黒澤公人の図書館システムの歴史と未来



はじめに

 図書館システムの発展は、コンピュータシステムの技術の発展と密接に関係している。コンピュータシステムの 発展の歴史と図書館システムの技術の発展を追いかけながら、日本の図書館システムがどのように発展してきたのか紹介する。そし て、今なお発展し続ける図書館システムの未来を展望する。



(1)巨大なコンピュータシステ ムと無数のダム端末(1960年代)

コンピュータは、2進数を原理にしているため、コンピュータの発展は、2倍、4倍、8倍、16倍..と2倍毎 に進化していく。第2次世界大戦中に誕生したコンピュータは、真空管で作られ非常に巨大なもので大電力を必要とした。最初のコン ピュータは、4ビットという単位で作成され、2の4乗の16種類のデータしか扱えなかった。そのため最初のコンピュータは数値計 算しか行うことが出来なかった。

 それが、2倍の8ビットという構成単位になると、2の8乗の256種類のデータを扱えるようになり、数字と 演算記号のほか、アルファベット大小52文字、それに、コンマやピリオドなど入れて、英語やそれに近い言語をコンピュータで取り 扱うことができるようになった。このことによってコンピュータで、文字を処理することが可能になった。

 1960年代になって、IBMなどのコンピュータメーカーから、計算だけではなく、文字情報を扱うことがで きるコンピュータが次々と発売されるようになると、図書館は,目録カードを作成する方法を研究し始めた。

 図書が出版されると、その図書を購入した世界中の図書館は、ほぼ同じような目録カードを作成する。100館 の図書館があれば、100人の目録担当者が目録カードを作成する。目録規則に従って目録作業が行われるため、誰が作成しても殆ど 同じ目録になる。もし、最初の目録担当者が最初の1枚を作成し、それを共有できれば、残りの99人は目録作業が効率化される。そ こで、アメリカ議会図書館(Library of Congress 以下、LCと略す)は、目録カードを図書にして世界中に販売した。その図書はLCの総合目録と呼ばれ、百科辞典サイズの図書で数千冊にもなる巨大なものと なった。世界中の目録担当者は、その総合目録を調べて、該当する図書をみつけると、そのデータを参考にして作業の効率化を計っ た。しかし、目録カードは、目録担当者が作成した原稿を元に、書名、著者名、件名、分類など、複数の目録カードが作成される。専 門のタイピストが、5枚、10枚と、同じ内容の目録カードを作成していく。その結果、100万冊の図書のある図書館には、数百万 枚という目録カードが目録カードボックスに収納されていた。

 この目録カードの作成をコンピュータにさせることができないだろうかと、登場したばかりのコンピュータに期 待を寄せて、世界中で開発に取り組んだ。そして、いくつかの方法が提案された。図書の目録情報は、入力項目の数も不規則で、ま た、各項目の長さも短長バラバラである。コンピュータが処理するには、まったく厄介な構造のデータである。そのため、全ての項目 の最長のデータを入力エリアとして、確保すると1つの目録データサイズが、とても大きくなり、データにたくさんの空きスペースが 発生してしまう。そして、1966年に一つのデータを可能な限り小さくしながら、どのような図書にも対応できるという画期的な目 録記入方式 LC/MARC(Library of Congress/ MAchin Readble Cataloging 機械可読目録)が開発された。 これは、現在でも、図書館システムの基本的な考え方になっている。

 このシステムに基づいて、LCが受入した図書の目録データを磁気テープにして販売を始めた。1967年に は、そのデータを活用して、目録カードの作成をコンピュータで行うための組織OCLCが設立された。はじめは、近隣の大学が参加 しただけでスタートしたが、その後、全米、全世界にその利用者を増やしていった。コンピュータを利用した目録の共同作成システム を書誌ユーティリティと呼ぶ。OCLCの成功によって、多くの国々で書誌ユーティリティが登場して、それぞれの国の図書館にサー ビスしていくことになった。

 書誌ユーティリティを利用する図書館には、電話回線に繋がれたダム端末と呼ばれるキーボードとプリンターが 一つに成った機械が置かれていた。電話を利用して、OCLCのコンピュータとどのように通信したのかというと、当時のデータの種 類は、256種類のデータしかないので、キーボードに打ち込まれた256種類の文字を音に変換し、その音を電話の受話器に向かっ てスピーカーで流し、そして、OCLCから送られてきた256種類の音をマイクで受信して、ダム端末を通じてプリンターに打ち出 すものであった。ダム端末とは、「馬鹿な端末」という意味で、キーボードから入力したデータを、電話の向こうの大型コンピュータ に送り、大型コンピュータから送られてきたデータをプリントするという機能しかなかった。

 ダム端末とモデムと呼ばれる電話機を繋ぐスピーカーとマイクの機械があれば、どの図書館からも簡単に書誌 ユーティリティを利用できるので、ダム端末は目録担当者の必需品となった。

(2) アルファベット文字の図書館システム(1970年代)

LCによって、目録データのフォーマットが確立されると、個々の図書館のための図書館システムの開発が本 格化した。日本でもコンピュータが次々と販売されるようになるが、漢字の処理はできない。しかし、海外では、本格的な図書館 システムが次々と作られるようになる。

 図書館は大量の図書を所蔵しているため、それらの目録データをコンピュータに格納するためには、それな りの規模のコンピュータシステムが必要だった。今では、机の上にあるようなコンピュータや持ち運べるコンピュータにも、大量 のデータを格納することができるが、当時は、50MB,100MB というハードディスクは大規模ハードディスクであった。当時のコンピュータに少しでも多くのデータを格納するために、様々な工夫が考えられた。

 1976年に究極のデータ節約術ともいえる図書館システムが開発された。DOBISと呼ばれたそのシス テムは、ドイツの大学図書館で開発された。図書館システムは、図書を検索するために、書名や著者名、分類、件名などたくさん の索引を作成しなければならない。すると、索引のためのディスク容量が増えていき、もとのデータの何倍にもなる。1冊あたり の目録カードの文字数は500文字としても、100万冊の図書を管理するには、500MB必要となり、索引のためにさらに4 倍5倍の容量が必要となると、コンピュータシステムがどんどん大きくなってしまう。

 そこで、DOBISが考えた方法は、目録データを索引毎に分解して、コンピュータ内の目録データ本体 は、無くしてしまうという方法だった。データは索引のみにしてしまうという逆転の発想だった、目録データを表示する時は、索 引を組み合わせると元の目録データに復元される。たとえば、Shakespeareの本が100冊あるとすると、他の図書館 システムでは、目録データとしてShakespeare, Williamという名前が100個存在し、索引にもデータが存在する。しかし、DOBIS では、目録データは、索引に分解されているので、Shakespeare, Williamというデータは、索引の一つしか存在しない。そうすることによって、ディスク容量を節約し、図書館システムのコストパフォーマンスを最大限 に引き出すことに成功した。その後、コンピュータで漢字が使えるようになると、日本でも、早稲田大学図書館、慶応大学図書館 など、数十の日本の大学図書館でも使われるようになった。海外で生まれた図書館システムで、日本に普及した例外的とも言える 傑作図書館システムであった。

 図書館システムは、図書館員たちとコンピュータ技術者の手で開発作成するという方針を掲げ、1978年 に設立されたアメリカのInnovative社は、毎年ユーザー会を開催し、そこに集ってくる図書館員たちの要望に耳を傾け ながらシステムを発展させてきた。この会社のシステムは世界中で広く使われようになり、日本でも、早稲田大学図書館に DOBISの後継として、Millenniumという名のシステムが導入された。


(3)和書システムと洋書システムが混 在する日本の大学図書館システム(1980年代)

LCが LC/MARCを販売するようになると、日本でも、いくつかの大学図書館で実験が開始され、LC/MARCデータの活用が模索された。当時は、256種類 のデータしか扱えなかったので、日本語を表示することはできなかった。そこで、一つの方法として提案されたのは、日本で は、アルファベットの小文字を捨てて、カタカナ50文字を組み込むという方法だった。

 コンピュータで漢字が使えるようになるには、データの取り扱える基本セット8ビットからその2倍の 16ビット 2の16乗 65,536種類のデータを取り扱えるコンピュータの登場が必要だった。1980年代になると、16ビットのコンピュータが登場し、漢字の JISコードも整備され、ようやく日本での本格的な図書館システムが構築できるようになった。

 国会図書館では、可能な限り早く日本語処理を実現するために、JIS規格の制定に先立って、国会図 書館独自の漢字コードを制定して日本語を処理する図書館システムを完成させている。そして、和書の目録データを管理する ためのJapan/MARC(以下 JP/MARCと表記)を制定し、磁気テープでの頒布を行った。LCの開発したLC /MARC は、英語の図書を処理するために考えられているので、日本語特有のヨミガナやローマ字を入れる場所がない。そのため、JP/MARC は、LC/MARCを参考に、日本独自の形式になった。

 多くの大学図書館には、和書と洋書の両方を所蔵している。そして、和書は日本目録規則で、洋書は英 米目録規則に従って目録カードを作成していた。そこで、日本の大学図書館の本格的な図書館システムは、和書は JP/MARC フォーマットで、洋書は、LC/MARCフォーマットという一つの図書館システムに2つのシステムが共存するシステムが登場した。図書館が所蔵する全ての 図書のデータをもつ本格的な目録カードレスシステムは、1982年に金沢工業大学図書館で登場した。

 1981年には、筑波大学付属図書館が、Model204というデータベース言語を駆使して、図書 館員によって本格的な図書館システムが構築されている。本格的な図書館システムを導入しても、その図書館が所蔵する図書 の目録データをどのように構築するのかが、大きな課題となった。


(4)目録カードではなく、目録データが必要 (1980年代)

本格的な図書館システムが登場してくると、図書館は目録カードではなく目録データを必要としていた。図書館が必要 とする目録データは、新規受入図書の目録データだけではなく、所蔵している全ての図書の目録データである。

 OCLC、UTLASなどの書誌ユーティリティには、大量の目録データが蓄積されており、目録カードを作成する システムから目録データを供給するシステムに変化していく。

 日本の図書館システムも本格化していく中で、目録データを供給してくれる書誌ユーティティの存在が不可欠になっ てきた。OCLC,UTLASなどの海外の書誌ユーティティを利用するケースも登場してきた。しかしながら、和書の目録データを供給 する方法がなかなか確立されなかった。唯一の例外として、UTLASが、JP/MARCを利用して、和書の書誌ユーティティ (Japan/Catss)をつくりあげるが、商業的には成功しなかった。

 大規模な図書館システムでは、JP/MARCを購入して、自館の図書館システムに格納して利用するところも登場 したが、そのようなことができる図書館システムは大規模な図書館システムに限られていた。

 日本の場合、コンピュータで漢字を使えるようになった時期と本格的な図書館システムが同じ時期となってしまった ので、書誌ユーティリティで目録カードを作成するという経験がない。図書館システムのために直接目録データを取り込める書誌ユーティ リティを必要としていた。そこに、救世主のように登場したのが、JBISCであった。パソコンで取り扱え、1枚のディスクに数十万件 の目録データが収納されており、急速に全国の図書館で使われていくようになった。国会図書館の提供するJP/MARC,JBISC には、図書整理のためのタイムラグが存在したため、新刊図書の情報を提供する民間MARCが、普及していくことになった。

(5)学術情報センターが全てを変えた (JP/LCからCATPへ)(1990年代)

1984年に学術情報センター(現 国立情報学研究所)が登場した。全国の大学図書館にどんな図書があるかを 把握できることは、国内の図書を活用する上で非常に有効な方法である。国会図書館は、大規模大学図書館に呼びかけて、洋書を購入 したら目録カードを一枚、国会図書館に送ってもらい、それをまとめた図書(新収洋書総合目録(1949-1987))を出版して いた。

 図書館システムが単独で存在していても、目録作業を効率的に行うことはできない。日本でも、和書洋書の大規 模書誌ユーティティの登場が待たれた。そこで、学術情報センターは目録カードという概念を離れ、全国の図書館の新規受入目録をサ ポートし、同時に、いままで所蔵している大量の図書の遡及を可能にし、全国の大学図書館の所蔵状況を一元管理できるシステムを開 発する。

 このころの本格大学図書館システムは、一つの図書館システムに、和書と洋書の2つの異なるフォーマットを運 用する方法で構築していたが、学術情報センターは、和洋共通フォーマットCATPを開発した。学術情報センターは、全国の大学図 書館を連携するためのネットワーク(学情ネット)を整備して、日本の大学図書館システムが、学術情報センターのデータを利用でき る体制を整えていく。

 学術情報センターが開発した目録フォーマットCATPや学術情報センターへのアクセス方法は、いままでの日 本の大学図書館システムにない、まったく新しい方法だったため、大学図書館システム開発業者は、学術情報センター対応の図書館シ ステムの開発に乗り出すことになる。

 新規に、大学図書館システムを導入しようとしていた中小規模の大学図書館にとっては、朗報であったが、先行 して本格図書館システムを導入していた大学図書館は、現行のJP/LC(和書洋書)システムを存続させるのか、学術情報センター の方式に変更するのかが大きな問題となった。国立大学が学術情報センター方式に切り替えていき、データの遡及にも大きな成果を上 げ始めると、多くの大学図書館が学術情報センター方式になった。学術情報センターは、2000年に国立情報学研究所に改組され た。現在の日本の大学図書館で、JP/LC 方式を採用しているところはほとんどなくなってしまった。

 珍しい例としては、国立くにたち音 楽大学は、音楽資料を管理するために独自の図書館システムを構築し,UNIMARCを採用している。(2018年 CATPシス テムに変更になった。)

(6)海外の図書館システムの多言語化への 挑戦(1990年代)

16ビットのコンピュータシステムが登場してくると、日本語の漢字を使用することが可能になった。このこ とは中国や韓国などの様々な文字を持つ国々の文字を表現することが可能になった。しかしながら、日本のコンピュータでは日本 語を、中国のコンピュータは中国語を表示することが可能になったが、中国語と日本語を同時に表現することはできなかった。

 アメリカの大学図書館には、世界中の言語の本が所蔵されているが、それらのデータを処理する方法が模索 された。CJKプロジェクトは、中国語、日本語、韓国語をアメリカの図書館システムで管理することを目指した。その成果は 24ビットEACCコード体系が開発され実用化された。しかし、その後、16ビットのUnicodeが整備され、一般的なコ ンピュータシステムでも世界の言語が一元的二表示できるようになり、海外の図書館システムは、Unicodeを利用して多言 語対応化していくことになった。CJKプロジェクトの成果は、洋書中心だったLC/MARCを世界の言語に対応するフォー マットMARC21を生み出す原動力になった。そして、海外で作成された図書館システムは、中国、韓国、日本といった国でも 利用することが可能になった。

 早稲田大学図書館、慶応大学図書館は、海外の図書館システムを採用しており、フォーマットは MARC21を採用している。図書館システムの目録フォーマットを変更することは簡単ではなく、早稲田大学図書館や慶応大学 図書館がCATPシステムに変更する可能性は殆どない。

 国会図書館は、長らく、独自のシステムを持っていたが、最近、海外のシステムを導入して、MARC21 に変更し、OCLCにもデータを提供できる体制を確立した。国会図書館は、和書データを独自に作成してきたので、国会図書館 システムの変更だけで、他のデータとの整合性などの問題がないので、大胆なシステム変更が可能になった。日本を代表する国立 図書館のMARC21への変更は、海外の図書館にとっても、朗報であり、和書の目録データを世界中で共有することができるよ うになった

 このCJKプロジェクトによる独自コード体系の開発は、1970年代に日本の国会図書館がNDL漢字を 整備して、日本語処理の先駆けになったのによく似ている。

(7)Web技術の衝撃 単純さは複雑 さに勝る(2000年代)

インターネットの登場は、各図書館の図書の検索(OPACと呼ばれる)を遠隔から利用できる可能性を 切り開いた。他の図書館システムのOPACを検索できるようになると、図書館システムごとに、検索方式が異なっているこ とに気がつき始めた。当時のOPACの操作方法は、コマンドを入力する形式で、タイトルを検索する時はTI,著者を検索 する時はAU などと指定する必要があった。その方法はシステム毎に異なっており、それぞれの図書館システムの検索方法を知る必要があった。Z39.50規格は、図書館 システム間の検索を可能にしていたので、共通検索技術が確立していた。Z39.50は、図書館OPACの標準化に大きな 期待を担っていた。しかし、Web技術の登場によって、Z39.50の出番は急速に失われていくことになった。Web技 術は、本来、ドキュメントを遠隔から見る技術であり、図書館システムの検索をすることができなかった。しかし、Web技 術で検索ができる方法が開発されるとWeb技術の制約によって、Web-OPAC技術は限られたことしかできなかった。 それ故に、シンプルで、どの図書館システムでも、同じようなWeb-OPACが登場し、自然にWeb-OPACの共通化 がなされてしまい、Z39.50の出番は奪われてしまった。Web-OPACはコンピュータシステムに対する負担も小さ く、同時にたくさんのWeb-OPACを処理できる点でも画期的であった。

 一方、Z39.50技術は、海外の図書館システムに標準的に整備されている機能となった。書誌ユー ティリティを利用するには費用が発生するが、Z39.50 機能を持つ図書館システム同士は自由に目録データを交換することが可能となった。Z39.50には、複数の図書館システムを同時に検索することができる。 入手困難な図書の目録データが必要になった場合でも、世界中の図書館システムに対して、100館でも、200館でも、一 度に検索を行い、該当する目録データを持っている図書館システムから、目録データが送られてくる。多くの図書館システム の遡及作業が完了し、Z39.50の機能が整備されてくると、書誌ユーティリティへの依存度が低下して、多くの書誌ユー ティティが姿を消すことになった。

(8)目録データシステムから全文 データシステムへ(2010年代)

多くのライバルの書誌ユーティティが姿を消していく中、OCLCは健在である。書誌ユーティリ ティは、目録データ、所在データの巨大な集合体である。OCLCの規模にかなうものは、存在しないのだが、現在の最 大のライバルは、数百万册、数千万冊の図書自体を丸ごとスキャンしてしまった超巨大電子図書館の登場である。超巨大 電子図書館システムが存在しながら、図書自体を自由に読めないのは、技術的な問題ではなく、著作権の制約や商業的な 問題が存在するからである。

 かつて、図書館目録データは、1件当たりのデータ量はさほど多くないにも関わらず、数十万件、 数百万件のデータを管理するため、究極の技術を駆使しながら対応してきた歴史を紹介したが、現在の超巨大コンピュー タは小型で高性能のコンピュータを数十万台と結合させて、一つの超巨大なコンピュータとして運用している。その処理 能力やデータ収納能力は巨大なものとなり、数百万册、数千万冊の図書のすべてのページをデジタル化しても、余りある 能力を持っている。

 Googleは、今まで出版されたすべての図書のデジタル化を行なってきており、アメリカの大 学図書館の蔵書のスキャニングを始めて、既に10年以上が経過している。読み込んだ図書の延べ数は、数千万冊になっ ているに違いない。アメリカの大学図書館が共同運用する電子図書館Hathi Trust Digital Libraryは、600万冊以上の図書の全文データが保管され、検索に役立っている。蓄積されている図書データを電子書籍として、全世界に公開できない のは、著作権の問題など、多くの制約があるからである。

最近、登場しているディスカバリーサービスは、10億件といった規模の雑誌記事フルテキストデータを蓄積し、それらのデータを一元的に検索する方法であ る。ディスカバリーサービスは、検索ツールとしてのみ存在し、ディスカバリーシステム内部に収録されている雑誌記事 フルテキストにアクセスすることはできない。A大学からアクセスする場合は、A大学が契約している雑誌記事のみを検 索し、B大学には、B大学分の契約分を検索させ、C大学には、C大学の契約分のみを検索できるようにしている。その 検索結果に基づいて、契約している出版元の雑誌記事フルテキストにリンクさせる。

ディスカバリーサービスには、個々の図書館システムのデータを取り込む機能があり、ディスカバリーシステムに収納されている雑誌記事データと図書館目録 データを一元的に検索できる機能をもっている。図書館の主役が、OPACからディスカバリーサービスへ変化しようと しているのかもしれない。

(9)日本の図書館システムと 世界の図書館システム

コンピュータの誕生から現在までの図書館システムの発展を概観した。はじめは英字しか処理で きなかったコンピュータが日本語を処理できるようになるためには、時間を必要とした。海外の図書館システムが、 日本語、中国語などの目録を処理できるようになるためには、たくさんの挑戦が必要だった。

 そのようなコンピュータの発展を待ちこがれるように、日本の図書館システムは進化し、独自 の発展を遂げてきた。既にほとんどの図書館に図書館システムが導入され、目録データが整備されてくると、概念や フォーマットの違う図書館システムへ変更することは難しい。今後も、日本の図書館システムは、独自の進化を続け ていくことになる。

 今まで出版された図書や雑誌のデジタル化によって、いままでの図書館のあり方も大きく変わ ろうとしている。すでに多くの図書、雑誌のデジタル化は進んでいるが、それらがどのように活用されていくのか は、著作権や商業的な問題の今後の模索が続くだろう。


(10)電子書籍時代の図書館と図書館システム(2020年代)

図書館の所蔵冊数上限は、図書館という物理収納能力の限界だった。それを越えるためには、図書館を新築、増築するなど大規模の 投資が必要となる。電子ジャーナル、電子ブックには、物理的大きさや重さを持たないため、図書館という物理的制約を受けない。
もし、100万冊、1000万冊という電子ブックパッケージが販売されて、それを契約できると場合、一挙に、100万冊、 1000万冊の図書を利用することができるようになる。
 著作権の問題や経済の問題があるので、古い図書に限られるが、日本の国会図書館は、数十万冊の図書をネット上で、公開されてい る。それらを図書館システムが検索できるようにすると、無料で、数十万冊の蔵書を増やしたと同じ効果を得ることができる。ただ し、明治、大正などの古い時代の本が中心である。出版社やアグリケーターなどが提供する数万冊、数十万冊のパッケージを導入でき れば、利用可能図書が一挙に増える。洋書の価格が1万円、2万円という価格は当たり前なので、1万冊購入すると1億円、10万冊 では、10億円、100万冊では、100億円が必要になる。通常は、毎年、数百冊、数千冊規模で、数十年という年月をかけて購入 することになる。しかし、電子書籍の利用は、そのような購入方法とは違う概念を提供する。


(11)新しい出版形態(図書館、書店、出版社が共存システム)(2030年代)


HathiTrust  は、大規模電子図書館コンソーシアムでは、図書館が所蔵する図書のデジタル化と著作権規則に従った電子図書館である。

新刊デジタルは、ここの大学図書館が購入する必要がある。
電子図書館は、出版ビジネスを発展させる方向で、電子図書館も発展しなければならない。

図書を無料で利用させることは、資本主義経済では、特例なので、あまり、活発になりすぎると、出版ビジネスを崩壊させることにな る。
電子書籍は、在庫切れという存在がなくなる。既に出版した図書のデジタル化も進むと、出版社がアグリケータの在庫が数十万冊、数 百万冊、数千万冊、数億冊の図書が持てるようになると、図書館が図書を所蔵する意味がなくなる。

すると、新しいビジネススタイルを構築することになる。

新刊図書
まだまだ売れる図書
既に、出版されて、著作権の切れた図書

それらのバランスをどうするかに今度の課題になるだろう。
図書館、古本ビジネスは、いずれなくなっていくのかもしれない。



参照文献

コンピュータの進化と図書館システムの進化:図書 館システムビッグバン40年間の旅へ / 黒澤公人 医学図書館 52(3),215-222 2005

日本の図書館システムの現状 (特集 多様化する図書館システム) / 黒澤公人 情報の科学と技術 61(5), 194-199, 2011

個別サーバー型図書館システムの現状とクラウド型図書館システムの登場(特集 図書館システム)/黒澤公 人薬学図書館 57(4) 270-278,2012