黒澤公人の図書館システムの歴史と未来

はじめに

　図書館システムの発展は、コンピュータシステムの技術の発展と密接に関係している。コンピュータシステムの発展の歴史と図書館システムの技術の発展を追いかけながら、日本の図書館システムがどのように発展してきたのか紹介する。そして、今なお発展し続ける図書館システムの未来を展望する。

(1)巨大なコンピュータシステムと無数のダム端末(1960年代)

コンピュータは、2進数を原理にしているため、コンピュータの発展は、2倍、4倍、8倍、16倍..と２倍毎に進化していく。第2次世界大戦中に誕生したコンピュータは、真空管で作られ非常に巨大なもので大電力を必要とした。最初のコンピュータは、4ビットという単位で作成され、2の4乗の16種類のデータしか扱えなかった。そのため最初のコンピュータは数値計算しか行うことが出来なかった。

　それが、2倍の8ビットという構成単位になると、2の8乗の256種類のデータを扱えるようになり、数字と演算記号のほか、アルファベット大小52文字、それに、コンマやピリオドなど入れて、英語やそれに近い言語をコンピュータで取り扱うことができるようになった。このことによってコンピュータで、文字を処理することが可能になった。

　1960年代になって、IBMなどのコンピュータメーカーから、計算だけではなく、文字情報を扱うことができるコンピュータが次々と発売されるようになると、図書館は,目録カードを作成する方法を研究し始めた。

　図書が出版されると、その図書を購入した世界中の図書館は、ほぼ同じような目録カードを作成する。100館の図書館があれば、100人の目録担当者が目録カードを作成する。目録規則に従って目録作業が行われるため、誰が作成しても殆ど同じ目録になる。もし、最初の目録担当者が最初の1枚を作成し、それを共有できれば、残りの99人は目録作業が効率化される。そこで、アメリカ議会図書館（Library of Congress 以下、LCと略す）は、目録カードを図書にして世界中に販売した。その図書はLCの総合目録と呼ばれ、百科辞典サイズの図書で数千冊にもなる巨大なものとなった。世界中の目録担当者は、その総合目録を調べて、該当する図書をみつけると、そのデータを参考にして作業の効率化を計った。しかし、目録カードは、目録担当者が作成した原稿を元に、書名、著者名、件名、分類など、複数の目録カードが作成される。専門のタイピストが、5枚、10枚と、同じ内容の目録カードを作成していく。その結果、100万冊の図書のある図書館には、数百万枚という目録カードが目録カードボックスに収納されていた。

　この目録カードの作成をコンピュータにさせることができないだろうかと、登場したばかりのコンピュータに期待を寄せて、世界中で開発に取り組んだ。そして、いくつかの方法が提案された。図書の目録情報は、入力項目の数も不規則で、また、各項目の長さも短長バラバラである。コンピュータが処理するには、まったく厄介な構造のデータである。そのため、全ての項目の最長のデータを入力エリアとして、確保すると1つの目録データサイズが、とても大きくなり、データにたくさんの空きスペースが発生してしまう。そして、1966年に一つのデータを可能な限り小さくしながら、どのような図書にも対応できるという画期的な目録記入方式　LC/MARC(Library of Congress/ MAchin Readble Cataloging 機械可読目録)が開発された。これは、現在でも、図書館システムの基本的な考え方になっている。

　このシステムに基づいて、LCが受入した図書の目録データを磁気テープにして販売を始めた。1967年には、そのデータを活用して、目録カードの作成をコンピュータで行うための組織OCLCが設立された。はじめは、近隣の大学が参加しただけでスタートしたが、その後、全米、全世界にその利用者を増やしていった。コンピュータを利用した目録の共同作成システムを書誌ユーティリティと呼ぶ。OCLCの成功によって、多くの国々で書誌ユーティリティが登場して、それぞれの国の図書館にサービスしていくことになった。

　書誌ユーティリティを利用する図書館には、電話回線に繋がれたダム端末と呼ばれるキーボードとプリンターが一つに成った機械が置かれていた。電話を利用して、OCLCのコンピュータとどのように通信したのかというと、当時のデータの種類は、256種類のデータしかないので、キーボードに打ち込まれた256種類の文字を音に変換し、その音を電話の受話器に向かってスピーカーで流し、そして、OCLCから送られてきた256種類の音をマイクで受信して、ダム端末を通じてプリンターに打ち出すものであった。ダム端末とは、「馬鹿な端末」という意味で、キーボードから入力したデータを、電話の向こうの大型コンピュータに送り、大型コンピュータから送られてきたデータをプリントするという機能しかなかった。

　ダム端末とモデムと呼ばれる電話機を繋ぐスピーカーとマイクの機械があれば、どの図書館からも簡単に書誌ユーティリティを利用できるので、ダム端末は目録担当者の必需品となった。

(2) アルファベット文字の図書館システム（1970年代）

LCによって、目録データのフォーマットが確立されると、個々の図書館のための図書館システムの開発が本格化した。日本でもコンピュータが次々と販売されるようになるが、漢字の処理はできない。しかし、海外では、本格的な図書館システムが次々と作られるようになる。

　図書館は大量の図書を所蔵しているため、それらの目録データをコンピュータに格納するためには、それなりの規模のコンピュータシステムが必要だった。今では、机の上にあるようなコンピュータや持ち運べるコンピュータにも、大量のデータを格納することができるが、当時は、50MB,100MB というハードディスクは大規模ハードディスクであった。当時のコンピュータに少しでも多くのデータを格納するために、様々な工夫が考えられた。

　1976年に究極のデータ節約術ともいえる図書館システムが開発された。DOBISと呼ばれたそのシステムは、ドイツの大学図書館で開発された。図書館システムは、図書を検索するために、書名や著者名、分類、件名などたくさんの索引を作成しなければならない。すると、索引のためのディスク容量が増えていき、もとのデータの何倍にもなる。１冊あたりの目録カードの文字数は500文字としても、100万冊の図書を管理するには、500MB必要となり、索引のためにさらに４倍５倍の容量が必要となると、コンピュータシステムがどんどん大きくなってしまう。

　そこで、DOBISが考えた方法は、目録データを索引毎に分解して、コンピュータ内の目録データ本体は、無くしてしまうという方法だった。データは索引のみにしてしまうという逆転の発想だった、目録データを表示する時は、索引を組み合わせると元の目録データに復元される。たとえば、Shakespeareの本が100冊あるとすると、他の図書館システムでは、目録データとしてShakespeare, Williamという名前が100個存在し、索引にもデータが存在する。しかし、DOBIS では、目録データは、索引に分解されているので、Shakespeare, Williamというデータは、索引の一つしか存在しない。そうすることによって、ディスク容量を節約し、図書館システムのコストパフォーマンスを最大限に引き出すことに成功した。その後、コンピュータで漢字が使えるようになると、日本でも、早稲田大学図書館、慶応大学図書館など、数十の日本の大学図書館でも使われるようになった。海外で生まれた図書館システムで、日本に普及した例外的とも言える傑作図書館システムであった。

　図書館システムは、図書館員たちとコンピュータ技術者の手で開発作成するという方針を掲げ、1978年に設立されたアメリカのInnovative社は、毎年ユーザー会を開催し、そこに集ってくる図書館員たちの要望に耳を傾けながらシステムを発展させてきた。この会社のシステムは世界中で広く使われようになり、日本でも、早稲田大学図書館に DOBISの後継として、Millenniumという名のシステムが導入された。

(3)和書システムと洋書システムが混在する日本の大学図書館システム（1980年代）

LCが LC/MARCを販売するようになると、日本でも、いくつかの大学図書館で実験が開始され、LC/MARCデータの活用が模索された。当時は、256種類のデータしか扱えなかったので、日本語を表示することはできなかった。そこで、一つの方法として提案されたのは、日本では、アルファベットの小文字を捨てて、カタカナ50文字を組み込むという方法だった。

　コンピュータで漢字が使えるようになるには、データの取り扱える基本セット8ビットからその2倍の 16ビット 2の16乗　65,536種類のデータを取り扱えるコンピュータの登場が必要だった。1980年代になると、16ビットのコンピュータが登場し、漢字の JISコードも整備され、ようやく日本での本格的な図書館システムが構築できるようになった。

　国会図書館では、可能な限り早く日本語処理を実現するために、JIS規格の制定に先立って、国会図書館独自の漢字コードを制定して日本語を処理する図書館システムを完成させている。そして、和書の目録データを管理するためのJapan/MARC（以下　JP/MARCと表記）を制定し、磁気テープでの頒布を行った。LCの開発したLC /MARC は、英語の図書を処理するために考えられているので、日本語特有のヨミガナやローマ字を入れる場所がない。そのため、JP/MARC は、LC/MARCを参考に、日本独自の形式になった。

　多くの大学図書館には、和書と洋書の両方を所蔵している。そして、和書は日本目録規則で、洋書は英米目録規則に従って目録カードを作成していた。そこで、日本の大学図書館の本格的な図書館システムは、和書は JP/MARC フォーマットで、洋書は、LC/MARCフォーマットという一つの図書館システムに2つのシステムが共存するシステムが登場した。図書館が所蔵する全ての図書のデータをもつ本格的な目録カードレスシステムは、1982年に金沢工業大学図書館で登場した。

　1981年には、筑波大学付属図書館が、Model204というデータベース言語を駆使して、図書館員によって本格的な図書館システムが構築されている。本格的な図書館システムを導入しても、その図書館が所蔵する図書の目録データをどのように構築するのかが、大きな課題となった。

(4)目録カードではなく、目録データが必要（1980年代）

本格的な図書館システムが登場してくると、図書館は目録カードではなく目録データを必要としていた。図書館が必要とする目録データは、新規受入図書の目録データだけではなく、所蔵している全ての図書の目録データである。

　OCLC、UTLASなどの書誌ユーティリティには、大量の目録データが蓄積されており、目録カードを作成するシステムから目録データを供給するシステムに変化していく。

　日本の図書館システムも本格化していく中で、目録データを供給してくれる書誌ユーティティの存在が不可欠になってきた。OCLC,UTLASなどの海外の書誌ユーティティを利用するケースも登場してきた。しかしながら、和書の目録データを供給する方法がなかなか確立されなかった。唯一の例外として、UTLASが、JP/MARCを利用して、和書の書誌ユーティティ（Japan/Catss）をつくりあげるが、商業的には成功しなかった。

　大規模な図書館システムでは、JP/MARCを購入して、自館の図書館システムに格納して利用するところも登場したが、そのようなことができる図書館システムは大規模な図書館システムに限られていた。

　日本の場合、コンピュータで漢字を使えるようになった時期と本格的な図書館システムが同じ時期となってしまったので、書誌ユーティリティで目録カードを作成するという経験がない。図書館システムのために直接目録データを取り込める書誌ユーティリティを必要としていた。そこに、救世主のように登場したのが、JBISCであった。パソコンで取り扱え、１枚のディスクに数十万件の目録データが収納されており、急速に全国の図書館で使われていくようになった。国会図書館の提供するJP/MARC,JBISC には、図書整理のためのタイムラグが存在したため、新刊図書の情報を提供する民間MARCが、普及していくことになった。

（5）学術情報センターが全てを変えた（JP/LCからCATPへ）（1990年代）

1984年に学術情報センター（現　国立情報学研究所）が登場した。全国の大学図書館にどんな図書があるかを把握できることは、国内の図書を活用する上で非常に有効な方法である。国会図書館は、大規模大学図書館に呼びかけて、洋書を購入したら目録カードを一枚、国会図書館に送ってもらい、それをまとめた図書（新収洋書総合目録(1949-1987)）を出版していた。

　図書館システムが単独で存在していても、目録作業を効率的に行うことはできない。日本でも、和書洋書の大規模書誌ユーティティの登場が待たれた。そこで、学術情報センターは目録カードという概念を離れ、全国の図書館の新規受入目録をサポートし、同時に、いままで所蔵している大量の図書の遡及を可能にし、全国の大学図書館の所蔵状況を一元管理できるシステムを開発する。

　このころの本格大学図書館システムは、一つの図書館システムに、和書と洋書の２つの異なるフォーマットを運用する方法で構築していたが、学術情報センターは、和洋共通フォーマットCATPを開発した。学術情報センターは、全国の大学図書館を連携するためのネットワーク（学情ネット）を整備して、日本の大学図書館システムが、学術情報センターのデータを利用できる体制を整えていく。

　学術情報センターが開発した目録フォーマットCATPや学術情報センターへのアクセス方法は、いままでの日本の大学図書館システムにない、まったく新しい方法だったため、大学図書館システム開発業者は、学術情報センター対応の図書館システムの開発に乗り出すことになる。

　新規に、大学図書館システムを導入しようとしていた中小規模の大学図書館にとっては、朗報であったが、先行して本格図書館システムを導入していた大学図書館は、現行のJP/LC（和書洋書）システムを存続させるのか、学術情報センターの方式に変更するのかが大きな問題となった。国立大学が学術情報センター方式に切り替えていき、データの遡及にも大きな成果を上げ始めると、多くの大学図書館が学術情報センター方式になった。学術情報センターは、2000年に国立情報学研究所に改組された。現在の日本の大学図書館で、JP/LC 方式を採用しているところはほとんどなくなってしまった。

　珍しい例としては、国立（くにたち）音楽大学は、音楽資料を管理するために独自の図書館システムを構築し,UNIMARCを採用している。（2018年　CATPシステムに変更になった。）

(6)海外の図書館システムの多言語化への挑戦（1990年代）

16ビットのコンピュータシステムが登場してくると、日本語の漢字を使用することが可能になった。このことは中国や韓国などの様々な文字を持つ国々の文字を表現することが可能になった。しかしながら、日本のコンピュータでは日本語を、中国のコンピュータは中国語を表示することが可能になったが、中国語と日本語を同時に表現することはできなかった。

　アメリカの大学図書館には、世界中の言語の本が所蔵されているが、それらのデータを処理する方法が模索された。CJKプロジェクトは、中国語、日本語、韓国語をアメリカの図書館システムで管理することを目指した。その成果は 24ビットEACCコード体系が開発され実用化された。しかし、その後、16ビットのUnicodeが整備され、一般的なコンピュータシステムでも世界の言語が一元的二表示できるようになり、海外の図書館システムは、Unicodeを利用して多言語対応化していくことになった。CJKプロジェクトの成果は、洋書中心だったLC/MARCを世界の言語に対応するフォーマットMARC21を生み出す原動力になった。そして、海外で作成された図書館システムは、中国、韓国、日本といった国でも利用することが可能になった。

　早稲田大学図書館、慶応大学図書館は、海外の図書館システムを採用しており、フォーマットは MARC21を採用している。図書館システムの目録フォーマットを変更することは簡単ではなく、早稲田大学図書館や慶応大学図書館がCATPシステムに変更する可能性は殆どない。

　国会図書館は、長らく、独自のシステムを持っていたが、最近、海外のシステムを導入して、MARC21 に変更し、OCLCにもデータを提供できる体制を確立した。国会図書館は、和書データを独自に作成してきたので、国会図書館システムの変更だけで、他のデータとの整合性などの問題がないので、大胆なシステム変更が可能になった。日本を代表する国立図書館のMARC21への変更は、海外の図書館にとっても、朗報であり、和書の目録データを世界中で共有することができるようになった

　このCJKプロジェクトによる独自コード体系の開発は、1970年代に日本の国会図書館がNDL漢字を整備して、日本語処理の先駆けになったのによく似ている。

(7)Web技術の衝撃　単純さは複雑さに勝る（2000年代）

インターネットの登場は、各図書館の図書の検索（OPACと呼ばれる）を遠隔から利用できる可能性を切り開いた。他の図書館システムのOPACを検索できるようになると、図書館システムごとに、検索方式が異なっていることに気がつき始めた。当時のOPACの操作方法は、コマンドを入力する形式で、タイトルを検索する時はTI,著者を検索する時はAU などと指定する必要があった。その方法はシステム毎に異なっており、それぞれの図書館システムの検索方法を知る必要があった。Z39.50規格は、図書館システム間の検索を可能にしていたので、共通検索技術が確立していた。Z39.50は、図書館OPACの標準化に大きな期待を担っていた。しかし、Web技術の登場によって、Z39.50の出番は急速に失われていくことになった。Web技術は、本来、ドキュメントを遠隔から見る技術であり、図書館システムの検索をすることができなかった。しかし、Web技術で検索ができる方法が開発されるとWeb技術の制約によって、Web-OPAC技術は限られたことしかできなかった。それ故に、シンプルで、どの図書館システムでも、同じようなWeb-OPACが登場し、自然にWeb-OPACの共通化がなされてしまい、Z39.50の出番は奪われてしまった。Web-OPACはコンピュータシステムに対する負担も小さく、同時にたくさんのWeb-OPACを処理できる点でも画期的であった。

　一方、Z39.50技術は、海外の図書館システムに標準的に整備されている機能となった。書誌ユーティリティを利用するには費用が発生するが、Z39.50 機能を持つ図書館システム同士は自由に目録データを交換することが可能となった。Z39.50には、複数の図書館システムを同時に検索することができる。入手困難な図書の目録データが必要になった場合でも、世界中の図書館システムに対して、100館でも、200館でも、一度に検索を行い、該当する目録データを持っている図書館システムから、目録データが送られてくる。多くの図書館システムの遡及作業が完了し、Z39.50の機能が整備されてくると、書誌ユーティリティへの依存度が低下して、多くの書誌ユーティティが姿を消すことになった。

(8)目録データシステムから全文データシステムへ（2010年代）

多くのライバルの書誌ユーティティが姿を消していく中、OCLCは健在である。書誌ユーティリティは、目録データ、所在データの巨大な集合体である。OCLCの規模にかなうものは、存在しないのだが、現在の最大のライバルは、数百万册、数千万冊の図書自体を丸ごとスキャンしてしまった超巨大電子図書館の登場である。超巨大電子図書館システムが存在しながら、図書自体を自由に読めないのは、技術的な問題ではなく、著作権の制約や商業的な問題が存在するからである。

　かつて、図書館目録データは、1件当たりのデータ量はさほど多くないにも関わらず、数十万件、数百万件のデータを管理するため、究極の技術を駆使しながら対応してきた歴史を紹介したが、現在の超巨大コンピュータは小型で高性能のコンピュータを数十万台と結合させて、一つの超巨大なコンピュータとして運用している。その処理能力やデータ収納能力は巨大なものとなり、数百万册、数千万冊の図書のすべてのページをデジタル化しても、余りある能力を持っている。

　Googleは、今まで出版されたすべての図書のデジタル化を行なってきており、アメリカの大学図書館の蔵書のスキャニングを始めて、既に10年以上が経過している。読み込んだ図書の延べ数は、数千万冊になっているに違いない。アメリカの大学図書館が共同運用する電子図書館Hathi Trust Digital Libraryは、600万冊以上の図書の全文データが保管され、検索に役立っている。蓄積されている図書データを電子書籍として、全世界に公開できないのは、著作権の問題など、多くの制約があるからである。

最近、登場しているディスカバリーサービスは、10億件といった規模の雑誌記事フルテキストデータを蓄積し、それらのデータを一元的に検索する方法である。ディスカバリーサービスは、検索ツールとしてのみ存在し、ディスカバリーシステム内部に収録されている雑誌記事フルテキストにアクセスすることはできない。A大学からアクセスする場合は、A大学が契約している雑誌記事のみを検索し、B大学には、B大学分の契約分を検索させ、C大学には、C大学の契約分のみを検索できるようにしている。その検索結果に基づいて、契約している出版元の雑誌記事フルテキストにリンクさせる。

ディスカバリーサービスには、個々の図書館システムのデータを取り込む機能があり、ディスカバリーシステムに収納されている雑誌記事データと図書館目録データを一元的に検索できる機能をもっている。図書館の主役が、OPACからディスカバリーサービスへ変化しようとしているのかもしれない。

(9)日本の図書館システムと世界の図書館システム

コンピュータの誕生から現在までの図書館システムの発展を概観した。はじめは英字しか処理できなかったコンピュータが日本語を処理できるようになるためには、時間を必要とした。海外の図書館システムが、日本語、中国語などの目録を処理できるようになるためには、たくさんの挑戦が必要だった。

　そのようなコンピュータの発展を待ちこがれるように、日本の図書館システムは進化し、独自の発展を遂げてきた。既にほとんどの図書館に図書館システムが導入され、目録データが整備されてくると、概念やフォーマットの違う図書館システムへ変更することは難しい。今後も、日本の図書館システムは、独自の進化を続けていくことになる。

　今まで出版された図書や雑誌のデジタル化によって、いままでの図書館のあり方も大きく変わろうとしている。すでに多くの図書、雑誌のデジタル化は進んでいるが、それらがどのように活用されていくのかは、著作権や商業的な問題の今後の模索が続くだろう。

(10)電子書籍時代の図書館と図書館システム（2020年代）

図書館の所蔵冊数上限は、図書館という物理収納能力の限界だった。それを越えるためには、図書館を新築、増築するなど大規模の投資が必要となる。電子ジャーナル、電子ブックには、物理的大きさや重さを持たないため、図書館という物理的制約を受けない。
もし、100万冊、1000万冊という電子ブックパッケージが販売されて、それを契約できると場合、一挙に、100万冊、 1000万冊の図書を利用することができるようになる。
　著作権の問題や経済の問題があるので、古い図書に限られるが、日本の国会図書館は、数十万冊の図書をネット上で、公開されている。それらを図書館システムが検索できるようにすると、無料で、数十万冊の蔵書を増やしたと同じ効果を得ることができる。ただし、明治、大正などの古い時代の本が中心である。出版社やアグリケーターなどが提供する数万冊、数十万冊のパッケージを導入できれば、利用可能図書が一挙に増える。洋書の価格が1万円、2万円という価格は当たり前なので、1万冊購入すると1億円、10万冊では、10億円、100万冊では、100億円が必要になる。通常は、毎年、数百冊、数千冊規模で、数十年という年月をかけて購入することになる。しかし、電子書籍の利用は、そのような購入方法とは違う概念を提供する。

(11)新しい出版形態（図書館、書店、出版社が共存システム）（2030年代）

HathiTrust は、大規模電子図書館コンソーシアムでは、図書館が所蔵する図書のデジタル化と著作権規則に従った電子図書館である。

新刊デジタルは、ここの大学図書館が購入する必要がある。
電子図書館は、出版ビジネスを発展させる方向で、電子図書館も発展しなければならない。

図書を無料で利用させることは、資本主義経済では、特例なので、あまり、活発になりすぎると、出版ビジネスを崩壊させることになる。
電子書籍は、在庫切れという存在がなくなる。既に出版した図書のデジタル化も進むと、出版社がアグリケータの在庫が数十万冊、数百万冊、数千万冊、数億冊の図書が持てるようになると、図書館が図書を所蔵する意味がなくなる。

すると、新しいビジネススタイルを構築することになる。

新刊図書
まだまだ売れる図書
既に、出版されて、著作権の切れた図書

それらのバランスをどうするかに今度の課題になるだろう。
図書館、古本ビジネスは、いずれなくなっていくのかもしれない。

参照文献

コンピュータの進化と図書館システムの進化：図書館システムビッグバン40年間の旅へ / 黒澤公人　医学図書館　52(3),215-222 2005

日本の図書館システムの現状 (特集多様化する図書館システム)　/ 黒澤公人　情報の科学と技術 61(5), 194-199, 2011

個別サーバー型図書館システムの現状とクラウド型図書館システムの登場（特集　図書館システム）/黒澤公人薬学図書館　57(4) 270-278,2012