黒 澤公人の Project L 日本語への挑戦

「一次情報ダイレクトアクセス」時代、「検索即閲覧」時代のドキュメンテーションシステムのあり方を考える。

黒澤公人のProject L  日本語への挑戦


日本語への挑戦  京都産業大学 1980年
図書館システムと言語への格闘は、まるで、永遠のテーマのようでもある。 コンピュータ、数値計算から、アルファベット、カナ、ひらがな、漢字(第一水準)(第二水準) ユニコードなどとその利用範囲を広げてきたが、その途上には、さまざま挑戦があった。 そして、それは、今も続いている。 日本語ほど、コンピュータに適さない言語はないのかもしれない。これほど、さまざまな要素をもった言語も珍しい。 人の名前一つとっても、その困難さがわかる。漢字書かれた名前を、どう読むのだろうと、困った経験した人も多いはず。 漢字と読みの問題、ローマ字、分かち、複雑な問題も多い。 京都産業大学の図書館システム取り組みは、果敢であった。 当時は、どんな入力方法があっただろうか。 漢字が一面に書いてある板をペンで指定する方法など、いまでは考えらなかった。 アルファベットが表現できる世界へむりやり、カタカタを滑り込ませて、アルファベットの捨てていた時代があるのをご存知だろうか。 いまでは、いろんなことができるようになったが、当時は、いつも、たくさんの問題があった。 そんな中での漢字目録の挑戦であった. 2001年になったいまでも、漢字や諸言語の対応は難しい。 日本語への対応だって、不完全である。 だれも、本気で取り組んでいないようにも見える。
いったい、コンピュータでいつになったら、日本語が取り扱えるのだろうか。

しかし、日本人すら、日本語を取り使えていない現実をご存知だろうか。
日本人の苗字でも、いったい、どう読んだらいいんだろうかと迷うものもたくさんある。
同じ漢字でも、読み方が違うのは、どうするのだ。
いったい 黒澤と黒沢は、同一なのか違うのか。
黒澤、黒沢、くろさわ、クロサワ、KUROSAWA、Kurosawa,kurosawa は、どれが正しいのか、間違っているの か。

英語なら、それなりのつづりなら、それなりの発音だが、日本語は、とんでもない言語なのだ。
このとんでもなさを、どうするべきだろう。


最初のマイクロコンピュータは、4ビットだったので、16の符号を処理できました。だから、数字と符号を処理できたので,電卓が誕生 しました.
その次、8ビットが生まれたので、256の符号を処理することができるようになりました。
しかし、アメリカでは、その半分の128文字で処理可能だということで、7ビット、128文字で
処理することになり、アルファベットを処理できるようになって、文字を表現できるようになりました。

だから、このときは、日本語はローマ字ですべて表すことで、対応しました。
(もし、この時代が長ければ、日本語のあり方自身も変化したかもしれません。)


日本では、アルファベットのみでは、ということで、カタカナを、強引に割り込ませることにしました。
そのとき、カタカナと濁音等の符号を混ぜて使うには、どうしても、足りなくて、アルファベットの小文字を捨てて、カタカナを割り込ま せました。
だから、日本のコンピュータは、アルファベットの小文字がつかえませんでした。
IBMが決めたコード体系から、パソコン対応コード(ASCII)が登場してきて、アルファベット大文字、小文字、カタカナというこ とになりました。
さて、CPUが16ビットになるといよいよ、漢字の登場です。でも、その前でも、漢字は使うことができたんです。それは、データとし て、ここから先は、漢 字、ここで、漢字終わりという符号をつけることで,半角の世界に、漢字の全角を割り込ませるという方法も考え出されました。
日本では、漢字コードをJISということで制定しました。一つ一つにコードが割り振られたのですが、そのコードでは、漢字の識別が面 倒であったため、コー ド全体を、移動して、コード自体をみると漢字のコードであるかわかる方法(shift-JIS)というも考え出されました。
IBMもIBMで漢字コードを確立していましたし、UNIXもUNIXの漢字コードを登場させました。
そうして、たくさんの漢字コードが存在することになりました。

漢字の問題は、画面の問題でもありました。アルファベットを表現するディスプレイでは、漢字の表現は難しかったし、プリンターも、そ うでした。そうして、 日本、独自のコンピュータへ進化をすすめて、いくことになりました。

漢字の入力の問題もありました。キーボードも今の方法で、漢字入力する方法に安定するまでたくさんのタイプの機械が登場しました。漢 字が一面に書いている ものをペンで選んでいくものや、漢字をたくさんのキーに割り当てたものも、ありました。
アメリカでは、どんな方法で、入力すると思います? 木編やサンズイといった漢字の構成要素を、打って漢字を組み立てていく方法で入 力するキーボードがあ るんですよ。

現状でも、いろいろ不便ですよね。
漢字の問題はいやになりますね。

それでも、日本人は、日本語捨てません。今日も、多くの小学生が漢字の練習に、がんばっているんでしょうね.日本人ほど(中国と、 朝鮮もそうかもし れないけど)言語に時間をかけている国民も少ないじゃないかしら。だから、もう、英語なんて習う余力がないのかもしれませんね。

1970年代後半,コンピュータで漢字が使えるようになると、京都産業大学では、和書目録挑戦していきました.ドットプリンターか ら、目録カードが 打ち出されたのでした。
それは、コンピュータへの挑戦でもあったのです。