所蔵2割、486万点を一括検索
文献の深掘り容易に
1 486万点のデジタルコレクションが収録
国立国会図書館(東京・千代田)が蔵書のオンライン公開を始めてから25年余り経ちました。外国刊行物を除く所蔵資料の2割に当たる486万点が電子化され、デジタルコレクションに収録されています。
光学式文字読み取り装置(OCR)の発達により、膨大な蔵書を全文検索し、知りたいことがどの本のどこに書かれているのか簡単に分かるようになりました。さまざまな学術分野で研究の掘り下げに役立てられています。
2 近代以降の文献を調べる最強のツール
2032年完成予定の日本国語大辞典第3版(小学館)の編集委員を務める青山学院大学の近藤名誉教授(日本語学)が評価しています。
用例調査で活用したケースに挙げたのは食事前の「いただきます」というあいさつです。1930年代が最も古いとされてきましたが、デジタルコレクションの検索で1891年(明治24年)に刊行された子どものしつけに関する本までさかのぼることが分かりました。
江戸期以前にそうした用例がないことも確認できました。明治半ばに学校給食が始まり、こうした言い回しが使われるようになったと考えられるということです。
デジタルコレクションを使えば、その言葉がいつごろからどのくらい使われていたかをグラフにすることもできます。近藤さんは「辞典の収録語を決める上でも欠かせない」と言い切ります。
3 電子化の流れ
国会図書館によると、電子化の準備が始まったのは1990年代です。2000年にデジタルコレクションの前進・貴重書画像データベースが公開されました。09年には著作権法が改正されて、権利者の許諾を受けずに保存目的で蔵書を電子化することも認められました。
スキャンを請け負った企業・団体が撮影した書籍のデータを、図書館側が旧字、異体字に対応した独自のOCRシステムを使って、コンピューターで処理できるテキストに変換し、新型コロナウイルス禍を経て作業のピッチは上がっています。
4 電子化がもたらすサービス
利用者への館外貸し出しに応じていない国会図書館の蔵書を閲覧するには、かつては訪れたり、近くの図書館まで取り寄せたりするなど手段が限られていました。
現在、電子書籍・雑誌も合わせると約650万点がオンラインで公開されています。利用者登録を済ませれば、3分の2は個人のパソコンからでも閲覧できます。人名で検索すると、載っている資料がすぐ分かることから先祖を調べるのに使う人もいます。
膨大な資料を一括検索できるデジタルコレクションは、人工知能(AI)など情報処理技術を応用するデジタル人文学の研究基盤となりつつあります。
慶応大の永崎教授(人文情報学)は「デジタルアーカイブがさらに拡充されれば、さまざまな研究分野の成果とつなぎ合わせ、新たな知見も得られるようになる。研究者は俯瞰的な視点が求められていくだろう」と話しています。
5 まとめ
今回、国立国会図書館の電子化について紹介しました。私はまだ利用していませんが、今度、東京に出張に行った際には登録してこようと思っています。自宅のパソコンを使って文献を調べられるのはとても便利ですし、ある情報について、さらに一歩深めた内容とすることができます。仕事でもプライベートでも何か探したり検索したりするにはいいものであると思います。これを読んでくれた方もHP上では簡易登録まではできるようなので、活用してみて欲しいと思います。


コメント