【世界の図書館から】ハーバード燕京図書館の漢籍デジタルコレクション

成田健太郎
U-PARL特任研究員

アメリカ合衆国マサチューセッツ州に所在するハーバード燕京図書館(Harvard-Yenching Library)は、世界有数の東アジア資料コレクションを擁する研究図書館であり、アジア研究者でその名を知らない人は少ないでしょう。そもそもはハーバード大学とは別個の機関であるハーバード燕京研究所(Harvard-Yenching Institute)の研究活動を支える図書館として発展してきましたが、現在は図書館のみハーバード大学の管理下に入って、大学内の70を超える図書館を束ねる図書館システム「ハーバード大学図書館(the Harvard Library)」の一翼を担っています。

さて、このたびそのハーバード燕京図書館はFacebook上にて、自館の漢籍(Chinese Rare Book)コレクションの全点デジタル化が完了したと発表しました。(こちらの投稿を参照)

4,200タイトルに上るというそのデジタルコレクションは、ハーバード大学図書館の検索システム HOLLIS+ にて検索可能となっています。

また、デジタルコレクションの概要は、ハーバード大学図書館のウェブサイト内にある中国学研究案内ページ Research Guide for Chinese Studies の “Digitization Projects” の項に掲載されています。

多くのコレクションが列挙されていますが、そのうち以下のコレクションなどに漢籍が含まれています。

・Chinese Rare Books- Unique, Manuscripts, ect. 哈佛燕京圖書館中文善本特藏 稿,鈔,孤本(傅斯年圖書館合作項目)
・Chinese Rare Books Collection- Classics & History 哈佛燕京圖書館中文善本特藏- 經,史部(中國國家圖書館合作項目)
・Chinese Rare Books Collection- Collectaner Section 哈佛燕京圖書館中文善本特藏- 叢部
・Chinese Rare Books Collection- Collected Works 哈佛燕京圖書館中文善本特藏- 集部
・Chinese Rare Books Collection- Oversize 哈佛燕京圖書館中文善本特藏- 特大
・Chinese Rare Books Collection- Philosophy 哈佛燕京圖書館中文善本特藏- 子部

これらはそれぞれ別個のデータベースにリンクしているわけではなく、すべてHOLLIS+の検索結果にリンクしています。さらに細かく検索するためには、HOLLIS+の検索機能を使いこなす必要がありますが、その際注意すべき点がいくつかあります。

というのも、これらのコレクションは一度にデジタル化されたわけではなく、別個のデータベースとしてひとまとまりずつ制作されてきた経緯があるからです。そのなかには上記コレクション名を見ても分かるように、台北の中央研究院歴史語言研究所傅斯年図書館や、北京の中国国家図書館等海外の図書館との提携の下に制作された部分があり、ハーバード燕京図書館ではそれらをすでにHOLLIS+に統合しましたが、各提携先図書館ではオリジナルのデータベースがなお稼働しています。

HOLLIS+への統合にあたっては、各データベースのために作られた異なる規格のメタデータを一つにまとめる処理がなされたはずで、そのために検索のよすがとなるメタデータにばらつきが生じているようです。以下具体的に見ていきましょう。

まず、上記のとおり四部分類にしたがってコレクションが小分けされているように見えますが、「經,史部」は必ずしもそうではなく、中国国家図書館との共同プロジェクトでデジタル化された本がすべてこのカテゴリーに入っているので、たまに他の部の本が混じっています。たとえば『勦闖小說』という本は、四部分類では集部の小説類に分類されるはずですが、メタデータに“National Library of China — Harvard-Yenching Library Chinese rare book digitization project”とあるために、「經,史部」からリンクされている検索結果に現れてしまっています。また反対に、この本は「集部」の検索結果には現れません。

次に「子部」の検索結果を見てみると、912件表示されます。一覧するには少し多すぎますので、四部分類に慣れている人ならば、ここからさらに「部」の下位の「類」によって絞り込みをかけたいと感じるところです。しかしながら、結論から言うとそれは不可能です。

上掲のように、Subject(主題)によって検索結果を絞り込む機能があり、そのなかに“Zi bu”(子部)というのがありますが、これで絞り込むと、なぜかわずか35件に減ってしまいます。つまり“Zi bu”のタグは、子部の本すべてに付与されているわけではないのです。また次の画面でSubjectに現れる“Zi bu–Lei shu lei”(子部–類書類)のタグで絞り込んでみると、15件の類書類の本が示されます。しかし当然ながら、このタグも類書類に分類されるべき本にすべて付与されているとは思えません。残念ながら、一つの類の書誌を一覧するという、紙の漢籍目録ならば当たり前にできることができない仕様となっているのです。また、“Zi bu”や“Zi bu–Lei shu lei”などの四部分類に基づくタグは、左のカラムには現れますが、個別の書誌の詳細(Details)を開いてもユーザーからは見えないようになっています。

書名あるいは著者名で検索する場合も注意が必要です。

まず、HOLLIS+ の詳細検索(Advanced Search)モードを使うようにしましょう。デジタル画像のみ検索したい場合は、下掲のように、一つ目の検索窓に“digitization”と入れておくとよいでしょう。そうしないと、ハーバード大学図書館に所蔵されている紙の本や論文などもヒットしてしまいます。

そのうえでTitleを「墨池編」として検索すると、2種の『墨池編』がヒットしました。ここから先は“View Online”をクリックすれば画像を自由に閲覧、ダウンロードできます。漢字で検索する場合、繁体字・簡体字両方に対応していますが、繁体字とも簡体字とも異なる日本の常用漢字体には対応していません。さらに厄介なのは、たとえば『道德真経義解』という書誌、なぜかTitle中に日本の常用漢字体の「経」が混じっています。そのため繁体字の「經」でも簡体字の「经」でもヒットしません。このようなメタデータの不備は全体の検索の精度に少なからず影響しているでしょう。

また、Titleを「杜工部集」として検索してみると、一件もヒットしません。しかしここで「イェンチンには杜工部集がないのか」と早合点してはいけません。Titleをピンイン“du gong bu ji”としてもう一度検索してみましょう。すると下掲のように2種の『杜工部集』がヒットしました。つまり、本によってはTitleのメタデータの漢字が検索システムに拾われない場合があるのです。そのようなわけで、書名はピンインで検索するのが無難です。その際、たとえばさきほどの「杜工部」でいうと、音節の切れ目にあわせて“du gong bu”と綴られている場合と、意味の切れ目にあわせて“Du Gongbu”と綴られている場合があります。一つの分かち方ですべてヒットするとは限らないので注意が必要です。なお、大文字小文字の区別、uとüの区別は検索上無視されるので気にする必要はありません。

最後に、Author / creator に著者名を入れて検索する場合、こんどは漢字でもピンインでも問題なく検索できます。ピンインの場合、たとえば白居易なら、“bai juyi”として検索します。名の部分の二音節を分かって“bai ju yi”とするとヒットしないので要注意です。また、本名だけでなく字号にもかなり対応していますが、たとえば白居易の字「楽天」の場合、繁体字「白樂天」ではヒットせず、簡体字「白乐天」かピンイン“bai letian”としなければならないなど、本名の場合と比べると弱点が目立ちます。

ここまで見てきた注意点を、簡単にまとめておきましょう。

・四部分類にしたがってコレクションを俯瞰することは期待しないほうがよい。
HOLLIS+ の詳細検索モードで“digitization”と入れてから書名や著者名を検索する。
・書名検索はピンイン推奨。綴りの分かち方を変えて検索することも忘れずに。
・著者名検索は漢字(繁/簡)でもOK。ピンインの場合は綴りの分かち方に注意。

以上、筆者の気づいた範囲内で基本的な注意点を記してみました。中国学研究者のみなさまの快適なデジタルライフをお祈りします!