コンテンツへスキップ

東京大学附属図書館アジア研究図書館
上廣倫理財団寄付研究部門
Uehiro Project for the Asian Research Library

COLUMN

新エジプト語のデータベース“Ramses Online(ラムセス・オンライン)”を使ってみよう!

Ramses Online: an annotated corpus of Late Egyptian
http://ramses.ulg.ac.be


特任准教授 永井正勝

1.はじめに

テキスト(文献資料)を研究している人であれば、ある単語や表現を効率よく検索したいと思ったことがあるかと思います。つまり、どの資料で、どのような文脈で、単語や表現がどれだけ用いられているのかを、正確かつ瞬時に知りたい、と。まるで、のび太くんがドラえもんにすがるかのように、なんか便利な道具はないものかな〜、と思ったりします。

すると、世の中うまく出来ているもので、みんなのために道具を作って提供したいと考えている人もたくさんおられます。まさに、便利な道具をポンポンと出すようなドラえもん的な精神の人達です。そのよう人達が作っている道具の中で、正確かつ瞬時に単語のデータがわかるものの1つのが、各種のデータベースでしょう。

今回のコラムでは、筆者の専門としているエジプト語のうち、新エジプト語と呼ばれる言語変種を対象としたデータベースのRamses Online(ラムセス・オンライン)を紹介します。

2.新エジプト語とは

新エジプト語とは、古代エジプトの新王国時代になって出現した新しい変種の書き言葉です。それ以前に使用されていた書き言葉の変種は中エジプト語と呼ばれています。中エジプト語は、新王国時代になるとすでに文語化していたため、書記たちは口語に即した書き言葉を模索していたようです。言文一致の試みとして生まれた新しい書き言葉が新エジプト語なのです。

新エジプト語の要素は第18王朝時代より出現しますが、これぞ新エジプト語と呼べるような文体は、第19王朝〜第20王朝の頃に確立します。この時代の王朝はラメセス(ラムセス)という名を冠したファラオが数多く存在したため、ラメセス(ラムセス)朝とも呼ばれています。

3.Ramses Online(ラムセス・オンライン)

Ramses Online(ラムセス・オンライン)は、ラメセス(ラムセス)朝を代表とする書き言葉である新エジプト語を対象とした、無料で使用することのできるオンライン・データベースです。

正式名称とURLは以下の通りです。

Ramses Online: an annotated corpus of Late Egyptian
ラムセス・オンライン:新エジプト語のアノテーション付コーパス
http://ramses.ulg.ac.be

本データベースは、インターフェース(タイトル、ページ上部の見出し、検索フォーム)部分が英語表記となっています。それゆえ、操作そのものは英語を見ればなんとか対応が可能です。その一方で、コンテンツはフランス語で書かれています。

日本の読者が望んでいるのは、本データベースの学術的な意義付けだとか作成メンバーだとかという周囲の情報ではなく、ずばり、使い方でしょう。そこで、以下、基本的な使い方を3つ紹介します。

4.検索(1)【初級編】転写から見出し語を検索する

▪️簡易検索におけるLemmas(見出し語)検索

さっそく、トップページ(http://ramses.ulg.ac.be)にアクセスしてみましょう(図1)。

Simple Search in Texts(テキスト内の簡易検索)では、Lemmas(見出し語)タブの下に検索窓が表示されています(図1)。そこに語の転写を入力すると、見出し語検索が実行されます。もっとも基本的な検索方法は、ずばりこれだけです。

なお、トップページではない箇所を開いている際には、左上にあるRamses Onlineをクリックするか、Searches(検索)からSimple Search(簡易検索)を選択して下さい。すると、Lemmas(見出し語)検索の画面に戻ります。

それでは、Lemmas(見出し語)検索にて、古代エジプト語のnbw「金/黄金」を検索してみましょう。

検索窓にnbwを入力してリターンキーを押すと、候補が示されます。お目当ての「金/黄金(フランス語 or)」は3番目に表示されています(図2)。

 

ここで3番目の候補をクリックすると、用例が示されます(図3)。その際、検索語が黄色でハイライトされています。また用例の上には、テキストの出典と時代(王朝)が示されています。

画面(図3)の左上には件数が表示されます。nbwの数はちょうど100件となっていますが、実はRamses Onlineでは、100件以上の用例がある場合、100件までしか表示されない仕様になっております。用例数の把握には注意が必要です。

▪️入力する転写記号

「金/黄金」の語はnbwと転写されます。ここで使用されているような、nbwなどのアルファベットを転写記号と言います。エジプト語研究で用いられている転写記号には複数種類の体系があり、どの体系を用いるのかは、学者によって、あるいはデータベースによって様々です。そこで、Ramses Onlineで使用されている転写記号の体系と入力用の転写を参考資料としてまとめておきました。

[参考資料]永井正勝(20220417)「“RAMSES ONLINE”で使用されている転写記号一覧」
https://hieraticscripts.omeka.net/items/show/2064(ファイルをクリックすると拡大します)

参考資料で「Ramses Online 表示」としたものが、インターフェースに表示される転写です。その下にある「見出し語検索」(黄色のマーカー)に示したファルファベットが、Simple Search in Texts(テキスト内の簡易検索)にあるLemmas(見出し語)検索で入力する文字となります。

ここで、Lemmas(見出し語)検索で用いる文字について、留意すべき点を述べておきたいと思います。まず、参考資料の上段に示した2の転写ですが、これについては「i」「j」のどちらも入力が可能です。好みの方をお使い下さい。次に、3と4について言うと、これらは共にyとなり、両者を区別しない仕様になっています。同様に、18と19も区別されず、共にsとなります。その他、1と5など、大文字と小文字とで別の転写を示すことがあるので、留意してください。

また、補助記号の使用についても留意が必要です。

女性形形態素を示す.(ピリオド)の使用は任意です。
たとえば、km.tと入力しても、kmtと入力しても、km.t「エジプト」が示されます。

また、複合語境界を示す-(ハイフン)の使用も任意です。
たとえば、st-qrsと入力しても、st qrsと入力しても、s.t-ḳrs「墓室」が示されます。

このように、インターフェースで示されている転写と入力転写が区分されている点において、ユーザーフレンドリーなシステム設計になっていると言えるでしょう。

5.検索(2)【中級編】ヒエログリフ部分を検索する

▪️簡易検索におけるSpellings(綴り字)検索

もどかしいことに、新エジプト語のテキストを読んでいると、語の一部の文字がわかるものの、語全体の転写がわからない、ということがしばしばあります。そのような状況でも語の検索ができるように、ラムセス・オンラインはSpellings(綴り字)検索を用意してくれています。

それでは、Simple Search in Texts(テキスト内の簡易検索)Spellings(綴り字)を選択してみましょう(図4)。

Spellings(綴り字)検索に用いるのは、Manuel de Codage(マニュエル・ド・コダージュ:MdCと略します)とよばれるシステムに従った文字番号あるいは転写記号となります。参考資料で水色あるいは緑色のマーカーで示したものです。

次に、実際に検索してみましょう。X1とZ4が2つ連続したヒエログリフの文字列を検索してみます。その場合、検索窓にX1-Z4(あるいはty)と入力します(図5)。

検索結果を確認していくと、その中にbd.t「blé amidonnier(エンマ小麦)」があります(図6)。この語を使って、Spellings(綴り字)検索の特徴を確認しておきます。

この語では、ヒエログリフの綴りの中にX1-Z4が含まれていますが、転写にはZ4の音のyが含まれておりません。このように、Spellings(綴り字)検索で対象となっているのは、語の転写ではなく、ヒエログリフの文字列となるのです。X1-Z4の音が語の転写に反映されない場合(つまりこれらの文字を読まない場合)でも、ヒエログリフの文字列にX1-Z4が含まれていれば、検索結果として返してくれます。

▪️Spellings(綴り字)検索を十全に行うための更なる情報

Spellings(綴り字)検索を十全に行うべく、いくつかの情報を捕捉しておきます。

まず、Spellings(綴り字)検索におけるManuel de Codage(MdC)式の文字番号ならびに転写記号ですが、これらについては参考資料に示したもの以外にもたくさんの種類があります。転写記号の詳細はManuel de CodageのWEBサイトで確認して下さい。

Manuel de Codage, Appendix B: List of sign numbers and phonetic values
http://www.catchpenny.org/codage/#app2

ただし、Ramses Onlineでは、MdCで文字配列のために使用される<:>や<*>などの記号は検索しても、すべて<->として処理されるようです。つまり、文字配列は、Ramses Onlineで検索することはできません。

次に、文字番号についてですが、これは以下のサイトで確認することもできます。

Thot Sign List (TSL)
http://thotsignlist.org

さらに、やや中級者向けの情報をお伝えしましょう。Ramses Onlineのヒエログリフ画像では、JSeshと呼ばれるヒエログリフ・エディターが使用されています。そのようなこともあってか、Spellings(綴り字)検索では、JSesh独自の文字番号での検索も可能となっています。JSesh独自の文字番号で重要なものとして、新エジプト語で頻繁に使用されるFf1(ヒエログリフのZ5に似た文字)やFf100(空白を埋める点)があります。これらの、Ff1やFf100の検索も可能です。

JSesh公式サイト
https://jsesh.qenherkhopeshef.org

なお、JSeshには日本語マニュアルがございます。必要に応じてご参照下さい。

永井正勝「JSesh ユーザーズガイド【基本編】」2021年7月22日
http://hdl.handle.net/2261/0002000750

永井正勝「JSesh ユーザーズガイド【中級編】」2021年7月25日
http://hdl.handle.net/2261/0002000751

6.検索(3)【上級編】連語検索

▪️Complex Search(複合検索)による連語検索

本データベースの利用で、もっとも玄人志向なのが、この連語検索でしょう。検索(1)と(2)は1語の単語を検索するものでしたが、この連語検索は2語以上の語句を検索するものです。利用には、上部のSearches(検索)からComplex Search(複合検索)を選んで下さい(図7)。

すると、Add Lemma(見出し語を付加)Add Spelling(綴り字を付加)Add Grammar(品詞を付加)Add Logical And(and検索を付加)Add Skip(1語以上の語をスキップ)などのタブが検索窓の下に現れます。これらのタブを使って連語検索を行います。

最初に、Add Grammar(品詞を付加)を利用した連語検索を紹介しましょう。

たとえば、「動詞」-「名詞」-「形容詞」という語の連続を検索したい場合、Add Grammar(品詞を付加)にて、「verb(動詞)」、「substantive(実詞/名詞)」、「adjective(形容詞)」をそれぞれ追加し、検索します(図8)。

すると、この語順で記されている資料が忠実にヒットします(図9)。当然ながら、この語順がヒットするということは、動詞と名詞の間に冠詞の入った、「動詞」-「冠詞」-「名詞」-「形容詞」はヒットしません。

次に、別の検索として、いわゆるワイルドカード(任意の1語)を使用した検索をご紹介しましょう。たとえば、「男性単数形定冠詞pꜣ」-「任意の1語」-「接尾代名詞1人称男女共通単数形i(私)」という連語で、「任意の1語」にどのような単語が用いられているのかを検索することができます。検索には、「Lemma<pꜣ>」-「Add Skip Exactry one word」-「Lemmma<i>」を入力します(図10)。

検索結果の一例は図11の通りです。上記の環境において、「任意の1語」には、動詞あるいは名詞が出現するようです。

連語検索は、指定した語の連続を愚直に探し出してくれるものです。これらは、文法あるいは表現として意味ある単位であることもありますし、そうでない場合(たとえば意味的にまとった単位をぶった切った語の連続が示される場合)もあります。上手く活用すると、語と語の有意な結びつき、つまり、言語学でいうコロケーションを抽出することができます。

7.アノテーション付コーパスとうまく付き合う

Ramses Onlineは、語や連語を検索することのできる便利なデータベースです。このデータベースの価値を高めているのが、「アノテーション付」という点にあります。「アノテーション」とは、文字番号・品詞・意味など、語の持つ要素への解釈です。このようなアノテーションがあるからこそ、複雑な検索が可能となっています。

しかしながら、アノテーションは、それを付与した研究者の解釈にしかすぎません。研究者が異なると、アノテーションの解釈も変わることがあります。データベースの利用には、アノテーションが解釈の1つであるという、やや斜に構えた対応が必要です。

Ramses Onlineでタグ付けされている品詞について一例を述べておきますと、前置詞(属格を含む)、転換詞(nty、jwなど)は、すべて「connector/connect」に分類されています。逆を言えば、前置詞や転換詞という品詞が設定されておりません。この点は、特に連語検索で注意が必要です。

また、通常の辞書ではあまり採用されていない転写がRamses Onlineで採用されていたりします。たとえば、「ピラミッド」や「ピラミッド墓」を意味する語の転写には、通常ではmrが使用されますが、Ramses Onlineではmḥrが使用されています。それゆえ、「ピラミッド」や「ピラミッド墓」の語は、mrで検索してもヒットしないことになります。

このように、アノテーション付与者の解釈(学説)とうまく付き合いながら、データベースを活用していく必要があります。

8.おわりに

データベースは、ドラえもんの道具のように便利なものです。しかし、その利用には、業界で用いられている転写システムに対する理解など、使い手側にもある程度の予備知識が求められます。Ramses Onlineの利用では、特に、Manuel de Codageを含めた広義の転写を理解しておく必要がありました。そこで、このコラムでは、のび太くんとドラえもんを結ぶ仲介者として、予備知識(暗黙知)を可視化・言語化させることにより、操作法の基礎を解説してみた次第です。

それでは、皆さん、Ramses Online(ラムセス・オンライン)を使ってみて下さい!楽しい発見がたくさんあることでしょう!

April 19, 2022


・本コラムは2022-2023年度U-PARL協働型アジア研究プロジェクト1「古代エジプト研究の総合知創出に向けた基礎的取り組み」(代表 永井正勝)の教育教材も兼ねて執筆致しました。