チベット語研究における
コンピュータの活用

 

 最近のコンピュータのめざましい発達のおかげで、チベット語をチベット文字で電子化できるのが当たり前という時代になりました。私の研究室でも『現代チベット語辞典(仮称)』の編纂に、テキストやデータベースの作成にと、3台のコンピュータをフル活用しています。まったく、コンピュータのおかげなくしては、私のような若造にはとても辞典編纂などという大仕事に取り組めるものではありません。

コラム:機織り機からパソコンへの道

 さて、今回、私の研究室でおこなっている研究活動の一環として、コンピュータをチベット語研究にどう活用していくか、ということに関するアイディアと実例を簡単にご紹介したいと思います。ご紹介といっても、なにぶんにもチベット文字をWeb上で公開するのは難しいので、画像化したチベット文字のテキストやデータベースを使ってのご紹介ということになります。

具体的なコンピュータの活用方法は現在のところ以下の三点にまとめられます。

  • 『チベット・ラサの年中行事』テキスト(訳注つき)
    チベット語の学習用テキストは古くは手書き、最近でも活字を用いた物でしたが、現在は研究室のコンピュータとプリンタで作成することができます。こうして電子化されたテキストは編集が容易なだけでなく、構成を変えて別なコンセプトで新しいテキストを作ったり、データベースに持ち込むことによって辞典編纂などに大いに活用することもできます。

  • 『チベットラサの年中行事』データベース
    ここに挙げるデータベースは、KWIC索引とかコンコーダンスなどと呼ばれる類のもので、『年中行事』の全文について検索ができるように作成しました。これを使って単語の使用頻度、共起制限、使用環境などを分析することができます。このデータベースは自分でもよく使っていますが、うまく活用すると、読みの精度というか、イメージの解像度というか、そういったものがかなり上がるものです。

  • 『現代チベット語辞典(仮称)』について
    チベット語の口語辞書を編纂する計画は10年以上前にさかのぼるのですが、当初は単語を手書きのカードで整理してゆく従来の方法を採っていました。こうして集めた単語はコロケーションも含めると10万を超え、現在はこれらを全て電子化してデータベースを構築し、整理、分析にあたっています。
    出版形態は書籍だけでなく、将来的には電子辞書の形も検討中です。

 このようにチベット語の研究においてもコンピュータは重要な道具となり、作業効率は上がっていますが、今後の課題としては多くのサンプルの電子化によるコーパスの拡充と、より高度なアプリケーションのためにプログラマーの方々との連携が考えられます。

 なお、私の作業環境はマッキントッシュ上で大谷大学真宗総合研究所のTibetan Language Kit (TLK)と東洋文庫のTLK用ユーティリティを使用しています。特に東洋文庫チベット研究室の福田洋一さんには大変お世話になり、感謝しております。

 この『チベット・ラサの年中行事』データベースは、以下の研究経費による研究成果の一部です。
アジア・アフリカ言語文化研究所研究高度化推進経費(平成10年度) 「アジア・アフリカ言語文化に関する電子事典の構築」

 
チベット語研究の目次ページに戻る

Copyright(C)2000, Izumi Hoshi@ILCAA,TUFS.
All Rights Reserved.