カンナダ語辞典の電子化


E-Kannada-English-Japanese Dictionary

プロジェクトの目的

カンナダ語 (Kannada) はインド共和国カルナータカ州 (Karnataka) の公用語であり、ドラヴィダ語族の主要言語の一つである。話者人口はおよそ5500万人である。
本プロジェクトでは、現在編纂・校正中の『Kannada-English-Japanese カンナダ語英語日本語辞典』の編纂と印刷のために開発したカンナダ文字処理システムを使い、同辞典を編纂する。さらに電子化データをweb 上で利用するためのツールの開発を行なう。

プロジェクトの概要と進行状況

カンナダ語の基礎的研究は、1988年以来、インド中央諸語研究所 (CIIL) との共同研究として、内田紀彦氏(元園田学園女子大学教授)と、Dr. B.B. Rajapurohit (元CIIL教授, カルナータカ州マイソール市在住)とを中心に、Rajapurohit博士を二度にわたってAA研客員教授として招聘するなどして行なわれてきた。さらに、以下の科研費等に基づき継続的な進展を図ってきた。

これらは主としてインドの公用語など、主要言語についての文法、語彙についての基礎研究を目的とした研究であり、当初はインドの主要言語のそれぞれ2000語からなる語彙データベースの作成から出発した。その中で、内田氏は1994年ころから、より高度で大規模な辞書の作成を目指すようになった。
しかしその時点ではまともに辞書に用いることのできるようなカンナダ語処理システムは存在していなかった。そこで、1994年から1995年にAA研がRajapurohit氏をAA研客員教授として招聘した際に、Rajapurohit氏がTeXのMetafontシステムを用いてカンナダ語のフォントを作成した。このフォントを用いたTeXによるカンナダ語文書処理システムや、一般的なPCで処理可能なテキストに基づく辞書データベースシステムを1995年に高島が開発することで、以後継続して『カンナダ語英語日本語辞典』の完成のための努力が、AA研のその他の南アジア諸語研究者との共同研究を伴いながら、継続されてきたところである。
2006年度: 高島、峰岸が、マイソール市を訪問し、Rajapurohit 氏とデータ入力方式について打ち合わせを行った。
2007年度: 内田がマイソール市において、Rajapurohit 氏と辞書の作成作業を進めた。
2008年度: 内田がマイソール市において、Rajapurohit 氏とデータの校正修正作業を続けた。これまでで3万2千語あまりの項目をほぼ確定し、更に全体の3分の2程度までのカンナダ語部分のチェックを終えた。
2009年度: 内田がマイソール市において、Rajapurohit 氏とデータの校正修正作業を続けた。ほぼ全体の項目を決定し、カンナダ語の例文部分について、別のカンナダ語母語使用者に校正を依頼して大体においての校正の作業を完了した。
2010年度: 2009年度までに行なったカンナダ語修正の手書きのデータを電子データに変換してデータベースにおける修正作業を半分程度完了した。
2011年度: 2009年度までに行なったカンナダ語修正の手書きのデータを電子データに変換してデータベースにおける修正作業の第一次分を完了した。校正の過程で明らかになった第二次修正の必要部分については2012年度初頭に修正作業を完了する予定である。
日本語についての校正を辞書作成経験のある出版社関連の業者に発注し、修正したので日本語部分の読みにくさの相当部分は改善された。
とりあえず町田センター員の開発した全文検索システムを用いて試作版の電子辞書検索システムを試行的に運用している。
2012年度: カンナダ語については、データの入力および第一次校正を完了した。
英語部分についてはさらに第二次の校正を行い、Kannada-English Etymological DictionaryとしてAA研から書籍の形で刊行した。

プロジェクトメンバー

高島淳(AA研教授、IRC)、内田紀彦、Rajapurohit(インド在住)、町田和彦(AA研)、峰岸真琴(AA研)