REPORT 01
1.助成事業の名称

 多言語処理技術の基盤整備

2.助成事業の概要

 前年度におこなったISO/IEC 10646 コード体系における文字処理,出力のシステム設計および辞書設計をもとに,各システム,サーバの実装をおこなう。さらに、組版規則の情報を持つ辞書および形態素解析用の辞書の作成をおこなう。

3.助成金交付申請額 15,150,000円


4.助成事業の開始及び終了予定年月日

開始年月日     平成13年4月 1日

終了予定年月日  平成14年3月31日


5.連絡先

  役職   助手

  氏名   星 泉

  住所   東京都北区西ヶ原4-51-21 東京外国語大学アジア・アフリカ言語文化研究所

  電話番号 03-5974-3817 (直通)


プロジェクトID 00A17004a

(添付資料1)

平成13年度 研究開発実施計画書


1.研究テーマ


多言語処理技術の基盤整備


2.研究開発の実施場所


(1)東京都北区西ヶ原4-51-21(最寄駅 都電荒川線 西ヶ原四丁目駅)

   東京外国語大学アジア・アフリカ言語文化研究所


(2)東京都府中市朝日町3-11-1(最寄駅 西武多摩川線 多磨墓地前駅)

   東京外国語大学外国語学部


3.研究に参加する研究員および経理担当者の氏名等


 ○研究代表者 星 泉   東京外国語大学アジア・アフリカ言語文化研究所 助手

              住所 〒114-8580 東京都北区西ヶ原4-51-21

              東京外国語大学アジア・アフリカ言語文化研究所

              電話:03-5974-3817(直通)、FAX:03-5974-3838(代表)

              E-mail: hoshi@aa.tufs.ac.jp

  (緊急連絡先)     電話:090-4051-9528(携帯) 045-787-0149(自宅)


 ○研 究 者 岡田知子  東京外国語大学外国語学部 講師

              電話:042-330-5323(直通)

              E-mail: tomokoo@fs.tufs.ac.jp

 ○研 究 者 上田広美  東京外国語大学外国語学部 講師 

              電話/ FAX:042-330-5322(直通)

              E-mail: hiromiu@fs.tufs.ac.jp

 ○研 究 者 町田和彦  東京外国語大学アジア・アフリカ言語文化研究所 教授

              電話:03-5974-3780(直通)、FAX:03-5974-3838(代表)

              E-mail: kmach@aa.tufs.ac.jp


  経理担当者 渡部博和 東京外国語大学会計課 契約・物品第二係長

              住所 〒114-8580 東京都北区西ヶ原4-51-21

              東京外国語大学会計課 契約・物品第二係

              電話:03-5974-3664(直通)、FAX:03-5974-3838(代表)

              E-mail: hirokazu@aa.tufs.ac.jp

4.研究の内容


 

4.1 研究の概要(平成12年度から平成14年度)

本研究では、事実上の国際標準となりつつあるISO/IEC 10646 コード体系の枠組みを尊重しながら、多言語の文字処理環境を整備するために、特にインド系言語の文字処理について、文字列の比較・照合ルールや辞書、グリフ(文字実体)の合成、ハイフネーションなどを十分に考慮した文字処理システムの研究開発を行う。これとともに各言語のグリフのデータベースの基盤を整備し、本格的な多言語情報処理環境の実装開発に発展させる。


4.2 研究の目標(平成13年度)


 前年度におこなったISO/IEC 10646 コード体系における文字処理,出力のシステム設計および辞書設計をもとに,各システム,サーバの実装をおこなう。組版規則の情報を持つ辞書および形態素解析用の辞書を作成し,開発したシステムの上での動作実験をおこなう。また、Web上での複数言語の混在処理を可能にするためのシステムを設計、開発する。文字と言語の関係を考慮した各種ソーティングのアルゴリズムを整理する。


4.3 研究の内容(平成13年度)  

星 泉(東京外国語大学アジア・アフリカ言語文化研究所) 

分担テーマ名:チベット文字(チベット語処理)

現在構築中のチベット語電子辞書の整備・拡大のため、チベット語コーパスを作成する。チベット語の各種ソーティングのアルゴリズムを整備する。またシステムへの辞書の実装をおこなう。


岡田知子(東京外国語大学外国語学部)  

分担テーマ名:クメール文字(電子辞書コンテンツの整備)

前年度に引き続き、クメール語電子辞書のコンテンツを整備・拡大する。また、システムへの実装に向けて、組版用辞書を作成する。


上田広美(東京外国語大学外国語学部)   

分担テーマ名:クメール文字(文字処理)

クメール語電子辞書を構築するために、クメール語ソーティングのアルゴリズムを整備し、システム上で試用する。


町田和彦(東京外国語大学アジア・アフリカ言語文化研究所) 

分担テーマ名:デーヴァナーガリー文字(サンスクリット、ヒンディー、マラーティー、ネパーリー語処理)

サンスクリット、ヒンディー、マラーティー、ネパーリーの各言語に即したソーティングのアルゴリズムを整備する。




5.助成研究費支出計画


5.1 研究期間内の研究開発費


研究期間 平成12年度から平成14年度まで


平成12年度助成研究費(確定額・支払額・予定額)  13,095,000円

平成13年度助成研究費(確定額・支払額・予定額)  15,150,000円

平成14年度助成研究費(確定額・支払額・予定額)  15,000,000円