ことばを測る
―ヒンディー語とウルドゥー語の語彙属性に関する研究―

トップ
科研データベース
電子申請システム
研究計画調書(pdf)

語彙解析(2015/03/28 更新)

【語彙解析について】
この語彙解析は、入力されたヒンディー語・ウルドゥー語の語句や文を可能な限り lemmatization として解析するツールです。特に両言語の特色である、述語動詞の迂言的活用 (periphrastic conjugation) は、辞書的意味をもつ先頭要素の動詞見出し語形に収束させるようにしています。このためこの語彙解析では、一つの動詞ごとに、文法的に生成される数千の動詞活用語句をカバーしています。この語彙解析により、より正確な出現頻度の測定および語彙属性の確定を目指しています。

【使用方法】
このページの左側と右側に、それぞれウルドゥー語とヒンディー語の語彙解析ページのリンクが張ってあります。
語彙解析ページには入力ウィンドウ(左)と出力ウィンドウ(右)があります。入力ウィンドウに、テキスト(語句あるいは文)を直接入力するか、他からコピーしたテキストをペーストしてください。文字コードはユニコード(UTF-8)であることが前提です。入力テキストのサイズは1,000バイトを超えないようにしてください。テキストを入力した後で中央部の 矢印 をクリックすると出力ウィンドウに結果が表示されます。
語彙解析ページの上部にある resources は日付の最も新しいものを選択してください。

【謝辞】
語彙解析用の機械辞書作成の一部は、アジア・アフリカ言語文化研究所(ILCAA)の 情報資源利用研究センター(IRC) の以下のプロジェクトから支援を受けたことを記して感謝いたします。また語彙解析用のサーバも同センターのものを利用させていただいています。
「ヒンディー語・ウルドゥー語の形態素自動解析(1)」(2012)
「ヒンディー語・ウルドゥー語の形態素自動解析(2)」(2013)
「ヒンディー語・ウルドゥー語の形態素自動解析(3)」(2014)

ウルドゥー語
語彙解析ページ

コピー・ペースト用の語句(例)
تصویر تصویریں تصویروں
کھینچوں گا
کھینچیے
کھینچ رہا ہے
کھینچی جا رہی تھیں

辞書の見出し語形としての
ウルドゥー語・ヒンディー語のリスト
(ウルドゥー語は約6760語)

ヒンディー語
語彙解析ページ

コピー・ペースト用の語句(例)
तस्वीर तस्वीरें तस्वीरों
खींचूँगा
खींचिए
खींच रहा है
खींची जा रही थीं

辞書の見出し語形としての
ヒンディー語・ウルドゥー語のリスト
(ヒンディー語は約11050語)