Indic Script Homepage > Tibetan Script

チベット語のホームページを作ろう!

星研究室のホームページへ
hoshi@aa.tufs.ac.jp last updated 2002/12/3

本ホームページは,新エネルギー・産業技術総合開発機構(NEDO)による新エネルギー・産業技術研究助成事業「多言語処理技術の基盤整備」(2000年11月-2003年3月,研究代表者:星泉)の研究成果です。

News!

★MacOS9.xの環境で,TibetanLanguageKit(TLK)をお使いの方は,チベット文字を使った書類をエディタで作成し,ISシステム対応のコードに変換できるperlのスクリプトIS_tib.plを用意しております。このスクリプトを使えば,通常のテキストからチベット文字表示可能なhtmlファイルを作成することができます。詳細はこちらをご覧ください。ダウンロードはこちらから。

★チベット語で投稿できる掲示板を作ろうと考えています。取りあえず今はNAZCAさんの無料掲示板をお借りしています。→ココ!

取りあえず実例

 以下はいずれも工事中です。

チベット語ホームページの作り方

簡単に言えば,チベット文字で表示したい文字列をローマ字転写(CTSA方式/ Code for Tibetan Script based on ASCII) に従って記述し,専用のタグでくくってhtmlを作成すると,チベット文字が表示されるという仕組みです。

サンプル

<IMG SRC= "http://nedo.aa.tufs.ac.jp/cgi-bin/indic_trans_image.cgi?script=TB ←IndicScriptシステム
&text=bakra^Sisa^bade^legasa/ ←転写したテキスト(長いものでもOK)
&color=black ←色
&size=20pt ←ポイント数
&trans=ctsa ←転写規則(wylieにも一応対応してます。その場合はEWSTと書く)
&font=tb_ut ←使用するフォント
&rule=tbt ←転写方式(チベット語方式tbt,サンスクリット方式skt)
&lineBreak=0 ←行末折り返しの有無 するなら1,しないなら0
&winWidth=600"  ←行末折り返しをする場合の幅
align="middle"> ←縦を中央のラインに揃える


上記のタグをHTMLテキストの中に書き込んだ結果は下記の通り。


インターネットにつながっていないとHTMLに書き込んでも表示できません。AA研のサーバーにアクセスし,転写されたテキストに即した文字列をグリフサーバーからイメージデータとして送り返してきます。結果的に表示される文字列は画像ということになります。画像ですから,OSやブラウザの種類にかかわらずチベット文字による情報を発信,受信することができます。

試しに下記のサンプルをコピーして,HTMLテキストの中に入れてみてください。

<IMG SRC="http://nedo.aa.tufs.ac.jp/cgi-bin/indic_trans_image.cgi?script=TB
&text=bakra^Sisa^bade^legasa/
&color=black&size=20pt
&trans=ctsa&font=tb_ut&rule=tbt
&lineBreak=0&winWidth=600" align="middle">

表示されたのを確認したら,下記のCTSA転写方式にしたがって書いたテキストをtext=の後に貼り付けて(あるいは直接書き込んで),再び表示させてみてください。自由な文字列が表示できます。

Tips! チベット文字画像にリンクをはることは可能ですが,webに表示される際は画像ですので,OSがWindowsの場合は周りに枠が表示されます。枠は,align="middle"の後に,border="0"と表記すれば消すことができます。Macなら枠は表示されません。



CTSA (Code for Tibetan Script based on ASCII)

◎子音字
ka k'a ga Ga
ca c'a ja ~a
ta t'a da na Ta T'a Da Na
pa p'a ba ma
Ca C'a Ja va
Za za xa ya
ra la Sa sa $a
ha qa hp'a


◎母音記号
qa qi qu qe qo qxa qxi qxu qxe qxo qai qau qaM qiM quM qeM qoM qaiM qauM qa:


◎その他記号類
space yig_mgo
ma^ ma/ ma// space 未対応

※ツェクは現在のシステムでは_を使用。次回のシステム更新では,_は純粋なスペースに当て,ツェクは^に変更する予定(2004.3.10現在,ツェクは^にシステム変更済み)。また,シェーが行頭に送られてしまうなど,組み版上のバグがあるので要修正。

※数字は,現在チベット数字のみに対応しています。

※チベット文字列の中で使用可能な記号は,現在のところ,!,?,( ) です。

◎音節の表示 厳密CTSA表記と簡易CTSA表記

★音節文字単位の厳密CTSA★
厳密CTSA表記は,古典以降のチベット語だけでなく,古代チベット語,サンスクリット,ゾンカ,外来語などいずれの表示もチベット文字に変換することができます。厳密CTSAの考え方は,子音字は常に母音を含むというインド系文字全般に共通する文字の構造に基づいています。縦のスロットごとに母音を一つ含む単位として解釈する,この単位をサンスクリットでアクシャラと言います。この考え方は,機械に理解しやすいもので,コンピュータによる文字処理には適しています。コンピュータによる文字処理に際しては,この厳密な転写に基づいて行い,人間にとっての入力のしやすさや,判読のしやすさ,といったものが必要な場合には,インプットメソッドを作ったり,簡易CTSAやWylie方式に転写するコンバータを作るなどして対応することができます。

★発音単位の簡易CTSA★
簡易CTSAはwylieやACIPの転写と同じ考え方に基づくもので,これでもチベット文字に変換させることは可能です。簡易CTSAは発音により近い転写で,人間にとって読みやすいのですが,機械にとって理解するのが難しい転写です。古典以降のチベット語とサンスクリットのルールから外れるような古代チベット語やゾンカ,外来語などのチベット文字表記には完全に対応することができません。

★厳密CTSAと簡易CTSAの例★
チベット文字表記
厳密CTSA boda^ badaga^ skra^ baskraga^ bakaxasa^ yodapa^ bumo^ gxolap'a^ lenaDi^ yu^qesi^Do^lxara^
簡易CTSA bod^ bdag^ skra^ bskrag^ bkaxs^ yodp^ bumo^ gxolap'a^ lenaDi^ yu^qesi^Do^lxara^
Wylie bod bdag skra bskrag ? ? bumo ? ? ?
言語 tibetan tibetan tibetan tibetan old tibetan dzongkha dzongkha english english english


※結合文字の対応はまだ不十分。rgaという組み合わせがなぜか表示できない/NDaなどサンスクリットの結合文字がほとんど表示できない,など。これらはフォントを作成するなどして改善する予定。

◎MacOSで使える入力支援ソフトTibetanLanguageKitから厳密CTSAへのコンバート

 MacOS9.xの環境で,TibetanLanguageKit(TLK)をお使いの方は,チベット文字を使った書類をエディタで作成し,ISシステム対応のコードに変換できるperlのスクリプトIS_tib.plを用意しました。このスクリプトを使えば,通常のテキストからチベット文字表示可能なhtmlファイルを作成することができます。詳細はこちらをご覧ください。

 download(IS_tib.pl+ReadMe 圧縮済 ファイルサイズ9,370バイト)








hoshi@aa.tufs.ac.jp