青空文庫テキストへの「アクセント分解」の適用
2004年8月2日
青空文庫
「アクセント分解」とは、アクセント付きのラテン・アルファベットを、通常の日本語テキスト中で、記号などを用いて代替表記する手法です。
フランス語のアクサンやドイツ語のウムラウトなどが、すっきりと書き表せます。
青空文庫では、収録テキストへの「アクセント分解」の採用を検討しています。
「アクセント分解」は、山本有二さんによって考案され、「アクセント付き文字の変換表」に集成されています。
鈴木厚司さんが、九鬼周造『「いき」の構造』にこれを適用し、従来の青空文庫方式などとの差異を、「アクセント分解の表記例」にまとめてくださいました。
従来方式と「アクセント分解」による『「いき」の構造』のテキストは共に、同作品の図書カードから引き落とすことができます。
【一般的な日本語テキストにある制限】
青空文庫では、日本語の使えるパソコンやワープロが、ほぼ例外なく対応しているJIS漢字コード(第1第2水準の漢字を定めている、JIS X 0208)の枠の中で、ファイル作りを進めています。
こうしておけば、意図した文字が別の字に入れ替わったり、文字として表示されなかったりといった問題は生じません。
ただし、JIS漢字コードにないもの(外字)は、通常のテキスト中の文字としては取り扱えません。
そこで青空文庫では、外字に対しては、文字の成り立ちを示す注記を行ってきました。
漢字は、「※[#「※」は「牛+建」]といった形で示し、アクセント付きのアルファベットは、「desir[#desirのeにアクサン・テギュ(´)]などと書いてきました。
【より大きな文字コードによる解決】
現在のJIS漢字コードよりも枠を広げた文字コードに、外字の多くが組み込まれ、それが情報機器に例外なく組み入れられるようになれば、状況は改善されるでしょう。
青空文庫は、より大きな文字コードに作業の基盤を移し、現時点では外字として処理せざるをえないもののかなりを、通常の文字として取り扱えるようになるはずです。
第3第4水準の漢字を定めたJIS X 0213の文字集合は、アクセント付きアルファベットも広くカバーしています。
これが、新しい基盤として機能してほしいと、青空文庫では期待をかけています。
ただし、次の土台がしっかり根付くまでには、まだ少し時間がかかります。
【JIS漢字コードの枠内での工夫】
「アクセント分解」は、より大きな文字コードの定着を待つ代わりに、現在のJIS漢字コードの枠内で、アクセント付きのアルファベットを書き表そうとする工夫です。
山本有二さんによって考案され、「アクセント付き文字の変換表」にまとめられています。
青空文庫の作業にも力をふるってこられた山本さんは、作業者の協力の広場となっている青空文庫メーリングリストで、アクセント付きアルファベットの注記法が論議された際、この方式を紹介してくれました。
アクセントが頻出する、九鬼周造の『「いき」の構造』を入力された鈴木厚司さんと山本さんが中心となって、「アクセント分解」を青空文庫テキストに採用するための、細部の検討が行われました。
この作業を踏まえて、鈴木さんは『「いき」の構造』にこれを適用し、従来の青空文庫方式等と比較検討するために、「アクセント分解の表記例」を用意してくれました。
この成果を元に、青空文庫全体としてアクセント付きアルファベットの表記問題にどう取り組むのか、考えを進めていきたいと思います。
トップページに戻る。