目次ページ  前ページ  次ページ

5. 形容詞・副詞・助詞の話し

5.2 形態素解析の位置づけ


5.2.10 表意文字を使う言語表現は交替が難しい

図5.1 邦文タイプライタ(カタログから)
 日本語や中国語の文書表記には表意文字の漢字を使いますので、音を文字に落とすことと、文字を音声で言う読み方とを並列させて覚えることに難しさがあります。日本語では、表音文字の仮名を覚えれば、文書による最低限のコミュニケーション(例えば手紙の読み書きなど)ができます。漢字を使う限り、文書表記法と読み方との間に在る質の違いを埋める手段はありません。漢字廃止論は、ナショナリズムによる漢字文化圏からの独立の要求も背景にありましたが、鉛の活字を使う活版印刷で障害になっていたことが大きな理由でした。東芝が日本語のワードプロセッサ(ワープロ)を始めて開発した1978年以前、企業での必須の事務機械の一つは、邦文(和文)タイプライタでした(図5.1)。文書の発想は音として頭の中で行われ、それを手書きにした原稿を見て、タイピストが操作します。タイピストは、文字を見てその音を再度頭の中で復元し、その音の順に並べられた漢字表で文字位置を確認し、レバーで活字を取り出してプラテンに打つ作業です。文字から音に変換する処理がここにあります。これは一文字単位での変換であって、訓読みの漢字も音の並びで検索しますので、単漢字変換と呼ばれるものです。熟語並びで変換する仮名漢字変換は、熟語に切り分けることと、読みを決めて辞書に当たりますので、人が漢字仮名混じり文を形態素解析する問題、と捉えることができます。
2010.5 橋梁&都市PROJECT

前ページ  次ページ