目次ページ  前ページ  次ページ

5. 形容詞・副詞・助詞の話し

5.2 形態素解析の位置づけ


5.2.3 表記と発音を区別する

 形態素の説明の前に、文字の書き方についての説明が必要です。言葉は基本的に音ですが、それを文字で表す規則が、書き方(表記)であり、それを声で再現することが言い方(発音)です。表記と発音は、言語ごとに対応の規則があります。細かくみれば、1対1に対応しません。アルファベットは表音文字ですので、かなり正確な書き方ができます。しかし、例えば、フランス語やドイツ語ではアクセント記号付きの母音文字を余分に使い、普通の母音文字と発声が微妙に違うことを反映するように書き(表記し)ます。英語は、この面倒な方法を使いませんので、逆に、読み方を個別に覚えなければなりません。アメリカ英語は、イギリス英語よりも簡単な表記が増えています。日本語では仮名が表音文字ですので、仮名を使えば、一応、正確に発声を文字で表すことができますが、実用的には表記の規則(かなづかい)を決めてあります。主語を立てる「〜は」、目的語を表す「〜を」などがそうです。漢字は、中国語の言い方を単純化した言い方に変化してきましたので、例えば、「過」は、以前「クァ」と振り仮名で表記したのを「カ」で済ますようになりました。漢字仮名交じりの文書を声に出して読み、その読みをすべて仮名文字で書いたものを、再度読むとなると、同音異義語が増え、読みから元の漢字を再現することができない問題が起こります。もう一つ、分かち書きしない仮名文字は、電報文の誤読の問題が起こります。この二つの問題の研究が、形態素解析の第一の課題です。
2010.5 橋梁&都市PROJECT

前ページ  次ページ