目次ページ  前ページ  次ページ

5. プレートガーダーの構造

5.2 形態素解析の位置づけ


5.2.2 形態素解析が現れた経緯

 品詞分類法は、辞書を作るときなど、文字並びで意味のある言葉の単位に分けるとき、自然に必要となった方法です。日本語の表記方法は漢字と仮名を組み合わせますが、分かち書きをしません。英文のような、最初から語単位(word)に分けてある言語表記とは違いますので、単語に切り分ける方法を先に考えて品詞を決めます。大局的に見ると、規則性、つまり文法があって、形容詞と副詞は、修飾対象(被修飾語句)の前に置き、助詞は後に付ける語(後置詞)です。動詞と形容詞は活用語尾が変わりますが、それを含めて品詞に分類しています。これが混乱の始まりです。分かち書きをしないで仮名文字だけを並べると、語の切れ目が分からなくなり、別の意味に取られることが起こります。仮名文字並びの言葉遊びは昔からありました。話し言葉を耳で聞いているときは、単語の切れ目、意味上の切れ目などの僅かな息継ぎやイントネーションを判断して、意味単位を正確に理解します。尤も、東北弁では「サ行」が「さ・す・す・せ・そ」と聞こえ、東京弁は「ひ」を「し」で発音することで取り違えが起こることがあります。現実には仮名文字だけで実用文を作ることはないのですが、電報文が例外的に使われていました。良く引用される例には「カネオクレタノム」を「金送れ、頼む」の意が「金をくれた、飲む」と判断される笑い話です。仮名文字並びから漢字交じりの意味ある文字列に直すことは、日本語ワープロを開発するときの問題の一つとして、長尾真(1936-)によって、1980年代前半から新しく形態素解析の研究が始まりました。
2010.5 橋梁&都市PROJECT

前ページ  次ページ