目次ページ  前ページ 次ページ

4. 論理学の応用場面

4.1 自然言語処理の課題


4.1.6 文書をコンピュータに発声させる

 テキストデータをコンピュータに発声させることの研究は、英語の場合には古くから開発されてきました。アルファベットを使う欧米語は、音を表す文字を並べ、単語単位で分かち書きをします。言語ごとに微妙に発声が異なることに対応させた特別な文字、例えばドイツ語のウムラウト、もあります。この表音文字並びの文構造は、機械的な発声に向きます。日本語は厄介です。分かち書きをしないこと、漢字の読みに音・訓の別がそれぞれ複数あること、それ以外にも特別な読みもあること、単語の切れ目が分からないことでの読み間違えがあること、などです。日本語を正しく読ませるため、息継ぎや語の切れ目に句読点を使います。漢字熟語の知識も助けになります。これを辞書だけの情報ではなく、人工知能(AI)を利用する研究もあります。しかし、ここで発想を切り替えると、コンピュータが日本語テキストを正確に読み上げるためには、作文技術を工夫することも考えられます。句読点以外の区切り符号(delimiter)を使い分ける方法です。その一つは、息継ぎをする個所に半角のスペースを入れます。コンピュータに日本語テキストを発声させることは、眼の不自由な人が情報を利用するときの大きな助けになります。これを目的とするときは、人の方が論理的で分かり易い作文をすること、または作文された文をそのように直すことに、コンピュータを利用することを考えます。これは、文章校正のソフトと言うことができて、自動翻訳の前段階に使うプリプロセッサと考えることができます。ワードプロセッサには、英語ではスペルチェッカ、日本語では表記の揺れを検査するツールを使うことができるようになったことが、これに当たります。文章の構成が論理的に筋の通った内容にまとめるのは、あくまでも人の側の責任です。日本語のワードプロセッサの仮名漢字変換は、変換候補をコンピュータ側が提示し、選択を人間側で行います。つまり、コンピュータの知能は、字面だけの解析に留めます。
科学書刊株式会社:電子版 「橋梁&都市 PROJECT: 2012」

前ページ 次ページ