目次ページ  前ページ   次ページ

9. データベースと文字処理

9.5 注意して言葉を選ぶ


9.5.4 固有名詞を扱うときの例

 筆者の専門は橋梁工学です。橋梁の実態(facts)を知りたいときの検索語に、固有名詞としての橋梁名を使うのですが、氏名と同じように同名が数多くでる場合も、また意図した橋梁がヒットしないことも少なくありません。在ることが分かっていても、文字違いで見つからないこともあります。例えば、或るデータベースを検索したとき「城ヶ島大橋」と入力してもヒットしませんでした。実は「城ケ島大橋」で登録されていました。「ケ」の字が大文字か小文字かの違いです。ワイルドカードで検索できるようにする、例えば「城*」を検索語に使いたいときは、文字処理を組み込む必要があります。橋の名前が分からなくて、橋梁の所在地から検索をしたいとして、都道府県名を使うとします。しかし、県境にある場合、管理者がどちらの県にあるかによって検索漏れも起こります。このときは、階層的に一段上の地区名(関東・中部・関西など)を使います。上位語で検索すると大量のヒット件数になることがありますので、そこから下位語を選択して絞りこみます。データベースを構成するとき、分類項目に使うキーワードに文字違いが無い様に注意することが必要ですが、これが次項で説明する正規化の目的の一つです。
2010.9 橋梁&都市PROJECT

前ページ  次ページ