目次ページ  前ページ   次ページ

10. データベース言語SQLの解説

10.2 問い合わせの儀式


10.3.1 シソーラス関連

 データベースの参考書で、シソーラス(thesaurus)を解説したものをほとんど見ません。考え方は、検索に使うキーワードを系統的に集めた辞書です。特に検索用の単語を意識しないで、普通に思いつく単語(これを自然言語と言います)を使う検索機能が強力になりました。しかし、或る決められた個数の検索語だけを使うと効率がよいのは当然です。この単純な選択方法が、プルダウンメニューの利用に見られます。選択可能なキーワードの一覧から選択します。検索に使う自然言語に揺れがあると、検索効率が下がります。例えば、「計算機、メインフレーム、コンピュータ、コンピューター、パーソナルコンピュータ、パソコン、マイクロコンピュータ、マイコン、計算器、卓上電子計算器、電卓、…」など、思いつく用語をすべてキーワードに登録するのではシソーラスになりません。これらの言葉を階層構造に構成します。その用語として、上位語下位語関連語の区別を付けて相互参照の語を示します。同義語が複数あるときは、その中の代表となる語を決めて、そちらを使うように提案します。英語では単数形と複数形で見掛け上は別の語ですが(例えばdatumとdata)、別の意義に使う場合を除き、単数形を使うことが暗黙の提案になっています。二語以上の連続でキーワードにする語は、一語にします。例えばdatabaseは、元は2語ですが、ハイフン(−)や点(・)などを介するdata.base、data-baseと使うと、記号に文字列解読で特別な機能を持たせることもありますので、この使用を避けます。また、大文字・小文字も区別しません。日本語の環境では、英字に半角と全角の区別があります。また、カタカナ・ひらがなの区別を、するか・しないかも大きな問題です。固有名詞の扱いも大きな問題です。橋梁のデータベースを計画するとき、橋名などで検索するときにこの問題に悩まされます。例えば、城ケ島大橋と城ヶ島大橋とは「ケ」の字の大小違いで探索に漏れる例があります。固有名詞を検索語に使うときの問題は、根本的な解決策は無いと言えます。
2010.10 橋梁&都市PROJECT

前ページ  次ページ