目次ページ  前ページ   次ページ

9. データベースと文字処理

9.3 文書の分類法


9.3.3 シソーラスの作成が準備作業として必要

 データベースを作成するときは、二次資料に分類を付けて検索の手掛かりにします。これに、図書の分類方法を転用できますが、詳しい分類法には不向きですし、分類が無い場合が起こります。学術論文では、表題に内容の手掛かりになる学術用語が使われていれば、その用語を見出しに使うことができます。デパートやスーパーマーケットでは、商品の種類別に売り場が分類されています。この場面には、番号や記号の方を補助的に使い、名前や用語を見出し語として使います。これがキーワードの材料です。ここから、コンピュータの利用を前提として、言葉の吟味が必要になり、標準として使う名詞用語をキーワードとして決めます。そうすると、集合名詞・普通名詞・固有名詞などの区別、階層的なつながりを意識しなければなりません。これは、いみじくも分類を考えることです。第3章で名詞の話を取り上げました。その中の3.3節で、階層的な構造で使う分類用の一般名詞について説明しました。データベース構築では、シソーラス(thesaurus)を先に作ります。これは、分類語彙辞典と訳しています。採録する語彙がキーワードであって、対象としている専門ごとの用語や学術用語に基づきます。データベースのプログラミングの参考書では、キーワードとシソーラスについての解説は殆んど載っていません。シソーラスは、キーワード間に上位語(BT: broader term)・下位語(NT: narrower term)・関連語(RT: relational term)の階層的な関係を定義してあるのが、単なる類語辞典とは異なります。形態素解析に使う目的で多くの用語を単に集めた辞書とは、編集の考え方が異なります。前項の十進分類法の編集は、階層構造別にキーワードを並べ、それを表す数字コードの辞書です。
2010.9 橋梁&都市PROJECT

前ページ  次ページ