目次ページ   前ページ  次ページ

2. 実践的な資料管理

2.3 画像データのファイル管理


2.3.6 五W一Hの情報を含めるファイル名の提案/H3>

 橋の文字情報は、文字数を節約することと、検索用キーワードとしての効率的な利用を考えて、省略形を使うか、英数字などのコード化を決めておきます。具体的なコードの一覧は、別の資料にまとめました。ここでは説明だけです。
  • 国名の記号化は、 JIS (ISOで規定されている英字2字の国名コードを使います。日本(JP)、米国(US)、イギリス(GB)、などです。
  • 都道府県名は、二桁の数字を当てる JIS規格があります。ただし数字であっても、1桁の数は文字型の扱いをして、01, 02, 03,…のように書きます。筆者は、漢字名を使うときは、府と県とを省いて二文字に揃えています。たとえば、東京、愛知、大阪のように書きます。三文字になる北海道、神奈川、和歌山、鹿児島は、三文字目を省いて、文字並びが不揃いにならないようにしました。実用上、誤読の心配はありません。
  • 筆者は、都道府県名にも英字2文字を使うコードを採用しています。例えば、東京、愛知、大阪は、 TK, AT. OSです。漢字を使うと4バイトですが、英字は2バイトで済みます。他の国、例えば米国では、州名の英字2字コードを繋ぎます。ただし、省略記号の点「.」を省きます。例えば、New Yorkは、NYです。
  • 都道府県名の下位に市区町村名があると分類に役たちます。必要に応じて追加します。 ・資料作成者を特定できるコードは必須です。藤井資料は情報の発生した年代順に項目が並べてありますが、全体の順番を示すコードがありませんでした。筆者は、これに一連番号のコードを割付けました、橋梁史年表の作業用には二種類あって、日本の橋については、英小文字を頭に持つ「 fuji*****」、他の国の橋では英大文字で始める「FUJIIi******」を当てました。これは、改定があったためです。
  • 橋名は、そのまま書きます。日本では鉄道橋は「……橋梁」と書く習慣ですが、「梁」の字を省きました。そうすると、鉄道橋と道路橋で同名になる場合がありますが、県別などの詳細データファイルで区別できるようにしました。海外の橋は、英字表記を標準としました。中国(中華人民共和国)の橋は、漢字表記もありますが、日本の漢字コードに無い字形があります。また英字表記も使われていることがありますので、参照する方法に苦労があります。
  • 或る橋の画像ファイルは、上記のコードを組み合わせた長いファイル名を提案したいと思います。書き換える新しいファイル名は、橋の名前、所在地名の情報、保存用フォルダ名などを、アンダースコア「_」で繋いで長いファイル名に組み上げるのが実践的です。例えば、名古屋市の納屋橋については、「JPAT名古屋_納屋橋_fuji00185_01.JPG」(38バイト)のようにします。最後の拡張子[.JPG]があることで、画像ファイル名であることが分かります。同じ画像をサムネイル化したファイルは、「JPAT名古屋_納屋橋_fuji00185_01tn.JPG」(40バイト)のように書きます。同時期で同じ橋について複数の画像の組があるときは、二桁の数字(上の例では01)を順序数にして区別させます。画像ファイル名には日付の情報がありません。これは、ファイルを作成した個人または機関名のコード、上の例で言えば、藤井資料の元データファイルの方に記述があるものとしています。藤井資料では、番号違いで納屋橋のデータが二箇所あります。第4章に例示したサムネイル付きの目録では、歴史的鋼橋の画像ファイル名と藤井資料の番号とを参考データに加えてあります。初期のOSであったMS-DOSでは、ファイル名の長さは、半角の英数字8文字以内、拡張子は3文字以内の制限がありました。現在では、漢字名も利用できて、260バイトの長さまで利用できます。ただし、この長さは、ドライブ名・パス名・フォルダ名・ファイル名・拡張子までを含めた全体のバイト数です。したがって、ユーザ側のファイル利用環境が、複数のフォルダを入れ子状にして間接的に参照するときは、ファイル名そのものの文字数に注意が必要です。

前ページ  次ページ