いまさら聞けないキーワード

<いまさら聞けないキーワード>CSV

2013/06/20 15:26

週刊BCN 2013年06月17日vol.1485掲載

【CSV(Comma-Separated Values)】
データ項目をカンマ( ,)で区切って並べたファイル形式

 「カンマで区切られた値」の意味。データ項目をカンマで区切って並べたファイル形式のことをいう。主に表計算ソフトやデータベース(DB)ソフトのデータ交換に用いられる。CSVファイルは拡張子に「.csv」がつく。

 通常、表計算ソフトやDBソフトで保存したデータは、それぞれのソフト特有のファイルフォーマットで形成されていて、異なるソフト間にはデータの互換性がない。しかしCSVは汎用性が高いので、異なる種類のアプリケーションソフト間でも利用することができる。また、CSVはカンマ( ,)で区切られたテキストファイルなので、メモ帳などのテキストエディタで閲覧・編集することもできる。

 例えば、Excelで保存したファイルの拡張子は「.xls」だが、これはExcel特有のファイル形式で、他のソフトでは開くことができない。しかし、この拡張子「.xls」を「.csv」に変更することによって、他のソフトでも再生することができるようになる。つまりCSVは、異なるアプリケーションソフト間でデータ交換する際の橋渡し役を務めるわけだ。

 実際には、CSVの細部の実装は、それぞれの表計算ソフトやDBソフトによって若干の差異がある。これを受けて、05年に「RFC4180」として一般的な書式が成文化されている。

 CSVに似た単語にTSV(Tab-Separated Values)やSSV(Space-Separated Values)があるが、これらはそれぞれデータ項目を区切る文字が異なる。CSVがデータ項目をカンマ( ,)で区切るのに対して、TSVはタブ(/t)と呼ばれる制御文字で、SSVは半角スペースでデータ項目を区切る。これらはすべてテキストファイルで、異なるソフト間でのデータ交換に活用されている。
  • 1

関連記事

<いまさら聞けないキーワード>ディレクトリ

トランスウエア、使いやすい管理者機能を提供する商用メールサーバー

ディサークル、POWER EGG 2.0上で簡単に情報共有できる「Webデータベース」