いまさら聞けないキーワード
<いまさら聞けないキーワード>CSV
2013/06/20 15:26
週刊BCN 2013年06月17日vol.1485掲載
データ項目をカンマ( ,)で区切って並べたファイル形式
「カンマで区切られた値」の意味。データ項目をカンマで区切って並べたファイル形式のことをいう。主に表計算ソフトやデータベース(DB)ソフトのデータ交換に用いられる。CSVファイルは拡張子に「.csv」がつく。
通常、表計算ソフトやDBソフトで保存したデータは、それぞれのソフト特有のファイルフォーマットで形成されていて、異なるソフト間にはデータの互換性がない。しかしCSVは汎用性が高いので、異なる種類のアプリケーションソフト間でも利用することができる。また、CSVはカンマ( ,)で区切られたテキストファイルなので、メモ帳などのテキストエディタで閲覧・編集することもできる。
例えば、Excelで保存したファイルの拡張子は「.xls」だが、これはExcel特有のファイル形式で、他のソフトでは開くことができない。しかし、この拡張子「.xls」を「.csv」に変更することによって、他のソフトでも再生することができるようになる。つまりCSVは、異なるアプリケーションソフト間でデータ交換する際の橋渡し役を務めるわけだ。
実際には、CSVの細部の実装は、それぞれの表計算ソフトやDBソフトによって若干の差異がある。これを受けて、05年に「RFC4180」として一般的な書式が成文化されている。
CSVに似た単語にTSV(Tab-Separated Values)やSSV(Space-Separated Values)があるが、これらはそれぞれデータ項目を区切る文字が異なる。CSVがデータ項目をカンマ( ,)で区切るのに対して、TSVはタブ(/t)と呼ばれる制御文字で、SSVは半角スペースでデータ項目を区切る。これらはすべてテキストファイルで、異なるソフト間でのデータ交換に活用されている。
- 1