みなさん、おはようございます!タカハシ(@ntakahashi0505)です。
こちらの記事は、タカハシが音声メディアVoicyの「スキルアップラジオ」にて放送した内容から、ピックアップしてお届けします!
今回のテーマは、今さら聞いてもいいIT用語 #9: 「CSV」です。
なお、以下で実際にお聴きいただくこともできます!
では、よろしくお願いいたします!
今聞いてもいいIT用語シリーズ9回目「CSV」
今聞いてもいいIT用語シリーズ第9回目お送りしたいと思います。
これは、いまさら人には聞けない、でも知っておいた方が良い気がする、そんなIT用語を意味からこっそり学べる、そんなシリーズとなっています。
今日紹介するIT用語は「CSV」になります。
CSVファイル、よく使っているんだがイマイチ何のことかよくわからずに使っている、そんな方も多いんじゃないかと思います。
これを読んで、ぜひ、CSVと仲良くなってください。
よく使われるファイル形式、ExcelとCSV
デスクワーカーのみなさんが1番よく使っているファイル形式と言えば、おそらくExcelファイルかなと思います。
ファイル名のピリオドの後ろの部分がファイル形式を表す拡張子というもので、Excelファイルの場合は「xlsx」が拡張子になります。
そのExcelファイルほどではないかもしれないですが、もう1つよく使用されるファイルとして、CSVファイルがあります。拡張子はそのまま「csv」です。
CSVを仕事でよく使っているけど実はCSVって何のことかよくわかってない、そんな方もいらっしゃるかもしれません。
今回の放送で詳しく解説していきたいと思います。
CSVファイルについて深掘り
CSVファイルとは
まず、CSVという3文字のアルファベットなんですが、これは、「comma separated values」の3つの単語の頭文字を取ったものになります。直訳すると、「カンマで分離した値」になりますね。
つまり、カンマ区切りでデータを格納する形式及びそれによるデータのことをCSVと言います。
,(カンマ)という記号なんですが、キーボードで言うとMの横にあります。英語で文の区切りに使われたり、大きい数字の桁区切りなどに使われますね。
今は「カンマ」と言っていますが、日本語で言うと、「コンマ」という場合もあります。
なぜCSVファイルを使うのか
ここまでCSVを簡単に説明してきました。
みなさんの中には、なんでわざわざそんなExcelの他にCSVという形式があるんだろうか、全部Excelでいいじゃん、と思われる方もいらっしゃるかもしれません。
確かに全部Excel形式だったら分かりやすいんですが、CSVを使う結構なメリットがあるわけなんです。
それは、CSVの最大の特徴であるCSVが単なるテキストデータであるということに起因しています。
これについて詳しく説明していきますね。
Excelデータは超リッチなデータ
Excel(xlsx形式)のファイルなんですが、これは単なるテキストデータではないんです。
まず、Exceはシート上のデータを格納して保存しています。
そしてそれ以外にも、各セルがどんな書式設定されているのかとか、シート名やシートの並び順、色の設定、また、シート上に配置されているグラフやピボットテーブルなどなど、みなさんがExcelを操作することによって加えられた情報をたくさん持っています。
つまり、Excel形式のデータというのは、文字だけでは表すことができない超リッチなデータということが言えます。
CSVデータは単なるテキストデータ
一方で、CSVというのは、単なるテキストデータなんです。文字以外の余計なデータを一切持っていない、そういった特徴があります。
そのため、色々な表現はできないんですが、一方で、たくさんのデータを持っていたとしてもファイル容量が小さくて済むとか、いろんな環境で取り扱いやすいとかのメリットがあります。
なので、システム間のデータの受け渡しなどによく使用されています。
CSVファイルを触ってみよう
CSVファイルを保存してみよう
ではこのCSV、より深く理解するために、実際にどんなものか見ていきましょう。
実際にみなさんに操作していただきたいんですが、Excelアプリケーションを開いて、新規で空白のブックを開きます。
そこに、ほんの小さなデータでいいので、表形式で何らかのデータを入力してみてください。
たとえば1行目を見出し行として、A1セルから順番に「名前、年齢、好きなもの」と書きます。そして、2行目に実際のデータを1行入力します。たとえば、「Bob、25、バナナ」と入力します。
あとは、これらのデータについて、太字にしてみたり、背景色を付けてみたり、形式をつけてみたり、いろんな装飾や書式設定をしてみてください。
その上で、保存します。ファイル名は適当でいいんですが、「CSV UTF-8 (コンマ区切り)(*.csv))」と書いてあるファイル形式を選択して保存します。
指定した保存先に、拡張子「.csv」となっているファイルが保存されているはずです。
そのファイルを、もう1回Excelで開いてみてください。
すると、先ほど入力したデータは残っているんですが、書式設定とか、装飾、たとえば太字にしたりとか、背景色にしたりとか、形成を追加したりといった設定は全てクリアされているというのが確認できると思います。
これは、先ほどお話しした通り、CSV形式のファイルというのが、単なるテキストデータである文字情報しか持たないということによります。
なので、それ以外の情報は保存する時に全て除外されてしまうということなんです。
CSV形式の本来の形を見る
では、このCSVをもっと本来の姿に近い状態で見てみたいと思います。
いわゆるテキストエディタと呼ばれる、文字情報をシンプルに表示するだけのアプリケーションで開くことで、CSV本来の姿を見ることができます。
Windowsで言うと、メモ帳アプリをテキストエディターとして使うことができますので、先ほどのCSVファイルをメモ帳アプリで開いてみてください。
すると、1行目に「名前,年齢,好きなもの」そして2行目に「Bob,25,バナナ」と入力されているのが確認できると思います。
もしかすると、一部のリスナーさんの中では、「文字だけって言っているのに、ちゃんと改行がされているじゃん」と思う方がいらっしゃるかもしれません。
それは、実は結構いい指摘なんです。
というのも、コンピューターの世界では、改行というのは改行コードと呼ばれる文字の扱いになっているんです。
なので、テキストデータの中に改行コードが入っていると、メモ帳などのテキストエディタはそれを改行として認識しますので、改行して実際に表示してくれる、そういった機能になっているわけです。
このように、テキストエディターで開くとちょっとデータとしては扱いづらいCSVなんですが、みなさん持っているExcelで開くと、きちんと表データとして確認できますし、集計や加工もしやすい状態で開くことができます。
人にもシステムにも扱いやすいCSV
一方で、このCSVという形式は、システムにとってはありがたい形式だったりします。
というのも、システムからデータを取り出したい時に、CSV形式なら簡単に取り出すことができるんです。
システムでは、データの保管庫としてデータベースが使われています。
そのデータベースの中に、たとえば、ユーザーデータとか、社員データとか、商品データとか、色々なデータが保管されているわけです。
それは、テーブルと呼ばれる形式で保存されています。
そういったテーブルでは1行ずつで1つのデータを表していて、その1行のうちの各列に、たとえば、名前とか、メアドとか、そういった属性情報が、順番に整理、格納されています。
それらのデータをCSVとして取り出すには、1行ずつデータを取り出してきて、その属性ごとにカンマ区切りをします。
1行終わったら改行コードを入れる、そうやって全ての行を取り出して書き出すだけなので、CSV形式でデータを出力するというのがとても簡単なんです。
冒頭でもお伝えした通り、ファイル容量も小さくて済みますし、いろんな環境で取り扱うことができる、そんなメリットもあります。
ということで、CSVという形式のデータはシステムにも優しいですし、人にも優しい。つまり、人とシステムの間を取り持ってくれる結構大切な存在だったりします。
次にCSVファイルを取り扱う時にはそんなことも思い出していただくと、より仲良くなれるんじゃないかなと思います。
CSVファイルで試してみてください
今日は、いまさら聞いてもいいIT用語シリーズ第9回ということで、CSVについて解説させていただきました。
もし、Excelとかプログラミングとかを学んでスキルを上げたい、そんな方がいらっしゃいましたら、ぜひ、今回紹介したCSVファイルを対象に色々と試していただけるといいかなと思います。
我々が作ったExcelファイルというのは人が見て優しい作りになっていますので、実はコンピューターにはあまり優しくないデータの置き方だったりするんです。
CSVファイルは、今回お話しした通り、システムから出されたそのままのデータで、コンピューターにとっても取り扱いやすいデータなんです。
なので、Excel関数とかピボットテーブルなどのコンピューターの力を借りる機能もすんなりと使える、そんなデータの置き方だということです。
ぜひ、この点も抑えておいていただくと、よりコンピューターと仲良く仕事ができるんじゃないかなと思います。
まとめ
ということで、今日はVoicy「スキルアップラジオ」の放送から『今さら聞いてもいいIT用語 #9: 「CSV」』をお届けしました。
タカハシのVoicyの放送はこちらからお聴きいただけます。
チャンネルのフォロー、コメント、SNSでのシェアなどなど、楽しみにお待ちしております。
では、また。