目次(まとめ)
- 0と1で文字を表現するための文字コード
- 0と1の使い方は、文字コードの種類によって異なる
- Macのターミナル上でコマンドを実行することで、ファイルの文字コードを確認できる
- 参考文献
こんにちは、みっちゃんです。
今回の記事では「ファイルを開くと文字コードの問題で文字化けした経験があるけど、そもそも文字コードって何?」という方向けに、文字コードの紹介から確認方法まで解説したいと思います。
0と1で文字を表現するための文字コード
わたしたちが使っているコンピュータは、"0" と "1" という2つの数字しか理解することができません。
つまり、あなたが今みている文字は、コンピュータの内部では「ただの数字の並び」ということです。
コンピュータに文字を表示させようとするならば、文字を「数字の並び」として決めてあげないといけません。
例えば、「00000」という数字の並びは「あ」という意味ですよ、と決めてあげたりするのです。
ここで「00000」という数字の並びが「文字コード」と呼ばれます。
つまり「文字コード」=「文字を表すための数字の並び」です。
0と1の使い方は、文字コードの種類によって異なる
"0" と "1" だけしか使えない文字コードですが、その種類はさまざまです。
日本人にとってみれば、ひらがなやカタカナ、漢字などを使用するので、それらに文字コードを割り振りたいものですが、欧米人にとっては、必要のないものです。
そこで、さまざまな文字コードが存在し、それぞれの文字コードでファイルが作り出され、私たちの目の前に「文字化け」として現れたりするわけです。
以下に代表的な「文字コード」を紹介します。
ASCII(アスキー)
- アメリカの機関によって定められた基本的な文字コード
- アルファベット、数字、記号を表現
- 7ビットで1文字を表現(例えば、"1000001" は "A" を表す)
シフトJISコード(シフトジスコード)
- 日本語文字コード
- ひらがな、漢字、カタカナなどを使用できる
- 16ビットで1文字を表現
EUC
- UNIXというOS上で使われる日本語文字コード
- 基本的に、16ビットで1文字を表現
Macのターミナル上でコマンドを実行することで、ファイルの文字コードを確認できる
ファイルの文字コードを確認するのは、コマンドを使えば簡単です。
Macのターミナルを開いて、以下のように入力します。
$ nkf -g ファイル名
これを実行すると、"Shift_JIS" など出力されます。
参考文献
きたみりゅうじ「キタミ式イラストIT塾 応用情報技術者」技術評論社