目次(まとめ)
- 0と1で文字を表現するための文字コード
- 0と1の使い方は、文字コードの種類によって異なる
- Macのターミナル上でコマンドを実行することで、ファイルの文字コードを確認できる
- 参考文献



こんにちは、みっちゃんです。

今回の記事では「ファイルを開くと文字コードの問題で文字化けした経験があるけど、そもそも文字コードって何?」という方向けに、文字コードの紹介から確認方法まで解説したいと思います。

0と1で文字を表現するための文字コード

わたしたちが使っているコンピュータは、"0" と "1" という2つの数字しか理解することができません。

つまり、あなたが今みている文字は、コンピュータの内部では「ただの数字の並び」ということです。

コンピュータに文字を表示させようとするならば、文字を「数字の並び」として決めてあげないといけません。

例えば、「00000」という数字の並びは「あ」という意味ですよ、と決めてあげたりするのです。

ここで「00000」という数字の並びが「文字コード」と呼ばれます。

つまり「文字コード」=「文字を表すための数字の並び」です。

0と1の使い方は、文字コードの種類によって異なる

"0" と "1" だけしか使えない文字コードですが、その種類はさまざまです。

日本人にとってみれば、ひらがなやカタカナ、漢字などを使用するので、それらに文字コードを割り振りたいものですが、欧米人にとっては、必要のないものです。

そこで、さまざまな文字コードが存在し、それぞれの文字コードでファイルが作り出され、私たちの目の前に「文字化け」として現れたりするわけです。


以下に代表的な「文字コード」を紹介します。

ASCII(アスキー)
- アメリカの機関によって定められた基本的な文字コード
- アルファベット、数字、記号を表現
- 7ビットで1文字を表現(例えば、"1000001" は "A" を表す)

シフトJISコード(シフトジスコード)
- 日本語文字コード
- ひらがな、漢字、カタカナなどを使用できる
- 16ビットで1文字を表現

EUC
- UNIXというOS上で使われる日本語文字コード
- 基本的に、16ビットで1文字を表現

Macのターミナル上でコマンドを実行することで、ファイルの文字コードを確認できる

ファイルの文字コードを確認するのは、コマンドを使えば簡単です。

Macのターミナルを開いて、以下のように入力します。

$ nkf -g ファイル名

これを実行すると、"Shift_JIS" など出力されます。

参考文献

きたみりゅうじ「キタミ式イラストIT塾 応用情報技術者」技術評論社