目次(まとめ)
- 散布図は、手元にある2項目からなるデータの関係を可視化する
- 関連記事



こんにちは、みっちゃんです。

今回の記事では「手元にある2項目からなるデータの関係を可視化したい」という方向けに「散布図」の書き方を紹介します。

散布図は、手元にある2項目からなるデータの関係を可視化する

ここでは、以下のようなデータをエクセルファイルで準備して、説明に使用したいと思います。

このエクセルファイルには、Aさん、Bさん、Cさん、Dさん、Eさんの算数、国語の点数が書かれています。

散布図を作成するためには、エクセルファイルをCSV形式(コンマ区切り形式)でデスクトップに保存して、以下のように実行します。

$ R -q
> data <- read.csv("~/Desktop/test_result.csv", header = T)
> plot(data$算数, data$国語, xlab = "Mathematics", ylab = "Japanese", xlim = c(80, 100), ylim = c(65, 85))

プロット関数(plot)のオプションの意味は、以下の通りです。
- xlab:x軸のラベルの名前
- ylab:y軸のラベルの名前
- xlim:x軸のプロット範囲
- ylim:y軸のプロット範囲

実行すると、以下のようなプロット(散布図)が得られます。

この結果を見ると、Cさんは5人のうち国語の点数が最も高いですが、数学の点数が最も低いことが可視化できます。

今回の例では、5人という少数のデータを取り扱ったため、グループ分けをすることはできませんでしたが、多数のデータを散布図として可視化すると、グループを見つけることができます。

関連記事