こんにちは、みっちゃんです。

みなさんは、グループごとに得られたデータの差に意味があるのか調べたい場合に、どのようなアプローチをとっていますか?

私は、そのような有意差検定を行う場合には、Rというソフトウェアを使って計算をしています。なぜなら、Rは統計解析用に開発されたものであり、統計に関するツールが充実しているからです。

とはいっても、Rは、統計解析だけでなく、グラフ作成など、さまざまな場面で使いやすいソフトウェアです。

今日は、Rというプログラミング言語について紹介したいと思います。

目次(まとめ)
- Rは無料で使える統計解析ソフトウェア
- Rにはデフォルトでさまざまなデータセットが用意されている

Rは無料で使える統計解析ソフトウェア

Rとは、主に統計解析を実行する際に便利なソフトウェアで、R言語というプログラミング言語で書かれたプログラムを実行します。ただ、その用途は幅広く、特に統計解析にこだわらず、いろいろな場面で簡単に使用できます。

Rは、R独自のプラットフォームでも実行可能なのですが、ここでは、MacOS上のソフトウェア「ターミナル」上で実行する手順を示していきたいと思います。

※必要に応じて、Rを管理しているCRANのWebサイトからパッケージをインストールしてください。

$ R

上のように入力するだけでRを開始することができますが、バージョン情報などを省略して開始したい場合には、以下のように開始することができます。

$ R -q

Rにはデフォルトでさまざまなデータセットが用意されている

Rには、デフォルトで、さまざまなデータセットが用意されています。例えば、以前の記事でも使用したようにアヤメのデータ("iris")やアメリカの車の専門誌から得られた車の性能データ("mtcars")が用意されています。

データセットの一覧を見る(開く)ためには、以下のように入力します。一覧を閉じる場合には、"q"を押します。

> library(help = "datasets")

今回の記事では、車の性能データである"mtcars"を用いて解説していきます。

"mtcars"データセットの中身を確認する場合には、以下のように入力します。

> mtcars

また、出力結果である(データセットの中身)をファイルに出力したい場合には、以下のように実行します。

> write.table(mtcars, "出力ファイル名", sep = "\t")

ここでは、区切り文字として、タブ("\t")を指定しました。

"mtcars"データセットの中身は以下のようになっています。

Rの中でデフォルトで準備されているデータの1つである車の性能データ("mtcars"):行に車の名前、列に車の性能に関する指標が並んでいる。


引き続き、別の記事で、Rを使った解析例を紹介していきたいと思います。