こんにちは、みっちゃんです。 これまでの記事で、2回にわたって「決定木」について紹介してきました。- Yes/Noチャートを使ってデータを分類する【決定木】- データ読み込みから決定木の可視化まで解説【Pythonをつかいます】 今回の記事では、決定木によるデータ分類のための指標 […]
こんにちは、みっちゃんです。 前回の記事で、「決定木」が私たちの身近なところで活用されていることを紹介しました。 今回は、実際に手持ちのデータ(Excel)から、決定木を作成して、可視化するまでの手順を、Pythonを用いて紹介します。 目次(まとめ)- エクセルで作ったデータ表 […]
こんにちは、みっちゃんです。 今回の記事では、「決定木」について紹介したいと思います。 (想定している読者)- 「決定木」という単語を初めて聞いたという方- 「決定木」の意義や使い方がわからない方- 「決定木」の書き方を知りたい方 目次(まとめ)- 決定木とは、Yes/Noチャー […]
こんにちは、みっちゃんです。 みなさんは、大量のデータが与えられた時、まずどのような分析をしますか? わたしは、データが多すぎると「データのグループ分け」をして、グループ単位で分析しています。 今回の記事では、データのグループ分けを行うための「クラスター分析」について紹介したいと […]
こんにちは、みっちゃんです。 これまでの記事で、異なるグループに属するデータを分けるための手法として、サポートベクトルマシン(SVM; Support Vector Machine)などを紹介してきました(こちらを参照)。 その際、基本を理解するという目的のため、「異なるグループ […]
こんにちは、みっちゃんです。 複雑なデータに出会った時、そのデータの解釈は十分にできていますか?複雑さを軽減するために、あらかじめ必要そうなものを自ら(恣意的に)選んだりしていないでしょうか? 今回の記事では、ビッグデータ解析の定番である「主成分分析」を紹介します。 「主成分分析 […]
こんにちは、みっちゃんです。 以前の記事で、ベイズの定理を紹介しました。簡単に振り返ると「ある原因が与えられたときの結果(条件付き確率)」の情報を用いて「ある結果が与えられた(得られた)ときの原因(事後確率)」を探るための重要な定理です。 今回の記事では、ベイズの定理を用いたデー […]
こんにちは、みっちゃんです。 今回の記事では、統計学を勉強するにしろ、機械学習を勉強するにしろ、避けては通れない重要な定理「ベイズの定理」を紹介します。 目次(まとめ)- 私たちの身近で活躍しているベイズの定理- ベイズの定理を使って、発熱からインフルエンザを予測する- 参考文献 […]
こんにちは、みっちゃんです。 今日は、「次元」という概念、また、「次元」を落としてデータを判別する技術である「正準判別」について紹介したいと思います。 目次(まとめ)- わたしたちの生活は高次元データで特徴づけられている- 高次元データを低次元データで表現するための次元圧縮- 正 […]
こんにちは、みっちゃんです。 以前の記事で、異なるグループのデータを判別する機械学習モデルの一つとして、「サポートベクトルマシン」を紹介しました。 今回の記事では、サポートベクトルマシンとよく似ている二つの手法、「フィッシャーの線形判別」と「マハラノビスの線形判別」を紹介したいと […]
こんにちは、みっちゃんです。 以前の記事で、「手持ちのデータを過度に表現できるモデルが良いモデルとは限らない」ということで、「正則化」について紹介しました。 今回の記事では、データから作ったモデルがどの程度良いモデルなのか?といった疑問に答えるために準備されているいくつかの指標に […]
こんにちは、みっちゃんです。 今年、2020年は東京オリンピック・パラリンピックですね。わたしはMr.Childrenのファンなので、2008年の北京オリンピック・パラリンピックテーマソング(NHK)の"GIFT"は好きな曲の一つです。 例えば病気になったとき、私たちは色々な検査 […]
目次(まとめ) ◾️ 手持ちのデータを過度に表現できるモデルが良いモデルとは限らない ◾️ モデルがデータをどの程度表現するべきなのか考慮する必要がある ◾️ 過適合を避けるために正則化項を導入 […]
最近、いろいろなデータが観測され、その重要性が注目されています。例えば、Amazonで花子さんがパソコンを購入すると、「花子さんがパソコンを購入した」というデータをAmazonが取得します。このようなデータは、Amazonにとって、ビジネスを展開する上で貴重なものです。このような […]
この記事では、機械学習入門シリーズとして、サポートベクトルマシンを簡単に紹介したいと思います。 目次(まとめ) ◾️ サポートベクトルマシンとは、異なるグループのデータを判別する機械学習モデルの1つ ◾️最適な判別モデルは、 […]
博士号を取得後、国内外の研究機関で研究者として勤務しました。
研究者の日常を交えながら、統計学、プログラミング、情報技術のトピックを中心に、「分かりやすく」をモットーに情報発信しています。
経験 プログラミング (10年以上:C, C++, Ruby, R, Python, Matlab, LaTeX)
資格 博士 / 基本情報処理技術者 / 統計検定2級 / 高校教諭免許(数学と情報)
趣味 野球 / 旅行 / 芸術鑑賞
詳細プロフィールはこちらです。
Tweets by michannel7
※Twitterの埋め込み方はこちらの記事をご参照ください。
2020年11月21日現在、一部のページで数式の表示に不具合が出ております。ご不便をおかけして、申し訳ありません。
お気づきの点があれば、こちらからご報告いただけますと幸いです。
URL: https://mi-chan-nel.com/feed/
※RSSの使い方はこちらの記事をご参照ください。
※広告の埋め込み方はこちらの記事をご参照ください。