学生による学生のためのデータサイエンス勉強会

機械学習の分類

 機械学習の手法をざっくりと分類する方法を学んでいきます。

3つの方式

 機械学習の手法の大分類として、「教師あり学習」、「教師なし学習」、「強化学習」の3つがあります。

 まずは3つをざっくりと分類した図を見てみましょう。

 これは勉強会で発表した資料からの抜粋です。

教師あり学習

 教師あり学習とは、機械学習モデルを作るために、教師データを使う方式です。つまり、データと実際の値を対応関係を学習させ、教師データと近い値を出力できるようにしたものです。

 機械学習モデルという用語が出てきましたので、ここで補足しておきます。 機械学習モデルとは、簡単に言うと「このデータはどう?」と聞くと、「こうなるで」と予測を吐き出してくれる「箱」のようなものです。この箱には様々な種類があり、箱の中のからくりに当たるものが機械学習アルゴリズムというわけです。

 またこれは、すこし違った言い方をすれば、数学でいう関数のようなものです。ある入力に対して、出力、つまり予測値を返す関数です。
 ただし、「関数」とは違う点は、「データ」から正しい出力を少しずつ学んでいくという点です。機械学習によって得られる「出力」というのは、数学における「関数」のような厳密なものではなく、「近似値」です。

教師あり学習には次のような具体的な手法があります。

  • SVM
  • 回帰分析
  • 決定木
  • ランダムフォレスト 等

教師なし学習

 「教師なし学習」では、正解ラベルはなく、データのみが与えられます。そのデータの中から、データの構造や相関関係といったものを発見することを「教師なし学習」と呼んでいます。

 「教師なし学習」では、データを類似度から分類したりクラスタリングしたりすることが出来ます。例えばデータを2次元のマスにプロットしたとき、それぞれの点が近ければ「似ている」という判断をすることができます。

 教師なし学習には次のような具体的な手法があります。

  • 主成分分析
  • k-means
  • k-NN

強化学習

 「強化学習」では教師データは与えられません。その代わりに、望ましい行動に対する「報酬」を定義した「評価関数」というものが与えられます。この関数の値を最大化するようにランダムな試行錯誤を繰り返して、最適な行動を学習する手法です。

 例えば、ロボットに「歩く」ということを学習させたいとします。このとき、まずロボットの各関節をランダムに動かしてみます。もし「歩く」という動作に近ければ評価関数は高い値を返します。逆に遠ければ低い値を返します。
 こうすることで、ロボットは「歩く」という動作に最適な関節の動かし方を徐々に学習していきます。

 このように、強化学習は「試行錯誤」を通して目標とする動作や出力を学んでいきます。これは、人間の成長過程にも似ています。

強化学習の具体的な手法には、例えば「Q学習」といったものがあります。

まとめ

 機械学習の手法は「教師あり学習」、「教師なし学習」、「強化学習」の3つに大きく分けることが出来ます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です