コース: 人工知能(AI)の基礎:機械学習

機械学習の種類を知る

機械学習は、別の手法とも よく混同されます。 統計学やデータサイエンスと 同じなのではないかといった誤解です。 しかし、機械学習で最も重要なのは、 学習という部分です。 統計学は使いますし、 データサイエンスも関係しますが、 これらは機械学習が 覚えて使うツールにすぎず、 それ自体は学習ではありません。 学習の意味を考えながら、 人が新しいことを学ぶための戦略と その使い分けについて整理し、 それを機械にあてはめてみましょう。 チェスの対戦方法を覚えるには、 いくつかのやり方があります。 第1に、教師から習う方法です。 駒の種類や動かし方から教わって、 練習相手になってもらいながら、 1手ずつ指し方のアドバイスを受けて 戦術を覚えていきます。 教師のもとである程度、力をつけてから、 いろいろな相手と実際に対戦していきます。 第2に、教師がみつからない場合、 公園などで対戦している愛好者を 観察する方法があります。 質問はせず、 黙って見ながら覚えるだけですが、 続けていると、 徐々に戦い方がわかってきます。 それぞれの駒の名前はわからなくても、 動かし方やプレイヤーの戦術は 理解できるでしょう。 第3に、これらの2つを 組み合わせる方法です。 基本的なルールは1対1で習い、 あとは実戦を見学します。 駒の名前や おおまかなゲームのやり方を教わったら、 ほかの人の対戦をお手本に 新しい戦術を覚え、磨いていくのです。 機械学習も、これらの3つと よく似た方法で行われます。 第1の方法は、教師あり学習です。 これはデータサイエンティストが 教師のように、 やりたいことの基本ルールや 全体的な戦略を機械に教えていく方法です。 第2の教師なし学習は、 機械に直接大量のデータを読ませて 学習させる方法です。 機械はさまざまな要素の名前は わからなくても、パターンを見つけます。 第3の方法の、半教師あり学習は、 両者をミックスして、 概要を少しだけ教える方法です。 大部分のルールや戦略はデータの さまざまなパターンから機械に 直接発見させます。 これら3つの方法は、 それぞれに長所と短所があります。 教師あり学習には、課題を熟知し、 最良のアプローチを教えられる 優秀な教師を見つけることが必要です。 教師なし学習には、 大量で十分なデータが必要です。 機械がさまざまなデータを直接見て、 パターンを発見するためには、 使うデータも、学習に役立つ 良質なものであることが必要です。 半教師あり学習には、 両方の条件が関係します。 教師が悪いと、データから パターンを発見しにくくなり、 読み込むデータの質が悪ければ、 どんなに教師が優秀でも、 意味のあるパターンを発見することが できなくなります。 最善の方法を選ぶことができれば 理想的ですが、 手持ちの条件で何とかする場合も 多いでしょう。 教師がいない場合は、 なるべく豊富なデータで 教師なし学習を行います。 データがあまりないなら、 優秀な教師を探して教師あり 学習を行います。 半教師あり学習が選べるのは、 どちらもある場合だけです。

目次