BLOG 研究員ブログ詳細

2021年05月25日 技術情報

いまさら解説する「教師あり学習」と「教師なし学習」の違い―それぞれの特徴と使い分けの勘所-

いわゆる第3次AIブームも落ち着きを見せはじめ、完全なバズワードだったAIも、今少し実態に即した理解が進んできたように思います。ブームの落ち着きというと、あたかも技術が廃れたと誤解する方もいるかもしれませんが、これはまったく異なります。
今やあらゆる製品に「AI搭載」というラベルが付加されるようになったことからも分かるように、第3次AIブームの過熱は、それが市民権を得て一般化したことによって鎮静化し始めたのです。

このようにAIが一般化したことによって、専門家ならずとも業務や自己啓発、学校での学習や研究でAIを扱い始める方も多いのではないでしょうか。AIを扱いはじめると、まず「教師あり学習」と「教師なし学習」という学習法に触れることになります(もうひとつ「強化学習」も一般的ですが今回は割愛します)。両者の違いについて、単語から大まかにイメージすることはできますが、AI初心者にはどのように使い分けるべきなのか判断が難しいところでもあります。

そこで本記事では、改めて上記2つの学習法の特徴と使い分けの勘所をAI初心者につかんでもらえるように平易に解説していきましょう。

教師あり学習とは

教師あり学習とは、AIに正解データを入力して学習させるシステムのことを指します。つまり「教師あり」とは「正解を教える」ことと同義です。AIに与える正解データは、一般的に私たち人間の手で作成します。正解データを作るあなたが教師となって、生徒たるAIに学習させる仕組みを教師あり学習と呼ぶのです。

このような特徴を持つ教師あり学習は、当然、正解データの量と質が学習結果に大きな影響を与えます。例えば「鳥の画像かそうではないか」を判定するAIシステムを構築する場合、同じ鳥の似たようなポーズの画像ばかりを使ってしまえば、別の種類・別のポーズの鳥の画像には対応できなくなってしまいます。
「このデータを渡したらAI君はどのように学ぶだろうか」ということを想像しながら学習データを用意しなければならないわけです。最終的なAIの優劣は、教師であるあなたの教え方によって大きく変化します。

教師あり学習では、学習と予測が行われます。先程の例でいうと、まずあなたは大量の鳥の画像を用意し、これが鳥=正解であることをラベリング(これをアノテーションと呼びます)し、AIに学習させます。
AIは大量の鳥の画像から特徴を見出し、どういう画像が来れば鳥と呼べるのか、判定ルールを創り出します。これが学習フェーズであり、こうした判別ルールの塊のことをモデル、モデルを作ることをモデリングと呼びます。
次の予測フェーズでは、アノテーションされていない(鳥か他の動物か明示されていない)動物の画像をAIに渡します。するとAIは、自らが作ったモデルに照らし合わせてそれが鳥である確率を算出します。教師あり学習は、こうした一般的に「分類」と呼ばれる処理に適しています

しかしもちろん、教師あり学習も「回帰」と呼ばれる処理にも用いられます。回帰とは、ある事象Xの変動を別の事象Yの変動から予測することです。例えば、土地の値段予測を考えます。入力データとして、値段を予測したい土地とは別の地域の値段の例や、駅からの近さ、近所のスーパーの有無、福祉施設の充実度や保育園の数などのデータセットを学習させます。するとAIはこれらの関係性を学習し、「どうやら駅から近く、商店からも近い方が土地の価格が高そうだ」といったルールをいくつも発見し、モデルを作成します。この学習モデルを使うことで、例えば「大型スーパーが近くにできたら、周辺の土地の値段はどのように変化するのか」といった価格予測ができるようになるのです。

それが「分類」でも「回帰」でも、教師あり学習とは既存のデータから何か答えを予測する学習法なのです。

教師なし学習とは

教師なし学習とは、正解を教えずに学習させるシステムのことを指し、AIは大量の入力データから自力で特徴を導き出します。教師あり学習のようなアノテーションを行わないため、正解を予測することはできません。この「正解を予測できない」というところが、教師なし学習の特徴であり、わかりづらさの原因となっている部分でしょう。

正解を予測しないシステムに一体何ができるのでしょうか。答えは「クラスタリング」と「データ次元数の削減」です。クラスタリングとは、大量のデータ群の中から特徴が似通ったもの同士をグルーピングすることです。先程説明した教師あり学習の分類処理と似ているように思えますが、全く違います

教師あり学習の分類とは、あらかじめ「どのように分類するのか」分け先が決まっている処理を指すのに対して、クラスタリングはどんな分類になるか分け先が決まっておらず、処理してみて初めて仕分けることができます。正解を与えない教師なし学習だからこそ、複数データの特徴量を比較し、似ているもの同士をグルーピングすることができるのです。
例を出して言えば、ある小学校の40人のクラスを仕分ける時、「スポーツが得意な人とそうでない人に分ける」など、あらかじめ決めて処理させるのが「分類処理」です。これに対し、「どうわかれるのかは不明だが、とにかく似た人でクラスを3つに分けてくれ」という処理をさせるのが「クラスタリング」です。クラスタリングでは、与えたデータによって、成績が似ている人で分けるかもしれませんし、性格が似ている人で分けるかもしれません。与えられたデータで判別できる範囲で、とにかく似た人でグループを作らせるのです。

教師なし学習でできるもうひとつのことに、「データ次元数の削減」があります。これはあらゆる要素の中から事象を表す特徴を抽出することを意味します。例えば、学校のテストで以下の点数を取ったとします。

 国語:40点  数学:95点  理科:90点  社会:50点  英語:50点

この点数一覧をデータとしてとらえると、5つのデータ数(次元数)ということになります。しかし、このデータを考察すると、「理系の教科が得意な人」という特徴に言い換えられるのではないでしょうか。点数一覧ではデータの次元数は5つだったのに対し、「理系の教科が得意な人」というデータであれば、データの次元数は1つで済みます。データ群から特徴を抽出し、データ群をひとつの言葉で言い表すことでデータの次元数を減らしているのです。

上記の例は、理解しやすいように私たちの言葉に置き換えていますが、概念的なこうした処理が教師なし学習では自律的に行われます。

以上のように、正解を与えずにAI自身がデータ同士を比較して特徴付けるのが教師なし学習です。

ふたつの学習手法の決定的な違い

教師あり学習と教師なし学習それぞれの決定的な違いを一言で伝えるとすれば「データを使って予測をするのか?それとも意味を考えるのか?」となるでしょう。

これまで挙げた具体例で考えてみます。画像を見てそれが鳥であるか否かを考えることや、駅からの近さやスーパーの有無といった情報から土地の値段を算出することは、データを使ってある事象(AIや統計学の世界ではこれを目的変数と呼びます)を予測する行為です。そこには明確な答えがあり、正誤を判断することができます。これがデータを使って予測する教師あり学習なのです。

一方、様々なデータから何らかの関連性を見出してグルーピングすることや、データ群に新たなラベルを付加することは、データ群そのものの意味を考える行為です。そこにはもともと答えはなく、正解という概念はありません。(上記の例で言っても、"似た人"の分け方は色々な観点や閾値があっていいもので、ただ一つの正解があるものではありません。一方、"鳥か鳥でないか"はどちらかの正解があります)これがデータを使って意味を考える教師なし学習なのです。

教師あり学習は「何かを予測するもの」であり、教師なし学習は「データの意味を見出すもの」と捉えると2つの学習法の違いをイメージできるでしょう。

学習手法の使い分けの勘所

ここまでで、教師あり学習と教師なし学習のそれぞれの特徴と違いについて、改めて説明してきました。教師あり学習と教師なし学習では、得意な処理が違うことを理解していただけたと思います。
そして、得意な処理が違うのですから、使用用途も違うということになります。教師あり学習と教師なし学習の使い分けの勘所は「AIに行わせたい作業によって用いる手法を判断する」ことなのです。

過去のデータから何かを予測したいといった場合は教師あり学習が適しています。正誤の判断を伴う作業も同様です。一方、データ同士の特徴を見出したり「いつもと違う」ことを検知させたりするような、正解があらかじめ決まっていない作業には教師なし学習が適しています。

「正解を教えるから教師あり学習は精度が高い」や「正解を教える必要がない教師なし学習はシステム構築が楽だ」といったような間違ったイメージを持たれがちな2つの学習法ですが、言葉が似ているだけで中身は全く違うものだと理解していただけたのではないでしょうか。今回解説したような使い分けの勘所を知ることで、AI初心者であっても適切にAIを使いこなしていけるはずです。

それでは、また。

関連記事
  • 2024年1月5日

    技術情報

    アルゴリズムの仕組みと意味合いを理解する:相関系のアルゴリズム

  • 2023年12月21日

    技術情報

    Geminiとはなにか?メリットとデメリット、Chat-GPTとの違い

  • 2023年5月23日

    技術情報

    チャットGPTとは?メリットとデメリット、産業応用の可能性について

  • 2022年12月17日

    価値創造

    技術情報

    2023年のトレンドを読み解く3つのキーワード

  • 2022年11月7日

    技術情報

    データサイエンティストの最初の疑問「P値に関する疑問のあれこれ」

  • 2021年8月2日

    技術情報

    ヘルスケア産業に使われるアルゴリズムのトレンドとは?

  • 2021年5月25日

    技術情報

    いまさら解説する「教師あり学習」と「教師なし学習」の違い―それぞれの特徴と使い分けの勘所-

  • 2021年3月8日

    技術情報

    Goole Vision APIの精度とは?実際の利用方法を解説

  • 2019年10月20日

    技術情報

    【ニュース解説】因果推論 – 2019年ノーベル経済学賞の何がすごいのか? –