IoT 検定を独学で合格する方法 (7. データ分析 その2)

7-2. 機械学習および人工知能に関する知識
機械学習には、大きく3点があります。さらに、そのカテゴリー内でも色々な学習方法が存在しています。

教師あり学習 学習データ(入力)と正解のデータ(出力)を予め与えることによって、 「このような入力(特徴)だとこの答え」というパターンを学習します。入力と出力の関係を学習します。
決定木 ある説明変数で2つに分類し、ツリー状な構造を形成されます。
if - else を大量に繰り返します。
サポートベクトルマシン 2つのクラスにおいてマージンが最大化するように、識別線の引き方を探索します。
ニューラルネットワーク  人間の脳内にある神経細胞(ニューロン)とそのつながり、つまり神経回路網を人工ニューロンという数式的なモデルで表現しています。答え合わせをして間違っていれば、ネットワーク間の重みを調節してことで学習します。
教師なし学習 学習データ(入力)のみで学習を行います。つまり、放置プレイです。学習データから抽出した特徴量から、データの構造を自分で学習していきます。
クラスタリング (クラスター分析) データ内の隠れたパターンやグループ化を発見する探索的データ解析に使用されます。
強化学習 現在の状態を観測して認識し、得られる報酬が一番高くなるような行動を探索します。試行錯誤を通じて報酬が最大化するような行動を学習するものです。
その他
遺伝アルゴリズム データ(解の候補)を遺伝子で表現した「個体」を複数用意し、適応度の高い個体を優先的に選択して交叉(組み換え)・突然変異などの操作を繰り返しながら解を探索する。
ベイジアンネットワーク 「原因」「結果」がお互いに影響を及ぼしながら発生する現象をネットワーク図(重み付けグラフ)と確率という形で、複雑な因果関係を可視化したものです。

 

強化学習の例

ブロック崩しゲームを強化学習した場合、次のような仕組みでメキメキと強化学習くんは上達していきます。

ブロック崩しゲーム

ブロック崩しゲーム (懐かしい)

  •   定量的な状態: 現在のブロックの数、ボールの位置、バーの位置等
  •   行動パターン: バーを右左に動かす。ボールを監視する。
  •   ルール: バーがボールに当たれば報酬(+1)、ブロックを1つ崩せばさらにポイントUp(+5)、ボールを落とすと没収(リセット)。

これらを繰り返しとレーニングすることで、報酬を最大化する行動パターンを取得していきます。「習うより慣れろ」と感じですかね。

 

IoT 検定に興味がある方は、「 IoT 検定」 一覧

お問合せ はこちらから

 

Follow me!