View on GitHub

memo

Random Forests

Random Forests

Random Forestsは決定木を理解していればアルゴリズム自体は単純である。

Good

Bad

Definition

Algorithms

  1. 訓練データからデータをランダムにサンプルを取る。
    • $D_{1}, \ldots, D_{M} \subset D$とする。
  2. 各$D_{m}$について、以下の方法で決定木を作る
  3. 指定したノード数$n_{\mathrm{min}}$になるまで、繰り返し木のノードを作る
    • 説明変数から$L$個の変数をランダムに選び、決定木を作る
    • 決定木のアルゴリズムは適当に選ぶ

Tips

$D_{m}$に対して、決定木を作る際に、説明変数をランダムに選ばずそのまま使う方法をbaggingという。 Random Forestsはbaggingに対して、説明変数のサンプリングを行うことで、説明変数間の相関を減らしている。

Reference