回帰における誤差

手持ちのN個のサンプル $(x_{1}, t_{1}), (x_{2}, t_{2}), \dots, (x_{N}, t_{N})$ について、 $x_{i}$ を与えられたら $t_{i}$ を返すハッシュ関数は常に二乗誤差が0だが、サンプル以外には対応できないので意味がない。このようなサンプルに対して過学習したモデルは使えないので、訓練用とテスト用のサンプルに分けて訓練を行う。

訓練誤差

モデル $t = f (x)$ を明らかにしたい
訓練事例 $X_{t r} = {(x_{i}, t_{i})}$ を使って学習させる
学習した回帰モデル $\hat{t}_{i} = \hat{f} (x_{i})$
訓練事例で得た回帰モデルの、訓練事例における誤答率を訓練誤差と呼ぶ

$TrainingErr = \frac{1}{∣ X _{t r} ∣} (x_{i}, t_{i}) \in X_{t r} \sum (t_{i} - \hat{f} (x_{i}))^{2}$

汎化誤差

データ生成分布 $p (x, t)$
- 知ることができない
真のモデル $t = f (x)$
- こちらも知ることができない
学習した回帰モデル $\hat{t}_{i} = \hat{f} (x_{i})$

$GeneralizationErr = \int\int (t - \hat{f} (x))^{2} p (x, t) d x d t$

汎化誤差を使えば回帰モデルの性能を調べることができるが、実際にはこれを計算することはできない。ただし、汎化モデルの上界を証明するような研究は存在し、学習機の性能保証として使える。

テスト誤差

モデル $t = f (x)$ を明らかにしたい
テスト事例 $X_{t s} = {(x_{i}, t_{i})}$
学習した回帰モデル $\hat{t}_{i} = \hat{f} (x_{i})$
訓練事例で学習した回帰モデルの、テスト事例における誤答率をテスト誤差と呼ぶ

$TestErr = \frac{1}{∣ X _{t s} ∣} (x_{i}, t_{i}) \in X_{t s} \sum (t_{i} - \hat{f} (x_{i}))^{2}$

汎化誤差の有限サンプル近似がテスト誤差となる。これは、標本平均が母平均の有限サンプルにおける近似だからで、サンプル数無限大における標本平均は母平均に一致する。

note.momee.mt

回帰における誤差

訓練誤差

汎化誤差

テスト誤差