シンプルな例で考えてみる
K氏はどのくらいの確率でビールを飲むのか?
- 可能性のある候補は以下の2つ
- どっちかわからない
- 「まあ50:50ということで」
- 0.5が一番確信が持てる値と思える

データを集める
- 10日分のデータを取得したら,右のような結果に
- これはいわゆるエビデンス
- もうこれでいいんじゃない?
- でもこれはたまたま10回分取り出した時の結果

得られたデータとは?
- 測定したデータは何なのか?
- 想定している母集団からサンプリング
- 「一定の条件の下でデータを生成」ともみなせる
- この場合…
- 「K氏は,ある確率\(\theta\)でビールを飲むという選択をする」かつ
「K氏は,ある確率\(1-\theta\)でビールを飲まないという選択をする」
- つまりK氏は次々をデータを生成するデータ生成器
- この\(\theta\)はいろんな値を取る
- でもこの\(\theta\)をセットすると、ガチャガチャデータを生成
- パラメータとして考えよう
データから尤もらしいところを
- 「10回で、7回飲んだ」
- ある\(\theta\)の時、今回のデータとなる確率は?
- 0.1刻みでやると右の通り
- ベルヌーイ試行なので、普通に計算可能
- \(\theta = 0.7\)あたりで最大っぽい
| 0.0 |
0.0000000 |
| 0.1 |
0.0000001 |
| 0.2 |
0.0000066 |
| 0.3 |
0.0000750 |
| 0.4 |
0.0003539 |
| 0.5 |
0.0009766 |
| 0.6 |
0.0017916 |
| 0.7 |
0.0022236 |
| 0.8 |
0.0016777 |
| 0.9 |
0.0004783 |
| 1.0 |
0.0000000 |
尤もらしさを図にしてみる
- 右図の通り
- 縦線は\(\theta = 0.7\)の場所
- やはりそこが一番高い
- つまり、この分布が「データから言えるパラメータの分布」
- これが尤度関数
- そしてこの場合\(\theta = 0.7\)が最尤推定量

もう一度整理しよう
推論したいパラメータ(K氏がビールを飲む確率)がある
- 漠然とした感覚がある
- それについてデータを取った
- データから、今までの感覚を更新したい
材料は揃った
事前の確信度

データが示すもの

事前の予想 x 尤もらしさ

これがベイズ推論
- 各項は以下の通り
- \(\theta\): パラメータ
- \(D\): データ
- \(P(\theta)\): データを考慮しない\(\theta\)の確率
- \(P(D)\): 可能性のある候補すべての確率
- \(P(D|\theta)\): \(\theta\)が与えられた場合の\(D\)の確率
- \(P(\theta|D)\): \(D\)が与えられた場合の\(\theta\)の確率
ベイズの定理:
\[
P(\theta|D) = \frac{P(D|\theta)P(\theta)}{P(D)}
\]
もうちょっとわかりやすく
- 各項は以下の通り
- \(P(\theta)\): 事前の確信度
(事前分布)
- \(P(D)\): 各候補の確率
(データ)
- \(P(D|\theta)\): データに基づいた尤もらしさ
(尤度関数)
- \(P(\theta|D)\): データが与えられた後の確信度
(事後分布)
ベイズの定理:
\[
P(\theta|D) = \frac{P(D|\theta)P(\theta)}{P(D)}
\]
まとめると…?
すごく大雑把にいうと、こんな感じです:
\[
P(\theta|D) = P(D|\theta) \times P(\theta) \:/\: {P(D)}
\] \[
事後分布 = 尤度 \times 事前分布 \:/\: エビデンス
\]
- 私達がほしいのは事後分布
- 事後分布は尤度と事前分布の折衷となる
- エビデンスは、得たデータから算出される候補の確率総和