想々啖々

絶世烟る刖天歌。文学者が思想を日常に翻訳していればいい時代は既に去った。

3. ベイズ理論の導入によるヒューム的破れの検討

人間の言う「世界」は、感覚する情報を自身のうちで(再)統合/(再)構築した総和のことであり、経験として接触可能な実在の総和より実在空間全体が大きいとすれば、観察可能なパラメータの外部のパラメータの変動によって、まったく予期しえぬ事態に直面することが当然に想定される。それは、観測不能、つまり理論として定式化できないために、あたかも全くの偶然に(ヒューム引用)生じる、と言うよりない。我々がメカニズムを決して知りえないこの作用は、歴史上「ヒューム的破れ」と呼ばれてきた。これの意味するところは、「物理法則は時空間に普遍的に適用される」また「現在の事象は過去の事象に必ず類似する」という基本的な原則が例外的に破綻する状況への遭遇である。(*5)観測を初めて以来、我々はこれを犯した現象に一度として直面したことはなく、そのために物理学は現実世界へ近似として適用するに実用的/妥当とされている。
 人間に不可知/不可観測であるところのパラメータの想定から、経験の捨象である、ある特有の論理によってなされる現実世界への近似の合致は、確率的になることが了承される。ある論理において真である予測が、実際に現実世界の物理系において同等に現象する確率poは、事象の全確率1から、ヒューム的破れの状態確率phを引いた値となるのである。これは、裏返せば「ヒューム的破れは生じない」とする物理学の立場から、phの値を0と見做しているためにpoが1となり、物理学的な予測結果が現実世界において生起することが必然視されているということである。本章では、このph = 0の近似を主観的なもの、主観確率(subjective probability)と見做してベイズ理論の導入を図る。
 輓近、確率論へのベイズ的なアプローチは、理論ならびに実践におけるデータ分析について、古典的な確率論や論理学の単なる拡張として扱われている。ベイズ確率における条件付き確率(conditional probability)、p(B|A)は、Aが観察されたという条件下でBが観察される確率、あるいは、2つの命題AとBに対するB→Aで示される論理包含を意味する。この値は尤度(likelihood又はplausibility)と呼ばれ、実際に観察されうる尤もらしさ、命題の真らしさの指標として用いられる。ここで、尤度は以下の要求項目Dに従うことにする。

D1: 尤度は実数値で表現される。これにより、尤度が単一スケールで比較されることを保証する。
D2: 尤度はコモンセンスの様態に従って変性する。ある命題を尤もらしいと思うのは、例えば、信じられる因果律において有効である根拠が挙げられており、それを反証するような根拠がないときである。
D3: 1つの結論が複数の方式によって推論されうるとき、可能なあらゆる方式は同一の結果を導かなければならない。
D4: 情報は恣意に選別してはならず、与えられたすべての証拠が考慮されねばならない。
D5: 対象についての知識状態が同一のときは、尤度は必ず同一値となるべきである。

 コックスの定理が示すとおり、尤度は一般的な確率の規則に従う。これはブール演算上の論理積(AB)、論理和(A + B)、否定(A)の表記に基づいて以下のように表される。

p(AB|C) ≡ p(A|BC)p(B|C) ≡ p(B|AC)p(A|C) (1)
p(A+B|C) ≡ p(A|C) + p(B|C) - p(AB|C) (2)
p(A|C) ≡ 1 - p(A|C) (3)

 (1)式より、ベイズの定理を得る。(ここで、p(B|C) ≠ 0とする)

p(A|BC) = p(B|AC)p(A|C) ÷ p(B|C) (4)

 このとき、p(A|C)を事前確率(prior probability)、p(A|BC)を事後確率と呼ぶ。等式で結ばれていることからわかるように、ベイズ理論では因果律上の結果──観察データから、因果律上の原因──諸法則について計算することが可能であり、この点で因果律に則った一方向の計算しかおこなえない、古典的な確率論を拡張している。
 拡張はもう一つなされる。古典的な確率論では、踏み込んで言えば、古典的な確率論を持ち出すときには、確率piは根元事象の数nに比例配分される。ダイスを振った出目にはそれぞれ1/6という値が均等に与えられるが、これは特に傾向を決める要素が試行に含まれないという前提下でそうされ、試行回数を大きくすれば本来の値に限りなく近づくことが大数の法則(law of large numbers)として知られている。これは特定の状況や試行者によらずに同等の結果を得られると期待されることから客観確率(objective probability)と呼ばれ、古典的な確率論ではこちらしか扱わない。対する主観確率(subjective probability)は、重心位置を変えて目印をつけたダイスを任意に選んで振ったり、衝撃に対して脆いダイスを用いるなどした場合の、特定の状態や試行者によって値にバラつきが生じる確率であり、普遍的に同等の結果を得られることが期待されない。ここで、ベイズ理論による第二の拡張によれば、両者は尤度として一律の定理下で計算可能となる。何らかの事象について、ある人が信念のために想定した生起確率(尤度)と、数理的に普遍的な予測から算出される生起確率(尤度)とを全く対等に扱うことを認めるのが、第二の拡張である。
 言ってしまえば、ダイスロール試行による出目に配分される確率が均等になるのは、あるいはそう予測して試算できるのは、試算者の物理学的な知識において偏りを予想するだけの情報が整わないためである。整わない以上は、不充足理由律(principle of insufficient reason)に則って事象の生起確率を均等に配分するのが尤もらしいと判断され、加えて、これを撤回しなければならないほど予測と経験とが乖離しないことによる。つまりは、主観確率を承認するというよりは「何も真に客観らしいものはない」という前提から客観確率の絶対性を批判し、失墜させることで両者の対等性を実現しているわけである。
 以上の古典確率論への2つの拡張により、ヒューム的破れを加味した、現象の観測における特定の論理による近似の適用可能性を、バーンズの議論(*6)を参考しつつ、定式化をおこなう。
 経験の捨象としての、ある論理における理論また仮説Tは、観測によって得た証拠Eおよび背景知識Bから、ベイズの定理((4)式)よりp(T|B)を事前確率として事後確率p(T|EB)を得る。
p(T|EB) = p(E|TB)p(T|B) / p(E|B) (5)
このとき証拠Eは経験可能なすべての情報についての部分集合であり、背景知識Bは信念によって知るものではなく、当該論理空間において真に機能する定理である。また、p(E|TB)は尤度であり、p(E|B)は周辺確率である。ここで得られた理論Tから、実際に現実世界において観測されうる現象Oについて見ると、ベイズの定理より事前確率p(O|B)から事後確率p(O|TB)が計算される。
p(O|TB) = p(T|OB)p(O|B) / p(O|B) (6)
この尤度p(O|TB)とは、論理原則として定めた規則が機能することを認容し、それが維持される論理空間において真である定理が、現実世界においても適用されうる、すなわち理論Tによって得られる近似現象と、実際に現実世界において観測される現象Oとが合致する度合いを示す。冒頭に述べたとおり、人類史において充分に検証が済んだ理論に関して、我々の経験を信用すればこの値は1である。しかし、ここで経験の外部すなわち実在の想定、つまり人間に不可知/不可観測であるところのパラメータを想定することで、確証不能性から、この値は信念によって不定となる。
 式(6)が示すのは、我々に固有の論理を外部に対して適用する際、主観による重み付けを必須とすることの了解さである。科学法則や数計算が現実世界において有効/妥当であるのは専ら主観が検証する範囲でのことであって、真に規定されている保証はないとすれば、すなわち我々に経験される一切に普遍性を認めなければ、ここで扱われた確率(尤度)のどれも主観確率である。したがって、我々はそれらが有効であることを、尤度の値に期待するのみであって、さらに言うと、この尤度はただ主観によって任意に与えられるよりない。任意に設定可能であるとすれば、経験されることが実在のすべてだと信じる物理学者はp(O|TB)が1となるように諸尤度を設定するだろうし、そうでない懐疑論者はこれがより小さい値をとるように設定するだろう。どれだけ長く観測をおこない、尤度p(O|TB)の値を1に近づけようと、それは「この程度の観測で確信には充分である」とする信念の作用によるのである。また、NOT p(O|TB)が示す値はヒューム的破れの生起確率(尤度)である。もしこの想定が莫迦げていると考える者があれば、それもまた主観によるドクサのためである。

 

---------------------------------------------------------------------------------------------------------------------

*5)これは新規物理法則の発見可能性とは区別されるべきである。例えば、もし時間変数や空間変数の導入によって、時空間への非等方性が理論によって定式化され、説明可能であるとすれば、これはヒュームの破れではなかったものとされる。なぜなら、人間に既知のパラメータによって定式化されているからである。
*6)Barnes, L. A. [2017]: "Fine-Tuning in the Context of Bayesian Theory Testing" 2. Probabilities for Model Selection in Physics