確率・情報理論の観点から古典力学を導出する。

前提

この記事では、古典力学は確率モデルだという立場からスタートします。(強い思想)
通常、古典的質点の運動は、ハミルトンの運動方程式 \begin{eqnarray} \frac{dx}{dt}&=&\frac{\partial H}{\partial p}(x,p) \\ \frac{dp}{dt}&=&-\frac{\partial H}{\partial x}(x,p) \end{eqnarray} を満たすように位置$x$と運動量$p$が時間変化する力学の理論として扱われています。
しかし、量子論と対比すると、確率モデルの一種であると考える方が都合が良いです。
位相空間上の確率密度分布$\rho(x,p,t)$の時間発展はリウヴィル方程式 \begin{eqnarray} \frac{\partial \rho}{\partial t}&=&\frac{\partial H}{\partial x}\frac{\partial \rho}{\partial p} - \frac{\partial H}{\partial p}\frac{\partial \rho}{\partial x}\tag{1} \\ &=&\{H,\ \rho \} \end{eqnarray} を満たしますが、純粋状態$\rho(x,p,0)=\delta(x-x_0)\delta(p-p_0)$の時間発展は、初期条件を$(x_0,p_0)$に取った時の質点の運動と同じ結果になるため、 確率モデルの時間発展方程式であるリウヴィル方程式はハミルトンの運動方程式を内包していることが分かります。
この事実からも、古典力学を確率モデルとして捉えることの自然さを感じることができます。
よって、この記事では式(1)こそが古典力学の方程式だと考え、これを導出することを目指します。

古典力学の導出

古典力学では、確率密度関数の集合 \begin{eqnarray} S_{\mathrm{c}} := \left\{ \rho\left| \rho:(x,p)\mapsto \rho(x,p)\geq 0,\ \int dxdp\rho(x,p)=1 \right. \right\} \end{eqnarray} が状態空間です。 この集合は \begin{eqnarray} &&\lambda \rho_1 +(1-\lambda)\rho_2\in S_{\mathrm{c}}\tag{2} \\ &&0<\lambda<1 \end{eqnarray} と、確率混合で集合が閉じていることが確認でき、このような集合を凸集合と呼びます。
時刻$0$から$t$までの時間発展写像は$\Lambda_t: S_{\mathrm{c}}\to S_{\mathrm{c}}$のアフィン写像であるとします。これは、観測との整合性を考慮した時間発展のアフィン性を意味します。
式(2)の分解ができない状態のことを純粋状態と言いますが、これは前述のようにデルタ関数で$\delta(x-x_0)\delta(p-p_0)$と表すことができます。 ここで、$(x_0,p_0)$に局在した状態であることが分かりやすいように、 \begin{eqnarray} \delta_{x_0}(x)&:=&\delta(x-x_0) \\ \delta_{p_0}(p)&:=&\delta(p-p_0) \end{eqnarray} という表記を導入します。
また、逆操作可能であることと、系の対称性の良さを願って、時間並進対称性があると仮定します。
数学的には、$\Lambda_t$が$t$についての1パラメータ変換群をなすと仮定するのがよいでしょう。
さらに、情報劣化が起きないことを願って、純粋状態は純粋状態に時間発展すると仮定します。(以後、純粋性と呼ぶ。)
アフィン性、時間並進対称性、純粋性を用いると、任意の時刻からの微小時間$\Delta t$の時間発展は \begin{eqnarray} \Lambda_{\Delta t}(\rho) &=& \int dxdp \rho(x,p)\Lambda_{\Delta t}(\delta_{x}\delta_{p}) \\ &=& \int dxdp \rho(x,p)\delta_{x+f(x,p)\Delta t}\ \delta_{p+g(x,p)\Delta t} \end{eqnarray} となります。($\Delta t$の2次以上のオーダーを無視する。)
ここで、$f,g$は時間発展写像を決める何らかの関数です。
さらに、逆操作可能性から、$(x,p)\mapsto (x+f(x,p)\Delta t,\ p+g(x,p)\Delta t)$という写像には逆写像が存在するので、 \begin{eqnarray} \Lambda_{\Delta t}(\rho)(x,p) &=& \int dx'dp' \rho(x',p')\Lambda_{\Delta t}(\delta_{x'}\delta_{p'})(x,p) \\ &=& \int dx'dp' \rho(x',p')\delta_{x'+f(x',p')\Delta t}(x)\ \delta_{p'+g(x',p')\Delta t}(p) \\ &=& \int dx'dp' J(x',p',\Delta t)\rho(x'-f(x',p')\Delta t,p'-g(x',p')\Delta t)\delta_{x'}(x)\ \delta_{p'}(p) \\ &=&J(x,p,\Delta t)\rho(x-f(x,p)\Delta t,p-g(x,p)\Delta t)\tag{3} \end{eqnarray} となります。

$J(x,p,\Delta t)$は状態$\rho$に依らないヤコビアンで、 \begin{eqnarray} J(x,p,\Delta t) &:=& \frac{\partial (x - f(x,p)\Delta t)}{\partial x} \frac{\partial (p - g(x,p)\Delta t)}{\partial p}
- \frac{\partial (x - f(x,p)\Delta t)}{\partial p} \frac{\partial (p - g(x,p)\Delta t)}{\partial x} \\ &=& 1 - \left\{ \frac{\partial f(x,p)}{\partial x} + \frac{\partial g(x,p)}{\partial p} \right\}\Delta t + O(\Delta t^2) \tag{4} \end{eqnarray} です。 ここで、$\rho=\delta_{x_0-f(x_0,p_0)\Delta t}\ \delta_{p_0-g(x_0,p_0)\Delta t}$とすると、 \begin{eqnarray} \Lambda_{\Delta t}(\delta_{x_0-f(x_0,p_0)\Delta t}\ \delta_{p_0-g(x_0,p_0)\Delta t}) &=& J(x_0,p_0,\Delta t)\delta_{x_0}\delta_{p_0} + O(\Delta t^2) \end{eqnarray} となるので、確率の保存を考慮すると、$J(x_0,p_0,\Delta t)=1$が結論されます。
従って、式(4)より、 \begin{eqnarray} \frac{\partial f}{\partial x} + \frac{\partial g}{\partial p} = 0 \tag{5} \end{eqnarray} が得られます。 以上から、式(3)の微小な時間発展は \begin{eqnarray} \Lambda_{\Delta t}(\rho)(x,p) &=&\rho(x-f(x,p)\Delta t,p-g(x,p)\Delta t)\tag{6} \end{eqnarray} となることが分かります。
ここで、 \begin{eqnarray} \omega := -gdx + fdp \end{eqnarray} という1-formを定義すると、式(5)より、 \begin{eqnarray} d\omega &=& \left( \frac{\partial f}{\partial x} + \frac{\partial g}{\partial p} \right) dx \land dp = 0 \end{eqnarray} となります。 よって、ポアンカレ補題より、関数$H(x,p)$が存在して、 \begin{eqnarray} \omega &=& dH \\ &=& \frac{\partial H}{\partial x} dx +\frac{\partial H}{\partial p} dp \\ &=& -gdx + fdp \end{eqnarray} となり、最後の等号から、 \begin{eqnarray} f &=& \frac{\partial H}{\partial p} \\ g&=& - \frac{\partial H}{\partial x} \end{eqnarray} という関係が導けます。
これを式(6)に代入することで、 \begin{eqnarray} \Lambda_{\Delta t}(\rho)(x,p) &=&\rho(x-f(x,p)\Delta t,p-g(x,p)\Delta t) \\ &=&\rho\left(x-\frac{\partial H}{\partial p}(x,p)\Delta t,p+ \frac{\partial H}{\partial x} (x,p)\Delta t\right) \\ &=&\rho(x,p) + \left\{\frac{\partial H}{\partial x}\frac{\partial \rho}{\partial p} - \frac{\partial H}{\partial p}\frac{\partial \rho}{\partial x}\right\}(x,p)\Delta t + O(\Delta t^2) \end{eqnarray} となるため、 \begin{eqnarray} \frac{\partial \rho}{\partial t}&=& \lim_{\Delta t \to 0}\frac{1}{\Delta t}\left\{\Lambda_{\Delta t}(\rho) - \rho \right\} \\ &=& \left\{\frac{\partial H}{\partial x}\frac{\partial \rho}{\partial p} - \frac{\partial H}{\partial p}\frac{\partial \rho}{\partial x}\right\} \end{eqnarray} が導かれます。
これは式(1)のリウヴィル方程式に他なりません。
以上の導出で仮定したのは、1. 時間発展のアフィン性、2. 時間並進対称性、3. 逆操作可能性、4. 純粋性、5.確率の保存、の5つであり、いずれも操作的に妥当な仮定であると考えられます。