ラグランジェの未定乗数法

ラグランジェの未定乗数法というのは,「拘束条件がある関数」の極値を求める数学的テクニックです. とても重要な計算テクニックなので,ここで紹介します. この節では,最初にいきなり計算の仕方を紹介します. 計算だけを読んでも覚えにくいと思いますので,最後に例題も載せます. 例題をやりながらまた最初の説明に戻る,ということを何度か繰り返してみてください. 幾つか問題を解いてみれば,便利さを体感して頂けると思います. 一回なんとなく理解しておけば,忘れてしまっても, また使うときに「物理のかぎしっぽ」のページで復習すれば良いだけです.

(※変数に付加的な条件式のことを,ここでは拘束条件と呼んでいます.)

計算のしかた(ひととおり)

まずは x , y , z の三変数の関数 f(x,y,z) の極値を求める方法を考えます.

\displaystyle {\partial f\over \partial x}={\partial f\over \partial y}={\partial f\over \partial z}=0 \tag{1}

ここで x , y , z が互いに独立ならば話は簡単で, 偏導関数 f_{x} , f_{y} , f_{z} を連立して解けば良いだけですね. ( f の右下に小さく x とか y とか書いてあるのは, fxy で偏微分したという略記号です.慣れておくと便利です.) f はもちろん微分可能な関数だとします.

難しいのは,なんらかの拘束条件がある場合です. 拘束条件があると, x , y , z は互いに独立ではないので, それぞれ勝手に偏微分することが出来ないからです. 拘束条件は x , y , z の関数ですから,一般に式(2)のように表せます.

g(x,y,z)=c \tag{2}

(2)式がある一つの変数に対して陽に解けてしまうことがあるかも知れません. それならば(1)式と(2)式を連立して,変数を一つ消せばいいだけなので簡単です. これから考えるのは特に(2)式が陽に解けないような場合です. (※陽に解くというのは, g(x,y)=0 のような形をしていた関数 を式変形して x=h(y) のような形にすることです.)

関数 fg は極値近傍で次の式を満たすと考えられます.

df &= {\partial f\over \partial x}      dx+{\partial f\over \partial y}      dy+{\partial f\over \partial z}      dz=0  \tag{3} \\dg &= {\partial g\over \partial x}      dx+{\partial g\over \partial y}      dy+{\partial g\over \partial z}      dz=0  \tag{4}

(3)式と(4)式は見かけは同じですが,違うのは関数の名前だけではありません. 本質的に式の意味することが異なることをここで理解しておくのが大事です. 普通の日本語に直すと,(3)式が意味するのは「関数 f が極値を取る」ということです. 一方,(4)式が意味するのは「拘束条件 g が あるので, x , y , z は互いに勝手には動けない」ということなのです. だから g は極値近傍でなくても(4)式を満たしますね.よく頭の中を整理しながら読んで下さい.

ここで,式(3),(4)から形式的に dz を消すような連立をしましょう.

\displaystyle df&=\bigg({\partial f\over \partial x}-{{\partial g\over \partial x}\over {\partial g\over \partial z}}\cdot {\partial f\over \partial z}\bigg)dx+\bigg({\partial f\over \partial y}-{{\partial g\over \partial y}\over {\partial g\over \partial z}}\cdot {\partial f\over \partial z}\bigg)dy \\& \equiv \bigg({\partial f\over \partial x}-\lambda {\partial g\over \partial x}\bigg)dx+\bigg({\partial f\over \partial y}-\lambda {\partial g\over \partial y}\bigg)dy=0  \tag{5}
\lambda = \frac{\frac{\partial f}{\partial z}}{\frac{\partial g}{\partial z}} \tag{6}

(5)式はすでに条件式(2)を中に含んでいるので,外部にはもう拘束条件がありません. つまり,(5)式の xy は独立変数になっているということです. こうなればしめたものです. dxdy がそれぞれ勝手に動けるのですから, 「右辺 =0 」が成り立つならば,中辺に含まれる括弧は それぞれ恒等的に零になっている,と考えることができますね.

(5) ⇔

\displaystyle {\partial f\over \partial x}-\lambda {\partial g\over \partial x}=0 \tag{7}
{\partial f\over \partial y}-\lambda {\partial g\over \partial y}=0 \tag{8}

また(6)式は次のように書き換えられます.

(6) ⇔

{\partial f\over \partial z}-\lambda {\partial g\over \partial z}=0 \tag{9}

ここで f-\lambda g=\widetilde{f} と置けば,式(7)(8)(9)は次の三式に帰着しますね. ( f の上に〜がついていますが,これはエフ・チルダと読みます.)

(7)(8)(9) ⇔

\displaystyle {\partial \widetilde f\over \partial x}=0,\  {\partial \widetilde f\over \partial y}=0,\  {\partial \widetilde f\over \partial z}=0

これは関数 \widetilde{f} に関する極値問題です. しかもここで, x , y , z には何も拘束条件が課せられていませんから, 普通にそれぞれ \widetilde{f} の導関数を連立して解けば良いだけです. なんだか魔法のように拘束条件が見えなくなってしまいました. これがラグランジェの未定乗数法というテクニックです.

まとめ

今までやったことを一言で書くと『拘束条件 g のある関数 f の極値問題は, 拘束条件の無い \widetilde{f}=f-\lambda g の極値問題に変換できる』と言うことです. ただし,未知数が x , y , z , \lambda の4つに増えていることに注意です. 普通は,変数や式の数は少ない方が計算が楽ですから,なるべく変数や式を減らすことを考えます. しかし,自由に微分の計算が出来ないことはもっと不便ですから, 反対にわざと変数の数を増やして,その代わり自由に微分が出来るようにしたのです. 今までの計算で何をやっていたのかというと,そういうことだったのです.

補足

ここでは \lambda の物理的意味は曖昧で,単に数学的なテクニック として登場した変数のように見えるますが,実際の物理の問題において は \lambda が重要な意味を持つ物理量になっていることが少なくありません.

注意

ラグランジェの未定乗数法が使えない場合があります. それは,極値を与える x,y,z の組に対して f_{x}=f_{y}=f_{z}=0 となってしまう場合です. このとき,式(7)(8)(9)を連立しても \lambda を決めることが出来ません.

発展

拘束条件が複数ある場合には次式のようにおけばよいのです.

\widetilde{f}=f-\lambda _{1}g_{1}-\lambda _{2}g_{2}- \dots

例題

例題1.[楕円に内接する四角形の面積]

『長径2a,短径2bの楕円に内接する長方形の面積の最大値を求めよ.』

Joh-Lag2.png

解答

四角形の面積を f(x,y) ,楕円に内接するという拘束条件を g(x,y) とおきます.

\displaystyle f(x,y)=4xy
g(x,y)= {x^{2}\over a^{2}}+{y^{2}\over b^{2}}=1

未定乗数 \lambda を導入して, f から \tilde f に変数変換します.

\displaystyle \widetilde{f}=f-\lambda g=4xy-\lambda {x^{2}\over a^{2}}-\lambda {y^{2}\over b^{2}}

このとき,次の三式を x , y , \lambda を独立変数のよう に見なして連立すればよいだけです.式が3本,変数が3つですから,問題なく解けますね.

& {\partial \widetilde{f} \over \partial x}  =4y-\lambda {2x\over a^{2}}  =0 \\& {\partial \widetilde{f}\over \partial y}  =4x-\lambda {2y\over b^{2}}  =0 \\& {x^{2}\over a^{2}}  +{y^{2}\over b^{2}}  =1

これより次の結果を得ます.

& x={a\over \sqrt {2}},\ y={b\over \sqrt {2}} ,\ \lambda =2ab \\& S_\mathrm{max}=2ab

はい,これで楕円に内接する四角形の最大値が出ました. !(^^)!

でも,ちょっと待てよ,と思った読者の方はいませんか? 実は,ここで求めたのは,楕円に内接する四角形の「極値」に過ぎません. 単に極値と言えば,極小値や変曲点も含まれますので, 数学的にはこの計算からだけでは「最大値」を求めたとは言えないのです. しかし,楕円に内接する四角形の面積が極値を持つとすれば, それは直感的に最大値だけです.一般に関数の二次導関数まで調べたりするのは大変なことですから, 物理学では直感的に明らかな問題に対しては,一次導関数を調べただけで, 最大だ,最小だ,と決めてしまうことがよくあるのです. 物理学の計算では「直感的に当たり前のことは手間を省く」ということがとても大事なことです. 直感的に明らかで無い問題の場合には,きちんと二次導関数も調べて,最大・最小を確認します.

例題.2

『二つの実数 x , y2x+y=8 を満たすとき, xy の最大値を求めなさい.』

解答

f &= xy \tag{1}\\g &= 2x+y=8 \tag{2}

とおきます.このとき \tilde f = f - \lambda g = xy-\lambda (2x+y) と置いて 次の計算をすればいいというのは,もう大丈夫ですね.

\frac{\partial \widetilde{f}}{\partial x} &= y-2\lambda=0 \tag{3}\\\frac{\partial \widetilde{f}}{\partial y} &= x-\lambda=0 \tag{4}

式(2),(3),(4)を連立すると, x=2 , y=4 , \lambda=2 という結果を得ます.

f_\mathrm{max}=8

はい,これで最大値が出ました. !(^^)!

……答は合ってるんですけど,実は,これは少しひっかけ問題で, 何もラグランジェの未定乗数法を使わなくても 次のように二次方程式の平方完成で簡単に解けてしまうのでした. 実は高校生の数Iから拾ってきた問題だったのです.

xy &= x(-2x+8)\\   &= -2(x-2)^{2}+8

最大値は x=2 の時, 8 になることがわかります.

大学生の人へ

ラグランジェの未定乗数法を使うと,大抵の条件付最大最小問題は解けるようになってしまいます. しかし,慣れてくると,逆に簡単な方法を忘れてしまったりするので要注意です.

高校生・受験生の人へ

最大・最小問題の解き方には相加相乗平均を使うとか色々なテクニックがあって, 難しいと思います.ラグランジェの未定乗数法で大抵の問題は解けてしまいますから, 難しいのがあったら,こっそり使って検算しましょう.