合成関数の微分への利用

高校生の頃の多くの人がとった方法,そう公式を覚える方法です. この方法で任意の関数を微分しようと思ったら,関数の形だけ微分の公式を憶えなければなりません. 例えば次のような微分の問題,

&\frac{d \ln x^{2}}{dx} = \frac{2}{x} \tag{A}\\&\frac{\partial \ln r}{\partial x} = \frac{x}{r^{2}} \qquad\left(r=\sqrt{x^{2}+y^{2}+z^{2}}\right) \qquad \tag{B}\\&\frac{d L(q,\dot{q},t)}{dt} = \frac{\partial L}{\partial q}\frac{dq}{dt} +\frac{\partial L}{\partial \dot{q}}\frac{d\dot{q}}{dt} + \frac{\partial L}{\partial t} \tag{C}

これだけでも憶えるのはつらいものがあります.そこで微分の計算方法として有効なもの,微分をもとの関数を合成関数として見る方法があります. そうすることで関数を微分するという問題は,合成関数の微分の問題に変わります. この方法の利点は,ごく限られた微分の公式を覚えているだけで,多くの微分の計算を可能にすることです. ここでは,実際に掲示板でよせられた質問を例にとって考えていきます.最後にここで説明されている計算を利用した具体的な物理の計算も説明してあるので ,頑張って最後まで読んでみましょう.

質問と解説

掲示板で次のような問題について質問がよせられてきました.

質問

位置ベクトル {\bm{r} = x\bm{e}_{x} + y \bm{e}_{y} + z \bm{e}_{z}} の動径距離 {|\bm{r}| = r = \sqrt{x^2 +y^2 +z^2}} を直交成分 {x,y,z} で偏微分すると,どうして次のようになるのですか.

\nabla r &= \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right) r\\         &= \frac{\partial r}{\partial x} \bm{e}_{x}           + \frac{\partial r}{\partial y} \bm{e}_{y}          + \frac{\partial r}{\partial z} \bm{e}_{z}\\         &= \frac{x}{r} \bm{e}_{x} + \frac{y}{r} \bm{e}_{y} + \frac{z}{r} \bm{e}_{z}\\         &= \frac{x\bm{e}_{x} + y \bm{e}_{y} + z \bm{e}_{z}}{r}\\         &= \frac{\bm{r}}{r} \tag{1}

解説

この問題の場合,関数 r を次のような合成関数として見るのが便利です.

&f = f(x,y,z) \tag{2}\\&r = r(x,y,z) = r(f)     \tag{3}

すると偏微分は合成関数の偏微分の公式

\frac{\partial r}{\partial x}  = \frac{\partial r}{\partial f} \frac{\partial f}{\partial x}  \tag{4}

が使えます. \tag{2} , \tag{3} に具体的な関数を書き込むと,次のようになります.

&f = x^2 +y^2 +z^2 \tag{5}\\&r     = \sqrt{x^2 +y^2 +z^2 } = \sqrt{f}  \tag{6}

これでもう計算の準備が整いました.ここでひとこと説明を加えておきますと, 結局ここで説明している計算の方法としてはこうなります. まず {\tag{5}} , \tag{6} のようにある関数 f を関数 r の変数として見ます. そうすることで関数 r を適当に微分の公式が使えるような関数(この関数の事を合成関数と呼びます)として見る事ができます. そして {\tag{5}} , {\tag{6}}\tag{4} 式に代入して,計算をおしすすめていこうという方針です. 数式で示すと,次の通りです.

&\frac{\partial f}{\partial x} = 2x \tag{7}\\&\frac{\partial r}{\partial f} = \frac{1}{2} f^{\frac{1}{2} - 1} =\frac{1}{2} f^{-\frac{1}{2}} =\frac{1}{2 \sqrt{x^2 + y^2 +z^2}}\tag{8}\\&\frac{\partial r}{\partial x} = 2x \frac{1}{2 \sqrt{x^2 + y^2 +z^2}} =\frac{x}{\sqrt{x^2 + y^2 +z^2}} = \frac{x}{r} \tag{9}

ただし \tag{7}\tag{8} で,次の公式の n=2 の場合と n=1/2 の場合を使っています.( g: 関数)

\frac{\partial g^{n}}{\partial g} = n g^{n-1} (n \neq 0 ) \tag{10}

後の y,z についての偏微分についても同じ方法でもとまります.結果だけ書いておくと

&\frac{\partial r}{\partial y} = \frac{y}{r} \tag{11}\\&\frac{\partial r}{\partial y} = \frac{y}{r} \tag{12}

です.こうして \tag{9} , \tag{11} , \tag{12} から \tag{1} が得られる事が示されました.

補足説明

ここでは与えた式 \tag{4} の導出を説明しておきます. 実はこの式は,全微分 df,dr から自然に出てくる式です.これらの全微分の具体的なかたちは \tag{2} , \tag{3} より

&df = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy + \frac{\partial f}{\partial z}dz \tag{13}\\&dr = \frac{\partial r}{\partial x}dx + \frac{\partial r}{\partial y}dy + \frac{\partial r}{\partial z}dz= \frac{\partial r}{\partial f}df \tag{14}

になります. \tag{13}\tag{14} の最後のところに代入することによって

\frac{\partial r}{\partial x}dx + \frac{\partial r}{\partial y}dy + \frac{\partial r}{\partial z}dz= \frac{\partial r}{\partial f}\frac{\partial f}{\partial x}dx + \frac{\partial r}{\partial f}\frac{\partial f}{\partial y}dy + \frac{\partial r}{\partial f}\frac{\partial f}{\partial z}dz

が成り立つことが分かります.両辺を比較すると公式として与えた式 \tag{4} が出てくるというわけです.

&\frac{\partial r}{\partial x}  = \frac{\partial r}{\partial f} \frac{\partial f}{\partial x}          \\ &\frac{\partial r}{\partial y}  = \frac{\partial r}{\partial f} \frac{\partial f}{\partial y} \tag{16}\\&\frac{\partial r}{\partial z}  = \frac{\partial r}{\partial f} \frac{\partial f}{\partial z}  \tag{17}

ここまでのまとめ

関数を何の関数として見るかが,重要.

練習問題

一通りの事が分かったところで実際に問題を解いてみましょう.

次の式を \tag{1} , \tag{4} , \tag{10} を使って {\bm{e}_x} , {\bm{e}_y} , {\bm{e}_z} の各成分を求めてください.

&\nabla \bm{r}      \tag{18}\\&\nabla \frac{1}{r} \tag{19}

答え

\nabla \bm{r} &= \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right) \left(x \bm{e}_{x} + y \bm{e}_{y} + z \bm{e}_{z} \right)\\              &= \left( \bm{e}_{x} \frac{\partial x\bm{e}_{x}}{\partial x}                        +\bm{e}_{x} \frac{\partial y\bm{e}_{y}}{\partial x}                        +\bm{e}_{x} \frac{\partial z\bm{e}_{z}}{\partial x}                        +\bm{e}_{y} \frac{\partial x\bm{e}_{x}}{\partial y}                        +\bm{e}_{y} \frac{\partial y\bm{e}_{y}}{\partial y}                        +\bm{e}_{y} \frac{\partial z\bm{e}_{z}}{\partial y}                        +\bm{e}_{z} \frac{\partial x\bm{e}_{x}}{\partial z}                        +\bm{e}_{z} \frac{\partial y\bm{e}_{y}}{\partial z}                        +\bm{e}_{z} \frac{\partial z\bm{e}_{z}}{\partial z}  \right)\\              &=  \bm{e}_{x}\bm{e}_{x} + \bm{e}_{y}\bm{e}_{y} + \bm{e}_{z}\bm{e}_{z}  (=\bm{1}) \tag{20} \\\\\nabla \frac{1}{r} &= \nabla r^{-1}\\                   &= \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right) \frac{1}{r} \\                   &= \frac{\partial r^{-1}}{\partial x}\bm{e}_{x} + \frac{\partial r^{-1}}{\partial y }\bm{e}_y + \frac{\partial r^{-1}}{\partial z} \bm{e}_{z} \\                   &= \frac{\partial r}{\partial x} \frac{\partial r^{-1}}{\partial r}\bm{e}_{x} + \frac{\partial r}{\partial y} \frac{\partial r^{-1}}{\partial r}\bm{e}_{y} + \frac{\partial r}{\partial z} \frac{\partial r^{-1}}{\partial r}\bm{e}_{z} \qquad[ \because (4)] \\                   &= \frac{\partial r^{-1}}{\partial r} \left( \frac{\partial r}{\partial x}\bm{e}_x + \frac{\partial r}{\partial y}\bm{e}_y + \frac{\partial r}{\partial z}\bm{e}_z \right) \\                   &= \frac{\partial r^{-1}}{\partial r} \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right) r \\                   &= \frac{\partial r^{-1}}{\partial r} \nabla r \\                   &= (-1) r^{(-1-1)} \nabla r  \qquad[\because (10)] \\                   &= - \frac{1}{r^2} \frac{\bm{r}}{r} \qquad[\because (1)] \\                   &= - \frac{\bm{r}}{r^{3}} \\                   &= \frac{-x}{r^{3}}\bm{e}_{x} + \frac{-y}{r^{3}}\bm{e}_{y} + \frac{-z}{r^{3}}\bm{e}_{z} \tag{21}

\tag{20} の最後のカッコ書きの部分については演算規則が単位元を満たしている事を確認してみてください. あと,式 \tag{19} のように微分される関数がある1つの変数 s の関数のときは,次のように \nabla を書き換えると複雑な計算をするときに便利です.

\nabla &= \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right)\\       &= \left( \frac{\partial s}{\partial x} \bm{e}_{x} + \frac{\partial s}{\partial y} \bm{e}_{y} + \frac{\partial s}{\partial z} \bm{e}_{z} \right) \frac{\partial}{\partial s} \\       &= \nabla s \frac{\partial}{\partial s}\tag{22}

例として s=r のときを書いておきます.これは \tag{22} の途中で \tag{1} を代入してやれば,簡単に分かります.

\nabla &= \left( \frac{\partial r}{\partial x} \bm{e}_{x} + \frac{\partial r}{\partial y} \bm{e}_{y} + \frac{\partial r}{\partial z} \bm{e}_{z} \right) \frac{\partial}{\partial r} \\       &= \frac{\bm{r}}{r} \frac{\partial}{\partial r}  \qquad[ \because (1)] \tag{23}

それでは \tag{23} を使って次の式の成分を求めてみます.

\nabla {r}^{n} \qquad(n\neq 0) \tag{24}

この式の {n=1} の場合が質問された問題 \tag{1} で, {n=-1} の場合が \tag{19} です.

\nabla r^{n} &= \frac{ \bm{r}}{r} \frac{\partial}{\partial r} r^{n} \qquad[\because (23)] \\              &= \frac{ \bm{r}}{r} n r^{n-1} \qquad[\because (10)] \\              &= n r^{n-2} \bm{r} \tag{25}

はじめの解法よりもずっと短くなったのが分かると思います.正確には \tag{23} で前もって計算した結果を使っているので, 1つの計算問題を2つの計算に分けたにすぎません.しかし分けて細切れにすることで,他の計算で同じカタチをした部分が出たときに 代入していく事ができます.これはミスを少なく,短い時間で多くの計算をしていくときに有効です.

物理への応用の話

せっかくここまで理解できたのだから,物理でこの計算方法がどのように使われるのかを知っておくと良いと思います. この方法は物理で使う計算のあらゆる場面で使われるのですが,特に今回の質問と関係が深いものに静電場とその電位の関係があります. はじめに静電場 {\bm{E}(\bm{r})} を真空中で定義しておきますと,クーロンの法則より次の式で表されます.[ {\rho(\bm{r}^{\prime})} :電荷密度 , {\epsilon_{0}} :真空中の誘電率 ]

\bm{E} &\equiv \int dV^{\prime}  \frac{ \rho (\bm{r}^{\prime})}{4 \pi \epsilon_{0}}\frac{ \bm{r}-\bm{r}\prime}{|\bm{r}-\bm{r}^{\prime}|^{3}}  \\       &= \int dV^{\prime}\frac{\rho}{4 \pi \epsilon_{0}} \frac{\bm{r}-\bm{r}^{\prime}}{R^{3}} \qquad[\because R = |\bm{r}-\bm{r}^{\prime}|] \\       &=- \int dV^{\prime} \frac{\rho}{4 \pi \epsilon_{0}} \left(            \bm{e}_{x} \frac{\partial }{\partial (x-x^{\prime})}           + \bm{e}_{y} \frac{\partial }{\partial (y-y^{\prime})}           + \bm{e}_{z} \frac{\partial }{\partial (z-z^{\prime})}             \right)\frac{1}{R}  \qquad[\because (21)] \\       &=- \int dV^{\prime} \frac{\rho}{4 \pi \epsilon_{0}} \left(            \bm{e}_{x} \frac{\partial x }{\partial (x-x^{\prime})} \frac{\partial}{\partial x}           + \bm{e}_{y} \frac{\partial y}{\partial (y-y^{\prime}) } \frac{\partial}{\partial y}           + \bm{e}_{z} \frac{\partial z}{\partial (z-z^{\prime}) } \frac{\partial}{\partial z}             \right)\frac{1}{R} \\        &=- \int dV^{\prime} \frac{\rho}{4 \pi \epsilon_{0}} \left(            \bm{e}_{x} \frac{1}{\frac{\partial (x-x^{\prime})}{\partial x}} \frac{\partial}{\partial x}           + \bm{e}_{y} \frac{1}{\frac{\partial (y-y^{\prime})}{\partial y}} \frac{\partial}{\partial y}          + \bm{e}_{z} \frac{1}{\frac{\partial (z-z^{\prime})}{\partial z}} \frac{\partial}{\partial z}             \right)\frac{1}{R} \\       &=- \int dV^{\prime} \frac{\rho}{4 \pi \epsilon_{0}} \left(            \bm{e}_{x} \frac{\partial }{\partial x}           + \bm{e}_{y} \frac{\partial }{\partial y}           + \bm{e}_{z} \frac{\partial }{\partial z}             \right) \frac{1}{R}\\       &=- \int dV^{\prime} \frac{\rho}{4 \pi \epsilon_{0}} \nabla \frac{1}{R} \\       &= - \nabla \left( \int dV^{\prime} \frac{\rho}{4\pi\epsilon_{0}R} \right) \\       &= - \nabla V \tag{26}

すると電位 {V(\bm{r})} の定義式は次のようになる事を意味しています.

V(\bm{r}) \equiv \int dV^{\prime} \frac{\rho}{4\pi\epsilon_{0}} \frac{1}{R} \tag{27}

次にこのスカラー量である電位というものを導入する意味ですが,これはこの段階では単純に計算を楽にするための関数を導入したにすぎません.系全体の電荷によって発生する電場の電位を全て 足した合わせた後でその勾配をとることによって任意の位置での電場を求める事ができます.3つの量を考えるより,1つに統一した量を足してから微分する方が随分と計算が楽になります.

まとめ

ここで今回の説明をまとめると,次の2つです. 微分の計算を合成関数の微分の方法,そしてその応用例として,電場と電位の関係を紹介する事でした. 最後に,この計算方法は一般の微分の計算に利用できるという事を補足して終わりにしたいと思います.