@tk
§16 関数の積分 II
§13 以降、微分、積分、微分ときて今回は再び積分が中心です。多くの初等関数の積分は、§15 の定理 2, 3 を用いる事で、まさしく「微分の逆演算」として計算する事が出来ますが、積分に関するそれ以外の重要な道具として更に部分積分や置換積分といった公式があります。これらを使って様々な関数の具体的な積分計算が可能となりますが、それだけでなく部分積分公式はまた「(滑らかな) 関数を『多項式の無限和』の形に展開する」という所謂 Taylor 展開への橋渡しの役割も担っています。今回は、微分積分の基本定理や部分積分公式を用いて、滑らかな関数を「多項式 + 誤差項 (剰余項)」の形で表現する Taylor の定理に迫っていきたいと思います。
寄り道: §15 命題 6 の証明
いきなり寄り道からのスタートとなりますが、まずは前回やり残した最急降下法アルゴリズムの収束性についてここで証明を与えます。あくまで寄り道なので全てを理解して次に進まなければならないわけではなく、読み飛ばしていただいても構いません。
任意の に対して微分積分学の基本定理から が得られますが、 ゆえ である点に着目して更に微分積分学の基本定理を適用すると となるので、これを (1) の右辺に代入すると となります。積分の記号が二つ並んだ項が登場しますが、これは という連続関数を 上で (あるいは 上で) Riemann 積分したものに他なりません。
ここで、仮定から であり、また §15 の定理 4 の系より は非負関数です。すると、 である時、§14 の命題 4 の系を使って となり、よって という式が得られます。この (4) は の時にも成り立ちます (確認してみて下さい)。(2) と (4) を合わせると が任意の で成り立つ事が分かります。
さて、 を適当に与えて によって を更新していく事を考えます。(5) から特に である事に注意して、(6) と合わせて 即ち が得られます。そこで を と取っておけば となり1、よって 即ち は単調非増大列である事が分かりました。なおこの関係式は、勾配法の理論における Armijo 規準と呼ばれているものに対応しています。
次に、 の強圧性条件 から、 は有界である事が分かります。何故ならば、もし が非有界であるならば、部分列 であって となるものが存在する事になりますが (何故でしょうか?)、強圧性より であり、そうすると が単調非増大列となる ( が単調非増大なのだからその部分列も同様) 事と辻褄が合わなくなるからです。すると、§7 の命題 3 から (またはその任意の部分列) は収束部分列 を持つ事が分かるので、その極限を と表す事にします。
ところで、(7) の左側の不等式から が得られ、 とすれば、 の連続性から右辺は有限値 に収束しています。ここから である事が得られます。実際、 と置くと は単調非減少な数列となり、(8) から は上に有界ですが、これはまた の有界性も示しているので、 は収束列となり、その極限を と書く事にすれば です (詳しくは次回、級数を扱う時に解説します)。一方、 の連続性より なので、これらを合わせて である事が分かります。よって §15 の定理 4 の系から、 は の最小値 と一致し、 の狭義凸性からそのような は唯一つに定まります。よって、この は部分列の取り方によらず、§6 の命題 4 から結局 であり、 が の下で に収束する事も分かりました。
という事で、これまで示してきた様々な定理や命題を組み合わせる事で、少々複雑ではありましたが証明を与える事が出来ました。このような最適化アルゴリズムは、実際には一変数でなく大規模な多変数関数に対してこそ威力を発揮するものかもしれませんが、今の時点では問題のエッセンスとなる部分について一変数関数のある程度簡単な場合に確認するのに留めておきます。
Taylor の定理 I
上の証明では、適当な を取って を単調非増大と出来る、即ち「(6) による学習を繰り返すと目的関数の値をどんどん小さくしていける」事がポイントとなっています。そして、 という関係式を示すために、微分積分学の基本定理を二回繰り返して適用して得られた (2) を用いました。
もし と の差が十分小さいならば、微分積分学の基本定理から という近似式が得られそうです。これと (6) を合わせれば となって、ほぼ となりそうだ、という印象があります。しかしこれはあくまで近似式であって、実際にこれらの式が正しく成り立つわけではなく、ここで誤魔化されている「ずれ」は (2) の右辺の最後の項に相当する の部分に現れる事となります。上で与えた §15 の命題 6 の証明では、二階導関数 の有界性を利用して、 を小さく取る事で、(10) が表す「ずれ」が (7) あるいは (9) の不等式の成立に影響を与えないように制御出来る、という事を利用しています。
ところで、もし が -級であるならば、(2) において更に に対して微分積分学の基本定理を適用して が得られるので、これを (2) に代入して §14 の命題 2 を適用すれば が得られます。ここで と計算出来る事に注意します。逆にこの点に留意して (2) を変形すれば と表す事も出来ます。
もし が更に -級であったならば、 に更に微分積分学の基本定理を適用する事で が得られます。やはり となる事に注意しましょう。また (12) と同様に、(11) と (13) を組み合わせて という等式を得る事も出来ます。
同じ事を繰り返し行えば次の定理が得られる事は想像に難くないでしょう。証明は、難しくはありませんが少々ややこしいので補遺に回します。なお、一般の に対してステートメントを述べる上で、積分に用いる変数を表す記号として有限個しか存在しないアルファベットだけでは足りないので、以下では上の の代わりに といった、添字付きの記号を使用します (所与の数列 という意味ではありません)。
定理 1. (Taylor の定理 I) とし、 を開区間 上の -級関数とすると、任意の に対して が成り立つ。ここで であり、また任意の に対して が成り立つ。
(10) は、 と が近い値の時に が に関する多項式で近似出来る事を意味しています。このように、滑らかな関数について、その微分係数を用いて多項式の形で近似するタイプの定理を Taylor の定理と呼びます。また に相当する部分は剰余項 (remainder) と呼ばれます。
簡単のため、まずは の場合を考えてみます。この場合、(10) は となりますが、もし であるならば (12) より は に近い値になるので2 と表せる事が分かります。また、( に近い、特に絶対値が よりも小さい) を固定する時、 は が大きくなる程小さな値となるので、多項式近似の誤差項となる の絶対値も概ね が大きくなる程小さな値になります。即ち、(13) の近似式は が大きくなる程良い精度を与えていると言えます。例として、 とした時の、 による の近似精度を調べてみます。 は が奇数の時に となり近似項が機能しなくなるので、ここでは の場合に のグラフを図示して のものと視覚的に比較してみます。
この図を見ると、確かに を大きくすればする程、 の値が に近付いている様子が分かります。一方、 に対して同様の計算を の場合に行ったものが以下の図となります。
この場合、 が十分 に近い場合にはいずれの場合にも は を良く近似出来ているようですが、 がある程度大きくなると、両者のグラフは大きく乖離してしまいます。例えば の場合、 であれば は に近接しているものの、 の時には の場合と比べて寧ろ乖離が大きくなっている様子が見て取れます。実際、縦軸方向の表示範囲をもう少し広くしてみると下図のようになっています。
なお、 を固定した時の の絶対値 (言い換えると (13) の近似誤差) の推移を調べてみると、下図の通り、 の時は を大きくするにつれて誤差の値が小さくなっていくのに対して、 の時には寧ろ誤差が拡大してしまっています。つまり、 がある程度大きい場合には、 に対する Taylor の定理は、多項式近似としては機能していません。
何故このような現象が生じるのか、また更に の極限を取るとどうなるのか…等色々と気になりますが、これらの話題については次回以降、もう少し準備をしてから扱う事にして、今回は有限の に対して (12) の意味での収束性を考えるだけにします。 は何回も積分を繰り返さなければならない煩雑な形となっていますが、以下では少し異なるアプローチを取り入れる事でもう少し簡便な表現を導いてみたいと思います。
部分積分
開区間 上で定義された微分可能な実数値関数 に対して、以下の公式 が成り立つ事を以前見ました (§13 の命題 1)。この両辺を適当な 上で積分し、左辺に微分積分学の基本定理を適用すると という式を得る事が出来ます。ここで を改めて一般の連続関数 だと思って、 の代わりに の原始関数 を当てはめれば、上式を少し変形して という関係式が得られます。但し は を表す記号とします。命題の形で整理すると以下のようになります。
なお不定積分は原始関数の一つである事から、(14) を以下のように表す事も出来ます ( は に含まれる適当な点)。但し、また「積分の中に積分」となってしまいますが。
命題 1 を使うと、初等関数に対する様々な積分計算を実行する事が出来ます。例えば の不定積分は自明ではありませんが、やや天下り的ながら適当な に対して とみなしてやる、即ち (14) において () とする事で と計算出来ます (即ち の不定積分は )。
もう一つ、具体例を扱ってみます。 である事を利用して、部分積分公式より に対して となります。同様にして、一般の に対して の積分を具体的に計算出来ます ( が大きくなると計算がやや煩雑になりますが、良い練習になるのでやってみて下さい)。
部分積分は具体的な積分計算において有用な道具であるだけでなく、解析学の一般論においても重要な役割を担っています。例えば、通常の意味では微分出来ない関数をある意味で無理矢理微分するために、部分積分公式が使われる事があります (弱微分または超関数微分と呼ばれます)。また、これまでも何度か触れている通り、部分積分公式を用いる事で、定理 1 における誤差項 (11) のもう少し簡単な表現を得る事も出来ます。
Taylor の定理 II
定理 1 における誤差項 (11) は、 の 階導関数に対して 回の積分を繰り返す、というやや面倒な形をしていました。ここでもう一度、定理 1 の導出のために行っていた発見的な考察を振り返ってみます。
を滑らかな関数とする時、まず微分積分学の基本定理から が得られます。上では右辺の被積分関数 に対して更に微分積分学の基本定理を適用したのですが、ここではその代わりに、この積分に部分積分公式を適用してみます。 の不定積分の計算をした時と同様に、 の前に隠れている を「ある関数の導関数」とみなすのですが、その際に ( を定数とみなして) である事に着目すると が得られるので、ここから が従います。以下同様にして、やはり部分積分公式を適用して となるので が得られました。同様に繰り返すと以下の定理が示せます。
定理 2. (Taylor の定理 II) とし5、 を開区間 上の -級関数とすると、任意の に対して が成り立つ。ここで であり、また任意の に対して が成り立つ。
あえて定理 1 と対比する形で定理の主張を述べていますが、一言で言ってしまえば「 が成立する」という事です。但し、微分可能性に関する仮定が若干異なっている点には注意しましょう。また、定理 2 を示すのなら直接、(11) の積分を変形して に一致する事を見れば良さそうですが、そのためには「積分の順序交換」が必要であり、現時点では準備が足りないため、ここでは数学的帰納法によって (15) を導き直す事を考えます。
定理 2 の証明. (15) を に関する数学的帰納法で示す。 の時は微分積分学の基本定理そのものである。後は について (15) が成立する時、( を -級として) (15) の を に置き換えた式も成り立つ事を示せば良いが、それは部分積分公式によって得られる関係式 と ( の時の) (15) から明らか。
以上から が成り立つ事に注意すれば (16) は定理 1 の帰結に過ぎないが、直接証明するのであれば、 を なる有界閉区間として、 が連続ゆえ 上で有界である事に注意して となる事を使えば良い6。
Taylor の定理 III
これまで、微分積分学の基本定理を繰り返し適用する事によって 2 通りの Taylor の定理の表現を見てきました。しかし、実は Taylor の定理は積分を使わなくとも、微分の性質だけを使って導く事が出来ます。多くの文献では寧ろ以下の形で定理の主張が述べられています7。
定理 3. (Taylor の定理 III) とし、 を開区間 上の 階微分可能な実数値関数とする。この時、任意の に対してある が存在して が成り立つ。ここで である。
定理 1, 2 と異なり、定理 3 における剰余項 (誤差項) はすっきりとした形をしています。但し、 はただ「 と の間にある数」という事しか分かっておらず、 の具体的な表現を得る事は出来ません8。また定理 3 では、 の存在が仮定されていますが、定理 2 と違ってその連続性までは必要とされていません。
どのタイプの Taylor の定理が使いやすいかはシチュエーションによって異なりますが、今後確率論や確率過程論の学習に進んでいく上では、ある理由から定理 3 よりも定理 2 の方が有益となる場面が多いと思われるため、ここでは寧ろ積分形の剰余項を持つ Taylor の定理として定理 1, 2 を主に扱いました9。
まとめ
微分積分学の基本定理や部分積分公式等を利用して、滑らかな関数に対して多項式近似を与える Taylor の定理を示しました。この定理によれば、滑らかな関数 について、 の時に十分大きな に対して という形で近似出来る事になります。上でも少し触れたように、そうなると「では とした時にどうなるのか?近似式ではなく、両辺は数学的に一致するのではないか?」という点が気になってきます。結論から言うと、 を無限大に飛ばす事で、剰余項が $0$ に収束する場合には という等式を得る事が出来、これを の Taylor 展開 (Taylor expansion) と呼びます。但し、 が滑らかならばいつでも (17) が成り立つというわけではありません。たとえ が無限回微分可能であっても、特定の範囲の でしか (17) が成り立たなかったり、あるいは (ほぼ) どんな に対しても (17) が成り立たなかったりする場合があります。
(17) の右辺のように、数列あるいは関数の無限和の事を級数 (series) と呼びます。ここでも触れているように、級数自体もまた数列の極限に過ぎず、これまで扱ってきた議論から逸脱するものではありませんが、一方で級数ならではの話題も多く存在しており注意が必要です。例えば、ここでは「級数を足し上げる順番を変えると収束先の値が変化する (それも、収束先を任意の値に出来るような並べ替えが常に出来る)」という例が紹介されていますが、逆に「足し上げる順番を変えても値が変化しないような級数」のための条件というものもも知られています。
Taylor の定理から Taylor 展開に進む前に、次回は一旦数列の話題に戻って級数の性質について紹介したいと思います。今回扱えなかった置換積分 (変数変換) ももう少し後で登場します。
補遺: 定理 1 の証明
最後に定理 1 の証明をまとめておきます。
定理 1 の証明. まず (10) が任意の で成り立つ事を数学的帰納法によって示す。 の時は微分積分学の基本定理によって容易に示せる (各自)。またある に対して (10) が成立している時、( を -級として) に対して微分積分学の基本定理を適用する事で が得られる。右辺第一項について、 について積分すると となり、更に について積分すると が得られる。以下帰納的に繰り返す事で を得る。また (18) の右辺第二項について同様に を取ったものは に一致している。以上から となる事が分かるので、これを (10) に代入する事で、 を に置き換えた時にも (10) が成立する事が示された。
最後に (12) を示す。 を、 及び を満たす (長さが正の) 有界閉区間とし、任意の を取り と置く。また簡単のため、以下しばらく と仮定する。まず任意の に対して、積分の三角不等式より が成り立つ。再び積分の三角不等式を使って、任意の に対して を得る。同様にして が得られる。なおこの不等式は の時も成立する事が分かる。これと §14 の補題 1 から が示された。
- 細かい事ですが、 が狭義凸である事から が従います。 の狭義凸性からでは しか示せませんが、しかし であるとすると は線形関数 (一次関数) となり狭義凸とならなくなるので、 とは限りませんが は O.K. です。↩
- やや直観的な議論となりますが、§9 で紹介した命題を使えば であり、 の時に右辺の も も十分 に近いので、これらの積である の (絶対) 値は「物凄く小さい」と考えられます。↩
- 部分積分の事を英語では integration by parts と呼びます。これを省略して IbP と表す事が多いです。↩
- や といった記号については §15 の脚注 1, 6 を参照して下さい。↩
- 本講座では、 以上の整数全体 を と表す事にします。↩
- いちいち断っていませんが、積分の三角不等式を含む §14 の命題 4 の系や、 に対して が成り立つ事等を使っています。↩
- ここでは定理 3 の証明を省略します。証明には、§15 の命題 1 の証明において暗に適用した Rolle の定理 (あるいは平均値の定理) を用いるのが一般的です。↩
- 中間値の定理や、連続関数の最大値・最小値定理と同様です。↩
- なお を Bernoulli の剰余項、 を Lagrange の剰余項と呼びます。↩
※ AMFiL Blog の記事を含む、本ウェブサイトで公開されている全てのコンテンツについての著作権は、一般社団法人数理ファイナンス研究所 (AMFiL) 及びブログ記事の寄稿者に帰属します。いかなる目的であれ、無断での複製、転送、改編、修正、追加等の行為を禁止します。