【Python】入門⑩　Pythonを使って機械学習のために数学を学習する　その３（微分）

いろいろあって長く間が空いてしましましたが、Pythonやります。

微分
偏微分

微分

そもそも微分ってなんだっけ？

微分とは滑らかなグラフの一瞬の変化の割合を示すもの。
数学的には導関数を求めることとも言われている。

中学数学などでも変化の割合は傾きとも言われていたと思います。
微分を扱うときは数式的に入り込みすぎず、元の式の傾きを求めているということは意識しておいた方がよいでしょう。
具体的にはこれからやっていきましょう。

微分公式と表現

・公式

本来の極限値を使ってしっかり導出する方法が正式ですが、一般的な公式のみ紹介します。

f:id:wantanBlog:20191229012117p:plain

・表現

以下の最も基本的な二次関数を微分を行います。

f:id:wantanBlog:20191229005621p:plain

微分表現は一般的には以下の表現で表されます。

f:id:wantanBlog:20191229005907p:plain

より一般的には③がよく見られたでしょうか。
①や②については高校や大学で多少数学はちゃんとやった人には一般的な表現でしょう。

これだけでは味気ないので復習がてら、Pythonで2次関数グラフを表現しておきましょう。

# ライブラリのインポート
import numpy as npy
import matplotlib.pyplot as plt
# Jupiter Notebookで結果を表示するためのおまじない
%matplotlib inline

def func1(x):
    return x*x

xline = npy.linspace(-5,5,50)
yline = func1(xline)

# pltに要素を設定する
plt.plot(xline, yline)
# pltに要素を設定する
plt.plot(xline, yline, color ='black', label='$f(x)=x^2$')

# 凡例を表示する
plt.legend(loc="upper left")
# y軸の表示範囲を設定する
plt. ylim(- 1, 20)
# タイトルを表示する
plt.title('$SampleGraph$')
# X軸に名前を付ける
plt.xlabel('$x$')
# Y軸に名前を付ける
plt.ylabel('$y$')
# グリッドを表示する
plt.grid(True)
# グラフを描写する
plt.show()

f:id:wantanBlog:20191229011325p:plain

関数の微分

・多項式の微分
公式では単項式で表現を行いましたが、多項式でも同様の公式が適用できます。

f:id:wantanBlog:20191229012949p:plain

・入れ子関数の微分

機械学習における微分では、入れ子になった関数の微分を行うことが多々あるそうです。
入れ子のイメージは以下のような関数です。

f:id:wantanBlog:20191229021134p:plain

入れ子関数の微分はそのままに展開してやる方法もありますが、連鎖律（チェーンルール）で解くのが一般的なようです。

連鎖律という言葉はあまり聞いたことがありませんでしたが、以下のようなものです。

f:id:wantanBlog:20191229015430p:plain

入れ子関数を実際に解こうとすると以下のような流れになります。

①まずは式[1]の部分をそれぞれ微分します。

f:id:wantanBlog:20191229015549p:plain

f:id:wantanBlog:20191229021336p:plain

②導出できた式[2]と式[3]を式[1]に代入します。

f:id:wantanBlog:20191229021720p:plain

③最終的にg(x)を代入し直すと普通に展開して微分を行った場合と同様の結果が得られていることがわかります。

f:id:wantanBlog:20191229021838p:plain

偏微分

そもそも偏微分って？

偏微分ってきいたことがあるでしょうか？
私は大学数学で少し聞いた覚えがある気がするということは、理系出身でないと全く触れたことがないものなのかもしれません。

機械学習に実際に登場する微分はこの偏微分らしいので数学的な理解をしようと思った場合、この偏微分の理解は必須ということになります。

しかし、基本的なものであれば通常の微分自体が理解できていればそこまでは難しくはないと思っています。

・偏微分とは
導入が長くなりましたが、偏微分とは複数の変数をもつ関数に対して、一つの変数に対して微分を行うことです。

複数の変数をもつ関数として以下を考えます。

f:id:wantanBlog:20191229023254p:plain

偏微分では∂（ディー）という記号を用います。
通常の微分で扱っていたdと扱いは同じで問題ないです。

偏微分を行う場合は、一つの変数に対して微分を行うので、その際に他の変数は定数として扱います。
まぁ簡単に言えば、無視して構わないということになります。

f:id:wantanBlog:20191229024527p:plain

一点注意があるとすれば、偏微分を行った変数が含まれていない項は定数扱いなので、消える点でしょうか。

偏微分のグラフ上の表現

Pythonが全然使えていないので、少し使っていきましょう。
通常の微分のグラフ上のイメージは高校数学などでも多少は見ることがありましたが、偏微分はいまいち扱ったことがないので、グラフ上でどのようになるのかをPythonで確認していきます。

題材は以下の関数です。

f:id:wantanBlog:20191231132313p:plain

・xで偏微分
y＝－4のとき
f:id:wantanBlog:20191231132331p:plain

・yで偏微分
x＝4のとき
f:id:wantanBlog:20191231132350p:plain

# ライブラリのインポート
import numpy as npy
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
# Jupiter Notebookで結果を表示するためのおまじない
%matplotlib inline
# 関数の定義
def f(x,y):
    return 3*x*x + 2*x*y - 2*y*y

def f1(x,y):
    return  2*x - 4*y

def f2(x,y):
    return 6*x + 2*y

linelen = 10
# X軸とY軸に0から5までの配列
xline = npy.linspace(-5,5,linelen)
yline = npy.linspace(-5,5,linelen)
# Z軸に0、0の要素を必要な数だけ用意する
zline = npy.zeros((len(xline),len(yline)))

# X軸のループ
for i0 in range(linelen):
    # Y軸のループ
    for i1 in range(linelen):
        zline[i1,i0] = f( xline[i0], yline[i1]) 
        
# グラフのサイズを指定する
plt.figure(figsize=(10,5))
# グラフ間の間隔を設定する
plt.subplots_adjust(wspace=0.2,hspace=0.5)
# x軸とy軸を行列表現にする
xline, yline = npy.meshgrid(xline, yline)
# 座標系の指定
ax = plt.subplot( 2, 2, 1, projection ='3d')
plt.title(1)

# 表面の表示
ax.plot_surface( xline, yline, zline, rstride = 1, cstride = 1, alpha = 0.3, color ='blue', edgecolor ='black')
# Z軸の表示をする
ax.set_zticks((-10, 0, 40))
# グラフの向きを調整する
ax.view_init( 20, -100)
# X軸に名前を付ける
plt.xlabel('$x$')
# Y軸に名前を付ける
plt.ylabel('$y$')

# グラフのサイズを指定する
plt.subplot(2,2,2)
plt.title("1.:2*x - 4*y")
yline1 = npy.linspace(-5,5,20)
zline1 = f(4,yline1)
plt.plot(yline1, zline1)
zline1 = f1(4,yline1)
plt.plot(yline1, zline1)

# グラフのサイズを指定する
plt.subplot(2,2,3)
plt.title("2.:6*x + 2*y")
xline2 = npy.linspace(-5,5,20)
zline2 = f(xline2,-4)
plt.plot(xline2, zline2)
zline2 = f2(xline2,-4)
plt.plot(xline2, zline2)


plt.show()

・グラフイメージ
f:id:wantanBlog:20191231132541p:plain

「1.」がx=4の断面をyで偏微分したときのグラフ
「2.」がy=-4の断面をxで偏微分したときのグラフ

やってみたもののいまいちですかね・・・

【勾配ベクトル】

三次元グラフの場合、それぞれ偏微分をとってベクトルとして表現することが可能となります。
これを勾配ベクトルといいます。
f:id:wantanBlog:20191231022550p:plain

勾配ベクトルは初めて聞いた概念ですが、傾きの最も大きい方向と、その大きさを表します。

勾配のグラフ化

かなりこんがらがってきました。

先ほど紹介した勾配ベクトルをグラフにより図示します。

関数は変わらず同じ以下を流用します。
f:id:wantanBlog:20191231132313p:plain

・例

import numpy as np 
import matplotlib. pyplot as plt

%matplotlib inline

# 関数の定義
def f(x,y):
    return 3*x*x + 2*x*y - 2*y*y

def f1(x,y):
    return  2*x - 4*y

def f2(x,y):
    return 6*x + 2*y

range_ = 5

dw = 0.5
x = np.arange(- range_, range_ + dw, dw)
y = np.arange(- range_, range_ + dw, dw)

xrange, yrange = np.meshgrid( x, y)

ff = np.zeros(( len(x), len(y))) 
dff_x = np.zeros(( len(x), len(y)))
dff_y = np.zeros(( len(x), len(y)))

for i0 in range( len( x)):
    for i1 in range( len( y)):
        ff[i1,i0] = f( x[ i0], y[ i1])
        dff_x[ i1, i0] = f1( x[i0], y[i1])
        dff_y[ i1, i0] = f2( x[i0], y[i1])

plt.figure(figsize =( 15, 7))
plt.subplots_adjust( wspace = 0.3)
plt.subplot( 1, 2, 1)
plt.title("[1]")
cont = plt.contour( xrange, yrange, ff, 10, colors='k')

# fの高等線の表示
cont.clabel( fmt ='%d', fontsize = 8)
plt.xticks( range(-range_, range_ + 1, 1))
plt.yticks( range(-range_, range_ + 1, 1))
plt.xlim(-range_ - 0.5, range_ + 0.5)
plt.ylim(-range_ - 0.5, range_ + 0.5)
plt.xlabel('$x$', fontsize = 14)
plt.ylabel('$y$', fontsize = 14)

# 勾配ベクトルの表示
plt.subplot( 1, 2, 2)
plt.title("[2]")
plt.quiver( xrange, yrange, dff_x, dff_y)

plt.xlabel('$x$', fontsize = 14)
plt.ylabel('$y$', fontsize = 14)

plt.xticks( range(-range_, range_ + 1, 1))
plt.yticks( range(-range_, range_ + 1, 1))

plt.xlim(-range_ - 0.5, range_ + 0.5)
plt.ylim(-range_ - 0.5, range_ + 0.5)

plt.show()

・グラフ化

f:id:wantanBlog:20191231132730p:plain