
RNN学習の要:BPTTの仕組み
巡り巡る誤差が時を遡るようにネットワークを調整していく様子を想像してみてください。それが、時間方向への誤差伝播と呼ばれる手法です。この手法は、特に過去の情報を記憶しながら、時々刻々と変化するデータの流れを扱うネットワーク、再帰型ニューラルネットワーク(RNN)の学習で重要な役割を担います。
RNNは、過去の情報を持ちながら次の出力を予測するため、通常のネットワークのように、ただ単純に誤差を後ろ向きに伝えるだけでは学習がうまくいきません。なぜなら、現在の出力は過去の入力にも影響を受けているからです。そこで、時間方向への誤差伝播を用いて、時間的な繋がりを考慮した学習を行います。
具体的には、まず各時点での出力と、本来あるべき出力(教師データ)との差、つまり誤差を計算します。そして、この誤差を未来から過去へ、出力側から入力側へと、まるで時間を巻き戻すかのように伝えていきます。
この時、各時点での誤差は、その時点でのネットワークの繋がり具合(重み)を調整するために利用されます。未来の時点での誤差も現在の時点の重みに影響を与えるところが、時間方向への誤差伝播の重要な点です。
このように、時間方向への誤差伝播は、時間的な依存関係を学習できるというRNNの特性を実現するための、なくてはならない手法と言えるでしょう。まるで、過去の出来事が現在の行動に影響を与えるように、ネットワークも過去の情報から未来を予測し、より正確な結果を出せるように学習していくのです。