最終更新: 2016/4/14

自動微分

柏木雅英

1. はじめに

ごく基本的な、Bottom-Up型(forward mode)の自動微分を行うためのライブラリ。内部に区間を持った自動微分は、精度保証付き数値計算において極めて重要であり、必要不可欠な技術である。

2. ファイル構成

autodif.hpp
(下請け: convert.hpp)

3. 使い方

3.1 概要

template <class T> class autodif {
    public:
    T v;
    boost::numeric::ublas::vector<T> d;

    autodif() {
        v = 0.;
        d.resize(0);
    }

    autodif(const T& x) {
        v = x;
        d.resize(0);
    }
};

} // namespace kv

のような感じで、メンバとして値v(スカラー)と微分値d(ベクトル)を持っており、例えば

(加算) (v₁, d₁) + (v₂, d₂) = (v₁+v₂, d₁+d₂)
(乗算) (v₁, d₁) * (v₂, d₂) = (v₁*v₂, v₁*d₂+v₂*d₁)

のような計算を行う。テンプレートクラスになっているので、Tをdoubleにすれば近似計算の自動微分、Tをintervalにすれば区間を内部に用いた精度保証付きの自動微分が行える。メンバvとdはpublicになっており、好きなように読み書きできる、ある意味無責任なライブラリ。

一応ヘルパー関数として、

autodif<T>::init(in) (初期値設定)
autodif<T>::split(in, v, d) (計算後に値と微分値を分離)

が準備されている。

具体的な使用例は、test/test-autodif.ccを見るか、以下を見て欲しい。

3.2 1変数関数の場合 (f: R → R)

まず、最も簡単な1変数関数の例をtemplateを使わないで示す。 (autodif-sample1.cc)

#include <kv/autodif.hpp>

kv::autodif<double> f(const kv::autodif<double>& x) {
    kv::autodif<double> tmp;

    tmp = x * x - 1.;
    return cos(tmp + sin(tmp));
}

int main()
{
    kv::autodif<double> a1, a2;
    double d1, d2;

    a1 = kv::autodif<double>::init(1.5);

    a2 = f(a1);

    kv::autodif<double>::split(a2, d1, d2);

    std::cout << d1 << "\n"; // f(1.5)
    std::cout << d2 << "\n"; // f'(1.5)
}

これを実行すると、

-0.58768
-3.19266

と表示される。これは、f(x) = cos(x² -1 + sin(x² - 1)) に対して、f(1.5)を計算すると同時にf'(1.5)を計算している。

このように、initで初期化し、splitと値を微分値を分離する、という流れで使用する。

    kv::autodif<double>::split(f(kv::autodif<double>::init(1.5)), d1, d2);

のように一気に書いても構わない。これでd1にf(1.5)が、d2にf'(1.5)が入る。

もしf(x)=xという関数なら(x.v,x.d(0))=(1.5,1)なので、 init関数はそのように初期化している。また、splitはd1にa2.vを、d2にa2.d(0)をただコピーしてるだけ。

上の例だとfの定義が煩雑な上に他の型を流し込めなくなっているが、当然template関数を使うことも出来る。 (autodif-sample2.cc)

#include <kv/autodif.hpp>

template <class T> T f(const T& x) {
    T tmp;

    tmp = x * x - 1.;
    return cos(tmp + sin(tmp));
}

int main()
{
    kv::autodif<double> a1, a2;
    double d1, d2;

    a1 = kv::autodif<double>::init(1.5);

    a2 = f(a1);

    kv::autodif<double>::split(a2, d1, d2);

    std::cout << d1 << "\n"; // f(1.5)
    std::cout << d2 << "\n"; // f'(1.5)

    d1 = 1.5;
    d2 = testfunc2(d1); // double can be also passed
    std::cout << d2 << "\n"; // f(1.5)
}

これだとfの定義がすっきりする上に、全く同じfにdoubleを流しこむことも可能になる。精度保証付き数値計算のプログラムを書くにはこれが出来るととても楽になる。

3.3 多変数関数の場合 (f: Rⁿ → R)

n変数関数 f: Rⁿ → R に対する例を示す。 (autodif-sample3.cc)

#include <boost/numeric/ublas/vector.hpp>
#include <boost/numeric/ublas/matrix.hpp>
#include <boost/numeric/ublas/io.hpp>
#include <kv/autodif.hpp>

namespace ub = boost::numeric::ublas;

template <class T> T f(const ub::vector<T>& x) {
    return atan(x(0) * x(0) + 2. * x(1) * x(1) - 1.);
}

int main()
{
    double d1;
    kv::autodif<double> a1;
    ub::vector<double> v1, v2;
    ub::vector< kv::autodif<double> > va1;

    v1.resize(2);
    v1(0) = 5.; v1(1) = 6.;

    va1 = kv::autodif<double>::init(v1);

    a1 = f(va1);

    kv::autodif<double>::split(a1, d1, v2);

    std::cout << d1 << "\n"; // f(5, 6)
    std::cout << v2 << "\n"; // gradient
}

initとsplitを使うのは1変数の場合とほぼ同じ。 initの引数とsplitの第3引数がベクトルになるのが違い。

initは、

    va1(0).v = 5.; va1(0).d(0) = 1.; va1(0).d(1) = 0,;
    va1(1).v = 6.; va1(1).d(0) = 0.; va1(1).d(1) = 1,;

のような動作をする。splitは、

    y = a1.v; v2(0) = a1.d(0); v2(1) = a1.d(1)

のような動作をする。

実行すると、

1.56038
[2](0.00108495,0.00260388)

と表示される。それぞれ、

関数値
第1変数に関する微分、第2変数に関する微分

である。

3.4 多変数関数の場合 (f: Rⁿ → R^m)

n変数関数 f: Rⁿ → R^m に対する例を示す。 (autodif-sample5.cc)

#include <boost/numeric/ublas/vector.hpp>
#include <boost/numeric/ublas/matrix.hpp>
#include <boost/numeric/ublas/io.hpp>
#include <kv/autodif.hpp>

namespace ub = boost::numeric::ublas;

template <class T> ub::vector<T> f(const ub::vector<T>& x) {
    ub::vector<T> y(2);

    y(0) = 2. * x(0) * x(0) * x(1) - 1.;
    y(1) = x(0) + 0.5 * x(1) * x(1) - 2.;

    return y;
}

int main()
{
    ub::vector<double> v1, v2;
    ub::vector< kv::autodif<double> > va1, va2;
    ub::matrix<double> m;

    v1.resize(2);
    v1(0) = 5.; v1(1) = 6.;

    va1 = kv::autodif<double>::init(v1);

    va2 = f(va1);

    kv::autodif<double>::split(va2, v2, m);
    
    std::cout << v2 << "\n"; // f(5, 6)
    std::cout << m << "\n"; // Jacobian matrix
}

前の例と大体同じであるが、splitの第2引数がベクトル、第3引数が行列になる。

initは、

    va1(0).v = 5.; va1(0).d(0) = 1.; va1(0).d(1) = 0,;
    va1(1).v = 6.; va1(1).d(0) = 0.; va1(1).d(1) = 1,;

のような動作をする。splitは、

    v2(0) = va2(0).v; m(0)(0) = va2(0).d(0); m(0)(1) = va2(0).d(1);
    v2(1) = va2(1).v; m(1)(0) = va2(1).d(0); m(1)(1) = va2(1).d(1);

のような動作をする。

実行すると、

[2](299,21)
[2,2]((120,50),(1,6))

のように表示される。それぞれ関数値(ベクトル)とヤコビ行列である。

3.5 compressとexpand

まだ書いてない。test/test-autodif.ccを参照のこと。大雑把に言うと、n >> m として、 n変数の関数を自動微分で評価中にその一部分としてm変数の関数が出てくるような場合、m変数の関数の評価の前後でcompressとexpandを使うことによって、 m変数関数評価中のベクトルdの大きさが小さくなるので計算を高速化できる。

4. 注意事項

微分値dはベクトルだが、高速化のため、その大きさは 0(どの変数にも依存しない値の場合) またはある値n(入力変数の数)であることを仮定している。すなわち、例えばautodif型の変数x, yにおいてx.d, y.dの大きさがどちらも0でない異なる大きさであった場合、正常に動作しない。 autodif<T>::init で生成された値を使って計算している場合は問題ないが、自分で d をresizeするような場合はこのことに注意が必要である。