Darknetの設定中の"policy"

cfgファイルの中にpolicyというのがあって，よくわからなかったので調べてみた．
policyは学習率を決定するパラメータらしい．
darknetのnetwork.cを読むと，以下のようになっている．

switch (net-&gt;policy) {
    case CONSTANT:
        return net-&gt;learning_rate;
    case STEP:
        return net-&gt;learning_rate * pow(net-&gt;scale, batch_num/net-&gt;step);
    case STEPS:
        rate = net-&gt;learning_rate;
        for(i = 0; i &lt; net-&gt;num_steps; ++i){
            if(net-&gt;steps[i] &gt; batch_num) return rate;
            rate *= net-&gt;scales[i];
        }
        return rate;
    case EXP:
        return net-&gt;learning_rate * pow(net-&gt;gamma, batch_num);
    case POLY:
        return net-&gt;learning_rate * pow(1 - (float)batch_num / net-&gt;max_batches, net-&gt;power);
    case RANDOM:
        return net-&gt;learning_rate * pow(rand_uniform(0,1), net-&gt;power);
    case SIG:
        return net-&gt;learning_rate * (1./(1.+exp(net-&gt;gamma*(batch_num - net-&gt;step))));
    default:
        fprintf(stderr, "Policy is weird!\n");
        return net-&gt;learning_rate;
}

何も指定しないと，学習率は一定．
これはconstantを指定したときと同じ挙動．
stepの場合，scaleパラメータで指定した値のbatch_num/net->step乗の割合で学習率を減衰させていく．

コメントする コメントをキャンセル

コメントするコメントをキャンセル