動的計画法(ナップサック問題について)

今回は、自分の大学の講義で数日前に扱われた有名な動的計画法の問題、ナップサック問題についてのプログラミングの解説をC言語でしてみようと思います。

理由は、講義の説明だとわかりづらいなと思ったからです。ただ、この解説をするのはとても難しいと思ったので、自分なりに人に説明するならどう説明するか？をまとめてみようと思いました。

はじめに

初期条件を設定します。与えられる数字はすべて自然数とし、大きさを100までとしておきます。
今回は、 $N$ 個の荷物が与えられ、
$i$ 番目の荷物の重量を
$W_i$
$i$ 番目の荷物の値段を
$V_i$
とします(ここで、 $i$ は $1$ 〜 $N$ のどれかです)。

また、荷物はそれぞれ1つずつしかありません。なので、入れるか入れないかの2通りとなります。
この時に、 $M$ という重さまでは入れても耐えられるカバンがあり( $M$ より大きくすると壊れるということです)、入れた荷物の合計の値段を出来るだけ多くしましょう、という問題を解くことにします。

全探索で解いてみる

$i$ 番目の荷物に対しては、入れるor入れないの2つの選択肢しかないので、全ての荷物についてその選択肢からどちらかを選びます。

これを繰り返し、 $M$ 以内かつ値段が最大になるようなものを探します。

これは、2通りが $N$ 個存在するので、全てのパターンを網羅すると

$2×2×...×2= 2^{N}$ (通り)

となります。

今回はこの方法がメインではないので、こちらのコードは省略します。

全探索すると、 $N$ が増えるにつれてどんどん莫大な計算が必要になることがわかります。

動的計画法で解いてみる

では、実際に動的計画法を使ってみましょう。
簡単に言うと、最終的な最適解(最大値)を求めるために、少しスケールを小さくした問題の最適解を利用するというイメージです。
さまざまなスケールの問題の答えをメモする配列を作成します。ここでは
$dp[i][j]$ とします。
具体的には、 $i$ 番目まで( $1$ 〜 $i$ 番)の荷物を使って、重量制限を $j$ とした時の最適解をここに格納することにします。つまり、 $j$ は $1$ ~ $M$ の範囲内にあります。最終的な答えは、 $dp[N][M]$ という場所に存在します。
では、どのようにこの配列を利用するかを考えたいと思います。今回は、いくつかに場合分けをして考察していきます。

① $i$ または $j$ が $0$ の時

はじめに、すぐ答えが求まるパターンについて考えます。
$i$ が $0$ のとき、 $dp[0][j]$ は、
$0$ 番目までの荷物を用いて、重量制限 $j$ 内でできる最大の値段の合計、というものでした。
ここで、 $0$ 番目の荷物とはなんでしょう？
…そんなものはありません。よって、カバンに詰める荷物がそもそもないので、答えは0になります。 $j$ が $0$ のとき、 $dp[i][0]$ は、
$i$ 番目までの荷物を用いて、重量制限0内で値段を最大にするという問題の答えになります。
重量制限が0なので、荷物の重さは0以下の物しか入れることができません。今回はそのような荷物がないので、答えは0です。
以上より、 $i$ または $j$ が $0$ の時、最適解はすべて0となります。式に直すと、
$dp[i][0]=0$
$dp[0][j]=0$
となります。

➁ $i$ , $j$ がどちらも0でない時

いよいよ本格的に最適解を求めます。まずは、大きく２つに分類して考えます。 $i$ 番目の荷物を、重量制限が $j$ のカバンに詰めることができるかどうか、です。これは
$W_{i}>j$ と $W_{i} \leqq j$ のように場合分けすることができます。

(ⅰ) $W_{i}>j$ のとき

$i$ 番目の荷物はカバンに詰めることができるでしょうか？
答えはNOです。なぜなら、 $i$ 番目の荷物を詰めた時点で、重量制限である $j$ を超えてしまうため、カバンが壊れてしまうからです。では、この時の最適解、 $dp[i][j]$ はどうなるでしょうか。そもそもの $dp[i][j]$ の定義に戻ってみます。
" $1$ 〜 $i$ "番の荷物を使って、重量制限を" $j$ "とした時の最適解
ですが、今 $i$ 番目の荷物はいれることができないとわかっています。よって、次のように置き換えることができます。
" $1$ 〜 $(i-1)$ "番の荷物を使って、重量制限を" $j$ "とした時の最適解
これは、dpの配列でいうとどこを表しているかというと、 $dp[i-1][j]$ となります。よって、一つ目の条件式が完成しました。
$W_{i}>j$ のとき $dp[i][j]=dp[i-1][j]$

(ⅱ) $W_{i} \leqq j$ のとき

のこり半分について考えます。今回は、 $i$ 番目の荷物をカバンに詰めることができます。
ここで、また場合分けをしましょう。 $i$ 番目の荷物を入れるか、入れないかの2通りで場合分けをします。それぞれを考えた後に、より値段が高くなるようなパターンを最後に選択すればよいのです。

(A) $i$ 番目を入れないとき

入れないパターンを先に考えるのには理由があります。実は、すでに答えがでています。
今、 $1$ ~ $i$ 番目の荷物での最適解を求めようとしています。ですが、 $i$ を入れないということは、残った $1$ ~ $(i-1)$ 番目の荷物で重量制限が $j$ の時の最適解を求めることと同じになります。
見覚えがありますね。これは、 $W_{i}>j$ の場合と全く同じ答えになります。つまり、答えの候補の1つが次のように求まります。
$W_{i} \leqq j$ のときの答え候補1: $dp[i-1][j]$

(B) $i$ 番目を入れるとき

いよいよ最後です。 $i$ 番目の荷物を入れると、 $W_{i}$ だけカバンが重くなりますが、代わりに $V_{i}$ の値段だけ価値が増えます。

f:id:emtubasa:20190111021730p:plain — イメージ図

この図では、四角全体が重量制限を $j$ としたときのカバンを表しています。グレーの部分が $i$ 番目の荷物を入れた部分、真っ白い部分がまだ荷物を入れることができる、空の部分です。この白い部分は、 $j-W_{i}$ であることがわかります。この空の部分に入れるべき荷物が何かを考えていきます。
$i$ 番目の荷物は先ほど入れてしまいました。なので、手元に残っている荷物は $1$ ~ $(i-1)$ 番目となります。ということは、 $1$ ~ $(i-1)$ 番目の荷物のなかで、先ほどの白い部分に入れる荷物の最適解を求めなければなりません。つまり、
" $1$ 〜 $(i-1)$ "番の荷物を使って、重量制限を" $j-W_{i}$ "とした時の最適解
を求める必要があるわけです。これは、dpという配列のどこに書いてあるかというと、
$dp[i-1][j-W_{i}]$ にあることがわかります。よって、カバン全体では、これに $V_{i}$ を加えたものがi番目の荷物を入れたときの解の候補となります。したがって次のようになります。
$W_{i} \leqq j$ のときの答え候補2: $V_{i}+dp[i-1][j-W_{i}]$

A,Bの候補が出そろったので、この二つの最大値をとってあげましょう。 $W_{i} \leqq j$ の時の解は次のようになります。
$W_{i} \leqq j$ のとき $dp[i][j]=max(dp[i-1][j],V_{i}+dp[i-1][j-W_{i}] )$
ここで、 $max(a,b)$ とは、 $a$ と $b$ のうち大きい方を取る、ということです。これはc++で使えますが、式を見やすくするためここでも使用することにします。

最終的な解を求める

①,➁から、最終的な解を求めます。といっても、まとめるだけです。
$dp[i][j] = \left\{ \begin{array}{} 0　(i=0またはj=0)\\ dp[i-1][j]　(W_{i}>j) \\ max(dp[i-1][j],V_{i}+dp[i-1][j-W_{i}])　( W_{i} \leqq j) \end{array} \right.$
これで解が求まりました。この条件式を用いて計算をしようとすると、 $N\times M$ 回計算するだけで済むようになります。最終的な答えは、for文を二重にして、 $i$ と $j$ を $0$ から順番に $N$ , $M$ まで動かしていけば求めることができます。

最後に、自分のコードをあげておきます。今回は、
$N=5$
$M=10$
$W_{i} = \{3,2,3,4,5\}$
$V_{i} = \{2,1,2,4,1\}$
としています。
また、C言語を用いています。

#include <stdio.h>
#define M 10
#define N 5
//-1はダミーです。
int w[N+1]={-1,3,2,3,4,5};
int v[N+1]={-1,2,1,2,4,1};
int dp[M+1][M+1];

int main(void){
  int i,j,k;
  for(i=0;i<=M;i++)for(j=0;j<=M;j++)dp[i][j]=0;
  printf("DPtable\n |w ");
  for(i=0;i<=M;i++)printf("%d ",i);
  printf("\n");
  printf("-+-------------------------");
  printf("\nv|\n");
  for(i=0;i<=N;i++){
    printf("%d|  ",i);
    for(j=0;j<=M;j++){
      int x,y=-1;
      if(i!=0){
    x = dp[i-1][j];
    if(j>=w[i])y = dp[i-1][j-w[i]]+v[i];
    if(x>y)dp[i][j]=x;
    else dp[i][j]=y;
      }
      printf("%d ",dp[i][j]);
    }
    printf("\n");
  }
  printf("\nanswer = %d\n",dp[N][M]);
  return 0;
}

答えは次のようになります。

DPtable
 |w 0 1 2 3 4 5 6 7 8 9 10
-+-------------------------
v|
0|  0 0 0 0 0 0 0 0 0 0 0
1|  0 0 0 2 2 2 2 2 2 2 2
2|  0 0 1 2 2 3 3 3 3 3 3
3|  0 0 1 2 2 3 4 4 5 5 5
4|  0 0 1 2 4 4 5 6 6 7 8
5|  0 0 1 2 4 4 5 6 6 7 8

answer = 8

このようにして、普通なら $N$ が増えると莫大な時間がかかるようなものでも、うまく条件式をつくり、小さいスケールから考えていくことで、計算の時間を減らすことができます。
ただし、今回の解き方でも、 $M$ や $W_{i}$ が整数でなかったり、 $M$ がとてつもなく大きい問題だと計算に時間がかかる場合があります。その場合では、今とは異なる条件式を組み立てる方がよいでしょう。
最後になりますが、AOJで公開されているナップサック問題を一つあげておきます。今回の考え方でとけるので、ぜひやってみてください。

ナップザック問題 | 動的計画法 | Aizu Online Judge

ツバサの備忘録

主に備忘録代わりに精進記録を載せていくつもりです。

動的計画法(ナップサック問題について)