kmjp's blog

競技プログラミング参加記です

yukicoder : No.463 魔法使いのすごろく🎲

★3にしてはちょっとつらいと思ったら、補正入ったのね。
http://yukicoder.me/problems/no/463

問題

1~NのNマスからなるすごろくを考える。
スタートが1、ゴールがNのマスである。
それ以外のマスには数値C[i]が書かれている。

1~Mが等確率で出るサイコロを使い、すごろくを行う。
各マスに到達すると、C[i]だけお金を失う。
ゴールを超えるようなサイコロの目が出た場合、超えた分だけ折り返したマスに戻る。

ここで、1回だけ1~Mの自由な目を出すことができるとする。
最適なタイミングで自由な目を出せる場合、失うお金の総額の期待値を最小化せよ。

解法

まずは自由な目はおいておいて、普通にすごろくした場合の期待値を考える。
f(x) := 次にx番のマスに止まる場合、ゴールまでに失うお金の期待値

f(x)は \displaystyle f(x) = C_x + \frac{\sum_{i=1}^M f(P(x+i))}{M}となる。
P(x+i)はxマス目からiの目のサイコロを出した場合の行き先である。
このf(x)は折り返しのため前後のマスの影響を受けるので、単純なDPで端から埋めていくことはできない。
そこでf(1)~f(N-1)に関する連立方程式を立ててそれを解こう。

次に、自由な目を出すことを考える。
g(x) := 次にx番のマスに止まる場合、ゴールまでに失うお金の期待値。なおまだ自由な目を出していない。

  • x+M≧N、すなわち自由な目を出せばゴールに到達できるならg(x) = C[i]
  • x+M<Nの場合、自由な目を使うか使わないかを選択できて \displaystyle g(x) = C_i + \min( \min_{i=1}^M(g(x+i)), \frac{\sum_{i=1}^M g(x+i)}{M} )
    • このg(x)はより大きなg(x+i)にしか影響を受けないので、xを大きい順に埋めることができる。
const int MAT=105;
long double mat[MAT][MAT],V[MAT],R[MAT];
// M*r+v=0となるr
int Gauss(int n,long double mat_[MAT][MAT],long double v_[MAT],long double r[MAT]) {
	int i,j,k;
	long double mat[MAT][MAT],v[MAT];
	memmove(mat,mat_,sizeof(mat));
	memmove(v,v_,sizeof(v));
	
	FOR(i,n) {
		if(mat[i][i]==0) {
			for(j=i+1;j<n;j++) if(mat[j][i]) break;
			if(j>=n) return -1;
			FOR(k,n) swap(mat[i][k],mat[j][k]);
			swap(v[i],v[k]);
		}
		v[i]/=mat[i][i];
		for(k=n-1;k>=i;k--) mat[i][k]/=mat[i][i];
		for(j=i+1;j<n;j++) {
			v[j]-=v[i]*mat[j][i];
			for(k=n-1;k>=i;k--) mat[j][k]-=mat[i][k]*mat[j][i];
		}
	}
	
	for(i=n-1;i>=0;i--) {
		for(j=n-1;j>i;j--) v[i]-=mat[i][j]*v[j],mat[i][j]=0;
		r[i]=v[i];
	}
	return 0;
}

int N,M;
int C[101010];
long double dp[1010];
long double dp2[1010];

long double dpdp(int cur) {
	if(cur==N-1) return 0;
	if(dp2[cur]>=0) return dp2[cur];
	
	if(cur+M>=N-1) return C[cur];
	
	long double mi=1e20;
	int i;
	for(i=1;i<=M;i++) mi=min(mi,dp[cur+i]);
	
	long double ave=0;
	for(i=1;i<=M;i++) ave+=dpdp(cur+i)/M;
	return dp2[cur]=C[cur]+min(mi,ave);
}

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N>>M;
	FOR(i,N-2) cin>>C[i+1];
	FOR(y,N-1) {
		for(x=1;x<=M;x++) {
			if(y+x<N-1) mat[y][y+x]+=1.0/M;
			if(y+x>N-1) mat[y][(N-1)-((y+x)-(N-1))]+=1.0/M;
		}
		mat[y][y]-=1;
		mat[y][N-1]=C[y];
	}
	mat[N-1][N-1]=1;
	V[N-1]=1;
	Gauss(N,mat,V,R);
	FOR(i,N-1) dp[i]=R[i];
	FOR(i,N) dp2[i]=-1;
	_P("%.12lf\n",(double)dpdp(0));
	
}

まとめ

これ系苦手。
連立方程式ではなく反復でどうにかする手もあるようね。