kmjp's blog

競技プログラミング参加記です

yukicoder : No.695 square1001 and Permutation 4

こういうのさっと思いつかないなぁ。
https://yukicoder.me/problems/no/695

問題

だいぶ意訳。

マス目に1~N番の番号が付いたすごろくを考える。
サイコロの目はM通りあり、それぞれ異なる正整数X[i]が書かれている。
このすごろくで1番のマスからN番のマスに移動する際、ちょうどN番のマスに止まるまでのサイコロの目の出方は何通りか。
mod 10^17+7で答えよ。

解法

普通に考えればO(NM)の単純なDPだが、mod 10^17+7で答えるためにはN要素の64bit値配列が必要である。
この場合、今回のケースだと160MBに達してしまい64MBの上限を超過する。
なんとかメモリ使用量を削減することを考えよう。

以下2つの手でメモリ使用量を半分ずつにする。
一つは10^17+7=168647939×592951213 より、mod 168647939とmod 592951213でそれぞれ目的の値を求めてあとで中国人剰余定理によりmod 10^17+7を求めればよい。
こうすると配列は32bit値で十分なのでメモリ使用量を半減できる。

もう一つは律儀にN要素の配列を持たなくていいことである。
1-originだと面倒なので、0-originで考え
dp(i) := 0番のマス目から初めてi番のマス目に至るサイコロの目の組み合わせ
とする。求めたいのはdp(N-1)である。

ここでZ=ceil*1なので、

  • i≦ZかつZ<i+X[j]≦N-1の場合、dp(N-1) += dp(i) * dp(N-1-(i+X[j]))

と置くことができ、配列長を半分に抑えることができる。

ll ext_gcd(ll p,ll q,ll& x, ll& y) { // get px+qy=gcd(p,q)
	if(q==0) return x=1,y=0,p;
	ll g=ext_gcd(q,p%q,y,x);
	y-=p/q*x;
	return g;
}


pair<ll,ll> crt(ll a1,ll mo1,ll a2,ll mo2) { // return (x,y) y=lcm(a1,a2),x%mo1=a1,x%mo2=a2
	ll g,x,y,z;
	g=ext_gcd(mo1,mo2,x,y);
	a1=(a1%mo1+mo1)%mo1;a2=(a2%mo2+mo2)%mo2;
	if(a1%g != a2%g) return pair<ll,ll>(-1,0); // N/A
	__int128_t lcm=mo1*(mo2/g);
	if(lcm<mo1) return pair<ll,ll>(-2,0); // overflow
	
	__int128_t v=a1+((a2-a1)%lcm+lcm)*x%lcm*(mo1/g);
	return make_pair(((v%lcm)+lcm) % lcm,lcm);
}

int N,M;
int X[6];
int dp[10100000];
vector<int> P={168647939,592951213};
vector<pair<ll,ll>> C;

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N>>M;
	N--;
	FOR(i,M) cin>>X[i];
	FORR(p,P) {
		dp[0]=1;
		for(i=1;i<=(N+1)/2;i++) {
			ll tmp=0;
			FOR(j,M) if(i>=X[j]) tmp+=dp[i-X[j]];
			dp[i]=tmp%p;
		}
		ll ret=0;
		for(i=0;i<=(N+1)/2;i++) FOR(j,M) if(i+X[j]>(N+1)/2 && i+X[j]<=N) (ret+=1LL*dp[i]*dp[N-(i+X[j])])%=p;
		
		C.push_back({ret,p});
	}
	
	auto ret=crt(C[0].first,C[0].second,C[1].first,C[1].second);
	cout<<ret.first<<endl;
	
	
}

まとめ

うーん。

*1:N-1)/2)とする。 Z番以前のマスiにいるとき、目X[j]を出してZ番移行のマスに始めて突入することを考えると残りN-1-(i+X[j])マスの移動法は結局dp(N-1-(i+X[j]