kmjp's blog

競技プログラミング参加記です

AtCoder ABC #230 : H - Bullion

ABC最難では…。
https://atcoder.jp/contests/abc230/tasks/abc230_h

問題

K種類の金塊があり、それぞれ重さは正整数でW[i]キロである。
各種類の金塊は無数にあるとする。

これらの金塊を1キロの袋に詰めることを考える。
袋には複数の金塊を入れてもよいし、袋を入れ子にしてもよい。
しかし、中身が何もない状態の袋があってはならない。

単一の袋とその中身で2~Wキロになるようにする場合、それぞれ袋の構成は何通りあるか。

解法

細かい式変形はEditorialに任せて、以下は解き方だけ。
以下の母関数を考える。
F(x) = x^nの係数は、nキロとなる袋の構成法の組み合わせ
G(x) = x^nの係数は、ちょうどnキロの金塊が存在するなら1、それ以外は0

f_n・g_nをF(x)・G(x)におけるx^nの係数とすると、J(x) = x^nの係数f(n)は、 \displaystyle \sum_{d|n} d(f_d+g_d)となる。
また、 \displaystyle f_n = \frac{1}{n-1} \left( j_{n-1} + \sum_{0 \lt k \lt n} f_k j_{n-k} \right)となる。

f_0=j_0=0から初めて、f_nとj_nを順次埋めて行くことを考える。
ただし、f_nにしてもj_nにしてもSumがあるのが厄介。

  • j_nの算出式のSumについては、f_dが確定した段階で、dの倍数nに対しj_n += d(f_d+g_d)と足しこんでしまえばよい。加算回数はO(NlogN)で済む。
  • f_nの算出式のSumについては、畳み込みの形になるのでNTTに持ち込みたい。
    • f_0~f_n、j_0~j_nまで確定していたら、それらの積によるf_(n+1)~f_(2n)への寄与分を計算できる。
    • 別途、f_(n+1)~f_(2n)とj_0~j_nや、f_0~f_nとj_(n+1)~j_(2n)の積によってもf_(n+1)~f_(2n)に寄与するが、それは分割統治の要領で計算できる。
int W,K;
const ll mo=998244353;

vector<ll> myslice(vector<ll>& v,int a,int b) {
	return vector<ll>(v.begin()+a,v.begin()+b);
}

ll modpow(ll a, ll n = mo-2) {
	ll r=1;a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}
template<class T> vector<T> fft(vector<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	for(int m=2; m<=n; m*=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=(ll)w*v[j2]%mo;
				v[j1]=t1+t2;
				v[j2]=t1+mo-t2;
				while(v[j1]>=mo) v[j1]-=mo;
				while(v[j2]>=mo) v[j2]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vector<T> MultPoly(vector<T> P,vector<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
		if(s<=16) { //fastpath
			vector<T> R(s*2);
			for(int x=0;x<2*s;x++) for(int y=0;x+y<2*s;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

vector<ll> F,G,J;

void dfs(int L,int R) {
	if(L+1==R) {
		
		if(L>=2) {
			// 加算済みのF[L]から計算
			F[L]=(F[L]+J[L-1])*modpow(L-1)%mo;
		}
		
		if(L>=1) {
			// F[n]への加算をここで行う
			ll a=L*(F[L]+G[L])%mo;
			for(int d=L;d<=W;d+=L) (J[d]+=a)%=mo;
		}
		return;
	}
	int M=(L+R)/2;
	dfs(L,M);
	int i;
	if(L==0) {
		// F[i+j] += F[i]*J[j] を F[0...(M-1)]*J[0...(M-1)]で行う
		auto a=MultPoly(myslice(F,0,M),myslice(J,0,M),1);
		for(i=M;i<R;i++) if(i<a.size()) (F[i]+=a[i])%=mo;
	}
	else {
		// F[i+j] += F[i]*J[j] を F[L...(M-1)]*J[0...(R-L)]とJ[L...(M-1)]*F[0...(R-L)]で行う
		auto a=MultPoly(myslice(F,L,M),myslice(J,0,R-L),1);
		auto b=MultPoly(myslice(J,L,M),myslice(F,0,R-L),1);
		for(i=M;i<R;i++) {
			if(i-L<a.size()) (F[i]+=a[i-L])%=mo;
			if(i-L<b.size()) (F[i]+=b[i-L])%=mo;
		}
	}
	
	dfs(M,R);
	
}

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>W>>K;
	F.resize(1<<19);
	G.resize(1<<19);
	J.resize(1<<19);
	FOR(i,K) {
		cin>>x;
		G[x]=1;
	}
	
	dfs(0,1<<19);
	
	for(i=2;i<=W;i++) cout<<F[i]<<endl;
	
}

まとめ

この変則的なNTT自体は過去に1回やったことある気がするな。
とはいえ、そこに至る前の部分の式変形がどうにもならない…。