kmjp's blog

競技プログラミング参加記です

AtCoder ARC #120 : F2 - Wine Thief

細かいところがかなりつらい。
https://atcoder.jp/contests/arc120/tasks/arc120_f2

問題

N個のワインが並んでおり、i番目のワインのおいしさはA[i]である。
このN本からK本のワインを選ぶ。ただし、連続するD本からは1本までしか選ぶことはできない。
全ワインの選び方における、選んだワインのおいしさの総和を求めよ。

解法

f(N,K) := N本中条件を守ってK本選ぶ選び方の数
g(N,K,i) := N本中条件を守ってK本選ぶ選び方のうち、i番目を選ぶ選び方の数
とすると、解はsum(g(N,K,i)*A[i])である。
fは二項係数を用いて、前処理済みならO(1)で求められる。あとはg(N,K,i)を求めよう。

i番目のワインを除いた後を考えると、g(N,K,i)は概ね以下のように計算できる。
 \displaystyle g(N,K,i) = f(N-D,K-1)-\sum_{j=\max(1,i-D+1)}^{i-1} g(N-D,K-1,j)
ただし、i>N-Dの場合は、fの係数が変わりf(i-1,K-1)となる。
また、maxの影響でiが小さいときはちょっとjの動く範囲が変わって面倒くさい。

この式を愚直に計算すればO(N^2K)、sumの部分を累積和を取ればO(NK)で解くことができる。
ただ、あいにくこれではTLEしてしまう。

V(t)を、i次の係数をg(N-tD,K-t,i)とするようなxの多項式とする。
g(*,1,i) = 1なので、V(K-1) = x+x^2+....から初めてV(0)を求めよう。
jの小さいときと大きいところを除けば、V(t-1) = f(N-tD,K-t)*(x+x^2+....) - V(t)*(x+x^2+...+x^(D-1))で計算できる。
これはNTTで計算できる。
g(N,K,i)=g(N,K,N+1-i)のはずなので、jの小さいところで上記式でずれる部分を後で補正し、同様に大きなところもあとで補正しよう。

補正の部分はEditorialにも十分書いてなくて理解が辛いが、公式解答のなかではsatashun氏のコードが一番Editorialに近くて読みやすいと思う。
Submission #22784217 - AtCoder Regular Contest 120

int N,K,D;
const ll mo=998244353;

ll comb(ll N_, ll C_) {
	const int NUM_=2400001;
	static ll fact[NUM_+1],factr[NUM_+1],inv[NUM_+1];
	if (fact[0]==0) {
		inv[1]=fact[0]=factr[0]=1;
		for (int i=2;i<=NUM_;++i) inv[i] = inv[mo % i] * (mo - mo / i) % mo;
		for (int i=1;i<=NUM_;++i) fact[i]=fact[i-1]*i%mo, factr[i]=factr[i-1]*inv[i]%mo;
	}
	if(C_<0 || C_>N_) return 0;
	return factr[C_]*fact[N_]%mo*factr[N_-C_]%mo;
}
ll hcomb(int P_,int Q_) { return (P_==0&&Q_==0)?1:comb(P_+Q_-1,Q_);}

ll F(ll n,ll k) {
	ll need=(k-1)*D+1;
	if(need>n) return 0;
	return hcomb(k+1,n-need);
}

ll modpow(ll a, ll n = mo-2) {
	ll r=1;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}


template<class T> vector<T> fft(vector<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	for(int m=2; m<=n; m*=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=(ll)w*v[j2]%mo;
				v[j1]=t1+t2;
				v[j2]=t1+mo-t2;
				while(v[j1]>=mo) v[j1]-=mo;
				while(v[j2]>=mo) v[j2]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vector<T> MultPoly(vector<T> P,vector<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
		if(s<=64) { //fastpath
			vector<T> R(s*2);
			for(int x=0;x<2*s;x++) for(int y=0;x+y<2*s;y++) (R[x+y]+=(ll)P[x]*Q[y]%mo)%=mo;
			return R;
		}
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}


vector<int> P;
vector<int> add[1510101];

pair<vector<int>,vector<int>> dfs(int L,int R) {
	if(L+1==R) {
		return {P,add[L]};
	}
	int M=(L+R)/2;
	auto PL=dfs(L,M);
	auto PR=dfs(M,R);
	auto f=MultPoly(PL.first,PR.first,1);
	auto s=MultPoly(PL.second,PR.first,1);
	int i;
	FOR(i,min(s.size(),PR.second.size())) (s[i]+=PR.second[i])%=mo;
	return {f,s};
}


void solve() {
	int i,j,k,l,r,x,y;
	
	cin>>N>>K>>D;
	
	if(K==1) {
		ll ret=0;
		FOR(i,N) {
			cin>>x;
			ret+=x;
		}
		cout<<ret%mo<<endl;
		return;
	}
	
	P.resize(D,mo-1);
	P[0]=0;
	ll foo=1;
	for(int step=1;step<K;step++) {
		add[step].resize(D);
		FOR(i,D) add[step][i]=foo*(D-1-i)%mo;
		foo = ((F(N-(K-step)*D,step)-foo*(D-1))%mo+mo)%mo;
	}
	
	auto s=dfs(1,K).second;
	
	
	vector<ll> G(N,foo);
	FOR(i,min(N,(int)s.size())) {
		(G[i]+=s[i])%=mo;
		(G[N-1-i]+=s[i])%=mo;
	}
	
	ll ret=0;
	FOR(i,N) {
		cin>>x;
		(ret+=G[i]*x)%=mo;
	}
	cout<<ret<<endl;
	exit(0);
}

まとめ

補正をかける部分がEditorialにあまり書いてなくてしんどかった。