kmjp's blog

競技プログラミング参加記です

AtCoder ABC #315 (キーエンスプログラミングコンテスト2023夏) : Ex - Typical Convolution Problem

知らないテクニックだった。
https://atcoder.jp/contests/abc315/tasks/abc315_h

問題

N要素の整数列Aが与えられる。
以下で計算できるF[1]~F[N]を求めよ。

  •  \displaystyle F_0=1
  •  \displaystyle F_n=A_n\sum_{i+j \lt n} F_iF_j (1 \le n \le N)

解法

  •  \displaystyle G_n=\sum_{i+j = n} F_iF_jとすると、 \displaystyle F_n = A_n \sum_{i=0}^{n-1} G_i

となる。F_nまで確定させたらG_nを確定させ、Gの累積和からF_(n+1)を確定させる…ということを繰り返すことを考える。
G_nは、Relaxed Convolutionで計算できる。

Editorialの数式だけから計算手順を理解するのはつらい。
幸い、Relaxed Convolutionで検索すると出てくるKiri8128氏の記事を見ると、図で計算の雰囲気がわかる。
qiita.com

int N;
ll A[202020];


const int mo=998244353;
ll modpow(ll a, ll n = mo-2) {
	ll r=1; a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}

template <class T> using vec=vector<T>; //using vec=valarray<T>;

template<class T> vec<T> fft(vec<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	for(int m=n; m>=2; m/=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=v[j2];
				v[j1]=t1+t2;
				v[j2]=ll(t1+mo-t2)*w%mo;
				while(v[j1]>=mo) v[j1]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		
		if(s<=16) { //fastpath
			vec<T> R(s*2);
			for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
		vec<T> P2(s*2),Q2(s*2);
		FOR(i,pi+1) P2[i]=P[i];
		FOR(i,qi+1) Q2[i]=Q[i];
		swap(P,P2),swap(Q,Q2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

struct RelaxedConvolution {
	int N;
	vector<ll> A,B,C;
	void add(ll a,ll b) {
		A.push_back(a);
		B.push_back(b);
		C.resize(N*2+1);
		int X=N+2;
		int cur=0,i;
		for(int s=1;;s*=2) {
			if(cur*2==N) {
				vector<ll> X,Y;
				FOR(i,s) X.push_back(A[cur+i]);
				FOR(i,s) Y.push_back(B[cur+i]);
				auto Z=MultPoly(X,Y,1);
				Z.resize(2*s);
				FOR(i,2*s) (C[N+i]+=Z[i])%=mo;
				break;
			}
			else {
				vector<ll> X[2],Y[2];
				FOR(i,s) {
					X[0].push_back(A[cur+i]);
					Y[1].push_back(B[cur+i]);
					X[1].push_back(A[N-cur+i]);
					Y[0].push_back(B[N-cur+i]);
				}
				auto Z=MultPoly(X[0],Y[0],1);
				auto W=MultPoly(X[1],Y[1],1);
				Z.resize(2*s);
				W.resize(2*s);
				FOR(i,2*s) (C[N+i]+=Z[i]+W[i])%=mo;
			}
			if((X&s)) break;
			cur+=s;
		}
		N++;
	}
	ll operator[](int x) {
		assert(x>=0&&x<N);
		return C[x];
	}
};
RelaxedConvolution rc;

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N;
	rc.add(1,1);
	ll sum=0;
	FOR(i,N) {
		cin>>x;
		(sum+=rc[i])%=mo;
		ll a=x*sum%mo;
		cout<<a<<" ";
		
		rc.add(a,a);
	}
}

まとめ

これ数式だけで理解するのつらそう。