知らないテクニックだった。
https://atcoder.jp/contests/abc315/tasks/abc315_h
問題
N要素の整数列Aが与えられる。
以下で計算できるF[1]~F[N]を求めよ。
解法
- とすると、
となる。F_nまで確定させたらG_nを確定させ、Gの累積和からF_(n+1)を確定させる…ということを繰り返すことを考える。
G_nは、Relaxed Convolutionで計算できる。
Editorialの数式だけから計算手順を理解するのはつらい。
幸い、Relaxed Convolutionで検索すると出てくるKiri8128氏の記事を見ると、図で計算の雰囲気がわかる。
qiita.com
int N; ll A[202020]; const int mo=998244353; ll modpow(ll a, ll n = mo-2) { ll r=1; a%=mo; while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1; return r; } template <class T> using vec=vector<T>; //using vec=valarray<T>; template<class T> vec<T> fft(vec<T> v, bool rev=false) { int n=v.size(),i,j,m; for(int m=n; m>=2; m/=2) { T wn=modpow(5,(mo-1)/m); if(rev) wn=modpow(wn); for(i=0;i<n;i+=m) { T w=1; for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) { T t1=v[j1],t2=v[j2]; v[j1]=t1+t2; v[j2]=ll(t1+mo-t2)*w%mo; while(v[j1]>=mo) v[j1]-=mo; w=(ll)w*wn%mo; } } } for(i=0,j=1;j<n-1;j++) { for(int k=n>>1;k>(i^=k);k>>=1); if(i>j) swap(v[i],v[j]); } if(rev) { ll rv = modpow(n); FOR(i,n) v[i]=(ll)v[i]*rv%mo; } return v; } template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) { if(resize) { int maxind=0,pi=0,qi=0,i; int s=2; FOR(i,P.size()) if(norm(P[i])) pi=i; FOR(i,Q.size()) if(norm(Q[i])) qi=i; maxind=pi+qi+1; while(s*2<maxind) s*=2; if(s<=16) { //fastpath vec<T> R(s*2); for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo; return R; } vec<T> P2(s*2),Q2(s*2); FOR(i,pi+1) P2[i]=P[i]; FOR(i,qi+1) Q2[i]=Q[i]; swap(P,P2),swap(Q,Q2); } P=fft(P), Q=fft(Q); for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo; return fft(P,true); } struct RelaxedConvolution { int N; vector<ll> A,B,C; void add(ll a,ll b) { A.push_back(a); B.push_back(b); C.resize(N*2+1); int X=N+2; int cur=0,i; for(int s=1;;s*=2) { if(cur*2==N) { vector<ll> X,Y; FOR(i,s) X.push_back(A[cur+i]); FOR(i,s) Y.push_back(B[cur+i]); auto Z=MultPoly(X,Y,1); Z.resize(2*s); FOR(i,2*s) (C[N+i]+=Z[i])%=mo; break; } else { vector<ll> X[2],Y[2]; FOR(i,s) { X[0].push_back(A[cur+i]); Y[1].push_back(B[cur+i]); X[1].push_back(A[N-cur+i]); Y[0].push_back(B[N-cur+i]); } auto Z=MultPoly(X[0],Y[0],1); auto W=MultPoly(X[1],Y[1],1); Z.resize(2*s); W.resize(2*s); FOR(i,2*s) (C[N+i]+=Z[i]+W[i])%=mo; } if((X&s)) break; cur+=s; } N++; } ll operator[](int x) { assert(x>=0&&x<N); return C[x]; } }; RelaxedConvolution rc; void solve() { int i,j,k,l,r,x,y; string s; cin>>N; rc.add(1,1); ll sum=0; FOR(i,N) { cin>>x; (sum+=rc[i])%=mo; ll a=x*sum%mo; cout<<a<<" "; rc.add(a,a); } }
まとめ
これ数式だけで理解するのつらそう。