この機会にライブラリ化した。
https://yukicoder.me/problems/no/2966
問題
N要素の整数列Aと、整数Kが与えられる。
Aを以下のように更新することを、K回行ったときAの値を求めよ。
新しいA[i]=A[1]-A[2]+A[3]-A[4]+.....+(-1)^(i-1)*A[i]
解法
2回この処理を行うと、Aの奇数番目の要素と偶数番目の要素それぞれ累積和を1回取った状態になる。
そこで、Kが奇数なら1回は愚直にAを更新したうえで、残りfloor(K/2)回、累積和を取ろう。
累積和は、Aを母関数に載せて1+x+x^2+...+x^(N/2)のfloor(K/2)を求めることで行った。
ll N,K; ll A[202020]; const ll mo=998244353; ll modpow(ll a, ll n = mo-2) { ll r=1; a%=mo; while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1; return r; } template <class T> using vec=vector<T>; //using vec=valarray<T>; template<class T> vec<T> fft(vec<T> v, bool rev=false) { int n=v.size(),i,j,m; for(int m=n; m>=2; m/=2) { T wn=modpow(5,(mo-1)/m); if(rev) wn=modpow(wn); for(i=0;i<n;i+=m) { T w=1; for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) { T t1=v[j1],t2=v[j2]; v[j1]=(t1+t2+mo)%mo; v[j2]=ll(t1+mo-t2)*w%mo; while(v[j1]>=mo) v[j1]-=mo; w=(ll)w*wn%mo; } } } for(i=0,j=1;j<n-1;j++) { for(int k=n>>1;k>(i^=k);k>>=1); if(i>j) swap(v[i],v[j]); } if(rev) { ll rv = modpow(n); FOR(i,n) v[i]=(ll)v[i]*rv%mo; } return v; } template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) { if(resize) { int maxind=0,pi=-1,qi=-1,i; int s=2; FOR(i,P.size()) if(norm(P[i])) pi=i; FOR(i,Q.size()) if(norm(Q[i])) qi=i; if(pi==-1||qi==-1) return {}; maxind=pi+qi+1; while(s*2<maxind) s*=2; if(s<=64) { //fastpath vec<T> R(s*2); for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo; return R; } vec<T> P2(s*2),Q2(s*2); FOR(i,pi+1) P2[i]=P[i]; FOR(i,qi+1) Q2[i]=Q[i]; swap(P,P2),swap(Q,Q2); } P=fft(P), Q=fft(Q); for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo; return fft(P,true); } vector<ll> prefix_sum(vector<ll> V,int num) { // (1-x)でnum回割る、または(1+x+x^2...)のnum乗を掛ける int N=V.size(); vector<ll> F(N,1),G={1};; while(num) { if(num%2) { G=MultPoly(F,G,1); G.resize(N); } num/=2; if(num==0) break; F=MultPoly(F,F,1); F.resize(N); } V=MultPoly(V,G,1); V.resize(N); return V; } vector<ll> prefix_sum(int N,int num) { // (1+x+x^2...)のnum乗を返す vector<ll> F(N,1),G={1};; while(num) { if(num%2) { G=MultPoly(F,G,1); G.resize(N); } num/=2; if(num==0) break; F=MultPoly(F,F,1); F.resize(N); } return G; } void solve() { int i,j,k,l,r,x,y; string s; cin>>N>>K; FOR(i,N) cin>>A[i]; if(K%2) { for(i=1;i<N;i++) { if(i%2) { A[i]=(A[i-1]+mo-A[i])%mo; } else { A[i]=(A[i-1]+A[i])%mo; } } } K/=2; vector<ll> V[2]; FOR(i,N) V[i%2].push_back(A[i]); auto W=prefix_sum(V[0].size(),K); V[0]=MultPoly(V[0],W,1); V[1]=MultPoly(V[1],W,1); FOR(i,N) cout<<V[i%2][i/2]<<" "; cout<<endl; }
まとめ
1/(1-x)^(N/2)をやった方が速かったかな?