必要な知識はあったはずなのに…。
https://atcoder.jp/contests/abc300/tasks/abc300_h
問題
以下のような数列Aを考える。
- A[0]~A[K-1]は1
- A[i]は、直前K項の総和
整数K,Nが与えられる。m and N=mを満たすmに対するA[m]の総和を求めよ。
解法
ユーザ解説側の方が自分にはわかりやすかった。
まず、A[N]を求めることを考える。
これは、x^Nを(x^K-(1+x+x^2+...+x^(K-1))で割った余りにおける、各係数の総和となる。
この計算はいわゆる高速きたまさ法で高速に求められる。
次にm and N=mを満たすmに対するA[m]の総和をもとめたい。
Nを2進数表記したとき、1が立つビットの位置の数列をBとすると、(1+x^(2^B[0]))*(1+x^(2^B[1]))*...を(x^K-(1+x+x^2+...+x^(K-1))で割ればよい。
これはx^Nを求めるときの手順を少しいじくり、途中1を加算するようにすれば求められる。
ll N,K; const int mo=998244353; ll modpow(ll a, ll n = mo-2) { ll r=1; a%=mo; while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1; return r; } template <class T> using vec=vector<T>; //using vec=valarray<T>; template<class T> vec<T> fft(vec<T> v, bool rev=false) { int n=v.size(),i,j,m; for(int m=n; m>=2; m/=2) { T wn=modpow(5,(mo-1)/m); if(rev) wn=modpow(wn); for(i=0;i<n;i+=m) { T w=1; for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) { T t1=v[j1],t2=v[j2]; v[j1]=t1+t2; v[j2]=ll(t1+mo-t2)*w%mo; while(v[j1]>=mo) v[j1]-=mo; w=(ll)w*wn%mo; } } } for(i=0,j=1;j<n-1;j++) { for(int k=n>>1;k>(i^=k);k>>=1); if(i>j) swap(v[i],v[j]); } if(rev) { ll rv = modpow(n); FOR(i,n) v[i]=(ll)v[i]*rv%mo; } return v; } template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) { if(resize) { int maxind=0,pi=0,qi=0,i; int s=2; FOR(i,P.size()) if(norm(P[i])) pi=i; FOR(i,Q.size()) if(norm(Q[i])) qi=i; maxind=pi+qi+1; while(s*2<maxind) s*=2; if(s<=16) { //fastpath vec<T> R(s*2); for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo; return R; } vec<T> P2(s*2),Q2(s*2); FOR(i,pi+1) P2[i]=P[i]; FOR(i,qi+1) Q2[i]=Q[i]; swap(P,P2),swap(Q,Q2); } P=fft(P), Q=fft(Q); for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo; return fft(P,true); } vector<ll> mod(vector<ll> V) { // Vを1+x+x^2+....x^(K-1)-x^Kで割った余りを取る vector<ll> S(1<<17); for(int i=V.size()-1;i>=0;i--) { (S[i]+=S[i+1]); (V[i]+=S[i])%=mo; if(i>=K) { (S[i-1]+=V[i]); if(i>K) (S[i-(K+1)]+=mo-V[i]); V[i]=0; } } return V; } void solve() { int i,j,k,l,r,x,y; string s; cin>>K>>N; vector<ll> X(1<<17),R(1<<17); X[1]=1; R[0]=1; FOR(i,60) { if(N&(1L<<i)) { X[0]++; //R*=1+X^(2^i) R=mod(MultPoly(X,R)); X[0]--; } X=mod(MultPoly(X,X)); } ll ret=0; FORR(v,R) ret+=v; cout<<ret%mo<<endl; }
まとめ
本番(1+x^(2^B[0]))*(1+x^(2^B[1]))*...を処理することは思いつけたのに、そこで高速きたまさ法を使うことに考えが至らず。
せっかくGまで速かったのにもったいない…。