kmjp's blog

競技プログラミング参加記です

yukicoder : No.2348 Power!! (Easy)

知らないテクだった。
https://yukicoder.me/problems/no/2348

問題

整数A,Nが与えられる。
 \displaystyle \sum_{i=0}^{N-1} A^{i^2}を答えよ。

解法

D=floor(N)とする。総和のi=(D^2)~(N-1)の部分は愚直に計算し、i=0~(D^2-1)の部分を高速化しよう。
式変形すると \displaystyle \sum_{i=0}^{D^2-1} A^{i^2}=\sum_{i=0}^{D-1} \sum_{j=0}^{D-1} A^{{i+Dj}^2}となる。
これをさらに変形すると、

 \displaystyle \sum_{i=0}^{D-1} A^{i^2} \sum_{j=0}^{D-1} A^{D^2j^2}A^{2Dij}となる。
 \displaystyle f(x) = \sum_{j=0}^{D-1} A^{D^2j^2}x^jとすると、この式は \displaystyle \sum_{i=0}^{D-1} A^{i^2}  f(A^{2Di})となる。

fに対し、multipoint evaluationを適用すればよいが、普通に行うとTLEする。
ここはfの引数が等比数列であることを用いると、畳み込みを使い高速にmultipoint evaluationが可能。

int T;
ll A,N;
const ll mo=998244353;

ll modpow(ll a, ll n = mo-2) {
	ll r=1;a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}


template <class T> using vec=vector<T>; //using vec=valarray<T>;

template<class T> vec<T> fft(vec<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	for(int m=n; m>=2; m/=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=v[j2];
				v[j1]=t1+t2;
				v[j2]=ll(t1+mo-t2)*w%mo;
				while(v[j1]>=mo) v[j1]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		
		if(s<=16) { //fastpath
			vec<T> R(s*2);
			for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
		vec<T> P2(s*2),Q2(s*2);
		FOR(i,pi+1) P2[i]=P[i];
		FOR(i,qi+1) Q2[i]=Q[i];
		swap(P,P2),swap(Q,Q2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}



vec<ll> multipoint_evaluation_geo(vec<ll> f,ll q,ll sqq,ll m) { //q^0~q^(m-1)のmultipoint_eval. sqqはqの平方根
	assert(sqq*sqq%mo==q);
	ll rsqq=modpow(sqq);
	vector<ll> A,B;
	int i,j;
	FOR(i,f.size()) {
		A.push_back(f[i]*modpow(rsqq,1LL*i*i)%mo);
	}
	reverse(ALL(A));
	FOR(i,f.size()+m) {
		B.push_back(modpow(sqq,1LL*i*i));
	}
	auto C=MultPoly(A,B,1);
	C.resize(2*f.size()+m);
	vector<ll> ret;
	
	FOR(i,m) ret.push_back(modpow(rsqq,1LL*i*i)*C[f.size()-1+i]%mo);
	
	return ret;
	
}

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>T;
	while(T--) {
		cin>>A>>N;
		ll S=floor(sqrt(N));
		if(S*S==N) S--;
		
		ll ret=0;
		for(i=S*S;i<N;i++) {
			ret+=modpow(A,1LL*i*i);
		}
		
		if(S) {
			vector<ll> F;
			FOR(i,S) {
				F.push_back(modpow(A,1LL*S*S*i*i));
			}
			ll q=modpow(A,2*S);
			ll sqq=modpow(A,S);
			auto X=multipoint_evaluation_geo(F,q,sqq,S);

			FOR(i,S) {
				(ret+=modpow(A,1LL*i*i)*X[i])%=mo;
			}
		}
		
		
		cout<<ret%mo<<endl;
		
	}
}

まとめ

まだまだ知らないテクがあるもんだ。