kmjp's blog

競技プログラミング参加記です

yukicoder : No.2613 Sum of Combination

こういう使い方は知らなかった。
https://yukicoder.me/problems/no/2613

問題

正整数Nと素数Pが与えられる。
 \displaystyle \sum_{R=0}^N ({}_N C_R \% P)を998244353で割った余りを答えよ。

解法

Lucasの定理を考えると、N,RをP進数で表現した各桁からなる数列をN',R'とすると、
 {}_N C_R \equiv \prod_i {}_{N'_i} C_{R'_i} (\mod P)となる。

wを原子根とした対数を考えると
 \displaystyle \log_w \left({}_N C_R\right) \equiv \sum_i \log_w \left( {}_{N'_i} C_{R'_i} \right) (\mod P-1)となる。
よって各Rに対し右辺を多項式とみなし、FFTを使って畳み込み演算すると良い。

ll N,P;
const ll mo=998244353;

const int NUM_=2000003;
static ll fact[NUM_+1],factr[NUM_+1],inv[NUM_+1];


ll modpow(ll a, ll n = mo-2) {
	ll r=1; a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}

template <class T> using vec=vector<T>; //using vec=valarray<T>;

template<class T> vec<T> fft(vec<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	for(int m=n; m>=2; m/=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=v[j2];
				v[j1]=(t1+t2+mo)%mo;
				v[j2]=ll(t1+mo-t2)*w%mo;
				while(v[j1]>=mo) v[j1]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		
		if(s<=64) { //fastpath
			vec<T> R(s*2);
			for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
		vec<T> P2(s*2),Q2(s*2);
		FOR(i,pi+1) P2[i]=P[i];
		FOR(i,qi+1) Q2[i]=Q[i];
		swap(P,P2),swap(Q,Q2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

ll get_root(ll p) {
	if(p==2) return 1;
	for(int i=2;i<p;i++) {
		set<int> S;
		int x=1,j;
		while(1) {
			if(S.size()==p-1) return i;
			if(S.count(x)) break;
			S.insert(x);
			x=x*i%p;
		}
		
	}
	assert(0);
}

ll po[202020],re[202020];

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N>>P;
	ll Q=get_root(P);
	
	ll cur=1;
	FOR(i,P-1) {
		po[i]=cur;
		re[cur]=i;
		cur=cur*Q%P;
	}
	
	
	inv[1]=fact[0]=factr[0]=1;
	for (int i=2;i<P;++i) inv[i] = inv[P % i] * (P - P / i) % P;
	for (int i=1;i<P;++i) fact[i]=fact[i-1]*i%P, factr[i]=factr[i-1]*inv[i]%P;
	vector<ll> V={1};
	while(N) {
		vector<ll> W(P-1);
		ll a=N%P;
		FOR(i,a+1) W[re[fact[a]*factr[i]%P*factr[a-i]%P]]++;
		
		V=MultPoly(V,W,1);
		while(V.size()>=P) {
			x=V.size()-1;
			(V[x-(P-1)]+=V[x])%=mo;
			V.pop_back();
		}
		N/=P;
	}
	ll ret=0;
	V.resize(P-1);
	FOR(i,V.size()) (ret+=po[i]*V[i])%=mo;
	
	cout<<ret%mo<<endl;
	
}

まとめ

乗算が沢山でる計算を、対数取って畳み込み演算にするの、あまり経験なかったな。