kmjp's blog

競技プログラミング参加記です

yukicoder : No.931 Multiplicative Convolution

こちらはまぁピンと来るかな。
https://yukicoder.me/problems/no/931

問題

素数Pと、A[1]~A[P-1]およびB[1]~B[P-1]からなる2つの(P-1)要素の整数列が与えられる。
 \displaystyle C_k = \sum_{i \times j = k (\mod P)} A_i B_j
とする。数列Cの各要素に対しmod 998244353を取った値を求めよ。

解法

P=2の時はA[1]*B[1]を答えればよい。
それ以外の時、原始根gを求める。
g^a = i、g^b = j、g^c = kとなるa,b,cを考えると、A,Bを並べ替えることでi*j=k (mod P)の部分の条件がa+b=c (mod P-1)となり、乗算をNNTで行える形になる。
あとは再度並べ替えればよい。

int P;
int rt;
ll A[101001];
ll B[101001];
ll R[101001];

const ll mo=998244353;

ll get_root(ll p) {
	// pの原子根を求める
	for(int i=2;i<p;i++) {
		set<int> S;
		int x=1,j;
		while(1) {
			if(S.size()==p-1) return i;
			if(S.count(x)) break;
			S.insert(x);
			x=x*i%p;
		}
		
	}
	assert(0);
}

ll modpow(ll a, ll n = mo-2) {
	ll r=1;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}
vector<ll> fft(vector<ll> v, bool rev=false) {
	int n=v.size(),i,j,m;
	
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	for(int m=2; m<=n; m*=2) {
		ll wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			ll w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				ll t1=v[j1],t2=w*v[j2]%mo;
				v[j1]=t1+t2;
				v[j2]=t1+mo-t2;
				while(v[j1]>=mo) v[j1]-=mo;
				while(v[j2]>=mo) v[j2]-=mo;
				w=w*wn%mo;
			}
		}
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=v[i]*rv%mo;
	}
	return v;
}

vector<ll> MultPoly(vector<ll> P,vector<ll> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=P[i]*Q[i]%mo;
	return fft(P,true);
}



void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>P;
	FOR(i,P-1) cin>>A[i+1];
	FOR(i,P-1) cin>>B[i+1];
	
	if(P==2) {
		cout<<A[1]*B[1]%mo<<endl;
		return;
	}
	
	rt=get_root(P);
	vector<ll> X(1<<17),Y(1<<17);
	ll v=1;
	FOR(i,P-1) {
		X[i]=A[v];
		Y[i]=B[v];
		v=v*rt%P;
	}
	auto Z=MultPoly(X,Y,true);
	v=1;
	FOR(i,Z.size()) {
		R[v]+=Z[i];
		v=v*rt%P;
	}
	
	FOR(i,P-1) cout<<R[i+1]%mo<<" ";
	cout<<endl;
	
}

まとめ

Eの方が手間取りそう…。