kmjp's blog

競技プログラミング参加記です

AtCoder ABC #247 : Ex - Rearranging Problem

これは思いつけて良かった。
https://atcoder.jp/contests/abc247/tasks/abc247_h

問題

N人の人が並んでおり、それぞれ着ている服の色が与えられる。
2人を選んで位置をswapするという処理をK回行うことを考える。

その結果、各位置に並ぶ人の服の色は、初期状態と一致していた。
この時、各人の並び方は何通りか。

解法

f(m) := 服の色の並びが初期状態と一致する人の並びのうち、最小m回のswapで達成できる並びの個数
とすると、m≦KかつmとKの偶奇が一致するようなmにおけるf(m)の総和が解となる。

あとはf(m)を考えよう。
最小のswap回数のケースを考えるので、服の色が異なる人のswapは無視してよい。
そこで、
P(l) := (l-1)次多項式で、n次の係数は、L人の人が並んでいた状態から最小n回のswapで達成できる並びの組み合わせ
とする。
あとは各同色の服の人の人数C[0],C[1],C[2]...に対し、f(m) = P(C[0])*P(C[1])*P(C[2])...と表現できるのでこれはNTTで求められる。

P(l)のn次の係数は、n回のswapで達成できる並びということで、言い換えるとl個の要素を(l-n)個の巡回列に分割するやり方であり、これは第1種スターリング数S(l,l-n)と一致する。
よって、S(l,*)を高速に求められれば良い。
これは第1種スターリング数が、x*(x+1)....*(x+l-1)の係数と一致することを考えると、こちらもNTTで求められる。

int N,K;
queue<vector<ll>> Q;

const int mo=998244353;
ll modpow(ll a, ll n = mo-2) {
	ll r=1; a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}


template<class T> vector<T> fft(vector<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	for(int m=n; m>=2; m/=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=v[j2];
				v[j1]=t1+t2;
				v[j2]=ll(t1+mo-t2)*w%mo;
				while(v[j1]>=mo) v[j1]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vector<T> MultPoly(vector<T> P,vector<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
		if(s<=16) { //fastpath
			vector<T> R(s*2);
			for(int x=0;x<2*s;x++) for(int y=0;x+y<2*s;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

vector<ll> hoge(int n) {
	queue<vector<ll>> Q;
	int i;
	FOR(i,n) Q.push({i,1});
	while(Q.size()>1) {
		auto a=Q.front();
		Q.pop();
		auto b=Q.front();
		Q.pop();
		Q.push(MultPoly(a,b,1));
	}
	auto v=Q.front();
	while(v.back()==0) v.pop_back();
	reverse(ALL(v));
	return v;
}

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	
	cin>>N>>K;
	map<int,int> M;
	FOR(i,N) {
		cin>>x;
		M[x]++;
	}
	FORR2(a,b,M) Q.push(hoge(b));
	while(Q.size()>1) {
		auto a=Q.front();
		Q.pop();
		auto b=Q.front();
		Q.pop();
		Q.push(MultPoly(a,b,1));
	}
	
	ll ret=0;
	auto v=Q.front();
	FOR(i,v.size()) if(i<=K&&(i%2==K%2)) ret+=v[i];
	cout<<ret%mo<<endl;
	
	
}

まとめ

本番中、「これ第1種スターリング数を高速に求められれば解けるな」とわかったものの、ちょっと調べてもS(n,k)を求めるのにO(n^2)かかる式ばかり出てきて唸ってた。
その後、「これ上昇階乗冪自体NTTで求められるんじゃない?」と気づいて無事解けた。