AtCoder ARC #134 : F - Flipping Coins

ややこしいけど前回のFに比べるとマシ。
https://atcoder.jp/contests/arc134/tasks/arc134_f

問題

1～NのPermutation Pがある。
ここで、1～N番のコインが順に並んでいるものとする。初期状態では全コイン表である。
これらをPに従い以下のようにひっくり返す。

i=1～Nの順で以下を行う。
- i番のコインがすでに裏なら何もしない
- i番のコインが表なら、i番とP[i]番のコインをそれぞれ反転させる。

最終的に表のコインがk枚あるとき、定数Wに対しスコアW^kを得るとする。
Pの組み合わせN!通り全通りに対し、スコアの総和を求めよ。

解法

i＜P[i]＜P[P[i]]…となる極大な数列を考える。そのような数列のうち奇数の長さのものがが1個あると、1枚表のコインが残る。
よって、P中における奇数長の極大な数列を数え上げればよいことになるが、これはなかなか難しい。

詳細はEditorialに譲るが、f(P)=Qとなる全単射fのうち、(i,P[i],P[P[i]],...)という列がQ中に連続部分列として現れるようなものが存在する。
よって、1～NのPermutation Qのうち、連続部分列が奇数長の極大な増加列となっているものがちょうどk個含まれるものを数え上げれば、これは元の問題における表コインがk枚となるPの組み合わせ数に一致する。

Qは以下のように表現できる。
(降下列のうち最後だけ上昇する2要素以上の数列)*0個以上 + 長さ0個以上の降下列
kの数は、前者の括弧内の数列の数となる。

dp[n] := 長さnのPermutation全通りに対する、上記括弧内の数列の形の登場数の総和
とすると
dp[n+m] += dp[n] * Comb(n+m,m) * (m-1) * W^(m-2)
で数え上げることができる。
あとはdp[0]～dp[N]に対し、最後「長さ0個以上の降下列」を付与した数列を末尾に追加した状態を数え上げればよい。

この数え上げは、一見O(N^2)かかる。
ただ、以下の問題の要領で分割統治+NTTでO(Nlog^2N)で数え上げることができる。
AtCoder ABC #230 : H - Bullion - kmjp's blog

int N;
ll W;
const ll mo=998244353;

const int NUM_=400001;
static ll fact[NUM_+1],factr[NUM_+1],inv[NUM_+1];

ll modpow(ll a, ll n = mo-2) {
	ll r=1; a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}


template<class T> vector<T> fft(vector<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	for(int m=2; m<=n; m*=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=(ll)w*v[j2]%mo;
				v[j1]=t1+t2;
				v[j2]=t1+mo-t2;
				while(v[j1]>=mo) v[j1]-=mo;
				while(v[j2]>=mo) v[j2]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vector<T> MultPoly(vector<T> P,vector<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
		if(s<=16) { //fastpath
			vector<T> R(s*2);
			for(int x=0;x<2*s;x++) for(int y=0;x+y<2*s;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

ll pw[2<<18];

vector<ll> wei,V;

void dfs(int L,int R) {
	if(L+1==R) return ;
	int M=(L+R)/2;
	
	dfs(L,M);
	vector<ll> A,B;
	A.resize((R-L)*2,0);
	B.resize((R-L)*2,0);
	int i;
	FOR(i,M-L) {
		A[i]=V[L+i];
	}
	FOR(i,R-L) {
		B[i]=wei[i];
	}
	
	A=MultPoly(A,B);
	FOR(i,M-L) (V[M+i]+=A[(M-L)+i])%=mo;
	
	dfs(M,R);
	
	
}

void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N>>W;
	
	inv[1]=fact[0]=factr[0]=1;
	for (int i=2;i<=NUM_;++i) inv[i] = inv[mo % i] * (mo - mo / i) % mo;
	for (int i=1;i<=NUM_;++i) fact[i]=fact[i-1]*i%mo, factr[i]=factr[i-1]*inv[i]%mo;
	pw[0]=1;
	FOR(i,(1<<18)+3) pw[i+1]=pw[i]*W%mo;
	
	wei.resize(1<<18);
	V.resize(1<<18);
	V[0]=fact[N];
	for(i=2;i<=N;i++) wei[i]=pw[i-2]%mo*(i-1)%mo*factr[i]%mo;
	dfs(0,1<<18);
	
	FOR(i,N) (V[N]+=V[i]*pw[N-i]%mo*factr[N-i])%=mo;
	
	cout<<V[N]<<endl;
	
	
}

まとめ

最初のPermutationの言い換えが難しいけど、これよくあるテクなんかな。