kmjp's blog

競技プログラミング参加記です

yukicoder : No.696 square1001 and Permutation 5

うーん、これは解けててもよさそう。
https://yukicoder.me/problems/no/696

問題

1~Nの順列が与えられる。
この順列は1~Nの順列全通りを辞書順に並べた場合何番目か。

解法

値自体は階乗進数の要領でBITで求められる。
問題は答えがmodではなく10進数の実際の値で返さなければならないことである。

以下の2つのテクを組み合わせて解こう。

  • 多倍長整数の乗算にはFFT/NTTを用いる。
  • 数列A[0...(N-1)]に対し、A[0]*0!+A[1]*1!+A[2]*2!+...+A[N-1]*N!のように数列の各要素に要素に応じた階乗値を掛けることになる。
    • これはSegTreeの要領で、区間をマージして和を取ること、および区間和に対し連続した整数の積を掛けること(またそのために連続した整数の積を覚えておくこと)を繰り返していくとよい。
template<class V, int ME> class BIT {
public:
	V bit[1<<ME];
	V operator()(int e) {if(e<0) return 0;V s=0;e++;while(e) s+=bit[e-1],e-=e&-e; return s;}
	void add(int e,V v) { e++; while(e<=1<<ME) bit[e-1]+=v,e+=e&-e;}
};
BIT<int,20> bt;

int N;
int A[101010];
int P[101010];

const int DI=100;

ll mo=(441LL<<21)+1;
ll modpow(ll a, ll n = mo-2) {
	ll r=1;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}
vector<ll> fft(vector<ll> v, bool rev=false) {
	int n=v.size(),i,j,m;
	
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	for(int m=2; m<=n; m*=2) {
		ll wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			ll w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				ll t1=v[j1],t2=w*v[j2]%mo;
				v[j1]=t1+t2;
				v[j2]=t1+mo-t2;
				while(v[j1]>=mo) v[j1]-=mo;
				while(v[j2]>=mo) v[j2]-=mo;
				w=w*wn%mo;
			}
		}
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=v[i]*rv%mo;
	}
	return v;
}


void carry(vector<ll>& V) {
	ll ca=0;
	FORR(c,V) {
		c+=ca;
		ca=0;
		if(c>=DI) {
			ca = c/DI;
			c %= DI;
		}
	}
	while(ca) {
		V.push_back(ca%DI);
		ca/=DI;
	}
		
	while(V.back()==0 && V.size()>1) V.pop_back();
}
vector<ll> MultPoly(vector<ll> P,vector<ll> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		P.resize(s*2);Q.resize(s*2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=P[i]*Q[i]%mo;
	P=fft(P,true);
	carry(P);
	return P;
}
vector<ll> AddPoly(vector<ll> P,vector<ll> Q) {
	int i,m=max(P.size(),Q.size());
	vector<ll> R(m+1);
	FOR(i,m) {
		if(i<P.size()) R[i]+=P[i];
		if(i<Q.size()) R[i]+=Q[i];
		if(R[i]>=DI) {
			R[i]-=DI;
			R[i+1]++;
		}
	}
	while(R.back()==0 && R.size()>1) R.pop_back();
	return R;
}

pair<vector<ll>,vector<ll>> hoge(int L,int R) {
	vector<ll> ret,F;
	if(R-L==1) {
		F.push_back(max(1,L));
		ret.push_back(F[0]*P[L]);
		carry(F);
		carry(ret);
	}
	else {
		int M=(L+R)/2;
		auto LL=hoge(L,M);
		auto RR=hoge(M,R);
		auto a=MultPoly(RR.first,LL.second,true);
		ret=AddPoly(LL.first,a);
		F=MultPoly(RR.second,LL.second,true);
	}
	return {ret,F};
}


void solve() {
	int i,j,k,l,r,x,y; string s;
	
	
	cin>>N;
	FOR(i,N) cin>>A[i];
	for(i=N-1;i>=0;i--) {
		P[N-i-1]=bt(A[i]);
		bt.add(A[i],1);
	}
	auto ret=AddPoly(hoge(0,N).first,vector<ll>(1,1));
	
	
	reverse(ALL(ret));
	int first=1;
	FORR(c,ret) {
		if(first==1) {
			if(c==0) continue;
			_P("%lld",c);
			first=0;
		}
		else {
			_P("%02lld",c);
		}
	}
	_P("\n");
	//cout<<ret<<endl;
}

まとめ

FFTは(理論上の計算量はともかく)実際の計算時間が読めなくて、項数が多いと割と怖い。