初手思いつくのが一番難しいかも?
https://atcoder.jp/contests/arc140/tasks/arc140_f
問題
整数N,Mが与えられる。
1~NのPermutation PはN!通りある。
このうち、K=0...(N-1)に対し、以下を満たすものが何通りあるか答えよ。
|P[i]-P[i+1]|=MとなるiがK個ある。
解法
数列Pに対し、数列QをQ[P[i]]=iで定める。
そうするとこの問題は|Q[i]-Q[i+M]|=1を満たす個数を求める問題になる。
Qの内容をMで割った剰余毎に分割した、M個の数列Rを考えると、|R[i]-R[i-1]|=1となるiの個数を、それぞれM個の数列で求める問題に置くことができる。
まず、その個々のRに対し、|R[i]-R[i-1]|=1となる箇所が何個あるかを考える。
Rの要素の境目にいくつか区切り目を入れ、同じ区切り目の間は、公差1または-1の等差数列を埋めることを考える。
具体的に何の値を入れるかは無視して、そのような区切り目の入れ方は、区切り目の個数毎に何通りか数えよう。
ただし、区切り目で分割された要素の長さ1が場合は公差1と-1を同一視し、2以上の場合は公差1と-1で同じ要素数でも2通りあると考えよう。
f(n,k,a,b) := 長さnの数列に対し、いくつか区切り目を入れてk個の部分列に分割でき、かつ先頭と末尾が単独要素であるかどうかの真偽値をa,bで示す場合、区切り目及び公差の選び方の組み合わせ
とすると、これはf(n,*,a,b)をkに関する多項式として表現し、ダブリングの要領でNTTを繰り返して求めることができる。
これで、R1個分において、f(|R|,*,*,*)を求めることができた。
実際にはR相当の数列はM個あるので、これらはやはりNTTで分割統治の要領で掛け合わせよう。
これらの結果得た多項式を
g(x) := n次の係数は、RをM個合わせた数列に区切りを入れたり公差を決めたのち、n個の部分列ができるような決め方の組み合わせ
とする。ただこれは、個々の部分列にどの数値を入れるかをまだ決めていない。
そこでB_K = [x^(N-K)]g(x)*(N-K)!]とすると、Editorialにある「|P[i]-P[i+1]|=MとなるiがK個"以上"あるようなPの組み合わせ」を得られる。
あとはこのB_Kに包除原理を施せば、Editorialにある「|P[i]-P[i+1]|=MとなるiがちょうどK個あるようなPの組み合わせ」を得られる。
この包除原理は、NTTを使いO(NlogN)で行うことができる。
(コード中コメントアウトしてる部分は、愚直にO(N^2)掛けているケースである)
int N,M; const ll mo=998244353; const int NUM_=400001; static ll fact[NUM_+1],factr[NUM_+1],inv[NUM_+1]; ll modpow(ll a, ll n = mo-2) { ll r=1; a%=mo; while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1; return r; } ll comb(ll N_, ll C_) { if(C_<0 || C_>N_) return 0; return factr[C_]*fact[N_]%mo*factr[N_-C_]%mo; } template <class T> using vec=valarray<T>; //using vec=vector<T>; template<class T> vec<T> fft(vec<T> v, bool rev=false) { int n=v.size(),i,j,m; for(int m=n; m>=2; m/=2) { T wn=modpow(5,(mo-1)/m); if(rev) wn=modpow(wn); for(i=0;i<n;i+=m) { T w=1; for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) { T t1=v[j1],t2=v[j2]; v[j1]=t1+t2; v[j2]=ll(t1+mo-t2)*w%mo; while(v[j1]>=mo) v[j1]-=mo; w=(ll)w*wn%mo; } } } for(i=0,j=1;j<n-1;j++) { for(int k=n>>1;k>(i^=k);k>>=1); if(i>j) swap(v[i],v[j]); } if(rev) { ll rv = modpow(n); FOR(i,n) v[i]=(ll)v[i]*rv%mo; } return v; } template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) { if(resize) { int maxind=0,pi=0,qi=0,i; int s=2; FOR(i,P.size()) if(norm(P[i])) pi=i; FOR(i,Q.size()) if(norm(Q[i])) qi=i; maxind=pi+qi+1; while(s*2<maxind) s*=2; if(s<=16) { //fastpath vec<T> R(s*2); for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo; return R; } vec<T> P2(s*2),Q2(s*2); FOR(i,pi+1) P2[i]=P[i]; FOR(i,qi+1) Q2[i]=Q[i]; swap(P,P2),swap(Q,Q2); } P=fft(P), Q=fft(Q); for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo; return fft(P,true); } map<int,array<vec<ll>,4>> memo; array<vec<ll>,4> create(int len) { array<vec<ll>,4> A; if(len==1) { A[0]={0,0}; A[1]={0,0}; A[2]={0,0}; A[3]={0,1}; return A; } if(len==2) { A[0]={0,2,0}; A[1]={0,0,0}; A[2]={0,0,0}; A[3]={0,0,1}; return A; } if(len==3) { A[0]={0,2,0,0}; A[1]={0,0,2,0}; A[2]={0,0,2,0}; A[3]={0,0,0,1}; return A; } if(memo.count(len)) return memo[len]; array<vec<ll>,4> B=create(len/2); array<vec<ll>,4> C=create(len-len/2); int i; FOR(i,4) A[i].resize(len+1); int b,c; FOR(b,4) FOR(c,4) { vec<ll> D2=MultPoly(B[b],C[c],1),D(len+1); FOR(i,min(D2.size(),D.size())) D[i]=D2[i]; int d=(b&2)+(c&1); //間に仕切りを入れる A[d]+=D; //間の仕切りを取る ll r=1; //大きな成分を連結 if(b%2==0&&c/2==0) r=(mo+1)/2; //小さな分を連結 if(b%2==1&&c/2==1) r=2; FORR(d,D) d=d*r%mo; D=D.cshift(1); D[len]=0; A[d]+=D; } FOR(i,4) A[i]%=mo; return memo[len]=A; } void solve() { int i,j,k,l,r,x,y; string s; inv[1]=fact[0]=factr[0]=1; for (int i=2;i<=NUM_;++i) inv[i] = inv[mo % i] * (mo - mo / i) % mo; for (int i=1;i<=NUM_;++i) fact[i]=fact[i-1]*i%mo, factr[i]=factr[i-1]*inv[i]%mo; cin>>N>>M; queue<vec<ll>> Q; FOR(i,M) { x=0; for(j=i;j<N;j+=M) x++; auto a=create(x); vec<ll> b=(a[0]+a[1]+a[2]+a[3])%mo; Q.push(b); } while(Q.size()>1) { auto a=Q.front(); Q.pop(); Q.push(MultPoly(a,Q.front(),1)); Q.pop(); } vec<ll> V=Q.front(),W(N+1),X(N+1); FOR(i,min(V.size(),W.size())) W[i]=V[N-i]*fact[N-i]%mo; /* FOR(i,N) { ll ret=0; for(j=i;j<N;j++) { if(i%2==j%2) { ret+=W[j]*comb(j,i)%mo; } else { ret+=mo-W[j]*comb(j,i)%mo; } } cout<<ret%mo<<" "; } cout<<endl; */ FOR(i,N+1) { W[i]=W[i]*fact[i]%mo; X[i]=factr[N-i]; if(i%2) X[i]=mo-X[i]; } X=MultPoly(W,X,1); FOR(i,N) cout<<(N+i>=X.size()?0:((N%2?mo-X[N+i]:X[N+i])*factr[i]%mo))<<" "; cout<<endl; }
まとめ
最初Q[P[i]]=iとした数列Qを置くところに気付かないと、以後の考察が辛いな。
逆にそこが思いつけばあとは意外とシンプル?
とはいえ実装も結構重いし、時間内に詰めるのは大変そう。