珍しいHLDの使い方?
https://atcoder.jp/contests/abc269/tasks/abc269_h
問題
N頂点の根付き木が与えられる。
このN点のうちK点を選ぶとき、どの選んだ頂点対においても互いに祖先と子孫の関係にならないようにしたい。
K=1~Nそれぞれについて、条件を満たす選び方を求めよ。
解法
f_v(x) := 頂点vのsubtreeにおける、この問題に対応する母関数
とすると、vの子頂点の集合をC(v)として、vを選ぶ場合と選ばない場合を考えると
となる。ただ、これを愚直に行うとFFTを使ってもO(N^2logN)かかり間に合わない。
そこで、木をHL分解することを考える。
g_v(x) := 頂点vのlight edgeでつながれた子頂点群のSubtreeにおける、この問題に対応する母関数
とする。g_v(x)は分割統治の要領で子頂点cのf_c(x)の積をFFTで計算すると求めることができる。
heavy pathの頂点を1,2,....,Mとすると、heavy path上の1点を選んだ場合と1点も選ばない場合を考えると
第1項のprefix prodの累積和と、第2項の積について、これまた分割統治法の要領で計算しよう。
int N; int P[202020]; vector<int> E[202020],L[202020]; const ll mo=998244353; vector<ll> F[202020],G[202020]; struct HLdecomp { static const int MD=20; int N,NE,id; vector<vector<int>> E; vector<int> D,S,B,C; // depth, size, base,heavy child vector<int> L,R,rev; // EulerTour vector<vector<int>> P,Cs; // parent for LCA,children void init(int N) { this->N=N, NE=0, E.clear(),E.resize(N); Cs.clear(),Cs.resize(N); D=S=B=C=L=R=rev=vector<int>(N,0); id=0; int i; P.clear(); FOR(i,MD+1) P.push_back(vector<int>(N,0));} void add_edge(int a,int b){ E[a].push_back(b),E[b].push_back(a); NE++;} // undir void dfs(int cur,int pre) { // get depth, parent, size, largest subtree int i; P[0][cur]=pre;S[cur]=1;C[cur]=-1;B[cur]=cur; D[cur]=(pre==cur)?0:(D[pre]+1); FOR(i,E[cur].size()) if(E[cur][i]!=pre) { int r=E[cur][i]; dfs(r,cur); S[cur]+=S[r]; if(C[cur]==-1 || S[r]>S[C[cur]]) C[cur]=r; } } void dfs2(int cur,int pre) { // set base and list if(pre!=cur && C[pre]==cur) B[cur]=B[pre]; else B[cur]=cur; Cs[B[cur]].push_back(cur); L[cur]=id++; rev[L[cur]]=cur; // DFS順を先行 if(C[cur]!=-1) dfs2(C[cur],cur); FORR(r,E[cur]) if(r!=pre && r!=C[cur]) dfs2(r,cur); R[cur]=id; } pair<int,int> lca(int a,int b) { int ret=0,i,aa=a,bb=b; if(D[aa]>D[bb]) swap(aa,bb); for(i=19;i>=0;i--) if(D[bb]-D[aa]>=1<<i) bb=P[i][bb]; for(i=19;i>=0;i--) if(P[i][aa]!=P[i][bb]) aa=P[i][aa], bb=P[i][bb]; return make_pair((aa==bb)?aa:P[0][aa], D[a]+D[b]-2*D[(aa==bb)?aa:P[0][aa]]); } void decomp(int root=0){ assert(NE==N-1); dfs(root,root); dfs2(root,root); int i,x; FOR(i,MD) FOR(x,N) P[i+1][x]=P[i][P[i][x]]; } }; HLdecomp hl; ll modpow(ll a, ll n = mo-2) { ll r=1; a%=mo; while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1; return r; } template <class T> using vec=vector<T>; //using vec=valarray<T>; template<class T> vec<T> fft(vec<T> v, bool rev=false) { int n=v.size(),i,j,m; for(int m=n; m>=2; m/=2) { T wn=modpow(5,(mo-1)/m); if(rev) wn=modpow(wn); for(i=0;i<n;i+=m) { T w=1; for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) { T t1=v[j1],t2=v[j2]; v[j1]=t1+t2; v[j2]=ll(t1+mo-t2)*w%mo; while(v[j1]>=mo) v[j1]-=mo; w=(ll)w*wn%mo; } } } for(i=0,j=1;j<n-1;j++) { for(int k=n>>1;k>(i^=k);k>>=1); if(i>j) swap(v[i],v[j]); } if(rev) { ll rv = modpow(n); FOR(i,n) v[i]=(ll)v[i]*rv%mo; } return v; } template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) { if(resize) { int maxind=0,pi=0,qi=0,i; int s=2; FOR(i,P.size()) if(norm(P[i])) pi=i; FOR(i,Q.size()) if(norm(Q[i])) qi=i; maxind=pi+qi+1; while(s*2<maxind) s*=2; if(s<=16) { //fastpath vec<T> R(s*2); for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo; return R; } vec<T> P2(s*2),Q2(s*2); FOR(i,pi+1) P2[i]=P[i]; FOR(i,qi+1) Q2[i]=Q[i]; swap(P,P2),swap(Q,Q2); } P=fft(P), Q=fft(Q); for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo; return fft(P,true); } template<class T> vec<T> AddPoly(vec<T> P,vec<T> Q) { if(P.size()<Q.size()) swap(P,Q); for(int i=0;i<Q.size();i++) (P[i]+=Q[i])%=mo; return P; } vector<vector<ll>> Gs; pair<vector<ll>,vector<ll>> dfs(int L,int R) { if(L+1==R) { return {{1LL},Gs[L]}; } int M=(L+R)/2; auto p=dfs(L,M); auto q=dfs(M,R); vector<ll> a,b; a=AddPoly(p.first,MultPoly(p.second,q.first,1)); b=MultPoly(p.second,q.second,1); return {a,b}; } void solve() { int i,j,k,l,r,x,y; string s; cin>>N; hl.init(N); for(i=1;i<N;i++) { cin>>P[i]; P[i]--; E[P[i]].push_back(i); hl.add_edge(i,P[i]); } hl.decomp(); for(i=N-1;i>=0;i--) { queue<vector<ll>> Q; Q.push({1}); FORR(e,E[i]) if(hl.B[e]==e) Q.push(F[e]); while(Q.size()>1) { auto a=Q.front(); Q.pop(); Q.push(MultPoly(a,Q.front(),1)); Q.pop(); } G[i]=Q.front(); L[hl.B[i]].push_back(i); if(hl.B[i]==i) { reverse(ALL(L[i])); Gs.clear(); FORR(a,L[i]) Gs.push_back(G[a]); auto p=dfs(0,Gs.size()); p.first.insert(p.first.begin(),0); F[i]=AddPoly(p.first,p.second); } } F[0].resize(1<<20); for(i=1;i<=N;i++) cout<<F[0][i]%mo<<endl; }
まとめ
この分割統治法、実行時間結構大きそうだけど間に合うんだな。