kmjp's blog

競技プログラミング参加記です

AtCoder ABC #269 (UNICORNプログラミングコンテスト2022) : Ex - Antichain

珍しいHLDの使い方?
https://atcoder.jp/contests/abc269/tasks/abc269_h

問題

N頂点の根付き木が与えられる。
このN点のうちK点を選ぶとき、どの選んだ頂点対においても互いに祖先と子孫の関係にならないようにしたい。
K=1~Nそれぞれについて、条件を満たす選び方を求めよ。

解法

f_v(x) := 頂点vのsubtreeにおける、この問題に対応する母関数
とすると、vの子頂点の集合をC(v)として、vを選ぶ場合と選ばない場合を考えると
 \displaystyle f_v(x) = x + \prod_{c \in C(v)} f_c(x)
となる。ただ、これを愚直に行うとFFTを使ってもO(N^2logN)かかり間に合わない。

そこで、木をHL分解することを考える。
g_v(x) := 頂点vのlight edgeでつながれた子頂点群のSubtreeにおける、この問題に対応する母関数
とする。g_v(x)は分割統治の要領で子頂点cのf_c(x)の積をFFTで計算すると求めることができる。

heavy pathの頂点を1,2,....,Mとすると、heavy path上の1点を選んだ場合と1点も選ばない場合を考えると
 \displaystyle  f_1(x) = x \times \sum_{v=1}^M \left( \prod_{w=1}^{v-1} g_w(x) \right) + \prod_{v=1}^{M} g_v(x)
第1項のprefix prodの累積和と、第2項の積について、これまた分割統治法の要領で計算しよう。

int N;
int P[202020];
vector<int> E[202020],L[202020];
const ll mo=998244353;
vector<ll> F[202020],G[202020];

struct HLdecomp {
	static const int MD=20;
	int N,NE,id;
	vector<vector<int>> E;
	vector<int> D,S,B,C; // depth, size, base,heavy child
	
	vector<int> L,R,rev; // EulerTour
	vector<vector<int>> P,Cs; // parent for LCA,children
	void init(int N) { this->N=N, NE=0, E.clear(),E.resize(N); Cs.clear(),Cs.resize(N);
		D=S=B=C=L=R=rev=vector<int>(N,0); id=0; int i; P.clear(); FOR(i,MD+1) P.push_back(vector<int>(N,0));}
	void add_edge(int a,int b){ E[a].push_back(b),E[b].push_back(a); NE++;} // undir
	void dfs(int cur,int pre) { // get depth, parent, size, largest subtree
		int i;
		P[0][cur]=pre;S[cur]=1;C[cur]=-1;B[cur]=cur;
		D[cur]=(pre==cur)?0:(D[pre]+1);
		FOR(i,E[cur].size()) if(E[cur][i]!=pre) {
			int r=E[cur][i]; dfs(r,cur); S[cur]+=S[r];
			if(C[cur]==-1 || S[r]>S[C[cur]]) C[cur]=r;
		}
	}
	void dfs2(int cur,int pre) { // set base and list
		if(pre!=cur && C[pre]==cur) B[cur]=B[pre];
		else B[cur]=cur;
		Cs[B[cur]].push_back(cur);
		L[cur]=id++;
		rev[L[cur]]=cur;
		// DFS順を先行
		if(C[cur]!=-1) dfs2(C[cur],cur);
		FORR(r,E[cur]) if(r!=pre && r!=C[cur]) dfs2(r,cur);
		R[cur]=id;
	}
	pair<int,int> lca(int a,int b) {
		int ret=0,i,aa=a,bb=b;
		if(D[aa]>D[bb]) swap(aa,bb);
		for(i=19;i>=0;i--) if(D[bb]-D[aa]>=1<<i) bb=P[i][bb];
		for(i=19;i>=0;i--) if(P[i][aa]!=P[i][bb]) aa=P[i][aa], bb=P[i][bb];
		return make_pair((aa==bb)?aa:P[0][aa], D[a]+D[b]-2*D[(aa==bb)?aa:P[0][aa]]);
	}
	void decomp(int root=0){
		assert(NE==N-1);
		dfs(root,root); dfs2(root,root);
		int i,x; FOR(i,MD) FOR(x,N) P[i+1][x]=P[i][P[i][x]];
	}
};

HLdecomp hl;


ll modpow(ll a, ll n = mo-2) {
	ll r=1; a%=mo;
	while(n) r=r*((n%2)?a:1)%mo,a=a*a%mo,n>>=1;
	return r;
}

template <class T> using vec=vector<T>; //using vec=valarray<T>;

template<class T> vec<T> fft(vec<T> v, bool rev=false) {
	int n=v.size(),i,j,m;
	for(int m=n; m>=2; m/=2) {
		T wn=modpow(5,(mo-1)/m);
		if(rev) wn=modpow(wn);
		for(i=0;i<n;i+=m) {
			T w=1;
			for(int j1=i,j2=i+m/2;j2<i+m;j1++,j2++) {
				T t1=v[j1],t2=v[j2];
				v[j1]=t1+t2;
				v[j2]=ll(t1+mo-t2)*w%mo;
				while(v[j1]>=mo) v[j1]-=mo;
				w=(ll)w*wn%mo;
			}
		}
	}
	for(i=0,j=1;j<n-1;j++) {
		for(int k=n>>1;k>(i^=k);k>>=1);
		if(i>j) swap(v[i],v[j]);
	}
	if(rev) {
		ll rv = modpow(n);
		FOR(i,n) v[i]=(ll)v[i]*rv%mo;
	}
	return v;
}

template<class T> vec<T> MultPoly(vec<T> P,vec<T> Q,bool resize=false) {
	if(resize) {
		int maxind=0,pi=0,qi=0,i;
		int s=2;
		FOR(i,P.size()) if(norm(P[i])) pi=i;
		FOR(i,Q.size()) if(norm(Q[i])) qi=i;
		maxind=pi+qi+1;
		while(s*2<maxind) s*=2;
		
		if(s<=16) { //fastpath
			vec<T> R(s*2);
			for(int x=0;x<=pi;x++) for(int y=0;y<=qi;y++) (R[x+y]+=P[x]*Q[y])%=mo;
			return R;
		}
		vec<T> P2(s*2),Q2(s*2);
		FOR(i,pi+1) P2[i]=P[i];
		FOR(i,qi+1) Q2[i]=Q[i];
		swap(P,P2),swap(Q,Q2);
	}
	P=fft(P), Q=fft(Q);
	for(int i=0;i<P.size();i++) P[i]=(ll)P[i]*Q[i]%mo;
	return fft(P,true);
}

template<class T> vec<T> AddPoly(vec<T> P,vec<T> Q) {
	if(P.size()<Q.size()) swap(P,Q);
	for(int i=0;i<Q.size();i++) (P[i]+=Q[i])%=mo;
	return P;
}

vector<vector<ll>> Gs;

pair<vector<ll>,vector<ll>> dfs(int L,int R) {
	if(L+1==R) {
		return {{1LL},Gs[L]};
	}
	int M=(L+R)/2;
	auto p=dfs(L,M);
	auto q=dfs(M,R);
	
	vector<ll> a,b;
	a=AddPoly(p.first,MultPoly(p.second,q.first,1));
	b=MultPoly(p.second,q.second,1);
	return {a,b};
}


void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N;
	hl.init(N);
	
	for(i=1;i<N;i++) {
		cin>>P[i];
		P[i]--;
		E[P[i]].push_back(i);
		hl.add_edge(i,P[i]);
	}
	hl.decomp();
	
	
	
	for(i=N-1;i>=0;i--) {
		queue<vector<ll>> Q;
		Q.push({1});
		FORR(e,E[i]) if(hl.B[e]==e) Q.push(F[e]);
		while(Q.size()>1) {
			auto a=Q.front();
			Q.pop();
			Q.push(MultPoly(a,Q.front(),1));
			Q.pop();
		}
		G[i]=Q.front();
		L[hl.B[i]].push_back(i);
		if(hl.B[i]==i) {
			reverse(ALL(L[i]));
			Gs.clear();
			FORR(a,L[i]) Gs.push_back(G[a]);
			auto p=dfs(0,Gs.size());
			p.first.insert(p.first.begin(),0);
			
			
			F[i]=AddPoly(p.first,p.second);
		}
	}
	
	F[0].resize(1<<20);
	for(i=1;i<=N;i++) cout<<F[0][i]%mo<<endl;
	
	
}

まとめ

この分割統治法、実行時間結構大きそうだけど間に合うんだな。