kmjp's blog

競技プログラミング参加記です

AtCoder ABC #280 (デンソークリエイトプログラミングコンテスト2022 Winter) : Ex - Substring Sort

前半はともかく後半の考察がしんどかった。
https://atcoder.jp/contests/abc280/tasks/abc280_h

問題

N個の文字列S[i]が与えられる。
全文字列の、全部分文字列を考え、それらを辞書順にソートしたとする。

以下のクエリに答えよ。

  • 正整数Xが与えられる。上記ソート順において、X番目にくる部分文字列は何か。

解法

まず各文字列を連結した文字列のSuffixArrayを求め、作成される部分文字列を辞書順ソートしよう。

SuffixArrayにおいてi番目にくるSuffixをP、(i-1)番目にくるSuffixをQとする。
この時、Pに対応して解に計上される文字列の個数は、P[x]!=Q[x]であるxにおいて、LCP(i,i+1,i+2,...,j)≧xとなる最大のjがわかったとき、Pの先頭(x+1)文字と同等の文字列が(j-i+1)個解に計上される。

上記処理を、iの大きい順に走査しよう。
LCP(i,i+1,i+2,...,j)≧xとなるjは、xが大きくなるほど小さくなるので、その変化点だけ覚えておけば高速に処理できる。

int N;
ll M;
string S[201010],G;
int TL[201010];
ll LS[201010];
pair<int,int> re[201010];

ll X[202020];
int ret[202020][3];
int nex;
ll did;

template<typename ST=string>
struct SuffixArray {
	int N; vector<int> rank,lcp,sa,rsa; ST S;
 
	void build(ST S){
		this->S=S;
		int i,h=0; vector<int> tmp;
		N=S.size(); rank.resize(N+1); sa.resize(N+1); tmp.resize(N+1);
		FOR(i,N+1) sa[i]=i, rank[i]=i==N?-1:S[i];
		
		for(int k=1; k<=N; k<<=1) {
			auto pred2 = [k,this](int& a,int &b)->bool{ return (((a+k<=N)?rank[a+k]:-1)<((b+k<=N)?rank[b+k]:-1));};
			auto pred = [pred2,k,this](int& a,int &b)->bool{ return (rank[a]!=rank[b])?(rank[a]<rank[b]):pred2(a,b);};
			int x=0;
			if(k!=1) for(i=1;i<N+1;i++) if(rank[sa[i]]!=rank[sa[x]]) sort(sa.begin()+x,sa.begin()+i,pred2), x=i;
			sort(sa.begin()+x,sa.end(),pred);
			FOR(i,N+1) tmp[sa[i]]=(i==0)?0:tmp[sa[i-1]]+pred(sa[i-1],sa[i]);
			swap(rank,tmp);
		}
		lcp.resize(N+1); rsa.resize(N+1);
		FOR(i,N+1) rsa[sa[i]]=i;
		FOR(i,N) {
			int j=sa[rsa[i]-1];
			for(h=max(h-1,0);i+h<N && j+h<N; h++) if(S[j+h]!=S[i+h]) break;
			lcp[rsa[i]-1]=h;
		}
	}
};
SuffixArray sa;


void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N;
	ll sum=0;
	FOR(i,N) {
		cin>>S[i];
		FOR(j,S[i].size()) {
			TL[G.size()+j]=S[i].size()-j;
			re[G.size()+j]={i+1,j+1};
			sum+=j+1;
		}
		G+=S[i]+"$";
	}
	
	sa.build(G);
	int Q;
	cin>>Q;
	FOR(i,Q) cin>>X[i];
	int cur=Q-1;
	
	vector<pair<int,int>> Rs={{0,0}};
	for(i=G.size();i>=0;i--) {
		while(Rs.back().first>sa.lcp[i]) {
			x=Rs.back().first;
			y=Rs.back().second;
			Rs.pop_back();
			k=max(Rs.back().first,sa.lcp[i]);
			sum-=1LL*(x-k)*(y-i);
			while(cur>=0&&X[cur]>sum) {
				ret[cur][0]=re[sa.sa[i+1]].first;
				ret[cur][1]=re[sa.sa[i+1]].second;
				ret[cur][2]=re[sa.sa[i+1]].second+k+(X[cur]-sum-1)/(y-i);
				cur--;
			}
			if(Rs.back().first<sa.lcp[i]) {
				Rs.push_back({sa.lcp[i],y});
			}
		}
		if(Rs.back().first<TL[sa.sa[i]]) Rs.push_back({TL[sa.sa[i]],i});
	}
	FOR(i,Q) cout<<ret[i][0]<<" "<<ret[i][1]<<" "<<ret[i][2]<<endl;
}

まとめ

SuffixArray作った後がうまく処理できなかったな。