kmjp's blog

競技プログラミング参加記です

Codeforces #422 Div2 E. Liar

まんまと引っかかってしまった。
http://codeforces.com/contest/822/problem/E

問題

文字列S,Tが与えられる。
Sのうち互いに交差しない部分列を最大X個選び、元の並び順を保ったまま連結してTを作ることができるか。

解法

まずは想定と思われる誤解法。
f(i,n,flag) := S[0..(i-1)]文字からn個の部分列を選び、かつ最後の部分列がまだ継続中かどうかの真偽値をflagで管理した状態で、Tのprefixと最大何文字と一致するかf(i,n,flag)
S[i]==T[f(i,n,flag)]なら、f(i+1,n+flag,true) := f(i,n,flag)+1で更新していく。
上記解法はO((|S|+|T|)X)程度で解けて速いが失敗する。
後ろにもっと良い文字列があっても、先に効率の悪い(Tと一致する文字列長の短い)文字列を取ってしまうためである。

逆に、できるだけ共通部分を長くとれるような部分列を優先的に取る解法を考えよう。
上のfと似ているが、以下を考えよう。
g(i,n) := S[0..(i-1)]文字からn個の部分列を選んだとき、Tのprefixと最大何文字と一致するか

S[i...(i+k)]=T[g(i,n)...(g(i,n)+k)]となる最大のkを求めよう。
これはローリングハッシュ値の二分探索でも、SuffixArrayからLCPの最小値をSegTreeで管理する方法でもlog(|S|+|T|)程度で求められる。
その際、g(i+k,n+1) = g(i,n)+kとして更新していくとよい。

struct RollingHash {
	static const ll mo0=1000000007,mo1=1000000009;
	static ll mul0,mul1;
	static const ll add0=1000010007, add1=1003333331;
	static vector<ll> pmo[2];
	string s; int l; vector<ll> hash_[2];
	void init(string s) {
		this->s=s; l=s.size(); int i,j;
		hash_[0]=hash_[1]=vector<ll>(1,0);
		if(!mul0) mul0=10009+(((ll)&mul0)>>5)%259,mul1=10007+(((ll)&mul1)>>5)%257;
		if(pmo[0].empty()) pmo[0].push_back(1),pmo[1].push_back(1);
		FOR(i,l) hash_[0].push_back((hash_[0].back()*mul0+add0+s[i])%mo0);
		FOR(i,l) hash_[1].push_back((hash_[1].back()*mul1+add1+s[i])%mo1);
	}
	ll hash(int l,int r) { // s[l..r]
		if(l>r) return 0;
		while(pmo[0].size()<r+2)
			pmo[0].push_back(pmo[0].back()*mul0%mo0), pmo[1].push_back(pmo[1].back()*mul1%mo1);
		return (((hash_[0][r+1]+(mo0-hash_[0][l]*pmo[0][r+1-l]%mo0))%mo0)<<32) | 
			             ((hash_[1][r+1]+(mo1-hash_[1][l]*pmo[1][r+1-l]%mo1))%mo1);
	}
	ll hash(string s) { init(s); return hash(0,s.size()-1); }
};
vector<ll> RollingHash::pmo[2]; ll RollingHash::mul0,RollingHash::mul1;

int maxmatch(RollingHash& S,int sp,RollingHash& T,int tp) {
	int L=0,R=min(S.s.size()-sp,T.s.size()-tp)+1;
	while(L+1<R) {
		int M=(L+R)/2;
		if(S.hash(sp,sp+M-1)==T.hash(tp,tp+M-1)) L=M;
		else R=M;
	}
	return L;
}

int N,M,X;
string S,T;
RollingHash RS,RT;
int dp[101010][32];


void solve() {
	int i,j,k,l,r,x,y; string s;
	
	cin>>N>>S>>M>>T;
	RS.init(S);
	RT.init(T);
	FOR(i,N+1) FOR(j,31) dp[i][j]=-202020;
	
	dp[0][0]=0;
	FOR(i,N) {
		FOR(j,31) {
			if(i) dp[i][j]=max(dp[i][j],dp[i-1][j]);
			if(dp[i][j]>=0) {
				int ml=maxmatch(RS,i,RT,dp[i][j]);
				if(ml>0) dp[i+ml][j+1]=max(dp[i+ml][j+1],dp[i][j]+ml);
			}
		}
	}
	
	cin>>X;
	for(i=1;i<=X;i++) if(dp[N][i]==M || dp[N-1][i]==M) return _P("YES\n");
	_P("NO\n");
	
}

まとめ

まんまと想定誤解法にはまってしまった。