kmjp's blog

競技プログラミング参加記です

Google Code Jam 2015 Round 2 : C. Bilingual

こういうグラフをさらっと作りたいなぁ。
https://code.google.com/codejam/contest/8234486/dashboard#s=p2

問題

N個の文章が与えられる。
各文章はいくつかの単語の並びからなる。

1つ目の文章は英語であり、2つ目の文章はフランス語である。
3つ目以降の文章は英語かフランス語かわからない。

「この単語は英語にもフランス語にもある」という単語数の最小値を求めよ。

解法

最小カットからフロー問題に落とせるのだろうが、自力で正答にたどり着けなかったので他の解答を参考に解いた。

単語の種類がW個あるとすると、各文章ごとに1個、単語ごとに2個の計(N+2W)頂点からなるグラフを考える。
単語に相当する2頂点は、片方を英語側、もう片方をフランス語側とする。

ここで以下のようにグラフの辺を張る。

  • 各単語2頂点対について、英語側からフランス語側にコスト1の辺を張る。
  • 各文章毎に、そこで使われる各単語について:
    • 文章に相当する頂点から単語の英語側の頂点に容量無限の辺を張る
    • 単語のフランス語側の頂点から文章に相当する頂点に容量無限の辺を張る

ここで1つ目の文章の頂点から2つ目の文章の頂点に至る最大フロー=最小カットがこの問題の解となる。

このグラフで無限容量でない辺は各単語の頂点対間だけで、ここに1フローが流れるということは、この単語が英語とフランス語両方に存在することに相当する。
よってその最小カットが求める値になる。

int N;
vector<int> P[1010];
map<string,int> M;
int mat[4040][4040];
int type[4040];

template<class V> class MaxFlow_dinic {
public:
	struct edge { int to,reve;V cap;};
	static const int MV = 8100;
	vector<edge> E[MV];
	int itr[MV],lev[MV];
	void add_edge(int x,int y,V cap,bool undir=false) {
		E[x].push_back((edge){y,(int)E[y].size(),cap});
		E[y].push_back((edge){x,(int)E[x].size()-1,undir?cap:0});
	}
	void bfs(int cur) {
		MINUS(lev);
		queue<int> q;
		lev[cur]=0;
		q.push(cur);
		while(q.size()) {
			int v=q.front(); q.pop();
			ITR(e,E[v]) if(e->cap>0 && lev[e->to]<0) lev[e->to]=lev[v]+1, q.push(e->to);
		}
	}
	V dfs(int from,int to,V cf) {
		if(from==to) return cf;
		for(;itr[from]<E[from].size();itr[from]++) {
			edge* e=&E[from][itr[from]];
			if(e->cap>0 && lev[from]<lev[e->to]) {
				V f=dfs(e->to,to,min(cf,e->cap));
				if(f>0) {
					e->cap-=f;
					E[e->to][e->reve].cap += f;
					return f;
				}
			}
		}
		return 0;
	}
	V maxflow(int from, int to) {
		V fl=0,tf;
		while(1) {
			bfs(from);
			if(lev[to]<0) return fl;
			ZERO(itr);
			while((tf=dfs(from,to,numeric_limits<V>::max()))>0) fl+=tf;
		}
	}
};

vector<string> split(const string str, char delim){
	vector<string> res;
	size_t current = 0, found;
	while((found = str.find_first_of(delim, current)) != string::npos){
		res.push_back(string(str, current, found - current));
		current = found + 1;
	}
	res.push_back(string(str, current, str.size() - current));
	return res;
}

void solve(int _loop) {
	int f,i,j,k,l,x,y;
	string s;
	
	cin>>N;
	getline(cin,s);
	M.clear();
	ZERO(mat);
	FOR(i,4020) mat[i][i]=1;
	
	FOR(i,N) {
		getline(cin,s);
		vector<string> VS=split(s,' ');
		
		P[i].clear();
		FORR(r,VS) {
			if(M.count(r)==0) M[r]=M.size()-1;
			P[i].push_back(M[r]);
		}
	}
	
	int W=M.size();
	MaxFlow_dinic<int> mf;
	
	FOR(i,W) mf.add_edge(N+i,N+W+i,1);
	FOR(i,N) FORR(r,P[i]) mf.add_edge(i,N+r,101000), mf.add_edge(N+W+r,i,101000);
	
	_P("Case #%d: %d\n",_loop,mf.maxflow(0,1));
}

まとめ

同じ単語間にコスト1の辺を張るのには思いが至らなかった。