POJ 3294 Life Forms(后缀数组+二分答案)
【题目链接】 http://poj.org/problem?id=3294
【题目大意】
求出在至少在一半字符串中出现的最长子串。如果有多个符合的答案,请按照字典序输出。
【题解】
将所有的字符串通过不同的拼接符相连,作一次后缀数组,二分答案的长度,然后在h数组中分组,判断是否可行,按照sa扫描输出长度为L的答案即可。注意在一个子串中重复出现答案串的情况。
【代码】
#include <cstdio> #include <cstring> #include <vector> #include <algorithm> using namespace std; const int N=1000010; int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N]; void suffixarray(int n,int m){ int i,j,k;n++; for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0; for(i=0;i<m;i++)cnt[i]=0; for(i=0;i<n;i++)cnt[rank[i]=s[i]]++; for(i=1;i<m;i++)cnt[i]+=cnt[i-1]; for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i; for(k=1;k<=n;k<<=1){ for(i=0;i<n;i++){ j=sa[i]-k; if(j<0)j+=n; tmp[cnt[rank[j]]++]=j; }sa[tmp[cnt[0]=0]]=j=0; for(i=1;i<n;i++){ if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i; sa[tmp[i]]=j; }memcpy(rank,sa,n*sizeof(int)); memcpy(sa,tmp,n*sizeof(int)); if(j>=n-1)break; }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++) while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1]; }int first=0,len[N],u,K; vector<int> S[N]; bool vis[N]; bool check(int L){ int cur=-1; for(int i=1;i<=u;i++){ if(h[i]<L)S[++cur].clear(); S[cur].push_back(i); } for(int i=0;i<=cur;i++){ if(S[i].size()>K){ memset(vis,0,sizeof(vis)); for(int j=0;j<S[i].size();j++){ int k=S[i][j]; int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1; vis[x]=1; }int count=0; for(int j=0;j<n;j++)if(vis[j])count++; if(count>K)return 1; } }return 0; } void Print(int L){ int cur=-1; for(int i=1;i<=u;i++){ if(h[i]<L)S[++cur].clear(); S[cur].push_back(i); } for(int i=0;i<=cur;i++){ if(S[i].size()>K){ memset(vis,0,sizeof(vis)); for(int j=0;j<S[i].size();j++){ int k=S[i][j]; int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1; vis[x]=true; }int count=0; for(int j=0;j<n;j++)if(vis[j])count++; if(count>K){ for(int j=0;j<L;j++)printf("%c",char(s[sa[S[i][0]]+j])); puts(""); } } } } int main(){ while(~scanf("%d",&n),n){ if(first++)puts(""); int tmp=200; u=0; for(int i=0;i<n;i++){ scanf("%s",str); len[i]=strlen(str); for(int j=0;j<len[i];j++)s[u++]=(int)str[j]; s[u++]=tmp++; }tmp=0; for(int i=0;i<=n;i++){ a[i]=tmp; if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1); }suffixarray(u,310); int l=1,r=1000,L=0,ans=0; K=n/2; while(l<=r){ int mid=(l+r)>>1; if(check(mid))ans=mid,l=mid+1; else r=mid-1; }if(ans==0)puts("?"); else Print(ans); }return 0; }