POJ 3294 Life Forms(后缀数组+二分答案)

forever97 posted @ 2016年8月13日 23:38 in 字符串-后缀数组 with tags 后缀数组 二分答案 , 779 阅读

 

【题目链接】 http://poj.org/problem?id=3294

 

【题目大意】

    求出在至少在一半字符串中出现的最长子串。如果有多个符合的答案,请按照字典序输出。

 

【题解】

    将所有的字符串通过不同的拼接符相连,作一次后缀数组,二分答案的长度,然后在h数组中分组,判断是否可行,按照sa扫描输出长度为L的答案即可。注意在一个子串中重复出现答案串的情况。

 

【代码】

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using namespace std;
const int N=1000010;
int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}int first=0,len[N],u,K;
vector<int> S[N];
bool vis[N];
bool check(int L){
    int cur=-1;
    for(int i=1;i<=u;i++){
        if(h[i]<L)S[++cur].clear();
        S[cur].push_back(i);
    }
    for(int i=0;i<=cur;i++){
        if(S[i].size()>K){
            memset(vis,0,sizeof(vis));
            for(int j=0;j<S[i].size();j++){
                int k=S[i][j];
                int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1;
                vis[x]=1;
            }int count=0;
            for(int j=0;j<n;j++)if(vis[j])count++;
            if(count>K)return 1;
        }
    }return 0;
}
void Print(int L){
    int cur=-1;
    for(int i=1;i<=u;i++){
        if(h[i]<L)S[++cur].clear();
        S[cur].push_back(i);
    }
    for(int i=0;i<=cur;i++){
        if(S[i].size()>K){
            memset(vis,0,sizeof(vis));
            for(int j=0;j<S[i].size();j++){
                int k=S[i][j];
                int x=upper_bound(a,a+n+1,sa[S[i][j]])-a-1;
                vis[x]=true;
            }int count=0;
            for(int j=0;j<n;j++)if(vis[j])count++;
            if(count>K){
                for(int j=0;j<L;j++)printf("%c",char(s[sa[S[i][0]]+j]));
                puts("");
            }
        }
    }
}
int main(){
    while(~scanf("%d",&n),n){
        if(first++)puts("");
        int tmp=200; u=0;
		    for(int i=0;i<n;i++){
			      scanf("%s",str);
			      len[i]=strlen(str);
        	  for(int j=0;j<len[i];j++)s[u++]=(int)str[j];
        	  s[u++]=tmp++;
        }tmp=0; 
        for(int i=0;i<=n;i++){
            a[i]=tmp;
            if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1);
        }suffixarray(u,310);
        int l=1,r=1000,L=0,ans=0;
        K=n/2;
        while(l<=r){
            int mid=(l+r)>>1;
            if(check(mid))ans=mid,l=mid+1;
            else r=mid-1;
        }if(ans==0)puts("?");
        else Print(ans);
    }return 0;
}

登录 *


loading captcha image...
(输入验证码)
or Ctrl+Enter