HDU 5769 Substring(后缀数组)

forever97 posted @ 2016年8月03日 15:37 in 字符串-后缀数组 with tags 后缀数组 , 379 阅读

 

【题目链接】 http://acm.hdu.edu.cn/showproblem.php?pid=5769

 

【题目大意】

    在一个串中求出包含字母的子串个数,只要存在一个字符不相等的子串即可视为不同的子串。

 

【题解】

    因为要求存在字符不相等因此我们可以利用后缀数组统计,后缀数组的h数组可以记录前后两个后缀的最长公共前缀这样子相同的前缀就不会被多次计算,保存每个位置之后出现的最近的要求的字母的位置,从该后缀的包含该字母的位置往后且不在最长公共前缀的范围内的位置都可以作为子串的右端点,统计左端点,计算符合条件的右端点的数量总和就是答案。

 

【代码】

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N=1000005;
int T,Cas=1,n,Rank[N],sa[N],h[N],tmp[N],cnt[N],nxt[N];
char c,s[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)Rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[Rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[Rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[Rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(Rank[tmp[i]]!=Rank[tmp[i-1]]||Rank[tmp[i]+k]!=Rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(Rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=Rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=Rank[sa[j]+1];
}
int main(){
    scanf("%d",&T);
    while(T--){
        scanf(" %s",s); c=s[0];
        scanf(" %s",s); n=strlen(s);
        suffixarray(n,256);
        int pre=-1;
        for(int i=n-1;i>=0;i--){
            if(s[i]==c)pre=i;
            nxt[i]=pre;
        }long long ans=0;
        if(nxt[sa[1]]!=-1)ans=n-nxt[sa[1]];
        for(int i=2;i<=n;i++){
            int t=nxt[sa[i]];
            if(t==-1)continue;
            t=max(t,sa[i]+h[i]);
            ans=ans+n-t;
        }printf("Case #%d: %lld\n",Cas++,ans); 
    }return 0;
}

 

 


登录 *


loading captcha image...
(输入验证码)
or Ctrl+Enter