首页 > ACM题库 > HDU-杭电 > HDU 1277 全文检索-BFS-[解题报告] C++
2013
12-04

HDU 1277 全文检索-BFS-[解题报告] C++

全文检索

问题描述 :

我们大家经常用google检索信息,但是检索信息的程序是很困难编写的;现在请你编写一个简单的全文检索程序。
问题的描述是这样的:给定一个信息流文件,信息完全有数字组成,数字个数不超过60000个,但也不少于60个;再给定一个关键字集合,其中关键字个数不超过10000个,每个关键字的信息数字不超过60个,但也不少于5个;两个不同的关键字的前4个数字是不相同的;由于流文件太长,已经把它分成多行;请你编写一个程序检索出有那些关键字在文件中出现过。

输入:

第一行是两个整数M,N;M表示数字信息的行数,N表示关键字的个数;接着是M行信息数字,然后是一个空行;再接着是N行关键字;每个关键字的形式是:[Key No. 1] 84336606737854833158。

输出:

输出只有一行,如果检索到有关键字出现,则依次输出,但不能重复,中间有空格,形式如:Found key: [Key No. 9] [Key No. 5];如果没找到,则输出形如:No key can be found !。

样例输入:

20 10
646371829920732613433350295911348731863560763634906583816269
637943246892596447991938395877747771811648872332524287543417
420073458038799863383943942530626367011418831418830378814827
679789991249141417051280978492595526784382732523080941390128
848936060512743730770176538411912533308591624872304820548423
057714962038959390276719431970894771269272915078424294911604
285668850536322870175463184619212279227080486085232196545993
274120348544992476883699966392847818898765000210113407285843
826588950728649155284642040381621412034311030525211673826615
398392584951483398200573382259746978916038978673319211750951
759887080899375947416778162964542298155439321112519055818097
642777682095251801728347934613082147096788006630252328830397
651057159088107635467760822355648170303701893489665828841446
069075452303785944262412169703756833446978261465128188378490
310770144518810438159567647733036073099159346768788307780542
503526691711872185060586699672220882332373316019934540754940
773329948050821544112511169610221737386427076709247489217919
035158663949436676762790541915664544880091332011868983231199
331629190771638894322709719381139120258155869538381417179544
000361739177065479939154438487026200359760114591903421347697

[Key No. 1] 934134543994403697353070375063
[Key No. 2] 261985859328131064098820791211
[Key No. 3] 306654944587896551585198958148
[Key No. 4] 338705582224622197932744664740
[Key No. 5] 619212279227080486085232196545
[Key No. 6] 333721611669515948347341113196
[Key No. 7] 558413268297940936497001402385
[Key No. 8] 212078302886403292548019629313
[Key No. 9] 877747771811648872332524287543
[Key No. 10] 488616113330539801137218227609

样例输出:

Found key: [Key No. 9] [Key No. 5]

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1277

题目大意及思路:和前一个题相同,只是这个题要求输出id。

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<string>
#include<queue>
#include<algorithm>
#include<vector>
#include<stack>
#include<list>
#include<iostream>
#include<map>
using namespace std;
#define inf 0x3f3f3f3f
#define Max 11000
char s[60010],str[66];
int ans[1010],rec;
char st[60010];
int max(int a,int b)
{
	return a>b?a:b;
}
int min(int a,int b)
{
	return a<b?a:b;
}
int q[Max*60],cnt;
struct node
{
    int id,fail;
    int next[10];
    void init()
    {
        id=fail=0;
        memset(next,0,sizeof(next));
    }
}tri[Max*60];
void insert(char *s,int num)
{
    int i,p,id;
    p=0;
    for(i=0;s[i];i++)
    {
        id=s[i]-'0';
        if(!tri[p].next[id])
        {
            tri[++cnt].init();
            tri[p].next[id]=cnt;
        }
        p=tri[p].next[id];
    }
    tri[p].id=num;
}
void bfs()
{
    int i,id,suf,p,head,tail;
    p=0;head=tail=0;
    for(i=0;i<10;i++)
    {
        if(tri[0].next[i])
        {
            q[tail++]=tri[0].next[i];
            tri[q[tail-1]].fail=0;
        }
        else
            tri[0].next[i]=0;
    }
    while(head<tail)
    {
        //printf("akkkk");
        p=q[head++];suf=tri[p].fail;
        for(i=0;i<10;i++)
        {
            if(tri[p].next[i])
            {
                q[tail++]=tri[p].next[i];
                tri[q[tail-1]].fail=tri[suf].next[i];
            }
            else
            {
                tri[p].next[i]=tri[suf].next[i];
            }
        }
    }
}
int query(char *s)
{
    int i,id,p,tmp;
    p=0;
    for(i=0;s[i];i++)
    {
        id=s[i]-'0';
        p=tri[p].next[id];
        tmp=p;
        if(tmp&&tri[tmp].id!=-1)
        {
            if(tri[tmp].id)
            ans[rec++]=tri[tmp].id;
            tri[tmp].id=-1;
            tmp=tri[tmp].fail;
        }
    }
    return rec;
}
int main()
{
    int n,m,i;
    while(scanf("%d%d",&m,&n)!=EOF)
    {
        s[0]=0;
        tri[0].init();
        cnt=0;
        rec=0;
        while(m--)
        {
            scanf("%s",st);
            strcat(s,st);
        }
      //  printf("%s\n",s);
        for(i=1;i<=n;i++)
        {
            scanf("%s%s%s%s",str,str,str,str);
            insert(str,i);
        }
        bfs();
       if(query(s)==0)
            puts("No key can be found !");
        else
        {
            printf("Found key:");
            for(i=0;i<rec;i++)
            {
                  printf(" [Key No. %d]",ans[i]);
            }
            puts("");
        }

    }
}

 


,
  1. 在方法1里面:

    //遍历所有的边,计算入度
    for(int i=0; i<V; i++)
    {
    degree = 0;
    for (j = adj .begin(); j != adj .end(); ++j)
    {
    degree[*j]++;
    }
    }

    为什么每遍历一条链表,要首先将每个链表头的顶点的入度置为0呢?
    比如顶点5,若在顶点1、2、3、4的链表中出现过顶点5,那么要增加顶点5的入度,但是在遍历顶点5的链表时,又将顶点5的入度置为0了,那之前的从顶点1234到顶点5的边不是都没了吗?

  2. 第二个方法挺不错。NewHead代表新的头节点,通过递归找到最后一个节点之后,就把这个节点赋给NewHead,然后一直返回返回,中途这个值是没有变化的,一边返回一边把相应的指针方向颠倒,最后结束时返回新的头节点到主函数。