首页 > ACM题库 > HDU-杭电 > HDU 2896-病毒侵袭[解题报告]HOJ
2014
02-17

HDU 2896-病毒侵袭[解题报告]HOJ

病毒侵袭

问题描述 :

当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋――我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~

输入:

第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20―200之间。
每个病毒都有一个编号,依此为1―N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000―10000之间。
每个网站都有一个编号,依此为1―M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。

输出:

第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20―200之间。
每个病毒都有一个编号,依此为1―N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000―10000之间。
每个网站都有一个编号,依此为1―M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。

样例输入:

3
aaa
bbb
ccc
2
aaabbbccc
bbaacc

样例输出:

web 1: 1 2 3
total: 1

#include<stdio.h>
#include<string.h>
#include<malloc.h>
#include<queue>
using namespace std;
int ans[1111][5];
char str[1111111];
#define cc 130
int id,vis[1111],a[1111];
struct node
{
	int count;
	struct node *next[cc];
	struct node *fail;
	void init()
	{
		int i;
		for(i=0;i<cc;i++)
			next[i]=NULL;
		count=0;
		fail=NULL;
	}
}*root;
void insert()
{
	int len,k;
	node *p=root;
	len=strlen(str);
	for(k=0;k<len;k++)
	{
		int pos=str[k]-31;
		if(p->next[pos]==NULL)
		{
			p->next[pos]=new node;
			p->next[pos]->init();
			p=p->next[pos];
		}
		else p=p->next[pos];
	}
	p->count=id;
}

void getfail()
{
	int i;
	node *p,*temp,*son;
	queue<struct node *>que;
	que.push(root);
	p=root;
	while(!que.empty())
	{
		temp=que.front();
		que.pop();
		for(i=0;i<cc;i++)
		{
			son=temp->next[i];
			if(son!=NULL)
			{
				if(temp==root)
				{
					son->fail=root;
				}
				else
				{
					p=temp->fail;
					while(p)
					{
						if(p->next[i]!=NULL)
						{
							son->fail=p->next[i];///
							break;
						}
						//else ע������û��else
							p=p->fail;
					}
					if(p==NULL) son->fail=root;
				}
				que.push(son);
			}	
		}
		 }
}

void query()
{
	int len,i,cnt=0,pos;
	len=strlen(str);
	node *p,*temp;
	p=root;
	for(i=0;i<len;i++)
	{
		pos=str[i]-31;
		while(!p->next[pos]&&p!=root) p=p->fail;
		p=p->next[pos];
		if(!p) p=root;
		temp=p;
		while(temp!=root)//ֻҪ�޸������T��
		{
			if(temp->count>=1&&!vis[temp->count])
			{
				ans[id][cnt++]=temp->count;
				vis[temp->count]=1;
			}
			temp=temp->fail;
		}
	}
}
int main()
{
	int n,m,i,j;
	while(scanf("%d",&n)!=EOF)
	{
		root= new node;
		root->fail=NULL;
		root->init();
		getchar();
		for(i=1;i<=n;i++)
		{
			gets(str);
			id=i;
			insert();
		}
		getfail();
		scanf("%d",&m);
		getchar();
		memset(ans,0,sizeof(ans));
		for(i=1;i<=m;i++)
		{
			memset(vis,0,sizeof(vis));
			id=i;
			gets(str);
			query();
		}
		int cnt=0;
		for(i=1;i<=m;i++)
		{
			if(ans[i][0]>=1)
			{
				cnt++;
				printf("web %d:",i);
				int a[1111];
				memset(a,0,sizeof(a));
				for(j=0;ans[i][j]>=1;j++)
				{
					a[ans[i][j]]=1;
				}
				int k;
				for(k=1;k<1100;k++)
				{
					if(a[k])
					 printf(" %d",k);
				}
				printf("\n");
			}
		}
		printf("total: %d\n",cnt);
	}
	return 0;
	
}

  1. if(j){
    int ans=a ;
    for(int x=j-1;x>=0;x–){
    if(!a ) break;
    ans=min(ans,a );
    sum+=ans;
    }
    }
    求解释,,dp的思路是什么呢?

  2. 因为是要把从字符串s的start位到当前位在hash中重置,修改提交后能accept,但是不修改居然也能accept

  3. “再把所有不和该节点相邻的节点着相同的颜色”,程序中没有进行不和该节点相邻的其他节点是否相邻进行判断。再说求出来的也不一样是颜色数最少的

  4. 给你一组数据吧:29 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 1000。此时的数据量还是很小的,耗时却不短。这种方法确实可以,当然或许还有其他的优化方案,但是优化只能针对某些数据,不太可能在所有情况下都能在可接受的时间内求解出答案。

  5. 算法是程序的灵魂,算法分简单和复杂,如果不搞大数据类,程序员了解一下简单点的算法也是可以的,但是会算法的一定要会编程才行,程序员不一定要会算法,利于自己项目需要的可以简单了解。