首页 > 剑指offer > 编程之美–寻找发帖水王
2014
07-08

编程之美–寻找发帖水王

问题描述:

Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?

书中第一种方法是先对ID进行排序,再遍历排序后的序列,统计每个ID的次数,从而寻找到最大次数的ID。不过还是第二种方法好些。

思路:

采用题目已知的水王发帖数超过一半这个特殊情况处理本题。考虑如下特殊情况:N个帖子,水王的帖子都在最前面,也就是。

1  2  3   4   5   …  N/2, N/2+1,…  N 。假如在N/2+1之前都是水王的帖子。

如果从一开始假定第一个 ID就为水王并记录,然后对应的次数一直加到N/2+1,往后都不是水王的帖子了,遍历时把水王的帖子数逐个减下去,知道最后,水王的帖子依然大于0。

这是特殊情况,实际情况,水王的帖子应该是分布在所有帖子其中的。仔细分析后发现,按照上述做法,到最后帖子数大于0的肯定是水王的帖子。

总结下大致思想就是:假设每个ID都有可能是水王,那么在遍历时这个水王就要遇到一种挑战,可能自己的帖子数是会增加的,也可能是遇到挑战的,帖子数要减少的。这样遍历下来,只有水王的帖子增加的减去遇到挑战的帖子数会是大于0的。其他任何帖子假设为水王时都是禁不起挑战的。

步骤:

1. 可以假设帖子的第一个ID是次数最大的,用candidate记录,次数用nTimes记录。

2. 遍历下一个ID,如果跟candidate一样,nTimes++,否则,遇到一个挑战,则nTimes–,如果nTimes == 0,下一步就要重复第一步了。

3.遍历结束,nTimes>0的那个candidate就是水王ID,他是获胜者。

Type Find(Type* ID, int N)
{
    Type candidate;
    int nTimes, i;
    for(i = nTimes = 0; i < N; i++)
    {
        if(nTimes == 0)
        {
             candidate = ID[i], nTimes = 1;
        }
        else
        {
            if(candidate == ID[i])
                nTimes++;
            else
                nTimes--;

        }

    }
    return candidate;
}

此题采用了一种策略,我不知道该称为什么,有点像“对战”,就是假如你很牛,你就要经得起其他人的挑战,如果不行,就要退出,换下一个,直到最后的胜者。

扩展问题:

随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?

这个扩展问题还是上题所述的”对手”问题,不过这次是三个ID同时应战,但是这三个ID之间并不对战。所以问题很快得到解决。

void Find(Type* ID, int N,Type candidate[3])
{
    Type ID_NULL;//定义一个不存在的ID
    int nTimes[3], i;
    nTimes[0]=nTimes[1]=nTimes[2]=0;
    candidate[0]=candidate[1]=candidate[2]=ID_NULL;
    for(i = 0; i < N; i++)
    {
        if(ID[i]==candidate[0])
        {
             nTimes[0]++;
        }
        else if(ID[i]==candidate[1])
        {
             nTimes[1]++;
        }
        else if(ID[i]==candidate[2])
        {
             nTimes[2]++;
        }
        else if(nTimes[0]==0)
        {
             nTimes[0]=1;
             candidate[0]=ID[i];
        }
        else if(nTimes[1]==0)
        {
             nTimes[1]=1;
             candidate[1]=ID[i];
        }
        else if(nTimes[2]==0)
        {
             nTimes[2]=1;
             candidate[2]=ID[i];
        }
        else
        {
             nTimes[0]--;
             nTimes[1]--;
             nTimes[2]--;
         }
    }
    return;}

实在是应了那句话,万变不离其宗。万事万物都是有普遍性和特殊性的,特殊性往往是浮于表面的,是动的一面,而普遍性才可能是认识事物的根本,是静的一面。以不变应万变,以静制动,事未行,已然成功大半了。

原文:http://blog.csdn.net/rein07/article/details/6741661


  1. int half(int *array,int len,int key)
    {
    int l=0,r=len;
    while(l<r)
    {
    int m=(l+r)>>1;
    if(key>array )l=m+1;
    else if(key<array )r=m;
    else return m;
    }
    return -1;
    }
    这种就能避免一些Bug
    l,m,r
    左边是l,m;右边就是m+1,r;

  2. 第二个方法挺不错。NewHead代表新的头节点,通过递归找到最后一个节点之后,就把这个节点赋给NewHead,然后一直返回返回,中途这个值是没有变化的,一边返回一边把相应的指针方向颠倒,最后结束时返回新的头节点到主函数。