数学之美 (第二版)

几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔可夫链、矩阵计算,甚至余弦 …… [ 展开全部 ]
  • 作者:吴军
  • 出版社:人民邮电出版社
  • 定价:49.00元
  • ISBN:7115373558
1 搜索引擎的反作弊
  • dzter
    2015-12-08 19:50:25 摘录自165页
    搜索引擎的作弊者所做的事,就如同在手机信号中加入了噪音,使得搜索结果的排名完全乱了。但是,这种人为加入的噪音并不难消除,因为作弊者的方法不可能是随机的(否则就无法提高排名了)。而且,作弊者也不可能是一天换一种方法,即作弊方法是时间相关的。因此,搞搜索引擎排名算法的人,可以在搜集一段时间的作弊信息良将作弊者抓出来,还原有的排名然这个过程需要时间,就如同采集汽车发动机的噪音需要时间一样,在这段时间内,作弊者可能会尝到些甜头。因此,有些人看到的网站经过所谓的优化(其实是作弊),排名在短期内靠前了,以为这种所谓的优化是有效的。但是,不久就会发现排名下降了很多这倒不是搜索引擎以前宽容,现在严厉了,而是说明抓作弊需要一定的时间,以前只是还没有检测到这些作弊的网站
    这条书摘已被收藏0
  • dzter
    2015-12-08 19:50:25 摘录自164页
    做事情的方法有道和术两种境界,搜索反作弊也是如此。在“术”这个层面的方法大多是看到作弊的例子,分析并清除之,这种方法能解决问題,而且不需要太动脑筋,但是工作量较大,难以从个别现象上升到普遍规律。很多崇尚“人工”的搜索引擎公司喜欢这样的做法。而“道”这个层面解决反作弊问题,就要透过具体的作弊例子,找到作弊的动机和本质。进而从本质上解决问题。我们发现,通信模型对于搜索反作弊然适用。在通信中解决噪音干扰问题的基本思路有两条。1.从信息源出赛,加强通信(编码)自身的抗干扰能力。2.从传输来看,过滤掉噪音,还原信息。搜索引擎作弊从本质上看就如同对(搜索)排序的信息加入噪音,因此反作弊的第一条是要增强排序算法的抗噪声能力。其次是像在信号处理中去噪音那样,还原原来真实的排名。学过信息论和有信号处理经验的读者可能知道这么一个事实:如果在发动机很吵的汽车里用手机打电话,对方可能听不清;但是如果知道了汽车发动机的频率,可以加上-个与发动机噪音频率相同、振幅相反的信号,便很容易地消除发动机的噪音,这样,接听人可以完全听不到汽车的噪音。
    这条书摘已被收藏0