手机浏览器扫描二维码访问
一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“重生之我真没想当大佬啊(.shg.tw)”!
第二天,苏炎直接来到了教学楼,今天是他和陆渊亭约好的日子。
来到陆渊亭的办公室,此刻里面正有三名男子正在办公室里和陆渊亭有说有笑。
看到苏炎的到来,陆渊亭也是起身做了介绍,这三人是计算机院系那边的负责人,这次过来主要就是看看苏炎到底有什么东西,敢夸下海口去和国外的搜索引擎进行竞争。
苏炎简单的打了个招呼后,一行人便在陆渊亭的带领下来到了一处会议室坐着,接下来就是苏炎展示他搜索引擎核心技术的时候了。
搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,在零一年的这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。
但是说白了,所有的搜索引擎核心点其实就是一个东西,算法。
因为每一个东西都是围绕着算法进行的。
“各位都是计算机方面的专家了,对于搜索引擎可能都有自己的看法,所以在一会的讲解中我希望可以按照我的节奏来,要是有异议的话可以提出来,我会进行详细的解答。”
说完苏炎便开始准备进入正题。
“在展示我的算法核心之前,我们先来看看当下的三大主流算法,百度的超链分析,谷歌的pagerank算法以及ibm的hits算法。
而在着三种算法里几乎所有人都觉得百度的超链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,百度的超链分析在某种程度上可以算得上是奠定了搜索引擎的发展基础。
通过抓去网页信息,然后用算法机制对这些网页进行排序当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。
当前三大主流算法,其实不管是哪一家的算法,算法基础其实都是一样的。都是按照上面的步骤来进行的。
甚至有一种说法,谷歌的算法其实是剽窃了百度的超链算法,对此我们不去做过多的研究。那么同样是搜索引擎为什么百度在国外市场竞争不过谷歌呢?
关键在于百度当前的过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。
这种基础排序方式导致有些正确的网页反而被一些劣质网页所覆盖,最终劣币驱逐良币,使用户很难找到自己需要的东西。
而谷歌的pagerank就多了两件很重要的事情,第一件事情是,把a页面到b页面的链接解释为a给b的投票行为,谷歌在这里会同时考评a和b的等级从而形成新的等级。
也就是每一个页面都有pr值,同时你的pr值会成为其他页面pr值的参考。
然后不断的重复计算每个页面的pr。假设给每个页面一个随机pr值,那么经过不断的重复计算,这些页面的pr值会趋向于稳定,也就是收敛的状态。
这样也就意味着用户用谷歌的搜索引擎可以比百度更为有效的获取到自己所需要的信息。至于我说为什么不将百度放在眼里,完全是因为百度在前不久推出了竞价业务。”
一年后神魔复苏全球沦陷 顾清瑶墨北寒 纸婚,坚不可摧 洪荒之永生圣王 顾总你前妻又闹绯闻了 凰后有妖气 颜苒温容安 我是丧尸NPC 顶级强者一杯八宝茶 谢毛毛钟安龄 南宫玥玄华 重生之苏念 849324 第一章妖孽 林晚白顾景知 顾兮陆寒川顾音 程星晚霍南擎 快穿之男神又苏又甜 老婆大人你好乖 江颜沈南箫
...
别人都是玩游戏,我却是被游戏玩难道是俺人品太好,所以蜀山服务器妒嫉了?不报此仇,俺下辈子就投胎做男人话说俺在游戏里真的成了男人-_-—受蛤蟆大大的蜀山影响写了这本书,希望不会被蛤蟆大大鄙视蜀山笑书友群46439206...
为了父亲三十万的救命钱而替小舅子顶包三年,出狱之后却发现美丽又冷艳的老婆竟然这是一个上门女婿的崛起之途!...
为医治母亲,陆羽当了五年上门女婿,忍气吞声任劳任怨只换来丈母娘百般侮辱妻子冷漠背叛!母亲拖欠药费被抓,陆羽救母身受重伤,濒临死境中,获得先祖医玄传承。自此,一念掌生死,逍遥人世间!...
老妈喊我回家收租了穿越过来就被合伙人扫地出门,到达了人生低谷。回到了家中,发现家里有三十三栋出租楼,外加一栋新建设的写字楼。摇身一变成了包租公,还出去做生意,脑子被驴踢了吧?每天收收租,过上咸鱼生活,收租它不香吗?...
离婚后,夏雨洋事业有成,身旁还有一个对她照顾有加,连儿子也很喜欢的男人。说一句她是人生赢家也不为过。但是这世上还有一种叫做前夫的凶残生物,不仅毁她青春,占她身心,离婚后还要对她纠缠不清!最后还要强硬宣布儿子是我的,你也是我的,永远逃不掉。夏雨洋败下阵来好好好,都是你的,但你是我的!...