看书中文网

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第1页)

“教授,你不是做语言翻译的,语言是规则的游戏,概率这太不靠谱了。”

保罗·加尔文还想再挣扎一下。

当然他确实也不信翻译和统计学能扯上什么关系。

词语之间一一对应。

英文单词和俄语单词一一对应,直接直译,扩充语料库。

在当时的思维里,这才是正道。

也就是所谓穷举法。

把所有的词语做好一一对应之后,自动翻译也就实现了。

统计学,概率游戏,不谈如果林燃是对的,他们的无能会暴露无遗,光是林燃提到的改进原理从直觉上来说就是错误的。

简单来说,反直觉。

就像在GPT大模型出来之前,大家都觉得算法最重要。

GPT出来之后,大家开始都一窝蜂力大飞砖。

等到deepseek的时候,好像算法有点用。

哪怕是顶级的研究人员,也会有盲从的问题,会有迷茫、找不到方向、走不出来的情况。

在这个计算机的混沌年代,会这样再正常不过了。

“精确?精确意味着出错,现在的计算机远远达不到精确这一点。

你们难道不清楚,你们在54年之所以演示出了良好的效果,是因为那些俄语句子是你们精挑细选出来的。

实际自然语言的复杂性要远超你们预期。

你们只做了语料库的扩展,规则覆盖都没有做,上下文依赖处理也没有。

你们能比我更懂机器翻译?”

林燃怒吼道:“你们做了九年都没有进展,现在立刻马上按照我说的去做!”

林燃的地位、实力和权力摆在这,他们根本没有拒绝的选择。

沃森会信林燃就不说了,毕竟深蓝项目才结束,国防部的麦克纳马拉那更是林燃说什么就是什么。

你们这帮搞计算机的能比数学大师更懂计算机?

林燃在博弈论和统计学上展现出来的风采,麦克纳马拉还没忘呢。

IBM的CEO支持林燃,国防部部长支持林燃,乔治敦大学的研究团队只能被按在地上摩擦。

“我们要做的一共五点,优化算法和规则设计,扩充语料和词汇,改进数据处理的效率,引入统计方法和硬件最大化利用。

其中改进数据处理效率和硬件最大化利用由IBM方面负责。

另外三点则由乔治敦大学的成员们负责。

我们先来谈优化算法和规则设计。

你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。

因为存储有限,你们觉得扩充对照词汇库就够了。

实际上句法规则显得更加重要。

你们需要做到,引进常见的高频句型。

对上下文进行依赖处理。

使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。

比如свет同时有光和世界的意思。

这个完全可以根据前词判断是光还是世界。”

沃森弱弱提醒道:“教授,你还会俄语啊?”

怪她太乖  重生的我只想追小姨子  重燃青葱时代  三年婚姻守空房,我独美你发疯  农门悍媳有空间,嫁猎户被宠不停  娶了棺中女帝,我在都市修仙  奥特曼:开门啊,是我,老人迦!  亡国公主娇又软,糙汉可汗夜夜宠  平步亲芸  怪猎:这条火龙有特性  反贼之路:开局抢了和亲公主!  换亲后!带火婆家!  蓄谋已久,强扭的白月光他又酸又涩  海贼:从捡到红发断臂开始  女儿喜欢后爸,我成全他们一家三口  请天下赴死  出宫第四年,清冷摄政王夜夜求复合  四合院:开局何大清要跑路  第四天灾:人在高武,游戏成神  团宠小福星,扛着粮仓去逃荒  

热门小说推荐
萌宝寻亲:穷妈咪,富爹地

萌宝寻亲:穷妈咪,富爹地

秦洛版四年前,秦洛与神秘女子一夜春宵,女人杳无踪影四年后,秦洛听说有个女人的儿子是自己的小翻版,秦洛气势汹汹的带人杀过去,打算抢也要抢回儿子,结果黎非豪气拍下儿子,给我一百万,儿子归你!秦洛这么简单?说好的我抢儿子你死也不给,女人,给我按套路来!黎非版秦洛拍下一百万,去母留子,黎非想,好,今天你对我弃之不理,明天我就叫你高攀不起结果后来的后来,秦洛天天捧着户口本跟着黎非的烧烤摊,跪求领证。老婆,再不领我们姑娘又要黑户了!嗯,最后是真特么香!...

我有五个大佬爸爸

我有五个大佬爸爸

本作品改编漫画已在腾讯动漫上线,大家可以去看一下啊被师傅捡来的小和尚五岁了,该下山找爸爸了。小和尚软软抱着一只小狼崽,迈着小短腿儿冲过去就抱着自己爸爸的大长腿奶声奶气的喊道爸爸!一声爸爸,喊得五位大佬齐齐虎躯一震!软软刚找到爸爸的时候一号爸爸冷漠小孩子什么的最麻烦了。二号爸爸不屑笑话,我有这么多喜欢我的粉丝,会在乎这多出来的一个小团子。三号爸爸拎着小团子同学你认错人了,回去写作业。四号爸爸嘴里叼着一根烟挑眉碰瓷?五号爸爸一脸小懵逼我有女儿的吗?和软软相处几天之后,爸爸们齐齐真香了这是我闺女,你们都别和我抢!从此…五位大佬过上了每天争夺软软监护权的日子。江锦城眼巴巴的看着软团子那我呢?五位爸爸齐齐冷眼看着这个和他们抢女儿的臭男人!滚一边儿去!...

每日热搜小说推荐