手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
团宠小福星,扛着粮仓去逃荒 怪猎:这条火龙有特性 农门悍媳有空间,嫁猎户被宠不停 第四天灾:人在高武,游戏成神 重生的我只想追小姨子 平步亲芸 娶了棺中女帝,我在都市修仙 重燃青葱时代 女儿喜欢后爸,我成全他们一家三口 怪她太乖 换亲后!带火婆家! 三年婚姻守空房,我独美你发疯 蓄谋已久,强扭的白月光他又酸又涩 四合院:开局何大清要跑路 海贼:从捡到红发断臂开始 奥特曼:开门啊,是我,老人迦! 亡国公主娇又软,糙汉可汗夜夜宠 出宫第四年,清冷摄政王夜夜求复合 请天下赴死 反贼之路:开局抢了和亲公主!
赵钰染好不容易将识破自己女儿身的摄政皇叔干掉了,自此以为要高枕无忧,哪知刚睡醒就发现自己回到了登基前。她看着还未把权的皇叔咬牙她是马上弄死他呢,还是马上弄死他呢?宋铭铮看着龙榻笑笑欢迎换个地方弄死他。—你要皇权至上,我为你血洒边疆。若我归来,佞权相让,宠溺无边。...
他是万里海疆上的战神,回归都市,只为给她们一个家!...
主角小时候出去过一趟,回来后留下了没法儿碰菜刀的毛病。进入无限世界,逐渐变强,逐渐解开心结,唔,或者说是这毛病越来越严重。主角是古武强化,兼修煞气和枪械...
十五年前,他是豪门弃子,流落街头,一个小女孩把自己的糖果送给他。十五年后,他是东方第一战神,权财无双!王者归来,甘当大龄上门女婿,只为那一颗糖果的恩情,当我牵起你的手时,这天下,无人再敢欺负你。...
系统降临,从现在起,您的每一秒学习时间都会转化为金钱!从现在起,您的每一分消费金额都会转化为知识!学习就可以有钱,氪金使你变强!庄楷逸我很惭愧,我的学习生涯充满了铜臭味!...
这是一个小人物的发迹史,抒写暗黑时代风神传说。这是一个热血而又猥琐的高手养成史重生归来,一人一弓一剑,纵横万载无双!银联总部69516144一统江湖群号167735283银联战斗营189696119(需要每天投票)看书要收藏,好看要投票,老作者,新菊花,跪求各种包养。...