都来读小说网

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第2页)

林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

我同时会俄语、德语、英语和汉语。”

多语言大师的身份,给林燃的理论增添了几分可信度。

在这个时代,科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

“另外翻译过程,应该是模块化设计,而不是简单的映射关系。

它应该分成预处理、翻译、后处理三部分。

预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

这样来降低单次计算的复杂度,提高规则的复用率!”

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用,但有路总比之前没有好。

再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

“好了刚才我们讲了一些简单的内容,现在才是最难的。

因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。

俄语句子Мыговоримомире

英语翻译:“Wespeakaboutpeace

对齐结果:“мы”

对应“we”

“говорим”

对应“speak”

“о”

对应“about”

“мире”

对应“peace”

然后我们需要对这种对齐的频率进行统计。

统计每个俄语词或短语在英语中的对应翻译出现的频率。

例如,在语料中,“говорим”

在80%的句子中翻译为“speak”

,20%翻译为“talk”

这样对于我们就可以构建概率表了。

将这些概率整理成表格,供机器进行查询。

模拟成真,我曾俯视万古岁月?  我的化身正在成为最终BOSS  平步亲芸  亡国公主娇又软,糙汉可汗夜夜宠  天命皆烬  文圣天尊  海贼:从捡到红发断臂开始  出宫第四年,清冷摄政王夜夜求复合  请天下赴死  女儿喜欢后爸,我成全他们一家三口  团宠小福星,扛着粮仓去逃荒  三年婚姻守空房,我独美你发疯  第四天灾:人在高武,游戏成神  灵魂扳机  重生的我只想追小姨子  农门悍媳有空间,嫁猎户被宠不停  换亲后!带火婆家!  奥特曼:开门啊,是我,老人迦!  反贼之路:开局抢了和亲公主!  蓄谋已久,强扭的白月光他又酸又涩  

热门小说推荐
女帝直播攻略

女帝直播攻略

干死皇帝,自立为帝,宫斗见鬼去吧!如果您喜欢女帝直播攻略,别忘记分享给朋友...

异瞳临世:军少之霸宠甜妻

异瞳临世:军少之霸宠甜妻

内容简介重生前,韩绍棋就是她的天,她的地,她的春暖花开,她的全世界,她的眼里除了他什么都看不到。重生后,韩绍棋于她而言,即便不是生死仇人,却也再不是她的天,她的地,她的全世界。只要这辈子他不再来招惹她,甘心跟她做个陌生人,那么她可以看在上天有好生之德的份上放他一条生路。如若他非要不知死活的再次卷入她的世界里,那么...

清平乐之特工花魁

清平乐之特工花魁

南楚一代权臣苏文卿因谋逆之罪满门抄斩。嫡女苏清洛临死前许下毒誓,用她九生繁华换仇人一命。女特工魂穿苏清洛化名清平成为京城第一青楼天香楼花魁,只为助她报这一世满门仇怨。...

天应

天应

关于天应古老的皇朝流传着这样一则组训做人不流氓,空到世上忙。红颜不成群,枉为男儿郎。身后若无三千佳丽,如何称雄天下!...

夫君,我才是你最大的金手指

夫君,我才是你最大的金手指

乔苓在生命最后一刻自愿无偿捐献所有器官,功德无量感动上天,获得重生还附赠一个药田空间。然而,辛辛苦苦兢兢业业升级空间之后傻眼了。失传的古医书,不传秘方,针灸之术,这都是些啥。。。专业不对口啊!我不想学医啊!我只想种田啊!乔苓摸着下巴看向身姿笔挺坐在桌前低头写字的少年。公子,我看你骨骼精奇,是万中无一的医学奇才,拯救万民于水火的重任就靠你了,我这有几本医书…少年抬起头,目光沉静,你有病吧。乔苓重重点头,没错!我不仅有病,我还有药!如果您喜欢夫君,我才是你最大的金手指,别忘记分享给朋友...

封门秘事

封门秘事

为了生活,我做起了户外探险主播。为了满足粉丝们的猎奇心理,得到更多的打赏。我在深夜孤坟的坟头上跳起了迪斯科。从那一天起,怪事接踵而来如果您喜欢封门秘事,别忘记分享给朋友...

每日热搜小说推荐