科技网

当前位置: 首页 >自媒体

人工智能能否助人类重建巴比伦塔

自媒体
来源: 作者: 2019-04-05 21:23:22

人工智能,能否助人类重建“巴比伦塔”

作者:未知来源:科技

假设上帝真的存在,他最近可能有些心事。

在犹太人的古老传说中,人类曾试图修建一座通向天堂的巴比伦塔。为阻挠这个疯狂的计划,上帝想出一个绝招赋予不同族群不同语言,让人们难以沟通。

最终,语言的隔阂让巴比伦塔计划搁浅。直到今天,即使信息和交通技术把世界变成了地球村,语系之间的交换,仍然只能依托对彼此语言的专业学习。

但是现在,人工智能在语言翻译领域的突飞猛进,又让人们重新看到了巴比伦塔竣工的希望。

九成六级考生不如它

这段时间,机器翻译技术可谓高调。

微软刚刚在12月13日放出大招推出实时语音翻译运用Microsoft Translator,支持多人、多语言、跨装备交换。国内企业并未示弱。上个月底科大讯飞在其年度发布会上也展现了类似的技术,可以将中文会议演讲实时翻译成英、日、韩、维吾尔等多种语言显示在大屏幕上。发布会上推出的语音翻译机晓译还瞄准了更广阔的运用场景出国游玩。

平时不显山不露水的翻译运用也已华丽升级。今年9月,谷歌翻译启用了谷歌神经机器翻译(GNMT)系统,在人工智能界引发骚动。而追溯至去年5月,则是百度翻译发布基于神经络的机器翻译(NMT)系统的时间。

机器翻译的高调,依赖于人工智能技术在这1领域的显着进展。

百度主任架构师何中军介绍,自上世纪40年代起,基于规则、实例和统计的机器翻译方法渐次登场。2014年起,人工神经络开始在机器翻译领域引领风骚。

终究的翻译效果就是更加流畅了。科大讯飞机器翻译研究主管刘俊华告知科技,科大讯飞所展现的会议实时翻译系统和晓译翻译机便运用了基于神经络的机器翻译方法。

若问人工智能的到来把机器翻译提到了什么水平,何中军举出一道大学英语六级翻译真题。这道题需要把1句中文翻译成英文,而百度翻译应用给出的答案,从辞汇和语法来看都挑不出甚么毛病。

无独有偶,科大讯飞在推介其晓译翻译机时也曾表示它可以到达大学英语六级水平。大学英语六级的翻译题目满分为15分,目前机器翻译答题可以到达11分。刘俊华解释说,这意味着机器翻译技术大概可以超过90%的英语六级考生。

炼丹炉取代了流水线

就在两三年前,流畅和自然还是让机器翻译研究人员感到头痛的字眼。那时,基于统计的机器翻译方法是大热门。

短短两年多时间内,基于神经络的机器翻译系统,就在多个公然测试集上超出了基于统计的机器翻译系统。

单从翻译步骤来看,刘俊华的体会是,基于神经络的机器翻译比其前任简洁了非常多。比如,要把1句中文翻译成英文,基于统计的机器翻译方法首先要对句子的辞汇、短语进行切分,然后分别对每一个单元进行翻译,再把翻译结果组合起来,最后还要进行调序等等。每一个步骤都对应着十分复杂的模型。

形象地说,如果基于统计的方法是一条长长的流水线,基于神经络以后只需一个炼丹炉。

新方法被称为从端到端的翻译。基本的神经机器翻译模型包括两个部份,编码器和解码器。何中军解释说,编码器将源语言句子表示为一个向量,解码器根据此向量逐词产生目标译文。也就是说,一个句子经过一次加工就能够直接输出目标语言。

不但翻译效力得到了极大提高,结果也更加流畅自然。这是由于,神经机器翻译方法是对整个句子进行编码处理,可以照顾到词汇的上下文信息,因此翻译出的答案不像统计机器翻译方法那样僵硬。

正是流畅和自然将机器翻译技术推向更加实际的运用。而且在与其他人工智能技术相结合后,机器翻译可以真正触到人们语言不通的痛点,从而深度切入商务、旅行、学习等多个场景。

例如,无论是微软的Microsoft Translator,还是科大讯飞的会议实时翻译系统和晓译翻译机,都结合了语音辨认技术来为语言交谈架起桥梁。而融入了光学字符识别(OCR)技术的百度翻译APP,则可以在国外购物或旅游的场景下,帮助人们翻译看不懂的英文路牌、菜单和说明书等。

等待打破叹息之墙

可以看到,人工智能正在一点一点捅破人与人之间的语言隔阂。有友戏言,也许不久后的一天,揣着装了高效语言翻译APP的,邻居大妈也能来一场说走就走的世界旅行。所有国家的学生将完全挣脱外语课的黑暗统治。

不过,要把重建巴比伦塔的美梦寄托给当前、乃至未来一段时间内的机器翻译技术,还是有点不太现实。

基于神经络的翻译技术虽然带来了机器翻译质量的较大提高,但是本身还存在诸多技术挑战。何中军说。他把神经络比作一个黑盒子,中文句子进去,英文句子出来,但是这个黑盒子为什么要这么翻译,技术人员还难以对其进行公道的解释。

更重要的是,复杂、多变,我们自己都掌握不住的人性,依然是所有人工智能发展的叹息之墙。

虽然对单个句子的翻译可以实现流畅和自然,但是在全部篇章的上下文理解方面,机器翻译并不给力。一旦触及歇后语、诗句、双关语乃至口语化的表达,机器翻译更会绝不掩盖地掉链子。而对如何将知识融会到机器翻译系统中,让机器真正理解人类的语言,目前还没有较好的解决方案。

从另一个角度来看,无论是基于统计的机器翻译,还是基于神经络的机器翻译,都以庞大的语料库为基础。但是刘俊华告知科技,虽然中、英等主要语种的语料相对充足,1些小语种的翻译,比如科大讯飞目前关注的国内少数民族语言的翻译,仍然会面临语料短缺的问题。

目前的成果可以证明,神经络在语言翻译领域的运用效果不错,但它的潜力还没有完全发挥出来。刘俊华给出的方案是,可以考虑将其他技术线路与基于神经络的机器翻译方法融会起来,使其各施所长,实现更好的翻译效果。

人工智能会不会取代专业的同声传译?这个简单的问题竟让机器翻译领域的专家们感到难堪。何中军用任重道远作为回答,而在刘俊华看来,对照传统的翻译规则信、达、雅,人工智能目前仅能实现信,离后两者尚有距离。

这么说来,上帝或可放宽心:就算人工智能要帮助人类重建巴比伦塔,也不过刚刚捡起几块砖瓦而已。

只是,未来呢?

青春期月经不调的治疗药物
身体寒会造成月经不调
引发月经不调的原因

相关推荐