人工智能与机器翻译(人工智能与机器翻译论文)
已经公版的作品,由于无需支付版权转让费,一时间百舸争流,多的甚至出现几十种不同的译本。《瓦尔登湖》就是一例。
1933年,亚美尼亚裔法国工程师乔治·阿特斯鲁尼(George Artsruni)获得了机械大脑的证书专利。这个机械大脑是用目标语言中的单词,替换原始语言中的单词,类似于今日Word的替换功能。这应该是机器翻译的较早记录。
后来,机器翻译和计算机的发展并驾齐驱。冷战期间机器翻译达到了一个小高潮。美苏两大阵营,都存在大量译介对方情报之需。当时东西方交流少,翻译需求大,但人工昂贵。在1963-1965年间,美国政府花在翻译上的钱是1300万美元。翻译费用标准在千字9美元到66美元之间,比21世纪中国文学翻译的标准还高出很多。1964年,美国成立了自动语言处理咨询委员会(ALPAC),邀请了来自贝尔实验室、兰德公司、哈佛大学、芝加哥大学、康奈尔大学等机构的专家,分析机器翻译的未来,为美国国防部、中央情报局和国家科学基金会等机构提供决策参考。
很长时间以来,研究者对机器翻译还有一种思路,类似于柏拉图的现实乃理念之模仿一说:所有文本,如中文、英文,都是更为抽象的某个超级文本的解码。如果能回到这个抽象的超级文本上,再译成具体的语言就不难了。这种理念化的文本,也反映人类对于思维逻辑性和规律的追寻。这一思路在理论上很美。有一种堪比巴别塔语言的世界语在理论上也很美。但它们都忽略了人类语言的复杂、模糊、灵活,和根植于具体环境的借景生意。这些因素,造成了人和机器的关系千变万化。
现在的机器翻译核心处是人工智能。人工智能不只是在找语言规律,而也依靠日渐扩大的语料库。机器翻译可以使用统计学的规律,寻找语料之间最为可能的对应。谷歌近些年提出了一个神经机器翻译(Neural Machine Translation)的说法,试图摆脱词汇、术语、句子之间的简单对应,而是试图在两种语言之间,寻找合适的对应,并实时矫正。机器自己在开展深度学习,不断纠正自己的错误。这样一来,文字翻译的准确性会逐渐提高。对人工智能改进机器翻译的效果,我持乐观态度。
在机器和人之间,最好的办法,是让机器做机器擅长的事,让人做人擅长的事情。人工智能对于翻译来说,是一种强大的赋能,而非狡诈的竞争。在文学翻译领域,受工匠思维的影响,作品被说成像机器翻译一度是见不得人的事。一句机翻的评论,能引发豆瓣上的一场一星运动的腥风血雨。好在此争论也没白费,好歹让人们更为合理地考虑机器翻译的角色与定位。
在角色上,人类翻译能游走于上述复杂、模糊、灵活和情景之间,在理解的峰顶和夹缝之间,找到自己的活路。文学翻译不妨利用机器的力量,完成初始的翻译,然后再来动手,会节约大量人工。节约的时间来自专业术语的统一,人名地名的翻译。中外文的对照翻译,放在同一个平台之下,也会使得重复性词语、术语翻译的修改更为简便。不然的话,两套文本在不同体系之下,查到原文的查不到译文,查到译文的查不到原文,无法一一对应,无法一网打尽。
人和机器翻译谁优谁劣是个伪命题。机器不是有情感的主体。机器没有和人类较劲的必要,人类也没有与机器较劲的必要。能利用机器翻译提高自己的效率和效果,才是明智的做法。那种阿尔法围棋和人类高手对决的场面,不应出现在翻译领域。文无第一,译无第一, 只有不同的方式的失手,和相得益彰的补充。对于人类翻译来说,机器翻译就好比苹果的Siri, 百度的小度,都是我们的人工助理而已。
互联网小常识:宽带城域网在组建方案中一定要按照电信级运行的要求,考虑设备冗余、线路冗余、路由冗余,以及系统故障的快速诊断与自动恢复。
更值得我们思考的,不是翻得怎样,而是翻译什么的问题。过去,翻译的文本,直接会影响一个人甚至一个国家的命运。可以想象,如果《圣经》《资本论》《天演论》这些文本没有翻译,结果会是怎样?
需要说明的是,不是所有的翻译都是有益的。在文学领域,美国翻译得很少,中国则为翻译第一大国,什么作品都翻译。已经公版的作品,由于无需支付版权转让费,一时间百舸争流,多的甚至出现几十种不同的译本。《瓦尔登湖》就是一例。比较不同的版本,都可以产生一门瓦学来,有这必要吗?真正重要的文献,尤其是对于我们对一个领域深入了解的学术文献,对于大众生活会有显著改进的文献,翻译又是匮乏的。
在文学界,中国出版界引进国外新书速度很快,新品泛滥。一有国外文学奖颁布,立刻就被抢购一空。让翻译做完之后出版,没有一炮打响,也不想持续经营,赶紧去追下一本,把现有的书丢掉不管。这些做法,多属狗熊掰玉米,一路走一路丢。这种货大量足式的大批量引进,跟文学翻译太廉价,没多少成本也有关系。指望译者用爱发电,做大他们的码洋,是荒唐的。缺乏行业的组织协调,译者起码可以给自己设个标准,把生存和生活的改进放在第一位,不要被各种情怀的说辞所误,尽量少做一点。不过当我提出这个想法时,南京大学英文系教授但汉松教授的回应是:不太可能的,以后译者议价能力会越来越低——因为一些高校对教师和研究生的译作开始计入科研分数或毕业发表(譬如两本译著折算为一篇c刊),只会有更多的人愿意成为廉价劳动力。但教授说的是有道理的,把优秀的翻译不当学术成果,是遗憾的。如果算成果,也要小心人类的指挥棒效应:你去衡量什么,就会得到什么。当我们讨论翻译未来的时候,不妨考虑什么样的翻译,能够改进人本身的生活质量,而不是让人成为廉价劳动力。
机器翻译可以拓展我们的专业视野。在诸多小众领域,翻译的书或其他资料,可能看到人不多,出版社也不愿意做。外语水平欠佳的人又看不到,视野受到限制,不妨利用更多机器翻译,翻个大概:内行人有时候需要的精度也不是很高,如果机器翻译不断改进,准确性提高到八九十分,很多人工翻译是不需要的,凭借机器翻译即可。一些科技文献,业内人士借助机器粗翻的结果,结合自己的专业知识,可以了解大体情况。一些仅需了解的说明文字,机翻完全够用。
互联网小常识:由于Winmail邮件服务器支持基于Web方式的访问和管理,因此在安装邮件服务器软件前要安装IIS.
机器翻译可以改进普通人的生活。保健、教育、亲子关系、冲突处理、有效沟通等方面,有很多实用的资料,翻译出来会影响一个人人发展的轨迹,甚至改变一个家庭的命运。又有多少出版社在争先恐后去翻它们?如果能够借助机器翻译的力量翻译出来,也是大有功劳的事。在国际争霸期间,机器翻译是刺探对方情报的手段。如今,我希望机器翻译成为改进人类生活的利器。
南桥
互联网小常识:Aironet 1100 系列接入点是一款无线局域网接发器,主要用于独立无线网络的中心点或无线网络和有线网络之间的连接点。这款接入点设备主要是为企业办公环境而设计,兼容IEEE802.11b与IEEE802.11g,工作在2.4GHz频段,使用IOS操作系统。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186