作者:OlivierFontana,微软研究院MicrosoftTranslator产品战略总监
世界越来越小,全球协作、共同创新已经成为常态。在微软研究院,我们对此尤为感同身受——从北京到雷德蒙,从剑桥到班加罗尔,全球范围内的无边界沟通与协作是我们科研合作与产品创新的关键基础。全球一体化带来的发展机遇应该属于每个人,为了帮助全球各地的人们跨越语言的障碍,实现高效沟通与广泛协作,我们带来了MicrosoftTranslator。
MicrosoftTranslator是微软以机器学习、大数据、自然语言和云计算等前沿技术为基础打造的自动翻译服务,也是微软众多人工智能研究成果中投入使用最早也最广泛的应用之一。MicrosoftTranslator现已支持50多种语言的文本翻译、8种语言的实时语音翻译和18种语言的语音识别和输出。就在年7月底,我们在中文简体和繁体的基础上,最新加入了粤语文本翻译,进一步完善了对汉语应用环境的支持。
自我学习的智能翻译
“统计机器翻译”是MicrosoftTranslator背后的主要技术,它以微软十几年来在自然语言领域的研究为基础,加入了统计学与机器学习的原理。简单地说,这套翻译体系将“翻译”转变成了一个机器学习的课题,让计算机不断地对训练数据中的人工译文和语言转换结果进行判断与学习,在不断的纠错与改正中,促进系统算法的自我完善与优化。通过统计建模技术和高效的算法,不断学习优化的机器翻译系统能学会根据上下文的语境,而不是单词的意思和生硬的语法规则来匹配最恰当的翻译结果。
要说MicrosoftTranslator的智能来自于机器学习、自然语言等技术,而它的可靠运行与不断优化,则离不开微软在各领域的资源优势。例如,作为一项云服务,MicrosoftTranslator运行于MicrosoftAzure云平台,Azure提供了机器学习等高级分析功能的运行平台,同时也确保了其作为SaaS云服务的高可用性和数据安全性,并且它还可以根据需要弹性扩展运算规模。另一方面,覆盖全球的必应搜索引擎,也为MicrosoftTranslator提供了全球规模的语言素材与学习资料,让机器学习系统得以不断地成长和完善。
与此同时,微软旗下多样化的产品与服务,也为MicrosoftTranslator提供了施展才华的广阔天地。从年起,MicrosoftTranslator便逐渐开始为越来越多的微软产品提供自动文本翻译功能,例如Office、必应搜索、IE和Edge浏览器、Skype、微软小娜(Cortana)等等。或许你还没有意识到,但它其实一直都在你身边——在电脑的Word界面中点击“审阅”菜单项,然后选择“翻译”图标,你就能领略到MicrosoftTranslator的本领了。
让你自然交流的智能语音翻译
在年3月底举办的Build微软开发者大会上,微软CEO萨提亚·纳德拉指明了微软乃至IT产业未来的一个发展方向:让人类的自然语言与先进的机器智能进行交互,也就是“对话即平台(ConversationasaPlatform)”的概念,并且发布了“微软机器人框架(MicrosoftBotFramework)”以及微软认知服务(MicrosoftCognitiveService),用以帮助开发者打造新一代的人工智能应用。事实上,作为一个能听会说多种语言的人工智能服务,MicrosoftTranslator在语音翻译服务方面已经提前取得了成功的实践。
微软认知服务
早在年,MicrosoftTranslator即推出了语音翻译服务,年3月又面向开发者开放了语音翻译的API。目前MicrosoftTranslator支持对包括中文普通话在内的8种语言的实时语音翻译(英语、法语、中文、德语、意大利语、西班牙语、阿拉伯语、葡萄牙语)。在SkypeTranslator以及Windows、iOS或者Android版的MicrosoftTranslator应用中,你都可以体验到这项私人实时口译服务。
语音翻译要比文本翻译复杂得多,需要经过自动语音识别(ASR)、TrueText智能文本校正、自动文本翻译以及文本到语音转换(TTS)四个步骤。
其中,自动语音识别借助深层神经网络,对数千小时不同语言的音频数据进行分析和学习,以达到“听懂”人类自然语音的目的——基于机器学习,语音识别的效果也会随数据的积累而不断完善。TrueText智能文本校正则负责将人们口语化的交流转换为规范的文本,比如,去掉“嗯”、“啊”、“这个”、“那个”之类的赘词以及重复、口吃等语病,并添加断句、标点符号,从而让文本更贴近用户本来的意图,也更易阅读和翻译。在文本翻译基础上增强的语音翻译引擎,增加了更多口语文本语料库,从而为口语会话类翻译构建了更好的模型。最后是文本到语音的转换过程,如果翻译的目标语言是MicrosoftTranslator目前所支持的18种转换语言之一,那么就能使用语音合成技术将翻译后的文本转换成语音播放出来。整个语音翻译过程中,深层神经网络(DNNs)技术的引入,则极大程度地降低了翻译的错误率,提高了可靠性。
带上你的私人翻译,畅行天下
为了让更多用户可以随时随地、便捷地使用翻译服务,MicrosoftTranslator面向不同平台推出了移动端应用。这款应用不仅适用于Windows设备,同时还支持使用iOS、Android平台的设备,甚至包括AppleWatch和AndroidWear智能手表。
运行于智能终端的MicrosoftTranslator经过持续的完善与升级,目前已经发展的非常成熟,不但支持众多语言的翻译功能,而且还可以提供离线翻译选项。用户既可以用键盘输入或者粘贴文本,也可以利用麦克风直接录入语音,或者是将看到的外国文字拍摄下来,让软件自动识别并翻译。在最新版本中,我们还加入了支持8种语言的实时语音翻译功能,让语言不通的两个人,仅凭一部手机就能进行面对面的实时语音交流。
MicrosoftTranslator移动端应用绝对是海外旅行必备的利器,它不但可以帮我问路,还能靠拍照辨认街道、商铺和没有图片的菜单,甚至可以让我和五湖四海的新朋友进行一次真正有意义的谈话,真正体会到四海一家的畅快沟通。
在中国越来越流行的“海淘”则是MicrosoftTranslator的另一个用武之地。基于MicrosoftTranslator技术的必应翻译(bing.中科医院北京看白癜风疗效好专科
转载请注明:http://www.shangwuyingyua.com/swyykc/10237.html