AI实时翻译现在已经达到一个什么样的水平了?

如题所述

当前AI翻译模块是能够实时的,但是由于每个人说话的断句【停顿】以及语音的不标准以及重复冗余字符【比如额,嗯等等】等等各种因素,导致语音识别需要一定语音量缓冲和上下文环境理解,才能够识别字、词、短句正确,而语音翻译需要根据识别后的文字进行翻译,一旦文字识别错误,【特别是同音不同字也不同义的】进行翻译后,会错的很离谱,当然翻译本身也是非常复杂的。所以识别模型、文字处理模型、翻译模型都需要针对特定场景进行针对性训练但是模型本身的计算不会引入多少延迟的,而另外两个延迟的引入是在字、音、画同步以及二次编码上,同时为了兼容某些语速较快的人,确保字符能够显示一定的时长,需要加些延迟。
综上所述AI翻译处理在整条直播链路中额外会引入500ms~2s的延迟.
所以可以看看整个链路延迟来看,AI翻译直播的端到端理论延迟可以在 1s左右。而此次阿里速卖通的跨境直播上推出的就是一个实时直播的场景,延迟在5-10s, 属于实时直播范畴,其中AI翻译引入的额外延迟可忽略不计。
而且不仅仅是电商直播,包括游戏直播也可以加入实时字幕和翻译的,比如今年S10赛事,某直播平台就采用了阿里云的实时字幕功能进行了实时字幕大型游戏赛事直播的尝试。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-10-30
智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在“短板”,会有“词不达意”的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。

1、大量补充口语化语料

智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。

2、提高语境理解能力

智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。
将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。

但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。
第2个回答  2020-10-30
其实现在AI学习语言的能力是非常完善的,日常生活交流的需求,基本上都能够满足。如果你是在非母语的国家旅游用谷歌翻译还可以,但有一点例外的场景,是电商场景。

当翻译工具在面对着商品品牌、型号、关键属性这类专业术语的时候,其实是有几率出错的。

像谷歌的实时翻译就曾有过闹剧,我记得是18年2月的时候吧,看过一个新闻,说是挪威奥运代表团在韩国参加冬奥会的时候,因为谷歌翻译错了计量单位,人家只想在超市买1500个鸡蛋的,结果拿到手的却是10倍数量的鸡蛋。
第3个回答  2020-10-30
实时翻译的水平,现在确实是挺高的了,在手机中,你可以输入文字,也可以是语音,他就能给你翻译的八九不离十的,当然,你的发音不准,那是另一回事了。
第4个回答  2020-10-30
AI实时翻译,现在已经达到了一个非常智能的水平。
我们使用的时候非常方便。可以和智能对话。他们也能识别出来,我们要翻译的语言。
相似回答