深度 | 杀死那个人类同传

2018年9月20日，知乎上一篇图文并茂的文章，将人们对“机器翻译”的质疑，再次置于放大镜下。

文章作者Bell Wang，一名同声传译工作者，指责著名的人工智能公司——科大讯飞在一场由他担任同传的会议上，没打招呼，就直接把他和搭档口译的内容语音识别成了文字并打到大屏幕上。而屏幕上显眼的“讯飞听见”logo，给了现场观众很大的误导，让人以为这中文字幕是机器翻译软件直接翻译得出的。

这篇文章迅速发酵，作为上市公司的科大讯飞不得不出面回应，强调自己“从没有说过要取代人类”，没有主观恶意。在连续的几场发布会和新闻稿中，高深莫测的“人机耦合”概念再次被科大讯飞拿出来，用于解释他们的机器翻译理念。

机器翻译是为了帮助人类翻译的，科大讯飞说。

尽管如此，同传界对科大讯飞的负面观感，并未因此减退。

PingWest品玩采访了多位同传从业者，他们普遍对科大讯飞缺乏正面印象。这并是不来自“机器翻译抢走人类饭碗”的担忧，而是源于包括科大讯飞在内的一众“机器翻译公司”，对同传从业者“缺乏起码的尊重“。

在这种糟糕的互动关系背后，自人类有文明交流以来便出现的语言翻译，正在走向两个分岔路。

公然羞辱

2017年底，美国前总统奥巴马来到中国参加了一场企业峰会。这场会议后来因大量流出的“微商握手奥巴马”图片而走红。不过在这场走穴现场，真正的主角是科大讯飞。

入行5年的同传译员乔亚（化名）是当天会议的同传之一。会议即将开始前，现场一片混乱，一名主办方工作人员匆匆找到正在做最后准备的乔亚和她的搭档，说“科大讯飞也会来”。主办方告诉她们，科大讯飞在会上会把她们的同传用语音识别技术展示在大屏幕上，提醒她们翻译时要“小心一些”。

在当天这场”寸时寸金“的活动上，主办方安排了多场路演，但由于时间把握的问题，几个讲者在演讲末尾不得不提高语速，最终快到同传无法及时翻译。“所以一个直接结果就是，当时屏幕出现长时间空白，不一会儿科大那边就直接把屏幕关了。”

活动结束时乔亚一度担心自己的翻译完成度，担心客户会不满意。但接下来的一幕却让她更加愤怒：

活动全部结束后，科大讯飞的一名高层突然蹦到台上，对奥巴马骄傲地说到：“今天我们在屏幕上看到的实时字幕，都是科大讯飞的翻译技术做的同传。”

而在当天的活动全程中，科大讯飞自始至终没有和译员有过任何接触。

这样的做法与 Bell Wang 在知乎热文里吐槽的行为如出一辙，而PingWest品玩采访的多名同传都表示，自己也受到过相似的待遇。

张伟是一名从事同传8年的译员，他记得在至少两次他同传的活动中，现场嘉宾在发言中突然脱稿说，如果他当天带来了自己公司的翻译产品，就不需要今天的同传了。而更加讽刺的是，作为现场的同传，他还需要把这些言论翻译成英文告诉老外观众。

“第一次遇到这种场景的时候我特别气愤，但作为译员我们要保持客观，我还是给他翻了。当时我和搭档互相看了一眼，两人满脸的抵触。”

如今国际化的科技大会越来越多，那些拥有翻译技术的科技公司嘉宾，总是喜欢拿就在现场的人类同传说事，并且对这种近乎公然羞辱的行为自我感觉良好。

在接受采访的多名同传的描述中，这些机器与人共存的场合，没有协同工作，也没有同场竞技，有的只是荒谬的闹剧， Bell Wang 吐槽的这一次与他们经历的并没有什么区别。唯一的不同只是，这一次事情“闹大了”，不再只局限于同传圈子。

“业内的朋友们也开始在我身上寄托很多期望，希望维护合理的权利和诉求。” Bell Wang 在自己帖子引发巨大反响后这样说到。

“从业者越来越浮躁”

中国人对科技的热衷，让“AI取代人类”成了所有人挂在嘴边的话题。说的多了，许多”震惊体“的标题，也开始被所有人严肃对待。

如今你时不时就会在网上看到“AI取代同传”样式的标题，在张伟印象中，同传圈第一次集体因此愤怒是2013年，当时中国移动的前董事长王建宙在央视接受采访，他强调4G带来传输速度的飞跃将大大提升机器翻译的速度，进而替代人类同传。

“如果4G让做同声传译的失业了，那我们这个行业就太高兴了。” 王建宙随口一说，同传们焦虑许久。

小L是一名入行不到4年的年轻同传，她的生活节奏代表了最典型的同传译员。我在她上下午两场活动的间隙见到她：一身崭新西装、脚踏高跟鞋，但依旧走路生风。虽然过往一周每天都在“接会”（担任会议的同传），但在她化着淡妆的脸上却看不到丝毫疲态。对这种快节奏的生活，她早已习惯。“这是做同传的常态。”她说。

在大部分时间里，她都保持着职业的微笑，只是当谈及AI翻译的话题时，她皱起了眉。

在此次科大讯飞的风波之前，机器翻译就曾在主流舆论中引发过一次热议。今年4月的博鳌亚洲论坛上，腾讯的机器同传产品“翻译君”高调亮相。

小L记得，在博鳌论坛开幕前，她以前合作过的一个客户给她转来一篇文章，内容是腾讯为”翻译君“亮相而发布的新闻稿，但题目则被多家自媒体改作“AI即将取代同传”。

“他什么意思？以后不需要和我合作了？”小L心里想，当时感到有点慌。不过之后的进展让她松了口气。

在那个热闹的大会上，“翻译君”仅用几天时间就从“业界首个完整AI同传服务”，迅速沦为一个错误百出的蹩脚翻译，诸如“我们需要一张脸，一张新的脸”的翻译让人哭笑不得，整体听下来也是磕磕绊绊，基本无法通过它弄清楚现场在讨论些什么。

小L觉得可笑，但紧跟而来的则是愤怒。

“同传这个行业向来是靠实力说话，你的翻译水平、你的情商，都很重要。”小L说。“但现在突然间机器翻译来了，谁都还没看过它们真的翻出什么成果，或者真的证明比我们人类优秀，但是一瞬间我们所有人类同传就是多余的了，连比较一下都不用。这感觉很不爽。”

小L2014年读研期间开始跟着老师参加会议的同传，正式入行。但毕业后的前2到3年，做为新人，每个月最差时可能就只有2到3场会，天天都很着急。“每一个机会都要十分珍惜，如何让客户满意，跟翻译公司维护好关系，让他们在下一次有会的时候能想起你。然后自己还要强迫自己每天都练习听力和翻译。总之挺不容易。”小L回忆说。

但同传是翻译行业的塔尖，而且同传本身也是一个金字塔型的行业，进入顶端才有机会，因此小L削尖了脑袋也要挤进去。“我从不怕和同学、前辈竞争，有机会总是会观察其他译者，甚至是我的搭档，从她们的长处学习，同时也知道他们的毛病在哪。”

而这一切到了机器翻译那，却可以不战而胜。越来越多科技公司在宣传时都把“同传”当成自己机器翻译技术的靶子。

“很多时候机器犯的错误对人类同传来说就是灾难，比如我看到过机器翻译在一家公司年会现场把人家公司名称翻错，在国际论坛把地名翻错，再比如博鳌这次，连一带一路这样的词语也敢翻错。”小L说。

她觉得，这与同传整体的低调有关：与坐在台前和讲者肩并肩的交传不同，同传往往“躲”在现场的某个角落，同时同传译员大多是自由职业者的工作状态，独来独往，竞争激烈，没有什么抱团的习惯，也不太集体发声。

“也许因为我们总坐在角落的箱子里，他们不知道我们的态度吧。所以这些公司总是把同传做为宣传中瞄准的对象。但这些动辄’替代同传’的言论，其实是一种缺少尊重的表现。”小L说。

“机器翻译水平这么差，但还把同传做靶子，也是因为同传是最高水平，而且也算是一个高薪的工作，说用机器取代我们会更有噱头，有利于他们吸引关注。而且对于那些上市公司，还有利于抬升股价。”乔亚认为。

而张伟则感到困惑，他从行业估值角度估算了一笔账，认为就算机器真能取代人类同传，同传这点市场也不值得科技公司花费如此巨大的投入。

“我算了一下，同传市场按照2000名译员、每名译员每年150场会，每场按照现在平均水平，译员5000元、翻译公司拿另外的5000元，那这样就是30个亿。再加上同传设备的租赁费大约50个亿，这已经是很高的估计，但也才多少。”张伟认为，就算把他估计的数字乘以10，也根本不值得这些科技公司大张旗鼓地做。

“我看，同传这个概念算是被这些科技公司做市场营销的给‘绑架’了。”小L愤愤地说。然而，尽管看不上机器翻译现在的水平，但小L承认，她也不确定未来10年机器翻译会发生怎样的变化。

这种铺天盖地的宣传已经开始影响同传行业里的每一个人。

乔亚目前还在一所高校兼职教授同传课程，她记得在给一个研究生班上的第一节课上，这些未来的同传主力军关心的最多的话题也是“AI这么强大，我们还需要学习同传么？要不要趁早改行”。这让她哭笑不得。

而张伟认为这很容易理解。“按照现在这样的发展，未来10年真的不好说。而这些20多岁的学生，10年后正进入事业黄金期，谁都不想在那时候被机器取代，丢掉饭碗。”

一方面亲眼看着如今机器翻译的糟糕水准，但另一方面却又停不住的感到担忧，如此纠结往复成了同传们生活的一部分，给本就压力不小的生活平添更多烦恼。

小L发现，这几年关于AI取代人类同传的讨论已经取代了所有与业务相关的讨论，成为行业内唯一持久的热议话题。

“以前还安安静静讨论讨论接会和做翻译的业务经验，现在网上和群里就都是讨论AI又干了什么。”小L说。“天天想这个，让从业者都显得越来越浮躁了。”

人类和机器互不理解

在瞄准同传这一行业的同时，这些机器翻译技术的研发者们对同传的理解却与拥有百余年发展史的同传这一工种有很大不同。

在被问及科技界对常常提到的“机器同传”的定义，微软首席语音科学家黄学东对PingWest品玩表示，他们的理解更多是指语音识别与机器翻译的结合。他表示，如今在语音识别上由于抗噪的能力还有所限，这一点比人类是要差点。但机器翻译方面，它的速度绝对是人类比不上的。

小L就认为，同传不是机械地翻译，而是要保证沟通，达到交流的目的。“这些AI翻译公司所说的同传，和我们从事的同传，完全就是两个事情。”小L说。

科大讯飞在此次风波过后的回应中提到“人机耦合”的独创概念。“人机耦合翻译模式，由机器提供语音转写和翻译结果给同传参考，辅助同传降低工作强度并提升效率，文字展示区Logo显示为‘讯飞听见’。”

但这种服务同传译员的说法，看起来却基本是一厢情愿。

根据业界的定义，同声传译是指译者用一种语言把另外一种语言所表达的内容，以与发言人几乎相同的速度，用口头形式准确表达出来的一种口译方式。

“同传需要很强的听力，正确判断讲者的停顿，需要做顺句驱动，也就是和讲者同时开口并随时调整逻辑确保基本同步且准确。”张伟介绍。“而机器现在就只是译一句喘一两分钟，这是假同传。”

“同传已经成功运行百来年，不须要这样的支持。有些翻译软件其实就挺好用，利用人工智能把资料用两分钟译好，关键词译的也非常准，这种人工译员确实可以利用。”张伟说。“但人机耦合就是个伪命题，因为同传工作路径与讯飞的工作路径平行，这怎么耦合？好比两列齐头并进的火车，同传译员边听边译，人工智能识别采用的信号起始点与译员的起始点一模一样。你不比我们快，你的车头不可能站我们前边拉火车。而站我们后面，我们又不需要你了。”

而且，无论是科大讯飞还是腾讯的翻译君，在这几次会议同传中，都没有任何辅助人类同传的行为。

一位曾在博鳌大会与腾讯翻译君“一同”为观众提供同传的译员，曾对PingWest品玩回忆当时的工作场景：“会场内有一块屏幕，会出AI同传字幕，而人类同传译员照例坐在会议室后面角落的同传间里，根本看不到。工作时不可能再分心去关注它，也更没有‘共同工作’的情况。可以比喻成两套班子同时工作。我们也是从社交媒体上看到有关报道才知道有腾讯的产品在现场的。”

而在科大讯飞此次的风波中，讯飞听见系统只是把同传的声音转为文字，不仅提不上帮助，而且更多是在依赖人类同传。而且这种语音转字幕功能在同传场景下更显的奇怪，炫技的成分多于解决实际需求的作用。

“现在很多所谓AI同传在会场的实现方式都是打字幕，这样的设计明显是反人类的，可能更适合听障人士。因为人们通过听力可以获取更多信息，而且还能边听边把眼睛用在别的地方，比如看看PPT，或者看着本子记笔记等等，用来看字幕就太奇怪了。”

“从我的观察来看，这些机器翻译技术公司里，应该是没有哪怕一个懂同传的人来帮他们提供建议。”张伟说。

PingWest品玩采访的多名不同背景的同传都表示，没有听说有翻译、同传等专业背景的人进入科技公司参加机器翻译研发的工作，而他们也都没有和研究机器翻译的人员有过什么直接交流。

科大讯飞翻译业务的负责人翟吉博曾对PingWest品玩介绍，他们的团队中也有翻译出身的人，但具体的职责仅仅是测试，对系统进行评估，制订些标准。也就是并不会参加到最核心的讨论中。据PingWest品玩了解，微软、搜狗等公司情况也类似，翻译技术团队多以机器学习、大数据等专业背景的专家为主，很少有传统英语学科背景的人加入。

但事实上，双方的这种”绝缘“并非一直如此。

最早在上世纪70年代，基于规则的机器翻译理论最早被提出，也被称作传统的自然语义方法，它属于最初的AI研究流派之一：“symbolic AI”。这种方法实现翻译的方式是，把所有英语和中文语法规则和一整本英语词典及一整本中文词典编码进机器，之后输入英语句子后，机器就对应地得出一句中文。

这其实是尝试模仿人类对语言的理解。“传统的自然语义方法是按照人类的理解来理解。”黄学东对PingWest品玩表示。当时最初的机器翻译研究者，经常需要向语言学专业的专家请教，共同研发。

但之后，到了90年代，基于统计的方法被应用到机器翻译领域，并给翻译效果带来巨大的跃升。研发者也纷纷转向基于统计的机器翻译方法。这种方法更像是纯粹的计算机方法，已经与传统自然语义方法有很大不同，也不再对研究翻译和语言学等学科的人们有太多依赖。

而进入最近5年，深度学习再次推动机器翻译的进步。2011年谷歌开始研发和使用的“神经网络”模仿人类大脑由神经元构成的结构，每一层神经网络都会对数据进行分析以找到其中存在的规则，多层的神经网络则类似现在流行的深度学习概念，可以发寻更多的范式。2016年，谷歌将神经网络用于其翻译产品上，再次大大提升了翻译质量，逐渐成为现在各家科技公司机器翻译技术的主流。

至此，机器翻译的逻辑与人类进行翻译的方法分别走向两条岔路。

不确定的未来

“机器翻译的算法和人类思维很不同。”黄学东说。“简单形象地描述，机器翻译是把一种人类语言投射到一个数字化的高维空间，然后在此进行解码，解码成另外一个语言。这个空间高维到人类不可想象。”

“机器翻译和人类翻译的逻辑很不一样，其实对于我们来说，也没必要去研究人类同传或翻译的逻辑，关键的是算力和数据。”一名在国内科技企业负责机器翻译团队的产品经理对PingWest品玩表示。

黄学东也表示，提升机器学习的质量，要靠高质量的数据、不同的算法模型以及性能完善的软件系统。他表示，今年3月微软的机器翻译系统在一个中-英新闻测试集上，达到了可与人工翻译媲美的水平。此次突破主要依靠的就是机器学习组新研发的对偶学习、推敲网络等模型，其中不少都是受人类工作模式的启发。

但是，虽然每个模型的原理都能说清楚，灵感也可能是在模仿人类，然而融合了这些模型的端对端系统则是一个超大的神经网络黑箱。它会自己把机器翻译的模型学习出来，外部很难弄清楚里面发生了什么。这样的方式也让机器翻译存在着不可解释性。

在此前博鳌论坛出洋相后，腾讯就对其中出现乱码的情况进行分析，最终给出的解释便是：“出现这种情况主要是包括神经网络机器翻译在内的深度学习算法，在原理上或多或少都有一定不确定性，在特定的情况下有一定的概率引发翻译偏差。”

而这些在机器翻译研究者眼中已经习惯的“特性”，对于普通人来说则可能带来担忧。小L就对机器翻译领域大量的晦涩术语十分反感。“我对机器翻译只有很简单了解过，我看不懂那些复杂的算法和技术。”小L说。“但是我很反感这些公司在犯错的时候拿什么不确定性或者其他听起来很吓人的AI高级术语来搪塞。”

小L形容，每每听到科技公司不断宣传“只要数据足够多，就能训练出与人一样水平的翻译”时，就好像听到猴子足够多就能写出莎士比亚全集一样，初听荒谬可笑，细想却感到吓人：“如果失控了怎么办？”

除此之外，一些以翻译为终生事业的人们还在思考，人类与机器在对待语言和翻译这件事上的不同，会带来什么后果？

人类学习外语时，以理解这门语言为目的，但机器看起来则仅仅是完成了从输入到输出的任务，在不少语言学者的眼里，它似乎永远不能算是“懂得”了一门语言。

“这是个非常好的问题，有各种各样不同的观点。”黄学东表示，机器翻译过程中，就是从低维空间到高维空间的投射过程，从计算机角度讲，它就是理解了这个语言。反过来说，机器在高维空间非常得心应手，但对于我们人类又是不可理解的。”

“人类的语言和机器的语言是不一样的，而我们现在用了一种机器可以理解的方案，来完成人类语言的翻译，它的效果远比基于人类知识结构方法来设计的机器翻译，要好很多。”黄学东说。“这就是理想与现实的差距。”

“其实我们人类还不是也一样，谁也说不清到底人脑是怎么运行，但我们不是一样在依赖它？那如果有一天我们训练的机器可以稳定输出，媲美人类，那为什么不能依赖机器呢？”上述产品经理对PingWest品玩说。

就这样，AI继续吃进大量的数据、补充各种新鲜的模型，从而自我进化，然后参加机器翻译的比赛，用科技界自己设立的标准来衡量着进步程度；另一边，人类同传则继续提升自己对语言的理解，磨练自己的翻译技巧，像传统的手艺人一样把这种工匠技艺传承下去。而且，两者并不怎么沟通。

人类自有文明交流以来便伴随出现的语言翻译这件事，正走入两个分岔路。两者就像在两个平行宇宙运行，何时会重合？还是会带来冲突？

目前没人知道。