根据科技研究公司 Canalys 的统计,截至去年底,世界范围内共有 4000 万台语音助手投入工作。按照目前的销量,到 2018 年底这个数字会增至 1 亿台。在美国市场,这类设备的应用更为普及。以美国国家公共电台 NPR 公布的数据来看,超过 800 万名美国人每人拥有三台或以上的语音助手。
另一家研究公司 Ovum 则表示,到 2021 年,地球上语音助手的数量会和人一样多。要知道,移动手机的数量超过人口花了 30 年,而语音助手所需的时间将只有一半。
但让《大西洋月刊》作者 Judith Shulevitz 注意到语音助手发展速度的并不是这些笼统的数据,而是她自己的 Alexa。她给这台 Alexa 设置了一个年轻男性的声音,每晚睡前让它播放一首催眠曲。有几个晚上,Alexa 开了小差,没有放曲子,而是说了声轻柔的“晚安好梦”。这让她感受到了一种情感联结。
南加大创意科技学院计算机科学家、心理学家 Jonathan Gratch 研究发现,人们在机器面前能够更坦然地展现自己的情绪而不觉羞耻。
除了能帮助人们解放双手,语音取代屏幕的一个天然优势是它更能制造亲密感。用传播学媒介环境学派代表人物 Walter Ong 在《口语文化与书面文化》(Orality and Literacy)中的说法,“口语来自人类内心,通过展现内心的认知和人性展示彼此”。一份 2017 年发表在心理学期刊“American Psychologist”上的研究显示,人们交谈时如果不看着彼此,反而更能产生共情,体会彼此的感受。纽约大学语言学者 Diana Van Lancker Sidtis 则指出,语音比语言本身能传达更多信息,通过研究语调、韵律、音高、发音等特质(统称 prosody,韵律学),能了解一个人的性别、身高、压力水平等。
生产语音助手的公司当然不会放过这个机会。他们希望开拓所有可能的空间:从家、汽车到办公室,从空调、冰箱、咖啡机到厕所。能够首先占领这些的公司也能把应用制造商、APP 设计师以及消费者都笼络到自己的生态系统里,就像微软在上世纪 90 年代把整个 PC 产业都捆绑到自己的操作系统上那样。单以 Alexa 为例,它目前已经和 2 万多台智能家居设备、3500 多个品牌以及 100 多个第三方设备达成了合作。
谁能占领先机?一个重要的决定因素其实是:谁能更好地通过语音及相关技术觉察使用者的情感,并且与之建立情感联系。
亚马逊和 Google 都建立了“个性小组”(personality teams),他们负责调整适合品牌及产品形象的语调。亚马逊希望 Alexa 的个性反映公司价值观:“聪明、谦虚,有时幽默”。Google Assistant 则希望是“谦虚、给力,有时活泼”。
Google 还从动画工作室皮克斯雇来了参与过制作《怪兽大学》、《头脑特工队》等影片的故事板设计师(storyboard artist)Emma Coats。在为 Google Assistant 撰写台词时,她强调的首要原则是“说话方式应该和人一样,但不该假装自己是人”。比如,如果有人问 Google Assistant “你最喜欢什么口味的冰淇淋”,它不该装作自己能吃冰淇淋,而应该回答“那不勒斯冰淇淋不错,没人不喜欢“。如果有人向 Alexa 求婚——2017 年有 100 万人这么干过——她会回答:“我们处于不同的人生阶段。你在地上,我在云里。”
James Giangola 是 Google Assistant 的首席对话及人设设计师,他负责把它的语言表达方式修饰得更自然,比如,普通人习惯把新信息放在句子最后。如果有人希望订 6 月 31 日的机票,Google Assistant 应该回答“Actually, June has only 30 days”,而不是“There are only 30 days in June”。在训练为语音助手录音的女演员时,Giangola 还会给她设置相当具体的角色背景:来自没什么口音的科罗拉多州,父母是图书管理员和物理学教授,是家里最小的女儿,有西北大学的艺术史学位,喜欢划皮艇,给一位以讽刺见长的晚间电视节目主持人做过个人助理。
除了这些大公司内部的技术人员,Judith Shulevitz 在采访过程中还遇到了难以计数的以语音分析为基础的创业公司。
MIT 工程学教授 Rosalind Picard 先后创立了 Affetive Computing Lab 和 Affectiva 两家公司:前者研究如何能将情感量化,并且将焦点放在对“状语”而非“名词和动词”的研究上;后者研究如何通过面部表情和语音捕捉情感变化,并以此辅助车载 AI 技术,追踪车主的情绪。
Ellipsis Health 位于旧金山,专门为医生、社工以及护工等研发 AI 软件,帮助他们分析病人话语中呈现的抑郁和焦虑水平。伦敦帝国理工学院 AI 教授 Björn Schuller 则表示,他已经教会机器通过分析语境和语调识别话语中的讽刺成分。
所有这些技术革新都是为了一个目的。用 Alexa Experience 副总裁 Toni Reid 的话来说,制造“无顿挫感”(frictionless)的人机交互体验。
不过很难说,“无顿挫感”是不是一定是件好事。人们现在已经逐渐意识到自己的个人信息如果被收集、储存和转卖,会带来什么危害——人脸识别技术将容许政府监视自己的公民;大公司将泄露我们的行踪、习惯和社交互动;黑客可以进入我们的家庭安全系统窃取数据并移作他用。
能够理解我们情感和生理状况的虚拟助手当然也可能带来新的问题。在便利之外,这些新技术共同描绘出的前景也令人想起《机器人瓦力》中那些不靠机器操控就无法活动的小胖子们。“Radical Technologies: The Design of Everyday Life”一书作者 Adam Greenfield 指出,“无顿挫感”让人们在做出消费决定时缺乏思考,跳过了对欲望以及通过购买实现愿望之间那条路径的反思。
《大西洋月刊》作者 Judith Shulevitz 在文末指出,她自己最担心的是这些技术对心理状态的影响——是宁静保护了思想和创意的空间。毕竟,大部分人需要的,不过是文首 Alexa 所说的那样,做个安静的好梦而已。
题图来自《大西洋月刊》
我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。