如果你是个软粉,最近正看着 Google 家语音助理能聊天能通话而眼馋的话,那么请再等等,Cortana 也在向着这个方向迈进了。
微软已经发布公告,宣布了他们刚刚完成 AI 公司 Semantic Machines 的收购。这家成立于 2014 年的 AI 公司,在其创始团队中多人与 Siri 当年的诞生有关,CTO 是前 Apple 的首席语音科学家,而首席科学家 Percy Liang 则是 Google Assistant 语义分析团队的创始人之一。
从此前公开的信息来看,该公司一直致力于语音识别、语义分析、语音合成,以及其引以为豪的“对话引擎”——通过机器学习技术让语音助理能够“回忆”起之前内容并联系起来,以此让 AI 脱离应答形式的交互,更接近真人聊天。
而微软正是冲着最后这项而收购的。
微软期望中的语音助手
微软一直想打造一个能够聊天的机器人,或者说语音助手、AI 助理。为此,微软早在 2016 年 Build 大会上就十分前瞻的推出了一个机器人框架,以便于开发者构建拥有语音识别和自然语处理的 AI 助理。
但是微软觉得目前的机器人、AI 助理太过于机械了,都在简单的执行命令、查询等工作,像是进行问答一样,一次只响应一件事,比如提供天气预报、播放音乐这类工作。遇到稍复杂的问题,需要跟上下文联系的事情上,目前的 AI 助理则一直不甚理想,比如提前告知不喜欢恐怖片,但是再次问推荐电影时依然可能会被推荐。
但微软期望中的 AI 助手并不是这样,不应该局限于一次响应一个命令的交互,而是可以联系上下文,甚至过去的内容,以一个更自然的聊天过程中提供信息和服务。
这是 Semantic Machines 在 2016 年放于公司官网的截图,从这张图中我们能够看到 AI 更为主动的提出了出行方式、预算等问题,并且从复杂的信息中做出了个性化的推荐、判断。据 TechCrunch 称,在 2016 年的实际体验比图片上要更丰富,该 AI 还能够回顾之前的预订记录,用来复用。
这种拥有记忆和联想、能够回答或预测问题、主动提出建议、个性化推荐的 AI,微软将其描述为“一种革命性的新方法来建立对话式 AI”,而这就是微软所想要的“对话式 AI”。
AI 助理
我相信你想要的是一个可以联系起整个对话的助手,而不是只能对单一句子进行反应的 AI。——Dan Klein,Semantic Machines 联合创始人
如何从“蠢”到“贴心”,可以预见的,这将是 AI 助理想当长期的致力方向,而在这条路上,每一家选择都方向都不同。比如微软及 Semantic Machines 就更倾向让人与 AI 实现探讨一样的交流,而他们所作的就是让 AI 在解构语义的同时拥有“记忆”。
当然,这条路上并不孤单,其实无论是 Apple 和 Google 似乎都有向这方面发展的趋势。
Apple 此前曾收购的一众 AI 科技公司当中,Vocal IQ 虽然在大多报道中都提到其对语音识别颇有建树,但其实其在自然对话上也有一定成就。而 Init.ai 除了擅长提取数据和自动应答之外,还涉及从整个对话线程中分析含义和情绪的研究。
而对于 Google,即便不算其收购了擅长意图辨识、上下文语境理解的 API.AI,仅看当年 Google I/O 上第一次演示 Google Assistant 时的 Demo 就知道 Google 想做什么:
- User:OK Google,今晚有什么好电影?
- Google:(列出一堆今晚上映的电影)
- User:我要带熊孩子去。
- Google:(新的结果中以儿童片为主)。
- Google:要看哪一部电影,给我你订四张票
- User:xxx。
- Google:(取票二维码)
在 Demo 中可以看出,Google Assistant 能够主动的、有一定记忆的 AI 助理——询问电影及票数。而近年 Google Assistant 虽然没展示出更进一步的效果,但今年公开的 Google Duplex 技术在让我们惊喜的同时,也让我们看到 Google 依然在人机自然对话上努力着。
当然,非谷粉们也不要对 Google Duplex 太过纠结,毕竟这功能想要落地还要经历一系列考验,谷粉们同样也还处在从人工智障中挑着智能用的状态中,比如下面这个情形从 2016 年至今还存在着:
题图来自:Wikimedia