一知智能完成超亿元B轮融资,算法驱动场景化服务升级

WechatIMG72_meitu_1

【猎云网北京】6月20日报道

近日,一知智能完成超亿元人民币B轮融资,本轮融资由凯泰资本、亿联凯泰以及中信证券投资共同参与。

据了解,本轮融资资金将用于算法开发、产品升级、团队建设与新业务开拓。

一知智能创始团队表示:五年来,一知智能通过领先的人工智能技术建设企业数字化生产力,深度服务核心行业场景,赋能企业智慧数字化经营。感谢本轮投资人信任,感谢每一个与一知智能同行的伙伴,一知智能将始终坚持做正确的事情,并用正确的方法找到产品研发与业务增长的价值实现最短路径,让越来越多的人可以“简单工作”,让人回归人的价值。

凯泰资本表示:营销领域向来是诞生新技术、新产品的最佳土壤,规模化触达用户并进行精细化运营已经应用到各行各业。数字经济时代,以AI和大数据为核心的新型产品在大量涌现,满足市场需求的同时,也为人们的生活方式带来改变。

一知智能在智能外呼及智能营销领域处于领先位置,凯泰资本投资一知智能,希望将大数据算法与智能语音交互技术融合创新,推动商业营销领域的数字化变革和智能化连接,为创造者经济生态赋能,同时助力团队不断深化技术迭代,完善产品矩阵,构建智能化营销生态。

亿联网络联合创始人卢荣富先生表示:人机交互语音技术在商业场景落地,离不开算法、算力和数据三者的结合。基于强大的AI能力,赋予机器智能感知和智能认知能力,模拟人工完成大量、简单、重复、枯燥的任务,是数据智能在认知形态的高级运用。此次亿联凯泰基金对一知智能的战略投资,是基金积极布局数据智能运用的重要一环。我们非常认可一知智能团队在人机语音交互领域的研发能力、创新能力和商业落地能力,希望通过此次投资行为,助力一知在人机语音交互技术的研发和市场推广,成为业内领先的人机语音交互服务商。

中信证券投资表示:一知智能是人机语音交互赛道优秀的企业级智能服务AI公司,创始团队脱胎于浙大人工智能研究所NLP团队,具有深厚的技术实力。经过多年的技术研发和市场探索,一知智能在语音识别ASR、多轮对话管理、语音合成TTS、语义理解及数据挖掘等技术领域具有较深的技术积累。基于此,公司构建完成 AI语音+RPA+SCRM的产品闭环,基本形成了一体化的智能运营管理解决方案。目前,公司已在泛消费领域得到KA客户的广泛认可,并处于高速发展期。中信证券投资认为,我们看好一知智能的发展,在公司创始团队的带领及全体一知人的拼搏努力下,一知智能有望成为未来人机语音交互领域的领军企业。

一知智能成立于2017年,创始团队来自浙大人工智能研究所,有200多名员工。公司于2019年2月成立浙大·一知人工智能联合研究中心,围绕多模态人机交互展开产学研结合。公司高度重视人机交互底层技术研发,在语音、语义领域与华为、微软亚洲研究院、阿里达摩院等多家企业进行联合研发,并进行相应工程化落地。

一知智能是一家专注于人机语音交互技术,赋能企业触达用户并实现精细化智能运营的SaaS服务商。公司凭借自研的语音识别、语义理解和语音合成三大人机交互核心算法,为零售、生活服务等泛消费行业,以及公共服务提供AI场景化智能服务。公司曾先后获评杭州市领军型创新团队、浙江省高新技术企业研究开发中心等。

近年来,在AI产业落地的浪潮中,智能语音交互因其交叉学科属性,又包含多项高难度AI技术,至今依然有较高的应用落地门槛。而从场景需求上来看,AI规模化用户触达,已证明是时代新基建下的新一代生产力工具。从百万级消费会员的千人千面营销与服务,到政企短时高效的定向通知和信息采集,投入人工智能技术也已成为企业服务实现降本增效的趋势之一。因此,如何迅速适应场景,提升AI交互体验效果,成为业内人机交互服务商进行技术优化的首要考验。

一知智能定位于技术研发型服务商,通过人机对话技术的不断迭代来做深消费品牌的会员智能化服务。从这一定位出发,近年来一知智能在核心技术上有了以下升级:

·ASR:在语音识别提取的过程中,一知智能在webRTCNS(降噪处理代码)的框架基础上,对环境音降噪与人声增强进行双向优化,实现双模并行。同时,公司使用MFCC+resCNN提取算法方案,细化机器人在性别、年龄与情绪识别中的感知颗粒度。

在通用场景识别的E2E(端到端)模型中,一知智能在传统语音识别架构AED(Attention-Encoder-Decoder基于注意力机制的编解码模型)的基础上做了场景化升级,自研了基于上下文文本定制增强模块的Context-Aware Encoder算法,在模型训练过程中,使用额外补充的场景文本作为强化信息,让模型建立起针对特定输入的强化架构,提高特定垂直场景中的语音识别率。

体现在场景应用上,该项技术能过滤沟通中的环境噪音干扰,并使机器人能快速识别用户的年龄、性别与情绪,根据当前情景选择最合适的对话内容。

·NLP:一知智能已于日前升级了新一代对话架构NLP2.0。在实现意图识别、情感识别、问答识别、任务对话、智能纠错、知识图谱等NLP常见任务之外,新的对话架构还提出了在泛消费领域的专用大规模预训练语言模型“EAZI”——在Transformer架构基础上,基于语言学知识与大量垂直数据,以NLP算法驱动语义理解,改进模型架构与预训练策略,并且针对大量的消费领域信息与公司已积累的消费场景对话进行专项训练。

体现在场景应用上,此项创新在问卷调研、用户满意度调研等语音交互需求中,解决了时间、地址、组织名称等实体信息提取的难点,机器人在应对消费场景客户调研中的复杂问题时,也能快速找到对应答案。

·Fastspeech 系列语音合成算法:浙大·一知人工智能联合研究中心,联合微软共同推出FastSpeech1和FastSpeech2两代算法系列,集合了语音合成、情感合成和语音克隆算法,以及相应的语气词回复生成算法。

该算法系列相较于谷歌的tacotron两代算法,在同等实现效果上,速度分别提升了38倍和260倍。体现在场景应用上,机器人在沟通中能够逼真地模拟人类情绪,并能在识别对话方情绪后及时给出回应。

关于公司的商业模式与应用,一知智能CFO张蕾介绍到,一知智能为客户和用户提供强大的AI能力和深度场景化智能服务。目前,公司已深入全国20多个省市。所涉及场景包括美妆、宠物、母婴、食品、鞋服等多个零售行业,线下商超、商业综合体、餐饮、影院等多个本地生活服务行业,以及金融、公共服务相关服务行业。公司的服务场景主要包括:会员激活、邀请加微信私域、生日&会员节关键时刻打造、大促节点活动通知、公安反电诈、疫情回访通知、银行逾期提醒等。目前已为300余家头部消费品牌、100余家地市公安局提供服务。在泛消费领域,公司已与雅诗兰黛、薇诺娜、Babycare、奶酪博士、Bosie 等消费品牌达成合作,主要需求方为消费品牌的电商、用户增长及营销部门。核心产品以广告投放逻辑按季度/年充值服务费,按CPA结算,收取成功触达费,中大型客户的年框合作客单价为50至100万元不等。