腾讯云开启音视频技术下半场

打开找房软件的VR看房,点击地面上的标点进行移动,你可以走进客厅查看沙发的摆放和布局,走进卫生间丈量一下具体的大小,你还可以走进卧室看看午后的采光,甚至你还可以跳出场景查看整个房间的三维模型,或是在线邀约经纪人进行实时带看讲解。

这是音视频通信技术应用场景的一种。在这其中,长时通话的实施性及弱网下的稳定性如何,是否通过一系列算法实现了音视频的QoE,最多可以容纳多少人同时在线,以及在场景化方面是否拥有一系列的个性化功能,都作为了音视频在场景化应用的技术指标。

过去一年以来,随着越来越多的公司因为疫情将业务从线下搬上线上,音视频技术作为云技术的底层技术也逐渐走到台前,市场迎来了更广阔的发展。

典型的音视频场景更多。诸如疫情期间大火的视频会议软件Zoom和腾讯会议,今年年初线上音频应用Clubhouse,移动直播、在线长短视频……背后都应用着这项技术。

Timing是国内第一个做在线自习室场景的应用,用户可以在Timing里面创建联线的学习房间,用户可以邀请好友和有共同学习目标的陌生人一起到这房间里面,大家可以对着视频讨论,边写作业边讨论。这其中,在线自习室的场景里面有大量的实时音视频沟通,这些都是基于腾讯RTC产品来进行构建。Timing公司——氪细胞CEO郭向云也强调了他们和腾讯云RTC类型产品的深度合作。

最近一到两年以来,市场上有这样需求的企业并不少。517日,腾讯宣布正式成立腾讯云音视频品牌,同时发布三合一的RT-ONE™网络。该网络整合了腾讯云实时音视频通信网络(TRTC)、即时通信网络(IM)以及流媒体分发网络(CDN)三张网络,为业界最完整的音视频通信PaaS平台构建基座,面向泛互联网、教育、零售、泛娱乐等行业需求提供服务。

随着音视频成为很多线上公司的技术基底,腾讯云也正式开辟了音视频领域的下半场。

我们可以说是业界唯一一家同时具备实时通信网络、即时通信网络和流媒体分发网络于一体的云厂商。腾讯云一位人士称。

20年的内功修炼

腾讯的音视频技术最早要追溯到20年前,QQ时代。

据品玩了解,腾讯在1999年深入这个领域,在2011年成立音视频中心,2016年音视频实验室成立,2017年的数据显示,QQ的月活跃用户超过8亿——在这背后,QQ用户每天的音视频通话时长达12亿分钟。

1999年,QQ前身OICQ在聊天对话框中首次加入音视频功能,人们可以开始在QQ上拨打语音电话。

QQ对于音视频双向通话的稳定性提出了更高的技术要求,但起初腾讯是采购外部技术,但一旦出现技术难题,它本身就变成了一个黑盒子,这坚定了腾讯在音视频技术上持续投入的决心。

黄斌刚加入腾讯时在QQ后台部门即通平台部工作,那时候部门的首要任务就是如何支撑好QQ的海量并发全球互联,比如海内外的用户需要流畅的视频沟通,那个时候QQ视频通话的画质不见得非常好,但是非常流畅,不论你是在国内还是国外。这个过程中团队积累了丰富的音视频通信技术栈能力。这是腾讯音视频技术的第一阶段。

2015年开始,移动互联网已过萌芽,4G和智能手机逐渐普及,技术和媒介的更迭创造了新的业态,流媒体技术和移动直播成为市场上新的热点。在普及的过程中,技术人员们也发现,网络连接的稳定性逐渐成为了一个技术问题。

比如直播中音频和视频可能出现延迟,但人们可能一般会简单总结为带宽问题。殊不知,这背后可能涉及到的是网络带宽检测、网络丢包、抖动以及如何自动平衡视频质量和传输速度的带宽检测等更细节的技术问题。

音视频技术应运而生——其实就是因为背后互联网数据传输方式的变化。互联网的应用往富媒体的方向演进,背后随之而来的技术更迭是编解码、带宽以及终端性能的几方面的变化。

这正是以QQ为代表,深耕音视频多年的腾讯的强项。后来,即通平台部将IM后台、音视频后台等几块以开放接口形式提供给第三方使用。这些音视频通信技术汇入了云服务的潮流,成为腾讯云To B成长的排头兵。腾讯云视频云也从一个原生的To C技术团队从头开始创业,经历了组建团队、跟客户磨合、积累技术解决方案、复制到整个行业的过程,转变成为一个To B商业化产品团队。

黄斌称,无论是2016年、2017年的直播风口,还是20182019年的短视频,又或是这几年音视频从泛娱乐发展到各个垂直行业,音视频成为了各个行业的基础设施。一项20年前开始的技术在最近奇妙地与时代产生了共振。

换句话说,腾讯抓住了直播和短视频的机会,实现了基础技术的演进、平台和产品的积累和丰富,针对各行各业垂直行业的场景和解决方案,并且和越来越多的行业合作伙伴落地了更多的实际应用和案例。据了解,腾讯云目前已经覆盖了国内90%音视频客户,视频云解决方案市场份额位列行业第一。

为何要统一为RT-ONE?

实际上,这里最好做一个概念上的区分。

传统通信在向互联网通信转变的过程中,分类出了更多的概念。比如即时通讯(Instant MessagingIM),主要基于发送者到接受者的即时聊天消息传输,强调消息的可靠性和送达率,而实时音视频(Real Time CommunicationRTC),多应用于互动直播、视频会议等场景,满足实时的通信需求,强调低延时和接通率。

而腾讯云音视频品牌发布的RT-ONE网络提倡的是一站式满足需求,整合腾讯云实时通信网络(TRTC)、即时通信网络(IM)以及流媒体分发网络(CDN)三张网络。

据腾讯云介绍,CDN则负责通过海量加速节点实现了低延时、超高画质、大并发访问量的需求。三方融合在一起,腾讯云提供的价值因此与众不同。

为什么要统一为一个RT-ONE解决方案?

腾讯云副总裁李郁韬在接受品玩采访时表示,多数音视频需求要搭建三个网络,这是底层需求,而RT-ONE网络可以一站式满足需求。

2020年,一家使用腾讯云技术产品的公司宣布要将线下的工作全部搬向线上,除去更大流量的CDN需求,他们也需要构建IMRTC网络。

腾讯云副总裁李郁韬对品玩称,后疫情时代,腾讯云也是在接触客户的时候,发现这3个需求是并存的。而且这3张网有很多的共通性:它们的基础设施天然就是一起的,从IDC到网络构建都在一起;而从技术能力来看,3张网都需要有就近接入的能力、有海量调度的能力和有传输优化的能力。正是基于这几个点,腾讯云把3张网融合在一起。

品玩了解到的另外一个案例是:2020年,有一家厂商在对接市场CDN服务时也出现了RTC的需求,但公司就找了两组人对接两个需求,操作流程和技术难度上都比较大。

郭向云在选择腾讯云音视频解决方案之前也综合考虑过市场其他几家供应商之后,他认为腾讯云还挺有性价比很平衡

我们之前和别的厂家合作的时候,要么响应不及时,要么就是价格过高,很难有像腾讯云这样,几方面都做得特别平衡的厂商,所以整体来看,性价比确实是我们考量特别重要的维度。但是不仅仅是价格,还包括不稳定之后所造成的损失和解决速度过慢造成的损失。

实际上,平衡确实是腾讯云相比其他一些提供类似服务公司的优势。疫情期间,腾讯云音视频在在线教育(比如腾讯会议、腾讯课堂)和电商直播等新领域上取得快速突破,这些自身的案例正是对其技术能力的公开验证。

音视频市场后续

在过去一年时间,在线教育显然算是疫情催生最明显的快速增长行业。李郁韬认为,如果按正常发展的话,他估计还需要3—5年才会达到线下往线上搬的过程。

疫情催生的行业不止在线教育。医疗、金融、政务民生和工业物联网都是音视频技术可以覆盖的场景。

不过,音视频技术的发展和市场趋势也必须要回应一个问题:如果疫情问题得以解决,市场是否会继续保持强劲的增长?

此前,品玩一篇文章中介绍过另外一家音视频巨头——声网。2020年疫情之下,全球范围内对于实时音视频技术的爆发式需求在一定程度上促成了声网在服务规模上的质变。一年内声网的实时音视频月均用量超过400亿分钟,累计纯RTC(real-time communication)PaaS实时音视频分钟数超10,000亿分钟。目前公司市值在46亿美元左右。

李郁韬所负责的音视频平台的业务目前不仅在服务外部客户,在腾讯体系内的绝大部分音视频的服务——比如微信视频号的直播,也是他的团队在承接。他认为音视频技术的市场空间主要分为三个部分:一是边缘计算,国内市场会在数百亿的市场规模,全球估计在500亿左右;二是音视频的直播、实时音视频两个加起来,跟实时相关的领域,大概会是边缘计算的十分之一左右,有超过50亿的市场份额;三是RTC多人互动实时音视频领域,腾讯预估今年的市场空间大概在15-20个亿,未来每年会有30%-40%的复合增长。

他认为,全球的资本市场对这个领域都非常看好——因为实时音视频是非常核心底层的基础设施,只有这个东西存在,你才能够实现大家在线上无缝的沟通,所以这就会被大家描绘成未来的基础设施之一。

当然,这也会牵出另一个问题,与垂直企业相比,大型公有云厂商提供这类服务能实现多大的差异性?

腾讯云把市场提供的能力比作十八般武艺,有时候可能会被一个直拳在某个领域打倒,但是随着时间的演变,单做一个领域是没有办法去做触类旁通的——很多招式都是基于内功,所以腾讯云未来的提升会更快。

腾讯云当天演示的另外一个重要场景是云游戏。这个场景也刚好印证了更全面更平衡这个趋势。云游戏涉及到了很多要素:一是内容版权,二是基础设施(边缘计算、服务器、GPU是否具备足够低的成本和足够高的性能),三是音视频技术和音视频云服务是否配套。

而腾讯的独特性就在于此——它又是唯一一家同时拥有3个要素的云厂商。