英特尔在 AI 芯片领域又出手了。这家处于转型期的半导体巨头于 2019 年 12 月 16 日宣布,以 20 亿美元收购以色列芯片制造商 Habana Labs。
此前,Habana Labs 总计融资约 1.2 亿美元。英特尔投资曾在 2018 年 11 月领投了 Habana Labs 的 7500 万美元 B 轮融资。
致力于开发 AI 推理芯片和 AI 训练芯片的 Habana Labs,由 PrimeSense 两位前高管 David Dahan 和 Ran Halutz 于 2016 年创立。PrimeSense 是一家 3D 传感器创业公司,于 2013 年被苹果以 3.6 亿美元收购,其技术后来被应用在 iPhone 的原深摄像头上。
被收购后,Habana Labs 将作为一个独立业务部门,由原来的管理团队领导,归属在英特尔数据平台事业部旗下。这个事业部主导了英特尔的数据中心业务,是英特尔“以数据为中心”转型策略的排头兵。
英特尔数据平台事业部执行副总裁兼总经理 Navin Shenoy(孙纳颐)说:“此次收购推进了我们的人工智能战略,即:从智能边缘到数据中心……通过高性能训练处理器系列产品和基于标准的编程环境,Habana Labs 大大增强了我们数据中心人工智能产品的实力。”
Habana Labs 有什么能耐?
Habana Labs 的拳头产品是两个 AI 专用芯片:AI 推理芯片 Goya(戈雅)和 AI 训练芯片 Gaudi(高迪)。“训练”是指用海量数据来调整 AI 的算法,而“推理”则是将已训练好的模型来理解或预测事件。
戈雅和高迪都是西班牙的艺术家,前者在绘画艺术史有所成就,后者引领了建筑艺术的发展。Habana Labs 表示,做产品如同做艺术,这样的命名方式代表了艺术与科技的结合。
由于都是 AI 专用芯片,所以在计算 AI 模型的性能上,两款芯片大大超过了传统的 CPU,并且和 GPU 相比也有优势。
2018 年 9 月发布的 AI 推理芯片 Goya ,在 ResNet-50(深度学习主流网络结构的一种)模型的推理测试上,其图片处理性能近 10 倍于普通 CPU,4 倍于英伟达 Tesla T4。Tesla T4 是英伟达于 2018 年 9 月发布的一款专为 AI 推理设计的 GPU。
此外,Goya 在能耗和延时上也胜过了 Tesla T4,几乎可以实时处理图片。
2019 年 6 月发布的 AI 训练芯片 Gaudi,在 ResNet-50 模型上可以提供每秒 1650 张的图片处理能力,功耗仅为 150w 左右。
而英伟达 Tesla V100 在 ResNet-50 模型上的处理能力为 600 张/秒,功耗为 300w。Tesla V100 是英伟达于 2017 年 5 月发布的专用于处理大规模计算的 GPU 加速器。
除了性能上的优势,Gaudi 的另一个杀手锏是在芯片里集成了 10 个 100GbE 带宽的 RDMA 以太网端口。
RDMA(Remote Direct Memory Access)是一种内存访问技术,让计算机可以直接存取其他计算机的内存,而不需要经过处理器耗时的处理。而以太网则是一种通信协议,优势是兼容性和分布式,主要应用于局域网。
RDMA 技术和以太网结合后,有更好的数据传输效率,可以大幅度加速深度学习的训练速度,缩短训练时间。
2019 年 3 月,英伟达以 69 亿美元现金收购以色列半导体公司 Mellanox(迈络思),正是看中了后者在 RDMA 和以太网方面的技术实力。
虽然 Habana Labs 和英伟达都在采用支持 RDMA 技术的以太网协议来加速深度学习训练速度,但两者在具体实现上还是有所区别。
Habana Labs 首席商务官 Eitan Medina(埃坦·麦地那)指出:“我们跟英伟达做得不一致的方面是,直接在单一芯片当中集成了十个支持 RDMA 的端口,而 Tesla V100 要支持 RDMA,必须要通过一个 PCIe(计算机和外部组件连接的接口)的交换,在外面再接一个支持 RDMA 的网卡,这样才能实现 RDMA 的功能。”
这意味着,购买了 Habana Labs 产品的客户,可以实现更大规模的并行计算。据 Habana Labs 给出的测试结果,在大规模并行运行的环境下,Gaudi 可以实现 Tesla V100 约 3.8 倍的性能。
借助并购,英特尔加速转型
自 2016 年起,英特尔启动了新一轮转型,将业务重心从 PC 芯片转向数据中心、AI、存储芯片和物联网等新业务上。其中,数据中心成为英特尔的基石业务。
而在数据中心行业中,AI 加速计算已经成为不可或缺的能力。英伟达就曾借助 GPU 加速 AI 模型训练的东风,大力发展数据中心业务,成为资本市场口中的“AI 第一股”。Google 也通过推出 TPU(张量处理单元,是一种定制化的 ASIC 芯片)来进军 AI 计算业务。
英特尔的 CPU 在 AI 加速计算上没有优势,因此通过收购来增强这方面的能力。
2015 年 6 月,英特尔以 167 亿美元收购当时全球第二大 FPGA 厂商 Altera。FPGA 全称“现场可编程门阵列”,是加速 AI 计算的其中一种技术路线。
收购 Altera 后,英特尔一直推动 FPGA 技术融入到自己的至强处理器系列,巩固了服务器市场。
2016 年 8 月,英特尔再次出手,以 4.08 亿美元收购了 Nervana。2019 年 11 月在人工智能峰会上,英特尔发布了首款云端 AI 专用芯片 Nervana 神经网络处理器(NNP)系列产品。和 Habana Labs 一样,NNP 同样覆盖训练和推理场景,分别是 NNP-T 和 NNP-I。
收购 Habana Labs 后,意味着英特尔同时拥有两个相重叠的产品线。有业内专家认为,此次收购或意味着 Habana Labs 的芯片表现强于 NNP。
耐人寻味的是,Habana Labs 汇报的对象是英特尔数据平台事业部执行副总裁兼总经理孙纳颐,而不是 Nervana 前首席执行官兼英特尔 AI 产品事业部总经理 Naveen Rao。
有外国媒体询问英特尔整合 Habana 和 Nervana 的计划,英特尔发言人通过邮件回复道:“我们将花些时间,结合客户们的意见,去评估 Habana 和 Nervana 的整合。