2015是深度学习框架的黄金一年,到了2018年,我倒是感觉已经进入稳定期。两个月前跟tensorflow团队聊了一次,在讨论未来五年大方向时,包括jeff dean在内都赞同框架本身已经是进入稳定期,tf因为有包括搜索和广告在内的重要用户,所以大变动可能性不高。mxnet同样也是这样,amazon内部和多个大的aws用户的产品都依赖mxnet。可以预见,未来的大趋势是让前端更好用,更加稳定,而且不断改进性能,特别的是新模型和新硬件。
同时,我们也注意到深度学习应用的普及在加速。很大一部分新用户其实不关心是用什么框架,而是如何快速上手某个算法,并应用到自己的研究或者公司项目中去。所以一年前开始mxnet社区开始了下面这四个项目:
- 面向初学应用的深度学习教程:动手学深度学习 – 动手学深度学习 文档。过去一年里这个网站有超过一百万的浏览,PDF也被下载十万+次。同时配套社区的评论也超过了五千。
- 快速上手最新的CV和NLP模型:GluonCV: a Deep Learning Toolkit for Computer Vision,http://gluon-nlp.mxnet.io/ 这两个项目复现了数十篇重要论文,有些模型比目前最好的公开版本还要好,也做了一些研究性的工作。之后会写blog来介绍。
- 2018年是新AI硬件涌现的一年,预计之后几年还会加速。mxnet社区分流了很多人力去开发http://tvm.ai/ 。例如天奇在过去一年半主要在做TVM。TVM使得训练好的模型能够很简单的高效的部署到各个平台上(Intel CPU/GPU,Nvidia GPU,ARM CPU/GPU,TPU类似的新硬件)。目标是“train once, deploy everywhere”
我的个人建议是,框架只是一个工具,是为应用服务。我们的目标应该是深度学习本身,包括了解各个算法,知道state-of-the-art中的各种细节,和懂得如何将技术应用到实际中去。在学习算法的过程中了解框架的使用,从而使得你的开发更快。所以,如果你想:
- 学习深度学习技术,可以参考《动手学深度学习》这个教程。
- 有了一定的知识,而有关注的模型。如果这个模型刚好在GluonCV和GluonNLP中,可以去了解重复state-of-the-art结果的各种细节和trick,并用它们来进行快速开发。
- 想知道如何部署训练好的模型,特别是关心性能和新的平台,可以参考TVM。
如果你有不同的想法,欢迎跟我们留言 🙂
来源:知乎 www.zhihu.com
作者:李沐
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 12 个回答,查看全部。