轨范员尊称他“大年夜神”李沐却说:比我厉害的人多了_深度_博士
个中有个回答是:有点晚。我家娃一岁开始就开始读Paper,现在已经可以闇练敲键盘写MXNet代码,虽然语法缺点还比较多。他妈妈在Google上班是用TensorFlow,但他对MXNet兴趣更大一点。不过比起敲代码,调参他更在行。
随回答还附上了一张小孩在电脑前玩耍的照片。
拿现在盛行的话说,如此“凡尔赛”,非但没被怼,截止到目前,知乎上显示已有超过2450个赞。
为什么这么反常规?
不仅是由于这个回答很皮,还由于答主是李沐!
1
从李沐《博士这五年》一文
看天才少年的人生选择
李沐是谁?
他是硅谷华人技能人才,深度学习框架MXNet作者之一,也是《动手学深度学习》作者之一。
2004年,李沐从打算机系ACM班毕业。上海交通大学ACM班因此培养打算机科学家而有名的“特色班”,自大学起李沐就开启了他的开挂人生。
这是李沐的职业生涯路径:
顺带一提,上面李沐提到的“孩子的妈妈”,也便是他妻子,也是业内很厉害的人物。2012年,李沐选择离开百度前往CMU深造时,他妻子当时也被MIT录取,这也成为了他选择去CMU学习的一大主要缘故原由。后来李沐的妻子入职Google。
李沐究竟是个若何的人?他在人生主要节点上是如何做选择的?这些答案,可以从他的《博士这五年》一文窥见一二。
「答辩前一天的晚上,
我想了两个问题,
一个是“博士收成最大的是什么”,
另一个是“如果可以重来会怎么办”。」
——李沐《博士这五年》
01 读博收成最大的是什么?
2012年8月12日,李沐早上去公司开完会,中午正式辞去百度高等研究员的事情,奔赴机场,准备进入CMU研读博士。
“在百度的经历让我学到了很多,也更清楚地创造了自己的短板。但是当时海内做系统方向的人比较少,以是我还是选择了去美国连续攻读博士。”
初到美国,李沐是迷茫的, “2012年8月提着一个行李箱降落在匹兹堡机场。没找住的地方,也不知道CMU该当怎么去。对未来一片迷茫,但充满乐不雅观。” 经由5年学习,他自己总结收成很多:“这五年韶光自然学到了很多东西,例如系统地学习了分布式系统,紧跟了机器学习这五年的发展,写文章做幻灯片做报告水平有提升,代码能力也加强了些。自傲上有所提高,以为既可以做一流的研究,也可以写跟大团队PK的代码。只要努力,对手没什么恐怖的。”
除了学术收成、专业能力提升、自傲心提升,还有不少人脉的积累:“CMU课程比较重,博士须要学8门课,每门课事情量巨大。而且哀求做两门课助教,做助教比上课更累。除了上课,更主要是做研究。我去CMU的时候Alex那时还在Google,而且没经费,以是把我丢给了Dave Andersen。于是我有了两个导师,一个做机器学习,一个做分布式系统。”
02 如果可以重来会怎么办?
对付这个问题,李沐在《博士这五年》里写到:
“第二个问题的一个选项是当年留在海内会怎么样?当年百度的伙伴们多数现在都做得很好,都在引领这一波AI的潮流,乃至有好几个创造了上亿代价的公司。以是从金钱或者影响力角度来看,一贯在工业界也不差,说不定现在已经是土豪了。
不过我以为还是会选择读博。赢利往后还有大把韶光可以,但是能花几年韶光在某个领域从入门到精通乃至到推动这个领域发展的机会就一次。站在这个领域的高点会创造天下虽然很大,但实在其他领域也利用差不多的技能,有着同样的发展规律。博士期间领悟到的学习的方法可以在各个方向上都会大有作为。”
“在某个领域从入门到精通乃至到推动这个领域发展”是他在博士期间以及日后事情中做的重点事变——出于对MXNet未来发展的考量,在毕业后的职业选择上,李沐放弃了加入Google的机会,而是去了Amazon,一贯任职至今,展开环绕MXNet的干系项目,后又写出了用MXNet实现的教材——《动手学深度学习》。
作者: 阿斯顿·张(Aston Zhang)
李沐(Mu Li)
[美] 扎卡里·C. 立顿(Zachary C. Lipton)
[德] 亚历山大·J. 斯莫拉(Alexander J. Smola)
2
MXNet的创建与
《动手学深度学习》的演化进程
博士学习第三年,李沐跟陈天奇在GitHub上创建了一个叫DMLC的组织,用来加强互助和沟通。真正让DMLC社区壮大的项目是第三个,就叫做MXNet。当时,李沐同时在做difacto和MXNet两个项目,在同吴恩达的一次见面之后,李沐屈服了他的建议,把全部精力放在了MXNet。
博士学习第四年,李沐开始以兼职的身份去了Amazon,领着团队做些MXNet开拓和AWS上深度学习的运用,毕业后也留在了Amazon。
2018年,李沐及其团队创造一个问题:AI虽然火,但是门槛太高,导致能参与到落地的用户并不多。他们意识到自己当时的义务便是把这人工智能的生态圈做得更大一些,于是萌发了一个更加正式的质量更高的MOOC的想法。
但由于担心线上课程不能实时得到反馈,以是李沐和其差错决定先去伯克利(Berkeley)教一遍积累些履历。2019年春季李沐跟Alex Smola一起在伯克利传授教化,传授教化后常日他们会在一两天内把课程***上传到YouTube,以供更多人免费学习。
授人以渔,这成为了李沐的新目标,他随后出版的交互式书本《动手学深度学习》也是为了实现这一目标而撰写的。
2017年,市情上并没有特殊适用的深度学习入门书,李沐和其团队想要一本既能讲事理、又有实现和实际利用、不断更新、而且随意马虎读的书,于是就开始动手写一本深度学习的教材。经由两年摸索,2019年,《动手学深度学习》一书逐渐成熟,英文版和中文版相继成型,首先发布在博客上。
这本书代码的实现很多是基于MXNet(一开始的目标是为MXNet写个好点文档),李沐和团队也考虑过要不要供应一个PyTorch或者Keras的版本。后来创造这个担心比较多余。框架便是一个工具,工具之间的那些不同带来的困难比起理解模型和调出结果来小很多。课上创造就算是没有打仗过这些工具的学生,用MXNet做作业,然后在基于不管用啥框架实现的现有算法再开拓做项目并没有多大困难。或者说困难都不来自工具本身,特殊是算法实现都在课上讲过一遍的情形下。
随着影响力变大,李沐团队感到任务越来越大。他们的目标也从“为MXNet写个好文档”变成“让更多人能随意马虎学习并利用深度学习技能”。今年六月他们朝这个目标迈出了主要的一步:为本书的前7章,从线性模型到当代卷积神经网络,供应基于PyTorch的实现。
授人以鱼不如授人以渔,不丢脸出,这也是李沐的一项过人之处。他的专业技能,他的业界长远发展眼力,令人折服。
不过,对付别人的夸赞,李沐始终保有一颗平常心,“比我厉害的人多了,千万别叫我大神”。
3
想研讨深度学习?
不妨从这本备受赞誉的书开始
除了李沐传奇的人生引人关注与倾慕外,李沐的《动手学深度学习》也被当作业内入门深度学习的精良教材。这本由李沐、美国伊利诺伊大学喷鼻香槟分校打算机科学博士 Aston Zhang、李沐在 CMU 的导师 Alex Smola ,以及来自社区的 100 多位贡献者合著。书本一经推出便大受欢迎,一度登上京东科技类图书热销榜 Top 1 。
自《动手学深度学习》面市以来,就备受学术界与工业界赞誉:
截至目前,已有140多所院校利用《动手学深度学习》这本书作为教材。
01 全面先容深度学习的方方面面
这本书全面先容深度学习从模型布局到模型演习的方方面面,以及它们在打算机视觉和自然措辞处理中的运用;不仅将阐述算法事理,还将基于Apache MXNet对算法进行实现,并实际运行它们。
本书的构造图
书的每一章用笔墨、数学、图示和代码来多方面先容一个知识点。它是一个Jupyter记事本,可以独立运行。包含20个旁边的笔墨和代码块,可以15分钟旁边读完。
02 搭配***+编程练习一起利用,还可随时谈论
这本书有一个非常显著的特色:互动性+实践性,紧张面向在校大学生、技能职员和研究职员。在校学生和老师可以申请用于本书学习或传授教化的免费打算资源。
书本将笔墨、公式、图像、代码和运行结果结合在了一起,不仅在阐述知识和事理,同时还有课件和***进行演示。
教程已在GitHub上开源,动手能力强的同学自己可以考试测验一下。不过须要把稳的是,所有markdown文件须要在提交前打消output,它们会在做事器上重新实行天生结果。以是须要担保每个记事本实行不要太久,韶光不超过十分钟。
实行无误后直接用三种格式发布在网上:含有实行输出的Jupyter记事本,可以直接浏览的HTML,和适宜打印的PDF。
每章后面都有谈论环节,读者可以随时进行谈论。
03 根据读者的反馈进行补充讲解
全书补充知识浩瀚,李沐会根据读者的反馈进行补充讲解,以便让书本更加适用。
例如,在《动手学深度学习》出版后,常常有读者反响自己的数学根本薄弱,难以理解深度学习。为此,李沐团队和亚马逊的机器学习大学互助,专门增加了“深度学习的数学”一章,详细阐述理解深度学习所需的数学背景知识。
同样,这一数学篇章也沿袭了全书的书写风格:
同时,他们完备重写了“预备知识”一章,全面改进内容的准确性和可读性。例如,在不过多利用术语的条件下,全章开头试图从多个角度引发读者阅读各小节的兴趣:
再例如,今年7月《动手学深度学习》新增TensorFlow实现。
回过分来看,李沐的一系列动作,实在都离不开我们之条件到的他的初心,“在某个领域从入门到精通乃至到推动这个领域发展”。
作者: 阿斯顿·张(Aston Zhang)
李沐(Mu Li)
[美] 扎卡里·C. 立顿(Zachary C. Lipton)
[德] 亚历山大·J. 斯莫拉(Alexander J. Smola)
动手学深度学习
作者:阿斯顿·张(Aston Zhang) 李沐(Mu Li)[美] 扎卡里·C. 立
当当
内容简介:
本书不仅阐述深度学习的算法事理,还演示它们的实现和运行。本书共分3个部分:第一部分先容深度学习的背景,供应预备知识,并包括深度学习最根本的观点和技能;第二部分描述深度学习打算的主要组成部分,还阐明近年来令深度学习在多个领域大得胜利的卷积神经网络和循环神经网络;第三部分评价优化算法,考验影响深度学习打算性能的主要成分,并分别列举深度学习在打算机视觉和自然措辞处理中的主要运用。
本文系作者个人观点,不代表本站立场,转载请注明出处!