吴恩达专访：我的人工智能科研之路-虎嗅网

acg222 · 发表于 2020-3-6 23:06:10

本文来自微信公众号：AI科技批评（ID：aitechtalk），作者：蒋宝尚，头图来自：IC photo

作为斯坦福大学盘算机科学系和电气工程系的客座传授，吴恩达不停致力于深度学习的研究。

在差别的场所，他频频表现：深度学习另有很大的潜力，是一项被证实有用的技能，我们必要继承加大投进。

为此他做了许多积极：其与达芙妮·科勒一起创建的在线教诲平台Coursera影响了数百万的AI学习者；所开辟的人工神经网络通过观看一周YouTube视频，自主学会辨认哪些是关于猫的视频为人工智能范畴翻开极新一页。

克日，MIT的 AI 科学家 Lex Fridman 对吴恩达举行了专访，在担当采访的时间，从在线教诲平台Coursera谈到了初学者怎样进进AI范畴，并解说了他以为的最高效的“学习姿势”是什么样的。别的，其还回想了他的第一个博士生，并简朴先容了其时研究直升机的项目......

专访视频如下，由于视频过长，AI科技批评在不改变吴传授逻辑的环境下，举行了有编削的编译。

您现在装备暂不支持播放

1、在线教诲的早些时间

我在香港和新加坡长大，第一次打仗代码照旧5、6岁的时间，其时我学习底子的编程语言，将一些代码编进盘算机里，其时我也非常喜好做一些编码实例。

我在我的旧电脑上面实现我的想法，着迷于将讲义上的代码复现到电脑上，由于我觉着用编程资助我玩视频游戏非常酷！

年事轻微大点，我就和我的大夫爸爸就阅读相干的专家体系和神经网络知识，当时在盘算机里写代码，然后展示智能是真的很棒！

高中的时间，我在办公室做助理练习，期间做了许多复印（photocopy）的工作，其时我就想，假如能写一些软件来造一个呆板人来让一些工作主动化，那该多棒。

从当时起，我的许多工作都围绕着主动化这一主题睁开，直达本日。我仍旧以主动化为中央，乃至本日的呆板学习在写一些学习算法方面也非常精彩。别的，我在Coursera上也实验了将主动化应用到校园讲授上面。

我在斯坦福传授呆板学习的时间，每年会有约莫400名门生，每一年我都会在雷同的传授，拍摄雷同的讲授视频，乃至讲雷同的笑话。

我在想为什么我不消在末了一年拍摄的讲授视频，然后花更多的时间和同砚们创建深刻的关系？这开导了我的思索，然后我们发起了第一步的举措。

实在大多数人都不知道，我放在网上的讲授视频大多是晚上10点到破晓3点之前录制的。一开始的时间，压力很大，我们想过要放弃，但是有十万人注册，成千上万的人的等待促使我走向灌音棚，走向办公室。

开始录制之前都会调解我的授课逻辑，调解接待致辞，开着麦克风，然后开始录制，通常都会到夜里两三点，但是创作内容的想法鼓励着我盼望有许多人学习呆板学习。

我告诉我的团队，我们主要使命是做对学习者有利的事变，每当我往灌音棚走往，我脑筋唯一的想法是我能说什么，怎样才气让学习者尽大概的相识呆板学习概念。

我以为我们做了对的事变，我不停在对峙根本原则，做对学习者最好的事变，纵然学习者大概来自环球各地。

我很想资助任何对呆板学习感爱好的人进进这个范畴，你大概会好奇，为什么要发给这么多的时间来表明梯度降落，实在追念一放学习的根本要求就知道了：任何进阶技能都可回溯到底子概念。

固然，对人工智能感爱好的人非常多，这内里大概包罗开辟商，步伐员，他们大概来自天下各地。确定的是，感爱好的人数还会随着时间的推移而增长，全部的这些东西都不会凭空而来，全部一挥而就的乐成都必要花时间才气实现。

我第一次打仗到在线教诲是把我在斯坦福授课的视频传到YouTube上面，随后也建了网站，制作网站的利益是让我可以举行迭代，让我们实现一些想法。

其时非常高兴，尤其开辟了一个特殊的登录功能，即可以让多个人同时登录此网站，可以或许让多人同时看视频。当前的一些网站大多不支持此项功能，究竟假如你已经登录了，我再想登录，那么只有你注销才可以。

固然也有很多失败的教导，实在假如有一些东西看起来很棒，然后没有人利用，那么它现实上并没有你以为的那么棒。

2、呆板学习会像教诲一样遍及

整个呆板学习活动的鼓起，并不是凭空而来，越来越多的人在学习呆板学习，进进这个范畴的人还会影响他的朋侪，以是这个AI学习者的比例还会不停的增长。

尚不清晰AI开辟职员占总开辟职员的多少，但是占到50%以上的比例照旧非常轻松的。究竟AI不但涉及呆板学习建模，还要涉及呆板学习底子装备、数据管道等。就像本日的开辟工程师或多或少的都对“云”有些明白，但并不是都在工作里必要“云”。我以为这种征象以后在某种方式上会实用于AI开辟者。

曾多少时，只有一小部门人识字，大概你以为不是每个人都必要学会读和写，这些人只必要听就够了？但是当一个国家的人根本上都熟悉字的时间，这大大的促进了人与人之间的交换。

在盘算机方面，仍处于这个阶段，假如大家都熟悉代码，都晓得呆板学习，这在某种水平上雷同于识字教诲遍及。

但随着呆板学习和数据规模的上升，我发现的是，我以为在一样平常生存中，在工作中详细利用数据分析的人数非常多。假如你在谋划一家市肆，假如你能分析你的客户的贩卖数据，那么你的代价非常高。

在某种水平上这些人是数据科学家，因此，我以为呆板学习的数据迹象大概比软件工程更轻易进进发达国家。

3、无监视学习很紧张！

Peter是我的我第一个博士生，他有着评判性头脑，其时他的博士学位研究主题是用强化学习控制无人直升机，直到如今你都可以在斯坦福网站上看到这些视频。

这项研究非常难，有一些事变无法降服，比方当直升机倒飞时，你怎样找出位置？怎样定位直升机？我们实验了许多方法，但显然题目出在GPS硬件上，其时想过用两个GPS定位，但没有乐成。为相识读GPS信号，我们疯狂索复杂的专门硬件设置，履历了许多失败，末了办理方法接纳在地面上安装摄像头办理定位题目。

斯坦福当时候有许多强化学习的理论文章，但是现实应用并未几，以是我们的研究在其时非常著名。

我们本日大概又回到了原点，强化学习的希望现在云云令人高兴，但我们仍旧在探求更多的应用场景。

我非常喜好研究理论，我盼望我所做的工作会对人们产生积极的影响。我还记得，多年之前，我们和一位数学传授讨论的时间，当他说道他想做的事变的时间，他的眼里布满了小星星，他说我之以是研究数学，是由于它资助人们发现原形以及宇宙的漂亮。

以是，尽力支持以及带着恭敬看别人的观点非常棒，当我看到我的团队正在资助人们的时间，也会非常有动力。

这个天下上必要各种各样的人，我只是此中一个，并不是每个人都像我一样做事变，但是当我研讨理论大概实践的时间，假如我坚信这是一条资助别人的门路，满意感就会非常猛烈。

我们也有忽略的东西，那就是早期无监视学习的紧张性，在谷歌大脑的早期，我们在无监视学习上投进的精神远超有监视学习。

当前我们所知道的大部门都是通过有监视的学习来实现，从尽对有题目的论点来看，人类获取信息的方式是通过检察图像、收听音频和感悟他在这个天下上的履历。以是无监视的学习非常紧张，固然，这不是说有监视学习不紧张，究竟早在几年前，许多人以为这才是进步的方向。

但是我们对“规模”的探索大概是精确的，究竟规模可以或许为体系带来性能。我在斯坦福小组的名为Adam成员颠末实行发现，我们练习的学习算法规模越大，结果越好。为此他还画了一个图，并说服了我：当模子的规模比在GPU上所做的大的多的时间，便可以或许得到一个非常好的效果。

大概这是一种有争议的文化，其时有许多朋侪都说我寻求规模的活动非常糟糕。但是我发现，假如你想取得突破，你必须对你所做的事变有信心，在事变盛行之前做一些事变，会让你更有影响力。

4、数据集的规模和学习机制都很紧张！

实在数据集的规模和学习机制都很紧张，固然这依靠于特定的题目，现在已经有几个数据表明，在根本错误率方面，我们正在靠近或凌驾人类程度。假如我们看看近来利用你们的语言模子取得的突破，比方GPT-2和Bert，就会发现这是架构和规模的联合。

我们已经在治理cold thing方面在渐渐成熟，比方版本控制。但是我们在治理数据集方面并不成熟，比方软件上一些七零八落的数据题目。

高质量数据集也非常紧张，举个例子，当我们与制造公司互助时，标签不同等的环境非常多。对于大型互联网公司，有许多数据，错几个标签不要紧，但是对于小公司，并没有大量的数据，如果只有100个数据，却有10个错误标签，那么错误率就是10%，这对练习的影响会非常大。

5、初学者怎样进进深度学习范畴？

一个人是怎样进进深度学习范畴的呢？固然大多数都是自学但是仍得益于专业化的计划。什么是序列模子？什么是留意力模子？是不黑白得微积分才气明白这些概念，实在假如只在电脑上操纵两个矩阵相乘只必要高中知识就够了。

固然了，深进学习还必要线性代数的支持，必要相识非常根本的知识，相识一些编程。但是有人已经做了呆板学习的调用，以是举行深度学习非常轻易。

初学者在学习人工智能的时间，应该多实践，相识算法之间的差别之处，一开始不要费心往网络数据。

在学习的过程中要举行自我测试，花时间修改架构，实验新东西，高效的构建神经网络，但规模也不要太大，神经网络的规模要在你可付出的范围之内即可。你可以在前六个月创建一个完备项目，眼光不要只放在数据这一个小的方面。

必须动手构建实用的呆板学习的体系头脑框架，打个比方，我们在学习编程的时间哦，必须必须学习一些语法，Python也好，C++也好。但同样紧张的是，大概编码中更紧张的部门是明白怎样将这些代码融合在一起。什么时间应该在函数列中放置一些东西？你什么时间不放置？什么样的框架能让步伐员更加高效？

我记恰当我在卡内基梅隆大学读本科时，我的一个朋侪会先试着用代码来调试他们的代码。

他每一行都要留意语法错误。语法错误是可骇的，应该学习怎样调试。别的，呆板学习步伐中调试的方式与二进制搜刮方式非常差别。

非常善于调试呆板学习算法的人，会让某些东西工作起来的速率很轻易就快了10倍，大概是几百倍，他们调试的过程非常高效。

与学习数学雷同，深度学习的一个挑衅是，有太多的的概念。假如你忽略了概念，那么你就大概弄不清背面要做的事变的条件条件。因此，在深度学习的专业化学习中，要只管冲破概念，最大限度进步可明白性。如许的话，当深进学习时，就会有充足的信心。

别的，我发现，假如我实验教给门生最有效的本领，并让他们马上利用，就会收缩他们“逼迫”学习的时间。

如今的天下变革太快了，大概几年的时间就会天翻地覆，但我以为我们还必要更多的举行强化学习。深度学习令人云云高兴，但人工智能团队不应该只利用深度学习，我的团队就会利用一系列的工具。有时间我们利用PC电脑，试图在PC上找出办理题目的缘故原由，有时间利用署理模子，有时间利用草稿，这内里大概会有一些对行业有巨大影响的内容。多样化的技能可以资助我们发现更实用办理题目的工具。

在学术方面我也有盼望。如果我只做学术，而且有无穷的预算，不消担心短期的影响的话，我会把全部的精神都花在研究无监视学习上，由于无监视学习是一个漂亮的想法，它让人高兴。

举一个自监视学习的例子：我在网上抓取了一些无标签的图像数据，数据的种类各种各样，那么我会将每张图片旋转、翻转，然后练习一个有监视的神经网络猜测图片原来的方位。由于旋转了图片，以是产生的有标签的数据就是无穷多。

研究职员已经发现，通过无标签数据和假造标签数据集，然后练习一个大型的新网络，接纳隐蔽层表现并利用迁徙学习可以或许将其转移到另一个强盛的算法上面。

无监视学习越来越紧张，而且在实际天下里发挥着作用，尤其是在盘算机视觉范畴，此概念融合其他学科的概念会让人高兴。

我对希罕编码也非常感爱好，我看到过一个慢特性分析，其想法可以追溯到我们十年前的工作内容，但其时我们都被监视学习所分散精神，以是盼望研究者可以围绕主题探索更多的工作，以便可以或许出圈。

6、养成学习风俗是紧张的学习本领！

对于初学者来说，大概是16周可以完成深度学习专门的课程，也有的人在不到一个月的时间完成学习、也就是说，这取决于个人环境，我们在Course上面提供了非常专业化的课程，非常轻易得到，也很实惠。假如门生经济困难，那么就可以申请经济救济也是可以的。

在学习深度学习和呆板学习的时间，养成学习风俗是关键，由于这意味着规律性。对我本身来说，我养成了每周六和周日花点时间看书或学习的风俗，风俗会让人变得更轻易。以是就像你刷牙的风俗一样，不会以为那刷牙的那两分钟所做的事变是烦人的。

记着，学习者不必要有认知负担的风俗，但要做到这一点一开始会非常困难。确信本身可以或许养成不必要做决定的风俗，学会对峙不懈！

读研究论文是一件非常好的事变，“不读论文”的本领可以来自一年里每周都读论文，当你读了一百篇论文之后，你会学到许多。

关于学习的本领，提倡手写条记。对于我来说，当我深进研究某件事时，我会用手写下来。固然，视环境而定，不是每个人都实用，比方许多人在通勤途中的学习，誊写就非常不方便。但是总的来说，手写条记可以进步影象力，可以或许让人们更多的回想知识点，促进了人们的恒久留意力的会合。然后在写条记的过程中，注意总结，可以写的慢一点，但要对学习的内容深条理总结。

在学习过程中，现实上课程作业是人们进进新范畴并学习概念知识的一种非常有用的方式。博士生假如想投进研究，现实上最好的做法，是在开始几年的花时间奠基底子，固然头几年的工作服从比力低，但是久远来看，确黑白常棒。

从小事做起，循规蹈矩，不要一上来就处置惩罚大项目，可以拿小项目练练手。固然，最关键的是先迈出第一步，然后再迈出一小步。

7、关于博士学位，关于找工作

研究者应该得到博士学位吗？呆板学习中最引人入胜的事变就是纵然你没有博士学位也能做一些有影响力的事变。固然了假如有人被麻省理工大概斯坦福等顶尖高校登科，那么也是一次极好的履历。别的，假如有人想成为一所顶尖大学的传授，那么就必须拥有一个博士学位。

别的，我发起你得到一份工作的时间，要问谁是你的司理？你四周的同龄人都有谁？由于我们都是社会生物，我们每每变得更像我们四周的人。假如你为良好的人工作，你会学得很快。假如一家公司不告诉你与谁一起工作，大概说是轮换制度，我觉着这大概是一个令人担心的答案，由于这意味着你无法与良好的人一起工作。

8、怎样创建一个乐成的人工智能创业公司

许多初创企业的失败都来自于产物制造，由于他们的产物没人想要。我自己倾向于效果以及客户驱动的贸易模式。只有当客户决定给你的产物伸大拇指，照旧小拇指的时间，才气决定你的成败。在短期大概会得到各种用户的青睐，最紧张的照旧恒久，以是当你开办一家企业的时间，要问本身一个题目：客户会有什么想法？

我们全部人都应该只做我们以为能创造社会公益、推动天下进步的事变。无论是在企业，照旧在学术情况中，最故意义的方法不停是为人们服务。以是我个人并不想支持制造令人上瘾的数字产物，由于这些产物只要带着“有利可图”的属都能做到“上瘾”。

当我还在百度向导人工智能小组时，我的工作分为两个部门。其一是创建一个AI引擎支持现有的贸易模式。第二个工作是实验启动公司新的业务线，即把公司的人工智能利用上。以是主动驾驶业务并进了我的小组。

其时我就想创建人工智能基金，并从零开始体系地打造新的创业公司。我想这会是团队寻求丰富企业空间的一种紧张方式。这种机制对完成项目，推动天下向前发展有紧张的影响。

非常荣幸的是，我创建了几个研究小组，也产生了一些积极的影响。接下来我会用更加体系的方式运营。

工作室最开始是新的概念，如今大概有了几十个了，许多团队仍旧试图想找出怎样高乐成率运行公司的方法。我的一些风投朋侪也好像越来越多的想创建一家公司，而不是投资一家公司，由于最迷人的事变始终是怎样创建一家乐成的公司。如今已经在给创业者进步乐成率方面已经做得很好了，但是在环球范围内还处在早期的阶段。对大多数创业者来说，开一家公司真的是一件寥寂的事变，有太多的企业家不知道怎样做出决定。比方在贩卖的时间，在投放广告的时间......

企业家必要做出数百个决定，而在几个关键决议中出错误会对公司的运气产生巨大的影响。因此，我以为工作室会给初学者提供支持，让创建公司不再是孤独的履历。别的，劈面对一些关键的决议的时间，比方在雇用第一个工程副总裁的时间，雇佣尺度是什么？怎样雇佣？工作室至少在关键时候能给这些人一些资助。别的也盼望资助他们对关键决议的“时点”故意识。

9、企业怎样转型AI？

一家至公司怎样将呆板学习融进到他们的工作中呢？人工智能是一项通用技能，它将改变每个行业。实在，我们的AI社区已经在很大水平上举行了改变，大多数软件互联网并不是顶级的，其只要具备公道的呆板学习本领，就有很大的改进空间。

软件互联网范畴之生手业，比方制造业，农业，医疗保健，物流，运输，有非常多的时机，但很少的人在利用人工智能。以是我以为人工智能的下一步是改变全部其他行业。

因此，我们必要更多的团队为这类公司工作，资助他们摆设AI。除了互联网软件行业，全部的行业都很有潜力，究竟这是我花了许多时间在制造业、农业、医疗保健等方面才得出结论。举个例子，在制造业中，盘算机视觉发挥了很大的作用：用深度学习练习一个算法，然后让其辨认产物是否有缺陷，然后给出工厂怎样改进的发起，以便进步产量和质量。

究竟证实，此过程碰到的现实题目大概与你料想大概碰到的题目大不雷同。在大多数研究中，起首数据集的规模险些是不敷的，另一方面还必要思量工厂的现实环境，大概模子在练习集上结果很棒，但假如工厂改变了一些东西，比方灯的亮度，算法的正确率就不会很高。然而这些题目，学术界大多都没有讨论。

自学版块-挂机方案吴恩达专访：我的人工智能科研之路-虎嗅网挂机论坛(1)

我曾经在网上发表了一份《人工智能转型手册》，简朴的先容了每个公司在转型的时间应该制止的坑。而第一步现实上是从小事做起，但是许多公司的失败都是由于一开始“大而不实”。

以谷歌大脑为例，其时许多人以为深度学习神经网络没啥用，我和我的团队从小事做起，创建了一个正确率高的语音辨认体系，然后其他团队开始青睐深度学习。

第二个例子是谷歌舆图，我们利用盘算机视觉从根本的街景图像中读取房屋编号，以谷歌舆图更正确地定位房屋。也就是用深度学习来进步舆图数据的质量。通过两次的乐成，我们渐渐创建了人工智能项目标发展势头，然后才开始了与谷歌广告团队举行对话、互助。固然只前期都是小规模的项目，但让我们的团队得到信心。

记得，我们其时只有一台GPU，但是却从怎样探索多人共享方面学到了许多东西，这也资助我们团队思索怎样将其扩展到更大的摆设。

创建和摆设呆板学习黑白常困难的，在电脑中运行notebook文件和在详细现实环境中摆设之间有着巨大的鸿沟。

许多人低估了算法摆设到生产所要耗费的精神，一些算法在测试集上做的很好，但是用在实处却不起作用，比方把工厂四周的树木砍掉，测试聚会会议发生变革，算法是否能发挥效力不得而知。

在学术界，当测试集和练习集之间的概率分布是差别的时间，怎样处置惩罚尚未得到好的办理办法。固然，迁徙学习正在为这方面工作做积极，但是我们真的不擅优点理此类事变。

假如你看看软件体系中的代码行数，呆板学习模子大概只占整个软件体系的5%乃至更少，那么怎样完成接下来的工作，并使其更加体系和可靠呢？必要明白的是，精良的软件工程是底子，也是构建小型呆板学习体系的底子。

10、我们应该思量什么样的AI道德？

拿主动驾驶来说，最大的题目不是“电车困难”是，最大的题目是当一辆车横穿马路时，你应该做的是刹车而不是撞上它。

另一个道德题目是财产不同等，人工智能和互联网正在引发权利会合，由于拥有数据可以高效的分析数据，会影响浩繁财产。

互联网许多行业有“赢家通吃”的动力，同时这些动力影响着其他的行业。以是重点是怎样确保财产得到公中分享呢？怎样资助赋闲的人？除了教诲之外，我们大概还必要做更多的事变。然而私见也是一个严峻的题目。

故意对迢遥的将来大概出现的题目的事变大做文章，而不是把重点放在当前硬件方面的题目上，会掩饰我们本日已经存在的题目。

11、我最自大的事变！

我也犯了许多错误，但是每次改正，我都会想为什么不早五年，乃至早十年想到这一点呢？有时间我读了一本好书，我盼望我10年前就读过这本书，要是10年前就读了大概我的生存是云云的差别，只管这是近来发生的。

在我们发现的过程中，不停地发现那些过后看起来云云显着的东西，它总是比我想要弄清晰的时间要长得多。

我最自大的满意和幸福的就是我的女儿，但我没有花充足的时间来陪陪她。

资助别人也能使我得到满意，对我来说，生命的意义是盼望别人实现他们的空想，我盼望试图通过使人类作为一个团体更增强大来推动天下的进步。以是，当我知作别人由于我变得好一些的时间，我也会非常自大和幸福。

本文来自微信公众号：AI科技批评（ID：aitechtalk），作者：蒋宝尚

http://www.fyguaji.com

		自动登录	找回密码
密码			立即注册

吴恩达专访：我的人工智能科研之路-虎嗅网

相关帖子