黄仁勋:AI的下一波浪潮是“物理AI”
近日,英伟达CEO黄仁勋接受了专访。
黄仁勋在受访中表示,英伟达至今已成立33年,历经了三次计算机革命:从PC革命到互联网,再到移动互联网。如今身处人工智能时代,英伟达要在这些转型中持续繁荣。他说,企业对不断变化的环境保持深刻理解,这一点至关重要。
以下为采访内容(有删节):
关于“AI工厂”的初步提问
主持人:您将AI定位为一场新的工业革命,而AI工厂是其中心。您能否向我们解释下什么是“AI工厂”,以及为什么它对于21世纪的经济发展如此重要?
黄仁勋:过去几年,我们一直在讨论人工智能。这是一个多层面的概念,我认为从不同的视角来看待它会很有帮助。首先,人工智能无疑是一项新技术。它之所以是新技术,在于其构建方式与传统软件截然不同,这使得它能够实现过去软件无法完成的功能。这是一项不可思议的技术,潜力巨大,能够做所有的事情,我们既需要确保它的安全,同时它也将带来所有令人惊叹的成就——这一切都非常棒。这是从技术层面来看。
第二个层面相对较新,关乎科技行业软件的生产方式。过去,软件主要由人工编码完成。而现在,一个新的行业正在兴起,在这个行业中,软件是由机器生产的。你需要一台大型超级计算机,你为其供电,然后从中源源不断地“飞出”的是“tokens”(令牌)。这些tokens可以被重构为数字、文字、蛋白质、图像、视频和三维结构——你可以将这些tokens重构成各种各样的东西。我们称之为智能。
所以这种机器看起来与以往不同,我称之为AI工厂,因为它专注于一件事:每天都在生产tokens。再往上一层是基础设施,这也是为什么我们现在认为人工智能就像一场非同寻常的工业革命。因为这项新技术将催生我刚才提到的新产业:AI工厂,即智能的生产。更重要的是,它将反过来彻底改变其他产业或让其他产业实现转型。
所有这些tokens都将进入医疗保健、教育领域——我个人非常喜欢教育,我每天都在用它来学习。金融服务和工程领域也正在被重塑。我们每天都在使用AI进行软件编程、供应链管理,并且它即将深入制造业,等等。
当你从这三个层面来思考人工智能时,它的变革性和影响力就像曾经的电力一样显而易见。它将彻底改变每一个行业。因此,这确实是一场工业革命。
讨论AI作为现代计算的范式改变
主持人:您认为这是现代计算的范式转变吗?每个制造实体物品的工厂都将配备一个AI工厂?
黄仁勋:是的,完全正确。如今,任何生产实体移动产品的公司,无论是生产割草机的,还是像卡特彼勒(320.89, -2.22, -0.69%)这样生产工程机械的,大多数操作仍然依赖手动。
未来,它们将变得自主或高度自主、半自主或辅助操作。一旦它们实现自主,就意味着它们将由软件定义。因此,你需要生产那些tokens,那些驱动拖拉机的软件。
未来,每个制造实体产品的公司,除了拥有制造其销售产品的工厂外,还将拥有另一个工厂,专门构建和生产运行在其产品上的AI。
这一点在汽车公司身上体现得尤为明显。今天的汽车公司主要制造汽车,但很显然,十年后,每家汽车公司也将在内部生产那些驱动汽车运行的tokens。
对物理AI及其从感知到推理的演变的解释
主持人:在过去一年里,您多次谈到物理AI(Physical AI)的概念。对于正在思考美国未来政策的决策者来说,您能否解释一下什么是物理AI,以及我们应该如何理解它?
黄仁勋:我们回顾一下历史。人工智能真正进入公众视野,现代AI的爆发大约是在14年前,伴随着AlexNet的出现以及计算机视觉的巨大突破。那大概是2012年。
大约在那个时期前后,回顾一下,什么是计算机视觉?从其最广泛的意义上讲,它是感知。感知世界,无论是何种信息模式。它可以是图像,当然也可以是声音、振动、温度。我们现在已经开发出了能够理解所有这些信息含义的AI模型,并且可以非常智能地处理它们。
因此,第一层浪潮,第一波AI是感知AI。第二波大约在五年前开始被大家广泛讨论,是生成式AI。生成式AI是一种能够理解信息的含义,并且可以进行翻译的AI。例如,它可以理解英语,并将其翻译成法语。它也可以理解英语,并将其翻译成图像。所以你可以通过提示来生成图像。因此,生成式AI本质上是一个通用翻译器,如果你愿意这样称呼它的话,一个理解人类语言的通用翻译器。这是下一个浪潮。
我们现在所处的浪潮是,你已经具备了理解能力,可以生成内容,但正如你所知,智能需要我们解决问题,并识别以前从未遇到的情况。我们解决问题的方式是运用推理。我们应用过去学到的规则、定律和原则,一步一步地分解问题。即使我们以前从未解决过这个问题,通过推理,我们也能找到解决方案。这是智能的独特能力之一。
我们现在正处于一个被称为推理AI的时代,这使得我们可以生产一种我们称之为代理AI的数字机器人。这些代理拥有能动性,能够理解给它们的任务。它们可以学习、阅读并使用计算器、网页浏览器和电子表格等工具,然后替我们完成任务。这些任务可能涉及通过SAP(297.68, -4.95, -1.64%)进行的供应链管理,或者通过Workday(247.79, -0.55, -0.22%)进行的人力资源管理。本质上,这些代理AI是数字劳动力机器人。
未来,我们将成为管理生物劳动力和数字劳动力的一代CEO。我们的人力资源部门将服务于生物劳动力,而我们的IT部门将演变为管理代理AI的人力资源需求。这就是我们今天所处的阶段。
下一个浪潮,将惠及世界上最大的产业,它要求我们理解基本概念,比如物理定律、摩擦力、惯性和因果关系。例如,如果我把一个物体推倒,它会掉下来。当我放下瓶子时,它不会穿过桌面。这些常识性的物理推理能力,儿童甚至我们的宠物都拥有,但在大多数AI中却普遍缺乏。例如,如果我把一个球滚过厨房的柜台,许多AI都难以理解随之产生的物理结果。
当球消失在另一边时,AI可能会认为它“消失”了,但你的狗知道它还在那里。它理解物体永存的概念,知道球没有进入另一个虚拟世界,所以会绕过桌子去把它找回来。
机器人需要知道,如果你想从桌子的一边走到另一边,你不能穿过桌子,而必须绕过去。所有这些类型的物理推理能力被称为物理AI。
当你将物理AI融入到一个物理实体,也就是机器人中时,就形成了机器人技术。这对我们现在来说非常重要,因为我们正在美国各地建设工厂。
我们希望以利用最新技术的方式来建造这些工厂。因此,希望在未来的十年里,当我们建设新一代工厂时,它们将是高度自动化的,这将帮助我们应对全球范围内严重的劳动力短缺问题。
美国需要做什么才能赢得全球人工智能竞赛
主持人:许多人都在谈论我们正处于一场全球性的人工智能竞赛中。您认为美国政府需要采取哪些行动,才能赢得这场人工智能竞赛,保持最顶尖的AI技术优势?
黄仁勋:首先,要在任何竞赛中取得成功,你必须理解这场竞赛。你需要认清自己拥有的资源、资产,以及缺乏的资产,你的优势和劣势。重要的是要意识到,人工智能的核心在于理解这些要素。
回到我们讨论的三个层面,在每个层面,我们都必须确保我们理解这个“游戏”。这个“游戏”并非由严格的时间限制定义,没有60分钟的倒计时。相反,这是一个无限游戏,而大多数人并不擅长玩无限游戏。
例如,英伟达至今已成立33年。我们历经了三次计算机革命:从PC革命到互联网,再到移动互联网,如今我们身处人工智能时代。要在所有这些转型中持续繁荣,对不断变化的环境保持深刻理解至关重要。
环境在不断变化,你必须了解如何参与其中。我刚才描述的,理解游戏,理解你拥有的资产,这一点非常重要。在第一个层面,技术层面,最关键的是理解智力资本。记住,世界上50%的人工智能研究人员是中国人。退一步思考这个重要的因素,它必须被纳入我们对这场“游戏”的思考中。
接下来是AI工厂。要在这一层面做得好,你需要能源,因为从根本上说,我们将电力转化为数字令牌。正如上一次工业革命通过能源将原子转化为钢铁制品以及我们所知的物理物体、汽车和建筑物等,再上一代工业革命则将水转化为一种叫做发电机的机器,从而产生了电力。所以现在我们有了电力输入,令牌输出。因此,下一层需要能源。
再往上一层,是关于技术的应用,而这正在发生。我们必须真正、真正地理解。最终,上一次工业革命的赢家不是发明它的国家,而是应用它的国家。美国应用钢铁和能源的速度比任何其他国家都快。当其他国家还在担心劳工问题和汽车取代马匹时,美国却抓住了创新,并一路狂奔。
因此,再上一层的基础设施层面,是关于技术的应用。关键在于不畏惧技术,积极参与其中,并对我们的劳动力进行再培训,使我们能够应用它。鼓励人们接受它至关重要。当你通过我所描述的视角和框架来看待人工智能时,每一层都有其独特的挑战和机遇。在每一层中,“游戏规则”都略有不同。
人工智能对劳动力和就业市场的影响
主持人:关于劳动力问题,媒体一直倾向于渲染人工智能可能导致大规模劳动力流失和失业的说法。您能否描绘一下您对人工智能对就业市场影响的预测,更具体地说,您认为有哪些我们今天可能根本没有想到的新类别工作可能会出现?
黄仁勋:一些工作将被创造出来,一些工作将会消失,而所有的工作都将会被改变。简单地走向极端总是很容易,但我发现把问题分解开,从第一性原理出发进行推理会更有帮助。在这个框架下,在基础层面,正如雅各布(主持人名字)所知,他深度参与了风险投资,很明显,人工智能是旧金山再次繁荣的原因。任何居住在旧金山的人都能证明这种变化;几乎所有人都曾撤离,但现在这座城市再次熙熙攘攘,这都归功于人工智能。
人工智能创造了一种新型工作,其根本在于它涉及软件开发,但以一种不同的方式实现。人工智能的引入改变了技术的每一个层面。过去在CPU上运行的人工编写的软件,现在是在GPU上运行的由机器学习生成的软件。从工具、编译器、方法论到我们收集和管理数据的方式,每一个层面都受到了人工智能的影响。我们目前正在发明利用人工智能实现各种功能的技术,从设置安全护栏到教学以及确保人工智能安全,这种创新正在创造大量的工作岗位。
在下一层,我们遇到了巨大的机遇。我们即将创造一种以独特方式运行的新型工厂——电力输入,令牌输出。例如,一个千兆瓦的AI工厂代表着巨大的机会;建设7、8甚至10千兆瓦的AI工厂已触手可及。一个千兆瓦工厂代表着600亿美元的投资。这个巨大的成本反映了我们正在进行的规模,因为100兆瓦的工厂已经变得相对普遍。为了便于理解,600亿美元相当于波音(185.96, -0.50, -0.27%)公司一年的收入,仅仅是一个千兆瓦工厂的造价。
要建造这样一个工厂,你必须为其融资,这创造了大量的工作岗位。你必须建设场地、建造厂房,这在建筑行业创造了大量工作,包括木匠、钢铁工人和泥瓦匠。你必须建造那座价值600亿美元的工厂。这东西是巨大的。你需要机械工程师、电气工程师和水管工。然后,在那之后,是所有低压工作,以及IT和网络方面的岗位。之后是运营。整个周期大约需要三年。所有这些都将创造一大批新的技能型岗位。这些手工艺岗位,在上一个计算机和计算平台转型浪潮中,大多数公司增长的主要驱动力是软件工程师。而在下一阶段,即AI工厂,手工艺将占据更重要的地位。我认为这太棒了。我们的国家需要认识到,手工艺是值得尊敬、至关重要且是建设国家不可或缺的工作。所以我们要大力鼓励手工艺:电工、水管工、木匠、钢铁工人等等各类工种。我们需要大量这类人才。
现在,再往上一个层面看,我们可以开始讨论AI代理如何改变医生、金融服务专业人士或客户服务人员的工作。在我们公司里,作为起点,每一位软件工程师现在都由AI助手协助。我们公司提交的代码量令人难以置信地增长。结果,我们的生产力直线飙升,而且我们因此能够雇佣更多的人,因为它使我们能创造更多世界所需的东西。它增加了我们的收入,也提升了我们的招聘能力。
我认为,对于处于上一层的人来说,尽早拥抱人工智能至关重要。请记住:并非人工智能会抢走你的工作,也不是人工智能会摧毁你的公司。真正可能做到这些的,是那些掌握并运用人工智能的人和企业。这一点至关重要,需要牢记。
人工智能如何通过数字孪生实现回流和制造业
主持人: 最近,人们对制造业回流的关注非常多。AI领域的许多人都在谈论数字孪生的概念,以及制造工厂采用数字孪生实际上如何帮助重启本土制造业。与此同时,苹果(198.51, -0.38, -0.19%)CEO蒂姆·库克最近表示,将iPhone迁回本土生产的主要瓶颈之一是缺乏良好且精确的机械臂技术。因此,从任何角度来看,人工智能似乎都将是制造业和本土回流的关键赋能技术。您能否详细谈谈您对此的看法?
黄仁勋: 好的。首先,制造业远不止低成本劳动力这么简单。今天的先进制造业是软件驱动的。整个工厂由软件掌控,就像一个巨大的机器人,指挥着内部的一系列更小的机器人协同工作。这些先进工厂里人员众多,但本质上是技术驱动的。所以,我认为首先,
首先,就我们所处的行业而言,我们有机会将从硅片到AI超级计算机的端到端制造能力转移回本土,这是一个绝佳的机会。我很高兴政府能够切实鼓励和支持制造业向本土转移。这是高质量、先进的技术工作。本土制造对国家来说是巨大的机会,对此我感到非常兴奋。我们是这一举措的坚定支持者,我们也幸运地拥有全球合作伙伴的支持,协助我们达成这一目标。
第二,如果我们不擅长制造业,我们将错过一个由能源可用性推动的巨大产业。哪个国家不希望参与人工智能这个新兴产业呢?为什么不想生产人工智能呢?为什么你不希望参与到最先进的制造业领域之一呢?它仍然是制造业,只是恰好与数字运算紧密相关。
就像上一次工业革命中的电子一样,当时大多数人无法理解可以通过一种名为“发电机”的机器创造出某种东西。现在我们称之为英伟达的AI超级计算机。当时,发电机产生了一种看不见的东西:电。你摸不着它,但它就是电,它就是电子。现在,这是一种新型的“电子流”:它是数字。当然,我们希望参与到这个新兴产业中。为了做到这一点,我们必须将制造业转移到本土。
至关重要的一点是,由于制造业如此技术密集,我们应该首先在数字孪生中进行设计和模拟。我们应该首先在虚拟世界中构建它。英伟达设计着世界上最复杂的系统。我们每一代产品的研发成本约为200亿美元,可能更高,但这200亿美元的研发投入,仅是为了生产一系列芯片。我们完全在数字孪生环境中设计这些芯片。在实际生产之前,它们已经在数字世界中存在了数月。一旦我们开始生产,就知道它们是完美的。
我们知道这一点,因为我们已经对其进行了详尽的模拟和仿真,并让它们经受了各种严苛的考验。我们也应该为数字工厂做同样的事。这些大型工厂应该完全创建数字孪生模型,并利用人工智能来辅助构建这些数字孪生。
我们需要通过虚拟集成来运行它们,以完全数字化的方式整合这些宏伟的结构。这种方法使我们能完全以数字化的方式优化运营和规划产能。
未来,我相信每个工厂都会有一个数字孪生版本,就像其他实体一样;我甚至希望每个人也都会有一个数字孪生版本。每辆汽车、每栋建筑、甚至每个城市,都将拥有一个数字孪生版本。
因此,数字孪生这一概念正在变为现实,而这一切都得益于人工智能。
AI赋能机器人普及的时间线预测
主持人:我的最后一个问题是,您对“人工智能赋能的机器人成为日常生活中无处不在的一部分”,这一愿景的实现时间有何预期?
黄仁勋:首先,让我说明一下,自动驾驶汽车本身就是一种机器人。我们花了大约10年的时间开发出这项技术。现在Waymo已经在全国多个城市运营,而且表现非常好。很高兴看到Waymo的车辆在旧金山等城市行驶。
然而,达到这一水平花费了大约10年时间。我认为开发其他类型的机器人所需的时间会更少。原因在于我们可以限制机器人的运行环境。与必须应对各种街道和路况的汽车不同,机器人可以被设计在更受控和有限的环境中工作。
对于机器人来说,我们可以设定特定的限制,从而实现更高效的开发。从一个原型具备相当功能,到它成为大批量生产的产品,我估计大约需要五年时间。因此,我们目前已有具备相当高功能的机器人原型,预计在大约五年内,我们将看到重大的进步和广泛的应用。
今天每一家制造汽车的公司,未来都将非常擅长制造机器人。它们只需要在软件部分,也就是AI部分有所建树,而这项技术实际上已经相当成熟。