下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

黄仁勋戴尔峰会重磅发声:AI正迈入“代理时代”,全球算力需求已呈抛物线暴增

26-05-22 17:40 81次浏览
美港智讯
+关注
博主要求身份验证
登录用户ID:
当大众还在惊叹于大语言模型撰写文章、生成图片的能力时,科技巨头们已经悄然开启了下一场革命。在近期的戴尔 科技峰会(Dell Tech World)上,英伟达(NVIDIA)CEO黄仁勋与戴尔CEO迈克尔·戴尔展开了一场深度对谈。黄仁勋抛出一个震撼业界的论断:我们已经正式从“生成式AI(Generative AI)”跨入“代理型AI(Agentic AI)”的全新纪元。 这一技术底层的质变,不仅将彻底颠覆企业的运作方式,更让全球算力需求陷入了“抛物线式”的疯狂增长。

一、 从“生成内容”到“自主思考”:代理型AI的觉醒
“两年前,我们才刚刚开启生成式AI的旅程。”黄仁勋在对谈中回忆道。然而,技术的迭代速度超乎想象。过去的AI主要用于“生成内容”,而现在的AI已经能够利用生成的内容进行“思考(Think)”、“推理(Reason)”和“规划(Plan)”。

这就是所谓的“代理型AI(Agentic Systems)”。黄仁勋指出,如今的AI不仅能听懂指令,还能自主使用工具,评估结果,甚至在遇到阻碍时重新制定计划,直到任务完成。

这就意味着,AI终于从一个被动的“问答机器”,变成了一个高度自主的“数字员工”。“这标志着我们首次迎来了‘有用的AI(Useful AI)’,这也是为什么我们两家公司的市场需求都在呈抛物线般疯狂增长的原因。”黄仁勋如此定调。

二、 算力缺口:为何计算需求暴增100到1000倍?
能力的跃升,必然伴随着底层资源的海量消耗。代理型AI与传统问答式AI最大的区别在于其“持续运行”的特性。

黄仁勋举了一个极其生动的例子:过去,AI只是单次响应查询;而现在,你给AI下达一个软件编程任务,它可能会在后台自主迭代、运行整整一个星期。虽然它用一周时间干完了整个团队一个月的工作量,极大地拉升了生产力,但这期间它对算力的持续消耗是极其惊人的。

“因为它是自主运行且长时间不间断的,计算量直接飙升了100倍甚至1000倍。”黄仁勋坦言。同时,这种“超级数字员工”正在被全面普及,从软件开发、DevOps、CI/CD到QA测试,几乎所有企业的核心环节都在引入AI代理。

单个任务算力需求猛增100倍,叠加全球数千家顶级企业(如礼来、三星、霍尼韦尔等)的全面部署,二者的乘积,就是如今英伟达和戴尔面临的“抛物线级”庞大需求。

三、 重塑算力经济学:不要租用核心,要制造“Token”
面对如此庞大的需求,传统的计算架构已经无法支撑。黄仁勋指出,过去的CPU是为超大规模云(Hyperscale Clouds)设计的,其商业模式是“出租CPU核心数”。但在这个崭新的AI时代,经济学的底层逻辑变了——“现在,你不再是租用核心,而是在生成并营销Token(词元)。”

AI的输出本质上就是Token。为了让AI代理能够以最快速度完成任务并生成Token,英伟达推出了具备全球最高单线程性能的 Vera CPU,其内存带宽是顶级CPU的三倍。它能让数据库运转如飞,确保前端的AI代理在调取数据时绝不卡顿,不会让昂贵的GPU算力白白排队等待。

四、 混合AI与本地部署:企业级数据大脑的终极形态
既然AI代理如此强大,大企业该如何安全地驾驭它们?

黄仁勋和戴尔给出了一套全新的“混合AI(Hybrid AI)”解决方案。在这个体系中,一个参数量高达1万亿级的庞语言模型(充当“大脑”),可以运行在由GB300等芯片组成的超大型单域计算机上;而连接大模型与企业数据的“控制线束(Harness)”,则运行在由NVIDIA开放沙盒保护的本地CPU中。

这意味着,企业可以在保证数据绝对安全、且无需信任外部数据中心操作员的前提下,在本地(On-Prem)部署自己的私有化AI代理。这种“不受计量限制的智能(Unmetered Intelligence)”,让企业彻底告别了对“Token账单”的焦虑。

五、 结语:重塑人类创造力的边界
对谈的最后,迈克尔·戴尔描绘了一幅令人振奋的未来图景:“过去,人类做完一项工作,就把它传递给下一个人;而未来,一个优秀的人类工程师,将是管弦乐队的指挥,他将协调成百上千个AI代理,而这些代理又会指挥更多的子代理去完成海量的任务。”

从英伟达和戴尔的这场对谈中,我们可以清晰地看到:AI的炒作期正在结束,深度的产业落地期已经全面开启。在这场长达十年的基建狂飙中,掌握算力和本地化部署能力的企业,必将掌握未来十年的全球定价权。
打开淘股吧APP
0
评论(0)
收藏
展开
热门 最新
提交