当地时期 3 月 18 日ag百家乐直播,在(NVIDIA)举办年度 GPU 期间大会(GTC)上,CEO 黄仁勋登台发表了主题演讲。
两个小时的时长,从芯片架构和生成式 AI,讲到数据中心、自动驾驶和 AI 工场,临了到个东谈主 AI 超算和机器东谈主,可谓是量大管饱。
老黄不仅一语气通告了三个架构升级门道图,一波奏凯谋略到了 2028 年,客岁 GTC 登台的 BDX 小机器东谈主也返场登台了,互动和步履似乎愈加当然、纯真。

在客岁的 GTC 大会上,英伟达发布了 Blackwell 架构,尽管 GPU 量产一度受阻,但近期已完毕大限制坐褥,并在第一季度完毕了数十亿好意思元的销售额。当今,四大云计较公司部署的 Blackwell 芯片数目是 Hopper 芯片的三倍。
今天,英伟达通告了 Blackwell 架构的升级版 Blackwell Ultra,擅长应答 AI 推理需求。
Blackwell Ultra 以 Blackwell 架构为基础,包括了搭配 CPU 的 GB300 NVL72 机架级措置决策和仅配备 GPU 的 B300 NVL16 系统两个版块。
在推崇上,GB300 的 AI 性能比上一代 GB200 跳跃 1.5 倍。而与 Hopper 一代比拟,B300 在大言语模子上的推理速率提高了 11 倍,计较才智提高了 7 倍,内存加多了 4 倍。
老黄暗示:“AI 依然获得了精深的飞跃,推理和代理东谈主工智能需要更高量级的计较性能。咱们为这一刻筹算了 Blackwell Ultra,它是一个单一的多功能平台,不错松驰高效地进行预考验、后考验和推理东谈主工智能推理。”
Blackwell Ultra 架构将于 2025 年下半年上市,具体参数如下。

在这之后,英伟达通告了其下一代 GPU 系列系统名为 Vera Rubin。这个名字来自觉现了暗物资的女天文体家 Vera Rubin。
该系统有两个主要组件:一个名为 Vera 的新 CPU 和一个名为 Rubin 的新 GPU 架构。它瞻望于 2026 下半年问世。
从纸面参数来看,它将全场地卓越 Blackwell Ultra,要津性能简直齐是两倍以上的升迁。

这还没完,接下来亮相的居品(ppt)是 Vera Rubin 的下一代,Vera Rubin Ultra NVL576。纸面性能又是一波暴涨。

“Vera Rubin Ultra 领有 250 万个零件,并衔接到 576 个 GPU。”老黄暗示。不外他也承认有些谋略“过于超前”,但“这等于咱们上前发展的速率”。
反过来看,咱们也再一次看法了老黄的刀法,居品还没出来,就依然想好奈何刀了。

那你可能要问了,Rubin Ultra 之后是什么呢?
至少名字英伟达想好了,以物理学家理查德·费曼(Richard Feynman)定名的费曼架构,瞻望在 2028 年问世。

先容收场 GPU 架构,老黄谈到了其他的英伟达居品线。
最初所以太网建筑升级。改善网罗自己将有助于使 AI 的责任进程愈加顺畅,为此英伟达通告推出新的 Spectrum-X 硅光子以太网交换机,该交换机每端口可提供 1.6 太比特每秒的速率,从而为 AI 工场从简 3.5 倍的能源并提高 10 倍的弹性。
该居品是英伟达 Spectrum-X 光子以太网和 Quantum-X 光子 InfiniBand 平台的一部分。
英伟达暗示,与传统花式比拟,它们的光学期间革命使用了更少的激光器(减少 4 倍),还能完毕 3.5 倍的能效、63 倍的信号齐全性、10 倍的大限制网罗弹性和 1.3 倍的部署速率升迁。
“AI 工场是一种限制极大的新式数据中心,Ag百家乐网罗基础设施必须再行矫正才能跟上设施。通过将硅光子学奏凯集成到交换机中,英伟达突破了超大限制和企业网罗的旧有限制,为百万 GPU AI 工场掀开了大门。”老黄暗示。

接下来,老黄先容了新款 DGX Spark 和 DGX Station 个东谈主 AI 计较机,他将其描摹为“AI 期间的超等计较机”。
这两款超等计较机均由 Grace Blackwell 平台相沿,旨在“让 AI 开采东谈主员、盘考东谈主员、数据科学家和学生在桌面上对大模子进行原型筹算、微颐养推理”。
Spark 搭载了 GB10 Blackwell 芯片,提供第五代 Tensor Core 和 FP4 相沿,具有 128GB 合并内存和高达 4TB 的 NVMe SSD 存储,不错提供“高达每秒 1 千万亿次运算的 AI 计较。”
体积更大的 DGX Station 不错容纳英伟达刚刚通告的功能更苍劲的 GB300 Blackwell Ultra 芯片,可提供“每秒 20 千万亿次运算的 AI 性能和 784GB 的合并系统内存”。
Spark 将至当天启动预订,售价 3000 好意思元起。DGX Station 当今尚不决价。

随后老黄通告了开源推理模子系列,英伟达 Llama Nemotron Reasoning,一种“任何东谈主齐不错运行”的 AI 模子。
顾名想义,Llama Nemotron 基于 Meta 的开源 Llama 模子。英伟达通过算法对模子进行调节,以优化计较条款,同期保持准确性。
它还诓骗合成数据应用了复杂的后考验期间。考验波及 36 万小时 H100 推理时期和 4.5 万小时东谈主工耀眼时期,以增强推理才智。
扫数系列包括三种模子尺寸:
-Nemotron Nano:针对角落和较小部署进行了优化,同期保持了较高的推理精度。
-Nemotron Super:在单数据中心 GPU 上完毕最好糊涂量和准确性的均衡。
-Nemotron Ultra:专为在多 GPU 数据中心环境中完毕最大“代理精度”而筹算。
动作英伟达 NIM 微做事的一部分,这套模子不错在职何平台上运行。

压轴登场的是一系列机器东谈主期间。最热切的是 Isaac GR00T N1,宇宙上第一个洞开、齐备可定制的通用东谈主形推理和手段基础模子。
其他新期间亮点包括模拟框架和蓝图,举例用于生成合成数据的 Isaac GR00T 蓝图,以及由 DeepMind 和迪士尼盘考部门共同开采的专为开采机器东谈主而构建的开源物理引擎 Newton。

据英伟达先容,GR00T N1 基础模子礼聘双系统架构,其灵感来自东谈主类认知旨趣。
“系统 1”是一种快速想考的步履模子,反应了东谈主类的反应或直观。“系统 2”则是一种慢速想考的模子,用于三想尔后行、环环相扣的决策。
在视觉言语模子的相沿下,系统 2 不错推理其环境和收到的提醒,从而谋略步履。然后,系统 1 将这些方向更正为精准、连气儿的机器东谈主动作。
GR00T N1 不错完毕常见任务,举例执取、用一只或两只手挪动物体,以及将物品从一只手更正到另一只手,大略实施需要手段组合的多门径任务。
开采东谈主员和盘考东谈主员不错使用真确或合成数据对 GR00T N1 进行后期考验,以稳当特定的东谈主形机器东谈主或任务。
英伟达还将与谷歌 DeepMind 和迪士尼盘收全心互助开采 Newton,这是一个开源物理引擎,可让机器东谈主学习怎样更精准地处理复杂任务。

Newton 基于英伟达 Warp 框架构建,将针对机器东谈主学习进行优化,并与 DeepMind 的 MuJoCo 和英伟达 Isaac Lab 等模拟框架兼容。此外,三家公司还方向让 Newton 使用迪士尼的物理引擎。
迪士尼盘考公司将成为首批使用 Newton 来改进其机器东谈主脚色平台的公司之一,为下一代文娱机器东谈主提供能源。
在 GTC 大会的临了,客岁 GTC 就曾亮相的可人 BDX 机器东谈主再次登台,其动和步履似乎愈加当然、纯真了,赚足了眼球。

临了值得一提的是,当地时期 3 月 20 日,英伟达将会举办首个“量子日(Quantum Day)”行为,召集行业群众共同想考企业在往时几十年对量子计较的渴望,并谋略出有价值的量子应用之路。这将是英伟达在量子计较规模迈出的热切一步。
参考尊府:
https://nvidianews.nvidia.com/news/nvidia-isaac-gr00t-n1-open-humanoid-robot-foundation-model-simulation-frameworks
https://nvidianews.nvidia.com/news/blackwell-ultra-dgx-superpod-supercomputer-ai-factories
https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
https://www.nvidia.com/gtc/keynote/