黄仁勋联手ChatGPT，AI赋能新纪元

2025-05-06 21:30:52 股票分析 facai888

23|0条评论

AI领域的风云际会：黄仁勋携手ChatGPT，开启新纪元

自今年年初ChatGPT爆火后，吸引了超过1亿用户，成为有史以来增长最快的应用。英伟达的股价也是一路飙升，目前英伟达市值为6471亿美元。

针对ChatGPT等大型语言模型推理，黄仁勋发布了一款新的GPU——带有双GPU NVLink的H100 NVL，配备94GB HBM3显存，可处理拥有1750亿参数的GPT-3，还可支持商业PCIE服务器轻松。

面对生成式AI的认知将重塑几乎所有行业的现状，黄仁勋坦言称：“这个行业需要一个类似台积电的代工厂，来构建自定义的大型语言模型。”台积电将于6月开始对cuLitho进行生产资格认证，ASML正在GPU和cuLitho方面与NVIDIA展开合作。

黄仁勋表示，初创企业正在竞相打造颠覆性的产品和商业模式，老牌企业则在寻求应对之法。DGX Cloud 使客户能够在全球规模的云上即时接入NVIDIA AI超级计算。

Grace包含72个Arm核心，由超高速片内可的、缓存一致的网络连接，可提供3.2TB/s的截面带宽。Grace Superchip通过900GB/s的低功耗芯片到芯片缓存一致接口，连接两个CPU芯片之间的144个核，内存系统由LPDDR低功耗内存构成。

cuLitho是一项历时近四年的庞大任务，英伟达与台积电、ASML和Synopsys等密切合作，将计算光刻加速了40倍以上。借助cuLitho，台积电可以缩短原型周期时间、提高产量、减少制造过程中的碳足迹，并为2纳米及以上的生产做好准备。

黄仁勋联手ChatGPT，AI赋能新纪元

黄仁勋激动地强调，“我们正处于AI的iPhone时刻”。数据中心加速各种工作负载，将会减少功耗，节省的能源可以促进新的增长。未经过加速的工作负载都将会在CPU上处理。

NVIDIA H100需要89块掩模版，在GPU上运行cuLitho，只需8小时即可处理完一个掩模版。此外，针对生成式AI的Omniverse、图形渲染等，推出L40 GPU，性能是T4的10倍。

黄仁勋发布了NVIDIA AI Foundations云服务系列，为构建、完善和运行自定义大型语言模型及生成式AI的客户提供服务。其中，计算光刻是芯片设计和制造领域最大的计算工作负载，每年消耗数百亿CPU小时。

从AI训练到部署，从系统到云服务，再到半导体芯片，黄仁勋打出了一套“组合拳”。他指出，如果把加速计算比作曲速引擎，那么AI就是动力来源。

针对AI视频工作负载，推出L4 GPU，对视频解码和编码、内容审核、视频通话等方面进行了优化。NVIDIA正与领先的云服务提供商托管DGX Cloud基础设施，Oracle Cloud Infrastructure和微软Azure预计将加入。

在微服务方面，Grace的速度比最新一代x86 CPU快1.3倍；在数据处理中，快1.2倍，而整机功耗仅为原来服务器的60%。云服务提供商可以为功率受限的数据中心配备超过1.7倍的Grace服务器。

因为对芯片制造的精确度提升，光刻成为芯片制造过程中的关键环节。Grace的性能和能效非常适合云计算应用和科学计算应用。

自AlexNet面市以来，深度学习开辟了巨大的新市场，包括自动驾驶、机器人、智能音箱等。因为生成式AI的兴起，推理工作负载呈阶梯函数式增长。

DGX Cloud提供NVIDIA DGX AI超级计算专用集群和AI软件，使企业能即时接入用于训练生成式AI等开创性应用的高级模型所需的基础设施和软件。

因为云计算发展，大约3000万台CPU服务器完成大部分处理工作。黄仁勋在GTC大会上带来一系列“杀手级”技术和产品。

MORE>

热门推荐网友点评

最近发表