黄仁勋联手ChatGPT,AI赋能新纪元

2025-05-06 21:30:52 股票分析 facai888

AI领域的风云际会:黄仁勋携手ChatGPT,开启新纪元

NVIDIA的生态拓展:DGX Cloud集群助力AI发展

自今年年初ChatGPT爆火后,吸引了超过1亿用户,成为有史以来增长最快的应用。英伟达的股价也是一路飙升,目前英伟达市值为6471亿美元。

NVIDIA全新推理平台:四种配置,一个体系架构,一个软件栈

针对ChatGPT等大型语言模型推理,黄仁勋发布了一款新的GPU——带有双GPU NVLink的H100 NVL,配备94GB HBM3显存,可处理拥有1750亿参数的GPT-3,还可支持商业PCIE服务器轻松 。

台积电与ASML合作:打造类似台积电的代工厂

面对生成式AI的认知将重塑几乎所有行业的现状,黄仁勋坦言称:“这个行业需要一个类似台积电的代工厂,来构建自定义的大型语言模型。”台积电将于6月开始对cuLitho进行生产资格认证,ASML正在GPU和cuLitho方面与NVIDIA展开合作。

黄仁勋表示,初创企业正在竞相打造颠覆性的产品和商业模式,老牌企业则在寻求应对之法。DGX Cloud 使客户能够在全球规模的云上即时接入NVIDIA AI超级计算。

Grace Superchip:云数据中心的新动力

Grace包含72个Arm核心,由超高速片内可 的、缓存一致的网络连接,可提供3.2TB/s的截面带宽。Grace Superchip通过900GB/s的低功耗芯片到芯片缓存一致接口,连接两个CPU芯片之间的144个核,内存系统由LPDDR低功耗内存构成。

cuLitho是一项历时近四年的庞大任务,英伟达与台积电、ASML和Synopsys等密切合作,将计算光刻加速了40倍以上。借助cuLitho,台积电可以缩短原型周期时间、提高产量、减少制造过程中的碳足迹,并为2纳米及以上的生产做好准备。

黄仁勋联手ChatGPT,AI赋能新纪元

AI的iPhone时刻:黄仁勋的信心与决心

黄仁勋激动地强调,“我们正处于AI的iPhone时刻”。数据中心加速各种工作负载,将会减少功耗,节省的能源可以促进新的增长。未经过加速的工作负载都将会在CPU上处理。

NVIDIA H100需要89块掩模版,在GPU上运行cuLitho,只需8小时即可处理完一个掩模版。此外,针对生成式AI的Omniverse、图形渲染等,推出L40 GPU,性能是T4的10倍。

黄仁勋发布了NVIDIA AI Foundations云服务系列,为构建、完善和运行自定义大型语言模型及生成式AI的客户提供服务。其中,计算光刻是芯片设计和制造领域最大的计算工作负载,每年消耗数百亿CPU小时。

从AI训练到部署,从系统到云服务,再到半导体芯片,黄仁勋打出了一套“组合拳”。他指出,如果把加速计算比作曲速引擎,那么AI就是动力来源。

针对AI视频工作负载,推出L4 GPU,对视频解码和编码、内容审核、视频通话等方面进行了优化。NVIDIA正与领先的云服务提供商托管DGX Cloud基础设施,Oracle Cloud Infrastructure和微软Azure预计将加入。

在微服务方面,Grace的速度比最新一代x86 CPU快1.3倍;在数据处理中,快1.2倍,而整机功耗仅为原来服务器的60%。云服务提供商可以为功率受限的数据中心配备超过1.7倍的Grace服务器。

因为对芯片制造的精确度提升,光刻成为芯片制造过程中的关键环节。Grace的性能和能效非常适合云计算应用和科学计算应用。

自AlexNet面市以来,深度学习开辟了巨大的新市场,包括自动驾驶、机器人、智能音箱等。因为生成式AI的兴起,推理工作负载呈阶梯函数式增长。

DGX Cloud提供NVIDIA DGX AI超级计算专用集群和AI软件,使企业能即时接入用于训练生成式AI等开创性应用的高级模型所需的基础设施和软件。

因为云计算发展,大约3000万台CPU服务器完成大部分处理工作。黄仁勋在GTC大会上带来一系列“杀手级”技术和产品。

搜索
最近发表
标签列表