2024年底,英伟达(Nvidia)以一场盛大的活动拉开了2025年的序幕,发布了一系列产品,进一步巩固了其在人工智能开发和游戏领域的领先地位。这些产品包括全新的图形处理器和人工智能芯片,为用户提供更强大的计算性能和更流畅的游戏体验。这次发布会刷新了各项记录,展示了英伟达在技术创新方面的不断突破和实力。
首席执行官黄仁勋(Jensen Huang)在拉斯维加斯的消费电子展(CES)上上台展示了从个人人工智能超级计算机到下一代游戏卡的各种新硬件和软件产品。
Nvidia最大的公告:Project DIGITS,一款价值3000美元的个人人工智能超级计算机,将千万亿次的计算能力装入台式机大小的盒子里。
这台机器是围绕新的——到目前为止,还是秘密的——GB10 Grace Blackwell超级芯片建造的,它可以处理多达2000亿个参数的AI模型,同时从标准插座供电。
对于较重的工作负载,用户可以链接两个单元来处理多达4050亿个参数的模型。
就上下文而言,最大的Llama 3.2模型,Meta最先进的开源LLM,有4050亿个参数,不能在消费类硬件上运行。
到目前为止,它需要大约8个Nvidia A100/H100超级芯片,每个芯片的成本约3万美元,仅在处理硬件方面就总计超过24万美元。
Nvidia的两台新型消费级AI超级计算机将耗资6000美元,能够运行相同的量化模型。
英伟达首席执行官黄仁勋在一份官方声明中表示:“人工智能将成为每个行业每个应用程序的主流。通过Project DIGITS,Grace Blackwell超级芯片将惠及数百万开发者。”博客文章“将人工智能超级计算机放在每个数据科学家、人工智能研究人员和学生的桌子上,使他们能够参与并塑造人工智能时代。”
对于那些喜欢技术细节的人来说,GB10芯片代表了与联发科合作取得的重大工程成就。
片上系统将Nvidia最新的GPU架构与通过NVLink-C2C互连连接的20个节能ARM内核相结合。
每个DIGITS单元配备128GB统一内存和高达4TB的NVMe存储。同样,就上下文而言,迄今为止最强大的GPU每个都包含约24GB的VRAM(运行AI模型所需的内存),而H100 Superchip的VRAM从80GB开始。
Nvidia计划主导人工智能代理公司正急于部署人工智能代理,Nvidia知道这一点,这可能就是为什么它开发Nemotron,一个有三种尺寸的新型号系列,并于今天宣布推出两款新型号:Nvidia NIIM用于视频摘要和理解,Nvidia Cosmos用于赋予Nemotron视觉功能——理解视觉指令的能力。
到目前为止,LLM只是基于文本的。然而,这些模型在以下指令方面表现出色:聊天、函数调用、编码和数学任务。
它们可以通过Hugging Face和Nvidia的网站获得,企业可以通过该公司的AI enterprise软件平台访问。
再次,就上下文而言,在LLM竞技场Nvidia的Llama Nemotron 70b的排名高于Meta开发的原始Llama 405b。它还击败了不同版本的Claude、Gemini Advanced、Grok-2 mini和GPT-4o。
英伟达的代理推动现在也与基础设施有关。该公司宣布与LangChain、LlamaIndex和CrewAI等主要代理技术提供商合作,在Nvidia AI Enterprise上构建蓝图。
这些准备部署模板处理特定任务,使开发人员更容易构建高度专业化的代理。
一个新的PDF到播客蓝图旨在与谷歌的NotebookLM竞争,而另一个蓝图则有助于构建视频搜索和摘要代理。开发人员可以通过新的Nvidia可发布产品该平台支持一键式原型制作和部署。
玩家们,欢呼吧!新款GeForce RTX 5000显卡性能强劲Nvidia将其游戏公告留到了最后,发布了备受期待的GeForce RTX 5000系列旗舰RTX 5090拥有920亿个晶体管,每秒可执行3352万亿次AI操作,是当前RTX 4090性能的两倍。整个阵容包括第五代Tensor Core和第四代RT Core。
新卡引入了DLSS 4,通过使用AI每次渲染生成多帧,可以将帧率提高到8倍。人工智能引擎Blackwell已经为PC游戏玩家、开发人员和创意人员而来说“Blackwell融合了人工智能驱动的神经渲染和光线追踪,是自25年前我们引入可编程着色以来最重要的计算机图形学创新。”
新显卡还采用了变压器模型进行超分辨率处理,承诺提供高度逼真的图形,并以其价格提供更高的性能——这并不便宜,顺便说一句:RTX 5070为549美元,5070 Ti为749美元,5080为999美元,5090为1999美元。
如果你没有那么多钱,想玩游戏,别担心。
AMD也今天宣布Radeon RX 9070系列。这些卡基于新的RDNA 4架构,采用4nm制造工艺,并具有专用的AI加速器,可与Nvidia的张量内核竞争。
虽然完整的规格仍在保密中,但AMD最新的Ryzen AI芯片在峰值性能下已经达到了50 TOPS。
可悲的是,Nvidia仍然是人工智能应用的王者,这要归功于其CUDA技术,Nvidia专有的人工智能架构。
为了解决这个问题,AMD已与惠普和华硕建立了系统集成合作伙伴关系,到2025年,100多个企业平台品牌将使用AMD Pro技术。
Radeon显卡预计将于2025年第一季度上市,为Nvidia在游戏和AI加速方面带来一场有趣的战斗。
编辑人塞巴斯蒂安·辛克莱