200亿美元收购Groq!英伟达“历史上最大的收购”
作者:365bet网址 发布时间:2025-12-29 10:10
文章|超级关注黄仁勋,再次发挥他的“金钱力量”。 12 月 24 日,据《华尔街日报》报道,Nvidia 与 Groq 达成非独家许可协议,将 Groq 的 AI 推理技术纳入未来产品中。作为交易的一部分,Groq 创始人兼首席执行官 Jonathan Ross、总裁 Sunny Madra 和几名关键员工将加入 Nvidia。此前,CNBC 援引投资机构 Disruptive 的报道称,交易价值将达到 200 亿美元,将以现金支付。如果价值属实,Groq 的收购也将成为 NVIDIA 30 多年来最大的收购案,超过当年为 Mellanox 支付的 70 亿美元价格。那么,Groq 到底是什么?它掌握了什么样的核心技术,值得英伟达在反垄断审查的压力下花重金去柜台购买呢?这笔交易到底是单纯收购AI推理技术,还是高深莫测?Nvidia有些“自私”?为什么Gorq不顾反垄断审查仍让英伟达收购它? Groq 不生产 GPU,它生产的是一种称为 LPU 的“速度怪物”,旨在彻底摧毁冯·诺依曼架构。如果你想了解 Groq,你必须首先了解它的创始人乔纳森·罗斯 (Jonathan Ross)。在硅谷,罗斯被许多人称为“芯片行业的叛逆者”。在创立 Groq 之前,他是 Google TPU 项目最早的支持者之一。他领导开发的TPU让谷歌在这一轮AI算力竞争中占据了重大优势。但当外界将TPU视为行业标杆时,罗斯却发现了一个问题。他意识到 GPU 和 TPU 本质上只是传统冯·诺依曼架构的“补丁”,很难满足 AI 模型不断扩展的需求。尤其是在面对日益复杂的逻辑任务时,硬件往往处于等待软件调度的低效被动状态。一个而这条不愿继续的路也将结束。 Ross想做的就是开辟一条新路,这也是Groq的初衷。罗斯认为,AI时代的计算不应该是随机的、不稳定的或依赖于复杂的调度,而应该是“确定性的”。因此,Groq在他的领导下提出了一个新的处理器类别——LPU。 LPU的基本逻辑与Nvidia的GPU完全相反。 GPU的本质是并行计算。它仍然像这个有数千名普通工人的brika。虽然它可以同时完成许多作业,但所有作业之间的通信、任务分配和缓存调度都非常复杂。这种复杂性在处理渲染图形时是一个优势,但在处理大型模型推理时却成为致命的延迟。当查询大型模型且数据在GPU内流动时,由于调度逻辑复杂,完成每一层计算所需的时间是不确定的。这导致了所谓的d“推理滞后”。 Groq 做的最疯狂的事情就是完全删除了硬件级调度程序。在LPU的世界里,你可以将其理解为“硬件定义的硬件”。这意味着在代码编译阶段,编译器已经每纳秒计算出芯片上每一位数据的位置。 LPU就像一条精确到微秒的自动化生产线:数据在第一个纳秒进入加法器,在第二个纳秒进入寄存器,在第三个纳秒退出。这种“确定性架构”让LPU能够充分感知时延变化,也震动了整个AI行业。在去年年底的评测中,当Nvidia最强大的显卡在处理大型上下文时因内存带宽和调度瓶颈而陷入“冥想”时,Groq的LPU以每秒500到800个令牌的可怕速度运行。这不仅仅是数值上的领先,更是体验上的质变。这个区域lly 将人工智能从“有用的工具”转变为“实时智能”。更具颠覆性的是,Groq 还挑战了 Nvidia GPU 的基础 HBM。目前,Nvidia的芯片价格昂贵且容量有限,因为它们严重依赖三星和海力士提供的HBM。 Groq 采用了不同的方法,使用 SRAM 而不是 HBM。 SRAM 带宽比 HBM 高几个数量级,并且延迟更低。唯一的缺点就是容量小。但通过集群设计,Groq 使用数百或数千个芯片连接在一起,形成超低延迟的“视频内存池”。这样的设计逻辑不仅超越了性能,还完成了供应链层面对NVIDIA的侧翼攻击。 Groq的LPU不需要昂贵的内存封装,也不依赖高度复杂的CoWoS封装工艺,这意味着它具有更大的生产潜力。 2025年,当AI产业从“培训所有人成本”转向“大规模商业化”Groq提出的计划,相当于在Nvidia的铁幕上打开了一道透明的裂缝。正是因为Groq出了一款可以从底层重构AI推理的产品,所以它成为了黄仁勋眼中必须立即“锁定”的目标。收购Groq或许是Nvidia最好的“防守”。在硅谷的商业逻辑中,收购一般分为两类:一是为了获得市场份额的“互补”型,另一个是消除安全威胁的“杀手级”,显然是两者的结合。 尽管NVIDIA凭借Hopper/Blackwell架构仍然主导着全球AI算力市场,但疯狂的赚钱机器已经是这样了,当大型模型完成训练、数千家企业开始部署应用时,市场对算力的需求将会发生转变。从“大飞砖”吞吐量到终极追求“毫秒响应”。而这绝对是Nvidia目前的短板。收购Groq有“锁定”竞争对手快速发展的推理能力的考虑。在 Groq 流行之前,其实已经有全球云服务巨头和初创公司在寻找“NVIDIA 以外的替代品”。经过多年的自研,谷歌有TPU,亚马逊有Trainium,微软有Maia。这些巨头正试图通过打造自己的芯片来摆脱英伟达的“税收”,而且他们已经看到了曙光。但对于二线云厂商和没有自研能力的AI软件公司来说,Groq才是他们手中原本最有力的筹码:当Groq的LPU集群大规模部署时,其极高的能效比和恐怖的推理速度将直接解构NVIDIA H100/B200在信息系统中的性价比优势。事情结束了。黄仁勋此举实质上是“井底之蛙”。通过收购Groq,Nvidia不仅获得了一项足以扰乱市场的技术,更重要的是,它让那些试图绕过Nvidia并通过Groq建立竞争优势的竞争对手立即失去了目标。其次,NVIDIA正在经历从“通用芯片”到“专用推理架构”的产品发展。 GPU虽然用途广泛,但在推理效率上却始终背负着冯诺依曼架构的重担。 Groq 的“确定性架构”和“软件定义硬件”理念是 NVIDIA 迄今为止补丁中最少的。通过整合Groq的核心团队,Nvidia将能够将LPU的低延迟特性深度集成到其下一代超级芯片中。这意味着未来的Nvidia产品可能不再是纯粹的GPU,而是集并行计算和确定性于一体的“算力怪物”。静态流处理。这将极大地促进NVIDIA纯逻辑产品的发展,也保证了NVIDIA的持续竞争力。与其被动等待 Groq 引领的架构新时代自我毁灭,不如积极拥抱并内化它。 NVIDIA 可以依靠其无与伦比的工程、软件生态系统和规模能力来快速生产和销售创新的 Groq 概念。这相当于在自己的巨轮上安装了一个为理性时代量身定制的强大新引擎。从斥巨资投资英特尔、OpenAI、xAI,到如今迫于审查压力推动收购 Groq,黄仁勋亲自诠释了什么是“用钱买未来”。此次收购Groq,本质上是英伟达利用其先发优势积累的巨额现金流,为自己购买了进入“后GPU时代”的门票。它不仅仅通过“杀死”那些acq来消除潜在的破坏者不仅如此,还尝试通过技术的内化将 Groq 的惊人推理速度融入 CUDA 生态系统的血液中。在永无休止的AI军备竞赛中,英伟达正在构建前所未有的护城河:这条护城河不仅由先进的工艺和软件生态组成,而且由能够颠覆自身的“叛逆技术”组成。黄仁勋的逻辑很简单:如果有人想打倒英伟达,那个人最好是英伟达本身。 特别声明:以上内容(如有,包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 免责声明:以上内容(包括图片、视频,如有)由网易用户Hao上传发布,网易用户Hao为社交媒体平台,仅提供信息存储服务。
电话
020-66888888