上市15天,摩尔线程将矛头直指英伟达腹地
作者:365bet亚洲体育 发布时间:2025-12-21 10:09
制造|虎秀科技群作者|丸都山编辑|苗正清头像|当摩尔之线在资本市场的热度减退时,摩尔之线又将人们的注意力重新带回了行业。 12月20日,摩尔线程召开首届“MUSA开发者大会”,发布了新一代全功能GPU架构“华罡”,以及基于“华罡”架构的AI训练与推广集成芯片“华山”,以及专用于高性能图形渲染的芯片“庐山”。此外,摩尔线程创始人张建中还宣布了“快鹅万卡智能计算集群”以及未来即将发布的MTT C256超级节点结构计划。如果说以上内容还属于“可预见”的技术迭代范围内,那么诸如中间语言MTX,以及光刻计算库、量子cowhite融合框架等技术确实让人意想不到。当然e,也可以说,这些技术并不是摩尔线程第一次提出的。毕竟,最后这些内容或多或少都是从GTC会议上出来的。不过,从国内GPU企业的规模来看,全面打造生态系统的勇气本身就值得肯定。对于正处于“感性估值”与“理性审视”交汇点的摩尔线程来说,本次开发者大会也向外界发出了一个明确的信号,那就是无论业界评价如何,摩尔线程都将坚持以MUSA为核心,打造类似于NVIDIA CUDA的生态护城河。与英伟达竞争?首先我们来说说本次开发者大会上最让我惊讶的技术:中间语言MTX。它是MUSA 5.0软件堆栈的一部分。关注摩尔线程的人或多或少都了解MUSA统一架构。是摩尔三人自主研发的全栈技术体系广告涵盖芯片架构、指令集编程模型、软件运行时库和驱动程序框架。在之前的版本迭代中,MUSA 主要致力于扩展编程生态,使其兼容更多编程语言,或者丰富算子库。今天提到的“中间语言MTX”还是第一次出现。简单解释一下什么是中间语言MTX。其主要功能是兼容不同代GPU的指令架构,使得开发者无需针对每一代新的GPU重新适配代码,显着降低了开发者的适配成本,同时为上层软件生态提供稳定的底层支持。我们举一个更容易理解的例子:在NVIDIA CUDA生态系统中,其主要组成部分之一就是中间语言技术,NVIDIA将其命名为“PTX”。依托PTX中间语言,d编译的代码2018 年图灵架构芯片的开发者仍然可以通过驱动程序动态编译在 2025 Blackwell 芯片上使用。那么让它成为“中间语言”就很难了吗?不得不说,这是非常困难且耗时的。以NVIDIA的PTX为例,2007年随CUDA 1.0一起发布后,大部分版本都不得不增加对应硬件的专用指令(如Tensor Core相关指令),同时保持对旧版本的支持。这种方式最终形成了“高级语言→PTX→硬件二进制指令”的成熟编译链路。对于开发者来说,由于中间语言PTX的存在,没有理由拒绝CUDA,因为在NVIDIA之前,没有一家芯片制造商考虑过“向前兼容”的问题。不过,对于国内GPU厂商来说,开发中间语言的难度肯定比NVIDIA还要大。因此,在此之前,我并不认为有应该是国内有厂家能做的吧。根据张建中今天在开发者大会上的发言,明年上半年,摩尔线程自研的MTX将向开发者开放。相比Nvidia 18年的努力,可以预见摩尔的MTX线程不会像以前那么好用,但敢于迈出这一步已经足够令人印象深刻了。因为毕竟在GPU行业,有了NVIDIA这样的巨头,“不做生态”在一定程度上已经成为了政治正确。新架构,重大改进。从2022年推出基于MUSA统一架构的“苏迪”开始,摩尔线程已经推出了四代GPU架构,而这期间发布的“花岗”架构可以认为是升级幅度最大的一代。首先是计算性能的显着提升。基于新一代指令集,“华钢”架构拥有算力密度比上一代“平湖”高50%。同时,能效高度优化,支持从FP4到FP64的全精度端到端计算。其次,有对异步编程和超大规模互连的支持。新一代异步编程模型可以更好地优化任务调度和并行性,并通过自主研发的MTLink高速互连技术,将支持10万卡以上规模的智能计算集群的扩展。值得一提的是,在开发者大会上,张建中还明确表示,新一代“花岗”架构将内置AI生成渲染结构,并将全面支持DirectX 12 Ultimate。基于此,确实可以判断,摩尔线程的消费级显卡未来肯定会重蹈覆辙,而且大概率是一款产品以“花岗”架构为基础。在“消费级显卡”这一小众且难度最大的赛道上,摩尔线程依然没有放弃。基于“花岗”架构,摩尔线程今天发布了两款芯片:“庐山”和“华山”。再来说说《庐山》中的Tung FirstCol,定位为“AI训练与推送一体”的芯片。除了上面提到的新一代异步编程和全精度张量计算单元之外,这款芯片的特别之处还在于它可以适应各种“类以太网协议”,同时适应各种Scale-Up交换机。这意味着“庐山”芯片不仅可以在MTlink下使用,还可以兼容国内其他厂商的协议。据现场张建中介绍,“庐山”支持最多1024个超级节点的扩展。不得不说的是,摩尔线程虽然执着于打造自研生态,但并没有缩小它的路径。另一款用于高性能图形渲染的“庐山”芯片,其图像性能与MMT S80进行了对比。融入AI生成渲染后,AI计算计算性能提升64倍,UtiTE统一渲染架构将几何处理性能提升16倍,全新硬件光线追踪引擎将光线追踪性能提升50倍。除了芯片之外,本次MUSA开发者大会还正式发布了“快鹅万卡智能计算集群”。该集群具备全精度、全功能的通用计算能力,可实现万卡规模的高效、稳健的人工智能训练和推理。随着今年生态边界的不断拓展,国内GPU行业的叙事逐渐从“好用”转向“好用”。尤其是国内H200出口禁令解除后,国内从业者感受到了更大的紧迫感y。对于芯片的“易用性”问题,摩尔线程依然聚焦在“生态”二字,不仅要实现生态自由,还要积极探索生态的边界。例如,在今天的开发者大会上,摩尔线程推出了“长江”SoC。该芯片主要针对终端侧。通过CPU+GPU+NPU的组合,可提供高达50TOPS的异构AI算力。张建中介绍,摩尔线程将推出MT机器人,包含基于“长江”SoC的智能解决方案、AI芯片模块MTT E300和快鹅智能计算集群。从这个组合可以看出,该方案最大的特点就是能够协调“端-边-云”算力。据悉,MT机器人已应用于农业场景。另外值得一提的是,摩尔线程还基于SoC na制作了一款名为“MTT AIBOOK”的AI计算笔记本,并且未来还将推出迷你计算设备MTT AI Cube。在体现智能方面,除了MT Robot之外,摩尔线程还发布了包含智能模拟训练平台的MT Lambda。该平台在定位上与Nvidia的Isaac Sim有些相似,但也不完全相同。 MT Lambda的核心聚焦于“全栈集成”,旨在将物理引擎、渲染引擎和AI引擎深度融合,打破传统具身智能研发中“开发、模拟、训练”分离的痛点,提升研发效率。此外,MT Lambda还可以直接与MT Robot部署,构建高效的软硬件协作。从摩尔线程在体现智能赛道上的生态拓展可以看出,在当前任何一个与“计算”相关的行业中,摩尔线程都试图通过“全栈软硬件”的布局来占据一席之地。“e架构+全场景产品”,每一步都在拓展生态边界,同时也面临着真正的挑战。从某种意义上来说,这也是英伟达的一次回归。面对后者20年来积累的生态霸权,摩尔之丝能否筑起另一条国内生态护城河,答案最终将受到考验。本文来自虎嗅,原文链接: https://www.huxiu.com/article/4819257.html?f=wyxwapp 特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布,本平台仅提供信息存储服务。 注:以上内容(如有,包括照片、视频)由网易号用户上传发布,网易号为社交媒体平台,仅提供信息存储服务。
电话
020-66888888