一场不发芯片的产品发布会：摩尔线程如何讲述“全栈生态”新故事？

出品/未来科技界

编辑/杨宇

5月18日，摩尔线程举办了2026年年度产品发布会。不过令硬件迷和投资者稍显意外的是，这家国内头部的芯片厂商并未带来核心GPU的升级迭代，取而代之的，是创始人张建中在近两小时的演讲中，系统性地铺开了一张名为“云-边-端”的全栈智算矩阵蓝图。

摩尔线程一口气发布了六大产品与解决方案，从支撑大模型训练的万卡级“夸娥”智算集群，到走进家庭的AI中枢“AICUBE”和AI笔记本“AIBOOK”，再到具身智能仿真平台“MT Lambda”和持续进化的“MUSA”软件生态，以及全新的智能体“小麦”。

发布会的主题是“词元时代，万物智能”，这清晰地传递出一个信号：在“词元（Token）时代”的算力焦虑中，这家国产GPU厂商的战略重心，正从单一的硬件性能追逐，转向一场更为复杂的、围绕生态与全栈能力的系统性战役。

“一句话生成游戏”，这听起来很未来，但它具体是怎样的体验？

从“纸面参数”转向“工程化ROI”

张建中在演讲中提到，过去几个月，以“龙虾（OpenClaw）”为代表的Agentic AI迅速爆发，将全行业推入了指数级消耗Token（中文名：词元）的“词元时代”。

虽然算力荒无处不在，但对于芯片厂商来说，受限于先进制程的客观壁垒，国产GPU盲目追求硬件迭代周期的边际效应正在递减。而对于大模型厂商来说，以前看重芯片的纸面浮点运算力，现在看重的是整体运营成本（TCO）与回本周期（ROI），也就是手头的算力能不能稳定地跑出商业成果。

张建中在演讲中披露了一组数据：夸娥集群有效训练时长占比超90%，Dense模型（稠密模型）和MOE模型（混合专家模型）的算力利用率分别达60%和40%，8000张卡规模的集群在Weak Scaling（弱扩展）下实现了95%的线性扩展效率。

摩尔线程在硬件未升级的情况下，通过MUSA生态的Day-0级适配（支持DeepSeek、Kimi、GLM、MiniMax、Qwen等）以及Automusify智能迁移工具，本质上是在帮B端客户省钱和抢时间。

用自研“长江”SoC开辟第二战场

“长江”是摩尔线程旗下基于Arm架构的智能SoC芯片，于去年12月在其举办的首届MUSA开发者大会上发布，32GB内存、120GB/s带宽，集成CPU、GPU、NPU、VPU等单元，兼顾AI计算、图形处理、多媒体编解码与设备控制能力，提供50 TOPS的异构AI算力，并支持INT8/FP16/FP32混合精度计算，能匹配终端侧智能体运行、本地推理、多任务协同的真实需求。

“长江”SoC驱动了AICUBE和AIBOOK两款产品：

其中AICUBE，是摩尔线程面向家庭场景打造的一体化AI中枢，将AI Agent（“小麦”智能体）、AI PC、AI NAS三种能力融合，切的是当下用户对本地AI、数据隐私、一站式智能体验的需求。它不只是一台迷你主机或存储设备，而是承载“小麦”智能体的家庭入口，把多应用控制、智能相册、视频超分、本地大模型运行等能力整合在了一台设备中。

和“长江”SoC同样在MUSA开发者大会上首发的AIBOOK，则聚焦个人AI生产力场景，以原生Linux AI OS为基础，主打多智能体并行运行、开箱即用的开发环境与全场景工具支持，面向AI开发者、轻量化办公人群与“一人公司”等群体。它跳出了传统笔记本的性能内卷思路，将核心竞争力放在AI任务高效运行、智能体协同、多系统兼容与端云一体开发上，让用户无需复杂配置即可开展AI开发、模型调试、智能体应用部署等工作，既是面向终端用户的生产力工具，也是摩尔线程触达开发者、普及MUSA生态的重要载体。

整体来看，“长江”SoC、AICUBE与AIBOOK三者形成了清晰的协同关系，芯片提供统一底层能力，两款终端分别覆盖家庭与个人场景，共同将摩尔线程在云端积累的智算、智能体、软件生态能力延伸至终端侧。

以全功能GPU的优势做具身大脑

具身大模型是人形机器人的“大脑”。随着视频生成、时空建模、多模态融合等技术的突破，“世界模型”已成为具身智能领域最具前景的又一技术路线，其核心意义在于赋予智体“内在的世界理解与模拟能力”，能够在与环境交互过程中产生对应的高维、多模态的感知数据中提取物理规律、因果结构与环境动态，从而形成可用于推理与规划的内部表征，进而提升决策性能。

张建中在演讲中也总结了具身大模型建设的三个挑战：一是数据稀缺且获取成本高；二是真机由于造价昂贵、试错成本高导致训练效率低；三是训练环境不可控导致实验难复现，单一环境无法覆盖各种场景变化，因此难以在实际应用中实现泛化。

以前训练一个机器人，需要CPU做物理刚体碰撞模拟，需要A卡/N卡做图形渲染来让“机器人看清世界”，同时还需要AI芯片来跑大模型进行策略训练。数据在不同的芯片、不同的内存区域之间“搬来搬去”，延迟极高，效率极低。

面对大模型向“物理世界落地”的确定性趋势，摩尔线程的首个全栈具身智能仿真平台MT Lambda的底层基于全功能GPU，实现了图形渲染、物理求解、AI计算在同一芯片中完成，这让摩尔线程成为了国内少数能提供“一站式训练”的厂商。

结语

总结来看，摩尔线程的这场产品发布会，展现出了其跳脱出传统芯片算力竞赛的发展路径。面向词元时代与Agentic AI浪潮，它主动选择将战略重心从单一的GPU性能迭代，转向构建一个覆盖“云-边-端”、软硬一体的全栈智算生态，核心从解决客户“有没有芯片可用”的基础问题，升级到回答“如何更低成本、更高效率、更安全可控地获得AI生产力”的系统性命题。

但这条“全栈生态”之路，也是一条高投入、长周期、需要强大多线协同能力的道路。它要求企业同时在基础设施、软件生态、终端产品与前沿平台等多个维度保持竞争力，对公司的技术整合、产品定义与市场开拓能力构成了前所未有的考验。其成功与否，最终将取决于各产品线能否真正形成合力、生态能否实现正向循环，以及市场对这套系统性解决方案的买单意愿。

然而，这或许也是中国高端算力产业在特定产业周期与外部环境下的一种务实选择。当单一节点的技术追赶面临客观约束时，通过系统集成与生态创新，在更广阔的“应用-软件-硬件”协同中创造独特价值，不失为一种构建差异化优势、寻求破局的战略尝试。

转载之前请先阅读转载说明，违规转载法律必究

寻求报道或合作，请点击这里

如果您加入壹览的讨论群，请联系我们的工作人员（微信号：star_3979)