摩尔线程描绘了更大的蓝图:从全功能GPU到Agent全场景落地
标题:摩尔线程全场景AI落地:智能体“小麦”引领从云端到终端的完整布局 算力需求的紧张局势早已无需渲染。今年5月的一个夜晚,摩尔线程创始人、董事长兼CEO张建中在2026年产品发布会上透露:当前国内仅某一款应用的单日Token消耗量已突破140万亿,而此前对整个市场的预测仅为30万亿至180万亿之间。应对如此庞大的算力需求,可靠的人工智能...
标题:摩尔线程全场景AI落地:智能体“小麦”引领从云端到终端的完整布局
算力需求的紧张局势早已无需渲染。今年5月的一个夜晚,摩尔线程创始人、董事长兼CEO张建中在2026年产品发布会上透露:当前国内仅某一款应用的单日Token消耗量已突破140万亿,而此前对整个市场的预测仅为30万亿至180万亿之间。应对如此庞大的算力需求,可靠的人工智能基础设施不可或缺。但算力只是故事的一半。“场景最终需要通过笔记本、手机等终端来实现,”一位投资人对雷峰网表示。从云端到终端,从算力到生态,摩尔线程在发布会上展示了一幅完整的AI版图。
Token消耗的主要来源无疑是AI Agent。IDC预测,到2030年全球活跃AI智能体将达22.16亿,中国企业的AI智能体数量将在2031年突破3.5亿,年复合增长率超过135%。这股热情也传导至政策端——2026年政府工作报告首次写入“智能体”,设定2027年普及率超70%、2030年超90%的目标。然而,市面上许多智能体在主动服务和长期记忆等方面仍存短板。摩尔线程此次首发的全域智能体“小麦”可谓恰逢其时。在MTClaw Evaluation System测评中,“小麦”综合评分远超国产同类产品,比OpenClaw高出约20%。张建中重点介绍了三个特性: - 事办得全:支持7×24小时服务,基于原生Linux环境控制超过36种APP,拥有60多项复杂技能,无缝衔接90多个CLI工具。 - 事办得好:通过二维拓扑记忆系统,融合短期与长期记忆,不断归纳总结知识。 - 事办得快:基于自研架构MTClaw,高频工具调用成功率超95%,端到端效率提升7倍。 “我们希望‘小麦’能迅速落地千家万户,”张建中表示。
智能体的落地需要载体。摩尔线程首款家庭消费级产品MTT AICUBE成为“小麦”的第一个家。张建中用“三位一体”——AI Agent、AI PC、AI NAS——定义这款迷你智能立方体。它内置首颗自研智能SoC芯片“长江”,集成CPU、GPU、NPU、VPU,提供50TOPS异构算力,内存可达32GB。标配1TB全闪SSD,可扩展至12TB,满足数据存储与隐私安全需求。以家庭照片为例,AICUBE能自动整理相册、生成纪念视频、实时视频超分,真正实现“存得下、找得到、用得起来”。
如果说AICUBE把“小麦”留在家中,那么MTT AIBOOK则把它装进了背包。这款AI PC瞄准当下个人公司(OPC)趋势,可在本地同时运行超过12个智能体,直连90多款工具,协同完成全链路工作。背后是摩尔线程自研的AI操作系统,相比Windows更轻量、实时、可靠。AIBOOK具备开箱即用特点:出厂预装OpenClaw,可一键切换MTClaw;内置PES应用市场;提供Windows虚拟机和安卓容器,方便跨系统运行应用。摩尔线程还联合趋境科技,为每位用户提供7×24小时远程技术支持。
从数字到物理,张建中希望智能体进一步走进现实世界。针对训练物理世界智能体面临的数据稀缺、真机风险大等挑战,摩尔线程推出国内首个全栈国产化具身智能仿真平台MT Lambda。硬件基于支持光线追踪的S5000 GPU和夸娥集群,软件融合开源MujoCo、Newton及自研AlphaCore引擎,实现多物理场统一求解与逼真渲染。现场机器狗的灵动表现便是最直观的注脚。目前,摩尔线程已联合光轮智能、智源研究院、光线云等合作伙伴,打通从数据合成到模型训练再到策略部署的闭环,并呼吁更多伙伴加入PES联盟。
支撑智能体和仿真平台的是摩尔线程的云端底座——夸娥万卡集群。其核心优势在于稳定与高效。张建中指出,客户不愿换用国产集群的根本原因在于能否“7×24小时不停机”。测试数据显示,该集群有效训练时长占比超90%,稠密模型MFU超40%,MoE模型MFU超60%;在精度和扩展性上,每个训练步骤与国际主流对齐,万卡规模线性扩展率约95%。针对强化学习等后训练阶段,集群集成了SGLang和vLLM两大开源推理引擎,并尝试训推分离Slime方案与训推一体VeRL方案,效果提升显著。在推理场景中,夸娥集群在AI漫剧、短剧创作上表现突出——张建中称“短时间就能生成以前好莱坞大片效果”。这得益于全流程智能生产流水线,包括文生视频、语言理解、剧本创作模型,以及自研语音引擎“摩语精灵”。
一切性能的发挥离不开软件生态。摩尔线程的MUSA平台已支持700多个核心API,驱动与运行时免费开放。算子库实现100%兼容,55类算子覆盖核心AI算子,MuDNN性能与原生持平;PyTorch算子层100%兼容,SDK升级至5.1。FlashAttention算子效率优化至95%,大幅缩短适配时间。在开发者社区方面,摩尔线程将国产AI编程语言TileLang集成至开源主线,GEMM算子效率超95%,Attention效率超90%;并与智源研究院合作推进Triton算子开发。此外,AI编程工具MUSACODE支持自然语言交互,或通过与“小麦”对话生成算子,已原生集成在AIBOOK的VSCode中。MUSA还新增了对Fortran编译器的支持,便于传统科学计算等应用的迁移。
从云端算力到端侧智能体,从数字世界到物理仿真,摩尔线程正构建起一个覆盖全场景的AI生态系统。这张版图的核心,是让智能体无处不在,真正服务于人。
评论反馈