端侧AI算力角逐升级, Arm Lumex CSS平台以全栈创新破局
飞象网讯(可欣)当前,移动设备正加速向ai驱动的智能终端演进,用户对实时翻译、生成式ai交互、高保真游戏等端侧体验的需求日益迫切,这使得移动芯片面临性能、能效与开发周期的三重挑战。
一方面,旗舰设备迭代速度加快,芯片供应商与oem厂商需在更短时间内实现技术突破;另一方面,3纳米等先进工艺带来设计复杂度攀升,而移动设备有限的面积与散热空间,进一步限制了ai算力的释放,行业亟需能平衡性能、能效与开发效率的一体化解决方案。在此背景下,arm推出全新lumex计算子系统(css)平台,通过软硬件深度集成的全栈创新,为端侧ai发展破局。
全栈创新破局端侧ai,armlumexcss平台重塑行业格局
据介绍,在核心硬件方面,armlumexcss平台实现ai与图形性能双突破。cpu层面,搭载armv9.3c1cpu集群,内建第二代可伸缩矩阵扩展(sme2)技术,ai性能较上一代提升5倍,语音工作负载延迟降低4.7倍,音频生成速度提升2.8倍;旗舰级armc1-ultra单线程峰值性能较上一代提升25%,且连续六年保持两位数每时钟周期指令数(ipc)增长;armc1-premium专为次旗舰市场打造,可提供一流的面积效率;,armc1-pro与armc1-nano则分别在功耗与能效、面积上优化,适配不同设备需求。
在gpu层面,malig1-ultra带来颠覆性体验。其新一代光线追踪单元(rtuv2)使光线追踪性能提升2倍,在《原神》、《崩坏:星穹铁道》等游戏中帧率提升40%,同时通过新的fp16矩阵计算路径,ai推理速度较上一代immortalis-g925提升20%。此外,malig1系列提供1-24个着色器核心的灵活配置,malig1-premium与malig1-pro可适配不同层级设备,兼顾性能与成本。
不仅如此,系统级的创新进一步释放了平台潜力。具体而言,新的sil1系统互连泄漏功耗较标准ram降低71%,mmul1内存管理单元支持多样化部署,3纳米工艺优化方案助力合作伙伴“一次流片成功”,降低设计风险与周期成本。开发者生态层面,kleidiai软件库集成至主流ai框架,开发者无需修改代码即可调用加速能力,目前谷歌多款应用及支付宝等已支持该平台,大语言模型响应时间缩短40%,生态兼容性与实用性凸显。
apple、三星和mediatek等企业,正积极集成ai加速功能,推动端侧ai向更快速、更高效的方向发展。armlumexcss平台的推出不仅解决了端侧ai核心痛点,更推动行业格局重塑。其性能突破重新定义移动计算天花板,生态层面支持跨系统迁移,apple、三星、mediatek等企业已基于其技术升级端侧ai。长远来看,arm预计到2030年,sme与sme2技术将为30亿台设备新增100亿tops计算能力,推动端侧ai从旗舰设备下沉至全场景,为芯片厂商与oem提供灵活适配方案,进一步巩固arm在移动计算领域的核心地位。
架构适配多元需求,稳固多领域市场地位
谈及与中国手机厂商的合作,arm表示会携手中国生态系统,深化合作伙伴关系,并对合作的持续推进充满信心。实际上,在当前国际环境复杂、手机大盘增速放缓的大背景下,不少人也疑惑是否会对arm产生负面影响,对此,arm方面也明确表示,在手机领域,尽管行业整体出货量增长趋于平缓,但arm对与中国手机厂商的合作充满信心,始终保持密切合作并致力于深化合作模式。
值得关注的是,旗舰及高端手机市场呈现出消费者支出持续增加的态势,用户对设备先进功能的重视程度不断提升。同时,ai发展初期带来的巨大机遇正推动手机领域计算需求升级,虽然ai计算对算力性能、内存带宽和功耗效率要求极高,但这些挑战也成为技术创新的驱动力,为arm在手机领域的增长创造了全新空间。
在本次armunlocked2025上海站主题演讲上,vivo高级副总裁、首席技术官施玉坚也表示,作为arm的技术合作伙伴,vivo不仅与芯片平台厂商协作,在手机中率先落地arm先进计算技术,为消费者带来体验的新升级。更重要的是,我们能将真实用户场景中的需求,提前带入技术的始发地,与arm共同开启微架构层面的特性优化,进而引领未来芯片技术的演进。
据了解,vivo从2023年就开始了sme2的场景研究和验证,分析测试各类ai任务,明确不同算法的最优硬件路径选择,真正实现软硬一体化的设计。目前,vivo计算加速平台vcap,已全面支持sme2指令集,对使用视觉、语音、文本ai算法进行处理的高负载任务,实现显著的性能加速。以典型的端侧任务为例,开启sme2硬件,在全局的离线翻译等真实场景中,vivo突破过往最优方案上限,实现额外20%的性能收益。
这也很直接的印证了arm对手机行业的正向价值,毫无疑问,最新一代的高性能计算技术以及sme2等先进特性,将把移动端用户体验带向新的高度。
除了移动设备领域与此同时,在中国智能汽车与机器人领域定制芯片趋势凸显的当下,arm架构也展现出强大的适配能力。针对汽车领域对安全性的高要求,arm长期投入安全技术,其技术成果已应用于zenacss平台,并被工业机器人领域广泛采用,完美契合这类场景的安全需求。而在机器人领域,除工业场景外,消费级市场从扫地机器人到高端阶设备的布局也在加速,据arm的中国合作伙伴反馈,arm在中国机器人市场的份额已超70%,这一成果并非依赖特定产品开发,而是源于arm架构本身的强劲性能与广泛适用性。
面对市场对定制化解决方案的需求,arm明确表示将推出相应产品满足需求,同时强调其架构能从根本上适配多样的设备类别与垂直领域,即便设备研发与制造方式发生变化,也能为行业发展提供稳定支撑。
在ai成为下一代移动技术核心驱动力的当下,armlumexcss平台以“硬件升级+系统优化+生态兼容”的全栈创新,打破了性能、能效与开发效率的平衡难题。无论是消费者期待的实时智能交互、沉浸式游戏,还是厂商追求的快速迭代、差异化竞争,armlumex都提供了高效解决方案,以实际行动推动技术落地与场景普及,或将成为推动移动计算进入“ai优先”时代的重要里程碑。