深度解读“智云上海”底层逻辑: 一次关于“城市未来”的算网重构

一次网络基因重组

作者/IT时报郝俊慧

编辑/孙妍

在时代的浪潮中,上海总是那个先行者。

从百年前的十里洋场到今日的国际金融中心,这座城市对“下一代城市范式”始终保持着高度敏感。随着AI的爆发,未来城市不再只是土地与建筑的集合体,而是将逐步演化为一个有记忆、有感知、有预测能力的“超级智能体”。在这个进程中,谁先构建起稳定、安全、可控的城市智能算网底座,谁就有可能率先进入下一轮增长周期。

上海必须上场,也必须加速。

根据《上海市关于促进智算云产业创新发展的实施意见(2025—2027年)》,到2027年,本市智算云产业规模力争突破2000亿元,智算规模力争达到200EFLOPS(每秒百亿亿次浮点运算),其中自主算力占比要超过70%。上海通信管理局刚刚发布的“算力浦江”计划中,到2025年底,上海智算规模要达到100EFLOPS。

可比数据是,截至3月底,我国智能算力规模为748EFLOPS(工信部数据),2025年中国智算规模有望达1037.3EFLOPS(IDC预测)。上海的目标意味着,在智算领域,上海至少要占据全国十分之一的份额,这彰显了上海打造全球“AICity先行者”的雄心。

中国电信凭借其在基础设施建设、云计算服务和技术创新方面的优势,正成为这一赛道的重要参与者。

在不久前中国电信与上海市政府正式联合发布的城市信息化新名片——“智云上海”战略中,明确在上海市部署“2+X+M”的前瞻性算力体系和普惠千行百业的公共算力服务平台、行业MaaS模型及一系列创新AI应用,助力上海构建从中心到边缘的全覆盖、超大规模智算网络。

打造AI底座从“大算力”到“微算力”

在上海的智算布局图上,中国电信临港智算谷是最耀眼的一颗明星。

2024年3月,临港智算谷首个国产单池万卡液冷算力集群正式交付并投入商业运营,作为长三角最大规模的运营商级算力资源,临港智算谷创新性的“魔方”式布局实现了单体超万卡的极致集群能力,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。

而在青浦,另一个智算引擎正在悄然运转。作为长三角一体化绿色算力枢纽,青浦智算中心占地约36亩,总建筑面积约5万平方米,可支持31.8MW算力设备部署(按需扩容至42MW)。依托国家算力高效调度示范工程,聚焦区域产业数字化与数据要素流通,为长三角企业提供低能耗、高可靠的算力服务。

临港和青浦两大核心枢纽,筑牢了算力的“压舱石”,也是上海电信“2+X+M”算力架构的心脏,而“X”则是密布城市“算力毛细血管”。

过去几年间,上海电信对上海核心区域约60个数据机房进行升级改造,使其成为“智云上海”的深边缘节点,为金融高频交易、电竞云渲染、在线新经济等场景提供高性能、高可靠算力。比如,在陆家嘴金融区,附近的“X节点”可为高频交易系统提供微秒级响应。

“M”则是客户侧算力,旨在将算力下沉到“指尖”。通过遍布全市的逾500个边缘算力节点,算力下沉至企业园区、工厂、交通枢纽等边缘场景,实现了“一跳即达”的低时延响应。比如在工业AI场景中,这些边缘节点可以实时处理工厂设备的传感数据,支撑无人工厂的精准控制,时延可低至10毫秒。

通过这种动态调度、分布协同的能力架构,上海电信实现了从“国家级大算力”到“边缘微算力”的全层级覆盖,既满足AI大模型训练等“重任务”需求,又支撑工业控制、家庭智能等“轻应用”场景,让算力真正像水电一样,成为城市运转的基础资源。

网络“基因重组”从“传数据”到“算数据”

如此庞大的算力体系,传统的网络架构已无法支撑。

为此,“智云上海”对城市网络进行了“基因重组”,它实现了从“传数据”到“算数据”的本质跨越,让网络不再是简单的“数据传输管道”,而是具备了“智能感知、资源随需调度、云网安一体化”等能力,成为AI时代的“数字神经网络”。

“智云上海”打破了传统树状网络的层级壁垒,采用了扁平化叶脊(Spine-Leaf)全互联架构,就像是为城市中的所有数据、网络和算力服务打造了一个“智能交通中枢”,任意节点间都能实现“路由最优、带宽无收敛”,彻底消除了资源调度的瓶颈,首次实现了全域数据流量的全向最优调度。

在此基础上,智云上海将计算能力嵌入网络节点,实现了从“计算在网络外围”到“计算在网络中间”的转变。

数据和算力就像有了“智能导航”,不仅能自主选择最佳路径,更能匹配最佳服务节点,实现“路径+算力”的双重优化。这种“算网融合”的底层支撑技术,让原本分散的资源被整合为一套“可以对话的系统”。

提供普惠算力让AI成为城市基础设施

上海正在将AI打造成像水电煤一样的基础设施,让其随取随用,普惠便民。

2024年1月,上海电信在全国范围内首个推出人工智能公共算力服务平台,以及一系列商用级“人工智能公共算力服务产品”。发展至今,该平台以上海为长三角核心部署中心节点,并拓展至国内多省市服务节点,最远端已延伸至西北边陲,汇聚了12.5Eflops的公共算力,面向企业和公众提供服务。它不仅汇聚了上海电信“东西两翼”的算力资源,还适配了包括华为、沐曦、壁仞、海光等在内的13家以上国产算力资源。

2025年3月,基于此平台,上海电信推出“人工智能公共算力超市”,中小企业可以按需租用算力,例如进行AI客服或数据分析,成本能降低一半以上,极大地降低了企业AI转型的门槛。例如,一家初创AI企业通过该平台训练图像识别模型,原本需要6个月的时间缩短至1个月,成本也大幅下降,加速了技术落地。

WAIC2025期间,人工智能公共算力服务平台焕新升级,在已有算力超市和模型超市基础上,新增AI超市。AI超市打造了“智云上海AISTORE”,企业可以在这一专区找到各有所长的数字员工,比如行政、法务、文宣、研发、客服、销售等专员。

除了算力普惠,智云上海还打造了“AISTORE”生态伙伴计划,整合了算力层、模型层、应用层的合作伙伴能力,开发面向千行百业的智能体和AI解决方案。

例如,针对政企单位公文处理的痛点,上海电信携手生态合作伙伴蜜度共同打造了智能体“晓主任”。它依托城市级算力平台,提供了通用问答、智能写作、审校、翻译等八大核心功能,助力政务办公从“手工苦写”迈向“智能赋能”。

面向未来连接“算力孤岛”一次跨越千里的三地同算

AI并不总以相同的方式走进每一个行业:对于制造业,它可能是产线背后的中枢调度;对于金融业,它是本地部署的算法安全沙箱;而对于大型科研机构,它则是一次连接“算力孤岛”的集体突围……

长期以来,超大规模人工智能模型的训练是一场“独立战争”,它严重依赖单一数据中心内的算力资源,不仅存在部署灵活性差、资源利用效率低、构建成本高等问题,更让高昂的构建成本成为一道难以逾越的壁垒,“算力孤岛”成为制约模型规模进一步扩展的关键瓶颈。

2025年7月,一场跨越数千里的试验在黄浦江畔、京畿重地和西南腹地之间悄然展开。这是全球首个长距离跨域异构混合训练,上海临港和天津武清的昇腾芯片集群,以及位于贵州贵阳的英伟达集群,三地节点联合进行千亿参数大模型的训练,三地智算资源被有效融合为一体,训练过程稳定运行,通信延迟、节点吞吐与模型精度均达到工程化标准,整体算力利用率超过90%,这在全球范围内尚属首次。

“千里大协同”的背后,是两股核心力量的深度融合:一方是上海人工智能实验室自主研发的DeepLink超大规模跨域混训技术方案,它创新性地采用异步同步融合策略和参数调度优化机制,为跨地域、跨芯片、跨平台的大规模分布式训练提供了技术支撑。另一方面,则是中国电信天翼云的“息壤”算网一体化智能调度能力。

作为中国电信第一科技,息壤平台可对不同类型智算节点进行智能编排、任务分发与资源动态优化调度,确保异构集群高效协同运行,为本次试验提供了关键的智能算网支撑。

这意味着,在计算资源有限的情况下,行业依旧可以实现不同性能芯片的灵活组合,无需再依赖高算力芯片“扎堆”式部署,从而有效降低对特定硬件的路径依赖,也为算力生态的多元繁荣奠定坚实基础。

由此,大量难以利用起来的碎片化算力可以得到有效整合,云边端的算力协同得以更加深入,随着全局算力利用率提升,可大幅降低人工智能服务成本,从而促进AI普惠加速到来。

业内专家表示,此次试验是中国推动大模型基础设施体系向“多地协同、异构融合、智能调度”演进的重要里程碑,不仅为大模型的高效开发提供了新路径,随着相关技术的进一步成熟与应用推广,更将有效提升我国在人工智能基础设施领域的自主可控能力,加速构建面向未来的国家智算网络。

排版/季嘉颖

图片/上海电信东方IC