海淀105款大模型背后: 看这些AI玩家如何抢占内容生产制高点

二喵 发自 凹非寺

当你还在为写一篇文章发愁时,AI已经帮别人月入一个亿了。

在北京海淀最新的一场文化沙龙上,最热的讨论不是电影、综艺,而是AI如何重塑内容生产。

不同的玩家,给出了各自的答案:

快手可灵成了“印钞机”——月入一个亿、一天能生成10万条广告;

AI音乐大模型直接把创作权交还给每一个普通人,人人都能随时随地写歌;

投资人捕捉到AIGC催生的新型创业潮,仿佛这波浪潮能再造一个抖音。

也难怪这样的讨论会发生在海淀。这里刚刚成为全国首个“百模规模”的地市级区域——备案大模型达到105款,占全国的五分之一。

于是乎,在这片技术最密集的热土上,大家开始思考一个更深层的问题:

当成本被压到接近零,内容生产彻底大众化,真正稀缺的是什么?创意?审美?还是人与人之间的共鸣?

答案或许没有标准,但很显然,新的内容生产秩序正在被AI一点点重写。

上述精彩观点的交锋,发生在2025北京文化论坛“双向赋能:网络文化创新发展”平行论坛的首场专业沙龙上,由北京市委网信办承办,海淀区委网信办、东升镇人民政府、快手联合协办。

参与本场沙龙访谈的嘉宾分别是:

蔡雄山,快手科技副总裁、快手研究院院长

姜涛,自由量级(上海)智能科技有限公司CTO兼执行CEO

马子涵,当红齐天集团联合创始人

赵晨,璞跃中国(Plug and Play)管理合伙人、常务副总裁

量子位在不改变原意的基础上,对本场对话进行了编辑整理。希望能够给你带来更多的启发与思考。

AIGC重塑内容生成:低成本、高交互、个性化

量子位:我们看到了AI的创造力,想了解驱动这种变革的内在逻辑是什么?背后正在形成哪些新规律?

蔡雄山:快手在人工智能领域这一块,有一个非常重要的产品,就是可灵。这是全球首个用户真实可用的视频生成大模型。

在视频生成领域,我们排在全世界非常前列的位置,甚至很多测评的指标是世界第一。

关于可灵带来的颠覆性改变,我觉得有以下几个方面:

首先,AIGC的应用降低了创作的门槛。

每一个用户都可以用视频生成大模型创作,所以它打开了创作的边界。我们现在全球已经有4500万用户,很多用户来自海外。

人类想不到的很多创意,机器今天可以给你创作出来。它提供了新的内容和思想的工具,这是人类社会以前不曾有的,或者说人的思维想象不到的。

例如,快手曾经拍过一部名叫《山海奇镜之劈波斩浪》的AIGC短剧,它是国内首部AIGC短剧,描述的是中国《山海经》的故事。

在《山海经》里,有一个概念叫“饕餮”,就是指特别能吃的怪兽。我们谁都没见过饕餮,你所看到的只是古书上画的饕餮。但到了今天,我们通过AIGC应用,可以创造出无比瑰丽的景象,创作出人类从未见过、非常有创意的饕餮怪兽。

第二,对于专业创作者来说,它降低了创作的成本。这样一来,每个人不仅是内容的消费者,同样也能成为内容的生产者。

这个成本包括时间成本、物质方面的花费。AIGC短剧创作所需时间可能不到传统短剧的三分之一。传统短剧拍摄要用摄像机拍摄,还需要后期的动画渲染。

姜涛:音乐大模型实现了创意平权,以前国内的音乐人大概只有几万,把泛音乐人加在一起有十几万,只有这十几万人能够创作歌曲和音乐。

但未来可能会有几百万、几千万,甚至几亿的用户使用音乐大模型,随时随地创作音乐作品。这是对整个行业的颠覆,原来只有少数人能做的,现在人人都能做。

举个例子,之前制作一首主题曲需要花上几周到几个月的时间,花费几万到几十万的成本,现在大家在APP市场下载「音潮」,点点鼠标或者动动手指,不到一分钟,也不用花费什么成本,这种商业发行级的作品就被创作出来了。

行业变化实在是太快了,每天都有新模型、新场景涌现,所以我觉得没有(普适性的)规律可总结。

马子涵:我认为有两个关键词:一个是交互性,另一个是个性化。

交互性是指,比如利用AI技术,我们在快手直播间提供像“包晴天”这样的AI律师,观众朋友如果遇到法律问题可以免费问它,它可以尝试帮大家解决。

而个性化是指,有了AI的介入后,在虚拟现实的体验里面,个人可以根据自己的喜好,去选择不同的故事线等等。

赵晨:和大家简单介绍一下,Plug and Play璞跃是1998年在硅谷成立的早期科技企业投资孵化平台,公司中国总部过去10年一直在海淀,现在位于东升镇的AI原点社区。整个街区现有超过300家人工智能领域创业公司,包括生数科技、无问芯穹、非夕科技在内的AI大模型、AI算力基础设施、具身智能等各类企业。

我们每天都在接触各类科技项目,不管是从投资的角度来讲,还是从大企业创新业务角度,璞跃一直在全球范围内帮助很多500强大型企业提供开放创新咨询服务。

服务的内容很好理解,就是传统行业的大型企业提出需求,璞跃结合大企业的需求和场景,快速精准找到前沿科技公司标的与解决方案,通过链接创业公司的技术协助大型企业解决数字化转型和创新上遇到的问题。

关于新趋势,一方面,我们今天在海淀三山五园中心看到小学生、中学生用AI创作出非常优质的内容, 让我们进一步感受到了内容创作中的”平权”;

另一方面,我们看到非常多大型企业都在被新的技术和市场推动,开始在实际业务中尝试接触AIGC相关的内容去达成业务合作,同时也产生了对于前沿技术团队的投资或者并购需求。

很多企业短期内最大的需求就是AIGC动态生成内容的能力。举例来说,北京的星河视效这家公司,他们做的就是在十几秒时间内,根据用户之前在电商平台上搜索的产品内容,去实时用AI渲染生成你看到的动态视频广告内容。

另外一个趋势是,有很多从高校科研院所走出来的、从海外回来的、从大厂出来创业的团队,他们的产品能力放在国际上也是非常能打的。

不管是音视频图文生成,还是AI技术赋能到硬件、陪伴、穿戴设备,国外市场也都有很多新的收入和机会。

量子位:在AIGC投资领域,是否正呈现出从“高精尖”实验室项目走向更多元化创业者的新挑战或新机遇?

赵晨:举几个我们最近投资的项目。有一个团队是深圳科创学院的李泽湘老师的团队孵化出来的,叫CODE27。

他们做的产品很讨巧,主要针对海外市场打游戏或者需要陪伴的人群。他们做了智能显示屏,这个舱里面可以通过AIGC的能力生成3D的人物,通过智能舱的显示技术可以投影到像桌面台灯这么高的设备,对于用户来讲也可以简单上手。

CODE27海外市场众筹不到一个月的时间就筹集了近200多万美金,现在正在向海外陆续交付产品的过程中。

还有一家我们近期投资的项目如意AI,是从零一万物孵化出来的团队,这是一家提供数字人直播服务的公司。公司已经在帮助很多500强企业做24小时持续不断、高质量、互动性的AI数字人直播。

当下的AI领域创业不光是调用大模型底座的能力,更是需要对垂直行业和企业的实际需求痛点有更深层的了解,才能形成更容易被买单的商业化产品。

AI已成文化产业新引擎:快手可灵月入1亿,日产出10万条广告

量子位:自由量级如何定义自己在“文化智造”中的角色?在人机协同的新范式下,你们看到了哪些机遇和现实问题?

姜涛:面对的最大机遇就是创作者越来越多了,人人都可以创造,你有一个想法,马上就能做出来。

举个例子,我几年前去北海旅游,在老街里面看到了一个老奶奶做越南春卷,做得特别慢,拿一个小锅做米皮,大家都耐心的等着她。这个老奶奶一看就是特别有故事的人。我听周围当地居民说,她很小的时候就跟家人从越南来到了中国这边。

我当时想如果把她的故事写出来,可能就是另一个版本《漠河舞厅》的故事,但是当时没有音潮这种工具来做。

但现在可以了,大家有想法,随时随地可以把这个故事写出来,同时能用AI模型把各种元素加进去。

模型虽然是通用的,但每个人的创意不一样。模型可以提供各种参数,用户可以把自己的音乐偏好、编曲风格、音色表达融入到这个里面,这个作品中蕴含了人的情感和羁绊,能够快速地传递到世界上,让其他人也听到这个故事。

量子位:快手可灵拥有4500万用户和2亿生成视频,快手如何建立机制确保高质量输出?

蔡雄山:现在整个AIGC领域比较大的挑战是成本问题。

但从商业化的角度来讲,像快手还是做得非常好的,比如现在可灵AI每月付费流水超过1个亿。

1个亿在全世界的赛道是什么水平?在全球属于第一梯队。这非常重要,因为你必须有这种商业变现能力,才能够不断地反哺研发,你的技术才能不断进步。

所以快手已经是做得非常好了,但整体成本还是比较高,所以这是一个大的挑战。

另外,关于怎么保证输出内容的质量,在视频生成领域,模型有两个重要的值得关注的点:

第一,内容生成的质量,这个需要技术不断进步,所以才能够生成高质量、高清的,而且符合用户审美要求的。

第二,需要有高质量的数据集,类似于好莱坞的影视作品构成的数据集,那我生成视频的质量就更有美感。

第三,模型要有更好的可控性。比如我们拍摄一个视频,要远景、中景、近景,这个东西在提示词里可以提示操控,包括可灵2.1里你可以定义一个视频的首尾帧,就像写文章一样首尾呼应。

另外还要保证我们的内容符合国家法律法规的要求,按照以上思路来,它能够保证视频生态和文化产业的繁荣。

机遇方面,第一,AIGC给电影内容工业化生产带来了许多便利。去年我们也和很多知名导演,包括贾樟柯等等,合作推出了“可灵AI导演合作计划”拍摄了一系列的电影,所以新的技术可能会重构电影工业。

第二,在广告领域,我们今天在快手平台上,每天有10万条AIGC生成的广告。

以前的广告都是用摄像机拍的,比如我是快手的中小商家,我想卖一瓶水,你是用视频去拍的,可能成本要200块钱一条。现在AIGC生成的广告,它的成本基本可以忽略不计。所以我们AIGC营销素材的日均消耗达3000万元。

第三,通过视觉技术我们可以构建一个世界模型,让我们的机器人在里面训练。训练之后得到的数据,然后让机器人在这个场景里面去使用。

也就是说,今天可灵的视频生成技术,它未来会跟国家产业结合,助力我们的人形机器人和具身智能的发展,这有无限的想象空间。

量子位:可灵在视频生成上的领先优势,如何转化为出海的新机遇?

蔡雄山:机会有很多,国家非常重视“一带一路”和金砖国家。

国家层面,已经成立了中国—金砖国家人工智能发展与合作中心,它挂在中国信息通信研究院,核心就是中国和金砖国家非常重要的人工智能合作的平台。

这个中心在全球设立了首个海外成果转化中心,这个中心就设置在快手的巴西分公司。

也就是说我们人工智能的技术,包括像可灵的技术,未来会在“一带一路”包括金砖国家都可以使用。

另外在文化输出领域,短剧本身已经成为中国文化输出非常重要的符号。最近有一个新的趋势,是通过AIGC来生成短剧。这些短剧在海外也会越来越受欢迎,所以这其实是中国文化输出不错的载体。

量子位:当红齐天过去依靠专业设备和内容打造体验,如今每个人都能创作高质量内容,这对你们是新的挑战还是机遇?

马子涵:在AI时代反而更能凸显出有想法或者创意人的价值。

因为AI本身可以创作很多好的内容出来,但因为它输入的数据都是类似的,所以会有同质化的倾向。未来有想法有创意的人才,TA的价值体现其实会更高。

所以我觉得我们的优势还是在于真正的创造力,AI只是辅助,它相当于是一个执行力。

量子位:本轮AIGC浪潮中,中国项目是否从一开始就展现出与以往不同的全球竞争力?

赵晨:因为璞跃公司总部在硅谷,离苹果、谷歌等科技大厂的位置都挺近,我们经常举办华人创业者交流活动Chinese Tech Network。最近这两三年,我们接触了非常多在美国本地的华人科学家、创业者设立的公司,以及国内企业到海外开展出海业务的团队。

例如璞跃中国之前参股的一家公司Authing创始人谢扬孵化的新项目叫Fellou,是做AI浏览器的团队,最近也在规划设立硅谷办公室。

首先,例如国内的头部数字文化内容企业中文在线,现在也做很多海外的短剧,因为在国内持有大量的IP,可以通过AI生成适合外国人看的剧情,尤其针对在北美地区的付费意愿非常强的受众。

第二,除了内容生产之外,很多AI大模型和AI基础设施以及中间件的产品,由传统的SaaS(软件即服务)、PaaS(平台即服务)和IaaS(基础设施即服务)模式,现在转变成了MaaS(模型即服务)或者RaaS (结果为服务)的公司,在这个领域我们看到非常多优秀的华人团队。

上周我们在北京一周内就聊了三四家华人创办的、以北美市场为主的技术团队,都纷纷在融资。

当然,现在面临的一个小挑战就是,这样的团队短期倾向于拿海外本地资本的融资,公司可能在国内设立研发团队,但融资主体是在境外的方式,这样对于他们海外业务的拓展会更方便一些。

AI音乐版权新实践:用户创意,用户所有

量子位:在AI音乐创作中,自由量级作为平台方与创作者之间的权责边界如何界定?特别是版权归属和收益分成的机制是怎样的?

姜涛:AI生成音乐海外有Suno,国内有音潮。我们跟其他生成模型的差异在于——创作者的版权完全归属于用户,我们自己不占,我们还可以帮助用户做代发行。

根据国家最近的法律规定,如果是纯AI生成的作品、没有人工参与的,这是没有版权的。但用户只要有自己的prompt和创意,或者有他的图片融入在里面,那么用户参与创作的这个作品,用户就有版权。

因为我们觉得整个创作空间其实就像是宇宙,这个宇宙中其实是有很多星星的,也有很多空洞。我们就提供工具,让创作者像星际迷航一样,驾驶着宇宙飞船去找到新的星星。

新的星星代表了新的音乐风格、新的表达方式,让其他用户也能创作出类似的作品。

这种新的发现,我们也会给第一个发现的人命名权。就比如某个新的风格是我发现的,那就给它命名“B612”,我还希望这颗星星上有朵会说话的玫瑰。

量子位:在AIGC时代,AI生成内容的版权归属问题,是否会成为你们投资决策中的关键一环?它如何影响你们的投资逻辑?

赵晨:从投资角度我们团队在早期更多是看他的团队、市场规模和商业化能力。

如果有的选的话,我们肯定希望这个团队能够在整个跟AIGC相关的业务过程中,有提前的合规相关布局,包括在训练数据的选择上,使用所有权清晰或者合成数据的方式。

我们希望团队在早期能够有这方面的意识和布局,同时我们在做法律尽调的过程中也会请外部律师做相应研判。

对于商业化过程中产生出来的内容,我们也看到有一些区块链相关的技术可以做到所有权的追溯,能够让他们在AI生成内容之后提前减少版权纠纷和官司,让企业在商业化的路径上走得顺畅和快一些。

姜涛:我们跟很多高校合作。比如上海音乐学院,他们就把自己的音乐数据库开放给我们,同时也把他们底层的音乐工程分轨、音乐标签贡献给我们。很感激他们,帮我们提升了模型对乐理的支持能力。

产品上线一段时间之后,我们已经在思考,一旦有版权纠纷的情况下,我们如何提早做好防火墙,如何保护版权方和创作者的利益。

这个我们要提前布局和考虑好,否则我们很难走得更长远。

创意归人,执行交给AI

量子位:在AI音乐发展的进程里,人类创作者最独特、最不可被替代的核心是什么?

姜涛:虽然大模型还有很多智能涌现,在音乐模型里面我们希望它的幻想更多,但是归根结底是分类模型,在参数确定的情况下,每一个Token的产生是确定的,人工可以加一些随机性和创作性在里面。

但人脑有的时候是非线性的,脑洞空间特别大,人类创造作品所带来的震撼力,模型目前还没有进化到这一步,这是人类目前最宝贵的一部分。

量子位:AI有一天可以超越张艺谋导演吗?如果有一天能超越了,让AI来当导演,你们接受吗?认同吗?

马子涵:每一位导演都具备各自的特色,独属于他那个时代的印记,包括他自己的价值观,以及他对不同事物的审美,这些都构建了导演的个人风格。

所以AI在这个领域还是充当执行导演,不管是音乐创作还是内容创作,还是要给予一个总导演他对这件事情和世界的理解,然后由AI去做一些执行工作。

AI在其他各行各业的领域,当你已经有了基础生态,比如像我们在全国20多个城市都有大型的XR乐园、科技馆。

AI在我们现有的生态下,它的助力就非常强,也会增加我们的壁垒、降低我们的成本。

所以不仅仅是在创作这个维度。比如说我们有AI讲解员,它对整个乐园的交互以及科技文旅就会起到非常大的价值。

量子位:快手以“真实”和“老铁”文化著称,可灵的AI生成内容是否会削弱这一核心特质?你们是否会有这种担忧?

蔡雄山:AI生成的内容只是丰富了我们文化的生态、进一步丰富了场景。现在快手日活有4个多亿的用户,月活有7个多亿的用户。

AI生成的内容,目前它只是对生态的进一步繁荣,并不会取代我们今天所有真实的直播和视频,因为后者是更有温度的,更真实的。

举一个例子,就是关于AI创意的应用对文旅的促进。我们知道各地的文旅部门都很卷,但是传统的宣传片大家不是很感兴趣,可能也花了很多钱。

在可灵出来之后,快手和五个地方的文旅局合作推了一个很小的视频。比如四川有大熊猫,它可以让大熊猫拉二胡;西藏有藏羚羊,它可以弹古筝;新疆是马,马可以弹另外的乐器。

这个小视频只有几秒钟,它出来之后,立马上了快手的热搜。

△图源:四川文旅快手号

这个热搜意味着你暴露在4亿的用户面前,实际的播放量达到了有4000万。

像我们传统的方式去写文章、拍视频,你怎么能够让4000万人一下子就看到你那个东西?那很难的,你有100万的转化就已经非常棒了。

当然,这需要你非常敏锐地捕捉到。

One More Thing

量子位:如果要给下一代写一条人机共生的教育原则,你们想到的第一句话是什么?

姜涛:张三丰教张无忌练太极拳的时候,说“你把你学的所有招式都忘掉,然后你就能学会太极”。

现在让所有的小孩把之前对AI的理解忘掉,以一个放空的心态重新开始,学会与AI对话,后面就会与AI共生,共同成长。

马子涵:让AI成为你的伙伴和员工,自己还是它的老板,自己还是要有自己思考的能力。

赵晨:我想遵循小朋友真实的兴趣,围绕着小孩自己的兴趣爱好,用AI工具辅助他们更快地在这个兴趣领域里面学习和做很多内容的延伸、创作。

蔡雄山:《周易》里面有一句话,“观乎人文,以化成天下”。