当人工智能在全球范围内加速应用,技术落地“最后一公里”的规模化难题——基础设施、人才与商业模式的多重挑战,正成为制约AI跨越地域、赋能全球产业的关键,而大模型作为AI发展核心引擎,更让“优质大模型与产品深度融合”成为高效全球化落地的核心方向。
在创业邦2025(第十九届)DEMO CHINA大会现场,昆仑万维董事长兼CEO方汉聚焦中国AI企业如何突破出海瓶颈、实现技术与产品的全球化落地,并以昆仑万维技术指标最优、月收入达100万美元的Mureka大模型为例,拆解其诞生背景、技术迭代及全球化推广经验,旨在与创业者分享AI全球化时代的产品实践之道。
以下是方汉的演讲实录,由创业邦整理。
Mureka大模型的发展历程与技术路线
让我做开场演讲我心中有一些压力,大家知道,我们公司出海比较早,目前海外收入占整体收入94%。占比这么高的情况下,全球除了南美地区我们业务少一些,其他地区都有不同业务,有做内容的、做社交的、做金融的,都有不同产品落地,2020年开始我们转向AI方向研发,孵化了很多AI的产品,落地或快或慢,收入或高或低。
今天拿我们技术指标最好的产品Mureka给大家做一个分析或者回顾,看看我们为什么做这个产品以及怎么做这个产品,怎么把这个产品在海外进行推广,目前Mureka也有一定的收入,目前月收入100万美金左右。
我们自2020年启动Mureka大模型相关研发,核心源于一定的路径依赖与第一性原理的判断。
从路径依赖来看,我们在海外运营着一款类似“全民K歌”的音乐社交产品Starmaker,该产品在海外市场占据主流地位。运营过程中,我们积累了大量音乐处理技术与数据,需开展人声消除、美声优化、不同硬件适配等工作,同时完成所有音乐数据的清洗与处理。基于这一基础,我们认为既然已掌握音乐数据,可尝试切入音乐生成领域。
当时GPT-3已发布(GPT-3.5尚未推出),我们发现不同类型数据的积累规模,直接决定研发投入:全球文本大模型因追求通用人工智能,吸引了规模最大的资金投入;YouTube、抖音等平台的视频数据约140亿条,而人类所有音乐数据总量仅4000万条。对创业公司或中小型互联网企业而言,音乐数据规模更小,所需投入的资金与训练资源相对更少,这是我们选择音乐生成方向的首要原因。
从第一性原理出发,我们当时判断:当内容创作门槛降低10倍,该领域的内容创作者数量将增加100倍,内容产量也会同步大幅提升。以我个人经历为例,我是70后,成长的县城有80万人口,早年整个县城仅电视台的4名摄影师掌握视频拍摄技能;而如今,中国使用智能手机拍摄视频的用户已达七八亿人。正是智能手机的出现大幅降低了摄影成本,才催生了短视频产业。
再看音乐制作,我们此前参与游戏开发时了解到,普通企业制作一首音乐的最低成本约10万元,米哈游等头部企业单首音乐的平均成本甚至达100万元。我们当时认为,若能通过AI生成音乐,降低制作成本,有望获得显著的用户回报,因此在2020年正式确定研发方向。
在技术路线选择上,全球音乐生成技术的探索自1980年便已起步,但因缺乏大模型支持与强化训练方法,早期均采用符号化生成方式——即先生成简谱、五线谱,再进行演奏,早年家用设备的音乐均通过该方式制作。我们初期也尝试了规则生成路线,但很快发现该路线的上限较低;随后转向当时主流的对抗网络路线,后续又从文生图算法中借鉴相关思路,效果却未达预期。
最终,我们选择DIT(Diffusion Transformer)路线,并自研创新的音乐Tokenizer,才使音乐生成模型的性能接近世界一线水平,但此时模型仍处于行业第三、第四的位置。GPT-4o发布后,我们认为其推理机制对生成模型具有重要价值,成为首个将COT(思维链)引入内容生成领域的团队——在内容生成过程中实时判断效果,若效果不佳则回退调整,大幅提升了成品率,至此Mureka大模型才真正达到音乐生成领域的一线水平。在座各位多聚焦产品方向,具体技术细节我不再展开阐述。
Mureka全球化推广的挑战与非买量增长探索
模型研发成熟后,我们启动商业化工作,针对用户需求开发了多语言支持、音色参考、音色克隆、API服务高质量音乐生成平台等功能(此类功能技术难度较低,核心为满足用户实际需求),随后开启全球推广。在此过程中,我们遭遇了一个多数中国出海企业都会面临的问题——对买量模式的路径依赖,而这一问题在全新的AI创业企业中反而较少出现。
包括昆仑万维在内的早期出海成功企业,普遍存在对买量模式的依赖。中国企业在买量领域经验丰富,擅长计算买量成本与ROI,尤其在手游领域,中国企业的买量操作曾将全球手游买量成本从最初的1-2美元/用户,推升至如今的数十美元/用户,对买量模式的运用最为熟练。
但在AI创业时代,尤其是开展ToB业务时,买量模式已不再适用。近两年中国AI创业领域的代表性企业如DeepSeek、Manus,均凭借技术与产品的硬指标实现增长,而非依赖买量;但绝大多数创业者与中小企业不具备顶尖技术指标,产品创新性也不足,因此“突破买量依赖、探索非买量增长路径”成为必须补足的能力。
非买量增长路径主要包括三类:第一类是依托技术与产品的核心突破,通过社交媒体传播形成爆发式增长,但此类增长无法提前规划,需以技术或产品的重大创新为前提;第二类是SEO(搜索引擎优化),例如国内某企业通过纯SEO实现近2000万日活,买量时代也有国内工具类企业借助SEO获取低成本、高精准度的用户;第三类是GEO(针对大模型搜索的优化),这是一个全新领域,国内擅长此领域的企业并不多,但海外已有专注GEO的公司获得多轮融资,可见其仍是具备潜力的增长渠道。
所有出海企业均需重视买量之外的增长方式,包括SEO、GEO,以及通过社媒营销提升产品触达率、实现用户口口相传。这些能力的落地,要么由创始人亲自学习掌握,要么寻找具备相关能力的人才加入团队,但此类增长人才极为稀缺——国内企业在技术与产品领域的人才储备充足,反而在增长领域的人才供给不足,这一点需要特别关注。
此外,传统中国出海企业以ToC业务为主,ToB业务占比极低,且国内企业开展ToB业务的思路与打法,与欧美创业者存在显著差距。以我们这类具备ToC基因的企业为例,Mureka出海转向ToB业务时,在收费模式设计、用户拓展、续费率提升等方面遭遇诸多困难,只能通过研究竞争对手的策略“照猫画虎”,分析其操作逻辑并测试自身实践效果。
国内企业中,字节跳动的剪映在ToB领域的实践值得借鉴:剪映是首个发现“KOL带动工具类产品增长”高性价比的企业,此前行业尚未意识到这一路径;在商业化层面,剪映也进行了诸多优化,例如设置免费版与付费版,先通过免费版扩大用户规模,再逐步提升商业化程度。
因此,出海开展ToB商业化的企业,除参考本赛道标杆外,也可借鉴剪映的经验,重点观察其免费版本与付费版本的设计逻辑,以及商业化节奏与增长节奏的平衡方式,具体细节此处不再展开。
中国AI企业全球化的产品判断标准与市场机会
我今天的分享虽未涉及高深理论,但希望传递一个核心观点:中国AI企业在全球市场拥有广阔发展空间。我们认为To B业务具备可行性,核心基于两点判断:
第一,To B产品是“效率倍增器”。以AI编程为例,其之所以被广泛应用,核心在于可将单个程序员的效率提升至10人的水平,可见AI To B的核心价值是提升效率。
第二,智能体是“工作流粘合剂”。多个智能体协同可完成复杂任务,而传统工作流需大量人力介入——例如工厂全自动化落地时,部分环节需人工协调磨合,效率较低。AI与智能体的介入,可作为工作流的“粘合剂”,提升整个系统的自动化程度。
以上两点,是我们判断To B产品价值的核心标准。
To C产品的判断标准则更为清晰,即“降低成本”,具体可分为两方面:一方面是降低内容制作成本,无论是视频、图片还是音乐,成本下降空间显著——例如传统人工制作一首音乐的成本约10万元,而AI音乐生成模型的推理成本不足0.1元人民币,这种成本差异必然催生市场爆发,视频领域也存在类似机遇;
另一方面是降低情感供给成本,当前社交平台的情感供给成本较高,国内情感服务的最低时薪约50-60元,而AI大模型介入后,AI聊天提供情感供给的成本可降至1-2元/小时,将使全社会的情感供给成本大幅降低,这一领域蕴含巨大商业机会。
此外,当前全球使用中国开源大模型的人次,已超过使用美国开源大模型的人次,可见国内开源大模型的竞争力逐步提升。中小企业若能依托AI赛道,借助开源大模型搭建新生态,仍有广阔的发展空间。