中文在线首席运营官杨锐志:“AI+数据”重构数字内容的未来

关注
数据质量影响AI大模型表现

12月11日,由北京市通州区人民政府主办,通州区经济和信息化局、通州区台湖镇人民政府承办的第二届ADD数据应用场景大会在台湖隆重举行。通州区发展和改革委员会、通州区投资促进中心、通州区人才工作局、通州区政务服务和数据局、通州区科学技术委员会、创业邦为本次大会协办单位。

作为全国首个“数据基础制度先行区”的核心承载地,台湖再次站在了数字经济的聚光灯下。本届大会以“AI推动进化,数据定义未来”为主题,汇聚了来自政、产、学、研、投各界的数百位领军人物。北京市经信局二级巡视员汪剑波,通州区委常委、副区长吴孔安,北京邮电大学教授、国务院参事张平,台湖镇党委书记王鑫,以及来自中文在线、拓尔思、天娱数科、云迹科技、合合信息、用友网络、数据堂、百分点科技等行业龙头的企业家与顶尖投资机构代表齐聚一堂,共同探讨在生成式AI加速渗透的当下,如何通过制度创新与场景落地,释放数据要素的乘数效应。

image.gif

会上,中文在线集团首席运营官杨锐志的精彩观点如下:

在AI大模型的技术体系中,算力、算法和数据是三大支柱,而数据是最重要的一环

AI技术在3D动画制作中可使成本指数级下降,效率指数级提升

在文化出海方面,AI有助于降低内容生产与运营成本,提升内容国际竞争力,推动内容向高质量升级

以下为现场演讲/对话内容,经创业邦整理后发布:

数据质量影响AI大模型表现

非常荣幸,今天跟大家分享中文在线在AI+数据上的探索心得。

中文在线是一家成立于2000年的数字内容公司,初期以数字图书馆、网文小说网等业务为核心。我们很早就开展出海业务,将中国的优质内容改编后推到海外市场。

2022年对我们来说是一个关键转折点,公司一部成本仅20万元的短剧意外走红,

启动了整个中国短剧市场的快速发展。目前来看,国内短剧市场规模约800亿元,海外短剧市场约30多亿美元。

在人工智能领域,我们自主研发AI大模型“中文逍遥”,探索AI在文字生成、动漫制作等场景的应用,推动“AI+内容”的深度融合。公司目前拥有超500万部作品和庞大作者资源,能够利用AI技术将文字转换成音频作品,或将文字转换成短剧剧本作品。

为了支撑AI发展,我们也在持续加强数据能力建设。除了自有数据,我们还会进行外部采购,覆盖高清视频等多元类型,并组建专业的标注团队,对各类数据进行结构化标注与处理,满足模型训练的需求。

作为一家上市公司,我们在2024年第一季度报告中,首次将数据资产纳入财务报表进行披露。目前,我们已成为实现了用数据资产完成抵押融资的上市公司,有部分数据资产入选北京国际大数据交易所、北京人工智能产业联盟组织发布的首批“100个人工智能大模型高质量训练数据集”。

在AI大模型的技术体系中,算力、算法和数据是三大支柱。在算力方面,我们主要运用第三方算力平台;算法方面,除了自研也会调用DeepSeek等开源模型。相比之下,数据是我们最为重要的核心资源。高质量数据直接决定模型效果,而低质或“脏数据”则导致模型表现下降,甚至带来高昂的修复成本。

降本增效、精品化与文化出海

面对以AI为核心的第四次工业革命浪潮,中文在线确定了三个发展方向:降本增效、内容精品化、文化出海。

降本增效方面,AI已应用于我们业务的多个环节,包括内容生成、质量审核与纠错等。例如,在3D动画制作中,AI技术可使成本指数级下降,效率指数级提升。尽管目前AI生产模式的收入尚未完全与传统方式持平,但由于投入和成本大幅降低,整体毛利率仍实现提升。

在文化出海方面,我们的短剧出海路径,与中国制造业的国际化进程有相似之处。中国制造出海最初也是从低附加值的日用小商品起步,逐步升级为高技术产品。文化内容的出海也遵循类似的逻辑从低端到精品。

当前,短剧出海仍处于“从低端切入”的阶段。如果AI能进一步降低内容生产与运营成本,我们在文化出海方面将拥有更丰富、更具竞争力的内容供给。为此,我们自主研发“中文逍遥”模型,依托我们积累的数据资源,专注于小说,剧本等文字内容的创作。

在内容精品化上,我们借助AI技术推动内容升级。从去年的AI动态漫,到如今的AI 3D动画,我们不断探索内容形态的创新。

比如,在AI真人剧领域,我们与清华大学元宇宙实验室、中央广播电视总台合作,共同打造了一部完全由AI生成的真人短剧。该剧从剧本创作、角色形象设计、音乐编曲、背景音效到视觉特效,全部由AI技术完成。

目前该剧并未实现商业化,观众会挑剔人物的AI面孔不够自然,或者AI生成的场景让人感觉出戏。因此,这类AI真人剧目前还无法与真人演绎的剧集直接竞争。但行业内多家相关企业预测,明年AI真人剧会有突破性的进展。

AI并非泡沫,正赋能数字内容行业

最后,我想分享一个有意思的观察:如今越来越多人开始讨论“AI泡沫”。这其实与AI的技术成熟度有关。任何颠覆性技术在诞生初期,人们往往高估其长期价值,随后因早期商业化不及预期而跌入低谷,直到市场逐渐明确该技术真正的应用场景,才会重新回升,并催生新的业态与行业。

回顾互联网历史也是如此:2000年左右,无论中美,只要有个网站就可能获得融资,但随着市场发现除了广告之外缺乏可持续的商业模式,泡沫迅速破裂,网易、新浪、搜狐等公司股价一度跌至谷底。然而低谷过后,门户、电商、社交网络、电子支付、移动互联网等模式相继成熟,互联网最终重塑了千行百业。

那么AI是否也会经历类似的过程?从我们所在的数字内容行业来看,AI呈现出一个不同寻常的特点:它几乎从起步阶段就实现了“降本、增效、精品化”,并快速带来商业回报。这也让我们能更清晰地回答:AI 将如何改造数字内容行业、为用户创造价值。

人类历史的进程往往是螺旋式上升的,此前的泡沫或许会在未来以新的形式重现。但在AI赋能千行百业的进程中,至少在我们这个数字内容赛道里,它已展现出明确的商用价值与变现能力。因此我们持续看好:随着AI技术进步,行业将能够以更低的成本、更高的效率,推出更优质、更精品化的内容产品,并推动它们走向全球市场。

反馈
联系我们
推荐订阅