融资丨数创弧光获数千万融资,以合成数据破解Agent落地行业认知对齐难题

关注
本轮融资由一村淞灵领投,深天使,及老股东君科丹木、英诺天使、深智城持续加注

数创弧光(DataArc)宣布已完成数千万元新一轮融资。

本轮融资由一村淞灵领投,深天使,及老股东君科丹木、英诺天使、深智城持续加注,投后估值数亿元。本轮融资主要用于技术及产品研发,与海内外高价值行业场景拓展。

合成数据的下一阶段,不只是为模型补充训练语料,而是为行业 Agent 提供可表达、可生成、可评估、可反馈的认知对齐闭环。


行业判断——AI Agent 落地,数据问题升级

随着AI Agent从问答、检索、生成,进一步进入真实业务执行,数据问题正在发生新的变化。企业不仅需要更多训练语料,更需要能够表达行业任务结构、业务规则、专家判断和执行反馈的数据体系。

过去,逻辑是“真实数据不够→需要合成数据”。

现在,逻辑已经变成“Agent要进入真实业务→需要行业认知、长尾任务、反馈评估和轨迹数据”。

未来,当Agent在业务中持续运行轨迹数据将持续沉淀,合成数据与反馈评估将不断优化Agent——这是一个完整的数据闭环。

高质量合成数据,正在从模型训练数据,演进为Agent行业认知对齐、长尾任务覆盖和持续反馈优化的核心基础设施。


战略选择——不卷通用模型,做行业 Agent 的“最适数据层”

在通用大模型能力快速提升的背景下,DataArc 并不试图与大模型厂商竞争基础模型的通用能力,而是选择深入公开互联网数据覆盖不足、真实数据难以获取、合规要求高、长尾场景复杂的行业与区域。

“通用模型解决的是基础智能的问题,但 Agent 真正进入业务流程后,还需要理解行业任务、业务规则、客户反馈和合规边界。DataArc 要做的是让模型在具体行业和具体区域里变得更适用、更可靠、更可控。”数创弧光创始人兼 CEO 江旭晖表示。

因此,DataArc 重点聚焦小语种、隐私敏感行业和复杂长尾任务。这些场景并不缺 AI 需求,真正缺的是高质量、可控、可评估、可持续迭代的数据闭环。


技术路径——合成数据驱动行业认知对齐

通用模型在标准问答和开放生成任务上表现出色,但进入真实业务流程后,往往仍会遇到行业术语不熟悉、业务流程不理解、合规边界不清晰、长尾场景覆盖不足等问题。原因在于,许多关键行业 know-how 并不存在于公开互联网语料中,而是沉淀在企业文档、专家经验、业务流程和真实服务反馈里。

DataArc 将这一问题概括为Agent 落地中的“行业认知对齐”问题,并围绕三类能力构建技术体系:

Semantic Alignment(语义理解对齐):通过语境图谱 Context Graph / Think-on-Graph 表达行业任务结构、业务语境、规则约束和决策路径;

Synthetic Alignment(合成数据对齐):通过知识驱动合成数据与加密合成数据技术,生成长尾场景、隐私保护、小语种和复杂流程数据;

Feedback Alignment(评估反馈对齐):通过 LLM-as-a-Judge / Judge Agent 等评估反馈技术,将专家修正、质量评估、合规边界和业务结果转化为可持续优化 Agent 的监督信号。

从 know-how 表达,到合成数据扩展,再到评估反馈和轨迹学习,DataArc 希望构建一套面向行业 Agent 落地的数据闭环。


场景落地——垂直验证,批量复制

数创弧光正在将这一技术闭环率先落地于金融保险和海外小语种两大场景。其中,金融保险场景主要验证 Agent 在高知识密度、高合规要求业务中的行业认知对齐能力;海外小语种场景则验证 DataArc 在跨区域、跨文化、本地化知识适配中的复制能力。

从技术验证到场景落地,从单点突破到跨区域复制,数创弧光将继续深耕高价值行业场景,以知识驱动合成数据为核心,让Agent在真实业务的持续反馈中不断进化。


「创始人说」

江旭晖,数创弧光创始人&CEO

“过去大家讨论合成数据,更多是在讨论如何补充模型训练语料。但随着 AI Agent 进入真实业务流程,数据的价值正在发生变化。未来最重要的数据,不只是静态语料,而是行业 know-how、专家反馈、客户反应、合规约束和业务结果共同形成的动态轨迹。

DataArc 希望通过语境图谱、合成数据和评估反馈技术,把这些高价值数据转化为 Agent 持续进化的基础设施。”


「投资人说」

张晨一村淞灵副总经理

“合成数据根本性挑战在于其与真实数据分布之间存在难以消除的分布偏移风险。尽管生成模型能复现宏观统计特征,但在高维数据微观结构层面(如复杂特征交互、长尾分布模式等)仍存在显著差距,'过度清洁'的数据会导致模型在现实场景中出现系统性的性能衰减。

数创弧光让我们看到了解决上述问题的可能路径,那就是用知识驱动的合成数据构建行业know-how,有别于市面上大多数合成数据建立的'关联关系',数创团队所走的路线,有机会建立'因果关系'。同时团队将技术优势对齐到Agent层面,让客户更加便捷、友好地参与到数创搭建的生态当中,即赚了钱、又能得到客户及时全面的反馈,商业飞轮让人期待。”


许允琪,深天使副总经理

“数创弧光兼具硬科技属性和清晰的商业化路径,团队在合成数据领域的技术积累与深圳AI产业方向高度契合。我们看好团队以粤港澳地区打造样板、辐射东南亚的AI出海路径,以及在小语种市场中已验证的落地效率。”

查看更多项目信息,请前往「睿兽分析」。

反馈
联系我们
推荐订阅