红熊AI:记忆重构智能,算力驱动落地——企业级AI新路径

关注
当前大模型的记忆痛点:从遗忘到多智能体协同

红熊AI是以记忆科学为核心结合全模态大模型与 Agent 原生架构,构建一体化技术生态,并搭配AI原生应用实现商业化收入的人工智能科技企业,专注于为各行业客户提供全栈式 AI 技术解决方案及相关产品与服务如人工智能客服、人工智能营销、教育、Chat BI等应用。已完成多轮数亿元融资。以下来自红熊AI创始人/CEO/首席科学家 温德亮在2026智算基础设施创新大会上的演讲。由创业邦整理。

image.gif

当前大模型的记忆痛点:从遗忘到多智能体协同

大家好,我是温德亮,很荣幸能代表红熊AI,与大家分享我们在AI记忆科学领域的探索与实践。

当前的大模型在记忆方面存在许多问题。例如,由于底层架构带来的序列时间下降,模型往往只关注最新的一轮对话。一个典型的场景是:用户已经告诉模型自己对海鲜过敏,但在第十轮对话中,当用户询问“今晚该吃什么”时,模型仍然可能推荐海鲜。这在真实业务场景中是不被允许的,因为这种知识遗忘会直接影响业务的最终解决率。

除了知识遗忘,我们还发现多Agent状态下存在一系列挑战:谁来协同、谁来主导、谁的记忆最核心、谁的记忆是辅助的。此外,在多模态交互中,用户发送了图片、音频、视频,甚至在具身智能或物理世界中,多个信号同时出现时,如何在同一个上下文中保持记忆的连贯性,也成为客户最真实、最痛点的需求。

红熊AI的解决方案:五大关键支撑与三层核心引擎

基于上述模型的记忆问题,红熊AI认为:AI记忆有可能是下一代AI的基础设施。为此,我们提供了五大关键支撑功能:记忆全周期的管理、类脑的神经编码形态、动态适配的自主进化能力、软硬件协同、全模态融合。

在内部测试中,我们的记忆能力目前处于行业头部水平。与当前主流方向(包括记忆科学、通用大模型内置记忆功能、以及外挂式第三方记忆产品)进行全面对比后,无论是在核心理论基础、记忆架构,还是多轮对话的一致性、准确性上,红熊AI都相对领先。

我们构建了三层核心引擎,覆盖底层能力、记忆机制、认知能力、成本效率及内容可靠性。我们的目标是最终迭代出像人类大脑一样的存在。因此,我们的口号是:赋予AI如同人类一样的认知中枢,提供动态自适应的长期记忆系统。

与传统方案相比,除了存储层、编排层、应用层,我们还提供了记忆调度引擎、自我反思引擎和记忆萃取引擎。这些能力带来了显著的差异性效果。

在算法层面,我们的记忆萃取引擎不仅萃取对话中的技术记忆,还可以萃取用户当前所有交互行为。通过组合对话记忆、编排记忆和行为记忆,实现统一萃取与价值观对齐,并能对正向问题进行反向解析,持续上下文修剪及记忆图谱更新。

此外,我们还设计了记忆遗忘引擎。例如在陪伴玩具等端侧设备中,记忆可以随着时间线或中间态进行遗忘,从而保证记忆数据实时有效,准确率更高。

同时,自我反思引擎可以基于结果、事实、时间(如天)或条件进行反思。在反思过程中,系统能直接修正知识库、提示词及关联的工作流与业务流程,使AI自主适应当前业务状态的变化。对于集群化的Agent记忆协同,我们能实现最小化的记忆共享,保证多Agent场景下的记忆一致性,从而完成业务一致性的规划,并实现集群的轻量化整合。

无限上下文、十倍降低Token消耗

我们提供了全流程的记忆转化路径,从瞬时感知记忆到永久记忆,涵盖短期、长期到永久,形成完整闭环。目前,我们的AI能力已经可以做到接近无限上下文的处理能力。在下一版本官宣时,AI的记忆能力还将进一步强化。

另一个重要发现是:记忆科学本质上可以降低Token消耗。我们可以将算力集中,形成记忆驱动算力,为企业构建新路径。在实际应用场景中,这可以实现:质量追溯、工艺优化、经验传承。

举例来说,我们可以将员工的全部记忆留存到Agent上,从而形成“数字员工”——它汇聚了历史上所有问题的处理经验,可用于经验传承,数字分身,研发设计的创意伙伴,以及供应链比对中的韧性记忆。我们确实可以做到经验复制、知识复制,以及关键决策方向的处理。经过实际应用,我们大约可以降低10倍以上的Token消耗。

总结下来,红熊AI是以记忆科学作为全场景应用的商业化体系,我们最核心的基座是,我们提供了MemoryBear类脑的记忆引擎,并与自研的全模态大模型进行融合。在此基础上,结合了我们Agent原生的架构,来构建了我们现在所有的应用,对外提供了人工智能客服、营销、ChatBI和个性化教育四个应用板块,形成了当前红熊主要的商业化布局。这一布局具备的核心优势是技术同源、开箱即用、效果可量化、灵活配置,能够基于企业自身需求进行修改和调整。谢谢各位!

反馈
联系我们
推荐订阅