红熊AI：记忆重构智能，算力驱动落地——企业级AI新路径

创业邦·2026-05-22

当前大模型的记忆痛点：从遗忘到多智能体协同

红熊AI是以记忆科学为核心结合全模态大模型与 Agent 原生架构，构建一体化技术生态，并搭配AI原生应用实现商业化收入的人工智能科技企业，专注于为各行业客户提供全栈式 AI 技术解决方案及相关产品与服务如人工智能客服、人工智能营销、教育、Chat BI等应用。已完成多轮数亿元融资。以下来自红熊AI创始人/CEO/首席科学家温德亮在2026智算基础设施创新大会上的演讲。由创业邦整理。

当前大模型的记忆痛点：从遗忘到多智能体协同

大家好，我是温德亮，很荣幸能代表红熊AI，与大家分享我们在AI记忆科学领域的探索与实践。

当前的大模型在记忆方面存在许多问题。例如，由于底层架构带来的序列时间下降，模型往往只关注最新的一轮对话。一个典型的场景是：用户已经告诉模型自己对海鲜过敏，但在第十轮对话中，当用户询问“今晚该吃什么”时，模型仍然可能推荐海鲜。这在真实业务场景中是不被允许的，因为这种知识遗忘会直接影响业务的最终解决率。

除了知识遗忘，我们还发现多Agent状态下存在一系列挑战：谁来协同、谁来主导、谁的记忆最核心、谁的记忆是辅助的。此外，在多模态交互中，用户发送了图片、音频、视频，甚至在具身智能或物理世界中，多个信号同时出现时，如何在同一个上下文中保持记忆的连贯性，也成为客户最真实、最痛点的需求。

红熊AI的解决方案：五大关键支撑与三层核心引擎

基于上述模型的记忆问题，红熊AI认为：AI记忆有可能是下一代AI的基础设施。为此，我们提供了五大关键支撑功能：记忆全周期的管理、类脑的神经编码形态、动态适配的自主进化能力、软硬件协同、全模态融合。

在内部测试中，我们的记忆能力目前处于行业头部水平。与当前主流方向（包括记忆科学、通用大模型内置记忆功能、以及外挂式第三方记忆产品）进行全面对比后，无论是在核心理论基础、记忆架构，还是多轮对话的一致性、准确性上，红熊AI都相对领先。

我们构建了三层核心引擎，覆盖底层能力、记忆机制、认知能力、成本效率及内容可靠性。我们的目标是最终迭代出像人类大脑一样的存在。因此，我们的口号是：赋予AI如同人类一样的认知中枢，提供动态自适应的长期记忆系统。

与传统方案相比，除了存储层、编排层、应用层，我们还提供了记忆调度引擎、自我反思引擎和记忆萃取引擎。这些能力带来了显著的差异性效果。

在算法层面，我们的记忆萃取引擎不仅萃取对话中的技术记忆，还可以萃取用户当前所有交互行为。通过组合对话记忆、编排记忆和行为记忆，实现统一萃取与价值观对齐，并能对正向问题进行反向解析，持续上下文修剪及记忆图谱更新。

此外，我们还设计了记忆遗忘引擎。例如在陪伴玩具等端侧设备中，记忆可以随着时间线或中间态进行遗忘，从而保证记忆数据实时有效，准确率更高。

同时，自我反思引擎可以基于结果、事实、时间（如天）或条件进行反思。在反思过程中，系统能直接修正知识库、提示词及关联的工作流与业务流程，使AI自主适应当前业务状态的变化。对于集群化的Agent记忆协同，我们能实现最小化的记忆共享，保证多Agent场景下的记忆一致性，从而完成业务一致性的规划，并实现集群的轻量化整合。

无限上下文、十倍降低Token消耗

我们提供了全流程的记忆转化路径，从瞬时感知记忆到永久记忆，涵盖短期、长期到永久，形成完整闭环。目前，我们的AI能力已经可以做到接近无限上下文的处理能力。在下一版本官宣时，AI的记忆能力还将进一步强化。

另一个重要发现是：记忆科学本质上可以降低Token消耗。我们可以将算力集中，形成记忆驱动算力，为企业构建新路径。在实际应用场景中，这可以实现：质量追溯、工艺优化、经验传承。

举例来说，我们可以将员工的全部记忆留存到Agent上，从而形成“数字员工”——它汇聚了历史上所有问题的处理经验，可用于经验传承，数字分身，研发设计的创意伙伴，以及供应链比对中的韧性记忆。我们确实可以做到经验复制、知识复制，以及关键决策方向的处理。经过实际应用，我们大约可以降低10倍以上的Token消耗。

总结下来，红熊AI是以记忆科学作为全场景应用的商业化体系，我们最核心的基座是，我们提供了MemoryBear类脑的记忆引擎，并与自研的全模态大模型进行融合。在此基础上，结合了我们Agent原生的架构，来构建了我们现在所有的应用，对外提供了人工智能客服、营销、ChatBI和个性化教育四个应用板块，形成了当前红熊主要的商业化布局。这一布局具备的核心优势是技术同源、开箱即用、效果可量化、灵活配置，能够基于企业自身需求进行修改和调整。谢谢各位！