搬走AI应用大规模采用的绊脚石,Cyberhaven获1亿美元新融资

分享至AI工具的企业数据中,有27.4%属于敏感信息。

编者按:本文来自微信公众号 “阿尔法公社”(ID:alphastartups),作者:发现非凡创业者的,创业邦经授权转载。

AI应用蓬勃发展,让企业遇到一个新问题:员工们积极使用AI工具,结果导致企业内部的敏感数据泄露。

一份AI安全公司制作的报告显示,企业员工的AI工具采用率高达23.6%,且超过73%的工作场所AI使用是通过未经授权的个人账户进行的。

该报告还发现,分享至AI工具的企业数据中,有27.4%属于敏感信息,包括源代码、客户数据以及研发材料。

发布这份报告的公司叫Cyberhaven,它训练了一个叫大型溯源模型 (Large Lineage Model, LLiM)的AI模型,它的产品能够精细追踪从可能从AI应用流出的敏感数据,实时阻止数据外泄至未经授权的AI工具。

这个产品让企业客户需要人工审查的事件数量减少了90%,并且在响应与数据安全相关的安全事件时,平均响应时间(MTTR)缩短了80%。

Cyberhaven近日获得由StepStone Group领投,新晋投资方Schroders和Industry Ventures参与的1亿美元D轮融资,Khosla Ventures、Adams Street Partners和Redpoint Ventures也参与了跟投,此次融资使Cyberhaven的估值超过10亿美元,一跃成为独角兽公司。

在2024年6月,它则获得了8800万美元C轮融资,参与投资的有CrowdStrike、Cisco Systems、 Google等企业型投资人。

掌握AI安全核心技术的华人创业者要让企业数据不被AI应用泄露

Cyberhaven于2016年创立,其最初的定位是利用其预测性数据追踪技术,确保知识产权不会被泄露,现在,它正专注于AI驱动的安全。

Cyberhaven的创始人兼首席执行官Howard Ting曾在业内一些最大的网络安全公司任职,包括Palo Alto Networks 和RSA。现在,他希望将Cyberhaven带到与它们同等的高度。

Howard Ting表示:“我们正以一种全新的基础性方法,构建数据安全平台,以应对企业安全团队面临的最严峻挑战。在当今AI驱动的世界中,数据保护必须超越传统方法和界限。我们致力于赋予企业对其数据的全面可见性与实时掌控力,无论这些数据如何转换形态或流向何方。”

在云安全公司Wiz被微软以320亿美元收购的背景下,Howard Ting强调他们想保持自己的独立性:“许多大型网络安全厂商都曾与我们接洽收购事宜,但我们对此不感兴趣。我们希望建立一家独立的公司。我们认为这是一个巨大的市场,并且我们拥有真正差异化的技术。”

用自研AI技术溯源企业内部敏感数据,让数据不再因AI应用的高采用外流

AI和云技术的爆炸式增长已从根本上改变了企业内部捕获、处理和利用数据的方式。数据不再局限于文件形式;相反,它变得高度碎片化且持续流动——在端点、云平台和AI系统之间扩散,其方式是传统安全工具无法有效追踪或保护的。随着数据在不同应用间转换和流动,敏感信息暴露或被滥用的风险呈指数级增长。

例如,企业员工们越来越热衷于用AI完成工作,根据Cyberhaven对300万名企业员工工作流程分析,生成的《AI采用与风险报告》:从2023年3月到2024年3月,AI使用量激增了485%。员工的AI工具采用率高达23.6%,且超过73%的工作场所AI使用是通过未经授权的个人账户进行的。

该报告还发现,分享至AI工具的企业数据中,有27.4%属于敏感信息,包括源代码、客户数据以及研发材料。

Cyberhaven能通过追踪跨不同用户和端点的数据溯源(Data Lineage)或数据生命周期来解决这一问题。数据溯源指的是追踪数据在整个组织内的起源、移动和转换过程。

Cyberhaven的核心技术是一个叫做大型溯源模型 (Large Lineage Model, LLiM)的AI模型,这个模型并非用语言数据集来训练,而是用数据流程数据集训练,自创立以来,Cyberhaven的LLiM已经学习了其客户网络中记录的数千亿条数据流,它可以识别出哪些数据或数据流程处于风险之中,并作出解释说明。

Cyberhaven的首席产品与开发官Nishant Doshi表示,公司利用一个多阶段的检索增强生成(RAG)引擎来微调其LLiM,以分析企业最有价值的数据,并实现“大海捞针”般的精准定位。

Cyberhaven的产品是一个叫Cyberhaven for AI的全面解决方案,旨在帮助企业在保护敏感公司数据的同时,安全地采用生成式 AI。

Cyberhaven for AI 的核心功能包括:

提供对整个组织内AI工具使用情况的全面可见性。

精细追踪流向AI应用及从AI应用流出的敏感数据。

区分企业AI账户与个人AI账户的使用。

实时阻止数据外泄至未经授权的AI工具。

检测并监控组织内部AI生成内容的使用情况。

而在Cyberhaven for AI 中的一个核心平台是Linea AI,在最新版本的Linea AI中,它不仅升级了多模态能力(可以支持对多模态数据的溯源和管理),增强了企业微调功能(企业可以更精确地自定义其安全策略),而且推出了一项叫Let Linea AI Decide(让 Linea AI 决定)的新功能。这项功能可自主评估策略违规行为并判断事件严重性,有助于减轻安全运营中心(SOC)的警报疲劳。

具体来说,以往在处理内部风险时,安全团队成员可能每天必须手动检查上百个安全相关事件,判断它是正常业务操作,还是高风险的可疑操作,然后进行处理。

Let Linea AI Decide这个功能的出现,让企业客户需要人工审查的事件数量减少了90%,并且在响应与数据安全相关的安全事件时,平均响应时间(MTTR)缩短了80%。

Cyberhaven的客户,DailyPay的高级安全工程师 Aaron Arkeen举例说明了Linea AI的多模态能力在实际用例上的突破:Cyberhaven的智能截图分析,一直是数据安全领域一个“长期存在的盲点”,假设一个安全团队想要阻止公司机密信息通过截图外流。他们必须逐一检查成千上万张截图,以确定这只是一张无伤大雅的猫咪梗图,还是包含产品设计图的敏感截图。

Nishant Doshi表示:“我们试图基于所掌握的所有历史知识来预测下一步行为:这究竟是一个异常事件,还是一个良性事件。我们称之为数据洞察力,因为确实在审视数据并深度理解它。”

在客户方面,Cyberhaven已经获得摩托罗拉,医疗保险提供商Oscar Health ,Snowflake、SurveyMonkey、律师事务所Cooley 等大型客户,预计2025年的年度经常性收入 (ARR) 将超过 5000 万美元。

安全问题是AI应用被采用的绊脚石,安全工具则是一种保障

Cyberhaven属于数据丢失防护 (DLP) 供应商,它的同类竞争对手有Trellix、Digital Guardian和Forcepoint等,同时也包括Palo Alto Networks和Zscaler等基础设施安全公司。

对于下一步突破的方向,Cyberhaven的创始人Howard Ting表示它们计划向数据检测与响应 (DDR) ,数据安全态势管理 (DSPM) 以及隐私与合规等领域拓展,Cyberhaven还将与安全浏览器、EDR(端点检测与响应)和协作工具等领域的其他网络安全提供商集成,以增强对数据移动的可见性和控制力。

自ChatGPT发布两年多来,AI应用在ToC和ToB两个领域都经历了蓬勃发展,不仅有ChatGPT这个月活数亿的超级C端产品,也有不少月访问量上亿的应用,更不要说今年DeepSeek的横空出世。

在创投市场,2024年有51家AI公司融资超过1亿美元,其中就有29家是应用公司,今年这个比例很可能继续增加。

目前,AI应用在C端的应用已经被很多用户接受,它也帮助了不少设计师,教师,程序员,律师,销售人员等提升了效率,但是AI在企业端的应用可能才是真正提升生产力的部分,比如进入到工业,进入到一些企业软件的核心区域。

但是一旦进入到这些领域,就会有一个问题出现,那就是使用AI的安全性如何?在使用AI的同时,是否能保证企业的核心数据,例如关键代码,客户数据,研发数据不被泄露?

所以可以说,安全问题对于AI应用的大规模采用,是一种障碍,而各种专门针对AI应用的安全工具,则是一种保障。

中国市场足够大,足够有活力,AI应用创业者既可以直接打造全球化的应用,中国市场也足以孕育出世界级的应用,例如微信,例如抖音(Tiktok)。但AI能力如果要进入生产环境,进入企业的核心业务,那么它首先要足够安全,而考虑到现在的环境,中国就需要自己的AI安全工具,无论是针对云安全,防止模型窃取,还是数据泄露,这些都有足够大的创业需求。

本文由阿尔法公社原创。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅