做出像真人一样对话的AI语音客服,剑桥博士又融资6亿元

关注
PolyAI的估值达到7.5亿美元。

图片

作者丨漫地

编辑丨关雎

图源丨Midjourney

距离富有人情味的AI语音客服面世,还要多久?

最近,总部位于伦敦的初创公司PolyAI拿到了8600 万美元(人民币约6亿元)的D 轮融资,这家公司正在做的事情专攻一个点——打造可以像人工对话一样自然的AI语音客服。

此轮投资,由著名风投公司Georgian、Hedosophia和Khosla Ventures共同领投。其他投资者包括英伟达旗下的NVentures、英国商业银行、花旗创投、Squarepoint Ventures、Sands Capital Ventures、Zendesk Ventures 和 Point72 Ventures。

01剑桥博士的创业路

PolyAI由Nikola Mrkšić、Tsung-Hsien Wen和Pei-Hao Su于2017年创立,他们是在剑桥大学机器智能实验室的对话系统小组相识的。

Nikola此前在剑桥大学获得机器学习博士学位,他在人工智能语音领域的从业经历,可以追溯到更早的时候。

图片

Nikola Mrkšić 图源:PolyAI

在他硕士毕业的时候,原本计划去瑞士信贷(Credit Suisse)实习,走上大多数学生都会选择的一条高成就、低风险的职业道路。但他的硕士导师,机器学习领域的传奇人物Zoubin Ghahramani 提醒他:“别去做个只会做PPT的家伙。”

于是机缘巧合下,Nikola作为首位员工加入了彼时初创的语音技术公司 VocalIQ。2015年, VocalIQ被苹果收购,主要是为了将VocalIQ的技术用于苹果的语音助手Siri中,让它变得更加智能。那个时候的VocalIQ产品,可以对用户提出的语义不明确的问题进行追问,就好像是和真正的人在交流一样。

有了这段智能语音的从业基础,在VocalIQ被收购的两年后,Nikola 与两位来自台湾的研究员 Tsung-Hsien Wen 和 Pei-Hao Su 决定更深入地探索语音助手领域。于是 PolyAI应运而生,其使命很简单:打造不会让用户感到被区别对待的语音助手。

Nikola此前在接受媒体采访时谈到,“我们团队从零开始重建了语音助手的整个基础设施。” 最后,一个不仅能识别语音,还能理解语音、适应语音内容并像人一样回答问题的平台就这样诞生了。

在一个人们大谈延迟性和准确性的技术环境里,PolyAI凭借其专有模型、战略自主性和以客户为中心的理念(超越技术层面)保持领先地位。谈起经营理念,Nikola认为, “我们专注于让用户真正感受到优质服务。这才是制胜之道。”

02一个像真人一样回答问题的平台

都在做AI语音,怎么和其他同类对手区分开来?

PolyAI抓住了企业运用语音客服却普遍无法做到反应灵敏、以及场景适应性差的痛点。

于是,创造一个足够智能的对话式Agent就变得很重要!PolyAI将其定位在帮助企业管理客户互动——它不仅能够理解复杂的多轮对话,处理不同地区的口音和语言,还能完成客户的身份验证、预订和支付等端到端任务。

对于顾客在语音通话中产生的中断、解释、甚至是离题的对话场景,PolyAI都能用传统交互式语音应答系统无法做到的方式来处理,这背后的技术支撑是PolyAI专为电话对话优化的语音识别和对话模型。

图片

图源:Poly AI官网

“据我所知,我们是唯一一家运行拥有数十种不同语言、适用于不同场景/用例的自动化系统的公司。” PolyAI的CEO Nikola显然以此为傲。对于AI公司对语音人工智能的打造,Nikola认为,并不仅仅只是为了取代企业呼叫中心的人工客服,它能做的事情还应该更多,包括自动化处理那些人工操作成本过高的任务来帮助企业提高收入。“我们的人工智能不仅会接听顾客的每一个电话,而且从不忘记向他们顺带推销其他产品。”

八年前,这家公司的前身只是剑桥大学呼叫中心开发的AI助手,这些助手用来引导客户处理各种咨询、每天处理数百万个电话。

但是现在, PolyAI的客户群涵盖金融服务、医疗保健、酒店和零售等行业,许多大企业客户都在采用他们的智能语音平台,包括万豪酒店、凯撒娱乐和Foot Locker等知名企业。PolyAI正在为加州最大的能源公司太平洋煤气电力公司 (Pacific Gas and Electric Co.) 处理有关停电的客户问询电话,为意大利联合信贷银行 (UniCredit SpA) 处理有关新开银行卡和遗失信用卡的咨询,并为拉斯维加斯的赌场(例如凯撒宫和金块赌场)处理餐厅订单。

根据PolyAI公开的财务记录显示,截至2024年1月31日的12个月内,其收入为890万美元,而到2025年同期,收入已超过1500万美元。PolyAI的CEO Nikola称,PolyAI语音的逼真度和灵活性使其在过去一年中实现了销售额的显著增长。他向媒体表示,公司有望在2025财年实现年度经常性收入翻番,超过4000万美元,其中美国客户的销售额预计将增长两倍。

营收不断增长,PolyAI融资的脚步也是不断。从2017年至今,其一共进行了六轮融资。最近这笔8600万美元的融资里,英伟达的NVentures、科斯拉风投(Khosla Ventures )、Point72 Ventures、Sands Capital Ventures等机构都是多次跟投。本轮融资也使该公司迄今为止的总融资额超过2亿美元,目前,PolyAI的估值达到7.5亿美元。

图片

对于最近的这笔新投资,PolyAI计划进一步开发其Agent Studio平台技术,并扩大市场推广力度。

03中美人工智能语音市场前进到哪了?

对PolyAI 进行风险投资的机构都清楚地认识到人工智能带来的机遇。

相较于市面上其它也在做语音客服的竞品,PolyAI 更关注高质量的语音交互。这使它区别于 Five9、Genesys 或 Avaya 等更广泛的联络中心平台,以及Cognigy、Kore.ai 或 Leaping AI 等更以工作流程为中心的对话式 AI 参与者。这些参与者通常跨越多个渠道,但在逼真、复杂的语音通话方面则显得不太专业。

PolyAI 的竞争对手包括多家美国语音人工智能初创公司,这些公司近几个月也吸引了大量风险投资。其中包括Sierra Technologies 在9月份完成了一轮3.5亿美元的巨额融资,使其估值超过100亿美元;而总部位于旧金山的Decagon AI在6月份的融资中获得了1.31亿美元,估值达到15亿美元。该公司在欧洲也面临着激烈的竞争,总部位于巴黎的Parloa GmbH在5月份融资1.2亿美元,估值达到10亿美元。

PolyAI的CEO Nikola表示,PolyAI与其竞争对手的主要区别之一在于,它开发了自己的大型语言模型,这使其在真实性方面具有优势。而它的竞争对手只是简单地接入OpenAI等公司或Eleven Labs 等语音AI初创公司的大语言模型。

回到中国智能客服市场来看,明显呈现出一个头部企业聚集的格局。科大讯飞、百度、阿里、腾讯、华为云纷纷布局智能语音。科大讯飞凭借全栈自研技术深耕教育与医疗等垂直行业,走“AI+刚需”的技术驱动路线;百度与阿里均侧重生态构建,但百度以DuerOS和小度硬件主攻家庭入口,阿里则依托电商、支付生态将语音深度融入商业场景;腾讯将语音作为底层能力赋能其社交与游戏等核心业务,布局相对内敛。

而近几年中国的AI智能语音初创公司数量上相对美国市场较少,它们大都通过深耕细分领域(金融、政务、跨境等)和技术差异化(低延迟、方言支持、合规适配)来构建护城河。比如赛舵智能深耕金融场景定制化语音机器人,云蝠智能的核心产品线包括大模型语音智能体,为企业提供CRM及AICC大模型呼叫中心,以及智齿科技通过提供全渠道的客户联络解决方案,嵌入到企业的营销、服务等多个环节。

图片

回到PolyAI来看,Georgian Capital的投资人 Emily Walsh 表示,这是她第二次投资这家初创公司。“对于全球最大的品牌而言,客户服务不再仅仅是一个成本中心,而是一个巨大的价值创造机会,”她说道。“PolyAI 能够在企业级规模上部署栩栩如生的语音助手,从而带来显著的成本节约和收入增长。”

而作为一个创业者,Nikola认为,打开想象力很重要。如今很多语音类的产品创新能力不够,这表现在它们往往只是一些辅助工具,让客服人员的工作能力略有提升。

“但是,你要想象一下这样的一个世界:大部分工作都实现了自动化,人只需要辅以适当的人工干预就可以了。我们要构建的是一个由人工智能驱动、高薪知识型员工主导的世界。所以,现在就开始实现电话自动化吧!”

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅