落地金融、安防、汽车等领域,时代拓灵发力智能音频采集、播放端生态闭环

2020-02-12
“疫情结束后,相信更多人会愿意偶尔佩戴口罩,声纹识别会成为更多客户的选择”。

严峻的疫情态势下,“人人佩戴口罩”“避免接触”成为不可忽视的关键词,人脸识别、指纹识别身份验证产品一定程度上面临困境,“而声纹识别的端上智能设备,给大家带来了新的非接触式应用方式,俨然成为了最安全有效,且能最大程度阻断病毒间接传播途径的最优身份验证方式。”时代拓灵联合创始人刘恩这样认为,在他看来,这次疫情一定程度可能会带来声纹识别的发展机会或拐点,“疫情结束后,相信更多人会愿意偶尔佩戴口罩,声纹识别会成为更多客户的选择”。

时代拓灵CEO孙学京博士毕业于美国西北大学,曾在高通CSR/杜比等世界顶级的智能音频领域内供职11年,联合创始人刘恩曾任Morgan Stanley投资银行IT风控分析师,有多年国内市场企业级产品销售和国外跨国团队项目管理经验。,两人都十分看好音频这类高利润核心技术的国产替代的趋势。基于自身背景,两人于2015年5月正式创办时代拓灵,如今团队已有30多人,主要研发全景音频处理为核心技术,向用户提供最新硬件采集、软件处理、内容制作与呈现一体化解决方案。

事实上,声纹识别并不是“新鲜物种”,时代拓灵也在2018年就已经成功将端上智能化声纹产品应用在金融领域,比如在某省国有银行实现了全省范围的自助银行加钞间门禁系统声纹识别产品上线,不依赖于任何服务器,可以离线工作。目前其产品已被5家国有银行列入采购清单。

在随后的1年多时间里,时代拓灵继续打磨出了技术水平更高、应用范围更广的人工智能边缘计算产品(智能音频分析报警仪等)。

“即客户可以指定一个特定声音,在100平米听到这个声音就实现报警行为,比如可应用在防控银行内部员工的飞单行为、监控在夜间破坏设备、侵入房间等违法行为”刘恩介绍,“现在的疫情之下也催生了新的需求,比如对于特定声音如咳嗽声的识别,连续咳嗽超过多长时间就可发出报警。”

需求在不断变化,产品功能也会不断丰富。2019年,时代拓灵也开始探索基于声纹识别对于工业设备的检测,传统方法是使用超声、震动方法检测设备是否损坏,但实际上损坏之前的工作声音会有异样,声纹识别可以在不接触、拆开设备的情况下完成检测。

以上都是时代拓灵在音频采集端的场景布局和应用,此外,其也在音频播放端同步发展,主要应用在汽车内音频播放系统。

据刘恩介绍,时代拓灵曾有幸获得2018奥迪创新实验室大赛”车内交互系统总冠军,这对于公司发展起到关键作用,此后时代拓灵得以和诸多汽车厂商开展合作,目前已有头部企业订单进入量产阶段。现阶段,该市场几乎被国外厂商占据,国内对于音频播放端领域没有太多关注以及缺乏相关人才培养渠道,市场上也鲜有音频播放端的资讯,目前很少有本土企业在做,时代拓灵作为国内本土企业具有语言无障碍、本土化服务、贸易风险低、性价比高的强大优势。因此,未来2-3年时代拓灵有望成为车厂音频播放端主要厂商。

在销售模式上,初期时代拓灵主要聚焦在核心算法的研发以及模组芯片的打包售卖,现阶段延伸到也可直接提供产品和完整的解决方案,已落地金融、工业检测、安防、汽车、电影、智能家居等多个行业,应用场景包括银行声纹门禁解决方案、工业听觉监测系统。2019年已实现数百万人民币签约额和收入,今年预计实现1000-1500万营收。

实际上,在智能音频领域,噪音、录音信道多样性、混响环境都会影响识别准确率。在降噪上,时代拓灵目前可做到三米之外抗95分贝的噪音,5米之外抗115分贝噪音。但在其他方面刘恩也坦承,虽然现在有专门的算法降低信道、混响的影响程度,但是不能做到完全消除影响,这是行业内普遍面临的难题。因此目前声纹识别准确率仍有待提升。但是,只要在场景要求的范围内、在特定环境下比如银行等可控环境,识别准确度仍可以达到客户的安全要求。

突发的疫情让远程办公态势火热,但不少企业感受到音频会议中声音的传输品质不理想,今年,时代拓灵也将探索研发结合5G的全景声解决方案,实现360度声音采集、多路传输,可应用到远程办公、远程医疗、现场采访报道等场景,提供沉浸式环境使得现场更具真实感。为此,新一轮融资正在计划中。此前曾于2015年获得创势资本天使轮融资,于2016年获得启迪之星等投资,去年完成一轮战略投资。

本文相关的文章列表页头图图片来源于时代拓灵,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。


来源:原创