靠给用户念书,AI语音产品移动端月入千万

关注
别家卷模型,它默默赚钱。

编者按:本文来自微信公众号 白鲸出海(ID:baijingapp),作者:张凯然,编辑:殷观晓,创业邦经授权转载。

2023 年,我们曾经观察过第一期 a16z 的 AI 产品榜单,当时访问量 Top50 的 Web 端产品中,仅有 2 款面向 AI 语音场景,分别是 ElevenLabs 和 Speechify。彼时,Speechify 的网站访问量排名第 23 位,比 ElevenLabs 还高了 1 位。

图片

第一期a16z AI产品榜单,2023年8月|图片来源:a16z

但在后续的时间里,相比频繁刷存在感的 EleveLabs,Speechify 可以说没啥存在感。

两年过去,ElevenLabs 已经融资 2.6 亿美元,网站访问量超 2500 万,稳坐 AI Web 全球 Top50 榜单,成为 AI 语音赛道的头部创企。而 Speechify 却渐渐“掉队”,榜单中难觅身影,而作为一个 AI 企业,它仅在 2017 和 2020 年有过两次融资,近几年也没有传出任何融资消息。

图片

8 月 29 日美国 iOS 效率畅销榜|图片来源:点点数据

但“惊喜”的是,它在 App 端默默赚钱。近两个月,Speechify 登上了点点数据的美国 iOS 畅销总榜Top150,并能够持续在榜,而在美国iOS效率畅销榜上,Speechify 的收入排名第 4,根据点点数据,Speechify 7 月份全球双端流水为 251 万美元,而 Sensor Tower 给出的数据还要更高一些,全球双端收入为 340 万美元。

图片

图源:Speechify 官网,根据官方 8 月 12 日

给出的数据,Speechify 全平台(App、Web、

Chrome 插件)总用户量已经突破 5000 万

图片

SensorTower 全球及美国AI产品收入榜单排名,

根据 Sensor Tower 数据,Speechify 上月全球

双端收入为 340 万美元,高于 ChatBox 的 310 万

美元,但低于 ChatOn 的 550 万美元,排名在第三和

第四之间;点点数据虽然具体数值有所出入,但相对排位与

Sensor Tower 一致|数据来源:Sensor Tower、点点数据

根据报告和以往观察,移动端能够取得不错商业化成绩的 AI 产品,大多都是 ChatBot,而 Speechify 作为一款 AI 音频产品,能够在移动端取得相当不错的商业化成绩,实属不易。

靠“听书”,切入个人学习提效场景

从功能上看,Speechify 属于“音频输出产品”,但与我们之前测评过的 ElevenLabs、MiniMax 等泛场景 AI 语音平台不同,Speechify 更“工具化“,明确指向“AI 读书场景“,即用户上传各种文字内容,AI 将其朗读出来,让用户在不方便阅读时,通过听,来获取信息,其产品设计也指向“个人学习提效”场景。

图片

从 App 端的产品设计来看,Speechify 需要用户自行上传文字内容。上传文字内容的方式非常多,除直接输入文字外,用户还可以通过链接、文件、云盘、照片,扫描纸质书等方式上传内容,而相比之下 App 端的 ElevenLabs,仅支持通过输入文字的方式上传。除此之外,Speechify 还提供一个电子图书馆(上图红框),用户可以免费收听里面的电子书。

图片

确定文字内容后,就会直接跳转到朗读页面,朗读时,用户可以以“0.05 倍”为单位调节速度,而且可以选择逐渐加速的模式,相比其他产品,这个“调节颗粒度”相当精细。

图片

用户也可以按照自己的偏好让

系统帮忙选择声音(上图红框),

或克隆自己喜欢的声音(上图黄框)

朗读页面的右下角,用户可以在左下角选择声音和语言,官方介绍,Speechify 一共支持 52 种语言,各语言还提供多种口音和音色,共 2000 多种。以英语为例,Speechify 提供英、美、澳、印度、南非、爱尔兰 6 种口音,不同音色超过 50 种。这些音色中还包括很多知名人士的声音,比如知名 YouTuber MrBeast、演员 Gwyneth Paltrow 等等,且根据官网的说法,这些声音都已获得本人授权。

图注:各位读者可以听一听,

自行感受一下两者的区别。

虽然,Speechify 提供的声音种类丰富,但从声音效果看,就算是读书场景,也要比 ElevenLabs 差一些。笔者用英文版《双城记》的经典开头测试了 Speechify 和 ElevenLabs,虽然从声音的质感上两者确实差不多,但从朗读的节奏方面,ElevenLabs 更加自然,Speechify 则有些怪怪的。

图片

而 8 月 12 日,Speechify 在开学季更新中推出了一系列新功能,让产品的定位,更偏向于“知识获取”场景。此次更新包括 AI 聊天、AI 回顾、内容总结、测验生成、播客生成等 AI 功能,以及重点标注、文字批注等功能。

图片

以播客生成为例,相比此前选题中观察过的播客生成产品,Speechify 除了能生成两人对话形式的播客,还能生成电台节目、讲座、辩论等不同的对谈形式。但是,Speechify 的播客生成功能仅支持英文,也没有能够下载音频或者转发分享的渠道,所以,该功能更像 NoteBookLM 的“音频概览”,主要目的仍是帮用户更好地吸收信息、减小双眼压力。

图片

图片

用 Speechify 学外语的分享(上),

阅读文献的分享(下)|图片来源:Reddit

从用户侧来看,根据 Reddit 用户的分享,典型的细分场景有学外语和阅读专业文献,有用户分享他在学习瑞典语的时候将学习材料上传给 Speechify,通过跟读的方式来纠正发音,并在碎片时间学习;而另一位用户分享,他用 Speechify 来阅读学术文献。总体而言,无论是功能,还是用户分享,Speechify 落地的基本场景是“学习、知识获取”。

之前不少播客平台的兴起,已经证明了用户愿意花大把时间“用耳朵获取知识”;而谷歌 NotebookLM 音频概览功能的爆火,也证明了用户需求,而 Speechify 在移动端的商业化成绩则证明,用户是愿意为“听知识”付费的。

高价+高付费墙+年订阅=高收入

Reddit 上,绝大多数用户都不否认 Speechify 确实非常有用,但它的高定价和付费点则受到了普遍吐槽。能够解锁所有功能的 Premium,定价高达 140 美元/年,且在 App 中没有其他订阅选项,点点数据的内购项目显示,Speechify App 端 70%+的收入来自年订阅。

图片

注:App中Speechify只提供

年订阅入口,用户需要到应用商店的

订阅管理页面才能找到其他的订阅方案。

有海外的文章分析,由于 Speechify 指向“知识获取场景”,许多用户都会在特定月份(“学年期间”、“年初年末”)等时段集中使用,而假期则很少使用,如果采用月订阅方案的话,可能无法负担成本。

而与“高价、年订阅”相配合的,则是“高付费墙”,如果不订阅,用户仅能使用机械感很强的基础语音,也只能同时保留 5 个文件,无法使用加速功能、以及 AI 聊天、总结、播客、测验生成等进阶功能。体验下来,由于基础版语音的效果确实不好,笔者听几分钟就会感到疲倦,可以当助眠产品来用,非订阅用户的体验相当糟糕。

图片

Speechify、Reader by Elevenlabs、Text to

Speech ARPMAU 数据|图片来源:点点数据

秉持这样的思路,Speechify 的数据呈现“低用户量,高 ARPU”的状态,7 月份,Speechify MAU 大概 50 万左右,远低于 a16z App 端 Top50 MAU 的门槛,但它的 ARPMAU 达到 4 美元以上,远超其他同类产品。

整体看下来,Speechify 不错的商业化成绩,一是它“用音频在学习场景做提效”,打到大家想学习、但又难坐得住用双眼学习的刚需;另一方面,“高价年订阅,卡付费点”让刚需用户们不得不掏钱,形成低用户、高订阅收入的局面。

但不得不说,对于所有 AI 产品来说,Speechify 都“示范”了如何用 AI 找到场景、赚到钱。

靠失读症人群冷启动,主动出击获取用户反馈

Speechify 于 2017 年上线,最初是创始人 Cliff Weitzman 的个人提效工具,靠着这款工具,患有严重的失读症和 ADHD 的 Cliff,成功从布朗大学毕业。Cliff 在播客中表示,小时候,父亲发现了自己有阅读障碍后,就用磁带录下了一本《哈里波特》,让他通过听的方式学习英语,Cliff 每天都要听着它入睡,这部有声书,他听了足足 22 遍,也养成了通过声音获取信息的习惯。

图片

根据某机构估算,15-20%的美国人都患有不

同程度的阅读障碍,有 200 万人确诊失读症

大学期间,精通编程的 Cliff 与患失明症的弟弟 Tyler,共同开发了一款文字转语音工具,帮自己阅读文献。而一个不经意的机会,他将 Demo 发上了 YouTube,1 天时间拿下了超过 30 万次观看,很多失读症病友们在评论区表示这个 Demo 让他们激动哭了。而从宏观数据看,仅在美国,就有 15-20% 的人口有不同程度的阅读障碍,200 万人确诊失读症,这个“刚需”人群真的不小。

因此,Cliff 决定将这个工具开发成一款产品,来帮助更多的人,顺理成章地,这个群体也成为了 Speechify 冷启动的目标人群。Speechify 的冷启动突出一个“主动出击”,创始人 Cliff 曾经偷偷溜进国际失读症协会的会议,并在主讲人演讲完后,跳上演讲台开始演示 Speechify,演示过后,就有 12 所学校的校长当场表示愿意邀请他去学校,教学生们使用 Speechify。此后,参加会议、深入学校和社区做“地推”,成为了 Speechify 的主要冷启动方式,并取得了不错的成绩。

虽然冷启动取得成功,但 Speechify 初期存在大量的 bug,以及 UI/功能的设计缺陷,导致用户流失问题非常严重。而解决用户流失问题,Cliff 贯彻了“主动出击”的行为模式,他曾经导出了前 300 个 90 天内流失掉的用户的联系方式,然后打电话询问对方对产品的看法,并根据反馈针对性地优化产品;他还曾在大学校园里用胶带封住自己的嘴巴,然后把手机交给用户,观察他们如何使用产品,发现设计缺陷。

图片

他表示,目前,Speechify 中不少备受好评的功能,就来自于对用户需求的深度洞察,比如,自动加速功能。Cliff 解释道,很多用户都感觉,在听的过程中,自己慢慢适应了 AI 的语速,就希望 AI 念的快一些,但是如果直接将语速翻倍,则会觉得太快无法适应。所以,Cliff 升级了加速功能,允许用户按“0.05 倍”的颗粒度调节语速,而且还开发了一个自动加速功能,每听完 500 个词,就加速一点点,让用户不需要再费力调节语速。

图片

而经过产品不断的迭代,Speechify 的用户也从失读者,扩展到了需要用音频方式来提效的其他人群,并在今年 6 月获得了苹果设计奖的“多元包容”奖项。目前,Speechify 除了 Web 和 App 端,还推出了 Chrome 插件,可以一键为用户朗读网页上的内容,Chrome 应用商店显示,Speechify 插件的用户数已经突破了 100 万。

写在最后

Speechify 的上线时间远远早于这一波生成式 AI 的热潮,也许它并不算是用AI技术找到场景的最佳案例,但恰巧该反思的是,当创业时,如果我们思考的是我可以用 AI 解决什么问题,可能已经偏离了“正确道路”。先看到问题,比 AI 技术更加重要。

数据来自SimilarWeb、点点数据、Semrush、广大大等三方平台,可能与真实数据中存在一定误差,仅供参考。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅