从最近出圈的AI初创,看今年的YC

2024-03-28
AI浪潮下周期性的变化

编者按:本文来自微信公众号 硅兔赛跑(ID:sv_race),作者:硅兔君,创业邦经授权发布。

这个月初,号称「人类首个AI软件工程师」的Devin火爆出圈,给世界带来了亿点点震撼。

它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型,一经发布就掀起业内疯狂讨论,甚至有人说:软件工程师要失业了。

图源:DigiAlps LTD

开发Devin的初创公司 Cognition AI ,仅由10人团队组成,团队虽小,全是大牛。大多是华人面孔的队伍,狂揽10 枚IOI(国际信息学奥林匹克竞赛)金牌,还有人在DeepMind、Waymo 等大厂的工作经历。

Cognition AI成立才不到两个月就获得硅谷投资大佬Peter Thiel的Founders Fund基金领投的2100万美元A轮融资,以及Google高管Elad Gil、计算机科学家Christopher Re、Strip创始人John Collison的联合支持。

01 一个,和无数个

虽然Devin才上线两周,且没有完全对外开放使用,拿到早期测试资格的人和公司并不多,不过还是有不少工程师晒出实测结果。

只需要自然语言写的提示词,接下来的所有工作都可以交给Devin,它会像一个真正的程序员一样完成工作。

图源:Linkedln

码农的世界已然变了天。Devin的首席执行官Scott Wu还在社交媒体发出现在的Devin还成为Cognition AI的首席执行官替身,开始打工了。

最近几天,AI初创公司 Suno AI 推出了第一款可制作的音乐生成模型V3,音乐圈炸裂。

图源:MLWires

此前,Suno AI因爆改的周杰伦的《以父之名》和《夜曲》出圈,当时网友纷纷惊叹未来AI音乐的可能性。本周发布的V3,仅用几秒的时间,便可以创作出2分钟的完整歌曲。

Air Street Capital预测,今年会有AI生成的歌曲成为 Billboard 或 Spotify 热门单曲。

今年Y Combinator W24即将在四月如期来到,我们观察到这个batch里同样有不少AI to software的初创公司。

Pythagora 是一款开发工具,由 GPT Pilot 和GPT-4支持的 VS Code 扩展,它能通过与用户对话,从零开始构建应用程序。非常适用于使用 Node、Express 和 MongoDB 的网络应用程序项目。

Pythagora在Github上有2.43万星,由CEO Zvonimir & CPO Leon 联合创立。AWW app (1.5M MAU 2016-2021) 被 Miro 收购;CTO Senko 与 CEO Zvonimir 一起开发了一个开源的软件自动测试项目,后来转型到 GPT Pilot 上。

图源:Linkedln

Fume 是一款人工智能软件开发工具,用户可以在开发周期的任何阶段随时随地访问,它类似一个编码助,但更像是一个团队成员,你可以从它那里获得帮助也可以将工作完全委托给它。

每个开发团队都有一长串未处理的错误报告、生产错误日志和功能请求,有些任务其实无聊又繁琐,修复他们往往花费了工程师大量的宝贵时间。Fume的用户只需在 Slack、VSCode、Github 或其他任何地方发出一个提示,即可在整个代码库中更改多个文件。

图源:Fume

Marblism ,一款通过单个提示生成功能齐全的 Web 的应用程序。创始人认为每个人都害怕前几行代码:选择框架、设计 UI/UX、设置项目、集成前端与后端,用户只需要描述您想要构建的产品,接下来90%的基本网站构建工作都可以放手交给Marblism,只需专注于剩下的个性化内容即可。

Marblism是两位联合创始人的第二次创业,上一家公司Vauban于2022年被Carta收购。

图源: Marblism

02 自己卷自己

除了AI+软件的初创,这届YC出现了很多相同类型产品的不同公司,比如视频生成领域。

Magic Hour 是一款视频生成工具,由两个年轻的华人工程师创立,其中联合创始人兼CEO曾是Meta的高级数据科学家,CTO也有相当长的行业经验。

Magic Hour使用开源模型,支持AI换脸、视频to视频、文字to视频、图像to视频等形式,区别于写实风格的视频,Magic Hour生成的视频主要以动画风格为主。

图源:Magic Hour

同样是AI+视频, Yarn 旨在利用人工智能,帮助客户制作专业品质的产品和销售视频。销售团队可以使用 Yarn 制作销售资料、发布视频、用例演示、培训指南,YC里的的一些公司比如DriverAI (W24) 、Replo (S23) 、Forge (W24) 已经在尝试使用Yarn。

同类型的成熟产品有Loom AI,去年10 月份宣布以 9.75 亿美元被协作软件巨头 Atlassian收购。

图源:Yarn

Infinity AI 号称只需上传文字剧本,就可以将其制作成电影。由MIT校友组成的创始团队称在未来十年内,由三名编剧组成的团队会赢得奥斯卡金像奖。

不过,从demo上看生成的效果还不够成熟,目前只能生成半身人像视频,且人脸的面目比较僵硬,达到所谓“电影级别的效果”还言之过早。

图源:Infinity AI

「AI+视频」 是本届YC一个拥挤赛道,同在挤在同类型产品中竞争的还有「AI+语音/音乐」,至少有十多个项目。

VoicePanel 是一个用于定性研究的全自动平台,负责招募高质量的参与者并对他们进行访谈,将反馈综合成有价值的报告。

两位创始人都是哈佛大学计算机工程毕业,CEO John曾在Google有着十多年工作经验,后加入Optimizely并结识CTO Asa,后者曾在Microsoft工作,曾创立了 Level (YC S21)被 英国出租代理服务公司Vouch 收购。

图源:VoicePanel

Retell AI 由五位华人创立,帮助开发人员在短时间内制作类人语音代理。实际上语音人工智能已经出现了一段时间,但始终没有被主流广泛应用。主要原因是用户体验不佳,表现为AI对话流程常常因不自然的停顿和中断,人类的请求经常被误解,生成的声音听起来机械化等等。

Retell AI生成的类人语音AI代理已经实现了平均 800 毫秒的响应时间,达到了人类交互的水平。在团队展示的Demo中,AI代理相应迅速、声音真实、理解迅速并且在被打断时也能做出正确响应。

图源:Retell AI

Soundry AI 为音乐家和声音设计师构建了一个通用的文本到声音人工智能生成器。三位联合创始人都因对音乐的热爱而团结在一起,其中CEO Mark在康奈尔大学获得人工智能博士学位,另一家创业公司也是音乐相关。

用户可以使用Soundry AI创建独特、高质量、无版权的demo,目前的展示来看,效果相比同类产品更为优秀。

图源:Soundry AI

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。