斯坦福天才少女一年缔造5亿美元独角兽！Pika再获8000万美元融资，金牌团队阵容首度曝光

新智元·2024-06-08

斯坦福天才少女郭文景的Pika，在成立一年之际再获一笔8000万美元融资。团队成员也首次曝光，6位IOI金牌得主，包揽9块金牌。凭借超神的速度，这家公司的产品进化路线图震惊了一众硅谷大佬。AI视频将走向何方？Pika定会拿出新的惊喜。

编者按：本文来自微信公众号新智元（ID：AI_era），编辑：编辑部，创业邦经授权转载。

斯坦福天才少女的这家公司，依然在继续它的传奇。

成立一年之际，Pika迎来最好的生日礼物——新一轮约8000万美元的融资。

至此，公司估值较上一轮融资已经整整翻了一番，接近5亿美元。

Pika联合创始人郭文景（Demi Guo）和孟辰霖（Chenlin Meng）

本轮融资由Spark Capital领投，而参与投资的，涵盖了科技和娱乐领域各大投资公司，以及个人投资者，包括Greycroft、Lightspeed、Neo、Makers Fund、著名演员Jared Leto和大西洋唱片公司CEO Craig Kallman等。

此外，这次的名单中还包括了去年11月就参与投资的「老熟人」，比如前Github CEO Nat Friedman、Quora创始人Adam D'angelo、Perplexity CEO Aravind Srinivas、HuggingFace CEO Clément Delangue、ElevenLabs联创Mateusz Staniszewski，以及AI大牛Andrej Karpathy等。

这一切无不表明，市场对生成式AI的未来信心巨大，科技、影视、文娱……要被AI视频「改造」的领域，还数不胜数！

回想7个月前，刚刚发布的Pika 1.0就效果炸裂，以电影般的质感、动画级的特效，掀起了AI生视频领域的大地震。

虽然如今经过Sora的洗礼，我们对AI视频的视效阈值已经一再被拉高，但当时横空出世的Pika 1.0，相比Gen-2等竞品，堪称一句「划时代」。

值得一提的是，Adobe在4月的时候钦定了三大视频AI合作商：Pika、Runway，以及估值860亿美元的OpenAI。

Sora、Pika、Gen-2三个工具同时登陆Premiere Pro

如今，「每个人都能成为自己的视频导演」，这句口号听来依旧震撼。

成为视频领域的Anthropic

在一周年之际，创始人郭文景对新智元表示——

「Pika想要构建更强大的视频大模型。而此次融资的目的，就是希望能够更加积极地训练大模型。」

是的，Pika希望成为的，就是AI视频领域的Anthropic。

这一轮Pika的新领投Yasmin Razavi，此前也是Anthropic的领投。

在Anthropic还没公开模型和产品时，Yasmin就选择相信这个团队，领投了Anthropic，并成为董事会成员。

现在，Yasmin也成为Pika最新的董事会成员。

6位IOI金牌得主，包揽9块金牌

今天，我们要讲的除了创始人故事之外，还有团队背后鲜有人知的内容。

工程团队

在Pika的团队中，共有6位IOI金牌得主，包揽9块国际奥赛金牌，其中3位还是IOI世界第一。

这一数字，甚至超过了前段时间爆火的AI工程师Devin，背后的初创Cognition Al的「金牌程序员」——5位金牌得主，10块金牌。

其中，创始人郭文景摘取了IOI银牌，是美国队十几年来唯一的女国家队队员，也是美国国家队教练。

另一位创始人陈思禹（Karli Chen）更是鲜有的双料国家集训队成员，曾在IOI集训队获得国内前12名，也是全国物理竞赛金牌获得者。

而且，Pika工程团队中还有两个人获得了美国大学最高数学奖项，被认定为Putnam Fellow。

Putnam Fellow是被认为特难的数学竞赛，每年选出5位个人成绩最好的人，将由美国数学协会颁发。

科研团队

在科研方面，Pika团队的实力也不容小觑。

他们纷纷来自世界最好的大学和科研机构，斯坦福、MIT、谷歌、Meta、OpenAl等等。

既有有连发几十篇论文的科研大牛，也有著名开源项目的主要开发者。

创始孟辰霖是DDIM、Img2Img、Model Distillation的作者。

这些方法，直接将扩散模型的推理速度提高了数百倍。也是GenAI editing方法的基石算法。

团队的研究科学家，Omer Bar-Tal，是谷歌CEO吹捧的AI视频大模型Lumiere项目的一作，有一线大模型训练的经验。

论文地址：https://arxiv.org/pdf/2401.12945

另外，Pika团队还拥有Hugging Face的Diffusers代码库的联创和最核心开发者。

Diffusers是Hugging Face最大的项目之一，训练GenAI模型的Default Library，现已拥有超过23k星。

顾问团队

此外，这家体量虽小的初创公司，还有着非常强大的顾问团队。

斯坦福AI实验室的主任，NLP大师Christopher Manning，是将深度学习应用于自然语言处理（NLP）的早期领导者之一。

Manning还是ACM院士、AAAI院士和ACL院士。截至目前，他个人被引数近25万，成为NLP领域引用量第一人。

两届奥斯卡得主，斯坦度大学工程学院的Canon教授Ron Fedkiw，曾参与制作了很多著名电影，比如加勒比海盗、星球大战的技术特效。

Fedkiw一直以来专注于计算机图形学的研究，曾设计了一个平台，首次应用在《终结者3：机器的崛起》中的T-X角色，现已被用来创造电影节最先进的特效。

Fedkiw的技术帮助《加勒比海盗2》获得了第79届奥斯卡最佳视觉效果奖

他个人在计算物理、图形学、机器学习和视觉方面，发表了140+篇论文，并出版了一本名为「Level Set Methods and Dynamic lmplicit Surfaces」的计算图形学书籍。

斯坦福大学计算机科学系的教授Stefano Ermon，在机器学习领域发表300+篇论文。并在扩散模型研究领域发表过著名的Score Matching以及「Denoising Diffusion Implicit Models」。

近期，Pika荣幸被选为福布斯Top AI 50公司，与Abridge、Harvey、Mistral并称为四个「New and Noteworthy」公司之一。同时，Business Insider将其评为Top 44最值得工作的创业公司。

5月初的时候，郭文景还被被彭博社评选为The People in Tech to Watch。

灵活的架构，「超神」的速度

除了坐拥阵容如此豪华的团队，Pika成功的另一个秘诀，就是快到令对手完全反应不过来的速度！

去年年初，AI视频领域早已在硅谷红了大半边天。

以Gen-2为代表的背后初创Runway成为当时最具竞争力、最受欢迎的公司，并坐拥100+员工，是估值1.5B美元的独角兽。

彼时，Pika还未诞生。

如今，仅用一年的时间，Pika已经成为了Runway的最大竞争对手。

，时长01:05

其实，Pika的速度，从它成立缘由的那一点「小火苗」，就可以窥见。

2023年初，郭文景和同学参加Runway的首届AI电影节时，发现Runway和Adobe Photoshop的工具并不好用。

2023年4月底，为了开发更好用的AI视频工具，让「每个人都能成为自己的视频导演」，郭文景决定从斯坦福退学，Pika由此诞生。

一次失败的参赛经历，却让一家估值近5亿美元的公司诞生，这不啻是一段传奇。

某天下午，天使投资人Friedman向团队提出了一个想法：在视频中嵌入文本。

凌晨3点，他收到了一条短信，告知这项功能已经准备就绪。

Friedman被团队的高效震惊了，立刻决定进行下一轮投资。

论文成果斐然

Pika的能力之所以可以不断迭代，完全是基于团队在研究领域取得的诸多成果。

Pika在全球范围内有超过20个研究合著者，来自清华姚班、北大、斯坦福、MIT、加州理工等知名高校以及科研机构。

Pika下一步计划是，将在今年晚些时候，发布文本到视频模型重大更新。

郭文景透露，包括支持生成更高质量、更长时间的视频（目前只能生成3秒的视频，不过用户可以在视频生成之后再延长）。

郭表示，「我们正在努力打造最佳的视频模型，同时也在打造一款真正服务于创造者的产品」。

AI电影，究竟还有多远

从创立的第一天起，Pika对于产品就是这样构想的——

成为一个帮助用户把「想法」做成「视频」的平台，因此，团队需要创造全新的模型，实现这个「将任何人的概念变为现实」的功能。

如何让每个人都能成为自己故事的导演？Pika决定从最底层构建产品，让整个过程更有趣、更有挑战，也更容易理解。

距离我们能从电影院看到一部AI电影，究竟还需要多久？

在电影制作人Paul Trillo看来，从孤立的剪辑到制作一种以故事形式运行的工具，并且能让观众在观看时不会脱离其中，还有一段路。

AI能让电影实现到某种程度，取决于它能在多大程度上，执行使用者的真实意图和愿景。

，时长00:43

如今用Pika，可以将视频中的对象改变各种风格

Pika希望自己的模型可以理解各种不同的输入，这无疑对模型的能力提出了很高的要求。

从某种意义上，OpenAI的Sora也采用了类似的根本性「拔高」。

Sora对世界上事物的物理运行方式，有着深刻的理解。这，就能让视频的主体能够直接做出正确的互动和反应。

而让AI视频更接近电影的另一个因素，就是长度。

如今，我们已经达到了用3到8秒的镜头所能讲述故事类型的极限，而更长时间的视频，则会开启我们讲述更复杂故事的能力。

不过，即使能生成60秒视频，也并不意味着AI能创作一部连贯的电影。

这也就意味着，如今的视频AI，还有许多潜在的全新方向可以开卷。

对此，制作人Trillo预测道：「或许两年后的模型会有极强的控制力，为电影制作人提供任何所需的细节」。

而Pika，无疑是该领域被寄托了最多希望的选手之一。

因为它强大的执行力，意味着很多可能。

短短一年时间里，Pika已经初始的3人公司，组建了世界级的研究人员和科学家团队，还集结了一批创作力爆棚的创作者。

难以想象，下一步他们将如何利用AI，推动视频生成领域的最前沿。

参考资料：

https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika

https://www.washingtonpost.com/technology/2024/06/04

/pika-funding-openai-sora-google-video/

https://www.forbes.com/lists/ai50/?sh=80bf8b4290f4

https://pika.art/blog

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

新智元

关于我们

订阅服务

特别推荐

法律相关

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅