3300万美元把公司卖给Salesforce,转身拿着这笔钱天使投资HuggingFace,现在又想挑战Google的搜索引擎!

2023-09-04
You.com 背后的创始人故事与思考

编者按:本文来自微信公众号 有新Newin(ID:NewinData),作者: 有新,创业邦经授权转载。

59a7b1feb2eebb3fe7d930e0d50809df_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

今天为大家带来 You.com 背后的创始人故事与思考:

  • 囤了24年的顶级域名

  • 从 LLMs 到搜索2.0

  • You 的产品组合与商业化

  • 如何看待应用层的含金量?

enjoy ✌️~

01囤了 24年的顶级域名

1996 年,时任甲骨文销售高级 VP 的 Marc Benioff 正在夏威夷的海滩上放假,他突然意识到了互联网即将发生的大事,网络世界将会成为现实的镜像他思考了数字孪生的概念并思考着什么东西会出现在互联网上,于是他开始购买域名,抢购数字世界的一小片土地以构建未来。

在 Marc Benioff 当时购买的域名中就有 You.com;在 1996~2020 年间,Benioff 一直持有这个域名,直到他找到了这个域名的继任者 —— Richard Socher。

2003 年,Socher 刚开始在莱比锡大学学习计算机科学,而后辗转计算机视觉并获得硕士学位,其中涉及了更多统计和模式识别、统计学习的内容,随后受到深度学习和神经网络在计算机视觉的启发,开始探索在自然语言领域的应用,最终为 Socher 在大模型领域的发展奠定了基础。

2014 年,Marc Benioff 和 Richard Socher 相遇,当时 Socher 刚在斯坦福大学完成博士学位,并在那里开创教授了一种计算机理解自然语言的新方法,神经网络在理解 Facebook 照片以及将文本从英文翻译成中文等方面引起了不小的关注,但还不能理解语言的含义,Socher 的研究证明了神经网络通过上下文和词汇间关系建模可以解决这些问题,这也为 Socher 赢得了在普林斯顿大学工作的机会,不过学术界终究是没待太久,最终 Socher 决定通过创业继续自己的研究。

Socher 当时创办了一家名为 MetaMind 的公司,通过神经网络来为其他公司执行任务,从舆情分析再到医学检测,这项技术设计的非常简单,不需要开发人员就可以使用,如果想要执行复杂的机器学习任务,只需要提出问题就可以了,Socher 在 2015 年的采访中表示 MetaMind 和搜索引擎的区别是前者给出了答案,后者只返回了一堆链接。

这项技术在当时吸引到了 OpenAI 的第一位风险投资人旗下的 Khosla Venture 以及 Marc Benioff 的注意,两方共同投资了 MetaMind 800 万美元的种子资金,Richard Socher 从 CEO 转任 CTO。

2016 年,这家公司被 Salesforce 以 3300 万美元收购,成了今天 Salesforce Einstein ,用于帮助销售人员跟踪销售机会;以及 Wave(现称为 Einstein Analytics)、Salesforce 的基于云的分析软件等产品。

Socher 也因此加入 Salesforce 担任首席科学家,与此同时,Socher 身为斯坦福大学兼职教授的索切尔先生提倡一种以研究为导向的文化,强调发表研究论文;根据 Salesforce 统计,在 Socher 领导下的 17 个月内,Salesforce Research 发表了 20 篇研究论文。因此,Socher 的加入为 Salesforce 培养了大批 AI 人才。

图片

在 Salesforce 时期,大公司内部的成熟管理模式带给 Socher 良好的市场营销和更好管理经验,这让 Socher 意识到随着公司的成长,设立专门的研究团队是有道理的,现有的公司以此有更大的概率把握未来的科技发展方向,并在某些情况下,实现这些预见,而对于一个小型创业公司,则可能过于奢侈,创业公司需要更多的关注如何“活在当下”你必须在相对短的时间内推出一些可以交付的产品。

同时,Benioff 不仅扮演着 Socher 的老板,更是一位创业导师,这让 Socher 学会譬如在一些重大决策时,需要多听取意见等经验教训,在 Socher 看来 Benioff 打造了一家了不起的公司,他不仅关心客户,也关心整个地球、生态系统、当地学校、环境等等方方面面。

图片

随着当初公司被收购,Socher 也因此获得了大量现金,一边是买了一块价值 300 万美元的牧场开始享受生活,一边则是做起了天使投资,包括他于 2015 年在斯坦福大学教授 CS224 学生们所创办的项目,其中之一就有我们熟知的 HuggingFace,当时 Julien Chaumond 通过这项课程的学习小组和朋友 Thomas Wolf 在 2017 年 3 月创立了 HuggingFace,而 Socher 通过 Wolf 接触了这个项目并在 2018 年 5 月投资了种子资金,而上月底 HuggingFace 刚完成 D 轮融资,估值已经达到了 45 亿美元。

02从 LLMs 到搜索2.0

图片

一直以来,Socher 都是单一大模型的支持者,今天 You 在这方面也取得了一些进展,但是在两三年前,市场主流的观点仍然还停留在每个任务都需要建立独立模型,比如那时会有一个情感分析模型分析推文积极或者消极,摘要模型进行摘要,翻译模型进行翻译,问答模型完成问答,Socher 认为大模型的训练应该像维基百科一样,通过人们不断的增加内容,将这个词典变得更好,而不是每个相邀构建词典的人都从头开始构建词典公司。

之所以当时的学术界和工业界都认为需要独立的模型去完成不同的任务,而不是由一个统一的大模型去完成,原因在于这中间需要让 LLMs 来融入世界知识,还需要具有注意力机制、更快的 GPU 和硬件等多种因素平衡才能让模型正常工作,而在 10~20 年前市场上只有非常小的模型时,要实现今天的效果几乎是不可能的。

2020 年,已经在 NLP 领域工作了十年的 Socher 依然有个想法困扰着他,也就是目前仍然没有看到有人将 AI 应用到有史以来最大的商业模式 ——“在线搜索”中,于是 Socher 拉来了在 Salesforce 的伙伴 Bryan McCann 一起创办新项目,当 Benioff 看到了 Socher 递来的辞职信,失望的同时也知道挡是挡不住了,不如顺水人情,一边掏出了自己藏了 24 年的顶流域名 You.com ,另一边在 2021 年领投了 You.com 的种子轮。

2022 年,You 当时的用户规模达到数十万,当年 6 月份的注册量就达到 70% 的增速,而独立搜索量则每月增长 30%,虽然和 Google 以及 Bing 之类的顶级搜索引擎相比犹如小巫见大巫,不过 Socher 在早期非常在意用户的留存情况,而将 You 设置为默认搜索引擎的人中有 50% 的用户仍然会继续使用。

今年上半年在 Google 匆忙的完成发布会后,Socher 表示 Google 以及 Bing 这类传统搜索引擎领域的主要参与者正在面临典型的创新者窘境,拿 Google 来说,其通过用户的隐私在搜索结果页面展示更多广告,每年赚取 1500 亿美元,Google 每年还要像 Apple 支付 150 亿美元作为默认搜索引擎的费用,这足矣说明其垄断地位。

Sicher 认为生成式 AI 的出现并不等于带来更多的盈利,而是会减少广告的展示次数,比如原先一个页面 6 个广告,现在用户只会看 1 个广告,相当于每天减少 5 亿美元的收入,用户并不想看到那么多广告,但实际上会看到一堆带有广告的 SEO 网站,对于通过广告变现的搜索引擎来说,微软也差不多,只不过这块业务占比并不大,微软也愿意保持一定亏损来换取更好的市场份额,而融入新的 AI 功能则可以换取更大的市场份额。

图片

当被媒体问及如何看待生成式 AI 在搜索领域的商业化时,Socher 认为在聊天中添加个性化的广告,就像是 DuckDuckGo 可能做的事情,这取决于用户的 Query,今天我们看到有很多网友沉浸在 reddit、tiktok 以及 chatgpt 上,这说明用户依然在找一些其他内容,但这些内容和渠道并不足以替代 Google 这样的搜索引擎,这就是为什么 Socher 觉得 You 会有机会,试想一下当一个聊天机器人只给你答案,而不是将流量分配给个人、杂志或者出版商时会发生什么?Socher 认为的搜索2.0 将是这些内容提供方在搜索引擎上有一个类似“应用”的位置,当用户喜欢它,它就会在聊天中不断出现。

03You 的产品组合与商业化

图片

You.com 除了搜索引擎,也提供其它的工具和服务,类似 OpenAI,你还能看到 You 版的写作工具、图像生成工具、代码生成工具以及开放平台等方面:

  • 搜索功能

You.com 的搜索引擎从微软 Bing 获取搜索结果,同时也拥有自己的网络爬虫,被称为 YouBot,用户可以通过插件设置 You.com 为默认的搜索引擎,并在搜索结果页面上获取相关信息;

  • YouChat 聊天工具

YouChat 是一款由人工智能驱动的会话式搜索助手。它能够回答问题、提出想法、翻译文本、总结文章、撰写电子邮件和编写代码片段,可以与其他平台(如 Reddit、TikTok、Stack Overflow 和 Wikipedia)结合使用;

  • YouWrite 写作工具

YouWrite 是一款AI写作工具,旨在帮助作家、作者和博客作者克服写作障碍,提高写作技能。它可以帮助创建各种类型的书面内容,如电子邮件、博客文章、小说、散文和社交媒体帖子,YouWrite 使用 OpenAI 的 GPT 语言模型,根据文本类型、目标受众和所需音调等信息生成内容;

  • YouImagine 图像生成工具

YouImagine 通过AI生成图像,使用稳定扩散等技术,允许用户使用文本描述来生成AI生成的图像;

  • YouCode 代码生成工具

YouCode 类似于编程资源网站,如 Stack Overflow 和 GitHub,它为开发人员提供搜索功能,可以找到编码问题的解决方案、生成代码片段、访问相关文档和学术出版物等;

  • OnePlatform 开放平台

You.com 的开放搜索平台允许其他人创建定制应用程序,称为“搜索应用”,来定制搜索结果页面的体验;用户可以通过点赞或点踩影响应用程序的排名,并可以阻止某些应用程序出现在搜索结果中。该平台目前提供了 200 多个第一方应用程序,可以在搜索结果页面上获取摘要信息或完成任务。

对于开放平台,Socher 希望长远来说有更多优质的第三方贡献应用以及内容,如果用户从应用或者内容中提取了好的上下文,且 You 能够商业化,那么这部分利润也可以与应用或者内容提供商共享。

这也是 You 比较有意思的地方,它实际也是一个社交媒体搜索引擎,毕竟 Google 和Bing 都没有提供能够抓取世界上最受欢迎的社交网站的搜索类别,而You 融合了 TikTok、Twitter、Facebook、Instagram、Reddit、YouTube、Quora、Twitch 上的内容,你可能会找到更多最新信息。

图片

对于想要体验 You 的用户来说,你需要在 You.com 上创建账户,AI 会根据你的使用偏好改进搜索结果,将信息减少到最相关,而不同于传统的搜索引擎想要让你不断刷内容看广告,而 You 上的搜索结果会以“应用”的形式呈现,主打让用户可以一目了然的找到答案,或者直接从结果中完成下一步的操作。

图片

You.com 目前的收入主要来自三个方面:

  • 推广链接(Affiliate Links):You.com 通过引入用户点击特定链接并购买商品的方式获取收入,当用户通过 You.com 的搜索结果点击某个商品链接并最终购买该商品时,You.com 可以获得与该销售额相关的佣金。这种盈利模式是通过推动用户购买来赚取佣金的方式;

  • SaaS订阅:You.com 提供一个可选的月度订阅计划,用户可以选择支付订阅费用来获得其提供的写作工具,这意味着用户可以付费使用特定的写作工具,从而为公司带来稳定的收入来源;

  • 广告展示:You.com 通过在搜索结果页面上展示例如沃尔玛的广告,从中获取一部分广告费用作为收入,这种模式类似于在用户的购物搜索结果中显示广告,从中获得收益;

图片04如何看待应用层的含金量?

生成式 AI 的应用层含金量有多少?Socher 认为确实存在一些价值很薄的公司,几乎没有护城河,但实际上又有很多人并不了解建立一个可行的业务所需要的整体要素有哪些,某些情况下这容易被低估。

Socher 以 Instagram 举了个例子,Instagram 的护城河是什么?显然不是 Instagram 的 AI 和软件工程有多厉害,如果按今天生成式 AI 的逻辑去套,可能小扎连 LLMs 都没加上, 看起来只是一个简单的照片分享软件,然后带了一些滤镜功能,而实际上 Instagram 的护城河在 AI Infra 之外,它有强大的分发、合伙伙伴以及渠道等等。

Socher 认为 LLMs 就像你的大嘴巴叔叔,它记不得你所有的往事和细节,有时候还会夸大其词,所以你需要给“他”提供更客观、更新的事实,以便“他”对正确的事情进行推理,虽然 You 的搜索引擎用到了 Bing 的搜索结果,其它工具用到了 GPT 的 API,但说是完全套壳且价值很薄,Socher 认为这么想就太肤浅了

站在一家创业公司的角度,Socher 表示在 LLMs 出现以前,创业公司是无法构建一个可以理解多种不同语言的搜索引擎的,而现在基于市场上的 LLMs 已经可以快速构建 80% 的解决方案,然后在 MVP 的基础上添加更多的功能。

Socher 认为在某种程度上 LLMs 可以视为数据库,用哪种数据库都可以,这个不是最主要的,关键是如何使用数据库,如何调优,如何对训练数据微调,如何检索事实并对所有这些事进行合理的推理,如何多次思考得出结论,这些过程中的细节会越来越重要。

因此,在 Socher 看来,在不同模型之间切换,更重要的是如何整合多个不同的模型,比如有的基础模型适合处理自然语言表述,有的垂直模型适合财务预测,关键是如何让这些模型丝滑配合,在该问的场景给到用户匹配的结果,目前 You 也在用不同模型厂商提供的模型,但在生产中也会用自己的 LLMs,所以并没有哪家模型厂商占据主导地位。

对于 AGI 方面的看法,Socher 认为目前人们的担心过多了,从本质上讲,目前的 AI 仅限于如何预测下一个 token,但是一个智能体要被认为是智能,它需要有自己的目标,而我们今天能看到的“智能”,如果不能在一个人类社会框架之中,为企业带来效益,为政府带来更好的经济,那么就没有人会去想这些事情,就更没有人来让 AI 设定自己的目标

对于 AI 的未来,Socher 比较乐观,比较有趣的观点是 AI 对许多工作会有实质性的影响,随着更多的工作数字化和自动化,物理任务会越来越贵,比如建造房屋的木工成本会越来越高,这会成为新的瓶颈。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。