把OpenAI“断掉的大腿”给接上

2023-12-09
打造类脑AI芯片,能效比英伟达GPU高10000倍。

图片

作者丨李霜霜

编辑丨海腰

图源丨Rain.ai官网

11月30日,经CFIUS(美国外国投资委员会)审查后,美国政府以“国家安全”为由迫使沙特基金出售其在Rain.ai的股份。

这家沙特阿美风投公司Prosperity7 Ventures曾领投过Rain.ai最大一笔2500万美元的A轮融资。据PitchBook数据,Prosperity7 将股份出售给了硅谷风投Grep VC。两家机构都对媒体报道不予置评。

OpenAI联合创始人Sam Altman和百度风投也是该公司的投资者。

据睿兽分析,Rain.ai成立于2017年,是一家AI芯片公司。最新一轮融资发生在2023年8月,由Toy Ventures投资210万美元。目前,Rain.ai共筹集资金3210万美元,估值约为9000万美元。

图片

投资者包括OpenAI的硬件专家Scott Gray、刚出演宫斗大戏的Sam Altman、热衷投资AI初创公司的Daniel Gross、Tinder创始人Justin Mateen、Web2Asia创始人George Godula、Y Combinator、Soma Capital、Buckley Ventures、FundersClub、Liquid 2 Ventures、Pegasus Tech Ventures、Loup Ventures等个人和机构。

Rain.ai核心产品为基于Neuromorphic(神经拟态)的“类脑”AI芯片。公司称,NPU会为AI开发者提供潜在的100倍计算能力,训练方面提供10000倍的能效,其AI加速器在速度、功耗、面积、精度和成本之间实现了创纪录的平衡。目前,Rain.ai团队约40人,包含芯片架构和设计、深度学习算法、半导体、编译器等方面的专家。

创始人Gordon Wilson在领英中介绍Rain.ai是构建人工大脑和软硬件集成平台,以大幅降低人工智能成本,他们在新型硬件基板和人工智能训练算法等方面展开研究,缩小人工智能和生物智能之间的成本差距。“我们构建的硬件出色的原因之一是与同类AI硬件相比,我们大大降低了功耗。”

图片比GPU能效高10000倍

20世纪50年代,已有美国工程师做出第一个用于解决实际问题的ANN(人工神经网络)。他们研究模拟生物神经网络机构和功能的计算模型,用于机器学习和人工智能任务,然而却难有庞大的数据团队解决棘手的计算问题。

也曾有惠普、英特尔这样的大厂尝试过神经网络处理器。2016年,英特尔收购Nervana Systems开发Nervana NNP-T训练芯片,因过程长、成本高,不到3年放弃。(详见《离开英特尔二次创业,两年后公司卖了13亿美元》

图片

Nervana NNP-T

深度学习的研究沉淀多年,直到近年大模型架构、大语言模型的兴起,研究者们再次陷入困境之中——对于当前计算机数字系统来说,运行和训练ChatGPT这类大模型费时、费电。

一批人认为,虽然现有的一些商业芯片使用模拟内存处理器技术,但消耗大量功率。从工程角度来讲,广泛用于AI训练的反向传播算法与大模型的并行性并不兼容,反而潜在限制了硬件设计,这表明我们需要一种截然不同的深度网络学习方法。

所以这种情况下,就到了Rain.ai的用武之地。它的目标是构建一个完整的虚拟芯片,通过全新硬件和全新算法来解决这些问题。其slogan是:“重新定义人工智能计算的极限。”

Rain .ai的核心产品是基于神经拟态(Neuromorphic)技术的类脑芯片。据资料,神经拟态是类脑计算的分支。Rain.ai推出的神经形态处理器(NPU)是旨在模仿人脑结构和功能的计算机芯片。据称,这是世界上第一个端到端模拟、可训练的人工智能电路。NPU将用于和模拟AI训练和推理的新算法(平衡算法)、新的模拟芯片架构结合。模拟算法的实施使NPU能效比GPU高10000倍。

图片

原理上,跟数字系统用“0”和“1”运行不同,Rain.ai芯片通过随机的memristor(惠普实验室约10年前设计)3D阵列,作为模仿大脑神经连接的“人工突触”。Rain.ai联合创始人Gordon Wilson解释,这让处理层和记忆层在同一个地方进行,能更快、更节能地运行人工智能算法。

“我们在全栈做出原则性设计决策,降低神经网络与其在芯片中的实践之间的抽象类接口差距。”Rain.ai在官网方法中提供了变革性的协同设计解决方案。

开创数字内存计算(D-IMC)范例,改进AI处理、数据存储、数据移动。其内核可拓展至大批量生产,并支持训练和推理。当与Rain.ai专有量化算法结合使用时,加速器将保持FP32(单精度浮点数,适用于大多数科学计算和通用计算任务)的精度。另外,Rain.ai开发了D-IMC和RISC-V的专有互联,任何操作者都能高效、自由地重新编程。

据资料,其初始芯片架构是基于于谷歌、高通和其他科技公司支持的传统的 RISC-V开源架构,用于远离数据中心的边缘设备,如手机、无人机、汽车和机器人等。

“不仅仅是芯片,他们还想控制生态系统,他们想有半导体访问权限、自己的算法和自己的训练推理与微调过程”,一位程序员指出。Rain.ai团队正在为数字内存计算块和软件栈提供IP许可机会,专为超低延迟和高效能设备端的AI负载定制,包括头显、智能手表、智能汽车、智能手柄等,适用于定制SoC的IP现已上市。

不仅如此,Rain.ai结合硬件设计微调算法(如LORA),以促进高效实时训练,能在实际部署环境中将AI准确性提高至少10%。

归根结底,Rain.ai试图打造拥有图形内存的AI加速芯片,但架构完全不同,并也有自己的“CUDA”以便在硬件中无缝运行,而且不像现有体系那样耗电。官网显示,这类芯片即将推出。

图片2年后发货

Rain.ai在招聘信息中写道:我们最终能够将ChatGPT大小的模型放入略缩图大小的芯片中。

Rain.ai的目标和前CEO兼创始人Gordon Wilson的迫切一脉相承,“现下,Rain.ai可能是世界上最野心勃勃的AI芯片公司。”

图片

Rain.ai前CEO兼创始人Gordon Wilson 图源Rain.ai官网

Gordon出生于一个热爱科幻小说的企业家家庭,日常不乏天马行空的想象,他将童年时期对科幻的迷恋转化为创业热情。25岁的Gordon就读于佛罗里达大学,在那里他遇到了同校学长Jack Kendall和大学教授Juan Claudio Nino,三个人都没有开公司的经验,但都对人工智能有着浓厚的兴趣。

大学时,Gordon在大学的DSI(多学科社区)担任主席,举办Python、机器学习等主题的研讨会,在线上并对其中的项目进行大量辅导,从那时起他意识到自己有通过数字化工作赚钱的能力。这期间,他也看到了神经网络从2012年起正经历飞速发展。

“大脑是怎么做好优化的,它们使用了怎样的算法?这个问题就连Yoshua Bengio(AI领域顶尖专家,图灵奖得主)都很感兴趣”,Jack说,在受到Alex Net启发后,他看到了现代神经网络的物理限制,转而将精力集中在了硬件部分。

经年,Jack在佛罗里达大学的Nino研究组发明了使用同轴纳米导线连接人工芯片神经元的方法,这也为Rain.ai打下了基础。在这个小组,Gordon和Jack结识,通过Jack的跨学科思维,他们发现可以同时从神经学、物理学、化学等多角度发掘人工智能的潜力。

2017年6月,三人共同创建了 Rain Neuromorphics持续探索,由Gordon担任CEO运筹帷幄,Jack担任CTO搭建框架,Juan则担任科学顾问。2018年,为获取运营资金,他们参与了Y Combinator S18,在8月成功获得包含YC、Liquid 2、Soma Capital在内的500万美元种子轮资金,值得注意的是,Scott Gray和Sam Altman便是在此轮下注。当时,Altman还是YC的CEO。

图片

OpenAI和Rain.ai的缘分不止于此,据Gordon访谈透露,Rain.ai在2020年5月时就已经在和OpenAI团队一起开发算法。OpenAI的技术人员Scott是其展示在官网上的顾问之一,此外,半导体领域知名华人大牛Jackson Hu、内存计算领域专家Arijit Raychowdhury也在其列。Gordon在InsightFinder的播客中提到,他们与深度学习之父Yoshua Bengio一起开发和研究神经拟态技术。

“阻止我们大规模部署神经网络的关键限制因素之一就是它的硬件成本”,Gordon在公司运行的早年间就看到了将英伟达GPU用于运行神经网络时需大量能耗和时间,“所以我们试图让我们的硬件更接近人类大脑,做了很多疯狂的事情,例如使用斯坦福大学开发的纳米线研究”。

他们也非一帆风顺,在闪存方面碰壁后改变了硬件方向,确保基本层的耐用性、切换设备的速度及操作功耗。Jack表示:“模拟真正大脑的神经脑回路,运用天然的矩阵反转功能,获得更快的二阶计算。”2020年7月,Rain.ai团队和加拿大研究机构Mila合作开展的一项研究证明,完全使用模拟硬件训练神经网络是可行的。

随后Rain.ai在2021年10月推出过一款演示芯片,能以极低的功耗运作神经网络的训练和推理。2022年11月,Jack同德克萨斯农工大学教授Su-in Yi一同在Nature子刊Nature Electronics上发表论文表示Rain.ai所采用的memristor阵列可以切实提高能源效率。

Rain.ai的进度可以说是“一年一个重大更新”。据投资者文件,Rain.ai最快本月(12月)“流片”测试,2024年10月提供第一批产品,2025年提供商业发货,但可能会因为Rain.ai这次投资风波加大芯片上市挑战,延迟兑现预付订单的诺言。

Rain.ai曾向投资者表示,公司已与谷歌、甲骨文、Meta和亚马逊进行了商议。在多轮资金筹集后,Rain.ai的设想从一个实验室项目正逐步走向前景广阔、规模化应用的商用之路。

图片或能给OpenAI降本增效

最近,Gordon辞去了Rain.ai的首席执行官职务,退居幕后当执行顾问。目前担任公司CEO的是此前的首席运营官William Passo,William是哈佛法学院博士,同时也是Gordon杜克大学的校友,此前是Freshfields Bruckhaus Deringer的律师。

图片

William Passo 图源Rain.ai官网

William Passo在博客中表示,英伟达的GPU是人工智能创新的关键“瓶颈”,其垄断也给初创企业创造了难以逾越的进入门槛。

据5月闭门会议的相关消息,即使是OpenAI也严重受限于GPU,并延误了其许多短期计划,如微调API目前还受到GPU可用性的制约,运行和管理微调非常耗费计算资源。ChatGPT的用户也能明显感觉到GPT4相比GPT3.5更“懒”,这也许与算力节省有关。

有知情人士称,近几月Altman与中东投资者讨论筹集资金创办新芯片公司的事宜,以帮助OpenAI和其他公司实现多元化。

毕竟Sam Altman自己也认为:“AI的进展速度可能取决于新的芯片设计和供应链。”话说回来,OpenAI也向Rain.ai下了5100万美元订单,凸显了其愿意花钱来确保开创性人工智能项目的芯片供应。如果Rain.ai芯片成功应用,便能为OpenAI、Anthropic等AI公司提供“低成本,高效能”的硬件,把OpenAI因为高成本而断掉的“一条大腿”给接上。

Jack认为,现在大家都关注到了大模型的局限性,正是更接近AGI的好时候。“芯片性能提高促使人们开始研究更高效的架构、算法。这致使一个研究峰值出现,这个高峰期也许五年,也许是十年。新的硬件也会出现,那时,我们将看到与人类同等水平的AI。”

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。