“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张

2024-02-10
核心竞争力是便宜但效果不错

图片

核心竞争力是便宜但效果不错

作者丨临风

编辑丨海腰

题图丨midjourney

澳大利亚AI初创公司Leonardo.ai因其集成了多项AI生图产品功能,并允许创作者每天免费使用,被用户称为“平替版Midjourney”和“简易版Stable Diffusion”。

据报道,该公司产品发布1年,用户突破700万人,平台共生成超过7亿张图像,并获得投资者青睐。

2023年12月7日,Leonardo.ai宣布获得3100万美元种子轮融资,投资方包括 Blackbird、Side Stage Ventures、Smash Capital、TIRTA Ventures、高榕资本和Samsung Next,截至目前共计融资2轮,金额3880万美元。

图片

2022年,JJ Fiasson、Jachin Bhasme、Sami Ede、Ethan Smith、Chris Gillis联合创立Leonardo.ai。Fiasson曾担任过两家公司的高管,做过托管服务、贷款抵押平台、Web3游戏公司,前一家公司经营12年后被Spirit Telecom收购。2021年,他创立了游戏公司Raini Studios,探索了2年但失败,过程中积累了生成式AI和开源工具的经验,因此转向AI工具平台。

图片

福布斯澳大利亚,左Jachin Bhasme、中JJ Fiasson、右Chris Gillis

据了解,Leonardo.ai当前主要针对游戏、广告、时尚和建筑行业的用户群,用户能在线创建和保存多个资产。Fiasson表示:“我们还将做更多工作,使AI创作在可控性和保真度方面更加强大,而且开箱即用。”

图片

“简易版Stable Diffusion”

当前,AI生图主流产品使用需跨过付费订阅或技术设备两个门槛,如Midjourney每个月10-60美元限次数生成,Stable Diffusion对电脑的显卡配置要求是专业级别的。

一部分“平替版”AI工具满足了部分用户既能每天免费试用,又不需要软件安装的轻量需求,其中就包括Leonardo.ai。

价格方面,Leonardo.ai较Midjourney优惠,价格在10-48美元区间,也提供给游客用户免费试用的机会,每日登录赠送150代币,约能满足5-8张AI生图需求。

图片

Leonardo.ai官网

功能方面,Leonardo.ai是基于Stable Diffusion开源模型建立,集成插件支持AI生图、改图、扩图和3D素材生成。因操作简单,界面友好,用户评价它是“简单版Stable Diffusion”,具有较高的性价比。

Leonardo.ai精选模型(Finetuned Models)一栏与CivitAI社区调性一致,有由社区创作者和平台官方提供的微调模型36类,风格包含梦幻、超现实、像素风、卡通等。

图片

Leonardo.ai精选模型界面

用户选用微调模型后进入编辑界面,选定跑图风格后用提示词生成图片。此外,Leonardo.ai上线新功能“Add elements”由 LoRA支持,允许用户选取多种元素调整权重后获得更好的风格效果。用户一次跑图可产生1-8张图片,自行调整图片大小、画质和背景无缝接图(Tiling)。

光是模版生图还不足以让Leonardo.ai短时间内吸引百万用户,它在提示词、动态调整、模型训练等方面集合了其他AI产品的实用优势。

用户可以像掷骰子一样随机生成提示词。风格模型里,用户可以让平台任意生成提示词,并在此基础上修改微调,也可以输入基础描述让系统生成2-8句提示词选用。获得图像后,用户可通过反向题词去掉图中内容。这一功能与Stable Diffusion WebUI的提示词插件相似。

图片图片

Leonardo.ai,左为提示词随机生成界面,右为Dynamic生成效果

除文字提示词外,Leonardo.ai也搬运了Stable Diffusion的图片提示功能,结合controlNET解析,用“pose to image”“edge to image”“depth to image”让图中角色与例图姿势、形状或深度保持一致。

图片图片

Discord社区Siloa教学,左为提示图,右为Leonardo.ai AR1.6模型生成

Leonardo.ai图像动态调整自由度高。用户获得生成图像后能继续微调,如图像放大增强、去除背景。另有两项实时修改功能,“实时生成”允许用户一边输入提示词,一边生成新图。“实时画布(Realtime Canvas)”可以让用户一边更改草图一边生成高质量渲染图。Magnific AI创始人Javi在试用时展示了Leonardo.ai实时将一张草图变为成品图。

此外,其运动视频(Motion)允许用户上传静态图像后生成炫酷的动态视频,需付费使用。

它另一项画布编辑(Canvas Editor)跟Runway补全画布内容功能相似,允许用户在范围内扩图。并且,画布中可以一键涂抹消除人物、背景,这类似Stable Diffusion的涂鸦画笔。

除了集合其他产品优势,Leonardo.ai也有独特优势——允许用户自行训练微调模型来生成定制风格图像。据Discord介绍,用户上传8-15张定向风格图片,可供AI学习。自训练模型将根据用户的关键提示词生成图像,训练时间约30分钟。Fiasson表示:“这个模型是私有模型,除非你想在平台公开它。你可以用大模型的语义理解继续训练,来贴合你想要的风格特征。”

当前,Leonardo.ai开放了图像生成、实时画布、画面编辑、运动镜头与实时编辑5项功能,还有一项3D纹理生成功能尚在Alpha阶段,每生成一组图片依据不同使用模型、功能花费4-20代币不等。

用户能在Leonardo.ai以相同的风格和功能集保存、编辑和构建多种素材,如风格图片、游戏资产和3D建模。并且,这些素材可以在平台反复使用,吸引众多游戏设计或视频制作的创作者。

图片

1年用户超700万

最初,Leonardo.ai专注于游戏素材的内容创建,后来才扩大到各个垂直领域。这是因为Fiasson在探索生成式AI时最先打造的是Web3游戏公司。

Fiasson于2013年本硕毕业于澳大利亚悉尼大学。他大学毕业后在悉尼创立过一家托管服务IT公司Cloud Business Technology,后被上市公司Spirit Telecom 收购。硕士毕业后他联合创立了Loan Base,开发智能技术改变房主申请抵押贷款的方式,据称,该公司帮助解决了近10亿澳元的贷款,在2021年被Exit Solutions Pty Ltd收购。

2015年6月,Google发布了建立在人工神经网络(Artificial Neural Network)算法基础上的Deep Dream,最初是源于工程师对视觉分类技术的研究,其生成图像往往由动物的脸、令人眩晕的色彩和错综复杂的建筑合成。后期,部分懂技术的艺术家利用Deep Dream创作效果出众的作品并用于展览,这表明人工智能网络可能创造独特价值的艺术作品——这吸引了Fiasson研究AI生图。

“无论个人还是专业用途,探索寻求创造力的用户群体正在迅速扩大,而人工智能的出现让你不需要非得去学习一门技术,这就是人工智能革命真正有趣的地方。”

Fiasson在播客中回忆,当时他没有艺术创作能力,只会简单的拍摄照片。但他用Deep Dream创作的作品迷幻有趣,还卖了个好价钱,他从中看到了AI生图的商业潜力。经过观察,他首先看中的是缺乏体验感的Web3游戏领域,于2021年创建Raini Studios游戏工作室深入探索,在其中担任游戏运营。

在Midjourney问世后,Fiasson带领团队开始尝试生成式AI。运营期间,他需要接触艺术内容创作,在保证游戏作品的交付时间与质量时遇到难题。

“我们看到了潜力,也看到了限制。”

游戏领域需统一风格与主视觉,而当时以文本提示词生成的图像不稳定,也不能批量生成满意作品。而且,游戏迭代时需要新的概念图和创意视觉,超出文本提示的控制,Fiasson第一次对AIGC的探索不算成功。

2022年8月,Fiasson在网络上研究谷歌AI绘画工具Disco Diffusion。艺术家Ethan Smith彼时在Latent Space发布的《潜在空间旅行者指南》一文被称为Disco Diffusion的经典教程,他在其中探索如何用人工智能构建一种艺术形式,Sami Ede助其将Disco Diffusion发散出MathRock Diffusion分支。Fiasson通过网络与他们搭线,发现对方有兴趣探索利用生成式AI专注于游戏素材创作,一拍即合。

图片

图源:Ethan Smith Latent Space

Fiasson叫上此前Loan Base的联合创始人Jachin Bhasme、Chris Gillis,原工作室的软件工程师Peter Runham,和Sami Ede、Ethan Smith一起创立了Leonardo.ai,旨在缩短AI内容创作与用户创造力之间的“距离”。

早期阶段,Leonardo.ai团队研究并建立了一个完整的二维创作流程,支持矢量图素材输出。Fiasson用视频展示在10分钟内完成了一款水果软糖元素的俄罗斯方块游戏所需的视觉素材,并用测试中的画布功能编辑了游戏背景。这一次,AI跑图的颜色和质感均保持一致。

2022年12月,他们的产品刚好与ChatGPT同时间推出,放出了2万个名额的抢先体验名单。2023年2月,几位YouTube博主做了推荐视频,播放量可观,尤其是标题带有“Midjourney VS leonardo.ai”、“Midjourney免费版”的视频超10万次播放。这让Leonardo.ai的流量滚雪球式增长。

“那时,我们每天大约有5-6万的日活用户。”

据Writerbuddy截至2023年8月的数据统计,9个月内Leonardo.ai平均每月流量增长220万,净增长1750万,排在全球访问量最大的AI工具TOP50第7名。同期,Midjourney流量下降870万。

图片

图源:writerbuddy

1年时间,他们的用户从初期数千名发展到超700万人。据similarweb,Leonardo.ai在2023年12月网站访问量为1516万次。

随着平台用例增多,Fiasson发现,“尽管我们的主推是游戏内容生产,但我们的AI工具也许适用于更广泛的领域。”他继续向平台集成其他AI产品功能,添加画布编辑器做绘制区域,增加文本提示生成3D纹理等。

图片

图源:Naver

“显然,我们在平台上利用了很多开源技术来包装应用,但我们也想构建自己的壁垒。”Fiasson认为,现有企业的产品面向大众化市场,缺乏用户对图像的可控性和可定制性,所以他在Leonardo.ai整合了自有模型和SDXL0.9、Stable Diffusion2.1、Dream ShaperV7等图像模型。据称,Leonardo.ai通过给予用户充分的创作控制权将其与Midjourney、Adobe Firefly、BlueWillow等软件区分开来。

此外,在建立团队方面,Fiasson从全世界搜集人才。“澳大利亚不像硅谷,没有那么多精巧的初创,所以我们的项目引起了悉尼多数AI人才的兴趣。”他也认为远程办公很有效。据悉,Leonardo.ai开发团队在澳大利亚,营销团队在中美洲,联合创始人兼主要工程师Ethan和Sami分别在美国佛罗里达和德国汉堡远程办公。

Fiasson是CEO也是产品负责人,他明白远程工作需要和设计师、工程师密切的线上联系以促进项目开发,但他强调Leonardo.ai不是老派的管理模式,不提倡加班也不过度管理员工,并以此氛围留住优秀人才。

图片

已生成超7亿张图像

自推出以来,Leonardo.ai平台内已生成超7亿张图像,并与娱乐、时装设计、广告、建筑等行业的创作者合作,声称目前正在被一些顶尖的 3A 游戏工作室以及 Razer Axon使用。

Fiasson表示:“Leonardo.ai的用途是无尽的,我们在设法减少构思和创作之间的摩擦,激发创造力。”

2023年4月,Leonardo.ai经历第一次大量用户增长后,Fiasson开始重视用户的入门教学流程。他认为,教用户如何与AI技术打交道才能让他们发掘平台的有更多可能性。

AI图像增强公司Magnific AI创始人Javi和Emilio是这家公司的天使投资人(详见:《2个人的AI公司,1个半月吸引用户40万,马斯克都来点赞》)。Javi表示:“他们不仅开发了一个非常好的用户界面,还聚集了一个庞大的社区。”

Discord是该公司业务增长的核心社区,其中约有18万活跃创作者,Leonardo.ai在内邀请多国创作者共创新手教程,分享使用素材和教学链接,吸引更多用户垂直入坑。

Leonardo.ai让用户通过社区教学熟悉平台不无道理,其整合的功能逐月增多,还在持续测试更新。

结合其社区公告来看,Leonardo.ai在2023年12月测试的Realtime Canva在次月正式推出,并更新上线了Motion这一重要功能,且在2024年1月又推出Realtime Gen即时生成影像。

图片

图源:Leonardo.ai

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。