人工智能绘画:让每个人都成为艺术家

2023-02-07
人工智能发展之快,超过了我们的想象。

编者按:本文作者系无锡市大数据管理局局长胡逸,文章首发于澎湃新闻,创业邦经作者授权转载。

在过去的2022年,人工智能发展之快,有些超过了我们的想象。他们从处理信息过渡到了创造内容,这些内容和真人创造一样真实,难辨真伪。他们能完成撰写邮件、翻译、甚至写代码等任务(详见拙作《未来可期|ChatGPT到底厉害在哪?百科全书版聊天机器人已诞生》)。除了文字能力,他们的绘画能力也大幅提高,通过简单的效果预设,就可以生成一幅叹为观止的大师范绘画作品。

我想请各位读者,先看几幅我借助人工智能创作的画作。我分别使用了百度的AI艺术和创意辅助平台“文心一格”和西湖大学深度学习实验室研制的AI模型“盗梦师”。两者都是由用户输入一段简单的文字,即可快速获取智能生成的AI画作。操作非常简单,文本输入——>风格选择——>艺术家选择——>上传参考图——>尺寸选择——>分辨率选择——>数量选择,正所谓“AI一下,妙笔生画”。

第一幅画的主题词——城市:无锡;场景:太湖;时间:五百年后;画面:城市天际线。

人工智能模型“盗梦师”创作的绘画作品——五百年后无锡太湖的天际线。

人工智能平台“文心一格”绘制的五百年后无锡太湖的天际线。第二幅画的主题词——城市:无锡;场景:城市运行管理中心;画面:从看见到预见;智慧城市。

人工智能模型“盗梦师”创作的绘画作品——无锡城市运行管理中心。

人工智能平台“文心一格”绘制无锡城市运行管理中心。当我体验完AI绘画之后,我发现如今的人工智能生成内容(AIGC),已经进化到相当智能的程度,不再是此前简单的风格化滤镜。和Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比(有关概念可以参考本人拙文《未来可期|五个问答助你初步了解Web3.0》),AIGC正在成为新一种内容生产方式。AIGC,即AI Generate Content,是一种利用人工智能技术自动生成内容的技术。它可以根据一定的规则和模型,自动生成文本、图像、音频等多种类型的内容。伴随着人工智能技术特别是自然语言处理技术的不断发展,近几年AIGC在质量、多样性、准确性和用户体验等方面都得到了飞速发展。越来越多的软件代码、数据分析报告、产品设计图、甚至音乐歌曲都由人工智能产出,AIGC已经从理解内容,走向了自动生成内容,并在新闻报道、广告创意、影视剧本创作等领域探索规模应用。

高德纳(Gartner)公司将AIGC列为2022年五大影响力技术之一,并预测到2025年,生成性AI所创造的数据可占到所有已生产数据的10%,也就是说,你每看十个新闻、图片或短视频,其中有一个就来自AI。根据《Generative AI:A Creative New World》的分析,AIGC有潜力产生数万亿美元的经济价值。

2023年1月10日,百度CEO李彦宏在百度2022 Create大会上,发出这样的断言,“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”

为此,你可以发现,这个春节,百度公司除了有类似“集五福”的“集好运”常规集卡活动外,还推出了一系列AIGC(人工智能自动生成内容)创新互动玩法,比如AI画头像”一起变兔兔”活动。你可以在百度APP自拍或者上传一张个人头像照片,人工智能将会捕捉你的五官比例和微表情,自动“等比”生成专属兔子版头像。很多用户都纷纷上传自己的兔子头像,让大家评论和本人的相似度有几分。

我们曾经以为,AI不会做有创意的工作,因为创意是人类最不可以取代的特质之一。在2018年,李开复讲述了人工智能有两件事情不能做:一件是有创意的事情,第二件是有温度的事情。有创意的事情,包括科学家,作家,艺术家,CEO等,在他看来,人工智能不擅长提出新概念。

不过,OpenAI创始人山姆·阿尔特曼(Sam Altma)提出了相反的论断:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。”

我问了ChatGPT同样的一个问题:人工智能不会做有创意的工作,你对此有什么观点?请列举六条。

他的回答是:

1.AI可以在许多领域实现创意,例如音乐制作、艺术创作和广告制作等。

2.AI可以通过学习和模仿人类创意来产生新的创意。

3.AI可以通过生成对抗网络(GANs)等技术来创造新的图像、音频和文本等内容。

4.AI可以通过计算机视觉和自然语言处理等技术来理解和分析人类创意,从而产生新的灵感。

5.AI可以通过机器学习算法来优化和升级现有的产品和服务。

6.AI可以通过分析大量的数据来发现新的市场机会和商业模式。

ChatGPT关于“人工智能不会做有创意的工作”的见解。所以,你千万不要想当然,人工智能只能从事低水平的重复性劳动。2021年10月9日,由德克·卡夫腾(Dirk Kaftan)担任指挥的波恩贝多芬管弦乐团,首次演奏贝多芬与人工智能共同谱写的第十交响曲。这部曲子本是贝多芬的遗作,1827年贝多芬逝世时,第十交响曲只有几张手稿留存,部分是简短未竟片段。但是,人工智能在学习了贝多芬过往所有的作曲数据后,续写了这部曲子。读到这里,你也许会好奇,那么作为普通人的我,如何借助人工智画出一幅好画?

我先给大家说一则新闻吧。2022年8月,有一幅名叫《太空歌剧院》的画作,战胜了诸多竞争对手,拿到了美国科罗拉多州博览会美术竞赛一等奖。作者杰森·艾伦(Jason Allen)却说,自己是个游戏设计师,这幅画并不是他亲手画的,而是用AI绘画工具Midjourney生成的。杰森的办法是:他先是想到了一个有创意的提示词,然后花费了80个小时,900多次迭代,来慢慢调整这个提示文本,比如添加“堂皇”“奢华”这样的关键词,来优化整幅画的基调和氛围。

得知这个消息后,那些在真实世界创作的艺术家们忿忿不平。我们画画,是在一步步调色,机器人作画,却是在一步步调关键词。比赛主办方最后维持原判,理由是杰森本来参加的就是数字艺术类别比赛,比赛规则并没有限制使用人工智能工具,而他在提交作品时也表明使用了Midjourney工具。最重要的一点,创作灵感属于杰森,只是他选用的素材不是传统的画笔和颜料,而是庞大的图像数据库。

《太空歌剧院(Théâtre D’opéra Spatial)》,作者:Jason M. Allen via Midjourney杰森后来在Midjourney讨论区中表示:“与其讨厌科技或应用它的人,我们不如承认它是一种强大的工具,并长久地运用它,这样我们才能向前迈进,而不是为此怨恨。”对啊,要借助人工智能画出一幅佳作,依然需要人类对艺术作品的感知力、鉴赏力、想象力和创造力。首先,你要了解有哪些画派,以及他们的风格,比如印象派重展现光影的改变,野兽派笔法率直奔放,新艺术的风格偏有活力、波浪形、流动的线条现实主义等等。

其次,你要知道关键词。这好比使用百度搜索,有的人可以快速精准搜索到自己想要的内容,有的人却只搜到一堆没用信息。如果只是靠常人都知晓的朴素语言,往往会生成不伦不类的学生级别的习作。使用好的提示语,才能让人工智能生成更符合要求、更赏心悦目的作品。

第三,你要熟悉人工智能画画的基本原理。例如,高手就会每个关键词加引号、加冒号、加减数字来让AI更准确地理解问题。更高阶的技术人员会使用生成对抗网络(GAN),来训练一个生成器生成新的图像,通过与一个鉴别器的博弈来提高生成图像的质量。

所以,现在多了一项新生意——提示语工程(prompt engineering),这也成了新的创业热点。美国旧金山初创公司PromptBase就推出了售价1.99美元一条提示语的服务,主要用于DALL-E2,ChatGPTGPT-3等人工智能模型。用户在该平台买卖提示词(Prompt),PromptBase则从卖家处抽成 20%。平台上已上架不少提示词,内容范围包括新闻标题、运动队标志、卡通T恤设计、现代黑白版公司标识等等。

PromptBase平台上开展的提示词买卖业务。如果你觉得这些都太麻烦,万能的淘宝可以更加直接而粗暴地解决问题,你只需要像我一样,在淘宝输入“Midjourney AI绘画代做”,找到合适的买家,他们会直接把图做好了发给你,30元不到。

淘宝卖家的AI绘画代做业务。曾经有一个高赞回答,显示出了人类对人工智能绘画的担忧:“我们正在目睹艺术的消亡。”可是,当我们每个人都可以善用技术,都成为艺术家的时候,为什么不可以说:我们正在目睹新一轮艺术的繁荣。如果它真的是一幅人见人爱,广为流传的作品,即使它是AIGC作品,又有何妨?后记:本篇文章的部分图片和文字,由我和AI共同创作完成。

(作者胡逸为无锡市大数据管理局局长)

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。