探索
现在人工智能艺术无处不在甚至专家也不知道这意味着什么

上个月,科罗拉多州博览会上的一项艺术大奖被授予了一件由人工智能系统生成的作品——评委们并不知道。

社交媒体上也出现了由人工智能从文字描述中生成的怪异图像的爆炸式增长,比如“厨房长凳上一条面包的侧面融合了一只柴犬的脸,数字艺术”。

或者是“约翰内斯·维米尔《戴珍珠耳环的女孩》风格的海獭”:

约翰内斯·维米尔(Johannes Vermeer)的《戴珍珠耳环的女孩》(Girl with Pearl耳环)风格的海獭。“OpenAI

你可能想知道这是怎么回事。作为一个研究人类和人工智能之间创造性合作的人,我可以告诉你,在头条新闻和表情包的背后,一场根本性的革命正在进行——具有深远的社会、艺术、经济和技术影响。

我们是怎么走到这一步的

你可以说这场革命始于2020年6月,当时一家名为OpenAI的公司通过GPT-3的创建实现了人工智能领域的重大突破,GPT-3是一种能够以比之前更复杂的方式处理和生成语言的系统。你可以和它就任何话题进行对话,让它写一篇研究文章或一个故事,总结文本,写一个笑话,几乎做任何你能想到的语言任务。

2021年,GPT-3的一些开发人员将他们的手转向图像。他们用数十亿对图像和文字描述训练了一个模型,然后用它从新的描述中生成新的图像。他们称这个系统为dal - e,并在2022年7月发布了一个大大改进的新版本,dal - e 2。

和GPT-3一样,DALL-E 2也是一个重大突破。它可以从自由形式的文本输入中生成非常详细的图像,包括关于风格和其他抽象概念的信息。

例如,在这里我要求它说明短语“Mind in Bloom”结合萨尔瓦多Dalí,亨利·马蒂斯和布雷特·怀特利的风格。

DALL-E从舞会上生成的图像 pt“思想盛开”结合了萨尔瓦多·达利、亨利·马蒂斯和布雷特·怀特利的风格。

竞争对手登场

自从DALL-E 2推出以来,出现了一些竞争对手。一个是免费使用但质量较低的DALL-E Mini(独立开发,现在更名为Craiyon),它是一个流行的表情包内容来源。

克雷扬在舞会上拍的照片 pt“阳光明媚的日子里,达斯·维德在外面骑着三轮车”。Craiyon

大约在同一时间,一家名为Midjourney的小公司发布了一款功能更接近DALL-E 2的型号。尽管与《DALL-E 2》相比,《中途之旅》的功能仍略显逊色,但它已经为自己提供了有趣的艺术探索。詹森·艾伦正是在《中游》中创作了这幅赢得科罗拉多州立艺术博览会竞赛的作品。

谷歌也有一个名为Imagen的文本到图像模型,据说它产生的结果比dal - e和其他模型好得多。然而,Imagen还没有被广泛使用,因此很难评估谷歌的声明。

Imagen文本到图像模型生成的图像,以及生成这些图像的文本。谷歌/画像

2022年7月,OpenAI开始利用对dal - e的兴趣,宣布将以付费使用的方式向100万用户提供访问权限。

然而,在2022年8月,一个新的竞争者出现了:稳定扩散。

Stable Diffusion不仅在功能上可以与DALL-E 2相匹敌,更重要的是它是开源的。任何人都可以按照自己的喜好使用、调整和调整代码。

在Stable Diffusion发布后的几周里,人们已经把代码推到了极限。

举个例子:人们很快意识到,因为视频是一系列图像,他们可以调整Stable Diffusion的代码,从文本生成视频。

另一个使用Stable Diffusion代码构建的有趣工具是Diffuse the Rest,它可以让你画一个简单的草图,提供文本提示,并从中生成图像。在下面的视频中,我从一个非常粗略的草图生成了一张花的详细照片。

在下面的一个更复杂的例子中,我开始构建一个软件,让你用你的身体画画,然后使用稳定扩散把它变成一幅画或照片。

创造力的终结?

用几行文字和点击一个按钮就可以生成任何类型的视觉内容、图像或视频,这意味着什么?如果您可以用GPT-3生成电影脚本,用DALL-E 2生成电影动画呢?

展望未来,当社交媒体算法不仅为你的feed策划内容,而且生成内容时,这将意味着什么?若干年后,这一趋势与元宇宙相遇,虚拟现实世界为你实时生成,那又会怎样呢?

这些都是需要考虑的重要问题。

一些人推测,在短期内,这意味着人类的创造力和艺术将受到严重威胁。

也许在一个任何人都可以生成任何图像的世界里,我们今天所知道的平面设计师将是多余的。然而,历史表明,人类的创造力总能找到出路。电子合成器并没有扼杀音乐,摄影也没有扼杀绘画。相反,它们催生了新的艺术形式。

我相信在人工智能时代也会发生类似的事情。人们正在尝试将像稳定扩散这样的模型作为他们创作过程的一部分。

或者使用DALL-E 2生成时装设计原型:

一种新的艺术家类型甚至正在出现,有些人称之为“提示学”或“提示工程”。艺术不在于手工制作像素,而在于制作提示计算机生成图像的文字:一种人工智能耳语。

与人工智能

人工智能技术的影响将是多维度的:我们不能在一个轴上把它们划分为好或坏。

新的艺术形式将出现,创造性表达的新途径也将出现。然而,我认为这也有风险。

我们生活在一个注意力经济时代,它的繁荣依赖于从用户那里榨取屏幕时间;在一个自动化驱动企业利润但不一定会提高工资、艺术被商品化为内容的经济中;在一个越来越难以区分真假的社会背景下;社会技术结构太容易编码我们训练的AI模型中的偏见。在这种情况下,人工智能很容易造成伤害。

我们如何引导这些新的人工智能技术朝着造福人类的方向发展?我认为实现这一目标的方法之一是设计能够与人类合作而不是取代人类的人工智能。

点击分享到

热门推荐