作品中的幽灵:AI可能终结艺术吗?之1.1

第一部分:滥觞:2022年的美学大爆炸

第1篇:引论:一种新图像的诞生

2022年,某种事物“断裂”了。

对于大多数人来说,这种感觉始于社交媒体上流传的奇怪图像:一个骑着马的宇航员(风格:逼真);一个看起来像伦勃朗遗失画作的快餐店场景。这些图像最初让人感到的是一种轻微的“错位感”(uncanny)——它们太连贯、太精美,不像是拼贴,但又隐约透露出非人的逻辑。

很快,工具的名字开始流传:DALL-E、Midjourney、Stable Diffusion。输入文本,获得图像。这场发端于2022年的图像生成浪潮,其意义(“滥觞”,即làn shāng,事物的源头)不仅是技术性的,它更像是一场关于“观看”和“创造”的哲学范式转移。

要理解这场“断裂”有多么深刻,我们必须短暂回溯到“前-2022时代”的幽灵。

“旧日幽灵”(上):AARON,自主的画家 

在AI艺术的“古典时代”,站着一位英国画家,哈罗德·科恩(Harold Cohen)。科恩在20世纪70年代是一个成功的抽象派画家,但他被一个问题所困扰:“如果一台机器能够创作艺术,那意味着什么?”。

科恩搬到加州,开始编写一个他持续开发了近40年的程序,并以《圣经》中摩西的代言人(“能言者”)之名,将其“祝圣”为“艾隆”(AARON)。科恩的目标不是一个“工具”,而是一个“伙伴”或“自主者”。他试图将自己作为画家的内部规则——关于构图、色彩、遮挡的知识——编码到AARON中。

AARON的美学是“自主的”。科恩的角色更像是一个哲学导师,他设定边界,而AARON在这个边界内“自主”创作。这是一种基于规则的、可解释的、长达数十年的“一人项目”。这是一场关于AI作为“艺术家”的哲学实验。

“旧日幽灵”(下):GANs,精明的伪造者 

2014年,伊恩·古德费洛(Ian Goodfellow)提出的“生成对抗网络”(Generative Adversarial Networks, GANs)开启了中期阶段。

如果说AARON是“哲学家”,那么GANs就是“博弈者”。

我们可以用一个简单的比喻来解释这个术语:想象一场由“艺术伪造者”(生成器网络)和“警察”(判别器网络)组成的二人游戏。

  1. “伪造者”(Generator)的任务是创造“假画”,试图欺骗“警察”。
  2. “警察”(Discriminator)的任务是审查所有画作,区分“真迹”(来自训练数据)和“伪造品”。

这场“零和博弈”的终点,是“伪造者”的技艺高超到“警察”已经无法分辨真伪。

这种“对抗性美学”的巅峰,体现在马里奥·克林格曼(Mario Klingemann)的《Memories of Passersby I》中。这些作品的美感,往往来自于GANs在“欺骗”过程中产生的“机器的”(uncanny)或“鬼魅般”的特质。在GANs时代,艺术家的角色(如克林格曼所说)是“策展”(curate)——他们是机器梦境的“策展人”,从机器的“幻觉”或“有趣的失败”中挑选出作品。

2022年的“断裂”:Diffusion,顺从的仆人 

2022年的浪潮彻底抛弃了AARON的“自主性”和GANs的“对抗性”。以Midjourney和Stable Diffusion为代表的扩散模型(Diffusion Models),其美学核心不再是“自主”或“欺骗”,而是“高保真”(high-fidelity)的“服从”(obedience)8。

我们同样可以用一个简单的比喻来解释“扩散模型”:

想象一下,你有一张清晰的照片(数据)。

  1. 正向过程(加噪):你一步步地给这张照片添加“噪点”(noise),直到它在几百步之后变成一片纯粹的、无意义的“雪花”。
  2. 反向过程(去噪):AI的任务是学习如何“逆转”这个过程。它学会了从一片纯粹的“雪花”(一个随机起点)开始,一步步地“雕刻”掉那些噪点,直到“还原”出一张清晰、连贯的图像。

这就是为什么扩散模型如此强大。它不是在“对抗”,而是在“精炼”。

这场“断裂”的哲学意义是深刻的。我们经历了一次“大倒退”或“大逆转”:

  • AARON时代:人类试图创造一个“自主的艺术家”8。
  • GANs时代:人类试图“策展机器的幻觉”。
  • Diffusion时代:人类要求机器“精确地服从我的意志”。

AI不再是“艺术家”或“伪造者”,它成了“仆人”。而这场转变之所以在2022年如此具有冲击力,不是因为一个作品或一种风格,而是因为它彻底改变了谁有权使用这个“仆人”。

生产模式的引爆:“古登堡时刻” 

AARON是科恩的“实验室模式”8。GANs艺术则需要深厚的计算机科学知识,仍是精英行为。而2022年的浪潮,由两种截然不同的模式引爆:平台(Midjourney)2和开源(Stable Diffusion)。

它将“技术图像”的生产门槛彻底摧毁了。在2022年之前,图像生产(无论是绘画、摄影还是CGI)都需要昂贵的工具、漫长的时间或专业的技能。而Stable Diffusion的开源与Midjourney的易用性2相结合,将这种生产能力交给了“任何会打字的人”。

这堪比“古登堡印刷术”或“摄影术”的时刻8。它瞬间导致了“美学产能”的绝对过剩。瓦尔特·本雅明(Walter Benjamin)在《机械复制时代的艺术作品》中对“灵韵”(Aura)消逝的论述,在2022年以一种指数级的、近乎粗暴的形式,得到了最彻底的印证。



留下评论