ai绘画人工智能大有可为（让技术成为想象力的发动机）

车神 2023-06-05 06:48:59 214

ai绘画人工智能大有可为（让技术成为想象力的发动机）但在早期，AI绘图作品通常被认为是粗糙的、词不达意的。2012年，谷歌公司的吴恩达和Jef Dean联手训练了一个当时世界上最大的深度学习网络用来指导计算机画出猫脸图片。3天，1.6万个CPU，1000万个猫脸图片，最终生成了一个模糊的猫脸。正式开启了深度学习模型支持的AI绘画这个“全新”的研究方向。AI绘画的步履历程杰森·艾伦使用的绘图工具名为Midjourney，是一款文本生成图像程序，可根据用户的指令生成逼真的图像，每次创作耗时约一分钟。这仅仅是现今众多AI绘图工具中的其中一款。OpenAI公司的“DALL-E”、谷歌Brain部门的“Imagen”和“Parti”、微软的“NUWA-Infinity”等等AI绘图工具正在悄悄地重塑艺术和文化。

今年，由AI生成的画作《空间歌剧院（Théâtre D'opéra Spatial）》在美国科罗拉多州博览会的数字艺术”类别美术比赛中获得第一名。

据美国有线电视新闻网（CNN）报道，该画作的创作者是39岁的美国游戏设计师杰森·艾伦（Jason Allen）。他通过人工智能绘画工具，经过了近千次调整、耗费近三百个小时进行修改完善，绘成了这幅争议之作。

话题讨论，直至近日，热度依旧未减。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(1)

AI生成画作《空间歌剧院（Théâtre D'opéra Spatial）》图源：凤凰周刊

AI绘画的步履历程

杰森·艾伦使用的绘图工具名为Midjourney，是一款文本生成图像程序，可根据用户的指令生成逼真的图像，每次创作耗时约一分钟。

这仅仅是现今众多AI绘图工具中的其中一款。OpenAI公司的“DALL-E”、谷歌Brain部门的“Imagen”和“Parti”、微软的“NUWA-Infinity”等等AI绘图工具正在悄悄地重塑艺术和文化。

2012年，谷歌公司的吴恩达和Jef Dean联手训练了一个当时世界上最大的深度学习网络用来指导计算机画出猫脸图片。3天，1.6万个CPU，1000万个猫脸图片，最终生成了一个模糊的猫脸。正式开启了深度学习模型支持的AI绘画这个“全新”的研究方向。

但在早期，AI绘图作品通常被认为是粗糙的、词不达意的。

2015年，学界提出了扩散模型（Diffusion model），为AI绘图提供了一个新的思路：

AI可以通过对其他画面的深度学习，通过“去噪”的方式作画。简单来说，是通过AI程序，反复对图片进行降噪处理，最终将一张完全是噪声的图片还原成清晰的图片。

2016年，生成对抗网络GAN（Generative Adversarial Nets）走红，AI生成真正开始展现出艺术价值和媲美人类的水平。这一时期，诞生了大量“以假乱真”的艺术作品。2018年10月佳士得以43.25万美元的价格拍卖了由AI创作的《爱德蒙·贝拉米肖像》，成为人类历史上首次AI艺术品拍卖。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(2)

AI生成画作《爱德蒙·贝拉米肖像》图源：数字叙事

2022年开始，人们开始更加直观地感受到AI绘图技术浪潮带来的影响。AI绘图从拍卖行、收藏家们关注的小众艺术，逐渐走入大众创作的视野。

2月初，AI图像生成程序Disco Diffuion崭露头角。它是第一个基于CLIP Diffusion模型的实用化AI绘画产品，可以根据描述场景的关键词渲染出对应的图像。但技术仍不成熟，它无法刻画细节，渲染时长也以小时计算。

4月著名人工智能团队OpenAI发布了新模型DALL·E2代，该名称来源于著名画家达利（Dalí）和机器人总动员（Wall-E）。自此，AI绘画开始拥有了一个重要的能力即按照文字输入提示来进行创作。

而7月，Stable Diffusion问世。它成功解决了细节及效率问题，通过算法迭代将AI绘图的精细度提升到了艺术品级别，并将生产效率提升到了秒级，创作所需的设备门槛也被拉到了民用水准。

9月，百度公司也发布了多项AIGC(人工智能生成内容)应用内容生产领域的技术和产品。依托飞桨文心大模型、飞桨文心一格、图文转视频等技术，创作者可以通过“AI文案助理”、“AI插画助理”、“AI视频制作助理”三大功能，实现“一个人成为一支队伍”的转变。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(3)

百度“创作者AI助理团” 图源：中国经济网

AI绘画的众说纷纭

《空间歌剧院》获奖后，越来越多的设计者开始关注并使用AI绘画，舆论热潮也随之而来。

一方面，AI作画延展了艺术的边界，人们不必经过专业训练便可以绘制图画作品，具备了一定的实用性和商用潜力。

比如，日常生产生活中存在大量视觉和设计工作。在这些领域中，AI已经能够扮演日渐进步的“作图助理”角色。AI工具的使用可以减少重复性或风险性工作，还可以极大提升设计者的工作效率。即使是普通人，也能低成本甚至零成本地实现脑洞，实现“创作自由”。从这个角度看，AI绘画工具的研发是一个向大众“赋权”的过程。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(4)

四川大学计算机学院（软件学院）数据智能与计算艺术实验室 AI绘画作品图源：科技日报

另一方面，产业化和大众化的AI绘画，面临着部分传统从业者和艺术爱好者的批判和价值怀疑。

使用AI绘制的作品参与比赛，是否对其他参赛选手不公平？AI画作能否代替人类画师的情感表达？如何保护那些被迫被大数据分析的画作及其原创者的作品版权？如何看待衍生的技术伦理争议？用户增多、门槛下降，如何约束创作者的使用行为？

问题涌现，众说纷纭。

《空间歌剧院》的获奖，引起了众多参赛艺术家和艺术爱好者的口诛笔伐。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(5)

“我们正在眼睁睁地看着艺术的死亡在我们眼前展开。” 图源社交平台

对此，创作者杰森·艾伦表示自己并没有违反任何规则，提交作品时也标注出了所使用的AI绘画平台。比赛组织者也认同这种说法。他们认为在该类别比赛中，“技术作为创意或演示过程的一部分”可以参与作品创作，数字滤镜、颜色处理工具和“图像重组”都是允许的。

在这个背景下，AI绘画取代传统画师的焦虑感在业内传播开来。

AI绘图本身依赖数据与算法的强大优势，目前看来，其底层逻辑仍旧在于学习与临摹。

因此，很多人表示“画面很美，但我们不接受它是艺术。”在创作过程中，AI需要大量绘画作品的图像数据的“投食”，并通过不断地深度学习将其“消化”，再通过理解关键词的方式进行创作输出。

对此，中山大学传播与设计学院教授冯原表示，当下和未来的AI肯定能够模仿人类的绘画，甚至在技术难度上超过人类的绘画。但如果AI没有情感，那么它始终会在情感的表达上输给人类。AI创造作品的风格，以人类的心灵为模板，最终被人类心灵来评价。

四川大学计算机学院（软件学院、智能科学与技术学院）数据智能与计算艺术实验室李茂副教授也提供了一种看待AI绘画的思路：AI作画不可能完全取代传统绘画，但可以为艺术提供更多可能性，而其本身也或可成为一种独立艺术体系。

爱尔兰数字艺术家大卫·奥瑞利（David Oreilly）则一直对OpenAI的DALL-E模型持批评态度。他表示，利用这些以过去作品为基础的工具来创作能赚钱的新作品的想法是错误的。

AI作画依赖于大数据的抓取，而这种抓取行为是否构成版权侵犯目前尚未定论。同时，对于AI创作的约束主要依靠开源社区的知识产权规范和协议。相关法律法规在全球范围内都还在空白和讨论阶段，目前只有个案作为参考。

ai绘画人工智能大有可为（让技术成为想象力的发动机）(6)

Stable Diffusion网站的服务条款图源：Stable Diffusion官网

因此，无论是创作是否具有灵魂，还是更实际的侵权问题，AI作画领域仍在政策、伦理方面存在着诸多亟待完善的空间。

AI作画风头正盛，AI视频也如约而至。

2022年9月底，Meta公司公布了名为“Make-A-Video”的AI视频制作工具，可以生成高质量的短视频。谷歌紧随其后，推出了两款AI生成视频的工具：“Imagen Video”和“Phenaki”。前者倾向于打造视频质量，后者倾向于视频的逻辑与时长。

“科技进步从来不是洪水猛兽。”

面对争议，Midjourney的创始人David Holz这样说：“当计算机比99%的人类更擅长视觉想象力时，这意味着什么？这并不意味着我们将停止想象。我们认为技术是想象力的发动机。”

参考｜科技日报、中国青年报、光明网、中国经济网、凤凰周刊、澎湃新闻、腾讯科技、北京商报等

整理｜穆子叶

来源：世界互联网大会公众号

网站首页

返回栏目

ai绘画人工智能大有可为（让技术成为想象力的发动机）

猜您喜欢：

相关文章