不断重复ai绘画是怎么做的(一个蹲点3个月的人有话说)
不断重复ai绘画是怎么做的(一个蹲点3个月的人有话说)1. 从AI绘画技术发展趋势看,AI绘画现在只是刚刚开启了一条门缝,从“早期采用”正开始进入到“跨越鸿沟到早期多数”的阶段(杰弗里.摩尔的书中的观点)最后,也是我这几个月基本天天泡在各种AI绘画社群里的大胆猜测。并且还是从自动生成的可以无限量的图片“作品”中挑选自己喜欢和可用的。我蹲的群里,凌晨两三点如果不看消息,几十分钟后的消息更新都能超过99条,狂热可见一般。当然,我确实也观察到了还是有一部分人一直是怀疑乃至抵制AI绘画的态度,每天也都能看到大大小小N场文字辩论。基本的争论点主要集中在:AI生成的图像是否有版权?版权归属?AI绘画是否是抄袭?AI绘画的工作机制是否就是各种拼接等几个方面。往更深层次的说,SD等这些新工具的出现,可算是美术与图片领域一种新的生产力,还记得政治和历史课上老师们就告诉过我们,新生产力的出现必然伴随新生产关系的变革,这种变革也必然会带来一些冲击,远一点的就有英国
目前在美术与绘画领域相关圈子内大火的人工智能绘画Stable
Diffusion已经开源两三个月了,我很有幸也参与到人类历史上这次在艺术和图片生成领域新生产力工具突然出现的进程中,最近小有感受,就从我观察到的众人不同态度上,我理解的技术发展趋势上,以及接下来可能带来更广的影响上做个分享。
首先,我先交代下我的背景:非科班出身,非美术领域,非AI算法领域,担任过上市集团子公司的总经理,在AI绘画领域充其量也就是一个稍微有点动手能力的爱好者,所以不知道能否算第三者视角。
在众人态度上,根据我这几个月混迹各个社群的发现看(有二次元的QQ群,贴吧,Reddit讨论专题,Twitter乃至Discord相关频道等等),国内国外大体上都有这么2类人存在:积极拥抱和尝试的狂热者,鄙夷和怀疑的反对者。狂热支持者,我的感受是在二次元领域最多,这里面的人,或有对于一些原作品产出速度、角色设定等不能讨好自己想法的,或有对于无法满足自己特殊“XP”(即性癖)的,也有认为自己就是个斗不过头部画师和AI的流水线画手的从业者。无论是何出发点,这群以前不敢画或者画不好的人,现在突然有了SD(大家对stable diffusion的简称)这只天降“神笔”的支持,自己无论阳光或阴暗的想法都可以在屏幕前被具象化呈现,而这仅需要给一段“prompt”(给AI的提示语)就可以得到自己想要什么样的角色、场景、姿势乃至穿着打扮,
并且还是从自动生成的可以无限量的图片“作品”中挑选自己喜欢和可用的。我蹲的群里,凌晨两三点如果不看消息,几十分钟后的消息更新都能超过99条,狂热可见一般。
当然,我确实也观察到了还是有一部分人一直是怀疑乃至抵制AI绘画的态度,每天也都能看到大大小小N场文字辩论。基本的争论点主要集中在:AI生成的图像是否有版权?版权归属?AI绘画是否是抄袭?AI绘画的工作机制是否就是各种拼接等几个方面。往更深层次的说,SD等这些新工具的出现,可算是美术与图片领域一种新的生产力,还记得政治和历史课上老师们就告诉过我们,新生产力的出现必然伴随新生产关系的变革,这种变革也必然会带来一些冲击,远一点的就有英国纺织工人打砸蒸汽纺织机,画家们抵制第一批印刷机出现,近一点的则有全球出租车司机抵制Uber,收费站收费员抵制自动收费等。但也是这些历史告诉我们,趋势性的东西是挡不住的。反而我还是看到了一些干CG图像、游戏原画的人已经从本地部署webUI如何打开CMD窗口开始学起,到产出自己所需的图片再加工的例子,把AI真正工具化为己协力。
另外,从目前AI绘画发展的趋势上,想都不用想,一定是开始有巨头和资本的介入了。虽然在很多方面我们不喜欢巨头和资本,但是坦白讲,这种需要巨量训练数据集(SD依赖的训练集LAION-5B共80个T数据,内含58.5亿个图文组合的集合)和巨量硬件运算资源(4000块A100 Ezra-1 GPU)的项目,一般人或者创业公司还真玩不起(SD项目背后既有知名大学,也有2个商业公司参与,其中一个现在估值10亿美金,首轮融资就跨入独角兽行列)。此外,对于Stable Diffusion这类项目的的盈利模式我认为都还处于探索的模式,比如问世比SD更早的Disco Diffusion、Midjourney、DALL-E 2等类似AI-图像生成项目背后的公司,大都还只是用一些类似“算力豆”、“魔兽点卡”的模式盈利,商业想象的范围远不到可触摸的天花板,可能连脚脖子都还没摸到,内部的人应该也是有很多想法在如何商业化。
最后,也是我这几个月基本天天泡在各种AI绘画社群里的大胆猜测。
1. 从AI绘画技术发展趋势看,AI绘画现在只是刚刚开启了一条门缝,从“早期采用”正开始进入到“跨越鸿沟到早期多数”的阶段(杰弗里.摩尔的书中的观点)
3. 接下来,我还会继续深度参与和观察AI生成视频的领域,毕竟视频本质就是一张张图片的有序组成。国外如谷歌的Imagen Video、Phenaki、Meta公司的AI video等等技术正式发布已经箭在弦上,不出意外也就是这几个月会发生的事情,届时,你我有幸又将见证一次AI的进化。这对当下势头火热的短视频赛道、以及电影工业、广告和传媒行业不知道又将带来一场怎样的挑战。