AI绘画对象Midjourney首创人：人工智能像水_人工智能_图像

2024-09-25 10:30:25 AI简讯

·“汽车比人的速率快，但并不虞味着我们不再行走。
远间隔移动大量物体时，我们须要发动机，无论是飞机、船只还是汽车。
我们认为AI绘画技能是想象力的发动机。
”

AI绘画对象Midjourney首创人：人工智能像水_人工智能_图像 AI简讯

·“人们完备误解了人工智能是什么。
他们把它看作是一只老虎。
老虎很危险，可能会吃掉我，是一个对手。
水也有危险，你会淹去世在水中，但你也可以在里面拍浮，可以制造船只，可以用水坝发电。
水是危险的，但它也是文明的驱动力。
”

AI绘画会让艺术家们集体失落业吗？

Midjourney是一款AI绘画工具，只要输入你想到的笔墨，就能通过人工智能产出相对应的图片，耗时只有大约一分钟。
自今年5月推出beta版后，这款搭载在Discord社区上的工具迅速成为谈论焦点。

今年4月，其余一款大热的AI绘画工具DALL-E升级到第二代，并在7月对100万个用户开放测试，只管要收费，还是吸引了大量用户涌入。

目前，AI天生的艺术品正悄悄开始重塑文化。
过去几年里，机器学习系统从文本提示天生图像的能力，在质量、准确性和表达能力方面都得到了显著提高。
这些画作在互联网上流传，给人们带来了一类别致感。
艺术家和设计师也正在把这些软件集成到事情流程中，很快，由人工智能天生和增强的艺术将无处不在。

但是，这些工具从实验室转移到日常用户手中，在创造新的视觉表达措辞的同时，也很可能带来新的问题，比如版权轇轕、输出错误信息的潜在危险，都必须引起把稳。

近日，科技媒体The Verge专访了Midjourney的创始人David Holz。
这家公司目前只有约10个员工，但年夜志勃勃。
Holz说：人工智能增强下创造力的呈现，仍旧只是冰山一角。

以下为采访内容，有删减。

问：你有什么背景？是怎么进入这个领域的？什么是Midjourney——一家公司，一个社区？如何描述它？

答：我2011年旁边搬到旧金山，创办了名为Leap Motion的科技公司，运营12年后离开，再创办了Midjourney。

我们认为，（AI绘画工具）不是关于艺术或深度假造（deepfake）的问题，而是，我们如何扩大人类物种的想象力？当打算机比99%的人类更善于视觉想象力时，这意味着什么？这并不虞味着我们将停滞想象。
汽车比人的速率快，但并不虞味着我们不再行走。
远间隔移动大量物体时，我们须要发动机，无论是飞机、船只还是汽车。
我们认为这项技能是想象力的发动机。
因此，这是一件非常积极和人性化的事情。

问：许多实验室和公司正在开拓类似的技能，将文本转化为图像。
谷歌有Imagen，OpenAI有DALL-E，还有一些较小的项目，如Craiyon。
这种技能从何而来，你以为它未来会走向何处？Midjourney的愿景与这个领域的其他人有什么不同？

答：（人工智能带来图像天生工具）取得了两个打破。
一个是理解措辞，另一个是创建图像的能力，结合后可以通过理解措辞来创建图像。
这些工具将比人类更善于制作图像，而且速率会非常快，在未来一两年内将能够实时制作内容：每秒30帧，高分辨率。
会很贵，但是是可能实现的。
然后在10年后，将能买到带有巨型人工智能处理器的Xbox，所有游戏都像梦一样。

我们去年9月开始测试原始技能，很快创造，大多数人不知道他们想要什么。
你说：“这里有一台机器，你可以用它画任何东西，你想要什么？”他们说：“狗”。
你说：“真的吗？”然后他们说：“粉赤色的狗”。
以是你给他们一张狗的图片，他们就说“好吧”，然后去做别的事情。

然而，如果你把他们放在一个小组里，他们会说“狗”，其他人会说“太空狗”，还有人会说“阿兹特克太空狗”，然后溘然之间，人们明白了这些可能性，你正在创造一种被增强的想象力，一个可以用这种新能力学习和娱乐的环境。
因此，我们创造人们真的喜好一起想象，以是我们让（Midjourney）更具社交性。
我们有一个巨大的Discord社区，大约有100万人在这些共享空间中共同想象。

问：你认为这种人类的集体与机器的集体是平行的吗？可以作为这些人工智能系统的某种制衡？

答：不存在机器的集体。
每次你哀求人工智能作画时，它都不记得或知道它做过的任何东西。
它没故意志，没有目标，没故意图，没有讲故事的能力。
所有的自我、意志和故事都是我们人类的。
它就像一个发动机，发动机不会自己去哪，但人会去。

社区内有一百万人在制作图像，你必须支付额外用度才能退出社区——如果这么做，解释你是某种类型的商业用户。
以是每个人都在相互撕裂，产生新的美学。
险些就像审美加速主义。
它们不是人工智能美学，而是新的、有趣的人类美学，我认为它们会溢出到真实天下。

一个由百万人组成的社区，他们的想象力被人工智能增强了。
（图 The Verge / Midjourneynone）

问：这种开放性能确保安全吗？由于有很多谈论，说人工智能图像天生器被用来天生潜在的有害内容，无论是令人讨厌的图像——血腥和暴力——还是缺点信息。
你如何阻挡这种情形发生？

答：当你在某人制作的所有图像上写上他的名字时，他们在利用方面就更加有规范了。
这很有帮助。

每当我们看到时都会禁止。
如果必须的话，会禁言。

问：那真实的面孔呢，由于这是制造缺点信息的另一个载体。
模型是否天生逼真的面孔？

答：会产生名人面孔这类东西。
但我们一样平常不会，我们有默认的风格和外不雅观，既具有艺术性又都雅。
如果花100个小时考试测验，也容许以找到一些得当的单词组合，让它看起来非常逼真，但你必须非常努力，让它看起来像一张照片。
就我个人而言，我认为天下不须要更多的深度假造，但它确实须要更多俏丽的东西，以是我们专注于让统统看起来俏丽和具有艺术性。

苏联时期的宣扬海报警告泼皮人工智能的危险。
（图 The Verge / Midjourneynone）

问：你从哪里得到模型中的演习数据？

答：和其他人一样，我们的演习数据险些来自同一个地方——差不多便是互联网。
险些每个大型人工智能模型都会提取它所能得到的所有数据和所有文本，以及能够提取的所有图像。

以是，我们最近的更新做了很大改进，你可能认为我们是通过（在演习数据中）放入大量绘画来做到的，但并没有。
我们只是利用了用户作品的数据。

问：演习花了多少钱？

答：我不能评论辩论详细本钱，但我可以说个大概。
演习图像模型每次大概在5万美元旁边。
一次考试测验无法精确理解，以是必须考试测验3次、10次或者20次。
很贵，频年夜多数大学所能支付得要多，但也不至于贵到10亿美元或须要购买一台超级打算机。

我相信培训和运营的本钱都会低落。
但运行本钱实际上相称高。
每张图片都费钱。
每个图像都是在2万美元的做事器上天生的，我们必须按分钟租用这些做事器。

问：说到演习数据，一个有争议的方面是所有权问题。
美国现行法律规定，不能对人工智能天生的艺术作品拥有版权，但我们不太清楚是否可以对演习数据中利用的图像拥有版权。
艺术家和设计师努力创造一种特定的风格，但如果他们的作品现在可以被人工智能机器人复制，会发生什么？

答：我们的社区中确实有很多艺术家，他们对这个工具普遍持积极态度，认为这将使他们更有效率，并改进他们的生活。
我们常常和他们交谈，问：“你还好吗？你对此觉得好吗？”

许多利用该平台的有名艺术家都在说同样的话，真的很故意思。
他们说：“我以为Midjourney是一个艺术学生，它有自己的风格，当你用我的名字来创作图像时，就像哀求艺术学生创作一些受我艺术启示的东西。
一样平常来说，作为一名艺术家，我希望人们从我创作的东西中得到灵感。
”

问：您在对话中多次提到Midjourney的默认艺术风格，每个人工智能图像天生器都有自己的偏好和表达办法。
你如何描述Midjourney的独特风格，你是如何故意识地发展它的？

答：我们考试测验了很多东西，每次考试测验新事物时，都会渲染出一千张图像。
我们绝对不肯望它看起来像照片。
完美的照片让我有点不舒畅，只管我知道你有情由想要更逼真的东西。

我认为这种风格会有点异想天开、抽象和奇特，它方向于以你可能不会哀求的办法进行领悟，以一种令人惊异和富有美感的办法。
它喜好利用很多蓝色和橙色，有一些最喜好的颜色和最喜好的面孔。
如果你给它一个非常模糊的指示，它会用它喜好的办法来创作。
以是，我们不知道为什么会发生这种情形，但它喜好画一张特殊的女人脸——我们不知道它来自哪里，来自我们的12个演习数据集之一——但人们只是称它为Miss Journey。
还有一个家伙的脸，有点方正，带着压迫感，也涌现了一段韶光，但他还没有名字。

Journey小姐的油画肖像。
（图 The Verge / Midjourneynone）

问：人工智能领域的一些人方向于以伟大的术语来思考这项技能，他们将其与神比较，与有感知的人生比较。
你以为怎么样？

答：一段韶光以来，我一贯在试图弄清楚什么是Midjourney的人工智能图像天生器？你可以说它就像一个想象力的发动机，但也有别的东西。
这就像拍照的发明吗？拍照被发明时，绘画就变得奇怪了，由于任何人都可以拍一张脸的照片，那么我为什么要画画呢？

是这样的吗？不，不是那样的。
觉得就像发动机的发明：就像你每分钟都在创作一堆图像，你沿着想象的道路飞来飞去，觉得很好。
但是，如果你再向未来迈出一步，你不是一次创作4张图像，而是1000或10000张，那就不同了。
有一天，我做到了：我在几分钟内制作了4万张图像，溘然之间，我面前有如此巨大的广度——所有这些不同的生物和环境——我花了四个小时才看完统统，在这个过程中，我觉得自己彷佛要淹去世了。
我以为我是个小孩子，看着拍浮池的深处，就像知道自己不会拍浮，对水的深度有这种觉得。
溘然间，（Midjourney）觉得不像发动机，而是像一股年夜水。
我花了几周来消化，我想了想，然后我意识到，你知道吗？这实际上是水。

现在，人们完备误解了人工智能是什么。
他们把它看作是一只老虎。
老虎很危险，可能会吃掉我，是一个对手。
水也有危险，你会淹去世在水中，但流水的危险与老虎的危险大不相同。
水是危险的，是的，但你也可以在里面拍浮，你可以制造船只，可以用水坝发电。
水是危险的，但它也是文明的驱动力，作为知道如何与水一起生活和共事的人，我们相处得更好。
这是一个机会。
它没故意志，没有恶意，是的，你可能淹去世在里面，但这并不虞味着我们该当禁止水。
当你创造一个新的水源时，这真的是一件好事。

问：Midjourney是新的水源吗？

答：我以为我们作为一个物种，共同创造了一种新的水源，Midjourney试图弄清楚的是，好吧，我们如何让人们利用它？我们如何教人们拍浮？如何制造船只？如何建造水坝？如何从害怕溺水的人变成将来在海水中冲浪的孩子？我们正在制造冲浪板，而不是制造水。

将人工智能描述成水的插图：一种可以用于善或恶的强大力量。
（图 The Verge / Midjourneynone）

来源：https://www.theverge.com/2022/8/2/23287173/ai-image-generation-art-midjourney-multiverse-interview-david-holz

任务编辑：张静

校正：施鋆