逼真!Midjourney画中国情侣画师演员模特全淘汰

2023年3月20日新智元

继GPT-4之后，Midjourney V5上线。网友纷纷试玩，画出了一对中国情侣，视觉炸裂，碾压人类画师。昨天，由Midjourney V5画的一对中国情侣在网上引起轩然大波。

许多人纷纷惊呼：人类画师别活了。

有人不相信这是Midjourney之作，也亲手体验了一把。在输入以下的promot后，画风瞬间惊艳了。

「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」

在GPT-4发布后，Midjourney也更新了V5，不仅绘图更逼真，而且prompt更灵敏。

最重要的是，一直被诟病的「AI 不会画手指」，Midjourney V5都拿捏了。

还有满屏的电影质感，除了OMG，还是OMG。

甚至有网友惊呼：模特不存在了！

效果炸裂，一大波设计师要失业了

从Midjourney的V1到V5，就可以看到AIGC这一年来的进化速度有多快。

最新V5版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示，以及更宽的动态范围……

激动的心，颤抖的手，国内网友纷纷上手实操了一波。

先上手的写真图：

虽然V5能够画出5根手指，但是在手指的细节上，还是差点意思。

比如试着让Midjourney V5给梵高的房间拍个照：

Midjourney V5在画中国美女的神态时，把控也是非常到位。

V5还能拿捏中国古典风格的美，画出了亭亭玉立的美人，细节颗粒度拉满。

还有网友用GPT-4+Midjourney V5创作了电影「杭州重生」，连豆瓣上介绍页都P出来了，看起来还真是那么回事儿。

在2022年12月，谭木匠举办了一场梳子比赛，人类设计师设计的梳子如下：

网友黄仲生用V5试了一波，并惊讶地发现「麻瓜」在AI面前完全不能打。

当别人反馈说上面的梳子太美，只能用来收藏，网友又整了一波日常可用的梳子。

还有给小朋友用的梳子

在国外，有网友直接用Midjourney V5画出了The Matrix的电影质感，让人瞬间怀疑这是不是电影里的截图。

并且献上了prompt:

「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」

还有网友尝试用「民宅火灾现场微笑女孩」经典meme让Midjourney创作「城堡火灾现场微笑洛基」。

来看下这炸裂的效果。

网友还开脑洞把「北京屋顶情侣」图加上洛基元素。

还有个搞笑版的，龙卷风来了，老太太骑着电驴在「狂飙」。

亚洲人的脸部特征也是做的非常逼真。

旅行博主都不用出门，直接在家调教Midjourney就可以了。

还有网友拿V4和V5做了对比图，通过输入一张图，还有文字提示，V4生成的图片在光照下物体阴影处理方面无法与V5相比。

再来一张眼睛特写图：

通过对V3、V4、V5这三个版本输入相同提示、相同设置，对其输出图片进行了对比。

在V5这个版本中，波光粼粼的水面，还有鱼儿在水中游的倒影，已经达到了以假乱真的程度。

但是如果没有提供有关环境的文本的提示，比起V4，V5默认生成了更加真的环境。

网友迫不及待地让V5来复刻一下王家卫「蓝莓之夜」的电影风格，发现V5在处理玻璃的反射方面做得更逼真了。

以及各种真假难辨的作品：

反派气质拉满的马斯克：

「猫戴VR」：

比V4强在哪？

最新升级的V5，相较于前一版有什么改进，一位研究员就他们之间的对比做了一张表：

1. 密铺（--tile argument）

在创建模式时使用。此前V3有这一参数，然而在V4中暂时终止使用，V5版本重新上线。

比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」，生成如下的图：

2. 长宽比（--ar argument ）

在V4中，只能有不高于1:2或不宽于2:1的自定义纵横比。而在V5中，你可以自定义比率与任何「宽度: 长度」比，如下是自定义比例的演示：

这一点升级，意味着什么？

现代电影中常见的最宽纵横比2.39:1都能够实现，你可以制作电影巨幕，人人都能成为导演！

V5生成2.4:1电影画幕

3. 图像权重可以自定义（ -- iw argument）

图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。

如下，在Midjourney V5中，输入一张图和一句文本提示。

通过自定义不同权重，2、1、0.5生成了不同的图片。

输入的提示如下：「/imagine https://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

4. less opinionated

「less opinionated」意味着，在V4中，只需要编写较少的文本提示，Midjourney便会输出更具创造性的图像。

但V5不是这样的，你可能需要输入更多的形容词，并给出更多的细节，比如风格或情绪，输出图像应该是什么样子。如果没有更多描述，Midjourney就会输出一个默认风格，比如「摄影」风格。

这一点升级，可以让人们通过文本提示能够更精准地把控Midjourney输出的内容。也意味着，在输入文本和输出图像之间有「更多的内聚力」。

以上4点升级是官方博客中提到，但是最让人意想不到的是Midjourney V5能够画出「5个手指和脚趾」！

另外，V5已经在更真实的图像/照片上进行了微调，因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。

考考眼力见

最后来一个测试题：

下面4张图，只有一张是真人，其他都是Midjourney V5画的，猜猜真人是哪一张？

参考资料：

https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295

这是Midjourney画的一对情侣，人类画师别活了。 pic.twitter.com/97DYvdshPb

— Michael Anti (@mranti) March 19, 2023