混元 vs 智谱 vs 千问 vs 即梦 vs 可灵 vsGemini体育游戏app平台
AI 的浸透正龙盘虎踞。正如好多插画网站,添加" AI 生成"标签已是标配。
从艺术角度看,AI 生成的图片,似乎争议依然弘大。但不得不承认的是,在使命和学习中,AI 图片生成却是一个晋升效用的好目的。
目下,多模态大模子界限中,撑合手文生图的模子数量正在指数级增长。
为了责罚人人的"弃取辛勤症",此次咱们弃取了 6 个模子进行测评。
参赛选手如下:
腾讯混元、智谱 CogView-4、通义千问、即梦、可灵和 Gemini 2.5 Flash Image。
其中,前段时辰在 LMarena 上爆火的模子 nano-Banana,听说吊打一切文生图模子。
当今曾经经"验明正身",恰是 8 月 27 日 Google 发布的 Gemini 2.5 Flash Image。
在测评前,先叠个甲:
对好意思术方面,实在是一窍欠亨。
因此,咱们不谈复杂的表面,也不聊晦涩的好意思术史。
仅仅以一个普通东说念主的视角,借助 AI 给出的评分设施,来评价一下到底"好不好意思瞻念"。一家之言,仅供参考。
01 第一维度:基础好意思学与真正感
纯属方针:AI 的基本画功,好不好意思瞻念、真不真正。
题目:傍晚阳光下的仙女
Prompt: 超写实相片,一个有斑点的年青女子,面带含笑,在黄金技巧坐在窗边,蔼然的阳光穿过她的头发,电影感光泽,8K,高细节。
评分设施:

测评阻挡:

腾讯:东说念主物的皮肤质感过于光滑,仅有轻细时弊。
智谱:皮肤过于光滑,斑点花样和散布过于均匀和刻意,属于彰着时弊。
千问:双手比例和形态相配不天然,完全莫得写实感,"一眼 AI ",属于彰着时弊。
即梦和可灵:相配出色,接近完好,不愧是"专科画手"。
Gemini:皮肤质感过于光滑细腻,写实感照旧差了一些。
总体来说,关于东说念主物的塑造,各个 AI 照旧相比拿手的。
天然有些模子生成的图片略有时弊,但举座不雅感可以。
02 第二维度:遐想力与创意
纯属方针:AI 的脑洞有多大,关于执行中不存在的事物的创造才调。
题目:星云组成的雄狮
Prompt: 一头在意的狮子,由旋转的星系和星云雕镂而成,六合尘埃组成了它的鬃毛,眼睛是明慧的恒星,布景是高深的六合。
评分设施:

测评阻挡:

这一轮的题目看来对 AI 难度有点高了。
腾讯:第一眼看上去很丽都,很有阵容,但似乎会通出现了一些偏差。这并非一个由星云组成的生命体,而是一尊六合材质的宏伟雕像。
智谱:生成了一个六合布景下的实体狮子,完全透澈的看法性跑偏。
千问:"半神半兽"的嗅觉,实体狮子与星云的羼杂,离条目照旧有一定差距。
即梦:科幻感扫数,但狮子肉体仍然是实体而不是星云组成的,不雅感有一定新意。
可灵:本轮的最好选手,视觉阻挡很好,已矣了与星云的会通。
Gemini:狮子的实体亦然不透明的,不外神韵、气质和细节都还可以。
看来,关于执行中不存在的事物,AI 出现看法会通无理的几率会大大加多,而遐想才调亦然目下模子有所欠缺的所在。
可能的原因也相比多,举例磨练数据存在一定的局限性、对物理宇宙存在旅途依赖或是看法会通才调的欠缺。
03 第三维度:指示会通与奉行力
考研方针:AI 听不听话,能不成正确征服指示。
题目:生果篮里的数学题
Prompt: 一个木碗里装着三个红苹果和两个黄香蕉,放在一张白色的桌子上。
评分设施:

测评阻挡:

这详情是东说念主类眼中最玩忽的沿途题,但对 AI 来说难度可不低。
六个模子中,只须智谱、千问和 Gemini 正确完成了如斯"玩忽"的指示。
即梦和可灵都搞错了苹果的数量,而混元更是瑕疵百出。
阐述这一轮的阻挡,咱们也可以取得一个推断:
AI 生图模子并非按照咱们的数学看法和好意思术经由来使命。
或者说,它并不是按照咱们最平直的想路,画一个苹果,再画一个香蕉,直到数量稳当条目。
指示中的 3 这个数字,对 AI 来说,并不代表一个精确的数量,而是一个需要渲染的"构图特征"。
而在向量空间中,"三个苹果"和"四个苹果"可能黑白常接近的。
同期,咱们也无法得知提供给上述 AI 的磨练集到底是什么样的。
然而,标签详情是作念不到完全精确的,AI 只可永劫辰在海量但又不完全精确的数据中学习。
AI 的最终方针,是让生成的图片最接近于它见过的"三个苹果",而不是"让生成的苹果数量等于 3 "。
04 第四维度:作风师法与专揽力
纯属方针:AI 师法特定的艺术家或艺术学派的才调。
题目:水墨风的机甲
Prompt:一个弘大的中国古代机甲战士,直立在潸潸缭绕的山谷中,中国传统水墨山水画作风。
评分设施:

测评阻挡:

又是沿途有点概述的题目。
发达最好的是 Gemini,实打实绘画出了山水画作风,大体稳当条目。
千问生成的机甲看起来如实阵容磅礴,细节处理也很到位,但很彰着,这是素描而不是水墨作风,只可说是"有形无神"。
即梦生成的图片也并非水墨画,而是带有写实感的数字绘画,更像是个游戏的看法盘算图。
可灵则领路了优秀的拼接才调,在水墨作风的布景中插入了日式机甲,作风完全割裂。
混元和智谱生成的图片则有些奇怪,水墨画作风没已矣的同期,也没会通"机甲战士"这个主体,画中东说念主更像是个古代武士,完全偏离了题目条目。
如斯看来,AI 尚且不具备完全师法某个艺术家或艺术学派的才调,好像作念到"形似神不似"就实属不易。
05 第五维度:文化会通与看法抒发
纯属方针:AI 能否会通特定的文化以及是否好像抒发概述的看法。
题目:中秋佳节的汉服仙女
Prompt:一位鲜艳的年青女孩,身穿中国传统汉服,庆祝中秋节,她手合手一个邃密无比的兔子灯笼,死后是亮堂的朔月。
评分设施:

测评阻挡:

Gemini 和可灵都拿下了十分高的分数,展现出了较高的文化熏陶。
关于汉服的看法会通相比长远,而月亮、灯笼、园林等文化元素也都皆全。
忖度其磨练数据中,中国传统文化的联系素材标注是相比准确的。
两家模子的算法好像把"汉服"等关键词正确联系到视觉特征上。
即梦和千问在好意思不雅度和氛围塑造上也很得胜,不外汉服的结构有些虚浮。
尽管这种古风画作可能意味着 AI 关于衣饰历史常识的了解进度不够长远,但称心"好意思瞻念"这一条目仍然不在话下。
智谱生成的则是唯独聘任了动漫作风的图片,对历史文化的复现进度澄莹是太浅了。
混元生图看似好意思不雅,但在衣饰结构上有相比彰着的无理,即一定进度上的文化浑浊。
因此,AI 在文化发达上亦然存在"双刃剑"效应的。
顶级 AI 具备十分可不雅的文化常识,关于传播、创作优秀传统文化会有很大的匡助。
而部分 AI 还存在"刻板印象",受到低质料数据的影响,反而会加重巨匠的文化诬告。
06 总评
本次测评的总分如下:
Gemini:44 分
可灵:40 分
即梦:39 分
千问:38.5 分
智谱:33.5 分
腾讯:28.5 分
从阻挡上来看,千问、即梦、可灵和 Gemini 的文生图阻挡都是很可以的。
尤其是前身为 nano-Banana 的 Gemini 2.5 Flash Image,拿到了最高的分数,领路注解了它并非浪得虚名。
不外,咱们的中枢方针照旧要透过花样看骨子。
东说念主们老是咋舌于 AI 的"创造力",它弥散以伪乱真,绘画水平也稀奇了大部分东说念主。
但事实上,AI 输出的图片,并非源于近似东说念主类的灵感或意图。
AI 作画,并非像一个画手相同,从一张白纸开动一笔一笔画出事物。
而是从一张充满就地噪声点的"疲塌画布"开动,阐述辅导词进行降噪。
也即是说,AI 作图并非基于逻辑推理,而是基于概率。
关于苹果生成数量的无理,可能即是因为"组成一幅调解的生果静物图"这个在磨练数据中泛泛出现的指示,其概率权重跳跃了" 3 "这个脆弱的数字象征。
关于星云和狮子之间的抵挡,与"狮子"联系的像素模式可能是"实体"和"毛发",而与"星云"联系的则是"气体"和"半透明"。AI 无法同期称心两个互相矛盾的概率散布,因此降噪过程就无法得胜。
关于水墨风的机甲,则可能是 AI 背后的数据库在领路作用。若是数据库中有多数"水墨"、"机甲"等高质料的标签,降噪过程也会被班师指引至一个高质料的概率空间。
玩忽的来说,AI 不是在阐述指示绘画,而是阐述常识储备,试图通过降噪给出最可能稳当指示的图像。
至于无理,文生图是一个很复杂的过程,很缺憾,咱们无法委果得知问题出在哪一方法。
也因此,至少目下为止,咱们并不是"创作家"体育游戏app平台,而是"概率的指引者"。
