CUE一下两个相对冷门的选手。
一个是Reve Image
它可能是目前在摄影美学上表现最好的AI生图。
哪怕是对比Midjourney,我都认为在人文摄影模拟上Reve会更好。
MJ艺术性有余,但少了些摄影味儿,GPT-4o等等出图就显得更生硬了。
更多Reve实出图片可以看我之前发过的多图合集:
另一个是字节最近新发布的即梦3.0
在美工类设计,尤其是中文文字生成上,十分强势。
并且免费额度高,且下放到了豆包。
我之前发过GPT-4o文生图生成小红书封面,也适用于即梦/豆包:
上面这套方案接收到了一些朋友的反馈:
①ChatGPT订阅有门槛,而且有点小贵,有没有更快捷更便宜甚至免费的方案? ②我已经有一张参考图了,能不能参考我喜欢的这种图片来生成新图片? ③我想单独修改画面上的某些元素或文字,有没有办法让我更方便地进行精细化修改和调整?
所以今天又做了一套基于即梦3.0/豆包的新的表格方案,正好给大家展示一下:
(下面我发的图都是无PS的即梦直出)
使用它+即梦,可以简单地进行无指向性参考出图:
也可以模仿例图的创意,根据这张图:
生成这张图:
还可以大幅度魔改,根据这张图:
做出这张图:
使用方法
准备工作
使用我的模板创建表格后,请先进行两项准备工作。
①启用工作流和自动化
之前小红书封面的表格有一些朋友卡住,无法正常生成Prompt,就是因为没有开启工作流。
飞书多维表格在使用模板创建新表格后,所有启用的工作流和自动化会自动转化为关闭状态,需要手动开启。
工作流操作十分简单,如下图所示,开启工作流开关即可。
跟前面小红书封面的表格不同的是,这次我们有一个按钮自动化,它不是工作流,所以不在左侧列表,而是需要在自动化中心开启,如下图所示。
②申请和替换API
自定义AI的字段捷径只支持直接填写API KEY,再加上确实有些学习比较慢的朋友还是需要些时间来掌握AI字段捷径的使用,所以我在模板里保留了自己的API KEY的接入点,它暂时依旧是生效的。但为了防止被滥用,我对这个接入点的并发性能和额度做了一些限制;而且随着模板使用人数越来越多,tokens消耗也在变大,目前每天小几十万的tokens没有多少成本,但如果用的人更多的话,我也不保证这个API KEY一直可以生效。所以还是建议能够自己配置API的朋友换成自己的API,一方面是性能上不会有限制,另一方面也把额度留给在配置上确实有困难的朋友。注册火山方舟后,平台会直接赠送一些免费额度。
直接双击字段名称就可以进行修改,获取API的方法可以看我这篇文章中火山方舟的部分:
另外,如果你反推图片比较多,当多维表格赠送的图片理解模型调用次数用完后,也是需要你
到火山开通视觉模型并绑定账号的。
按下图操作,可以找到官方教程。
正式使用
打开表格后可以看到有这些字段:
①请在原海报的位置粘贴或直接上传你要进行参考的海报或图片。
②AI字段捷径会自动运作,生成反推Prompt,并提取出其中的文字文案和主体形象。
③在修改区手动调整文案的文字,并提出对画面细节和风格的修改要求。
④点击开始修改按钮,右侧修改字段中会自动生成可用来进行生图的Prompt。
⑤最后,复制这个Prompt到即梦/豆包平台进行生图。这两个平台每天都有数十次的免费生图次数。
我在模板中留了15个全流程的实操案例,你也可以参考它们进行操作。
案例演示
接下来我们跑几个实际的案例。
演示案例一
例如,这是一张优酸乳的原版海报。
我们把它上传到「原海报」的位置。
然后AI字段捷径自动运行,提取出其中的文案:
这些文案被提取出来后,会自动写入到黄色「修改文案」部分。 然后我们可以在「修改文案」部分直接对文案进行编辑。 例如,我不喜欢海报上这个「NEW」的标签,我就在这段文案中,把「NEW」删掉。
同时,海报中的主体形象也被标识了出来,有:
这些都是画面中比重较高,也是我们可以进行修改的元素。 比如,我想对女孩手里的乳汽产品进行强调,我只要「易拉罐」版本的。
点击「开始修改」按钮,我们就得到了生图Prompt:
复制到即梦中,生成图片:
「NEW」的标签被成功去掉,女孩手里的饮料也改成了易拉罐版本。
还没完。 对比原来的海报发现,原海报女孩身后的绿色图案其实是一个数字「0」,在这张海报中,它应该是呼应0糖0脂的。 我们使用的豆包图片理解模型没有成功理解到这一点。但我觉得这个数字「0」十分有创意,我想保留它。
怎么办?很简单。
我们再回到「其他修改要求」中,进行补充。
明确告诉AI,女孩身后要有一个数字0的图案,象征0糖0脂0负担,并且黄色和绿色的几何图形有点丑了,我不想要。
再点击按钮,重新生成Prompt。
现在得到新的Prompt:
生成图片是这样的:
控制文案+控制元素+用嘴改图。
演示案例二
假设现在阿里云是我们的客户,我们要在某流量平台为它进行信息流投放宣传。
这个平台的图片广告位是一个3:4比例的展示位,但是现在我们只有一张接近方形的矩形素材图,设计师又没空给我们重做。
怎么办?别着急。
我们把现在有的这张图上传到表格「原海报」的位置。AI自动反推出Prompt:
我们直接复制这个Prompt来到即梦,选择3:4的目标比例:
3:4的图片就这样生成了:
选择其中比较好的一张,我发现即梦的生成结果在品牌LOGO部分还是有明显瑕疵的。
但这点问题完全不打紧,找到右下方工具中的「消除笔」,我们把错误的部分涂掉。
再重新生成一遍:
现在瑕疵部分就消除了:
接下来,只要随便找一个图片编辑工具把阿里云的LOGO加到左上角就可以了。当然,如果要修改也是完全没有问题的。
比如,我们可以把它改成腾讯云:
LOGO依旧是按刚才的方法处理一遍。
PS:如果你真的是处在一个服务客户的场景的话,无论如何,哪怕AI生成的结果看起来跟真实的很像,我都建议你把LOGO、商品这些有严格规范的东西重新处理一遍,替换成准确的素材。这是对客户负责,也是对自己负责。
演示案例三
这是前面放的那张封面图:
虽然被我改的有点面目全非,但它的原版其实是……《只狼:影逝二度》:
上传原图进行反推,Prompt我就不粘贴了,同步还得到了文案和海报主体形象:
在最终的新图里,实际上文案、角色和画风都发生了变化。 文案最简单,我们直接在「修改文案」中,把主副标题修改为:
其他的修改,就放在「其他修改要求」里。 首先,这个燃烧的古日式建筑我希望保留,所以可以写道:
画风我希望变成巨人的风格。 如果我们现在用的生图模型是GPT-4o,其实直接指名就是最优的选择。 但我们现在使用的模型是即梦3.0,它在理解上确实跟GPT-4o有所差距。 于是就可以这样:
请AI在提示词中具体描述一下目标动画的画风。 AI也确实给到了反馈:
接下来人物,要求AI把只狼的武士形象,替换成兵长的形象:
上面几条内容拼起来,就是「其他修改要求」。 然后,点击按钮,我们得到最终的生图Prompt:
而后,生成图片:
到这里,你应该已经理解这张仿图表格的运作逻辑了。 如果还想看更多的案例,可以直接打开表格查看我留在表格里的其他案例。
Prompt
图片反推的Prompt我也放在这里,感兴趣的朋友可以自行取用或进行二次调优。 这套Prompt最早是去年我用ComfyUI工作流做FLUX.1海报反推时写的,后来经过Claude和o1的优化,现在是第3个版本。 默认可输出中英双语描述,且结构更加自然语言化,符合现在新生图模型的风格。我觉得已经达到比较可用的状态了,分享给大家:
GPT-4o就不提了,大家应该都刷到了,很猛。
老牌的选手Midjourney,依旧强。但v7这个版本并不很强势,没什么特殊亮点。
但从升级的能力来看,很明显是在提升B端和专业用户的体验。
所以说正式的生产上,需要稳定优质产出选Midjourney还是没错。
最近重新开始用Midjourney,后面有新的体验再更新。
开源派FLUX.1&Stable Diffusion,快一年没动静了,期待它们的更新。
