近期肝了很长时间,把国内外相对主流和常见的AIGC图像,视频,音频生成产品,网站都试用了一圈,做了一下总结,分享给大家。
主要是对各类产品功能做简单的介绍和展示,不涉及详细的深入探讨,针对其中部分优秀的产品,软件的功能和使用技巧,创作范例,后续会单独撰文介绍。
内容太多,一篇写不下,这一篇内容主要介绍各类图像生成网站和工具,谈一下个人的感受和看法,简单罗列一下优缺点和费用价格等等。下一篇会介绍视频和音频,音乐相关生成工具。
以下是本文图像篇中的主要产品列表:
国外产品
-
MidJourney
-
ideogram
-
DALL-E
国内产品
-
通义万象
-
通义千问
-
手机版通义 APP
-
豆包
-
即梦 AI
-
百度文心一言,文心一格,超能画布等
本地部署产品
-
Stable Diffusion WebUI
-
ComfyUI
-
Foooocus
SD 模型体系云端服务相关产品
-
LibLibArt
-
TusiArt
-
RunDiffusion
其它AI创业公司或图片视频领域商业公司的产品
-
可灵,智谱,whee,viva等
然后是具体每个产品的简单介绍,如果不想看介绍,只想看一下各自的优缺点小结,可以直接跳到文章最后边的总结部分。
MidJourney
网址:https://www.midjourney.com/home
这两年以来,MidJourney一直是AIGC图像生成领域的商业网站标杆,有众多的付费商业用户,功能迭代创新和图像生成质量等方面一直走在行业前列。近期才有一些其它商业网站和开源产品开始逼近MJ的水平。
之前需要在discord上使用,需要注册discord账号(用google邮箱账号之类的也可以登录),通过命令行指令,输入相关文本描述进行绘图。如果简单试一下,不想装discord APP,也可以通过discord的网页版:https://discord.com/channels/662267976984297473/ 来使用MidJourney的服务。
不过,现在,你也可以直接MidJourney官网网页上来创建图像了,虽然如此,还是有很多老用户习惯在discord上使用。
优点:
-
非常好的图像生成质量,画质效果在第一梯队,被众多AI创意工作者使用
-
不需要复杂的提示词就能有很好的效果,持续添加各种新的功能
-
使用CRef之类的参数,在画图时可以获得较好的人物一致性控制能力
缺点:
-
非付费用户注册以后的信用点额度用完以后,后续没有每日免费额度,无法继续使用
费用:
-
想要畅快的使用的话,至少需要购买30刀一个月的标准计划才行
ideogram
网址:https://ideogram.ai/
虽然MidJourney是行业领头羊,但这个网站我个人会更加推荐,主要是因为它的模型生成的图片,我感觉在美学构图,色彩等方面,遥遥领先,随便写一点描述词,生成写实风格的图片都有很强的艺术效果,几乎不用后期处理。毕竟定位也是针对设计师群体的。
下面这些都是我随便画的,没有参考任何其它人的作品,就是简单写了一些提示语。
最新的2.0模型,更新以后,画文字的效果异常的好(如果熟悉AI作图的用户,应该知道画文字是老大难问题),比Flux还强很多,甚至能把文字融入各种造型设计中,进行艺术化的抽象和变形,排列布局等等,所以也有很多用户用它来设计海报,PPT,LOGO等等。
比如下面这两张(不是我画的)都是通过纯文字描述直接文生图画出来的,放在其它文生图模型,几乎是不可能完成的任务。
再比如设计一张电影海报,文字和画面的结合:
最后之光电影海报。背景颜色黑暗且荒凉,充满后末日氛围。主要画面是一片有着废墟建筑、废弃车辆和散落物品的荒地。焦点是一位身着黑红相间婚纱的年轻女子,站在废墟之上,面部细节丰富,长发飘飘。标语是 “在这片荒芜之地,生存是唯一的信仰”。一个辐射警告标志被放置在海报的一个角落。利用烟雾和尘埃效果营造出后末日氛围。通过透视和景深使背景更加遥远和荒凉。
比如:核战后的世界尽显荒凉,粉红色的迷雾弥漫,厚厚的冰雪覆盖在狂野上,远处是冰封的堡垒,一个身穿红黑色蕾丝晚礼服的优雅的中国年轻女士,站在坠毁的半截飞机边上,望着远方,风吹过美丽的脸庞,天边巨大的红月亮,一个破败的箱子,边上放着一个破旧的电视,箱子上写着“绝密,请勿开启”
优点:
艺术审美遥遥领先!出图可用率很高,图像遵循文字的准确率很高,描述词得当的话,几乎每张图都可用
使用magic prompt功能的话,能使用非英文输入(当然就包括可以使用中文)(不过,这也是很多网站的标配了),会自动扩充优化提示词,转成英文,生成四张,每张的提示词还会自动有些变化,让生成的图像之间的变化更丰富一些。当然,这也会导致部分提示词被去除,不严格遵守用户输入,这个选项可选。
非常良心的是,免费用户下载图片也没有加水印(真的追求美学效果啊),只是限制了只能下载压缩率很高的jpg图,不能下载PNG图
缺点:
免费用户几乎干不了任何后期工作,比如放大,导出无损图片,图片局部重绘等等 (但是,因为出图效果很好,也已经够用了)
人物一致性方面的控制能力还没有(相比MJ)
不是Plus以上的用户的话,不能管理删除过往生成的图片(比如效果不好的),图片多了会比较难找估计。
费用:
一天10个信用点的免费额度,2.0模型可以生成5次共20张图,我几乎都是在别的网站画几张,确定好大概的提示词以后,再到这个网站上画一遍,总是有意外的惊喜
能够舒服的畅用的PLUS计划20刀,比MJ便宜10刀
DALL-E
DALL-E也是比较知名的绘图模型,如果不通过API,而是网站的话,它主要通过ChatGPT 或者 Bing的对话界面来使用
优点:
图像质量还是不错的(不过相比现在众多专门定位于文生图,图生图的网站产品,出图效果方面并没有太突出的地方)
缺点:
由于透出形式是问答式对话,也没有太多的图像针对性参数设置功能,只提供非常基本的文生图能力。不太能满足需要精确控制图像生成的需求场合
费用:
以透过ChatGPT使用为例,如果不付费,每天只有非常少量几张图的免费额度。
接下来看一下国内的产品
通义万象
吴妈回归阿里掌权以来,阿里来一直在喊ALL-in AI,通义大模型家族也是对应的产物之一,万象是通义大模型的画图部分
https://tongyi.aliyun.com/wanxiang/
不过,其效果一般,生成图像的变化相对较少,且具有一定的 AI 感。当然,最新的 2.0 模型相比刚开始的 1.0 模型已有不少改进。
优点:
网页版每天有大约 50 张免费额度可用;若额度不够,可使用手机 APP 版,该版本无额度限制。
小白上手比较简单,界面还比较简单,有各种可视化的参考选项
灵感扩写等能把简单的提示语扩充描写,方便词穷的同学(不过这也基本是各类AI生图网站的标配了)
缺点:
图像的后期调整,修改等能力相对弱一点
对一些名人的画像似乎做了隐私控制?比如下面这张画赫本,就完全不像。各种提示词检查做得比较严。
各种敏感词检测也很严格,比如临近万圣节了,你要画个骷髅,吸血鬼,僵尸,鬼魂,十字架什么的,这些统统都不行,都是被禁的关键字。
费用:有钱任性,都没有给你个人用户交钱的地方。。。
通义千问
https://tongyi.aliyun.com/qianwen/
千问是大语言模型,但是也能调用绘图模型画图,万象需要灵感点数画图,如果你不想装APP,就是想要用网页版画图的话,也可以在通义千问里面画图,
优点:
免费账号也没有额度数量限制。
缺点:
图像效果差一些,估计和万象使用的模型版本不一样
另外问答式的画图,功能也相对简单,缺乏后期调整能力
费用:无
手机版通义APP
手机版AI智能助手APP,大概是大厂们都想要争夺的下一个用户流量入口,通义APP里面塞了很多AI相关的功能,从语言模型,视频模型,还有各种乱七八糟的虚拟人物抽卡,AI角色等功能,图像生成功能只是其中的一个模块。
总体感觉产品形态交互设计比较差,人性化的设计不足,手机版APP的各种功能就是混乱的塞在一起,但模型相关技术水平还是比较高的。里面有一些其它有趣的功能模块,以后也可以介绍
效果和网页版一样,后台都是相同的模型,2.0专业版的模型稍微好一点,但不多。出图的多样性也稍微欠缺一些。
除了不限额度以外,优缺点和费用,类似网页版。
豆包
说完阿里系的,说字节系的,直接的豆包也是定位类似通义这样的AI工具集成网站,AI画图功能也只是其中的一个模块。
网址:www.doubao.com
漫画风格
画赫本像很多,应该是没有刻意去控制名人肖像,内容审查得要松一些。
豆包同样有APP版和windows客户端版本,三端的交互内容和对话记录都是互通可见的,这就非常好。
优点:
用户交互的细节,易用性做得比通义强太多了。
网站版也是不限量使用的,不像通义只有APP版不限量。
速度非常快,基本没有排队的感觉,扩图和局部重绘的速度也很快
有些风格模版生成图像的真实感不错,比如胶片风格的照片
一些画面内容要求复杂的图片,也能较好的遵循提示词给出基本满足所要求的元素内容,指令遵循性还不错
比如:万圣节夜幕下,一位十八世纪女孩身着哥特风华服,黑色小皮鞋,脸部特写。坐在一只巨大的黑白色猫身边。红黑蓝白粉色蕾丝长裙。她头戴一顶小礼帽,帽子上有一根孔雀羽毛,帽檐下,苍白面容被一抹粉红色的唇膏衬托得更加神秘莫测。玫瑰花装饰,动态的姿势,烟熏眼妆,诡异的微笑,脸部特写。背景中,巨大的暗红色月亮,月光洒在古老城堡上,营造出一种惊悚而神秘的氛围。虚化的背景光斑。图片风格为电影写真,比例 4:3
缺点:
功能比较有限,图片的放大,细节重绘之类的功能都没有(当然通义也没有)
图片的分辨率也比较小,简化了部分图像编辑和调整的功能。
人物姿势非常规或者画面结构复杂时,还是容易出现手脚画面的崩坏(当然大半产品都这样,只有少数能做到基本不崩)
功能简单和豆包的定位办公相关领域有一定关系。实际上字节系有另外一款专注于图像和视频生成领域的产品,这方面的功能就完整强大很多,就是我们下面要说的即梦AI。
费用:无
即梦AI
网址 https://jimeng.jianying.com/ai-tool/home
即梦AI通常被大家用来做视频,但它的图片生成能力也很强,特别是导入参考图的能力(应该基本上是Controlnet的能力),可以提供很强的图像内容控制能力。
此外最新的画板功能提供了大量的图像精确控制修改的能力,常见的如局部重绘,细节改进等等。最有特色的是图像局部转向能力,基本上是参考局部图像,按照箭头方向重构画面,但保持图像特征的相似性。比如下面这个例子,我把三个脸都做了不同方向的转向,效果惊人。(这有什么用呢?比如可以作为视频头尾帧的生成,把前后两张图片喂给视频生成模型,生成运动视频效果)
优点:
丰富的图像后处理调整功能,可以反复细化和重绘一张图片的细节,提高了抽图的可用性。
几乎完整的Controlnet图像控制能力,一定程度上满足自定义控制画面内容的需要
UI交互设计合理,用户体验较好
缺点:
严格来说不算缺点,是希望提高的地方:
各个不同的模型目前支持的图像控制能力不一样,能力有些缺失
没有内置自定义角色的能力,人物形象控制需要另外想办法(比如使用它的Controlnet)
文生图,人物外貌形象特征等,多样性稍微不足,略显单一
费用:
不像豆包,即梦的免费账号不是无限量使用的,每天有66个积分,通常画一幅图是1-2个积分。但是即梦的画图功能,高清图和细节重绘都是不消耗积分的,所以可以多次反复重绘一张图的细节,一定程度上替代了部分抽卡,所以还是比较耐用的。当然,如果要畅快的使用,还是要开会员,积分其实从一个月来看,没有增加多少,但最主要是去水印和视频的高清功能。
百度(文心一言,文心一格,超能画布等)
文心一言
文心一言中可以使用文生图的功能,我觉得效果一般,而且需要百度账号实名身份证认证才能使用。
文生图和图生图都是通过文心一言的大语言交互模型的界面来完成的
图生图也是通过问答的方式,上传图片,描写要求,不会写,可以让它自己扩写。
怎么说呢,语言理解能力还可以,但生成图像的质量清晰度很差
因为没有提供任何修改手段,可以尝试通过问答形式要求他把图像画得高清一些。画质倒是好多了,但结果和原图已经是截然不同的两张图了。
优点:免费,不限额度
缺点:需要身份证实名认证的百度账号,功能比较简单单一。
费用:无
文心一格
相比文心一言,文心一格是纯定位图像生成领域的产品。
https://yige.baidu.com/
我用的很少,首先没有什么免费额度,其次效果很一般,没有什么特别的地方,出图还经常崩,所以就简单看了一下,试用完几张新用户的额度就完事了。
超能画布
百度照片里面还有一个功能叫百度超能画布,这个不需要实名认证,主打的是各种图片AI后期改造和加工处理。这个定位和百度照片倒是比较匹配。
https://photo.baidu.com/photasy/home
比如上传的是左图,选择一个模版,生成右图。功能有点简单,但效果还可以。不过,应该很少人会为了这些功能开会员付费吧。有类似需求的用户,可能都去买美图秀秀之类的会员了,同样有类似的功能。
如果你有一定的动手能力,想要更加自由的,免费的产品,那么可以试一下本地部署各类开源图像模型工具
Stable Diffusion WebUI
Stable Diffusion 模型,简称SD,是和MidJourney,DALL-E等商业产品齐名的开源图像大模型,有很多种方式可以在本地部署运行相关模型。
而 SD WebUI则是一个图形化的UI交互封装,可以通过它使用SD以及其它各类图像大模型。生图的效果取决于你选择的模型和插件
有一定动手能力的小伙伴,可以去SD WebUI的github仓库下载并自行安装使用
https://github.com/AUTOMATIC1111/stable-diffusion-webui
但安装过程要下载大量的依赖包,还需要配置各类运行环境和参数等等,所以大多数时候,还是直接下载别人打包整合软件包会更快更便利一些。比较出名的比如国内秋叶大佬出品的整合包
具体下载地址,B站上随便搜索一下就有了。
使用整合包最大的便利是所有的依赖环境,以及后续的更新,都有可视化的界面,基本可以一键完成。如果不小心搞坏了,在下载一个也很容易,无痛使用。一些国外的资源地址,还做了国内镜像,就很方便,所以整合包能用就用,大多数时候没必要自己折腾。
具体的使用方式,当然是要比现成的网站文生图或图生图网站产品要复杂的,但其实只要试一下,或者简单看个教学视频,也都能快速上手。最基本的就是选个模型,填一下描述词,选择生成的采样方法,步数,然后点击生成。
根据你装的插件多少,你可以使用各种额外的功能,如人体3D骨架编辑,模型训练,标签反推,各种高清修复,扩图脚本等等。这些就不是一两句话可以讲清楚的了。
当然,你需要一张显卡来使用这个软件。如果不训练模型,其实不用太高级的显卡,主要是对显存大小有要求,4-8G就可以跑包括SDXL在内的众多模型了,而16G显存,比如4060TI的16G版本,就可以跑最新的Flux模型,无非比4090之类的慢一些罢了。当然,如果要追求速度或使用各种插件,或者训练自己的模型的话,显存还是越大越好。
各类模型资源可以去比如 huggingface 或者 civitai下载
优点:
使用方式自由,开源模型和各类插件众多,有很强的可控性。
有大量的社区资源,可折腾性强。
操作界面相对来说还是比较简单的(相比自己编程跑模型代码,或者后面要介绍的ComfyUI)
缺点:
基础模型出图质量没有一线成熟商业产品好(当然,也有补偿的方式,包括使用各种Lora,Controlnet之类),
显卡不够好的话,出图速度和出图的大小受限
有一定的学习成本,越想玩得溜,越需要投入时间在研究工具本身的使用和拓展上。
需要自己跟进新的模型,使用技巧等等。(当然,对喜欢专研的人来说,这说不定是优点。。。)
费用:
如果你没有足够好的显卡的话,你需要一张显卡作为一次性投资
ComfyUI
ComfyUI 是一个基于工作流(workflow)的UI交互构建和生成图像(其实不光是图像,可以是任何流程)的软件系统,用户通过连接不同的节点来构建复杂的图像处理和生成流程。
一个具体的工作流由多个节点组成,每个节点代表不同的操作和功能,如模型加载、噪声应用、图像生成等。这些节点通过输入输出端口,连接在一起,形成一个流程图,描述了图像从原始数据到最终输出的处理过程。
熟悉编程的小伙伴,可以把它理解为一个个的函数模块,你负责串联调用这些函数。实际上有很多知名的软件也采用这种工作流流程图的交互形式。比如3D建模软件Blender
下面是一个最简单的官方例子,最基础的文生图工作流
同SD类似,有一定动手能力的小伙伴,可以去ComfyUI的github仓库下载并安装使用
https://github.com/comfyanonymous/ComfyUI
但同样的,直接下载别人打包整合的软件包会更便利一些。秋叶大佬也有封装了类似启动界面的整合包,可以管理各类扩展安装。
但ComfyUI启动完的网页界面里,自己也提供了完善的环境管理功能,具备更强的功能
比如节点管理
如果不会构建工作流的话,帮助文档里有大量的使用各种不同节点和实现不同功能的示例工作流,社区也有大量的工作流可以参考,还有人替别人付费定制特定功能的工作流。
工作流通常是一个json文件或者包含了工作流Json信息的图片,直接拖进ComfyUI的界面就可打开别人构建好的工作流,如果有缺失的节点,可以在管理界面一键补充安装。
工作流可简可繁,稍微添加一些功能,可能流程图就会变得比较复杂
至于一些功能强大,流程复杂的工作流,往往需要数量庞大的节点进行构建。
优点:
高度定制化的能力,ComfyUI及其社区提供了大量不同功能的节点,你可以根据自己的需求,自由组合使用这些节点。
工作流导入导出非常便利,便于分享,可以学习和借鉴他人的工作流创意和经验。可以几乎完美复制特定图像生成和工作流程
相比ComfyUI,节点自定义,能够按需加载功能,除了灵活以外,通常也更节省显存,同样的配置下,有时能够运行更大的模型和更复杂的流程。
往往能够最快使用上最新的模型或者工具。比如用Flux画两张2046之水下巴黎,看看广角人像和文字控制的效果
再画两张近期流行的猫猫守护神照片,看看这种反常尺寸画像的指令遵循能力
缺点:
与一些界面简洁、操作直观的图像生成软件相比,ComfyUI 的界面可能看起来较为复杂和混乱,不容易快速上手
理解和掌握节点系统的工作方式以及各节点的功能和参数需要花费大量时间和精力。需要学习如何正确连接和配置这些节点,才能实现期望的图像生成效果
FOOOOCUS
如果上面SDWEBUI还嫌麻烦,想和生图类网站产品一样简单傻瓜的界面,可以试一下 foooocus这个软件,不过我个人没有觉得太有必要,除非你是完全新手小白,。
https://github.com/lllyasviel/Fooocus
SD模型体系,云端服务相关产品
如果想享用SDWebUI或者ComfyUI的高度自由性,但是又不想自己在本地搭建环境,又或者没有足够好的显卡。那也可以使用一些云端在线的部署服务。
这些网站,大多数通常会提供在线版本,配置好的基于各类开源模型的绘图界面,也可以提供SDWebUI,ComfyUI,Foooocus之类开源软件的云端部署服务,打包基本的环境,同时可以自己上传额外的模型,文件之类。通常他们也会建设一些社区让用户分享各类模型,图片,工作流等等。大同小异,选一个价格合适,或者眼顺的就好了。
常见的,国内比如
LibLibArt:https://www.liblib.art/
TusiArt:https://tusiart.com/
国外比如
RunDiffusion :https://rundiffusion.com/
优点:不用自己部署,成果方便分享,随开随用。
缺点:要花钱呗。管理文件,后期处理这些不如本地可以结合各种工具来的方便
费用:各不一样,比如LibLibAI如下,如果短期简单使用,或者偶尔训练个模型需要好的显卡,还是比自己买显卡要节省一些的,看自己实际需要了。
其它AI创业公司,团队的产品
还有很多国内外AI创业公司,或者国内类似快手,美图这样的公司有图像生成类产品,下面列举一些,他们其中有不少产品,图像生成这块的功能,其实还是可以的,但因为没有特别突出的地方,或者他们的产品,相对知名的部分是其视频生成的部分,所以对其图像生成部分只做简单地罗列,大家可以自己去试一下。
-
可灵AI
https://klingai.kuaishou.com/text-to-image
可灵AI以图生视频功能出名,图像生成部分,表面上看只提供文生图功能,但是可以拖进参考图,虽然不能指定控制逻辑,只能控制参考强度,但是一定程度上是图生图的功能
-
智谱-清言
https://chatglm.cn/
之前主要是chatglm大语言模型产品,后来做的图像生成产品。所以文生图模型是以对话的形式提供的。图像效果,看运气。
-
whee
美图的AI绘图产品 https://www.whee.com/
-
viva
https://vivago.ai/
特色功能是提供了角色创建和绘图时引用角色的功能,有助于生成人物外貌一致性的图像。
提供了大量的分类辅助提示词(通过他的TAG功能使用),也有图像参考功能。图像生成,构图还可以,但是颜色总感觉过度AI了,有很强的涂抹和过饱和的感觉。
不过,他的免费账号是不限量生成图片的,只是部分功能受限,以及下载带水印。要去水印的话,5刀的订阅计划就可以了,也是比较良心了。
小结
本文主要介绍了文生图、图生图相关的国内外产品,包括商业网站、国内大厂产品、开源图像模型工具、云端服务相关产品以及其他 AI 创业公司的产品:
国外网站产品
-
MidJourney:
网址:https://www.midjourney.com/home
是 AIGC 图像生成领域的商业标杆,功能迭代创新和图像生成质量高,需付费使用,非付费用户信用点额度用完后无免费额度。可在 discord 或官网网页上使用,有较好的人物一致性控制能力。
-
ideogram:
网址:https://ideogram.ai
生成的图片美学构图、色彩领先,2.0 模型画文字效果好,可设计海报等。免费用户下载无水印但有功能限制,有一定的艺术审美优势。
-
DALL-E:
通过 ChatGPT 或 Bing 的对话界面使用,图像质量不错但出图效果在专业文生图产品中不突出,缺乏图像针对性参数设置功能。免费额度少。
国内产品
-
通义万象:
网址:https://tongyi.aliyun.com/wanxiang
阿里通义大模型的画图部分,网页版每天有 50 张左右免费额度,APP 版无额度限制。小白上手简单,有灵感扩写等功能,但图像后期调整能力较弱,对敏感词检测严格。
-
通义千问:
网址:https://tongyi.aliyun.com/qianwen
大语言模型,可调用绘图模型画图,免费账号无额度限制,但图像效果差,功能相对简单。
-
手机版通义 APP:
功能混乱但技术水平高,效果与网页版类似,出图多样性欠缺,除不限额度外优缺点与网页版相同。
-
豆包:
网址:www.doubao.com
用户交互细节好,速度快,不限量使用,一些风格模版真实感不错,指令遵循性好,但功能有限,画面复杂时易出现人物手脚细节崩坏。
-
即梦 AI:
网址:https://jimeng.jianying.com/ai-tool/home
图片生成能力强,有丰富的后处理调整功能和图像控制能力,UI 交互设计合理,但免费账号有使用限制,人物外貌形象特征多样性不足。
-
文心一言:
可文生图,需百度账号实名身份证认证,免费不限额度,功能简单单一,图像质量清晰度差。
-
文心一格:
纯图像生成产品,无免费额度,效果一般,出图易崩。
-
超能画布:
百度照片中的功能,主打图片 AI 后期改造和加工处理,无需实名认证,功能简单但效果可以。
开源图像模型工具
-
Stable Diffusion WebUI:
图形化 UI 交互封装,可使用 SD 及其他图像大模型,生图效果取决于模型和插件,使用有一定学习成本,需要显卡,有大量社区资源。
-
ComfyUI:
基于工作流的图像生成软件,高度定制化,可导入导出工作流,学习成本高,界面复杂。
-
FOOOOCUS:
SD 模型体系,界面简单傻瓜,适合新手小白。
SD 模型体系云端服务相关产品
LibLibArt、TusiArt、RunDiffusion 等,不用自己部署,成果方便分享,管理文件和后期处理不如本地方便。
其他 AI 创业公司产品
可灵 AI、智谱 - 清言、whee、viva 等产品,图像生成功能各有特点,但没有特别突出之处
推荐
最后,这么多产品,如果你看得眼花缭乱,非要简单推荐几个的话,那么:
-
商业付费产品,对审美和设计要求高:推荐ideogram,对功能要求强:推荐MidJourney,要使用国内产品,即梦AI也可以考虑,综合性价比高。
-
非重度使用,不想付费:豆包,通义万象APP 都能免费画图,玩得好的话,效果也不错
-
有显卡,想要本地部署或者不想上传图片担心个人隐私:新手小白,推荐使用Stable Diffusion WebUI整合包, 有一定技术理解能力,追求高效和完全的自由,推荐使用ComfyUI。
-
有技术,没显卡,或者工作负载高,那么LibLibArt等找一个顺眼的在线模型服务就好
当然,这些选项也不冲突,作为成年人,你也可以全都要。。。