年初,DeepSeek 的走红让国内用户真正体验到了大语言模型的强大能力,掀起了一波 AI 学习热潮。


市面上的 AI 工具层出不穷,功能也越来越强大。主要集中在 AI 对话、AI 写作、AI 绘画、AI 视频生成、AI 音频生成、AI 编程、AI 搜索以及 AI 音乐这几大领域。


今天我们整理了这份AI工具全景图,希望能帮助刚接触 AI 的朋友们少走弯路,找到最适合自己的工具。


需要说明的是,大多数 AI 产品在功能上其实有不少重叠。我在分类时主要考虑的是它们的核心优势和特长。比如 DeepSeek 虽然也是一款不错的 AI 对话工具,但我认为它在写作方面的表现最为出色,因此将它归入了 AI 写作工具类别。


AI 对话


ChatGPT


特点:功能最全面、生态最丰富、应用最广泛的 AI 对话平台,几乎无所不能。


ChatGPT 可以说是 AI 领域的明星产品,凭借其强大的语言理解和生成能力,在全球范围内拥有大量用户。


它能够回答各种问题,协助撰写文章、故事、代码,甚至进行角色扮演和创意启发。目前在多模态能力方面最全面的 AI 产品。


产品体验非常好,语音聊天流畅自然,反应迅速,可以通过摄像头在与 AI 进行视频通话时,直接识别现实中的物体,甚至还能模拟人类的情绪变化。


尽管 OpenAI 凭借先发优势在技术上保持一定领先,但产品实用性和用户体验方面还有提升空间,并且Plus 会员(20 刀 / 月)每月只能用 10 次,Pro 会员 (200 刀 / 月) 每月也才 150 次的高费用也劝退了不少用户。


豆包


特点:对中文语境理解最到位,接地气又不失专业,产品体验拉满,是国内用户的贴心伙伴。



豆包是字节跳动开发的 AI,对中文用户特别友好。


  • 它不仅能准确理解中文语境中的各种细微含义,还能根据不同的场景和需求,提供高质量的回答。


  • 无论是日常聊天、知识查询,还是文本创作,豆包都能轻松胜任。字节跳动凭借其强大的产品打磨能力弥补了模型能力的不足。


  • 日常英语练习、塔罗牌解读等功能都由豆包 AI 提供,使用体验相当流畅。


Gemini


特点:谷歌的 AI 产品,融合了 Google 强大的搜索能力。


作为 Google 的 AI 产品,Gemini 融合了 Google 强大的搜索能力和 AI 对话能力,创造了一种独特的使用体验。


【AI应用技巧】AI大热工具汇总!从入门到精通,这一篇就够了Gemini 最大的亮点是它与 Google 搜索的无缝集成。当我需要最新信息或特定数据时,Gemini 能够实时搜索并整合信息,这是其他对话模型难以企及的优势。


AI 写作


DeepSeek


特点:国内最强开源大模型,创意写作能力爆表,是国人实现 “AI 自由” 的重要武器。


国内最强的开源大模型,引爆了 2025 年的 AI 狂潮,也是国人很简单就能用上的性能最强大模型,现在各家都接入了 DeepSeek,让我们基本实现了 AI 自由。


DeepSeek 在写作领域堪称强大助力,适合各类人群。



  • 对于职场打工人而言,它能够轻松生成条理清晰的会议纪要,精准提炼会议重点;撰写工作报告时,凭借其高效产出,为忙碌的职场人节省大量时间与精力;还能巧妙优化简历,突出个人优势与亮点,提升求职竞争力。


  • 在自媒体行业,博主们依靠 DeepSeek 创作出爆款文章,精准把握读者喜好,吸引海量流量;制作短视频脚本时,它能构思出引人入胜的情节,助力视频脱颖而出;就连直播话术,也能在它的帮助下更具吸引力与互动性。


  • 电商领域,DeepSeek助力电商老板打造亚马逊爆款文案,精准吸引消费者目光;生成贴心的客服话术,提升客户满意度;设计有效的私域引流话术,实现客户群体的高效拓展 。




Claude


特点:业内公认写作、代码能力最强的大模型,能非常好的理解用户需求,可以说比deepseek更加稳重,输出语言真人感强。


最近新发布的 Claude 3.7 是首个混合大模型,能力进一步增强。Claude 在写作方面功能十分强大。它的指令服从性极高,当你给出特定写作风格要求。


例如 “模仿《南方周末》特稿风格,写一篇关于 AI 伦理的深度报道” ,Claude 能精准把握该媒体的叙事逻辑,在字里行间还原其独特语言风格,甚至巧妙地加入虚构人物对白,极大增强文章的可读性 。


同时,Claude 擅长理解复杂指令,在处理一些专业性较强的写作任务时,能够深入剖析问题,给出逻辑严谨、内容详实的文本。


比如在法律文书写作中,它对法律条款的解读与运用较为准确,能为法律工作者提供参考性较强的初稿。


AI 绘画


Whisk


特点:不靠文字描述,而是通过上传多张图片自由组合,简单直观。


谷歌推出的 AI 绘画产品,与传统的 AI 绘画工具有着本质区别,它不再主要依赖文本提示,而是让用户通过上传图片作为主要输入方式,实现更直观的艺术创作过程。


比如

软萌的皮卡丘抱着雄伟的艾菲尔铁塔,还有甜美可人的玲娜贝儿抱着东方明珠。这些充满奇思妙想的画面,都是借助 Whisk 生成的。


操作过程是这样,比如我们可以把自家猫咪的照片作为 “主体”,选择一幅油画作为 “风格”,再加上一个秋天公园的场景,几秒钟后就能得到一幅穿着正装的猫咪绅士在秋日公园的艺术画作!


由此可见,Whisk 更侧重快速视觉探索,帮助用户以新颖、创意方式组合元素,生成如数字毛绒玩具、珐琅胸针、贴纸等作品,也适合制作 NFT、表情包、周边产品 。

 

ImageFX


特点:和Whisk一样也是谷歌推出的产品,技术强大、细节精湛、整合度高,是追求高品质图像生成的理想选择。


但与whisk不同的是,ImageFX是文生图工具,用户需要输入文字提示词,模型会根据提示词来生产图形。




我用下来真实度最好的文生图 AI 绘画工具,对提示词的理解也很到位。ImageFX 操作时,可在设置中选生成比例,输入提示词后自动标注关键词,还能调整词组修改图像,有数百种风格可选,适用于多种场景。


AI 视频


可灵


特点:快手推出的国内视频生成领域的领军者,画质极致、动作流畅。


可灵就是视频生成领域的 DeepSeek,强大的视频生成能力让可灵国际版已上线就被外国友人刷爆了。生成视频质量极高,没有混乱,对动作的理解也很到位。


可灵是快手 AI 团队自研的视频生成大模型,于 2024 年 6 月 6 日在官网正式上线。支持生成长达 2 分钟的 30fps 视频,分辨率高达 1080p,并且支持多种宽高比。


可灵大模型采用类 Sora 的 DiT 结构,用 Transformer 取代传统的卷积网络结构,为了提升计算效率,还使用 flow 模型作为扩散模型基座,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。


Runway


特点:AI 视频领域的开拓者,价格偏高但专业质量无可替代。


AI 视频领域的 OpenAi,当年 Gen-2 刚发布的时候可谓是视频生成领域的天,只需要输入几句描述,或者上传一张图片,它就能给你生成一段流畅自然的视频。


不是那种粗糙的动画,而是真实感十足的画面,连专业人士都要惊叹的那种。如今虽然 AI 视频领域新生代产品很多,但是 Runway 依旧宝刀未老。唯一不友好的是价格偏贵,而且需要模仿,嫌麻烦的话还是推荐大家直接使用可灵。



投稿邮箱:acqwzzb@163.com