图像视频是AI社交的主战场

本文约4000字,推荐阅读时长15分钟,欢迎关注新财富。

谈及Sora,大众对它最初的印象,想必是24年春节前夕OpenAI放出那一段惊世骇俗的Demo视频——霓虹灯光下的女子、在咖啡池中翻涌的海盗船……当初的震撼感仍然记忆犹新。

依靠Sora,OpenAI硬生生地砸出了个视频大模型的新赛道。

但当时OpenAI过分高估了自己、低估了对手,上演了一出龟兔赛跑。不到半年的时间,国产大模型快手可灵1.0上线;9月 MiniMax 海螺 AI 发布,国产 AI 视频席卷海外各大社交平台。

反观 Sora 却成为“期货产品”,推迟到12月才上线。而此时的竞争格局已经发生两极反转:“神秘的东方力量”已经在AI视频领域征服了全球用户,Sora的故事深度诠释了什么叫“开局即巅峰”。

如果单论视频大模型,Sora 确实是一款“过气”的产品。但OpenAI显然志不在此,迅速调整了产品的战略定位,让Sora踏入了第二条河流。

于是乎在无人问津的角落,Sora正逐渐蜕变成为主打图像、视频的 AI 社交平台

每家AI公司都有一个“社交梦”

3月份 AI 行业有一则很有趣的新闻:马斯克的xAI对收购了自己的X。

一场左手倒右手的交易,背后反映的是马斯克对于大模型产品与传统社交软件之间结合的思考。X 作为全球最大的社交平台之一,除了能为 xAI 贡献独家数据以供训练之外,还将扮演为 xAI 提供用户增长和分发渠道的重要角色。

在这场收购案完成后,马斯克自己在X上发文称:“xAI和X的未来是紧密相连的”。对于马斯克这样老谋深算的企业家而言,真正让两家公司紧密相连的,是数据、流量与Dollars。

马斯克xAI收购案只是一个开端。

无独有偶,4月中旬国内知名AI公司月之暗面Kimi被曝光正在测试一款AI社区类的产品。

据内测用户透露,这个神秘的社区产品暂以“发现”Tab内置在原本的Kimi软件内,是一个充满“AI氛围”的图文社交平台:用户可以在这里分享自己与Kimi的对话过程,社区内有多个AI虚拟个体。据悉,该产品目前仍处于邀请制测试阶段。

我们本文的主角OpenAI,在4月15日也被报道正在加速开发新的社交应用。The Verge 援引知情人士消息报道称,OpenAI的社交平台将和马斯克的 X 类似,但更侧重于图像生成功能

“图像生成功能”这个关键词线索几乎已经指明了,这个平台其实就是Sora。

Sora发生了哪些变化

Sora的起爆点还是要追溯至 OpenAI 4月份上线原生图像生成模块——GPT-Image-1。

GPT-Image-1 超强的图像风格化能力,一夜之间在全网带火了“吉卜力画风”,各位相必都见证了当时病毒式传播的盛况,就连Sam也将自己X的头像换成了吉卜力风格的照片。

根据 OpenAI COO 布拉德・莱特凯普透露,GPT-Image-1上线仅一周内便有超过 1.3 亿名用户,合计生成超过 7 亿张图像。平均每天产出超 1 亿张图像,约每分钟 7 万张,每秒达 1157 张之多。

连Sam也在社交媒体发文称:ChatGPT 的 GPU “快要融化了”,服务器几乎陷入瘫痪。要知道,目前GPT-4o只支持Plus以上档位付费会员,我们能够肯定的是,GPT-Image-1势必为OpenAI带来了更多的新增付费用户

而Sora则依靠能一次生成2张图、不卡顿的特点,成功成为GPT-Image-1的第二个入口,吃到了这波版本红利,取得了巨大的用户增量。

Sora的第二个变化,就是它全面向社交平台的基本框架进行演变

“过气”的Sora,凭什么想做AI版的抖音?对比两个时期的产品形态,我们发现新版Sora显著的变化在于:

1、新Sora图片作品占比显著提高,内容排布密度更高;

2、新Sora在左侧标签栏增添了大量社交功能组件,包括推荐、点赞、一键复制、无限信息流的新交互机制。用户可以查看平台每天/周/月和全时段点赞数最高的图片;

3、支持用户一键套用他人上传图像的提示词,实现载体的裂变传播;

4、用户只要在Sora平台上生成的图片,合规前提下除非用户手动下架否则就是默认公开分享的;

5、用户可以对自己生成内容点赞或点踩。用户可以访问任意创作者的主页,查看Ta所有的作品。

我们可以看到,除了无法评论外,当前Sora已经具备了图像社区几乎所有的功能。

图像和视频,永远是社交平台的主旋律

2025年,图像生成并不是一个新鲜的事物。那为什么这一次GPT-Image-1,能够拥有如此超预期的表现呢?

从微观角度分析,GPT-Image-1确实拔高了大模型文生图“审美”的新高度。

图片与代码不一样,代码输出的结果是固定的,而人们对图片的艺术审美则是千人千面的。

如果说注意力是公认最稀缺的资源的话,那么比注意力资源更稀缺的,是感受力资源。

GPT-Image-1高度自定义的风格化、艺术化的图像呈现方式,引起了全球所有人感受上的共鸣。你可以随意将一张合照,转化为吉卜力工作室画风的风格,可以生成美式四格漫画并配上稳定性极强的文字,甚至和马斯克拍一张平平无奇但又真实的自拍照。

这种个性化的图像效果,在GPT-Image-1之前没有一款通用大模型产品能够轻松做到。可以说无论用户提示词水平高低如何,GPT-Image-1都能保证较高的图片质量下限。

换一个视角来看,人类天生就是视觉动物,而图片天然就是极其适合传播的载体。图片最大的优势是它极其容易被感知,它既包含了个性化的表达,同时又能够实现跨越语言、跨文化传播。我们往往说一图胜千言,图片本身就具有很强的社交属性。

移动互联网时代,有不少以图片作为主体的社交软件至今依旧风靡全球。

Instagram 就是其中的典型代表。

在2010年智能手机大规模普及的时代,Instagram的成功在于聚焦摄影本身,依靠产品设计让随手拍的照片都能具有艺术感,让业余用户也能在上传好看的照片,实现了“随时随地分享生活瞬间”的口号。

Instagram的设计,摈弃了传统APP繁琐的UI设计,只聚焦于照片拍摄、美化和分享这一单一核心场景。这使得普通用户也能轻松上手Instagram:拍照->套用滤镜->分享,只需数步即可完成。“Ins风”滤镜也在中外社交平台上引发了病毒式传播。

同期也有不少APP都是以图像作为主要载体,并逐渐发展成为全球级别超级社交APP,例如主打图片阅后即焚玩法的Snapchat,抓住了用户从文字博客转向视觉内容的趋势的Pinterest。

包括后来的朋友圈、小红书,以及从图片升维成短视频媒介的tiktok,其实都反映了大众化社交平台的媒介正在向个性化、易感知方向发展的趋势。

“AI社交”成为AI应用聚焦的新方向

为什么当前阶段,马斯克、杨植麟、奥特曼三个人在AI社交领域达成了高度共识,扎堆涌向AI社区的新赛道?其背后的原因无外乎两个方面。

首先用户的扩展意味着智能的提升。

我们此前在《杀疯了的豆包》中提到,豆包保持国内AI大模型第一梯队的原因很大程度上源自于字节依靠社交产品矩阵,网罗了巨量的数据资源。晚点的报道也提到,字节早在1.5pro发布的过程中就始终认为大规模的用户反馈仍然重要。在豆包这款产品中,字节一直致力于提升产品规模效应,并力图打造大规模用户反馈到模型实际使用体验提升的优化闭环。

尽管这样的理论同样遭受了很大的质疑,但是近期其他头部AI公司开始重新认可用户反馈能够提升模型实力的观点。同样是晚点报道,OpenAI正在开始将用户的对回答结果的点赞、点踩数据引入模型的“后训练”的强化学习环节。Google 也开始引入用户反馈来提升 Gemini 模型能力。

其次AI科技公司对成为下一时代、用户新的流量入口有着共同的需求。

过往的经验证明,社交平台能够依靠社交与信息交互这一需求,形成用户的长期留存。用户自主生产的UGC内容,在平台上不断推陈出新,形成流量的增长,即“用户数据飞轮”。

将增长的流量转化为现金,是过去互联网发展20多年来最成熟的商业模式。Meta、Google、抖音等公司,无论是采取广告、竞价或者是电商引流的策略,它们都是各自领域内依靠“社区”来实现流量变现的高手。而在AI时代,无论是用户增值、广告付费、API调用费用营收的商业模式,最基础的要求依旧是平台上的大流量用户。

不久前,OpenAI创始人Sam Altman在访谈中被问到了一个问题:“五年后,一个坐拥10亿日活用户、无需买量的平台,还是最顶尖SOTA的AI模型哪个更有价值”。这个问题很像前段时间短视频平台上广为流传的一则灵魂拷问:“上清华和拿1000万,你选哪一个?”

Sam在深思熟虑后回答:“我觉得是10亿用户的平台(The 1-billion user site I think)

OpenAI 2024年 40 亿美元的营收已经算是同行中的佼佼者。但由于需要同时兼顾大模型研究和应用产品服务,在训练开支、服务器租赁、研究摊销成本的压力下,OpenAI去年的总亏损依旧高达50亿美元。

正如Sam所言:OpenAI是成为消费科技公司的是一场意外。当OpenAI坐拥超3000亿美元估值、服务3亿日活用户的时候,如何扩大营收、寻找新的商业模式已经是他们不得不面临的问题。

ChatGPT 订阅服务依旧是最大的现金来源,并且其中针对个人用户的 ChatGPT Plus 占比更高。根据最新的数据报道,ChatGPT当前付费用户数量已突破2000万,较 2024 年底的 1550 万增长约 30%。按照20美元Plus会员定价测算,ChatGPT订阅费今年的年化营收将超过50亿美元。

显然,为了实现“25年冲击127亿美元营收”的诺言,OpenAI最直接的途径就是吸引更多的付费用户,特别是扩大高级订阅会员(200美元/月档位)的占比。

尾声:到了2025年了,社交平台真的那么好做吗?

当AI公司在大力推进自己的社交平台研发的当下,它们往往容易忽视的一件事情,就是AI社交平台,同样处于传统主流社交平台的射程范围之内。

近期我们能够看到,在过去互联网时代坐拥大流量社交平台的公司,频繁地将AI功能与自家社交产品结合。

这一点国内大厂的动作尤为积极,前有抖音将豆包加入了抖音好友列表,后有腾讯将元宝迁入了微信通讯录界面这些进展。

很显然,关于如何构建“AI社区”,有两种技术路线的直接冲突:一个是“AI+社区”,另一个是“社区+AI”。

Sora作为一个“土生土长”的原生AI社区,是OpenAI真正转向“消费级科技公司”的第一款战略意义的产品。但残酷的现实始终无法回避:“AI+社交”赛道是一条凶险艰辛的路线。特别是在中国,Sora有力的竞争对手,还包括坐拥老牌社交产品公司的新产品,如字节的即梦、快手的可灵/可图。

从数据上看,全球近十年来在社交领域,几乎再也没有“全民级”的产品出来。泛社交领域内的QQ微信、内容社区的小红书B站、兴趣社区的知乎、豆瓣等产品,经过多年的发展已经盘根错节。

整个社交应用的用户规模当前已经出现了“增量见顶、存量博弈”的趋势,新入局者很难击穿已有平台的壁垒。在用户使用时长上,根据艾瑞咨询数据,在2024年市场份额排名前两位社交赛道中,短视频的人均单日使用时长(138.4分钟)已经达到了聊天类应用的两倍。

这反映出用户注意力已接近饱和,社交产品的竞争已经到了不是你死我活的境地,新应用若无法从现有的巨无霸中抢夺时间,就很难培养起高黏性的使用习惯。

“AI+社交”赛道唯一可能的胜算只在于“AI”。GPT-Image-1 掀起的这一波图像热潮,给了OpenAI充分的信心。

或许对于这条路未来成功的胜算,我们尚且无法做出定论。但我们能够肯定的是:移动互联网时代的图片和视频,在AI时代依然会是大杀器。

往期推荐