当前,人工智能生成视频(AIGV)技术的突破性进展正重塑视频创作生态。然而,全球AIGV大模型在生成质量的稳定性、语义一致性以及应用场景适配性等方面存在差异。对中文用户来说,如何选择适配的AIGV模型,是媒体人应用Al面临的现实问题。

  有鉴于此,中央广播电视总台研究院联合央视网人工智能编辑部、中国传媒大学信息与通信工程学院智能媒体计算实验室,选取2024年度国内外代表性AIGV产品,包括Runway、Sora Turbo、Pika、可灵、即梦、海螺等17款文生视频及13款图生视频模型进行评测研究。现将研究成果的核心观点择要汇成报告,旨在为视频创作提供选型参考依据,同时为广电主流媒体智能化转型提供策略参考。

  一、AIGV技术驱动视频创作进入“分钟级时代”

  2024年,AIGV技术迎来里程碑式突破,其“文本-视频”端到端生成能力可实现新闻场景分钟级重构,动画制作从“逐帧渲染”迈向“一键生成”,广告创意实现“千人千面”动态交互。这一系列创新标志着AIGV技术全面进入应用爆发期。?

  国际上,OpenAI、谷歌等科技巨头聚焦技术创新,如谷歌Veo2实现2分钟4K视频生成;国内字节跳动、快手、海螺、PixVerse、阿里、腾讯等则在场景应用上突围,快手可灵模型全球用户超2200万,视频生成破1.68亿条,海螺AI海外版连续三个月蝉联全球增速榜首,彰显中国AIGV产品在全球应用领域的“超车”之势。

  二、AIGV产品核心性能评测:国产模型跻身全球第一梯队

  本次评测基于当前AIGV技术的多模态(文生视频、图生视频)生成特性,立足于用户视听创作需求,建立AIGV视频生成能力评测体系,编制涵盖多维度评测指标和细粒度评测要素的提示词库,选择国内外主流视频生成模型,通过大规模主观评价实验,得到各个模型的生成能力排名。

  AIGV评测基准的价值

  评测指标体系包括总体印象、语义一致性、真实性、视频质量、美学质量等五大核心指标及24个二级指标。

  AIGV视频生成能力评测指标

  (一)文生视频模型评测结果及分析

  根据总体印象分排名,可将17款主流文生视频模型划分为三个梯队。

  文生视频模型各项指标得分

  注:表中部分数据来自中国传媒大学和北京智源人工智能研究院联合发布的文生视频模型排行榜。

  结论1:国产模型可灵、即梦、海螺强势崛起,与国际顶尖模型Runway Gen-3、Sora Turbo并列全球第一梯队。可灵的总体印象和真实性均排名第一,展现出优异的整体生成效果和真实性刻画能力;即梦在除了视频质量之外的四个指标上都位列第二,表现出良好的综合实力;Runway Gen-3凭借语义一致性、视频质量和美学质量三项第一,彰显视觉技术优势;Sora Turbo在视频质量指标上位列第三,实力不容小觑。

  结论2:不同模型在不同场景生成任务中的表现各具特色。以排名前三的模型为例,可灵在人物类场景中具有明显优势,生成的人物形态、表情、动作等具有较高的真实感,即梦在动物类和景物类场景生成中表现突出,而Runway在超现实类场景中表现优异。

报告|AIGV产品评测与智能化视频生产策略前瞻

  结论3:在中国传统文化类生成任务中,国内模型具有相对优势。可灵、即梦等国内模型适配能力出色,优势显著。

  结论4:复杂动作行为的生成仍是当前的技术瓶颈。无论是国外模型还是国内模型,在复杂动作行为刻画方面与真实场景仍存在较大差异,这也导致所有参评模型的真实性评分均未超过60分。

  (二)图生视频模型评测结果及分析

  图生视频均来自文生视频模型的图生视频功能,因在文生视频主观评价中已对视频质量和美学质量进行了评分,因此,图生视频评测仅聚焦总体印象、语义一致性和真实性三项核心指标。依据总体印象分排名,将13款图生视频模型划分为三个梯队。

  图生视频模型各项指标得分排名

  结论1:国产模型可灵、海螺、即梦位列前三,PixVerse V3位于第五,与国外模型Runway Gen-3共同组成第一梯队,整体性能全面领先。这一结果也说明国产模型在图生视频领域也进入全球领先行列。

  结论2:不同模型在不同场景类别的生成任务中表现各异。可灵在人物、动物、人工制品、空镜等类别的生成任务中均有优异表现。此外,海螺在人物类、即梦在动物类、Runway Gen-3在人工制品类和空镜类场景中表现较好。

  结论3:尽管部分模型在部分场景下的真实性和语义一致性表现较为优异,但在输入图像语义理解、动态场景内容的一致性以及新对象与场景的自然融合等方面仍面临挑战。

  三、AIGV行业应用广泛,爆款案例涌现

  AIGV技术的突破性进展,为视听行业带来了全新创作模式,由此涌现出大量AI创作的爆款影视作品,如海内外受众达12亿的国内首部文生视频动画片《千秋诗颂》、传播量超4.3亿的原创奇幻微短剧《山海奇镜之劈波斩浪》、播放量破1.6亿的国内首部AIGV科幻短剧集《三星堆:未来启示录》、首部全AI生成的奇幻短片《熊猫奥运奇幻之旅》、社交阅读量达104亿的品牌广告片《伊笑过龙年》等等。

  可灵模型制作的《山海奇镜之劈波斩浪》

  即梦模型制作的《三星堆未来启示录》

  这些爆款作品在创作上呈现三大技术亮点:

  一是生成算法协同,通过文生视频、图生视频、动态扩展等技术,实现创意与视觉呈现的无缝衔接。

  二是多模态融合,整合剧本优化、分镜生成和动态渲染,形成高效的工作流程。

  三是智能导演系统,利用深度学习技术分析海量影视数据,精准理解创作意图,提供专业级的决策建议。这种“生成-优化-决策”的闭环不仅重塑了影视制作流程,更开创了人机协同创作的新模式。

  四、广电主流媒体应对AIGV冲击的四大策略

  国内AIGV技术已从“跟跑”迈向“并跑”,并在整体生成效果、中国文化场景还原、垂直领域适配性等关键领域实现突破,广电主流媒体可结合AIGV技术优势,加速智能化转型,重点聚焦四大方向:

  (一)依托AIGV技术,打造中华文化IP新范式

  构建“中华文化特征数据库”,通过知识图谱标注服饰纹样、建筑形制等元素,为AI生成提供文化基因库。

  (二)构建以AIGV为核心的“人-机协同”模式,实现效率质量双提升

  构建“AI创意辅助+人工把关”双轮驱动模式:AI承担剧本初稿生成、分镜设计、素材合成等标准化工作,创作团队聚焦叙事逻辑优化、情感价值注入等核心环节。

  (三)探索专用模型+通用大模型+智能体/工作流的融合发展模式

  用自家语料训练专用模型,精准服务新闻报道与影视制作,借力DeepSeek等通用模型的基础能力拓宽节目选题边界,提供创意灵感,借鉴Manus模式,打造智能体+工作流模式,实现资源整合与流程优化。

  (四)加强版权保护与规范管理

  建立无版权争议素材库,从源头解决AIGV创作素材的版权隐患;建立健全版权管理机制,加强内容审核与版权教育。利用区块链与数字水印技术追踪AI内容,识别和追踪侵权行为。

  结语

  AIGV技术突破,不仅是工具革命,更是内容生产范式的颠覆。国产模型在文化适配、多模态效率等领域的领先,为广电媒体提供了“弯道超车”机遇。通过构建“技术-内容-生态”体系,整合头部大模型优势,主流媒体有望在文化IP开发、国际传播中引领变革,推动智能媒体从“技术驱动”向“价值驱动”跃迁,开启人机协同、虚实融合的视听新纪元。

报告封面及目录

(原文发布于2025年6月6日中央广播电视总台研究院公众号)