编辑 | Yuki ID:YukiYuki1108
AI 生成的体操视频火了,百万网友围观,LeCun等大佬掀起论战。
体操表演,emmmm 怎么不算呢?
从视频右上角水印来看,这段视频出自Luma AI的Dream Machine,被称为“下一代”文生视频的神器。
网友看后纷纷坐不住,议论的核心是:AI是否真的理解物理规律。
LeCun直言不讳:
“视频生成模型不懂基本物理知识,更不用说人体结构了。”
畸形的动作确实离谱自Sora问世以来,关于“AI是否理解物理规律”的话题一直热议不断。以下这段Sora生成的“寄居蟹用灯泡当外壳的夜间场景”是个经典案例,海浪和沙滩的互动非常细腻,寄居蟹腿上的纤毛也栩栩如生。
和真实拍摄的类似场景照片对比,唯一的破绽就是灯泡没电源不该亮。
华盛顿大学计算机科学教授Pedro Domingos也表示怀疑:
“AGI(通用人工智能)可能并不像一些人预期的那样即将到来。”
因此,很多人认为Sora、LUMA等视频生成模型已经理解了简单的物理规律。
然而,这次的体操视频实在太荒唐。
不仅动作乱飞,还频频上演“变活人”:
这高难度的空中悬浮翻跟头,连牛顿都要被气活了:
网友看后表示,恐怖不至于,但搞笑是有点。
如此抽象的表现,LeCun直接评论说视频生成模型不懂物理。
他进一步解释,Sora或其他视频生成模型都有类似的问题,视频生成技术肯定会随时间进步。
但:真正理解物理的学习系统并不具备生成性。鸟类、哺乳动物等比任何视频生成系统更了解物理,但它们都不能生成详细的视频。
也有人提出另一种看法:即使AI视频生成模型未来会进化得很完美,生成的视频质量无瑕疵,是否就意味着它理解物理了?
LeCun的观点立刻引发网友质疑:
鸟和哺乳动物也会在大脑中生成详细的视频,只是无法具象化。
这种反驳未能说服LeCun。
此外,还有不少人持反对意见。
例如,谷歌DeepMind/Brain团队研究员Lucas Beyer指出:
这就像展示几年前的Dall·E mini生成的图像,然后宣称当前的图像生成方式注定失败一样。
毕竟,之前生图模型生成的图像也是这样的:
至于模型为什么会生成如此离谱的视频?
有网友认为是缺乏体操表演数据,也有网友认为是身体部位的模糊处理,使得模型无法理解人体结构,导致动作不连贯。
视频生成更复杂,并且高度依赖上下文,对详细标注的训练数据需求更大,目前这些需求还未得到充分满足。
前段时间SD 3翻车,同样对人体生成效果不佳,网友也讨论过这一问题,过于严格的数据审核,可能误删了一些无害的成人图像,影响了模型对人体结构的理解。
总之,AI视频生成模型的进步还需要时间和更多的训练数据,但目前的表现确实让人大跌眼镜。网友的热议与质疑,也为这个技术领域的未来发展提供了更多思考的空间。
