01|Unique3D海外出圈,被外网媒体提名为最佳3D生成,由00后清北团队开发
最近清华的学霸们搞了个超酷的3D生成模型,名叫Unique3D。模型在github和huggingface上已经开源了,一上线就登上了Huggingface的热门模型排行榜,还被旗下官方工具Gradio在海外媒体上提名为“best image-to-3d model”(最佳图片生成3D模型)。
Unique3D提出了创新的多视图扩散和多级分辨率提升的模型及重建算法,具有目前可用的最高精度和高一致性的几何与材质。不管你扔给它什么图片,它都能在短短30秒内,给你变出一个跟原图一样精细的3D模型。许多海外网友也感慨“写真级3D”,“the pinnacle”(顶峰级),“best 3d generative AI”,“3d generation finally solved?”(3D生成最终解决)。
Unique3D从图像生成“写真级3D”过程
Unique3D生成的模型合集
而Unique3D的研发团队Aiuni AI,并非是顶级的科学家或大厂工程师团队,而是来自清华北大的平均年龄00年的团队。
Aiuni创始人及CEO April Hu胡雅婷来自北京大学计算机系,曾在Google/阿里/字节做过算法工程师,是一名00后女性创业者,也是近期36Kr评选的2025 U36创业者中最年轻的一位。
April评选为2025 U36中最年轻的创业者
技术合伙人兼CTO Kailu Wu吴凯路,来自天才少年云集的清华姚班,在叉院做在3D生成和NeRF科研,本科期间就发表了多篇顶会论文,创新性地提出了FSD(text-to-3d流分数蒸馏)和MemSR(高效训练超分辨率模型)。
April和Kailu曾参与NOI信息学奥林匹克竞赛拿过全国金牌,Kailu是国家集训队,而April是最佳女选手。
Unique3D研究员包括清华大学phd,本科期间就在清华电子系综合测评Top1。研究领域覆盖各类前沿3D生成,包括Physics3D(通过视频扩散学习3DGS物理特性)、Make-Your-3D(主题驱动 3D 内容生成)、Sherpa3D(3D 先验增强文本到 3D 生成)和DreamReward(符合人类偏好的文本到 3D 生成)。
Aiuni AI及Unique3D团队
目前Aiuni团队人数很少但全员00后清北天才——有竞赛金牌也有高考状元,有计算机顶级会议最年轻的第一作者也有AI影视作品上过央视的新锐导演。Aiuni甚至没有严格意义上的全职员工,而在开放合作AI研究员与CG艺术家。
女性科技创始人及技术团队的算法竞赛背景,很像爆火的AI视频领域Pika的团队配置。
02|Aiuni AI,AI技术结合CG艺术,生成3D模型、场景、动画、分镜
Unique3D开源了训练Objaverse开源数据的版本,而训练了更高质量Lisence Data商用私有数据及进行了工程优化的模板上线到Aiuni网页端。
不管你是想用人像照片、手绘图片,还是电商图片,甚至是MJ和SD生成的AI原生图像,Aiuni都能轻松搞定,一键生成高精度的3D模型。
Aiuni AI比起其他工具,它的特点就是超!高!精!度!无论是几何还是材质,都能达到令人惊叹的水准,而且输入的图像还能实现1:1的&34;像素级还原&34;。在Aiuni生成阶段,会生成四视图4K分辨率的材质预测,并且有百万级的顶点精度,再通过拓扑烘焙算法形成四边面的标准模型,易于导入CG管线及后续的编辑和创作。
Aiuni.ai 通过图像生成的3D模型
所以Aiuni AI生成的模型,在白膜精细度、布线规范性、法相一致性、材质清晰度,有超过同类产品的表现。这就意味着,在数字设计、动画影视制作等对模型的精细度和还原度高要求的领域,用Aiuni可以生成高质量的3D艺术效果。
四边面布线、高精度材质、高保真法相
目前Aiuni AI已经和多家动画、影视、品牌、IP行业的上市公司及大厂达成了战略合作,同时C端新媒体内容和社群运营也在持续增长,目前海内外的用户都会自发主动把生成的3D作品运用在数字艺术、动画创作、电商渲染、IP设计等领域。
Aiuni生成的模型的CG渲染效果
03|不止于3D,剑指更高难度的4D生成
3D生成的下一步是什么?
最近,3DGS团队的Luma AI搞了个大新闻,发布了一款AI视频效果,动作幅度和运镜范围直接秒杀同类AI视频。有技术人员分析认为是在训练视频的过程中结合了3D信息,可见3D+视频的多模态或是一个值得关注的方向。
而对于Aiuni而言,选择将3D算法开源也是因为3D生成只是一个起点,接下来的重点是通过结合3D、视频、动画、图形学的多模态算法,生成拥有时空维度的4D内容。
3D空间维度,360度场景一致性
3DWorld功能 生成的360全景场景
Aiuni用文本或图片就能召唤出360度全景场景。Aiuni的4D技术,就像是一个超级稳定的时空锚,保证了场景的一致性和视野的连续性。Aiuni还支持360度任意镜头运动,多机位长时间视频渲染,这就意味着,无论是你想来个大范围的全景运镜,还是想搞个多角度的长时间拍摄,在Aiuni中都可以生成任意的场景模型。
4D时间维度,成为高频可互动的内容
3D模型本身只是一种格式、并不承载内容,所以目前3D资产的导出都是偏专业化场景。但当3D模型增加时间维度后,拥有动作和动画的模态后,便可以成为有叙事有表达的4D动态,就可以成为高频交互的消费级内容。
Aiuni AI目前围绕着图形学算法及4DGS的算法生成多模态的4D内容。这样比起助帧生成的AI视频、或者只基于计算机视觉和NeRF的方案,更加拥有角色连续性、动作镜头的可控性和可编辑性。
一张图生成场景+一张图生成角色动画
4D生成比起AI视频有什么优势?
通过3D对于物理世界的先验,4D内容生成比起逐帧生成的AI视频,可以更好的实现角色一致性、场景一致性、动作连续性、物理规律性、广泛运镜幅度,从而形成实时渲染有准确叙事和表达的长视频。
目前Aiuni正在开发上线的模块包括角色生成、场景生成、动作生成、表情动画、运镜生成、渲染合成。Aiuni希望打造新一代端到端的CG艺术工作流,通过AIGC的原生流程重新定义CGI和VFX动画视频。
在Aiuni中,用户可以自由搭配场景、角色、动作、运镜,比起逐帧视频拥有更好的可控性、可编辑性、可交互性。
DreamCamera功能 视频人物替换为生成角色
此外Aiuni AI也非常注重虚拟内容和现实素材的结合,DreamCamera可将生成的AI角色合成进入实拍视频,让内容创作者都可以此前需要繁琐影视流程的特效内容。同时Aiuni还兼容VisionPro等MR的渲染环境。
4D内容的MR未来是什么?
在3D和4D的世界里,内容渲染成平面照片或视频,这事儿已经不新鲜了。在下一代MR设备中将拥有3D原生的表示,当你带上VisionPro,它们不再是平面的图片或视频,也不是通过视察计算出来的3D效果,而是可以真真切切实时互动的4D内容。
Aiuni的模型在VisionPro中互动
接下来,Aiuni AI也将持续训练结合3D、视频、动画、图形学的多模态算法,训练角色大模型、场景大模型、动作大模型,以及4D原生表征的算法和数据,形成时空大模型。
除了AI算法本身,Aiuni更重视产品工作流与内容完成度。他们的目标是让用户不只是导出一个3D模型或者一段短短的视频,而是能够生成可编辑、可交互、有叙事和镜头感、充满IP潜力的4D内容。这就像是给创作者们一个超级工具箱,让他们的创意能够无限扩展,创造出真正有深度、有灵魂的作品。
目前,Aiuni的3D模型和3D场景正在网站(https://aiuni.ai)和社群内测中,4D生成、动画生成等功能也将在接下来陆续上线。Aiuni的slogan是“AI Actualize Unique Inspiration”,希望让创作者的每个独特灵感,扩展内容的时空新维度,赋予数字世界无限创造力和生命力。4D动画长视频仍然存在着许多跨模态的挑战,Aiuni也在积极招募全球的AI前沿研究者及CG数字艺术家合作,打造开源和共创的生态。
宇航员在Image-Dreamer生成的无限场景
参考链接
Unique3D includes a multi-view diffusion model with a corresponding normal diffusion model to generate multi-view images with their normal maps, a multi-level upscale process to progressively improve the resolution of generated orthographic multi-views, as well as an instant and consistent mesh reconstruction algorithm called ISOMER.
开源地址:https://wukailu.github.io/Unique3D/
HuggingFace:https://huggingface.co/spaces/Wuvin/Unique3D
项目主页:https://wukailu.github.io/Unique3D/
论文地址:https://arxiv.org/pdf/2405.20343
-----------END-----------
关于Z Potentials
🚀 我们正在招募新一期的Z Explorer