Stability AI发布Stable Video 3D:单图生成多视图3D视频,质量大幅提升

Stability AI 近日发布了Stable Video 3D模型,该模型能够从单张图像创建多视图3D视频。

Stable Video 3D有两个版本:SV3D_u和SV3D_p。SV3D_u可以基于单个图像输入生成轨道视频,无需调整相机,而SV3D_p则扩展了SV3D_u的功能,允许沿着指定的摄像机路径创建3D视频。

相较于之前的Stable Zero123模型或开源替代品Zero123-XL,Stable Video 3D在质量上有显著提升,具有更好的多视图功能和泛化能力,能够更忠实地展现输入图像的三维全貌。

Stability AI表示,新模型的提升得益于其基石模型Stable Video Diffusion。同时,Stable Video 3D添加了摄像机路径调节功能,能够生成围绕物体的任意轨道视频。

Stable Video 3D利用其多视图一致性优化了3D NeRF和网格表示,以提高直接从新视图生成的3D网格质量。

为此,Stability AI设计了一种新的掩码分数蒸馏采样损失技术,以提高3D预测质量。同时,其解纠缠照明优化减少了照明问题,提升了阴影质量。

Stability AI表示,Stable Video 3D已可通过其会员订阅服务进行商业使用(对于个人用户每月收费20美元);而对于非商业用途,则可在Hugging Face平台上下载模型权重。

本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。

本文链接:https://www.ttsai.com.cn/news/2043.html

滚动至顶部