Stability AI发布Stable Video 3D：单图生成多视图3D视频，质量大幅提升 - 天天学术AI写作系统专注学术论文写作的工具|毕业论文|期刊投稿|开题报告|任务书www.ttsai.com.cn

Stability AI 近日发布了Stable Video 3D模型，该模型能够从单张图像创建多视图3D视频。

Stable Video 3D有两个版本：SV3D_u和SV3D_p。SV3D_u可以基于单个图像输入生成轨道视频，无需调整相机，而SV3D_p则扩展了SV3D_u的功能，允许沿着指定的摄像机路径创建3D视频。

相较于之前的Stable Zero123模型或开源替代品Zero123-XL，Stable Video 3D在质量上有显著提升，具有更好的多视图功能和泛化能力，能够更忠实地展现输入图像的三维全貌。

Stability AI表示，新模型的提升得益于其基石模型Stable Video Diffusion。同时，Stable Video 3D添加了摄像机路径调节功能，能够生成围绕物体的任意轨道视频。

Stable Video 3D利用其多视图一致性优化了3D NeRF和网格表示，以提高直接从新视图生成的3D网格质量。

为此，Stability AI设计了一种新的掩码分数蒸馏采样损失技术，以提高3D预测质量。同时，其解纠缠照明优化减少了照明问题，提升了阴影质量。

Stability AI表示，Stable Video 3D已可通过其会员订阅服务进行商业使用（对于个人用户每月收费20美元）；而对于非商业用途，则可在Hugging Face平台上下载模型权重。

本站文章通过互联网转载或者由本站编辑人员搜集整理发布，如有侵权，请联系本站删除。

Related Posts