9

靠网上晒的景点照就能还原3D建模,浙大团队这是要带我们云旅游?

 3 years ago
source link: https://www.36kr.com/p/1759173460340998
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

靠网上晒的景点照就能还原3D建模,浙大团队这是要带我们云旅游?

量子位·2022-05-27 09:31
可以直接导入到电影、游戏和VR等图形生产线

以NeRF为代表的神经渲染技术高速发展,学界已经不满足合成几个新视角让照片动起来了。

接下来要挑战的是根据照片直接输出3D模型,可以直接导入到电影、游戏和VR等图形生产线里的那种。

v2_7f14a06f3d414f108de715b785c64d92_img_000

所用照片不是出自高质量数据库,就是直接从网上搜集游客拍摄的各大景点,设备、天气、距离角度等都会不一致。

生成的结果远看结构完整,近看细节丰富,如果你有VR设备也可以在Demo中直接预览3D版。

v2_1f3497f018be4d1da27d3fa73a037f3f_img_000

这项最新突破由浙江大学和康奈尔大学团队合作完成,登上图形学顶会SIGGRAPH 2022

v2_fdf9740a95ab446a832f9ca9637cf3f8_img_000

而在这之前,同类技术生成的3D模型连形状完整都做不到。

v2_d4046fd94c3640cfb4436504152deb1a_img_000

看到这里,网友纷纷表示这个领域的进展比人们想象的要快。

v2_c3d2cc23dbfb440e8ec6c81824194879_img_000

“慢点学,等等我”。

v2_dd9b1589b3d447b985543c57c98a9592_img_000

那么,这项研究靠什么取得了突破?

融合两种采样方式

具体来说,这项研究的基本框架借鉴了NeurIPS 2021上的NeuS,一种把隐式神经标准和体积渲染结合起来的方法。

v2_2afdb10b93634427b2e626a586c38a7d_img_000

但是NeuS使用基于球体的采样(Sphere-based sampling)方法,对于近景、小物体来说还算适合。

用于结构复杂的大型建筑物的话会有大量采样点采在空白区域,增加大量不必要的计算压力。

v2_4b6ce54ae13e46618aa0b51b3131be87_img_000

为解决这个问题,研究人员提出体素引导(Voxel-guided)和表面引导(Surface-guided)混合的新采样方法。

v2_64ae9f523ba14d34aabc5aa2e9a7519f_img_000

体素引导可以避免不必要的浪费,训练时所需射线(Traning ray)可以减少30%

再结合表面引导增加真实曲面周围的采样密度,帮助神经网络更好拟合,避免丢失细节。

在消融实验中可以看到,仅使用体素引导方法收敛的比基于球体的方法快,但不如混合方法细节丰富。

v2_410ddf4a26ee4d2ba9c07233ea8105fc_img_000

与之前同类研究对比,新方法生成模型的完整性和细节方面更出色。

v2_dd793c142a8c496889bade4e49a8f9d9_img_000

训练速度上也有明显优势,特别是在大型场景墨西哥城美术宫(PBA)。

v2_9791e2035c05473d9da66d93adf2a32d_img_000

Ours为完全收敛结果,带小人图标的是训练过程中一个检查点

当然,新方法也不是完全没有缺点。

一个继承自NeRF的局限性是,如果相机位置校准有偏差会影响最终结果。

还有一个难以解决的问题,就是照片拍不到的建筑物背面和内部就无法精确重建了。

v2_ea211f96e0cf49319512a5619cbc678a_img_000

One More Thing

最后再补充一点,浙大团队中一些成员,之前还研究了神经3D人体重建。

v2_fae575cd566d480daea3d237fae39d4b_img_000

v2_e19886aa6eef459682d31c36f1166aae_img_000

可应用于为体育比赛提供自由视角的视频重放。

v2_4ba8227eb3744191ab5f675ed7813935_img_000

也是666了。

https://arxiv.org/abs/2205.12955

GitHub仓库

https://zju3dv.github.io/neuralrecon-w/

[1]https://zju3dv.github.io/neuralbody/

本文来自微信公众号“量子位”(ID:QbitAI),作者:梦晨,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

</div


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK