015 NeRF Representing Scenes as Neural Radiance Fields for View Synthesis

Zhangwenniu 于 2022-10-11 发布

标题

NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis, link

期刊

ECCV, 2020, 1432 citations. arxiv link, arxiv pdf link

后来又被期刊Communications of the ACM收录,pdf link, website link

Project link: https://www.matthewtancik.com/nerf

贡献

使用MLP学习三维场景中的隐含形式,给定100张场景中的视角图片训练模型,通过体渲染的方式获取新视角下的图像。

公式解读

突破性理解的笔记

连续积分不容易处理,使用离散采样求和的方法,逼近连续积分的精确数值。

感想

神经辐射场;神经。

计算机视觉的终极意义是什么?一是理解人是如何获取视觉的,如何理解现实世界,并把这种理解迁移到计算机中,形成计算机视觉。

二是,用重建的方法,形成计算机的视觉之后,更好的服务于现实场景、现实世界。

无论是体素表示还是mesh表示或是点云表示,都是为了找到现实场景在计算机中的表达。那么,现实场景在人思维中的表示,必然不会是mesh或者体素或是点云,他们只是媒介。

人能够理解世界,靠的不是将事物的三维形状在脑中重建,而是形成经验内化在脑海中。下一次见面的时候,就能够形成特有的认知,得到所见物体的直观感受。

因此,神经辐射场、隐表示,都符合世界在人脑海中的映像:不必了解具体模型在计算机中的占有表示,只需要知道一种内化的、可以重新索引、重新建构的内化知识即可。

因此,不是因为技术而去索求应用场景,而是因为解决应用的场景才催生了各种技术。