diff --git a/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md b/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md index b32b2e5..b901a27 100644 --- a/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md +++ b/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md @@ -915,7 +915,11 @@ Text‑to‑Image 模型通常同时支持多风格、多分辨率输出:通 在 NeRF 中,整个 3D 场景被建模为一个连续函数: -![](https://ecn00p15ubf1.feishu.cn/space/api/box/stream/download/asynccode/?code=ZjYyZTc5MWFhY2QxM2FjNTI1MDFhNDM5NTEwNTBkNGFfM3RvSngwZnhwc1hMRFQxaXVXMkFNem5RSFFqUkppdkdfVG9rZW46TVltUGJUUWRib1NGV2V4dklHZ2NYandjbkJlXzE3NjcxMDU4ODM6MTc2NzEwOTQ4M19WNA) +$$ +F_\theta(\mathbf{x}, \mathbf{d}) = (\sigma, \mathbf{c}) +$$ + +其中 $\mathbf{x}$ 表示三维空间中的点位置,$\mathbf{d}$ 表示观察方向,$\sigma$ 表示体密度,$\mathbf{c}$ 表示颜色,$\theta$ 为网络参数。 给定三维空间中的一个点位置 x 和观察方向 d,网络会输出该点对应的体密度 σ 与颜色 c。沿着相机视线方向对这个映射函数做体渲染积分运算,我们就能得到该相机位姿下的像素颜色;反过来,只要给定一组多视角照片及其相机参数,我们就能通过最小化渲染结果与真实图像的误差,求解出模型的参数 θ。待模型训练完成后,只需改变相机位姿,就能合成那些 “从未被真实拍摄过” 的新视角图像(Novel View Synthesis)。