diff --git a/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md b/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md
index b32b2e5..b901a27 100644
--- a/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md
+++ b/docs/zh-cn/appendix/8-artificial-intelligence/ai-capability-dictionary.md
@@ -915,7 +915,11 @@ Text‑to‑Image 模型通常同时支持多风格、多分辨率输出：通
 
 在 NeRF 中，整个 3D 场景被建模为一个连续函数：
 
-![](https://ecn00p15ubf1.feishu.cn/space/api/box/stream/download/asynccode/?code=ZjYyZTc5MWFhY2QxM2FjNTI1MDFhNDM5NTEwNTBkNGFfM3RvSngwZnhwc1hMRFQxaXVXMkFNem5RSFFqUkppdkdfVG9rZW46TVltUGJUUWRib1NGV2V4dklHZ2NYandjbkJlXzE3NjcxMDU4ODM6MTc2NzEwOTQ4M19WNA)
+$$
+F_\theta(\mathbf{x}, \mathbf{d}) = (\sigma, \mathbf{c})
+$$
+
+其中 $\mathbf{x}$ 表示三维空间中的点位置，$\mathbf{d}$ 表示观察方向，$\sigma$ 表示体密度，$\mathbf{c}$ 表示颜色，$\theta$ 为网络参数。
 
 给定三维空间中的一个点位置 x 和观察方向 d，网络会输出该点对应的体密度 σ 与颜色 c。沿着相机视线方向对这个映射函数做体渲染积分运算，我们就能得到该相机位姿下的像素颜色；反过来，只要给定一组多视角照片及其相机参数，我们就能通过最小化渲染结果与真实图像的误差，求解出模型的参数 θ。待模型训练完成后，只需改变相机位姿，就能合成那些 “从未被真实拍摄过” 的新视角图像（Novel View Synthesis）。