引言

（下文的讨论基于右手坐标系，以及矩阵左乘顺序。）

我对视角矩阵的理解是这样子的，假设3维空间有一个观察者（摄像机），这个观察者必然有它的坐标位置、视角、焦点，根据这3个参数，可以建立一个正交化、规范化的坐标系（一个正交化、单位化的3x3矩阵），这个坐标系对应的矩阵就是Lookat矩阵。

根据上面这个我自己创造的定义，可以知道，Lookat矩阵只和观察者的坐标、焦点、视角有关，和被观察的东西完全无关，也就是说，Lookat矩阵是independent的，这个性质的好处是，这个观察者的Lookat矩阵，可以应用到任意目标上。

观察者的坐标、焦点、视角，可以进一步抽象。观察者坐标位置设为eye向量，焦点位置设为focal向量，视角呢，比较特殊，是设为一个up向量，含义是这个观察者的头顶朝向。

可以想象成，观察者就是你自己，你站在地面上，盯着远处一个美女，可以是盯着她的腿、她的腰，都无妨。

看的过程中，你可以往左侧着头看，也可以倒立着看，不会影响focal向量，因为你的眼睛还是能看见美女。

但是当你低头时，情况就有些变化了。第一种情况：你对着美女弯腰90度，focal向量变成指向了地面上的某个点，up向量虽然还是沿着你头部的方向，不过因为弯腰90度的关系，已经不是朝着上方了(大约是指向了美女的方向)；第二种情况是，你只是微微低头(大于15度这样子)，眼睛还是能看到美女（低头15度的视野和完全直立时一致），不过，up向量被改变了，因为你的头转了15度。

通过这个例子，可以知道，focal向量和up向量之间是存在联系的，而eye向量则和focal、up向量没有关系，eye向量决定的是你所在的位置。

唠嗑到这里，下面进入数学环节。

推导

当eye、focal、up三个向量的值确定后，就可以构造Lookat矩阵了。

首先明确2点：一，Lookat矩阵是正交且规范化的；二，我们使用的是右手坐标系。

这个Lookat矩阵，相当于是一个坐标系，那么可以设三个坐标轴的方向向量分别为\(\vec r\)、\(\vec u\)、\(\vec f\)，分别的含义是，观察者坐标系的+x、+y、+z方向。

focal向量

focal向量一般是通过计算被观察位置center和观察者的位置eye的差值得到的，focal = center - eye，然后要单位化:

\[ \overrightarrow {focal} = \frac {\overrightarrow {target} - \overrightarrow {eye} }{ |\overrightarrow {target} - \overrightarrow {eye}| } \]

f向量

上面得到的focal向量此时是朝向屏幕里侧的，而我们需要的是右手坐标系下的f向量（+z），应该是朝向屏幕外侧，所以f要取focal的反方向：

\[\vec f = - {\overrightarrow {focal} } \]

r向量

接着是\(\vec r\)。显然，\(\vec r\)指的方向是focal和up的叉积。

\[\vec r = \frac {\overrightarrow {focal} \times \overrightarrow {up}}{|\overrightarrow {focal} \times \overrightarrow {up}|} \]

这里用了叉积，叉积后得到的向量的方向，可以用一个小技巧识别：以叉积符号左边的向量当做"自己"的up向量（指向自己头顶），然后想象自己向叉积符号右边的向量靠近，靠近过程中，左手边方向就是结果向量的方向。

u向量

u不一定等于up，因为up和focal的夹角不一定是90度。

\(\vec r\)、\( \overrightarrow {focal} \)都得到后，\(\vec u\)的计算很简单，因为\(\vec r\)、\( \overrightarrow {focal} \)已经规范化、正交化了的，那么\(\vec u\)就是他们的叉积：

\[\vec u = \vec r \times \overrightarrow {focal} = \vec r \times (-\vec f) = -\vec r \times \vec f = \vec f \times \vec r \]

注意，这一步叉积的调用顺序很关键，别弄错了；而且这一步不需要单位化了，能节省计算。

构造矩阵

设Lookat矩阵为M，则M等于：

\[ M = \left[ \begin{matrix} r_{x}&r_{y}&r_{z}&0\\ u_{x}&u_{y}&u_{z}&0\\ f_{x}&f_{y}&f_{z}&0\\ 0&0&0&1\\ \end{matrix} \right] \]

拿这个M和单位矩阵I对比下：

\[ I = \left[ \begin{matrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1\\ \end{matrix} \right] \]

可以发现，单位矩阵I相当于是把观察者放在世界空间的原点。因为I的\(\vec r\)、\(\vec u\)、\(\vec f\)已经是规范化、正交化的，且和世界坐标系一致。

所以上面的M可以理解为：M等于M乘以I。含义是，把世界坐标系变换到观察者坐标系。也即相当于调整了对world的观察角度。

到了这里，事情还没完，因为这个M并不能体现出观察者的位置，为什么呢？因为\(\vec r\)、\(\vec u\)、\(\vec f\)是规范化的向量，长度都为1，并不包含位置信息。

和单位矩阵I对比的话就清楚了，单位矩阵I之所以不需要位置信息，是因为单位矩阵I已经隐含了一个信息：观察位置就在(0,0,0)。

观察位置，上面已经定义过了，它就是eye向量。

把观察者放到eye位置，反过来想，相当于是把被观察的东西偏移-eye的距离。实际上，我们正在构造的Lookat矩阵，不是要作用到观察者身上，而是要作用到被观察者（world）身上的。

因此，现在可以根据eye向量构造一个移动矩阵T(Translate)了：

\[ T = \left[ \begin{matrix} 1&0&0&-eye_{x}\\ 0&1&0&-eye_{y}\\ 0&0&1&-eye_{z}\\ 0&0&0&1\\ \end{matrix} \right] \]

然后把M和T合并，即得到了Lookat矩阵：

\[ Lookat = MT \]

\[ = \left[ \begin{matrix} r_{x}&r_{y}&r_{z}&0\\ u_{x}&u_{y}&u_{z}&0\\ f_{x}&f_{y}&f_{z}&0\\ 0&0&0&1\\ \end{matrix} \right] \left[ \begin{matrix} 1&0&0&-eye_{x}\\ 0&1&0&-eye_{y}\\ 0&0&1&-eye_{z}\\ 0&0&0&1\\ \end{matrix} \right] \]

\[ = \left[ \begin{matrix} r_{x}&r_{y}&r_{z}&-r_{x}eye_{x}-r_{y}eye_{y}-r_{z}eye_{z}\\ u_{x}&u_{y}&u_{z}&-u_{x}eye_{x}-u_{y}eye_{y}-u_{z}eye_{z}\\ f_{x}&f_{y}&f_{z}&-f_{x}eye_{x}-f_{y}eye_{y}-f_{z}eye_{z}\\ 0&0&0&1\\ \end{matrix} \right] \]

简化下：

\[ Lookat = \left[ \begin{matrix} r_{x}&r_{y}&r_{z}&-(\vec r\cdot \overrightarrow {eye})\\ u_{x}&u_{y}&u_{z}&-(\vec u\cdot \overrightarrow {eye})\\ f_{x}&f_{y}&f_{z}&-(\vec f\cdot \overrightarrow {eye})\\ 0&0&0&1\\ \end{matrix} \right] \]

翻译成代码


static Matrix4x4 LookAt(const Vector3dF &eye, const Vector3dF &target, const Vector3dF &up) {
    Vector3dF focal = (target - eye).Normalize();
    Vector3dF r = (focal.Cross(up)).Normalize();
    Vector3dF u = r.Cross(focal);
    Vector3dF f = -focal;
    return Matrix4x4{
        r.x, r.y, r.z, -r.Dot(eye),
        u.x, u.y, u.z, -u.Dot(eye),
        f.x, f.y, f.z, -f.Dot(eye),
        0,   0,   0,    1
    };
}

(未经授权禁止转载)

Written on March 20, 2016

写作不易，您的支持是我写作的动力！

Wyman的原创技术博客

线性代数之视角矩阵Lookat Matrix

Tags: matrix, linear algebra

引言

推导

focal向量

f向量

r向量

u向量

构造矩阵

翻译成代码