Pinhole Camera Model

[TOC]

成像流水线

针孔相机模型

相机将三维世界中的坐标点（单位：米）映射到二维图像平面（单位：像素）的过程能够用一个几何模型来描述，其中最简单的称为 针孔相机模型 (pinhole camera model) ，其框架如下图所示。

世界坐标系中三维点 $M=[X,Y,Z]^T$ 和像素坐标系中二维点 $m=[u,v]^T$ 的关系为： $s\tilde{m} = A [R \quad t] \tilde{M}$ 即（针孔相机模型）

\[\begin{aligned} s\left[\begin{array}{c}u\\v\\1\end{array}\right] = \left[\begin{array}{ccc} f_x&0&c_x\\0&f_y&c_y\\0&0&1 \end{array}\right] \left[\begin{array}{cccc} r_{11}&r_{12}&r_{13}&t_1\\r_{21}&r_{22}&r_{23}&t_2\\r_{31}&r_{32}&r_{33}&t_3 \end{array}\right] \left[\begin{array}{c}X_w\\Y_w\\Z_w\\1\end{array}\right] \end{aligned}\]

其中，$s$ 为缩放因子，$A$ 为相机的内参矩阵，$[R \quad t]$ 为相机的外参矩阵，$\tilde{m}$ 和 $\tilde{M}$ 分别为 $m$ 和 $M$ 对应的齐次坐标。

世界坐标系到相机坐标系

\[\begin{aligned} \left[\begin{array}{c}X_c\\Y_c\\Z_c\end{array}\right] = R \left[\begin{array}{c}X_w\\Y_w\\Z_w\end{array}\right] + t = [R \quad t] \left[\begin{array}{c}X_w\\Y_w\\Z_w\\1\end{array}\right] \end{aligned}\]

相机坐标系到像素坐标系

根据三角形相似关系，有

\[\frac{Z_c}{f} = \frac{X_c}{x} = \frac{Y_c}{y}\]

整理，得

\[\begin{cases} x = f \cdot \frac{X_c}{Z_c} \\[2ex] y = f \cdot \frac{Y_c}{Z_c} \end{cases}\]

像素坐标系 和 成像平面坐标系 之间，相差一个缩放和平移，联合上式整理得

\[\begin{cases} u = \alpha \cdot x + c_x \\[2ex] v = \beta \cdot y + c_y \end{cases} \quad \Longrightarrow \quad \begin{cases} u = \alpha f \cdot \frac{X_c}{Z_c} + c_x \\[2ex] v = \beta f \cdot \frac{Y_c }{Z_c} + c_y \end{cases}\]

或

\[\begin{cases} u = \frac{1}{dx} \cdot x + c_x \\[2ex] v = \frac{1}{dy} \cdot y + c_y \end{cases} \quad \Longrightarrow \quad \begin{cases} u = \frac{f}{dx} \cdot \frac{X_c}{Z_c} + c_x \\[2ex] v = \frac{f}{dy} \cdot \frac{Y_c }{Z_c} + c_y \end{cases}\]

其中，

\[\begin{cases} dx = \frac{W_{sensor}}{W_{image}}\\[2ex] dy = \frac{H_{sensor}}{H_{image}} \end{cases}\]

则

\[\begin{cases} f_x = \frac{f}{dx}\\[2ex] f_y = \frac{f}{dy} \end{cases} \quad \Longrightarrow \quad \begin{cases} u = f_x \frac{X_c}{Z_c} + c_x \\[2ex] v = f_y \frac{Y_c }{Z_c} + c_y \end{cases}\]

或

\[\begin{cases} f_{nx} = \frac{f}{W_{sensor}}\\[2ex] f_{ny} = \frac{f}{H_{sensor}} \end{cases} \quad \Longrightarrow \quad \begin{cases} u = f_{nx} W_{image} \frac{X_c}{Z_c} + c_x \\[2ex] v = f_{ny} H_{image} \frac{Y_c }{Z_c} + c_y \end{cases}\]

其中，

$f$ 为镜头焦距，单位为米;
$\alpha$、$\beta$ 的单位为像素/米;
$dx$、$dy$ 为传感器x轴和y轴上单位像素的尺寸大小，单位为米/像素;
$f_x$、$f_y$ 为x、y方向的焦距，单位为像素;
$f_{nx}$、$f_{ny}$ 为x、y方向的归一化焦距;
$(c_x,c_y)$ 为主点，图像的中心，单位为像素。

最终，写成矩阵的形式为：

\[\begin{aligned} \left[\begin{array}{c}u\\v\\1\end{array}\right] = \frac{1}{Z_c} \left[\begin{array}{ccc} f_x&0&c_x\\0&f_y&c_y\\0&0&1 \end{array}\right] \left[\begin{array}{c}X_c\\Y_c\\Z_c\end{array}\right] \end{aligned}\]

或

\[\begin{aligned} Z_c\left[\begin{array}{c}u\\v\\1\end{array}\right] = \left[\begin{array}{ccc} f_x&0&c_x\\0&f_y&c_y\\0&0&1 \end{array}\right] \left[\begin{array}{c}X_c\\Y_c\\Z_c\end{array}\right] \end{aligned}\]

主焦距 & 有效焦距

畸变模型

多项式畸变模型 (radial-tangential)

透镜的畸变主要分为径向畸变和切向畸变。

下图是距离光心不同距离上的点经过透镜径向畸变后点位的偏移示意图，距离光心越远，径向位移越大，表示畸变也越大，在光心附近，几乎没有偏移。

径向畸变 是由于透镜形状的制造工艺导致，且越向透镜边缘移动径向畸变越严重，实际情况中我们常用r=0处的泰勒级数展开的前几项来近似描述径向畸变，径向畸变后的归一化坐标为：

\[\begin{cases} x_{distorted} = x (1+k_1r^2+k_2r^4+k_3r^6)\\[2ex] y_{distorted} = y (1+k_1r^2+k_2r^4+k_3r^6) \end{cases}\]

切向畸变 是由于透镜和CMOS或者CCD的安装位置误差导致，切向畸变需要两个额外的畸变参数来描述，切向畸变后的归一化坐标为：

\[\begin{cases} x_{distorted} = x + 2p_1xy + p_2(r^2+2x^2)\\[2ex] y_{distorted} = y + 2p_2xy + p_1(r^2+2y^2) \end{cases}\]

联合上式，整理得

\[\begin{cases} x_{distorted} = x (1+k_1r^2+k_2r^4+k_3r^6) + 2p_1xy + p_2(r^2+2x^2)\\[2ex] y_{distorted} = y (1+k_1r^2+k_2r^4+k_3r^6) + 2p_2xy + p_1(r^2+2y^2) \end{cases}\]

其中，$r^2 = x^2 + y^2$

综上，我们一共需要5个畸变参数 $(k_1, k_2, k_3, p_1, p_2)$ 来描述透镜畸变。

畸变矫正

整张图

[图像]畸变校正详解

核心示例代码 (from here)

for (int v = 0; v < height; v++) {
  for (int u = 0; u < width; u++) {

    double u_distorted = 0, v_distorted = 0;

    double x = (u-cx)/fx;
    double y = (v-cy)/fy;

    double x2 = x*x, y2 = y*y, xy = x*y, r2 = x2 + y2;
    double x_radial = x * (1 + k1*r2 + k2*r2*r2);
    double y_radial = y * (1 + k1*r2 + k2*r2*r2);
    double x_tangential = 2*p1*xy + p2*(r2 + 2*x2);
    double y_tangential = 2*p2*xy + p1*(r2 + 2*y2);
    double xd = x_radial + x_tangential;
    double yd = y_radial + y_tangential;

    u_distorted = xd*fx + cx;
    v_distorted = yd*fy + cy;

    // 最近邻插值
    if (u_distorted >= 0 && v_distorted >= 0 && u_distorted < width && v_distorted < height)
        img_dst(v, u) = (*this)((int) v_distorted, (int) u_distorted);
    else
        img_dst(v, u) = 0;
  }
}

单点

上面逆向过程 (PinholeCamera::liftProjective())

// Lift points to normalised plane
mx_d = m_inv_K11 * p(0) + m_inv_K13;
my_d = m_inv_K22 * p(1) + m_inv_K23;

Apply Inverse distortion model

// Apply inverse distortion model proposed by Heikkila
mx2_d = mx_d*mx_d;
my2_d = my_d*my_d;
mxy_d = mx_d*my_d;
rho2_d = mx2_d+my2_d;
rho4_d = rho2_d*rho2_d;
radDist_d = k1*rho2_d+k2*rho4_d;
Dx_d = mx_d*radDist_d + p2*(rho2_d+2*mx2_d) + 2*p1*mxy_d;
Dy_d = my_d*radDist_d + p1*(rho2_d+2*my2_d) + 2*p2*mxy_d;
inv_denom_d = 1/(1+4*k1*rho2_d+6*k2*rho4_d+8*p1*my_d+8*p2*mx_d);
  
mx_u = mx_d - inv_denom_d*Dx_d;
my_u = my_d - inv_denom_d*Dy_d;

Recursive distortion model

// Recursive distortion model
int n = 8;
Eigen::Vector2d d_u;
distortion(Eigen::Vector2d(mx_d, my_d), d_u);

// Approximate value
mx_u = mx_d - d_u(0);
my_u = my_d - d_u(1);
  
for (int i = 1; i < n; ++i)
{
    distortion(Eigen::Vector2d(mx_u, my_u), d_u);
    mx_u = mx_d - d_u(0);
    my_u = my_d - d_u(1);
}

PREVIOUS基于数字光栅投影的结构光三维测量技术

NEXTComputer Vision Libraries