Cross-Based Local Stereo Matching for Orthogonal Integral Images

文章阅读
作者: MingXiao

IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 19, NO. 7, JULY 2009


1 Introduction

将立体配准手段大致分为了两类

  • 在预先定义的多个窗口中选择最合适的,缺点是窗口的形状受到了限制
  • 在一个窗口内修改像素的权重,很显然开销很大

本方法的关键思想,见上文提及

2 具体算法

假设:在一个区域内,匹配的元素应该有相似的灰度和视差

为了找到点\(p(x_0,y_0)\)所在的区域,以\(p\)为中心,构造cross,将水平段记为集合\(H(p)\),竖直段记为集合\(V(p)\),并定义一个集合\(\{h_p^-, h_p^+, v_p^-,v_p^+\}\)作为这个cross的边界限制

这个边界集合的定义是关键,回顾图像分割的内容

最终得到的结果和一个3*3的cross取最大值,保证一定存在一个区域而非单个元素

在\(V(p)\)上做滑动,每一个\(V_i(p)\)都能根据一个规则生长出一个\(H_i(p)\),将所有的\(H_i(p)\)作为这个区域的元素
\[ U(p) = \bigcup\limits_{q\in V(p)} H(q) \]
交换\(H,V\)的地位,也能得到很相近的结果

后面整合cost的部分见上文

3 快速整合算法

还是这个问题,整合的数据量太大了,想办法减少数据量

这里选择的方法是数据复用

原先的区域加和,可以分解为先水平加和,再竖直加和

首先计算全局的可能的水平条的加和,再计算对于区域时调用即可

算法的关键在于d图的复用



Comments