博客
关于我
深度图像的获取原理
阅读量:345 次
发布时间:2019-03-04

本文共 1178 字,大约阅读时间需要 3 分钟。

深度图像的获取原理

在计算机视觉系统中,三维场景信息为图像分割、目标检测、物体跟踪等各类计算机视觉应用提供了更多可能性。深度图像作为一种普遍的三维场景信息表达方式,广泛应用于多个领域。深度图像的每个像素值可用于表征场景中某一点距离摄像机的远近。

获取深度图像的方法主要可分为两类:被动测距传感和主动深度传感。

被动测距传感

被动测距传感最常用的方法是双目立体视觉。该方法通过两个相隔一定距离的摄像机同时获取同一场景的两幅图像,通过立体匹配算法找到两幅图像中对应的像素点。基于三角原理计算出的视差信息可转换为深度信息。立体匹配算法还可通过拍摄同一场景下不同角度的一组图像来获得深度图像。除此之外,深度信息还可通过图像的光度特征、明暗特征等特征间接估算得到。

Middlebury Stereo Dataset是常用于深度图像增强领域的测试数据集,属于被动测距传感范畴。该方法通过两个相隔一定距离的相机获取两幅图像,结合立体匹配算法和三角原理计算视差(disparity),从而得到深度图像。

主动测距传感

主动测距传感的特点是设备需要发射能量来完成深度信息的采集。其优势在于深度图像获取与彩色图像获取相互独立。近年来,主动深度传感在市面上的应用越来越广泛。该方法主要包括TOF(Time of Flight)、结构光、激光扫描等。

TOF相机

TOF相机通过发射连续的近红外脉冲并接收反射回的光脉冲,计算光脉冲传输延迟来推算物体距离,进而得到深度图像。该方法的缺陷包括深度图像分辨率低于彩色图像,深度值易受噪声干扰,边缘区域深度值误差较大,且成本较高。

结构光与Kinect

结构光通过特定模式的光投射至场景并捕获图像,根据光图案形变程度和位置计算深度信息。结构光测量技术提供了高精度且快速的三维信息,已广泛应用于汽车、游戏、医疗等领域。微软公司推出的Kinect设备结合了彩色图像和深度图像,应用于人机交互、三维场景重建等领域。

Kinect采用光编码技术,通过激光散斑获取深度信息。光编码的光源发射具有三维纵深的立体编码,激光散斑具有高度的空间随机性。该技术通过红外摄像机捕获散斑图像,进而获取深度信息。Kinect的价格低廉且实时高分辨率深度图像捕捉特性使其在消费电子领域应用迅猛。然而,其有效测距范围有限,深度缺失区域较多,且深度图像边缘与彩色图像边缘不一致等问题。

激光雷达

激光雷达通过激光扫描获取三维信息。其原理是按照一定时间间隔发射激光并记录反射信号,从而计算物体表面与激光雷达的距离。激光雷达在室外三维感知、自主车避障导航等领域应用广泛。Velodyne HDL-64E激光雷达在自主车中应用,其全向扫描能力使其成为标准配置。然而,其捕获的三维信息在彩色图像坐标系下呈不均匀稀疏分布,导致深度图像深度值以离散点形式呈现,许多区域深度值未知。

转载地址:http://yvfr.baihongyu.com/

你可能感兴趣的文章
mysql时间相关函数和操作
查看>>
万物皆可爬系列查看翻页翻到最后是什么
查看>>
python scrapy
查看>>
pymongo的使用
查看>>
A Guide to Node.js Logging
查看>>
前端基础知识学习FreeCodeCamp
查看>>
css的一些基础知识
查看>>
webwxbatchgetcontact一个神奇的接口
查看>>
Edge浏览器:你的的内核我的芯
查看>>
chrome浏览器功能介绍
查看>>
linux shell 读取文件脚本
查看>>
git命令升级版用法
查看>>
sed常用命令
查看>>
linux下各种小命令
查看>>
checksec未完待续~
查看>>
python pexpect
查看>>
inode索引节点的概念
查看>>
python时间格式转换time模块
查看>>
文件校验
查看>>
python can i use return in wiht statement?
查看>>