CN104835165B - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN104835165B
CN104835165B CN201510240940.2A CN201510240940A CN104835165B CN 104835165 B CN104835165 B CN 104835165B CN 201510240940 A CN201510240940 A CN 201510240940A CN 104835165 B CN104835165 B CN 104835165B
Authority
CN
China
Prior art keywords
image
matching
power flow
algorithm
matching power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510240940.2A
Other languages
English (en)
Other versions
CN104835165A (zh
Inventor
戴向东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201510240940.2A priority Critical patent/CN104835165B/zh
Publication of CN104835165A publication Critical patent/CN104835165A/zh
Priority to PCT/CN2016/081599 priority patent/WO2016180325A1/zh
Application granted granted Critical
Publication of CN104835165B publication Critical patent/CN104835165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Abstract

本发明公开了一种图像处理方法及装置,其方法包括:获取两异源传感器图像;计算两异源传感器图像的梯度方向图;遍历梯度方向图,计算匹配窗口的互信息,作为匹配代价;根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。本发明解决了红外光与可见光图像的立体匹配难度大的问题,满足实际应用需求。

Description

图像处理方法及装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像处理方法及装置。
背景技术
在图像处理技术中,双目视觉可以用来还原场景的三维信息,是计算机视觉中的一个热点研究内容。其中,立体匹配是双目视觉中最为核心和困难的一个步骤,立体匹配的精确程度影响着后续的景深估计和三维重建的效果,给双目视觉的应用带来了技术瓶颈。
目前,已经出现了很多立体匹配算法,主要分为全局和局部的立体匹配算法,也有全局和局部相结合的半全局立体匹配算法,这些算法在两幅可见光双目相机上可以获取满足实际应用的效果,但是对异源传感器图像,如红外光和可见光图像的立体匹配,现有相关的研究工作比较少,并且由于图像传感器的成像原理不同,导致红外光与可见光的图像在色彩上出现较大的差异,使得立体匹配的难度相较双可见光立体匹配要大,从而无法获取满足实际应用的效果。
发明内容
本发明的主要目的在于提出一种图像处理方法及装置,旨在解决红外光与可见光图像的立体匹配难度大的问题。
为实现上述目的,本发明提供的一种图像处理方法,包括:
获取两异源传感器图像;
计算所述两异源传感器图像的梯度方向图;
遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价;
根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。
优选地,所述根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像的步骤包括:
根据所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;
结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
优选地,所述方法还包括:
利用交叉一致性算法和图像分割算法修正所述初始视差图像;
利用滤波算法平滑修正后的视差图像。
优选地,所述修正所述初始视差图像的步骤包括:
排除所述初始视差图像中的错误匹配点。
优选地,所述计算所述两异源传感器图像的梯度方向图的步骤包括:
利用soble算子分别计算两异源传感器图像在水平和垂直方向的梯度大小和方向;
将所述梯度大小和方向归一化处理到适合图像处理的数值范围[0 255],得到原始图像的梯度方向图。
优选地,所述两异源传感器图像分别为红外图像和可见光图像。
本发明实施例还提出一种图像处理装置,包括:
图像获取模块,用于获取两异源传感器图像;
梯度方向图计算模块,用于计算所述两异源传感器图像的梯度方向图;
匹配代价计算模块,用于遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价;
全局能量优化模块,用于根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。
优选地,所述全局能量优化模块,还用于根据所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
优选地,所述装置还包括:
视差图像优化模块,用于利用交叉一致性算法和图像分割算法修正所述初始视差图像;利用滤波算法平滑修正后的视差图像。
优选地,所述视差图像优化模块,还用于排除所述初始视差图像中的错误匹配点。
优选地,所述梯度方向图计算模块,还用于利用soble算子分别计算两异源传感器图像在水平和垂直方向的梯度大小和方向;将所述梯度大小和方向归一化处理到适合图像处理的数值范围[0 255],得到原始图像的梯度方向图。
本发明提出的一种图像处理方法及装置,通过获取两异源传感器图像;计算所述两异源传感器图像的梯度方向图;遍历梯度方向图,计算匹配窗口的互信息,作为匹配代价;利用匹配代价构造全局能量优化函数,作为匹配代价累积函数;根据匹配代价累积函数计算获取相应像素点的初始视差图像,由此基于梯度方向结合互信息的红外可见光立体匹配方案,解决了红外光与可见光图像的立体匹配难度大的问题,满足实际应用需求。
附图说明
图1是实现本发明各个实施例的移动终端的硬件结构示意图;
图2是如图1所示的移动终端的无线通信系统示意图;
图3是本发明图像处理方法第一实施例的流程示意图;
图4是本发明实施例中像素点p与视差d在方向r上的匹配代价函数示意图;
图5是本发明实施例中基于匹配代价累积函数获取初始的视差图像的示意图;
图6是本发明图像处理方法第二实施例的流程示意图;
图7(a)是本发明实施例中一种原始可见光图像;
图7(b)是本发明实施例中一种原始红外图像;
图7(c)是图7(a)中可见光梯度方向图;
图7(d)是图7(b)中红外光梯度方向图;
图7(e)是图7(a)所示的原始可见光图像和图7(b)所示的原始红外图像进行图像处理后得到的初始视差图像示意图;
图7(f)是图7(e)中的视差图像修正后的示意图;
图8是本发明图像处理装置第一实施例的功能模块示意图;
图9是本发明图像处理装置第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为实现本发明各个实施例的移动终端的硬件结构示意。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
感测单元140检测移动终端100的当前状态,(例如,移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即,触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100实施为滑动型移动电话时,感测单元140可以感测该滑动型电话是打开还是关闭。另外,感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。感测单元140可以包括接近传感器1410将在下面结合触摸屏来对此进行描述。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152、警报单元153等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
警报单元153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外,警报单元153可以以不同的方式提供输出以通知事件的发生。例如,警报单元153可以以振动的形式提供输出,当接收到呼叫、消息或一些其它进入通信(incomingcommunication)时,警报单元153可以提供触觉输出(即,振动)以将其通知给用户。通过提供这样的触觉输出,即使在用户的移动电话处于用户的口袋中时,用户也能够识别出各种事件的发生。警报单元153也可以经由显示单元151或音频输出模块152提供通知事件的发生的输出。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块1810,多媒体模块1810可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图2,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图2中所示的系统可以包括多个BSC2750。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图2中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图1中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图2中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图2中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,提出本发明方法各个实施例。
由于现有的双目视觉立体匹配算法,在两幅可见光双目相机上可以获取满足实际应用的效果,但是对异源传感器图像,如红外光和可见光图像的立体匹配,由于图像传感器的成像原理不同,导致红外与可见光的图像在色彩上出现较大的差异,使得立体匹配的难度相较双可见光立体匹配要大,从而无法获取满足实际应用的效果。
为此,本发明提出一种解决方案,可以很好的解决红外光与可见光图像的立体匹配难度大的问题。
具体地,如图3所示,本发明第一实施例提出一种图像处理方法,包括:
步骤S101,获取两异源传感器图像;
其中,两异源传感器图像可以分别为红外图像和可见光图像,当然也可以为其他两种不同类型的图像,本实施例以红外拍摄的图片与可见光拍摄的图片做图像处理进行举例。
步骤S102,计算所述两异源传感器图像的梯度方向图;
具体地,利用soble算子计算各图像在水平和垂直方向的梯度大小和方向。该算子包含两组3x3的矩阵,分别为横向及纵向,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。
如果以I代表原始图像,Gx及Gy分别代表经纵向及横向边缘检测的图像,G为该图像像素点处的梯度大小,θ为梯度方向,其公式如下:
这里计算的梯度方向范围是(-π/2,π/2),会包含负数,首先可以将θ归一化到(0,π),之后归一化到适合图像处理的[0,255]范围,得到原始图像的梯度方向图像:
步骤S103,遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价;
在得到梯度方向图后,计算匹配窗口的互信息,作为匹配代价。匹配代价的意义在于:找到特征上的相似点,原理是找差异最小的点作为相似点。
具体地,对于给定的视差范围[0,Dmax],在视差为D时,右视角梯度方向图I1中的像素点p与左视角梯度方向图I2中的像素点q匹配,匹配代价函数C(p,D)计算方式如下式:
其中,PI(i)为图像I中像素值大小为i的概率,为图像I1与图像I2的联合灰度对概率,相应的H1为图像I1的熵,为图像I1与图像I2的联合熵,为图像I1与图像I2的互信息量,图像的互信息可以衡量两幅图像的灰度分布的相关性,互信息量越大,说明两幅图像越相近。
步骤S104,根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。
首先,利用所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;
本实施例考虑到,初始的匹配代价函数容易受到噪声和视角遮挡产生误匹配,需要利用视差的连续性约束,添加一个视差变化的平滑项。因此,定义一个关于视差图D的全局能量函数E(D),如式子:
其中,C(p,Dp)为像素点p在视差D时的匹配代价,是由步骤S103中计算的MI。
T[]函数是一个截断函数,自变量为1时,值为1,自变量为0,值为0。P1和P2是像素点p与相邻像素点q的视差变化的惩罚权值,如果p与q的视差变化较小,则给定一个固定较小的惩罚权值P1;如果变化较大,则给予一个较大的惩罚值P2,P2的计算方式如下:P2′为常量,一般P2>=P1。
然后,结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
具体地,对于全局能量函数E(D),计算出最小的E(D),可以获取初始的视差图像。
由于二维图像能量函数的不连续性,这个全局最小化问题一般需要转换到一维空间利用动态规划的方法来求解,单方向的动态规划优化方法会出现水平条纹的问题,这里采用多方向的动态规划优化策略,如图4及图5所示,图4是本发明实施例中像素点p与视差d在方向r上的匹配代价函数示意图;图5是本发明实施例中基于匹配代价累积函数获取初始的视差图像的示意图。
在方向r上,像素点p在视差d的代价Lr(p,d)可以通过下式来计算:
S(p,d)为所有方向r的代价累积之和,这样通过计算最小化的S(p,d)即可获取初始的视差图像。
本实施例通过上述方案,具体通过获取两异源传感器图像;计算所述两异源传感器图像的梯度方向图;遍历梯度方向图,计算匹配窗口的互信息,作为匹配代价;利用匹配代价构造全局能量优化函数,作为匹配代价累积函数;根据匹配代价累积函数计算获取相应像素点的初始视差图像,由此基于梯度方向结合互信息的红外可见光立体匹配方案,解决了红外光与可见光图像的立体匹配难度大的问题,满足实际应用需求。
如图6所示,本发明第二实施例提出一种图像处理方法,基于上述图3所示的实施例,该方法还包括:
步骤S105,利用交叉一致性算法和图像分割算法修正所述初始视差图像;
步骤S106,利用滤波算法平滑修正后的视差图像。
相比上述实施例,本实施例考虑到,初始的视差图像中会存在由于噪声、光照、遮挡、弱纹理区域引起的无匹配点,需要进行合理的优化,排除所述初始视差图像中的错误匹配点。
首先,依据视差唯一性这一约束条件,分别获取左右视差图像,左右视差图像对应像素点的视差值误差应限定在较小的范围。表达式如下:
q=e12(p,D1p);
式中e12(p,D1p)是像素点p根据其在图像1中的视差值计算出在图像2中的对应匹配点q。左右一致性检测后,视差图像中会出现空洞,需要通过邻域插值和中值滤波的方法来进行插值和平滑视差图像,获取最后的视差图像。
基于上述实施例原理,下面结合具体实例图像,对本发明图像处理的过程进行说明:
首先,获取两异源传感器图像,分别如图7(a)及图7(b)所示,图7(a)为原始可见光图像,图7(b)为原始红外图像。
然后,计算两异源传感器图像的梯度方向图,分别如图7(c)及图7(d)所示,图7(c)为可见光梯度方向图,图7(d)为红外光梯度方向图。
之后,遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价;
然后,根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像,如图7(e)所示。
最后,利用交叉一致性算法和图像分割算法修正所述初始视差图像;利用滤波算法平滑修正后的视差图像,修正后的视差图像如图7(f)所示,在视差图像中,像素点的颜色越亮,表示该处的物体的视差越大,距离相机的距离越近。
对应地,提出本发明图像处理装置实施例。
如图8所示,本发明第一实施例提出一种图像处理装置,包括:图像获取模块201、梯度方向图计算模块202、匹配代价计算模块203及全局能量优化模块204,其中:
图像获取模块201,用于获取两异源传感器图像;
梯度方向图计算模块202,用于计算所述两异源传感器图像的梯度方向图;
匹配代价计算模块203,用于遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价;
全局能量优化模块204,用于根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。
其中,两异源传感器图像可以分别为红外图像和可见光图像,当然也可以为其他两种不同类型的图像,本实施例以红外拍摄的图片与可见光拍摄的图片做图像处理进行举例。
首先,计算所述两异源传感器图像的梯度方向图。
具体地,利用soble算子计算各图像在水平和垂直方向的梯度大小和方向。该算子包含两组3x3的矩阵,分别为横向及纵向,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。
如果以I代表原始图像,Gx及Gy分别代表经纵向及横向边缘检测的图像,G为该图像像素点处的梯度大小,θ为梯度方向,其公式如下:
这里计算的梯度方向范围是(-π/2,π/2),会包含负数,首先可以将θ归一化到(0,π),之后归一化到适合图像处理的[0,255]范围,得到原始图像的梯度方向图像:
在得到梯度方向图后,计算匹配窗口的互信息,作为匹配代价。匹配代价的意义在于:找到特征上的相似点,原理是找差异最小的点作为相似点。
具体地,对于给定的视差范围[0,Dmax],在视差为D时,右视角梯度方向图I1中的像素点p与左视角梯度方向图I2中的像素点q匹配,匹配代价函数C(p,D)计算方式如下式:
其中,PI(i)为图像I中像素值大小为i的概率,为图像I1与图像I2的联合灰度对概率,相应的H1为图像I1的熵,为图像I1与图像I2的联合熵,为图像I1与图像I2的互信息量,图像的互信息可以衡量两幅图像的灰度分布的相关性,互信息量越大,说明两幅图像越相近。
然后,根据所述匹配代价并结合预设的立体匹配算法,计算获取相应像素点的初始视差图像。
首先,利用所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;
本实施例考虑到,初始的匹配代价函数容易受到噪声和视角遮挡产生误匹配,需要利用视差的连续性约束,添加一个视差变化的平滑项。因此,定义一个关于视差图D的全局能量函数E(D),如式子:
其中,C(p,Dp)为像素点p在视差D时的匹配代价,是由上述计算得到的MI。
T[]函数是一个截断函数,自变量为1时,值为1,自变量为0,值为0。P1和P2是像素点p与相邻像素点q的视差变化的惩罚权值,如果p与q的视差变化较小,则给定一个固定较小的惩罚权值P1;如果变化较大,则给予一个较大的惩罚值P2,P2的计算方式如下:P2′为常量,一般P2>=P1。
然后,结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
具体地,对于全局能量函数E(D),计算出最小的E(D),可以获取初始的视差图像。
由于二维图像能量函数的不连续性,这个全局最小化问题一般需要转换到一维空间利用动态规划的方法来求解,单方向的动态规划优化方法会出现水平条纹的问题,这里采用多方向的动态规划优化策略,如图4及图5所示,图4是本发明实施例中像素点p与视差d在方向r上的匹配代价函数示意图;图5是本发明实施例中基于匹配代价累积函数获取初始的视差图像的示意图。
在方向r上,像素点p在视差d的代价L′r(p,d)可以通过下式来计算:
S(p,d)为所有方向r的代价累积之和,这样通过计算最小化的S(p,d)即可获取初始的视差图像。
本实施例通过上述方案,具体通过获取两异源传感器图像;计算所述两异源传感器图像的梯度方向图;遍历梯度方向图,计算匹配窗口的互信息,作为匹配代价;利用匹配代价构造全局能量优化函数,作为匹配代价累积函数;根据匹配代价累积函数计算获取相应像素点的初始视差图像,由此基于梯度方向结合互信息的红外可见光立体匹配方案,解决了红外光与可见光图像的立体匹配难度大的问题,满足实际应用需求。
如图9所示,本发明第二实施例提出一种图像处理装置,基于上述图8所示的实施例,所述装置还包括:
视差图像优化模块205,用于利用交叉一致性算法和图像分割算法修正所述初始视差图像;利用滤波算法平滑修正后的视差图像。
相比上述实施例,本实施例考虑到,初始的视差图像中会存在由于噪声、光照、遮挡、弱纹理区域引起的无匹配点,需要进行合理的优化,排除所述初始视差图像中的错误匹配点。
首先,依据视差唯一性这一约束条件,分别获取左右视差图像,左右视差图像对应像素点的视差值误差应限定在较小的范围。表达式如下:
q=e12(p,D1p);
式中e12(p,D1p)是像素点p根据其在图像1中的视差值计算出在图像2中的对应匹配点q。左右一致性检测后,视差图像中会出现空洞,需要通过邻域插值和中值滤波的方法来进行插值和平滑视差图像,获取最后的视差图像。
本发明实施例图像处理方法及装置,通过获取两异源传感器图像;计算所述两异源传感器图像的梯度方向图;遍历梯度方向图,计算匹配窗口的互信息,作为匹配代价;利用匹配代价构造全局能量优化函数,作为匹配代价累积函数;根据匹配代价累积函数计算获取相应像素点的初始视差图像,由此基于梯度方向结合互信息的红外可见光立体匹配方案,解决了红外光与可见光图像的立体匹配难度大的问题,满足实际应用需求。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种图像处理方法,其特征在于,包括:
获取两异源传感器图像,所述两异源传感器图像分别为红外图像和可见光图像;
利用soble算子分别计算两异源传感器图像在水平和垂直方向的梯度大小和方向;
将所述梯度大小和方向归一化处理到适合图像处理的数值范围[0,255],得到原始图像的梯度方向图;
遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价,其中,所述互信息用于衡量所述两异源传感器图像的灰度分布的相关性;
根据所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;
结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用交叉一致性算法和图像分割算法修正所述初始视差图像;
利用滤波算法平滑修正后的视差图像。
3.根据权利要求2所述的方法,其特征在于,所述修正所述初始视差图像的步骤包括:
排除所述初始视差图像中的错误匹配点。
4.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取两异源传感器图像,所述两异源传感器图像分别为红外图像和可见光图像;
梯度方向图计算模块,用于利用soble算子分别计算两异源传感器图像在水平和垂直方向的梯度大小和方向;将所述梯度大小和方向归一化处理到适合图像处理的数值范围[0,255],得到原始图像的梯度方向图;
匹配代价计算模块,用于遍历所述梯度方向图,计算匹配窗口的互信息,作为匹配代价,其中,所述互信息用于衡量所述两异源传感器图像的灰度分布的相关性;
全局能量优化模块,用于根据所述匹配代价构造全局能量优化函数,作为匹配代价累积函数;结合半全局立体匹配算法,利用多方向的动态规划算法优化所述匹配代价累积函数,获取相应像素点的初始视差图像。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
视差图像优化模块,用于利用交叉一致性算法和图像分割算法修正所述初始视差图像;利用滤波算法平滑修正后的视差图像。
6.根据权利要求5所述的装置,其特征在于,
所述视差图像优化模块,还用于排除所述初始视差图像中的错误匹配点。
CN201510240940.2A 2015-05-12 2015-05-12 图像处理方法及装置 Active CN104835165B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510240940.2A CN104835165B (zh) 2015-05-12 2015-05-12 图像处理方法及装置
PCT/CN2016/081599 WO2016180325A1 (zh) 2015-05-12 2016-05-10 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510240940.2A CN104835165B (zh) 2015-05-12 2015-05-12 图像处理方法及装置

Publications (2)

Publication Number Publication Date
CN104835165A CN104835165A (zh) 2015-08-12
CN104835165B true CN104835165B (zh) 2017-05-24

Family

ID=53813030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510240940.2A Active CN104835165B (zh) 2015-05-12 2015-05-12 图像处理方法及装置

Country Status (2)

Country Link
CN (1) CN104835165B (zh)
WO (1) WO2016180325A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104835165B (zh) * 2015-05-12 2017-05-24 努比亚技术有限公司 图像处理方法及装置
CN104902260B (zh) * 2015-06-30 2018-04-27 Tcl集团股份有限公司 一种图像视差的获取方法及系统
CN105354838B (zh) * 2015-10-20 2018-04-10 努比亚技术有限公司 图像中弱纹理区域的深度信息获取方法及终端
CN108876841B (zh) * 2017-07-25 2023-04-28 成都通甲优博科技有限责任公司 一种视差图视差求精中插值的方法及系统
CN108205658A (zh) * 2017-11-30 2018-06-26 中原智慧城市设计研究院有限公司 基于单双目视觉融合的障碍物检测预警系统
CN109074661A (zh) * 2017-12-28 2018-12-21 深圳市大疆创新科技有限公司 图像处理方法和设备
CN110033426B (zh) * 2018-01-12 2021-07-09 杭州海康威视数字技术股份有限公司 一种用于对视差估计图像进行处理的装置
CN111354032B (zh) * 2018-12-24 2023-10-20 杭州海康威视数字技术股份有限公司 一种生成视差图的方法及装置
CN109840894B (zh) * 2019-01-30 2021-02-09 湖北亿咖通科技有限公司 视差图精修方法、装置及存储介质
CN110060283B (zh) * 2019-04-17 2020-10-30 武汉大学 一种多测度半全局密集匹配方法
CN110136188B (zh) * 2019-05-16 2023-01-17 东莞职业技术学院 一种基于特征的立体图像匹配算法
CN110533712B (zh) * 2019-08-26 2022-11-04 北京工业大学 一种基于卷积神经网络的双目立体匹配方法
CN110866535B (zh) * 2019-09-25 2022-07-29 北京迈格威科技有限公司 视差图的获取方法、装置、计算机设备和存储介质
CN111008660A (zh) * 2019-12-03 2020-04-14 北京京东乾石科技有限公司 语义地图的生成方法、装置、系统、存储介质及电子设备
CN111462195B (zh) * 2020-04-09 2022-06-07 武汉大学 基于主线约束的非规则角度方向代价聚合路径确定方法
CN111612898B (zh) * 2020-06-18 2023-04-18 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质及电子设备
CN112215876B (zh) * 2020-10-22 2022-10-04 烟台艾睿光电科技有限公司 一种双光谱图像配准融合方法、装置、设备及存储介质
CN113052862A (zh) * 2021-04-12 2021-06-29 北京机械设备研究所 基于多级优化的室外场景下立体匹配方法、装置、设备
CN113534176A (zh) * 2021-06-22 2021-10-22 武汉工程大学 基于图正则化的光场高精度三维测距方法
CN113724308B (zh) * 2021-11-02 2022-03-15 南京理工大学 基于光度与对比度互注意力的跨波段立体匹配算法
CN117408890B (zh) * 2023-12-14 2024-03-08 武汉泽塔云科技股份有限公司 一种视频图像传输质量增强方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021548A (zh) * 2014-05-16 2014-09-03 中国科学院西安光学精密机械研究所 一种获取场景4d信息的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285952A (ja) * 2005-03-11 2006-10-19 Sony Corp 画像処理方法、画像処理装置、プログラムおよび記録媒体
US8731334B2 (en) * 2008-08-04 2014-05-20 Siemens Aktiengesellschaft Multilevel thresholding for mutual information based registration and image registration using a GPU
CN103679714B (zh) * 2013-12-04 2016-05-18 中国资源卫星应用中心 一种基于梯度互相关的光学和sar图像自动配准方法
CN104021556A (zh) * 2014-06-13 2014-09-03 西南交通大学 一种基于几何结构相似性的异源遥感影像配准方法
CN104835165B (zh) * 2015-05-12 2017-05-24 努比亚技术有限公司 图像处理方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021548A (zh) * 2014-05-16 2014-09-03 中国科学院西安光学精密机械研究所 一种获取场景4d信息的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Census变换的区域立体匹配算法研究;张晗玥;《中国优秀硕士学位论文全文数据库》;20140115(第1期);第二至四章 *

Also Published As

Publication number Publication date
WO2016180325A1 (zh) 2016-11-17
CN104835165A (zh) 2015-08-12

Similar Documents

Publication Publication Date Title
CN104835165B (zh) 图像处理方法及装置
CN105163042B (zh) 一种虚化处理深度图像的装置和方法
CN106530241A (zh) 一种图像虚化处理方法和装置
CN106878588A (zh) 一种视频背景虚化终端及方法
CN106791472A (zh) 一种曝光方法及终端
CN106331499A (zh) 对焦方法及拍照设备
CN106534590B (zh) 一种照片处理方法、装置及终端
CN106851113A (zh) 一种基于双摄像头的拍照方法及移动终端
CN106850941A (zh) 照片拍摄方法及装置
CN106791365A (zh) 人脸图像预览处理方法及装置
CN106534693A (zh) 一种照片处理方法、装置及终端
CN106897004A (zh) 一种移动终端及显示界面的调整方法
CN106097284A (zh) 一种夜景图像的处理方法和移动终端
CN106651867A (zh) 一种实现交互式图像分割的方法、装置及终端
CN106898003A (zh) 一种实现交互式图像分割的方法、装置及终端
CN106791119A (zh) 一种照片处理方法、装置及终端
CN106846323A (zh) 一种实现交互式图像分割的方法、装置及终端
CN106657783A (zh) 图片拍摄的装置及方法
CN104731484B (zh) 图片查看的方法及装置
CN106898005A (zh) 一种实现交互式图像分割的方法、装置及终端
CN106876892A (zh) 一种天线和移动终端
CN106791016A (zh) 一种拍照方法及终端
CN106651773A (zh) 图片处理方法及装置
CN106651762A (zh) 一种照片处理方法、装置及终端
CN106646442A (zh) 一种测量距离方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant