CN108664626A - 一种标题一致性检测方法、装置及电子设备 - Google Patents

一种标题一致性检测方法、装置及电子设备 Download PDF

Info

Publication number
CN108664626A
CN108664626A CN201810456414.3A CN201810456414A CN108664626A CN 108664626 A CN108664626 A CN 108664626A CN 201810456414 A CN201810456414 A CN 201810456414A CN 108664626 A CN108664626 A CN 108664626A
Authority
CN
China
Prior art keywords
image
title
pixel
rect
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810456414.3A
Other languages
English (en)
Inventor
刘楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810456414.3A priority Critical patent/CN108664626A/zh
Publication of CN108664626A publication Critical patent/CN108664626A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

本发明实施例提供了一种标题一致性检测方法、装置及电子设备,所述方法包括:获取第一标题图像和第二标题图像;对第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;从第一二值化图像中确定第一文本区域,以及从第二二值化图像中确定第二文本区域;将第一文本区域和第二文本区域配准,得到第一文本区域对应的第一配准区域和第二文本区域对应的第二配准区域;基于第一配准区域和第二配准区域的图像匹配度,确定第一标题图像和第二标题图像是否具有同一标题。通过本发明实施例提供的技术方案,可以提高标题一致性检测的准确率。

Description

一种标题一致性检测方法、装置及电子设备
技术领域
本发明涉及图像处理技术领域,特别是涉及一种标题一致性检测方法及装置。
背景技术
为了方便用户观看视频,视频画面上可以呈现出与视频内容相关的标题。例如,在电视台播出的新闻类视频中,视频画面上常常会呈现出与视频内容相关的新闻标题。
对于一个完整的视频来说,通常会包含不同标题的视频内容。为了方便用户观看其自身感兴趣的标题对应的视频内容,通常按照视频内容的标题是否一致,将该完整的视频切分成多个不同标题的视频,并在切分所得的各个视频中输入与其视频内容相关的标题,然后将切分所得的各个视频进行上线。可见,在切分视频的过程中,需要判断视频内容的标题是否一致。
现有技术中,通常通过以下方式来判断视频内容的标题是否一致:获取两个标题图像,其中,标题图像为包含标题文本内容的图像;对获取的两个标题图像进行图像匹配,得到图像匹配度;若所得到的图像匹配度大于预设图像匹配度,则判断出两个标题图像的标题一致;若所得到的图像匹配度小于预设图像匹配度,则判断出两个标题图像的标题不一致。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
在实际应用中,两个标题图像中标题的位置通常不同,从而导致判断两个标题图像的标题是否一致的准确度较低。举例而言,第一标题图像的第一标题与第二标题图像的第二标题一致,但是,第一标题在第一标题图像中的位置为第一位置,第二标题在第二标题图像中的位置为第二位置。这种情况下,如果对第一标题图像和第二标题图像进行图像匹配,得到的判断结果为:第一标题与第二标题不一致,很显然,得到的判断结果不准确。
发明内容
本发明实施例的目的在于提供了一种标题一致性检测方法、装置及电子设备,以提高标题一致性检测的准确率。具体技术方案如下:
第一方面,本发明实施例提供了一种标题一致性检测方法,所述方法包括:
获取第一标题图像和第二标题图像;
对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;
从所述第一二值化图像中确定第一文本区域,以及从所述第二二值化图像中确定第二文本区域;
将所述第一文本区域和所述第二文本区域配准,得到所述第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域;
基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题。
可选的,所述对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像的步骤,包括:
从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域,所述第一子区域为提取所述第一标题图像中标题的颜色信息所基于的区域,所述第二子区域为提取所述第二标题图像中标题的颜色信息所基于的区域;
基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像;
对所述第一通道图像和所述第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
可选的,基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像的步骤,包括:
确定所述第一子区域对应的RGB通道图像和亮度通道图像,以及所述第二子区域对应的RGB通道图像和亮度通道图像;
基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
可选的,所述基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像的步骤,包括:
利用最大类间方差法,计算所述第一子区域的R、G、B三个通道图像与所述第一子区域的亮度通道图像的第一方差值,计算所述第二子区域的R、G、B三个通道图像与所述第二子区域的亮度通道图像的第二方差值;
确定所述第一方差值中最大方差值所对应通道图像的第一通道类型,以及所述第二方差值中最大方差值所对应通道图像的第二通道类型;
将第一类通道图像中具有所述第一通道类型的通道图像,确定为所述第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有所述第二通道类型的通道图像,确定为所述第二标题图像的待二值化的第二通道图像,所述第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,所述第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
可选的,所述从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域的步骤,包括:
按照预设的坐标转换公式,计算所述第一标题图像中第一子区域的第一位置信息,计算所述第二标题图像中第二子区域的第二位置信息;
将所述第一标题图像中所述第一子位置信息对应的区域确定为第一子区域,将所述第二标题图像中所述第二子位置信息对应的区域确定为第二子区域;
其中,所述预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数。
可选的,所述从所述第一二值化图像中确定第一文本区域的步骤,包括:
扫描所述第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于所述第一像素值的像素点的第一数量;以及,扫描所述第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于所述第二像素值的像素点的第二数量;
计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值,其中,所述第一目标像素行为:所述第一二值化图像中第一数量小于预设数量的像素行,所述第一目标像素列为:所述第一二值化图像中第二数量小于预设数量的列;
若所述第一平均值小于128,确定所述第一二值化图像的标题文本内容的二值化特征为0,否则,确定所述第一二值化图像的标题文本内容的二值化特征为255;
利用所确定的第一二值化图像的标题文本内容的二值化特征,确定所述第一二值化图像的标题文本区域,作为第一文本区域;
相应的,所述从所述第二二值化图像中确定第二文本区域的步骤,包括:
扫描所述第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于所述第三像素值的像素点的第三数量;以及,扫描所述第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于所述第四像素值的像素点的第四数量;
计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,所述第二目标像素行为:所述第二二值化图像中第三数量小于预设数量的像素行,所述第二目标像素列为:所述第一二值化图像中第四数量小于预设数量的列;
若所述第二平均值小于128,确定所述第二二值化图像的标题文本内容的二值化特征为0,否则,确定所述第二二值化图像的标题文本内容的二值化特征为255;
利用所确定的第二二值化图像的标题文本内容的二值化特征,确定所述第二二值化图像的标题文本区域,作为第二文本区域。
可选的,所述将所述第一文本区域和所述第二文本区域配准的步骤,包括:
确定所述第一文本区域的起始点在所述第一二值化图像中的第一坐标信息(x1,y1),以及所述第二文本区域的起始点在所述第二二值化图像中的第二坐标信息(x2,y2);
根据所述第一坐标信息(x1,y1)和所述第二坐标信息(x2,y2),确定所述第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及所述第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为所述第一配准区域和所述第二匹配区域的宽度,h为所述第一配准区域和所述第二配准区域的高度。
可选的,所述基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题的步骤,包括:
计算所述第一配准区域和所述第二配准区域中位置信息相对应的像素点的掩码的差分值;
计算所得到的差分值的差分平均值;
当所述差分平均值小于预设差分阈值,确定所述第一标题图像和所述第二标题图像具有同一标题,否则,确定所述第一标题图像和所述第二标题图像不具有同一标题。
第二方面,本发明实施例还提供了一种标题一致性检测装置,所述装置包括:
图像获取模块,用于获取第一标题图像和第二标题图像;
二值化处理获取,用于对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;
文本区域确定模块,用于从所述第一二值化图像中确定第一文本区域,以及从所述第二二值化图像中确定第二文本区域;
文本区域配准模块,用于将所述第一文本区域和所述第二文本区域配准,得到所述第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域;标题一致性确定模块,用于基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题。
可选的,所述二值化处理获取,包括:
子区域确定单元,用于从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域,所述第一子区域为提取所述第一标题图像中标题的颜色信息所基于的区域,所述第二子区域为提取所述第二标题图像中标题的颜色信息所基于的区域;
通道图像确定单元,用于基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像;
二值化处理单元,用于对所述第一通道图像和所述第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
可选的,所述通道图像确定单元,包括:
第一通道图像确定子单元,用于确定所述第一子区域对应的RGB通道图像和亮度通道图像,以及所述第二子区域对应的RGB通道图像和亮度通道图像;
第二通道图像确定子单元,用于基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
可选的,所述第二通道图像确定子单元,具体用于:
利用最大类间方差法,计算所述第一子区域的R、G、B三个通道图像与所述第一子区域的亮度通道图像的第一方差值,计算所述第二子区域的R、G、B三个通道图像与所述第二子区域的亮度通道图像的第二方差值;
确定所述第一方差值中最大方差值所对应通道图像的第一通道类型,以及所述第二方差值中最大方差值所对应通道图像的第二通道类型;
将第一类通道图像中具有所述第一通道类型的通道图像,确定为所述第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有所述第二通道类型的通道图像,确定为所述第二标题图像的待二值化的第二通道图像,所述第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,所述第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
可选的,所述子区域确定单元,具体用于:
按照预设的坐标转换公式,计算所述第一标题图像中第一子区域的第一位置信息,计算所述第二标题图像中第二子区域的第二位置信息;
将所述第一标题图像中所述第一子位置信息对应的区域确定为第一子区域,将所述第二标题图像中所述第二子位置信息对应的区域确定为第二子区域;
其中,所述预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数。
可选的,所述文本区域确定模块,具体用于:
扫描所述第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于所述第一像素值的像素点的第一数量;以及,扫描所述第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于所述第二像素值的像素点的第二数量;
计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值,其中,所述第一目标像素行为:所述第一二值化图像中第一数量小于预设数量的像素行,所述第一目标像素列为:所述第一二值化图像中第二数量小于预设数量的列;
若所述第一平均值小于128,确定所述第一二值化图像的标题文本内容的二值化特征为0,否则,确定所述第一二值化图像的标题文本内容的二值化特征为255;
利用所确定的第一二值化图像的标题文本内容的二值化特征,确定所述第一二值化图像的标题文本区域,作为第一文本区域;
扫描所述第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于所述第三像素值的像素点的第三数量;以及,扫描所述第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于所述第四像素值的像素点的第四数量;
计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,所述第二目标像素行为:所述第二二值化图像中第三数量小于预设数量的像素行,所述第二目标像素列为:所述第一二值化图像中第四数量小于预设数量的列;
若所述第二平均值小于128,确定所述第二二值化图像的标题文本内容的二值化特征为0,否则,确定所述第二二值化图像的标题文本内容的二值化特征为255;
利用所确定的第二二值化图像的标题文本内容的二值化特征,确定所述第二二值化图像的标题文本区域,作为第二文本区域。
可选的,所述文本区域配准模块,具体用于:
确定所述第一文本区域的起始点在所述第一二值化图像中的第一坐标信息(x1,y1),以及所述第二文本区域的起始点在所述第二二值化图像中的第二坐标信息(x2,y2);
根据所述第一坐标信息(x1,y1)和所述第二坐标信息(x2,y2),确定所述第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及所述第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为所述第一配准区域和所述第二匹配区域的宽度,h为所述第一配准区域和所述第二配准区域的高度。
可选的,所述标题一致性确定模块,具体用于:
计算所述第一配准区域和所述第二配准区域中位置信息相对应的像素点的掩码的差分值;
计算所得到的差分值的差分平均值;
当所述差分平均值小于预设差分阈值,确定所述第一标题图像和所述第二标题图像具有同一标题,否则,确定所述第一标题图像和所述第二标题图像不具有同一标题。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的标题一致性检测方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第一方面所述的标题一致性检测方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面所述的标题一致性检测方法。
本发明实施例提供的技术方案,在判断第一标题图像和第二标题图像是否具有同一标题时,获取第一标题图像和第二标题图像;并对第一标题图像和第二标题图像进行二值化处理,得到第二标题图像的第一二值化图像及第二标题图像的第二二值化图像;然后从第一二值化图像中确定第一文本区域,从第二二值化图像中确定第二文本区域;并将第一文本区域和第二文本区域配准,得到第一文本区域对应的第一配准区域和第二文本区域对应的第二配准区域;最后基于第一配准区域和第二配准区域的图像匹配度,确定第一标题图像和第二标题图像是否具有同一标题。
可见,本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种标题一致性检测方法的流程图;
图2为本发明实施例所提供的一种文本区域示意图;
图3为本发明实施例所提供的一种从第一二值化图像中确定第一文本区域的流程图;
图4为本发明实施例所提供的一种从第二二值化图像中确定第二文本区域的流程图;
图5为本发明实施例所提供的一种对第一标题图像和第二标题图像进行二值化处理的流程图;
图6为本发明实施例所提供的一种标题一致性检测装置的结构示意图;
图7为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了解决背景技术中记载的技术问题,本发明实施例提供了一种标题一致性检测方法、装置及电子设备,以提高标题一致性检测的准确率。
下面将对本发明实施例所提供的一种标题一致性检测方法、装置及电子设备进行详细阐述。
第一方面,对本发明实施例所提供的一种标题一致性检测方法进行介绍。
需要说明的是,本发明实施例所提供的一种标题一致性检测方法的执行主体可以为一种标题一致性检测装置,而该标题一致性检测装置可以运行于电子设备中。在具体应用中,该电子设备可以为终端设备或服务器。
如图1所示,本发明实施例所提供的标题一致性检测方法包括如下步骤:
S110,获取第一标题图像和第二标题图像。
为了方便用户观看视频,视频画面上通常呈现出于视频相关的标题,可以将包含标题文本内容的图像称为标题图像。可以理解的是,每一个视频帧中,标题的位置是较为固定的,例如,标题的位置通常位于视频帧的底部,因此,从视频帧中获取标题图像时,可以检测位于视频帧底部区域的文本内容,并将该视频帧中包含文本内容的图像作为标题图像。
在判断两个标题图像中所包含的标题是否一致时,首先需要获取这两个标题图像,即获取第一标题图像和第二标题图像。
需要说明的是,获取标题图像的方式可以有多种,例如,可以利用深度学习的文本检测方法,来检测标题图像所在视频帧中文本内容,将该视频中包含该文本内容的图像作为标题图像。本发明实施例对获取标题图像的方式不做具体限定,现有技术中的任一种从视频帧中提出包含文本内容的图像均可以作为本发明实施例中提取标题图像的方式。
S120,对第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
在得到第一标题图像和第二标题图像之后,为了能够使得第一标题图像和第二标题图像能够展示出所包含的标题的轮廓,将第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的二值化图像以及第二标题图像对应的二值化图像。
本领域技术人员可以理解的是,二值化图像上的像素点的灰度值为0或255,也就是说,第一二值化图像和第二二值化图像均呈现出明显的黑白效果,从而有利于后续步骤中,从第一二值化图像中确定第一文本区域,并从第二二值化图像中确定第二文本区域。
为了方案清楚及布局清晰,后续将对第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像的具体实现方式进行具体介绍。
S130,从第一二值化图像中确定第一文本区域,以及从第二二值化图像中确定第二文本区域。
需要说明的是,本发明所涉及的文本区域是指包含标题文本内容的区域,具体的,第一文本区域为第一二值化图像中包含标题文本内容的区域,同样地,上述第二文本区域为第二二值化图像中包含标题文本内容的区域。
举例而言,如图2所示为文本区域示意图,在该文本区域中所包含的标题文本内容为“添加柴火过多锅炉房顶起火”。
在得到第一二值化图像后,可以根据第一二值化图像确定出第一二值化图像的标题文本内容的二值化特征,并将第一二值化图像中属于标题文本内容的二值化特征的像素点组成的区域,确定为第一文本区域;同样地,在得到第二二值化图像后,可以根据第二二值化图像确定出第二二值化图像的标题文本内容的二值化特征,并将第二二值化图像中属于标题文本内容的二值化特征的像素点组成的区域,确定为第二文本区域。
为了方案清楚和布局清楚,后续对所述从第一二值化图像中确定第一文本区域,以及从第二二值化图像中确定第二文本区域的具体实现方式进行具体介绍。
S140,将第一文本区域和所述第二文本区域配准,得到第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域。
为了避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,需要对第一文本区域和第二文本区域进行配准,从而在后续步骤中能够精确地判断第一标题图像和第二标题图像的标题是否一致。
在一种实施方式中,将第一文本区域和第二文本区域配准的步骤,可以包括如下两个步骤,分别为步骤a和步骤b:
步骤a:确定第一文本区域的起始点在第一二值化图像中的第一坐标信息(x1,y1),以及第二文本区域的起始点在第二二值化图像中的第二坐标信息(x2,y2);
具体的,确定第一文本区域的起始点在第一二值化图像中的第一坐标信息(x1,y1)过程可以包括如下4个步骤:
1、对于第一二值化图像,进行垂直方向投影生成特征Hb。具体的,统计第一二值化图像每列中像素值不等于背景像素值的像素点个数numb,如果numb<Th1,则Hb[i]=1,否则,Hb[i]=0。i的范围是[0,W-1],其中,Th1为预设值,W为第一二值化图像的宽度。
2、对于Hb[i],在范围[0,W-1]进行遍历,如果(i==0||Hb[i-1]==1)&&(Hb[i]==0,Hb[i+1]==0,…,Hb[i+n]==0)&&(Hb[i+n+1]==1||H-1),则记录这些x方向的位置[i,i+n]为标题区域,进入标题列表POStext=[text0,…,textn],第一个text0的起点位置即为x1
3、对于第一二值化图像,进行水平方向投影生成特征Hv。具体的,统计第一二值化图像每行中像素值不等于背景像素值的像素点个数numv,如果numv<Th1,则Hv[i]=1,否则,Hv[i]=0。i的范围是[0,H-1],其中,H为第一二值化图像的高度。
4、对于Hv[i]在范围[0,H-1]进行遍历,记录ystart的位置,即Hv[0]==0,Hv[1]==0,…,Hv[ystart-1]==0,Hv[ystart]=1,如果没有符合条件的位置,则ystart=0,即y1=0。
相应地,确定第二文本区域的起始点在第二二值化图像中的第二坐标信息(x2,y2)过程也可以包括如下4个步骤,在此不再赘述。
步骤b:根据第一坐标信息(x1,y1)和第二坐标信息(x2,y2),确定第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为第一配准区域和第二匹配区域的宽度,h为第一配准区域和第二配准区域的高度。
具体的,确定第一配准区域的长度和宽度的方式可以为:h=min(H-y1,H-y2),w=min(W-x1,W-x2),其中,h为第一文本区域的高度,H为第一二值化图像的高度,w为第一文本区域的高宽度,W为第一二值化图像的高度的宽度。
由于第一配准区域和第二配准区域的长度和宽度相同,因此,在确定了第一配准区域的长度和宽度后,即可以得知第二配准区域的长度和宽度。
S150,基于第一配准区域和第二配准区域的图像匹配度,确定第一标题图像和第二标题图像是否具有同一标题。
在一种实施方式中,可以通过S1-S3这三个步骤来确定第一标题图像和第二标题图像是否具有同一标题:
S1,计算第一配准区域和第二配准区域中位置信息相对应的像素点的二值化特征的差分值。
S2,计算所得到的差分值的差分平均值。
S3,当差分平均值小于预设差分阈值,确定第一标题图像和第二标题图像具有同一标题,否则,确定第一标题图像和第二标题图像不具有同一标题。
为了能够精确地判断第一标题中包含的标题文本内容与第二标题图像中包含的标题文本内容是否一致,可以判断第一配准区域和第二配准区域中相同位置的像素点是否相同。
判断第一配准区域和第二配准区域中相同位置的像素点是否相同的方式可以为:计算第一配准区域和第二配准区域中相同位置的像素点的二值化的差分值,并计算所得到的差分值的差分平均值,其中,计算所得到的差分值的差分平均值的公式可以为:
其中,Diff为差分平均值,B1(x,y)为第一配准区域中,位置信息为(x,y)的像素点的二值化特征,B2(x,y)为第二配准区域中,位置信息为(x,y)的像素点的二值化特征,W为第一配准区域和第二配准区域的宽度,H为第一配准区域和第二配准区域的高度。
可以理解的是,差分平均值越小,第一配准区域和第二配准区域的图像匹配度越高;同样的,差分平均值越大,第一配准区域和第二配准区域的图像匹配度越低,因此,可以利用计算得到的差分平均值表示第一配准区域和第二配准区域的图像匹配度。
当差分平均值大于预设差分阈值,则确定第一标题图像和第二标题图像具有同一标题,当差分平均值小于预设差分阈值,确定第一标题图像和第二标题图像不具有同一标题。
需要说明的是,上述预设差分阈值的大小可以根据实际情况来确定,本发明实施例对预设差分阈值的大小不做具体限定。
当然,还可以通过其他方式来计算第一配准区域和第二配准区域的图像匹配度,本发明实施对第一配准区域和第二配准区域的图像匹配度的计算方式不做具体限定。
本发明实施例提供的技术方案,在判断第一标题图像和第二标题图像是否具有同一标题时,获取第一标题图像和第二标题图像;并对第一标题图像和第二标题图像进行二值化处理,得到第二标题图像的第一二值化图像及第二标题图像的第二二值化图像;然后从第一二值化图像中确定第一文本区域,从第二二值化图像中确定第二文本区域;并将第一文本区域和第二文本区域配准,得到第一文本区域对应的第一配准区域和第二文本区域对应的第二配准区域;最后基于第一配准区域和第二配准区域的图像匹配度,确定第一标题图像和第二标题图像是否具有同一标题。
可见,本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。
为了方案清楚及布局清晰,下面将对第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像的具体实现方式进行具体介绍,如图3所示,在一种实施方式中,图1所示实施例中的S120可以包括如下步骤:
S121,从第一标题图像中确定第一子区域,从第二标题图像中确定第二子区域,第一子区域为提取第一标题图像中标题的颜色信息所基于的区域,第二子区域为提取第二标题图像中标题的颜色信息所基于的区域。
其中,第一子区域中的背景区域对第一子区域中的标题文本内容干扰较小。举例而言,第一子区域的背景区域的颜色为不透明区域。
在一种实施方式中,从第一标题图像中确定第一子区域,从第二标题图像中确定第二子区域的步骤,可以包括如下步骤:
按照预设的坐标转换公式,计算第一标题图像中第一子区域的第一位置信息,计算第二标题图像中第二子区域的第二位置信息;
将第一标题图像中第一子位置信息对应的区域确定为第一子区域,将第二标题图像中第二子位置信息对应的区域确定为第二子区域;
其中,预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数,本发明实施例对Xratio1,Xratio2,Yratio1,Yratio2的大小不做具体限定。
S122,基于第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
在一种实施方式中,确定第一通道图像和第二通道图像时,可以首先确定第一子区域对应的RGB通道图像和亮度通道图像,以及第二子区域对应的RGB通道图像和亮度通道图像。
其中,亮度通道图像可以为灰度图像或任意亮度色彩分离图像,当亮度通道图像为灰度图像时,可以采用公式Gray=R*0.299+G*0.587+B*0.114,将第一子区域中的RGB图像转换为灰度图像;当亮度通道图像为任意亮度色彩分离图像时,以亮度色彩分离图像为HSL(色调、饱和度、亮度)图像为例,可以采用公式:L=(max(R,G,B)+min(R,G,B))/2公式,将第一子区域中的RGB图像转换为HSL图像。其中,亮度色彩分离图像可以包括YUV(亮度、色度)图像、HSV(色调、饱和度、明度)图像、LAB(亮度、色彩)图像等,这都是合理的。
在确定出第一子区域的RGB通道图像和亮度通道图像,以及第二子区域的RGB通道图像和亮度通道图像后,可以基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
具体的,利用最大类间方差法(OTSU),计算所述第一子区域的R、G、B三个通道图像与第一子区域的亮度通道图像的第一方差值,计算第二子区域的R、G、B三个通道图像与第二子区域的亮度通道图像的第二方差值。可以理解的是,第一方差值的数量为4,第二方差值的数量也为4。
可以理解的是,方差值较大的通道图像,背景区域对标题文本内容的干扰较小,因此,接下来,确定第一方差值中最大方差值所对应通道图像的第一通道类型,该第一通道类型可以为R、G、B、灰度通道、亮度通道等;以及确定第二方差值中最大方差值所对应通道图像的第二通道类型;该第二通道类型可以为R、G、B、灰度通道、亮度通道等。
然后,将第一类通道图像中具有第一通道类型的通道图像,确定为第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有第二通道类型的通道图像,确定为第二标题图像的待二值化的第二通道图像,第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
例如,如果第一通道类型为R通道,则将第一标题图像的R通道确定为待二值化的第一通道图像;再例如,如果第一通道类型为灰度通道,则将第一标题图像的灰度通道确定为待二值化的第一通道图像。
当然,在确定待二值化的通道图像前,可以预先对标题图像所在的视频进行分析,通过分析直接得出将标题图像所对应的通道图像,这也是合理的。
S123,对第一通道图像和第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
在确定了待二值化的第一通道图像和待二值化的第二通道图像,对第一通道图像和第二通道图像进行二值化处理,即可得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
为了方案清楚及布局清晰,下面对所述从第一二值化图像中确定第一文本区域,以及从第二二值化图像中确定第二文本区域的具体实现方式进行具体介绍。
在一种实施方式中,如图4所示,从第一二值化图像中确定第一文本区域的步骤,可以包括如下几个步骤:
S410,扫描第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于第一像素值的像素点的第一数量。以及,扫描第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于第二像素值的像素点的第二数量。
S420,计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值。
其中,上述第一目标像素行为:第一二值化图像中第一数量小于预设数量的像素行,上述第一目标像素列为:第一二值化图像中第二数量小于预设数量的列。
S430,若第一平均值小于128,确定第一二值化图像的标题文本内容的二值化特征为0,否则,确定第一二值化图像的标题文本内容的二值化特征为255。
S440,利用所确定的第一二值化图像的标题文本内容的二值化特征,确定第一二值化图像的标题文本区域,作为第一文本区域。
相应的,在一种实施方式中,如图5所示,从第二二值化图像中确定第二文本区域的步骤,可以包括如下步骤:
S510,扫描第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于第三像素值的像素点的第三数量。以及,扫描第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于第四像素值的像素点的第四数量。
S520,计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,第二目标像素行为:第二二值化图像中第三数量小于预设数量的像素行,第二目标像素列为:第一二值化图像中第四数量小于预设数量的列。
S530,若第二平均值小于128,确定第二二值化图像的标题文本内容的二值化特征为0,否则,确定第二二值化图像的标题文本内容的二值化特征为255。S540,利用所确定的第二二值化图像的标题文本内容的二值化特征,确定第二二值化图像的标题文本区域,作为第二文本区域。
第二方面,本发明实施例还提供了一种标题一致性检测装置,如图6所示,所述装置包括:
图像获取模块610,用于获取第一标题图像和第二标题图像;
二值化处理模块620,用于对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;
文本区域确定模块630,用于从所述第一二值化图像中确定第一文本区域,以及从所述第二二值化图像中确定第二文本区域;
文本区域配准模块640,用于将所述第一文本区域和所述第二文本区域配准,得到所述第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域;
标题一致性确定模块650,用于基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题。
本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。可选的,所述二值化处理获取,包括:
子区域确定单元,用于从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域,所述第一子区域为提取所述第一标题图像中标题的颜色信息所基于的区域,所述第二子区域为提取所述第二标题图像中标题的颜色信息所基于的区域;
通道图像确定单元,用于基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像;
二值化处理单元,用于对所述第一通道图像和所述第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
可选的,所述通道图像确定单元,包括:
第一通道图像确定子单元,用于确定所述第一子区域对应的RGB通道图像和亮度通道图像,以及所述第二子区域对应的RGB通道图像和亮度通道图像;
第二通道图像确定子单元,用于基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
可选的,所述第二通道图像确定子单元,具体用于:
利用最大类间方差法,计算所述第一子区域的R、G、B三个通道图像与所述第一子区域的亮度通道图像的第一方差值,计算所述第二子区域的R、G、B三个通道图像与所述第二子区域的亮度通道图像的第二方差值;
确定所述第一方差值中最大方差值所对应通道图像的第一通道类型,以及所述第二方差值中最大方差值所对应通道图像的第二通道类型;
将第一类通道图像中具有所述第一通道类型的通道图像,确定为所述第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有所述第二通道类型的通道图像,确定为所述第二标题图像的待二值化的第二通道图像,所述第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,所述第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
可选的,所述子区域确定单元,具体用于:
按照预设的坐标转换公式,计算所述第一标题图像中第一子区域的第一位置信息,计算所述第二标题图像中第二子区域的第二位置信息;
将所述第一标题图像中所述第一子位置信息对应的区域确定为第一子区域,将所述第二标题图像中所述第二子位置信息对应的区域确定为第二子区域;
其中,所述预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数。
可选的,所述文本区域确定模块,具体用于:
扫描所述第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于所述第一像素值的像素点的第一数量;以及,扫描所述第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于所述第二像素值的像素点的第二数量;
计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值,其中,所述第一目标像素行为:所述第一二值化图像中第一数量小于预设数量的像素行,所述第一目标像素列为:所述第一二值化图像中第二数量小于预设数量的列;
若所述第一平均值小于128,确定所述第一二值化图像的标题文本内容的二值化特征为0,否则,确定所述第一二值化图像的标题文本内容的二值化特征为255;
利用所确定的第一二值化图像的标题文本内容的二值化特征,确定所述第一二值化图像的标题文本区域,作为第一文本区域;
扫描所述第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于所述第三像素值的像素点的第三数量;以及,扫描所述第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于所述第四像素值的像素点的第四数量;
计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,所述第二目标像素行为:所述第二二值化图像中第三数量小于预设数量的像素行,所述第二目标像素列为:所述第一二值化图像中第四数量小于预设数量的列;
若所述第二平均值小于128,确定所述第二二值化图像的标题文本内容的二值化特征为0,否则,确定所述第二二值化图像的标题文本内容的二值化特征为255;
利用所确定的第二二值化图像的标题文本内容的二值化特征,确定所述第二二值化图像的标题文本区域,作为第二文本区域。
可选的,所述文本区域配准模块,具体用于:
确定所述第一文本区域的起始点在所述第一二值化图像中的第一坐标信息(x1,y1),以及所述第二文本区域的起始点在所述第二二值化图像中的第二坐标信息(x2,y2);
根据所述第一坐标信息(x1,y1)和所述第二坐标信息(x2,y2),确定所述第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及所述第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为所述第一配准区域和所述第二匹配区域的宽度,h为所述第一配准区域和所述第二配准区域的高度。
可选的,所述标题一致性确定模块,具体用于:
计算所述第一配准区域和所述第二配准区域中位置信息相对应的像素点的掩码的差分值;
计算所得到的差分值的差分平均值;
当所述差分平均值小于预设差分阈值,确定所述第一标题图像和所述第二标题图像具有同一标题,否则,确定所述第一标题图像和所述第二标题图像不具有同一标题。
第三方面,本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现第一方面所述的标题一致性检测方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(ApplicationSpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。
第四方面,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的标题一致性检测方法。
本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。
第五方面,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的标题一致性检测方法。
本发明实施例提供的技术方案中,从第一标题图像和第二标题图像各自的二值化图像中提取得到文本区域,并基于两个文本区域对应的配准区域的图像匹配度来确定标题是否一致。因此,通过本方案可以避免因第一标题图像和第二标题图像中标题位置不一致而导致标题一致性检测的准确率较低的问题出现,即提高了标题一致性检测的准确率。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (17)

1.一种标题一致性检测方法,其特征在于,所述方法包括:
获取第一标题图像和第二标题图像;
对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;
从所述第一二值化图像中确定第一文本区域,以及从所述第二二值化图像中确定第二文本区域;
将所述第一文本区域和所述第二文本区域配准,得到所述第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域;
基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像的步骤,包括:
从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域,所述第一子区域为提取所述第一标题图像中标题的颜色信息所基于的区域,所述第二子区域为提取所述第二标题图像中标题的颜色信息所基于的区域;
基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像;
对所述第一通道图像和所述第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
3.根据权利要求2所述的方法,其特征在于,基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像的步骤,包括:
确定所述第一子区域对应的RGB通道图像和亮度通道图像,以及所述第二子区域对应的RGB通道图像和亮度通道图像;
基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
4.根据权利要求3所述的方法,其特征在于,所述基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像的步骤,包括:
利用最大类间方差法,计算所述第一子区域的R、G、B三个通道图像与所述第一子区域的亮度通道图像的第一方差值,计算所述第二子区域的R、G、B三个通道图像与所述第二子区域的亮度通道图像的第二方差值;
确定所述第一方差值中最大方差值所对应通道图像的第一通道类型,以及所述第二方差值中最大方差值所对应通道图像的第二通道类型;
将第一类通道图像中具有所述第一通道类型的通道图像,确定为所述第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有所述第二通道类型的通道图像,确定为所述第二标题图像的待二值化的第二通道图像,所述第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,所述第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
5.根据权利要求2所述的方法,其特征在于,所述从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域的步骤,包括:
按照预设的坐标转换公式,计算所述第一标题图像中第一子区域的第一位置信息,计算所述第二标题图像中第二子区域的第二位置信息;
将所述第一标题图像中所述第一子位置信息对应的区域确定为第一子区域,将所述第二标题图像中所述第二子位置信息对应的区域确定为第二子区域;
其中,所述预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数。
6.根据权利要求1所述的方法,其特征在于,所述从所述第一二值化图像中确定第一文本区域的步骤,包括:
扫描所述第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于所述第一像素值的像素点的第一数量;以及,扫描所述第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于所述第二像素值的像素点的第二数量;
计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值,其中,所述第一目标像素行为:所述第一二值化图像中第一数量小于预设数量的像素行,所述第一目标像素列为:所述第一二值化图像中第二数量小于预设数量的列;
若所述第一平均值小于128,确定所述第一二值化图像的标题文本内容的二值化特征为0,否则,确定所述第一二值化图像的标题文本内容的二值化特征为255;
利用所确定的第一二值化图像的标题文本内容的二值化特征,确定所述第一二值化图像的标题文本区域,作为第一文本区域;
相应的,所述从所述第二二值化图像中确定第二文本区域的步骤,包括:
扫描所述第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于所述第三像素值的像素点的第三数量;以及,扫描所述第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于所述第四像素值的像素点的第四数量;
计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,所述第二目标像素行为:所述第二二值化图像中第三数量小于预设数量的像素行,所述第二目标像素列为:所述第一二值化图像中第四数量小于预设数量的列;
若所述第二平均值小于128,确定所述第二二值化图像的标题文本内容的二值化特征为0,否则,确定所述第二二值化图像的标题文本内容的二值化特征为255;
利用所确定的第二二值化图像的标题文本内容的二值化特征,确定所述第二二值化图像的标题文本区域,作为第二文本区域。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述将所述第一文本区域和所述第二文本区域配准的步骤,包括:
确定所述第一文本区域的起始点在所述第一二值化图像中的第一坐标信息(x1,y1),以及所述第二文本区域的起始点在所述第二二值化图像中的第二坐标信息(x2,y2);
根据所述第一坐标信息(x1,y1)和所述第二坐标信息(x2,y2),确定所述第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及所述第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为所述第一配准区域和所述第二匹配区域的宽度,h为所述第一配准区域和所述第二配准区域的高度。
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题的步骤,包括:
计算所述第一配准区域和所述第二配准区域中位置信息相对应的像素点的掩码的差分值;
计算所得到的差分值的差分平均值;
当所述差分平均值小于预设差分阈值,确定所述第一标题图像和所述第二标题图像具有同一标题,否则,确定所述第一标题图像和所述第二标题图像不具有同一标题。
9.一种标题一致性检测装置,其特征在于,所述装置包括:
图像获取模块,用于获取第一标题图像和第二标题图像;
二值化处理获取,用于对所述第一标题图像和第二标题图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像;
文本区域确定模块,用于从所述第一二值化图像中确定第一文本区域,以及从所述第二二值化图像中确定第二文本区域;
文本区域配准模块,用于将所述第一文本区域和所述第二文本区域配准,得到所述第一文本区域对应的第一配准区域和所述第二文本区域对应的第二配准区域;标题一致性确定模块,用于基于所述第一配准区域和所述第二配准区域的图像匹配度,确定所述第一标题图像和第二标题图像是否具有同一标题。
10.根据权利要求9所述的装置,其特征在于,所述二值化处理获取,包括:
子区域确定单元,用于从所述第一标题图像中确定第一子区域,从所述第二标题图像中确定第二子区域,所述第一子区域为提取所述第一标题图像中标题的颜色信息所基于的区域,所述第二子区域为提取所述第二标题图像中标题的颜色信息所基于的区域;
通道图像确定单元,用于基于所述第一子区域的颜色信息和第二子区域的颜色信息,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像;
二值化处理单元,用于对所述第一通道图像和所述第二通道图像进行二值化处理,得到第一标题图像对应的第一二值化图像以及第二标题图像对应的第二二值化图像。
11.根据权利要求10所述的装置,其特征在于,所述通道图像确定单元,包括:
第一通道图像确定子单元,用于确定所述第一子区域对应的RGB通道图像和亮度通道图像,以及所述第二子区域对应的RGB通道图像和亮度通道图像;
第二通道图像确定子单元,用于基于所确定出的RGB通道图像和亮度通道图像,确定第一标题图像的待二值化的第一通道图像和第二标题图像的待二值化的第二通道图像。
12.根据权利要求11所述的装置,其特征在于,所述第二通道图像确定子单元,具体用于:
利用最大类间方差法,计算所述第一子区域的R、G、B三个通道图像与所述第一子区域的亮度通道图像的第一方差值,计算所述第二子区域的R、G、B三个通道图像与所述第二子区域的亮度通道图像的第二方差值;
确定所述第一方差值中最大方差值所对应通道图像的第一通道类型,以及所述第二方差值中最大方差值所对应通道图像的第二通道类型;
将第一类通道图像中具有所述第一通道类型的通道图像,确定为所述第一标题图像的待二值化的第一通道图像,以及将第二类通道图像中具有所述第二通道类型的通道图像,确定为所述第二标题图像的待二值化的第二通道图像,所述第一类通道图像为第一标题图像的R、G、B通道图像及亮度通道图像,所述第二类通道图像为第二标题图像的R、G、B通道图像及亮度通道图像。
13.根据权利要求10所述的装置,其特征在于,所述子区域确定单元,具体用于:
按照预设的坐标转换公式,计算所述第一标题图像中第一子区域的第一位置信息,计算所述第二标题图像中第二子区域的第二位置信息;
将所述第一标题图像中所述第一子位置信息对应的区域确定为第一子区域,将所述第二标题图像中所述第二子位置信息对应的区域确定为第二子区域;
其中,所述预设的坐标转换公式为:
color_rect.x=rect.x+rect.w*Xratio1
color_rect.y=rect.y+rect.h*Yratio1
color_rect.w=rect.w*Xratio2
color_rect.h=rect.h*Yratio2
其中,(rect.x,rect.y,rect.w,rect.h)为标题图像的位置信息,(rect.x,rect.y)为标题图像起始点的坐标信息,rect.w为标题图像的宽度,rect.h为标题图像的高度,(color_rect.x,color_rect.y,color_rect.w,color_rect.h)为子区域的位置信息,(color_rect.x,color_rect.y)为子区域的起始点的坐标信息,color_rect.w为子区域的宽度,color_rect.h为子区域的高度,Xratio1,Xratio2,Yratio1,Yratio2为预先设定的参数。
14.根据权利要求9所述的装置,其特征在于,所述文本区域确定模块,具体用于:
扫描所述第一二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第一像素值,并统计该行像素点中像素值不等于所述第一像素值的像素点的第一数量;以及,扫描所述第一二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第二像素值,并统计该列像素点中像素值不等于所述第二像素值的像素点的第二数量;
计算第一目标像素行及第一目标像素列包含的第一个像素点的像素值的第一平均值,其中,所述第一目标像素行为:所述第一二值化图像中第一数量小于预设数量的像素行,所述第一目标像素列为:所述第一二值化图像中第二数量小于预设数量的列;
若所述第一平均值小于128,确定所述第一二值化图像的标题文本内容的二值化特征为0,否则,确定所述第一二值化图像的标题文本内容的二值化特征为255;
利用所确定的第一二值化图像的标题文本内容的二值化特征,确定所述第一二值化图像的标题文本区域,作为第一文本区域;
扫描所述第二二值化图像的每行像素点,对于每行像素点,确定该行的第一个像素点的第三像素值,并统计该行像素点中像素值不等于所述第三像素值的像素点的第三数量;以及,扫描所述第二二值化图像的每列像素点,对于每列像素点,确定该列的第一个像素点的第四像素值,并统计该列像素点中像素值不等于所述第四像素值的像素点的第四数量;
计算第二目标像素行及第二目标像素列包含的第一个像素点的像素值的第二平均值,其中,所述第二目标像素行为:所述第二二值化图像中第三数量小于预设数量的像素行,所述第二目标像素列为:所述第一二值化图像中第四数量小于预设数量的列;
若所述第二平均值小于128,确定所述第二二值化图像的标题文本内容的二值化特征为0,否则,确定所述第二二值化图像的标题文本内容的二值化特征为255;
利用所确定的第二二值化图像的标题文本内容的二值化特征,确定所述第二二值化图像的标题文本区域,作为第二文本区域。
15.根据权利要求9至14任一项所述的装置,其特征在于,所述文本区域配准模块,具体用于:
确定所述第一文本区域的起始点在所述第一二值化图像中的第一坐标信息(x1,y1),以及所述第二文本区域的起始点在所述第二二值化图像中的第二坐标信息(x2,y2);
根据所述第一坐标信息(x1,y1)和所述第二坐标信息(x2,y2),确定所述第一文本区域对应的第一配准区域的第一区域坐标信息(x1,y1,w,h),以及所述第二文本区域对应的第二配准区域的第二区域坐标信息(x1,y1,w,h),其中,w为所述第一配准区域和所述第二匹配区域的宽度,h为所述第一配准区域和所述第二配准区域的高度。
16.根据权利要求15所述的装置,其特征在于,所述标题一致性确定模块,具体用于:
计算所述第一配准区域和所述第二配准区域中位置信息相对应的像素点的掩码的差分值;
计算所得到的差分值的差分平均值;
当所述差分平均值小于预设差分阈值,确定所述第一标题图像和所述第二标题图像具有同一标题,否则,确定所述第一标题图像和所述第二标题图像不具有同一标题。
17.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
CN201810456414.3A 2018-05-14 2018-05-14 一种标题一致性检测方法、装置及电子设备 Pending CN108664626A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810456414.3A CN108664626A (zh) 2018-05-14 2018-05-14 一种标题一致性检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810456414.3A CN108664626A (zh) 2018-05-14 2018-05-14 一种标题一致性检测方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN108664626A true CN108664626A (zh) 2018-10-16

Family

ID=63778459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810456414.3A Pending CN108664626A (zh) 2018-05-14 2018-05-14 一种标题一致性检测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108664626A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114663788A (zh) * 2022-03-29 2022-06-24 浙江奥脉特智能科技有限公司 一种基于Yolo V5的电塔缺陷检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915429A (zh) * 2011-08-04 2013-02-06 汉王科技股份有限公司 一种扫描图片匹配方法和装置
CN104766076A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种视频图像文字的检测方法和装置
CN105117704A (zh) * 2015-08-25 2015-12-02 电子科技大学 一种基于多特征的文本图像一致性比较方法
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN107545210A (zh) * 2016-06-27 2018-01-05 北京新岸线网络技术有限公司 一种视频文本提取的方法
CN107590447A (zh) * 2017-08-29 2018-01-16 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN107609546A (zh) * 2017-08-29 2018-01-19 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915429A (zh) * 2011-08-04 2013-02-06 汉王科技股份有限公司 一种扫描图片匹配方法和装置
CN104766076A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种视频图像文字的检测方法和装置
CN105117704A (zh) * 2015-08-25 2015-12-02 电子科技大学 一种基于多特征的文本图像一致性比较方法
CN107545210A (zh) * 2016-06-27 2018-01-05 北京新岸线网络技术有限公司 一种视频文本提取的方法
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN107590447A (zh) * 2017-08-29 2018-01-16 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN107609546A (zh) * 2017-08-29 2018-01-19 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114663788A (zh) * 2022-03-29 2022-06-24 浙江奥脉特智能科技有限公司 一种基于Yolo V5的电塔缺陷检测方法及系统

Similar Documents

Publication Publication Date Title
US10896349B2 (en) Text detection method and apparatus, and storage medium
WO2019148912A1 (zh) 一种图像处理方法、装置、电子设备及存储介质
CN108615030B (zh) 一种标题一致性检测方法、装置及电子设备
CN107590447A (zh) 一种文字标题识别方法及装置
EP3806064A1 (en) Method and apparatus for detecting parking space usage condition, electronic device, and storage medium
US7606414B2 (en) Fusion of color space data to extract dominant color
CN104504717B (zh) 一种图像信息检测方法及装置
CN108764352B (zh) 重复页面内容检测方法和装置
CN108875744B (zh) 基于矩形框坐标变换的多方向文本行检测方法
CN110399842B (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN107609546A (zh) 一种文字标题识别方法及装置
US8655060B2 (en) Night-scene light source detecting device and night-scene light source detecting method
WO2019210707A1 (zh) 一种图像清晰度评测方法、装置及电子设备
CN108052931A (zh) 一种车牌识别结果融合方法及装置
CN111259891A (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN113989626B (zh) 一种基于目标检测模型的多类别垃圾场景区分方法
CN115240197A (zh) 图像质量评价方法、装置、电子设备、扫描笔及存储介质
CN104281850A (zh) 一种文字区域识别方法和装置
CN108241874B (zh) 基于bp神经网络和频谱分析的视频文字区域定位方法
WO2023173949A1 (zh) 一种古籍识别方法、装置、存储介质及设备
CN108664626A (zh) 一种标题一致性检测方法、装置及电子设备
CN110879987A (zh) 一种识别试题作答内容的方法
CN110837789B (zh) 一种检测物体的方法、装置、电子设备及介质
CN103034855A (zh) 在图像中识别字符区域的方法
CN108363981B (zh) 一种标题检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181016