CN104616295A - 新闻图像中水平标题字幕的简单快速定位方法 - Google Patents

新闻图像中水平标题字幕的简单快速定位方法 Download PDF

Info

Publication number
CN104616295A
CN104616295A CN201510034625.4A CN201510034625A CN104616295A CN 104616295 A CN104616295 A CN 104616295A CN 201510034625 A CN201510034625 A CN 201510034625A CN 104616295 A CN104616295 A CN 104616295A
Authority
CN
China
Prior art keywords
boundary
headline
region
caption
main title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510034625.4A
Other languages
English (en)
Other versions
CN104616295B (zh
Inventor
王志衡
郭超
司增艳
贾利琴
王静
霍占强
姜国权
邓超
刘红敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN201510034625.4A priority Critical patent/CN104616295B/zh
Publication of CN104616295A publication Critical patent/CN104616295A/zh
Application granted granted Critical
Publication of CN104616295B publication Critical patent/CN104616295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种新闻图像中水平标题字幕的简单快速定位方法,包括:采集图像并输入计算机;截取整幅图像下面的区域作为处理区域,计算处理区域内各点的梯度,并利用阈值获得其边缘图;根据边缘图中各行包含的边缘点数目获得上下边界位置;对于获得的上下边界位置,基于最大特征得分获得其对应的目标区域;利用目标区域的梯度信息值确定第一个标题字幕区域;根据左边界位置差及高度比获得其余标题字幕区域;输出获得的标题字幕区域的边界位置信息。本发明提供的方法能够简单快速地定位新闻图像中的水平标题字幕。

Description

新闻图像中水平标题字幕的简单快速定位方法
技术领域
本发明涉及计算机视觉中的图像特征自动检测领域,特别是新闻图像中水平标题字幕的简单快速定位方法。
背景技术
新闻图像中标题字幕的定位在基于内容的新闻视频或图像检索、索引及理解等方面有着重要应用。长期以来,新闻图像中水平标题字幕的定位方法可以分为三类:1)基于投影的方法,该方法容易受标点符号的影响,导致标题字幕区域被截断;2)基于颜色的方法,该方法容易受到背景颜色的干扰,且计算复杂度相对较高;3)基于机器学习的方法,该方法需要大量的样本进行训练,导致算法复杂且效率较低。
发明内容
本发明针对新闻图像中水平标题字幕的快速检测定位问题,目的是提供一种能够提取出新闻图像中水平标题字幕的边界位置信息的快速方法。为了实现本目的,本发明新闻图像中水平标题字幕的简单快速定位方法,包括以下步骤:
      步骤S1:采集图像并输入计算机;
      步骤S2:截取整幅图像下面的区域作为处理区域,采用Sobel算子计算处理区域内的各点梯度,并利用阈值获得其边缘图;
      步骤S3:计算边缘图中各行包含的边缘点数目,获得上下边界位置;
      步骤S4:利用步骤S3中获得的上下边界位置,基于最大特征得分获得其对应的目标区域;
      步骤S5:基于目标区域的梯度信息值确定第一个标题字幕区域;
      步骤S6:根据左边界位置差及高度比获得其余标题字幕区域;
      步骤S7:输出步骤S5、S6获得的标题字幕区域的边界位置信息。
本发明提供的新闻图像中水平标题字幕的简单快速定位方法,主要利用了水平标题字幕的位置、字体大小及边缘信息等约束,首先截取整幅图像下面的区域作为处理区域,计算处理区域中各行包含的边缘点数目,获得上下边界位置,并利用上下边界位置,基于最大特征得分获得其对应的目标区域;然后基于目标区域的梯度信息值确定第一个标题字幕区域,并利用左边界位置差及高度比获得其余标题字幕区域;最后输出获得的标题字幕区域的边界位置信息。本发明提供的方法不仅能够准确定位新闻图像中的水平标题字幕,而且不易受标点符号的影响,不需要考虑字体颜色,也不需要进行大量样本的训练,在计算复杂性及效率上优于已有方法。
附图说明
图1为本发明新闻图像中水平标题字幕的简单快速定位方法流程图。
具体实施方式
如图1所示为本发明新闻图像中水平标题字幕的简单快速定位方法流程图,包括:采集图像并输入计算机、获得处理区域并计算其中各点的梯度及边缘图、获得上下边界位置、在上下边界约束下利用最大特征得分获得其对应的目标区域、基于目标区域的梯度信息值确定第一个标题字幕区域、利用左边界位置差及高度比获得其余标题字幕区域、输出获得的标题字幕区域的边界位置信息。各步骤的具体实施细节如下:
      步骤S1:  采集图像并输入计算机;
      步骤S2:  截取整幅图像下面的                                                区域作为处理区域,利用Sobel算子计算内各点梯度,并利用阈值内各点进行二值化处理获得边缘图,其中阈值设定为内各点梯度幅值的均值,边缘图中边缘点对应数值为1,其余为0;
        步骤S3:  通过计算边缘图中各行包含的边缘点数目获得上下边界位置,具体方式为,记内各行边缘点数目为,若连续行均满足,且,则记录连续区域的首行和末行作为上下边界;上述过程中表示行数,阈值的确定方法为,调节系数的取值范围为0.4~0.5,阈值的取值范围为10~15,表示上下边界的个数;
      步骤S4:  对于步骤S3得到的一个上下边界,基于最大特征得分获得其对应的目标区域,具体方式为,以为上下边界、变化左右边界,按照如下方式计算矩形区域的特征得分:
      (1)计算区域左、右边界的特征得分:分别表示左、右边界位置处的竖直直线, 表示边缘图上点处的数值,阈值的取值范围为1~2;
      (2)计算区域内部的特征得分:,权重系数的取值范围是1~2;
      (3)计算惩罚项:考虑中以为上下边界的长方形区域,利用大小为的小窗口沿区域水平中心线滑动,的取值范围是21~25,如果小窗口包含的边缘点个数为0则记录其中心位置;若矩形区域包含所述的中心位置,则,反之
      (4)计算矩形区域的特征得分:
      (5)以为上下边界,变化左右边界,计算所有矩形区域的特征得分,记当时矩形区域特征得分最大,则将作为对应的目标区域;
      步骤S5:  基于目标区域的梯度信息值确定第一个标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域,计算其梯度信息值,其中分别表示点处的水平梯度幅值和垂直梯度幅值,将梯度信息值最大的目标区域确定为第一个标题字幕区域;
      步骤S6:  根据左边界位置差及高度比获得其余标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域,如果同时满足如下条件将其认定为标题字幕区域:
      (1) ,其中的取值范围为90~120;
      (2)  ,其中的取值范围为0.7~0.9;
      步骤S7:输出步骤S5、S6获得的标题字幕区域的边界位置信息。

Claims (1)

1.一种新闻图像中水平标题字幕的简单快速定位方法,其特征在于,包括步骤:
       步骤S1: 采集图像并输入计算机;
       步骤S2: 截取整幅图像下面的                                                区域作为处理区域,利用Sobel算子计算内各点梯度,并利用阈值内各点进行二值化处理获得边缘图,其中阈值设定为内各点梯度幅值的均值,边缘图中边缘点对应数值为1,其余为0;
       步骤S3:   通过计算边缘图中各行包含的边缘点数目获得上下边界位置,具体方式为,记内各行边缘点数目为,若连续行均满足,且,则记录连续区域的首行和末行作为上下边界;上述过程中表示行数,阈值的确定方法为,调节系数的取值范围为0.4~0.5,阈值的取值范围为10~15,表示上下边界的个数;
       步骤S4: 对于步骤S3得到的一个上下边界,基于最大特征得分获得其对应的目标区域,具体方式为,以为上下边界、变化左右边界,按照如下方式计算矩形区域的特征得分:
      (1)计算区域左、右边界的特征得分:分别表示左、右边界位置处的竖直直线, 表示边缘图上点处的数值,阈值的取值范围为1~2;
       (2)计算区域内部的特征得分:,权重系数的取值范围是1~2;
       (3)计算惩罚项:考虑中以为上下边界的长方形区域,利用大小为的小窗口沿区域水平中心线滑动,的取值范围是21~25,如果小窗口包含的边缘点个数为0则记录其中心位置;若矩形区域包含所述的中心位置,则,反之
       (4)计算矩形区域的特征得分:
       (5)以为上下边界,变化左右边界,计算所有矩形区域的特征得分,记当时矩形区域特征得分最大,则将作为对应的目标区域;
      步骤S5: 基于目标区域的梯度信息值确定第一个标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域,计算其梯度信息值,其中分别表示点处的水平梯度幅值和垂直梯度幅值,将梯度信息值最大的目标区域确定为第一个标题字幕区域;
      步骤S6: 根据左边界位置差及高度比获得其余标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域,如果同时满足如下条件将其认定为标题字幕区域:
      (1) ,其中的取值范围为90~120;
      (2)  ,其中的取值范围为0.7~0.9;
      步骤S7:输出步骤S5、S6获得的标题字幕区域的边界位置信息。
CN201510034625.4A 2015-01-23 2015-01-23 新闻图像中水平标题字幕的简单快速定位方法 Active CN104616295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510034625.4A CN104616295B (zh) 2015-01-23 2015-01-23 新闻图像中水平标题字幕的简单快速定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510034625.4A CN104616295B (zh) 2015-01-23 2015-01-23 新闻图像中水平标题字幕的简单快速定位方法

Publications (2)

Publication Number Publication Date
CN104616295A true CN104616295A (zh) 2015-05-13
CN104616295B CN104616295B (zh) 2017-09-26

Family

ID=53150728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510034625.4A Active CN104616295B (zh) 2015-01-23 2015-01-23 新闻图像中水平标题字幕的简单快速定位方法

Country Status (1)

Country Link
CN (1) CN104616295B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609546A (zh) * 2017-08-29 2018-01-19 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN108304824A (zh) * 2018-02-28 2018-07-20 北京奇艺世纪科技有限公司 一种基于区域颜色的新闻标题的识别方法及装置
CN110598622A (zh) * 2019-09-06 2019-12-20 广州华多网络科技有限公司 视频字幕定位方法、电子设备以及计算机存储介质
CN110910373A (zh) * 2019-11-25 2020-03-24 西南交通大学 正交异性钢桥面板疲劳裂纹检测图像的识别方法
CN112216640A (zh) * 2020-10-19 2021-01-12 惠州高视科技有限公司 一种半导体芯片定位方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045346A1 (en) * 2004-08-26 2006-03-02 Hui Zhou Method and apparatus for locating and extracting captions in a digital image
CN101102419A (zh) * 2007-07-10 2008-01-09 北京大学 一种定位视频字幕区域的方法
CN102625029A (zh) * 2012-03-23 2012-08-01 无锡引速得信息科技有限公司 自适应阈值字幕检测方法
CN102915438A (zh) * 2012-08-21 2013-02-06 北京捷成世纪科技股份有限公司 一种视频字幕的提取方法及装置
US8929461B2 (en) * 2007-04-17 2015-01-06 Intel Corporation Method and apparatus for caption detection

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045346A1 (en) * 2004-08-26 2006-03-02 Hui Zhou Method and apparatus for locating and extracting captions in a digital image
US8929461B2 (en) * 2007-04-17 2015-01-06 Intel Corporation Method and apparatus for caption detection
CN101102419A (zh) * 2007-07-10 2008-01-09 北京大学 一种定位视频字幕区域的方法
CN102625029A (zh) * 2012-03-23 2012-08-01 无锡引速得信息科技有限公司 自适应阈值字幕检测方法
CN102915438A (zh) * 2012-08-21 2013-02-06 北京捷成世纪科技股份有限公司 一种视频字幕的提取方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SHIVAKUMARA P 等: "Accurate video text detection through classification of low and high contrast images", 《PATTERN RECOGNITION》 *
XIAOLING,FU 等: "Gray-based news video text extraction approach", 《COMPUTER SCIENCE AND CONVERGENCE INFORMATION TECHNOLOGY》 *
刘洋 等: "一种基于边缘检测和线条特征的视频字符检测算法", 《计算机学报》 *
郭丽 等: "视频文本的自动提取方法", 《小型微型计算机系统》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609546A (zh) * 2017-08-29 2018-01-19 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN107609546B (zh) * 2017-08-29 2020-12-18 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN108304824A (zh) * 2018-02-28 2018-07-20 北京奇艺世纪科技有限公司 一种基于区域颜色的新闻标题的识别方法及装置
CN110598622A (zh) * 2019-09-06 2019-12-20 广州华多网络科技有限公司 视频字幕定位方法、电子设备以及计算机存储介质
CN110598622B (zh) * 2019-09-06 2022-05-27 广州华多网络科技有限公司 视频字幕定位方法、电子设备以及计算机存储介质
CN110910373A (zh) * 2019-11-25 2020-03-24 西南交通大学 正交异性钢桥面板疲劳裂纹检测图像的识别方法
CN112216640A (zh) * 2020-10-19 2021-01-12 惠州高视科技有限公司 一种半导体芯片定位方法和装置
CN112216640B (zh) * 2020-10-19 2021-08-06 高视科技(苏州)有限公司 一种半导体芯片定位方法和装置

Also Published As

Publication number Publication date
CN104616295B (zh) 2017-09-26

Similar Documents

Publication Publication Date Title
CN104616295A (zh) 新闻图像中水平标题字幕的简单快速定位方法
CN102663409B (zh) 一种基于hog-lbp描述的行人跟踪方法
CN104574375B (zh) 结合彩色和深度信息的图像显著性检测方法
CN104134234B (zh) 一种全自动的基于单幅图像的三维场景构建方法
CN105335745B (zh) 图像中数字的识别方法、装置及设备
CN102855466B (zh) 一种基于视频图像处理的人数统计方法
CN104899892B (zh) 一种快速的星图图像星点提取方法
Tong et al. Skewness correction and quality evaluation of plug seedling images based on Canny operator and Hough transform
CN105457908B (zh) 基于单目ccd的小尺寸玻璃面板的分拣快速定位方法及系统
CN107464252A (zh) 一种基于混合特征的可见光与红外异源图像识别方法
Liu et al. The recognition of apple fruits in plastic bags based on block classification
CN103218605A (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN102156865A (zh) 手写文本行字符切分方法、识别方法
CN104123529A (zh) 人手检测方法及系统
CN105574527A (zh) 一种基于局部特征学习的快速物体检测方法
CN105512618B (zh) 视频跟踪方法
CN104931044A (zh) 一种星敏感器图像处理方法及系统
CN107527054A (zh) 基于多视角融合的前景自动提取方法
CN108090485A (zh) 基于多视角融合的图像前景自动提取方法
CN105046199A (zh) 基于像素分类器和椭圆拟合的指尖点提取方法
CN103106409A (zh) 一种针对头肩检测的混合特征提取方法
CN108830269A (zh) 确定满文单词中轴线宽度的方法
CN103606153A (zh) 一种从粪便显微图像中提取细胞的方法
CN103400134A (zh) 非接触式手指静脉样本感兴趣区域提取方法
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant