CN104657721B - 一种基于自适应模板的视频osd时间识别方法 - Google Patents

一种基于自适应模板的视频osd时间识别方法 Download PDF

Info

Publication number
CN104657721B
CN104657721B CN201510102516.1A CN201510102516A CN104657721B CN 104657721 B CN104657721 B CN 104657721B CN 201510102516 A CN201510102516 A CN 201510102516A CN 104657721 B CN104657721 B CN 104657721B
Authority
CN
China
Prior art keywords
character
time
recognition
video
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510102516.1A
Other languages
English (en)
Other versions
CN104657721A (zh
Inventor
陈远浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Is According To Figure Network Technology Co Ltd
Original Assignee
Shanghai Is According To Figure Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Is According To Figure Network Technology Co Ltd filed Critical Shanghai Is According To Figure Network Technology Co Ltd
Priority to CN201510102516.1A priority Critical patent/CN104657721B/zh
Publication of CN104657721A publication Critical patent/CN104657721A/zh
Application granted granted Critical
Publication of CN104657721B publication Critical patent/CN104657721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种基于自适应模板的视频OSD时间识别方法,包括以下步骤:1)对视频帧中的OSD时间区域进行定位,获得若干候选区域;2)在各候选区域中,对时间字符进行定位及识别,根据设定时间段内的识别结果确定一个最终识别区域;3)根据所述最终识别区域生成多个字符模板,各字符模板记录每个字符的前景和背景区域;4)利用所述字符模板对待识别视频帧进行时间识别,并获得对应的识别置信度。与现有技术相比,本发明具有识别精度高、适用范围广、可处理短暂花屏情况等优点。

Description

一种基于自适应模板的视频OSD时间识别方法
技术领域
本发明涉及一种视频信息识别方法,尤其是涉及一种基于自适应模板的视频OSD时间识别方法。
背景技术
视频OSD(on-screen display)时间识别主要采用图像分类算法,可以从图像中抽取边缘信息等特征,然后用Kmeans、SVM等机器学习模型进行分类;也可以直接用深度神经网络进行分类;还可以使用OCR软件进行识别,由于OCR软件是针对所有字符库的识别,因此,使用视频OCR技术识别文字非常耗时,更重要的是,这种检测识别方法的准确率很低,并不能处理低分辨率情况,如果把数字识别成字符后续将很难处理。由于OSD时间识别的结果通常要用作数据库索引,因此对精度要求非常高(99.99%以上)。当出现复杂背景变化、花屏等情况时,现有的机器学习算法的分类准确率会受到较大影响,无法满足需求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种识别精度高、适用范围广、可处理短暂花屏情况的基于自适应模板的视频OSD时间识别方法。
本发明的目的可以通过以下技术方案来实现:
一种基于自适应模板的视频OSD时间识别方法,包括以下步骤:
1)对视频帧中的OSD时间区域进行定位,获得若干候选区域;
2)在各候选区域中,对时间字符进行定位及识别,根据设定时间段内的识别结果确定一个最终识别区域;
3)根据所述最终识别区域生成多个字符模板,各字符模板记录每个字符的前景和背景区域;
4)利用所述字符模板对待识别视频帧进行时间识别,并获得对应的识别置信度。
所述步骤1)中,采用Boosting方法和先验参数检测时间字符所在区域,对OSD时间区域进行定位。
所述先验参数包括区域长宽比和区域位置。
所述步骤2)中,采用深度神经网络方法对时间字符进行定位及识别,具体为:
a)在视频帧图像中找到单一颜色的联通区域;
b)在联通区域上采用扫描窗口的方法,对每个窗口进行字符识别,保留置信度大于设定置信度阈值的窗口;
c)检索同时满足如下条件的六个窗口:
i)在同一水平线上,ii)相同间隔,iii)构成数字满足时间约束;
d)判断步骤c)是否检索到满足条件的六个窗口,若是,则执行步骤e),若否,则减小设定置信度阈值,返回步骤b);
e)判断检索到满足条件的六个窗口的组合数据是否大于1,若是,则选择其中字符识别置信度最高的一组为最终定位结果,若否,则直接以检索到的六个窗口为最终定位结果。
所述步骤3)中,根据步骤2)获得的多帧深度神经网络定位和识别的字符生成字符模板。
所述步骤4)中,根据字符模板对待识别视频帧进行时间识别时,将各个字符模板应用到待识别视频帧上,统计每个字符模板下前景的灰度值方差,取方差最小的字符模板作为识别结果,并用该方差作为对应的识别置信度。
该方法还包括:
判断识别置信度是否小于设定值,若是,则根据上一视频帧的识别结果修正当前视频帧的识别结果,若否,则退出。
与现有技术相比,本发明具有以下优点:
(1)本发明利用一段时间的识别结果自适应地生成字符模板,可以充分利用OSD字符的特性,识别更加准确,大大减少复杂背景对识别结果的影响;
(2)由于字符位置固定,所以采用字符模板进行识别,字符边缘会精确到每个像素,有利于提高识别精度;
(3)不同摄像头厂商之间的OSD时间字体差异很大,本发明采用自适应的字符模板,字符模板是根据历史数据确定的,比起通用的字符识别模型,识别率达到100%,适用范围更广;
(4)本发明对字符进行识别时,采用基于深度神经网络的字符分类器,可以有效识别不同字体的时间字符,从而有效帮助生成字符模板;
(5)本发明采用了帧间的时间识别修正,可以进一步提升识别精度,并可处理短暂的花屏情况。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
如图1所示,本实施例提供一种基于自适应模板的视频OSD时间识别方法,通过对输入的监控视频进行识别,获得视频中每一帧的OSD时间,具体包括以下步骤:
步骤S01,对视频帧中的OSD时间区域进行定位,获得若干候选区域。
采用Boosting方法检测时间字符所在区域,该区域的梯度变化具有一定规律。然后通过OSD字符区域的一些其他先验参数帮助确定位置,先验参数包括区域的长宽比、区域的位置等,可以有若干个候选区域。
步骤S02,在各候选区域中,采用深度神经网络方法对时间字符进行定位及识别,根据设定时间段内的识别结果确定一个最终识别区域,具体为:
a)在视频帧图像中找到单一颜色的联通区域;
b)在联通区域上采用扫描窗口的方法,对每个窗口进行字符识别,保留置信度大于设定置信度阈值的窗口;
c)检索同时满足如下条件的六个窗口:
i)在同一水平线上,ii)相同间隔,iii)构成数字满足时间约束;
d)判断步骤c)是否检索到满足条件的六个窗口,若是,则执行步骤e),若否,则减小设定置信度阈值,返回步骤b);
e)判断检索到满足条件的六个窗口的组合数据是否大于1,若是,则选择其中字符识别置信度最高的一组为最终定位结果,若否,则直接以检索到的六个窗口为最终定位结果。
步骤S03,根据多帧深度神经网络定位和识别的字符生成多个字符模板,各字符模板记录每个字符的前景和背景区域,由同一字符的多帧图片在每个像素上灰度值的方差大小来区分前景与背景区域。
本方法能根据视频帧中OSD时间字体自动生成专门的字符模板,比起通用的字符识别模型,识别率解决100%;同时可以适用不同视频,即使该视频的字体不在字符识别的训练数据中。
步骤S04,利用所述字符模板对待识别视频帧进行时间识别,并获得对应的识别置信度。
根据字符模板对待识别视频帧进行时间识别时,将各个字符模板应用到待识别视频帧上,统计每个字符模板下前景的灰度值方差,取方差最小的字符模板作为识别结果,并用该方差作为对应的识别置信度。
实施例2
参考图1所示,本实施例提供的基于自适应模板的视频OSD时间识别方法还包括:
步骤S05,判断识别置信度是否小于设定值,若是,则利用帧间时间连续递增的先验,根据上一视频帧的识别结果修正当前视频帧的识别结果,若否,则退出。
其余同实施例1。

Claims (6)

1.一种基于自适应模板的视频OSD时间识别方法,其特征在于,包括以下步骤:
1)对视频帧中的OSD时间区域进行定位,获得若干候选区域;
2)在各候选区域中,采用深度神经网络方法对时间字符进行定位及识别,根据设定时间段内的识别结果确定一个最终识别区域,具体为:
a)在视频帧图像中找到单一颜色的联通区域;
b)在联通区域上采用扫描窗口的方法,对每个窗口进行字符识别,保留置信度大于设定置信度阈值的窗口;
c)检索同时满足如下条件的六个窗口:
i)在同一水平线上,ii)相同间隔,iii)构成数字满足时间约束;
d)判断步骤c)是否检索到满足条件的六个窗口,若是,则执行步骤e),若否,则减小设定置信度阈值,返回步骤b);
e)判断检索到满足条件的六个窗口的组合数据是否大于1,若是,则选择其中字符识别置信度最高的一组为最终定位结果,若否,则直接以检索到的六个窗口为最终定位结果;
3)根据所述最终识别区域生成多个字符模板,各字符模板记录每个字符的前景和背景区域;
4)利用所述字符模板对待识别视频帧进行时间识别,并获得对应的识别置信度。
2.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤1)中,采用Boosting方法和先验参数检测时间字符所在区域,对OSD时间区域进行定位。
3.根据权利要求2所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述先验参数包括区域长宽比和区域位置。
4.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤3)中,根据步骤2)获得的多帧深度神经网络定位和识别的字符生成字符模板。
5.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤4)中,根据字符模板对待识别视频帧进行时间识别时,将各个字符模板应用到待识别视频帧上,统计每个字符模板下前景的灰度值方差,取方差最小的字符模板作为识别结果,并用该方差作为对应的识别置信度。
6.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,该方法还包括:
判断识别置信度是否小于设定值,若是,则根据上一视频帧的识别结果修正当前视频帧的识别结果,若否,则退出。
CN201510102516.1A 2015-03-09 2015-03-09 一种基于自适应模板的视频osd时间识别方法 Active CN104657721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510102516.1A CN104657721B (zh) 2015-03-09 2015-03-09 一种基于自适应模板的视频osd时间识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510102516.1A CN104657721B (zh) 2015-03-09 2015-03-09 一种基于自适应模板的视频osd时间识别方法

Publications (2)

Publication Number Publication Date
CN104657721A CN104657721A (zh) 2015-05-27
CN104657721B true CN104657721B (zh) 2018-09-25

Family

ID=53248822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510102516.1A Active CN104657721B (zh) 2015-03-09 2015-03-09 一种基于自适应模板的视频osd时间识别方法

Country Status (1)

Country Link
CN (1) CN104657721B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657591A (zh) * 2017-09-05 2018-02-02 维沃移动通信有限公司 一种图像处理方法及移动终端
CN108875738B (zh) * 2018-06-13 2022-03-08 深圳市云识科技有限公司 一种智能摄像表的云识别纠错系统及其方法
CN109712456A (zh) * 2019-01-15 2019-05-03 山东仁博信息科技有限公司 一种基于摄像头的学生纸质作业智能批阅系统
CN111126378B (zh) * 2019-11-18 2022-04-15 杭州亿圣信息技术有限公司 一种视频osd提取与覆盖区域重建的方法
CN112019925B (zh) * 2020-10-29 2021-01-22 蘑菇车联信息科技有限公司 视频水印识别处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464949A (zh) * 2009-01-16 2009-06-24 清华大学 体育视频中数字时钟的识别方法
CN101533474A (zh) * 2008-03-12 2009-09-16 三星电子株式会社 基于视频图像的字符和图像识别系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533474A (zh) * 2008-03-12 2009-09-16 三星电子株式会社 基于视频图像的字符和图像识别系统和方法
CN101464949A (zh) * 2009-01-16 2009-06-24 清华大学 体育视频中数字时钟的识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种改进的AdaBoost算法——AD AdaBoost;李闯 等;《计算机学报》;20070131;第108页第4段,图5 *
视频图像文字检测研究;孙福生;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130715;全文 *

Also Published As

Publication number Publication date
CN104657721A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN104657721B (zh) 一种基于自适应模板的视频osd时间识别方法
CN107729899B (zh) 一种车牌号码识别方法及装置
CN110348522B (zh) 一种图像检测识别方法及系统、电子设备、图像分类网络优化方法及系统
CN109874313A (zh) 文本行检测方法及文本行检测装置
CN103336954A (zh) 一种视频中的台标识别方法和装置
JP5889727B2 (ja) 電子機器の捺印シンボル検査装置、及びその方法
JP2008250908A (ja) 映像判別方法および映像判別装置
CN107977645B (zh) 一种视频新闻海报图的生成方法及装置
CN108093314B (zh) 一种视频新闻拆分方法及装置
US10440296B2 (en) Method for processing an asynchronous signal
CN105303153A (zh) 一种车辆车牌识别方法及装置
WO2017088479A1 (zh) 台标识别方法及装置
CN111046872A (zh) 一种光学字符识别方法
US8300937B2 (en) Image segmentation method and system based on region features of pixels
CN109840520A (zh) 一种发票关键信息识别方法及系统
CN109740553B (zh) 一种基于识别的图像语义分割数据筛选方法及系统
US20110156999A1 (en) Gesture recognition methods and systems
CN111985469B (zh) 一种图像中文字的识别方法、装置及电子设备
CN109886978A (zh) 一种基于深度学习的端到端告警信息识别方法
Kim et al. Effective character segmentation for license plate recognition under illumination changing environment
CN110807457A (zh) Osd字符识别方法、装置及存储装置
US11113519B2 (en) Character recognition apparatus, character recognition program, and character recognition method
CN107145888A (zh) 视频字幕实时翻译方法
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和系统
CN104850819B (zh) 信息处理方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant