CN103761345A - 一种基于ocr字符识别技术的视频检索方法 - Google Patents

一种基于ocr字符识别技术的视频检索方法 Download PDF

Info

Publication number
CN103761345A
CN103761345A CN201410067419.9A CN201410067419A CN103761345A CN 103761345 A CN103761345 A CN 103761345A CN 201410067419 A CN201410067419 A CN 201410067419A CN 103761345 A CN103761345 A CN 103761345A
Authority
CN
China
Prior art keywords
video
character recognition
target
ocr character
search system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410067419.9A
Other languages
English (en)
Inventor
李志前
姚领众
王小帅
唐智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd
Original Assignee
SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd filed Critical SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd
Priority to CN201410067419.9A priority Critical patent/CN103761345A/zh
Publication of CN103761345A publication Critical patent/CN103761345A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于OCR字符识别技术的视频检索方法,以实现视频特征检索的同时,识别画面上的字符。其包括以下步骤:步骤1)选择所需检索的原始视频;步骤2)输入检索条件;步骤3)原始视频导入并自动转码;步骤4)检索视频中的运动目标;步骤5)判断是否有活动目标;步骤6)目标类别检测;步骤7)检测该运动目标的特征;步骤8)截取运动目标的关键帧;步骤9)对关键帧进行OCR字符识别;步骤10)检索结果储存与展示。本发明的视频检索方法能获取运动目标的更多特征,实现视频检索和OCR字符识别的结合。

Description

一种基于OCR字符识别技术的视频检索方法
技术领域
本发明属于视频处理技术领域,涉及一种视频分析方法,具体而言涉及一种基于OCR字符识别技术的视频检索方法。
背景技术
视频监控系统的建设规模不断扩大,并且逐渐高清化。视频的数量迅速提升,并且视频中所携带的信息量也越来越多。快速从视频大数据中挖掘信息,显得尤为重要。
视频检索技术已经开始在公安视频侦查等领域得到应用。例如,在海量视频中查找“一辆从东往西开的红色出租车”。检索后,再通过人工查看照片,回溯视频等方式,进行排查。而对于目标画面中的一些字符,例如车牌信息,也是通过人眼进行识别,信息难于共享,无法支持数据搜索。而实际上,字符的部分排查工作完全可以交由计算机进行处理。如果视频检索结合OCR字符识别技术,将能从视频画面中获取更多的信息,例如该出租车的车牌、车标、出租公司名以及车贴,甚至车检、保险单等信息。
发明内容
为克服现有技术中的缺点,本发明的目的在于提供一种基于OCR字符识别技术的视频检索方法,该视频检索方法除了检索目标特征外,还能从视频中获取字符的信息,并以直观方式展现出来。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:一种基于OCR字符识别技术的视频检索方法,其包括一视频检索系统,所述视频检索系统通过与OCR字符识别技术的结合,在海量视频中查找目标的字符信息,具体包括以下步骤:
步骤1)选择所需检索的视频
确定进行视频检索的海量视频库,记为原始视频;
步骤2)检索条件输入
在所述视频检索系统中输入检索条件,包括静态特征和动态特征;
步骤3)视频导入并转码
所述视频检索系统自动将选中的所述原始视频导入到所述视频检索系统的分析服务器中,并将不同编码格式的原始视频转码成为标准的H.264编码格式视频,记为标准视频;
步骤4)运动目标检测
所述视频监测系统检测所述标准视频中的运动目标,在分析初始阶段以背景去除法摘录视频中的运动目标;
步骤5)确认是否有目标
根据上述检测结果,所述视频检索系统判断视频中是否有运动目标,如果没有,则直接输出结果;如果有,则继续确认所述运动目标的类别与特征;
步骤6)目标类别检测
所述视频检索系统对所述运动目标的类别进行识别,确定目标是人物、车辆或者其他;
步骤7)目标特征检测
所述视频检索系统对所述运动目标的特征进行识别,所述特征包括所述运动目标的静态特征和所述运动目标的动态特征;
步骤8)目标关键帧选取
所述视频检索系统为每个检测到的运动目标,选取一个关键帧,要求所述运动目标在所述关键帧的画面中占的比例最大;
步骤9)目标关键帧的OCR字符识别
所述视频检索系统采用所述OCR字符识别技术对所述关键帧进行OCR字符识别,识别所述关键帧中的字符信息,获取识别结果以及对应的可信度;
步骤10)结果储存与展示
所述视频检索系统将视频检索和OCR字符识别的结果进行储存展示。
进一步的,在步骤2中,配置好所述视频检索系统的检索条件后,其他所有视频分析和OCR字符识别工作将由所述视频检索系统所述自动完成。
进一步的,在步骤10中,展示结果以所述运动目标的关键帧作为索引,与检索条件的相似度高低进行排列,并列出OCR字符识别结果。
优选的,所述识别结果支持根据字符或特征进行筛选,以及后续的根据文字搜索。
本发明的有益效果是:
1、利用OCR字符识别技术,可以识别视频画面中所带的字符如车牌、品牌商标等信息;
2、可以利用视频中的字符、车牌号、品牌商标等信息作为视频的检索条件进行输入。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的一种基于OCR字符识别技术的视频检索方法的流程示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
实施例1:
公安刑侦或者其他部门进行视频查看时,往往需要调取海量的视频,查找具有某个特征的某个目标,同时还关注该目标或者周边环境中所带的字符信息,尤其是目标车辆的车牌车标等信息。
如果某案件中,嫌疑车辆是某出租公司的一辆红色出租车,现调取了大量视频,需要确认该车的去向。使用本发明的基于OCR字符识别技术的视频检索方法可轻松高效的完成。具体处理方式如下,参见图1所示:
步骤1)选择所需检索的视频
选择所需进行视频检索的海量视频,可以下载到本地的视频文件,也可以是视频监控系统的存储服务器中的视频;
步骤2)检索条件输入
输入检索条件,在该例中,需要检索的是“一辆红色出租车”,输入完成后提交确认,之后的步骤将自动完成,OCR字符识别也将在检索后自动进行,无需特别设置。
步骤3)视频导入并转码
视频检索系统自动将所选择的视频导入到分析服务器中。调取的视频来自不同监控点,视频编码格式可能多样,为了方便处理,需要将不同编码格式的原始视频转码成为标准的H.264编码格式视频;
步骤4)运动目标检测
对转码完成后的视频,检测视频中的运动目标。视频侦查时一般不关注固定背景,例如停在车位中的车。所以在分析初始阶段,需要以背景去除法,摘录视频中的运动目标,这目标可能是行驶的车辆,或者人行道的行人,或者红绿灯的变化等;
步骤5)确认是否有目标
根据上述检测结果,判断视频中是否有运动目标,如果没有,则直接输出结果;如果有,则进入下一步,视频检索系统进行人、车分类;
步骤6)目标类别检测
视频检索系统对所检测出来的运动目标的类别进行识别,类别包括人、车、其他。在此例中,只需关注的类别是“车”;
步骤7)目标特征检测
视频检索系统对检测出来的“车”的特征进行识别,识别的特征包括目标的静态特征如颜色、纹理,以及目标的动态特征,如移动方向。此例中,只需关注颜色是“红色”的车;
步骤8)目标关键帧选取
为每辆检测到的“红色的车”,选取一个关键帧,要求目标在该帧画面中占的比例最大。所述关键帧可以作为结果展示时目标的索引,也将作为OCR字符识别的对象;
步骤9)目标关键帧的OCR字符识别
对所述的“红色的车”的关键帧,进行OCR字符识别,识别照片中的字符,例如车牌、车标、车门中的出租车公司信息等,并获取识别结果及对应的可信度;
步骤10)结果储存与展示
将视频检索和OCR字符识别的结果进行储存和展示。展示结果以目标的关键帧作为索引,按检索条件的相似度高低进行排列,并显示OCR字符识别结果。此例中,“红色的车”的照片将排在前列,点击该照片,可以播放该目标对应的原始视频片段,以及OCR检测的字符结果。系统支持通过字符,例如车牌后进行搜索。通过这些方式,大大减少视频信息挖掘所需时间。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于OCR字符识别技术的视频检索方法,其特征在于,视频检索系统通过与OCR字符识别技术的结合,在海量视频中查找目标的字符信息,具体包括以下步骤:
步骤1)选择所需检索的视频
确定进行视频检索的海量视频库,记为原始视频;
步骤2)检索条件输入
在所述视频检索系统中输入检索条件,包括静态特征和动态特征;
步骤3)视频导入并转码
所述视频检索系统自动将选中的所述原始视频导入到所述视频检索系统的分析服务器中,并将不同编码格式的原始视频转码成为标准的H.264编码格式视频,记为标准视频;
步骤4)运动目标检测
所述视频监测系统检测所述标准视频中的运动目标,在分析初始阶段以背景去除法摘录视频中的运动目标;
步骤5)确认是否有目标
根据上述检测结果,所述视频检索系统判断视频中是否有运动目标,如果没有,则直接输出结果;如果有,则继续确认所述运动目标的类别与特征;
步骤6)目标类别检测
所述视频检索系统对所述运动目标的类别进行识别,确定目标是人物、车辆或者其他;
步骤7)目标特征检测
所述视频检索系统对所述运动目标的特征进行识别,所述特征包括所述运动目标的静态特征和所述运动目标的动态特征;
步骤8)目标关键帧选取
所述视频检索系统为每个检测到的运动目标,选取一个关键帧,要求所述运动目标在所述关键帧的画面中占的比例最大;
步骤9)目标关键帧的OCR字符识别
所述视频检索系统采用所述OCR字符识别技术对所述关键帧进行OCR字符识别,识别所述关键帧中的字符信息,获取识别结果以及对应的可信度;
步骤10)结果储存与展示
所述视频检索系统将视频检索和OCR字符识别的结果进行储存展示。
2.根据权利要求1所述的基于OCR字符识别技术的视频检索方法,其特征在于:在步骤2中,配置好所述视频检索系统的检索条件后,其他所有视频分析和OCR字符识别工作将由所述视频检索系统所述自动完成。
3.根据权利要求1所述的基于OCR字符识别技术的视频检索方法,其特征在于:在步骤10中,展示结果以所述运动目标的关键帧作为索引,与检索条件的相似度高低进行排列,并列出OCR字符识别结果。
CN201410067419.9A 2014-02-27 2014-02-27 一种基于ocr字符识别技术的视频检索方法 Pending CN103761345A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410067419.9A CN103761345A (zh) 2014-02-27 2014-02-27 一种基于ocr字符识别技术的视频检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410067419.9A CN103761345A (zh) 2014-02-27 2014-02-27 一种基于ocr字符识别技术的视频检索方法

Publications (1)

Publication Number Publication Date
CN103761345A true CN103761345A (zh) 2014-04-30

Family

ID=50528581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410067419.9A Pending CN103761345A (zh) 2014-02-27 2014-02-27 一种基于ocr字符识别技术的视频检索方法

Country Status (1)

Country Link
CN (1) CN103761345A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126619A (zh) * 2016-06-20 2016-11-16 中山大学 一种基于视频内容的视频检索方法及系统
WO2016192501A1 (zh) * 2015-05-29 2016-12-08 中兴通讯股份有限公司 视频查找方法及装置
CN106257451A (zh) * 2015-12-18 2016-12-28 陶德龙 网站访问的方法及装置
CN113836972A (zh) * 2020-06-23 2021-12-24 中国移动通信集团辽宁有限公司 基于ocr的安全审计方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040255249A1 (en) * 2001-12-06 2004-12-16 Shih-Fu Chang System and method for extracting text captions from video and generating video summaries
CN101533474A (zh) * 2008-03-12 2009-09-16 三星电子株式会社 基于视频图像的字符和图像识别系统和方法
TW201039149A (en) * 2009-04-17 2010-11-01 Yu-Chieh Wu Robust algorithms for video text information extraction and question-answer retrieval
CN102207966A (zh) * 2011-06-01 2011-10-05 华南理工大学 基于对象标签的视频内容快速检索方法
CN103020624A (zh) * 2011-09-23 2013-04-03 杭州海康威视系统技术有限公司 混合车道监控视频智能标记、检索回放方法及其装置
CN103500230A (zh) * 2013-10-25 2014-01-08 苏州千视通信科技有限公司 基于样本图像的视频检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040255249A1 (en) * 2001-12-06 2004-12-16 Shih-Fu Chang System and method for extracting text captions from video and generating video summaries
CN101533474A (zh) * 2008-03-12 2009-09-16 三星电子株式会社 基于视频图像的字符和图像识别系统和方法
TW201039149A (en) * 2009-04-17 2010-11-01 Yu-Chieh Wu Robust algorithms for video text information extraction and question-answer retrieval
CN102207966A (zh) * 2011-06-01 2011-10-05 华南理工大学 基于对象标签的视频内容快速检索方法
CN103020624A (zh) * 2011-09-23 2013-04-03 杭州海康威视系统技术有限公司 混合车道监控视频智能标记、检索回放方法及其装置
CN103500230A (zh) * 2013-10-25 2014-01-08 苏州千视通信科技有限公司 基于样本图像的视频检索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016192501A1 (zh) * 2015-05-29 2016-12-08 中兴通讯股份有限公司 视频查找方法及装置
CN106257451A (zh) * 2015-12-18 2016-12-28 陶德龙 网站访问的方法及装置
CN106126619A (zh) * 2016-06-20 2016-11-16 中山大学 一种基于视频内容的视频检索方法及系统
CN113836972A (zh) * 2020-06-23 2021-12-24 中国移动通信集团辽宁有限公司 基于ocr的安全审计方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US9002066B2 (en) Methods, systems and processor-readable media for designing a license plate overlay decal having infrared annotation marks
US20210192227A1 (en) Method and apparatus for detecting parking space usage condition, electronic device, and storage medium
CN110837807A (zh) 一种套牌车辆的识别方法及系统
US9792301B2 (en) Multi-query privacy-preserving parking management system and method
US9854015B2 (en) Incident data collection for public protection agencies
CN110619277A (zh) 一种多社区智慧布控方法以及系统
Yousef et al. SIFT based automatic number plate recognition
Shobayo et al. Development of smart plate number recognition system for fast cars with web application
US20170091555A1 (en) Identification system
Youssef et al. Automatic vehicle counting and tracking in aerial video feeds using cascade region-based convolutional neural networks and feature pyramid networks
CN103761345A (zh) 一种基于ocr字符识别技术的视频检索方法
CN112016545A (zh) 一种包含文本的图像生成方法及装置
CN111191604A (zh) 检测车牌完整性的方法、设备和存储介质
US20190189159A1 (en) Vehicle annotation
Lin et al. Automatic vehicle license plate recognition system for smart transportation
Papakis et al. Convolutional neural network-based in-vehicle occupant detection and classification method using second strategic highway research program cabin images
Kiew et al. Vehicle route tracking system based on vehicle registration number recognition using template matching algorithm
CN109325755B (zh) 基于汽车轮毂的电子计费系统
CN113486957A (zh) 神经网络训练和图像处理方法及装置
KR20210066081A (ko) 태국 자동차 번호 인식이 가능한 주차 관제 시스템 및 그 방법
Baviskar et al. Auto Number Plate Recognition
CN115471804A (zh) 标注数据质检方法、装置、存储介质及电子设备
Sreedhar et al. Autotrack: a framework for query-based vehicle tracking and retrieval from CCTV footages using machine learning at the edge
Osabe et al. Solutions to social problems leveraging image analysis technology based on machine learning
CN114023028A (zh) 非机动车辆防盗预警方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215000 No. 209 Chuk Yuen Road, hi tech Industrial Development Zone, Jiangsu, Suzhou

Applicant after: Suzhou vision Polytron Technologies Inc

Address before: 215000 No. 209 Chuk Yuen Road, hi tech Industrial Development Zone, Jiangsu, Suzhou

Applicant before: SUZHOU QIANSHI COMMUNICATION TECHNOLOGY CO., LTD.

COR Change of bibliographic data
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140430

WD01 Invention patent application deemed withdrawn after publication