CN103761345A

CN103761345A - 一种基于ocr字符识别技术的视频检索方法

Info

Publication number: CN103761345A
Application number: CN201410067419.9A
Authority: CN
Inventors: 李志前; 姚领众; 王小帅; 唐智
Original assignee: SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd
Current assignee: SUZHOU QIANSHI COMMUNICATION TECHNOLOGY Co Ltd
Priority date: 2014-02-27
Filing date: 2014-02-27
Publication date: 2014-04-30

Abstract

本发明公开了一种基于OCR字符识别技术的视频检索方法，以实现视频特征检索的同时，识别画面上的字符。其包括以下步骤：步骤1）选择所需检索的原始视频；步骤2）输入检索条件；步骤3）原始视频导入并自动转码；步骤4）检索视频中的运动目标；步骤5）判断是否有活动目标；步骤6）目标类别检测；步骤7）检测该运动目标的特征；步骤8）截取运动目标的关键帧；步骤9）对关键帧进行OCR字符识别；步骤10）检索结果储存与展示。本发明的视频检索方法能获取运动目标的更多特征，实现视频检索和OCR字符识别的结合。

Description

一种基于OCR字符识别技术的视频检索方法

技术领域

本发明属于视频处理技术领域，涉及一种视频分析方法，具体而言涉及一种基于OCR字符识别技术的视频检索方法。

背景技术

视频监控系统的建设规模不断扩大，并且逐渐高清化。视频的数量迅速提升，并且视频中所携带的信息量也越来越多。快速从视频大数据中挖掘信息，显得尤为重要。

视频检索技术已经开始在公安视频侦查等领域得到应用。例如，在海量视频中查找“一辆从东往西开的红色出租车”。检索后，再通过人工查看照片，回溯视频等方式，进行排查。而对于目标画面中的一些字符，例如车牌信息，也是通过人眼进行识别，信息难于共享，无法支持数据搜索。而实际上，字符的部分排查工作完全可以交由计算机进行处理。如果视频检索结合OCR字符识别技术，将能从视频画面中获取更多的信息，例如该出租车的车牌、车标、出租公司名以及车贴，甚至车检、保险单等信息。

发明内容

为克服现有技术中的缺点，本发明的目的在于提供一种基于OCR字符识别技术的视频检索方法，该视频检索方法除了检索目标特征外，还能从视频中获取字符的信息，并以直观方式展现出来。

为实现上述技术目的，达到上述技术效果，本发明通过以下技术方案实现：一种基于OCR字符识别技术的视频检索方法，其包括一视频检索系统，所述视频检索系统通过与OCR字符识别技术的结合，在海量视频中查找目标的字符信息，具体包括以下步骤：

步骤1）选择所需检索的视频

确定进行视频检索的海量视频库，记为原始视频；

步骤2）检索条件输入

在所述视频检索系统中输入检索条件，包括静态特征和动态特征；

步骤3）视频导入并转码

所述视频检索系统自动将选中的所述原始视频导入到所述视频检索系统的分析服务器中，并将不同编码格式的原始视频转码成为标准的H.264编码格式视频，记为标准视频；

步骤4）运动目标检测

所述视频监测系统检测所述标准视频中的运动目标，在分析初始阶段以背景去除法摘录视频中的运动目标；

步骤5）确认是否有目标

根据上述检测结果，所述视频检索系统判断视频中是否有运动目标，如果没有，则直接输出结果；如果有，则继续确认所述运动目标的类别与特征；

步骤6）目标类别检测

所述视频检索系统对所述运动目标的类别进行识别，确定目标是人物、车辆或者其他；

步骤7）目标特征检测

所述视频检索系统对所述运动目标的特征进行识别，所述特征包括所述运动目标的静态特征和所述运动目标的动态特征；

步骤8）目标关键帧选取

所述视频检索系统为每个检测到的运动目标，选取一个关键帧，要求所述运动目标在所述关键帧的画面中占的比例最大；

步骤9）目标关键帧的OCR字符识别

所述视频检索系统采用所述OCR字符识别技术对所述关键帧进行OCR字符识别，识别所述关键帧中的字符信息，获取识别结果以及对应的可信度；

步骤10）结果储存与展示

所述视频检索系统将视频检索和OCR字符识别的结果进行储存展示。

进一步的，在步骤2中，配置好所述视频检索系统的检索条件后，其他所有视频分析和OCR字符识别工作将由所述视频检索系统所述自动完成。

进一步的，在步骤10中，展示结果以所述运动目标的关键帧作为索引，与检索条件的相似度高低进行排列，并列出OCR字符识别结果。

优选的，所述识别结果支持根据字符或特征进行筛选，以及后续的根据文字搜索。

本发明的有益效果是:

1、利用OCR字符识别技术，可以识别视频画面中所带的字符如车牌、品牌商标等信息；

2、可以利用视频中的字符、车牌号、品牌商标等信息作为视频的检索条件进行输入。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明的一种基于OCR字符识别技术的视频检索方法的流程示意图。

具体实施方式

下面将参考附图并结合实施例，来详细说明本发明。

实施例1：

公安刑侦或者其他部门进行视频查看时，往往需要调取海量的视频，查找具有某个特征的某个目标，同时还关注该目标或者周边环境中所带的字符信息，尤其是目标车辆的车牌车标等信息。

如果某案件中，嫌疑车辆是某出租公司的一辆红色出租车，现调取了大量视频，需要确认该车的去向。使用本发明的基于OCR字符识别技术的视频检索方法可轻松高效的完成。具体处理方式如下，参见图1所示：

步骤1）选择所需检索的视频

选择所需进行视频检索的海量视频，可以下载到本地的视频文件，也可以是视频监控系统的存储服务器中的视频；

步骤2）检索条件输入

输入检索条件，在该例中，需要检索的是“一辆红色出租车”，输入完成后提交确认，之后的步骤将自动完成，OCR字符识别也将在检索后自动进行，无需特别设置。

步骤3）视频导入并转码

视频检索系统自动将所选择的视频导入到分析服务器中。调取的视频来自不同监控点，视频编码格式可能多样，为了方便处理，需要将不同编码格式的原始视频转码成为标准的H.264编码格式视频；

步骤4）运动目标检测

对转码完成后的视频，检测视频中的运动目标。视频侦查时一般不关注固定背景，例如停在车位中的车。所以在分析初始阶段，需要以背景去除法，摘录视频中的运动目标，这目标可能是行驶的车辆，或者人行道的行人，或者红绿灯的变化等；

步骤5）确认是否有目标

根据上述检测结果，判断视频中是否有运动目标，如果没有，则直接输出结果；如果有，则进入下一步，视频检索系统进行人、车分类；

步骤6）目标类别检测

视频检索系统对所检测出来的运动目标的类别进行识别，类别包括人、车、其他。在此例中，只需关注的类别是“车”；

步骤7）目标特征检测

视频检索系统对检测出来的“车”的特征进行识别，识别的特征包括目标的静态特征如颜色、纹理，以及目标的动态特征，如移动方向。此例中，只需关注颜色是“红色”的车；

步骤8）目标关键帧选取

为每辆检测到的“红色的车”，选取一个关键帧，要求目标在该帧画面中占的比例最大。所述关键帧可以作为结果展示时目标的索引，也将作为OCR字符识别的对象；

步骤9）目标关键帧的OCR字符识别

对所述的“红色的车”的关键帧，进行OCR字符识别，识别照片中的字符，例如车牌、车标、车门中的出租车公司信息等，并获取识别结果及对应的可信度；

步骤10）结果储存与展示

将视频检索和OCR字符识别的结果进行储存和展示。展示结果以目标的关键帧作为索引，按检索条件的相似度高低进行排列，并显示OCR字符识别结果。此例中，“红色的车”的照片将排在前列，点击该照片，可以播放该目标对应的原始视频片段，以及OCR检测的字符结果。系统支持通过字符，例如车牌后进行搜索。通过这些方式，大大减少视频信息挖掘所需时间。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于OCR字符识别技术的视频检索方法，其特征在于,视频检索系统通过与OCR字符识别技术的结合，在海量视频中查找目标的字符信息，具体包括以下步骤：

步骤1）选择所需检索的视频

确定进行视频检索的海量视频库，记为原始视频；

步骤2）检索条件输入

步骤3）视频导入并转码

步骤4）运动目标检测

步骤5）确认是否有目标

步骤6）目标类别检测

步骤7）目标特征检测

步骤8）目标关键帧选取

步骤9）目标关键帧的OCR字符识别

步骤10）结果储存与展示

2.根据权利要求1所述的基于OCR字符识别技术的视频检索方法，其特征在于：在步骤2中，配置好所述视频检索系统的检索条件后，其他所有视频分析和OCR字符识别工作将由所述视频检索系统所述自动完成。

3.根据权利要求1所述的基于OCR字符识别技术的视频检索方法，其特征在于：在步骤10中，展示结果以所述运动目标的关键帧作为索引，与检索条件的相似度高低进行排列，并列出OCR字符识别结果。