CN111476279A - 基于相似程度值的识别方法、装置和计算机设备 - Google Patents
基于相似程度值的识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN111476279A CN111476279A CN202010213651.4A CN202010213651A CN111476279A CN 111476279 A CN111476279 A CN 111476279A CN 202010213651 A CN202010213651 A CN 202010213651A CN 111476279 A CN111476279 A CN 111476279A
- Authority
- CN
- China
- Prior art keywords
- picture
- similarity
- preset
- value
- frame picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000013145 classification model Methods 0.000 claims abstract description 68
- 238000012549 training Methods 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 42
- 238000012795 verification Methods 0.000 claims description 27
- 238000003384 imaging method Methods 0.000 claims description 24
- 238000003062 neural network model Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001678 irradiating effect Effects 0.000 claims description 4
- 238000013479 data entry Methods 0.000 abstract description 19
- 230000008569 process Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请揭示了一种基于相似程度值的识别方法、装置、计算机设备和存储介质,所述方法包括:实时获取所述第一摄像头拍摄的第一视频,并从中获取当前帧图片,以及获取多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则利用第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到图片类别;若所述图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
Description
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于相似程度值的识别方法、装置、计算机设备和存储介质。
背景技术
数据录入是数据处理的前置条件。对于数据录入,最早采用的是人工录入的手段,以将纸质资料录入计算机中。随着智能识别技术的发展,出现了例如光学字符识别等文字识别技术,从而提高了数据录入的效率。但是,当需要录入的资料数量多且种类杂时,仍需要采用人工辅助的方式(例如控制文字识别的时机,以针对性录入数据),从而造成了数据录入的效率下降。
发明内容
本申请的主要目的为提供一种基于相似程度值的识别方法、装置、计算机设备和存储介质,旨在提高数据录入的效率。
为了实现上述发明目的,本申请提出一种基于相似程度值的识别方法,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
判断所述图片分类模型输出的图片类别是否为文字图片;
若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
进一步地,所述根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值的步骤,包括:
执行第一次图片相似判断操作、第二次图片相似判断操作、...、第n次图片相似判断操作,从而获取n次判断结果,其中剩余帧图片共有n张;其中所述第一次图片相似判断操作用于判断所述参考帧图片与第一张剩余帧图片是否相似;所述第二次图片相似判断操作用于判断所述参考帧图片与第二张剩余帧图片是否相似;...;所述第n次图片相似判断操作用于判断所述参考帧图片与第n张剩余帧图片是否相似;
采用预设的计数规则,利用所述n次判断结果,调整预设的计数器的数值,其中所述计数规则指当判断结果为相似时,计数器的读数增加预设数值;
获取所述计数器的最终读数,并将所述最终读数作为所述参考帧图片与所述剩余帧图片之间的第一相似度值。
进一步地,所述执行第一次图片相似判断操作的步骤,包括:
根据预设的区块划分方法,对所述参考帧图片进行区块划分以得到多个区块,并从所述多个区块中选出多个指定区块,以及获取所述多个指定区块之间的相对位置关系;
判断所述第一张剩余帧图片中是否存在所述多个指定区块;
若所述第一张剩余帧图片中存在所述多个指定区块,则判断所述第一张剩余帧图片中的多个指定区块之间是否符合所述相对位置关系;
若所述第一张剩余帧图片中的多个指定区块之间符合所述相对位置关系,则判定所述参考帧图片与所述第一张剩余帧图片相似。
进一步地,所述根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值的步骤,包括:
根据预设的像素点划分方法,将所述当前帧图片的所有像素点划分为第一像素点和第二像素点,其中所述第一像素点的色值大于预设的色值阈值,所述第二像素点的色值不大于所述色值阈值;
对所述当前帧图片进行部分透明化处理,以使所述当前帧图片中的第一像素点变为透明像素点,从而得到第一中间图片;
将所述第一中间图片引入预设的虚拟空间中,并采用预设的光源对所述第一中间图片进行照射,从而在预设的成像平面中获取第一斑点图案,其中所述第一中间图片位于所述光源与所述成像平面之间;
根据预设的像素点划分方法,将所述参考帧图片的所有像素点划分为第三像素点和第四像素点,其中所述第三像素点的色值大于所述色值阈值,所述第四像素点的色值不大于所述色值阈值;
对所述参考帧图片进行部分透明化处理,以使所述参考帧图片中的第三像素点变为透明像素点,从而得到第二中间图片;
将所述第二中间图片引入所述虚拟空间中,并采用所述光源对所述第二中间图片进行照射,从而在所述成像平面中获取第二斑点图案,其中所述第二中间图片位于所述光源与所述成像平面之间;并且所述第二中间图片与所述光源的相对位置,与所述第一中间图片与所述光源的相对位置相同;所述第二中间图片与所述成像平面的相对位置,与所述第一中间图片与所述成像平面的相对位置相同;
根据公式:
进一步地,所述将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成的步骤之前,包括:
利用预先收集的图片生成p个样本集,其中每个样本集均包括训练用文字图片和训练用非文字图片,每个样本集包括的图片总数量相同,并且第一个样本集、第二个样本集、...、第p个样本集中的训练用文字图片的数量依次增加;
抽取所述p个样本集中的一个样本集作为验证集,并将除所述验证集之外的其他样本集记为p-1个训练集;
利用所述p-1个训练集对预设的神经网络模型进行p-1次训练,其中每次训练仅使用单一训练集中的样本数据,从而获得训练完成的中间模型;
利用所述验证集对所述中间模型进行验证,并判断验证是否通过;
若验证通过,则将所述中间模型记为所述图片分类模型。
进一步地,所述利用预设的文字识别方法识别所述清晰图片,从而得到识别文字的步骤,包括:
分别使用预设的多种文字识别工具识别所述清晰图片,从而对应得到多个中间识别文本;
判断所述多个中间识别文本是否完全相同;
若所述多个中间识别文本完全相同,则将所述中间识别文本记为所述识别文字。
本申请提供一种基于相似程度值的识别装置,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
视频获取单元,用于实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
第一相似计算单元,用于将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
第二相似计算单元,用于若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
清晰图片获取单元,用于若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
图片类别获取单元,用于将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
图片类别判断单元,用于判断所述图片分类模型输出的图片类别是否为文字图片;
识别文字获取单元,用于若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于相似程度值的识别方法、装置、计算机设备和存储介质,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别;若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
附图说明
图1为本申请一实施例的基于相似程度值的识别方法的流程示意图;
图2为本申请一实施例的基于相似程度值的识别装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种基于相似程度值的识别方法,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
S1、实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
S2、将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
S3、若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
S4、若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
S5、将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
S6、判断所述图片分类模型输出的图片类别是否为文字图片;
S7、若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
本申请通过双摄像头的设计,无需人工控制文字识别的时机,却能够实现全程全自动的数据识别,以提高数据录入的效率。其中,双摄像头中,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,能够降低能耗,减少计算消耗,更有利于数据录入的实现。其中所述指定终端可为固定终端,也可为移动终端,当所述指定终端为移动终端时,还能够提高续航时间。
如上述步骤S1所述,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片。其中,所述第一摄像头与第二摄像头的状态可为任意可行状态,优选所述第一摄像头常态下处于开启状态,第二摄像头常态下处于关闭状态。所述常态指所述指定终端未开始进行数据录入时的状态,包括且不限于待机状态等。所述第一摄像头的分辨率比所述第二摄像头的分辨率低,从而常态下指定终端的能耗与算力消耗得到了降低。
如上述步骤S2所述,将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值。将所述多张连续帧图片进行划分的方法可为任意可行方法,例如指定多张连续帧图片的第一帧图片为参考帧图片。所述第一图片相似计算方法为任意可行方法,例如为计算参考帧图片与每个剩余帧图片之间的相似度,从而得到多个第一相似度值;或者,计算参考帧图片与由所有的剩余帧图片所构成的整体之间的相似度,从而得到一个第一相似度值。从而,所述第一相似度值可衡量所述多张连续帧图片之间是否均彼此相似。
如上述步骤S3所述,若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值。若所述第一相似度值大于预设的第一相似阈值,表明所述多张连续帧图片之间彼此相似,即在所述多张连续帧图片的持续时间内,所述第一终端未进行大幅度的位移,因此所述第一终端有可能意图进行数据录入。为了进一步判断,本申请通过判断所述第二相似程度值是否大于预设的第二相似阈值,以确定最新的当前帧图片与参考帧图片之间的相似程度,以进一步判断所述第一终端的意图。其中所述第二图片相似计算方法,优选采用计算量大于所述第一图片相似计算方法的方法,以在节省算力的前提下,保证计算的准确性。
如上述步骤S4所述,若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象。若所述第二相似程度值大于预设的第二相似阈值,则可确定所述第一终端意图进行数据录入,因此开启分辨率更高的第二摄像头,以对指定对象进行图像采集,从而得到清晰图片。其中所述清晰图片是相对于所述第一摄像头采集的图片或视频而言,其清晰度更高,因此称之为清晰图片。进一步地,所述第二摄像头的初始参数可被设置为,取景范围与所述第一摄像头的取景范围相同,从而在所述第二摄像头开启之后,无需进一步调整参数,即可直接完成清晰图片的采集,进一步提高了数据录入的效率。
如上述步骤S5所述,将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成。为了确保清晰图片是需要录入的数据源,本申请先对清晰图片进行分类,以防止错误图片对数据的干扰。其中所述神经网络模型可为任意可行的模型,例如为VGG19模型、DenseNet模型和和CNN模型等。
如上述步骤S6所述,判断所述图片分类模型输出的图片类别是否为文字图片。由于图片分类模型经由已标注过类别的训练用图片构成的样本数据训练而成,因此能够胜任将文字图片划分出来的任务。当输出的图片类型为文字图片是,该文字图片中的文字内容即为应录入的数据。
如上述步骤S7所述,若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。其中所述文字识别方法为任意可行的识别方法,例如为基于光学字符识别技术的文字识别方法,从而将文字图片中的文字数据转换为识别文字,完成了数据录入的过程。
在此对本申请应用场景进行举例:银行工作人员上门服务时(例如对对公开户交易),需要录入的资料至少包括:证照资料12类,填写字段信息147项等。在此场景中,工作人员意图录入资料时,用指定终端的第一摄像头对准相应资料,那么当判断应该进行资料采集时(即所述第二相似程度值大于预设的第二相似阈值),则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片。而该清晰图片即为数据采集的基础,该清晰图片例如为身份证图片等。随后再进行图片分类与文字识别,从而实现工作人员无需手工录入,只需利用指定终端进行拍摄或拍照,即可实现数据录入;并且由于数据录入是基于高分辨率的第二摄像头采集到的图像,因此数据准确性得到了提高,而且采用了分辨率较低的第一摄像头进行数据采集时机的判断的设计,能够减少错误数据的录入,并且由于第一摄像头的分辨率较低,其耗费的资源与成本也较低,即以较低的代价实现了整个方案的性能提升。进一步地,利用指定终端获得的视频、图片和所述识别文字,还将同时传送给多个系统,或者传送给多个系统中的一个系统(所述多个系统之间实现数据共享),从而实现了工作人员现场零手工输入,后台能够获取全面数据的目的。进一步地,将指定终端获得的视频、图片和所述识别文字发送给多个系统,或者传送给多个系统中的一个系统(所述多个系统之间实现数据共享)之时,还采用电子签名、电子表单和电子回执等技术手段,以实现数据的区分、分类、统计,并且提高安全性。
在一个实施方式中,所述根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值的步骤S2,包括:
S201、执行第一次图片相似判断操作、第二次图片相似判断操作、...、第n次图片相似判断操作,从而获取n次判断结果,其中剩余帧图片共有n张;其中所述第一次图片相似判断操作用于判断所述参考帧图片与第一张剩余帧图片是否相似;所述第二次图片相似判断操作用于判断所述参考帧图片与第二张剩余帧图片是否相似;...;所述第n次图片相似判断操作用于判断所述参考帧图片与第n张剩余帧图片是否相似;
S202、采用预设的计数规则,利用所述n次判断结果,调整预设的计数器的数值,其中所述计数规则指当判断结果为相似时,计数器的读数增加预设数值;
S203、获取所述计数器的最终读数,并将所述最终读数作为所述参考帧图片与所述剩余帧图片之间的第一相似度值。
如上所述,实现了计算所述参考帧图片与所述剩余帧图片之间的第一相似度值。本申请采用先进行n次图片相似判断操作,再利用所述n次判断结果,调整预设的计数器的数值,从而得到第一相似程度值的方式,以完成由一个第一相似度值来衡量参考帧图片与由所有的剩余帧图片所构成的整体之间的相似度。由此,可排除特定状态下的误判(例如偶然的抖动或某一画面帧扭曲的状况)。其中,所述计数器的初始读数可为任意可行读数,优选为0。所述预设数值例如为1。从而计数器的最终读数即反应了参考帧图片与由所有的剩余帧图片所构成的整体之间的相似度,据此,将其作为第一相似度值。由于本申请以一个第一相似度值作为相似衡量的标准,相较于普通的依据多个相似度值的方式,其判断更为精准快捷。
在一个实施方式中,所述执行第一次图片相似判断操作的步骤S201,包括:
S2011、根据预设的区块划分方法,对所述参考帧图片进行区块划分以得到多个区块,并从所述多个区块中选出多个指定区块,以及获取所述多个指定区块之间的相对位置关系;
S2012、判断所述第一张剩余帧图片中是否存在所述多个指定区块;
S2013、若所述第一张剩余帧图片中存在所述多个指定区块,则判断所述第一张剩余帧图片中的多个指定区块之间是否符合所述相对位置关系;
S2014、若所述第一张剩余帧图片中的多个指定区块之间符合所述相对位置关系,则判定所述参考帧图片与所述第一张剩余帧图片相似。
如上所述,实现了执行第一次图片相似判断操作。其中区块划分方法,例如为,采用网格式划分,或者采用扇形式划分。所述指定区块可为多个区块中的任意可行区块,其筛选方法例如为随机选出多个指定区块,或者从多个区块中选出色值差最大(即区块中色值最大的像素点的色值,减去色值最小的像素点的色值得到的差值最大)的几个区块作为所述多个指定区块。因此所述多个指定区块即代表了所述参考帧图片,从而无需对第一张剩余帧图片进行全面的图片识别即可进行相似判断,即只需判断所述第一张剩余帧图片中是否存在所述多个指定区块即可,从而减小了计算量。为了进一步保证相似判断的准确性,本申请更采用了相对位置关系的判断依据,即若所述第一张剩余帧图片中的多个指定区块之间符合所述相对位置关系,才判定所述参考帧图片与所述第一张剩余帧图片相似。从而在节省算力的前提下保证了计算的准确度。
在一个实施方式中,所述根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值的步骤S3,包括:
S301、根据预设的像素点划分方法,将所述当前帧图片的所有像素点划分为第一像素点和第二像素点,其中所述第一像素点的色值大于预设的色值阈值,所述第二像素点的色值不大于所述色值阈值;
S302、对所述当前帧图片进行部分透明化处理,以使所述当前帧图片中的第一像素点变为透明像素点,从而得到第一中间图片;
S303、将所述第一中间图片引入预设的虚拟空间中,并采用预设的光源对所述第一中间图片进行照射,从而在预设的成像平面中获取第一斑点图案,其中所述第一中间图片位于所述光源与所述成像平面之间;
S304、根据预设的像素点划分方法,将所述参考帧图片的所有像素点划分为第三像素点和第四像素点,其中所述第三像素点的色值大于所述色值阈值,所述第四像素点的色值不大于所述色值阈值;
S305、对所述参考帧图片进行部分透明化处理,以使所述参考帧图片中的第三像素点变为透明像素点,从而得到第二中间图片;
S306、将所述第二中间图片引入所述虚拟空间中,并采用所述光源对所述第二中间图片进行照射,从而在所述成像平面中获取第二斑点图案,其中所述第二中间图片位于所述光源与所述成像平面之间;并且所述第二中间图片与所述光源的相对位置,与所述第一中间图片与所述光源的相对位置相同;所述第二中间图片与所述成像平面的相对位置,与所述第一中间图片与所述成像平面的相对位置相同;
S307、根据公式:
如上所述,实现了计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值。本申请通过将当前帧图片转化为具有透明像素点的图片,再转化为第一斑点图案,从而将复杂的图片相似度计算与判断,转化为简单的斑点图案的对比,提高了计算速度。相应地,对参考帧图片也进行透明化处理以转化为第二中间图片,再转化为第二斑点图案,并且转化的过程与当前帧图片的转化过程相对应,从而保证了计算的可靠性。再根据公式:
在一个实施方式中,所述将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成的步骤S5之前,包括:
S41、利用预先收集的图片生成p个样本集,其中每个样本集均包括训练用文字图片和训练用非文字图片,每个样本集包括的图片总数量相同,并且第一个样本集、第二个样本集、...、第p个样本集中的训练用文字图片的数量依次增加;
S42、抽取所述p个样本集中的一个样本集作为验证集,并将除所述验证集之外的其他样本集记为p-1个训练集;
S43、利用所述p-1个训练集对预设的神经网络模型进行p-1次训练,其中每次训练仅使用单一训练集中的样本数据,从而获得训练完成的中间模型;
S44、利用所述验证集对所述中间模型进行验证,并判断验证是否通过;
S45、若验证通过,则将所述中间模型记为所述图片分类模型。
如上所述,实现了将所述中间模型记为所述图片分类模型。本申请采用特殊的训练方法,即利用预先收集的图片生成p个样本集,其中第一个样本集、第二个样本集、...、第p个样本集中的训练用文字图片的数量依次增加;取所述p个样本集中的一个样本集作为验证集,并将除所述验证集之外的其他样本集记为p-1个训练集;利用所述p-1个训练集对预设的神经网络模型进行p-1次训练的方式,以使训练得到的模型更具鲁棒性,即能够胜任从任意数量的图片中进行准确地分类。再利用所述验证集对所述中间模型进行验证,并判断验证是否通过;若验证通过,则将所述中间模型记为所述图片分类模型。由于采用的是轮番训练的p-1次训练的方式,并且每次训练采用的训练用文字图片的占比不同,从而最终获得的图片分类模型具有更好的分类效果,其鲁棒性更佳。
在一个实施方式中,所述利用预设的文字识别方法识别所述清晰图片,从而得到识别文字的步骤S7,包括:
S701、分别使用预设的多种文字识别工具识别所述清晰图片,从而对应得到多个中间识别文本;
S702、判断所述多个中间识别文本是否完全相同;
S703、若所述多个中间识别文本完全相同,则将所述中间识别文本记为所述识别文字。
如上所述,实现了利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。为了保证文字识别的准确性,本申请采用了多种文字识别工具进行综合识别的手段。即,分别使用预设的多种文字识别工具识别所述清晰图片,从而对应得到多个中间识别文本;若所述多个中间识别文本完全相同,则将所述中间识别文本记为所述识别文字。从而防止某些文字识别工具无法准确特定字体等状况的出现,以保证录入数据的绝对准确。
本申请的基于相似程度值的识别方法,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别;若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
参照图2,本申请实施例提供一种基于相似程度值的识别装置,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
视频获取单元10,用于实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
第一相似计算单元20,用于将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
第二相似计算单元30,用于若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
清晰图片获取单元40,用于若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
图片类别获取单元50,用于将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
图片类别判断单元60,用于判断所述图片分类模型输出的图片类别是否为文字图片;
识别文字获取单元70,用于若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
其中上述单元分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述第一相似计算单元20,包括:
相似判断子单元,用于执行第一次图片相似判断操作、第二次图片相似判断操作、...、第n次图片相似判断操作,从而获取n次判断结果,其中剩余帧图片共有n张;其中所述第一次图片相似判断操作用于判断所述参考帧图片与第一张剩余帧图片是否相似;所述第二次图片相似判断操作用于判断所述参考帧图片与第二张剩余帧图片是否相似;...;所述第n次图片相似判断操作用于判断所述参考帧图片与第n张剩余帧图片是否相似;
计数器调整子单元,用于采用预设的计数规则,利用所述n次判断结果,调整预设的计数器的数值,其中所述计数规则指当判断结果为相似时,计数器的读数增加预设数值;
最终读数获取子单元,用于获取所述计数器的最终读数,并将所述最终读数作为所述参考帧图片与所述剩余帧图片之间的第一相似度值。
其中上述子单元分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述相似判断子单元,包括:
区块划分模块,用于根据预设的区块划分方法,对所述参考帧图片进行区块划分以得到多个区块,并从所述多个区块中选出多个指定区块,以及获取所述多个指定区块之间的相对位置关系;
指定区块判断模块,用于判断所述第一张剩余帧图片中是否存在所述多个指定区块;
相对位置判断模块,用于若所述第一张剩余帧图片中存在所述多个指定区块,则判断所述第一张剩余帧图片中的多个指定区块之间是否符合所述相对位置关系;
相似判定模块,用于若所述第一张剩余帧图片中的多个指定区块之间符合所述相对位置关系,则判定所述参考帧图片与所述第一张剩余帧图片相似。
其中上述模块分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述第二相似计算单元30,包括:
第一划分子单元,用于根据预设的像素点划分方法,将所述当前帧图片的所有像素点划分为第一像素点和第二像素点,其中所述第一像素点的色值大于预设的色值阈值,所述第二像素点的色值不大于所述色值阈值;
第一透明化处理子单元,用于对所述当前帧图片进行部分透明化处理,以使所述当前帧图片中的第一像素点变为透明像素点,从而得到第一中间图片;
第一斑点图案获取子单元,用于将所述第一中间图片引入预设的虚拟空间中,并采用预设的光源对所述第一中间图片进行照射,从而在预设的成像平面中获取第一斑点图案,其中所述第一中间图片位于所述光源与所述成像平面之间;
第二划分子单元,用于根据预设的像素点划分方法,将所述参考帧图片的所有像素点划分为第三像素点和第四像素点,其中所述第三像素点的色值大于所述色值阈值,所述第四像素点的色值不大于所述色值阈值;
第二透明化处理子单元,用于对所述参考帧图片进行部分透明化处理,以使所述参考帧图片中的第三像素点变为透明像素点,从而得到第二中间图片;
第二斑点图案获取子单元,用于将所述第二中间图片引入所述虚拟空间中,并采用所述光源对所述第二中间图片进行照射,从而在所述成像平面中获取第二斑点图案,其中所述第二中间图片位于所述光源与所述成像平面之间;并且所述第二中间图片与所述光源的相对位置,与所述第一中间图片与所述光源的相对位置相同;所述第二中间图片与所述成像平面的相对位置,与所述第一中间图片与所述成像平面的相对位置相同;
第二相似程度值获取子单元,用于根据公式:
其中上述子单元分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述装置,包括:
样本集生成单元,用于利用预先收集的图片生成p个样本集,其中每个样本集均包括训练用文字图片和训练用非文字图片,每个样本集包括的图片总数量相同,并且第一个样本集、第二个样本集、...、第p个样本集中的训练用文字图片的数量依次增加;
验证集获取单元,用于抽取所述p个样本集中的一个样本集作为验证集,并将除所述验证集之外的其他样本集记为p-1个训练集;
中间模型获取单元,用于利用所述p-1个训练集对预设的神经网络模型进行p-1次训练,其中每次训练仅使用单一训练集中的样本数据,从而获得训练完成的中间模型;
模型验证单元,用于利用所述验证集对所述中间模型进行验证,并判断验证是否通过;
模型标记单元,用于若验证通过,则将所述中间模型记为所述图片分类模型。
其中上述单元分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述识别文字获取单元70,包括:
中间识别文本获取子单元,用于分别使用预设的多种文字识别工具识别所述清晰图片,从而对应得到多个中间识别文本;
中间识别文本判断子单元,用于判断所述多个中间识别文本是否完全相同;
识别文字标记子单元,用于若所述多个中间识别文本完全相同,则将所述中间识别文本记为所述识别文字。
其中上述子单元分别用于执行的操作与前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
本申请的基于相似程度值的识别装置,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别;若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于相似程度值的识别方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于相似程度值的识别方法。
上述处理器执行上述基于相似程度值的识别方法,其中所述方法包括的步骤分别与执行前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别;若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于相似程度值的识别方法,其中所述方法包括的步骤分别与执行前述实施方式的基于相似程度值的识别方法的步骤一一对应,在此不再赘述。
本申请的计算机可读存储介质,实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;计算参考帧图片与剩余帧图片之间的第一相似度值;若所述第一相似度值大于预设的第一相似阈值,则计算得到第二相似程度值;若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片;将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别;若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。从而提高数据录入的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于相似程度值的识别方法,其特征在于,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
判断所述图片分类模型输出的图片类别是否为文字图片;
若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
2.根据权利要求1所述的基于相似程度值的识别方法,其特征在于,所述根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值的步骤,包括:
执行第一次图片相似判断操作、第二次图片相似判断操作、...、第n次图片相似判断操作,从而获取n次判断结果,其中剩余帧图片共有n张;其中所述第一次图片相似判断操作用于判断所述参考帧图片与第一张剩余帧图片是否相似;所述第二次图片相似判断操作用于判断所述参考帧图片与第二张剩余帧图片是否相似;...;所述第n次图片相似判断操作用于判断所述参考帧图片与第n张剩余帧图片是否相似;
采用预设的计数规则,利用所述n次判断结果,调整预设的计数器的数值,其中所述计数规则指当判断结果为相似时,计数器的读数增加预设数值;
获取所述计数器的最终读数,并将所述最终读数作为所述参考帧图片与所述剩余帧图片之间的第一相似度值。
3.根据权利要求2所述的基于相似程度值的识别方法,其特征在于,所述执行第一次图片相似判断操作的步骤,包括:
根据预设的区块划分方法,对所述参考帧图片进行区块划分以得到多个区块,并从所述多个区块中选出多个指定区块,以及获取所述多个指定区块之间的相对位置关系;
判断所述第一张剩余帧图片中是否存在所述多个指定区块;
若所述第一张剩余帧图片中存在所述多个指定区块,则判断所述第一张剩余帧图片中的多个指定区块之间是否符合所述相对位置关系;
若所述第一张剩余帧图片中的多个指定区块之间符合所述相对位置关系,则判定所述参考帧图片与所述第一张剩余帧图片相似。
4.根据权利要求1所述的基于相似程度值的识别方法,其特征在于,所述根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值的步骤,包括:
根据预设的像素点划分方法,将所述当前帧图片的所有像素点划分为第一像素点和第二像素点,其中所述第一像素点的色值大于预设的色值阈值,所述第二像素点的色值不大于所述色值阈值;
对所述当前帧图片进行部分透明化处理,以使所述当前帧图片中的第一像素点变为透明像素点,从而得到第一中间图片;
将所述第一中间图片引入预设的虚拟空间中,并采用预设的光源对所述第一中间图片进行照射,从而在预设的成像平面中获取第一斑点图案,其中所述第一中间图片位于所述光源与所述成像平面之间;
根据预设的像素点划分方法,将所述参考帧图片的所有像素点划分为第三像素点和第四像素点,其中所述第三像素点的色值大于所述色值阈值,所述第四像素点的色值不大于所述色值阈值;
对所述参考帧图片进行部分透明化处理,以使所述参考帧图片中的第三像素点变为透明像素点,从而得到第二中间图片;
将所述第二中间图片引入所述虚拟空间中,并采用所述光源对所述第二中间图片进行照射,从而在所述成像平面中获取第二斑点图案,其中所述第二中间图片位于所述光源与所述成像平面之间;并且所述第二中间图片与所述光源的相对位置,与所述第一中间图片与所述光源的相对位置相同;所述第二中间图片与所述成像平面的相对位置,与所述第一中间图片与所述成像平面的相对位置相同;
根据公式:
5.根据权利要求1所述的基于相似程度值的识别方法,其特征在于,所述将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成的步骤之前,包括:
利用预先收集的图片生成p个样本集,其中每个样本集均包括训练用文字图片和训练用非文字图片,每个样本集包括的图片总数量相同,并且第一个样本集、第二个样本集、...、第p个样本集中的训练用文字图片的数量依次增加;
抽取所述p个样本集中的一个样本集作为验证集,并将除所述验证集之外的其他样本集记为p-1个训练集;
利用所述p-1个训练集对预设的神经网络模型进行p-1次训练,其中每次训练仅使用单一训练集中的样本数据,从而获得训练完成的中间模型;
利用所述验证集对所述中间模型进行验证,并判断验证是否通过;
若验证通过,则将所述中间模型记为所述图片分类模型。
6.根据权利要求1所述的基于相似程度值的识别方法,其特征在于,所述利用预设的文字识别方法识别所述清晰图片,从而得到识别文字的步骤,包括:
分别使用预设的多种文字识别工具识别所述清晰图片,从而对应得到多个中间识别文本;
判断所述多个中间识别文本是否完全相同;
若所述多个中间识别文本完全相同,则将所述中间识别文本记为所述识别文字。
7.一种基于相似程度值的识别装置,其特征在于,应用于指定终端,所述指定终端预设有第一摄像头和第二摄像头,所述第一摄像头的分辨率比所述第二摄像头的分辨率低,包括:
视频获取单元,用于实时获取所述第一摄像头拍摄的第一视频,并从所述第一视频中获取当前帧图片,以及获取所述当前帧图片之前的预设时间内的多张连续帧图片;其中所述当前帧图片指所述第一视频中的最新帧图片;
第一相似计算单元,用于将所述多张连续帧图片划分为一张参考帧图片和除所述参考帧图片之外的剩余帧图片,并根据预设的第一图片相似计算方法,计算所述参考帧图片与所述剩余帧图片之间的第一相似度值,并判断所述第一相似度值是否大于预设的第一相似阈值;
第二相似计算单元,用于若所述第一相似度值大于预设的第一相似阈值,则根据预设的第二图片相似计算方法,计算所述当前帧图片与所述参考帧图片之间的相似度,从而得到第二相似程度值,并判断所述第二相似程度值是否大于预设的第二相似阈值;
清晰图片获取单元,用于若所述第二相似程度值大于预设的第二相似阈值,则开启所述第二摄像头,并利用所述第二摄像头对指定对象进行图像采集,从而得到清晰图片,其中所述指定对象指所述当前帧图片中的对象;
图片类别获取单元,用于将所述清晰图片输入预设的图片分类模型中,从而得到所述图片分类模型输出的图片类别,其中图片类别包括文字图片和非文字图片,所述图片分类模型基于神经网络模型,并利用指定样本数据训练而成,所述指定样本数据由预先收集的已标注过类别的训练用图片构成;
图片类别判断单元,用于判断所述图片分类模型输出的图片类别是否为文字图片;
识别文字获取单元,用于若所述图片分类模型输出的图片类别为文字图片,则利用预设的文字识别方法识别所述清晰图片,从而得到识别文字。
8.根据权利要求7所述的基于相似程度值的识别装置,其特征在于,所述第一相似计算单元,包括:
相似判断子单元,用于执行第一次图片相似判断操作、第二次图片相似判断操作、...、第n次图片相似判断操作,从而获取n次判断结果,其中剩余帧图片共有n张;其中所述第一次图片相似判断操作用于判断所述参考帧图片与第一张剩余帧图片是否相似;所述第二次图片相似判断操作用于判断所述参考帧图片与第二张剩余帧图片是否相似;...;所述第n次图片相似判断操作用于判断所述参考帧图片与第n张剩余帧图片是否相似;
计数器调整子单元,用于采用预设的计数规则,利用所述n次判断结果,调整预设的计数器的数值,其中所述计数规则指当判断结果为相似时,计数器的读数增加预设数值;
最终读数获取子单元,用于获取所述计数器的最终读数,并将所述最终读数作为所述参考帧图片与所述剩余帧图片之间的第一相似度值。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213651.4A CN111476279A (zh) | 2020-03-24 | 2020-03-24 | 基于相似程度值的识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213651.4A CN111476279A (zh) | 2020-03-24 | 2020-03-24 | 基于相似程度值的识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111476279A true CN111476279A (zh) | 2020-07-31 |
Family
ID=71747689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010213651.4A Pending CN111476279A (zh) | 2020-03-24 | 2020-03-24 | 基于相似程度值的识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476279A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112614109A (zh) * | 2020-12-24 | 2021-04-06 | 四川云从天府人工智能科技有限公司 | 图像质量评估方法、装置以及计算机可读存储介质 |
CN112966596A (zh) * | 2021-03-04 | 2021-06-15 | 北京秒针人工智能科技有限公司 | 视频光学字符识别系统方法及系统 |
CN115017359A (zh) * | 2022-05-27 | 2022-09-06 | 浙江大华技术股份有限公司 | 一种搜索图片的方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650560A (zh) * | 2015-11-04 | 2017-05-10 | 上海市公安局刑事侦查总队 | 基于身份证的身份验证方法、处理器及系统 |
CN108875495A (zh) * | 2017-10-17 | 2018-11-23 | 北京旷视科技有限公司 | 人证核验装置及人证核验方法 |
CN109409060A (zh) * | 2018-09-26 | 2019-03-01 | 中国平安人寿保险股份有限公司 | 身份验证方法、系统和计算机可读存储介质 |
CN110334702A (zh) * | 2019-05-30 | 2019-10-15 | 深圳壹账通智能科技有限公司 | 基于配置平台的数据传输方法、装置和计算机设备 |
CN110705233A (zh) * | 2019-09-03 | 2020-01-17 | 平安科技(深圳)有限公司 | 基于文字识别技术的笔记生成方法、装置和计算机设备 |
CN110807630A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于人脸识别的支付方法、装置、计算机设备和存储介质 |
-
2020
- 2020-03-24 CN CN202010213651.4A patent/CN111476279A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650560A (zh) * | 2015-11-04 | 2017-05-10 | 上海市公安局刑事侦查总队 | 基于身份证的身份验证方法、处理器及系统 |
CN108875495A (zh) * | 2017-10-17 | 2018-11-23 | 北京旷视科技有限公司 | 人证核验装置及人证核验方法 |
CN109409060A (zh) * | 2018-09-26 | 2019-03-01 | 中国平安人寿保险股份有限公司 | 身份验证方法、系统和计算机可读存储介质 |
CN110334702A (zh) * | 2019-05-30 | 2019-10-15 | 深圳壹账通智能科技有限公司 | 基于配置平台的数据传输方法、装置和计算机设备 |
CN110705233A (zh) * | 2019-09-03 | 2020-01-17 | 平安科技(深圳)有限公司 | 基于文字识别技术的笔记生成方法、装置和计算机设备 |
CN110807630A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于人脸识别的支付方法、装置、计算机设备和存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112614109A (zh) * | 2020-12-24 | 2021-04-06 | 四川云从天府人工智能科技有限公司 | 图像质量评估方法、装置以及计算机可读存储介质 |
CN112614109B (zh) * | 2020-12-24 | 2024-06-07 | 四川云从天府人工智能科技有限公司 | 图像质量评估方法、装置以及计算机可读存储介质 |
CN112966596A (zh) * | 2021-03-04 | 2021-06-15 | 北京秒针人工智能科技有限公司 | 视频光学字符识别系统方法及系统 |
CN112966596B (zh) * | 2021-03-04 | 2024-05-14 | 北京秒针人工智能科技有限公司 | 视频光学字符识别系统方法及系统 |
CN115017359A (zh) * | 2022-05-27 | 2022-09-06 | 浙江大华技术股份有限公司 | 一种搜索图片的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931664B (zh) | 混贴票据图像的处理方法、装置、计算机设备及存储介质 | |
CN109086756B (zh) | 一种基于深度神经网络的文本检测分析方法、装置及设备 | |
US11087125B2 (en) | Document authenticity determination | |
WO2017124990A1 (zh) | 基于多张图片一致性实现保险理赔反欺诈的方法、系统、设备及可读存储介质 | |
CN111191568B (zh) | 翻拍图像识别方法、装置、设备及介质 | |
CN111476279A (zh) | 基于相似程度值的识别方法、装置和计算机设备 | |
US20090226047A1 (en) | Apparatus and Method of Processing Image and Human Face Detection System using the smae | |
CN111476268A (zh) | 翻拍识别模型训练、图像识别方法、装置、设备及介质 | |
CN110516672A (zh) | 卡证信息识别方法、装置及终端 | |
CN111583180B (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
CN112507922A (zh) | 人脸活体检测方法、装置、电子设备及存储介质 | |
US8238604B2 (en) | System and method for validation of face detection in electronic images | |
CN111325769A (zh) | 一种目标对象检测方法及装置 | |
CN111898520A (zh) | 证件真伪识别方法、装置、计算机可读介质及电子设备 | |
CN109086765B (zh) | 车牌识别方法、装置、介质、服务器和行车记录仪 | |
CN112766255A (zh) | 一种光学文字识别方法、装置、设备及存储介质 | |
CN111652145B (zh) | 一种公式检测的方法、装置、电子设备和存储介质 | |
US7415137B2 (en) | Image processing method, apparatus and storage medium | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
CN116311214A (zh) | 车牌识别方法和装置 | |
CN112699811B (zh) | 活体检测方法、装置、设备、储存介质及程序产品 | |
CN106355066A (zh) | 人脸验证方法及人脸验证装置 | |
CN111402185A (zh) | 一种图像检测方法及装置 | |
CN112926515B (zh) | 活体模型训练方法和装置 | |
Nair et al. | A Two-level authentication for Attendance Management System using deep learning techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |