CN113591520A - 一种图像识别方法、入侵对象检测方法及装置 - Google Patents
一种图像识别方法、入侵对象检测方法及装置 Download PDFInfo
- Publication number
- CN113591520A CN113591520A CN202010367005.3A CN202010367005A CN113591520A CN 113591520 A CN113591520 A CN 113591520A CN 202010367005 A CN202010367005 A CN 202010367005A CN 113591520 A CN113591520 A CN 113591520A
- Authority
- CN
- China
- Prior art keywords
- image
- recognition result
- type
- probability value
- belongs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000001514 detection method Methods 0.000 title claims abstract description 70
- 238000004422 calculation algorithm Methods 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013461 design Methods 0.000 description 20
- 238000012549 training Methods 0.000 description 19
- 238000007635 classification algorithm Methods 0.000 description 15
- 238000002372 labelling Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种图像识别方法、入侵对象检测方法及装置。该方法中,摄像机对采集的图像进行识别,生成第一识别结果,然后把图像发送给图像识别平台,由图像识别平台身体工程第二识别结果,当所述第一识别结果和第二识别结果之间的差异较大时,所述图像识别平台根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。因此,在本申请中,一张图像的最终识别结果是结合摄像机和图像识别平台各自对这张图像的识别结果而得,准确性较高。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像识别方法、入侵对象检测方法及装置。
背景技术
图像识别技术的应用越来越广泛,比如,车辆检测、行人检测、人体身份识别(person re-Identification,ReID)、目标跟踪、人流量统计等等。
为了提升图像识别的准确性,图像采集终端可以通过算法模型进行图像识别。比如识别图像上的对象是成人还是儿童。
然而,图像采集终端比如摄像机使用算法模型进行图像识别,存在如下缺陷:
由于图像采集终端的位置固定,即拍摄范围(或拍摄场景)相对固定,采集的样本数据有局限。比如,设置在小学门口的摄像机,采集的图像中儿童图像居多,成人图像较少。图像采集终端使用采集到的图像对算法模型进行训练,训练出的算法模型对儿童的识别准确率高,对成人的识别准确率低。这样的话,一旦有成年人意图潜入小学,而图像采集终端对其识别准确率低,无法起到真正的安全防范效果。
发明内容
本申请提供一种图像识别方法、入侵对象检测方法及装置,图像采集终端和图像识别平台可以协作对图像进行检测,以得到较为准确性的检测结果。
第一方面,提供一种图像识别方法,该方法可以由图像识别平台执行,该方法包括:图像识别平台获取图像采集终端采集的第一图像;所述图像识别平台获取所述图像采集终端对所述第一图像的第一识别结果;所述图像识别平台对所述第一图像进行识别,得到对所述第一图像的第二识别结果;当所述第一识别结果和第二识别结果之间的差异满足预设条件时,所述图像识别平台根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。这里的差异满足预设条件例如是差异较大,当差异较小时,可以直接把第一识别结果作为最终识别结果。
因此,本申请实施例中,第一图像的最终识别结果是结合图像采集终端和图像识别平台各自对第一图像的识别结果而得,提升图像识别准确性。
举例来说,设置在小学门口的图像采集终端比如摄像机,拍摄范围(或拍摄场景)相对固定,采集的图像中儿童图像居多,成人图像较少。比如,摄像机采集到100张图像,其中90张是儿童图像,10张是成人图像。图像采集终端使用这些图像对算法模型进行训练,训练出的算法模型对儿童的识别准确率高,对成人的识别准确率低。比如,第一图像上包含对象1,对象1是成人,但是由于图像采集终端对儿童识别准确性高对成人的准确性较低,所以图像采集终端识别第一图像之后可能认为对象1有0.6的概率是儿童,有0.4的概率是成人,也就是说,图像采集终端不是非常确定对象1是儿童。
图像识别平台与多个图像采集终端连接,获取的样本数据较多,可以做到样本数据均衡化,比如,使用50张成人图像和50张儿童图像对模型进行训练,由于成人图像增多,训练得到的算法模型能够提升成人的识别准确率,但是对儿童的识别准确性可能会降低。比如,图像识别平台识别第一图像之后认为对象1有0.8的概率是成人,有0.2的概率是儿童。也就是说,图像识别平台比较确定对象1是成人。
图像识别平台和图像采集终端各自的识别结果结合得到图像的最终识别结果,比如,取两个识别结果的平均值,即0.4和0.8的平均值,确定对象1是成人的概率是0.6,那么对象1是儿童的概率是0.4,所以对象1的最终识别结果是成人;相对于图像采集终端的识别结果(0.6的概率是儿童),提升图像识别准确性。
在一种可能的设计中,所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
示例性的,假设第一类型是成人,第一识别结果是描述第一图像中的对象属于成人的可能性,第二识别结果是描述第一图像中的对象属于成人的可能性,最终识别结果是描述第一图像中的对象属于成人的可能性。也就是说,第一图像的最终识别结果(比如是成人的可能性)是结合图像采集终端对第一图像的识别结果(是成人的可能性)和图像识别平台对第一图像的识别结果(是成人的可能性)而得,提升图像识别准确性。
在一种可能的设计中,所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
举例来说,图像采集终端使用第一算法模型对第一图像识别,得到第一类型标签,比如,第一类型标签是第一图像上的对象1是成人的第一概率数值。图像识别平台使用第二算法模型对第一图像识别,得到第二类型标签,比如,第二类型标签是第一图像上对象1是成人的第二概率数值。第一图像的最终识别结果是第一概率数值与第二概率数值的算术平均值或加权平均值,可以提升图像识别准确性。
在一种可能的设计中,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
如果第一图像的最终识别结果是第一概率数值与第二概率数值的加权平均值的话,第一概率数值和第二概率数值的权重可以有多种方式确定,比如预设、根据图像测试集确定或用户指定。图像识别平台选择合适的权重,可以提升加权平均值即第一图像的最终识别结果的准确性。
在一种可能的设计中,所述图像识别平台对所述第一图像进行识别,得到第二识别结果,包括:通过第一算法模型对所述第一图像进行类型识别,得到所述第二识别结果;在所述确定所述第一图像的最终识别结果之后,还包括:通过所述第一图像和所述第一图像的最终识别结果对所述第一算法模型进行优化。
在本申请实施例中,图像识别平台得到第一图像的最终识别结果之后,还可以使用第一图像和最终识别结果对图像识别平台使用的第一算法模型进行优化。比如,图像识别平台对第一图像的第二识别结果是成人,而结合图像采集终端对第一图像的第一识别结果和第二识别结果得到的最终识别结果是儿童,可以校正图像识别平台的识别结果,使用最终识别结果和第一图像对图像识别平台内的第一算法模型进行优化,会使第一算法模型的识别准确性提升。
在一种可能的设计中,所述方法还包括:向所述图像采集终端发送所述第一图像的最终识别结果,所述最终识别结果用于所述图像采集终端基于所述最终识别结果对第二算法模型进行优化。
在本申请实施例中,图像识别平台得到第一图像的最终识别结果之后,将最终识别结果发送给图像采集终端,图像采集终端使用第一图像和最终识别结果对图像采集终端使用的第二算法模型进行优化,增强第二算法模型的识别准确性。
第二方面,还提供一种入侵对象检测方法,该方法可以由图像采集终端执行。该方法包括:图像采集终端获取第一图像,对所述第一图像进行识别,当从所述第一图像中检测到无记录的第一对象时,输出入侵警报;提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;所述图像采集终端获取第二图像,对所述第二图像进行识别,当在所述第二图像上检测到与所述第一对象相同或者相似的第二对象时,不输出入侵警报。
示例性的,图像采集终端中存储数据库,该数据库用于记录各种非入侵对象,非入侵对象是指树木、花草等不是真正的或恶意的入侵对象(恶意入侵对象例如准备潜入仓库的窃贼)。图像采集终端从第一图像检测到第一对象,如果第一对象在数据库中没有记录,输出入侵报警。然而,虽然由于第一对象无记录而触发了报警,但第一对象也可能不是真正的入侵对象,比如,第一对象是鸟,虽然在数据库中无记录但并不是真正的入侵对象。因此,图像采集终端可通过管理员人工方式判断第一对象是否是非入侵对象,若是,管理人员可以在输入界面内将第一对象标记为非入侵对象。此时,图像采集终端可以更新数据库,比如在数据库中添加第一对象即鸟。当图像采集终端采集到第二图像时,如果从第二图像检测到与第一对象相同或相似的第二对象比如是鸟,由于鸟已经在数据库中被标记为非入侵对象,因此不触发入侵报警。
也就是说,本申请实施例中,无记录的第一对象如果不是真正的入侵对象可以通过管理员人工方式将第一对象标记为非入侵对象,更新到数据库中,从而使得数据库越来越丰富,越来越准确。图像采集终端采集到新图像后,可以使用数据库对新图像上的对象进行过滤,只有数据库中未记录的对象可以触发报警,提升了入侵报警的准确性。
在一种可能的设计中,所述方法还包括:在非入侵对象记录中添加所述第一对象。
在本申请实施例中,非入侵对象记录(例如数据库)可以更新,更新后的数据库较为丰富,图像采集终端采集到新图像时,可以使用更新的数据库对新图像上的对象进行过滤,只有无记录的对象可以触发报警,提升了报警的准确性。
在一种可能的设计中,所述第一对象和所述第二对象相同或相似,包括:通过算法模型对所述第一对象识别得到第一识别结果,对所述第二对象识别得到第二识别结果;其中,所述第一识别结果用于描述所述第一对象属于第一类型的可能性;所述第二识别结果用于描述所述第二对象属于第一类型的可能性;所述第一对象属于第一类型的可能性与所述第二对象属于第一类型的可能性相同或相近。
示例性的,第一识别结果用于描述第一对象是鸟的第一概率,第二识别结果用于描述第二对象是鸟的第二概率。那么第一对象和第二对象相同或相似,即第一概率和第二概率相同或相近。图像采集终端通过算法模型进行对象识别的准确性较高,可以准确的判断第一对象和第二对象是否相同或相似。
在一种可能的设计中,所述第一识别结果是所述第一对象属于第一类型的第一概率数值,所述第二识别结果是所述第二对象属于第一类型的第二概率数值;所述第一识别结果与所述第二识别结果相同或相似,包括:所述第一概率数值与所述第二概率数值的差值小于阈值。
示例性的,以第一类型是鸟为例,第一识别结果是第一对象是鸟的第一概率数值,比如0.7,第二识别结果是第二对象是鸟的第二概率数值,比如0.8,0.7与0.8的差值为0.1小于阈值如0.2,说明第一对象和第二对象是相同或相似的。图像采集终端通过算法模型进行对象识别的准确性较高,可以准确的判断第一对象和第二对象是否相同或相似。
第三方面,还提供一种图像识别装置,例如图像识别平台,包括:
通信单元,用于从图像采集终端处接收第一图像以及所述图像采集终端对所述第一图像的第一识别结果;
处理单元,用于对所述第一图像进行识别,得到对所述第一图像的第二识别结果;
所述处理单元,还用于在所述第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
在一种可能的设计中,所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
在一种可能的设计中,所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
在一种可能的设计中,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
第四方面,还提供一种入侵对象检测装置,包括:
获取模块,用于获取第一图像;
处理模块,用于对所述第一图像进行识别,当从所述第一图像中检测到无记录的第一对象时,通过输出模块输出入侵警报;
输入模块,用于提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;
所述获取模块,还用于获取第二图像;
所述处理模块,还用于对所述第二图像进行识别,当在所述第二图像上检测到与所述第一对象相同或者相似的第二对象时,不输出入侵警报。
在一种可能的设计中,所述处理模块还用于:在非入侵对象记录中添加所述第一对象。
在一种可能的设计中,所述第一对象和所述第二对象相同或相似,包括:
通过算法模型对所述第一对象识别得到第一识别结果,对所述第二对象识别得到第二识别结果;其中,所述第一识别结果用于描述所述第一对象属于第一类型的可能性;所述第二识别结果用于描述所述第二对象属于第一类型的可能性;所述第一对象属于第一类型的可能性与所述第二对象属于第一类型的可能性相同或相近。
在一种可能的设计中,所述第一识别结果是所述第一对象属于第一类型的第一概率数值,所述第二识别结果是所述第二对象属于第一类型的第二概率数值;所述第一识别结果与所述第二识别结果相同或相似,包括:所述第一概率数值与所述第二概率数值的差值小于阈值。
第五方面,还提供一种图像识别系统,包括:
多个图像采集终端;
图像识别平台,与所述多个图像采集终端分别通信;
所述每个图像采集终端包括第一图像数据库,所述第一图像数据库中包括所述图像采集终端采集的图像,所述图像采集终端用于对所述第一图像数据库中的第一图像进行识别得到第一识别结果;
所述图像识别平台中包括第二图像数据库,所述第二图像数据库中包括从所述每个图像采集终端处获取的图像,其中包括所述第一图像;所述图像识别平台用于对所述第一图像进行识别得到第二识别结果,还用于在所述第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
在一种可能的设计中,所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
在一种可能的设计中,所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
在一种可能的设计中,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
第六方面,还提供一种装置,包括至少一个处理器,所述至少一个处理器与至少一个存储器耦合;所述至少一个处理器,用于执行所述至少一个存储器中存储的计算机程序或指令,以使得所述装置执行如上述第一方面或第二方面提供的方法步骤。
第七方面,还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序或指令,当计算机读取并执行所述计算机程序或指令时,使得计算机执行如上述第一方面或第二方面提供的方法步骤。
第八方面,还提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面或第二方面提供的方法。
第九方面,还提供一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行上述第一方面或第二方面提供的方法。
在一种可能的设计中,所述芯片还可以包括存储器,所述存储器中存储有指令,所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行第一方面中的方法。
上述第三方面至第九方面的有益效果,请参见第一方面和第二方面的有益效果描述,在此不重复赘述。
附图说明
图1为本申请一实施例提供的一个系统架构的示意图;
图2为本申请一实施例提供的图像采集终端和图像识别平台的结构示意图;
图3为本申请一实施例提供的难例、非难例与分界线的示意图;
图4为本申请一实施例提供的图像识别方法的流程示意图;
图5为本申请一实施例提供的入侵检测图像的示意图;
图6为本申请一实施例提供的入侵检测方法的流程示意图;
图7为本申请一实施例提供的一种装置的结构示意图;
图8为本申请一实施例提供的又一种装置的结构示意图;
图9为本申请一实施例提供的另一种装置的结构示意图。
具体实施方式
实施例1
如前文所述,现有技术中,图像采集终端比如摄像机可以使用算法模型进行图像识别,但存在对稀有样本识别准确率低的问题。比如,设置在小学门口的摄像机,由于拍摄场景固定,采集的图像基本是包含儿童的图像。比如,摄像机采集到100张图像,其中90张是儿童图像,10张是成人图像。摄像机使用这100张图像对算法模型进行训练,训练之后的算法模型对儿童的识别准确性高,但对成人的识别准确非常低。这种成人样本和儿童样本数量差异较大的训练样本被称为非均衡样本,使用非均衡样本训练的算法模型会使得识别样本较多的类(即儿童)的效果更佳,识别样本较少的类(即成人)的效果欠佳。
为了解决非均衡样本的问题,一种解决方案是图像采集终端将采集的图像发送给图像识别平台,由图像识别平台通过算法模型对图像进行识别。由于图像识别平台与多个图像采集终端连接,可以获取来自各个图像采集终端的图像,样本数据较为丰富,图像识别平台可以对所有样本数据作均衡化处理,所谓均衡化处理是指在所有样本数据中选择数量相同或相近的成人样本和儿童样本作为训练样本。一种均衡化方式是删除数量较多的样本,保持成人和儿童的样本量相同。例如,假设图像识别平台从摄像机1(设置在小学门口)处共获取到100张图像,其中90张是儿童图像、10张是成人图像;从摄像机2处获取100张图像,其中50张儿童图像,50张成人图像。图像识别平台可以使用所有样本数据中的60张成人图像和60张儿童图像对算法模型训练,多余的儿童图像可删除。因此,相对于摄像机1的包含90张儿童图像,10张成人图像的样本数据,图像识别平台使用的成人样本增多,能够识别成人的准确率提升,但是识别儿童的准确率就降低了。
鉴于此,本申请提供一种图像识别方法,图像采集终端和图像识别平台均进行模型在线学习,且一张图像的最终识别结果是结合图像采集终端和图像识别平台各自对这张图像的识别结果而得,准确性更高。
在介绍本申请的技术方案之前,下面先对本申请实施例涉及的相关术语进行介绍。
算法模型,包括一个或多个函数/方程。本申请实施例提到的算法模型可以是现有技术的模型,比如决策树、逻辑回归(logistic regression,LR),朴素贝叶斯(naivebayes,NB)分类算法,随机森林(random forest,RF)算法,支持向量机(support vectormachines,SVM)算法、方向梯度直方图(histogram of oriented gradients,HOG),等等。通常,模型是包括模型参数、输入参数和输出参数的函数式,在给定模型参数和输入参数的具体取值的情况下,通过计算该函数式可以得到输出结果。
类型,是指图像内的对象(或称拍摄对象)所属的种类,其中,对象例如是行人、车辆、车牌等,对象所属于的种类比如成人或儿童、人或动物等等。
类型标签,是指算法模型的输出结果。以分类算法为例,输入图像经过分类算法得到输出结果,输出结果是对输入图像的分类结果。类型标签的形式有多种,比如,类型标签是概率数值,比如输入图像是第一类型(比如成人)的概率值;或者,类型标签是“是”或“否”的形式,比如是第一类型或不是第一类型。
图1示出了本申请实施例提供的一种系统架构。系统架构中包括图像识别平台和多个图像采集终端。图像识别平台可以是能够进行模型在线学习的任何类型的服务器。图像采集终端例如摄像机,用于采集图像也能够进行模型在线学习。
图像采集终端采集到第一图像之后,对第一图像识别得到第一识别结果。比如,图像采集终端使用第一算法模型对第一图像进行识别,得到第一识别结果是第一类型标签。图像采集终端将第一图像和第一类型标签发送给图像识别平台。图像识别平台对第一图像进行识别得到第二识别结果。比如,图像识别平台通过第二算法模型对第一图像进行识别,得到第二识别结果是第二类型标签。图像采集终端使用的第一算法模型与图像识别平台使用的第二算法模型可以相同或不同,本申请实施例不作限定。
倘若图像采集终端和图像识别平台对第一图像的识别结果差异较大(比如,第一类型标签与第二类型标签之间的差异满足预设条件),图像识别平台可以根据第一类型标签和第二类型标签确定第一图像的最终类型标签。也就是说,本申请中,一张图像的最终识别结果是结合图像采集终端和图像识别平台各自对这张图像的识别结果得到的,准确性较高。
图2为本申请实施例提供的图像识别平台和图像采集终端的示例性结构。
图像采集终端中包括图像采集模块、第一标注模块和第一训练模块。图像识别平台包括第二标注模块、第二训练模块、难例检测模块和自动识别模块。
图像采集终端中的图像采集模块用于采集图像,比如采集到第一图像。图像采集模块将第一图像发送给第一标注模块,第一标注模块用于对第一图像进行识别得到第一识别结果,例如第一识别结果是第一类型标签。图像采集模块还将第一图像发送给图像识别平台,比如图像采集模块通过通信模块(图中未示出)将第一图像发送给图像识别平台,图像识别平台接收到第一图像之后提供给第二标注模块。第二标注模块用于对第一图像进行识别得到第二识别结果,例如第二识别结果是第二类型标签。
第一标注模块将第一类型标签发送给难例检测模块,第二标注模块将第二类型标签发送给难例检测模块。难例检测模块用于判定第一图像是难例或非难例。难例是指对于同一张图像,图像采集终端和图像识别平台的识别结果差异较大(比如,第一类型标签与第二类型标签之间的差异满足预设条件)。非难例是指对于同一张图像,图像采集终端和图像识别平台的识别结果差异较小(比如,第一类型标签与第二类型标签之间的差异不满足预设条件)。
下面介绍难例检测的实现方式。
类型标签可以是多种形式,比如“是/YES”或“否/NO”,或者,概率数值。
示例1,以一分类算法模型为例,所谓一分类即分类数目是1,非此即彼的分类方式,比如,一分类算法模型用于识别第一图像上的对象是第一类型(比如成人),或不是第一类型,或对象属于第一类型的概率比如0.6。因此,一分类算法模型输出的类型标签可以是“是”或“否”或一个概率数值A,A是指第一图像上的对象属于第一类型的概率。
需要说明的是,这种示例中,图像识别平台和图像采集终端可以都使用一分类算法模型,且二者使用的算法模型都是用于识别图像上的对象属于第一类型(比如成人)的可能性。
对于一分类算法模型,可以使用下述方式1-方式3中的任一种进行难例检测。
方式1,假设类型标签是“是/YES”或“否/NO”的形式,第一类型标签和第二类型标签差异满足预设条件是指第一类型标签和第二类型标签不同,比如,第一类型标签是“是”,而第二类型标签是“否”。
方式2,假设类型标签是概率数值的形式。第一类型标签和第二类型标签的差异满足预设条件是指第一类型标签和第二类型标签之间的差值大于阈值。比如,图像采集终端使用的第一算法模型识别第一图像上的对象得到的第一类型标签是0.5,表明所述对象是成人的概率为0.5,图像识别平台使用的第二算法模型识别第一图像得到的第二类型标签是0.9,表明所述对象是成人的概率是0.9。第一类型标签和第二类型标签的差值是0.4,若阈值是0.2,确定第一类型标签和第二类型标签差异较大,第一图像是难例。
方式3,假设类型标签是概率数值的形式,第一类型标签和第二类型标签的差异满足预设条件可以是指第一类型标签和第二类型标签处于在分界线数值的两侧。这里的分界线数值例如是0.5。第一类型标签和第二类型标签分别在分界线数值的两侧包括:第一类型标签大于分界线数值,而第二类型标签小于分界线数值;或者,第一类型标签小于分界线数据,而第一类型标签大于分界线数值。示例性的,图像采集终端使用的第一算法模型识别第一图像上的对象得到的第一类型标签是0.4,即所述对象是成人的概率为0.4.。图像识别平台使用的第二算法模型识别第一图像得到的第二类型标签是0.6,即所述对象是成人的概率是0.6,而分界线数值是0.5,第一类型标签小于0.5,而第二类型标签大于0.5,确定第一图像是难例。
示例2,以二分类算法模型为例,所谓二分类算法模型即分类数目为二,是指通过一个算法模型识别图像上的对象属于两种类型中每种类型的可能性。示例性的,二分类算法输出的类型标签可以是概率数值的组合形式,比如(A,B),A是图像上的对象属于第一类型(比如成人)的概率,B图像上的对象是属于第二类型(比如儿童)的概率,A+B=1。
需要说明的是,这种示例中,图像识别平台和图像采集终端可以都使用二分类算法模型,且二者使用的算法模型都是用于识别图像上的对象属于第一类型和第二类型的可能性。比如,图像采集终端使用的第一算法模型用于识别图像上的对象属于成人的概率以及属于儿童的概率,图像识别平台使用的第二算法模型也是用于识别图像上的对象属于成人的概率以及属于儿童的概率。
对于二分类算法模型,可以使用下述方式4进行难例检测。
方式4,第一图像的第一类型标签是(A,B);A是第一图像上的对象是儿童的概率,B是第一图像上的对象是成人的概率,A+B=1。比如,第一类型标签是(0.6,0.4),即第一图像上的对象属于儿童的概率是0.6,属于成人的概率是0.4。第二类型标签是(C,D);同理,C是第一图像上的对象是儿童的概率,D是第一图像上的对象是成人的概率,C+D=1。比如,第二类型标签是(0.2,0.8),即第一图像上的对象属于儿童的概率是0.2,属于成人的概率是0.8。这种情况下,第一类型标签和第二类型标签的差异满足预设条件是指,A与C的差值(差值的绝对值)大于阈值,或,B与D的差值(差值的绝对值)大于阈值;或,A与C处于分界线比如0.5的两侧,或,B与D处于分界线比如0.5的两侧。
需要说明的是,以上是一分类和二分类为例介绍的,对于分类数目大于2的分类算法可以使用相同原理,本申请实施例不一一列举。
以上是列举难例检测方式的几种示例,当然还可以使用其他的方式进行难例检测,只要确定图像采集终端和图像识别平台对同一张图像的识别结果差异较大即可,本申请实施例不作限定。
难例检测模块对第一图像的检测结果包括两种,难例或非难例。
如果检测结果为第一图像是难例,将第一图像和第一类型标签以及第二类型标签发送给决策模块。决策模块用于确定难例的最终类型标签。
第一种方式
如果类型标签是“是”或“否”的形式。比如,第一类型标签是“是”而第二类型标签是“否”,这种情况下,决策模块从第一类型标签和第二类型标签中选择一个作为最终类型标签。
方式1,提供输入界面,用户通过输入界面指定第一图像的最终类型标签。举例来说,第一图像上包括人,图像采集终端和图像识别平台使用的算法模型用于识别第一图像上的人是否是成人;比如第一类型标签是“是”,而第二类型标签是“否”;若用户通过输入界面指定第一图像的成人,即最终类型标签是“是”。
方式2,图像采集终端和图像识别平台哪一侧的算法模型更可靠就使用哪一侧的类型标签作为最终类型标签。比如,图像采集终端使用第一算法模型得到第一类型标签是“是”,图像识别平台使用第二算法模型得到第二类别标签是“否”,假设第一算法模型相对于第二算法模型更为可靠,取第一类型标签作为第一图像的最终类型标签。示例性的,不同算法模型的可靠性排序可预先设置好,并存储在图像识别平台中。作为一种示例,不同算法模型的可靠性由算法本身决定,比如神经网络的可靠性小于深度神经网络。
第二种方式
如果类型标签的形式是概率数值。比如,第一类型标签是图像上的对象属于第一类型的第一概率数值,第二类型标签是图像上的对象属于第一类型的第二概率数值。这种情况下,决策模块需要根据第一概率数值和第二概率数值,确定第一图像的最终类型标签。
方式1,最终类型标签是第一概率数值和第二概率数值的算术平均值。比如,以一分类算法为例,假设第一概率数值是0.2,第二概率数值是0.6,则最终类型标签是0.4。以二分类算法为例,假设第一类型标签是(A,B),第二类型标签是(C,D),则最终类型标签是((A+B)/2,(C+D)/2)。
方式2,最终类型标签是第一概率数值和第二概率数值的加权平均值。比如,以一分类算法为例,假设第一概率数值是0.2,第二概率数值是0.6,再假设第一概率数据的权重是权重1,第二概率数值的权重是权重2,那么最终类型标签是0.2*权重1+0.6*权重2。以二分类算法为例,假设第一类型标签是(A,B),第二类型标签是(C,D),再假设第一概率数据的权重是权重1,第二概率数值的权重是权重2,那么最终类型标签是(A*权重1+C*权重2,B*权重1+D*权重2)。
其中,第一概率数值和第二概率数值的权重是可以有多种方式得到。以下给出确定权重的几种示例。
1、第一数值和第二数值的权重是预设的。
2、第一数值和第二数值的权重是用户通过输入界面指定的。
3、第一数值和第二数值的权重是通过图像测试集确定的最优权重。
下面以一分类为例介绍第3种方式,图像测试集中包括N个测试图像,N为大于等于2的整数,还包括所述N个测量图像对应的N个真实结果。比如,测试图像1对应真实结果1,测试对象2对应真实结果2,等等。
首先可以设置第一概率数值和第二概率数值的权重为第一权重,第一权重即初始权重可以是默认设置好的。需要说明的是,第一权重是第一概率数值和第二概率数值的权重的统称,比如第一概率数值的权重是a,第二概率数值的权重是b,第一权重是a和b的统称。
图像识别平台需要判断第一权重是否是最优权重,具体而言,图像识别平台获取图像采集终端分别对N个测试图像的识别结果,比如,对测试图像1的识别结果是类型标签X1,对测试图像2的识别结果是类型标签X2,等等。图像识别平台分别对N个测试图像进行识别得到识别结果,比如,对测试图像1的识别结果是类型标签Y1,对测试图像2的识别结果是类型标签Y2,等等。因此,图像测试集中的N个测试图像中每个测试图像对应两个类型标签(即两个数值),一个来自图像采集终端,另一个是图像识别平台的识别结果。
图像识别平台根据第一权重确定每个测试图像对应的两个类型标签的第一加权平均值。比如,第一权重包括a和b,第一加权平均值满足公式:(a*第一概率数值+b*第二概率数值)。因此,图像识别平台总共可以得到N个第一加权平均值,而图像测试集中有N个真实结果。若N个第一加权平均值中有M个第一加权平均值与N个真实类型结果中的M个真实类型结果一致,且M大于预设值,确定第一权重(即a和b)为最优权重。
如果第一权重不是最优权重,图像识别平台可以调整第一权重为第二权重,然后判断第二权重是否是最优权重。具体实现方式与判断第一权重是否是最优权重的过程类似,不重复赘述。如果第二权重仍然不是最优权重,可以继续调整第二权重是第三权重,然后判断第三权重是否是最优权重。
每次调整权重的步长可以是一致的。示例性的,第一权重是(a,b),a+b=1;第二权重是(a+第一步长,b-第一步长),第三权重是(a+2*第一步长,b-2*第一步长)。或者,第二权重是(a-第二步长,b+第二步长),第三权重是(a-2*第二步长,b+2*第二步长),等等。其中,第一步长和第二步长可以相同或不同,例如可以是预设的取值。
方式3,最终类型标签是用户通过输入界面指定的。由于这种情况下,类型标签是数值形式,输入界面中可以提供设置数值的输入框,通过该输入框设置最终类型标签的数值。
决策模块确定出难例(即第一图像)的最终类型标签之后,将第一图像和最终类型标签发给第一训练模块和第二训练模块。
如果是非难例,即图像采集终端和图像识别平台对第一图像的识别结果差异不大,可以直接将第一图像、以及第一类型标签或第二类型标签发送给第一训练模块和第二训练模块。
第一训练模块和第二训练模块各自使用第一图像和最终类型标签进行优化(也可以称为训练)。比如,第一训练模块对第一算法模型进行优化,第二训练模块对第二算法模型进行优化。模型优化的过程,本申请实施例不多赘述。
作为一种可实现方式,针对图像采集终端采集的每张图像执行一次难例检测过程。比如,图像采集终端每采集一张图像,就将该图像发送给图像识别平台,然后执行难例检测过程。
作为另一种可实现方式,无需针对图像采集终端采集的每张图像都执行一次难例检测过程。比如,图像采集终端采集多张图像,并对采集的每张图像进行识别,得到每张图像对应的第一类型标签,其中部分图像的第一类型标签满足第一条件,则将这部分图像发送给图像识别平台进行难例检测。所述部分图像的第一类型标签满足第一条件,包括:第一类型标签是概率数值,且数值与分界线数值之间的差值(或差值的绝对值)较小(小于阈值)。比如,一张图像的第一类型标签是0.4,分界线数值是0.5,差值为0.1,小于阈值0.2,则该图像需要上报服务器作难例检测。再比如,一张图像的第一类型标签是0.6,分界线数值是0.5,差值为0.1,小于阈值0.2,则该图像需要上报服务器作难例检测。
为了节省难例检测所带来的功耗,难例检测可以周期性的执行,比如,每周一次,或每3天一次,本申请实施例对此不作限定。
那么在不进行难例检测的周期(简称非难例检测周期)内,为了提升图像识别的准确性,图像采集终端采集第二图像之后,可以将第二图像发送给图像识别平台,一并发送的还有图像采集终端(第一标注模块)对第二图像的识别结果比如第三类型标签。图像识别平台中的自动识别模块通过第三类型标签和第四类型标签确定第二图像的最终类型标签,其中,第四类型标签是图像识别平台(即第二标注模块)对第二图像的识别结果。假设上一个难例检测周期内,图像识别平台确定出最优权重。自动识别模块可以获取该最优权重,使用该最优权重、第三类型标签和第四类型标签,确定第二图像的最终类型标签。比如,最优权重是(a,b),第三类型标签是第三概率数值,第四类型标签是第四概率数值,那么第二图像的最终类型标签满足:(a*第三数值+b*第四数值)。
也就是说,在难例检测周期内确定的最优权重可以是非难例检测周期内使用,以提升非难例检测周期内图像识别的准确性。
需要说明的是,本申请实施例中难例检测还可以提升确定分界线的准确性。应理解,通过模型训练的方式可以得到越来越精准的分界线,但是如果使用非难例进行模型训练得到的分界线准确性较差。示例性的,请参见图3,实心点和交叉点属于两种不同类型。其中,非难例比如类型标签是0.9、0.8的样本远离分界线,若使用非难例训练模型的话无法更为精准的分界线,这样的话,对于后续出现的难例容易分错。因此,本申请中可以使用难例比如图3中实心点和交叉点比较接近的样本训练模型,得到较为精准的分界线,提升分类准确性。需要说明的是,图3中以分界线是曲线为例,但本申请实施例对比并不作限定,还可以是直线、平面等,例如,如果是高维特征空间,分类界面还是一个超平面。
图4为本申请实施例提供的图像识别方法的流程示意图。该方法可以适用于图1所示的系统架构。如图4所示,该方法流程包括:
S41,图像采集终端采集第一图像。图像采集终端例如是摄像机,采集到的第一图像例如是JPGE格式的图像。
S42,图像采集终端对第一图像进行识别得到第一识别结果。例如,图像采集终端使用第一算法模型进行识别,得到的第一识别结果是第一类型标签。
值得说明的是,一张图像上可以包括一个或多个对象。对象例如是行人、车辆、车牌等。图像采集终端对第一图像进行识别可以是先识别第一图像上的一个或多个对象,然后对一个或多个对象的类型识别。假设第一图像上包括一个对象,那么识别结果是一个类型标签。假设第一图像上包括多个对象,那么识别结果可以是多个类型标签,一个对象对应一个类型标签。
S43,图像采集终端将第一图像和第一识别结果发送给图像识别平台。图像识别平台例如是服务器或者服务器集群,或者是云。
一种可实现方式为,图像采集终端每采集到一帧图像,就将该图像以及图像采集终端对该图像的识别结果发送给图像识别平台。图像识别平台对该图像进行难例检测。这种方式可以提升每张图像的识别准确性。
另一种可实现方式为,图像采集终端无需将每次采集的图像上报图像识别平台,可以将采集到的图像中满足第一条件的图像以及图像采集终端对该图像的识别结果上报给图像识别平台进行难例检测。所述满足第一条件的图像,包括:图像采集终端对图像的识别结果是第一类型标签,且第一类型标签是概率数值,且概率数值与分界线数值之间的差值较小(小于阈值)。比如,一张图像的第一类型标签是0.4,分界线数值是0.5,差值为0.1,小于阈值0.2,需要将该图像以及对应的第一类型标签上报图像识别平台。再比如,一张图像的第一类型标签是0.6,分界线数值是0.5,差值为0.1,小于阈值0.2,则需要将该图像以及对应的第一类型标签上报图像识别平台。这种方式一定程度上可以节省计算功耗,提升效率。
如果第一图像上包括一个对象,图像采集终端只需将该对象对应的第一类型标签上报图像识别平台。如果第一图像上包括多个对象,图像采集终端可以将每个对象对应的第一类型标签均上报服务器,也可以仅将多个对象中满足第一条件的对象以及该对象对应的第一类型标签上报图像识别平台。比如,第一图像上包括对象1和对象2,对象1的第一类型标签是0.9,与分界线数值之间的差值大于阈值0.2,那么对象1和对象1对应的第一类型标签可以无需上报,对象2的第一类型标签是0.5,与分界线数值之间的差值小于阈值0.2,那么对象2和对象2对应的第一类型标签需要上报。
S44,图像识别平台对第一图像进行识别得到第二识别结果。例如,图像识别平台使用第二算法模型对第一图像识别,得到的第二识别结果是第二类别标签。
图像识别平台对第一图像识别所使用的算法模型与图像采集终端对第一图像识别所使用的算法模型可以相同或不同,本申请实施例不作限定。
S45,图像识别平台判断第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果确定第一图像的最终识别结果。示例性的,第一识别结果是第一类型标签,第二识别结果是第二类型标签,最终识别结果也即最终类型标签。其中,关于第一类型标签和第二类型标签之间的差异满足预设条件(即难例检测过程)的介绍,请参见前文描述,在此不重复赘述。其中,根据第一类型标签和第二类型标签确定最终类型标签的方式,请参见前文所述,在此不重复赘述。
需要说明的是,第一识别结果用于描述第一图像中的对象属于第一类型的可能性;第二识别结果用于描述第一图像中的所述对象属于第一类型的可能性;最终识别结果用于描述第一图像中的所述对象属于第一类型的可能性。也就是说,第一识别结果、第二识别结果和最终识别结果可以是对第一图像上同一对象的相同类型的识别结果。
例如,第一识别结果用于描述:第一图像上的对象1所属于的类型(比如属于成人)以及属于所述类型的可能性(比如,成人的可能性是80%),第二识别结果用于描述:第一图像上的对象1所属于的类型(比如属于成人)以及属于所述类型的可能性(比如,成人的可能性是40%);最终识别结果用于描述:第一图像上的对象1所属于的类型(比如属于成人)以及属于所述类型的可能性(比如,成人的可能性是60%)。
本实施例中,第一识别结果用于描述:第一图像上的对象所属于的类型,以及属于对应类型的可能性。类似的,第二识别结果用于描述:第一图像上的所述对象所属于的类型,以及属于对应类型的可能性。所述最终识别结果用于描述:所述对象所属于的类型,以及属于对应类型的可能性。需要说明的是,第一识别结果所识别出来的类型与第二识别结果所识别出的类型可以相同,也可以不同。如果把第一识别结果所识别出来的类型与第二识别结果所识别出的类型的并集称为总类型,那么最终识别结果所识别出的类型是所述总类型的子集(可以与总集中的类型相同,但是不会有总集之外的类型)。参见下面的举例。
例如,第一识别结果所识别的类型共2种,分别是:儿童、成人;儿童的可能性80%,成人的可能性20%。第二识别结果所识别的类型共3种,分别是:儿童、成人,动物;儿童的可能性60%,成人的可能性20%,动物的可能性20%。那么最终识别结果所识别出的类型是所述总类型的子集,例如最终识别结果:儿童、成人、动物;各类型的比例是儿童的可能性70%,成人的可能性20%,动物的可能性10%,最终识别结果中不会出现儿童、成人、动物这三种类型之外的类型。在一些算法中,可以把最低可能性的类型删除,仅保留可能性较高的类型,那么最终识别结果可以是:儿童的可能性70%,成人的可能性20%。
S46,图像识别平台将第一图像的最终识别结果发送给图像采集终端。
S47,图像识别平台根据第一图像和最终识别结果优化第二算法模型。
S48,图像采集终端根据第一图像和最终识别结果优化第一算法模型。
需要说明的是,步骤S46-步骤S48之间的执行顺序,本申请实施例不作限定。
S49,图像采集终端采集第二图像。
S50,图像采集终端使用优化后的第一算法模型识别第二图像,得到第三识别结果。第三识别结果可以是第三类型标签。
S51,图像采集终端将第二图像和第三识别结果发送给图像识别平台。
S52,图像识别平台使用优化之后的第二算法模型识别第二图像得到第四识别结果。第四识别结果可以是第四类型标签。
S53,图像识别平台根据第三识别结果和第四识别结果,确定第二图像的最终识别结果。
作为一种示例,图像识别平台确定当前时间不处于难例检测周期内,可以执行步骤S53。应理解,在难例检测周期内,图像识别平台会对第二图像进行难例检测即判断第三类型标签和第四类型标签之间的差异是否满足预设条件;如果当前时间不处于难例检测周期内,图像识别平台直接根据第二图像的第三类型标签和第四类型标签确定第二图像的最终类型标签。具体而言,图像识别平台可以使用上一个难例检测周期内确定的最优权重确定第二图像的最终类型标签。
S54,图像识别平台将第二图像的最终识别结果发送给图像采集终端。
S55,图像采集终端输出第二图像的最终识别结果。
需要说明的是,步骤S46-步骤S55是可选步骤,图中以虚线表示。
下面,以一种具体的实例,对第一图像的难例检测以及确定最终类型标签的过程进行说明。
沿用前述某乡镇的例子,设置在小学门口的摄像机采集到第一图像发送给图像识别平台,摄像机对第一图像识别得到的第一类型标签,图像识别平台对第一图像识别得到第二类型标签。示例性的,第一类型标签和第二类型标签可以是(A,B)的形式,其中,A是指第一图像上的对象属于儿童的概率,B是指第一图像上的对象属于成人的概率。如果第一图像上包括两个对象,对象1和对象2,其中,对象1的第一类型标签为(A1,B1),A1是指对象1属于儿童的概率,B1是指对象1属于成人的概率;对象2的第一类型标签为(A2,B2),A2是指对象2属于儿童的概率,B2是指对象2属于成人的概率。
示例性的,第一类型标签和第二类型标签参见下表1:
表1
参见上述表1,对于对象1:图像采集终端识别得到的第一类型标签是(0.6,0.4),即对象1是儿童的概率是0.6,对象2是成人的概率是0.4;这是因为,图像采集终端对儿童识别准确性高但对成人识别准确性低,所以图像采集终端不是十分确定对象1是成人。对于对象1:图像识别平台识别得到的第二类型标签是(0.2,0.8),即对象1是儿童的概率是0.2,对象1是成人的概率是0.8。这是因为,图像识别平台对成人的识别准确性较高,可以较为肯定的确认对象1是成人。因此,对于对象1,图像采集终端和图像识别平台认为是成人的概率差异较大,一个是0.4一个是0.8,所以确定对象1是难例。
继续参见上述表1,对于对象2:图像采集终端识别得到的第一类型标签是(0.8,0.2),即对象2是儿童的概率是0.8,对象2是成人的概率是0.2;这是因为,图像采集终端对儿童识别准确性高,所以图像采集终端可以比较肯定的确认对象2是儿童。对于对象2:图像识别平台识别得到的第二类型标签是(0.4,0.6),即对象2是儿童的概率是0.4,对象2是成人的概率是0.6。这是因为,图像识别平台对儿童的识别准确性较低,不是十分确定对象2是儿童。因此,对于对象2,图像采集终端和图像识别平台认为是儿童的概率差异较大,一个是0.8一个是0.4,所以确定对象2是难例。
因此,图像识别平台需要确定第一图像中的对象1和对象2的最终类型标签。
假设图像识别平台使用加权平均值的方式确定最终类型标签,且假设权重如下表2:
表2
图像识别平台 | 图像采集终端 | |
权重 | 0.5 | 0.5 |
通过上表2所示的权重,计算上表1中对象1和对象2的最终类型标签。示例性的,参见下表3:
表3
第一图像 | 对象1(成人) | 对象2(儿童) |
第一类型标签(图像采集终端的识别结果) | (0.6,0.4) | (0.8,0.2) |
第二类型标签(图像识别平台的识别结果) | (0.2,0.8) | (0.4,0.6) |
难例检测结果 | 难例 | 难例 |
最终类型标签 | (0.4,0.6) | (0.6,0.4) |
其中,对象1的最终类型标签的计算过程为:
如表1,对象1的第一类型标签(0.6,0.4),第二类型标签(0.2,0.8),如表2,权重是0.5和0.5;则最终类型标签:(0.6*0.5+0.2*0.5)=0.4,(0.4*0.5+0.8*0.5)=0.6,即对象1的最终类型标签是(0.4,0.6),最终类型标签指示对象1是成人,校正了图像采集终端的识别结果,解决了图像采集终端对成人识别准确性低的问题。
其中,对象2的最终类型标签的计算过程为:
对象2的第一类型标签(0.8,0.2),第二类型标签(0.4,0.6),最终类型标签:(0.8*0.5+0.4*0.5)=0.6,(0.2*0.5+0.6*0.5)=0.4,即对象2的最终类型标签是(0.6,0.4),最终类型标签指示对象2是儿童,校正了图像识别平台的识别结果,可以解决图像识别平台对儿童识别准确性低的问题。
实施例2
入侵检测是指通过图像采集终端采集图像,然后通过图像识别技术对图像进行检测,以检测图像上是否有入侵对象。通常入侵检测可应用于安防监控比如小区/学校入口监控、围栏监控等等场景。
目前,入侵检测可通过算法模型实现,当从图像上检测到入侵对象时,输出入侵报警。但是,现有技术无法准确的识别入侵对象是否是真正的或者恶意的入侵对象。举例来说,请参考图5所示,以围栏监控为例,虚线之间的区域是监控区域,周围有树木如果树木随风摇晃可能会导致树枝出现在所述监控区域内,算法模型检测到区域内有入侵对象时,输出入侵报警,显然,这样的入侵报警属于误报,因为检测到的入侵对象并不是真正的或者说恶意的入侵对象,可见,现有技术入侵检测准确性较差。
鉴于此,本申请提供一种入侵检测方法,该方法可以提升检测入侵对象的准确性。
本申请提供的入侵检测方法可以适用于图1所示架构。比如,图像采集终端采集到图像后发送给图像识别平台,图像识别平台使用本申请实施例提供的入侵检测方法进行入侵检测。或者,本申请提供的入侵检测方法完全由图像采集终端执行,本申请实施例对此不作限定。下文中以图像采集终端执行为例介绍。
图6为本申请实施例提供的入侵检测方法的流程示意图。如图6所示,该方法的流程包括:
S61,图像采集终端获取第一图像。图像采集装置例如是摄像机,图像格式例如JPEG。图像采集装置可以安装在仓库门口。
S62,从第一图像检测到第一对象;如果第一对象无记录,执行步骤S63,如果第一对象有记录,不输出入侵报警。
作为一种可实现方式,图像采集终端中存储数据库,该数据库用于记录各种非入侵对象,非入侵对象是指树木、花草等不是真正的或恶意的入侵对象(恶意入侵对象例如准备潜入仓库的窃贼)。从第一图像检测到第一对象,如果第一对象在数据库中有记录,说明第一对象是非入侵对象,可以不输出入侵报警;如果第一对象在数据库中没有记录,输出入侵报警。
举例来说,数据库中记录的非入侵对象包括树木。当有鸟经过图像采集装置的视野,从图像采集装置采集到第一图像,图像采集装置检测到第一对象不是树木,由于数据库中没有记录,输出入侵报警。
可选的,从第一图像上检测到第一对象可以是对第一图像上的全部区域进行检测,也可以是对第一图像上的部分区域进行检测,比如,对第一图像上的特定区域的检测,特定区域比如图5所示的虚线之间的区域,仅对特定区域内对象检测可以节省计算,节省功耗。
S63,输出入侵报警。
入侵报警包括多种方式,比如指示灯点亮、扬声器播放报警声音,发送报警消息等等,本申请实施例对此不作限定。
S64,提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;
虽然第一对象无记录从而触发了报警,但第一对象也可能不是真正的入侵对象。沿用上面的例子,第一对象是鸟,虽然在数据库中无记录但并不是真正的入侵对象。为了进一步识别,可通过管理员人工方式判断第一对象是否是非入侵对象,若是,可在输入界面内将第一对象标记为非入侵对象。
S65,更新记录。
沿用上面的例子,图像采集终端将第一对象(比如鸟)更新到数据库中,那么数据库中记录的非入侵对象增加一项比如鸟。
因此,数据库可以过滤非入侵对象,避免非入侵对象导致的入侵报警,而且也可以减少人工确定入侵对象的工作量。而且,数据库可以更新,更新后的数据库能够过滤更多类型的非入侵对象,更加提升入侵检测的准确性。
S66,图像采集终端采集第二图像。
S67,从第二图像检测到第二对象,第二对象与第一对象相同或相似。
作为一种可实施方式,通过数据库中记录的非入侵对象建立算法模型,该算法模型用于从图像检测对象并识别对象的类型标签,类型标签可以是对象属于数据库中各种非入侵对象的概率数值。假设数据库中记录的非入侵对象包括树木和鸟。示例性的,算法模型对图像识别得到类型标签可以是(W,P)其中,W是对象是树木的概率,P是对象是鸟的概率。比如,类型标签是(0.6,0.4),确定对象是树木。
这种方式下,第一对象和第二对象相同或相似是指,第一对象的第一类型标签和第二对象的第二类型标签相同或相似。相似包括:第一类型标签和第二类型标签之间的差值小于阈值。比如,第一类型标签是(0.6,0.4),第二类型标签是(0.7,0.3),其中0.6和0.7之间的差值0.1小于阈值0.2,确定第一对象和第二对象相似,且均是鸟。
S68,不输出入侵报警。由于鸟已经在数据库中被标记为非入侵对象,因此不触发入侵报警。
因此,本申请中,数据库可以过滤非入侵对象,避免非入侵对象导致的入侵报警,而且,数据库可以更新,更新后的数据库能够过滤更多类型的非入侵对象,更加提升入侵检测的准确性。
图7示出了一种装置700的结构示意图。其中,该装置700可以是上述图像识别平台或图像识别平台内置的装置,能够实现本申请实施例1提供的图像识别方法。该装置700可以是硬件结构、软件模块、或硬件结构加软件模块。该装置700可以由芯片系统实现。本申请实施例中,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
该装置700可以包括通信单元701、处理单元702。
通信单元701,用于从图像采集终端处接收第一图像以及所述图像采集终端对所述第一图像的第一识别结果;
处理单元702,用于对所述第一图像进行识别,得到对所述第一图像的第二识别结果;
所述处理单元,还用于在所述第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
关于通信单元701、处理单元702的具体执行过程,可参见上方法实施例中的记载。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
图8示出了一种装置800的结构示意图。其中,该装置800可以是图像采集终端或图像识别平台,或图像采集终端内置的装置或图像识别平台内置的装置,能够实现本申请实施例2提供的入侵检测方法。该装置800可以是硬件结构、软件模块、或硬件结构加软件模块。该装置800可以由芯片系统实现。本申请实施例中,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
该装置800可以包括获取模块801、处理模块802、输入模块803。
获取模块801,用于获取第一图像;
处理模块802,用于对所述第一图像进行识别,当从所述第一图像中检测到无记录的第一对象时,通过输出模块输出入侵警报;
输入模块803,用于提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;
所述获取模块801,还用于获取第二图像;
所述处理模块802,还用于对所述第二图像进行识别,当在所述第二图像上检测到与所述第一对象相同或者相似的第二对象时,不输出入侵警报。
关于获取模块801、处理模块802、输入模块803的具体执行过程,可参见上方法实施例中的记载。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
图9是本申请实施例提供的一种装置900的硬件结构示意图。图9所示的装置900包括存储器901、处理器902、通信接口903以及总线904。其中,存储器901、处理器902、通信接口903通过总线904实现彼此之间的通信连接。
存储器901可以是只读存储器(Read Only Memory,ROM),静态存储设备,动态存储设备或者随机存取存储器(Random Access Memory,RAM)。存储器901可以存储程序,当存储器901中存储的程序被处理器902执行时,处理器902和通信接口903用于执行本申请实施例的图像识别方法、或入侵检测方法的各个步骤。
处理器902可以采用通用的中央处理器(Central Processing Unit,CPU),微处理器,应用专用集成电路(Application Specific Integrated Circuit,ASIC),图形处理器(graphics processing unit,GPU)或者一个或多个集成电路,用于执行相关程序,以实现本申请实施例的图像识别平台或图像采集终端中的单元或模块所需执行的功能,或者执行本申请实施例提供的图像识别方法或入侵检测方法。
处理器902还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述实施例1的图像识别方法的各个步骤可以通过处理器902中的硬件的集成逻辑电路或者软件形式的指令完成。或者,上述实施例2的入侵检测方法的各个步骤可以通过处理器902中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器902还可以是通用处理器、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器901,处理器902读取存储器901中的信息,结合其硬件完成本申请实施例的图像识别方法或入侵检测方法。
通信接口903使用例如但不限于收发器一类的收发装置,来实现装置900与其他设备或通信网络之间的通信。例如,装置900是图像识别平台时,可以通过通信接口903从图像采集终端接收图像。
总线904可包括在装置900各个部件(例如,存储器901、处理器902、通信接口903)之间传送信息的通路。
应理解,装置700中的通信单元701相当于装置900中的通信接口903,处理单元702可以相当于处理器902。
应注意,尽管图9所示的装置900仅仅示出了存储器、处理器、通信接口,但是在具体实现过程中,本领域的技术人员应当理解,装置900还包括实现正常运行所必须的其他器件。同时,根据具体需要,本领域的技术人员应当理解,装置900还可包括实现其他附加功能的硬件器件。此外,本领域的技术人员应当理解,装置900也可仅仅包括实现本申请实施例所必须的器件,而不必包括图9中所示的全部器件。
本申请实施例还提供一种计算机可读介质,该计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行前述实施例中的图像识别方法或入侵检测方法。
本申请实施例还提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行前述实施例中的图像识别方法或入侵检测方法。
本申请实施例还提供一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行前述实施例中的图像识别方法或入侵检测方法。
在一种可能的设计中,所述芯片还可以包括存储器,所述存储器中存储有指令,所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行前述实施例中的图像识别方法或入侵检测方法。
本申请实施例还提供一种电子设备,该电子设备包括执行前述实施例中的图像识别方法或入侵检测方法的处理装置。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (24)
1.一种图像识别方法,其特征在于,包括:
图像识别平台获取图像采集终端采集的第一图像;
所述图像识别平台获取所述图像采集终端对所述第一图像的第一识别结果;
所述图像识别平台对所述第一图像进行识别,得到对所述第一图像的第二识别结果;
当所述第一识别结果和第二识别结果之间的差异满足预设条件时,所述图像识别平台根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
2.如权利要求1所述的方法,其特征在于,
所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
3.如权利要求1或2所述的方法,其特征在于,
所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
4.如权利要求3所述的方法,其特征在于,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:
所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
5.如权利要求1-4任一所述的方法,其特征在于,所述图像识别平台对所述第一图像进行识别,得到第二识别结果,包括:
通过第一算法模型对所述第一图像进行类型识别,得到所述第二识别结果;
在所述确定所述第一图像的最终识别结果之后,还包括:
通过所述第一图像和所述第一图像的最终识别结果对所述第一算法模型进行优化。
6.如权利要求1-5任一所述的方法,其特征在于,所述方法还包括:
向所述图像采集终端发送所述第一图像的最终识别结果,所述最终识别结果用于所述图像采集终端基于所述最终识别结果对第二算法模型进行优化。
7.一种入侵对象检测方法,其特征在于,包括:
图像采集终端获取第一图像,对所述第一图像进行识别,当从所述第一图像中检测到无记录的第一对象时,输出入侵警报;
提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;
所述图像采集终端获取第二图像,对所述第二图像进行识别,当在所述第二图像上检测到与所述第一对象相同或者相似的第二对象时,不输出入侵警报。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
在非入侵对象记录中添加所述第一对象。
9.如权利要求7或8所述的方法,其特征在于,所述第一对象和所述第二对象相同或相似,包括:
通过算法模型对所述第一对象识别得到第一识别结果,对所述第二对象识别得到第二识别结果;其中,所述第一识别结果用于描述所述第一对象属于第一类型的可能性;所述第二识别结果用于描述所述第二对象属于第一类型的可能性;所述第一对象属于第一类型的可能性与所述第二对象属于第一类型的可能性相同或相近。
10.如权利要求9所述的方法,其特征在于,所述第一识别结果是所述第一对象属于第一类型的第一概率数值,所述第二识别结果是所述第二对象属于第一类型的第二概率数值;所述第一识别结果与所述第二识别结果相同或相似,包括:所述第一概率数值与所述第二概率数值的差值小于阈值。
11.一种图像识别装置,其特征在于,包括:
通信单元,用于从图像采集终端处接收第一图像以及所述图像采集终端对所述第一图像的第一识别结果;
处理单元,用于对所述第一图像进行识别,得到对所述第一图像的第二识别结果;
所述处理单元,还用于在所述第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
12.如权利要求11所述的装置,其特征在于,
所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
13.如权利要求11或12所述的装置,其特征在于,
所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
14.如权利要求13所述的装置,其特征在于,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:
所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
15.一种入侵对象检测装置,其特征在于,包括:
获取模块,用于获取第一图像;
处理模块,用于对所述第一图像进行识别,当从所述第一图像中检测到无记录的第一对象时,通过输出模块输出入侵警报;
输入模块,用于提供输入界面,通过所述输入界面把所述第一对象标记为非入侵对象;
所述获取模块,还用于获取第二图像;
所述处理模块,还用于对所述第二图像进行识别,当在所述第二图像上检测到与所述第一对象相同或者相似的第二对象时,不输出入侵警报。
16.如权利要求15所述的装置,其特征在于,所述处理模块还用于:
在非入侵对象记录中添加所述第一对象。
17.如权利要求15或16所述的装置,其特征在于,所述第一对象和所述第二对象相同或相似,包括:
通过算法模型对所述第一对象识别得到第一识别结果,对所述第二对象识别得到第二识别结果;其中,所述第一识别结果用于描述所述第一对象属于第一类型的可能性;所述第二识别结果用于描述所述第二对象属于第一类型的可能性;所述第一对象属于第一类型的可能性与所述第二对象属于第一类型的可能性相同或相近。
18.如权利要求17所述的装置,其特征在于,所述第一识别结果是所述第一对象属于第一类型的第一概率数值,所述第二识别结果是所述第二对象属于第一类型的第二概率数值;所述第一识别结果与所述第二识别结果相同或相似,包括:所述第一概率数值与所述第二概率数值的差值小于阈值。
19.一种图像识别系统,其特征在于,包括:
多个图像采集终端;
图像识别平台,与所述多个图像采集终端分别通信;
所述每个图像采集终端包括第一图像数据库,所述第一图像数据库中包括所述图像采集终端采集的图像,所述图像采集终端用于对所述第一图像数据库中的第一图像进行识别得到第一识别结果;
所述图像识别平台中包括第二图像数据库,所述第二图像数据库中包括从所述每个图像采集终端处获取的图像,其中包括所述第一图像;所述图像识别平台用于对所述第一图像进行识别得到第二识别结果,还用于在所述第一识别结果和第二识别结果之间的差异满足预设条件时,根据所述第一识别结果和所述第二识别结果,确定所述第一图像的最终识别结果。
20.如权利要求19所述的系统,其特征在于,
所述第一识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述第二识别结果用于描述所述第一图像中的对象属于第一类型的可能性;
所述最终识别结果用于描述所述第一图像中的对象属于第一类型的可能性。
21.如权利要求19或20所述的系统,其特征在于,
所述第一识别结果是所述第一图像中的对象属于第一类型的第一概率数值,第二识别结果是所述第一图像中的对象属于第一类型的第二概率数值,所述最终识别结果是所述第一概率数值和所述第二概率数值的算术平均值或加权平均值。
22.如权利要求21所述的系统,其特征在于,所述最终识别结果是所述第一概率数值和所述第二概率数值的加权平均值时,其中:
所述第一概率数值和所述第二概率数值的权重是预设的;或者,是根据图像测试集确定的最优权重,或者,是用户通过输入界面指定的。
23.一种装置,其特征在于,包括至少一个处理器,所述至少一个处理器与至少一个存储器耦合;所述至少一个处理器,用于执行所述至少一个存储器中存储的计算机程序或指令,以使得所述装置执行如权利要求1至10中任一项所述的方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当计算机读取并执行所述计算机程序或指令时,使得计算机执行如权利要求1至10中任意一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010367005.3A CN113591520A (zh) | 2020-04-30 | 2020-04-30 | 一种图像识别方法、入侵对象检测方法及装置 |
PCT/CN2021/079432 WO2021218385A1 (zh) | 2020-04-30 | 2021-03-06 | 一种图像识别方法、入侵对象检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010367005.3A CN113591520A (zh) | 2020-04-30 | 2020-04-30 | 一种图像识别方法、入侵对象检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113591520A true CN113591520A (zh) | 2021-11-02 |
Family
ID=78237579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010367005.3A Pending CN113591520A (zh) | 2020-04-30 | 2020-04-30 | 一种图像识别方法、入侵对象检测方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113591520A (zh) |
WO (1) | WO2021218385A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115131829A (zh) * | 2022-08-30 | 2022-09-30 | 天津大学四川创新研究院 | 一种基于边缘算力融合的去中心化身份识别方法及系统 |
CN115278176A (zh) * | 2022-07-29 | 2022-11-01 | 山东大学 | 一种目标检测识别装置和方法 |
CN115690448A (zh) * | 2022-11-09 | 2023-02-03 | 广东省科学院动物研究所 | 一种基于ai的鸟类物种识别方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6668074B1 (en) * | 2000-03-23 | 2003-12-23 | Unisys Corporation | Apparatus and method for utilizing multiple digital image representations of a document |
CN107992822B (zh) * | 2017-11-30 | 2020-04-10 | Oppo广东移动通信有限公司 | 图像处理方法和装置、计算机设备、计算机可读存储介质 |
CN108875516B (zh) * | 2017-12-12 | 2021-04-27 | 北京旷视科技有限公司 | 人脸识别方法、装置、系统、存储介质和电子设备 |
CN109086789A (zh) * | 2018-06-08 | 2018-12-25 | 四川斐讯信息技术有限公司 | 一种图像识别方法及系统 |
US11113532B2 (en) * | 2019-04-16 | 2021-09-07 | Lg Electronics Inc. | Artificial intelligence apparatus for recognizing object and method therefor |
CN110910551A (zh) * | 2019-10-25 | 2020-03-24 | 深圳奥比中光科技有限公司 | 3d人脸识别门禁系统及基于3d人脸识别的门禁控制方法 |
-
2020
- 2020-04-30 CN CN202010367005.3A patent/CN113591520A/zh active Pending
-
2021
- 2021-03-06 WO PCT/CN2021/079432 patent/WO2021218385A1/zh active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115278176A (zh) * | 2022-07-29 | 2022-11-01 | 山东大学 | 一种目标检测识别装置和方法 |
CN115131829A (zh) * | 2022-08-30 | 2022-09-30 | 天津大学四川创新研究院 | 一种基于边缘算力融合的去中心化身份识别方法及系统 |
CN115690448A (zh) * | 2022-11-09 | 2023-02-03 | 广东省科学院动物研究所 | 一种基于ai的鸟类物种识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021218385A1 (zh) | 2021-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062349B (zh) | 基于视频结构化数据及深度学习的视频监控方法和系统 | |
CN108053427B (zh) | 一种基于KCF与Kalman的改进型多目标跟踪方法、系统及装置 | |
CN108009473B (zh) | 基于目标行为属性视频结构化处理方法、系统及存储装置 | |
WO2021218385A1 (zh) | 一种图像识别方法、入侵对象检测方法及装置 | |
US8744125B2 (en) | Clustering-based object classification | |
US20170213081A1 (en) | Methods and systems for automatically and accurately detecting human bodies in videos and/or images | |
US20150262068A1 (en) | Event detection apparatus and event detection method | |
CN109543607A (zh) | 目标物异常状态检测方法、系统、监护系统及存储介质 | |
CN111401215B (zh) | 一种多类别目标检测的方法及系统 | |
KR102506029B1 (ko) | 영상 기반 가축 개체 성장 추이 모니터링 장치 및 방법 | |
US20240087368A1 (en) | Companion animal life management system and method therefor | |
CN113421192B (zh) | 对象统计模型的训练方法、目标对象的统计方法和装置 | |
CN110414360A (zh) | 一种异常行为的检测方法及检测设备 | |
CN109117771B (zh) | 一种基于锚节点的图像中暴力事件检测系统及方法 | |
CN113111838A (zh) | 行为识别方法及装置、设备和存储介质 | |
CN111325181A (zh) | 一种状态监测方法、装置、电子设备及存储介质 | |
CN114494965A (zh) | 一种基于视觉的流浪宠物的检测方法及系统 | |
CN112633262B (zh) | 通道监测方法、装置、电子设备及介质 | |
CN116959099A (zh) | 一种基于时空图卷积神经网络的异常行为识别方法 | |
CN112257628A (zh) | 一种户外比赛运动员的身份识别方法、装置及设备 | |
CN112053382A (zh) | 出入口监测方法、设备及计算机可读存储介质 | |
CN113743293B (zh) | 跌倒行为检测方法、装置、电子设备及存储介质 | |
CN116189286A (zh) | 一种视频图像暴力行为检测模型及检测方法 | |
CN112784691B (zh) | 一种目标检测模型训练方法、目标检测方法和装置 | |
CN112989869B (zh) | 人脸质量检测模型的优化方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |