CN113869201A - 一种图像识别方法及电子设备 - Google Patents

一种图像识别方法及电子设备 Download PDF

Info

Publication number
CN113869201A
CN113869201A CN202111137201.2A CN202111137201A CN113869201A CN 113869201 A CN113869201 A CN 113869201A CN 202111137201 A CN202111137201 A CN 202111137201A CN 113869201 A CN113869201 A CN 113869201A
Authority
CN
China
Prior art keywords
target
target image
image area
event
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111137201.2A
Other languages
English (en)
Inventor
林泉宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision System Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision System Technology Co Ltd filed Critical Hangzhou Hikvision System Technology Co Ltd
Priority to CN202111137201.2A priority Critical patent/CN113869201A/zh
Publication of CN113869201A publication Critical patent/CN113869201A/zh
Priority to PCT/CN2022/111396 priority patent/WO2023045602A1/zh
Priority to EP22871660.1A priority patent/EP4332826A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种图像识别方法及电子设备,涉及人工智能领域,能够提高对图像画面信息的识别度。该方法包括:确定目标图像画面中的目标图像区域;其中,目标图像区域为目标事件出现在目标图像画面中的候选区域;将目标图像区域与目标算法进行关联;该关联用于指示利用目标算法对目标图像区域进行图像识别,以确定目标图像区域内是否存在目标事件。

Description

一种图像识别方法及电子设备
技术领域
本申请实施例涉及人工智能领域,尤其涉及一种图像识别方法及电子设备。
背景技术
随着人工智能技术的快速发展,通过摄像机拍摄的图像画面判断画面中是否存在目标事件的技术手段被应用在日常生活中的各个方面。
目前,对目标区域中的事件进行监控的方法为:根据摄像机拍摄的目标区域的图像画面判断该目标区域是否存在某种目标事件。以红绿灯路口的拍摄车辆压实线的摄像机为例,该摄像机实时拍摄红绿灯路口的图像画面,然后,根据拍摄到的图像画面判断该图像画面中是否存在车辆,在该图像画面中存在车辆的情况下,根据车辆的位置信息判断该车辆是否存在压实线的事件,进而确定该车辆存是否在违章行为。
然而,上述图像画面中可能包括多种事件,但上述的技术手段中一个摄像机在一个图像画面中只能识别一种事件,进而导致对上述图像画面识别度很低。
发明内容
本申请实施例提供一种图像识别方法及电子设备,能够提高对图像画面信息的识别度。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,本申请实施例提供一种图像识别方法,该方法应用于电子设备;该方法包括:确定目标图像画面中的目标图像区域;其中,目标图像区域为目标事件出现在目标图像画面中的候选区域;将目标图像区域与目标算法进行关联;该关联用于指示利用该目标算法对上述目标图像区域进行图像识别,以确定目标图像区域内是否存在目标事件。
本申请实施例提供的一种图像识别方法,电子设备将目标事件出现在目标图像画面中的候选区域确定为目标图像区域,并为目标图像区域确定关联算法(即:目标算法),其中,目标算法用于确定目标图像区域内是否存在目标事件。如此,上述电子设备即可根据需要,在目标图像画面中选取一个或多个目标图像区域,并为该一个或多个目标图像区域关联一种或多种算法,以使电子设备根据与某一目标图像区域关联的算法对该目标区域进行图像识别,进而提高了电子设备对上述目标图像画面识别度。
一种可能的实现方式中,利用上述目标算法对上述目标图像区域进行图像识别,以确定该目标图像区域内是否存在目标事件;或者,向目标服务器发送目标消息,以使目标服务器基于该目标消息确定上述目标图像区域是否存在目标事件行为,其中,目标消息包括上述目标图像区域的位置信息和目标算法的标识。
一种可能的实现方式中,上述确定目标图像画面中的目标图像区域,包括:将上述目标图像画面输入图像区域识别模型,得到输出结果,该输出结果包括:目标图像区域和目标事件;其中,该图像区域识别模型用于识别预设事件发生在目标图像画面中的候选区域,预设事件包括目标事件。
一种可能的实现方式中,上述图像区域识别模型是基于多个样本图像画面和该多个样本图像画面的标签训练得到的;其中,一个样本图像画面的标签用于表征:该样本图像画面中发生的预设事件,以及发生该预设事件的图像区域。
一种可能的实现方式中,上述确定目标图像画面中的目标图像区域,还包括:接收针对上述目标图像画面的第一操作;该第一操作用于指示上述目标图像画面中的目标图像区域;响应于上述第一操作,以确定上述目标图像画面中的目标图像区域;接收针对上述目标图像区域的第二操作;该第二操作用于指示上述目标图像区域关联的目标事件;响应于上述第二操作,以确定该目标图像区域关联的目标事件。
一种可能的实现方式中,上述将目标图像区域与目标算法进行关联,包括:建立目标图像区域的标识与目标算法的标识之间的对应关系。
一种可能的实现方式中,将目标图像区域与目标算法进行关联,之前还包括:基于目标区域获取目标事件的标识;基于事件标识与算法标识之间的对应关系,确定目标事件对应的目标算法。
第二方面,本申请实施例提供一种电子设备,包括:确定模块和关联模块;确定模块用于确定目标图像画面中的目标图像区域;其中,该目标图像区域为目标事件出现在目标图像画面中的候选区域;关联模块用于将目标图像区域与目标算法进行关联;该关联用于指示利用该目标算法对目标图像区域进行图像识别,以确定该目标图像区域内是否存在目标事件。
一种可能的实现方式中,上述电子设备还包括:识别模块或发送模块;其中,识别模块用于利用上述目标算法对上述目标图像区域进行图像识别,以确定上述目标图像区域内是否存在目标事件;发送模块用于向目标服务器发送目标消息,以使目标服务器基于该目标消息确定上述目标图像区域是否存在目标事件行为,其中,该目标消息包括目标图像区域的位置信息和目标算法的标识。
上述电子设备还包括:输入模块,其中,输入模块用于将上述目标图像画面输入图像区域识别模型,得到输出结果,该输出结果包括:上述目标图像区域和目标事件;其中,该图像区域识别模型用于识别预设事件发生在目标图像画面中的候选区域,该预设事件包括目标事件。
上述图像区域识别模型是基于多个样本图像画面和该多个样本图像画面的标签训练得到的;其中,一个样本图像画面的标签用于表征:该样本图像画面中发生的预设事件,以及发生该预设事件的图像区域。
上述关联模块还具体用于建立上述目标图像区域的标识与上述目标算法的标识之间的对应关系。
上述电子设备还包括获取模块用于基于上述目标区域获取上述目标事件的标识;上述确定模块还用于基于事件标识与算法标识之间的对应关系,确定上述目标事件对应的目标算法。
第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,存储器与处理器耦合;存储器用于存储计算机程序代码,其中,计算机程序代码包括计算机指令;当计算机指令被处理器执行时,使得电子设备执行第一方面及其可能的实现方式中任意之一所述的方法。
第四方面,本申请实施例提供一种计算机存储介质,包括计算机指令,当计算机指令在计算设备上运行时,使得计算设备执行上述第一方面及其可能的实现方式中任意之一所述的方法。
第五方面,本申请实施例提供一种的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面及其可能的实现方式中任意之一所述的方法。
应当理解的是,本申请实施例的第二方面至第五方面技术方案及对应的可能的实施方式所取得的有益效果可以参见上述对第一方面及其对应的可能的实施方式的技术效果,此处不再赘述。
附图说明
图1为本申请实施例提供的一种图像识别系统的示意图一;
图2为本申请实施例提供的一种图像识别系统示意图二;
图3为本申请实施例提供的一种电子设备的硬件示意图;
图4为本申请实施例提供的一种图像识别方法示意图一;
图5为本申请实施例提供的一种图像识别方法示意图二;
图6为本申请实施例提供的一种图像画面示意图;
图7为本申请实施例提供的一种图像识别方法示意图三;
图8为本申请实施例提供的一种图像识别方法示意图四;
图9为本申请实施例提供的一种图像识别方法示意图五;
图10为本申请实施例提供的一种图像识别方法示意图六;
图11为本申请实施例提供的一种图像画面划分示意图一;
图12为本申请实施例提供的一种图像识别方法示意图七;
图13为本申请实施例提供的一种图像画面划分示意图二;
图14为本申请实施例提供的一种图像识别方法示意图八;
图15为本申请实施例提供的一种电子设备结构示意图一;
图16为本申请实施例提供的一种电子设备结构示意图二。
具体实施方式
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请实施例的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一图像区域和第二图像区域等是用于区别不同的图像区域,而不是用于描述图像区域的特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个处理单元是指两个或两个以上的处理单元;多个系统是指两个或两个以上的系统。
随着万物互联时代的到来,视频监控技术在现实生活中的应用也越来越广泛。
目前,一个摄像机只能处理一种事件;例如,红绿灯路口拍摄车辆是否压实线的摄像机,该摄像机只能具备监控目标区域的车辆是否存在压实线的事件。当需要对该目标区域中的多种事件进行监控时,只能在上述摄像机的位置再堆加多台摄像机,并分别对多台摄像机配置多种不同的算法,进而实现对目标区域的多种事件进行监控。例如,摄像机A基于算法A来监控目标区域是否存在车辆压实线的事件,摄像机B基于算法B来监控目标区域内是否存在行人闯红灯的事件。也就是说,当需要对目标区域中的多种事件进行监控时,需要获取目标区域的多路视频画面,并根据多种算法对该多路视频画面进行识别,进而实现对目标区域中的多种事件进行监控;由此可见,现有的技术中单台摄像机对目标区域的图像画面识别度很低。
另外,在同一位置安装多台摄像机的方案造成了“麻雀杆”的现象,这种方案受到物理空间的限制,同时在资源成本(如带宽成本、管理成本、维护成本等)上有很大的浪费。
基于此,本申请实施例提供了一种图像识别方法及电子设备,电子设备确定目标图像画面中的目标图像区域;其中,目标图像区域为目标事件出现在目标图像画面中的候选区域;将目标图像区域与目标算法进行关联;该关联用于指示利用目标算法对目标图像区域进行图像识别,以确定目标图像区域内是否存在目标事件。通过本申请实施例提供的技术方案,能够提高单台电子设备对目标区域的图像画面识别度。另外,上述电子设备可以是一种摄像机,也可以是一种服务器,具体本申请实施例不进行限定。
本申请实施例提供的图像识别方法可以应用于如图1所示的图像识别系统中。该图像识别系统中包括:摄像机和服务器。其中,该摄像机可以是智能摄像机,即具有采集图像、图像分析功能和发送功能的摄像机;也可以是普通摄像机,即具有采集图像和发送功能的摄像机。
在一种可选实施方式中,摄像机确定拍摄到的目标图像画面中的目标图像区域,并将目标图像区域与目标算法进行关联,然后,根据目标算法确定目标图像区域中是否存在目标事件。可选的,摄像机可以将目标图像区域中是否存在目标事件的结果发送给服务器。该实施方式中,摄像机可以是智能摄像机。
在另一种可选实施方式中,摄像机确定拍摄到的目标图像画面中的目标图像区域,并将目标图像区域与目标算法进行关联,然后,将具有关联关系的第一消息和第二消息发送给服务器,其中第一消息用于指示目标图像区域,第二消息用于指示目标算法。服务器根据第一消息确定目标图像区域,并根据第二消息确定目标算法,以及根据第一消息和第二消息的关联关系,利用目标算法对目标图像区域进行图像识别,以确定目标图像区域中是否存在目标事件。该实施方式中,摄像机可以是智能摄像机。
本申请实施例对第一消息具体包括哪些信息不进行限定。例如,第一消息可以是目标图像区域的内容,即直接指示目标图像区域的内容。又如,如果摄像机还向服务器发送该目标图像画面,则第一消息可以是目标图像区域在该目标图像画面中的位置信息,即通过目标图像画面和目标图像区域在该目标图像画面中的位置信息,间接指示目标图像区域的内容。
本申请实施例对第二消息具体包括哪些信息不进行限定。例如,第二消息可以是目标算法本身。又如,如果服务器中本身存储有目标算法,则第二消息可以是目标算法的标识。
在另一种可选实施方式中,摄像机向服务器发送拍摄到的目标图像画面,服务器确定该目标图像画面中的目标图像区域,并将目标图像区域与目标算法进行关联,然后,根据目标算法确定目标图像区域中是否存在目标事件。该实施方式中,摄像机可以是普通摄像机,也可以是智能摄像机。
上述任一技术方案中,目标图像区域可以是一个或多个图像区域。如果目标图像区域包括多个图像区域,则将目标图像区域与目标算法进行关联,可以包括:将每个目标图像区域分别与相应的目标算法进行关联。
当目标图像区域包括多个图像区域时,上述任一可选的实时方式中的服务器可以是一个服务器,也可以是多个服务器,如一个图像区域对应一个服务器。
例如,如图2所示,为本申请实施例提供的另一种图像识别方法的示意图。该图像识别系统中包括:摄像机、第一服务器和第二服务器;其中,摄像机确定拍摄到的目标图像画面中的第一图像区域和第二图像区域,并将第一图像区域与第一算法进行关联,将第二图像区域与第二算法进行关联。然后,摄像机根据第一算法确定第一图像区域中是否存在第一事件,根据第二算法确定第二图像区域中是否存在第二事件;并将根据第一算法确定的第一图像区域中是否存在第一事件的结果发送至第一服务器;将根据第二算法确定的第二图像区域中是否存在第二事件的结果发送至第二服务器。
其他示例不再一一列举。
示例性的,图3是本申请实施例提供的电子设备的一种硬件示意图,该电子设备具体可以是摄像机本身,也可以是其他计算设备。如图3所示,电子设备包括处理器301、存储器 302和网络接口303。
其中,处理器301包括一个或多个CPU。该CPU可以为单核CPU(single-CPU)或多核CPU(multi-CPU)。
存储器302包括但不限于是RAM、ROM、EPROM、快闪存储器、或光存储器等。
可选地,处理器301通过读取存储器302中保存的指令实现本申请实施例提供的图像识别方法,或者,处理器301通过内部存储的指令实现本申请实施例提供的图像识别方法。在处理器301通过读取存储器302中保存的指令实现上述实施例中的方法的情况下,存储器302 中保存实现本申请实施例提供的图像识别方法的指令。
网络接口303是有线接口(端口),例如FDDI、GE接口。或者,网络接口303是无线接口。应理解,网络接口303包括多个物理端口,网络接口303用于接收图像画面信息等。
可选地,电子设备还包括总线304,上述处理器301、存储器302、网络接口303通常通过总线304相互连接,或采用其他方式相互连接。
本申请实施例提供一种图像识别方法,该方法由电子设备执行,该电子设备可以集成在摄像机、服务器或者其他具有计算能力的计算设备上,如图4所示,该方法可以包括S410-S420。
S410、电子设备确定目标图像画面中的目标图像区域。
上述目标图像区域为目标事件出现在上述目标图像画面中的候选区域,其中,目标图像画面可以是摄像头采集到的任意一个图像画面。
上述目标事件包括目标行为事件和/或目标对象事件,例如,目标行为事件可以是车辆追尾事件、车辆压实线事件、行人闯红灯事件以及商贩乱丢垃圾等事件,目标对象事件可以是目标图像区域存在拉土车、行人中存在小学生、目标图像区域存在孕妇等对象事件。
候选区域为目标事件出现在上述目标图像画面中的概率最大或概率较大(如概率大于某一阈值)的区域。需要说明的是,实际实现时,电子设备并不需要计算目标事件出现在目标图像画面中的概率,从而确定目标画面中的哪个区域是目标图像区域。具体确定目标图像画面中的目标图像区域的方法见后续实施例的详细描述。
需要说明的是,上述目标图像区域可以包括一个图像区域,也可以包括多个图像区域。
S420、电子设备将目标图像区域与目标算法进行关联。
上述将目标图像区域与目标算法进行关联用于指示利用该目标算法对目标图像区域进行图像识别,以确定目标图像区域内是否存在目标事件。
需要说明的是,上述目标算法可以包括一个算法,也可以包括多个算法。可选的,一个目标图像区域可以与一个目标算法进行关联。例如上述目标图像区域是用于识别乱丢垃圾的图像区域,则上述目标算法仅包括识别乱丢垃圾的算法;又如上述目标图像区域是用于识别违停车辆的图像区域,则上述目标算法包括识别车辆的算法和检测车辆违停的算法。可选的,一个目标图像区域可以与多个目标算法进行关联。例如一个目标图像区域需要用于识别乱丢垃圾、也需要用于识别违停车辆,则该目标图像区域可以与乱丢垃圾的目标算法、违停车辆的目标算法进行关联。需要说明的是,当多个目标图像区域完全重合时,可以通过多次框选确定出多个目标图像区域,也可以框选一次,并通过给该框选的目标图像区域关联多种算法。
目标算法通常有针对目标行为事件的识别算法和针对目标对象事件的识别算法,例如,针对目标行为事件的算法有识别车辆闯红灯算法、识别车辆超速算法以及识别行人乱丢垃圾等算法,针对目标对象事件的算法有人脸识别算法和车辆识别等算法。
本申请实施例提供的一种图像识别方法,电子设备将目标事件出现在目标图像画面中的候选区域确定为目标图像区域,并为目标图像区域确定关联算法(即:目标算法),其中,目标算法用于确定目标图像区域内是否存在目标事件。如此,上述电子设备即可根据需要,在目标图像画面中选取一个或多个目标图像区域,并为该一个或多个目标图像区域关联一种或多种算法,以使电子设备根据与某一目标图像区域关联的算法对该目标区域进行图像识别,进而提高了电子设备对上述目标图像画面识别度。
本申请实施例以目标图像区域包括第一图像区域和第二图像区域为例进行说明,如图5 所示,本申请实施例提供的图像识别方法,包括:S510-S520。
S510、电子设备确定目标图像画面中的第一图像区域和第二图像区域。
上述第一图像区域为第一事件出现在上述目标图像画面中的候选区域,第二图像区域为第二事件出现在上述目标图像画面中的候选区域。
示例性的,如图6所示的目标图像画面中,第一车道和第二车道用于行驶车辆,第三车道用于行人通行;所以在第一车道和第二车道中出现车辆压实线的事件的概率最大,在第三车道出现行人乱丢垃圾的事件的概率最大;因此,电子设备可以将该目标图像画面中第一车道和/或第二车道的区域确定为第一图像区域,将第三车道的区域确定为第二图像区域。此外,电子设备也可以将第一车道确定为第一图像区域,将第二车道确定为第二图像区域,以及将第三车道确定为第三图像区域。
应理解,上述第一图像区域和第二图像区域的位置关系包括:相交关系、不相交关系或包含关系中的任意一种;也就是说,目标图像画面中的同一区域可能对应多个图像区域,即目标图像画面中的同一区域可能存在多种不同的事件。例如,可以将第一车道同时确定为第一图像区域和第四图像区域,其中,第一图像区域为车辆压实线的事件对应的候选区域,第四图像区为车辆追尾的事件对应的区域,即第一车道既是车辆压实线的事件对应的区域,也是车辆追尾事件对应的区域。
可选的,上述确定目标图像画面中的第一图像区域和第二图像区域的方法可以是通过人工进行确认的,结合图5,如图7所示,确定目标图像画面中的第一图像区域和第二图像区域的方法具体包括:
S710、电子设备接收针对目标图像画面的第一操作。
上述第一操作用于指示目标图像画面中的第一图像区域,具体可以是用户在目标图像画面上手动圈选出第一图像区域;或者,用户在电子设备上配置第一图像区域在目标图像画面上的位置信息,然后,电子设备读取用户配置的第一图像区域的位置信息。具体的,本申请实施例不对上述第一操作的具体内容进行限定。
S720、电子设备响应于第一操作,以确定目标图像画面中的第一图像区域。
上述确定第一图像区域,具体包括:确定第一图像区域在上述目标图像画面中的位置信息。
可选的,当上述第一操作是用户在目标图像画面上手动圈选出第一图像区域时,电子设备响应于人工圈选操作,进而读取第一图像区域在目标图像画面中的位置信息。
可选的,当上述第一操作是用户在电子设备上配置第一图像区域在目标图像画面上的位置信息时,电子设备读取该配置信息,进而获取第一图像区域在目标图像画面中的位置信息。
S730、电子设备接收针对目标图像画面的第二操作。
上述第二操作用于指示第一图像区域关联的第一事件;具体的可以是通过用户指定第一图像区域关联的第一事件。
可选的,上述用户指定第一图像区域关联的第一事件,电子设备接收到的是第一事件的标识信息,该标识信息可以是事件索引、事件名称或事件类型中的任意一个。
S740、电子设备响应于第二操作,以确定第一图像区域关联的第一事件。
可选的,上述确定第一图像区域关联的第一事件具体可以是,电子设备基于上述第二操作获取第一事件的标识信息,然后,根据第一事件的标识信息获取第一事件。
上述第一事件用于,电子设备后续根据第一事件确定与第一图像区域关联的第一算法。
S750、电子设备接收针对目标图像画面的第三操作。
上述第三操作用于指示目标图像画面中的第二图像区域。
S760、电子设备响应于第三操作,以确定第二图像区域。
S770、电子设备接收针对目标图像画面的第四操作。
S780、电子设备响应于第四操作,以确定第二图像区域关联的第二事件。
应注意,上述S750-S780与S710-S740的相关描述类似,具体参考S710-S740的详细描述,此处不再赘述。
需要说明的是,本申请实施例不对上述S710-S740和S750-S780的执行顺序进行限定,也就是说,电子设备可以执行完S710-S740后执行S750-S780,也可以执行完S750-S780后执行S710-S740。
可选的,上述确定目标图像画面中的第一图像区域和第二图像区域的方法还可以是利用训练模型确定的,结合图5,如图8所示,确定目标图像画面中的第一图像区域和第二图像区域的方法具体为S810。
S810、电子设备将目标图像画面输入图像区域识别模型,得到输出结果。
上述输出结果包括:第一图像区域、与第一图像区域关联的第一事件、第二图像区域以及与第二图像区域关联的第二事件。
需要说明的是,上述图像区域识别模型用于识别预设事件发生在目标图像画面中的候选区域,其中,预设事件包括上述第一事件和上述第二事件。
在本申请实施例中,上述图像区域识别模型具备识别出目标图像画面中第一图像区域、与第一图像区域关联的第一事件、第二图像区域以及与第二图像区域关联的第二事件的功能,图像区域识别模型可以根据输入的目标图像画面,确定出该目标图像画面中的第一图像区域和第二图像区域以及与第一图像区域关联的第一事件和与第二图像区域关联的第二事件。
应理解,根据图像区域识别模型输出的结果,在获取第一图像区域和第二图像区域以外还可获知与第一图像区域关联的第一事件,以及与第二图像区域关联的第二事件,以使电子设备后续根据与第一图像区域关联的第一事件确定第一区域对应的第一算法,同样的,电子设备根据与第二图像区域关联的第二事件确定第二区域对应的第二算法。
需要说明的是,上述图像区域识别模型是基于多个样本图像画面和多个样本图像画面的标签训练得到的;其中,一个样本图像画面的标签用于表征:该样本图像画面中发生的预设事件,以及发生该预设事件的图像区域;其中,样本图像画面与目标图像画面是针对同一类空间区域的图像画面。其中,同一类空间区域是指可能包含同一事件的一个或多个空间区域。例如,由于车道中可能存在车辆追尾事件,因此可以将不同地点的车道确定为同一类空间区域。
可选的,上述目标图像画面中的第一图像区域和第一事件可以是人工进行确认的(参照S710-S740的相关描述),而上述目标图像画面中的第二图像区域和第二事件可以是利用图像区域识别模型确认的(参照S810的相关描述);同样的,上述目标图像画面中的第一图像区域和第一事件可以是利用图像区域识别模型确认的(参照S810的相关描述);而上述目标图像画面中的第二图像区域和第二事件可以是人工进行确认的(参照S740-S780的相关描述)。
S520、电子设备将第一图像区域与第一算法进行关联,该关联用于指示利用第一算法对第一图像区域进行图像识别,以确定第一图像区域中是否存在第一事件;电子设备将第二图像区域与第二算法进行关联,该关联用于指示利用第二算法对第二图像区域进行图像识别,以确定第二图像区域中是否存在第二事件。
需要说明的是,上述第一算法可以是由一个或多个子算法组成的算法;同样的,上述第二算法可以是由一个或多个子算法组成的算法。
可选的,上述将第一图像区域与第一算法进行关联,以及将第二图像区域与第二算法进行关联的方法具体为:将第一图像区域的标识与第一算法的标识之间建立映射关系,或在第一图像区域上打上第一算法的标签,以使电子设备根据第一算法识别第一图像区域中的第一事件。同样的,将第二图像区域的标识与第二算法的标识之间建立映射关系,或在第二图像区域上打上第二算法的标签,以使电子设备根据第二算法识别第二图像区域中的第二事件。
可选的,结合图5、图7或图8,如图9所示,上述将第一图像区域与第一算法进行关联,以及将第二图像区域与第二算法进行关联的方法包括:S910。
S910、电子设备基于事件标识与算法标识之间的对应关系,确定第一事件对应的第一算法以及第二事件对应的第二算法。
上述基于事件标识与算法标识之间的对应关系,确定第一事件对应的第一算法以及第二事件对应的第二算法的具体方法包括:电子设备根据第一图像区域对应的第一事件的标识,在本地或远端知识库中检索与该第一事件相关联的第一算法。同理,电子设备根据第二图像区域对应的第二事件的标识,在本地或远端知识库中检索与第二事件相关联的第二算法。
应理解,上述确定第一事件对应的第一算法以及第二事件对应的第二算法的方法是:基于第一图像区域获取与第一图像区域关联的第一事件的标识,基于第二图像区域获取与第二图像区域关联的第二事件的标识。
可选的,上述第一事件的标识可以是电子设备根据第一事件查询知识库得到的,也可以是上述S510在确定上述第一图像区域时,用户手动为第一图像区域配置第一事件时配置的就是第一事件对应的标识;具体本申请实施例对于获取第一事件的标识的方法不进行限定。
需要说明的是,上述知识库是用于存储事件与相关算法之间的对应关系的数据库。
可选的,结合图5、图7或图8,如图10所示,上述将第一图像区域与第一算法进行关联,以及将第二图像区域与第二算法进行关联的方法还可以包括:S1010-S1030。
S1010、电子设备接收针对第一图像区域的第五操作和针对第二图像区域的第六操作。
上述第五操作可以用于用户手动为第一图像区域选择关联的第一算法;上述第六操作可以用于用户手动为第二图像区域选择关联的第二算法。
可选的,用户在选择第一算法和第二算法后,电子设备基于用户的选择动作获取第一算法的标识和第二算法的标识。
示例性的,如图11所示,用户选中上述目标图像画面中的第一图像区域(即:图11中黑色虚线选中的区域);然后,选择要关联的算法,当用户选择图11中的算法1时,则表示将算法1确定为第一图像区域关联的第一算法。
S1020、电子设备响应于针对第一图像区域的第五操作,以将第一图像区域与第一算法进行关联。
示例性的,基于上述示例,用户在如图11所示的网页上为第一图像区域选择算法1后,该网页将算法1的标识信息和第一图像区域的标识(可以是第一图像区域在目标图像画面中的位置信息)发送至电子设备,然后电子设根据算法1的标识,确定与第一图像区域关联的算法1,并使用算法1识别第一图像区域中是否存在第一事件。
S1030、电子设备响应于针对第二图像区域的第六操作,以确定将第二图像区域与第二算法进行关联。
上述步骤与S1020类似,具体参考S1020的相关描述,此处不再赘述。
结合图10所示,在一种实现方式中,用户手动在目标图像画面中框选图像区域后,电子设备将用户框选的图像区域确定目标图像区域;然后用户再手动为该目标图像区域选择目标算法后,电子设备将该目标算法与目标图像建立关联关系,以使电子设备根据该目标算法识别目标图像区域中是否存在目标事件。
结合图9所示,在另一种实现方式中,电子设备通过图像区域识别模型,识别出目标图像区域和与目标图像区域关联的目标事件,然后,电子设备根据目标事件确定目标算法,并将该目标算法与上述目标图像区域建立关联关系,以使电子设备根据该目标算法识别目标图像区域中是否存在目标事件。
结合图9和图10,在又一种实现方式中,用户手动在目标图像画面中确定目标图像区域和与目标图像区域关联的目标事件后,电子设备根据目标事件确定目标算法,并建立目标图像区域与目标算法的关联关系,以使电子设备根据该目标算法识别目标图像区域中是否存在目标事件。
结合图9和图10,在再一种实现方式中,电子设备通过图像区域识别模型,识别出目标图像区域和与目标图像区域关联的目标事件后,用户基于目标事件选择目标算法,进而电子设备并建立目标图像区域与目标算法的关联关系,以使电子设备根据该目标算法识别目标图像区域中是否存在目标事件。
本申请实施例提供的一种图像识别方法,电子设备将第一事件出现在目标图像画面中的候选区域确定为第一图像区域,将第二事件出现在目标图像画面中的候选区域确定为第二图像区域;并为第一图像区域确定关联算法(即:第一算法),为第二图像区域确定关联算法(即:第二算法);其中,第一算法用于确定第一图像区域内是否存在第一事件,第二算法用于确定第二图像区域内是否存在第二事件。如此,上述电子设备即可根据第一算法处理第一图像区域中的第一事件,也可根据第二算法处理第二图像区域中的第二事件,进而提高了电子设备对上述目标图像画面识别度。
进一步的,本申请实施例提供的一种图像识别方法,通过电子设备将目标图像画面中确定出的第一图像区域和第二图像区域分别与第一算法和第二算法进行关联,以使电子设备不但可以根据第一算法判断第一图像区域中是否存在第一事件,还可以根据第二算法判断第二图像区域中是否存在第二事件,进而促使电子设备能够对目标区域中的多种事件进行处理,解决了现有技术中通过多个摄像头对同一区域中的多种事件进行处理时,受到物理空间限制的问题,进而极大的节约了资源成本。
可选的,结合图9,如图12所示,当上述电子设备为摄像机时,该电子设备应用在如图 2所示的图像识别系统中时,上述图像识别方法还包括:S1210。
S1210、电子设备向第一服务器发送第一消息,向第二服务器发送第二消息。
上述第一消息包括上述第一图像区域在上述第一图像画面中的位置信息和第一算法的标识,该第一服务器基于第一消息确定第一图像区域内是否存在第一事件;上述第二消息包括第二图像区域在第二图像画面中的位置信息和第二算法的标识,以使第二服务器基于第二消息确定第二图像区域内是否存在第二事件。
示例性的,电子设备通过确认该图像画面中的第一图像区域和第二图像区域,如图13所示,第一图像区域为秸秆燃烧的事件识别区,第二图像区域为商贩乱丢垃圾的事件识别区;并确定与第一图像区域关联的第一算法以及与将第二图像区域与第二算法进行关联。如图2 所示,电子设备向第一服务器(环保局服务器)发送第一消息,然后,环保局服务器可以根据第一消息确定第一图像区域是否存在燃烧秸秆的事件;同时,电子设备向第二服务器(城管局服务器)发送第二消息,城管局服务器根据第二消息确定第二图像区域是否存在商贩乱丢垃圾的事件。
可选的,结合图9,如图14所示,上述电子设备为服务器时或如图3所示的电子设备为摄像机时,上述图像识别方法还包括:1410。
S1410、电子设备根据第一算法对第一图像区域进行识别,以确定第一图像区域内是否存在第一事件。电子设备根据第二算法对第二图像区域进行识别,以确定第二图像区域内是否存在第二事件。
需要说明的是,上述S410中目标图像区域为一个图像区域时,上述目标图像区域可以为上述S510-S520中的第一图像区域或第二图像区域。
可选的,当上述目标图像区域为第一图像区域时,上述目标事件为上述第一事件,上述目标算法为上述第一算法。
可选的,当上述目标图像区域为第二图像区域时,上述目标事件为上述第二事件,上述目标算法为上述第二算法。
相应地,本申请实施例提供一种电子设备,该电子设备用于执行上述图像识别方法中各个的步骤,本申请实施例可以根据上述方法示例对该电子设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图15示出上述实施例中所涉及的电子设备的一种可能的结构示意图。如图15所示,该电子设备包括:确定模块1510和关联模块 1520。
确定模块1510,用于确定目标图像画面中的目标图像区域,例如执行上述方法实施例中的步骤S410。
关联模块1520还用于将目标图像区域与目标算法进行关联,例如执行上述方法实施例中的步骤S420。
可选的,本申请实施例提供的电子设备还包括输入模块1530;输入模块1530用于将目标图像画面输入图像区域识别模型,得到输出结果,例如执行上述方法实施例中的步骤S810。
可选的,本申请实施例提供的电子设备还包括接收模块1540和响应模块1550;接收模块1540用于接收针对目标图像画面的第一操作,例如执行上述方法实施例中的步骤S710。
响应模块1550用于响应于第一操作,以确定目标图像画面中的第一图像区域,例如执行上述方法实施例中的步骤S720。
上述电子设备的各个模块还可以用于执行上述方法实施例中的其他动作,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在采用集成的单元的情况下,本申请实施例提供的电子设备的结构示意图如图16所示。在图16中,电子设备包括:处理模块1601和通信模块1602。处理模块1601用于对电子设备的动作进行控制管理,例如,执行上述确定模块1510、关联模块1520、输入模块1530、接收模块1540以及响应模块1550执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信模块1602用于支持电子设备与其他设备之间的交互等。如图16所示,电子设备还可以包括存储模块1603,存储模块1603用于存储电子设备的程序代码和目标图像画面等。
其中,处理模块1601可以是处理器或控制器,例如图3中的处理器301。通信模块1602 可以是收发器、RF电路或通信接口等,例如图3中的总线304和/或网络接口303。存储模块 1603可以是存储器,例如图3中的内部存储器302。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例中的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line, DSL))方式或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、磁盘、磁带)、光介质(例如,数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state drives,SSD))等。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
确定目标图像画面中的目标图像区域;其中,所述目标图像区域为目标事件出现在所述目标图像画面中的候选区域;
将所述目标图像区域与目标算法进行关联;所述关联用于指示利用所述目标算法对所述目标图像区域进行图像识别,以确定所述目标图像区域内是否存在所述目标事件。
2.根据权利要求1所述的方法,其特征在于,所述确定目标图像画面中的目标图像区域,包括:
将所述目标图像画面输入图像区域识别模型,得到输出结果,所述输出结果包括:所述目标图像区域以及所述目标事件;其中,所述图像区域识别模型用于识别预设事件发生在所述目标图像画面中的候选区域,所述预设事件包括所述目标事件。
3.根据权利要求2所述的方法,其特征在于,所述图像区域识别模型是基于多个样本图像画面和所述多个样本图像画面的标签训练得到的;其中,一个样本图像画面的标签用于表征:所述样本图像画面中发生的所述预设事件,以及发生所述预设事件的图像区域。
4.根据权利要求1所述的方法,其特征在于,所述确定目标图像画面中的目标图像区域,包括:
接收针对所述目标图像画面的第一操作;所述第一操作用于指示所述目标图像画面中的目标图像区域;
响应于所述第一操作,以确定所述目标图像画面中的所述目标图像区域;
接收针对所述目标图像区域的第二操作;所述第二操作用于指示所述目标图像区域关联的目标事件;
响应于所述第二操作,以确定所述目标图像区域关联的所述目标事件。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述将所述目标图像区域与所述目标算法进行关联,包括:
建立所述目标图像区域的标识与所述目标算法的标识之间的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述将所述目标图像区域与目标算法进行关联,之前还包括:
基于事件标识与算法标识之间的对应关系,确定所述目标事件对应的所述目标算法。
7.一种电子设备,其特征在于,包括:确定模块和关联模块;
所述确定模块,用于确定目标图像画面中的目标图像区域;其中,所述目标图像区域为目标事件出现在所述目标图像画面中的候选区域;
所述关联模块,用于将所述目标图像区域与目标算法进行关联;所述关联用于指示利用所述目标算法对所述目标图像区域进行图像识别,以确定所述目标图像区域内是否存在所述目标事件。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:输入模块;
所述输入模块,用于将所述目标图像画面输入图像区域识别模型,得到输出结果,所述输出结果包括:所述目标图像区域以及所述目标事件;其中,所述图像区域识别模型用于识别预设事件发生在所述目标图像画面中的候选区域,所述预设事件包括所述目标事件;
所述图像区域识别模型是基于多个样本图像画面和所述多个样本图像画面的标签训练得到的;其中,一个样本图像画面的标签用于表征:所述样本图像画面中发生的所述预设事件,以及发生所述预设事件的图像区域;
所述电子设备还包括:接收模块和响应模块;
所述接收模块,用于接收针对所述目标图像画面的第一操作;所述第一操作用于指示所述目标图像画面中的目标图像区域;
所述响应模块,用于响应于所述第一操作,以确定所述目标图像画面中的所述目标图像区域;
所述接收模块,还用于接收针对所述目标图像区域的第二操作;所述第二操作用于指示所述目标图像区域关联的目标事件;
所述响应模块,还用于响应于所述第二操作,以确定所述目标图像区域关联的所述目标事件;
所述关联模块,还用于建立所述目标图像区域的标识与所述目标算法的标识之间的对应关系;
所述确定模块,还用于基于事件标识与算法标识之间的对应关系,确定所述目标事件对应的所述目标算法。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器与所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;当所述计算机指令被所述处理器执行时,使得所述电子设备执行如权利要求1至6中任一项所述的方法。
10.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在计算设备上运行时,使得所述计算设备执行如权利要求1至6中任一项所述的方法。
CN202111137201.2A 2021-09-27 2021-09-27 一种图像识别方法及电子设备 Pending CN113869201A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111137201.2A CN113869201A (zh) 2021-09-27 2021-09-27 一种图像识别方法及电子设备
PCT/CN2022/111396 WO2023045602A1 (zh) 2021-09-27 2022-08-10 一种图像识别方法及电子设备
EP22871660.1A EP4332826A1 (en) 2021-09-27 2022-08-10 Image recognition method and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111137201.2A CN113869201A (zh) 2021-09-27 2021-09-27 一种图像识别方法及电子设备

Publications (1)

Publication Number Publication Date
CN113869201A true CN113869201A (zh) 2021-12-31

Family

ID=78991307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111137201.2A Pending CN113869201A (zh) 2021-09-27 2021-09-27 一种图像识别方法及电子设备

Country Status (3)

Country Link
EP (1) EP4332826A1 (zh)
CN (1) CN113869201A (zh)
WO (1) WO2023045602A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023045602A1 (zh) * 2021-09-27 2023-03-30 杭州海康威视系统技术有限公司 一种图像识别方法及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829456B (zh) * 2017-11-23 2022-05-17 腾讯科技(深圳)有限公司 图像识别方法、装置及终端
CN111753609B (zh) * 2019-08-02 2023-12-26 杭州海康威视数字技术股份有限公司 一种目标识别的方法、装置及摄像机
CN110852236A (zh) * 2019-11-05 2020-02-28 浙江大华技术股份有限公司 目标事件的确定方法及装置、存储介质、电子装置
CN112149503A (zh) * 2020-08-20 2020-12-29 北京迈格威科技有限公司 目标事件检测方法、装置和电子设备和可读介质
CN112991130A (zh) * 2021-03-16 2021-06-18 广东省电信规划设计院有限公司 基于人工智能的城市治理事件处理方法及装置
CN113869201A (zh) * 2021-09-27 2021-12-31 杭州海康威视系统技术有限公司 一种图像识别方法及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023045602A1 (zh) * 2021-09-27 2023-03-30 杭州海康威视系统技术有限公司 一种图像识别方法及电子设备

Also Published As

Publication number Publication date
WO2023045602A1 (zh) 2023-03-30
EP4332826A1 (en) 2024-03-06

Similar Documents

Publication Publication Date Title
KR102399425B1 (ko) 데이터 라벨링 전처리, 분배 및 검수 시스템
CN202940921U (zh) 一种基于人脸识别的实时监控系统
CN110162462A (zh) 基于场景的人脸识别系统的测试方法、系统和计算机设备
CN112446395A (zh) 网络摄像机、视频监控系统及方法
CN113627402B (zh) 一种图像识别方法及相关装置
WO2020111776A1 (en) Electronic device for focus tracking photographing and method thereof
CN111047824B (zh) 一种室内儿童看护联动控制预警方法及系统
CN108288025A (zh) 一种车载视频监控方法、装置及设备
CN113378616A (zh) 视频分析方法、视频分析的管理方法及相关设备
CN113869201A (zh) 一种图像识别方法及电子设备
CN111340016A (zh) 图像曝光方法和装置、存储介质及电子装置
CN112908017A (zh) 车辆停放状态的检测方法、装置及设备
CN113409056B (zh) 支付方法、装置、本地识别设备、人脸支付系统及设备
CN113554610A (zh) 一种光伏组件运行状态检测方法及其应用装置
CN114051116A (zh) 一种驾考车辆的视频监控方法、装置以及系统
CN110855947B (zh) 一种图像抓拍处理方法及装置
KR101236266B1 (ko) 주차공간정보 관리시스템
CN114531340B (zh) 日志获取方法、装置、电子设备、芯片及存储介质
CN112270639B (zh) 一种图像处理方法、图像处理装置以及存储介质
CN205644589U (zh) 车牌分类识别装置
CN114155483A (zh) 监控告警方法、装置、存储介质及计算机设备
CN113269150A (zh) 基于深度学习的车辆多属性识别的系统及方法
CN112418234A (zh) 识别车牌号的方法、装置、电子设备及存储介质
CN213123586U (zh) 一种智能镜面视频广告机
CN115826899B (zh) 基于远程桌面共享的涂鸦图像处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination