CN109766953B - 对象识别方法及装置 - Google Patents
对象识别方法及装置 Download PDFInfo
- Publication number
- CN109766953B CN109766953B CN201910061163.3A CN201910061163A CN109766953B CN 109766953 B CN109766953 B CN 109766953B CN 201910061163 A CN201910061163 A CN 201910061163A CN 109766953 B CN109766953 B CN 109766953B
- Authority
- CN
- China
- Prior art keywords
- frame
- side length
- frame image
- determining
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请的实施例提供了一种对象识别方法及装置,涉及图像处理技术领域,方法包括:获得包含对象的第一帧图像;在所述第一帧图像中确定出包含所述对象的第一框;判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;若是,确定所述对象处于未运动状态。在第一帧图像中确定出包含对象的第一框,将第一框在第一帧图像中的位置与第二框在第二帧图像中的位置进行匹配,以此判断对象是否处于未运动状态,通过判断两个框的位置是否变化来判断对象是否处于未运动状态,能够减少计算量,从而提升处理速度,且具有较高的识别的准确率,因此能够提升对象识别的效率。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种对象识别方法及装置。
背景技术
目前,在对象识别技术中,通常通过边缘匹配的方式来识别,这种方式在计算时的运算量大,设备负荷大,对设备性能要求高,导致现有的静物识别技术的实时性、稳定性和准确性较低,识别效率低下。
发明内容
有鉴于此,本申请的目的在于提供一种对象识别方法及装置,以改善目前由于通过边缘匹配的方式来识别,而这种方式在计算时的运算量大,设备负荷大,对设备性能要求高,导致现有的静物识别技术的实时性、稳定性和准确性较低,识别效率低下的问题。
为了实现上述目的,本申请的实施例通过如下方式实现:
第一方面,本申请的实施例提供了一种对象识别方法,包括:获得包含对象的第一帧图像;在所述第一帧图像中确定出包含所述对象的第一框;判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;若是,确定所述对象处于未运动状态。
在本申请实施例中,在第一帧图像中确定出包含对象的第一框,将第一框在第一帧图像中的位置与第二框在第二帧图像中的位置进行匹配,以此判断对象是否处于未运动状态。通过判断两个框的位置是否变化来判断对象是否处于未运动状态,能够减少计算量,从而提升处理速度,因此能够提升对象识别的效率。
结合第一方面,在第一方面的第一种可能的实现方式中,所述在所述第一帧图像中确定出包含所述对象的第一框,包括:从所述第一帧图像中确定出所述对象的轮廓;根据所述轮廓,在所述第一帧图像中生成框选住所述轮廓且为规则图形的第一框。
在本申请实施例中,通过从第一帧图像中确定对象的轮廓,并生成包含该轮廓的规则图形作为第一框。由于第一框是根据对象的轮廓生成的,因此能够可以提高识别的准确率;而第一框为规则图形,能够简化计算第一框的位置的过程,能够提升识别速度,进而能够提升对象识别的效率。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述轮廓,在所述第一帧图像中生成框选住所述轮廓且为规则图形的第一框,包括:确定出所述轮廓上的水平方向上最远的两个点连接的第一长度,以及确定出所述轮廓上的竖直方向上最远的两个点连接的第二长度;确定出所述第一框的与所述第一长度相同的第一边长,以及确定出所述第一框的与所述第二长度相同的第二边长;根据所述轮廓在所述第一帧图像中的位置,以及根据所述第一边长和所述第二边长,生成框选住所述轮廓且为矩形的所述第一框。
在本申请实施例中,通过从对象的轮廓上确定出水平方向上最远的两个点之间的第一长度作为矩形的第一边长,从轮廓上确定出竖直方向上距离最远的两个点之间的第二长度作为矩形的第二边长,以第一边长和第二边长生成矩形的第一框。第一框为矩形,能够简化第一框和第二框的位置匹配时的计算量,从而提高识别的速度,而通过矩形框来框选对象的轮廓,也能够保证识别的准确率,因此能够提升对象识别的效率。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述判断所述第一框在所述第一帧图像中的位置是否与第二框在第二帧图像中的位置匹配,包括:获得所述第一框上第一顶点的第一坐标,并获得所述第二框上与所述第一顶点对应的第二顶点的第二坐标;判断所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长是否均匹配,其中,所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长均匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
在本申请实施例中,通过将两个框在两帧图像中的顶点进行匹配,以及将两个框的边长进行匹配,能够通过计算矩形的一个顶点和两条边长来确定第一框的位置,能够简化位置匹配时的计算量,从而提高识别的速度。而在两个框的顶点和两条边长都匹配一致时,才确定对象处于未运动状态,能够保证识别的准确率,因此能够提升对象识别的效率。
结合第一方面,在第一方面的第四种可能的实现方式中,所述判断所述第一框在所述第一帧图像中的位置是否与第二框在第二帧图像中的位置匹配,包括:判断所述第一框的中心点坐标和所述第二框的中心点坐标在同一参考坐标系中是否匹配,其中,所述第一框的中心点坐标和所述第二框的中心点坐标在所述同一参考坐标系中匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
在本申请实施例中,通过计算两个框的中心点在同一坐标系中的坐标位置,来判定两个框的位置是否一致,以此达到对对象的识别,方法简单高效,在保证对象识别的准确率的同时,能够极大地简化计算量,从而提升对象识别的效率。
结合第一方面,在第一方面的第五种可能的实现方式中,在确定所述第一框在所述第一帧图像中的位置与包含所述对象的第二框在第二帧图像中的位置匹配之后,以及在确定所述对象处于未运动状态之前,所述方法还包括:获得匹配总次数,其中,预设时长内多帧图像中两帧图像匹配成功标记一次,所述预设时长内所有匹配成功的次数之和为所述匹配总次数,所述两帧图像匹配成功表示所述两帧图像中两个框的位置匹配;将所述匹配总次数加一获得更新的所述匹配总次数,并判断更新的所述匹配总次数是否达到阈值次数;若是,执行步骤:确定所述对象处于未运动状态。
在本申请实施例中,通过在两个框的位置匹配成功后,加入判断匹配成功的次数是否达到预设次数,多次匹配成功才确定该对象处于未运动状态,能够尽可能地排除一些暂时性不动的物体,提高对象识别的准确率,进而提升对象识别的效率。
第二方面,本申请的实施例提供了一种对象识别装置,包括:获得模块,用于获得包含对象的第一帧图像;处理模块,用于在所述第一帧图像中确定出包含所述对象的第一框;判断模块,用于判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;确定模块,用于若是,确定所述对象处于未运动状态。
结合第二方面,在第二方面的第一种可能的实现方式中,所述处理模块,还用于从所述第一帧图像中确定出所述对象的轮廓;确定出所述轮廓上的水平方向上最远的两个点连接的第一长度,以及确定出所述轮廓上的竖直方向上最远的两个点连接的第二长度;确定出所述第一框的与所述第一长度相同的第一边长,以及确定出所述第一框的与所述第二长度相同的第二边长;根据所述轮廓在所述第一帧图像中的位置,以及根据所述第一边长和所述第二边长,生成框选住所述轮廓且为矩形的所述第一框。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述判断模块,还用于获得所述第一框上第一顶点的第一坐标,并获得所述第二框上与所述第一顶点对应的第二顶点的第二坐标;判断所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长是否均匹配,其中,所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长均匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
结合第二方面,在第二方面的第三种可能的实现方式中,所述判断模块,还用于判断所述第一框的中心点坐标和所述第二框的中心点坐标在同一参考坐标系中是否匹配,其中,所述第一框的中心点坐标和所述第二框的中心点坐标在所述同一参考坐标系中匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
结合第二方面,在第二方面的第四种可能的实现方式中,在确定所述第一框在所述第一帧图像中的位置与包含所述对象的第二框在第二帧图像中的位置匹配之后,以及在确定所述对象处于未运动状态之前,所述装置还包括:扩展判断模块,用于获得匹配总次数,其中,预设时长内多帧图像中两帧图像匹配成功标记一次,所述预设时长内所有匹配成功的次数之和为所述匹配总次数,所述两帧图像匹配成功表示所述两帧图像中两个框的位置匹配;将所述匹配总次数加一获得更新的所述匹配总次数,并判断更新的所述匹配总次数是否达到阈值次数;若是,确定所述对象处于未运动状态。
第三方面,本申请实施例提供了一种具有处理器可执行的非易失程序代码的计算机可读储存介质,用于存储程序代码,所述程序代码在被计算机读取并运行时,执行第一方面或第一方面的任一可选的实现方式所述的对象识别方法。
第四方面,本申请实施例提供了一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,执行第一方面或第一方面的任一可能的实现方式所述的对象识别方法。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1示出了本申请第一实施例提供的第一种电子设备的结构框图;
图2示出了本申请第一实施例提供的第二种电子设备的结构框图;
图3示出了本申请第二实施例提供的一种对象识别方法的流程图;
图4示出了本申请第二实施例提供的一种对象识别方法中步骤S200的子流程图;
图5示出了本申请第二实施例提供的第一帧图像的结构框图;
图6示出了本申请第二实施例提供的第一帧图像生成第一框的结构框图;
图7示出了本申请第二实施例提供的第二帧图像生成第二框的结构框图;
图8示出了本申请第三实施例提供的一种对象识别装置的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一实施例
本申请实施例提供了一种电子设备10,电子设备10可以为服务器,也可以为终端。当电子设备10为服务器时,例如可以为网络服务器、数据库服务器、云服务器或由多个子服务器构成的服务器集成等;或者,当电子设备10为终端时,例如可以为个人电脑(personalcomputer,PC)、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)等。当然,上述列举的设备为用于便于理解本实施例,其不应作为对本实施例的限定。
请参阅图1,在本实施例中,电子设备10为服务器或者无摄像模块的终端时可以包括:存储器11、通信接口12、总线13和处理器14。其中,处理器14、通信接口12和存储器11通过总线13连接。这种情况下,电子设备10可以通过与外部的摄像机、摄像头、进行有线或者无线的连接,获得视频流,也可以通过从其他渠道获得视频流,例如通过网络下载获得视频流等,此处不作限定。
处理器14用于执行存储器11中存储的可执行模块,例如计算机程序。图1所示的电子设备10的组件和结构只是示例性的,而非限制性的,根据需要,电子设备10也可以具有其他组件和结构。
存储器11可能包含高速随机存取存储器(Random Access MemoryRAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少两个磁盘存储器。本实施例中,存储器11存储了执行对象识别方法所需要的程序。
总线13可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类别的总线。
处理器14可能是一种具有信号的处理能力集成电路芯片。在实现过程中,上述方法的各步骤可以通过处理器14中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器14可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门电路或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。
本申请任意实施例揭示的流过程或定义的装置所执行的方法可以应用于处理器14中,或者由处理器14实现。处理器14在接收到执行指令后,通过总线13调用存储在存储器11中的程序后,处理器14通过总线13控制通信接口12则可以执行对象识别方法的流程。
请参阅图2,在本实施例中,电子设备10为具有摄像模块的终端或者摄像装置本身。具有摄像模块的终端可以为包括附带摄像功能的智能手机、平板电脑、个人电脑等;摄像装置例如摄像机、网络摄像机等。这种情况下,电子设备10可以包括:存储器15、通信接口16、总线17、处理器18和摄像模块19。其中,摄像模块19、处理器18、通信接口16和存储器15通过总线17连接。
由于本实施例中前面已经介绍过与存储器15、通信接口16、总线17、处理器18类似的内容,此处就不再赘述。
摄像模块15可以是网络摄像模组、高清摄像模组等,只需能够摄像并与处理器18、通信接口16和存储器15通过总线17通信连接,执行本申请提供的对象识别方法就行,此处不作具体限定。
第二实施例
在本实施例提供的对象识别方法中,对象识别方法应用于电子设备,可以从电子设备的角度进行描述。以下,将结合图3-图4对本申请实施例中的对象识别方法的各个步骤进行详细的描述。
在本实施例中,电子设备可以获得视频流,视频流可以是已经存在的视频流,也可以是实时的视频流。在电子设备具有内置的摄像模块时,可以利用内置的摄像模块,实时获得视频流;电子设备也可以与外部的摄像模块进行通信连接,实时获得摄像模块拍摄的视频流。通过获得已经存在的视频流,即非实时视频流,可以使数据的来源不受限制,应用更广泛;而通过获得实时的视频流,则能够实现实时监测的功能,具有极强的实时性。
在本实施例中,由于从视频流中抽取出多帧图像,电子设备对多帧图像中的每一帧图像的处理过程是类似的,因此,本实施例将从对其中某一帧图像的处理进行说明;而对方案的描述是针对判断过程中对AB两帧图像的判断进行说明,但判断包含多次对两帧图像的判断,因此不应认为本申请实施例提供的对象识别方法只能对一帧图像进行处理,或者只能对两帧图像进行判断。
请参阅图3,图3为本实施例提供的对象识别方法的流程图。在本实施例提供的对象识别方法中,可以包括:步骤S100、步骤S200、步骤S300和步骤S400。
步骤S100:获得包含对象的第一帧图像。
步骤S200:在所述第一帧图像中确定出包含所述对象的第一框。
步骤S300:判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配。
步骤S400:若是,确定所述对象处于未运动状态。
在执行步骤S100之前,电子设备可以对获得的视频流进行处理,抽取视频流中的图像,作为对象识别的图像的来源。在本实施例中,可以从视频流中的每一帧图像进行对象识别,也可以选择性从等数量的多帧图像中抽取某一帧图像作为对象识别的图像,此处不作限定。对每一帧图像都进行对象识别,优点是几乎不会遗漏重要信息;而选择性抽帧并对图像进行对象识别,可以在保证准确率和低遗漏的情况下,提高对象识别的效率。例如,可以每5-10帧图像抽一帧图像,作为对象识别的图像,这样可以在保证准确率和极低的遗漏率的情况下,极大地提高对象识别的处理速度,进而提高对象识别的效率。
在本实施例中,可以对获得的图像逐一处理,即根据获得该帧图像的时间,先获得的先处理,这样能够使得识别的过程具有时间上的先后顺序,更接近现实的情况。当然,也可以采用其他的方式进行处理,例如,将图像按照某一预设时长进行分类,例如将每3秒获得的所有图像都归于同一时段的图像,对该时段的图像进行处理时,就可以按照所包含的对象来进行归类处理,因此,此处不应视为对本申请的限定。
在本实施例中,电子设备可以执行步骤S100,即电子设备获得包含对象的第一帧图像,需要说明的是,此处所指的第一帧图像,是指当前的图像,而非按照时间顺序上的第一帧图像。
在电子设备获得包含对象的第一帧图像后,可以执行步骤S200。请参阅图4,在本实施例中,步骤S200可以包括:步骤S210和步骤S220。
步骤S210:从所述第一帧图像中确定出所述对象的轮廓。
步骤S220:根据所述轮廓,在所述第一帧图像中生成框选住所述轮廓且为规则图形的第一框。
在电子设备获得包含对象的第一帧图像后,可以执行步骤S210。
电子设备可以对获得的第一帧图像进行处理,在本实施例中,电子设备可以将第一帧图像与预设的背景图像进行差分处理,即根据第一帧图像与背景图像的不同,确定出第一帧图像中的对象。需要说明的是,预设的背景图像可以是预先确定的背景图像,也可以是通过对大量的该场景的图像进行处理和分析后得到的背景图像,此处不作为对本申请的限定。利用预先确定的背景图像作为预设的背景图像,可以使背景图像具有极高的准确性;而利用对大量的该场景的图像进行处理和分析后得到的背景图像作为预设的背景图像,可以使得背景图像得到更新,具有更高的实时性。
在电子设备通过对第一帧图像与预设的背景图像进行处理而确定出第一帧图像中包含的对象后,可以执行步骤S210。在本实施例中,电子设备可以对确定出对象的第一帧图像进行二值化处理,从而在第一帧图像中确定出对象的轮廓。通过二值化处理,可以使对象的轮廓确定得更加准确,从而提高识别的准确性。
在电子设备确定出对象的轮廓后,可以执行步骤S220。
在本实施例中,电子设备可以对确定出对象的轮廓后的第一帧图像进行处理,从轮廓上的所有点中确定出水平方向上最远的两个点连接的第一长度,作为生成的包含对象轮廓的第一框的第一边长;以及从轮廓上的所有点中确定出竖直方向上最远的两个点连接的第二长度,作为生成的包含对象轮廓的第一框的第二边长;在确定第一框的第一边长和第二边长后,电子设备就可以根据对象轮廓、第一边长以及第二边长,生成框选出对象轮廓的第一框。例如,在第一边长的两个端点上分别作竖直方向上的直线,以及在第二边长的两个端点上分别作水平方向上的直线;将水平方向上和竖直方向上的共四条直线确定出来的封闭的矩形作为第一框。通过生成框选对象轮廓的矩形作为第一框,能够使得对象的轮廓所占的范围得到准确地确定,从而提高对象识别的准确率,而生成包含对象轮廓的矩形作为第一框,也非常简洁,可以提高在第一帧图像中确定出包含对象轮廓的第一框的效率。
需要说明的是,此处生成的矩形作为第一框,只是其中的一种方式,在其他一些可选的实现方式中,还可以生成包含对象轮廓的圆、正六边形、梯形、平行四边形等。例如,电子设备可以从对象轮廓上的所有点中确定出距离最远的两个点,确定出这两个点之间的距离,并确定出这两点之间的中点,将中点作为圆心,两点之间的距离作为直径,从而生成包含对象轮廓的圆作为第一框。因此,只需要生成包含对象的规则图形作为第一框即可,此处不应视为对本申请的限定。通过生成包含对象轮廓的圆作为第一框,可以简化生成第一框的一些程序,从而提高在第一帧图像中确定出第一框的效率。
在电子设备生成框选住对象轮廓且为规则图形的第一框后,可以执行步骤S300。
在本实施例中,电子设备可以确定出第一框的中心点坐标,以及确定出第二框的中心点坐标,将第一框的中心点坐标和第二框的中心点坐标放在同一参考坐标系中,判断两个坐标的差异是否在预设的范围内,从而确定第一框和第二框的位置是否匹配。电子设备也可以通过根据对象的中心点或顶点,结合第一框的一些图形特征,来确定出第一框在第一帧图像中的位置,此处不作限定。通过根据第一框的中心点坐标与第二框的中心点坐标来确定第一框在第一帧图像中的位置和第二框在第二帧图像中的位置是否匹配,可以大大地简化匹配时的计算量,提高匹配效率,从而提升对象识别的效率。
例如,在第一框和第二框为矩形时,电子设备可以获得第一框上第一顶点的第一坐标,此处第一坐标可以是矩形的四个顶点中的任意一个顶点的坐标,还获得第一框的相互垂直的两条边的长度,即第一边长和第二边长;以及,电子设备可以获得第二框上与第一框上的第一顶点对应的第二顶点的第二坐标,还获得与第一框的第一边长对应的第三边长、与第一框的第二边长对应的第二框的第四边长;电子设备在确定出第一坐标和第二坐标、第一边长和第三边长、第二边长和第四边长后,可以将其对应进行比较,判断第一坐标和第二坐标、第一边长和第三边长、第二边长和第四边长是否均匹配,从而确定出第一框和第二框的位置是否匹配。通过将矩形第一框的一个顶点、两条边长与矩形第二框的对应顶点和两条对应边长进行匹配,可以提高匹配的准确率,同时,由于匹配的要素只有三个,简化了计算量,提高了匹配的速度,从而提升对象识别的效率。
而第一框和第二框为圆时,可以确定圆形第一框的第一圆心和第一半径,以及确定圆形第二框的第二圆心和第二半径,将第一圆心和第二圆心、第一半径和第二半径进行匹配,确定两者是否均匹配。通过对圆形的第一框和第二框进行匹配,可以在保证准确率的情况下,提升匹配的处理速度,从而提高对象是别的效率。
需要说明的是,第一框和第二框还可以为其他规则形状,例如三角形、正六边形等规则图形,在第一框和第二框为其他规则图形时,也能够提高匹配的效率,从而提升对象识别的效率。因此,第一框和第二框的具体形状不应视为对本申请的限定。
对于第一框和第二框匹配的标准,可以存在一定范围的误差,例如,利用中心点坐标进行匹配时,若两个中心点坐标的距离差异在预设范围内,则可以判定第一框与第二框匹配,若两个中心点坐标的距离差异超出了预设范围,则可以判定第一框与第二框不匹配。类似的,在第一框与第二框为矩形或者圆形以及其他规则形状时,对于点坐标的判断,可以根据第一框的第一点和第二框的与第一点对应的第二点之间的距离是否在预设范围内判断第一点于第二点是否匹配;对于边长、半径或其他长度的判断,可以判断长度的差异值或者差异百分比是否在预设范围内,确定边长、半径或者其他长度是否匹配;在第一框与第二框的各项均匹配时,可以确定第一框在第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
在电子设备确定第一框在第一帧图像中的位置与第二框在第二帧图像中的位置匹配后,可以获得匹配总次数。需要说明的是,预设时长内多帧图像中两帧图像匹配成功标记一次,而预设时长内所有匹配成功的次数之和为匹配总次数,两帧图像匹配成功可以表示为两帧图像中两个框的位置匹配。
在本实施例中,在电子设备获得匹配的总次数后,可以将匹配总次数加一获得更新后的匹配总次数,以此判断更新后的匹配总次数是否达到阈值次数,在匹配总次数达到阈值次数后,可以执行步骤S400,即确定该对象处于未运动状态。例如,电子设备获得匹配的总次数为3,加上当前的一次匹配成功,即得到更新后的匹配总次数为4,将更新后的匹配总次数与阈值次数4次进行比较,判断更新后的匹配总次数已经达到阈值次数,可以将第一框框选的图像轮廓对应的对象确定处于未运动状态。需要说明的是,此处所列举的阈值次数只是举例所用的,还可以为3次、10次、20次等,此处不应视为对本申请的限定。
通过在确定第一框在第一帧图像中的位置与第二框在第二帧图像中的位置匹配成功后,判断匹配成功的次数是否达到阈值次数,进而判断该图像中的对象是否处于未运动状态,可以减少很多由偶然因素造成的匹配成功,从而提高对象识别的准确率。
另外,需要说明的是,在本实施例中,在对抽帧出来的多帧图像的处理中,对每一帧图像生成的框是同一种图形,例如,对一条视频流进行每5帧图像抽一帧图像,得到20帧图像,在对这20帧图像中每一帧图像的处理中,全部都是生成矩形或者全部都是生成圆形的框,以便于对对象的位置的准确判断,尽量减少因不同形状的框而带来的对框选住的对象的位置的判断误差。但并不意味着不能采用前后不同的框,在本申请的其他一些可选的实施例中,对第一帧图像进行处理后,生成了矩形的第一框,而第二帧图像中框选对象轮廓的第二框为圆形,此时,可以判断第一框的中心点坐标和第二框的中心点坐标是否匹配,进而判断两个框的位置是否匹配。因此,此处不应视为对本申请的限定。
以下,将结合一个具体的例子,对本申请实施例提供的对象识别方法进行描述。
请参阅图5-图7,在本例子中,首先,电子设备10可以从视频流中抽取出当前需要处理的包含对象的第一帧图像P100。电子设备获得第一帧图像P100后,可以对第一帧图像P100进行处理,例如利用背景差分法确定出第一帧图像P100中包含的对象,再对确定出对象的第一帧图像P100进行二值化处理,确定出对象的轮廓。在确定出第一帧图像P100中的对象的轮廓后,电子设备10可以根据对象的轮廓生成框选住对象轮廓的矩形的第一框T1。电子设备10可以确定出第一框T1的第一顶点在参考坐标系中的坐标(x1,y1),以及第一框T1的第一边长a1和第二边长b1。然后,电子设备可以获得前一次处理的第二帧图像P200,以及确定出第二帧图像P200中第二框T2上的与第一顶点对应的第二顶点在参考坐标系中的坐标(x2,y2),以及第二框T2的第三边长a2和第四边长b2。
在确定出第一框的第一顶点坐标(x1,y1)、第一边长a1和第二边长b1,以及确定出第二框的第二顶点坐标(x2,y2)、第三边长a2和第四边长b2后,电子设备10可以计算第一顶点(x1,y1)和第二顶点(x2,y2)的距离,判断该距离是否在预设误差距离范围内,若是,则可以确定第一顶点(x1,y1)和第二顶点(x2,y2)匹配。电子设备10还比较第一边长a1和第三边长a2的长度,判断两者的长度误差是否在预设误差长度范围内,若是,可以确定第一边长a1和第三边长a2匹配。电子设备10还要比较第二边长b1和第四边长b2的长度,判断两者的长度误差是否在预设误差长度范围内,若是,可以确定第二边长b1和第四边长b2匹配。在第一顶点(x1,y1)和第二顶点(x2,y2)、第一边长a1和第三边长a2、第二边长b1和第四边长b2均为匹配的时候,电子设备可以确定第一框T1在第一帧图像P100中的位置与第二框T2在第二帧图像P200中的位置匹配。
电子设备确定第一框T1在第一帧图像P100中的位置与第二框T2在第二帧图像P200中的位置匹配后,还可以获得两帧图像中的对应该对象的两个框的位置匹配成功的总次数,将其加1,判断是否达到阈值次数,若是,电子设备就可以确定该对象处于未运动状态了。
需要说明的是,此处举例说明的对象识别方法的过程,只是为了方便说明,不应视为对本申请的限定。
第三实施例
请参阅图8,图8为本申请提供的一种对象识别装置100的结构框图。
本申请的实施例提供了一种对象识别装置100,包括:获得模块110,用于获得包含对象的第一帧图像;处理模块120,用于在所述第一帧图像中确定出包含所述对象的第一框;判断模块130,用于判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;确定模块140,用于若是,确定所述对象处于未运动状态。
在本实施例中,所述处理模块120,还用于从所述第一帧图像中确定出所述对象的轮廓;确定出所述轮廓上的水平方向上最远的两个点连接的第一长度,以及确定出所述轮廓上的竖直方向上最远的两个点连接的第二长度;确定出所述第一框的与所述第一长度相同的第一边长,以及确定出所述第一框的与所述第二长度相同的第二边长;根据所述轮廓在所述第一帧图像中的位置,以及根据所述第一边长和所述第二边长,生成框选住所述轮廓且为矩形的所述第一框。
在本实施例中,所述判断模块130,还用于获得所述第一框上第一顶点的第一坐标,并获得所述第二框上与所述第一顶点对应的第二顶点的第二坐标;判断所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长是否均匹配,其中,所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长均匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
在本实施例中,所述判断模块130,还用于判断所述第一框的中心点坐标和所述第二框的中心点坐标在同一参考坐标系中是否匹配,其中,所述第一框的中心点坐标和所述第二框的中心点坐标在所述同一参考坐标系中匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
在本实施例中,在确定所述第一框在所述第一帧图像中的位置与包含所述对象的第二框在第二帧图像中的位置匹配之后,以及在确定所述对象处于未运动状态之前,所述对象识别装置100还包括:扩展判断模块,用于获得匹配总次数,其中,预设时长内多帧图像中两帧图像匹配成功标记一次,所述预设时长内所有匹配成功的次数之和为所述匹配总次数,所述两帧图像匹配成功表示所述两帧图像中两个框的位置匹配;将所述匹配总次数加一获得更新的所述匹配总次数,并判断更新的所述匹配总次数是否达到阈值次数;若是,确定所述对象处于未运动状态。
综上所述,本申请的实施例提供了一种对象识别方法及装置,方法包括:获得包含对象的第一帧图像;在所述第一帧图像中确定出包含所述对象的第一框;判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;若是,确定所述对象处于未运动状态。
在第一帧图像中确定出包含对象的第一框,将第一框在第一帧图像中的位置与第二框在第二帧图像中的位置进行匹配,以此判断对象是否处于未运动状态,通过判断两个框的位置是否变化来判断对象是否处于未运动状态,能够减少计算量,从而提升处理速度,且具有较高的识别的准确率,因此能够提升对象识别的效率。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (4)
1.一种对象识别方法,其特征在于,包括:
获得包含对象的第一帧图像;
在所述第一帧图像中确定出包含所述对象的第一框;
判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;
若是,确定所述对象处于未运动状态;
其中,判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配的方式,包括:
判断所述第一框的中心点坐标和所述第二框的中心点坐标在同一参考坐标系中是否匹配,其中,所述第一框的中心点坐标和所述第二框的中心点坐标在所述同一参考坐标系中匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配;或者,根据所述对象的中心点或顶点,结合所述第一框的图形特征,确定出所述第一框在所述第一帧图像中的位置,实现对所述第一框在所述第一帧图像中的位置与所述第二框在所述第二帧图像中的位置匹配,其中,所述图形特征包括顶点和/或边长,或者包括半径和圆心;
其中,所述在所述第一帧图像中确定出包含所述对象的第一框,包括:
从所述第一帧图像中确定出所述对象的轮廓;
根据所述轮廓,在所述第一帧图像中生成框选住所述轮廓且为规则图形的第一框;
其中,所述根据所述轮廓,在所述第一帧图像中生成框选住所述轮廓且为规则图形的第一框,包括:
确定出所述轮廓上的水平方向上最远的两个点连接的第一长度,以及确定出所述轮廓上的竖直方向上最远的两个点连接的第二长度;
确定出所述第一框的与所述第一长度相同的第一边长,以及确定出所述第一框的与所述第二长度相同的第二边长;
根据所述轮廓在所述第一帧图像中的位置,以及根据所述第一边长和所述第二边长,生成框选住所述轮廓且为矩形的所述第一框;
其中,所述判断所述第一框在所述第一帧图像中的位置是否与第二框在第二帧图像中的位置匹配,包括:
获得所述第一框上第一顶点的第一坐标,并获得所述第二框上与所述第一顶点对应的第二顶点的第二坐标;
判断所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长是否均匹配,其中,所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长均匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
2.根据权利要求1所述的对象识别方法,其特征在于,在确定所述第一框在所述第一帧图像中的位置与包含所述对象的第二框在第二帧图像中的位置匹配之后,以及在确定所述对象处于未运动状态之前,所述方法还包括:
获得匹配总次数,其中,预设时长内多帧图像中两帧图像匹配成功标记一次,所述预设时长内所有匹配成功的次数之和为所述匹配总次数,所述两帧图像匹配成功表示所述两帧图像中两个框的位置匹配;
将所述匹配总次数加一获得更新的所述匹配总次数,并判断更新的所述匹配总次数是否达到阈值次数;
若是,执行步骤:确定所述对象处于未运动状态。
3.一种对象识别装置,其特征在于,包括:
获得模块,用于获得包含对象的第一帧图像;
处理模块,用于在所述第一帧图像中确定出包含所述对象的第一框;
判断模块,用于判断所述第一框在所述第一帧图像中的位置是否与包含所述对象的第二框在第二帧图像中的位置匹配;
确定模块,用于若是,确定所述对象处于未运动状态;
其中,所述判断模块,还用于:
判断所述第一框的中心点坐标和所述第二框的中心点坐标在同一参考坐标系中是否匹配,其中,所述第一框的中心点坐标和所述第二框的中心点坐标在所述同一参考坐标系中匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配;或者,根据所述对象的中心点或顶点,结合所述第一框的图形特征,确定出所述第一框在所述第一帧图像中的位置,实现对所述第一框在所述第一帧图像中的位置与所述第二框在所述第二帧图像中的位置匹配,其中,所述图形特征包括顶点和/或边长,或者包括半径和圆心;
其中,所述处理模块,还用于从所述第一帧图像中确定出所述对象的轮廓;确定出所述轮廓上的水平方向上最远的两个点连接的第一长度,以及确定出所述轮廓上的竖直方向上最远的两个点连接的第二长度;确定出所述第一框的与所述第一长度相同的第一边长,以及确定出所述第一框的与所述第二长度相同的第二边长;根据所述轮廓在所述第一帧图像中的位置,以及根据所述第一边长和所述第二边长,生成框选住所述轮廓且为矩形的所述第一框;
其中,所述判断模块,还用于获得所述第一框上第一顶点的第一坐标,并获得所述第二框上与所述第一顶点对应的第二顶点的第二坐标;判断所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长是否均匹配,其中,所述第一坐标和所述第二坐标、所述第一边长和所述第二框上与所述第一边长对应的第三边长、所述第二边长和所述第二框上与所述第二边长对应的第四边长均匹配表示所述第一框在所述第一帧图像中的位置与第二框在第二帧图像中的位置匹配。
4.根据权利要求3所述的对象识别装置,其特征在于,在确定所述第一框在所述第一帧图像中的位置与包含所述对象的第二框在第二帧图像中的位置匹配之后,以及在确定所述对象处于未运动状态之前,所述装置还包括:
扩展判断模块,用于获得匹配总次数,其中,预设时长内多帧图像中两帧图像匹配成功标记一次,所述预设时长内所有匹配成功的次数之和为所述匹配总次数,所述两帧图像匹配成功表示所述两帧图像中两个框的位置匹配;将所述匹配总次数加一获得更新的所述匹配总次数,并判断更新的所述匹配总次数是否达到阈值次数;若是,确定所述对象处于未运动状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910061163.3A CN109766953B (zh) | 2019-01-22 | 2019-01-22 | 对象识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910061163.3A CN109766953B (zh) | 2019-01-22 | 2019-01-22 | 对象识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109766953A CN109766953A (zh) | 2019-05-17 |
CN109766953B true CN109766953B (zh) | 2021-07-13 |
Family
ID=66454186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910061163.3A Active CN109766953B (zh) | 2019-01-22 | 2019-01-22 | 对象识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766953B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112206508A (zh) * | 2020-09-25 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 一种图像检测方法、装置及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101633356A (zh) * | 2008-07-25 | 2010-01-27 | 通用汽车环球科技运作公司 | 检测行人的系统及方法 |
CN102034112A (zh) * | 2010-12-17 | 2011-04-27 | 浙江大学 | 一种相控阵三维声学摄像声纳动静目标识别方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0154654B1 (ko) * | 1995-04-29 | 1998-11-16 | 배순훈 | 영상의 움직임검출에 의한 의사스테레오재생장치 |
FR2800972B1 (fr) * | 1999-11-16 | 2002-02-08 | Mouret Thierry Ets | Dispositif de fauchage des vegetaux |
US20120154633A1 (en) * | 2009-12-04 | 2012-06-21 | Rodriguez Tony F | Linked Data Methods and Systems |
CN102467742B (zh) * | 2010-10-29 | 2013-11-06 | 华晶科技股份有限公司 | 对象追踪方法 |
CN103226834B (zh) * | 2013-03-26 | 2015-10-21 | 长安大学 | 一种图像运动目标特征点快速搜索方法 |
CN105571583B (zh) * | 2014-10-16 | 2020-02-21 | 华为技术有限公司 | 一种用户位置定位方法以及服务器 |
WO2017200899A1 (en) * | 2016-05-16 | 2017-11-23 | Acist Medical Systems, Inc. | Motion-based image segmentation systems and methods |
CN107424172B (zh) * | 2017-07-24 | 2020-09-25 | 福建师范大学 | 基于前景判别和圆形搜索方法的运动目标跟踪方法 |
CN108829232B (zh) * | 2018-04-26 | 2021-07-23 | 深圳市同维通信技术有限公司 | 基于深度学习的人体骨骼关节点三维坐标的获取方法 |
-
2019
- 2019-01-22 CN CN201910061163.3A patent/CN109766953B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101633356A (zh) * | 2008-07-25 | 2010-01-27 | 通用汽车环球科技运作公司 | 检测行人的系统及方法 |
CN102034112A (zh) * | 2010-12-17 | 2011-04-27 | 浙江大学 | 一种相控阵三维声学摄像声纳动静目标识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109766953A (zh) | 2019-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409277B (zh) | 手势识别方法、装置、智能终端及计算机存储介质 | |
CN108875731B (zh) | 目标识别方法、装置、系统及存储介质 | |
CN107633526B (zh) | 一种图像跟踪点获取方法及设备、存储介质 | |
CN108875534B (zh) | 人脸识别的方法、装置、系统及计算机存储介质 | |
US20170103258A1 (en) | Object detection method and object detection apparatus | |
US9773192B2 (en) | Fast template-based tracking | |
CN107886026B (zh) | 图形码处理方法及装置 | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
EP3812956A1 (en) | Comparison method based on multiple facial images, apparatus and electronic device | |
CN109598744A (zh) | 一种视频跟踪的方法、装置、设备和存储介质 | |
CN113496208B (zh) | 视频的场景分类方法及装置、存储介质、终端 | |
CN110245643B (zh) | 目标跟踪拍摄方法、装置、电子设备 | |
CN112199268A (zh) | 一种软件兼容性测试方法及电子设备 | |
CN109766953B (zh) | 对象识别方法及装置 | |
CN115278089A (zh) | 人脸模糊图像对焦矫正方法、装置、设备和存储介质 | |
CN110298302A (zh) | 一种人体目标检测方法及相关设备 | |
CN111415371A (zh) | 一种稀疏光流确定方法和装置 | |
CN111340788B (zh) | 硬件木马版图检测方法、装置、电子设备和可读存储介质 | |
CN112579810B (zh) | 印刷电路板分类方法、装置、计算机设备和存储介质 | |
CN117057376A (zh) | 一种获得目标定位框的方法、装置、设备及介质 | |
EP3709666A1 (en) | Method for fitting target object in video frame, system, and device | |
CN116052038A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN112580638B (zh) | 文本检测方法、装置、存储介质及电子设备 | |
CN115272682A (zh) | 目标对象检测方法、目标检测模型的训练方法及电子设备 | |
CN115239612A (zh) | 电路板定位方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |