CN111368784A - 一种目标识别方法、装置、计算机设备和存储介质 - Google Patents
一种目标识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111368784A CN111368784A CN202010183651.4A CN202010183651A CN111368784A CN 111368784 A CN111368784 A CN 111368784A CN 202010183651 A CN202010183651 A CN 202010183651A CN 111368784 A CN111368784 A CN 111368784A
- Authority
- CN
- China
- Prior art keywords
- target
- target frame
- frame
- identified
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 80
- 238000012549 training Methods 0.000 claims description 40
- 238000002372 labelling Methods 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种目标识别方法、装置、计算机设备和存储介质。该方法包括:获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标中心的方向向量;根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。本发明实施例的技术方案,可以实现准确、迅速以及全面的识别待识别图像中的目标及其属性。
Description
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种目标识别方法、装置、计算机设备和存储介质。
背景技术
随着图像处理技术的发展,根据拍摄到的图像识别图像中的目标及其属性,可以适用于多个领域。例如,在自动驾驶技术中,通过交通道路图像识别车辆周围的车灯信号,来预测其他车辆的行为,对于自动驾驶车辆的决策规划具有重要意义。
现有技术中主要通过训练神经网络模型,对待识别图像进行目标识别和属性识别。发明人在实现本发明的过程中,发现现有技术存在以下缺陷:训练神经网络模型时依赖于人工对待识别图像中的目标及其属性进行标注,人工成本高,效率低,准确率低。
发明内容
本发明实施例提供一种目标识别方法、装置、计算机设备和存储介质,以实现准确、迅速以及全面的识别待识别图像中的目标及其属性。
第一方面,本发明实施例提供了一种目标识别方法,该方法包括:
获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量;
根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
第二方面,本发明实施例还提供了一种目标识别装置,该装置包括:
第一目标框识别结果获取模块,用于获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标中心的方向向量;
第一目标框分配模块,用于根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
第一目标位置属性识别模块,用于对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
第三方面,本发明实施例还提供了一种计算机设备,包括一个或多个处理器,存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的目标识别方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的目标识别方法。
本发明实施例通过根据待识别图片获取第一目标框、第一目标框指向第二目标中心的方向向量以及第二目标框,将各第一目标框分配到匹配的第二目标框中,对第二目标框分配的各第一目标框进行位置属性识别。解决了现有技术中通过神经网络模型识别目标属性时,训练神经网络模型需要依赖人工标注目标及其属性,人工成本高以及目标识别错误率较高的问题,实现了准确、迅速和全面的识别待识别图像中的目标及其属性的效果,提高了识别结果的准确度。
附图说明
图1a是本发明实施例一中的一种目标识别方法的流程图;
图1b是适用于本发明实施例中的车灯框识别结果的示意图;
图2a是本发明实施例二中的一种目标识别方法的流程图;
图2b是适用于本发明实施例中的分配第一目标框的示意图;
图2c是适用于本发明实施例中的对车灯及其属性进行标注的方法的流程图;
图3是本发明实施例三中的一种目标识别装置的结构示意图;
图4是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1a是本发明实施例一提供的一种目标识别方法的流程图,本实施例可适用于对交通道路图像进行目标及其属性的识别的情况,该方法可以由目标识别装置来执行,该装置可以由软件和/或硬件来实现,并一般集成在具有图像处理功能的终端或者服务器中。
如图1a所示,本发明实施例的技术方案,具体包括如下步骤:
S110、获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量。
其中,待识别图片可以为需要对目标及其属性进行识别的图片。第一目标框可以为在待识别图片中识别出来的第一目标的轮廓框,第二目标框中包含若干第一目标框。第一目标框指向所在第二目标中心的方向向量可以为,以第一目标框中心为起点,以第二目标中心为终点构造的向量。
示例性的,待识别图片可以为道路交通图片,第一目标可以为车灯,第二目标可以为车身。本发明实施例可以用于识别道路交通图片中的车灯及其属性。
示例性的,待识别图片还可以为人体图片,第一目标可以为人体器官,第二目标可以为人体。本发明实施例可以用于识别人体图片中的人体器官以及其属性。
本发明实施例对待识别图片、第一目标以及第二目标的类型不进行限制,只要第一目标和第二目标之间为包含关系,都在本发明技术方案中目标识别的保护范围之内。
在本发明实施例中,第一目标框识别结果中还可以包括:各所述第一目标框的识别置信度、前后属性,当第一目标为车灯,第二目标为车身时,第一目标框识别结果中还可以包括各所述第一目标框的亮灭属性。
其中,第一目标框的识别置信度可以用来表示第一目标框的真实度,前后属性可以用来表示第一目标框对应的第一目标是位于第二目标前还是第二目标之后,当第一目标是车灯时,亮灭属性可以用来表示第一目标框对应的第一目标的状态是熄灭还是点亮。
示例性的,图1b提供了一种车灯识别结果的示意图,图1b中包含若干车灯框,其中,每个车灯框都标明了指向车中心的方向向量,以及车灯的前后属性和亮灭属性。
在本发明一个可选的实施例中,在待识别图片中获取第一目标框识别结果,可以包括:将所述待识别图片输入至预先训练的目标识别模型中,获取所述第一目标框识别结果;其中,所述目标识别模型通过第一数量的训练样本训练得到,且所述第一数量小于训练标准目标识别模型所需的样本数量值;
其中,训练样本可以为若干图像,图像中标注了第一目标框、第一目标的前后属性以及第一目标框指向第二目标中心的方向向量,当第一目标为车灯,第二目标为车身时,图像中还可以标注第一目标的亮灭属性。目标识别模型可以为根据若干数量较少的训练样本预先训练得到,对目标识别模型进行预先训练的训练样本中,可以通过人工对目标及其属性进行标注,也可以通过图像识别技术,对目标及其属性进行识别。本发明实施例对预先训练的目标识别模型的训练样本的标注方式不进行限制。
S120、根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中。
其中,可以通过将待识别图片输入至预先训练的第二目标识别模型中,得到第二目标框,也可以对待识别图片中的第二目标框预先进行标注,或者通过图像识别技术,对待识别图片中的第二目标框进行识别。本实施例对获取第二目标框的方式和具体过程不进行限制。
在本发明实施例中,通过目标识别模型获取待识别图片中的第一目标框,以及第一目标框对应的方向向量、识别置信度和各项属性。同时识别待识别图片中的第二目标框,将各第一目标框分配至与之匹配的第二目标框中。可以将第一目标框分配至完全覆盖其区域的第二目标框中,也可以基于方向向量,寻找第一目标框指向第二目标框的方向向量与第一目标框指向第二目标中心的方向向量的向量内积最大的第二目标框。本实施例对分配第一目标框的方式不进行限制。
S130、对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
其中,位置属性可以包括第一目标的前后属性和左右属性。
在本发明实施例中,将各第一目标框分配至与之匹配的第二目标框中之后,每个第二目标框包括至少一个第一目标框,对同个第二目标框中的各个第一目标框进行位置属性识别。
在本发明一个可选的实施例中,在对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别之后,还可以包括:在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注,当第一目标为车灯,第二目标为车身时,还可以在所述待识别图片中,对所述第一目标框的亮灭属性进行标注。
在本发明实施例中,对于待识别图片中的各第二目标框,对每个第二目标框中的第一目标框进行位置属性识别之后,将保留的所有第一目标框、各第一目标框指向第二目标中心的方向向量以及各第一目标框的位置属性进行标注。这样设置的好处在于,可以将标注后的待识别图片用于训练目标识别模型,以提高模型的性能。
在本发明一个可选的实施例中,在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注,以及对所述第一目标框的亮灭属性进行标注之后,还可以包括:将标注后的所述待识别图片发送至标注结果验证平台中,并将所述标注结果验证平台反馈的确认验证图片,作为新的训练样本对所述目标识别模型进行继续训练。在本发明实施例中,对目标图像进行标注之后,可以对标注结果进行准确性的验证,如果标注结果准确,则将标注后的待识别图片作为新的训练样本,继续训练目标识别模型。这样设置的好处在于,提高标注结果的准确性,以保证目标识别模型的训练效果。
示例性的,可以人工判断标注结果的准确性,如果标注正确,则可以节省对待识别图片进行人工标注的成本,如果标注不正确,可以对标注结果进行修正,在提高标注结果的准确性的同时,也最大程度的降到了人工标注的工作量。随着目标识别模型的不断训练和优化,标注正确的概率不断提高,可以节省大量对训练样本进行人工标注的时间,提高了目标识别模型的训练效率。最终训练完成得到的目标识别模型可以准确、快速的识别图像中的目标及其属性。
本实施例的技术方案,通过根据待识别图片获取第一目标框、第一目标框指向第二目标中心的方向向量以及第二目标框,将各第一目标框分配到匹配的第二目标框中,对第二目标框分配的各第一目标框进行位置属性识别。解决了现有技术中通过神经网络模型识别目标属性时,训练神经网络模型需要依赖人工标注目标及其属性,人工成本高以及目标识别错误率较高的问题,实现了准确、迅速和全面的识别待识别图像中的目标及其属性的效果,提高了识别结果的准确度。
实施例二
图2a是本发明实施例二提供的一种目标识别方法的流程图,本发明实施例在上述实施例的基础上,对在待识别图片中获取第一目标框识别结果的过程、将第一目标框分配至匹配的第二目标框中的过程以及对第二目标框中的第一目标框进行第一目标位置属性识别的过程进行了进一步的具体化,并在第一目标位置属性识别之后,加入了对待识别图片进行标注,并利用标注后的图片训练目标识别模型的步骤。
相应的,如图2a所示,本发明实施例的技术方案,具体包括如下步骤:
S210、获取待识别图片。
S220、将所述待识别图片输入至预先训练的目标识别模型中,获取所述第一目标框识别结果;
S230、根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中。
在本发明实施例中,待识别图片同一第一目标框有可能包含于多个第二目标框中,需要对与第一目标框匹配的第二目标框进行判断。
相应的,步骤S230,可以包括:
S231:获取当前处理的第一目标框,以及当前处理的第一目标框指向所在第二目标中心的目标方向向量。
S232:根据所述当前处理的第一目标框的中心点以及各所述第二目标框的中心点,计算所述当前处理的第一目标框与各所述第二目标框之间的方向向量作为基准向量。
S233:分别计算所述目标方向向量与各所述基准向量之间的向量内积,并将所述当前处理的第一目标框分配至与最大向量内积对应的第二目标框中。
其中,向量内积用于表征两个向量之间的夹角。在第一目标框与各第二目标框之间的方向向量中,与第一目标框指向所在第二目标中心的目标方向向量向量内积最大的方向向量对应的第二目标框,即为第一目标框所述的第二目标框。
在本发明实施例中,对于第i个预测的第一目标框,其中心坐标为bi,与其对应的指向第二目标中心的方向向量为ai,ai为单位方向向量,模长为1。在N个待匹配的第二目标框中,第j个第二目标框中心坐标为cj,其中,j的取值范围为1-N,可以通过下述公式获取与第i个第一目标框匹配的第j个第二目标框:
示例性的,图2b提供了一种分配第一目标框的示意图,如图2b所示,对于第一目标框1而言,其中心为b1,指向所在第二目标中心的方向向量为a1,第一目标框1包含在第二目标框1和第二目标框2中,第二目标框1和第二目标框2的中心分别为c1和c2。图2b中,明显与a1之间的夹角小于与a1之间的夹角,因此将第一目标框1分配到第二目标框1中。同理,对于第一目标框2而言,其中心为b2,,指向所在第二目标中心的方向向量为a2,第一目标框2包含在第二目标框2和第二目标框3中,第二目标框2和第二目标框3的中心分别为c2和c3。图2b中,明显与a2之间的夹角小于与a2之间的夹角,因此将第一目标框2分配到第二目标框2中。
S240、对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
在本发明实施例中,对各第一目标框分配第二目标框之后,第二目标框中包含至少一个第一目标框,对各第一目标框还需进行左右属性的识别。
示例性的,当第一目标为车灯,第二目标为车身时,识别出车灯的前后属性之后,还需要判断车灯的左右属性,同时,由于一个车身框中前左灯、前右灯、后左灯、后右灯以及后中灯都只有一个,但是同一车身框中有可能出现存在多个同类型车灯框的情况,因此需要对同类型车灯框进行过滤。
示例性的,当第一目标为人手,第二目标为人体时,识别出人手是手背还是手掌之后,还需要识别是左手还是右手,由于同一个人只有一个左手和一个右手,但待识别图片中可能存在人群密集,手部互相遮挡的情况,需要确定手部和人体之间的对应关系。
相应的,步骤S240可以包括:
S241、根据各所述第一目标框的前后属性,以及各所述第一目标框与所在第二目标框之间的位置关系,确定各所述第一目标框的第一目标位置属性。
S242、根据各所述第一目标框的第一目标位置属性以及识别置信度,对同一第一目标位置属性下的多个第一目标框进行过滤处理。
在本发明实施例中,根据第一目标框在所匹配的第二目标框中的位置,可以获知第一目标框的左右属性。示例性的,可以通过提取训练样本中左右属性的特征集,训练二分类器,从而通过二分类器检测第一目标框的左右属性。本实施例对检测第一目标框左右属性的方式和具体过程不进行限制。
第一目标框的左右属性结合S220中获取的第一目标框的前后属性,可以获知第一目标框的第一目标位置属性。
当第二目标框中存在多个第一目标框的第一目标位置属性相同时,需要对多个第一目标框进行过滤,保留至多一个第一目标框。
相应的,步骤S242又包括:
S2420、判断是否存在包括同一第一目标位置属性的多个第一目标框。如果是,则执行S2421,否则执行S250。
S2421、保留所述多个第一目标框中识别置信度最高的第一目标框后,滤除其余第一目标框。
其中,第一目标框对应的识别置信度为S220中的第一目标框识别结果。在本发明实施例中,只保留第一目标位置属性相同的多个第一目标框中识别置信度最高的第一目标框,可以提高第一目标框识别的准确度。
示例性的,当第一目标为车灯,第二目标为车身时,当某第二目标框中,第一目标位置属性为尾中灯的第一目标框共四个,其识别置信度分别为0.12、0.04、0.08以及0.11,只保留识别置信度最高的,也即识别置信度为0.12的第一目标框,其他第一目标位置属性为尾中灯的第一目标框均被滤除。
S250、滤除识别置信度小于等于预设的下限阈值门限的第一目标框。
在本发明实施例中,识别置信度低于下限阈值门限时,第一目标框与第二目标框相匹配的真实性过低,影响第一目标框识别结果的准确性,因此,需要滤除识别置信度低于下限阈值门限的第一目标框。
下限阈值门限的设置需要考虑模型的召回率和识别结果的准确率。如果下限阈值门限设置的过高,例如,当第一目标为车灯,第二目标为车身时,当某第二目标框中,第一目标位置属性为尾中灯的第一目标框共四个,其识别置信度分别为0.12、0.04、0.08以及0.11时,下限阈值门限设置为0.5,所有第一目标位置属性为尾中灯的第一目标框均会被滤除,会导致较低的召回率。如果下限阈值门限设置的过低,例如当某第二目标框中,第一目标位置属性为尾中灯的第一目标框识别置信度为0.05时,下限阈值门限设置为0.01,该识别置信度为0.05的第一目标框会被保留,降低识别结果的准确性。
需要进行说明的是,先执行S241、S242中保留多个第一目标框中识别置信度最高的第一目标框的操作,再执行S250中滤除识别置信度小于等于预设下限阈值门限的第一目标框的操作,仅是本发明实施例中一个可选的实施方式。还可以先执行S250中滤除识别置信度小于等于预设下限阈值门限的第一目标框的操作,再执行S241、S242中保留多个第一目标框中识别置信度最高的第一目标框的操作。本发明实施例对S241、S242和S250的顺序不进行限制。
S260、在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注。
S270、将标注后的所述待识别图片发送至标注结果验证平台中,并将所述标注结果验证平台反馈的确认验证图片,作为新的训练样本对所述目标识别模型进行继续训练。
需要进行说明的是,本发明实施例是对待识别图片进行第一目标及其属性的识别,还可以将待识别图片中的各第二目标框区域单独作为识别对象,进行第二目标框内的第一目标及其属性的识别,本发明实施例对此不进行限制。
在本发明一个可选的实施例中,图2c提供了一种对车灯及其属性进行标注的方法的流程图,如图2c所示,对车灯及其属性进行标注的方法包括以下步骤:
S1、选择待标注图像,将图像输入到车灯检测模型得到车灯框,车灯的前后属性,亮灭属性和车灯指向车中心的方向向量。
S2、根据车灯框和车灯指向车中心的方向向量,对各车灯框分配对应的车身框。
S3、将各车灯框分配至匹配的车身框之后,各车身框中分别包括至少一个车灯框。根据车身框中,车灯框相对于车身框的位置,预测车灯框的左右属性。S4、车身框内同型车灯保留得分最大的车灯框,然后再用较低阈值过滤。
对于同一车身框,如果存在多个位置属性类型相同的车灯框,则保留置信度最高的车灯框,其中,置信度是车灯检测模型检测车灯的前后属性时输出的结果。然后判断该置信度最高的车灯框,其置信度是否高于一个预设的较低阈值,如果小于该阈值,则将该车灯框滤除,否则,将该车灯框作为最终保留的车灯框。
S5、将预测的车灯位置及其前后左右亮灭属性写入标注结果,作为初始化结果后提供给标注平台的标注员。
S6、标注员判断所述初始化结果是否正确。如果不正确,则执行S7,如果正确,则执行S8。
S7、将该初始化结果修改正确后,得到最终标注结果。
S8、将初始化结果作为最终标注结果。
在上述方法中,得到最终标注结果后,使用最终标注结果对车灯检测模型进一步进行训练,提升车灯检测模型的性能。
本实施例的技术方案,通过待识别图片获取第一目标框、第一目标框指向第二目标中心的方向向量以及第二目标框,通过计算方向向量的向量内积,将各第一目标框分配到匹配的第二目标框中,对第二目标框分配的各第一目标框进行位置属性识别,并根据识别置信度对第一目标框进行过滤。根据最终得到的识别结果对待识别图片进行标注,通过标注后的待识别图片对目标识别模型进行训练。解决了现有技术中通过神经网络模型识别目标及其属性时,训练神经网络模型需要依赖人工标注目标及其属性,人工成本高以及识别错误率较高的问题,实现了准确、迅速和全面的识别待识别图像中的目标及其属性的效果,提高了识别结果的准确度。
实施例三
图3是本发明实施例三提供的一种目标识别装置的结构示意图,如图3所示,所述装置,包括:第一目标框识别结果获取模块310、第一目标框分配模块320以及第一目标位置属性识别模块330。其中:
第一目标框识别结果获取模块310,用于获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量;
第一目标框分配模块320,用于根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
第一目标位置属性识别模块330,用于对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
本实施例的技术方案,通过根据待识别图片获取第一目标框、第一目标框指向第二目标中心的方向向量以及第二目标框,将各第一目标框分配到匹配的第二目标框中,对第二目标框分配的各第一目标框进行位置属性识别。解决了现有技术中通过神经网络模型识别目标属性时,训练神经网络模型需要依赖人工标注目标及其属性,人工成本高以及目标识别错误率较高的问题,实现了准确、迅速和全面的识别待识别图像中的目标及其属性的效果,提高了识别结果的准确度。
在上述实施例的基础上,所述第一目标框分配模块320,包括:
目标第一目标框及目标方向向量获取单元,用于获取当前处理的第一目标框,以及当前处理的第一目标框指向所在第二目标中心的目标方向向量;
基准向量获取单元,用于根据所述当前处理的第一目标框的中心点以及各所述第二目标框的中心点,计算所述当前处理的第一目标框与各所述第二目标框之间的方向向量作为基准向量;
向量内积计算单元,用于分别计算所述目标方向向量与各所述基准向量之间的向量内积,并将所述当前处理的第一目标框分配至与最大向量内积对应的第二目标框中。
在上述实施例的基础上,所述第一目标框识别结果还包括:各所述第一目标框的识别置信度以及前后属性;
所述第一目标位置属性识别模块330,包括:
第一目标位置属性确定单元,用于根据各所述第一目标框的前后属性,以及各所述第一目标框与所在第二目标框之间的位置关系,确定各所述第一目标框的第一目标位置属性;
第一目标框过滤单元,用于根据各所述第一目标框的第一目标位置属性以及识别置信度,对同一第一目标位置属性下的多个第一目标框进行过滤处理。
在上述实施例的基础上,所述第一目标框过滤单元,具体用于:
如果确定包括同一第一目标位置属性的多个第一目标框,则保留所述多个第一目标框中识别置信度最高的第一目标框后,滤除其余第一目标框。
在上述实施例的基础上,所述装置,还包括:
第一目标框滤除模块,用于滤除识别置信度小于等于预设的下限阈值门限的第一目标框。
在上述实施例的基础上,所述装置,还包括:
待识别图片标注模块,用于在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注;
所述第一目标为:车灯,所述第二目标为:车身,所述第一目标框识别结果中还包括:各所述第一目标框的亮灭属性;
所述装置,还包括:
对所述第一目标框的亮灭属性进行标注。
在上述实施例的基础上,所述第一目标框识别结果获取模块310,包括:
第一目标框识别结果获取单元,用于将所述待识别图片输入至预先训练的目标识别模型中,获取所述第一目标框识别结果;
其中,所述目标识别模型通过第一数量的训练样本训练得到,且所述第一数量小于训练标准目标识别模型所需的样本数量值;
所述装置,还包括:
目标识别模型训练模块,用于将标注后的所述待识别图片发送至标注结果验证平台中,并将所述标注结果验证平台反馈的确认验证图片,作为新的训练样本对所述目标识别模型进行继续训练。
本发明实施例所提供的目标识别装置可执行本发明任意实施例所提供的目标识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种计算机设备的结构示意图,如图4所示,该计算机设备包括处理器70、存储器71、输入装置72和输出装置73;计算机设备中处理器70的数量可以是一个或多个,图4中以一个处理器70为例;计算机设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的目标识别方法对应的模块(例如,目标识别装置中的第一目标框识别结果获取模块310、第一目标框分配模块320以及第一目标位置属性识别模块330)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的目标识别方法。该方法包括:
获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量;
根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种目标识别方法,该方法包括:
获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量;
根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的目标识别方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述目标识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种目标识别方法,其特征在于,包括:
获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标框中心的方向向量;
根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
2.根据权利要求1所述的方法,其特征在于,根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中,包括:
获取当前处理的第一目标框,以及当前处理的第一目标框指向所在第二目标中心的目标方向向量;
根据所述当前处理的第一目标框的中心点以及各所述第二目标框的中心点,计算所述当前处理的第一目标框与各所述第二目标框之间的方向向量作为基准向量;
分别计算所述目标方向向量与各所述基准向量之间的向量内积,并将所述当前处理的第一目标框分配至与最大向量内积对应的第二目标框中。
3.根据权利要求1所述的方法,其特征在于,所述第一目标框识别结果还包括:各所述第一目标框的识别置信度以及前后属性;
对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别,包括:
根据各所述第一目标框的前后属性,以及各所述第一目标框与所在第二目标框之间的位置关系,确定各所述第一目标框的第一目标位置属性;
根据各所述第一目标框的第一目标位置属性以及识别置信度,对同一第一目标位置属性下的多个第一目标框进行过滤处理。
4.根据权利要求3所述的方法,其特征在于,根据各所述第一目标框的第一目标位置属性以及识别置信度,对同一第一目标位置属性下的多个第一目标框进行过滤处理,包括:
如果确定包括同一第一目标位置属性的多个第一目标框,则保留所述多个第一目标框中识别置信度最高的第一目标框后,滤除其余第一目标框。
5.根据权利要求3所述的方法,其特征在于,在根据各所述第一目标框的前后属性,以及各所述第一目标框与所在第二目标框之间的位置关系,确定各所述第一目标框的第一目标位置属性之前和/或在根据各所述第一目标框的第一目标位置属性以及识别置信度,对同一第一目标位置属性下的多个第一目标框进行过滤处理之后,还包括:
滤除识别置信度小于等于预设的下限阈值门限的第一目标框。
6.根据权利要求1-5任一项所述的方法,其特征在于,在对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别之后,还包括:
在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注;
所述第一目标为:车灯,所述第二目标为:车身,所述第一目标框识别结果中还包括:各所述第一目标框的亮灭属性;
在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注之后,还包括:
对所述第一目标框的亮灭属性进行标注。
7.根据权利要求6所述的方法,其特征在于,在待识别图片中获取第一目标框识别结果,包括:
将所述待识别图片输入至预先训练的目标识别模型中,获取所述第一目标框识别结果;
其中,所述目标识别模型通过第一数量的训练样本训练得到,且所述第一数量小于训练标准目标识别模型所需的样本数量值;
在所述待识别图片中,对各所述第一目标框、第一目标框指向所在第二目标中心的方向向量以及第一目标框的第一目标位置属性进行标注,以及对所述第一目标框的亮灭属性进行标注之后,还包括:
将标注后的所述待识别图片发送至标注结果验证平台中,并将所述标注结果验证平台反馈的确认验证图片,作为新的训练样本对所述目标识别模型进行继续训练。
8.一种目标识别装置,其特征在于,包括:
第一目标框识别结果获取模块,用于获取待识别图片,并在待识别图片中获取第一目标框识别结果,第一目标框识别结果中包括:至少一个第一目标框和各所述第一目标框指向所在第二目标中心的方向向量;
第一目标框分配模块,用于根据识别出的所述第一目标框、所述方向向量以及所述待识别图片中包括的至少一个第二目标框,将各所述第一目标框分配至匹配的第二目标框中;
第一目标位置属性识别模块,用于对同一第二目标框中包括的各所述第一目标框,进行第一目标位置属性的识别。
9.一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的目标识别方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的目标识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183651.4A CN111368784B (zh) | 2020-03-16 | 2020-03-16 | 一种目标识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183651.4A CN111368784B (zh) | 2020-03-16 | 2020-03-16 | 一种目标识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111368784A true CN111368784A (zh) | 2020-07-03 |
CN111368784B CN111368784B (zh) | 2024-04-02 |
Family
ID=71212001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010183651.4A Active CN111368784B (zh) | 2020-03-16 | 2020-03-16 | 一种目标识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368784B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686170A (zh) * | 2020-12-31 | 2021-04-20 | 北京一起教育科技有限责任公司 | 一种图像识别方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206135895U (zh) * | 2016-09-20 | 2017-04-26 | 广东安居宝数码科技股份有限公司 | 对讲终端的开关装置、对讲终端和对讲系统 |
WO2019128676A1 (zh) * | 2017-12-27 | 2019-07-04 | 北京七鑫易维信息技术有限公司 | 过滤光斑的方法和装置 |
US20200019165A1 (en) * | 2018-07-13 | 2020-01-16 | Kache.AI | System and method for determining a vehicles autonomous driving mode from a plurality of autonomous modes |
WO2020047420A1 (en) * | 2018-08-31 | 2020-03-05 | Alibaba Group Holding Limited | Method and system for facilitating recognition of vehicle parts based on a neural network |
-
2020
- 2020-03-16 CN CN202010183651.4A patent/CN111368784B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206135895U (zh) * | 2016-09-20 | 2017-04-26 | 广东安居宝数码科技股份有限公司 | 对讲终端的开关装置、对讲终端和对讲系统 |
WO2019128676A1 (zh) * | 2017-12-27 | 2019-07-04 | 北京七鑫易维信息技术有限公司 | 过滤光斑的方法和装置 |
US20200019165A1 (en) * | 2018-07-13 | 2020-01-16 | Kache.AI | System and method for determining a vehicles autonomous driving mode from a plurality of autonomous modes |
WO2020047420A1 (en) * | 2018-08-31 | 2020-03-05 | Alibaba Group Holding Limited | Method and system for facilitating recognition of vehicle parts based on a neural network |
Non-Patent Citations (1)
Title |
---|
祁秋红 等: "基于尾灯跟踪的夜间车辆检测", pages 58 - 60 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686170A (zh) * | 2020-12-31 | 2021-04-20 | 北京一起教育科技有限责任公司 | 一种图像识别方法、装置及电子设备 |
CN112686170B (zh) * | 2020-12-31 | 2023-10-17 | 北京一起教育科技有限责任公司 | 一种图像识别方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111368784B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220020127A1 (en) | Dynamic image recognition model updates | |
CN109426801B (zh) | 一种车道线实例检测方法和装置 | |
CN112418268A (zh) | 目标检测方法、装置及电子设备 | |
US20180240249A1 (en) | Image Recognition System | |
CN110826370B (zh) | 车内人员的身份识别方法、装置、车辆及存储介质 | |
CN109002820A (zh) | 一种车牌识别方法、装置及相关设备 | |
CN111645695B (zh) | 一种疲劳驾驶的检测方法、装置、计算机设备和存储介质 | |
CN113159198A (zh) | 一种目标检测方法、装置、设备及存储介质 | |
US11893766B2 (en) | Neural network system and operating method thereof | |
CN112906823A (zh) | 目标对象识别模型训练方法、识别方法及识别装置 | |
WO2023138538A1 (zh) | 车载视频稳像方法、装置、车辆及存储介质 | |
CN111753592A (zh) | 交通标志识别方法、装置、计算机设备和存储介质 | |
CN112949519A (zh) | 目标检测方法、装置、设备及存储介质 | |
CN114460598A (zh) | 一种目标识别方法、装置、设备及存储介质 | |
CN111368784B (zh) | 一种目标识别方法、装置、计算机设备和存储介质 | |
CN110659631B (zh) | 车牌识别方法和终端设备 | |
US11100702B2 (en) | 3D image labeling method based on labeling information of 2D image and 3D image labeling device | |
CN112529917A (zh) | 一种三维目标分割方法、装置、设备和存储介质 | |
US20230298350A1 (en) | Vehicle identification system | |
CN112598007B (zh) | 图片训练集的筛选方法、装置、设备和可读存储介质 | |
CN111340092B (zh) | 一种目标关联处理方法及装置 | |
CN110569865B (zh) | 识别车体方向的方法和装置 | |
CN111860090A (zh) | 一种车辆验证方法及装置 | |
CN112419366A (zh) | 车辆的追踪方法、系统及计算机可读存储介质 | |
CN115376092B (zh) | 辅助驾驶中的图像识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |