CN110390295A - 一种图像信息识别方法、装置及存储介质 - Google Patents

一种图像信息识别方法、装置及存储介质 Download PDF

Info

Publication number
CN110390295A
CN110390295A CN201910665544.2A CN201910665544A CN110390295A CN 110390295 A CN110390295 A CN 110390295A CN 201910665544 A CN201910665544 A CN 201910665544A CN 110390295 A CN110390295 A CN 110390295A
Authority
CN
China
Prior art keywords
image
information
target object
target
forward reasoning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910665544.2A
Other languages
English (en)
Other versions
CN110390295B (zh
Inventor
李亚学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Autel Intelligent Aviation Technology Co Ltd
Original Assignee
Shenzhen Autel Intelligent Aviation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Autel Intelligent Aviation Technology Co Ltd filed Critical Shenzhen Autel Intelligent Aviation Technology Co Ltd
Priority to CN201910665544.2A priority Critical patent/CN110390295B/zh
Publication of CN110390295A publication Critical patent/CN110390295A/zh
Application granted granted Critical
Publication of CN110390295B publication Critical patent/CN110390295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像信息识别方法、装置及存储介质。该方法包括:获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;根据所述位置信息确定目标物体在所述第一图像中的比例;根据所述比例从所述第二图像中截取目标物体的图像;以及将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。通过本发明的技术方案,能够解决单个正向推理器执行图像信息识别时,实时性低和准确率低的问题,提高识别效率。

Description

一种图像信息识别方法、装置及存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种图像信息识别方法、装置及存储介质。
背景技术
HI3559C芯片上携带两个专门针对神经网络进行加速的正向推理器(neuralnetwork inference engine,NNIE),正向推理器可以单独的处理检测、分类、分割等任务,但某些应用场景下,需要同时运行多个任务,而多个任务的对图像分辨率的要求不同,单个正向推理器难以实现多任务应用场景。
发明内容
本发明实施例提供一种图像信息识别方法、装置及存储介质,以实现两个任务分别放在两个不同的正向推理器上运行,并使用不同分辨率的图像,解决单个正向推理器执行图像信息识别时,实时性低和准确率低的问题,提高识别效率。
第一方面,本发明实施例提供了一种图像信息识别方法,包括:
获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;
将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;
根据所述位置信息确定所述目标物体在所述第一图像中的比例;
根据所述比例从所述第二图像中截取所述目标物体的图像;以及
将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
进一步的,所述第二图像的分辨率大于所述第一图像的分辨率。
进一步的,所述根据所述第一图像确定目标物体的位置信息包括:
根据所述第一图像确定所述目标物体的图像在所述第一图像中的起始坐标信息和宽高信息。
进一步的,所述第一正向推理器和所述正向推理器可以互换。
进一步的,所述第一正向推理器和所述第二正向推理器用于以流水线的方式执行任务,
其中,所述流水线的方式是指在其中一个正向推理器执行当前任务的同时,另一正向推理器执行下一任务。
进一步的,所述目标物体的图像包括:车牌图像、广告牌图像、人脸图像以及人物图像中的至少一种。
进一步的,所述目标信息包括:字符信息、人脸信息、人脸微表情信息以及手势信息中的至少一种。
第二方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的图像信息识别方法。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的图像信息识别方法。
第四方面,本发明实施例还提供了一种图像信息识别装置,该装置包括:
处理器,用于获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;
第一正向推理器,用于根据所述第一图像确定目标物体的位置信息,并发送给所述处理器,以使得所述处理器根据所述位置信息确定所述目标物体在所述第一图像中的比例并根据所述比例从所述第二图像中截取所述目标物体的图像;以及
第二正向推理器,用于对所述目标物体的图像进行识别,得到目标信息。
进一步的,所述第二图像的分辨率大于所述第一图像的分辨率。
进一步的,所述位置信息包括所述目标物体的图像在所述第一图像中的起始坐标信息和宽高信息。
进一步的,所述第一正向推理器和所述第二正向推理器用于以流水线的方式执行任务,
其中,所述流水线的方式是指在其中一个正向推理器执行当前任务的同时,另一正向推理器执行下一任务。
本发明实施例通过获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;根据所述位置信息确定所述目标物体在所述第一图像中的比例;根据所述比例从所述第二图像中截取所述目标物体的图像;以及将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息,能够解决单个正向推理器执行图像信息识别时。时性低和准确率低的问题,提高识别效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1A是本发明实施例一中的一种图像信息识别方法的流程图;
图1B是本发明实施例一中的数据流示意图;
图1C是本发明实施例一中的第一正向推理器和第二正向推理器使用串行方式进行识别的示意图;
图1D是本发明实施例一中的第一正向推理器和第二正向推理器使用流水线方式进行识别的示意图;
图2是本发明实施例二中的一种图像信息识别方法的流程图;
图3是本发明实施例三中的一种图像信息识别装置的结构示意图;
图4是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例一
图1A为本发明实施例一中的一种车牌识别方法的流程图,本方法由芯片执行,所述芯片包括:处理器、第一正向推理器、及第二正向推理器。
如图1A所示,本实施例的方法具体包括如下步骤:
S110,获取车牌图像,调整所述车牌图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同。
其中,所述车牌图像的获取方式可以为云台相机拍摄的目标图像,也可以为将拍摄的图像进行去噪后得到的车牌图像,本发明实施例对此不进行限制。
其中,调整所述车牌图像的分辨率的方式可以为增加所述车牌图像的分辨率和/或减小所述目标图像的分辨率,还可以为保持所述车牌图像的分辨率不变,例如可以是,若车牌图像的分辨率为1920*1080,将所述车牌图像的分辨率调整为512*512,将所述车牌图像的分辨率保持1920*1080。
其中,所述第一图像的分辨率可以为512*512,也可以为其他数值,本发明实施例对此不进行限制。
其中,所述第二图像的分辨率可以为1920*1080,也可以为其他数值,本发明实施例对此不进行限制。
具体的,获取车牌图像,调整所述车牌图像的分辨率,得到第一图像和第二图像,例如可以是,如图1B所示,获取云台相机拍摄的车牌图像,车牌图像的分辨率为1920*1080,调整车牌图像的分辨率,将车牌图像的分辨率调整为512*512作为第一图像,将车牌图像的分辨率保持1920*1080不变作为第二图像。
S120,将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定车牌的起始坐标信息和宽高信息。
其中,所述车牌的起始坐标信息可以为车牌的所有顶点坐标信息,也可以为车牌的任一顶点信息,本发明实施例对此不进行限制。起始坐标通过以下过程得到:创建一个坐标系(例如,坐标原点在图像的坐上角定点,x轴延图像下边缘向右延伸,y轴延图像左边缘向下延伸),根据车牌在图像中的大小设立一个车牌框(例如,矩形的车牌框),此车牌框可以恰好将所述车牌框起来,根据坐标系的位置和图像的分辨率(例如,每像素在坐标系下距离大小为1),得到车牌框的坐标,该车牌框的坐标为所述车牌的起始坐标。
其中,所述宽高信息可以直接获取,也可以为根据车牌的所有顶点坐标信息确定车牌的宽高信息,本发明实施例对此不进行限制。
S130,根据所述起始坐标信息和宽高信息确定车牌在所述第一图像中的比例。
其中,确定所述车牌在所述第一图像中的比例,即确定了车牌在图像中的位置。
S140,根据所述车牌在所述第一图像中的比例从所述第二图像中截取车牌图像。
其中,所述车牌在第一图像中的比例和车牌在第二图像中的比例相同,因此,可以根据车牌在所述第一图像中的比例从第二图像中截取车牌图像。
S150,将所述车牌图像发送至第二正向推理器,以使所述第二正向推理器对所述车牌图像进行识别,得到目标信息。
其中,车牌图像送入到用于分类的第二正向推理器进行字符信息的分类,从而得到车牌的字符信息,结合上一步得到的车牌位置信息,能够得到具体的车牌信息,即,字符信息。
在另一个具体的例子中,如图1C所示,为第一正向推理器和第二正向推理器使用串行方式执行任务的示意图。
如图1D所示,为第一正向推理器和第二正向推理器使用流水线方式执行任务的示意图,第一正向推理器和第二正向推理器分别运行两个任务,可以使用流水线方式来缩短识别一帧图片的时间,相比串行执行方式,流水线方式提高了识别的效率,图1C和图1D分别对三帧图片进行识别,串行方式需要的时间是T1,流水线方式需要的时间是T2,假设检测需要的时间是t1,分类需要的时间是t2,那么依据图1C和图1D有:T1=3*(t1+t2),T2=3*t1+t2,当t2<t1时,识别三帧图片能够节省2*t2的时间,当长时间运行识别模块,能够提高识别的效率。
本实施例的技术方案,通过获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定车牌的起始坐标信息和宽高信息,从而根据所述起始坐标信息和宽高信息确定车牌在所述第一图像中的比例,根据所述车牌在所述第一图像中的比例从所述第二图像中截取车牌图像,将所述车牌图像发送至第二正向推理器,以使所述第二正向推理器对所述车牌图像进行识别,得到字符信息,能够解决单个正向推理器下实时性低和准确率低的问题,并以流水线方式实现两个正向推理器任务的运行,提高识别效率。
实施例二
图2为本发明实施例二提供的一种图像信息识别方法的流程图,本实施例可适用于图像信息识别的情况,该方法可以由芯片(例如,HI3559C芯片)来执行,该装置可采用软件和/或硬件的方式实现,如图2所示,该方法具体包括如下步骤:
S210,获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同。
其中,所述目标图像的获取方式可以为云台相机拍摄的目标图像,也可以为将拍摄的图像进行去噪后得到的目标图像,本发明实施例对此不进行限制。
其中,调整所述目标图像的分辨率的方式可以为增加所述目标图像的分辨率和/或减小所述目标图像的分辨率,还可以为保持所述目标图像的分辨率不变,例如可以是,若目标图像的分辨率为1920*1080,将所述目标图像的分辨率调整为512*512,将所述目标图像的分辨率保持1920*1080。
其中,所述第一图像的分辨率可以为512*512,也可以为其他数值,本发明实施例对此不进行限制。
其中,所述第二图像的分辨率可以为1920*1080,也可以为其他数值,本发明实施例对此不进行限制。
具体的,获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,例如可以是,获取云台相机拍摄的目标图像,目标图像的分辨率为1920*1080,调整目标图像的分辨率,将目标图像的分辨率调整为512*512作为第一图像,将目标图像的分辨率保持1920*1080不变作为第二图像。
S220,将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息。
其中,所述目标物体可以为车牌、广告牌、人脸、人体中的任意一种或者多种。
其中,所述目标物体为第一图像中的目标物体,所述目标物体的位置信息可以包括,至少一个目标物体在第一图像中起始坐标信息和宽高信息,本发明实施例对此不进行限制。
其中,所述目标物体的起始坐标通过以下过程得到:创建一个坐标系(例如,坐标原点在图像的坐上角定点,x轴延图像下边缘向右延伸,y轴延图像左边缘向下延伸),根据目标物体在图像中的大小设立一个目标框(例如,矩形的目标框),此目标框可以恰好将所述目标物体框起来,根据坐标系的位置和图像的分辨率(例如,每像素在坐标系下距离大小为1),得到目标框的坐标,该目标框的坐标为所述目标物体的起始坐标。其中,目标框可以是非矩形的其他形状,坐标原点和方向可以为使用方便而任意设置。
其中,所述根据所述第一图像确定目标物体的位置信息包括:第一正向推理器通过对第一图像进行分析,确定第一图像中的目标物体的起始坐标和宽高信息。
S230,根据所述位置信息确定目标物体在所述第一图像中的比例。
S240,根据所述比例从所述第二图像中截取目标物体的图像。
其中,根据比例从第二图像中截取目标物体的图像,例如包括,根据至少一个目标物体在第一图像中的比例从第二图像中截取至少一个目标物体的图像。
S250,将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
其中,所述目标信息可以为字符信息、人脸信息、人脸微表情信息以及手势信息中的至少一种。
其中,对所述目标物体的图像进行识别之前,可以预先对目标物体的图像进行预处理,以提升对目标物体的图像进行识别的准确度。
其中,所述对所述目标物体的图像进行识别,得到目标信息包括:第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
具体的,将至少一个目标物体的图像发送至第二正向推理器,第二正向推理器对至少一个目标物体的图像进行识别,得到至少一个目标信息。例如以车牌识别为例,将至少一个车牌图像发送至第二正向推理器,第二正向推理器对至少一个车牌图像进行字符信息识别,得到至少一个车牌中的字符信息。
具体的,若目标物体的图像为车牌图像或者广告牌图像,则对目标物体的图像进行识别得到的目标信息为字符信息;若目标物体的图像为人脸图像,则对目标物体的图像进行识别得到的目标信息为人脸信息或者人脸微表情信息;若目标物体的图像为人物图像,则对目标物体的图像进行识别得到的目标信息为手势信息。
由于目标物体识别需要同时运行检测和分类两个任务,其中检测任务要求图像的分辨率较小,太大的分辨率会导致正向推理的过程非常慢,难以满足实时性要求;而分类的任务要求图像的分辨率较大,较小的分辨率会导致分类的结果不准确。因此单个正向推理器难以实现类似于目标物体识别这种多任务应用场景,需要多正向推理器共同协调实现。
本发明实施例将目标物体识别方案分为两步进行,检测目标物体位置和目标物体分类,需要运行检测和分类两个任务,两个任务分别在两个正向推理器上运行,其中,例如,检测任务采用512*512分辨率的第一图像,使用该分辨率进行检测,能够在保证检测准确率的前提下,满足实时性要求;分类任务采用1920*1080分辨率的第二图像,高分辨率的图片保留了目标物体的信息,能够保证分类的准确率。
本实施例的技术方案,通过获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;根据所述位置信息确定目标物体在所述第一图像中的比例;根据所述比例从所述第二图像中截取目标物体的图像;以及将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。本申请的技术方案能够解决单个正向推理器下实时性低和准确率低的问题,并以流水线方式实现两个正向推理器任务的运行,提高识别效率。
实施例三
图3为本发明实施例三提供的一种图像信息识别装置的结构示意图。本实施例可适用于图像信息识别的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供图像信息识别功能的设备中,如图3所示,所述图像信息识别装置具体包括:处理装置310、第一正向推理器320和第二正向推理器330,所述处理装置310、第一正向推理器320和第二正向推理器330之间通信地连接。
处理装置310,用于获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同。
其中,所述处理装置包括:处理器、CPU或其他有计算处理功能的硬件,此处不做限制。
可选的,所述第二图像的分辨率大于所述第一图像的分辨率。可选的,所述第一图像的分辨率为512*512。可选的,所述第二图像的分辨率为1920*1080。
第一正向推理器320,用于根据所述第一图像确定目标物体的位置信息,并发送给所述处理装置,以使得所述处理装置根据所述位置信息确定所述目标物体在所述第一图像中的比例并根据所述比例从所述第二图像中截取目标物体的图像。
其中,所述位置信息包括:所述目标物体的图像在所述第一图像中的起始坐标信息和宽高信息,本发明在此不作限制。
第二正向推理器330,用于对所述目标物体的图像进行识别,得到目标信息。
可选的,所述第一正向推理器和所述第二正向推理器用于以流水线的方式执行任务,其中,所述流水线的方式是指在其中一个正向推理器执行当前任务的同时,另一正向推理器执行下一任务。使用流水线方式来缩短识别一帧图片的时间,相比串行执行方式,流水线方式提高了识别的效率,例如,对三帧图片进行识别,串行方式需要的时间是T1,流水线方式需要的时间是T2,假设检测模块需要的时间是t1,识别模块需要的时间是t2,当t2<t1时,那么有:T1=3*(t1+t2),T2=3*t1+t2,,识别三帧图片能够节省2*t2的时间,当长时间运行识别模块,能够提高识别的效率。
本实施例的图像信息识别装置,包括:处理装置,用于获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;第一正向推理器,用于根据所述第一图像确定目标物体的位置信息,并发送给所述处理装置,以使得所述处理装置根据所述位置信息确定所述目标物体在所述第一图像中的比例并根据所述比例从所述第二图像中截取目标物体的图像;以及第二正向推理器,用于对所述目标物体的图像进行识别,得到目标信息。能够解决现有技术实时性低和准确率低的问题,并以流水线方式实现检测模块和识别模块的运行,提高识别效率。
实施例四
图4为本发明实施例四中的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的计算机设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像信息识别方法:获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;根据所述位置信息确定所述目标物体在所述第一图像中的比例;根据所述比例从所述第二图像中截取所述目标物体的图像;以及将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
实施例五
本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的图像信息识别方法:获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;根据所述位置信息确定所述目标物体在所述第一图像中的比例;根据所述比例从所述第二图像中截取所述目标物体的图像;以及将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (13)

1.一种图像信息识别方法,其特征在于,包括:
获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;
将所述第一图像发送至第一正向推理器,以使所述第一正向推理器根据所述第一图像确定目标物体的位置信息;
根据所述位置信息确定所述目标物体在所述第一图像中的比例;
根据所述比例从所述第二图像中截取所述目标物体的图像;以及
将所述目标物体的图像发送至第二正向推理器,以使所述第二正向推理器对所述目标物体的图像进行识别,得到目标信息。
2.根据权利要求1所述的方法,其特征在于,所述第二图像的分辨率大于所述第一图像的分辨率。
3.根据权利要求1或2中所述的方法,其特征在于,所述根据所述第一图像确定目标物体的位置信息包括:
根据所述第一图像确定所述目标物体的图像在所述第一图像中的起始坐标信息和宽高信息。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述第一正向推理器和所述第二正向推理器可以互换。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一正向推理器和所述第二正向推理器用于以流水线的方式执行任务,
其中,所述流水线的方式是指在其中一个正向推理器执行当前任务的同时,另一正向推理器执行下一任务。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述目标物体的图像包括:车牌图像、广告牌图像、人脸图像以及人物图像中的至少一种。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述目标信息包括:字符信息、人脸信息、人脸微表情信息以及手势信息中的至少一种。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
10.一种图像信息识别装置,其特征在于,包括:
处理器,用于获取目标图像,调整所述目标图像的分辨率,得到第一图像和第二图像,其中,所述第一图像和所述第二图像的分辨率不同;
第一正向推理器,用于根据所述第一图像确定目标物体的位置信息,并发送给所述处理器,以使得所述处理器根据所述位置信息确定所述目标物体在所述第一图像中的比例并根据所述比例从所述第二图像中截取所述目标物体的图像;以及
第二正向推理器,用于对所述目标物体的图像进行识别,得到目标信息。
11.根据权利要求10所述的装置,其特征在于,所述第二图像的分辨率大于所述第一图像的分辨率。
12.根据权利要求10或11所述的装置,其特征在于,所述位置信息包括所述目标物体的图像在所述第一图像中的起始坐标信息和宽高信息。
13.根据权利要求10-12中任一项所述的装置,其特征在于,所述第一正向推理器和所述第二正向推理器用于以流水线的方式执行任务,
其中,所述流水线的方式是指在其中一个正向推理器执行当前任务的同时,另一正向推理器执行下一任务。
CN201910665544.2A 2019-07-23 2019-07-23 一种图像信息识别方法、装置及存储介质 Active CN110390295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910665544.2A CN110390295B (zh) 2019-07-23 2019-07-23 一种图像信息识别方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910665544.2A CN110390295B (zh) 2019-07-23 2019-07-23 一种图像信息识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110390295A true CN110390295A (zh) 2019-10-29
CN110390295B CN110390295B (zh) 2022-04-01

Family

ID=68287063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910665544.2A Active CN110390295B (zh) 2019-07-23 2019-07-23 一种图像信息识别方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110390295B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796104A (zh) * 2019-11-01 2020-02-14 深圳市道通智能航空技术有限公司 目标检测方法、装置、存储介质及无人机
CN112149684A (zh) * 2020-08-19 2020-12-29 北京豆牛网络科技有限公司 图像处理方法和用于目标检测的图像预处理方法
US20220067394A1 (en) * 2020-08-25 2022-03-03 Axon Enterprise, Inc. Systems and Methods for Rapid License Plate Reading
CN115052103A (zh) * 2021-03-08 2022-09-13 本田技研工业株式会社 处理装置、移动体、处理方法及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074036A1 (en) * 2013-09-12 2015-03-12 Agt International Gmbh Knowledge management system
CN107004116A (zh) * 2014-12-12 2017-08-01 北京市商汤科技开发有限公司 用于预测脸部属性的方法和设备
CN108171103A (zh) * 2016-12-07 2018-06-15 北京三星通信技术研究有限公司 目标检测方法及装置
CN109034266A (zh) * 2018-08-16 2018-12-18 新智数字科技有限公司 一种目标图像检测方法、装置及系统
CN109977876A (zh) * 2019-03-28 2019-07-05 腾讯科技(深圳)有限公司 图像识别方法、装置、计算设备、系统和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074036A1 (en) * 2013-09-12 2015-03-12 Agt International Gmbh Knowledge management system
CN107004116A (zh) * 2014-12-12 2017-08-01 北京市商汤科技开发有限公司 用于预测脸部属性的方法和设备
CN108171103A (zh) * 2016-12-07 2018-06-15 北京三星通信技术研究有限公司 目标检测方法及装置
CN109034266A (zh) * 2018-08-16 2018-12-18 新智数字科技有限公司 一种目标图像检测方法、装置及系统
CN109977876A (zh) * 2019-03-28 2019-07-05 腾讯科技(深圳)有限公司 图像识别方法、装置、计算设备、系统和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SONG HAN ET AL.: "EIE: efficient inference engine on compressed deep neural network", 《ACM SIGARCH COMPUTER ARCHITECTURE NEWS》 *
高放 等: "基于异构多核并行加速的嵌入式神经网络人脸识别方法", 《计算机科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796104A (zh) * 2019-11-01 2020-02-14 深圳市道通智能航空技术有限公司 目标检测方法、装置、存储介质及无人机
CN112149684A (zh) * 2020-08-19 2020-12-29 北京豆牛网络科技有限公司 图像处理方法和用于目标检测的图像预处理方法
CN112149684B (zh) * 2020-08-19 2024-06-07 北京豆牛网络科技有限公司 图像处理方法和用于目标检测的图像预处理方法
US20220067394A1 (en) * 2020-08-25 2022-03-03 Axon Enterprise, Inc. Systems and Methods for Rapid License Plate Reading
US11978260B2 (en) * 2020-08-25 2024-05-07 Axon Enterprise, Inc. Systems and methods for rapid license plate reading
CN115052103A (zh) * 2021-03-08 2022-09-13 本田技研工业株式会社 处理装置、移动体、处理方法及存储介质

Also Published As

Publication number Publication date
CN110390295B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
US11710243B2 (en) Method for predicting direction of movement of target object, vehicle control method, and device
US11379699B2 (en) Object detection method and apparatus for object detection
CN109242903B (zh) 三维数据的生成方法、装置、设备及存储介质
CN110390295A (zh) 一种图像信息识别方法、装置及存储介质
US20210279503A1 (en) Image processing method, apparatus, and device, and storage medium
US20210209797A1 (en) Point-based object localization from images
US10984266B2 (en) Vehicle lamp detection methods and apparatuses, methods and apparatuses for implementing intelligent driving, media and devices
CN108898086B (zh) 视频图像处理方法及装置、计算机可读介质和电子设备
CN109948542B (zh) 手势识别方法、装置、电子设备和存储介质
CN108846440B (zh) 图像处理方法及装置、计算机可读介质和电子设备
CN110095752B (zh) 定位方法、装置、设备和介质
CN111328396A (zh) 用于图像中的对象的姿态估计和模型检索
US9535498B2 (en) Transparent display field of view region determination
US10262207B2 (en) Method for tracking keypoints in a scene
CN109974733A (zh) 用于ar导航的poi显示方法、装置、终端和介质
CN109409241A (zh) 视频核验方法、装置、设备及可读存储介质
CN107851308A (zh) 用于识别目标物体的系统和方法
CN112734827B (zh) 一种目标检测方法、装置、电子设备和存储介质
US20190096073A1 (en) Histogram and entropy-based texture detection
CN116883981A (zh) 一种车牌定位识别方法、系统、计算机设备及存储介质
CN108256477B (zh) 一种用于检测人脸的方法和装置
CN114882046B (zh) 三维点云数据的全景分割方法、装置、设备及介质
CN109857244B (zh) 一种手势识别方法、装置、终端设备、存储介质及vr眼镜
CN114489341A (zh) 手势的确定方法和装置、电子设备和存储介质
CN114821034A (zh) 目标检测模型的训练方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518055 Shenzhen, Guangdong, Nanshan District Xili street, No. 1001, Zhiyuan Road, B1 9.

Applicant after: Shenzhen daotong intelligent Aviation Technology Co.,Ltd.

Address before: 518055 Shenzhen, Guangdong, Nanshan District Xili street, No. 1001, Zhiyuan Road, B1 9.

Applicant before: AUTEL ROBOTICS Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant