CN112949341A - 一种信息获得方法、装置、电子设备及存储介质 - Google Patents
一种信息获得方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112949341A CN112949341A CN202110414453.9A CN202110414453A CN112949341A CN 112949341 A CN112949341 A CN 112949341A CN 202110414453 A CN202110414453 A CN 202110414453A CN 112949341 A CN112949341 A CN 112949341A
- Authority
- CN
- China
- Prior art keywords
- information
- identified
- image
- category
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1439—Methods for optical code recognition including a method step for retrieval of the optical code
- G06K7/1443—Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Electromagnetism (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Toxicology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种信息获得方法、装置、电子设备及存储介质,涉及计算机技术领域,包括:获得图像采集设备持续采集的、包含待识别对象的图像;针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。由此可见,应用本申请实施例提供的方案可减小信息获得的复杂度。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息获得方法、装置、电子设备及存储介质。
背景技术
在铁路、生产流水线、快递分拣线等场景中,通常需要获得上述场景中车厢、生产品、快递等对象的对象信息,如编号信息、重量信息、体积信息等。
现有技术中,通常在上述对象上配置携带对象信息的图形识别码,例如,在快递上张贴携带收货人信息的二维码、在车厢上安装携带车厢编号的二进制形式的号码板等,然后利用灯光镭射数据采集器灯光照射对象上配置的图形识别码、并采集图形识别码上携带的对象信息。
利用现有技术虽然可以获得对象的信息,但是需要预先生成携带对象信息的图形识别码,并将所生成的图形识别码配置在对象上,此外还需要在对象的经过路线上配置灯光镭射数据采集器,这样后续才能利用上述灯光镭射数据采集器通过识别图形识别码的方式获得对象信息,导致获得对象信息的方式复杂度较高。
发明内容
本申请实施例的目的在于提供一种信息获得方法、装置、电子设备及存储介质,以减小信息获得的复杂度。具体技术方案如下:
第一方面,本申请实施例提供了一种信息获得方法,所述方法包括:
获得图像采集设备持续采集的、包含待识别对象的图像;
针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
本申请的一个实施例中,所述针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,包括:
针对所述待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于所述ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于所述ROI区域的待识别图像的图像数量,在所述图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果。
本申请的一个实施例中,所述针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,包括:
针对所述待识别对象外表面上携带的每一待识别信息,从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果,其中,所述第一图像为:该待识别信息进入所述ROI区域的图像,所述第二图像为:该待识别信息离开所述ROI区域的图像。
本申请的一个实施例中,所述方法还包括:
确定所获得的图像中待识别信息的信息类别;
所述对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,包括:
对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,所述确定所获得的图像中待识别信息的信息类别,包括:
提取所获得的图像的图像特征,根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度;
针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
本申请的一个实施例中,所述提取图像的图像特征,包括:
将所述图像输入预先训练完成的信息类别识别模型中的卷积层,利用所述卷积层提取所述图像的图像特征,其中,所述信息类别识别模型用于识别图像中待识别信息的信息类别,所述信息类别识别模型还包括:归一化层、融合层、非极大值抑制NMS层;
所述根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,包括:
将所述图像特征输入所述归一化层,利用所述归一化层获得所述图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果;
所述针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度,包括:
将各个像素点的预测结果输入所述融合层,利用所述融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
所述根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别,包括:
将所获得的所述图像中的各个待识别信息的信息区域及每一信息区域的置信度输入所述NMS层,利用所述NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
第二方面,本申请实施例提供了一种信息获得装置,所述装置包括:
图像获得模块,用于获得图像采集设备持续采集的、包含待识别对象的图像;
信息获得模块,用于针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
本申请的一个实施例中,所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于所述ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于所述ROI区域的待识别图像的图像数量,在所述图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述第一图像为:该待识别信息进入所述ROI区域的图像,所述第二图像为:该待识别信息离开所述ROI区域的图像。
本申请的一个实施例中,所述装置还包括类别获得模块,用于:确定所获得的图像中待识别信息的信息类别;
所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,所述类别获得模块,包括:
特征提取单元,用于提取所获得的图像的图像特征;
像素点预测单元,用于根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度;
结果融合单元,用于针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
类别获得单元,用于根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
本申请的一个实施例中,所述特征提取单元,具体用于:
将所述图像输入预先训练完成的信息类别识别模型中的卷积层,利用所述卷积层提取所述图像的图像特征,其中,所述信息类别识别模型用于识别图像中待识别信息的信息类别,所述信息类别识别模型还包括:归一化层、融合层、非极大值抑制NMS层;
所述像素点预测单元,具体用于:
将所述图像特征输入所述归一化层,利用所述归一化层获得所述图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果;
所述结果融合单元,具体用于:
将各个像素点的预测结果输入所述融合层,利用所述融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
所述类别获得单元,具体用于:
将所获得的所述图像中的各个待识别信息的信息区域及每一信息区域的置信度输入所述NMS层,利用所述NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
第三方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的信息获得方法。
本申请实施例有益效果:
应用本申请实施例提供的方案获得信息时,首先获得图像采集设备持续采集的、包含待识别对象的图像,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。这样通过图像识别的方式,可以直接获得待识别对象外表面上携带的待识别信息的识别结果,无需配置灯光镭射数据采集器采集待识别对象上携带的图形识别码、再通过识别图形识别码的方式获得识别结果,由此可见,应用本申请实施例提供的方案可以减小信息获得的复杂度。
除此之外,本申请实施例提供的方案中,首先确定待识别信息处于预设的ROI区域的待识别图像,对不同待识别图像中的待识别信息的识别结果进行融合,可以提高所获得的识别结果的准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本申请实施例提供的一种信息获得方法的流程示意图;
图2为本申请实施例提供的一种待识别信息的示意图;
图3为本申请实施例提供的一种ROI区域的示意图;
图4为本申请实施例提供的一种信息类别确定方法的流程示意图;
图5为本申请实施例提供的一种信息类别识别模型的结构示意图;
图6为本申请实施例提供的另一种信息获得方法的流程示意图;
图7为本申请实施例提供的一种火车车厢信息识别结果的示意图;
图8为本申请实施例提供的一种信息获得装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为减小获得对象信息的复杂度,本申请实施例提供了一种信息获得方法、装置、电子设备及存储介质,下面分别进行详细介绍。
参见图1,图1为本申请实施例提供的一种信息获得方法的流程示意图,该方法可以应用于电子计算机、图像采集设备、NVR(Network Video Recorder,网络视频录像机)等。上述信息获得方法包括如下步骤S101-S102。
S101,获得图像采集设备持续采集的、包含待识别对象的图像。
具体的,上述图像采集设备可以部署在待识别对象的运动路线上,从而便于图像采集设备能够采集到经过的待识别对象的图像。
上述待识别对象可以是火车车厢、生产品、快递、车辆等。上述待识别信息中可以记载有待识别对象的体积信息、编号信息、重量信息等。上述待识别信息的形式可以是字符、二维码、条形码等。
待识别对象的外表面上可以携带待识别信息。具体的,上述待识别信息可以是待识别对象外表面上喷绘的信息,例如,假设待识别对象为火车车厢,火车车厢上通常喷绘有车厢编号、车厢荷载、车厢承重、火车标识等,可以将上述喷绘的信息作为火车车厢的待识别信息。参见图2,图2为本申请实施例提供的一种待识别信息的示意图。如图2所示,火车车厢上喷绘有英文标识、数字编号等,可以将上述英文标识、数字编号等作为待识别信息。
除此之外,上述待识别信息还可以是:待识别对象上张贴的广告牌、海报、条幅、横幅等物体上记载的信息,例如,可以将待识别对象上张贴的海报上的字符,作为待识别信息。
具体的,图像采集设备可以部署在能够采集到经过的待识别对象的待识别信息的位置处。例如,假设待识别对象为火车车厢,则图像采集设备可以部署在火车轨道的侧方、上方等位置处,且图像采集设备可以朝向火车轨道,这样当火车车厢经过时,图像采集设备可以采集到火车车厢的待识别信息的图像。
S102,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果。
其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
上述ROI(Region Of Interest,感兴趣区域)区域为图像中待识别对象经过的区域,例如,可以是图像的中部区域、底部区域、上方区域等,具体可以根据应用场景进行设定,本申请实施例并不对此进行限定。这样待识别对象的待识别信息可以出于上述ROI区域内,从而便于后续对
具体的,可以检测图像中待识别对象的待识别信息的位置信息,针对待识别对象外表面上携带的每一待识别信息,可以从所获得的图像中确定该待识别信息的位置处于上述ROI区域内的图像,作为待识别图像,并获得各个待识别图像中该待识别信息的识别结果。进而,可以对上述所获得的各个识别结果进行融合,得到该待识别信息的融合结果,作为最终确定的待识别信息。
本申请的一个实施例中,在上述步骤S101获得图像后,可以对图像中待识别信息进行识别,得到识别结果,并进行存储。这样在步骤S102中确定待识别图像后,可以从所存储的识别结果中查找上述待识别图像中该待识别信息的识别结果,并对所查找到的识别结果进行融合,得到融合结果。
本申请的一个实施例中,也可以在确定出待识别图像后,对待识别图像中该待识别信息进行识别,从而得到待识别图像中该待识别信息的识别结果,然后对上述所获得的各个识别结果进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,在待识别信息为字符信息的情况下,可以利用预先训练完成的字符识别模型对图像中的待识别信息进行识别,还可以利用边缘检测算法检测图像中的边缘信息,根据检测到的边缘信息确定图像中的字符信息,作为识别结果。
除此之外,在待识别信息为二维码、条形码等图形识别码的情况下,在识别得到上述图像识别码之后,还可以利用预先训练的图形识别码识别模型对图像中的图形识别码进行识别,从而获得图形识别码中携带的信息,作为最终的识别结果。
本申请的一个实施例中,在对不同待识别图像中的待识别信息的识别结果进行融合时,可以统计该待识别信息的不同的识别结果的数量,将数量最多的识别结果作为融合结果。例如,假设上述待识别信息为车厢编号,其中5帧待识别图像中对车厢编号进行识别得到的识别结果为“00001”、1帧待识别图像中对车厢编号进行识别得到的识别结果为“00002”,由于识别结果“00001”的数量最多,因此可以将“00001”作为融合结果。
除此之外,还可以统计不同的识别结果的置信度,将置信度最高的识别结果作为融合结果。例如,假设上述待识别信息为重量信息,其中1帧待识别图像中对重量信息进行识别得到的识别结果为“10kg”,置信度为98%,1帧待识别图像中对重量信息进行识别得到的识别结果为“18kg”,置信度为11%,由于识别结果“10kg”的置信度较高,因此可以将“10kg”作为融合结果。
本申请的一个实施例中,上述ROI区域可以是图像内待识别对象经过的区域中,待识别对象能够清晰成像的区域。例如,参见图3,图3为本申请实施例提供的一种ROI区域的示意图,如图所示,由于灯光照射的原因,图像采集设备所采集的图像中矩形框之内的区域较亮,在该矩形区域内待识别对象能够清晰成像,而矩形框之外的区域较暗,因此可以将上述矩形框区域作为ROI区域。
应用上述实施例提供的方案获得信息时,首先获得图像采集设备持续采集的、包含待识别对象的图像,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。这样通过图像识别的方式,可以直接获得待识别对象外表面上携带的待识别信息的识别结果,无需配置灯光镭射数据采集器采集待识别对象上携带的图形识别码、再通过识别图形识别码的方式获得识别结果,由此可见,应用上述实施例提供的方案可以减小信息获得的复杂度。
除此之外,上述实施例提供的方案中,首先确定待识别信息处于预设的ROI区域的待识别图像,对不同待识别图像中的待识别信息的识别结果进行融合,可以提高所获得的识别结果的准确度。
本申请的一个实施例中,对于上述步骤S102在获得识别结果时,可以针对待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于ROI区域的待识别图像的图像数量,在图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果。
其中,上述数量阈值可以是5、8、10等,本申请实施例并不对此进行限定。
具体的,针对待识别对象外表面上携带的每一待识别信息,可以对所获得的图像中该待识别信息的位置信息进行检测,进而根据所检测到的位置信息判断图像中该待识别信息是否处于ROI区域,若为是,则可以对该待识别信息进行跟踪,统计该待识别信息处于ROI区域的待识别图像的图像数量,直到该待识别信息离开上述ROI区域。最后可以判断上述图像数量是否大于等于上述数量阈值,若为是,则认为成功捕获到了该待识别信息,因此可以对所获得的每一待识别图像中的待识别信息进行识别。
本申请的一个实施例中,在对待识别信息进行跟踪时,可以根据所检测到不同待识别图像中的待识别信息的位置信息,对该待识别信息进行跟踪。
具体的,可以将不同图像中的、位置信息的重合度较高的待识别信息作为同一待识别信息,进而实现对待识别信息的跟踪。
除此之外,还可以位置处于同一路线的待识别信息作为同一待识别信息,例如,假设待识别对象为火车车厢,由于火车是按照轨道运行的,火车车厢上的各个待识别信息都有固定的路线,因此,可以将位置处于同一路线的待识别信息作为同一待识别信息。
本申请的一个实施例中,在上述步骤S101获得图像后,可以对图像中的待识别信息进行检测,获得待识别信息的位置信息,进而根据上述位置信息判断待识别信息是否处于ROI区域内,若为是,则可以认为触发开始,可以对该待识别信息进行跟踪,对于接下来所获得的图像中的该待识别信息进行跟踪,并统计跟踪到的待识别图像的数量,直至跟踪失败或者统计得到的数量大于等于数量阈值,认为触发结束,然后可以获得对每一待识别图像中的该待识别信息进行识别得到的识别结果。
本申请的一个实施例中,在判断待识别信息是否进入ROI区域时,可以判断待识别信息的位置是否处于ROI区域内,其中,待识别信息的位置可以是待识别信息的信息区域的中心所在的位置、待识别信息的信息区域的边界点所在的位置等。
除此之外,还可以判断图像中待识别信息的位置是否跨进ROI区域的边界线,若为是,则认为待识别信息处于ROI区域内。
本申请的一个实施例中,针对待识别对象外表面上携带的每一待识别信息,可以从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果。
其中,第一图像为:该待识别信息进入ROI区域的图像,第二图像为:该待识别信息离开ROI区域的图像。
具体的,针对所获得的图像,可以识别所获得的图像中待识别信息的位置信息,根据位置信息判断图像中的待识别信息是否进入上述ROI区域,若为是,则可以将该图像作为第一图像,还可以判断图像中的待识别信息是否离开上述ROI区域,若为是,则可以将上述图像作为第二图像。由于第一图像和第二图像分别为待识别信息进入和离开ROI区域的图像,因此认为第一图像和第二图像之间所获得的图像为待识别信息处于上述ROI区域内的待识别图像,进而可以获得上述待识别图像中待识别信息的识别结果。
本申请的一个实施例中,可以预先对图像中的待识别信息进行跟踪,这样便于后续判断图像中的每一待识别信息是否进入和/或离开上述ROI区域。
本申请的一个实施例中,可以将ROI区域的左侧边界线、右侧边界线分别作为第一边界线和第二边界线,或者将ROI区域的上方边界线、下方边界线分别作为第一边界线和第二边界线。在上述步骤S101获得图像后,可以对图像中的待识别信息进行检测,得到待识别信息的位置信息,并对各个待识别信息进行跟踪。根据跟踪结果判断待识别信息是否跨过第一边界线,将待识别信息跨过第一边界线的图像作为第一图像,继续判断待识别信息是否跨过第二边界线,将待识别信息跨过第二边界线的图像作为第二图像,将第一图像和第二图像之间的图像作为待识别图像,并获得待识别图像中待识别信息的识别结果。
本申请的一个实施例中,还可以确定所获得的图像中待识别信息的信息类别。例如,在待识别对象为生产品的情况下,信息类别可以是体积信息、重量信息等,在待识别对象为汽车的情况下,信息类别可以是车牌号、车辆型号、核载人数等。这样不仅得到待识别信息的识别结果,还获得待识别信息的类别,所获得的信息更加丰富。
本申请的一个实施例中,对于上述步骤S102在对识别结果进行融合时,可以对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
参见图4,图4为本申请实施例提供的一种信息类别确定方法的流程示意图,该方法包括如下步骤S401-S404。
S401,提取所获得的图像的图像特征。
其中,上述图像特征中可以包含图像内各个像素点的语义特征、纹理特征、位置特征等。在提取得到图像特征后,可以根据所提取的特征得到图像对应的特征图,从而便于后续根据该特征图得到各个像素点所属的类别。
本申请的一个实施例中,可以利用降采样的方式提取图像的图像特征。其中,在进行降采样处理时,可以利用卷积网络对图像进行卷积变换,从而实现降采样处理。也可以利用预先训练完成的图像特征提取算法,提取图像的图像特征。
S402,根据所提取的图像特征确定图像中各个像素点所属的类别,并获得每一像素点的预测结果。
其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度。
具体的,图像中的像素点可以分为背景像素点和目标像素点,上述目标像素点为:属于待识别信息的像素点,背景像素点为:不属于待识别信息的像素点。针对目标像素点,由于图像中可能存在多个待识别信息,因此目标像素点可能属于不同的待识别信息,可以将预测得到的、像素点所属的待识别信息的类别,作为像素点的类别。
除此之外,还可以预测像素点所属的待识别信息在图像中所占的信息区域,以及该信息区域的置信度。信息区域的置信度表征:由像素点预测得到的信息区域的可靠程度。
本申请的一个实施例中,在预测像素点所属的类别时,可以将上述S401得到的图像特征输入预先训练得到的类别分类模型,得到该类别分类模型输出的各个像素点所属的待识别信息的类别,作为各个像素点的类别。
本申请的一个实施例中,在得到各个像素点所属的待识别信息的信息区域和置信度时,可以将上述图像特征和像素点的类别输入预先训练得到的区域预测模型,得到该区域预测模型输出的各个像素点所属的待识别信息的信息区域和各个信息区域的置信度。
S403,针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得图像中的各个待识别信息的信息区域及每一信息区域的置信度。
具体的,针对属于同一类别的像素点,由于同一类别的像素点属于同一待识别信息,因此可以首先对同一类别的像素点对应的信息区域进行融合,所得到的融合后的区域即为该类别的待识别信息的信息区域。除此之外,还可以对上述像素点对应的信息区域的置信度进行融合,将融合后的置信度作为该类别的待识别信息的信息区域的置信度。
本申请的一个实施例中,在对同一类别的像素点对应的信息区域进行融合时,可以将上述像素点对应的信息区域进行合并,将合并后的区域作为该类别的待识别信息的信息区域。还可以确定上述像素点对应的信息区域的外接矩形区域、外接圆形区域、外接椭圆形区域等,作为该类别的待识别信息的信息区域。
本申请的一个实施例中,在对同一类别的像素点对应的信息区域的置信度进行融合时,可以计算上述像素点对应的信息区域的置信度之和,作为该类别的待识别信息的信息区域的置信度。除此之外,还可以确定上述像素点对应的信息区域的置信度中的最大置信度,作为该类别的待识别信息的信息区域的置信度。另外,还可以计算上述像素点对应的信息区域的置信度的均值,作为该类别的待识别信息的信息区域的置信度。
例如,假设待识别对象为快递,待识别信息为重量,属于重量类别的像素点包括像素点P1、P2……P10,上述步骤S402中预测得到的上述像素点所属的待识别信息的信息区域分别为R1、R2……R10,各个信息区域的置信度分别为K1、K2……K10,可以对上述信息区域R1、R2……R10进行合并,将合并后的区域作为上述待识别信息重量的信息区域。另外,还可以计算上述置信度K1、K2……K10之和,作为上述待识别信息重量的信息区域的置信度。
S404,根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
其中,上述交并比为:待识别信息的信息区域之间相交区域的面积,与相并区域的面积之间的比值。
具体的,在上述S403得到各个待识别信息的信息区域和信息区域的置信度后,还可以计算上述信息区域两两之间的交并比,根据信息区域之间的交并比和置信度,对所确定的待识别信息进行筛选,获得筛选后待识别信息的信息类别。
本申请的一个实施例中,针对任意两个待识别信息,可以计算上述两个待识别信息的信息区域的交并比,判断上述交并比是否大于等于预设的比例阈值,若为是,则可以认为上述两个待识别信息的信息区域重合度较高,因此可以认为上述两个待识别信息实际上是一个待识别信息。进而,可以将对应的置信度较高的待识别信息的类别,作为该待识别信息的类别,并将上述两个待识别信息的信息区域之和,作为该待识别信息的信息区域。除此之外,还可以比较上述两个信息区域的置信度的大小,选择对应的置信度较大的信息区域,作为该待识别信息的信息区域,本申请实施例并不对此进行限定。
若两个待识别信息的信息区域的交并比小于上述比例阈值,则不需要进行筛选。
例如,假设存在两个待识别信息F1和F2,其中F1的类别为体积,对应的信息区域的置信度为90;F2的类别为载重,对应的信息区域的置信度为75。计算得到二者信息区域的交并比为80%,上述比例阈值为60%,由于上述交并比大于比例阈值,因此可以将F1和F2作为一个待识别信息Fz,又由于F1对应的信息区域的置信度较高,因此可以将待识别信息Fz的类别作为体积,并将F1和F2的信息区域之和作为Fz的信息区域。
应用上述实施例提供的方案,可以识别得到图像中的待识别信息的信息区域和类别,从而得到待识别信息的结构化数据,从而可以使得所得到的信息更加丰富。
本申请的一个实施例中,在确定信息类别时,可以利用预先训练完成的信息类别识别模型进行待识别信息的信息类别的识别,其中,信息类别识别模型用于识别图像中待识别信息的信息类别,参见图5,图5为本申请实施例提供的一种信息类别识别模型的结构示意图,如图5所示,该模型可以包括:卷积层、归一化层、融合层、非极大值抑制NMS(Non-Maximum Suppression)层等。具体的,可以包括如下步骤A-步骤D。
步骤A,将图像输入预先训练完成的信息类别识别模型中的卷积层,利用卷积层提取图像的图像特征。
具体的,可以利用上述信息类别识别模型的卷积层提取图像的图像特征,并将所提取得到的图像特征输入归一化层。
本申请的一个实施例中,在上述卷积层之前,上述信息类别识别模型中还可以包括解码层,用于对输入的图像进行解码,将解码后的图像输入上述卷积层,再由卷积层对解码后的图像提取图像特征。
步骤B,将图像特征输入归一化层,利用归一化层获得图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果。
具体的,上述归一化层用于接收卷积层输入的图像特征,并利用上述图像特征对各个像素点进行分类,预测每一像素点所属的待识别信息的类别,作为该像素点的类别,并预测每一像素点所属的待识别信息的信息区域,得到每一信息区域的置信度。归一化层在得到预测结果后,将预测结果输入融合层。
步骤C,将各个像素点的预测结果输入融合层,利用融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到图像中的各个待识别信息的信息区域及每一信息区域的置信度。
具体的,上述融合层用于对各个像素点对应的待识别信息的信息区域和置信度进行融合,将融合后的像素点所组成的区域作为待识别信息的信息区域,并将用于融合上述信息区域的像素点的类别作为该待识别信息的信息类别,并通过融合的方式获得上述待识别信息的信息区域的置信度。
步骤D,将所获得的图像中的各个待识别信息的信息区域及每一信息区域的置信度输入NMS层,利用NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
具体的,在得到各个待识别信息的信息区域及每一信息区域的置信度之后,可以将上述信息输入非极大值抑制NMS层,该NMS层可以计算上述信息区域两两之间的交并比,根据信息区域之间的交并比和置信度,对所确定的待识别信息进行筛选,并输出筛选后待识别信息的信息类别。
参见图6,图6为本申请实施例提供的另一种信息获得方法的流程示意图,该方法包括如下步骤S601-S605:
S601,获得图像采集设备持续采集的、包含火车车厢的图像。
具体的,上述图像采集设备可以部署在火车的轨道附近,用于对经过的火车车厢进行图像采集。
上述火车车厢上通常喷绘有车厢编号、车厢荷载、车厢承重、火车标识等,可以将上述喷绘的信息作为火车车厢的待识别信息。
S602,将所采集的图像输入预先训练完成的信息类别识别模型,获得上述信息类别识别模型输出的火车车厢上的待识别信息的位置和类别,并获得待识别信息的识别结果。
具体的,可以由信息类别识别模型识别图像中各个待识别信息的位置和类别,在获得各个待识别信息的位置后,再由信息内容识别模型对上述待识别信息的内容进行识别,得到待识别信息的识别结果。
其中,上述信息内容识别模型可以是字符识别模型等。
S603,根据所识别到的待识别信息的位置,对各个待识别信息进行跟踪。
具体的,可以将不同图像中的、位置的重合度较高的待识别信息作为同一待识别信息,进而实现对待识别信息的跟踪。
除此之外,由于火车是按照轨道运行的,火车车厢上的各个待识别信息都有固定的路线,因此,可以将位置处于同一路线的待识别信息作为同一待识别信息。
S604,根据跟踪结果确定待识别图像。
其中,上述待识别图像中火车车厢上的待识别信息处于预设的ROI区域。
S605,对不同的待识别图像中的待识别信息的类别和识别结果进行融合,得到火车车厢的车厢信息。
本申请的一个实施例中,在得到车厢信息后,可以将上述车厢信息展示在图像中。
参见图7,图7为本申请实施例提供的一种火车车厢信息识别结果的示意图。该图像中包含多个待识别信息,其类别分别为载重、自重、容积、车型号、车号等,图像中还标注有不同类别的待识别信息的识别结果,如车型号的识别结果为“C70H”,车号的识别结果为“I501911”等。
应用上述实施例提供的方案获得信息时,首先获得图像采集设备持续采集的、包含待识别对象的图像,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。这样通过图像识别的方式,可以直接获得待识别对象外表面上携带的待识别信息的识别结果,无需配置灯光镭射数据采集器采集待识别对象上携带的图形识别码、再通过识别图形识别码的方式获得识别结果,由此可见,应用上述实施例提供的方案可以减小信息获得的复杂度。
除此之外,上述实施例提供的方案中,首先确定待识别信息处于预设的ROI区域的待识别图像,对不同待识别图像中的待识别信息的识别结果进行融合,可以提高所获得的识别结果的准确度。
参见图8,图8为本申请实施例提供的一种信息获得装置的结构示意图,所述装置包括:
图像获得模块801,用于获得图像采集设备持续采集的、包含待识别对象的图像;
信息获得模块802,用于针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
本申请的一个实施例中,所述信息获得模块802,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于所述ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于所述ROI区域的待识别图像的图像数量,在所述图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,所述信息获得模块802,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述第一图像为:该待识别信息进入所述ROI区域的图像,所述第二图像为:该待识别信息离开所述ROI区域的图像。
本申请的一个实施例中,
所述装置还包括类别获得模块,用于:确定所获得的图像中待识别信息的信息类别;
所述信息获得模块802,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
本申请的一个实施例中,所述类别获得模块,包括:
特征提取单元,用于提取所获得的图像的图像特征;
像素点预测单元,用于根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度;
结果融合单元,用于针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
类别获得单元,用于根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
本申请的一个实施例中,所述特征提取单元,具体用于:
将所述图像输入预先训练完成的信息类别识别模型中的卷积层,利用所述卷积层提取所述图像的图像特征,其中,所述信息类别识别模型用于识别图像中待识别信息的信息类别,所述信息类别识别模型还包括:归一化层、融合层、非极大值抑制NMS层;
所述像素点预测单元,具体用于:
将所述图像特征输入所述归一化层,利用所述归一化层获得所述图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果;
所述结果融合单元,具体用于:
将各个像素点的预测结果输入所述融合层,利用所述融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
所述类别获得单元,具体用于:
将所获得的所述图像中的各个待识别信息的信息区域及每一信息区域的置信度输入所述NMS层,利用所述NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
应用上述实施例提供的方案获得信息时,首先获得图像采集设备持续采集的、包含待识别对象的图像,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。这样通过图像识别的方式,可以直接获得待识别对象外表面上携带的待识别信息的识别结果,无需配置灯光镭射数据采集器采集待识别对象上携带的图形识别码、再通过识别图形识别码的方式获得识别结果,由此可见,应用上述实施例提供的方案可以减小信息获得的复杂度。
除此之外,上述实施例提供的方案中,首先确定待识别信息处于预设的ROI区域的待识别图像,对不同待识别图像中的待识别信息的识别结果进行融合,可以提高所获得的识别结果的准确度。
本申请实施例还提供了一种电子设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现上述信息获得方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一信息获得方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一信息获得方法。
应用上述实施例提供的方案获得信息时,首先获得图像采集设备持续采集的、包含待识别对象的图像,针对待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。这样通过图像识别的方式,可以直接获得待识别对象外表面上携带的待识别信息的识别结果,无需配置灯光镭射数据采集器采集待识别对象上携带的图形识别码、再通过识别图形识别码的方式获得识别结果,由此可见,应用上述实施例提供的方案可以减小信息获得的复杂度。
除此之外,上述实施例提供的方案中,首先确定待识别信息处于预设的ROI区域的待识别图像,对不同待识别图像中的待识别信息的识别结果进行融合,可以提高所获得的识别结果的准确度。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、计算机存储介质实施例、计算机可读程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (14)
1.一种信息获得方法,其特征在于,所述方法包括:
获得图像采集设备持续采集的、包含待识别对象的图像;
针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
2.根据权利要求1所述的方法,其特征在于,所述针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,包括:
针对所述待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于所述ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于所述ROI区域的待识别图像的图像数量,在所述图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果。
3.根据权利要求1所述的方法,其特征在于,所述针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,包括:
针对所述待识别对象外表面上携带的每一待识别信息,从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果,其中,所述第一图像为:该待识别信息进入所述ROI区域的图像,所述第二图像为:该待识别信息离开所述ROI区域的图像。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所获得的图像中待识别信息的信息类别;
所述对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,包括:
对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
5.根据权利要求4所述的方法,其特征在于,所述确定所获得的图像中待识别信息的信息类别,包括:
提取所获得的图像的图像特征,根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度;
针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
6.根据权利要求5所述的方法,其特征在于,所述提取图像的图像特征,包括:
将所述图像输入预先训练完成的信息类别识别模型中的卷积层,利用所述卷积层提取所述图像的图像特征,其中,所述信息类别识别模型用于识别图像中待识别信息的信息类别,所述信息类别识别模型还包括:归一化层、融合层、非极大值抑制NMS层;
所述根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,包括:
将所述图像特征输入所述归一化层,利用所述归一化层获得所述图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果;
所述针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度,包括:
将各个像素点的预测结果输入所述融合层,利用所述融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
所述根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别,包括:
将所获得的所述图像中的各个待识别信息的信息区域及每一信息区域的置信度输入所述NMS层,利用所述NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
7.一种信息获得装置,其特征在于,所述装置包括:
图像获得模块,用于获得图像采集设备持续采集的、包含待识别对象的图像;
信息获得模块,用于针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述待识别图像为:所获得的图像中该待识别信息处于预设的感兴趣ROI区域的图像。
8.根据权利要求7所述的装置,其特征在于,所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,在检测到该待识别信息处于所述ROI区域的情况下,对该待识别信息进行跟踪,统计该待识别信息处于所述ROI区域的待识别图像的图像数量,在所述图像数量大于等于预设的数量阈值的情况下,获得对每一待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果。
9.根据权利要求7所述的装置,其特征在于,所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,从所获的图像中确定第一图像至第二图像之间采集的所有图像,作为待识别图像,获得对所确定的待识别图像中的该待识别信息进行识别得到的识别结果,对所获得的不同待识别图像中该待识别信息的识别结果进行融合,得到该待识别信息的融合结果,其中,所述第一图像为:该待识别信息进入所述ROI区域的图像,所述第二图像为:该待识别信息离开所述ROI区域的图像。
10.根据权利要求7所述的装置,其特征在于,
所述装置还包括类别获得模块,用于:确定所获得的图像中待识别信息的信息类别;
所述信息获得模块,具体用于:
针对所述待识别对象外表面上携带的每一待识别信息,获得对待识别图像中的该待识别信息进行识别得到的识别结果,对不同待识别图像中该待识别信息的识别结果和信息类别分别进行融合,得到该待识别信息的融合结果。
11.根据权利要求10所述的装置,其特征在于,所述类别获得模块,包括:
特征提取单元,用于提取所获得的图像的图像特征;
像素点预测单元,用于根据所提取的图像特征确定所述图像中各个像素点所属的类别,并获得每一像素点的预测结果,其中,每一像素点所属的类别为:该像素点所属的待识别信息的信息类别,每一像素点的预测结果包括:该像素点所属待识别信息的信息区域及该信息区域的置信度;
结果融合单元,用于针对属于同一类别的像素点,对预测得到的、每一属于该类别的像素点的预测结果进行融合,获得所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
类别获得单元,用于根据所确定的各个待识别信息的信息区域的置信度及各个信息区域之间的交并比,对所确定的待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
12.根据权利要求11所述的装置,其特征在于,
所述特征提取单元,具体用于:
将所述图像输入预先训练完成的信息类别识别模型中的卷积层,利用所述卷积层提取所述图像的图像特征,其中,所述信息类别识别模型用于识别图像中待识别信息的信息类别,所述信息类别识别模型还包括:归一化层、融合层、非极大值抑制NMS层;
所述像素点预测单元,具体用于:
将所述图像特征输入所述归一化层,利用所述归一化层获得所述图像中每一像素点所属待识别信息的信息类别,作为该像素点所属的类别,并预测得到该像素点所属待识别信息的信息区域及信息区域的置信度,作为该待识别信息的预测结果;
所述结果融合单元,具体用于:
将各个像素点的预测结果输入所述融合层,利用所述融合层在类别通道上对属于同一类别的像素点的预测结果进行融合,得到所述图像中的各个待识别信息的信息区域及每一信息区域的置信度;
所述类别获得单元,具体用于:
将所获得的所述图像中的各个待识别信息的信息区域及每一信息区域的置信度输入所述NMS层,利用所述NMS层获得各个待识别信息的信息区域之间的交并比,根据所获得的交并比对各个待识别信息进行筛选,获得筛选后图像中待识别信息的信息类别。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110414453.9A CN112949341B (zh) | 2021-04-16 | 2021-04-16 | 一种信息获得方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110414453.9A CN112949341B (zh) | 2021-04-16 | 2021-04-16 | 一种信息获得方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949341A true CN112949341A (zh) | 2021-06-11 |
CN112949341B CN112949341B (zh) | 2023-09-05 |
Family
ID=76232971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110414453.9A Active CN112949341B (zh) | 2021-04-16 | 2021-04-16 | 一种信息获得方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949341B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869357A (zh) * | 2021-08-17 | 2021-12-31 | 浙江大华技术股份有限公司 | 属性类别识别方法、设备及计算机存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682596A (zh) * | 2016-12-14 | 2017-05-17 | 苏州航天系统工程有限公司 | 一种基于视频图像分析的违规垂钓监测方法 |
CN110135394A (zh) * | 2019-05-27 | 2019-08-16 | 杭州亚美利嘉科技有限公司 | 区域占用和车牌识别方法及装置 |
CN110516517A (zh) * | 2018-05-22 | 2019-11-29 | 杭州海康威视数字技术股份有限公司 | 一种基于多帧图像的目标识别方法、装置及设备 |
CN110852258A (zh) * | 2019-11-08 | 2020-02-28 | 北京字节跳动网络技术有限公司 | 物体检测方法、装置、设备及存储介质 |
CN111767908A (zh) * | 2019-04-02 | 2020-10-13 | 顺丰科技有限公司 | 字符检测方法、装置、检测设备及存储介质 |
CN111783620A (zh) * | 2020-06-29 | 2020-10-16 | 北京百度网讯科技有限公司 | 表情识别方法、装置、设备及存储介质 |
-
2021
- 2021-04-16 CN CN202110414453.9A patent/CN112949341B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682596A (zh) * | 2016-12-14 | 2017-05-17 | 苏州航天系统工程有限公司 | 一种基于视频图像分析的违规垂钓监测方法 |
CN110516517A (zh) * | 2018-05-22 | 2019-11-29 | 杭州海康威视数字技术股份有限公司 | 一种基于多帧图像的目标识别方法、装置及设备 |
CN111767908A (zh) * | 2019-04-02 | 2020-10-13 | 顺丰科技有限公司 | 字符检测方法、装置、检测设备及存储介质 |
CN110135394A (zh) * | 2019-05-27 | 2019-08-16 | 杭州亚美利嘉科技有限公司 | 区域占用和车牌识别方法及装置 |
CN110852258A (zh) * | 2019-11-08 | 2020-02-28 | 北京字节跳动网络技术有限公司 | 物体检测方法、装置、设备及存储介质 |
CN111783620A (zh) * | 2020-06-29 | 2020-10-16 | 北京百度网讯科技有限公司 | 表情识别方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869357A (zh) * | 2021-08-17 | 2021-12-31 | 浙江大华技术股份有限公司 | 属性类别识别方法、设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112949341B (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | A robust license plate detection and character recognition algorithm based on a combined feature extraction model and BPNN | |
CN110119726B (zh) | 一种基于YOLOv3模型的车辆品牌多角度识别方法 | |
CN112487848B (zh) | 文字识别方法和终端设备 | |
CN111382704A (zh) | 基于深度学习的车辆压线违章判断方法、装置及存储介质 | |
CN110555347B (zh) | 具有危险载货行为的车辆目标识别方法、装置及电子设备 | |
CN111274926B (zh) | 图像数据筛选方法、装置、计算机设备和存储介质 | |
CN112163525B (zh) | 一种事件类型预测方法、装置、电子设备及存储介质 | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
Abdellatif et al. | A low cost IoT-based Arabic license plate recognition model for smart parking systems | |
Salma et al. | Development of ANPR framework for Pakistani vehicle number plates using object detection and OCR | |
CN112733666A (zh) | 一种难例图像的搜集、及模型训练方法、设备及存储介质 | |
CN111881741A (zh) | 车牌识别方法、装置、计算机设备和计算机可读存储介质 | |
CN108573244B (zh) | 一种车辆检测方法、装置及系统 | |
Llopis-Castelló et al. | Automatic classification and quantification of basic distresses on urban flexible pavement through convolutional neural networks | |
CN112861567B (zh) | 一种车型分类方法及装置 | |
CN110728193B (zh) | 一种脸部图像丰富度特征的检测方法及设备 | |
Ali et al. | License plate recognition system | |
Kejriwal et al. | Vehicle detection and counting using deep learning basedYOLO and deep SORT algorithm for urban traffic management system | |
Al Nasim et al. | An automated approach for the recognition of bengali license plates | |
CN112949341B (zh) | 一种信息获得方法、装置、电子设备及存储介质 | |
Kiew et al. | Vehicle route tracking system based on vehicle registration number recognition using template matching algorithm | |
CN111126112A (zh) | 候选区域确定方法和装置 | |
CN116109874A (zh) | 一种检测方法、装置、电子设备和存储介质 | |
CN115512315A (zh) | 一种非机动车儿童搭乘检测方法、电子设备及存储介质 | |
Zhang et al. | An effective method for automated railcar number detection and recognition based on deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |