CN111709422A - 基于神经网络的图像识别方法、装置和计算机设备 - Google Patents

基于神经网络的图像识别方法、装置和计算机设备 Download PDF

Info

Publication number
CN111709422A
CN111709422A CN202010574566.0A CN202010574566A CN111709422A CN 111709422 A CN111709422 A CN 111709422A CN 202010574566 A CN202010574566 A CN 202010574566A CN 111709422 A CN111709422 A CN 111709422A
Authority
CN
China
Prior art keywords
target image
segmented
pixel
image
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010574566.0A
Other languages
English (en)
Inventor
鄢伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Pension Insurance Corp
Original Assignee
Ping An Pension Insurance Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Pension Insurance Corp filed Critical Ping An Pension Insurance Corp
Priority to CN202010574566.0A priority Critical patent/CN111709422A/zh
Publication of CN111709422A publication Critical patent/CN111709422A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能,提供一种基于神经网络的图像识别方法、装置、计算机设备和存储介质。所述方法包括:获取目标图像,目标图像中包括目标信息;将目标图像按照预设比例分割,得到各个分割后的目标图像;计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息。此外,本发明还涉及区块链技术,图像和目标信息可存储于区块链中,采用本方法能够提高识别目标图像的准确性,从而提高得到目标信息的准确性。本申请可应用于智慧政务中,从而推动智慧城市的建设。

Description

基于神经网络的图像识别方法、装置和计算机设备
技术领域
本申请涉及互联网技术领域,特别是涉及一种基于神经网络的图像识别方法、装置、计算机设备和存储介质。
背景技术
随着移动互联网时代的快速发展,用户通过线上处理各种事务的倾向逐渐升高,线上业务比例日益扩大。目前,用户通过将各种事务文件进行扫描,然后上传到线上事务处理平台进行审核,线上事务处理平台按照设定好的规则对线上扫描图像进行识别,得到图像信息,然后事务处理人员对图像信息进行审核处理。然而,通过预设规则识别扫描图像,使得到的图像信息的准确性比较低,影响事务处理效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高扫描图像识别准确性的基于神经网络的图像识别方法、装置、计算机设备和存储介质。
一种基于神经网络的图像识别方法,所述方法包括:
获取目标图像,目标图像中包括目标信息;
将目标图像按照预设比例分割,得到各个分割后的目标图像;
计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;
根据各个分割后的目标图像对应的识别结果得到目标信息。
在其中一个实施例中,计算各个分割后的目标图像对应的像素读取路径,包括:
获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的空白像素点和非空白像素点;
对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径。
在其中一个实施例中,对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径,包括:
确定非空白像素点中起始像素点和终止像素点;
获取当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离;
根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,得到分割后的目标图像对应的像素读取路径。
在其中一个实施例中,像素分类模型的训练步骤包括:
获取历史目标图像,历史目标图像携带有像素点标签,像素点标签包括空白标签和非空白标签;
根据历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的像素分类模型。
在其中一个实施例中,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果,包括:
计算像素读取路径中各个像素点对应的二维矩阵向量;
将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
在其中一个实施例中,在根据各个分割后的目标图像对应的识别结果得到目标信息之后,还包括:
将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端;
将目标图像、目标信息和审核结果关联存储到区块链中。
在其中一个实施例中,目标图像识别模型的训练步骤,包括:
获取历史目标图像和对应的历史目标信息,历史目标图像和对应的历史目标信息存储于区块链中;
将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息;
计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型。
一种基于神经网络的图像识别装置,所述装置包括:
图像获取模块,用于获取目标图像,目标图像中包括目标信息;
图像分割模块,用于将目标图像按照预设比例分割,得到各个分割后的目标图像;
图像识别模块,用于计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;
信息得到模块,用于根据各个分割后的目标图像对应的识别结果得到目标信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标图像,目标图像中包括目标信息;
将目标图像按照预设比例分割,得到各个分割后的目标图像;
计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;
根据各个分割后的目标图像对应的识别结果得到目标信息。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标图像,目标图像中包括目标信息;
将目标图像按照预设比例分割,得到各个分割后的目标图像;
计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;
根据各个分割后的目标图像对应的识别结果得到目标信息。
上述基于神经网络的图像识别方法、装置、计算机设备和存储介质,通过获取目标图像,目标图像中包括目标信息;将目标图像按照预设比例分割,得到各个分割后的目标图像;计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息。通过将图像进行分割,并计算分割后图像对应的像素读取路径,按照像素读取路径进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息,提高了识别目标图像的准确性,从而提高了得到的目标信息的准确性。
附图说明
图1为一个实施例中基于神经网络的图像识别方法的应用环境图;
图2为一个实施例中基于神经网络的图像识别方法的流程示意图;
图3为一个实施例中得到像素读取路径的流程示意图;
图4为另一个实施例中得到像素读取路径的流程示意图;
图5为一个实施例中训练像素分类模型的流程示意图;
图6为一个实施例中得到识别结果的流程示意图;
图7为一个实施例中训练目标图像识别模型的流程示意图;
图8为一个实施例中基于神经网络的图像识别装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于神经网络的图像识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取到目标用户通过终端102上传的目标图像,目标图像中包括目标信息;服务器104将目标图像按照预设比例分割,得到各个分割后的目标图像;服务器104计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;服务器104根据各个分割后的目标图像对应的识别结果得到目标信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于神经网络的图像识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
S202,获取目标图像,目标图像中包括目标信息。
其中,目标图像是指包括有目标信息的图像,目标信息是指用户要进行处理的事务的信息,目标信息可以是合同信息、政务文件信息、申请事务信息等等。比如,用户要进行线上投保,目标图像是投保单图像,投保单亦称“要保单”或“投保申请书”。投保人申请保险的一种书面形式。通常由保险人提供,即由投保人填明订立保险单所需要的项目。主要内容包括:被保险人的名称;保险标的名称及存放地点(如投保运输工具或运输货物,还须注明运输工具名称、货物数量及目的地等);投保的险别;保险期限;保险价值及保险金额等。目标图像是指使用扫描工具进行扫描得到的图像。扫描工具用于将纸质文档扫描成电子图像。目标信息是指目标图像中的主要内容。
具体地,用户通过线上进行事务处理时,将纸质的事务文档通过扫描工具扫描得到电子图像,然后将电子图像上传到要进行事务处理的事务处理平台,事务处理平台将得到的电子图像发送至服务器中,服务器获取到该用户对应的目标图像。
S204,将目标图像按照预设比例分割,得到各个分割后的目标图像。
具体地,服务器将目标图像按照预先设置好的比例进行图像分割,得到各个分割后的目标图像区域。比如,可以按照要处理事务中每个项目占据的大小来确定图像分割比例,使得在分割可以得到不同的项目对应的图像区域。
S206,计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果。
其中,像素读取路径是指分割后的图像中能够快速和精确进行读取的路径。目标图像识别模型是指预设根据历史目标图像数据使用机器学习算法进行训练得到的模型,其中,机器学习算法可以是线性回归算法、逻辑回归算法、支持向量机算法和神经网络算法等等。识别结果是指各个分割后目标图像区域中的目标信息。
具体地,服务器预先训练好目标图像识别模型并搭载在服务器中。通过计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果。
S208,根据各个分割后的目标图像对应的识别结果得到目标信息。
具体地,服务器将各个分割后的目标图像对应的识别结果进行汇总,得到最终的目标对应的目标信息。
在上述实施例中,通过将图像进行分割,并计算分割后图像对应的像素读取路径,按照像素读取路径进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息,提高了识别目标图像对的准确性,从而提高了得到目标信息的准确性。
在一个实施例中,如图3所示,步骤S206,即计算各个分割后的目标图像对应的像素读取路径,包括步骤:
S302,获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的空白像素点和非空白像素点。
其中,像素分类模型是预先根据历史图像数据使用机器学习算法进行训练得到的模型,机器学习算法可以是各种分类识别算法,包括但不限于决策树算法、线性回归算法、逻辑回归算法、支持向量机算法和神经网络算法等等。空白像素点是指图像中未有目标信息的像素点,空白像素点是指图像中有目标信息的像素点。
具体地,服务器在获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的各个空白像素点和各个非空白像素点,其中对空白像素点可以不做处理。
S304,对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径。
其中,最短路径搜索算法用于搜索非空白像素点的最短路径,该最短路径搜索算法可以包括但不限于A*(A-Star)算法等等。
具体地,服务器对每个分割后的目标图像中的非空白像素点使用最短路径搜索算法进行搜索,得到每个分割后的目标图像对应的像素读取路径。其中,可以使用并行线程同时对每个分割后的目标图像中的非空白像素点进行搜索。
在上述实施例中,通过最短路径搜索算法搜索非空白像素中的像素读取路径,能够提高得到像素读取路径的准确性,从而提高识别结果的准确性。
在一个实施例中,如图4所示,步骤S204,即对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径,包括步骤:
S402,确定非空白像素点中起始像素点和终止像素点。
其中,起始像素点是非空白像素点中的最开始搜索到的像素点。终止像素点是指非空白像素点中的最终搜索到的像素都。
具体地,服务器可以根据非空白像素点的位置来确定非空白像素点中起始像素点和终止像素点。比如,当非空白像素点的位置位于预先设置好的起始位置时,可以确定为起始像素点。
S404,获取当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离。
其中,当前搜索像素点是指非空白像素点中的当前搜索到的像素点。第一评价距离是指使用启发函数计算得到起始像素点到当前搜索像素点的评价距离,第二评价距离是指计算出的当前搜索像素点距离终止像素点的预计评价距离。
具体地,服务器获取到当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离。
S406,根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,得到分割后的目标图像对应的像素读取路径。
其中,距离评价值用于表示将当前搜索像素点作为路径的评价值。可以使用如下公式(1)计算得到:
f(n)=g(n)+h(n)
其中,g(n)表示第一评价距离,h(n)标识第二评价距离,f(n)是指距离评价值。
具体地,根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,将当前搜索像素点作为已得到的路径中的像素点,重新选取当前搜索像素点进行计算,当选取的当前搜索像素点为终止像素点时,得到分割后的目标图像对应的像素读取路径。
在上述实施例中,通过计算第一评价距离和第二评价距离得到距离评价值,根据距离评价值来选择路径中的像素点,提高得到像素读取路径的准确性。
在一个实施例中,如图5所示,像素分类模型的训练步骤包括:
S502,获取历史目标图像,历史目标图像携带有像素点标签,像素点标签包括空白标签和非空白标签。
S506,根据历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的像素分类模型。
其中,历史目标图像可以是历史采集的已完成事务处理的目标图像。像素点标签用于标准图像中的像素点类别。空白标签是指图像中未存在目标信息的像素点的标签。非空白标签是指图像中存在目标信息的像素点的标签。训练完成条件包括但不限于损失函数的值达到预设阈值或者训练达到最大迭代次数时。
具体地,服务器获取到历史目标图像,将历史目标图像输入到卷积神经网络算法进行训练,判断损失函数的值是否达到预设阈值,当损失函数的值未达到预设阈值时,重复上述步骤继续进行迭代执行,直到当损失函数的值达到预设阈值时,得到已训练的像素分类模型。其中,损失函数可以是可以使用交叉熵损失函数,传递函数可以使用S型函数等。然后服务器可以将训练得到的像素分类模型进行搭载,方便后续的使用。
在一个实施例中,如图6所示,步骤S206,即按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果,包括:
S602,计算像素读取路径中各个像素点对应的二维矩阵向量。
S604,将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
具体地,服务器可以将像素读取路径中各个像素点进行二值化处理,根据二值化处理结果得到二维矩阵向量。然后将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。在该实施例中,通过计算像素读取路径中各个像素点对应的二维矩阵向量,使用二维矩阵向量进行识别,提高了识别的效率。
在一个实施例中,在步骤S208之后,即在根据各个分割后的目标图像对应的识别结果得到目标信息之后,还包括步骤:
将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端;将目标图像、目标信息和审核结果关联存储到区块链中。
具体地,服务器将识别出的目标信息发送到审核终端进行展示,该审核终端是指审核人员对应的终端。审核人员对展示的目标信息进行审核,使审核终端获取到对目标信息的审核结果,该审核结果包括审核目标信息通过,审核目标信息未通过和审核目标信息有误返回修改等。服务器获取到审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端进行展示,提高了用户使用的便利性,提升了用户体验。在一个实施例中,为进一步保证上述目标图像、目标信息和审核结果信息的私密和安全性,上述目标图像、目标信息和审核结果还可以关联存储于一区块链的节点中。
在一个实施例中,如图7所示,目标图像识别模型的训练步骤,包括:
S702,获取历史目标图像和对应的历史目标信息,历史目标图像和对应的历史目标信息存储于区块链中。
S704,将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息。
具体地,服务器从区块链中获取到历史目标图像和对应的历史目标信息,将每个将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息。
S706,计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型。
具体地,服务器并行计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型,其中训练完成条件包括训练达到预设设置好的最大迭代次数和损失函数的值小于预设阈值,其中损失函数可以是交叉熵损失函数。然后将训练得到的目标图像识别模型搭载到服务器中,方便后续的使用。
在一个具体的实施例中,基于神经网络的图像识别方法应用到线上投保平台中,投保平台服务器获取到用户终端上传的投保单图像,该投保单图像包括三部分内容:投保人信息的部分、被保险信息的部分和投保事项的部分。按照三部分图像占比将投保单图像进行分割,得到投保人信息的部分图像、被保险信息的部分图像和投保事项的部分图像。然后并行计算投保人信息的部分图像、被保险信息的部分图像和投保事项的部分图像对应的像素读取路径,按照所述像素读取路径使用投保单图像识别模型对所述各个分割后的投保单图像进行识别,得到算投保人信息的部分图像对应的投保人信息、被保险信息的部分图像对应的被保险信息和投保事项的部分图像对应的投保事项。根据投保人信息、被保险信息和投保事项得到投保信息,将投保信息发送到将投保信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至投保单图像对应的用户终端进行展示。
在一个具体的实施例中,基于神经网络的图像识别方法应用智慧政务的处理中,智慧政务服务器获取到用户终端上传的待审核政务文件图像,该待审核政务文件包括:政务事项主题、政务事项的具体内容、政务事项的申请人信息和申请时间信息。按照四部分图像占比将投保单图像进行分割,得到政务事项主题的部分图像、政务事项具体内容的部分图像、申请人信息的部分图像和申请时间信息的部分图像。然后并行计算政务事项主题的部分图像、政务事项具体内容的部分图像、申请人信息的部分图像和申请时间信息的部分图像对应的像素读取路径,按照所述像素读取路径使用目标图像识别模型对所述各个分割后的投保单图像进行识别,得到政务事项主题、政务事项的具体内容、政务事项的申请人信息和申请时间信息。根据政务事项主题、政务事项的具体内容、政务事项的申请人信息和申请时间信息得到目标信息,将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至对应的用户终端进行展示。应该理解的是,虽然图2-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种基于神经网络的图像识别装置800,包括:图像获取模块802、图像分割模块804、图像识别模块806和信息得到模块808,其中:
图像获取模块802,用于获取目标图像,目标图像中包括目标信息;
图像分割模块804,用于将目标图像按照预设比例分割,得到各个分割后的目标图像;
图像识别模块806,用于计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;
信息得到模块808,用于根据各个分割后的目标图像对应的识别结果得到目标信息。
在一个实施例中,图像识别模块806,包括:
分类单元,用于获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的空白像素点和非空白像素点;
搜索单元,用于对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,搜索单元还用于确定非空白像素点中起始像素点和终止像素点;获取当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离;根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,基于神经网络的图像识别装置800,还包括:
历史图像获取模块,用于获取历史目标图像,历史目标图像携带有像素点标签,像素点标签包括空白标签和非空白标签;
训练模块,用于根据历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的像素分类模型。
在一个实施例中,图像识别模块806还用于计算像素读取路径中各个像素点对应的二维矩阵向量;将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
在一个实施例中,基于神经网络的图像识别装置800,还包括:
审核模块,用于将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端;
将目标图像、目标信息和审核结果关联存储到区块链中。
在一个实施例中,基于神经网络的图像识别装置800,还包括:
信息获取模块,用于获取历史目标图像和对应的历史目标信息,历史目标图像和对应的历史目标信息存储于区块链中;
历史分割模块,用于将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息;
历史训练模块,用于计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型。
关于基于神经网络的图像识别装置的具体限定可以参见上文中对于基于神经网络的图像识别方法的限定,在此不再赘述。上述基于神经网络的图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于神经网络的图像识别方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取目标图像,目标图像中包括目标信息;将目标图像按照预设比例分割,得到各个分割后的目标图像;计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的空白像素点和非空白像素点;对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定非空白像素点中起始像素点和终止像素点;获取当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离;根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史目标图像,历史目标图像携带有像素点标签,像素点标签包括空白标签和非空白标签;根据历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的像素分类模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算像素读取路径中各个像素点对应的二维矩阵向量;将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史目标图像和对应的历史目标信息;将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息;计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标图像,目标图像中包括目标信息;将目标图像按照预设比例分割,得到各个分割后的目标图像;计算各个分割后的目标图像对应的像素读取路径,按照像素读取路径使用目标图像识别模型对各个分割后的目标图像进行识别,得到各个分割后的目标图像对应的识别结果;根据各个分割后的目标图像对应的识别结果得到目标信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取分割后的目标图像,将分割后的目标图像输入到像素分类模型进行分类识别,得到分割后的目标图像对应的空白像素点和非空白像素点;对非空白像素点使用最短路径搜索算法进行搜索,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定非空白像素点中起始像素点和终止像素点;获取当前搜索像素点,计算起始像素点到当前搜索像素点的第一评价距离,并计算当前搜索像素点到终止像素点的第二评价距离;根据第一评价距离和第二评价距离计算得到距离评价值,当距离评价值小于预设阈值时,得到分割后的目标图像对应的像素读取路径。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史目标图像,历史目标图像携带有像素点标签,像素点标签包括空白标签和非空白标签;根据历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的像素分类模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算像素读取路径中各个像素点对应的二维矩阵向量;将二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将目标信息发送到审核终端进行展示,并获取审核终端返回的审核结果,将审核结果返回至目标图像对应的用户终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史目标图像和对应的历史目标信息;将历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据各个分割后的历史目标图像从历史目标信息中确定对应的分割后的历史目标信息;计算各个分割后的历史目标图像对应的历史像素读取路径,将历史像素读取路径作为输入,并将对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的目标图像识别模型。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于神经网络的图像识别方法,其特征在于,所述方法包括:
获取目标图像,所述目标图像中包括目标信息;
将所述目标图像按照预设比例分割,得到各个分割后的目标图像;
计算所述各个分割后的目标图像对应的像素读取路径,按照所述像素读取路径使用目标图像识别模型对所述各个分割后的目标图像进行识别,得到所述各个分割后的目标图像对应的识别结果;
根据所述各个分割后的目标图像对应的识别结果得到所述目标信息。
2.根据权利要求1所述的方法,其特征在于,所述计算所述各个分割后的目标图像对应的像素读取路径,包括:
获取分割后的目标图像,将所述分割后的目标图像输入到像素分类模型进行分类识别,得到所述分割后的目标图像对应的空白像素点和非空白像素点;
对所述非空白像素点使用最短路径搜索算法进行搜索,得到所述分割后的目标图像对应的像素读取路径。
3.根据权利要求2所述的方法,其特征在于,所述对所述非空白像素点使用最短路径搜索算法进行搜索,得到所述分割后的目标图像对应的像素读取路径,包括:
确定所述非空白像素点中起始像素点和终止像素点;
获取当前搜索像素点,计算所述起始像素点到所述当前搜索像素点的第一评价距离,并计算所述当前搜索像素点到所述终止像素点的第二评价距离;
根据所述第一评价距离和所述第二评价距离计算得到距离评价值,当所述距离评价值小于预设阈值时,得到所述分割后的目标图像对应的像素读取路径。
4.根据权利要求2所述的方法,其特征在于,所述像素分类模型的训练步骤包括:
获取历史目标图像,所述历史目标图像携带有像素点标签,所述像素点标签包括空白标签和非空白标签;
根据所述历史目标图像使用卷积神经网络算法进行训练,当达到训练完成条件时,得到已训练的所述像素分类模型。
5.根据权利要求1所述的方法,其特征在于,所述按照所述像素读取路径使用目标图像识别模型对所述各个分割后的目标图像进行识别,得到所述各个分割后的目标图像对应的识别结果,包括:
计算所述像素读取路径中各个像素点对应的二维矩阵向量;
将所述二维矩阵向量输入到目标图像识别模型中进行识别,得到输出的识别结果。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述各个分割后的目标图像对应的识别结果得到所述目标信息之后,还包括:
将所述目标信息发送到审核终端进行展示,并获取所述审核终端返回的审核结果,将所述审核结果返回至所述目标图像对应的用户终端;
将所述目标图像、所述目标信息和所述审核结果关联存储到区块链中。
7.根据权利要求1所述的方法,其特征在于,所述目标图像识别模型的训练步骤,包括:
获取历史目标图像和对应的历史目标信息,所述历史目标图像和对应的历史目标信息存储于区块链中;
将所述历史目标图像按照预设比例分割,得到各个分割后的历史目标图像,并根据所述各个分割后的历史目标图像从所述历史目标信息中确定对应的分割后的历史目标信息;
计算所述各个分割后的历史目标图像对应的历史像素读取路径,将所述历史像素读取路径作为输入,并将所述对应的分割后的历史目标信息作为输入使用神经网络算法进行训练,当达到训练完成条件时,得到已训练的所述目标图像识别模型。
8.一种基于神经网络的图像识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取目标图像,所述目标图像中包括目标信息;
图像分割模块,用于将所述目标图像按照预设比例分割,得到各个分割后的目标图像;
图像识别模块,用于计算所述各个分割后的目标图像对应的像素读取路径,按照所述像素读取路径使用目标图像识别模型对所述各个分割后的目标图像进行识别,得到所述各个分割后的目标图像对应的识别结果;
信息得到模块,用于根据所述各个分割后的目标图像对应的识别结果得到所述目标信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010574566.0A 2020-06-22 2020-06-22 基于神经网络的图像识别方法、装置和计算机设备 Pending CN111709422A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010574566.0A CN111709422A (zh) 2020-06-22 2020-06-22 基于神经网络的图像识别方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010574566.0A CN111709422A (zh) 2020-06-22 2020-06-22 基于神经网络的图像识别方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN111709422A true CN111709422A (zh) 2020-09-25

Family

ID=72541734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010574566.0A Pending CN111709422A (zh) 2020-06-22 2020-06-22 基于神经网络的图像识别方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111709422A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464724A (zh) * 2020-10-30 2021-03-09 中科院成都信息技术股份有限公司 选票识别方法及系统
CN113139950A (zh) * 2021-05-08 2021-07-20 佳都科技集团股份有限公司 一种目标对象识别的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464724A (zh) * 2020-10-30 2021-03-09 中科院成都信息技术股份有限公司 选票识别方法及系统
CN112464724B (zh) * 2020-10-30 2023-10-24 中科院成都信息技术股份有限公司 选票识别方法及系统
CN113139950A (zh) * 2021-05-08 2021-07-20 佳都科技集团股份有限公司 一种目标对象识别的方法及装置
CN113139950B (zh) * 2021-05-08 2024-04-16 佳都科技集团股份有限公司 一种目标对象识别的方法及装置

Similar Documents

Publication Publication Date Title
CN110930417B (zh) 图像分割模型的训练方法和装置、图像分割方法和装置
CN108898418B (zh) 用户账号检测方法、装置、计算机设备和存储介质
CN111667011A (zh) 损伤检测模型训练、车损检测方法、装置、设备及介质
CN111291264B (zh) 基于机器学习的访问对象预测方法、装置和计算机设备
CN111615702B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN109285105B (zh) 水印检测方法、装置、计算机设备和存储介质
CN108520041B (zh) 文本的行业分类方法、系统、计算机设备和存储介质
CN107886082B (zh) 图像中数学公式检测方法、装置、计算机设备及存储介质
CN109063921B (zh) 客户风险预警的优化处理方法、装置、计算机设备和介质
CN109886330B (zh) 文本检测方法、装置、计算机可读存储介质和计算机设备
CN111666990A (zh) 车辆损伤特征检测方法、装置、计算机设备及存储介质
CN110166522B (zh) 服务器识别方法、装置、可读存储介质和计算机设备
CN112183296B (zh) 模拟票据图像生成、票据图像识别方法和装置
CN112966583A (zh) 图像处理方法、装置、计算机设备和存储介质
CN111709422A (zh) 基于神经网络的图像识别方法、装置和计算机设备
CN113673439A (zh) 基于人工智能的宠物狗识别方法、装置、设备及存储介质
CN112241952A (zh) 大脑中线识别方法、装置、计算机设备及存储介质
CN112464660B (zh) 文本分类模型构建方法以及文本数据处理方法
CN108364024B (zh) 图像匹配方法、装置、计算机设备和存储介质
CN115827877A (zh) 一种提案辅助并案的方法、装置、计算机设备和存储介质
CN113868543B (zh) 推荐对象的排序方法、模型训练方法、装置及电子设备
CN115424001A (zh) 场景相似度估计方法、装置、计算机设备和存储介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN111091022A (zh) 机器视觉的效能评估方法与系统
CN111652245B (zh) 车辆轮廓检测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination