CN111985486A - 图像信息的识别方法及装置、存储介质、计算机设备 - Google Patents

图像信息的识别方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN111985486A
CN111985486A CN202010898471.4A CN202010898471A CN111985486A CN 111985486 A CN111985486 A CN 111985486A CN 202010898471 A CN202010898471 A CN 202010898471A CN 111985486 A CN111985486 A CN 111985486A
Authority
CN
China
Prior art keywords
image information
character
preset
recognition
medical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010898471.4A
Other languages
English (en)
Inventor
黎安
王航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202010898471.4A priority Critical patent/CN111985486A/zh
Publication of CN111985486A publication Critical patent/CN111985486A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像信息的识别方法及装置、存储介质、计算机设备,涉及数据处理技术领域,主要目的在于解决现有医疗发票中图像信息的识别效率低的问题。包括:从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。主要用于图像信息的识别。

Description

图像信息的识别方法及装置、存储介质、计算机设备
技术领域
本发明涉及一种数据处理技术领域,特别是涉及一种图像信息的识别方法及装置、存储介质、计算机设备。
背景技术
随着医疗业务的逐步完善,医疗发票对于不同需求的报销起到重要的作用,因此,需要审核方需要多大量的医疗发票进行核实处理。其中,为减少人力、物力资源的浪费,会将医疗发票录入至计算机中进行识别,以便直接将识别的结果录入系统进行核实。
本申请发明人在研究中发现,现有在对发票的识别过程中,由于需要对纸质发票进行扫描,基于操作缺陷、纸质因素等影响,得到的医疗发票的图像信息通常较为模糊,在利用文字识别方式对图像信息识别时,无法精确的识别出图像信息中的文字内容,且由于医疗发票中文字内容的特殊性,利用汉字库直接进行自然语言处理,无法满足对医疗发票中医疗内容的识别需求,大大降低了对医疗发票中图像信息的识别效率。
发明内容
有鉴于此,本发明提供一种图像信息的识别方法及装置、存储介质、计算机设备,主要目的在于解决现有医疗发票中图像信息的识别效率低的问题。
依据本发明一个方面,提供了一种图像信息的识别方法,包括:
从区块链网络的不同区块节点中获取医疗发票的图像信息;
基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
进一步地,所述基于已训练的识别模型对所述文字数据进行识别处理之前,所述方法还包括:
获取包含至少一个医疗用语的所述预设文字资源库中的训练样本集;
根据词向量转换算法对所述训练样本集中的训练样本进行词向量转换,得到向量矩阵;
基于主成分分析从所述训练样本中提取匹配所述向量矩阵的特征向量;
基于所述特征向量对卷积神经网络进行训练,得到已训练的识别模型。
进一步地,所述量化参数包括编辑距离、相似度,所述确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数包括:
计算所述完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的相似度;
当计算的相似度大于预设相似阈值时,计算所述文字数据与所述医疗用语之间的编辑距离;
当计算的相似度小于或等于预设相似阈值时,配置所述量化参数为空。
进一步地,所述基于所述图像信息提取文字数据包括:
按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据,其中,所述文字数据中未识别出的文字内容以预设标识进行标记;
对携带有标记的文字数据进行标识替换处理,所述标识替换处理用于替换所述标记为匹配所述文字数据的文字内容;
将完成替换处理的所述文字数据进行词向量转换,以进行识别处理。
进一步地,所述对携带有标记的文字数据进行标识替换处理之前,所述方法还包括:
基于所述预设文字资源库建立不同文字内容的替换映射关系,所述替换映射关系中包括待替换文字内容的前文字内容、后文字内容之间的映射关系;
所述对携带有标记的文字数据进行标识替换处理包括:
依次对比携带有标记的文字数据中各标识的前文字内容、后文字内容,根据所述替换映射关系确定与所述前文字内容、后文字内容匹配的替换文字内容,并将确定的替换文字内容替换至所述标记处,得到替换处理后的文字内容。
进一步地,所述按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据之前,所述方法还包括:
获取所述图像信息中的直线,并确定所述直线的倾斜角度与所述图像信息的基准角度的差值;
利用所述差值对所述图像信息进行旋转处理。
进一步地,所述方法还包括:
当所述量化参数不符合预设量化范围时,生成包含有所述图像信息、所述文字数据的处理请求信息;
基于所述区块链网络的公钥将所述处理请求信息发送至所述区块节点中,以请求对所述处理请求信息进行识别;
接收所述所述处理请求信息的识别结果,并将所述识别结果更新至所述识别模型的训练样本集中。
依据本发明另一个方面,提供了一种图像信息的识别装置,包括:
获取模块,用于从区块链网络的不同区块节点中获取医疗发票的图像信息;
处理模块,用于基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
第一确定模块,用于确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
第二确定模块,用于当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
进一步地,所述装置还包括:转换模块,提取模块,训练模块,
所述获取模块,还用于获取包含至少一个医疗用语的所述预设文字资源库中的训练样本集;
所述转换模块,用于根据词向量转换算法对所述训练样本集中的训练样本进行词向量转换,得到向量矩阵;
所述提取模块,用于基于主成分分析从所述训练样本中提取匹配所述向量矩阵的特征向量;
所述训练模块,用于基于所述特征向量对卷积神经网络进行训练,得到已训练的识别模型。
进一步地,所述量化参数包括编辑距离、相似度,所述第一确定模块包括:
计算单元,用于计算所述完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的相似度;
确定单元,用于当计算的相似度大于预设相似阈值时,计算所述文字数据与所述医疗用语之间的编辑距离;
配置单元,用于当计算的相似度小于或等于预设相似阈值时,配置所述量化参数为空。
进一步地,所述处理模块包括:
识别单元,用于按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据,其中,所述文字数据中未识别出的文字内容以预设标识进行标记;
第一处理单元,用于对携带有标记的文字数据进行标识替换处理,所述标识替换处理用于替换所述标记为匹配所述文字数据的文字内容;
转换单元,用于将完成替换处理的所述文字数据进行词向量转换,以进行识别处理。
进一步地,所述处理模块还包括:建立单元,
所述建立单元,用于基于所述预设文字资源库建立不同文字内容的替换映射关系,所述替换映射关系中包括待替换文字内容的前文字内容、后文字内容之间的映射关系;
所述第一处理单元,具体用于依次对比携带有标记的文字数据中各标识的前文字内容、后文字内容,根据所述替换映射关系确定与所述前文字内容、后文字内容匹配的替换文字内容,并将确定的替换文字内容替换至所述标记处,得到替换处理后的文字内容。
进一步地,所述处理模块还包括:
获取单元,用于获取所述图像信息中的直线,并确定所述直线的倾斜角度与所述图像信息的基准角度的差值;
第二处理单元,用于利用所述差值对所述图像信息进行旋转处理。
进一步地,所述装置还包括:
生成模块,用于当所述量化参数不符合预设量化范围时,生成包含有所述图像信息、所述文字数据的处理请求信息;
发送模块,用于基于所述区块链网络的公钥将所述处理请求信息发送至所述区块节点中,以请求对所述处理请求信息进行识别;
接收模块,用于接收所述所述处理请求信息的识别结果,并将所述识别结果更新至所述识别模型的训练样本集中。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述图像信息的识别方法对应的操作。
根据本发明的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述图像信息的识别方法对应的操作。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明提供了一种图像信息的识别方法及装置、存储介质、计算机设备,本发明实施例通过从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果,实现基于机器学习与识别校正的结合完成对医疗内容的准确识别,大大提高了识别的深度,从而满足对医疗发票中医疗内容的高效识别。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种图像信息的识别方法流程图;
图2示出了本发明实施例提供的另一种图像信息的识别方法流程图;
图3示出了本发明实施例提供的一种图像信息的识别装置组成框图;
图4示出了本发明实施例提供的另一种图像信息的识别装置组成框图;
图5示出了本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有医疗发票中图像信息的识别效率低的问题,使得对医疗发票扫描得到的图像信息中准确的识别出医疗发票的具体文字内容,本发明实施例提出了一种图像信息的识别,用于数字医疗中对医疗发票的内容进行识别。
本发明实施例提供了一种图像信息的识别方法,如图1所示,该方法包括:
101、从区块链网络的不同区块节点中获取医疗发票的图像信息。
其中,所述医疗发票的图像信为数字医疗系统中通过扫描纸质医疗发票存储在区块节点中,当对图像信息进行识别时,从区块节点中获取图像信息。
另外,由于各医院方需要对本院的财务信息进行保密,即对医疗发票进行扫描得到的图像信息保密,为了确保不同图像信息进行识别的安全性,在扫描采集图像信息时,以区块链网络中的不同区块节点存储不同院方的图像信息,并通过下发秘钥供服务端进行识别者处理。本发明实施例中,密钥包含公钥与私钥,每个区块节点对应一个区块节点标识,每个院方分配一个私钥,且对应一个区块节点标识,用以表征身份,院方可以根据分配的私钥进行对区块节点标识对应的区块节点中图像信息进行获取,公钥用于解密院方对应区块节点中进行识别的图像信息,从而确保医疗发票的安全性及私密性,提高图像信息的识别的效率。
102、基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理。
本发明实施例中,为了对图像信息进行识别,首先需要从图像信息中提取出文字数据,由于医疗发票为各医院方的发票,则从图像信息中提取的文字数据包括药品名称、数量,以及医院名称等文字数据,例如,盐酸溶液、酸溶液、第一市医院、第二市医院等,本发明实施例不做具体限定。另外,所述识别模型用于对文字数据进行识别,以确定具体的文字内容,所述识别模型为机器学习模型,如神经网络算法等,本发明实施例不做具体限定,且对于识别模型为基于主成分分析进行特征提取训练得到的,以便基于具有高效特征提取的主成分分析从多个待训练的训练数据中提取出具有识别高效性的特征,对识别模型进行训练,以基于已训练的识别模型对文字数据进行识别处理,本发明实施例中不做具体限定。
103、确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数。
其中,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的,所述医疗用语为不同院方已确定出的医院名称、药品名称等内容,所述量化参数包括编辑距离、相似度。具体的,基于识别出的文字数据与资源医疗用语计算编辑距离以及相似度,例如,识别出的“盐酸溶液”与预设文字资源库中的对应“盐酸碱液”、“醋酸溶液”、“碳酸溶液”“盐酸溶液”之间的编辑距离、相似度。
需要说明的是,在自然语言处理中,编辑距离为二个字符串的差异程度的量化量测,具体为需要多少次的处理才能将一个字符串变成另一个字符串。相似度为一个字符串与另一个字符串之间向量距离,因此,确定包含编辑距离、相似度的量化参数,以提高对图像信息中文字内容的识别准确性。
104、当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
本发明实施例中,当量化参数符合预设量化范围时,说明文字数据与预设文字资源库中对应的医疗用语是匹配的,因此,将进行对比的医疗用语作为图像信息的识别结果,得到准确性高的识别结果。例如,识别出的文字数据“盐酸溶液”与医疗用语的“盐酸溶液”,量化参数中的编辑距离小于0.3,相似度大于0.8时,则将医疗用语“盐酸溶液”作为识别结果。
本发明提供了一种图像信息的识别方法,本发明实施例通过从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果,实现基于机器学习与识别校正的结合完成对医疗内容的准确识别,大大提高了识别的深度,从而满足对医疗发票中医疗内容的高效识别。
本发明实施例提供了另一种图像信息的识别方法,如图2所示,该方法包括:
201、获取包含至少一个医疗用语的所述预设文字资源库中的训练样本集。
本发明实施例中,为了满足对图像信息进行识别需求,利用识别模型进行文字数据的识别,需要预先对识别模型进行训练,因此,为了训练得到识别效率高的识别模型,获取预设文字资源库中的训练样本集。其中,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的,记录有至少一个医疗用语,所述医疗用语为不同院方已确定出的医院名称、药品名称等词语,本发明实施例不做具体限定。
需要说明的是,为了确保隐私性,在构建训练集时,通过区块链结构,从区块链网络的不同区块节点中获取可以作为训练数据的药品名称文字数据、医院名称数据等,即每个医院方存储在各自具有私钥的区块节点中一个对应的预设文字资源库,当进行识别模型训练时,从全部的预设文字资源库中获取训练样本集,得到待训练的数据。
202、根据词向量转换算法对所述训练样本集中的训练样本进行词向量转换,得到向量矩阵。
本发明实施例中,由于识别模型为作为数学算法的机器学习模型,且作为样本集中的训练样本为文字形式的医疗用语,因此,在进行训练时,为了满足对模型训练的量化需求,利用次向量转换算法对训练样本集中的训练样本进行词向量转换,得到向量矩阵用于进行模型训练。其中,利用word2vec算法对训练样本,如医药名文字数据、医院名文字数据进行词向量转换。具体的,词向量的转换过程,可以利用one-hot编码将训练样本进行数值化处理,即得到一个只含一个1、其他都是0的向量来唯一表示词语,然后基于Word2vec算法进一步地得到药品名、医院名的词向量。
需要说明的是,Word2Vec是一种浅层神经网络,包含输入层x,隐藏层h和输出层o。输入层、输出层的维度为N(词汇表的大小),隐藏层维度为D(词向量的维度)。输入层与隐藏层之间的网络权重矩阵为V(N×D),输入层与隐藏层之间的网络权重矩阵为V'(N×D),h=xV,o=softmax(V'h)。Word2vec算法输入层x接收单词a的one-hot编码,输出层o计算出所有单词出现在单词a上下文的概率,概率用softmax计算。Word2vec算法在语料库中训练,使单词出现的条件概率尽可能符合语料库中的分布。训练完后,得到的权重向量矩阵V就是最终的词向量矩阵,而V'是词作为预测输出时的向量矩阵,本发明实施例不做具体限定。
203、基于主成分分析从所述训练样本中提取匹配所述向量矩阵的特征向量。
对于本发明实施例,为了利用识别模型进行识别训练,提高对模型训练的精度,通过对转换为向量矩阵的训练样本提取特征向量。具体的,基于主成分分析方法提取向量矩阵的特征向量,以将提取的特征向量作为待训练的卷积神经网络的输入进行训练。
本发明实施例中,主成分分析对向量矩阵的具体特征提取过程包括:A、求作为医院名称、药品名称的样本数据集{(x1,y1),(x2,y2),,,(xN,yN)}的N维的主成分即为对样本集的协方差矩阵的n个特征向量矩阵W,其中,x为包含有N个维度的数据特征向量值,y为此条数据的验证结果,对于每个xi进行中心化,
Figure BDA0002659218170000101
B、计算样本协方差矩阵;C、对协方差矩阵进行特征值分解;D、取出最大的n个特征值对应的特征向量(w1,w2,,,wn),将全部的特征向量标准化后,得到特征向量矩阵W;E、对每个xi转化为特征zi=WTxi,得到筛选后的特征集D’={z1,z2,,,zm}。
204、基于所述特征向量对卷积神经网络进行训练,得到已训练的识别模型。
本发明实施例中,为了使对图像信息中提取的文字数据进行识别,利用包含卷积计算且具有深度结构的前馈神经网络,即卷积神经网络进行训练,训练步骤包括:第一阶段:向前传播阶段:a、从样本集中取一个样本(X,Yp),将X输入网络;b、计算相应的实际输出Op。在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是计算,即输入与每层的权值矩阵相点乘,得到最后的输出结果:Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))。第二阶段,向后传播阶段:a、计算实际输出Op与相应的理想输出Yp的差;b、按极小化误差的方法反向传播调整权矩阵。完成全部的训练过程后,得到基于主成分分析进行改进的CNN预测识别模型。
205、从区块链网络的不同区块节点中获取医疗发票的图像信息。
206、按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据。
本发明实施例中,为了满足对图像信息中文字数据的识别,利用图像识别技术OCR对文字数据进行识别。具体的,在基于图像识别技术OCR进行识别时,依据每行的内容进行识别,即将图像中每行的文字进行识别,在此过程中,由于扫描像素、扫描光度等因素影响,各行中的文字可能在图像中显示不清楚,导致识别的文字数据不全完,例如,图像中的文字为“第一中心医院”,但是,识别出的文字数据仅仅为“第一医院”,“中心”两个词缺失,会影响对文字数据进行识别模式的识别准确性。因此,本发明实施例中,在识别过程中,若检测到未识别出的文字数据,则对文字数据中,未识别出的文字内容进行标识,即得到包含标识的文字数据,所述文字数据中未识别出的文字内容以预设标识进行标记,不同的文字内容可以标记为不同的预设标识,也可以标记为相同的标识,本发明实施例中预设标识不做具体限定。例如,未识别出“中心”,则在识别到的文字数据中进行标记,得到标记的文字数据“第一**医院”。
进一步地,为了具体说明及限定,所述按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据之前,所述方法还包括:获取所述图像信息中的直线,并确定所述直线的倾斜角度与所述图像信息的基准角度的差值;利用所述差值对所述图像信息进行旋转处理。
对于本发明实施例,为了避免图像信息中待进行识别的文字数据无法以行形式进行识别,满足对预定直线行形式进行识别的需求,需要对倾斜的图像信息进行旋转校正。具体的,由于本发明实施例中对于扫描的医疗发票可以为发票,发票中带有直线,可以表征发票的倾斜角度,因此,获取图像信息中的直线,确定此直线的倾斜角度,以便与进行OCR识别的基准行的基准角度进行校正。其中,计算直线的倾斜角度与图像信息的基准角度的差值,并基于差值进行旋转处理,完成校正,从而提高对识别OCR技术的识别效率。
207、对携带有标记的文字数据进行标识替换处理。
对于本发明实施例,为了提高识别的准确性,使得获取的文字数据可以准确匹配到对应的识别结果,从而满足对图像信息中文字数据的全方位、高效率的识别,对写到有标记的文字数据进行标识替换处理,即将标识替换为文字内容。具体的,所述标识替换处理用于替换所述标记为匹配所述文字数据的文字内容,即将文字内容替换至文字数据中的标识处,例如,“第一**医院”中将文字内容“市级”替换至“**”处,本发明实施例不做具体限定。
进一步地,为了进一步说明及限定,以提高替换文字内容的准确性,从而有效的提高对文字数据的识别,所述对携带有标记的文字数据进行标识替换处理之前,所述方法还包括:基于所述预设文字资源库建立不同文字内容的替换映射关系。
本发明实施例中,为了准确确定出替换标识的文字内容,以进行有效替换,基于预设文字资源库建立不同文字内容的替换映射关系,以进行文字替换处理时,按照替换映射关系进行获取待替换的文字内容。其中,所述替换映射关系中包括待替换文字内容的前文字内容、后文字内容之间的映射关系,每个待替换文字内容对应一个前文字内容、一个后文字内容,以便在进行替换时,基于文字数据中标识的前、后文字内容进行替换。
本发明实施例中,为了进一步限定及说明,所述对携带有标记的文字数据进行标识替换处理包括:依次对比携带有标记的文字数据中各标识的前文字内容、后文字内容,根据所述替换映射关系确定与所述前文字内容、后文字内容匹配的替换文字内容,并将确定的替换文字内容替换至所述标记处,得到替换处理后的文字内容。
例如,替换映射关系为待替换为文字内容“液”的前文字内容为“溶”,后文字内容为“体”,则对于文字数据“盐酸溶*”,将“*”替换为文字内容“液”,从而提高进行识别过程中的准确性、有效性。
208、将完成替换处理的所述文字数据进行词向量转换,以进行识别处理。
209、基于已训练的识别模型对所述文字数据进行识别处理。
具体的,已训练的识别模型为卷积神经网络模型。
210、计算所述完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的相似度。
对于本发明实施例,由于量化参数包括相似度、编辑距离,因此,为了利用量化参数进行识别的最终校验,计算完成识别的文字数据与预设文字资源库中医疗用语的相似度,即通过公式
Figure BDA0002659218170000131
其中,q为识别结果,d为医疗用语。
211、当计算的相似度大于预设相似阈值时,计算所述文字数据与所述医疗用语之间的编辑距离。
本发明实施例中,为了提高对识别结果的校正,从而提高识别的准确性,当相似度大于预设相似度阈值时,说明基于相似度层面,文字数据与医疗用语为匹配的,因此,进一步地计算文字数据与医疗用语之间的编辑距离。
需要说明的是,编辑距离即为在两个词之间,由其中一个词转换为另一个词所需要的最少单字符编辑操作次数,由于本发明实施例中,文字数据在进行进行识别模式识别时进行了向量化处理,而对于编辑距离的计算,需要进行字符之间的编辑操作的次数的确定,因此,在计算编辑距离时,可以将已向量化处理的识别出的文字数据进行字符串的转换,从而计算编辑距离,本发明实施例不做具体限定。
212、当计算的相似度小于或等于预设相似阈值时,配置所述量化参数为空。
对于本发明实施例,若相似度小于或等于预设相似度阈值,则说明文字数据基于相似度层面与医疗用语不匹配,则得到的识别结果不正确,将量化参数配置为空,以使在进行量化参数的判断时,直接排除,从而提高识别结果的校正准确性。
213a、当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
213b、当所述量化参数不符合预设量化范围时,生成包含有所述图像信息、所述文字数据的处理请求信息。
对于本发明实施例,为了满足对文字数据的识别需求,针对量化参数不符合预设量化范围的文字数据识别的情况,可以进一步地生成包含图像信息、文字数据的处理请求信息,以便通过人工、或者第三方服务器进行处理,以实现对图像信息识别的多样性。
对于本发明实施例213b之后的步骤还包括:基于所述区块链网络的公钥将所述处理请求信息发送至所述区块节点中。
本发明实施例中,由于图像信息是从各院方的区块节点中获取的,为了满足对图像信息的识别需求以及保密性要求,基于区块链网络的公钥将处理请求信息发送至区块节点中,以请求对所述处理请求信息进行识别。
例如,图像信息a为基于第一中心医院的区块节点中获取的,若图像信息识别后得到的量化参数不符合预设量化范围,则利用公钥发送图像信息a对应的处理请求信息至第一中心医院的区块节点中,以请求第一中心医院进行识别。
进一步地,本发明实施例还包括:接收所述所述处理请求信息的识别结果,并将所述识别结果更新至所述识别模型的训练样本集中。
本发明实施例中,为了使对图像信息的识别更具有智能性,接收处理请求信息的识别结果,并将识别结果跟新至训练样本集中,以使对识别模型进行重新训练,获取更具有识别准确性的识别模型,从而提高识别的准确性。
本发明提供了另一种图像信息的识别方法,本发明实施例通过从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果,实现基于机器学习与识别校正的结合完成对医疗内容的准确识别,大大提高了识别的深度,从而满足对医疗发票中医疗内容的高效识别。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种图像信息的识别装置,如图3所示,该装置包括:
获取模块31,用于从区块链网络的不同区块节点中获取医疗发票的图像信息;
处理模块32,用于基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
第一确定模块33,用于确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
第二确定模块34,用于当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
本发明提供了一种图像信息的识别装置,本发明实施例通过从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果,实现基于机器学习与识别校正的结合完成对医疗内容的准确识别,大大提高了识别的深度,从而满足对医疗发票中医疗内容的高效识别。
进一步的,作为对上述图2所示方法的实现,本发明实施例提供了另一种图像信息的识别装置,如图4所示,该装置包括:
获取模块41,用于从区块链网络的不同区块节点中获取医疗发票的图像信息;
处理模块42,用于基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
第一确定模块43,用于确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
第二确定模块44,用于当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
进一步地,所述装置还包括:转换模块45,提取模块46,训练模块47,
所述获取模块41,还用于获取包含至少一个医疗用语的所述预设文字资源库中的训练样本集;
所述转换模块45,用于根据词向量转换算法对所述训练样本集中的训练样本进行词向量转换,得到向量矩阵;
所述提取模块46,用于基于主成分分析从所述训练样本中提取匹配所述向量矩阵的特征向量;
所述训练模块47,用于基于所述特征向量对卷积神经网络进行训练,得到已训练的识别模型。
进一步地,所述量化参数包括编辑距离、相似度,所述第一确定模块43包括:
计算单元4301,用于计算所述完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的相似度;
确定单元4302,用于当计算的相似度大于预设相似阈值时,计算所述文字数据与所述医疗用语之间的编辑距离;
配置单元4303,用于当计算的相似度小于或等于预设相似阈值时,配置所述量化参数为空。
进一步地,所述处理模块42包括:
识别单元4201,用于按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据,其中,所述文字数据中未识别出的文字内容以预设标识进行标记;
第一处理单元4202,用于对携带有标记的文字数据进行标识替换处理,所述标识替换处理用于替换所述标记为匹配所述文字数据的文字内容;
转换单元4203,用于将完成替换处理的所述文字数据进行词向量转换,以进行识别处理。
进一步地,所述处理模块还包括:建立单元4204,
所述建立单元4204,用于基于所述预设文字资源库建立不同文字内容的替换映射关系,所述替换映射关系中包括待替换文字内容的前文字内容、后文字内容之间的映射关系;
所述第一处理单元4202,具体用于依次对比携带有标记的文字数据中各标识的前文字内容、后文字内容,根据所述替换映射关系确定与所述前文字内容、后文字内容匹配的替换文字内容,并将确定的替换文字内容替换至所述标记处,得到替换处理后的文字内容。
进一步地,所述处理模块42还包括:
获取单元4205,用于获取所述图像信息中的直线,并确定所述直线的倾斜角度与所述图像信息的基准角度的差值;
第二处理单元4206,用于利用所述差值对所述图像信息进行旋转处理。
进一步地,所述装置还包括:
生成模块48,用于当所述量化参数不符合预设量化范围时,生成包含有所述图像信息、所述文字数据的处理请求信息;
发送模块49,用于基于所述区块链网络的公钥将所述处理请求信息发送至所述区块节点中,以请求对所述处理请求信息进行识别;
接收模块410,用于接收所述所述处理请求信息的识别结果,并将所述识别结果更新至所述识别模型的训练样本集中。
本发明提供了另一种图像信息的识别装置,本发明实施例通过从区块链网络的不同区块节点中获取医疗发票的图像信息;基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果,实现基于机器学习与识别校正的结合完成对医疗内容的准确识别,大大提高了识别的深度,从而满足对医疗发票中医疗内容的高效识别。
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的图像信息的识别方法。
图5示出了根据本发明一个实施例提供的一种计算机设备的结构示意图,本发明具体实施例并不对计算机设备的具体实现做限定。
如图5所示,该计算机设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述图像信息的识别方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:
从区块链网络的不同区块节点中获取医疗发票的图像信息;
基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种图像信息的识别方法,其特征在于,包括:
从区块链网络的不同区块节点中获取医疗发票的图像信息;
基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述基于已训练的识别模型对所述文字数据进行识别处理之前,所述方法还包括:
获取包含至少一个医疗用语的所述预设文字资源库中的训练样本集;
根据词向量转换算法对所述训练样本集中的训练样本进行词向量转换,得到向量矩阵;
基于主成分分析从所述训练样本中提取匹配所述向量矩阵的特征向量;
基于所述特征向量对卷积神经网络进行训练,得到已训练的识别模型。
3.根据权利要求1所述的方法,其特征在于,所述量化参数包括编辑距离、相似度,所述确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数包括:
计算所述完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的相似度;
当计算的相似度大于预设相似阈值时,计算所述文字数据与所述医疗用语之间的编辑距离;
当计算的相似度小于或等于预设相似阈值时,配置所述量化参数为空。
4.根据权利要求1所述的方法,其特征在于,所述基于所述图像信息提取文字数据包括:
按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据,其中,所述文字数据中未识别出的文字内容以预设标识进行标记;
对携带有标记的文字数据进行标识替换处理,所述标识替换处理用于替换所述标记为匹配所述文字数据的文字内容;
将完成替换处理的所述文字数据进行词向量转换,以进行识别处理。
5.根据权利要求4所述的方法,其特征在于,所述对携带有标记的文字数据进行标识替换处理之前,所述方法还包括:
基于所述预设文字资源库建立不同文字内容的替换映射关系,所述替换映射关系中包括待替换文字内容的前文字内容、后文字内容之间的映射关系;
所述对携带有标记的文字数据进行标识替换处理包括:
依次对比携带有标记的文字数据中各标识的前文字内容、后文字内容,根据所述替换映射关系确定与所述前文字内容、后文字内容匹配的替换文字内容,并将确定的替换文字内容替换至所述标记处,得到替换处理后的文字内容。
6.根据权利要求4所述的方法,其特征在于,所述按照行迭代方式,利用图像识别技术OCR识别所述图像信息中的文字数据之前,所述方法还包括:
获取所述图像信息中的直线,并确定所述直线的倾斜角度与所述图像信息的基准角度的差值;
利用所述差值对所述图像信息进行旋转处理。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
当所述量化参数不符合预设量化范围时,生成包含有所述图像信息、所述文字数据的处理请求信息;
基于所述区块链网络的公钥将所述处理请求信息发送至所述区块节点中,以请求对所述处理请求信息进行识别;
接收所述所述处理请求信息的识别结果,并将所述识别结果更新至所述识别模型的训练样本集中。
8.一种图像信息的识别装置,其特征在于,包括:
获取模块,用于从区块链网络的不同区块节点中获取医疗发票的图像信息;
处理模块,用于基于所述图像信息提取文字数据,并基于已训练的识别模型对所述文字数据进行识别处理,所述识别模型为基于主成分分析进行特征提取训练得到的;
第一确定模块,用于确定完成识别的文字数据与预设文字资源库中对应至少一个医疗用语之间的量化参数,所述预设文字资源库为在匹配所述图像信息的区块节点中创建的;
第二确定模块,用于当所述量化参数符合预设量化范围时,将所述医疗用语确定为所述图像信息的识别结果。
9.一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的图像信息的识别方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的图像信息的识别方法对应的操作。
CN202010898471.4A 2020-08-31 2020-08-31 图像信息的识别方法及装置、存储介质、计算机设备 Pending CN111985486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010898471.4A CN111985486A (zh) 2020-08-31 2020-08-31 图像信息的识别方法及装置、存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010898471.4A CN111985486A (zh) 2020-08-31 2020-08-31 图像信息的识别方法及装置、存储介质、计算机设备

Publications (1)

Publication Number Publication Date
CN111985486A true CN111985486A (zh) 2020-11-24

Family

ID=73441188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010898471.4A Pending CN111985486A (zh) 2020-08-31 2020-08-31 图像信息的识别方法及装置、存储介质、计算机设备

Country Status (1)

Country Link
CN (1) CN111985486A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117197828A (zh) * 2023-08-11 2023-12-08 中国银行保险信息技术管理有限公司 票据信息识别方法、装置、介质及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117197828A (zh) * 2023-08-11 2023-12-08 中国银行保险信息技术管理有限公司 票据信息识别方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
WO2021135910A1 (zh) 基于机器阅读理解的信息抽取方法、及其相关设备
WO2021212749A1 (zh) 命名实体标注方法、装置、计算机设备和存储介质
US20070003147A1 (en) Grammatical parsing of document visual structures
CN110826303A (zh) 一种基于弱监督学习的联合信息抽取方法
US20080279455A1 (en) Machine character recognition verification
US20220292861A1 (en) Docket Analysis Methods and Systems
CN108364037A (zh) 识别手写汉字的方法、系统及设备
CN111401099A (zh) 文本识别方法、装置以及存储介质
CN108280389A (zh) 医疗票据icr识别系统及其医疗票据识别方法
CN114021573B (zh) 一种自然语言处理方法、装置、设备及可读存储介质
CN113949582A (zh) 一种网络资产的识别方法、装置、电子设备及存储介质
CN113961768A (zh) 敏感词检测方法、装置、计算机设备和存储介质
CN113568965A (zh) 一种结构化信息的提取方法、装置、电子设备及存储介质
CN116229494A (zh) 一种基于小样本数据的证照关键信息抽取方法
CN115935914A (zh) 一种入院记录缺失文本补充方法
CN111985486A (zh) 图像信息的识别方法及装置、存储介质、计算机设备
WO2022134580A1 (zh) 证件信息的获取方法及装置、存储介质、计算机设备
CN114021572B (zh) 一种自然语言处理方法、装置、设备及可读存储介质
CN108537855B (zh) 一种草图一致的陶瓷花纸图案生成方法及装置
CN116432608A (zh) 基于人工智能的文本生成方法、装置、计算机设备及介质
US11335108B2 (en) System and method to recognise characters from an image
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
US9443139B1 (en) Methods and apparatus for identifying labels and/or information associated with a label and/or using identified information
CN110414000B (zh) 一种基于模板文档对比的关键词提取方法及系统
JP7512630B2 (ja) くずし字認識システム、くずし字認識方法、データセットの作成方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220525

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.

TA01 Transfer of patent application right