CN117351501A - 信息录入方法、装置、设备及存储介质 - Google Patents
信息录入方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117351501A CN117351501A CN202311319172.0A CN202311319172A CN117351501A CN 117351501 A CN117351501 A CN 117351501A CN 202311319172 A CN202311319172 A CN 202311319172A CN 117351501 A CN117351501 A CN 117351501A
- Authority
- CN
- China
- Prior art keywords
- content
- picture
- preset
- target
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012937 correction Methods 0.000 claims abstract description 46
- 238000013145 classification model Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 48
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 12
- 239000013598 vector Substances 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及信息处理技术领域,具体涉及一种信息录入方法,该方法包括通过预设分类模型对获取的待处理图片进行分类,得到与各分类结果对应的分类图片;通过摩尔纹去除模型对分类图片进行摩尔纹去除,得到目标图片;对目标图片进行内容识别,得到图片内容;对图片内容进行结构化处理,得到结构化内容;对结构化内容进行文字纠错,得到纠正内容;对纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。本发明应用于金融或保险业务中的信息录入。本发明通过对图片内容进行结构化和文字纠错,实现了自动对图片内容的正确排序,以及对识别文字的纠错,提高了后续审核效率。对图片的摩尔纹去除,提高了图片的质量。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息录入方法、装置、设备及存储介质。
背景技术
随着社会不断地发展,企业业务得到飞速发展,越来越多的文档信息需要录入电脑中。例如,在银行、证券、保险等金融机构的业务量持续扩大,产生大量的业务信息需要录入电脑。而现有OCR识别技术对于理想情况下的样本具有很好的识别效果。但是实际场景的信息录入中,针对背景嘈杂、摩尔纹、印章水印干扰等复杂场景的文本识别,现有技术的实际效果并不理想。这时需要对大量原生图文本进行人工干预,才能实现一定的效果。而且,当图片没有按照顺序上传时,或者其中部分图片不符合要求被退回重新上传时,识别得到内容比较混乱,需要人工将连续图片的内容排序以及内容纠错后,才能录入系统进行审核,从而信息录入周期较长,增加了人工成本,也影响了客户的体验。
发明内容
本发明实施例提供一种信息录入方法、装置、设备及存储介质,以解决现有技术中图片识别内容混乱需要重新排序以及纠错,从而导致信息录入较长的问题。
一种信息录入方法,包括:
获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片;
获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片;
对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容;
对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容;
对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容;
对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
一种信息录入装置,包括:
图片筛选模块,用于获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片;
摩尔纹去除模块,用于获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片;
内容识别模块,用于对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容;
结构化处理模块,用于对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容;
文字纠错模块,用于对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容;
信息提取模块,用于对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息录入方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息录入方法。
本发明提供一种信息录入方法、装置、设备及存储介质,该方法通过预设分类模型进行图片分类,确保了上传图片的准确性。通过摩尔纹去除模型进行图片摩尔纹去除,提高了金融或保险业务中图片质量,进而提高了后续图片识别的准确性。通过对识别的图片内容进行结构化处理以及文字纠错,实现了对金融或保险业务中的图片内容的正确排序,以及实现了对金融或保险业务中的图片内容的纠错,进而提高了金融或保险业务中的审核效率,缩短了金融或保险业务中的信息录入,降低了金融或保险业务中的人工成本。最后,对纠正的图片内容进行信息提取以及验证,确保了提取的目标内容符合要求,进而确保了金融或保险业务中信息录入成功。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中信息录入方法的应用环境示意图;
图2是本发明一实施例中信息录入方法的流程图;
图3是本发明一实施例中信息录入方法步骤S40的流程图;
图4是本发明一实施例中信息录入方法步骤S50的流程图;
图5是本发明一实施例中信息录入装置的原理框图;
图6是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的信息录入方法,该信息录入方法可应用如图1所示的应用环境中。具体地,该信息录入方法应用在信息录入装置中,该信息录入装置包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决现有技术中图片识别内容混乱需要重新排序以及纠错,从而导致信息录入较长的问题。其中,该服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端又称为用户端,是指与服务器相对应,为客户提供分类服务的程序。客户端可安装在但不限于各种计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。
在一实施例中,如图2所示,提供一种信息录入方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片。
可理解地,待处理图片为上传需要录入信息的图片。预设分类模型为用于区分图片的类别,例如,住院病历,检查报告或费用清单,或无效图片等。分类图片是指分类后得到的需要进行摩尔纹消除的图片。
具体地,获取上传的至少一个待处理图片,调取预设分类模型,将所有待处理图片输入到预设分类模型中,通过预设分类模型对各待处理图片进行分类,也即对各待处理图片中的标题进行识别,并以包含图片标题的图片内容为聚类中心进行图片聚类,从而得到与该聚类中心相关的所有图片,如此,即可确定所有待处理图片中的分类图片。例如,在保险理赔场景中,对用户上传的身份证图片、保险资料图片、事故认定责任书、医疗费用清单和病历资料等进行分类,得到身份证图片、保险资料图片和事故认定责任书为证明类图片;医疗费用清单为票据类图片;病历资料为医疗类图片。其中,如果识别到上传错误的自拍图片或风景图片,则将图片删除。
S20:获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片。
可理解地,摩尔纹是一种在数码照相机或者扫描仪等设备上,感光元件出现的高频干扰的条纹,是一种会使图片出现彩色的高频率不规则的条纹。目标图片是指不包含摩尔纹的图片。摩尔纹去除模型为通过大量样本数据并引入对抗损失函数训练得到的。
具体地,调取摩尔纹去除模型,将所有分类图片输入至摩尔纹去除模型中,通过摩尔纹去除模型对各分类图片进行摩尔纹去除,从而得到与各分类图片对应的目标图片。其中,可以对各分类图片进行多尺度特征提取,也即采用Unet网络对各分类图片进行下采样处理,从而得到多尺度特征。然后对多尺度特征进行小波变换或傅里叶变换进行摩尔纹去除,得到目标特征。再对目标特征进行逆变换,即可得到与各分类图片对应的目标图片。例如,在保险理赔场景中,对电脑中的住院病例、检查报告等信息进行拍照上传,而对电脑屏幕拍摄一般会包含摩尔纹,因此,需要对上传图片进行摩尔纹去除,通过训练完成的摩尔纹去除模型对上传图片进行去除,即可得到不包含摩尔纹的图片。
S30,对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容。
可理解地,图片内容是指目标图片中的文字内容。
具体地,在得到目标图片之后,对各目标图片进行内容识别,可以直接采用OCR技术进行识别,也可以通过预设识别模型进行内容识别,还可以对目标图片进行文本行划分,得到每个文本行对应的文本框。并对每个文本框中的文本行出现的位置进行标记,然后对标记的每个文本框中的文本行进行文本识别,并按照标记的位置进行排序,即可得到与各目标图片对应的图片内容。其中,在识别之前,先对各目标图片进行预处理,也即先对目标图片进行二值化、噪声去除和倾斜校正等预处理后进行内容识别。例如,目标图片为检查报告时,文本框1对应的文本信息1,文本框2对应的文本信息2,文本框3对应的文本信息3,对文本框中的内容进行识别,即可得到与各文本框中文本行对应的文本内容。并按照文本框的顺序对应识别的文本内容进行排序,即可得到与各目标图片对应的图片内容。
S40:对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容。
可理解地,结构化内容是指对同一文档对应的所有图片内容排序得到的。
具体地,对各图片内容进行结构化处理,也即通过对每张目标图片对应从最后一行文本框中识别的末文本内容和第一行文本框中识别的首文本内容进行提取。然后,对不同目标图片之间对应的末文本内容和首文本内容进行语义分析,从而得到语义分析结果。并按照语义分析结果对各首文本内容以及各末文本内容对应的图片内容进行排序,即可得到结构化内容。例如,在理赔场景中,在调查过程中,在将上传调查结果时,不一定所有图片均按照正确的顺序进行上传,因此,需要对识别后的图片内容进行排序。其中,对包含页面编码的可以直接对图片的最底部进行数字识别,并按照数字大小进行排序,即可得到结构化内容。对无页面编码的,进行语义分析以及排序,即可得到结构化内容。
S50:对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容。
可理解地,纠正内容是指将结构化内容中识别的错误文字纠正后的内容。
具体地,对结构化内容中的文字进行特征提取,也即提取每个文字的特征,从而得到与各文字对应的文字特征。对所有文字特征进行错误预测,也即对所有结构化内容中的错误文字进行预测,即可得到至少一个错误文字。然后,通过预设字典信息对错误文字进行字音相似度计算,即可得到与各错误文字对应的至少一个候选文字。对所有候选文字进行筛选,即可得到与各错误文字对应的目标文字,并将错误文字替换为目标文字,从而得到与各结构化内容对应的纠正内容。
S60:对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
可理解地,目标内容是指图片中关键内容,例如,在住院病历中,住院时间,用药等内容。
具体地,通过识别的纠正内容,确定纠正内容中的标题内容,基于标题内容进行模板匹配,从而得到与各标题内容对应的信息提取模板,通过信息提取模板对与标题内容对应的纠正内容进行信息提取,从而即可得到目标内容。或者,通过对纠正内容进行分词处理,得到目标关键词,然后,计算每一目标关键词的权重值,即将词频(TF)和逆向文本频率(IDF)相乘,即得到该目标关键词的权重值。再根据权重对所有目标关键词进行筛选,从中筛选出权重值较大的目标关键词确定为目标内容。进一步地,还可以设定权重阈值和预定数量。若权重值超过权重阈值的目标关键词的数量大于预定数量,则按照权重值从大到小的顺序筛选出预定数量的目标关键词,作为目标内容。若权重值超过权重阈值的目标关键词的数量小于或者等于预定数量,则将权重值超过权重阈值的目标关键词确定为目标内容。最后,对提取的目标内容进行内容验证,也即可以将目标内容发送至客户端进行验证,并接收反馈的验证结果;还可以通过预设信息模板进行内容验证。当目标内容符合预设要求时,确定信息录入成功。当目标内容不符合预设要求时,确定信息录入失败,并发出提示。例如,在保险理赔场景中,对提取的信息内容进行判断,当提取的信息内容和模板信息之间相似度大于或等于阈值时,确定符合预设要求,确定信息录入成功。当提取的信息内容和模板信息之间相似度小于阈值时,确定不符合预设要求,确定信息录入失败。
在本发明实施例中的一种信息录入方法,该方法通过预设分类模型进行图片分类,确保了上传图片的准确性。通过摩尔纹去除模型进行图片摩尔纹去除,提高了金融或保险业务中图片质量,进而提高了后续图片识别的准确性。通过对识别的图片内容进行结构化处理以及文字纠错,实现了对金融或保险业务中的图片内容的正确排序,以及实现了对金融或保险业务中的图片内容的纠错,进而提高了金融或保险业务中的审核效率,缩短了金融或保险业务中的信息录入,降低了金融或保险业务中的人工成本。最后,对纠正的图片内容进行信息提取以及验证,确保了提取的目标内容符合要求,进而确保了金融或保险业务中信息录入成功。
在一实施例中,步骤S10之前,也即通过预设分类模型对各所述待处理图片进行分类之前,包括:
S101,获取样本数据集,所述样本数据集包括至少一个样本数据和与各所述样本数据对应的样本标签。
可理解地,样本数据为历史数据中上传的资料图片。样本数据集包括至少一个样本数据和与各样本数据对应的样本标签。例如,在保险理赔场景中,对用户上传的身份证图片、保险资料图片、事故认定责任书、医疗费用清单和病历资料等进行分类,得到身份证图片、保险资料图片和事故认定责任书为证明类图片;医疗费用清单为票据类图片;病历资料为医疗类图片。样本标签用于表征样本数据的类别,例如,证明类图片、票据类图片和医疗类图片等等。进而,根据所有样本数据和与各样本数据对应的样本标签构建样本数据集。其中,还可以增加一些负样本对预设训练模型进行训练,从而提高预设分类模型的准确率。
S102,获取预设训练模型,通过所述预设训练模型对所有所述样本数据进行分类,得到预测标签。
可理解地,预测标签为预设训练模型对样本数据分类得到的图片。
具体地,获取预设训练模型,将所有样本数据和样本标签输入到预设训练模型中,通过预设训练模型对所有样本数据进行分类,也即通过所有样本数据对预设训练模型进行迭代训练,使得预设训练模型完成对样本数据的类别的分类,从而得到与各样本数据对应的预测标签。例如,在保险理赔场景中,对资料图片进行分类,也即对风景图片、身份证图片、事故认定责任书、医疗费用明细清单和门诊病历或急诊病历进行分类,得到与各图片对应的类别,其中,风景图片和人像图片为无效图片类别。
S103,根据与同一所述样本数据对应的样本标签和预测标签,确定所述预设训练模型的预测损失值。
可理解地,预测损失值为对样本训练数据进行分类过程中生成的。
具体地,在得到预测标签之后,将各样本数据对应的预测标签按照样本数据集中样本数据的顺序进行排列,进而将样本数据关联的样本标签,与序列相同的样本数据的预测标签进行比较;也即按照样本数据排序,将位于第一的样本数据对应的样本标签,与位于第一的样本数据对应的预测标签进行比较,通过损失函数计算样本标签与预测标签之间的损失值;进而将位于第二的样本数据对应的样本标签,与位于第二的样本数据对应的预测标签进行比较,通过损失函数计算样本标签与预测标签之间的损失值,直至所有样本标签与所有预测标签的损失值均比较完成,即可得到预测损失值。
S104,在所述预测损失值达到预设收敛条件时,将收敛之后的预设训练模型确定预设分类模型。
可理解地,收敛条件可以为预测损失值小于设定阈值的条件,还可以为预测损失值经过了500次计算后值为很小且不会再下降的条件,停止训练。
具体地,在得到预测损失值之后,在预测损失值未达到预设的收敛条件时,通过预测损失值调整预设训练模型的初始参数,并将所有样本数据和样本标签重新输入至调整初始参数的预设训练模型中,对调整初始参数的预设训练模型进行迭代训练,即可得到对应的预测损失值。进而在该预测损失值未达到预设收敛条件时,根据该预测损失值再次调整预设训练模型的初始参数,使得再次调整初始参数的预设训练模型的预测损失值达到预设的收敛条件。如此,使得预测的分类结果不断的向正确结果靠拢,预设训练模型的准确率越来越高,直至预设训练模型的预测损失值达到预设收敛条件时,将收敛之后的预设训练模型确定为预设分类模型。
本发明实施例通过大量的样本数据对预设训练模型进行迭代训练,并通过损失函数计算预设训练模型的整体损失值,从而实现了对预设训练模型的预测损失值的确定。通过预测损失值对预设训练模型的初始参数进行调整,直至模型收敛,实现了对预设分类模型的确定,进而确保了预设分类模型有较高的准确率。
在一实施例中,步骤S20之前,也即获取摩尔纹去除模型之前,包括:
S201,获取图片数据集,所述图片数据集中包括至少一对摩尔纹图片和非摩尔纹图片。
可理解地,摩尔纹图片是指包含摩尔纹的图片,该图片是用于金融或保险业务中信息录入的历史图片。非摩尔纹图片是指不包含摩尔纹的图片,采用其他方式对摩尔纹图片进行摩尔纹去除得到的。从数据库中调取至少一对摩尔纹图片和非摩尔纹图片,进而根据获取的所有摩尔纹图片和非摩尔纹图片构建图片数据集。
S202,获取对抗生成网络,将各所述摩尔纹图片输入至所述对抗生成网络中,得到与各所述摩尔纹图片对应的生成图片。
具体地,获取对抗生成网络,将各摩尔纹图片输入至对抗生成网络中,也即只将包含摩尔纹的原图输入到对抗生成网络中,通过对抗生成网络中的生成器对包含摩尔纹的原图进行图片处理,也即对摩尔纹图片进行摩尔纹去除处理,从而得到与各摩尔纹图片对应的生成图片。例如,在理赔场景中,将拍摄的住院病历和检查报告的图片输入到对抗生成网络中进而摩尔纹去除处理,即可得到与各图片对应的生成图片。生成图片是指与之相似的图片。
S203,将所有所述摩尔纹图片、非摩尔纹图片和生成图片输入至预设去除模型中,通过梯度反向传播算法对所述预设去除模型进行迭代训练,得到摩尔纹去除模型。
具体地,获取预设去除模型,将所有摩尔纹图片、非摩尔纹图片和生成图片输入至预设去除模型中,通过梯度反向传播算法对预设去除模型进行迭代训练,也即通过预设去除模型对各摩尔纹图片以及各生成图片进行摩尔纹去除处理,从而与各生成图片对应的第一图片和与各摩尔纹图片对应的第二图片,分别计算第一图片、第二图片和非摩尔纹图片之间的第一损失值和第二损失值。然后,通过第一损失值和第二损失值对损失函数进行计算,从而得到预设去除模型的预设损失函数。然后,通过梯度反向传播算法对预设去除模型进行参数调整,即采用链式法则计算出每个参数对预设损失函数的偏导数,也即从输出层开始,逐层计算每个节点的局部梯度,最终得到每个参数对预设损失函数的偏导数。接着,使用梯度下降算法,通过每个参数的偏导数来更新参数,直至预设去除模型达到收敛条件时,将收敛之后的预设去除模型确定为摩尔纹去除模型。
本发明实施例通过计算第一图片、第二图片和非摩尔纹图片之间的损失值,实现了对损失函数的计算。通过梯度反向传播算法对预设去除模型进行参数调整,实现了对预设去除模型的迭代训练,进而确保了摩尔纹去除模型有较高的准确率,以及提高了模型训练速度。
在一实施例中,如图3所示,步骤S40中,也即对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容,包括:
S401,对与各所述坐标信息对应的所述文本内容之间进行语义分析,得到语义分析结果。
S402,基于所述语义分析结果对与各所述文本内容对应的图片内容进行排序,得到结构化内容。
其中,所述图片内容包括至少一个文本内容以及与各所述文本内容对应的坐标信息。
可理解地,文本内容是指目标图片中每一行的内容。坐标信息是指每一行文本对应的文本框位置。
具体地,在得到图片内容之后,获取与各图片内容对应的至少一个文本内容和与各文本内容对应的坐标信息,对与各坐标信息对应的文本内容之间进行语义分析,也即通过坐标信息对图片内容中的第一行和最后一行的首文本内容和末文本内容进行确定以及提取。接着,对各图片内容之间的首文本内容和末文本内容之间进行关联度计算,也即对首文本内容和末文本内容进行特征提取,并通过计算特征之间的欧式距离,或者对首文本内容和末文本内容进行独热编码,并对编码向量之间的语义相似度进行计算,从而得到与各目标图片对应的关联度值。对所有关联度值进行大小比较,从中筛选出最大的关联度值,即可得到语义分析结果。基于语义分析结果对各文本内容进行排序,也即将该关联度值对应的图片内容进行排序,也即按照末文本内容对应的图片内容在前,首文本内容对应的图片内容在后的方式进行排序,如此,对所有的图片内容之间进行排序,即可得到结构化内容。其中,将包含图片标题的图片内容设置为首页,如此对后续的图片内容进行排序。例如,在理赔场景中,对住院病历进行识别时,因为图片内容较多,也没有排序,如此,通过计算各图片内容中首文本内容和末文本内容之间的关联度,并将关联度值最大的两个图片内容之间进行排序,即可将住院病历按照正确顺序排序,无需工作人员排序。
本发明实施例通过对文本内容之间进行语义分析,实现了对文本内容之间关联度的计算,进而实现了对语义分析结果的确定。基于语义分析结果对各文本内容进行排序,实现了自动对各图片内容的排序,进而实现了对结构化内容的获取。
在一实施例中,如图4所示,步骤S50中,也即对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容,包括:
S501,对所述结构化内容中的文字进行特征提取,得到与各所述文字对应的文字特征。
具体地,在得到结构化内容之后,对结构化内容中的文字进行特征提取,也即通过卷积网络对结构化内容中的文字进行卷积处理,得到卷积特征。然后,对卷积特征进行多尺度特征提取,并将提取的多尺度特征进行特征融合,即可得到与各文字对应的文字特征。或者,将所有结构化内容输入特征提取模型中,通过特征提取模型对结构化内容中的文字进行特征提取,从而得到与各文字对应的文字特征。
S502,对所有所述文字特征进行错误预测,得到至少一个错误文字。
S503,通过预设字典信息对所述错误文字进行字音相似度计算,得到与各所述错误文字对应的至少一个候选文字。
具体地,获取预设纠错模型,将所有文字特征输入到预设纠错模型中,通过预设纠错模型的嵌入层对文字特征进行嵌入处理,也即对文字特征进行独热编码,从而生成内容编码。然后,对与文字特征对应的所有内容编码进行量化,即可得到与各文字内容对应的待纠错向量。然后,对待纠错向量进行掩码纠错,也即对待纠错向量进行MASK预测,从而得到结构化内容中的至少一个错误文字以及与错误文字对应的错误位置。进一步地,获取预设字典信息,通过预设字典信息中的形近字混淆集和拼音混淆集对错误文字进行字音相似度计算,也即通过计算形近字混淆集中文字和错误文字的相似度,以及通过计算拼音混淆集中文字拼音和错误文字拼音的相似度,并将两者相似度同时大于预设相似度阈值的预设文字确定为候选文字,即可从预设字典信息中筛选出与各错误文字对应的至少一个候选文字。
在另一实施例中,纠错模型还可以是Encoder-Decoder模式,编码器使用的是BiGRU,对中文文本按字符级别进行编码,解码器使用的是LSTM,在解码器进行解码时,不仅接收上一个文字的特征向量,还接受通过注意力机制将编码器的文字特征聚合成一个包含上下文信息的特征向量,从而达到基于语义信息的文本纠错。在解码器的每个时间t所生成的特征向量,一方面通过线性变换投影到向量空间用于生成候选字符,另一方面也会通过一个Softmax层构成的门控机制,用于决定当前时刻解码器的输出结果是否直接复制原始的文字。此外当门控机制不选择直接复制时,并且当要预测的字符出现在预先设定好的混淆集中的时候,解码器则会在混淆集中选择候选的字符,而不是在整个词典向量空间中选择。
S504,对所有所述候选文字进行筛选,得到与各所述错误文字对应的目标文字,并将所述错误文字替换为所述目标文字,得到纠正内容。
具体地,对所有候选文字进行筛选,也即对所有候选文字对应的字形相似度和音似相似度进行加权计算,即第一权重和字形相似度相乘,第二权重和音似相似度相乘,并将相乘结果相加,即可得到与各候选文字对应的文字相似度值。通过比较与同一错误文字对应的所有候选文字的文字相似度值的大小,从选择处理与各错误文字对应的目标文字。并按照错误位置对错误文字进行替换,也即将结构化内容中的所有错误文字均替换为目标文字,即可得到纠正内容。
本发明实施例通过对结构化内容中的文字进行特征提取,实现了对文字特征的确定。通过对文字特征进行错误预测,实现了对错误文字的确定。通过预设字典信息对错误文字进行字音相似度计算,实现了对候选文字的获取。
对所有候选文字进行筛选
在一实施例中,步骤S60之后,也即对各所述纠正内容进行信息提取,得到目标内容之后,包括:
S601,获取预设信息模板,通过所述预设信息模板对所述目标内容进行内容验证,得到文本相似度值。
S602,当所述文本相似度值大于或等于预设阈值时,确认所述目标内容符合预设要求。
S603,当所述文本相似度值小于预设阈值时,确认所述目标内容不符合预设要求。
可理解地,文本相似度值是指预设信息模板和目标内容之间的相似度。
具体地,从数据库中获取预设信息模板,该预设信息模板是通过图片标题进行匹配获取的。然后,通过预设信息模板对目标内容进行内容验证,也即对目标内容和预设信息模板进行相似度计算,即将与同一内容对应的目标内容和模板内容进行相似度计算,可以提取对应的内容特征,对内容特征之间的相似度进行计算,从而得到文本相似度值。当文本相似度值大于或等于预设阈值时,确认目标内容符合预设要求。当文本相似度值小于预设阈值时,确认目标内容不符合预设要求。例如,在保险理赔场景中,对目标内容和模板内容进行文本匹配,通过计算欧氏距离,得到文本相似度值。然后,当文本相似度值大于或等于预设阈值时,确认目标内容符合预设要求。当文本相似度值小于预设阈值时,确认所述目标内容不符合预设要求。
本发明实施例通过对目标内容和预设信息模板进行内容验证,实现了对文本相似度值的计算。对预设阈值和文本相似度值进行比较,实现了对上传图片是否符合要求的判断,进而确保了上传图片的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执的行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种信息录入装置,该信息录入装置与上述实施例中信息录入方法一一对应。如图5所示,该信息录入装置包括图片筛选模块11、摩尔纹去除模块12、内容识别模块13、结构化处理模块14、文字纠错模块15和信息提取模块16。各功能模块详细说明如下:
图片筛选模块11,用于获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片;
摩尔纹去除模块12,用于获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片;
内容识别模块13,用于对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容;
结构化处理模块14,用于对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容;
文字纠错模块15,用于对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容;
信息提取模块16,用于对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
在一实施例中,所述图片内容包括至少一个文本内容以及与各所述文本内容对应的坐标信息;所述结构化处理模块14包括:
语义分析单元,用于对与各所述坐标信息对应的所述文本内容之间进行语义分析,得到语义分析结果;
内容排序单元,用于基于所述语义分析结果对与各所述文本内容对应的图片内容进行排序,得到结构化内容。
在一实施例中,所述文字纠错模块15包括:
特征提取单元,用于对所述结构化内容中的文字进行特征提取,得到与各所述文字对应的文字特征;
错误预测单元,用于对所有所述文字特征进行错误预测,得到至少一个错误文字;
相似度计算单元,用于通过预设字典信息对所述错误文字进行字音相似度计算,得到与各所述错误文字对应的至少一个候选文字;
文字替换单元,用于对所有所述候选文字进行筛选,得到与各所述错误文字对应的目标文字,并将所述错误文字替换为所述目标文字,得到纠正内容。
在一实施例中,所述信息提取模块16包括:
内容验证单元,用于获取预设信息模板,通过所述预设信息模板对所述目标内容进行内容验证,得到文本相似度值;
符合要求单元,用于当所述文本相似度值大于或等于预设阈值时,确认所述目标内容符合预设要求;
不符合要求单元,用于当所述文本相似度值小于预设阈值时,确认所述目标内容不符合预设要求。
在一实施例中,所述摩尔纹去除模块12包括:
图片获取单元,用于获取图片数据集,所述图片数据集中包括至少一对摩尔纹图片和非摩尔纹图片;
生成图片单元,用于获取对抗生成网络,将各所述摩尔纹图片输入至所述对抗生成网络中,得到与各所述摩尔纹图片对应的生成图片;
迭代训练单元,用于将所有所述摩尔纹图片、非摩尔纹图片和生成图片输入至预设去除模型中,通过梯度反向传播算法对所述预设去除模型进行迭代训练,得到摩尔纹去除模型。
在一实施例中,所述图片筛选模块11包括:
样本获取单元,用于获取样本数据集,所述样本数据集包括至少一个样本数据和与各所述样本数据对应的样本标签;
标签预测单元,用于获取预设训练模型,通过所述预设训练模型对所有所述样本数据进行分类,得到预测标签;
损失预测单元,用于根据与同一所述样本数据对应的样本标签和预测标签,确定所述预设训练模型的预测损失值;
模型收敛单元,用于在所述预测损失值达到预设收敛条件时,将收敛之后的预设训练模型确定预设分类模型。
关于信息录入装置的具体限定可以参见上文中对于信息录入方法的限定,在此不再赘述。上述信息录入装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中信息录入方法所用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息录入方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息录入方法。
在一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息录入方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围内。
Claims (10)
1.一种信息录入方法,其特征在于,包括:
获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片;
获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片;
对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容;
对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容;
对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容;
对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
2.如权利要求1所述的信息录入方法,其特征在于,所述图片内容包括至少一个文本内容以及与各所述文本内容对应的坐标信息;
所述对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容,包括:
对与各所述坐标信息对应的所述文本内容之间进行语义分析,得到语义分析结果;
基于所述语义分析结果对与各所述文本内容对应的图片内容进行排序,得到结构化内容。
3.如权利要求1所述的信息录入方法,其特征在于,所述对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容,包括:
对所述结构化内容中的文字进行特征提取,得到与各所述文字对应的文字特征;
对所有所述文字特征进行错误预测,得到至少一个错误文字;
通过预设字典信息对所述错误文字进行字音相似度计算,得到与各所述错误文字对应的至少一个候选文字;
对所有所述候选文字进行筛选,得到与各所述错误文字对应的目标文字,并将所述错误文字替换为所述目标文字,得到纠正内容。
4.如权利要求1所述的信息录入方法,其特征在于,所述对各所述纠正内容进行信息提取,得到目标内容之后,包括:
获取预设信息模板,通过所述预设信息模板对所述目标内容进行内容验证,得到文本相似度值;
当所述文本相似度值大于或等于预设阈值时,确认所述目标内容符合预设要求;
当所述文本相似度值小于预设阈值时,确认所述目标内容不符合预设要求。
5.如权利要求1所述的信息录入方法,其特征在于,所述获取摩尔纹去除模型之前,包括:
获取图片数据集,所述图片数据集中包括至少一对摩尔纹图片和非摩尔纹图片;
获取对抗生成网络,将各所述摩尔纹图片输入至所述对抗生成网络中,得到与各所述摩尔纹图片对应的生成图片;
将所有所述摩尔纹图片、非摩尔纹图片和生成图片输入至预设去除模型中,通过梯度反向传播算法对所述预设去除模型进行迭代训练,得到摩尔纹去除模型。
6.如权利要求1所述的信息录入方法,其特征在于,所述通过预设分类模型对各所述待处理图片进行分类之前,包括:
获取样本数据集,所述样本数据集包括至少一个样本数据和与各所述样本数据对应的样本标签;
获取预设训练模型,通过所述预设训练模型对所有所述样本数据进行分类,得到预测标签;
根据与同一所述样本数据对应的样本标签和预测标签,确定所述预设训练模型的预测损失值;
在所述预测损失值达到预设收敛条件时,将收敛之后的预设训练模型确定为预设分类模型。
7.一种信息录入装置,其特征在于,包括:
图片筛选模块,用于获取至少一个待处理图片,通过预设分类模型对各所述待处理图片进行分类,得到与各分类结果对应的分类图片;
摩尔纹去除模块,用于获取摩尔纹去除模型,通过所述摩尔纹去除模型对各所述分类图片进行摩尔纹去除,得到目标图片;
内容识别模块,用于对各所述目标图片进行内容识别,得到与各所述目标图片对应的图片内容;
结构化处理模块,用于对各所述图片内容进行结构化处理,得到与各所述图片内容对应的结构化内容;
文字纠错模块,用于对各所述结构化内容进行文字纠错,得到与各所述结构化内容对应的纠正内容;
信息提取模块,用于对各所述纠正内容进行信息提取,得到目标内容,当所述目标内容符合预设要求时,确定信息录入成功。
8.如权利要求7所述的信息录入装置,其特征在于,所述摩尔纹去除模块,包括:
样本获取单元,用于获取样本数据集,所述样本数据集包括至少一个样本数据和与各所述样本数据对应的样本标签;
标签预测单元,用于获取预设训练模型,通过所述预设训练模型对所有所述样本数据进行分类,得到预测标签;
损失预测单元,用于根据与同一所述样本数据对应的样本标签和预测标签,确定所述预设训练模型的预测损失值;
模型收敛单元,用于在所述预测损失值达到预设收敛条件时,将收敛之后的预设训练模型确定为预设分类模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述信息录入方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述信息录入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311319172.0A CN117351501A (zh) | 2023-10-10 | 2023-10-10 | 信息录入方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311319172.0A CN117351501A (zh) | 2023-10-10 | 2023-10-10 | 信息录入方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117351501A true CN117351501A (zh) | 2024-01-05 |
Family
ID=89358931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311319172.0A Pending CN117351501A (zh) | 2023-10-10 | 2023-10-10 | 信息录入方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117351501A (zh) |
-
2023
- 2023-10-10 CN CN202311319172.0A patent/CN117351501A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191568B (zh) | 翻拍图像识别方法、装置、设备及介质 | |
CN111626124B (zh) | Ocr图像样本生成、印刷体验证方法、装置、设备及介质 | |
CN111666932B (zh) | 单据审核方法、装置、计算机设备及存储介质 | |
CN114596566B (zh) | 文本识别方法及相关装置 | |
WO2022035942A1 (en) | Systems and methods for machine learning-based document classification | |
CN114357174B (zh) | 基于ocr和机器学习的代码分类系统及方法 | |
CN115862040A (zh) | 文本纠错方法、装置、计算机设备及可读存储介质 | |
CN113806613B (zh) | 训练图像集生成方法、装置、计算机设备及存储介质 | |
CN117454426A (zh) | 一种理赔资料信息脱敏采集方法、装置及系统 | |
CN112307749A (zh) | 文本检错方法、装置、计算机设备和存储介质 | |
CN113837169B (zh) | 文本数据处理方法、装置、计算机设备及存储介质 | |
CN115759758A (zh) | 风险评估方法、装置、设备及存储介质 | |
US20200226162A1 (en) | Automated Reporting System | |
CN115984886A (zh) | 表格信息抽取方法、装置、设备及存储介质 | |
US20230134218A1 (en) | Continuous learning for document processing and analysis | |
CN115880702A (zh) | 数据处理方法、装置、设备、程序产品及存储介质 | |
CN117351501A (zh) | 信息录入方法、装置、设备及存储介质 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN115688166A (zh) | 信息脱敏处理方法、装置、计算机设备及可读存储介质 | |
WO2023173546A1 (zh) | 文本识别模型的训练方法、装置、计算机设备及存储介质 | |
CN113901817A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
CN114283429A (zh) | 素材工单数据处理方法、装置、设备及存储介质 | |
CN117133000A (zh) | 签名校验方法、装置、设备及存储介质 | |
CN117058679A (zh) | 文本纠错处理方法、装置、设备及存储介质 | |
CN117493645B (zh) | 一种基于大数据的电子档案推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |