CN112989990A - 医疗票据识别方法、装置、设备及存储介质 - Google Patents

医疗票据识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112989990A
CN112989990A CN202110256578.3A CN202110256578A CN112989990A CN 112989990 A CN112989990 A CN 112989990A CN 202110256578 A CN202110256578 A CN 202110256578A CN 112989990 A CN112989990 A CN 112989990A
Authority
CN
China
Prior art keywords
bill
field
identification
medical
transcoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110256578.3A
Other languages
English (en)
Other versions
CN112989990B (zh
Inventor
谢虹
瞿城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110256578.3A priority Critical patent/CN112989990B/zh
Publication of CN112989990A publication Critical patent/CN112989990A/zh
Application granted granted Critical
Publication of CN112989990B publication Critical patent/CN112989990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明属于信息识别领域,公开了一种医疗票据识别方法、装置、设备及存储介质,包括获取待识别医疗票据的票据图片、票据类型和票据所属地域,确定待识别医疗票据的类别;根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;根据预设的医疗知识库,对各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果,根据预设的业务规则逻辑进行业务逻辑校验,得到各字段的最终转码识别结果;将各字段的最终转码识别结果按照预设的集成要求集成后输出,有效提升医疗票据识别的准确性和识别效率。

Description

医疗票据识别方法、装置、设备及存储介质
技术领域
本发明属于信息识别领域,涉及一种医疗票据识别方法、装置、设备及存储介质。
背景技术
在保险理赔过程中,保险公司需要用户提交理赔的各项材料,其中,最主要的材料就是用户就诊的医疗票据信息,包括但不限于发票、费用明细、病历及检查检验报告等。但是,用户一般提供的都是图片影像材料而非结构化数据,继而通过保险公司的理赔作业人员在理赔系统中录入,信息获取效率低,并且录入的结构化信息一般仅为影像中的少量信息,大部分的就诊信息都未录入信息,导致信息缺失,影响理赔结果。
为了提高信息获取效率,目前一般采用OCR技术实现信息的自动获取,并且,随着OCR技术的日趋成熟,目前证照、激光打印类图片识别准确率能够达到95%以上。
但是,目前的OCR技术厂商仅提供算法技术,而非整套的解决方案。同时,由于医疗票据本身一般质量都比较差,且医疗票据内的部分就诊信息比较专业领域化,导致现有OCR技术对医疗票据的识别准确率较低,一般在70%~80%左右。
发明内容
本发明的目的在于克服上述现有技术中,医疗票据的识别准确率较低的缺点,提供一种医疗票据识别方法、装置、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种医疗票据识别方法,包括:
获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
将各字段的最终转码识别结果按照预设的集成要求集成后输。
本发明医疗票据识别方法进一步的改进在于:
所述根据票据类型和票据所属地域,确定待识别医疗票据的类别前,包括:将待识别医疗票据的票据图片进行数据质控预处理、数据脱敏预处理和分割切片预处理中的至少一种。
当将待识别医疗票据的票据图片进行数据质控预处理时,所述将待识别医疗票据的票据图片进行数据质控预处理具体包括:根据预设的票据模板,通过模糊检测算法检测待识别医疗票据的票据图片,得到票据图片的模糊程度、票据存在张数以及倾斜程度;当票据图片的模糊程度在预设的模糊程度阈值以内时,保留当前票据图片,否则,生成人工作业请求;当票据存在张数大于1时,将票据图片分割为仅包含单张票据的若干子票据图片;否则,保留当前票据图片;当票据图片的倾斜程度在预设的倾斜程度阈值以内时,保留当前票据图片,否则,将票据图片进行角度旋转至票据图片的倾斜程度在倾斜程度阈值以内。
所述根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎具体包括:根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取以与待识别医疗票据的类别相同类别的医疗票据的票据图片训练后的OCR识别引擎,得到目标OCR识别引擎;所述医疗票据识别方法还包括:将包含人工识别结果的票据图片作为训练样本,根据包含人工识别结果的票据图片对应的医疗票据的类别,对经过相同类别的医疗票据的票据图片进行训练后得到的OCR识别引擎重新进行训练。
当从预设的若干OCR识别引擎中选取的目标OCR识别引擎为两个及以上时,所述通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果的具体方法为:通过各目标OCR识别引擎识别待识别医疗票据图片,得到各目标OCR识别引擎对票据图片内各字段的字段识别结果;比较任意两目标OCR识别引擎对票据图片内同一字段的字段识别结果,当二者相同时,得到当前字段的字段识别结果;否则,生成人工作业请求,基于人工作业请求获取当前字段的字段识别结果对应字段的人工识别结果,将当前字段的字段识别结果更新为人工识别结果。
所述通过目标OCR识别引擎识别待识别医疗票据图片,得到待识别医疗票据图片内各字段的字段识别结果时,包括:获取各字段识别结果的置信度,根据各字段识别结果的置信度以及各字段预设的置信度阈值,进行各字段识别结果的置信度校验;当当前字段识别结果的置信度大于预设的置信度阈值时,通过置信度校验;否则,生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,将当前字段识别结果更新为工识别结果。
所述根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码具体包括:通过相似度算法从预设的医疗知识库中,获取与当前的字段识别结果最相近的字段名称,并获取该字段名称的标准字段名称;根据所述标准字段名称更新当前的字段识别结果,逐个遍历各字段识别结果,完成各字段识别结果的智能匹配转码。
本发明第二方面,一种医疗票据识别装置,包括:
获取模块,用于获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
OCR识别模块,用于根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
智能匹配转码模块,用于根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
业务逻辑校验模块,用于从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过,否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
人工作业模块,用于当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
输出模块,用于将各字段的最终转码识别结果按照预设的集成要求集成后输出。
本发明第三方面,一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述医疗票据识别方法的步骤。
本发明第四方面,一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述医疗票据识别方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明医疗票据识别方法,首先确定待识别医疗票据的类别,并基于OCR识别引擎对不同类别医疗票据的识别能力的不同,根据待识别医疗票据的类别,选取目标OCR识别引擎,实现待识别医疗票据的票据图片的自动识别,从而在有效保证识别效率的同时,还能有效提升票据图片内各字段的字段识别结果的准确率,并在此基础上,根据预设的医疗知识库,进行各字段识别结果的智能匹配转码,将机器识别不太准确的字段识别结果进行智能匹配转码,同时,基于票据图片内各字段之间的关联性,根据预设的业务规则逻辑,从智能匹配转码后的字段识别结果中获取与业务逻辑相关联的若干字段识别结果并进行业务逻辑校验,进而大大提高识别的准确率,从而减少人工录入的成本,提升识别效率,并且,引用人工操作,解决了部分机器无法识别的内容,无法满足客户整体需求的情况。
附图说明
图1为本发明实施例的医疗票据识别方法流程框图;
图2为本发明的医疗票据识别装置结构框图;
图3为本发明实施例的终端设备结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
参见图1,本发明一个实施例中,提供一种医疗票据识别方法,有效解决现有的票据识别技术无法有效对低质量的医疗票据进行准确识别的问题,提高医疗票据的识别效率和识别准确率,具体的,该医疗票据识别方法包括以下步骤。
S1:获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别。
通过相连接各家保险公司,通过人工录入的方式获取待识别医疗票据的票据图片,以进行后续的医疗票据识别,并且,在传输医疗票据图片的同时,可以一同传输票据来源、票据用户、票据类型、票据所属地域以及票据个人信息。
其中,票据类型和票据所属地域对医疗票据本身内容的影响较大,因此,本实施例中,以票据类型和票据所属地域作为医疗票据的分类标准,通过票据类型和票据所属地域,划分医疗票据的类别。进而根据票据类型和票据所属地域,确定待识别医疗票据的类别,根据分类的类别来决定后续调用的OCR识别引擎。
S2:根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果。
具体的,本实施例中,提前预设了若干了OCR识别引擎,OCR识别引擎用于通过OCR技术识别传输来的待识别医疗票据的票据图片,是目前普遍采用的识别方式,但是,不同的OCR识别引擎针对不同类别的医疗票据的票据图片的识别效果和能力有所差别,因此,本实施例中,预先设置各种类别的医疗票据的票据图片对应的OCR识别引擎,并通过相应的训练样本进行OCR识别引擎的训练。这里,相应的训练样本就是指同一类别的医疗票据的票据图片,其通过人工识别得到的识别结果,进而作为训练样本。
因此,本实施例中在进行预测时,首先会根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,这里目标OCR识别引擎就是指以与待识别医疗票据同一类别的医疗票据的票据图片训练后的OCR识别引擎。具体的,从预设的若干OCR识别引擎中选取目标OCR识别引擎的方法为:根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取以同一类别的医疗票据的票据图片训练后的OCR识别引擎,得到目标OCR识别引擎。
同时,为保证结果的准确,也可以根据前期的测试结果及配置中心的配置,基于待识别医疗票据的类别,来调用一个或多个目标OCR识别引擎。
优选的,当从预设的若干OCR识别引擎中选取的目标OCR识别引擎为两个及以上时,所述通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果方法为:对于需要调用2个及以上目标OCR识别引擎进行识别的,需要比对两个目标OCR识别引擎的识别结果,如果两个目标OCR识别引擎的识别结果一致则通过,如非一致则进入人工环节。具体的,首先,通过各目标OCR识别引擎识别待识别医疗票据图片,得到各目标OCR识别引擎对票据图片内各字段的字段识别结果;其次,比较任意两目标OCR识别引擎对票据图片内同一字段的字段识别结果,当二者相同时,得到当前字段的字段识别结果;否则,生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,以人工识别结果更新字段识别结果,得到当前字段的字段识别结果。
最终,目标OCR识别引擎将识别结果以结构化的数据形式,按照字段级别返回,得到票据图片内各字段的字段识别结果,同时,也可以一并返回各个字段识别结果的置信度。返回的各个字段识别结果以及各个字段识别结果的置信度,接着进行后续智能校验和人工作业阶段。
S3:根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果。
本实施例中,医疗知识库可以细分为诊断库、健康因子库、药品库、疾病库、处方库以及医疗资源库六大库,进而通过六大库可以有效将药品、医院、疾病以及治疗方案等字段进行智能校验匹配,其目的主要是将一些机器无法有效准确识别的个别字段通过相似度算法纠正成正确的名称。
智能匹配转码的做法是从预设的医疗知识库中,选取与当前字段识别结果相似度最高的字段名称更新当前字段识别结果。具体的,根据预设的医疗知识库,逐个遍历各字段识别结果,通过相似度算法从预设的医疗知识库中,获取与当前的字段识别结果最相近的字段名称,以字段名称更新当前的字段识别结果。
同时,由于有些字段名称存在多种表现形式,比如,医院名字段,“上海红房子医院”和“复旦附属妇产科医院”表示的是一个内容,为了后续数据的方便整理,本实施例中,实现对医院名、疾病名及药品名等的标准化,通过预设标准字段及该标准字段对应的若干非标准字段实现。例如,“上海红房子医院”和“复旦附属妇产科医院”,通过智能匹配转码模块后,识别的字段统一成“复旦附属妇产科医院”。具体做法为:当获取与当前的字段识别结果最相近的字段名称后,获取该字段名称的标准字段名称,以标准字段名称更新当前的字段识别结果,完成各字段识别结果的智能匹配转码,得到各字段的转码识别结果。
S4:根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果。
在经过智能匹配转码后,各字段识别结果已经初步实现准确识别,得到了各字段的转码识别结果,同时,从另一个角度上说,还可以从各字段之间的关联性出发,即进行业务逻辑校验,进一步提升识别的准确性,其中,业务逻辑校验用于根据业务规则逻辑,对一些关联字段进行业务逻辑校验,例如,总金额=医保统筹支付+自负金额+自费金额。
具体的,本实施例中,根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务逻辑相关联的转码识别结果,得到若干关联识别结果;然后将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验。且当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;当若干关联识别结果满足预设的业务规则逻辑时,业务逻辑校验通过。
当业务逻辑校验通过时,表示当前的字段识别结果已经具有相当高的准确性因此,将当前各字段的转码识别结果作为各字段的最终转码识别结果。而一但业务逻辑校验没有通过,则说明相关联的几个字段识别结果存在问题,关联的几个字段识别结果均需要进入人工环节进行比对。
S5:当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果。
具体的,对于前面环节都符合系统配置要求的字段则跳过人工环节,对于机器判断不符合条件的字段进入人工环节进行处理,本实施例中,当字段识别结果检验未通过时,表明当前的机器识别结果不能满足需求,需要进行人工介入。
具体的,当业务逻辑校验未通过时,生成人工作业请求,并根据人工作业请求将待识别医疗票据的票据图片输出进行人工处理,接收人工处理后的当前关联识别结果对应字段的人工识别结果,进而将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果。
优选的,对于部分因为模板切片或其他原因导致字段识别结果不准确的,人工对待识别医疗票据的票据图片进行重新识别,并返回给机器作为新的训练样本,对对应的OCR识别引擎重新进行训练。具体的,将包含人工识别结果的票据图片作为训练样本,根据包含人工识别结果的票据图片对应的医疗票据的类别,对经过相同类别的医疗票据的票据图片进行训练后得到的OCR识别引擎重新进行训练。通过人工的录入和标准提交给OCR识别引擎和数据库,给OCR识别引擎提供训练样本,不断提高OCR识别引擎后续的识别准确率,丰富数据库从而提高机器纠偏能力。
S6:将各字段的最终转码识别结果按照预设的集成要求集成后输出。
在得到各字段的字段识别结果之后,将各字段的最终转码识别结果按照预设的集成要求集成后返回给保险公司。在经过机器+人工的识别流程后,将各字段的最终转码识别结果按照预设的集成要求,比如按照理赔案件维度,进行结构化数据的识别结果的整合。对于各字段的最终转码识别结果,也可以支持人工进行抽样检查以及复核等步骤,最终将完整的字段识别结果返回对应的保险公司。
同时,将结构化数据的字段识别结果回写给数据库,补充数据库的信息,为以后识别提供支持。
综上所述,本发明医疗票据识别方法,提供医疗票据的完整解决方案,通过机器+人工的全流程方式解决医疗票据无法完全机器识别的问题,以及识别结果不准确的问题。同时为了节省人工操作,通过引用目标OCR识别引擎、医疗知识库校验、业务规则逻辑配置比对等方式大大提供识别的准确率,从而减少人工录入的成本;其中,医疗知识库校验即为积累的药品、诊断、处方知识库,例如根据药品库匹配检验智能识别的药品名称是否正确,如果无法找到将会提供相似词,以便于后续人工作业进行调整选择,避免人工完全手工录入,提高效率。同时,引用人工操作,一方面解决部分机器无法识别的内容,无法满足客户整体需求的情况,一方面通过人工的录入和标准提交给识别模型和数据库,给模型提供训练样本,不断提高后续模型的识别准确率,丰富数据库从而提高机器纠偏能力。
本发明再一个实施例中,提供一种医疗票据识别方法,相较于上一实施例中的医疗票据识别方法,本实施例中的医疗票据识别方法除包括上一实施例中的医疗票据识别方法的全部内容外,在根据票据类型和票据所属地域,确定待识别医疗票据的类别前,还包括:将待识别医疗票据的票据图片进行数据质控预处理、数据脱敏预处理和分割切片预处理中的至少一种。
其中,数据质控预处理具体是对待识别医疗票据的票据图片进行质量检查,可以通过模糊检测算法检测,通过预设的票据模板来匹配一张票据图片中是否存在多个票据模板,以及检测待识别医疗票据的票据图片中模板边缘确定票据图片是否倾斜,确定票据图片是否存在模糊、多张票据存在、倾斜等不符合质量的情况,得到票据图片的具体情况,比如模糊程度、票据存在张数以及倾斜程度,根据预设的对应指标,确定是否能够进行智能识别。
对能够进行智能识别的医疗票据图片进行优化处理,比如:将倾斜的票据图片经过角度旋转成直线,对于识别为多张票据的,对票据图片进行切割成多张子票据图片,提升医疗票据图片的清晰度,保留多张票据中完整的票据并拆分,调整票据图片的角度;对不能进行智能识别的医疗票据图片返回给用户进行人工处理。具体方法为:根据预设的票据模板,通过模糊检测算法检测待识别医疗票据的票据图片,得到票据图片的模糊程度、票据存在张数以及倾斜程度;当票据图片的模糊程度在预设的模糊程度阈值以内时,保留当前票据图片,否则,生成人工作业请求;当票据存在张数大于1时,将票据图片分割为仅包含单张票据的若干子票据图片;否则,保留当前票据图片;当票据图片的倾斜程度在预设的倾斜程度阈值以内时,保留当前票据图片,否则,将票据图片进行角度旋转至票据图片的倾斜程度在倾斜程度阈值以内。
数据脱敏预处理是对医疗票据图片进行个人敏感信息进行脱敏。数据脱敏预处理是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
分割切片预处理是对于一些需要分割的票据图片进行切片后传输给后续识别引擎。当前票据是否需要分割通过预先的配置决定,其中,该预先的配置则由不同的OCR识别引擎的算法能力确定。
本发明再一个实施例中,提供一种医疗票据识别方法,相较于上一实施例中的医疗票据识别方法,本实施例中的医疗票据识别方法除包括上一实施例中的医疗票据识别方法的全部内容外,在通过目标OCR识别引擎识别待识别医疗票据图片,得到待识别医疗票据图片内各字段的字段识别结果时,还包括:获取各字段识别结果的置信度,根据各字段识别结果的置信度以及各字段预设的置信度阈值,进行各字段识别结果的置信度校验;其中,置信度阈值根据前期测试的置信度进行总结归纳得到。
当当前字段识别结果的置信度大于预设的置信度阈值时,通过置信度校验,对于低于置信度阈值的字段识别结果,认定智能识别不准确,需要经过机器修正或人工修正,一般是生成人工作业请求,进而基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,以人工识别结果更新当前字段识别结果。
优选的,人工可以对各个环节依据不同的情况进行不同的处理,例如,无法识别的字段或置信度低的字段进行人工识别,并录入人工识别结果;待识别医疗票据分类不正确而无法识别的待识别医疗票据的票据图片进行重新弄分类;对于多个目标OCR识别引擎识别不一致的字段,通过人工选出识别结果最准确的字段识别结果等。
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未纰漏的细节,请参照本发明方法实施例。
参见图2,本发明再一个实施例中,提供一种医疗票据识别装置,该医疗票据识别装置能够用于实现上述医疗票据识别方法,具体的,该医疗票据识别装置包括获取模块、OCR识别模块、智能匹配转码模块、业务逻辑校验模块、人工作业模块以及输出模块。
其中,获取模块用于获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别。具体的,本实施例中,获取模块中还用于实现用户管理、用量统计以及配置中心等常规功能。OCR识别模块用于根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果。具体的,本实施例中,采用不同的技术团队或外部供应商提供不同的OCR识别引擎。智能匹配转码模块用于根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;业务逻辑校验模块用于从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;人工作业模块用于当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;输出模块用于将各字段的最终转码识别结果按照预设的集成要求集成后输出。
优选的,人工作业模块还用于当任意两目标OCR识别引擎对票据图片内同一字段的字段识别结果不同时,生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,将人工识别结果作为当前字段的字段识别结果,还用于当未通过置信度校验时,生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,将当前字段识别结果更新为人工识别结果。
该医疗票据识别装置还包括数据库模块,数据库模块用于存储预设的数据信息、识别过程中信息以及识别结果,具体的,数据库模块内预设六大库,实现智能纠编、人工查询和数据回写。
优选的,该医疗票据识别装置还包括预处理模块,预处理模块用于将待识别医疗票据的票据图片进行预处理,所述预处理包括下述中的至少一种:数据质控、数据脱敏和分割切片。
优选的,该医疗票据识别装置还包括置信度校验模块,置信度校验模块用于获取各字段识别结果的置信度,根据各字段识别结果的置信度以及各字段预设的置信度阈值,进行各字段识别结果的置信度校验;当字段识别结果的置信度大于预设的置信度阈值时,通过置信度校验,否则,通过人工作业模块生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,将当前字段识别结果更新为人工识别结果。
参见图3,本发明再一个实施例中,提供一种终端设备,包括:在硬件层面,该终端设备包括:处理器和存储器,可选的还包括内部总线、网络接口。其中,存储器可能包含内存,例如高速随机存储器,也可能还包括非易失性存储器,例如,至少一个磁盘存储器等。当然,该终端设备可能还包括其他业务所需的硬件。处理器、网络接口、存储器通过内部总线互相连接,该内部总线可以是工业标准体系结构总线、外设部件互连标准总线、扩展工业标准结构总线等。总线可以分为地址总线、数据总线、控制总线等。存储器用于存放程序。具体地,程序可以包括程序代码、所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成上述终端设备。处理器可能是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能。
本发明实施例所述的处理器可以用于医疗票据识别方法的操作,包括获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;将各字段的最终转码识别结果按照预设的集成要求集成后输出。
再一个实施例中,本发明还提供了一种计算机存储介质(Memory),所述计算机存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作装置。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机存储介质中存放的一条或一条以上指令,以实现上述实施例中有关医疗票据识别方法的相应步骤;计算机存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;将各字段的最终转码识别结果按照预设的集成要求集成后输出。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种医疗票据识别方法,其特征在于,包括:
获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
将各字段的最终转码识别结果按照预设的集成要求集成后输出。
2.根据权利要求1所述的医疗票据识别方法,其特征在于,所述根据票据类型和票据所属地域,确定待识别医疗票据的类别前,包括:
将待识别医疗票据的票据图片进行数据质控预处理、数据脱敏预处理和分割切片预处理中的至少一种。
3.根据权利要求2所述的医疗票据识别方法,其特征在于,当将待识别医疗票据的票据图片进行数据质控预处理时,所述将待识别医疗票据的票据图片进行数据质控预处理具体包括:
根据预设的票据模板,通过模糊检测算法检测待识别医疗票据的票据图片,得到票据图片的模糊程度、票据存在张数以及倾斜程度;
当票据图片的模糊程度在预设的模糊程度阈值以内时,保留当前票据图片,否则,生成人工作业请求;
当票据存在张数大于1时,将票据图片分割为仅包含单张票据的若干子票据图片;否则,保留当前票据图片;
当票据图片的倾斜程度在预设的倾斜程度阈值以内时,保留当前票据图片,否则,将票据图片进行角度旋转至票据图片的倾斜程度在倾斜程度阈值以内。
4.根据权利要求1所述的医疗票据识别方法,其特征在于,所述根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎具体包括:
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取以与待识别医疗票据的类别相同类别的医疗票据的票据图片训练后的OCR识别引擎,得到目标OCR识别引擎;
所述医疗票据识别方法还包括:
将包含人工识别结果的票据图片作为训练样本,根据包含人工识别结果的票据图片对应的医疗票据的类别,对经过相同类别的医疗票据的票据图片进行训练后得到的OCR识别引擎重新进行训练。
5.根据权利要求1所述的医疗票据识别方法,其特征在于,当从预设的若干OCR识别引擎中选取的目标OCR识别引擎为两个及以上时,所述通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果的具体方法为:
通过各目标OCR识别引擎识别待识别医疗票据图片,得到各目标OCR识别引擎对票据图片内各字段的字段识别结果;
比较任意两目标OCR识别引擎对票据图片内同一字段的字段识别结果,当二者相同时,得到当前字段的字段识别结果;
否则,生成人工作业请求,基于人工作业请求获取当前字段的字段识别结果对应字段的人工识别结果,将当前字段的字段识别结果更新为人工识别结果。
6.根据权利要求1所述的医疗票据识别方法,其特征在于,所述通过目标OCR识别引擎识别待识别医疗票据图片,得到待识别医疗票据图片内各字段的字段识别结果时,包括:
获取各字段识别结果的置信度,根据各字段识别结果的置信度以及各字段预设的置信度阈值,进行各字段识别结果的置信度校验;
当当前字段识别结果的置信度大于预设的置信度阈值时,通过置信度校验;
否则,生成人工作业请求,基于人工作业请求获取当前字段识别结果对应字段的人工识别结果,将当前字段识别结果更新为人工识别结果。
7.根据权利要求1所述的医疗票据识别方法,其特征在于,所述根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码具体包括:
通过相似度算法从预设的医疗知识库中,获取与当前的字段识别结果最相近的字段名称,并获取该字段名称的标准字段名称;
根据所述标准字段名称更新当前的字段识别结果,逐个遍历各字段识别结果,完成各字段识别结果的智能匹配转码。
8.一种医疗票据识别装置,其特征在于,包括:
获取模块,用于获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
OCR识别模块,用于根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
智能匹配转码模块,用于根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
业务逻辑校验模块,用于从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
人工作业模块,用于当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
输出模块,用于将各字段的最终转码识别结果按照预设的集成要求集成后输出。
9.一种终端设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述医疗票据识别方法的步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述医疗票据识别方法的步骤。
CN202110256578.3A 2021-03-09 2021-03-09 医疗票据识别方法、装置、设备及存储介质 Active CN112989990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110256578.3A CN112989990B (zh) 2021-03-09 2021-03-09 医疗票据识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110256578.3A CN112989990B (zh) 2021-03-09 2021-03-09 医疗票据识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112989990A true CN112989990A (zh) 2021-06-18
CN112989990B CN112989990B (zh) 2023-08-04

Family

ID=76336228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110256578.3A Active CN112989990B (zh) 2021-03-09 2021-03-09 医疗票据识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112989990B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723508A (zh) * 2021-08-30 2021-11-30 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN114611541A (zh) * 2022-03-11 2022-06-10 平安科技(深圳)有限公司 发票图像识别方法、装置、设备及存储介质
CN115101186A (zh) * 2022-07-25 2022-09-23 武汉大学人民医院(湖北省人民医院) 基于大数据的医院就诊信息管理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN108664897A (zh) * 2018-04-18 2018-10-16 平安科技(深圳)有限公司 票据识别方法、装置及存储介质
CN111444792A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 票据识别方法、电子设备、存储介质及装置
CN111444793A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 基于ocr的票据识别方法、设备、存储介质及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN108664897A (zh) * 2018-04-18 2018-10-16 平安科技(深圳)有限公司 票据识别方法、装置及存储介质
CN111444792A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 票据识别方法、电子设备、存储介质及装置
CN111444793A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 基于ocr的票据识别方法、设备、存储介质及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723508A (zh) * 2021-08-30 2021-11-30 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN113723508B (zh) * 2021-08-30 2024-04-19 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN114611541A (zh) * 2022-03-11 2022-06-10 平安科技(深圳)有限公司 发票图像识别方法、装置、设备及存储介质
CN115101186A (zh) * 2022-07-25 2022-09-23 武汉大学人民医院(湖北省人民医院) 基于大数据的医院就诊信息管理方法及装置
CN115101186B (zh) * 2022-07-25 2022-11-08 武汉大学人民医院(湖北省人民医院) 基于大数据的医院就诊信息管理方法及装置

Also Published As

Publication number Publication date
CN112989990B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
US11429878B2 (en) Cognitive recommendations for data preparation
CN112989990B (zh) 医疗票据识别方法、装置、设备及存储介质
WO2021068601A1 (zh) 病历检测方法、装置、设备及存储介质
WO2020082579A1 (zh) 一种风险审批方法、装置、存储介质和服务器
US10482174B1 (en) Systems and methods for identifying form fields
WO2019085064A1 (zh) 医疗理赔拒付方法、装置、终端设备及存储介质
US20220004878A1 (en) Systems and methods for synthetic document and data generation
US8064703B2 (en) Property record document data validation systems and methods
US20070217692A1 (en) Property record document data verification systems and methods
US10452700B1 (en) Systems and methods for parsing log files using classification and plurality of neural networks
CN111161815A (zh) 医疗数据检测方法、装置、终端和计算机可读存储介质
CN110610431A (zh) 基于大数据的智能理赔方法及智能理赔系统
CN111767350A (zh) 数据仓库测试方法、装置、终端设备及存储介质
CN116541752B (zh) 元数据管理方法、装置、计算机设备及存储介质
CN110223182A (zh) 一种理赔风控方法、装置及计算机可读存储介质
CN113707304B (zh) 分诊数据处理方法、装置、设备及存储介质
CN112836041B (zh) 人员关系分析方法、装置、设备及存储介质
CN112786124B (zh) 一种问题排查方法、装置、存储介质及设备
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
US20070217691A1 (en) Property record document title determination systems and methods
CN111242779A (zh) 金融数据特征选择和预测方法、装置、设备及存储介质
US20230214451A1 (en) System and method for finding data enrichments for datasets
CN114491134A (zh) 一种商标注册成功率分析方法及系统
CN115099922B (zh) 财务数据查询方法、系统、可读存储介质及计算机设备
CN115662607B (zh) 一种基于大数据分析的互联网线上问诊推荐方法及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant