CN117197828A - 票据信息识别方法、装置、介质及设备 - Google Patents
票据信息识别方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN117197828A CN117197828A CN202311013293.2A CN202311013293A CN117197828A CN 117197828 A CN117197828 A CN 117197828A CN 202311013293 A CN202311013293 A CN 202311013293A CN 117197828 A CN117197828 A CN 117197828A
- Authority
- CN
- China
- Prior art keywords
- word
- missing
- text
- determining
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012937 correction Methods 0.000 claims abstract description 107
- 238000001514 detection method Methods 0.000 claims description 23
- 230000011218 segmentation Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 19
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000007547 defect Effects 0.000 abstract description 9
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 230000036772 blood pressure Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
本申请公开票据信息识别方法、装置、介质及设备,该方法包括:对待识别的医疗票据图像进行文字识别,确定文字缺失区域及文字缺失区域中的完整字和缺失字;将完整字和缺失字组成待识别词组,基于预设医疗词语库对待识别词组进行词向量匹配,确定缺失字对应的候选补正字;识别缺失字中存在的笔画,将笔画和候选补正字进行笔画匹配,确定缺失字对应的目标补正字;基于完整字和目标补正字,输出医疗票据的识别信息。通过确定待识别的医疗票据图像中的文字缺失区域,将文字缺失区域中词组与预设医疗词语库的词组进行词向量匹配,确定缺失字对应的目标补正字,提高了票据信息的识别准确率,尤其适用于具有文字缺失、文字模糊、文字污损等缺陷的票据。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种票据信息识别方法、装置、介质及设备。
背景技术
随着经济的发展,人们的消费水平不断提高,为了维护人们的消费权益以及保护人们的合法权益,票据成为了消费者的有力保障以及有效的报销凭证,因此相关工作人员每天需要处理大量的票据,例如识别票据信息。
通常使用的票据识别方法有人工识别方法和光学字符识别方法。人工识别方法准确率高但是识别效率低,需要耗费大量的人力和精力,因此,近些年光学字符识别方法得到了广泛应用。光学字符识别方法通过对票据图像中的每一字符进行识别,从而确定出该票据图像所包含的票据信息。由于光学字符识别方法只能对清楚的字符进行识别,因此针对具有文字重叠、文字模糊等缺陷的票据,光学字符识别方法的识别准确率低。
发明内容
有鉴于此,本发明提供了一种票据信息识别方法、装置、介质及设备,主要目的在于解决目前光学字符识别方法对具有文字重叠、文字模糊等缺陷的票据的识别准确率低的问题。
根据本申请的一个方面,提供了一种票据信息识别方法,该方法包括:
对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字;
将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字;
识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字;
基于所述完整字和所述目标补正字,输出医疗票据的识别信息。
可选地,所述将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字,包括:
将所述完整字和所述缺失字组成待识别词组;
基于所述待识别词组中字的数量、所述完整字和所述完整字的占位,将所述待识别词组与预设医疗词语库中的词组进行匹配,确定候选词组;
基于所述候选词组和所述待识别词组中所述缺失字的占位,确定所述缺失字对应的候选补正字。
可选地,所述识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字,包括:
识别所述缺失字中存在的笔画,按所述笔画的所在位置,生成待补正字;
将所述待补正字与候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字。
可选地,所述对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字,包括:
基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域;
基于预设的文字设置位置和预设的文字识别模型,分别对每个图像区域进行文字识别;
对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,并基于识别的文字,确定所述文字缺失区域中的完整字和缺失字。
可选地,所述对识别的文字进行语义检测之后,所述方法还包括:
根据语义检测结果,确定文字完整区域,基于所述文字完整区域中识别的文字,输出医疗票据的识别信息。
可选地,所述基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割之前,所述方法还包括:
获取初始票据图像,对所述初始票据图像进行表格矫正;
对表格矫正后的票据图像进行光谱调整和颜色调整;
对光谱调整和颜色调整后的票据图像进行尺寸调整和像素栅格化处理,得到待识别的票据图像。
可选地,所述文字缺失区域包括文字与表格重叠区域、文字与图章重叠区域、文字与文字重叠区域和文字模糊区域中的至少一种。
根据本申请的另一个方面,提供了一种票据信息识别装置,包括:
文字缺失区域确定模块,用于对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字;
候选补正字确定模块,用于将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字;
目标补正字确定模块,用于识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字;
信息输出模块,用于基于所述完整字和所述目标补正字,输出医疗票据的识别信息。
可选地,所述候选补正字确定模块还用于:
将所述完整字和所述缺失字组成待识别词组;
基于所述待识别词组中字的数量、所述完整字和所述完整字的占位,将所述待识别词组与预设医疗词语库中的词组进行匹配,确定候选词组;
基于所述候选词组和所述待识别词组中所述缺失字的占位,确定所述缺失字对应的候选补正字。
可选地,所述目标补正字确定模块还用于:
识别所述缺失字中存在的笔画,按所述笔画的所在位置,生成待补正字;
将所述待补正字与候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字。
可选地,所述文字缺失区域确定模块还用于:
基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域;
基于预设的文字设置位置和预设的文字识别模型,分别对每个图像区域进行文字识别;
对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,并基于识别的文字,确定所述文字缺失区域中的完整字和缺失字。
可选地,所述票据信息识别装置还包括:
文字完整区域确定模块,用于根据语义检测结果,确定文字完整区域;
所述信息输出模块还用于:基于所述文字完整区域中识别的文字,输出医疗票据的识别信息。
可选地,所述基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割之前,所述方法还包括:
获取初始票据图像,对所述初始票据图像进行表格矫正;
对表格矫正后的票据图像进行光谱调整和颜色调整;
对光谱调整和颜色调整后的票据图像进行尺寸调整和像素栅格化处理,得到待识别的票据图像。
可选地,所述文字缺失区域包括文字与表格重叠区域、文字与图章重叠区域、文字与文字重叠区域和文字模糊区域中的至少一种。
根据本申请的另一个方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述票据信息识别方法对应的操作。
根据本申请的另一个方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述票据信息识别方法对应的操作。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本申请提供的一种票据信息识别方法、装置、设备及介质,通过对待识别的医疗票据图像进行文字识别,获取文字缺失区域及文字缺失区域中的完整字和缺失字,按字的顺序将完整字和缺失字进行组合,生成待识别词组,将待识别词组与预设医疗词语库中的词组进行词向量匹配,确定缺失字对应的候选补正字,将缺失字中存在的笔画与候选补正字进行笔画匹配,确定缺失字对应的目标补正字,按顺序输出完整字和目标补正字,作为医疗票据的识别信息,通过对缺失字的识别和补正,提高了票据信息的识别准确率,尤其适用于具有文字缺失、文字模糊、文字污染等缺陷的票据。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种票据信息识别方法的流程图;
图2示出了本申请实施例提供的另一种票据信息识别方法的流程图;
图3示出了本申请实施例提供的再一种票据信息识别方法的流程图;
图4示出了本申请实施例提供的又一种票据信息识别方法的流程图;
图5示出了本申请实施例提供的一种票据信息识别装置的组成框图;
图6示出了本发明实施例提供的一种计算机设备的结构示意图。
其中,
图5中:502-文字缺失区域确定模块;504-候选补正字确定模块;506-目标补正字确定模块;508-信息输出模块;
图6中:602-处理器;604-通信接口;606-存储器;608-通信总线;610-程序。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明申请的具体实施方式、结构、特征及其功效,详细说明如后。在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
针对目前光学字符识别方法对具有文字重叠、文字模糊等缺陷的票据的识别准确率低的问题,本申请实施例提供了一种票据信息识别方法,如图1所示,该方法包括:
102:对待识别的医疗票据图像进行文字识别,确定文字缺失区域及文字缺失区域中的完整字和缺失字;
在本实施例中,待识别的医疗票据图像是用户在就医过程中生成的医院报销单据图像,例如医疗发票、医疗收据等。将这些医疗发票、医疗收据作为待识别的医疗票据图像。对待识别的医疗票据图像进行文字识别,对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,以便于对文字缺失区域中的缺失文字进行识别和处理。本申请的票据信息识别方法应用于保险理赔等场景。
在另一个本发明实施例中,为了进一步限定及说明,如图2所示,对待识别的医疗票据图像进行文字识别,确定文字缺失区域及文字缺失区域中的完整字和缺失字,包括:
202:基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域;
204:基于预设的文字设置位置和预设的文字识别模型,分别对每个图像区域进行文字识别;
206:对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,并基于识别的文字,确定文字缺失区域中的完整字和缺失字。
在本实施例中,基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域,例如表格区域,包含图章的区域、包含票据抬头的区域等,根据每个区域预设的文字设置位置,基于预设的文字识别模型,对每个区域进行文字识别,进一步提高文字识别的准确率,优选的,预设的区域分割模型为神经网络模型,预设的文字识别模型为光学字符识别模型。识别的文字包括表格文字、打印文字、图章文字、手写文字等。输出的识别信息包括已补全的文字、表格文字、打印文字、图章文字和手写文字等。
对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,例如某一个图像区域识别的文字为高、二和期,根据语义检测结果,高、二和期为不完整的词组,因此,将该图像区块确定为文字缺失区域,该文字缺失区域中的完整字为高、二和期,缺失字有两个,位于高和二之间,用*表示。
在一个实施例中,文字缺失区域包括文字与表格重叠区域、文字与图章重叠区域、文字与文字重叠区域和文字模糊区域中的至少一种。
在本实施例中,文字缺失区域可以为文字模块区域,文字穿孔区域、文字遮挡区域、文字涂染区域、文字污损区域,文字与表格重叠区域,文字与图章重叠区域和文字与文字重叠区域,针对上述文字缺失区域均可进行票据信息识别。
在一个实施例中,基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割之前,方法还包括:
获取初始票据图像,对初始票据图像进行表格矫正;
对表格矫正后的票据图像进行光谱调整和颜色调整;
对光谱调整和颜色调整后的票据图像进行尺寸调整和像素栅格化处理,得到待识别的票据图像。
在本实施例中,获取初始票据图像之后,首先对初始票据图像进行预处理,例如表格矫正、光谱调优、色阶调优和色差调优等,然后对调整后的票据图像进行尺寸调整和像素栅格化处理,将票据中的污损、遮挡、重叠、阴影、穿孔、手签部分进行处理,确保处理后的图像符合要求,进一步提高票据信息识别的准确率。
在一个实施例中,根据初始票据图像存在的缺陷进行相应处理,不用进行上述全部处理,例如,票据中存在阴影区域,将票据进行像素栅格化处理。
在一个实施例中,对识别的文字进行语义检测之后,方法还包括:
根据语义检测结果,确定文字完整区域,基于文字完整区域中识别的文字,输出医疗票据的识别信息。
在本实施例中,根据语义检测结果,确定文字完整区域,将文字完整区域内的文字,根据识别结果直接输出,作为票据的识别信息。
在一个实施例中,基于至少一种票据特征,识别目标医疗票据图像包含的特征区域,票据特征包括文字特征和至少一种样式特征;识别文字特征区域中与至少一个样式特征区域存在重叠的缺失文字区域。
具体的,样式特征包括图章、表格、印章中至少一种;
基于至少一种票据特征,识别医疗票据图像包含的特征区域,包括:
对医疗票据图像进行票据样式识别,确定医疗票据图像的目标票据样式,并获取目标票据样式对应的票据特征以及每种票据特征的特征所在区域范围;
基于每种票据特征的特征所在区域范围,在医疗票据图像中识别每种票据特征对应的特征区域。
在本实施例中,首先对医疗票据图像进行票据样式识别,例如确定该医疗票据图像的格式是发票还是收据,确定票据格式后,根据预设的票据格式,获取目标票据样式对应的票据特征以及每种票据特征的特征所在区域范围,根据每个票据特征对应的特征所在区域,将医疗票据图像划分为每个票据特征对应的特征区域,然后对每个特征区域进行识别。
在一个实施例中,若特征区域包括文字特征区域和样式特征区域,则识别文字特征区域中与每个样式特征区域均不存在重叠的完整文字区域,以及与至少一个样式特征区域存在重叠的缺失文字区域。
在一个实施例中,对缺失文字区域进行特征强化处理,基于特征强化处理后的缺失文字区域,进行文字识别。
104:将完整字和缺失字组成待识别词组,基于预设医疗词语库对待识别词组进行词向量匹配,确定缺失字对应的候选补正字;
在本实施例中,按字的占位将完整字和缺失字组成待识别词组,将待识别词组与预设医疗词语库中的词组进行词向量匹配,将匹配度高的词组作为候选词组,根据缺失字的占位,确定每个候选词组中的候选补正字。
在一个实施例中,预设医疗词语库是根据历史医疗票据获取的医疗词语,包括医疗行业、保险行业中词语的简称、全称、代称、标准化术语等。
在一个实施例中,预设医疗词语库为整合医学术语、保险术语,建立的结构化术语库(如医院名称、疾病诊断、药品规格、手术名称、实验室检验检查等)。预设医疗词语库还包括根据票据录入的病理说明、入院诊断、出院小结等,整理分析获得的理赔语料特征库,整合图章、印章、手戳等样式获得的图章特征库,整合手写文字获得的文字特征库以及整合常规医院报销单据获得的样式库。
本发明实施例中,在另一个本发明实施例中,如图3所示,将完整字和缺失字组成待识别词组,基于预设医疗词语库对待识别词组进行词向量匹配,确定缺失字对应的候选补正字,包括:
302:将完整字和缺失字组成待识别词组;
304:基于待识别词组中字的数量、完整字和完整字的占位,将待识别词组与预设医疗词语库中的词组进行匹配,确定候选词组;
306:基于候选词组和待识别词组中缺失字的占位,确定缺失字对应的候选补正字。
在本实施例中,按字的占位将完整字和缺失字组成待识别词组,根据待识别词组中字的数量、识别的完整字和完整字的占位,将待识别词组与预设医疗词语库中的词组进行匹配,将匹配度高的词组作为候选词组,根据待识别词组中缺失字的占位,在候选词组中确定候选补正字。例如,文字缺失区域中的完整字为“高”“二期”,中间有两个缺失文字,缺失字用*标识,完整字和缺失字组成的待识别词组为“高**二期”,将“高**二期”与预设医疗词语库中的词组进行匹配,从预设医疗词语库中获取五个字的词组,且该词组的第一个字为高,第四个字为二,第五个字为期,将符合条件的词组作为候选词组,例如匹配的候选词组为“高血压二期”、“高血糖二期”和“高血脂二期”等,再将待识别词组分别与每个候选词组进行比较,确定缺失字对应的候选补正字为“血压”、“血糖”和“血脂”。
在一个实施例中,识别完整文字区域对应的第一完整文字组以及缺失文字区域对应的缺失文字组;利用预设医疗词语库对缺失文字组进行特征匹配,并依据匹配出的医疗词语对缺失文字组进行缺失字补全,得到第二完整文字组。
利用预设医疗词语库对缺失文字组进行特征匹配,包括:
若缺失文字组包含至少一个完整字,则利用预设医疗词语库对缺失文字组进行特征匹配;
若缺失文字组不包含完整字,则识别缺失文字组中不完整字的笔画,基于不完整字的笔画,利用预设医疗词语库对缺失文字组进行特征匹配。
106:识别缺失字中存在的笔画,将笔画和候选补正字进行笔画匹配,确定缺失字对应的目标补正字;
在本实施例中,识别缺失字中清楚的笔画,将缺失字中清楚的笔画与候选补正字进行匹配,将匹配度高的候选补正字作为目标补正字。
本发明实施例中,在另一个本发明实施例中,如图4所示,识别缺失字中存在的笔画,将笔画和候选补正字进行笔画匹配,确定缺失字对应的目标补正字,包括:
402:识别缺失字中存在的笔画,按笔画的所在位置,生成待补正字;
404:将待补正字与候选补正字进行笔画匹配,确定缺失字对应的目标补正字。
在本实施例中,识别缺失字中清楚的笔画,按笔画所占位置将这些清楚的笔画组合起来,生成待补正字,将待补正字与候选补正字进行匹配,将匹配度高的候选补正字作为目标补正字。例如,文字缺失区域中的完整字为“高”“二期”,缺失文字为两个,第一个缺失文字的上部有笔画撇,下部有笔画横,第二个缺失文字的上部有笔画横,左侧部有撇,候选补正字有“血压”、“血糖”和“血脂”等,将第一个缺失字的笔画组成第一个待补正字,将第二个缺失字的笔画组成第二个待补正字,将这两个待补正字与候选补正字进行匹配,分别计算这两个待补正字与每个候选补正字的相似度,最终确定相似度高的“血压”作为目标补正字。
108:基于完整字和目标补正字,输出医疗票据的识别信息。
在本实施例中,将文字缺失区块中的完整字和目标补正字按顺序组成词组,并将该词组作为医疗票据的识别信息输出,提高了有文字缺陷的票据信息的识别准确率。
本申请提供了一种票据信息识别方法,与现有技术相比,通过对待识别的医疗票据图像进行文字识别,获取文字缺失区域及文字缺失区域中的完整字和缺失字,按字的顺序将完整字和缺失字进行组合,生成待识别词组,将待识别词组与预设医疗词语库中的词组进行词向量匹配,确定缺失字对应的候选补正字,将缺失字中存在的笔画与候选补正字进行笔画匹配,确定缺失字对应的目标补正字,按顺序输出完整字和目标补正字,作为医疗票据的识别信息,通过对缺失字的识别和补正,提高了票据信息的识别准确率,尤其适用于具有文字缺失、文字模糊、文字污染等缺陷的票据。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种票据信息识别装置,如图5所示,该装置包括:
文字缺失区域确定模块502,用于对待识别的医疗票据图像进行文字识别,确定文字缺失区域及文字缺失区域中的完整字和缺失字;
候选补正字确定模块504,用于将完整字和缺失字组成待识别词组,基于预设医疗词语库对待识别词组进行词向量匹配,确定缺失字对应的候选补正字;
目标补正字确定模块506,用于识别缺失字中存在的笔画,将笔画和候选补正字进行笔画匹配,确定缺失字对应的目标补正字;
信息输出模块508,用于基于完整字和目标补正字,输出医疗票据的识别信息。
本申请提供了一种票据信息识别装置,与现有技术相比,通过对待识别的医疗票据图像进行文字识别,获取文字缺失区域及文字缺失区域中的完整字和缺失字,按字的顺序将完整字和缺失字进行组合,生成待识别词组,将待识别词组与预设医疗词语库中的词组进行词向量匹配,确定缺失字对应的候选补正字,将缺失字中存在的笔画与候选补正字进行笔画匹配,确定缺失字对应的目标补正字,按顺序输出完整字和目标补正字,作为医疗票据的识别信息,通过对缺失字的识别和补正,提高了票据信息的识别准确率,尤其适用于具有文字缺失、文字模糊、文字污染等缺陷的票据。。
在一个实施例中,候选补正字确定模块还用于:
将完整字和缺失字组成待识别词组;
基于待识别词组中字的数量、完整字和完整字的占位,将待识别词组与预设医疗词语库中的词组进行匹配,确定候选词组;
基于候选词组和待识别词组中缺失字的占位,确定缺失字对应的候选补正字。
在一个实施例中,目标补正字确定模块还用于:
识别缺失字中存在的笔画,按笔画的所在位置,生成待补正字;
将待补正字与候选补正字进行笔画匹配,确定缺失字对应的目标补正字。
在一个实施例中,文字缺失区域确定模块还用于:
基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域;
基于预设的文字设置位置和预设的文字识别模型,分别对每个图像区域进行文字识别;
对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,并基于识别的文字,确定文字缺失区域中的完整字和缺失字。
在一个实施例中,票据信息识别装置还包括:
文字完整区域确定模块,用于根据语义检测结果,确定文字完整区域;
信息输出模块还用于:基于文字完整区域中识别的文字,输出医疗票据的识别信息。
在一个实施例中,基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割之前,方法还包括:
获取初始票据图像,对初始票据图像进行表格矫正;
对表格矫正后的票据图像进行光谱调整和颜色调整;
对光谱调整和颜色调整后的票据图像进行尺寸调整和像素栅格化处理,得到待识别的票据图像。
在一个实施例中,文字缺失区域包括文字与表格重叠区域、文字与图章重叠区域、文字与文字重叠区域和文字模糊区域中的至少一种。
根据本发明一个实施例提供了一种存储介质,存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的票据信息识别方法。
图6示出了根据本发明一个实施例提供的一种计算机设备的结构示意图,本发明具体实施例并不对计算机设备的具体实现做限定。
如图6所示,该计算机设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器602,用于执行程序610,具体可以执行上述票据信息识别方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行以下操作:
对待识别的医疗票据图像进行文字识别,确定文字缺失区域及文字缺失区域中的完整字和缺失字;
将完整字和缺失字组成待识别词组,基于预设医疗词语库对待识别词组进行词向量匹配,确定缺失字对应的候选补正字;
识别缺失字中存在的笔画,将笔画和候选补正字进行笔画匹配,确定缺失字对应的目标补正字;
基于完整字和目标补正字,输出医疗票据的识别信息。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,在一个实施例中,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。
Claims (10)
1.一种票据信息识别方法,其特征在于,包括:
对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字;
将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字;
识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字;
基于所述完整字和所述目标补正字,输出医疗票据的识别信息。
2.如权利要求1所述的票据信息识别方法,其特征在于,所述将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字,包括:
将所述完整字和所述缺失字组成待识别词组;
基于所述待识别词组中字的数量、所述完整字和所述完整字的占位,将所述待识别词组与预设医疗词语库中的词组进行匹配,确定候选词组;
基于所述候选词组和所述待识别词组中所述缺失字的占位,确定所述缺失字对应的候选补正字。
3.如权利要求1所述的票据信息识别方法,其特征在于,所述识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字,包括:
识别所述缺失字中存在的笔画,按所述笔画的所在位置,生成待补正字;
将所述待补正字与候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字。
4.如权利要求1所述的票据信息识别方法,其特征在于,所述对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字,包括:
基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割,获得多个图像区域;
基于预设的文字设置位置和预设的文字识别模型,分别对每个图像区域进行文字识别;
对识别的文字进行语义检测,根据语义检测结果,确定文字缺失区域,并基于识别的文字,确定所述文字缺失区域中的完整字和缺失字。
5.如权利要求4所述的票据信息识别方法,其特征在于,所述对识别的文字进行语义检测之后,所述方法还包括:
根据语义检测结果,确定文字完整区域,基于所述文字完整区域中识别的文字,输出医疗票据的识别信息。
6.如权利要求4所述的票据信息识别方法,其特征在于,所述基于预设的区域分割模型,对待识别的医疗票据图像进行区域分割之前,所述方法还包括:
获取初始票据图像,对所述初始票据图像进行表格矫正;
对表格矫正后的票据图像进行光谱调整和颜色调整;
对光谱调整和颜色调整后的票据图像进行尺寸调整和像素栅格化处理,得到待识别的票据图像。
7.如权利要求1-6中任一项所述的票据信息识别方法,其特征在于,所述文字缺失区域包括文字与表格重叠区域、文字与图章重叠区域、文字与文字重叠区域和文字模糊区域中的至少一种。
8.一种票据信息识别装置,其特征在于,包括:
文字缺失区域确定模块,用于对待识别的医疗票据图像进行文字识别,确定文字缺失区域及所述文字缺失区域中的完整字和缺失字;
候选补正字确定模块,用于将所述完整字和所述缺失字组成待识别词组,基于预设医疗词语库对所述待识别词组进行词向量匹配,确定所述缺失字对应的候选补正字;
目标补正字确定模块,用于识别所述缺失字中存在的笔画,将所述笔画和所述候选补正字进行笔画匹配,确定所述缺失字对应的目标补正字;
信息输出模块,用于基于所述完整字和所述目标补正字,输出医疗票据的识别信息。
9.一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的票据信息识别方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的票据信息识别方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311013293.2A CN117197828A (zh) | 2023-08-11 | 2023-08-11 | 票据信息识别方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311013293.2A CN117197828A (zh) | 2023-08-11 | 2023-08-11 | 票据信息识别方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117197828A true CN117197828A (zh) | 2023-12-08 |
Family
ID=88995165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311013293.2A Pending CN117197828A (zh) | 2023-08-11 | 2023-08-11 | 票据信息识别方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117197828A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8094942B1 (en) * | 2011-06-13 | 2012-01-10 | Google Inc. | Character recognition for overlapping textual user input |
CN105261109A (zh) * | 2015-07-24 | 2016-01-20 | 广州广电运通金融电子股份有限公司 | 一种钞票冠字号识别方法 |
CN111401099A (zh) * | 2018-12-28 | 2020-07-10 | 中国电信股份有限公司 | 文本识别方法、装置以及存储介质 |
CN111985486A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 图像信息的识别方法及装置、存储介质、计算机设备 |
CN112651402A (zh) * | 2019-10-11 | 2021-04-13 | 中国电信股份有限公司 | 字符识别方法和装置 |
CN114170604A (zh) * | 2021-12-08 | 2022-03-11 | 江西八戒创新资源有限公司 | 基于物联网的文字识别方法及系统 |
CN114550189A (zh) * | 2021-12-23 | 2022-05-27 | 上海浦东发展银行股份有限公司 | 票据识别方法、装置、设备、计算机存储介质和程序产品 |
WO2023039942A1 (zh) * | 2021-09-17 | 2023-03-23 | 深圳前海环融联易信息科技服务有限公司 | 基于文本识别的要素信息提取方法、装置、设备及介质 |
-
2023
- 2023-08-11 CN CN202311013293.2A patent/CN117197828A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8094942B1 (en) * | 2011-06-13 | 2012-01-10 | Google Inc. | Character recognition for overlapping textual user input |
CN105261109A (zh) * | 2015-07-24 | 2016-01-20 | 广州广电运通金融电子股份有限公司 | 一种钞票冠字号识别方法 |
CN111401099A (zh) * | 2018-12-28 | 2020-07-10 | 中国电信股份有限公司 | 文本识别方法、装置以及存储介质 |
CN112651402A (zh) * | 2019-10-11 | 2021-04-13 | 中国电信股份有限公司 | 字符识别方法和装置 |
CN111985486A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 图像信息的识别方法及装置、存储介质、计算机设备 |
WO2023039942A1 (zh) * | 2021-09-17 | 2023-03-23 | 深圳前海环融联易信息科技服务有限公司 | 基于文本识别的要素信息提取方法、装置、设备及介质 |
CN114170604A (zh) * | 2021-12-08 | 2022-03-11 | 江西八戒创新资源有限公司 | 基于物联网的文字识别方法及系统 |
CN114550189A (zh) * | 2021-12-23 | 2022-05-27 | 上海浦东发展银行股份有限公司 | 票据识别方法、装置、设备、计算机存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829453B (zh) | 一种卡证中文字的识别方法、装置以及计算设备 | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
CN111340037B (zh) | 文本版面分析方法、装置、计算机设备和存储介质 | |
Singh et al. | Offline script identification from multilingual indic-script documents: a state-of-the-art | |
CN110738203A (zh) | 字段结构化输出方法、装置及计算机可读存储介质 | |
US11023764B2 (en) | Method and system for optical character recognition of series of images | |
CN108830275B (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN111401099A (zh) | 文本识别方法、装置以及存储介质 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN111858977B (zh) | 票据信息采集方法、装置、计算机设备和存储介质 | |
CN111291741B (zh) | 单据识别方法、装置、计算机设备和存储介质 | |
CN112464845A (zh) | 票据识别方法、设备及计算机存储介质 | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN114005127A (zh) | 一种基于深度学习的图像光学文字识别方法,存储装置及服务器 | |
CN111881880A (zh) | 一种基于新型网络的票据文本识别方法 | |
US20240144711A1 (en) | Reliable determination of field values in documents with removal of static field elements | |
CN117197828A (zh) | 票据信息识别方法、装置、介质及设备 | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
US20210303839A1 (en) | Method and apparatus to estimate image translation and scale for alignment of forms | |
CN113936187A (zh) | 文本图像合成方法、装置、存储介质及电子设备 | |
JPH07168910A (ja) | 文書レイアウト解析装置及び文書フォ−マット識別装置 | |
CN112257718A (zh) | 一种关于放射科胶片的文本识别方法及装置 | |
CN111401365A (zh) | Ocr图像自动生成方法及装置 | |
TWI773444B (zh) | 影像識別系統與方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |