CN114743209A - 处方的识别校验方法、系统、电子设备和存储介质 - Google Patents

处方的识别校验方法、系统、电子设备和存储介质 Download PDF

Info

Publication number
CN114743209A
CN114743209A CN202210444267.4A CN202210444267A CN114743209A CN 114743209 A CN114743209 A CN 114743209A CN 202210444267 A CN202210444267 A CN 202210444267A CN 114743209 A CN114743209 A CN 114743209A
Authority
CN
China
Prior art keywords
prescription
feature code
image
data
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210444267.4A
Other languages
English (en)
Inventor
周昊
翁澍舜
孙欣然
倪述荣
王佳斐
郭爱群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Juyin Information Technology Co ltd
Original Assignee
Shanghai Juyin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Juyin Information Technology Co ltd filed Critical Shanghai Juyin Information Technology Co ltd
Priority to CN202210444267.4A priority Critical patent/CN114743209A/zh
Publication of CN114743209A publication Critical patent/CN114743209A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Abstract

本发明提供一种处方的识别校验方法、系统、电子设备和存储介质,识别校验方法包括:获取处方图像;对处方图像进行特征提取得到特征码数据;将特征码数据与预设的若干处方数据模型进行对比,得到特征码数据与每一处方数据模型之间的特征码误差值;若存在特征码误差值小于误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将特征码误差值小于误差阈值所对应的处方数据模型作为命中模型;基于目标处方图像和命中模型得到处方信息。本发明通过处方图像的特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。

Description

处方的识别校验方法、系统、电子设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种处方的识别校验方法、系统、电子设备和存储介质。
背景技术
目前,随着图像识别技术日益成熟,图像文本提取(OCR)算法已广泛应用于各种生活及工作场所中。现有的图片识别技术只能对特定的标准图片进行要素提取,比如身份证、护照、发票等,对于非标准图片大部分采用的是文本识别的方法,由于各个医院诊所处方格式和文本都不一致,在处理处方图像时无法有效定制要素进行提取,无法准确地识别校验处方信息,导致对于处方的识别校验的效率低下,用户体验感差。
发明内容
本发明要解决的技术问题是为了克服现有技术中对于处方的识别校验的效率低下,用户体验感差的缺陷,提供一种处方的识别校验方法、系统、电子设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种处方的识别校验方法,包括:
获取处方图像;
对所述处方图像进行特征提取得到特征码数据;
将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值;
若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型;
基于所述目标处方图像和所述命中模型得到处方信息。
较佳地,所述特征码数据包括位置特征码和文字特征码;
所述将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值,包括:
将所述位置特征码数据与所述处方数据模型进行对比,得到所述位置特征码数据与每一所述处方数据模型之间的位置特征码误差值,将所述位置特征码误差值小于第一误差阈值对应的处方数据模型作为位置命中模型;
将所述文字特征码数据与所述位置命中模型进行对比,得到所述文字特征码数据与每一所述位置命中模型之间的文字特征码误差值;
所述若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型,包括:
若存在所述文字特征码误差值小于第二误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述文字特征码误差值小于第二误差阈值所对应的位置命中模型作为所述命中模型。
较佳地,所述特征码数据还包括颜色特征码;
所述若存在所述文字特征码误差值小于第二误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述文字特征码误差值小于第二误差阈值所对应的位置命中模型作为所述命中模型,包括:
若存在所述文字特征码误差值小于所述第二误差阈值,则将所述文字特征码误差值小于所述第二误差阈值所对应的位置命中模型作为文字命中模型;
将所述颜色特征码数据与所述文字命中模型进行对比,得到所述颜色特征码数据与每一所述文字命中模型之间的颜色特征码误差值;
若所述颜色特征码误差值小于第三误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述颜色特征码误差值小于第三误差阈值所对应的文字命中模型作为所述命中模型。
较佳地,所述若存在所述文字特征码误差值小于所述第二误差阈值,则将所述文字特征码误差值小于所述第二误差阈值所对应的位置命中模型作为文字命中模型,包括:
按照所述文字特征码误差值从小到大的顺序对所述位置命中模型进行排序;
将所述文字特征码误差值小于所述第二误差阈值并且与排序首位的位置命中模型的文字特征码误差值的差值小于差值阈值所对应的位置命中模型作为文字命中模型。
较佳地,所述基于所述目标处方图像和所述命中模型得到处方信息,包括:
通过图像文本提取对所述目标处方图像提取处方信息;其中,所述处方信息包括开方医疗机构;
判断所述开方医疗机构与所述命中模型中的医疗机构信息是否相匹配,若相匹配,则所述处方信息正确,并输出所述处方信息。
较佳地,在所述对所述处方图像进行特征提取得到特征码数据之前,所述识别校验方法还包括:
对所述处方图像进行预处理操作。
较佳地,所述预处理操作包括:噪声去除、倾斜较正、版面分析、字符切割中的一种或多种。
本发明还提供一种处方的识别校验系统,包括:图像获取模块、特征提取模块、对比模块、判断模块和处方信息模块;
所述图像获取模块用于获取处方图像;
所述特征提取模块用于对所述处方图像进行特征提取得到特征码数据;
所述对比模块用于将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值;
所述判断模块用于若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型;
所述处方信息模块用于基于所述目标处方图像和所述命中模型得到处方信息。
较佳地,所述特征码数据包括位置特征码和文字特征码;
所述对比模块包括:位置对比单元和文字对比单元;
所述位置对比单元用于将所述位置特征码数据与所述处方数据模型进行对比,得到所述位置特征码数据与每一所述处方数据模型之间的位置特征码误差值,将所述位置特征码误差值小于第一误差阈值对应的处方数据模型作为位置命中模型;
所述文字对比单元用于将所述文字特征码数据与所述位置命中模型进行对比,得到所述文字特征码数据与每一所述位置命中模型之间的文字特征码误差值;
所述判断模块具体用于若存在所述文字特征码误差值小于第二误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述文字特征码误差值小于第二误差阈值所对应的位置命中模型作为所述命中模型。
较佳地,所述特征码数据还包括颜色特征码;
所述判断模块包括:第一判断单元、第二判断单元和第三判断单元;
所述第一判断单元用于若存在所述文字特征码误差值小于所述第二误差阈值,则将所述文字特征码误差值小于所述第二误差阈值所对应的位置命中模型作为文字命中模型;
所述第二判断单元用于将所述颜色特征码数据与所述文字命中模型进行对比,得到所述颜色特征码数据与每一所述文字命中模型之间的颜色特征码误差值;
所述第三判断单元用于若所述颜色特征码误差值小于第三误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述颜色特征码误差值小于第三误差阈值所对应的文字命中模型作为所述命中模型。
较佳地,所述第一判断单元包括:排序子单元和差值子单元;
所述排序子单元用于按照所述文字特征码误差值从小到大的顺序对所述位置命中模型进行排序;
所述差值子单元用于将所述文字特征码误差值小于所述第二误差阈值并且与排序首位的位置命中模型的文字特征码误差值的差值小于差值阈值所对应的位置命中模型作为文字命中模型。
较佳地,所述处方信息模块包括:文本提取单元和匹配输出单元;
所述文本提取单元用于通过图像文本提取对所述目标处方图像提取处方信息;其中,所述处方信息包括开方医疗机构;
所述匹配输出单元用于判断所述开方医疗机构与所述命中模型中的医疗机构信息是否相匹配,若相匹配,则所述处方信息正确,并输出所述处方信息。
较佳地,所述识别校验系统还包括:预处理模块;
所述预处理模块用于对所述处方图像进行预处理操作。
较佳地,所述预处理操作包括:噪声去除、倾斜较正、版面分析、字符切割中的一种或多种。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现前述的处方的识别校验方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的处方的识别校验方法。
本发明的积极进步效果在于:基于处方图像的特征码数据进行对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
附图说明
图1为本发明的实施例1的处方的识别校验方法的流程图。
图2为本发明的实施例1的处方的识别校验方法的一具体实施方式的流程图。
图3为本发明的实施例1的处方的识别校验方法中的步骤S141的一具体实施方式的流程图。
图4为本发明的实施例1的处方的识别校验方法中的步骤S1411的一具体实施方式的流程图。
图5为本发明的实施例1的处方的识别校验方法中的步骤S15的一具体实施方式的流程图。
图6为本发明的实施例1的处方的识别校验方法的另一具体实施方式的流程图。
图7为本发明的实施例2的处方的识别校验系统的模块示意图。
图8为本发明的实施例3的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种处方的识别校验方法,参照图1,识别校验方法包括:
S11、获取处方图像。
S12、对处方图像进行特征提取得到特征码数据。
S13、将特征码数据与预设的若干处方数据模型进行对比,得到特征码数据与每一处方数据模型之间的特征码误差值。
S14、若存在特征码误差值小于误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将特征码误差值小于误差阈值所对应的处方数据模型作为命中模型。
S15、基于目标处方图像和命中模型得到处方信息。
其中,对历史上存在的处方图像进行采集归纳,统一收录历史处方图像,对历史处方图像可以进行数据识别、版面分析、字符提取、识别校正和特征提取等处理得到处方数据模型,通过处方数据模型构建处方基础库,处方基础库包括若干处方数据模型。
对处方图像进行特征提取得到的特征码数据具有多个位码,例如特征码数据可以有128位码。
可以根据实际需要设置误差阈值,例如误差阈值设为10%。
对于判断为伪处方的处方图像,可以转为人工审核。对于人工审核为真处方的处方图像,可以进行数据识别、版面分析、字符提取、识别校正和特征提取等处理得到新的处方数据模型,增加到处方基础库中。
本实施例中,基于处方图像的特征码数据进行对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,特征码数据包括位置特征码和文字特征码。
参照图2,步骤S13包括:
S131、将位置特征码数据与处方数据模型进行对比,得到位置特征码数据与每一处方数据模型之间的位置特征码误差值,将位置特征码误差值小于第一误差阈值对应的处方数据模型作为位置命中模型。
S132、将文字特征码数据与位置命中模型进行对比,得到文字特征码数据与每一位置命中模型之间的文字特征码误差值。
步骤S14包括:
S141、若存在文字特征码误差值小于第二误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将文字特征码误差值小于第二误差阈值所对应的位置命中模型作为命中模型。
其中,各个开方医疗机构的处方格式可能不同。开方医疗机构的名称和logo(标志)一般位于处方的头部,患者信息(例如姓名、年龄和电话)和开方时间一般位于处方的头部,药品信息(例如药品名称、药品规格、品牌、数量、服用方法和禁忌)一般位于处方的中部,开方医师的署名(签名或印章或两者都有)一般位于处方的中部或底部。
处方自带开方医疗机构的名称和logo(若有),开方医师需要填写患者信息、药品信息和开方时间并署名。真实有效的处方必须具有开方医疗机构、患者信息、药品信息、开方时间和开方医师的署名。
开方医疗机构与开方医师具有关联关系,在识别校验过程中,通过开方医师的署名确定开方医师,进而通过开方医师也可以确定开方医疗机构。
位置特征码和文字特征码囊括了开方医疗机构、患者信息、药品信息、开方时间和开方医师的署名这些关键项目的在位置和文本信息上的特征要素。
误差阈值具体包括第一误差阈值和第二误差阈值。可以根据实际需要设置第一误差阈值和第二误差阈值,例如第一误差阈值和第二误差阈值均设为10%。
本实施例中,通过位置特征码和文字特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置和文字)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,特征码数据还包括颜色特征码。
参照图3,步骤S141包括:
S1411、若存在文字特征码误差值小于第二误差阈值,则将文字特征码误差值小于第二误差阈值所对应的位置命中模型作为文字命中模型。
S1412、将颜色特征码数据与文字命中模型进行对比,得到颜色特征码数据与每一文字命中模型之间的颜色特征码误差值。
S1413、若颜色特征码误差值小于第三误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将颜色特征码误差值小于第三误差阈值所对应的文字命中模型作为命中模型。
其中,有些开方医疗机构会采用特定底色的处方,例如肿瘤医院采用绿色底色的处方笺。对于这些非黑白色的处方,可以增加颜色特征码数据的对比,以做进一步的真伪判断。
例如,用非黑白色的处方的复印件去买药,复印会导致颜色特征码误差值过大,从而判断不是真处方,符合处方的复印件无效的判断依据。
误差阈值具体包括第一误差阈值、第二误差阈值和第三误差阈值。可以根据实际需要设置第一误差阈值、第二误差阈值和第三误差阈值,例如第一误差阈值、第二误差阈值和第三误差阈值均设为10%。
本实施例中,通过位置特征码、文字特征码和颜色特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,参照图4,步骤S1411包括:
S14111、按照文字特征码误差值从小到大的顺序对位置命中模型进行排序。
S14112、将文字特征码误差值小于第二误差阈值并且与排序首位的位置命中模型的文字特征码误差值的差值小于差值阈值所对应的位置命中模型作为文字命中模型。
其中,文字命中模型包括排序首位的位置命中模型。
可以根据实际需要设置差值阈值,例如差值阈值设为1%。
例如,第二误差阈值为10%,差值阈值设为1%,排序后的位置命中模型依次为模型1、模型2、模型3……模型n,n为正整数,对应的文字特征码误差值依次为6.15%、6.23%、7.22%……。由于(6.23%-6.15%)<1%,(7.22%-6.15%)>1%且6.15%和6.23%均小于10%,那么,将模型1和模型2作为文字命中模型。
本实施例中,采用差值阈值排除与排序首位的位置命中模型的文字特征码误差值偏差比较大的位置命中模型,以缩小对比范围,提高对比效率,进而提高了处方的识别校验的效率,提升了用户体验感。
在一个实施例中,对于黑白色的处方,可以不采用颜色特征码数据进行对比,而是采用位置特征码和文字特征码与处方数据模型的对比,再按照文字特征码误差值从小到大的顺序对位置命中模型进行排序,根据差值阈值将排序靠前的位置命中模型作为命中模型(文字命中模型即为命中模型)。
在一个实施例中,如果排序第二位的位置命中模型的文字特征码误差值与排序首位的位置命中模型的文字特征码误差值的差值大于或等于差值阈值,则将排序首位的位置命中模型作为文字命中模型。
本实施例中,通过位置特征码、文字特征码和颜色特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,参照图5,步骤S15包括:
S151、通过图像文本提取对目标处方图像提取处方信息。其中,处方信息包括开方医疗机构。
S152、判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,若相匹配,则处方信息正确,并输出处方信息。
其中,判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,是为了校验提取出的处方信息是否正确,若开方医疗机构不正确,那么提取出的其他处方信息也可能错误。
可以理解的是,命中模型对应的处方格式也可以帮助更好更准确地提取处方信息。
在一个实施例中,由于通过图像文本提取对目标处方图像提取处方信息的正确率较高(例如正确率在99%以上),可以不判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,而直接输出处方信息。
具体实施时,参照图6,在步骤S12之前,识别校验方法还包括:
S110、对处方图像进行预处理操作。
本实施例中,通过预处理操作去除干扰因素,提高了处方图像的质量,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,预处理操作包括:噪声去除、倾斜较正、版面分析、字符切割中的一种或多种。
本实施例中,通过预处理操作去除干扰因素,提高了处方图像的质量,基于处方图像的特征码数据进行对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
实施例2
本实施例提供一种处方的识别校验系统,参照图7,识别校验系统包括:图像获取模块21、特征提取模块22、对比模块23、判断模块24和处方信息模块25。
图像获取模块21用于获取处方图像。
特征提取模块22用于对处方图像进行特征提取得到特征码数据。
对比模块23用于将特征码数据与预设的若干处方数据模型进行对比,得到特征码数据与每一处方数据模型之间的特征码误差值。
判断模块24用于若存在特征码误差值小于误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将特征码误差值小于误差阈值所对应的处方数据模型作为命中模型。
处方信息模块25用于基于目标处方图像和命中模型得到处方信息。
其中,对历史上存在的处方图像进行采集归纳,统一收录历史处方图像,对历史处方图像可以进行数据识别、版面分析、字符提取、识别校正和特征提取等处理得到处方数据模型,通过处方数据模型构建处方基础库,处方基础库包括若干处方数据模型。
对处方图像进行特征提取得到的特征码数据具有多个位码,例如特征码数据可以有128位码。
可以根据实际需要设置误差阈值,例如误差阈值设为10%。
对于判断为伪处方的处方图像,可以转为人工审核。对于人工审核为真处方的处方图像,可以进行数据识别、版面分析、字符提取、识别校正和特征提取等处理得到新的处方数据模型,增加到处方基础库中。
本实施例中,基于处方图像的特征码数据进行对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,特征码数据包括位置特征码和文字特征码。
对比模块23包括:位置对比单元231和文字对比单元232。
位置对比单元231用于将位置特征码数据与处方数据模型进行对比,得到位置特征码数据与每一处方数据模型之间的位置特征码误差值,将位置特征码误差值小于第一误差阈值对应的处方数据模型作为位置命中模型。
文字对比单元232用于将文字特征码数据与位置命中模型进行对比,得到文字特征码数据与每一位置命中模型之间的文字特征码误差值。
判断模块24具体用于若存在文字特征码误差值小于第二误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将文字特征码误差值小于第二误差阈值所对应的位置命中模型作为命中模型。
其中,各个开方医疗机构的处方格式可能不同。开方医疗机构的名称和logo(标志)一般位于处方的头部,患者信息(例如姓名、年龄和电话)和开方时间一般位于处方的头部,药品信息(例如药品名称、药品规格、品牌、数量、服用方法和禁忌)一般位于处方的中部,开方医师的署名(签名或印章或两者都有)一般位于处方的中部或底部。
处方自带开方医疗机构的名称和logo(若有),开方医师需要填写患者信息、药品信息和开方时间并署名。真实有效的处方必须具有开方医疗机构、患者信息、药品信息、开方时间和开方医师的署名。
开方医疗机构与开方医师具有关联关系,在识别校验过程中,通过开方医师的署名确定开方医师,进而通过开方医师也可以确定开方医疗机构。
位置特征码和文字特征码囊括了开方医疗机构、患者信息、药品信息、开方时间和开方医师的署名这些关键项目的在位置和文本信息上的特征要素。
误差阈值具体包括第一误差阈值和第二误差阈值。可以根据实际需要设置第一误差阈值和第二误差阈值,例如第一误差阈值和第二误差阈值均设为10%。
本实施例中,通过位置特征码和文字特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置和文字)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,特征码数据还包括颜色特征码。
判断模块24包括:第一判断单元241、第二判断单元242和第三判断单元243。
第一判断单元241用于若存在文字特征码误差值小于第二误差阈值,则将文字特征码误差值小于第二误差阈值所对应的位置命中模型作为文字命中模型。
第二判断单元242用于将颜色特征码数据与文字命中模型进行对比,得到颜色特征码数据与每一文字命中模型之间的颜色特征码误差值。
第三判断单元243用于若颜色特征码误差值小于第三误差阈值,则判断处方图像为真处方,将处方图像作为目标处方图像,将颜色特征码误差值小于第三误差阈值所对应的文字命中模型作为命中模型。
其中,有些开方医疗机构会采用特定底色的处方,例如肿瘤医院采用绿色底色的处方笺。对于这些非黑白色的处方,可以增加颜色特征码数据的对比,以做进一步的真伪判断。
例如,用非黑白色的处方的复印件去买药,复印会导致颜色特征码误差值过大,从而判断不是真处方,符合处方的复印件无效的判断依据。
误差阈值具体包括第一误差阈值、第二误差阈值和第三误差阈值。可以根据实际需要设置第一误差阈值、第二误差阈值和第三误差阈值,例如第一误差阈值、第二误差阈值和第三误差阈值均设为10%。
本实施例中,通过位置特征码、文字特征码和颜色特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,第一判断单元241包括:排序子单元2411和差值子单元2412。
排序子单元2411用于按照文字特征码误差值从小到大的顺序对位置命中模型进行排序。
差值子单元2412用于将文字特征码误差值小于第二误差阈值并且与排序首位的位置命中模型的文字特征码误差值的差值小于差值阈值所对应的位置命中模型作为文字命中模型。
其中,文字命中模型包括排序首位的位置命中模型。
可以根据实际需要设置差值阈值,例如差值阈值设为1%。
例如,第二误差阈值为10%,差值阈值设为1%,排序后的位置命中模型依次为模型1、模型2、模型3……模型n,n为正整数,对应的文字特征码误差值依次为6.15%、6.23%、7.22%……。由于(6.23%-6.15%)<1%,(7.22%-6.15%)>1%且6.15%和6.23%均小于10%,那么,将模型1和模型2作为文字命中模型。
本实施例中,采用差值阈值排除与排序首位的位置命中模型的文字特征码误差值偏差比较大的位置命中模型,以缩小对比范围,提高对比效率,进而提高了处方的识别校验的效率,提升了用户体验感。
在一个实施例中,对于黑白色的处方,可以不采用颜色特征码数据进行对比,而是采用位置特征码和文字特征码与处方数据模型的对比,再按照文字特征码误差值从小到大的顺序对位置命中模型进行排序,根据差值阈值将排序靠前的位置命中模型作为命中模型(文字命中模型即为命中模型)。
在一个实施例中,如果排序第二位的位置命中模型的文字特征码误差值与排序首位的位置命中模型的文字特征码误差值的差值大于或等于差值阈值,则将排序首位的位置命中模型作为文字命中模型。
本实施例中,通过位置特征码、文字特征码和颜色特征码与处方数据模型的对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,进一步实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,处方信息模块25包括:文本提取单元251和匹配输出单元252。
文本提取单元251用于通过图像文本提取对目标处方图像提取处方信息。其中,处方信息包括开方医疗机构。
匹配输出单元252用于判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,若相匹配,则处方信息正确,并输出处方信息。
其中,判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,是为了校验提取出的处方信息是否正确,若开方医疗机构不正确,那么提取出的其他处方信息也可能错误。
可以理解的是,命中模型对应的处方格式也可以帮助更好更准确地提取处方信息。
在一个实施例中,由于通过图像文本提取对目标处方图像提取处方信息的正确率较高(例如正确率在99%以上),可以不判断开方医疗机构与命中模型中的医疗机构信息是否相匹配,而直接输出处方信息。
具体实施时,识别校验系统还包括:预处理模块26。
预处理模块26用于对处方图像进行预处理操作。
本实施例中,通过预处理操作去除干扰因素,提高了处方图像的质量,提高了处方的识别校验的效率,提升了用户体验感。
具体实施时,预处理操作包括:噪声去除、倾斜较正、版面分析、字符切割中的一种或多种。
本实施例中,通过预处理操作去除干扰因素,提高了处方图像的质量,基于处方图像的特征码数据进行对比,不因处方图像中的个人信息和医师字体而影响对处方的判断,通过特定规则(位置、文字和颜色)作为关键的特征码数据提取标准,有效构建处方的标准特征码清单,通过特征码数据的对比结果来校验处方的真伪,对于真处方识别得到处方信息,实现了对于处方这种非标准图片进行准确地识别校验,提高了处方的识别校验的效率,提升了用户体验感。
实施例3
图8为本发明实施例3提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1中的处方的识别校验方法。图8显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1中的处方的识别校验方法。
电子设备30也可以与一个或多个外部设备34(例如按键、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的电子设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的电子设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的电子设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干模块/模块或子模块/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块/模块的特征和功能可以在一个模块/模块中具体化;反之,上文描述的一个模块/模块的特征和功能可以进一步划分为由多个模块/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1中的处方的识别校验方法。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1中的处方的识别校验方法。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种处方的识别校验方法,其特征在于,包括:
获取处方图像;
对所述处方图像进行特征提取得到特征码数据;
将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值;
若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型;
基于所述目标处方图像和所述命中模型得到处方信息。
2.如权利要求1所述的处方的识别校验方法,其特征在于,所述特征码数据包括位置特征码和文字特征码;
所述将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值,包括:
将所述位置特征码数据与所述处方数据模型进行对比,得到所述位置特征码数据与每一所述处方数据模型之间的位置特征码误差值,将所述位置特征码误差值小于第一误差阈值对应的处方数据模型作为位置命中模型;
将所述文字特征码数据与所述位置命中模型进行对比,得到所述文字特征码数据与每一所述位置命中模型之间的文字特征码误差值;
所述若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型,包括:
若存在所述文字特征码误差值小于第二误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述文字特征码误差值小于第二误差阈值所对应的位置命中模型作为所述命中模型。
3.如权利要求2所述的处方的识别校验方法,其特征在于,所述特征码数据还包括颜色特征码;
所述若存在所述文字特征码误差值小于第二误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述文字特征码误差值小于第二误差阈值所对应的位置命中模型作为所述命中模型,包括:
若存在所述文字特征码误差值小于所述第二误差阈值,则将所述文字特征码误差值小于所述第二误差阈值所对应的位置命中模型作为文字命中模型;
将所述颜色特征码数据与所述文字命中模型进行对比,得到所述颜色特征码数据与每一所述文字命中模型之间的颜色特征码误差值;
若所述颜色特征码误差值小于第三误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述颜色特征码误差值小于第三误差阈值所对应的文字命中模型作为所述命中模型。
4.如权利要求3所述的处方的识别校验方法,其特征在于,所述若存在所述文字特征码误差值小于所述第二误差阈值,则将所述文字特征码误差值小于所述第二误差阈值所对应的位置命中模型作为文字命中模型,包括:
按照所述文字特征码误差值从小到大的顺序对所述位置命中模型进行排序;
将所述文字特征码误差值小于所述第二误差阈值并且与排序首位的位置命中模型的文字特征码误差值的差值小于差值阈值所对应的位置命中模型作为文字命中模型。
5.如权利要求1所述的处方的识别校验方法,其特征在于,所述基于所述目标处方图像和所述命中模型得到处方信息,包括:
通过图像文本提取对所述目标处方图像提取处方信息;其中,所述处方信息包括开方医疗机构;
判断所述开方医疗机构与所述命中模型中的医疗机构信息是否相匹配,若相匹配,则所述处方信息正确,并输出所述处方信息。
6.如权利要求1所述的处方的识别校验方法,其特征在于,在所述对所述处方图像进行特征提取得到特征码数据之前,所述识别校验方法还包括:
对所述处方图像进行预处理操作。
7.如权利要求6所述的处方的识别校验方法,其特征在于,所述预处理操作包括:噪声去除、倾斜较正、版面分析、字符切割中的一种或多种。
8.一种处方的识别校验系统,其特征在于,包括:图像获取模块、特征提取模块、对比模块、判断模块和处方信息模块;
所述图像获取模块用于获取处方图像;
所述特征提取模块用于对所述处方图像进行特征提取得到特征码数据;
所述对比模块用于将所述特征码数据与预设的若干处方数据模型进行对比,得到所述特征码数据与每一所述处方数据模型之间的特征码误差值;
所述判断模块用于若存在所述特征码误差值小于误差阈值,则判断所述处方图像为真处方,将所述处方图像作为目标处方图像,将所述特征码误差值小于误差阈值所对应的处方数据模型作为命中模型;
所述处方信息模块用于基于所述目标处方图像和所述命中模型得到处方信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现权利要求1至7中任一项所述的处方的识别校验方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的处方的识别校验方法。
CN202210444267.4A 2022-04-25 2022-04-25 处方的识别校验方法、系统、电子设备和存储介质 Pending CN114743209A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210444267.4A CN114743209A (zh) 2022-04-25 2022-04-25 处方的识别校验方法、系统、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210444267.4A CN114743209A (zh) 2022-04-25 2022-04-25 处方的识别校验方法、系统、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114743209A true CN114743209A (zh) 2022-07-12

Family

ID=82284333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210444267.4A Pending CN114743209A (zh) 2022-04-25 2022-04-25 处方的识别校验方法、系统、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114743209A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116311327A (zh) * 2023-05-11 2023-06-23 四川骏逸富顿科技有限公司 处方图像检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116311327A (zh) * 2023-05-11 2023-06-23 四川骏逸富顿科技有限公司 处方图像检测方法
CN116311327B (zh) * 2023-05-11 2023-08-08 四川骏逸富顿科技有限公司 处方图像检测方法

Similar Documents

Publication Publication Date Title
JP6711523B2 (ja) 帳票認識システム
CN112257613B (zh) 体检报告信息结构化提取方法、装置及计算机设备
CN113707300A (zh) 基于人工智能的搜索意图识别方法、装置、设备及介质
US11557140B2 (en) Model-independent confidence values for extracted document information using a convolutional neural network
CN113130038A (zh) 药品数据匹配方法、装置、设备及存储介质
US20190384971A1 (en) System and method for optical character recognition
CN111797217B (zh) 基于faq匹配模型的信息查询方法、及其相关设备
CN113568965A (zh) 一种结构化信息的提取方法、装置、电子设备及存储介质
JP6845911B1 (ja) 文字処理システム及びプログラム
CN114743209A (zh) 处方的识别校验方法、系统、电子设备和存储介质
CN111383732A (zh) 一种基于互斥识别的药品审核方法、装置、计算机系统及可读存储介质
WO2021151270A1 (zh) 图像结构化数据提取方法、装置、设备及存储介质
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
JP2004252881A (ja) テキストデータ修正方法
CN112364857A (zh) 基于数值抽取的图像识别方法、装置及存储介质
KR20220001342A (ko) 영수증 인식 장치, 영수증의 스캔 이미지에서 진료 항목을 자동적으로 인식하는 방법 및 컴퓨터 프로그램
CN109324963B (zh) 自动测试收益结果的方法及终端设备
CN113168527A (zh) 用于从实体文档提取信息的系统和方法
CN115688166A (zh) 信息脱敏处理方法、装置、计算机设备及可读存储介质
US11335108B2 (en) System and method to recognise characters from an image
US8380690B2 (en) Automating form transcription
CN113408536A (zh) 票据的金额识别方法、装置、计算机设备及存储介质
CN110852713A (zh) 一种统一信用代码证识别系统和算法
TWM585395U (zh) 運用深度學習之長短期記憶模型輔助保險理賠系統
TWI712979B (zh) 運用深度學習之長短期記憶模型輔助保險理賠系統及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination