CN112819003B - 一种提升体检报告ocr识别准确率的方法及装置 - Google Patents

一种提升体检报告ocr识别准确率的方法及装置 Download PDF

Info

Publication number
CN112819003B
CN112819003B CN202110418565.1A CN202110418565A CN112819003B CN 112819003 B CN112819003 B CN 112819003B CN 202110418565 A CN202110418565 A CN 202110418565A CN 112819003 B CN112819003 B CN 112819003B
Authority
CN
China
Prior art keywords
physical examination
ocr
recognition
report
examination report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110418565.1A
Other languages
English (en)
Other versions
CN112819003A (zh
Inventor
常德杰
孔飞
刘邦长
刘朝振
王海
赵洪文
谷书锋
赵进
罗晓斌
庄博然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou miaoyijia Health Technology Group Co.,Ltd.
Original Assignee
Beijing Miaoyijia Health Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Miaoyijia Health Technology Group Co ltd filed Critical Beijing Miaoyijia Health Technology Group Co ltd
Priority to CN202110418565.1A priority Critical patent/CN112819003B/zh
Publication of CN112819003A publication Critical patent/CN112819003A/zh
Application granted granted Critical
Publication of CN112819003B publication Critical patent/CN112819003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种提升体检报告OCR识别准确率的方法及装置,包括以下步骤,上传报告,模板识别,OCR区域识别,语义分析识别,校验和标准化,结果输出,输出校验和标准化后体检报告最终结果。该装置包括上传报告模块,模板识别模块,OCR区域识别模块,语义分析识别模块,校验和标准化模块,结果输出模块。该方法基于周围特征的可信度评估函数,来提高体检报告,发票识别的准确率。

Description

一种提升体检报告OCR识别准确率的方法及装置
技术领域
本发明属于人工智能识别技术领域,具体涉及一种提升体检报告OCR识别准确率的方法及装置。
背景技术
目前体检报告识别,发票识别已经成为一项非常重要的技术和手段,该技术可以大大提升核赔核保,体检报告信息解析的效率和自动化,但是目前由于各家体检报告和体检格式具有很大的差别,所有导致最终识别的准确率很低。
现有的OCR提取技术方案,如图1所示,主要是获取体检报告特征和区域,对比格式来源后获取体检报告模板,分析定位提取文字后识别,校验和标准化目标体检报告,结果输出经过以上步骤。存在有如下缺点,目前体检报告多种多样,简单的模型和算法不能取得很好的准确率,目前通用的方法取得准确率一般在 50%左右;目前体检报告识别一般没有经过深度学习神经网络的模板判别和分类,一般都是通过简单相似度的方式对比获取模板的类别;目前的算法无法很好的解决,体检报告细项匹配错位的问题,例如,把血常规的白细胞计数,识别成尿常规的白细胞计数,而这样的错误大量的存在于体检报告中;目前算法也无法很好解决,体检报告项目和值对应出错的问题,例如白细胞技术值100,实际上项目和值匹配出错的问题。
发明内容
为解决现有技术中存在的上述技术问题,提供了一种提升体检报告OCR识别准确率的方法及装置,应用于体检报告场景,基于周围特征的可信度评估函数,来提高体检报告,发票识别的准确率。
为实现上述发明目的,本发明的技术方案是:
根据本发明的第一方面,提供了一种提升体检报告OCR识别准确率的方法,该方法包括,上传报告,用户上传体检报告;
模板识别,体检报告上传后通过深度学习分类模型,进行模板判别;
OCR区域识别,根据模板判别结果,OCR识别重点识别的区域和每个区域存储的内容分布;
语义分析识别,OCR开始提取所述重点识别的区域和每个区域存储的内容文字,根据语义分析识别出体检报告字段和值;
校验和标准化,将识别出的体检报告对比标准体检报告,进行校验和标准化;
结果输出,输出校验和标准化后体检报告最终结果。
根据本发明的第二方面,还提供了一种电子设备,该设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述提升体检报告OCR识别准确率的方法。
根据本发明的第三方面,还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本公开文本的第一方面的方法。
在一些实施例中,深度学习分类模型是使用卷积神经网络(CNN),进行图片判别分类。
在一些实施例中,模板判别是使用深度学习分类模型,识别当前OCR的体检报告页面的类别。
在一些实施例中,区域是指体检报告的内容,区域包括重点区域和非重点区域,重点区域是结构化的区域,非重点区域是无结构化的区域。
在一些实施例中,标准体检报告为根据体检标准和用户体检要求,将体检报告字段汇总后,构建一个标准体检报告,标准体检报告包括有字段,字段包括有标准分类、项目名称、编码、结果允许值、结果属性和是否长期有效信息。
在一些实施例中,在校验和标准化时,对于有歧义的体检项目,体检报告用周围项目特征判别函数进行处理。
在一些实施例中,所述周围项目特征判别函数,对样本的概率统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值。样本是指标准体检报告集合,n取值范围是正整数,n越大最后的结果越精确。
在一些实施例中,提升体检报告OCR识别准确率的装置,包括上传报告模块,用户上传体检报告;
模板识别模块,所述上传报告模块上传后通过深度学习分类模型,进行模板判别;
OCR区域识别模块,根据所述模板识别模块的模板判别结果,OCR识别重点识别的区域和每个区域存储的内容分布;
语义分析识别模块,OCR开始提取所述OCR区域识别模块的所述重点识别的区域和每个区域存储的内容分布文字,根据语义分析识别出体检报告字段和值;
校验和标准化模块,将识别出所述语义分析识别模块的体检报告字段和值对比标准体检报告字段和值,进行校验和标准化;
结果输出模块,输出所述校验和标准化模块的体检报告最终结果。
周围项目特征判别函数模块,在校验和标准化时,对于有歧义的项目,体检报告用周围项目特征判别函数进行处理;
所述周围项目特征判别函数是基于贝叶斯理论构建的一个置信度函数,对样本的概率统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值;样本是指标准体检报告集合,n取值范围是正整数,n越大最后的结果越精确;特征是周围出现的体检项目。
与现有技术相比较,本发明具有如下的有益效果:
本发明通过深度学习进行判别模板的策略,以及周围特征函数判别策略和流程;还构建一个标准健康档案,格式如标准体检报告。进一步提升体检报告的识别的准确率,可扩展性量化,可以灵活的适配各种体检报告情况。
附图说明
图1为现有OCR提取体检报告识别的流程示意图。
图2为本发明提升体检报告OCR识别准确率的方法的流程示意图。
图3为本发明提升体检报告OCR识别准确率的方法的标准体检报告示意图。
图4为本发明提升体检报告OCR识别准确率的方法的周围项目特征判别函数示意图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
参照图2所示,一种提升体检报告OCR识别准确率的方法,包括:上传报告,用户上传体检报告;
模板识别,体检报告上传后通过深度学习分类模型,进行模板判别;
OCR区域识别,根据模板判别结果,OCR需要重点识别的区域和每个区域存储的内容分布;
语义分析识别,OCR开始提取所述重点识别的区域和每个区域存储的内容文字,根据语义分析识别出体检报告字段和值;
校验和标准化,识别出体检报告字段和值对比标准体检报告字段和值,进行校验和标准化;
结果输出,输出校验和标准化后体检报告最终结果。
在一些实施例中,深度学习分类模型是使用卷积神经网络(CNN),进行图片判别分类,图片类别包括有:体检报告基础信息页,超声报告页面,血常规页面,尿常规页面。
在一些实施例中,模板判别是使用深度学习分类模型,识别当前OCR的体检报告页面的类别,就是体检报告页面属于哪一个分类。如体检报告基础信息页面,超声报告页面,血常规页面,尿常规页面。
在一些实施例中,区域是指体检报告的内容,区域包括重点区域和非重点区域,重点区域是结构化的区域,非重点区域是无结构化的区域。有的需要进行结构化,有的不需要,需要结构化的区域是重点区域,例如:基础信息区域,超声区域,体检报告结论区域;其他不需要结构化的区域非重点区域,例如,超声报告图像区域不用进行识别,属于非重点区域。
在一些实施例中,如图3所示,标准体检报告为根据体检标准和用户体检要求(即公司情况),将体检报告字段汇总后,构建一个标准体检报告,标准体检报告为现有场景的体检报告,标准体检报告包括有字段,字段包括有标准分类、项目名称、编码、结果允许值、结果属性和是否长期有效信息。体检公司的标准是主流体检公司大体检机构的共有项目。该标准体检报告有如下的项目,例如姓名,年龄,基础信息等。
在一些实施例中,如图4所示,周围项目特征判别函数,在校验和标准化时,对于有歧义的体检项目,体检报告用周围项目特征判别函数进行处理。有歧义(即置信度不高)的体检项目是指概率低项目,例如尿常规 0.5,血常规 0.5;低于0.5表示不确定有歧义。体检项目的最细的分类,如红细胞计数。置信度就是概率值,是指最后结果可信的程度,越接近于1越可信。置信度最小是0,就是肯定不属于。
在一些实施例中,所述周围项目特征判别函数就是置信度函数,对样本的概率自动统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值。样本是指标准体检报告集合;n取值范围是正整数,n越大最后的结果越精确。现在扫描到性别,把附近的年龄等作为n个特征一起,组合也可以单独使用,特征是周围出现的体检项目,还有的特征是与首页边框的距离有多远,有利于可以定位确认项目的特征。
周围项目特征判别函数是基于贝叶斯理论构建的一个置信度函数。该函数的工作流程如下:
a)样本的概率统计,通过标准体检报告集合可以计算出,所有类别出现某个项目的概率值,样本是指标准体检报告集合;其格式如下:
例如:P(尿常规)|P(红细胞计数)=0.6 表示在尿常规类别中出现红细胞计数的概率0.6,
P(尿常规)=0.1 表示尿常规出现在体检报告的概率为0.6,
P(红细胞计数)|4.5~5.5=0.8 表示红细胞计数取值4.5~5.5的概率0.8,
P(红细胞计数)|0.8=0 表示0.8是红细胞计数的值的概率为0;
P(外科检查项目)|P(皮肤)=0.8 表示在外科检查项目出现皮肤类别的概率是0.8;
b)接收OCR初步的识别结果,同时拿到周围n个项目的识别结果和值。
样本通过如下的公式计算(对Bayes公式进行了简化),
P(红细胞计数)|尿常规 =P(i项目)*P(尿常规)|P(i项目)+........,
P(红细胞计数)|血常规 =P(i项目)*P(尿常规)|P(i项目)+........,
1|P(红细胞计数)=如果1 属于 4.5~5.5 范围=0.8。
其他1不属于4.5~5.5范围=0。
周围特征中选n个,i数值是1到n。
如果 P(红细胞计数)|尿常规>P(红细胞计数)|血常规,则判断当前检测的红细胞计数属于尿常规。
最后 1|P(红细胞计数)=0 则判断1不能是红细胞的值,而用其他概率更高的值。
在一些实施例中,提升体检报告OCR识别准确率的装置,包括上传报告模块,用户上传体检报告;
模板识别模块,所述上传报告模块上传后通过深度学习分类模型,进行模板判别;
OCR区域识别模块,根据所述模板识别模块的模板判别结果,OCR识别重点识别的区域和每个区域存储的内容分布;
语义分析识别模块,OCR开始提取所述OCR区域识别模块的所述重点识别的区域和每个区域存储的内容分布文字,根据语义分析识别出体检报告字段和值;
校验和标准化模块,将识别出所述语义分析识别模块的体检报告字段和值对比标准体检报告字段和值,进行校验和标准化;
结果输出模块,输出所述校验和标准化模块的体检报告最终结果;
在校验和标准化时,对于有歧义的体检项目,体检报告用周围项目特征判别函数进行处理;
所述周围项目特征判别函数是基于贝叶斯理论构建的一个置信度函数,对样本的概率统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值;样本是指标准体检报告集合,n取值范围是正整数,n越大最后的结果越精确;特征是周围出现的体检项目。
在一些实施例中,还提供了一种电子设备,该设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述提升体检报告OCR识别准确率的方法。
在一些实施例中,还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本公开文本的第一方面的方法。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (8)

1.一种提升体检报告OCR识别准确率的方法,其特征在于,该方法包括:上传报告,用户上传体检报告;
模板识别,体检报告上传后通过深度学习分类模型,进行模板判别;
OCR区域识别,根据模板判别结果,OCR识别重点识别的区域和每个区域存储的内容分布;
语义分析识别,OCR开始提取所述重点识别的区域和每个区域存储的内容文字,根据语义分析识别出体检报告字段和值;
校验和标准化,将识别出体检报告对比标准体检报告,进行校验和标准化;
结果输出,输出校验和标准化后体检报告最终结果;在校验和标准化时,对于有歧义的体检项目,体检报告用周围项目特征判别函数进行处理;
所述周围项目特征判别函数是基于贝叶斯理论构建的一个置信度函数,对样本的概率统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值;样本是指标准体检报告集合,n取值范围是正整数,n越大最后的结果越精确;特征是周围出现的体检项目。
2.根据权利要求1所述提升体检报告OCR识别准确率的方法,其特征在于,所述深度学习分类模型是使用卷积神经网络,进行图片判别分类。
3.根据权利要求1所述提升体检报告OCR识别准确率的方法,其特征在于,所述模板判别是使用深度学习分类模型,识别当前OCR的体检报告页面的类别。
4.根据权利要求1所述提升体检报告OCR识别准确率的方法,其特征在于,所述区域是指体检报告的内容,所述区域包括重点区域和非重点区域,重点区域是结构化的区域,非重点区域是无结构化的区域。
5.根据权利要求1所述提升体检报告OCR识别准确率的方法,其特征在于,所述标准体检报告为根据体检标准和用户体检要求,将体检报告字段汇总后,构建一个标准体检报告,标准体检报告包括有字段,字段包括有标准分类、项目名称、编码、结果允许值、结果属性和是否长期有效信息。
6.一种提升体检报告OCR识别准确率的装置,其特征在于,该装置包括上传报告模块,用户上传体检报告;
模板识别模块,所述上传报告模块上传后通过深度学习分类模型,进行模板判别;
OCR区域识别模块,根据所述模板识别模块的模板判别结果,OCR识别重点识别的区域和每个区域存储的内容分布;
语义分析识别模块,OCR开始提取所述OCR区域识别模块的所述重点识别的区域和每个区域存储的内容分布文字,根据语义分析识别出体检报告字段和值;
校验和标准化模块,将识别出所述语义分析识别模块的体检报告对比标准体检报告,进行校验和标准化;
结果输出模块,输出所述校验和标准化模块的体检报告最终结果;
在校验和标准化时,对于有歧义的体检项目,体检报告用周围项目特征判别函数进行处理;
所述周围项目特征判别函数是基于贝叶斯理论构建的一个置信度函数,对样本的概率统计,计算样本所有类别出现某个项目的概率值;再接收样本OCR初步的识别结果,同时识别出周围n个项目的识别结果和值,识别项目与样本首页的识别结果和值,识别项目与样本边框的识别结果和值;样本是指标准体检报告集合,n取值范围是正整数,n越大最后的结果越精确;特征是周围出现的体检项目。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述提升体检报告OCR识别准确率的方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述提升体检报告OCR识别准确率的方法。
CN202110418565.1A 2021-04-19 2021-04-19 一种提升体检报告ocr识别准确率的方法及装置 Active CN112819003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110418565.1A CN112819003B (zh) 2021-04-19 2021-04-19 一种提升体检报告ocr识别准确率的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110418565.1A CN112819003B (zh) 2021-04-19 2021-04-19 一种提升体检报告ocr识别准确率的方法及装置

Publications (2)

Publication Number Publication Date
CN112819003A CN112819003A (zh) 2021-05-18
CN112819003B true CN112819003B (zh) 2021-08-27

Family

ID=75863693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110418565.1A Active CN112819003B (zh) 2021-04-19 2021-04-19 一种提升体检报告ocr识别准确率的方法及装置

Country Status (1)

Country Link
CN (1) CN112819003B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593668A (zh) * 2021-08-10 2021-11-02 康键信息技术(深圳)有限公司 一种体检报告校验方法、装置、设备及介质
CN113780285B (zh) * 2021-09-27 2024-03-15 常州市公共资源交易中心 证照分析方法、装置和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1976629A (zh) * 2004-04-26 2007-06-06 D·F·杨克洛维茨 用于准确测定定向瘤变化的医学影像系统
CN105011933A (zh) * 2014-04-25 2015-11-04 朴永根 包含详细检查信息的健康体检方法
CN106897466A (zh) * 2017-04-14 2017-06-27 泰康保险集团股份有限公司 体检数据匹配方法及系统、存储介质和电子设备
CN107958204A (zh) * 2017-10-27 2018-04-24 深圳市牛鼎丰科技有限公司 征信报告识别方法、装置、计算机设备及存储介质
CN108648783A (zh) * 2018-03-12 2018-10-12 杭州电子科技大学 一种医技检查项目相似性快速判别方法
CN109800803A (zh) * 2019-01-11 2019-05-24 广东奥普特科技股份有限公司 一种用于分类的特征尺度下界的计算方法
CN110136836A (zh) * 2019-03-27 2019-08-16 周凡 一种基于体检报告聚类分析的疾病预测方法
CN110580942A (zh) * 2019-08-23 2019-12-17 和宇健康科技股份有限公司 一种新型体检报告生成方法、装置、介质及终端设备
CN110991411A (zh) * 2019-12-20 2020-04-10 谢骏 适用于物流行业的智能单证结构化提取方法
CN112088070A (zh) * 2017-07-25 2020-12-15 M·奥利尼克 用于操作机器人系统并执行机器人交互的系统及方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092596B (zh) * 2017-04-24 2020-08-04 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107577157A (zh) * 2017-09-20 2018-01-12 河南工业大学 一种多变量语言动力系统建模与控制方法
CN107679564A (zh) * 2017-09-20 2018-02-09 北京百度网讯科技有限公司 样本数据推荐方法及其装置
CN108174289B (zh) * 2017-12-28 2020-11-03 泰康保险集团股份有限公司 一种影像资料处理方法、装置、介质和电子设备
CN108280357A (zh) * 2018-01-31 2018-07-13 云易天成(北京)安全科技开发有限公司 基于语义特征提取的数据防泄漏方法、系统
CN109036502B (zh) * 2018-07-11 2022-03-08 董云鹏 一种体检报告健康管理方法及系统
WO2020041204A1 (en) * 2018-08-18 2020-02-27 Sf17 Therapeutics, Inc. Artificial intelligence analysis of rna transcriptome for drug discovery
US10853638B2 (en) * 2018-08-31 2020-12-01 Accenture Global Solutions Limited System and method for extracting structured information from image documents
US10885280B2 (en) * 2018-11-14 2021-01-05 International Business Machines Corporation Event detection with conversation
CN110222148B (zh) * 2019-05-17 2021-05-04 北京邮电大学 适用于语法分析的置信度评估方法及装置
CN111275040B (zh) * 2020-01-18 2023-07-25 北京市商汤科技开发有限公司 定位方法及装置、电子设备、计算机可读存储介质
CN111428599B (zh) * 2020-03-17 2023-10-20 北京子敬科技有限公司 票据识别方法、装置和设备
CN111652162A (zh) * 2020-06-08 2020-09-11 成都知识视觉科技有限公司 一种医疗单证结构化知识提取的文本检测与识别方法
CN112182249B (zh) * 2020-10-23 2022-12-13 四川大学 针对航空安全报告的自动分类方法和装置
CN112257613B (zh) * 2020-10-23 2023-08-08 中国平安人寿保险股份有限公司 体检报告信息结构化提取方法、装置及计算机设备
CN112001373B (zh) * 2020-10-28 2021-01-22 北京妙医佳健康科技集团有限公司 一种物品识别方法、装置及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1976629A (zh) * 2004-04-26 2007-06-06 D·F·杨克洛维茨 用于准确测定定向瘤变化的医学影像系统
CN105011933A (zh) * 2014-04-25 2015-11-04 朴永根 包含详细检查信息的健康体检方法
CN106897466A (zh) * 2017-04-14 2017-06-27 泰康保险集团股份有限公司 体检数据匹配方法及系统、存储介质和电子设备
CN112088070A (zh) * 2017-07-25 2020-12-15 M·奥利尼克 用于操作机器人系统并执行机器人交互的系统及方法
CN107958204A (zh) * 2017-10-27 2018-04-24 深圳市牛鼎丰科技有限公司 征信报告识别方法、装置、计算机设备及存储介质
CN108648783A (zh) * 2018-03-12 2018-10-12 杭州电子科技大学 一种医技检查项目相似性快速判别方法
CN109800803A (zh) * 2019-01-11 2019-05-24 广东奥普特科技股份有限公司 一种用于分类的特征尺度下界的计算方法
CN110136836A (zh) * 2019-03-27 2019-08-16 周凡 一种基于体检报告聚类分析的疾病预测方法
CN110580942A (zh) * 2019-08-23 2019-12-17 和宇健康科技股份有限公司 一种新型体检报告生成方法、装置、介质及终端设备
CN110991411A (zh) * 2019-12-20 2020-04-10 谢骏 适用于物流行业的智能单证结构化提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
6219例健康体检分析报告;马雁;《甘肃医药》;20111231;第30卷(第8期);第476-478页 *
体检中心常见检查项目危急值规范化的意义;吴梦玮;《中国医药导报》;20190731;第16卷(第20期);第185-188页 *

Also Published As

Publication number Publication date
CN112819003A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
Kavasidis et al. A saliency-based convolutional neural network for table and chart detection in digitized documents
CN112819003B (zh) 一种提升体检报告ocr识别准确率的方法及装置
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN105389593A (zh) 基于surf特征的图像物体识别方法
WO2020164278A1 (zh) 一种图像处理方法、装置、电子设备和可读存储介质
CN107294834A (zh) 一种识别垃圾邮件的方法和装置
CN111931548B (zh) 人脸识别系统、建立人脸识别数据的方法及人脸识别方法
WO2022213396A1 (zh) 猫的面部个体识别装置、方法、计算机设备及存储介质
CN115953123A (zh) 机器人自动化流程的生成方法、装置、设备及存储介质
CN112395392A (zh) 一种意图识别方法及装置、可读存储介质
CN101299762B (zh) 一种身份认证方法及装置
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
CN113780207A (zh) 一种羊脸识别的系统及方法
CN116384393B (zh) 一种基于自然语言处理的运维数据处理系统及方法
Fuglsby et al. Elucidating the relationships between two automated handwriting feature quantification systems for multiple pairwise comparisons
CN116469505A (zh) 数据处理方法、装置、计算机设备及可读存储介质
CN114266267B (zh) 集合二维码、文档、证件、人脸的自动识别方法、装置及存储介质
US11900705B2 (en) Intelligent engineering data digitization
CN115294576A (zh) 基于人工智能的数据处理方法、装置、计算机设备及介质
CN114842261A (zh) 图像处理方法、装置、电子设备及存储介质
CN113691525A (zh) 一种流量数据处理方法、装置、设备及存储介质
Srihari et al. Comparison of statistical models for writer verification
Deselaers et al. Local representations for multi-object recognition
CN111931229A (zh) 一种数据识别方法、装置和存储介质
CN118377852B (zh) 一种基于多模态大语言模型的数据处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211012

Address after: Room 502-3, floor 5, building 1, Taihu cultural innovation center, 2999 Sunwu Road, Suzhou Taihu National Tourism Resort, Suzhou, Jiangsu 215000

Patentee after: Suzhou miaoyijia Health Technology Group Co.,Ltd.

Address before: 100027 F5, Air China century building, No.40 Xiaoyun Road, Chaoyang District, Beijing

Patentee before: Beijing miaoyijia Health Technology Group Co.,Ltd.

TR01 Transfer of patent right
CB03 Change of inventor or designer information

Inventor after: Chang Dejie

Inventor after: Zhuang Boran

Inventor after: Kong Fei

Inventor after: Liu Bangchang

Inventor after: Liu Chaozhen

Inventor after: Wang Hai

Inventor after: Zhao Hongwen

Inventor after: Gu Shufeng

Inventor after: Zhao Jin

Inventor after: Luo Xiaobin

Inventor before: Chang Dejie

Inventor before: Zhuang Boran

Inventor before: Kong Fei

Inventor before: Liu Bangchang

Inventor before: Liu Chaozhen

Inventor before: Wang Hai

Inventor before: Zhao Hongwen

Inventor before: Gu Shufeng

Inventor before: Zhao Jin

Inventor before: Luo Xiaobin

CB03 Change of inventor or designer information