CN113128490B - 一种处方信息扫描和自动识别方法 - Google Patents

一种处方信息扫描和自动识别方法 Download PDF

Info

Publication number
CN113128490B
CN113128490B CN202110466829.0A CN202110466829A CN113128490B CN 113128490 B CN113128490 B CN 113128490B CN 202110466829 A CN202110466829 A CN 202110466829A CN 113128490 B CN113128490 B CN 113128490B
Authority
CN
China
Prior art keywords
prescription
text
data
matching
intercepting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110466829.0A
Other languages
English (en)
Other versions
CN113128490A (zh
Inventor
窦钰涛
胡彪
夏飞
肖坚
金持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Rongguan Intelligent Technology Co ltd
Original Assignee
Hunan Rongguan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Rongguan Intelligent Technology Co ltd filed Critical Hunan Rongguan Intelligent Technology Co ltd
Priority to CN202110466829.0A priority Critical patent/CN113128490B/zh
Publication of CN113128490A publication Critical patent/CN113128490A/zh
Application granted granted Critical
Publication of CN113128490B publication Critical patent/CN113128490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请属于数据处理方法技术领域,尤其涉及一种处方信息扫描和自动识别方法。包括用于进行文本识别的步骤;包括获取处方笺图片,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;用于完成信息抽取的步骤,包括步获取文本识别数据和文本位置数据;通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;本申请提出了一种能够用于快速识别和分析处方笺上文本信息,并实现自动化分类信息收集和处方信息预处理的技术方案,本方法实现方式相对简单,适应性好,且能够充分保证信息收集的准确性,并具有一定的纠错勘误能力,能够提高处方笺信息电子化的效率,降低操作成本。

Description

一种处方信息扫描和自动识别方法
技术领域
本申请属于数据处理方法技术领域,尤其涉及一种处方信息扫描和自动识别方法。
背景技术
目前,市场上现有的信息扫描和自动识别应用大多应用在身份证和银行卡上,该类技术要求卡片大小和信息相对于卡片的位置固定,所得到的识别效果已经达到目前工程化的需求,但是现有自动识别技术要求卡片信息相对卡片位置固定,对于卡片信息相对卡片位置不固定的情况识别效果较差。处方笺中药方信息相对处方位置不固定,数量不固定、药方信息有部分缺失,在进行自动识别时难以获得准确信息。
发明内容
本申请的目的在于,构建能够用于进行电子化的处方信息的识别和抽取,以便于实现自动化和智能化的处方笺信息收集处理工作,对药方进行切分实现处方笺的信息扫描和自动识别的处方信息扫描和自动识别方法。
为实现上述目的,本申请采用如下技术方案。
一种处方信息扫描和自动识别方法,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
所述TrWebOCR采用CNN+RNN+CTC模型,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列;
②用于完成信息抽取的步骤,包括步骤B1~B3:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息将每一条药方进行切分,包括步骤:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤b3中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为要药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述文本识别方式采用的CNN+RNN+CTC模型实现,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤③用于完成信息抽取的步骤,还包括准备步骤,所述准备步骤是指将所有处方信息文本拼接为一个字符串,将易错符号进行定位和纠正。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤B3、B4为并行执行。
其有益效果在于:
基于现有技术方案,提出了一种能够用于快速识别和分析处方笺上文本信息,并实现自动化分类信息收集和处方信息预处理的技术方案,为实现自动化的处方信息收集工作提供了必要的技术基础,本方法实现方式相对简单,适应性好,且能够充分保证信息收集的准确性,并具有一定的纠错勘误能力,能够提高处方笺信息电子化的效率,降低操作成本。
附图说明
图1是处方信息扫描和自动识别方法的流程图。
具体实施方式
以下结合具体实施例对本申请作详细说明。
一种处方信息扫描和自动识别方法,如图1所示,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
②用于完成信息抽取的步骤,包括步骤B1~b3:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息,将每一条药方进行切分,包括步骤Ⅰ~Ⅲ:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据,中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为要药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
本申请中,文本识别方式采用的CNN+RNN+CTC模型实现,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列。
具体而言,采用CRNN文本识别模型,返回识别得到的文本、位置信息,在此基础上提供了http调用的接口,便于后续信息抽取模块的调用。该模块以拍照所得的处方笺图片作为输入,输出为识别的文本结果。文系统识别所采用的模型是CNN+RNN+CTC,CRNN自下而上由卷积层、循环层和转录层三个部分组成。卷积层负责从输入图像中提取特征序列。循环层由双向LSTM组成,负责对卷积层输出的特征序列的每一帧进行预测。转录层负责将每帧的预测转化为标签序列。CRNN训练时使用CTC作为损失函数,可以进行端到端的训练。
最后应当说明的是,以上实施例仅用以说明本申请的技术方案,而非对本申请保护范围的限制,尽管参照较佳实施例对本申请作了详细地说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或者等同替换,而不脱离本申请技术方案的实质和范围。

Claims (4)

1.一种处方信息扫描和自动识别方法,其特征在于,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
所述TrWebOCR采用CNN+RNN+CTC模型,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列;
②用于完成信息抽取的步骤,包括步骤B1~B4:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息,将每一条药方进行切分,包括步骤Ⅰ~Ⅲ:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据。
2.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤b3中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
3.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤②用于完成信息抽取的步骤,还包括准备步骤,所述准备步骤是指将所有处方信息文本拼接为一个字符串,将易错符号进行定位和纠正。
4.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤B3、B4为并行执行。
CN202110466829.0A 2021-04-28 2021-04-28 一种处方信息扫描和自动识别方法 Active CN113128490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110466829.0A CN113128490B (zh) 2021-04-28 2021-04-28 一种处方信息扫描和自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110466829.0A CN113128490B (zh) 2021-04-28 2021-04-28 一种处方信息扫描和自动识别方法

Publications (2)

Publication Number Publication Date
CN113128490A CN113128490A (zh) 2021-07-16
CN113128490B true CN113128490B (zh) 2023-12-05

Family

ID=76780474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110466829.0A Active CN113128490B (zh) 2021-04-28 2021-04-28 一种处方信息扫描和自动识别方法

Country Status (1)

Country Link
CN (1) CN113128490B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117074409B (zh) * 2023-08-31 2024-04-12 苏州聚鑫堂药业有限公司 一种基于机器视觉的中药代煎用校方装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016197381A1 (en) * 2015-06-12 2016-12-15 Sensetime Group Limited Methods and apparatus for recognizing text in an image
CN109447078A (zh) * 2018-10-23 2019-03-08 四川大学 一种自然场景图像敏感文字的检测识别方法
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN110298343A (zh) * 2019-07-02 2019-10-01 哈尔滨理工大学 一种手写黑板板书识别方法
EP3608844A1 (en) * 2018-08-10 2020-02-12 Naver Corporation Methods for training a crnn and for semantic segmentation of an inputted video using said crnn
CN111046946A (zh) * 2019-12-10 2020-04-21 昆明理工大学 基于crnn的缅甸语图像文本识别方法
CN111259889A (zh) * 2020-01-17 2020-06-09 平安医疗健康管理股份有限公司 图像文本识别方法、装置、计算机设备及计算机存储介质
WO2020164281A1 (zh) * 2019-02-13 2020-08-20 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
JP2021022367A (ja) * 2019-07-29 2021-02-18 富士通株式会社 画像処理方法及び情報処理装置
RU2744769C1 (ru) * 2020-07-04 2021-03-15 Общество с ограниченной ответственностью "СЭНДБОКС" Способ обработки изображений с использованием адаптивных технологий на основе нейросетей и компьютерного зрения
WO2021050256A1 (en) * 2019-09-11 2021-03-18 Amazon Technologies, Inc. Machine learning system to score alt-text for image data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917286B2 (en) * 2005-12-16 2011-03-29 Google Inc. Database assisted OCR for street scenes and other images

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016197381A1 (en) * 2015-06-12 2016-12-15 Sensetime Group Limited Methods and apparatus for recognizing text in an image
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
EP3608844A1 (en) * 2018-08-10 2020-02-12 Naver Corporation Methods for training a crnn and for semantic segmentation of an inputted video using said crnn
CN109447078A (zh) * 2018-10-23 2019-03-08 四川大学 一种自然场景图像敏感文字的检测识别方法
WO2020164281A1 (zh) * 2019-02-13 2020-08-20 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
CN110298343A (zh) * 2019-07-02 2019-10-01 哈尔滨理工大学 一种手写黑板板书识别方法
JP2021022367A (ja) * 2019-07-29 2021-02-18 富士通株式会社 画像処理方法及び情報処理装置
WO2021050256A1 (en) * 2019-09-11 2021-03-18 Amazon Technologies, Inc. Machine learning system to score alt-text for image data
CN111046946A (zh) * 2019-12-10 2020-04-21 昆明理工大学 基于crnn的缅甸语图像文本识别方法
CN111259889A (zh) * 2020-01-17 2020-06-09 平安医疗健康管理股份有限公司 图像文本识别方法、装置、计算机设备及计算机存储介质
RU2744769C1 (ru) * 2020-07-04 2021-03-15 Общество с ограниченной ответственностью "СЭНДБОКС" Способ обработки изображений с использованием адаптивных технологий на основе нейросетей и компьютерного зрения

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Convolutional Attention Networks for Scene Text Recognition;Xie, HT,等;ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS;第15卷(第01期);文献号 3 *
Text-CRNN+attention架构下的多类别文本信息分类;卢健,等;计算机应用研究(第06期);第1693-1696, 1701页 *
基于BP神经网络的规范手写体数字离线识别;徐鹏;;木工机床(第04期);第14-16, 9页 *
基于循环卷积神经网络的模块化文字识别;张焱,等;智能计算机与应用;第10卷(第10期);第37-42页 *

Also Published As

Publication number Publication date
CN113128490A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
WO2019119505A1 (zh) 人脸识别的方法和装置、计算机装置及存储介质
CN111222340B (zh) 基于多标准主动学习的乳腺电子病历实体识别系统
CN109800761A (zh) 基于深度学习模型创建纸质文档结构化数据的方法和终端
US8290269B2 (en) Image document processing device, image document processing method, program, and storage medium
CN109816118A (zh) 一种基于深度学习模型的创建结构化文档的方法及终端
CN103824053A (zh) 一种人脸图像的性别标注方法及人脸性别检测方法
CN112164446B (zh) 一种基于多网络融合的医疗影像报告生成方法
CN109872784A (zh) 智能病历生成方法、装置、计算机设备以及存储介质
CN111444723A (zh) 信息抽取模型训练方法、装置、计算机设备和存储介质
CN111027562A (zh) 基于多尺度cnn和结合注意力机制的rnn的光学字符识别方法
Kumar et al. Multi-script robust reading competition in ICDAR 2013
CN112257613A (zh) 体检报告信息结构化提取方法、装置及计算机设备
EP4170670A1 (en) Medical data processing method and system
CN113128490B (zh) 一种处方信息扫描和自动识别方法
CN108280389A (zh) 医疗票据icr识别系统及其医疗票据识别方法
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
CN110969154A (zh) 文本识别方法、装置、计算机设备和存储介质
CN111177375A (zh) 一种电子文档分类方法及装置
CN109036506A (zh) 互联网医疗问诊的监管方法、电子装置及可读存储介质
CN114023414A (zh) 一种体检报告多层次结构录入方法、系统以及存储介质
CN109378082A (zh) 互联网医疗问诊的监管方法、电子装置及可读存储介质
CN115374788B (zh) 农业病虫害文本命名实体的方法及装置
CN109344730A (zh) 数据提取方法、装置及计算机可读存储介质
CN114420233A (zh) 一种中文电子病历后结构化信息的抽取方法
CN111651960B (zh) 一种从合同简体迁移到繁体的光学字符联合训练及识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant