CN113128490B - 一种处方信息扫描和自动识别方法 - Google Patents
一种处方信息扫描和自动识别方法 Download PDFInfo
- Publication number
- CN113128490B CN113128490B CN202110466829.0A CN202110466829A CN113128490B CN 113128490 B CN113128490 B CN 113128490B CN 202110466829 A CN202110466829 A CN 202110466829A CN 113128490 B CN113128490 B CN 113128490B
- Authority
- CN
- China
- Prior art keywords
- prescription
- text
- data
- matching
- intercepting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000003814 drug Substances 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 11
- 238000013518 transcription Methods 0.000 claims description 10
- 230000035897 transcription Effects 0.000 claims description 10
- 238000003759 clinical diagnosis Methods 0.000 claims description 9
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000010254 subcutaneous injection Methods 0.000 claims description 3
- 239000007929 subcutaneous injection Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 abstract description 2
- 238000003672 processing method Methods 0.000 abstract description 2
- 210000005266 circulating tumour cell Anatomy 0.000 description 5
- 102100032202 Cornulin Human genes 0.000 description 3
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请属于数据处理方法技术领域,尤其涉及一种处方信息扫描和自动识别方法。包括用于进行文本识别的步骤;包括获取处方笺图片,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;用于完成信息抽取的步骤,包括步获取文本识别数据和文本位置数据;通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;本申请提出了一种能够用于快速识别和分析处方笺上文本信息,并实现自动化分类信息收集和处方信息预处理的技术方案,本方法实现方式相对简单,适应性好,且能够充分保证信息收集的准确性,并具有一定的纠错勘误能力,能够提高处方笺信息电子化的效率,降低操作成本。
Description
技术领域
本申请属于数据处理方法技术领域,尤其涉及一种处方信息扫描和自动识别方法。
背景技术
目前,市场上现有的信息扫描和自动识别应用大多应用在身份证和银行卡上,该类技术要求卡片大小和信息相对于卡片的位置固定,所得到的识别效果已经达到目前工程化的需求,但是现有自动识别技术要求卡片信息相对卡片位置固定,对于卡片信息相对卡片位置不固定的情况识别效果较差。处方笺中药方信息相对处方位置不固定,数量不固定、药方信息有部分缺失,在进行自动识别时难以获得准确信息。
发明内容
本申请的目的在于,构建能够用于进行电子化的处方信息的识别和抽取,以便于实现自动化和智能化的处方笺信息收集处理工作,对药方进行切分实现处方笺的信息扫描和自动识别的处方信息扫描和自动识别方法。
为实现上述目的,本申请采用如下技术方案。
一种处方信息扫描和自动识别方法,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
所述TrWebOCR采用CNN+RNN+CTC模型,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列;
②用于完成信息抽取的步骤,包括步骤B1~B3:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息将每一条药方进行切分,包括步骤:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤b3中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为要药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述文本识别方式采用的CNN+RNN+CTC模型实现,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤③用于完成信息抽取的步骤,还包括准备步骤,所述准备步骤是指将所有处方信息文本拼接为一个字符串,将易错符号进行定位和纠正。
对前述处方信息扫描和自动识别方法的进一步改进和优化,所述步骤B3、B4为并行执行。
其有益效果在于:
基于现有技术方案,提出了一种能够用于快速识别和分析处方笺上文本信息,并实现自动化分类信息收集和处方信息预处理的技术方案,为实现自动化的处方信息收集工作提供了必要的技术基础,本方法实现方式相对简单,适应性好,且能够充分保证信息收集的准确性,并具有一定的纠错勘误能力,能够提高处方笺信息电子化的效率,降低操作成本。
附图说明
图1是处方信息扫描和自动识别方法的流程图。
具体实施方式
以下结合具体实施例对本申请作详细说明。
一种处方信息扫描和自动识别方法,如图1所示,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
②用于完成信息抽取的步骤,包括步骤B1~b3:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息,将每一条药方进行切分,包括步骤Ⅰ~Ⅲ:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据,中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为要药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
本申请中,文本识别方式采用的CNN+RNN+CTC模型实现,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列。
具体而言,采用CRNN文本识别模型,返回识别得到的文本、位置信息,在此基础上提供了http调用的接口,便于后续信息抽取模块的调用。该模块以拍照所得的处方笺图片作为输入,输出为识别的文本结果。文系统识别所采用的模型是CNN+RNN+CTC,CRNN自下而上由卷积层、循环层和转录层三个部分组成。卷积层负责从输入图像中提取特征序列。循环层由双向LSTM组成,负责对卷积层输出的特征序列的每一帧进行预测。转录层负责将每帧的预测转化为标签序列。CRNN训练时使用CTC作为损失函数,可以进行端到端的训练。
最后应当说明的是,以上实施例仅用以说明本申请的技术方案,而非对本申请保护范围的限制,尽管参照较佳实施例对本申请作了详细地说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或者等同替换,而不脱离本申请技术方案的实质和范围。
Claims (4)
1.一种处方信息扫描和自动识别方法,其特征在于,包括步骤①~②:
①用于进行文本识别的步骤;包括:
A1.获取处方笺图片,基于TrWebOCR,以处方笺图片为输入获取输出的文本识别数据以及文本位置数据;
所述TrWebOCR采用CNN+RNN+CTC模型,具体而言,包括:
构建自下而上的卷积层、循环层和转录层三个部分;在卷积层输入图像特征提取序列,利用双向LSTM组成循环层,循环层对卷积层输出的特征序列的每一帧进行预测,利用转录层将每帧的预测转化为标签序列;
②用于完成信息抽取的步骤,包括步骤B1~B4:
B1.获取文本识别数据和文本位置数据;
B2.通过处方笺上固有的Rp文本作为参考点,将文本识别数据和文本位置数据分割为处方信息部分及药方信息部分;
B3.对于处方信息部分;
以“医院”作为关键字进行匹配,截取与医院直接连接的文本串,获取医院名称数据;
以“医院”和“处方笺”为关键字进行匹配后,截取位于两者之间的文本串,获取处方类型数据;
以“处方笺”为关键字进行匹配确定处方笺文本位置,在处方笺后侧以有效为关键字进行匹配,截取与有效直接连接的文本串作为有效期数据;
以“门诊号”作为关键字进行匹配,截取与门诊号直接连接的文本串作为门诊号数据;
以“科室”作为关键字进行匹配,截取与科室直接连接的文本串作为科室数据;
以“年”、“月”、“日”作为关键字进行匹配,截取与年月日直接连接的文本串作为处方日期数据;
以依次相连的数字加关键字“:”加数字的三组合为匹配规则,确定处方时间数据;
以“姓名”和“性别”为关键字进行匹配后,截取位于两者之间的文本串,获取姓名数据;
以“姓名”为关键字进行匹配确定姓名文本位置,在姓名后侧以“男”或“女”为关键字进行匹配,以截取到的男或女作为性别数据;
以依次相连的数字加关键字“岁”的组合为匹配规则,截取相应的数字文本作为年龄数据;
以“临床诊断”为关键字进行匹配,截取位于“临床诊断”关键字后侧文本数据作为临床诊断数据;
B4.对于药方信息部分,采用步骤b1~b3处理,具体而言:
b1.是指利用文本识别模块所获取的位置信息,将每一条药方进行切分,包括步骤Ⅰ~Ⅲ:
I、利用已有药方文本位置信息中的宽度信息求得所有药方文本的平均宽度;
II、将相对位置小于平均宽度的文本拼接,作为单条药方的其中一行;
III、每两行作为一条药方,若出现单条药方占处方笺三行,确定该行最左侧文本的横坐标与上一行最左侧文本的横坐标的距离大于判定阈值,若大于阈值则认为此行与上一行为一行信息;
b2.将易错文本字符进行修正;
b3.对药方的各行分别使用正则匹配的方式分别抽取得到药方数据。
2.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤b3中具体是指:
C1、使用数字文本对药方的第一行进行正则匹配,截取位于数字文本前侧的字符串作为药品名称数据;
C2、删除前述药方名称文本,在剩下的字符串中使用正则方法匹配中文或中文+字母,以得到的文本串作为药品来源数据;
C3、以C2的匹配结果切分第一行删除药方名称的部分,切分得到的前一部分为药品规格数据;切分得到的后一部分为药品数量数据;
C4、使用关键字“/”+“周”或“日”的组合方式进行正则匹配,匹配得到的文本串为药品频次数据;
C5、以C4的匹配结果切分药方的第二行,切分得到的前一部为药品单次剂量;
C6、对C5中切分得到的后一部分,使用关键字天进行正则匹配,截取得到的数字字符作为药品周期数据;
C7、对C5中切分得到的后一部分,使用关键字口服、吸入、外用、皮下注射进行正则匹配,以得到的相同字样文本串作为使用类型数据;
C8、对C5中切分得到的后一部分,删除C6、C7相应数据,截取剩下的文本数据作为药方医嘱数据。
3.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤②用于完成信息抽取的步骤,还包括准备步骤,所述准备步骤是指将所有处方信息文本拼接为一个字符串,将易错符号进行定位和纠正。
4.根据权利要求1所述的一种处方信息扫描和自动识别方法,其特征在于,所述步骤B3、B4为并行执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466829.0A CN113128490B (zh) | 2021-04-28 | 2021-04-28 | 一种处方信息扫描和自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466829.0A CN113128490B (zh) | 2021-04-28 | 2021-04-28 | 一种处方信息扫描和自动识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113128490A CN113128490A (zh) | 2021-07-16 |
CN113128490B true CN113128490B (zh) | 2023-12-05 |
Family
ID=76780474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110466829.0A Active CN113128490B (zh) | 2021-04-28 | 2021-04-28 | 一种处方信息扫描和自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113128490B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117074409B (zh) * | 2023-08-31 | 2024-04-12 | 苏州聚鑫堂药业有限公司 | 一种基于机器视觉的中药代煎用校方装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016197381A1 (en) * | 2015-06-12 | 2016-12-15 | Sensetime Group Limited | Methods and apparatus for recognizing text in an image |
CN109447078A (zh) * | 2018-10-23 | 2019-03-08 | 四川大学 | 一种自然场景图像敏感文字的检测识别方法 |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110298343A (zh) * | 2019-07-02 | 2019-10-01 | 哈尔滨理工大学 | 一种手写黑板板书识别方法 |
EP3608844A1 (en) * | 2018-08-10 | 2020-02-12 | Naver Corporation | Methods for training a crnn and for semantic segmentation of an inputted video using said crnn |
CN111046946A (zh) * | 2019-12-10 | 2020-04-21 | 昆明理工大学 | 基于crnn的缅甸语图像文本识别方法 |
CN111259889A (zh) * | 2020-01-17 | 2020-06-09 | 平安医疗健康管理股份有限公司 | 图像文本识别方法、装置、计算机设备及计算机存储介质 |
WO2020164281A1 (zh) * | 2019-02-13 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于文字定位识别的表格解析方法、介质及计算机设备 |
JP2021022367A (ja) * | 2019-07-29 | 2021-02-18 | 富士通株式会社 | 画像処理方法及び情報処理装置 |
RU2744769C1 (ru) * | 2020-07-04 | 2021-03-15 | Общество с ограниченной ответственностью "СЭНДБОКС" | Способ обработки изображений с использованием адаптивных технологий на основе нейросетей и компьютерного зрения |
WO2021050256A1 (en) * | 2019-09-11 | 2021-03-18 | Amazon Technologies, Inc. | Machine learning system to score alt-text for image data |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7917286B2 (en) * | 2005-12-16 | 2011-03-29 | Google Inc. | Database assisted OCR for street scenes and other images |
-
2021
- 2021-04-28 CN CN202110466829.0A patent/CN113128490B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016197381A1 (en) * | 2015-06-12 | 2016-12-15 | Sensetime Group Limited | Methods and apparatus for recognizing text in an image |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
EP3608844A1 (en) * | 2018-08-10 | 2020-02-12 | Naver Corporation | Methods for training a crnn and for semantic segmentation of an inputted video using said crnn |
CN109447078A (zh) * | 2018-10-23 | 2019-03-08 | 四川大学 | 一种自然场景图像敏感文字的检测识别方法 |
WO2020164281A1 (zh) * | 2019-02-13 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于文字定位识别的表格解析方法、介质及计算机设备 |
CN110298343A (zh) * | 2019-07-02 | 2019-10-01 | 哈尔滨理工大学 | 一种手写黑板板书识别方法 |
JP2021022367A (ja) * | 2019-07-29 | 2021-02-18 | 富士通株式会社 | 画像処理方法及び情報処理装置 |
WO2021050256A1 (en) * | 2019-09-11 | 2021-03-18 | Amazon Technologies, Inc. | Machine learning system to score alt-text for image data |
CN111046946A (zh) * | 2019-12-10 | 2020-04-21 | 昆明理工大学 | 基于crnn的缅甸语图像文本识别方法 |
CN111259889A (zh) * | 2020-01-17 | 2020-06-09 | 平安医疗健康管理股份有限公司 | 图像文本识别方法、装置、计算机设备及计算机存储介质 |
RU2744769C1 (ru) * | 2020-07-04 | 2021-03-15 | Общество с ограниченной ответственностью "СЭНДБОКС" | Способ обработки изображений с использованием адаптивных технологий на основе нейросетей и компьютерного зрения |
Non-Patent Citations (4)
Title |
---|
Convolutional Attention Networks for Scene Text Recognition;Xie, HT,等;ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS;第15卷(第01期);文献号 3 * |
Text-CRNN+attention架构下的多类别文本信息分类;卢健,等;计算机应用研究(第06期);第1693-1696, 1701页 * |
基于BP神经网络的规范手写体数字离线识别;徐鹏;;木工机床(第04期);第14-16, 9页 * |
基于循环卷积神经网络的模块化文字识别;张焱,等;智能计算机与应用;第10卷(第10期);第37-42页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113128490A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111222340B (zh) | 基于多标准主动学习的乳腺电子病历实体识别系统 | |
WO2019119505A1 (zh) | 人脸识别的方法和装置、计算机装置及存储介质 | |
CN109800761A (zh) | 基于深度学习模型创建纸质文档结构化数据的方法和终端 | |
US8290269B2 (en) | Image document processing device, image document processing method, program, and storage medium | |
CN112257613B (zh) | 体检报告信息结构化提取方法、装置及计算机设备 | |
CN109816118A (zh) | 一种基于深度学习模型的创建结构化文档的方法及终端 | |
CN112164446B (zh) | 一种基于多网络融合的医疗影像报告生成方法 | |
CN111444723A (zh) | 信息抽取模型训练方法、装置、计算机设备和存储介质 | |
CN111027562A (zh) | 基于多尺度cnn和结合注意力机制的rnn的光学字符识别方法 | |
Kumar et al. | Multi-script robust reading competition in ICDAR 2013 | |
EP4170670A1 (en) | Medical data processing method and system | |
CN113128490B (zh) | 一种处方信息扫描和自动识别方法 | |
CN111177375B (zh) | 一种电子文档分类方法及装置 | |
CN108280389A (zh) | 医疗票据icr识别系统及其医疗票据识别方法 | |
CN112927776A (zh) | 一种面向医学检验报告的人工智能自动解读系统 | |
CN110969154A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN114420233A (zh) | 一种中文电子病历后结构化信息的抽取方法 | |
CN109036506A (zh) | 互联网医疗问诊的监管方法、电子装置及可读存储介质 | |
CN112116968A (zh) | 一种医学检验报告的识别方法、装置、设备及存储介质 | |
CN113488157A (zh) | 智能导诊处理方法、装置、电子设备及存储介质 | |
CN115374788B (zh) | 农业病虫害文本命名实体的方法及装置 | |
CN114566247B (zh) | Crf的自动生成方法和装置、电子设备和存储介质 | |
CN111209924B (zh) | 一种用于对医嘱进行自动提取的系统及应用 | |
CN111651960B (zh) | 一种从合同简体迁移到繁体的光学字符联合训练及识别方法 | |
TWM607472U (zh) | 文字區段標籤系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |