CN109214381A - 数控程序转换装置 - Google Patents

数控程序转换装置 Download PDF

Info

Publication number
CN109214381A
CN109214381A CN201810568611.4A CN201810568611A CN109214381A CN 109214381 A CN109214381 A CN 109214381A CN 201810568611 A CN201810568611 A CN 201810568611A CN 109214381 A CN109214381 A CN 109214381A
Authority
CN
China
Prior art keywords
character
letter
storage unit
numerical control
control program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810568611.4A
Other languages
English (en)
Other versions
CN109214381B (zh
Inventor
上西大辅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of CN109214381A publication Critical patent/CN109214381A/zh
Application granted granted Critical
Publication of CN109214381B publication Critical patent/CN109214381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明提供一种数控程序转换装置(1),其能够转换识别后的字符串,使其作为数控程序发挥功能。该数控程序转换装置(1)具备:OCR处理部(3),其从输入的图像中识别字符串;第一存储部(4),其将一个字符的字母与紧接在每个字母后面的数字的位数对应地存储;第二存储部(4),其将由一个字符的字母和两个字符的数字的组合组成的程序代码与由紧接在该程序代码后面的一个字符的字母组成的有效字符对应地存储;以及字符串划分部(5),其参照该第一存储部(4)和第二存储部(4),将由OCR处理部(3)识别出的字符串的每一行划分为,由一个字符的字母和对应地存储于第一存储部(4)中的位数的数字组成的程序代码。

Description

数控程序转换装置
技术领域
本发明涉及数控程序转换装置。
背景技术
以往,已知如下字符识别装置,其通过读取申请书的图像,并对读取到的图像实施OCR(光学字符识别)处理,从而进行字符识别,以提高记载数据的输入作业的效率(例如,参照专利文件1。)。
该字符识别装置预先注册有容易混淆的字符,经字符识别,将误识别的字符置换为注册的字符中可能性最高的字符。
现有技术文件
专利文件
专利文件1:日本特开2003-108918号公报
发明内容
发明要解决的问题
然而,仅将误识别的字符置换为可能性最高的字符,未必能够使转换后的字符串作为数控程序发挥功能。
本发明是鉴于上述情况而做出的,目的在于提供一种数控程序转换装置,其能够转换识别后的字符串,使其作为数控程序发挥功能。
用于解决问题的方案
为了达到上述目的,本发明提供以下方案。
本发明的一个方案提供一种数控程序转换装置,其具备:
OCR处理部,其从输入的图像中识别字符串;第一存储部,其将一个字符的字母与紧接在每个字母后面的数字的位数对应地存储;第二存储部,其将由一个字符的字母和两个字符的数字的组合组成的程序代码与由紧接在该程序代码后面的一个字符的字母组成的有效字符对应地存储;以及字符串划分部,其参照所述第一存储部和所述第二存储部,将由所述OCR处理部识别出的所述字符串的每一行划分为,由一个字符的字母和对应地存储于所述第一存储部中的位数的数字组成的程序代码。
根据本方案,如果由OCR处理部将输入的图像转换为字符串,则字符串划分部参照第一存储部和第二存储部,将字符串的每一行划分为由一个字符的字母和对应地存储于第一存储部中的位数的数字组成的程序代码。由于在数控程序中,程序代码必须由一个字符的字母和数字的组合构成,因此例如如果在字符串中识别出由存储于第一存储部中的一个字符的字母和两个字符的数字组成的程序代码,则能够推定紧接在其后面的字符为存储于第二存储部中的任一有效字符和存储于第一存储部中的位数的数字。由此能够转换识别后的字符串,使其作为数控程序发挥功能。
在上述方案中,所述数控程序转换装置可以具备第三存储部,所述第三存储部将数字和与该数字容易混淆的字母对应地存储,当由所述OCR处理部识别出的所述字符串中的每个区划的第一个字符为数字时,所述字符串划分部将该数字置换为对应地存储于所述第三存储部中的任一字母。
通过如此,由于每个区划的第一个字符为数字的程序代码并不存在,因此当第一个字符为数字时,通过将第一个字符置换为与数字对应地存储于第三存储部中的字母,从而能够将其转换,使其作为数控程序发挥功能。
此外,在上述方案中,当由所述OCR处理部识别出的所述字符串中的第一个字符为存储于所述第一存储部中的任一字母时,所述字符串划分部可以将紧接在该字母后面的字符串置换为对应地存储于所述第一存储部中的位数的数字。
通过如此,能够容易地将识别出的字符串划分为多个程序代码,从而能够转换该字符串使其作为数控程序发挥功能。
此外,在上述方案中,当由所述OCR处理部识别出的所述字符串中的第一个字符为“O”,且紧接在其后面的数字少于四位时,所述字符串划分部可以在第一个字符与数字之间添加零,以置换为四位的数字。
通过如此,将以“O”开始的行识别为程序编号,并且即便在紧接在“O”后面的数字被省略为少于四位的位数的情况下,也能够通过在数字之前添加零而置换为四位数字,从而将其转换,以使其作为数控程序发挥功能。
此外,在上述方案中,所述字符串划分部可以将由所述OCR处理部识别出的所述字符串中的不符合任何程序代码的字符转换为注释语句。
通过如此,不符合任何程序代码的字符,即与存储于第一存储部中的任何字母、与字母对应地存储的位数的数字以及存储于第二存储部中的任何有效字符均不符合时,通过将不符合的部分作为注释语句,从而能够将其转换,使其作为数控程序发挥功能。
发明效果
根据本发明,取得如下效果:能够转换识别后的字符串,使其作为数控程序发挥功能。
附图说明
图1是表示本发明的一个实施方式所涉及的数控程序转换装置的框图。
图2是表示存储于图1的数控程序转换装置所具备的存储部内的数值类型格式的一个示例的图。
图3是表示存储于图1的数控程序转换装置所具备的存储部内的代码类型格式的一个示例的图。
图4是表示存储于图1的数控程序转换装置所具备的存储部内的数值字母转换列表的一个示例的图。
图5是对图1的数控程序转换装置的作用进行说明的流程图。
图6a是表示输入的手写文本的一个示例的图。
图6b是表示图6a中的手写文本的OCR处理结果的一个示例的图。
图6c是表示由本实施方式所涉及的数控程序转换装置生成的数控程序的一个示例的图。
图7a是表示输入的手写文本的另一个示例的图。
图7b是表示图7a中的手写文本的OCR处理结果的另一个示例的图。
图7c是表示由本实施方式所涉及的数控程序转换装置生成的数控程序的另一个示例的图。
附图标记说明
1数控程序转换装置
3OCR处理部
4存储部(第一存储部、第二存储部、第三存储部)
5字符串划分部
具体实施方式
下面参照附图对本发明的一个实施方式所涉及的数控程序转换装置1进行说明。
如图1所示,本实施方式所涉及的数控程序转换装置1具备:图像获取部2,其拍摄手写字符、印刷的文本或通过传真发送来的文本以获取图像;OCR处理部3,其从由该图像获取部2获取的图像中识别字符串;存储部4,其存储数值类型格式(第一存储部)、代码类型格式(第二存储部)和数值字母转换列表(第三存储部);以及字符串划分部5,其基于存储于该存储部4中的格式和列表来转换由OCR处理部3识别出的字符串。
如图2所示,在数值类型格式中,一个字符的字母与紧接在每个字母后面的数字的位数对应地存储有多组。
如图3所示,在代码类型格式中,由一个字符的字母和两个字符的数字的组合组成的程序代码、与由紧接在其后面的一个字符的字母组成的一个以上的有效字符对应地存储。
如图4所示,在数值字母转换列表中,数字和与该数字容易混淆的字母对应地存储。
字符串划分部5针对由OCR处理部3从图像中获取的字符串的每一行,从行首开始,搜索存储于数值类型格式中的任一字母,并从数值类型格式中读取发现的字母后面的数字的位数。
然后,搜索代码类型格式内是否存在读取到的字母和紧接在其后面的预定位数的数字,若存在,则将该字母和数字的组合划分为程序代码。与此同时,判定程序代码后面的字符是否为对应地存储于代码类型格式中的有效字符。若为任一有效字符,则判定紧接在其后面的数字为对应地存储于数值类型格式中的位数的数字,并划分为由有效字符和数字组成的程序代码,对其之后的字符也进行相同的处理。
这样,通过将由OCR处理部3转换后的所有字符串划分为多个程序代码的集合,能够生成数控程序,该数控程序能够输入到数控控制器中,使机床等机械运行。
下面对这种构成的本实施方式所涉及的数控程序转换装置1的作用进行说明。
为了使用本实施方式所涉及的数控程序转换装置1,从印刷在纸上的文本生成数控程序,如图5所示,由图像获取部2获取文本的图像(步骤S1),并由OCR处理部3识别图像而生成字符串(步骤S2)。
接着,通过在隔着所生成的字符串的位置上附加表示数控程序的开始和结束的字符,例如“%”,从而更改为数控程序格式(步骤S3)。
在该状态下,从“%”之后的识别出的字符串继续生成作为数控程序发挥功能的程序代码。
即,字符串划分部5首先判定第一行字符串的第一个字符是否为字母(步骤S4),若为字母,则参照存储于存储部4中的数值类型格式(步骤S5),从字母后续的字符串中提取与该字母对应地存储的位数的数字(步骤S6),并划分为程序代码(步骤S7)。
例如,在获取到图6a所示的手写的文本的图像的情况下,由OCR处理部3识别出图6b所示的字符串时,判定第一个字符“G”是否为字母(步骤S4),由于是字母,因此参照数值类型格式(步骤S5),读取“G”后续的数字的位数“2”(步骤S6),识别出图6b的字符串中“G”后面的两个字符“43”为数字,划分程序代码“G43”(步骤S7)。
接着,判定是否存在后续的字符(步骤S8),若存在,则重复从步骤S4开始的步骤。
在上述示例中,由于存在“G43”后续的字符串“250.H01”,因此重复从步骤S4开始的步骤。
此时,在步骤S4中,判定第一个字符“2”不是字母。由于数控程序中不存在仅由数字或符号组成的程序代码,因此进入步骤S9,判定该字符“2”是否为数字。
由于“2”是数字,因此参照存储于存储部4中的数值字母转换列表(步骤S10),读取与“2”对应地存储的作为候选的“Z”(步骤S11)。
接着,参照存储于存储部4中的代码类型格式(步骤S12),判定在步骤S11中读取的“Z”是否合适(步骤S13)。关于是否合适,通过其是否为与代码类型格式内的程序代码对应地存储的有效字符进行判定。
在上述示例中,由于字母“Z”是程序代码“G43”中的有效字符,因而判定其合适,并将数字“2”置换为字母“Z”(步骤S14)。然后,再次参照数值类型格式(步骤S5),读取置换后的“Z”后面的数字的位数(步骤S6)。由于小数点后三位数或四位数的数值类型与“Z”对应,因此从“Z”的后续数字中读取隔着小数点“.(period)”的三位或四位的数字,但小数点后的“0(零)”可以省略。
在上述示例中,由于“.”的后续的字符为“H”,因而判定其所有的“0”均被省略,读取“50.”作为“Z”的后续的数字。即,将“Z50.”划分为程序代码(步骤S7)。
在步骤S4中判定第一个字符不是字母,且在步骤S9中判定也不是符号的情况下,例如,在第一个字符为“0”的情况下,由于在数值字母转换列表中对应地存储有多个候选,因此在步骤S13中,从候选1开始判定合适与否,若判定不合适,则判定是否存在其他候选(步骤S15);若存在其他候选,则重复从步骤S10开始的步骤。
在上述示例中,若第一行末尾的“H01”被划分为程序代码,则由于该行中不存在后续字符(步骤S8),因此判定是否存在后续行(步骤S16),若存在后续行,则重复从步骤S4开始的步骤。
即,在上述示例中,将第二行的“51000”置换为程序代码“S1000”,将第三行的“2-10.”置换为“Z-10.”,将第四行的“150.”置换为“I([ai])50.”,将第五行的“G2820”置换为“G28Z0”。
然后,当对所有行的字符串的程序代码的划分结束时,结束处理。
此外,若在步骤S9中判定第一个字符不是字符,以及在步骤S13中未找到合适的候选,且在步骤S15中没有其他候选,则将该字符更改为注释语句(步骤S17)。将字符更改为注释语句通过用“()(括号)”将该字符括起来进行。并且,将字符更改为注释语句之后,重复从步骤S8开始的步骤。
例如,图7a所示的图像通过OCR处理,被识别为图7b所示的字符串时,由于第一行末尾和第二行末尾的“.”在步骤S4中被判定为非字母,且在步骤S9中被判定为也非字符,因此通过在步骤S17中由()括住,从而成为图7c所示的注释语句。
在图6c和图7c中,用空格将程序代码的区划部分间隔开,以使其清楚,但实际上空格是不需要的。此外,在图6c中,存储于数值字母转换列表中的数字和容易混淆的字母用粗体字符表示。
这样,根据本实施方式所涉及的数控程序转换装置1,能够从识别手写或印刷物的图像而获得的字符串生成数控程序,该数控程序能够在数控控制器中发挥功能。即,通过仅仅转换为最有可能的字符,有时会转换为不作为数控程序发挥功能的字符串,或者甚至连原本不需要的字符或符号也直接转换了,但根据本实施方式所涉及的数控程序转换装置1,具有以下优点:能够生成可执行的数控程序,并能够使数控程序执行以调查数控程序是否存在错误。
尤其对于原本不需要的字符,通过以不对其作为数控程序发挥功能带来障碍的注释语句的形式留存在记录中,从而能够不遗漏原有的错误而生成数控程序。
此外,尤其在机床中不同机床的数控程序格式不同的情况较多,由于调查发生数控程序错误的相应机床需要熟知相应机床,因此并不容易,有时会委托机床制造商进行故障调查。在这种情况下,从防止信息泄露的角度出发,往往限制作为电子信息的数据输出,有时也会将数控程序通过印刷物或手写记录在纸介质上而委托给机床制造商。
根据本实施方式所涉及的数控程序转换装置1,不是仅将由纸介质等提供的数控程序转换为电子信息,而且能够生成作为可执行的数控程序发挥功能的程序代码。从而具有能够在机械制造商迅速执行错误调查的优点。
另外,在本实施方式中,例如,当表示程序编号的字母被识别为第一个字符时,能够判定紧接在该字母“O”后面的四位字符为“数字”,例如,当从图像识别出的字符串为“Oooo1”时。可以从数值字母转换列表中将“o(小写字母的o)”置换为“0(零)”来生成程序代码“O0001”。
此外,同样地,如果字母“O”被识别为第一个字符,且其后面的字符串不是四位数字,例如是“1”,则可以在“O”与“1”之间补充三个“0(零)”来生成程序代码“O0001”。
此外,G代码等一些程序代码因为作为刚才的模态指令发挥功能,因此即便在同一行中不存在G代码,识别出的第一个字符是以G代码等为前提的有效字符串,也可以作为其之前的行的G代码的有效字符生成程序代码。

Claims (5)

1.一种数控程序转换装置,其特征在于,具备:
OCR处理部,其从输入的图像中识别字符串;
第一存储部,其将一个字符的字母与紧接在每个字母后面的数字的位数对应地存储;
第二存储部,其将由一个字符的字母和两个字符的数字的组合组成的程序代码与由紧接在该程序代码后面的一个字符的字母组成的有效字符对应地存储;以及
字符串划分部,其参照所述第一存储部和所述第二存储部,将由所述OCR处理部识别出的所述字符串的每一行划分为,由一个字符的字母和对应地存储于所述第一存储部中的位数的数字组成的程序代码。
2.根据权利要求1所述的数控程序转换装置,其特征在于,具备:
第三存储部,所述第三存储部将数字和与该数字容易混淆的字母对应地存储,
当由所述OCR处理部识别出的所述字符串中的每个划分的第一个字符为数字时,所述字符串划分部将该数字置换为对应地存储于所述第三存储部中的任一字母。
3.根据权利要求1或2所述的数控程序转换装置,其特征在于,
当由所述OCR处理部识别出的所述字符串中的第一个字符为存储于所述第一存储部中的任一字母时,所述字符串划分部将紧接在该字母后面的字符串置换为对应地存储于所述第一存储部中的位数的数字。
4.根据权利要求3所述的数控程序转换装置,其特征在于,
当由所述OCR处理部识别出的所述字符串中的第一个字符为“O”,且紧接在该字符后面的数字少于四位时,所述字符串划分部在第一个字符与数字之间添加零,以置换为四位的数字。
5.根据权利要求1~4中任一项所述的数控程序转换装置,其特征在于,
所述字符串划分部将由所述OCR处理部识别出的所述字符串中的不符合任何程序代码的字符转换为注释语句。
CN201810568611.4A 2017-07-03 2018-06-05 数控程序转换装置 Active CN109214381B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-130355 2017-07-03
JP2017130355A JP6480985B2 (ja) 2017-07-03 2017-07-03 Ncプログラム変換装置

Publications (2)

Publication Number Publication Date
CN109214381A true CN109214381A (zh) 2019-01-15
CN109214381B CN109214381B (zh) 2020-01-10

Family

ID=64738818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810568611.4A Active CN109214381B (zh) 2017-07-03 2018-06-05 数控程序转换装置

Country Status (4)

Country Link
US (1) US10410080B2 (zh)
JP (1) JP6480985B2 (zh)
CN (1) CN109214381B (zh)
DE (1) DE102018115158A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254027A (zh) * 2021-05-20 2021-08-13 西安华讯科技有限责任公司 一种半导体设备控制程序转换方法、系统、设备和存储介质
CN114365048A (zh) * 2019-09-12 2022-04-15 三菱电机株式会社 数控装置
CN113254027B (zh) * 2021-05-20 2024-05-14 西安华讯科技有限责任公司 一种半导体设备控制程序转换方法、系统、设备和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408313B2 (ja) * 2019-08-13 2024-01-05 キヤノン株式会社 画像処理装置、その制御方法及びプログラム
CN112987653B (zh) * 2019-12-17 2022-04-15 深圳市恒控科技有限公司 一种将中文程序转化为g代码的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2369773A1 (en) * 2001-02-02 2002-08-02 Siemens Dematic Ag Method and apparatus for reading dispatch addresses with postcodes
CN103902993A (zh) * 2012-12-28 2014-07-02 佳能株式会社 文档图像识别方法和设备
CN105431866A (zh) * 2013-07-16 2016-03-23 株式会社汤山制作所 光学字符识别装置
JP2017016549A (ja) * 2015-07-06 2017-01-19 株式会社日立システムズ 文字認識装置、文字認識方法、及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55115175A (en) * 1979-02-26 1980-09-04 Toshiba Corp Character reader
JPH0535323A (ja) 1991-07-26 1993-02-12 Mori Seiki Co Ltd Nc装置
JPH06114678A (ja) 1992-09-30 1994-04-26 Toyoda Mach Works Ltd Nc装置の工具軌跡表示装置
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
JPH09251515A (ja) * 1996-03-15 1997-09-22 Mitsubishi Heavy Ind Ltd 高圧容器の容器番号読取装置及び読取り方法
JP2000163111A (ja) 1998-11-26 2000-06-16 Amada Co Ltd 板取り図形編集方法及び図形編集機能付きcnc装置並びに板取り図形編集方法のプログラムを記憶した記憶媒体
JP2003108918A (ja) 2001-09-29 2003-04-11 Toshiba Corp 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法
JP2006058930A (ja) 2004-08-17 2006-03-02 Toshiba Corp Ncプログラムチェック装置およびncプログラムチェック装置の制御方法およびncプログラムのチェックプログラム
JP2011018108A (ja) 2009-07-07 2011-01-27 Toshiba Corp 認識文字列補正装置および認識文字列補正用プログラム
JP5647919B2 (ja) * 2011-03-07 2015-01-07 株式会社Nttドコモ 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
JP6524800B2 (ja) * 2015-05-28 2019-06-05 株式会社デンソーウェーブ 情報読取装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2369773A1 (en) * 2001-02-02 2002-08-02 Siemens Dematic Ag Method and apparatus for reading dispatch addresses with postcodes
CN103902993A (zh) * 2012-12-28 2014-07-02 佳能株式会社 文档图像识别方法和设备
CN105431866A (zh) * 2013-07-16 2016-03-23 株式会社汤山制作所 光学字符识别装置
JP2017016549A (ja) * 2015-07-06 2017-01-19 株式会社日立システムズ 文字認識装置、文字認識方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114365048A (zh) * 2019-09-12 2022-04-15 三菱电机株式会社 数控装置
CN114365048B (zh) * 2019-09-12 2022-12-02 三菱电机株式会社 数控装置
CN113254027A (zh) * 2021-05-20 2021-08-13 西安华讯科技有限责任公司 一种半导体设备控制程序转换方法、系统、设备和存储介质
CN113254027B (zh) * 2021-05-20 2024-05-14 西安华讯科技有限责任公司 一种半导体设备控制程序转换方法、系统、设备和存储介质

Also Published As

Publication number Publication date
JP2019016001A (ja) 2019-01-31
US20190005345A1 (en) 2019-01-03
JP6480985B2 (ja) 2019-03-13
US10410080B2 (en) 2019-09-10
DE102018115158A1 (de) 2019-01-17
CN109214381B (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
Wilkinson et al. Semantic and verbatim word spotting using deep neural networks
US6721451B1 (en) Apparatus and method for reading a document image
US4058795A (en) Method and apparatus for context-aided recognition
Van der Loo The stringdist package for approximate string matching.
US4991094A (en) Method for language-independent text tokenization using a character categorization
US7092567B2 (en) Post-processing system and method for correcting machine recognized text
CN109214381A (zh) 数控程序转换装置
CN102402576A (zh) 信息处理设备、信息处理方法及计算机程序产品
US10699112B1 (en) Identification of key segments in document images
US11663408B1 (en) OCR error correction
CN107153469B (zh) 为输入数据搜索匹配候选项的方法、数据库创建方法、装置及计算机程序产品
US7406201B2 (en) Correcting segmentation errors in OCR
JP5056337B2 (ja) 情報検索システム
CN111339910B (zh) 文本的处理、文本分类模型的训练方法及装置
Clausner et al. The significance of reading order in document recognition and its evaluation
JP2007048272A (ja) 文字列検索装置およびプログラム
CN110019829A (zh) 数据属性确定方法、装置
JPH0133866B2 (zh)
WO2022026908A1 (en) Systems and methods for machine learning key-value extraction on documents
EP0638187B1 (en) Categorizing strings in character recognition
Reynaert Parallel identification of the spelling variants in corpora
CN116150442B (zh) 一种基于tcam的网络数据检测方法和设备
KR101276203B1 (ko) 매개 인터페이스 장치를 이용한 한/영 타이프라이터 시스템 및 문자열 입력 방법
JP2921119B2 (ja) 数値検索装置および数値検索方法
Lazic Using Natural Language Processing to extract information from receipt text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant