CN112084947A - 光学字符识别结果的处理方法、电路、设备及存储介质 - Google Patents
光学字符识别结果的处理方法、电路、设备及存储介质 Download PDFInfo
- Publication number
- CN112084947A CN112084947A CN202010942909.4A CN202010942909A CN112084947A CN 112084947 A CN112084947 A CN 112084947A CN 202010942909 A CN202010942909 A CN 202010942909A CN 112084947 A CN112084947 A CN 112084947A
- Authority
- CN
- China
- Prior art keywords
- word
- corrected
- confidence
- letters
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000012015 optical character recognition Methods 0.000 title claims abstract description 65
- 238000012937 correction Methods 0.000 claims abstract description 77
- 230000004044 response Effects 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 9
- 206010047571 Visual impairment Diseases 0.000 claims description 2
- 208000029257 vision disease Diseases 0.000 claims description 2
- 230000004393 visual impairment Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000003936 working memory Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/23—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on positionally close patterns or neighbourhood relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
提供一种光学字符识别结果的处理方法、电路、设备及存储介质。所述方法包括:获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度;确定所识别出的单词中的待纠错单词;根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置;以及根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
Description
技术领域
本公开涉及图像识别技术领域,特别涉及一种光学字符识别结果的处理方法、电路、设备及存储介质。
背景技术
相关技术中,在使用OCR(Optical Character Recognition,光学字符识别)技术识别图像时,因为拍照时的角度与光线等原因,图像的成像质量可能会受到影响,从而可能会出现个别单词中部分字母识别出错的情况。这样会导致后续通过TTS(Text To Speech,文本转语音)等操作进行单词播报时出现拼读、错读的情况。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一个方面,提供一种光学字符识别结果的处理方法,包括:获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度;确定所识别出的单词中的待纠错单词;根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置;以及根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
根据本公开的另一个方面,提供一种电子电路,包括:被配置为执行本公开中所述的方法的步骤的电路。
根据本公开的另一个方面,提供一种视障辅助设备,包括:摄像机,被配置为获取图像;以及本公开中所述的电子电路。
根据本公开的另一个方面,提供一种电子设备,包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行本公开中所述的方法。
根据本公开的另一个方面,提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行本公开中所述的方法。
从下面结合附图描述的示例性实施例中,本公开的更多特征和优点将变得清晰。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1是示出根据示例性实施例的光学字符识别结果的处理方法的流程图;
图2是示出根据示例性实施例的待纠错单词及其所包含的字母的置信度的示意图;
图3是示出根据示例性实施例的光学字符识别结果的处理方法的整体流程图;
图4是示出根据示例性实施例的电子设备的示例的框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
相关技术中,在使用OCR(Optical Character Recognition,光学字符识别)技术识别图像时,因为拍照时的角度与光线等原因,图像的成像质量可能会受到影响,从而可能会出现个别单词中部分字母识别出错的情况。这样会导致后续通过TTS(Text To Speech,文本转语音)操作进行单词播报时,出现拼读、错读的情况。
随着算法的升级,OCR识别率会不断提升,但不能保证识别出的单词一定是完全正确无误的。特别是在OCR识别率达到了较高水准(例如90%以上)、往上的算法提升空间逐渐缩小且成本会不断上升的情况下,有必要增加其它的提升识别率的方式。
本公开提供了一种光学字符识别结果的处理方法,针对对图像进行光学字符识别所得到的识别结果,可基于所识别出的单词中的字母的置信度,确定所识别出的单词中的待纠错单词的待纠错位置,并基于所述待纠错位置进行纠错查询以得到与所述待纠错单词相对应的替换用单词。由此,可在不增加OCR算法难度与成本的基础上,对OCR识别结果进行相应纠正,从而能够以更为简单便捷的方式提升OCR识别率。以下将结合附图对本公开的光学字符识别结果的处理方法的示例性实施例进行进一步描述。
图1是示出根据本公开的示例性实施例的光学字符识别结果的处理方法的流程图。如图1所示,该处理方法例如可以包括以下步骤:获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度(步骤S101);确定所识别出的单词中的待纠错单词(步骤S102);根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置(步骤S103);以及根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词(步骤S104)。
根据图1的流程图所示的处理方法,可基于所识别出的单词中的字母的置信度,确定所识别出的单词中的待纠错单词的待纠错位置,并基于所述待纠错位置进行纠错查询以得到与所述待纠错单词相对应的替换用单词。由此,可在不增加OCR算法难度与成本的基础上,对OCR识别结果进行相应纠正,从而能够以更为简单便捷的方式提升OCR识别率。
在本公开中,光学字符识别即OCR所针对的图像可以是通过图像传感器(例如可以为摄像头、照相机等)获取的电子图像。所述电子图像可以是彩色图像或灰度图像。所述电子图像还可以是静态图像或视频图像。根据一些实施例,图像传感器可以被包括在用户手持的电子设备(例如阅读辅助设备、移动电话、平板计算机、个人数字助理、可穿戴电子设备等)中。所述图像传感器或者包括所述图像传感器的电子设备可以设置于用户的可穿戴设备或眼镜等物品上,从而所述图像可以是由该图像传感器获取的、包含由用户握持的读物(例如书籍或杂志等)的场景的图像。另外,所述图像可以在被图像传感器获取之后存储(例如缓存)在存储设备或存储介质中,并被读出以供后续处理。
另外,本领域技术人员可以理解,相关技术中的OCR技术可以从图像中识别提取出单词,并在提供识别出的单词之外还提供所识别出的单词中的各字符(包括字母)的置信度。这里,单词中的字符(包括字母)的置信度可以理解为OCR操作后,对其识别结果给出的一个可信度的值。置信度的范围一般在0~1(0%~100%)之间,值越接近0则表示相应的识别结果的可信度越低,反之,值越接近1则表示相应的识别结果的可信度越高。作为示例,所识别出的单词和所识别出的单词中的字符的置信度可以相应的单词数组(其中的元素为单词中的各字符)和置信度数组(其中的元素为单词中的各字符的置信度)的形式表示。
此外,还可以理解的是,本公开的处理方法可适用于OCR所识别出的英文、法文、德文等各种字母文字语言下的单词,前提是OCR操作可以识别相应的单词并为每个识别出的单词中的字母赋予一个置信度。
为了更好地理解本公开所述的技术方案,下面将结合附图对本公开所述的各步骤S101至S104进行详细说明。
根据一些实施例,为了提高OCR识别结果的处理效率,在步骤S101中,在获取到对图像进行光学字符识别所得到的识别结果之后,可以对获取到的识别结果进行预处理,以去除识别结果中的包含符号和/或数字等非字母字符的单词。换言之,本公开所述的处理主要可针对识别结果中的由字母所组成的单词,对于其它包含符号和/或数字等的不规范的单词可以默认为无需进行相应的纠错判断处理。
根据一些实施例,在步骤S102中,确定所识别出的单词中的待纠错单词,可包括:针对所识别出的单词中的待处理单词(所述待处理单词可为所识别出的单词中的任一或多个尚未执行本公开所述的纠错判断与处理操作的单词),响应于确定无法在单词数据库中查询得到所述待处理单词,将所述待处理单词作为所述待纠错单词。
换言之,在本公开中,可搭建一用于存储单词的单词数据库,然后通过在所述单词数据库中进行搜索查询的方式,简单便捷地确定所识别出的单词中的待处理单词是否为需要进行纠错处理的单词。
可以理解的是,所述单词数据库中的各单词可带有相应的标签(例如使用频率等),其中所述标签可通过对单词在书本、杂志、报纸等各种素材中的出现频率进行大数据分析而获得。另外,所述单词数据库可搭建于一个或多个服务器(例如云服务器)内,以供后续各设备访问使用。所述单词数据库中的单词及其标签还可定时(例如每隔一天,一周或一月等)更新,以提高OCR识别结果处理的准确性。
根据另一些实施例,在步骤S102中,确定所识别出的单词中的待纠错单词,可包括:针对所识别出的单词中的待处理单词,响应于确定无法在单词数据库中查询得到所述待处理单词且确定所述待处理单词不满足以下条件,将所述待处理单词作为所述待纠错单词:
所述待处理单词中的各字母的置信度均不小于第一置信度阈值(或者也可认为,所述待处理单词中的字母的最低置信度不小于第一置信度阈值);或者,所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值,且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值,其中,所述第二置信度阈值不大于所述第一置信度阈值。
换言之,除了考虑待处理单词是否可从单词数据库中查询得到之外,还可结合考虑待处理单词中的各字母的置信度来确定待处理单词是否为需要进行纠错处理的单词。这是因为,所搭建的单词数据库中的词汇量是有限的,未能在单词数据库中查询到的单词,未必就不是正确的单词,所以可通过增加一个基于字母置信度的判断条件,来进一步过滤掉较高概率无需进行纠错处理的单词,从而提高后续纠错处理的效率。
例如,对于一待处理单词,虽确定无法在单词数据库中查询得到所述待处理单词但若确定所述待处理单词中的每个字母的置信度均较高(例如均不小于第一置信度阈值),则可以认为该待处理单词为一无需进行纠错处理的单词。再例如,对于一待处理单词,虽确定无法在单词数据库中查询得到所述待处理单词,但若确定所述待处理单词中的除了具备最低置信度的字母之外的其它字母的置信度均较高(例如均不小于第二置信度阈值)且字母的最低置信度并未太低(例如虽小于第二置信度阈值但不小于第三置信度阈值),仍可以认为该待处理单词为一无需进行纠错处理的单词。
根据一些实施例,所述第一置信度阈值、所述第二置信度阈值和所述第三置信度阈值可以是通过对大量的OCR识别结果进行分析所得到的。
根据一些实施例,所述第一置信度阈值可为一接近于字母置信度上限值(即,“1”)的数值。例如,所述第一置信度阈值可为与所述字母置信度上限值之间的差值绝对值不超过所述字母置信度上限值的5%的数值,例如,可为0.95,0.96,0.97或0.98等。所述第二置信度阈值可为等于或稍小于所述第一置信度阈值的数值。例如,所述第二置信度阈值可为0.93或0.94,或者可为0.95,0.96,0.97或0.98等。所述第三置信度阈值可为小于字母置信度中间值(即“0.5”)的数值,例如可为0.35~0.45范围内的数值,或可为等于或稍大于字母置信度中间值的数值,例如,可为0.50~0.65范围内的数值等。
另外,可以理解的是,以上各阈值的取值仅为示例,根据实际的处理精度要求和/或速率需求,第一、第二和第三置信度阈值还可设置为其它数值,只要能够使得第三置信度阈值小于第二置信度阈值且第二置信度阈值不大于第一置信度阈值即可。
根据一些实施例,上述确定所述待处理单词是否满足所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值、且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值的条件可以是响应于确定所述待处理单词中的字母的数量不小于数量阈值而执行的。
换言之,以上基于字母置信度进行二次判断以确定待纠错单词的方案,特别是基于字母置信度和两个置信度阈值(例如上述第二置信度阈值和第三置信度阈值)进行二次判断的方案比较适用于待处理单词中的字母的数量较多(例如不小于数量阈值)的场景。若待处理单词中的字母的数量较少,可不再基于字母置信度进行二次判断。
根据一些实施例,所述数量阈值可通过对单词数据库中的各单词的字母数量进行统计分析而获得。另外,所述数量阈值的取值大小还可与单词是否为全大写单词有关。根据一些实施例,全大写单词所对应的数量阈值可小于非全大写单词所对应的数量阈值。例如,非全大写单词对应的数量阈值可为5~7范围内的数值,而全大写单词对应的数量阈值可为3或4等。
根据一些实施例,在步骤S103中,针对所确定出的待纠错单词,根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置,包括:按照所述待纠错单词中的各字母的置信度从低到高的顺序,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母;以及将所选取的所述至少一个字母在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
由此,通过引入单词中的单个字母的置信度,并基于单词中的各字母的置信度的高低排列顺序,优先处理单词中的置信度低的字母,可达到减少纠错处理的时间从而提升纠错处理的效率的效果。
根据一些实施例,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母,可包括:从所述待纠错单词中选取对应的置信度最低的字母。这样,可更为简单高效地确定待纠错单词的待纠错位置,从而可提高纠错处理的效率。可以理解的是,该处理方式比较适用于待纠错单词中仅存在单个字母识别出错(因而置信度较低)的场景。例如,如图2所示,假设待纠错单词为“Examplc”(对应的正确单词为“Example”),且该待纠错单词中的各字母E,x,a,m,p,l,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.94和0.57,则可以直接选取置信度最低的字母c并将该置信度最低的字母c在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
根据另一些实施例,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母,可包括:响应于确定所述待纠错单词满足以下条件中的至少一个,从所述待纠错单词中选取对应的置信度排序靠前的至少两个字母:
所述待纠错单词中的字母的最低置信度小于第四置信度阈值;所述待纠错单词中存在多个对应的置信度小于第五置信度阈值的字母,所述第五置信度阈值大于所述第四置信度阈值;以及所述待纠错单词中的字母的数量不小于数量阈值。
换言之,若待纠错单词中的字母的最低置信度极低(从而极大概率导致该单词中存在多个识别错误的字母),或多个字母的置信度均较低,或具备足够多个字母,可一次性选取多个置信度较低的字母来确定所述待纠错单词的待纠错位置。由此,可降低将单个字母所在位置作为待纠错位置所带来的查询次数增加的风险,从而可进一步提高纠错处理的效率。另外,由于将多个置信度较低的字母所在的位置一并确定为待纠错位置,因而还可进一步提高所确定出的待纠错位置的准确度,从而提高纠错处理的准确性。
根据一些实施例,所述第四置信度阈值和所述第五置信度阈值也可以是通过对大量的OCR识别结果进行分析所得到的。另外,所述第四置信度阈值和所述第五置信度阈值可小于前述提及的第一置信度阈值和第二置信度阈值。
示例的,所述第四置信度阈值可为小于字母置信度中间值的数值,例如可为0.35~0.45范围内的数值。所述第五置信度阈值可为等于或稍大于所述字母置信度中间值的数值,例如,可为0.50~0.65范围内的数值。当然,可以理解的是,以上各阈值的取值仅为示例,根据实际需求,所述第四置信度阈值和所述第五置信度阈值还可设置为其它数值。
另外,如前文所述,所述数量阈值可通过对单词数据库中的各单词的字母数量进行统计分析而获得。另外,所述数量阈值的取值大小还可与单词是否为全大写单词有关。根据一些实施例,全大写单词所对应的数量阈值可小于非全大写单词所对应的数量阈值。例如,非全大写单词对应的数量阈值可为5~7范围内的数值,而全大写单词对应的数量阈值可为3或4等。
示例的,以所述第五置信度阈值为0.65,所述数量阈值为6为例,假设待纠错单词为“Exumplc”(对应的正确单词为“Example”),且该待纠错单词中的各字母E,x,u,m,p,l,c的置信度分别为0.99,0.96,0.64,0.88,0.89,0.94和0.57,由于其可以满足前述提及的所述待纠错单词中存在多个(例如2个)对应的置信度小于第五置信度阈值的字母和/或所述待纠错单词中的字母的数量不小于数量阈值的条件,因而可以根据字母的置信度从低到高的排列顺序,选取置信度排序靠前的两个字母c和u,并将该两个字母c和u在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
根据一些实施例,在步骤S104中,根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词,可包括:根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串;以及基于所述查询字符串,在单词数据库中查询与所述查询字符串相匹配的单词以得到与所述待纠错单词相对应的替换用单词。
换言之,可通过基于待纠错位置构造相应的查询字符串并基于构造的查询字符串在单词数据库中进行查询来确定与所述待纠错单词相对应的替换用单词,由此,可简单便捷地对OCR识别结果进行相应纠正,从而能够在不增加OCR算法难度与成本的基础上进一步提升OCR识别率。
可以理解的是,所确定出的与所述待纠错单词相对应的查询字符串可包括所述待纠错单词中的除了所述待纠错位置处的字母之外的各其它字母。
另外,虽然本公开实施例以根据待纠错位置构造查询字符串并基于构造的查询字符串进行纠错查询为例对相应的纠错查询操作进行说明,在本公开中,根据所述待纠错位置进行纠错查询的操作还可以采用其它无需构造相应的查询字符串的方式执行,例如,还可采用编程方式替代执行。
根据一些实施例,根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串,可包括:将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,得到与所述待纠错单词相对应的查询字符串。
根据一些实施例,所述模糊查询符号包括下划线(“_”)和/或百分号(“%”)等用于实现模糊查询的SQL(Structured Query Language,结构化查询语言)符号。所述下划线的作用是用于进行单个字母的匹配,即,相对于被匹配单词,所匹配到的单词中的字母,除了下划线所对应的部分,其它部分的字母与被匹配单词中的相应部分的字母相一致且所匹配到的单词中的下划线所对应的部分的字母不为空。所述百分号的作用是用于进行0个或至少一个字母的匹配,即,相对于被匹配单词,所匹配到的单词中的字母,除了百分号对应的部分,其它部分的字母与被匹配单词中的相应部分的字母相一致且所匹配到的单词中的百分号所对应的部分可以是0个字母,也可以是一个或多个字母。需要注意的是,不同的模糊查询符号可对应不同的查询范围和查询时间,例如,百分号的查询范围比下划线的查询范围广,但耗时长(例如,一下划线所需的查询时间可为300ms左右,一百分号所需的查询时间可为300ms~800ms左右),因而可根据实际的查询范围需求(即查询精度需求)和/或速率需求,从下划线和百分号等模糊查询符号中选择合适的模糊查询符号以进行相应字母的替换。
示例的,以前述提及的待纠错单词为“Examplc”,且该待纠错单词中的各字母E,x,a,m,p,l,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.94和0.57为例,由于可直接将置信度最低的字母c在该待纠错单词中的位置作为该待纠错单词的待纠错位置,因而可通过将该待纠错位置处的字母(即字母c)替换为模糊查询符号例如“%”或“_”等的方式,得到与该待纠错单词相对应的查询字符串“Exampl%”或“Exampl_”等。
再例如,以前述提及的待纠错单词为“Exumplc”,且该待纠错单词中的各字母E,x,u,m,p,l,c的置信度分别为0.99,0.96,0.64,0.88,0.89,0.94和0.57为例,由于可以根据字母的置信度从低到高的排列顺序,将置信度排序靠前的两个字母c和u在该待纠错单词中的位置作为该待纠错单词的待纠错位置,因而可通过将该待纠错位置处的字母(即字母c和u)替换为相应的模糊查询符号“%”或“_”等的方式,得到对应的查询字符串“Ex%mpl%”,“Ex_mpl_”,“Ex_mpl%”或“Ex%mpl_”等。这样,相对于将单个字母所在位置作为待纠错位置从而一次替换一个字母的处理方式,可较大程度地降低查询次数增加的风险,从而可进一步提高纠错处理的效率。另外,由于待纠错单词中的多个置信度较低的字母得到了替换,因而还可进一步提高所得到的查询字符串的可信度,从而提高纠错处理的准确性。
根据一些实施例,将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,可包括:使用相同或不同的模糊查询符号对所述待纠错位置处的字母中的不同字母进行分别替换。例如,如前文所述,对所述待纠错单词“Exumplc”中的置信度排序靠前的两个字母c和u进行替换时,可使用相同的模糊查询符号进行替换以得到相应的查询字符串“Ex%mpl%”或“Ex_mpl_”,或者,还可使用不同的模糊查询符号进行替换以得到相应的查询字符串“Ex_mpl%”或“Ex%mpl_”。由此,可提高所确定的查询字符串的多样性和灵活性,提高纠错处理的灵活性和可适用性。
根据一些实施例,将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,可包括:响应于确定所述待纠错单词中的所述待纠错位置处的字母包括所述待纠错单词中的多个相邻字母,使用一能够模糊匹配多个字母的模糊查询符号对所述多个相邻字母进行替换处理。由此,可减少所使用的模糊查询符号的数量,提高纠错处理的效率。另外,对于所述待纠错单词中的所述待纠错位置处的其它字母(如有),可使用与前述针对所述多个相邻字母所使用的模糊查询符号相同或不同的模糊查询符号进行替换处理。
示例的,假设待纠错单词为“Examprc”(对应的正确单词为“Example”),且该待纠错单词中的各字母E,x,a,m,p,r,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.60和0.57,则在根据字母的置信度从低到高的排列顺序,确定置信度排序靠前的两个字母c和r所在位置为待纠错位置时,由于可确定该待纠错位置处的两个字母c和r为所述待纠错单词中的两个相邻字母,因而,可使用能够模糊匹配多个字母的一模糊查询符号(例如“%”)对所述两个相邻字母进行替换处理,得到对应的查询字符串“Examp%”。这样,可减少所使用的模糊查询符号的数量,提高纠错处理的效率。当然,作为替换实施例,对于所述待纠错单词中的所述多个相邻字母,也可以使用多个相同或不同的模糊查询符号进行替换。例如,对于前述提及的待纠错单词“Examprc”,也可使用两个模糊查询符号“_”对所述两个相邻字母进行替换处理,得到对应的查询字符串“Examp__”。
根据另一些实施例,根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串,可包括:根据统计出的原始字母与误识别字母之间的对应关系,将所述待纠错单词中的所述待纠错位置处的字母作为误识别字母替换为对应的原始字母,得到与所述待纠错单词相对应的查询字符串。
由于待纠错位置处的字母通常为误识别率较高的字母,而OCR操作中字母的误识别具备一定的规律性(例如,通过对大量的OCR识别结果进行统计分析可知,字母a易被误识别为字母u,字母e易被误识别为字母c,字母h易被误识别为字母b,等等),因而通过基于这种规律性(即,原始字母与误识别字母之间的对应关系)将误识别字母替换为对应的原始字母,可提高所得到的查询字符串与真实单词的匹配性,由此可进一步降低查询次数增加的风险,从而可进一步提高纠错处理的效率。
示例的,以前述提及的待纠错单词为“Examplc”,且该待纠错单词中的各字母E,x,a,m,p,l,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.94和0.57为例,由于可直接将置信度最低的字母c在该待纠错单词中的位置作为该待纠错单词的待纠错位置,且根据统计出的原始字母与误识别字母之间的对应关系可知,误识别字母c对应的原始字母可为e,因而可通过将该待纠错位置处的字母(即字母c)替换为字母e的方式,得到与该待纠错单词相对应的查询字符串“Example”。
再例如,以前述提及的待纠错单词为“Exumplc”,且该待纠错单词中的各字母E,x,u,m,p,l,c的置信度分别为0.99,0.96,0.64,0.88,0.89,0.94和0.57为例,由于可以根据字母的置信度从低到高的排列顺序,将置信度排序靠前的两个字母c和u在该待纠错单词中的位置作为该待纠错单词的待纠错位置,且根据统计出的原始字母与误识别字母之间的对应关系可知,误识别字母c和u对应的原始字母可分别为e和a,因而可通过将该待纠错位置处的字母(即字母c和u)分别替换为字母e和a方式,得到对应的查询字符串“Example”。
可以理解的是,虽然上述示例以一个原始字母对应一个误识别字母为例进行了说明,一个原始字母也可以对应多个误识别字母,本公开对此不作限制。
根据一些实施例,本公开所述的处理方法还可包括:响应于确定所述待纠错单词中的字母的数量小于数量阈值,基于模糊查询符号对所述待纠错单词进行补位处理。所述补位处理可包括对所述待纠错单词的首位和/或末位进行补位处理,即,在所述待纠错单词的首位之前和/或末位之后增加一个或多个模糊查询符号。经过补位处理后的待纠错单词的字符数量相对较多(例如可不小于数量阈值),因而可避免使用字符数量较少的查询字符串进行单词的查询与匹配时所造成的匹配范围过宽、难以快速准确地确定所需的替换用单词的问题,从而可进一步提高纠错处理的效率。
如前文所述,所述数量阈值的设置可与单词是否为全大写单词有关。根据一些实施例,对于全大写单词,为其设置的数量阈值可小于为非全大写单词所设置的数量阈值,例如,为非全大写单词设置的数量阈值可为5~7范围内的数值,而为全大写单词设置的数量阈值可为3或4等。
根据一些实施例,本公开所述的处理方法还可包括:响应于确定根据所述待纠错位置无法查询得到与所述待纠错单词相对应的替换用单词,重新确定所述待纠错单词的待纠错位置;以及根据所述重新确定的待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
由于一次纠错查询存在无法查询到与所述待纠错单词相对应的替换用单词的情况,因而可通过重新确定待纠错位置,并基于重新确定的待纠错位置再次执行纠错查询的方式提高查询到与所述待纠错单词相对应的替换用单词的概率,从而提高纠错处理的准确性。
根据一些实施例,重新确定所述待纠错单词的待纠错位置,包括:按照所述待纠错单词中的除了前一待纠错位置处的字母之外的各其它字母的置信度从低到高的顺序,从所述待纠错单词中的除了前一待纠错位置处的字母之外的其它字母中选取对应的置信度排序靠前的至少一个字母;以及将所选取的所述至少一个字母在所述待纠错单词中的位置和所述前一待纠错位置一并作为所述重新确定的待纠错位置。
示例的,假设待纠错单词为“Examprc”(对应的正确单词为“Example”),其中,该待纠错单词中的各字母E,x,a,m,p,r,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.60和0.57,且在第一次纠错查询时,选择了将置信度排序最低的字母c在待纠错单词中的位置作为待纠错单词的待纠错位置,且在基于该待纠错位置进行纠错查询时并没有查询到与该待纠错单词相对应的替换用单词,在此情况下,可通过从该待纠错单词中的除了前一待纠错位置处的字母之外的其它字母(即字母E,x,a,m,p,r)中选取至少一个置信度较低的字母来重新确定待纠错位置。例如,可从字母E,x,a,m,p,r中选取置信度最低的字母r,并将选取的字母r在待纠错单词中的位置和前一待纠错位置(即字母c在待纠错单词中的位置)一并作为所述重新确定的待纠错位置。
可以理解的是,在重新确定所述待纠错单词的待纠错位置之后,可按照前述实施例所述的纠错查询方式,根据所述重新确定的待纠错位置进行纠错查询以得到与所述待纠错单词相对应的替换用单词,对此不再赘述。
另外,在根据所述重新确定的待纠错位置进行纠错查询的过程中,以基于模糊查询符号构造查询字符串进行纠错查询的方式为例,若最终涉及到待纠错单词中的多个相邻字母的替换,也可以根据需要使用能够模糊匹配多个字母的模糊查询符号,以降低所使用的模糊查询符号的数量,提高纠错处理的效率。
示例的,以前述提及的针对待纠错单词“Examprc”(该待纠错单词中的各字母E,x,a,m,p,r,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.60和0.57),在第一次纠错查询时,选择将置信度排序最低的字母c在待纠错单词中的位置作为待纠错位置,在第二次纠错查询时,选择从该待纠错单词中的除了前一待纠错位置处的字母之外的其它字母(即字母E,x,a,m,p,r)中选取置信度最低的字母r,并将选取的字母r在待纠错单词中的位置和前一待纠错位置(即字母c在待纠错单词中的位置)一并作为所述重新确定的待纠错位置为例,由于可确定所重新确定的待纠错位置所对应的两个字母r和c为所述待纠错单词中的两个相邻字母(即,最终可涉及到待纠错单词中的多个相邻字母的替换),因而,后续在基于模糊查询符号构造查询字符串时,可选择使用能够模糊匹配多个字母的一模糊查询符号(例如“%”)对所述两个相邻字母进行替换处理。这样,可减少所使用的模糊查询符号的数量,提高纠错处理的效率。
根据一些实施例,所述重新确定所述待纠错单词的待纠错位置的操作可以是响应于确定针对所述待纠错单词已执行的纠错查询次数未达到查询次数阈值而执行的。换言之,在确定根据待纠错位置无法查询得到与所述待纠错单词相对应的替换用单词之后,可首先确定针对所述待纠错单词已执行的纠错查询次数是否已达到查询次数阈值,若确定已达到所述查询次数阈值,则可无需执行重新确定所述待纠错单词的待纠错位置的操作(即确定不需再对或放弃对所述待纠错单词执行纠错处理,尽管此时所述待纠错单词并未得到纠错)。在本公开中,根据确定的待纠错位置所进行的一整个纠错查询操作(即前述步骤S104所涉及的整个操作)为一次纠错查询(尽管其中可能涉及到多次字母替换查询)。根据一些实施例,所述查询次数阈值可为2或3等。可以理解的是,根据实际的处理精度要求和/或速率需求,所述查询次数阈值还可设置为其它数值。
由此,通过限制针对单个待纠错单词的最大查询次数,可限制单个待纠错单词的最大纠错时间,从而可避免无意义的查询、降低系统资源消耗并可进一步提高纠错处理的效率。
根据一些实施例,所述重新确定所述待纠错单词的待纠错位置的操作可以是响应于确定所述待纠错单词中的除了前一待纠错位置处的字母之外的各其它字母不满足置信度均不小于第六置信度阈值的条件而执行的。换言之,在确定根据待纠错位置无法查询得到与所述待纠错单词相对应的替换用单词之后,可确定所述待纠错单词中的除了前一待纠错位置处的字母之外的其它字母是否满足置信度均不小于第六置信度阈值的条件,若满足该条件,可无需执行重新确定所述待纠错单词的待纠错位置的操作。
示例的,以基于模糊查询符号构造查询字符串进行纠错查询的方式为例,若某次替换处理(例如将置信度最低的字母进行替换)后的待纠错单词中的剩余各字母的置信度都不小于第六置信度阈值(即置信度均较高),即使该次替换处理后未在单词数据库中查询到匹配的单词,仍可将该待纠错单词看作为是正确的单词(不再进行纠错处理),以提高纠错处理的效率。
根据一些实施例,与前述提及的第二置信度阈值类似,所述第六置信度阈值可为等于或稍小于前述提及的第一置信度阈值的数值。例如,所述第六置信度阈值可为0.93或0.94,或者可为0.95,0.96,0.97或0.98等。
根据一些实施例,本公开所述的处理方法还可包括:响应于确定根据所述待纠错位置能够查询得到与所述待纠错单词相对应的替换用单词,根据所述替换用单词对所述待纠错单词进行纠错(即替换)处理。由此,可提高所获得的OCR识别结果的准确率,从而可在不增加OCR算法难度与成本的基础上,以更为简单便捷的方式进一步提升OCR识别率。
根据一些实施例,本公开所述的处理方法还可包括:响应于确定查询到多个与所述待纠错单词相对应的替换用单词,将使用频率最高的单词作为最终使用的替换用单词。由此,可进一步提高纠错处理的准确性。例如,以基于模糊查询符号构造查询字符串进行纠错查询的方式为例,若查询到多个与所述查询字符串相匹配的单词(即查询到多个与所述待纠错单词相对应的替换用单词),则可从中选取使用频率最高的单词作为最终使用的替换用单词。
根据一些实施例,将使用频率最高的单词作为最终使用的替换用单词,包括:确定所查询到的多个与所述待纠错单词相对应的替换用单词中的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词;以及将所确定出的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词中的使用频率最高的单词作为最终使用的替换用单词。
换言之,还可基于待纠错单词的字母数量(即原始字母数量)和单词的使用频率二者来选取替换用单词,且待纠错单词的字母数量的优先级可高于单词的使用频率的优先级,以此进一步提高纠错处理的准确性。
可以理解的是,本公开所述的处理方法还可包括:响应于确定查询到多个与所述待纠错单词相对应的替换用单词(例如,查询到多个与构造的查询字符串相匹配的单词),且确定所查询到的多个单词中仅存在一个所具备的字母数量与所述待纠错单词中的字母数量相一致的单词,则可直接将该确定出的单词作为最终使用的替换用单词。或者,响应于确定查询到多个与所述待纠错单词相对应的替换用单词,且确定所查询到的多个单词中不存在所具备的字母数量与所述待纠错单词中的字母数量相一致的单词,则可将所查询到的多个单词中的使用频率最高的单词作为最终使用的替换用单词,等等。
以上已结合图1和图2对本公开所涉及到的各步骤S101至S104进行了示例性描述。可以理解的是,在本公开中,针对获取到的OCR识别结果中的各识别出的单词,除了可采用串行方式对这些单词执行相应的纠错判断与处理操作之外,还可采用并行方式对这些单词中的至少一部分单词执行相应的纠错判断与处理操作,以提高OCR识别结果的处理效率。
另外,尽管未示出,OCR识别结果可被提供给相应的应用程序进行进一步处理,例如语音播报等,这可以用于例如与有声读物相关的应用以及视障辅助应用中。
此外,可以理解的是,本公开中所述的比较运算符并不限于上述实施例中提到的情形。例如,相较于“不小于(即,大于或等于)”、“不大于(即,小于或等于)”,分别使用“大于”、“小于”并搭配适当的阈值也是可行的且并不超出本公开的范围。
为了更进一步地理解本公开所述的技术方案,下面将结合图3对本公开示例性实施例的光学字符识别结果的处理方法的整体流程进行示例说明。需要注意的是,前文中参照图1和图2描述的各种定义、实施例、实施方式和例子等也均可适用于之后描述的示例性实施例或与其进行组合。如图3所示,本公开的光学字符识别结果的处理方法可包括以下步骤:
步骤S301:获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度。
如前文所述,相关技术中的OCR技术可以从图像中识别提取出单词,并在提供识别出的单词之外还提供所识别出的单词中的各字符(包括字母)的置信度。这里,字符(包括字母)的置信度可以理解为OCR操作后,对其识别结果给出的一个可信度的值。置信度的范围一般在0~1(0%~100%)之间,值越接近0则表示相应的识别结果的可信度越低,反之,值越接近1则表示相应的识别结果的可信度越高。
步骤S302:对所述识别结果进行预处理,以去除所述识别结果中的不规范的单词。
如前文所述,所述不规范的单词是指包含符号和/或数字等非字母字符的单词。
步骤S303:确定所识别出的单词中的待处理单词是否为待纠错单词,若是,则执行步骤S3041,否则,确定不需对所述待处理单词执行纠错处理并执行步骤S3042。
如前文所述,响应于确定无法在单词数据库中查询得到所述待处理单词,可将所述待处理单词作为所述待纠错单词。换言之,可通过在搭建的单词数据库中进行搜索查询的方式,简单便捷地确定所识别出的单词中的待处理单词是否为需要进行纠错处理的单词。
或者,响应于确定无法在所述单词数据库中查询得到所述待处理单词且确定所述待处理单词不满足以下条件,将所述待处理单词作为所述待纠错单词:所述待处理单词中的各字母的置信度均不小于第一置信度阈值(或者也可认为,所述待处理单词中的字母的最低置信度不小于第一置信度阈值);或者,所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值,且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值,其中,所述第二置信度阈值不大于所述第一置信度阈值。
步骤S3041:根据待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置。另外,执行完步骤S3041之后,执行步骤S305。
如前文所述,可按照所述待纠错单词中的各字母的置信度从低到高的顺序,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母,并将所选取的所述至少一个字母在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
示例的,假设待纠错单词为“Examplc”(对应的正确单词为“Example”),且该待纠错单词中的各字母E,x,a,m,p,l,c的置信度分别为0.99,0.96,0.99,0.88,0.89,0.94和0.57,则可以选取置信度最低的字母c并将其在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
再例如,假设待纠错单词为“Exumplc”(对应的正确单词为“Example”),且该待纠错单词中的各字母E,x,u,m,p,l,c的置信度分别为0.99,0.96,0.64,0.88,0.89,0.94和0.57,则可以根据字母的置信度从低到高的排列顺序,选取置信度排序靠前的两个字母c和u,并将该两个字母在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
步骤S3042:判断所识别出的单词中是否存在其它尚未执行纠错判断与处理操作的单词,若是,则从中确定新的待处理单词并基于所述新的待处理单词执行步骤S303,否则,结束本次针对OCR识别结果的纠错判断与处理操作。
步骤S305:根据待纠错位置进行纠错查询。另外,执行完步骤S305之后,执行步骤S306。
如前文所述,根据待纠错位置进行纠错查询可包括:根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串;以及基于所述查询字符串,在单词数据库中查询与所述查询字符串相匹配的单词以得到与所述待纠错单词相对应的替换用单词。
根据一些实施例,根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串可包括:将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,得到与所述待纠错单词相对应的查询字符串;或者,根据统计出的原始字母与误识别字母之间的对应关系,将所述待纠错单词中的所述待纠错位置处的字母作为误识别字母替换为对应的原始字母,得到与所述待纠错单词相对应的查询字符串。
另外,如前文所述,在将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号时,响应于确定所述待纠错单词中的所述待纠错位置处的字母包括所述待纠错单词中的多个相邻字母,可使用一能够模糊匹配多个字母的模糊查询符号对所述多个相邻字母进行替换处理。
此外,响应于确定所述待纠错单词中的字母的数量小于数量阈值,还可基于模糊查询符号对所述待纠错单词进行补位处理。所述补位处理可包括对所述待纠错单词的首位和/或末位进行补位处理。
步骤S306:确定是否能够查询得到与所述待纠错单词相对应的替换用单词,若否,则执行步骤S3071,若是,则执行步骤S3072。
步骤S3071:确定针对所述待纠错单词已执行的纠错查询次数是否达到查询次数阈值,若否,则执行步骤S308,若是,则确定不需再对所述待纠错单词执行纠错处理并跳转至步骤S3042。
如前文所述,所述查询次数阈值可为2或3等。由此,通过限制针对单个待纠错单词的最大查询次数,可限制单个待纠错单词的最大纠错时间,从而可避免无意义的查询、降低系统资源消耗并可进一步提高纠错处理的效率。
步骤S3072:根据查询到的替换用单词对所述待纠错单词进行纠错处理。另外,执行完步骤S3072之后,跳转至步骤S3042。
如前文所述,响应于确定查询到多个与所述待纠错单词相对应的替换用单词,将使用频率最高的单词作为最终使用的替换用单词。其中,将使用频率最高的单词作为最终使用的替换用单词,可包括:确定所查询到的多个与所述待纠错单词相对应的替换用单词中的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词;以及将所确定出的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词中的使用频率最高的单词作为最终使用的替换用单词。
换言之,可基于待纠错单词的字母数量和/或单词的使用频率选取替换用单词,且待纠错单词的字母数量的优先级可高于单词的使用频率的优先级,以此提高纠错处理的准确性。
步骤S308:重新确定待纠错单词的待纠错位置,并基于重新确定的待纠错位置执行步骤S305。
如前文所述,重新确定待纠错单词的待纠错位置,可包括:按照所述待纠错单词中的除了前一待纠错位置处的字母之外的各其它字母的置信度从低到高的顺序,从所述待纠错单词中的除了前一待纠错位置处的字母之外的其它字母中选取对应的置信度排序靠前的至少一个字母;以及将所选取的所述至少一个字母在所述待纠错单词中的位置和所述前一待纠错位置一并作为所述重新确定的待纠错位置。
根据图3的流程图所示的处理方法,可基于所识别出的单词中的字母的置信度,确定所识别出的单词中的待纠错单词的待纠错位置,并基于所述待纠错位置进行纠错查询以得到与所述待纠错单词相对应的替换用单词。由此,可在不增加OCR算法难度与成本的基础上,对OCR识别结果进行相应纠正,从而能够以更为简单便捷的方式提升OCR识别率。
以上已经结合附图描述了根据本公开的示例性方法。下面将结合附图对本公开的示例性装置、以及电子设备等的示例性实施例进行进一步描述。
根据本公开的另一个方面,提供一种电子电路,包括:被配置为执行本公开中所述的方法的步骤的电路。
根据本公开的另一个方面,提供一种视障辅助设备,包括:摄像机,被配置为获取图像;以及本公开中所述的电子电路。
根据本公开的另一个方面,提供一种电子设备,包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行本公开中所述的方法。
根据本公开的另一个方面,提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行本公开中所述的方法。
图4是示出根据本公开的示例性实施例的电子设备的示例的框图。要注意的是,图4所示出的结构仅是一个示例,根据具体的实现方式,本公开的电子设备可以仅包括图4所示出的组成部分中的一种或多个。
电子设备2000例如可以是通用计算机(例如膝上型计算机、平板计算机等等各种计算机)、移动电话、个人数字助理。根据一些实施例,电子设备2000可以是视障辅助设备。
电子设备2000可被配置为拍摄图像,对所拍摄的图像进行处理,并且响应于所述处理所获得的数据而提供声音提示。例如,电子设备2000可被配置为拍摄图像,对该图像进行文字检测和/或识别以获得文字数据,将文字数据转换成声音数据,并且输出声音数据供用户聆听。这里的文字包含但不限于中文、英文、日文和/或其它语言字符。
根据一些实施方式,所述电子设备2000可以被配置为包括眼镜架或者被配置为能够可拆卸地安装到眼镜架(例如眼镜架的镜框、连接两个镜框的连接件、镜腿或任何其他部分)上,从而能够拍摄到近似包括用户的视野的图像。
根据一些实施方式,所述电子设备2000也可被安装到其它可穿戴设备上,或者与其它可穿戴设备集成为一体。所述可穿戴设备例如可以是:头戴式设备(例如头盔或帽子等)、可佩戴在耳朵上的设备等。根据一些实施例,所述电子设备可被实施为可附接到可穿戴设备上的配件,例如可被实施为可附接到头盔或帽子上的配件等。
根据一些实施方式,所述电子设备2000也可具有其他形式。例如,电子设备2000可以是移动电话、通用计算设备(例如膝上型计算机、平板计算机等)、个人数字助理,等等。电子设备2000也可以具有底座,从而能够被安放在桌面上。
根据一些实施方式,所述电子设备2000作为视障辅助设备可以用于辅助阅读,在这种情况下,所述电子设备2000有时也被称为“电子阅读器”或“阅读辅助设备”。借助于电子设备2000,无法自主阅读的用户(例如视力障碍人士、存在阅读障碍的人士等)可以采用类似阅读姿势的姿势即可实现对常规读物(例如书本、杂志等)的“阅读”。在“阅读”过程中,所述电子设备2000可以拍摄图像,对所拍摄的图像进行版面分析、文字检测和文字识别(例如利用光学字符识别OCR方法)以获得文字数据,然后将文字数据转换成声音数据,并且通过扬声器或耳机等声音输出设备输出所述声音数据供用户聆听。
电子设备2000可以包括摄像机2004,用于获取图像。摄像机2004可以包括但不限于摄像头或照相机等。电子设备2000还可以包括文字识别电路2005,所述文字识别电路2005被配置为对所述图像中包含的文字进行文字检测和/或识别(例如OCR处理),从而获得文字数据。所述文字识别电路2005例如可以通过专用芯片实现。电子设备2000还可以包括声音转换电路2006,所述声音转换电路2006被配置为将所述文字数据转换成声音数据。所述声音转换电路2006例如可以通过专用芯片实现。电子设备2000还可以包括声音输出电路2007,所述声音输出电路2007被配置为输出所述声音数据。所述声音输出电路2007可以包括但不限于耳机、扬声器、或振动器等,及其相应驱动电路。电子设备2000还可以包括电子电路2100,所述电子电路2100包括被配置为执行如前文所述的光学字符识别结果的处理方法的步骤(例如图1和图3的流程图中所示的方法步骤)的电路。
根据一些实施方式,所述电子设备2000还可以包括图像处理电路2008,所述图像处理电路2008可以包括被配置为对图像进行各种图像处理的电路。图像处理电路2008例如可以包括但不限于以下中的一个或多个:被配置为对图像进行降噪的电路、被配置为对图像进行去模糊化的电路、被配置为对图像进行几何校正的电路、被配置为对图像进行特征提取的电路、被配置为对图像中的对象进行对象检测和/或识别的电路、被配置为对图像中包含的文字进行文字检测的电路、被配置为从图像中提取文本行的电路、被配置为从图像中提取文字坐标的电路、被配置为从图像中提取对象框的电路、被配置为从图像中提取文本框的电路、被配置为基于图像进行版面分析(例如段落划分)的电路,等等。
根据一些实施方式,电子设备2000还可以包括文字处理电路2009,所述文字处理电路2009可以被配置为基于所提取的与文字有关的信息(例如文字数据、文本框、段落坐标、文本行坐标、文字坐标等)进行各种处理,从而获得诸如段落排序、文字语义分析、版面分析结果等处理结果。
上述的各种电路(例如文字识别电路2005、声音转换电路2006、声音输出电路2007、图像处理电路2008、文字处理电路2009、电子电路2100)中的一个或多个可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现。例如,上述的各种电路中的一个或多个可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
根据一些实施方式,电子设备2000还可以包括通信电路2010,所述通信电路2010可以是使得能够与外部设备和/或与网络通信的任何类型的设备或系统,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信设备和/或芯片组,例如蓝牙设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
根据一些实施方式,电子设备2000还可以包括输入设备2011,所述输入设备2011可以是能向电子设备2000输入信息的任何类型的设备,并且可以包括但不限于各种传感器、鼠标、键盘、触摸屏、按钮、控制杆、麦克风和/或遥控器等等。
根据一些实施方式,电子设备2000还可以包括输出设备2012,所述输出设备2012可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、视觉输出终端、振动器和/或打印机等。尽管电子设备2000根据一些实施例用于视障辅助设备,基于视觉的输出设备可以方便用户的家人或维修工作人员等从电子设备2000获得输出信息。
根据一些实施方式,电子设备2000还可以包括处理器2001。所述处理器2001可以是任何类型的处理器,并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(例如特殊处理芯片)。处理器2001例如可以是但不限于中央处理单元CPU或微处理器MPU等等。电子设备2000还可以包括工作存储器2002,所述工作存储器2002可以存储对处理器2001的工作有用的程序(包括指令)和/或数据(例如图像、文字、声音,以及其他中间数据等)的工作存储器,并且可以包括但不限于随机存取存储器和/或只读存储器设备。电子设备2000还可以包括存储设备2003,所述存储设备2003可以包括任何非暂时性存储设备,非暂时性存储设备可以是非暂时性的并且可以实现数据存储的任何存储设备,并且可以包括但不限于磁盘驱动器、光学存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁介质,光盘或任何其他光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓冲存储器和/或任何其他存储器芯片或盒、和/或计算机可从其读取数据、指令和/或代码的任何其他介质。工作存储器2002和存储设备2003可以被集合地称为“存储器”,并且在有些情况下可以相互兼用。
根据一些实施方式,处理器2001可以对摄像机2004、文字识别电路2005、声音转换电路2006、声音输出电路2007、图像处理电路2008、文字处理电路2009、通信电路2010、电子电路2100以及电子设备2000包括的其他各种装置和电路中的至少一个进行控制和调度。根据一些实施方式,图4中所述的各个组成部分中的至少一些可通过总线2013而相互连接和/或通信。
软件要素(程序)可以位于所述工作存储器2002中,包括但不限于操作系统2002a、一个或多个应用程序2002b、驱动程序和/或其他数据和代码。
根据一些实施方式,用于进行前述的控制和调度的指令可以被包括在操作系统2002a或者一个或多个应用程序2002b中。
根据一些实施方式,执行本公开所述的方法步骤(例如图1和图3的流程图中所示的方法步骤)的指令可以被包括在一个或多个应用程序2002b中,并且上述电子设备2000的各个模块可以通过由处理器2001读取和执行一个或多个应用程序2002b的指令来实现。换言之,电子设备2000可以包括处理器2001以及存储程序的存储器(例如工作存储器2002和/或存储设备2003),所述程序包括指令,所述指令在由所述处理器2001执行时使所述处理器2001执行如本公开各种实施例所述的方法。
根据一些实施方式,文字识别电路2005、声音转换电路2006、图像处理电路2008、文字处理电路2009、电子电路2100中的至少一个所执行的操作中的一部分或者全部可以由处理器2001读取和执行一个或多个应用程序2002b的指令来实现。
软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如所述存储设备2003)中,并且在执行时可以被存入工作存储器2002中(可能被编译和/或安装)。因此,本公开提供存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备(例如视障辅助设备)的处理器执行时,致使所述电子设备执行如本公开各种实施例所述的方法。根据另一种实施方式,软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现各个电路、单元、模块或者元件。例如,所公开的方法和设备所包含的电路、单元、模块或者元件中的一些或全部可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
根据一些实施方式,电子设备2000中的处理器2001可以分布在网络上。例如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器的另一个处理器执行其他处理。电子设备2000的其他模块也可以类似地分布。这样,电子设备2000可以被解释为在多个位置执行处理的分布式计算系统。
以下描述本公开的一些示例性方面。
方面1.一种光学字符识别结果的处理方法,包括:
获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度;
确定所识别出的单词中的待纠错单词;
根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置;以及
根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
方面2.如方面1所述的方法,其中,确定所识别出的单词中的待纠错单词,包括:
针对所识别出的单词中的待处理单词,响应于确定无法在单词数据库中查询得到所述待处理单词,将所述待处理单词作为所述待纠错单词。
方面3.如方面1所述的方法,其中,确定所识别出的单词中的待纠错单词,包括:
针对所识别出的单词中的待处理单词,响应于确定无法在单词数据库中查询得到所述待处理单词且确定所述待处理单词不满足以下条件,将所述待处理单词作为所述待纠错单词:
所述待处理单词中的各字母的置信度均不小于第一置信度阈值;或者,
所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值,且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值,其中,所述第二置信度阈值不大于所述第一置信度阈值。
方面4.如方面3所述的方法,其中,确定所述待处理单词是否满足所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值、且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值的条件是响应于确定所述待处理单词中的字母的数量不小于数量阈值而执行的。
方面5.如方面1至4中任一项所述的方法,其中,根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置,包括:
按照所述待纠错单词中的各字母的置信度从低到高的顺序,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母;以及
将所选取的所述至少一个字母在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
方面6.如方面5所述的方法,其中,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母,包括:
响应于确定所述待纠错单词满足以下条件中的至少一个,从所述待纠错单词中选取对应的置信度排序靠前的至少两个字母:
所述待纠错单词中的字母的最低置信度小于第四置信度阈值;
所述待纠错单词中存在多个对应的置信度小于第五置信度阈值的字母,所述第五置信度阈值大于所述第四置信度阈值;以及
所述待纠错单词中的字母的数量不小于数量阈值。
方面7.如方面1至4中任一项所述的方法,其中,根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词,包括:
根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串;以及
基于所述查询字符串,在单词数据库中查询与所述查询字符串相匹配的单词以得到与所述待纠错单词相对应的替换用单词。
方面8.如方面7所述的方法,其中,根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串,包括:
将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,得到与所述待纠错单词相对应的查询字符串。
方面9.如方面8所述的方法,其中,将所述待纠错单词中的所述待纠错位置处的字母替换为模糊查询符号,包括:
响应于确定所述待纠错单词中的所述待纠错位置处的字母包括所述待纠错单词中的多个相邻字母,使用一能够模糊匹配多个字母的模糊查询符号对所述多个相邻字母进行替换处理。
方面10.如方面7所述的方法,其中,根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串,包括:
根据统计出的原始字母与误识别字母之间的对应关系,将所述待纠错单词中的所述待纠错位置处的字母作为误识别字母替换为对应的原始字母,得到与所述待纠错单词相对应的查询字符串。
方面11.如方面7所述的方法,还包括:
响应于确定所述待纠错单词中的字母的数量小于数量阈值,基于模糊查询符号对所述待纠错单词进行补位处理。
方面12.如方面1至4中任一项所述的方法,还包括:
响应于确定根据所述待纠错位置无法查询得到与所述待纠错单词相对应的替换用单词,重新确定所述待纠错单词的待纠错位置;以及
根据所述重新确定的待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
方面13.如方面12所述的方法,其中,重新确定所述待纠错单词的待纠错位置,包括:
按照所述待纠错单词中的除了前一待纠错位置处的字母之外的各其它字母的置信度从低到高的顺序,从所述待纠错单词中的除了前一待纠错位置处的字母之外的其它字母中选取对应的置信度排序靠前的至少一个字母;以及
将所选取的所述至少一个字母在所述待纠错单词中的位置和所述前一待纠错位置一并作为所述重新确定的待纠错位置。
方面14.如方面12所述的方法,其中,重新确定所述待纠错单词的待纠错位置的操作是响应于确定针对所述待纠错单词已执行的纠错查询次数未达到查询次数阈值而执行的。
方面15.如方面12所述的方法,其中,重新确定所述待纠错单词的待纠错位置的操作是响应于确定所述待纠错单词中的除了前一待纠错位置处的字母之外的各其它字母不满足置信度均不小于第六置信度阈值的条件而执行的。
方面16.如方面1至4中任一项所述的方法,还包括:
响应于确定根据所述待纠错位置能够查询得到与所述待纠错单词相对应的替换用单词,根据所述替换用单词对所述待纠错单词进行纠错处理。
方面17.如方面16所述的方法,还包括:
响应于确定查询到多个与所述待纠错单词相对应的替换用单词,将使用频率最高的单词作为最终使用的替换用单词。
方面18.如方面17所述的方法,其中,所述将使用频率最高的单词作为最终使用的替换用单词,包括:
确定所查询到的多个与所述待纠错单词相对应的替换用单词中的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词;以及
将所确定出的所具备的字母数量与所述待纠错单词中的字母数量相一致的单词中的使用频率最高的单词作为最终使用的替换用单词。
方面19.如方面1至4中任一项所述的方法,其中,在确定所识别出的单词中的待纠错单词之前,所述方法还包括:
对获取到的所述识别结果进行预处理,以去除所述识别结果中的包含非字母字符的单词。
方面20.一种电子电路,包括:
被配置为执行根据方面1-19中任一项所述的方法的步骤的电路。
方面21.一种视障辅助设备,包括:
摄像机,被配置为获取图像;以及
如方面20所述的电子电路。
方面22.如方面21所述的视障辅助设备,还包括:
被配置为将识别出的单词转换成声音数据的电路;以及
被配置为输出所述声音数据的电路。
方面23.一种电子设备,包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据方面1-19中任一项所述的方法。
方面24.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据方面1-19中任一项所述的方法。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (10)
1.一种光学字符识别结果的处理方法,包括:
获取对图像进行光学字符识别所得到的识别结果,所述识别结果包括识别出的单词和所识别出的单词中的字母的置信度;
确定所识别出的单词中的待纠错单词;
根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置;以及
根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词。
2.如权利要求1所述的方法,其中,确定所识别出的单词中的待纠错单词,包括:
针对所识别出的单词中的待处理单词,响应于确定无法在单词数据库中查询得到所述待处理单词,将所述待处理单词作为所述待纠错单词。
3.如权利要求1所述的方法,其中,确定所识别出的单词中的待纠错单词,包括:
针对所识别出的单词中的待处理单词,响应于确定无法在单词数据库中查询得到所述待处理单词且确定所述待处理单词不满足以下条件,将所述待处理单词作为所述待纠错单词:
所述待处理单词中的各字母的置信度均不小于第一置信度阈值;或者,
所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值,且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值,其中,所述第二置信度阈值不大于所述第一置信度阈值。
4.如权利要求3所述的方法,其中,确定所述待处理单词是否满足所述待处理单词中的字母的最低置信度小于第二置信度阈值但不小于第三置信度阈值、且所述待处理单词中的除了具备所述最低置信度的字母之外的其它字母的置信度均不小于所述第二置信度阈值的条件是响应于确定所述待处理单词中的字母的数量不小于数量阈值而执行的。
5.如权利要求1至4中任一项所述的方法,其中,根据所述待纠错单词中的字母的置信度,确定所述待纠错单词的待纠错位置,包括:
按照所述待纠错单词中的各字母的置信度从低到高的顺序,从所述待纠错单词中选取对应的置信度排序靠前的至少一个字母;以及
将所选取的所述至少一个字母在所述待纠错单词中的位置作为所述待纠错单词的待纠错位置。
6.如权利要求1至4中任一项所述的方法,其中,根据所述待纠错位置进行纠错查询,以得到与所述待纠错单词相对应的替换用单词,包括:
根据所述待纠错位置确定与所述待纠错单词相对应的查询字符串;以及
基于所述查询字符串,在单词数据库中查询与所述查询字符串相匹配的单词以得到与所述待纠错单词相对应的替换用单词。
7.一种电子电路,包括:
被配置为执行根据权利要求1-6中任一项所述的方法的步骤的电路。
8.一种视障辅助设备,包括:
摄像机,被配置为获取图像;以及
如权利要求7所述的电子电路。
9.一种电子设备,包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-6中任一项所述的方法。
10.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010942909.4A CN112084947A (zh) | 2020-09-09 | 2020-09-09 | 光学字符识别结果的处理方法、电路、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010942909.4A CN112084947A (zh) | 2020-09-09 | 2020-09-09 | 光学字符识别结果的处理方法、电路、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112084947A true CN112084947A (zh) | 2020-12-15 |
Family
ID=73732981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010942909.4A Pending CN112084947A (zh) | 2020-09-09 | 2020-09-09 | 光学字符识别结果的处理方法、电路、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084947A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077018A (zh) * | 2021-06-07 | 2021-07-06 | 浙江大华技术股份有限公司 | 一种目标对象识别方法、装置、存储介质及电子装置 |
CN113704403A (zh) * | 2021-08-25 | 2021-11-26 | 深圳市网联安瑞网络科技有限公司 | 基于词库的ocr语义校正方法、系统、介质、设备、终端 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US8185539B1 (en) * | 2008-08-12 | 2012-05-22 | Foneweb, Inc. | Web site or directory search using speech recognition of letters |
CN109711412A (zh) * | 2018-12-27 | 2019-05-03 | 信雅达系统工程股份有限公司 | 一种基于字典的光学字符识别纠错方法 |
CN111435406A (zh) * | 2019-01-14 | 2020-07-21 | 北京京东尚科信息技术有限公司 | 一种纠正数据库语句拼写错误的方法和装置 |
CN111630521A (zh) * | 2018-02-28 | 2020-09-04 | 佳能欧洲股份有限公司 | 图像处理方法和图像处理系统 |
-
2020
- 2020-09-09 CN CN202010942909.4A patent/CN112084947A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US8185539B1 (en) * | 2008-08-12 | 2012-05-22 | Foneweb, Inc. | Web site or directory search using speech recognition of letters |
CN111630521A (zh) * | 2018-02-28 | 2020-09-04 | 佳能欧洲股份有限公司 | 图像处理方法和图像处理系统 |
CN109711412A (zh) * | 2018-12-27 | 2019-05-03 | 信雅达系统工程股份有限公司 | 一种基于字典的光学字符识别纠错方法 |
CN111435406A (zh) * | 2019-01-14 | 2020-07-21 | 北京京东尚科信息技术有限公司 | 一种纠正数据库语句拼写错误的方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077018A (zh) * | 2021-06-07 | 2021-07-06 | 浙江大华技术股份有限公司 | 一种目标对象识别方法、装置、存储介质及电子装置 |
CN113704403A (zh) * | 2021-08-25 | 2021-11-26 | 深圳市网联安瑞网络科技有限公司 | 基于词库的ocr语义校正方法、系统、介质、设备、终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10019436B2 (en) | Input method and system | |
US10114809B2 (en) | Method and apparatus for phonetically annotating text | |
US9411801B2 (en) | General dictionary for all languages | |
US20210201143A1 (en) | Computing device and method of classifying category of data | |
JP5400200B2 (ja) | ショートハンド・オン・キーボード・インタフェースにおいてテキスト入力を改善するためのシステム、コンピュータ・プログラムおよび方法(キ | |
KR101667463B1 (ko) | 콘텍스트 정보를 이용한 모바일 디바이스 상에서의 광학적 문자 인식 | |
CN104850542B (zh) | 非可听语音输入校正 | |
US20110267490A1 (en) | Camera based method for text input and keyword detection | |
US20220343062A1 (en) | Table detection in spreadsheet | |
CN112084947A (zh) | 光学字符识别结果的处理方法、电路、设备及存储介质 | |
US11386897B2 (en) | Method and system for extraction of key-terms and synonyms for the key-terms | |
US20210012062A1 (en) | Extracting Structured Data from Handwritten and Audio Notes | |
US11087187B2 (en) | System and method for improving recognition of characters | |
JP7116088B2 (ja) | 音声情報処理方法、装置、プログラム及び記録媒体 | |
US20190042186A1 (en) | Systems and methods for using optical character recognition with voice recognition commands | |
WO2020233379A1 (zh) | 版面分析方法、阅读辅助设备、电路及介质 | |
US10032071B2 (en) | Candidate handwriting words using optical character recognition and spell check | |
JP2015040908A (ja) | 情報処理装置、情報更新プログラム及び情報更新方法 | |
US11797551B2 (en) | Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method | |
KR101176963B1 (ko) | 간판 영상 문자 인식 및 후처리 시스템 | |
US11755659B2 (en) | Document search device, document search program, and document search method | |
US20170116174A1 (en) | Electronic word identification techniques based on input context | |
JP2008089825A (ja) | 音声認識装置、および音声認識プログラム | |
US7680331B2 (en) | Document processing device and document processing method | |
CN110969161B (zh) | 图像处理方法、电路、视障辅助设备、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |