CN110472701A - 文字纠错方法、装置、电子设备和存储介质 - Google Patents
文字纠错方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN110472701A CN110472701A CN201910747672.1A CN201910747672A CN110472701A CN 110472701 A CN110472701 A CN 110472701A CN 201910747672 A CN201910747672 A CN 201910747672A CN 110472701 A CN110472701 A CN 110472701A
- Authority
- CN
- China
- Prior art keywords
- text
- word
- error correction
- recognition result
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000015654 memory Effects 0.000 claims description 22
- 235000013399 edible fruits Nutrition 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000002687 intercalation Effects 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
本申请实施例公开了一种文字纠错方法、装置、电子设备和存储介质,该方法包括:对用户点击的目标文字进行识别,获取识别结果;将识别结果与预设字词库进行匹配,确定候选词语;针对各个候选词语,按照构成识别结果的各个第一文字在识别结果中的位置顺序,以及,构成候选词语的各个第二文字在候选结果中的位置顺序,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度;根据第一匹配度确定识别结果中的待纠错文字和候选词语中待纠错文字对应的备选文字;依次计算待纠错文字和每个备选文字的第二匹配度,选择第二匹配度最高的备选文字替换待纠错文字。这样提高了文字识别的准确率,进而提高了对识别文字的搜索的准确率,提高用户体验。
Description
技术领域
本申请实施例涉及文字识别与处理技术,尤其涉及一种文字纠错方法、装置、电子设备和存储介质。
背景技术
随着科技的进步,文字识别技术的应用越来越广泛,例如在单据识别领域或学生使用学习平板电脑学习的过程中。尤其是当对图片识别时,原本图片存在一定的手写干扰,或者拍照环境灰暗,或者图片像素、清晰度、噪音等问题导致文字识别的准确率不高,经常会出现识别出相似的字或单词,如“闰”识别成了“闺”,这样就会实际应用。尤其是在学生学习过程中,在识别完成后还需要进一步搜索等,这样当字或词识别错误后,导致搜索的结果准确率也会随之降低。因此,如何进行纠错进而提升文字识别的准确率成为亟待解决的问题。
发明内容
本申请提供了一种文字纠错方法、装置、电子设备和存储介质,以解决现有技术中文字识别准确率低的问题。
本发明采用如下技术方案:
第一方面,本申请实施例提供了一种文字纠错方法,该方法包括:
对用户点击的目标文字进行识别,获取识别结果;
将所述识别结果与预设字词库进行匹配,确定候选词语;
针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
第二方面,本申请实施例提供了一种文字纠错装置,该装置包括:
识别结果获取模块,用于对用户点击的目标文字进行识别,获取识别结果;
候选词语确定模块,用于将所述识别结果与预设字词库进行匹配,确定候选词语;
第一匹配度确定模块,用于针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
待纠错文字和备选文字确定模块,用于根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
文字纠错模块,用于依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
第三方面,本申请实施例提供了一种电子设备,包括存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的文字纠错方法。
第四方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的文字纠错方法。
本发明采用的技术方案中有如下有益效果:通过对用户点击的目标文字进行识别,获取识别结果,并将识别结果与预设字词库进行匹配来确定候选词语,这样确定的候选词语可能为多个,这样扩大了文字纠错的范围,在一定程度上提高了文字纠错的准确度;另外,针对各个候选词语,按照构成识别结果的各个第一文字在识别结果中的位置顺序,以及,构成候选词语的各个第二文字在候选词语中的位置顺序,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度,根据第一匹配度确定识别结果中的待纠错文字和候选词语中待纠错文字对应的备选文字;这样将识别结果和候选词语分别拆分为单个文字,并考虑在相应词语中的位置顺序,分别进行匹配,这样确定的待纠错文字和备选文字更准确;另外,依次计算待纠错文字和每个备选文字的第二匹配度,选择第二匹配度最高的备选文字替换待纠错文字,这样,用进一步筛选出来的备选文字替换待纠错文字,这样就可以得到准确的识别结果,提高了文字识别的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例提供的一种文字纠错方法的流程图;
图2是本申请实施例提供的另一种文字纠错方法的流程图;
图3是本申请实施例中适用的一种文字识别过程中点击之前的界面示意图;
图4是本申请实施例中适用的一种文字识别过程中点击时界面示意图;
图5是本申请实施例提供的一种文字纠错装置的结构示意图;
图6是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
首先对本申请实施例的可应用场景进行说明,具体可以应用在文字识别场景中,例如,孩子在应用学习平板学习的过程中,遇到不认识或者不懂的字或者词语时,首先应用学习平板正确的识别不认识的字或词,才能进一步查询或者搜索其释义等,而一旦识别错误,则很大程度上影响后续搜索释义等操作结果的准确性。这个场景只是用来示例,还可以应用在其他场景中,例如票据识别等。
图1给出了本申请实施例提供的一种文字纠错方法的流程图,本实施例提供的文字纠错方法可以由文字纠错装置来执行,该文字纠错装置可通过硬件和/或软件的方式实现。参考图1,该方法具体可以包括:
S101、对用户点击的目标文字进行识别,获取识别结果。
具体的,以学生应用学习平板进行学习的场景为例,这个场景中的用户就是学生。如果想要更加进一步了解某个字或者某个词语的含义或者造句等,首先得准确认识这个字或者词,而当学生不认识时,则需要借助学习平板进行识别。此时,用户可以点击不认识的字或者词,然后应用学习平板进行识别。而考虑到实际的应用过程,用户可能想去识别的是一个成语,但是,由于用户的手指在学习平板上点击时的接触以及力度等,点击的目标文字可能是一个,也可能是多个。而识别结果可能存在个别文字识别错误的情况,因此,需要应用本申请实施例的技术方案对识别错的文字进行纠正。
在一个具体的例子中,用户想要识别的文字所属的词语为“相提并论”,用户手指点击在了“并”字上,而由于不同的文字之间有一定的相似程度,因此,识别结果不一定就是正确的,例如识别结果可能是“相提井论”。而识别结果只是在文字识别过程中的一个中间结果,该结果可以不向用户进行展示。
S102、将所述识别结果与预设字词库进行匹配,确定候选词语。
由于上述步骤中通过用户点击目标文字来识别,以获取识别结果,进而需要确定该识别结果是不是常用字词里边的一个固有词语,也即,确定是不是某一个或者某几个字出现了识别错误的情况,或者,确定是不是某几个文字的机械组合的情况。
学习平板本地或者云服务器中预先存储有预设字词库,该字词库中存储有大量的常用字词。具体的,将识别结果与预设字词库进行匹配,其中,匹配原则可以是首先确定识别结果中的词语包括的文字的个数,例如,上述“相提井论”一共包括四个字,则优先将这个识别结果与预设字词库中的四字成语进行匹配,从多个匹配结果中找出匹配度最高的词语作为候选词语。这样,一方面可以节约匹配过程中的计算量,另一方面也可以更快、更准确的确定候选词语。在这个具体的例子中,候选词语可以是“相提并论”和“相提而论等”。
S103、针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度。
具体的,根据每个识别结果确定的候选词语可能是一个,也可能是多个,若有多个候选词语时,则针对每个候选词语,分别执行S103中的各个操作。接下来以其中的一个候选词语的处理过程进行说明。首先,将构成识别结果的各个文字称为第一文字,将构成候选词语的各个文字称为第二文字,分别确定各个第一文字在识别结果中的位置顺序,和,各个第二文字在候选词语中的位置顺序。示例性的,该位置顺序可以是,每个文字处在所属词语中的第几个字,例如,“相提井论”中,“相”的位置顺序是1,“提”的位置顺序是2,“井”的位置顺序是3,“论”的位置顺序是4;“相提并论”中,“相”的位置顺序是1,“提”的位置顺序是2,“并”的位置顺序是3,“论”的位置顺序是4。
在一个具体的例子中,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度,也即,分别计算位置顺序是1、2、3、4的四组文字的第一匹配度。例如,“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“井”和“并”的第一匹配度、“论”和“论”的第一匹配度。
另外,由于在实际的应用过程中,候选词语通常为多个,因此,这里用两个候选词为例,另一个候选词为“相提而论”。在这个具体的例子中,“相提而论”中,“相”的位置顺序是1,“提”的位置顺序是2,“而”的位置顺序是3,“论”的位置顺序是4。分别计算位置顺序是1、2、3、4的四组文字的第一匹配度,也即,“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“井”和“而”的第一匹配度、“论”和“论”的第一匹配度。
这样,在确定了两个候选词的情况下,就可以确定出两组第一匹配度,第一组第一匹配度是由识别结果“相提井论”和候选词语“相提并论”确定的,第二组第一匹配度是由识别结果“相提井论”和候选词语“相提而论”确定的。
S104、根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字。
具体的,可以预先设置筛选条件,例如,第一匹配度小于预设第一匹配度阈值时,识别结果中的相应的文字为待纠错文字,候选词语中的与待纠错文字对应的文字为备选文字。
仍按上述示例进行说明,在识别结果“相提井论”和候选词语“相提并论”确定的第一组第一匹配度中,可以发现,“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“论”和“论”的第一匹配度均高于“井”和“并”的第一匹配度,则确定“井”为待纠错文字,“并”为“井”对应的备选文字。同理,在识别结果“相提井论”和候选词语“相提而论”确定的第二组第一匹配度中,可以发现,“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“论”和“论”的第一匹配度均高于“井”和“而”的第一匹配度,则确定“井”为待纠错文字,“而”为“井”对应的备选文字。
需要说明的是,由于在S102中确定候选词语的过程中已经经历了大量的数据匹配,也即,候选词语通常是与识别结果最为接近的词语,因此,在多个候选词语时,确定的待纠错文字通常为一个,也即,多个候选词语出现过个不同的待纠错文字的概率极低,这里可以忽略不考虑。
S105、依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
在上述实施例中,确定的待纠错文字为“井”,备选文字为“并”和“而”,这只是用两个候选词语为例子的结果,当有多个候选词语时,可能出现多个备选文字。具体的,此时就要从多个备选文字中找出一个最佳备选文字来替换待纠错文字。依次计算“井”和“并”的第二匹配度,“井”和“而”的第二匹配度,然后选择第二匹配度最高的结果中的“并”作为目标备选文字,来替换待纠错文字“井”,这样,就可以得到正确的识别结果“相提并论”。
在实际的应用过程中,在获取到纠正后的争取的识别结果后,可以根据该识别结果继续查询其释义等其他相关性信息,以辅助学生学习。
本发明采用的技术方案中有如下有益效果:通过对用户点击的目标文字进行识别,获取识别结果,并将识别结果与预设字词库进行匹配来确定候选词语,这样确定的候选词语可能为多个,这样扩大了文字纠错的范围,在一定程度上提高了文字纠错的准确度;另外,针对各个候选词语,按照构成识别结果的各个第一文字在识别结果中的位置顺序,以及,构成候选词语的各个第二文字在候选词语中的位置顺序,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度,根据第一匹配度确定识别结果中的待纠错文字和候选词语中待纠错文字对应的备选文字;这样将识别结果和候选词语分别拆分为单个文字,并考虑在相应词语中的位置顺序,分别进行匹配,这样确定的待纠错文字和备选文字更准确;另外,依次计算待纠错文字和每个备选文字的第二匹配度,选择第二匹配度最高的备选文字替换待纠错文字,这样,用进一步筛选出来的备选文字替换待纠错文字,这样就可以得到准确的识别结果,提高了文字识别的准确率。
在上述实施例的基础上,图2给出了本申请实施例提供的另一种文字纠错方法的流程图。该文字纠错方法是对上述文字纠错方法的具体化。参考图2,该文字纠错方法包括:
S201、计算所述用户点击的目标文字的像素坐标。
具体的,在获取到用户点击目标文字的点击操作后,响应根据点击操作生成的指令,进而通过识别该指令中的信息来计算用户点击的目标文字的像素坐标。其中,在一个图像中,通常根据图像分辨率将图像分为各个像素点来进行研究和处理,而像素坐标则可以表示每个像素点在当前图像中的位置。例如,图像分辨率为1600*900,则表示有1440000个像素点。而用户点击的目标文字包括的像素点不止为一个,因此,计算得到的用户点击的目标文字的像素坐标可以是个坐标范围,例如,横坐标为(x1,y1),纵坐标为(x2,y2)。
S202、根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语。
其中,预设识别规则包括成语识别、词语识别和单字识别的优先级依次降低。这样,在文字识别的过程中,则优先识别为成语,其次为词语,再次为单字,这里说的词语是不包括成语的多个文字组成的词语,这样更符合中国文字的语言表达。
具体的,预设字数阈值可以是3,也即,目标文字的前3个字,和目标文字的后3个字,这样可以根据目标文字的像素坐标,和,预设字数阈值,确定待识别词语的像素坐标,例如,通过字的个数可以确定像素坐标的范围。这样,在这个具体的例子中,确定包括目标文字的目标词语可以是最多7个字。
在一个具体的例子中,用户点击在了“并”字上,而“并”字所在的句子为“这两件事儿怎么可以相提并论呢?”,则包括目标识别文字的目标词语可以是“可以相提并论呢”中任意相邻的两个及以上的文字的组合,如“提并”、“并论”、“可以相提并”或“相提并论”等。
在一个具体的例子中,图3示出了一种文字识别过程中点击之前的界面示意图;参考图3,当前显示页面显示的目标文字所在的句子为“这两件事儿怎么可以相提并论呢?”。图4示出了一种文字识别过程中点击时界面示意图,参考图4,用户点击了“并”字。
S203、对所述目标词语进行识别,获取识别结果。
具体的,将目标词语输入至本地标准字词库进行识别,或者,输入至服务器中的在线识别系统进行识别,例如,将“提并”、“并论”、“可以相提并”或“相提并论”等输入至本地标准字词库进行识别,这样就可以排除一些不是固有词语而只是单纯的文字组合的情况。因此,在这个具体的例子中,由于“提并”等均非固有词语,则获取到的识别结果为针对“相提并论”的识别,而识别结果则具有很大的不确定性,造成识别结果错误的原因有很多种,例如,许多文字的字形相似等,而这正是本申请需要解决的问题,去纠正识别错误的文字,而本申请实施例中的识别结果是若干识别结果中的一个,假如换一种识别算法,或者,换一个本地标准字词库等,均可能有不同的识别结果。
示例性的,在本申请实施例中,在文字识别采用的方法可以是利用OCR(OpticalCharacter Recognition,光学字符识别)是指电子设备检查纸上打印的字符,例如可以是图片形式的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字。其中,电子设备可以是学习平板,还可以是扫描仪或数码相机等。
S204、将所述识别结果与预设字词库进行匹配,计算第三匹配度。
具体的,上述例子中,识别结果为“相提井论”,则将“相提井论”输入至预设字词库进行识别,这样可以识别出多个待处理的候选词语,而每个待处理的候选词语和识别结果直接都可以计算出一个第三匹配度。例如,待处理的候选词语可以是“相提并论”、“相提而论”、“相互讨论”等。
在一个具体的例子中,第三匹配度可以是待处理的候选词语中包括的与识别结果中相同的字的个数或者相同的字的个数占待处理的候选词语总字数的比例。例如,在“相提并论”中,有三个相同的字,“相”、“提”和“论”,则第三匹配度可以是75%;在“相提而论”中,有三个相同的字,“相”、“提”和“论”,则第三匹配度可以是75%;在“相互讨论”中,有两个相同的字,“相”和“论”,则第三匹配度可以是50%。需要说明的是,这里用相同的字的个数来简单的计算一个百分比作为第三匹配度只是用来示例,还可以通过其他方式进行计算,这里不进行限定。
S205、将所述第三匹配度最高的所述预设字词库中的至少一个词语作为候选词语。
具体的,第三匹配度越高,表示与识别结果的接近程度越高,这样就在多个待处理的候选词语中确定候选词语,例如可以选取第三匹配度最高的词语作为候选词语,当有至少两个待处理的候选词语的第三匹配度相同时,这两个待处理的候选词语均作为候选词语。
S206、针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度。
S207、选取第一匹配度最小的一组目标第一文字和目标第二文字。
具体的,仍以本申请实施例中的上述示例进行说明,参见S104中的表述,“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“论”和“论”的第一匹配度均高于“井”和“并”的第一匹配度;“相”和“相”的第一匹配度、“提”和“提”的第一匹配度、“论”和“论”的第一匹配度均高于“井”和“而”的第一匹配度,则目标第一文字为“井”,目标第二文字为“并”和“而”。
S208、确定所述目标第一文字为所述识别结果中的待纠错文字,以及,确定所述目标第二文字为所述待纠错文字对应的备选文字。
示例性的,目标第一文字为识别结果中的文字,因此,将目标第一文字确定为识别结果中的待纠错文字,因此,待纠错文字为“井”;目标第二文字为候选词语中的文字,有几个候选词语,就会有几组备选文字,每组备选文字的个数可以是一个,也可以是多个,在这个具体的例子中,确定的目标第二文字为待纠错文字对应的备选文字为“并”和“而”。
S209、将所述待纠错文字和各个备选文字输入至预设形近字库;分别计算所述待纠错文字和每个备选文字间之间的第二匹配度。
具体的,预设形近字库中存储有大量关联形近字和易混字,这样,将待纠错文字和各个备选文字输入至预设形近字库中,分别计算待纠错文字和每个备选文字的第二匹配度。在上述具体的例子中,计算“井”和“并”的第二匹配度,以及,“井”和“而”的第二匹配度,其中,“井”和“并”的第二匹配度高于“井”和“而”的匹配度。示例性的,在计算第二匹配度时的标准更多的是参考字形上的相似程度,这样才会得到更准确的识别结果,例如,“井”和“并”更相似。
S210、选择所述第二匹配度最高的备选文字替换所述待纠错文字。
在这个具体的例子中,将“并”字替换掉识别结果中的“井”,这样就得到正确的识别结果为“相提并论”。
本申请实施例中,通过计算用户点击的目标文字的像素坐标,以及预设识别规则等,确定了包括目标文字在内的目标词语,这样就可以避免简单的只识别目标文字降低识别准确率的问题;将识别结果与预设字词库进行匹配,这样确定的候选词更接近于识别结果;然后分别确定待纠错文字和备选文字,将待纠错文字和备选文字输入至预设形近字库来确定用哪个备选文字替换待纠错文字,也即,找出与待纠错文字最匹配的备选文字,这样,将最匹配的备选文字替换待纠错文字,这样就可以得到正确的识别结果,进而提高了文字识别的准确率。这样如果是应用在学生应用学习平板学习中,通过提高文字识别的准确率还提升学生的学习内容的搜索准确率,让学生有更好的产品体验。
在上述实施例的基础上,图5为本申请实施例提供的一种文字纠错装置的结构示意图。参考图5,本实施例提供的文字纠错装置具体包括:识别结果获取模块501、候选词语确定模块502、第一匹配度确定模块503、待纠错文字和备选文字确定模块504和文字纠错模块505。
其中,识别结果获取模块501,用于对用户点击的目标文字进行识别,获取识别结果;候选词语确定模块502,用于将所述识别结果与预设字词库进行匹配,确定候选词语;第一匹配度确定模块503,用于针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;待纠错文字和备选文字确定模块504,用于根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;文字纠错模块505,用于依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
本发明采用的技术方案中有如下有益效果:通过对用户点击的目标文字进行识别,获取识别结果,并将识别结果与预设字词库进行匹配来确定候选词语,这样确定的候选词语可能为多个,这样扩大了文字纠错的范围,在一定程度上提高了文字纠错的准确度;另外,针对各个候选词语,按照构成识别结果的各个第一文字在识别结果中的位置顺序,以及,构成候选词语的各个第二文字在候选词语中的位置顺序,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度,根据第一匹配度确定识别结果中的待纠错文字和候选词语中待纠错文字对应的备选文字;这样将识别结果和候选词语分别拆分为单个文字,并考虑在相应词语中的位置顺序,分别进行匹配,这样确定的待纠错文字和备选文字更准确;另外,依次计算待纠错文字和每个备选文字的第二匹配度,选择第二匹配度最高的备选文字替换待纠错文字,这样,用进一步筛选出来的备选文字替换待纠错文字,这样就可以得到准确的识别结果,提高了文字识别的准确率。
进一步的,识别结果获取模块501具体用于:
计算所述用户点击的目标文字的像素坐标;
根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语;
对所述目标词语进行识别,获取识别结果。
进一步的,候选词语确定模块502具体用于:
将所述识别结果与预设字词库进行匹配,计算第三匹配度;
将所述第三匹配度最高的所述预设字词库中的至少一个词语作为候选词语。
进一步的,待纠错文字和备选文字确定模块504具体用于:
选取第一匹配度最小的一组目标第一文字和目标第二文字;
确定所述目标第一文字为所述识别结果中的待纠错文字,以及,确定所述目标第二文字为所述待纠错文字对应的备选文字。
进一步的,文字纠错模块505具体用于:
将所述待纠错文字和各个备选文字输入至预设形近字库;
分别计算所述待纠错文字和每个备选文字间之间的第二匹配度。
进一步的,所述预设识别规则包括成语识别、词语识别和单字识别的优先级依次降低。
本申请实施例提供的文字纠错装置可以用于执行上述实施例提供的文字纠错方法,具备相应的功能和有益效果。
本申请实施例提供了一种电子设备,且该电子设备中可集成本申请实施例提供的文字纠错装置。图6是本申请实施例提供的一种电子设备的结构示意图。参考图6,该电子设备包括:处理器6060、存储器6161。该电子设备中处理器6060的数量可以是一个或者多个,图6中以一个处理器6060为例。该电子设备中存储器6161的数量可以是一个或者多个,图6中以一个存储器61为例。该电子设备的处理器6060和存储器6161可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的文字纠错方法对应的程序指令/模块(例如,文字纠错装置中的识别结果获取模块501、候选词语确定模块502、第一匹配度确定模块503、待纠错文字和备选文字确定模块504和文字纠错模块505)。存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的文字纠错方法,该文字纠错方法包括:对用户点击的目标文字进行识别,获取识别结果;将所述识别结果与预设字词库进行匹配,确定候选词语;针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
上述提供的电子设备可用于执行上述实施例提供的文字纠错方法,具备相应的功能和有益效果。
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种文字纠错方法,该文字纠错方法包括:对用户点击的目标文字进行识别,获取识别结果;将所述识别结果与预设字词库进行匹配,确定候选词语;针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的文字纠错方法,还可以执行本申请任意实施例所提供的文字纠错方法中的相关操作。
上述实施例中提供的文字纠错装置、存储介质及电子设备可执行本申请任意实施例所提供的文字纠错方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的文字纠错方法。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
Claims (10)
1.一种文字纠错方法,其特征在于,包括:
对用户点击的目标文字进行识别,获取识别结果;
将所述识别结果与预设字词库进行匹配,确定候选词语;
针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
2.根据权利要求1所述的方法,其特征在于,所述对用户点击的目标文字进行识别,获取识别结果,包括:
计算所述用户点击的目标文字的像素坐标;
根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语;
对所述目标词语进行识别,获取识别结果。
3.根据权利要求1所述的方法,其特征在于,所述将所述识别结果与预设字词库进行匹配,确定候选词语,包括:
将所述识别结果与预设字词库进行匹配,计算第三匹配度;
将所述第三匹配度最高的所述预设字词库中的至少一个词语作为候选词语。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字,包括:
选取第一匹配度最小的一组目标第一文字和目标第二文字;
确定所述目标第一文字为所述识别结果中的待纠错文字,以及,确定所述目标第二文字为所述待纠错文字对应的备选文字。
5.根据权利要求1所述的方法,其特征在于,依次计算所述待纠错文字和每个备选文字的第二匹配度,包括:
将所述待纠错文字和各个备选文字输入至预设形近字库;
分别计算所述待纠错文字和每个备选文字间之间的第二匹配度。
6.根据权利要求1所述的方法,其特征在于,所述预设识别规则包括成语识别、词语识别和单字识别的优先级依次降低。
7.一种文字纠错装置,其特征在于,包括:
识别结果获取模块,用于对用户点击的目标文字进行识别,获取识别结果;
候选词语确定模块,用于将所述识别结果与预设字词库进行匹配,确定候选词语;
第一匹配度确定模块,用于针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
待纠错文字和备选文字确定模块,用于根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
文字纠错模块,用于依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
8.根据权利要求7所述的装置,其特征在于,所述识别结果获取模块具体用于:
计算所述用户点击的目标文字的像素坐标;
根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语;
对所述目标词语进行识别,获取识别结果。
9.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6任一所述的文字纠错方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6任一所述的文字纠错方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910747672.1A CN110472701B (zh) | 2019-08-14 | 2019-08-14 | 文字纠错方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910747672.1A CN110472701B (zh) | 2019-08-14 | 2019-08-14 | 文字纠错方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110472701A true CN110472701A (zh) | 2019-11-19 |
CN110472701B CN110472701B (zh) | 2023-07-07 |
Family
ID=68510736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910747672.1A Active CN110472701B (zh) | 2019-08-14 | 2019-08-14 | 文字纠错方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472701B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126045A (zh) * | 2019-11-25 | 2020-05-08 | 泰康保险集团股份有限公司 | 一种文本纠错方法和装置 |
CN111683285A (zh) * | 2020-08-11 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 文件内容识别方法、装置、计算机设备及存储介质 |
CN112380842A (zh) * | 2020-11-25 | 2021-02-19 | 北京明略软件系统有限公司 | 人名纠错方法、装置、计算机设备和可读存储介质 |
CN113486653A (zh) * | 2021-07-06 | 2021-10-08 | 安徽淘云科技股份有限公司 | 形近字多候选控制方法、装置和设备 |
CN113836874A (zh) * | 2021-09-16 | 2021-12-24 | 北京小米移动软件有限公司 | 文本纠错方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0484383A (ja) * | 1990-07-27 | 1992-03-17 | Ricoh Co Ltd | 文字認識装置 |
JPH11134335A (ja) * | 1997-10-30 | 1999-05-21 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 文字誤り校正装置 |
CN107633250A (zh) * | 2017-09-11 | 2018-01-26 | 畅捷通信息技术股份有限公司 | 一种文字识别纠错方法、纠错系统及计算机装置 |
CN109582972A (zh) * | 2018-12-27 | 2019-04-05 | 信雅达系统工程股份有限公司 | 一种基于自然语言识别的光学字符识别纠错方法 |
CN109948122A (zh) * | 2017-12-21 | 2019-06-28 | 北京金山安全软件有限公司 | 输入文本的纠错方法、装置及电子设备 |
-
2019
- 2019-08-14 CN CN201910747672.1A patent/CN110472701B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0484383A (ja) * | 1990-07-27 | 1992-03-17 | Ricoh Co Ltd | 文字認識装置 |
JPH11134335A (ja) * | 1997-10-30 | 1999-05-21 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 文字誤り校正装置 |
CN107633250A (zh) * | 2017-09-11 | 2018-01-26 | 畅捷通信息技术股份有限公司 | 一种文字识别纠错方法、纠错系统及计算机装置 |
CN109948122A (zh) * | 2017-12-21 | 2019-06-28 | 北京金山安全软件有限公司 | 输入文本的纠错方法、装置及电子设备 |
CN109582972A (zh) * | 2018-12-27 | 2019-04-05 | 信雅达系统工程股份有限公司 | 一种基于自然语言识别的光学字符识别纠错方法 |
Non-Patent Citations (1)
Title |
---|
窦光辉: "搜索引擎查询纠错的关键技术研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126045A (zh) * | 2019-11-25 | 2020-05-08 | 泰康保险集团股份有限公司 | 一种文本纠错方法和装置 |
CN111683285A (zh) * | 2020-08-11 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 文件内容识别方法、装置、计算机设备及存储介质 |
CN111683285B (zh) * | 2020-08-11 | 2021-01-26 | 腾讯科技(深圳)有限公司 | 文件内容识别方法、装置、计算机设备及存储介质 |
CN112380842A (zh) * | 2020-11-25 | 2021-02-19 | 北京明略软件系统有限公司 | 人名纠错方法、装置、计算机设备和可读存储介质 |
CN113486653A (zh) * | 2021-07-06 | 2021-10-08 | 安徽淘云科技股份有限公司 | 形近字多候选控制方法、装置和设备 |
CN113836874A (zh) * | 2021-09-16 | 2021-12-24 | 北京小米移动软件有限公司 | 文本纠错方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110472701B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472701A (zh) | 文字纠错方法、装置、电子设备和存储介质 | |
US11699275B2 (en) | Method and system for visio-linguistic understanding using contextual language model reasoners | |
CN109634961B (zh) | 一种试卷样本生成方法、装置、电子设备和存储介质 | |
US20220067416A1 (en) | Method and device for generating collection of incorrectly-answered questions | |
CN111178123A (zh) | 图像中的对象检测 | |
CN111104883B (zh) | 作业答案提取方法、装置、设备及计算机可读存储介质 | |
WO2023202197A1 (zh) | 文本识别方法及相关装置 | |
CN107748744B (zh) | 一种勾勒框知识库的建立方法及装置 | |
US11817126B2 (en) | Converting sign language | |
CN112287926A (zh) | 一种图形题目的批改方法、装置以及设备 | |
CN110210480A (zh) | 文字识别方法、装置、电子设备和计算机可读存储介质 | |
US20240346799A1 (en) | Method, apparatus, device and storage medium for image segmentation | |
CN109190615A (zh) | 形近字识别判定方法、装置、计算机设备和存储介质 | |
CN117149967A (zh) | 应答生成方法、装置、服务器和计算机可读存储介质 | |
CN111008624A (zh) | 光学字符识别方法和产生光学字符识别的训练样本的方法 | |
CN112395880B (zh) | 结构化三元组的纠错方法、装置、计算机设备及存储介质 | |
WO2021083110A1 (zh) | 载体对象处理和水印嵌入方法、装置及电子设备 | |
CN112991410A (zh) | 一种文本图像配准方法、电子设备及其存储介质 | |
CN110633457B (zh) | 一种内容替换方法、装置、电子设备及可读存储介质 | |
CN110363189B (zh) | 一种文档内容修复方法、装置、电子设备及可读存储介质 | |
CN111027533B (zh) | 一种点读坐标的变换方法、系统、终端设备及存储介质 | |
CN112001152A (zh) | 对象识别处理方法、处理装置、电子设备和存储介质 | |
CN110895924B (zh) | 一种文档内容朗读方法、装置、电子设备及可读存储介质 | |
WO2023024898A1 (zh) | 题目辅助方法、题目辅助装置和题目辅助系统 | |
EP4322066A1 (en) | Method and apparatus for generating training data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |