CN111160347B

CN111160347B - 一种基于相似字符识别的文本识别方法及电子设备

Info

Publication number: CN111160347B
Application number: CN201910749303.6A
Authority: CN
Inventors: 周林
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2019-08-14
Filing date: 2019-08-14
Publication date: 2023-04-18
Anticipated expiration: 2039-08-14
Also published as: CN111160347A

Abstract

一种基于相似字符识别的文本识别方法及电子设备，该方法包括：将待识别的文本通过科目识别模型，以识别出其对应的若干个潜在科目；根据潜在科目对该文本进行分词，获得若干个分词词语；根据分词词语与该潜在科目对应的分词库中每个分词的字符相似度，计算每个分词的置信度，并由此获取该潜在科目的总置信度，其中总置信度最高的潜在科目作为目标科目；针对目标科目对应的分词词语，获取该目标科目对应的分词库中置信度最高的分词，并在判断出其置信度高于某一预设阈值时，将分词词语纠正为该置信度最高的分词，以获得文本识别结果。实施本发明实施例，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

Description

一种基于相似字符识别的文本识别方法及电子设备

技术领域

本发明涉及字符识别技术领域，尤其涉及一种基于相似字符识别的文本识别方法及电子设备。

背景技术

近年来，以光学字符识别(OCR)为代表的字符识别技术得到了突飞猛进的发展。但目前，在进行文本识别时，可能存在部分字符混淆不清晰的情况，例如，在识别学生作业的过程中，由于作业本吸墨质量不佳或学生字迹潦草，导致部分中文字符(单个汉字)或英文字符(单个字母)不够清晰，容易被错误识别为其他相似字符，甚至可能出现某一科目的字符被错误识别为其他科目的字符的情况(如汉语拼音被错误识别为英文字母)，从而降低了文本识别的准确率。

发明内容

本发明实施例公开了一种基于相似字符识别的文本识别方法及电子设备，能够提高文本识别的准确率。

本发明实施例第一方面公开一种基于相似字符识别的文本识别方法，包括：

将待识别的文本通过科目识别模型，以识别出所述文本对应的若干个潜在科目；其中，所述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的科目识别模型；

根据所述潜在科目，对所述文本进行分词，获得所述潜在科目对应的若干个分词词语；

根据所述潜在科目对应的所述分词词语与所述潜在科目对应的分词库中的每个分词的字符相似度，计算所述潜在科目对应的分词库中的每个分词的置信度；

根据所述潜在科目对应的分词库中的每个分词的置信度，获得所述潜在科目的总置信度；

从所述若干个潜在科目中，获取所述总置信度最高的潜在科目，作为目标科目；

针对所述目标科目对应的所述分词词语，获取所述目标科目对应的分词库中置信度最高的分词；

判断所述置信度最高的分词的置信度是否高于某一预设的置信度阈值，若高于，将所述分词词语纠正至与所述置信度最高的分词一致，以获得最终的文本识别结果。

作为一种可选的实施方式，在本发明实施例第一方面中，所述针对所述目标科目对应的所述分词词语，获取所述目标科目对应的分词库中置信度最高的分词，包括：

针对所述目标科目对应的所述分词词语，按照所述置信度从高到低的顺序对所述分词库中的每个分词进行排序，获得排序结果；

根据所述排序结果，判断所述分词库中置信度最高的分词个数是否多于一个；

若判断出所述置信度最高的分词个数只有一个，获取所述分词库中置信度最高的分词；若判断出所述置信度最高的分词个数多于一个，根据预先配置的分词权重，获取所述置信度最高的分词中所述权重最高的一个分词，作为所述分词库中置信度最高的分词。

作为另一种可选的实施方式，在本发明实施例第一方面中，所述从所述若干个潜在科目中，获取所述总置信度最高的潜在科目，作为目标科目之后，所述方法还包括：

针对所述目标科目对应的所述分词词语，统计所述分词词语的出现频率，获取所述出现频率高于某一预设频率的高频词语；

判断所述高频词语是否已经存在于所述目标科目对应的分词库中；

若判断出所述高频词语不存在于所述目标科目对应的分词库中，在电子屏幕上输出是否更新所述目标科目对应的分词库的询问信息；

当所述询问信息得到确认后，将所述高频词语添加到所述目标科目对应的分词库中。

作为另一种可选的实施方式，在本发明实施例第一方面中，在获得最终的文本识别结果之后，所述方法还包括：

在所述电子屏幕上输出所述文本识别结果；

检测通过所述电子屏幕对所述文本识别结果包括的部分内容的涂抹操作；

获取用户针对所述部分内容输入的订正内容；

将所述部分内容替换为所述订正内容，完成人工校对。

作为另一种可选的实施方式，在本发明实施例第一方面中，所述将所述部分内容替换为所述订正内容，完成人工校对之后，所述方法还包括：

根据所述人工校对后获得的文本校对结果，获取所述文本校对结果的真实语义；

根据所述真实语义，判断所述文本校对结果的语言情感；

根据所述语言情感获取预先配置的对应于所述语言情感的声纹特征；

采用所述声纹特征对所述文本校对结果进行报读。

本发明实施例第二方面公开一种电子设备，包括：

识别单元，用于将待识别的文本通过科目识别模型，以识别出所述文本对应的若干个潜在科目；其中，所述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的科目识别模型；

分词单元，用于根据所述潜在科目，对所述文本进行分词，获得所述潜在科目对应的若干个分词词语；

第一计算单元，用于根据所述潜在科目对应的所述分词词语与所述潜在科目对应的分词库中的每个分词的字符相似度，计算所述潜在科目对应的分词库中的每个分词的置信度；

第二计算单元，用于根据所述潜在科目对应的分词库中的每个分词的置信度，获得所述潜在科目的总置信度；

第一获取单元，用于从所述若干个潜在科目中，获取所述总置信度最高的潜在科目，作为目标科目；

第二获取单元，用于针对所述目标科目对应的所述分词词语，获取所述目标科目对应的分词库中置信度最高的分词；

第一判断单元，用于判断所述置信度最高的分词的置信度是否高于某一预设的置信度阈值；

纠正单元，用于在第一判断单元判断出所述置信度最高的分词的置信度高于所述置信度阈值时，将所述分词词语纠正至与所述置信度最高的分词一致，以获得最终的文本识别结果。

作为一种可选的实施方式，在本发明实施例第二方面中，所述第二获取单元，包括：

排序子单元，用于针对所述目标科目对应的所述分词词语，按照所述置信度从高到低的顺序对所述目标科目对应的分词库中的每个分词进行排序，获得排序结果；

判断子单元，用于根据所述排序结果，判断所述分词库中置信度最高的分词个数是否多于一个；

获取子单元，用于在判断子单元判断出所述置信度最高的分词个数只有一个时，获取所述分词库中置信度最高的分词；以及，在判断子单元判断出所述置信度最高的分词个数多于一个时，根据预先配置的分词权重，获取所述置信度最高的分词中所述权重最高的一个分词，作为所述分词库中置信度最高的分词。

作为另一种可选的实施方式，在本发明实施例第二方面中，所述电子设备还包括：

第三计算单元，用于在所述第一获取单元从所述若干个潜在科目中获取所述总置信度最高的潜在科目作为目标科目之后，针对所述目标科目对应的所述分词词语，统计所述分词词语的出现频率，获取所述出现频率高于某一预设频率的高频词语；

第二判断单元，用于判断所述高频词语是否已经存在于所述目标科目对应的分词库中；

第一输出单元，用于在第二判断单元判断出所述高频词语不存在于所述目标科目对应的分词库中时，在电子屏幕上输出是否更新所述目标科目对应的分词库的询问信息；

第一处理单元，用于当所述询问信息得到确认后，将所述高频词语添加到所述目标科目对应的分词库中。

所述第一输出单元，用于在所述纠正单元获得最终的文本识别结果之后，在电子屏幕上输出所述文本识别结果；

检测单元，用于检测通过所述电子屏幕对所述文本识别结果包括的部分内容的涂抹操作；

第三获取单元，用于获取用户针对所述部分内容输入的订正内容；

第二处理单元，用于将所述部分内容替换为所述订正内容，完成人工校对。

第四获取单元，用于在第二处理单元将所述部分内容替换为所述订正内容，完成人工校对之后，根据所述人工校对后获得的文本校对结果，获取所述文本校对结果的真实语义；

第三判断单元，用于根据所述真实语义，判断所述文本校对结果的语言情感；

第五获取单元，用于根据所述语言情感获取预先配置的对应于所述语言情感的声纹特征；

第二输出单元，用于采用所述声纹特征对所述文本校对结果进行报读。

本发明实施例第三方面公开了另一种电子设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的任意一种基于相似字符识别的文本识别方法中的全部或部分步骤。

本发明实施例第四方面公开了一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的任意一种基于相似字符识别的文本识别方法中的全部或部分步骤。

本发明实施例第五方面公开一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行本发明实施例第一方面的任意一种基于相似字符识别的文本识别方法中的全部或部分步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，将待识别的文本通过科目识别模型后，可以识别出该文本对应的若干个潜在科目(如英语)，其中，上述科目识别模型是预先利用不同科目的文字和图像资料(如课本、辅导书)进行训练得到的；再根据上述潜在科目对该文本进行分词，获得该潜在科目对应的若干个分词词语(如英语课文中有实际意义的实词)；根据该潜在科目对应的分词词语与该潜在科目对应的分词库中的每个分词的字符相似度，可以计算出该潜在科目对应的分词库中的每个分词的置信度，并根据该置信度获得该潜在科目的总置信度；在此基础上，可以从上述若干个潜在科目中，获取总置信度最高的潜在科目，作为目标科目；进一步的，针对该目标科目对应的分词词语，可以获取该目标科目对应的分词库中置信度最高的分词，并判断其置信度是否高于某一预设的置信度阈值，若高于，将该分词词语纠正至与上述置信度最高的分词一致，以获得最终的文本识别结果。可见，实施本发明实施例，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种基于相似字符识别的文本识别方法的流程示意图；

图2是本发明实施例公开的另一种基于相似字符识别的文本识别方法的流程示意图；

图3是本发明实施例公开的又一种基于相似字符识别的文本识别方法的流程示意图；

图4是本发明实施例公开的一种电子设备的结构示意图；

图5是本发明实施例公开的另一种电子设备的结构示意图；

图6是本发明实施例公开的又一种电子设备的结构示意图；

图7是本发明实施例公开的又一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种基于相似字符识别的文本识别方法及电子设备，能够提高文本识别的准确率。以下进行结合附图进行详细描述。

请参阅图1，图1是本发明实施例公开的一种基于相似字符识别的文本识别方法的流程示意图。如图1所示，该文本识别方法可以包括以下步骤：

101、电子设备将待识别的文本通过科目识别模型，以识别出该文本对应的若干个潜在科目；其中，上述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的。

示例性的，电子设备可以包括具备文本识别功能的各类设备或系统(如家教机、点读机等)，本发明实施例不作具体限定。

在一个实施例中，电子设备可以在用户的触发(如用户通过语音触发或通过触碰电子屏幕上的某一区域触发)下获取待识别的文本图片，并对该文本图片进行预处理，再将预处理后获得的文本通过科目识别模型以识别出其对应的若干个潜在科目。

举例来说，电子设备可以在用户的触发(如用户通过语音触发或通过触碰电子屏幕上的某一区域触发)下，接收其他用户通过无线信号(如蓝牙、WLAN热点)传输过来的文本图片，并对该文本图片进行预处理和文本识别。

又举例来说，电子设备可以在用户的触发(如用户通过语音触发或通过触碰电子屏幕上的某一区域触发)下，控制自身的拍摄模组对某一纸张上的待识别的文本进行拍摄，从而获得文本图片，再对该文本图片进行预处理和文本识别。

其中，上述对文本图片的预处理可以包括灰度化、二值化、降噪、纠偏、字符切割、文本合并等步骤，本发明实施例不作具体限定。

102、电子设备根据上述潜在科目，对该文本进行分词，获得该潜在科目对应的若干个分词词语。

示例性的，电子设备可以根据潜在科目选择对应的自然语言处理模型，并将文本通过该模型，实现对应于科目的分词，即利用科目的用语习惯、专有名词等特征信息将文本划分为词语或短语。

103、电子设备根据上述潜在科目对应的分词词语与该潜在科目对应的分词库中的每个分词的字符相似度，计算该潜在科目对应的分词库中的每个分词的置信度。

104、电子设备根据上述潜在科目对应的分词库中的每个分词的置信度，获得该潜在科目的总置信度。

示例性的，当该潜在科目为语文时，分词可以包括单字、词语、汉语拼音；当该潜在科目为数学时，分词可以包括单字、词语、阿拉伯数字、希腊字母及其他数学符号。举例来说，语文中的汉语拼音n与数学中的希腊字母η是相似字符，在识别时容易被混淆误判；当分词词语中包括类似易混淆的字符时，可以分别根据该分词词语与语文分词库和数学分词库中的每个分词的字符相似度(例如某一类型的特征值之差)，计算每个分词的置信度；对语文分词库或数学分词库中的每个分词的置信度进行统计，可以获得语文或数学科目的总置信度。

105、电子设备从上述若干个潜在科目中，获取总置信度最高的潜在科目，作为目标科目。

106、电子设备针对该目标科目对应的分词词语，获取该目标科目对应的分词库中置信度最高的分词。

107、电子设备判断该置信度最高的分词的置信度是否高于某一预设的置信度阈值，若高于，执行步骤108；若不高于，结束本流程。

108、电子设备将上述分词词语纠正至与该置信度最高的分词一致，以获得最终的文本识别结果。

本发明实施例中，针对目标科目对应的每一个分词词语，都需要执行步骤106～步骤108以获得最终的文本识别结果。进一步的，由于该目标科目对应的分词词语可能存在重复，可以先进行去重复的操作，再根据步骤106～步骤108的执行结果批量纠正重复的分词词语。

作为一种可选的实施方式，电子设备与配套的电子笔通过无线信号(如蓝牙)连接，其中，该电子笔包括替芯，可以在纸张(如作业本)上进行书写；当该电子笔检测到用户处于书写状态中，并检测到超出预设的时间阈值的停顿时，可以认为用户完成了一部分文本的书写(如书写完毕一道作业题)，并向电子设备发出激活信号；电子设备获取该激活信号后，检测用户及上述纸张(如作业本)是否处于预设的位置范围；若是，控制自身的拍摄模组对该纸张上的文本进行拍摄，获得待识别的文本图片，并进行相应的预处理；在此基础上，电子设备执行步骤101～步骤108，获得纠正后的文本识别结果并在其电子屏幕上输出；进一步的，电子设备还可以在其电子屏幕上标注(如添加下划线)进行了纠正的分词词语，以供用户对比查看，确认其在纸张(如作业本)上书写的文本是否存在书写错误；更进一步的，电子设备还可以根据联网题库对文本识别结果进行搜索、匹配和批改，并及时向用户反馈批改结果(如作业题的正确率)，提升用户的学习效率。

作为另一种可选的实施方式，电子设备可以进入自动翻译模式，将待识别的文本通过以语言种类为科目的科目识别模型，以识别出该文本对应的若干种潜在语言种类；在此基础上，电子设备执行步骤102～步骤108，以确定该文本所属的目标语言种类，并获得最终的文本识别结果；根据上述目标语言种类和文本识别结果，电子设备可以利用预先存储的词典或通过网络连接调用翻译API对该文本识别结果进行翻译，获得翻译结果。

其中，实施上述实施方式，可以自动识别文本所属的语言种类，从而识别易被混淆误判的相似字符并根据语言种类进行纠正，提高文本识别的准确率；在此基础上，还可以便捷地对文本识别结果进行翻译，提升用户的使用体验。

进一步的，电子设备在进入自动翻译模式时，可以首先获取通过自身或外接的拍摄模组进行拍摄所得到的拍摄图片，并判断该拍摄图片中是否存在待识别的文本；当判断出存在时，电子设备对该拍摄图片进行切割，获得以待识别的文本为主体的切割图片，并进行相应的预处理；在此基础上，电子设备执行步骤101～步骤108，以确定该文本所属的目标语言种类，并获得最终的文本识别结果；根据上述目标语言种类和文本识别结果，电子设备可以利用预先存储的词典或通过网络连接调用翻译API对该文本识别结果进行翻译，获得翻译结果；结合图像处理技术，电子设备还可以将该翻译结果与原拍摄图片进行融合，获得包括翻译结果的拍摄图片，从而实现实景AR翻译的效果。

可见，实施图1所描述的文本识别方法，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

请参阅图2，图2是本发明实施例公开的另一种基于相似字符识别的文本识别方法的流程示意图。如图2所示，该文本识别方法可以包括以下步骤：

201、电子设备将待识别的文本通过科目识别模型，以识别出该文本对应的若干个潜在科目；其中，上述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的。

202、电子设备根据上述潜在科目，对该文本进行分词，获得该潜在科目对应的若干个分词词语。

203、电子设备根据上述潜在科目对应的分词词语与该潜在科目对应的分词库中的每个分词的字符相似度，计算该潜在科目对应的分词库中的每个分词的置信度。

204、电子设备根据上述潜在科目对应的分词库中的每个分词的置信度，获得该潜在科目的总置信度。

205、电子设备从上述若干个潜在科目中，获取总置信度最高的潜在科目，作为目标科目。

206、电子设备针对该目标科目对应的分词词语，按照置信度从高到低的顺序对该目标科目对应的分词库中的每个分词进行排序，获得排序结果。

207、电子设备根据上述排序结果，判断该目标科目对应的分词库中置信度最高的分词个数是否多于一个，若否，执行步骤208；若是，执行步骤209。

208、电子设备获取该目标科目对应的分词库中置信度最高的分词，并执行步骤210。

209、电子设备根据预先配置的分词权重，获取步骤207中所述置信度最高的分词中权重最高的一个，作为该目标科目对应的分词库中置信度最高的分词，并执行步骤210。

示例性的，上述预先配置的分词权重，可以通过大数据的方式分析不同科目的文字和图像资料(如课本、辅导书)，对分词的使用频率、实用场景进行统计而获得。

210、电子设备判断该置信度最高的分词的置信度是否高于某一预设的置信度阈值，若高于，执行步骤211～步骤213；若不高于，结束本流程。

211、电子设备将上述分词词语纠正至与该置信度最高的分词一致，以获得最终的文本识别结果。

212、电子设备针对上述目标科目对应的分词词语，统计其出现频率，获取出现频率高于某一预设频率的高频词语。

213、电子设备判断上述高频词语是否已经存在于该目标科目对应的分词库中，若否，执行步骤214～步骤215；若是，结束本流程。

214、电子设备在其电子屏幕上输出是否更新该目标科目对应的分词库的询问信息。

215、电子设备在上述询问信息得到确认后，将上述高频词语添加到该目标科目对应的分词库中。

作为一种可选的实施方式，电子设备可以定期(如每周一次)与其对应的服务设备进行通信。例如，电子设备在将上述高频词语添加到该目标科目对应的分词库中之后，可以同时将该高频词语上传到该电子设备对应的服务设备；在该服务设备对该高频词语进行二次筛选(如去重、语法检测)，并根据二次筛选的结果更新目标科目的分词库和科目识别模型之后，电子设备定期(如每周一次)从该服务设备下载新版本的分词库和科目识别模型；在此基础上，电子设备可以在用户的触发下，利用该新版本的分词库和科目识别模型进行文本识别，从而进一步提高文本识别的准确性。

进一步的，电子设备可以记录用户通过该电子设备上传的高频词语数量，并为用户发放相应的积分奖励，其中，上述积分奖励可用于兑换增值服务。通过实施上述实施方式，能够充分调动用户的积极性，及时根据电子设备的使用情况对每个科目对应的分词库进行更新，从而降低了数据维护和升级成本。

可见，实施图2所描述的文本识别方法，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

此外，实施图2所描述的文本识别方法，能够及时根据电子设备的使用情况对每个科目对应的分词库进行更新，从而降低了数据维护和升级成本，并进一步提高文本识别的准确率。

请参阅图3，图3是本发明实施例公开的又一种基于相似字符识别的文本识别方法的流程示意图。如图3所示，该文本识别方法可以包括以下步骤：

301、电子设备将待识别的文本通过科目识别模型，以识别出该文本对应的若干个潜在科目；其中，上述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的。

302、电子设备根据上述潜在科目，对该文本进行分词，获得该潜在科目对应的若干个分词词语。

303、电子设备根据上述潜在科目对应的分词词语与该潜在科目对应的分词库中的每个分词的字符相似度，计算该潜在科目对应的分词库中的每个分词的置信度。

304、电子设备根据上述潜在科目对应的分词库中的每个分词的置信度，获得该潜在科目的总置信度。

305、电子设备从上述若干个潜在科目中，获取总置信度最高的潜在科目，作为目标科目。

306、电子设备针对该目标科目对应的分词词语，按照置信度从高到低的顺序对该目标科目对应的分词库中的每个分词进行排序，获得排序结果。

307、电子设备根据上述排序结果，判断该目标科目对应的分词库中置信度最高的分词个数是否多于一个，若否，执行步骤308；若是，执行步骤309。

308、电子设备获取该目标科目对应的分词库中置信度最高的分词，并执行步骤310。

309、电子设备根据预先配置的分词权重，获取步骤307中所述置信度最高的分词中权重最高的一个，作为该目标科目对应的分词库中置信度最高的分词，并执行步骤310。

310、电子设备判断该置信度最高的分词的置信度是否高于某一预设的置信度阈值，若高于，执行步骤311～步骤319；若不高于，结束本流程。

311、电子设备将上述分词词语纠正至与该置信度最高的分词一致，以获得最终的文本识别结果。

312、电子设备在其电子屏幕上输出该文本识别结果。

313、电子设备检测通过上述电子屏幕对该文本识别结果包括的部分内容的涂抹操作。

在一个实施例中，电子设备可以在用户的触发下进入手动订正模式，检测用户通过电子屏幕对文本识别结果包括的部分内容的涂抹操作；电子设备对该部分内容进行高亮突出显示，以供用户确认是否手动订正该部分内容，从而实现灵活的修改。

314、电子设备获取用户针对上述部分内容输入的订正内容。

315、电子设备将上述部分内容替换为订正内容，完成人工校对。

316、电子设备根据上述人工校对后获得的文本校对结果，获取其真实语义。

317、电子设备根据该真实语义，判断上述文本校对结果的语言情感。

318、电子设备根据上述语言情感获取预先配置的对应于该语言情感的声纹特征。

示例性的，上述预先配置的声纹特征包括语言种类、性别、年龄、情绪的差异，对应于上述文本校对结果的真实语义及语言情感的差异；该声纹特征可以预先存储在电子设备中，也可以存储在其对应的服务设备中，以便于维护和更新；电子设备获取某一声纹特征后，利用该声纹特征进行人声合成，从而执行接下来的步骤319。

319、电子设备采用该声纹特征对上述文本校对结果进行报读。

在一个实施例中，电子设备可以是设置于某一学习环境(如教室、图书馆)内供教学使用的电子设备。当教师或学生希望利用其对某一文本(如需要学生听写的英语课文片段)进行报读时，可以将该文本的纸质资料放置于该电子设备能够识别的位置范围内；该电子设备通过自身或外接的拍摄模组对上述纸质资料进行拍摄，获得待识别的文本图片，再执行上述步骤301～步骤319，对该文本进行报读；进一步的，当该学习环境内存在多个用户(如多个学生)时，电子设备可以对环境音(包括多个用户产生的噪声以及报读回音)进行检测，并根据检测结果调整报读音量，从而照顾处于不同距离的用户的收听感受；更进一步的，当电子设备检测到一个用户位于某一特定的位置范围内时，可以触发模仿模式，获取该用户的声纹特征，并根据该声纹特征选择预先配置的声纹特征中最接近于该用户的一种，再并使用该声纹特征进行报读，从而促进用户与电子设备进行互动，提升学习的趣味性和用户学习的积极性。

其中，实施上述实施方式，能够以文本的真实语义为基础处理和输出文本识别结果，从而提升学习的趣味性和用户学习的积极性，有效提升用户的使用体验。

可见，实施图3所描述的文本识别方法，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

此外，实施图3所描述的文本识别方法，能够借助人工校对对文本识别结果进行灵活的修改，从而能够纠正错误的文本识别结果，进一步提高文本识别结果的准确率。

此外，实施图3所描述的文本识别方法，能够以文本的真实语义为基础处理和输出文本识别结果，从而提升学习的趣味性和用户学习的积极性，有效提升用户的使用体验。

请参阅图4，图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示，该电子设备可以包括：

识别单元401，用于将待识别的文本通过科目识别模型，以识别出该文本对应的若干个潜在科目；其中，上述科目识别模型是预先利用不同科目的文字和图像资料进行训练得到的；

分词单元402，用于根据上述潜在科目，对文本进行分词，获得潜在科目对应的若干个分词词语；

第一计算单元403，用于根据上述潜在科目对应的分词词语与该潜在科目对应的分词库中的每个分词的字符相似度，计算该潜在科目对应的分词库中的每个分词的置信度；

第二计算单元404，用于根据上述潜在科目对应的分词库中的每个分词的置信度，获得该潜在科目的总置信度；

第一获取单元405，用于从上述若干个潜在科目中，获取总置信度最高的潜在科目，作为目标科目；

第二获取单元406，用于针对该目标科目对应的分词词语，获取该目标科目对应的分词库中置信度最高的分词；

第一判断单元407，用于判断该置信度最高的分词的置信度是否高于某一预设的置信度阈值；

纠正单元408，用于在第一判断单元407判断出上述置信度最高的分词的置信度高于上述置信度阈值时，将上述分词词语纠正至与该置信度最高的分词一致，以获得最终的文本识别结果。

可见，实施图4所描述的电子设备，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

请一并参阅图5，图5是本发明实施例公开的另一种电子设备的结构示意图。其中，图5所示的电子设备是由图4所示的电子设备进行优化得到的。与图4所示的电子设备相比较，图5所示的电子设备还包括：

第三计算单元409，用于在第一获取单元405从上述若干个潜在科目中获取总置信度最高的潜在科目作为目标科目之后，针对该目标科目对应的分词词语，统计其出现频率，获取出现频率高于某一预设频率的高频词语；

第二判断单元410，用于判断上述高频词语是否已经存在于目标科目对应的分词库中；

第一输出单元411，用于在第二判断单元410判断出上述高频词语不存在于目标科目对应的分词库中时，在电子屏幕上输出是否更新该目标科目对应的分词库的询问信息；

第一处理单元412，用于当该询问信息得到确认后，将上述高频词语添加到目标科目对应的分词库中。

作为一种可选的实施方式，在图5所示的电子设备中，上述第二获取单元406，包括：

排序子单元4061，用于针对上述目标科目对应的分词词语，按照置信度从高到低的顺序对该目标科目对应的分词库中的每个分词进行排序，获得排序结果；

判断子单元4062，用于根据该排序结果，判断上述分词库中置信度最高的分词个数是否多于一个；

获取子单元4603，用于在判断子单元4062判断出置信度最高的分词个数只有一个时，获取该分词库中置信度最高的分词；以及，在判断子单元4062判断出置信度最高的分词个数多于一个时，根据预先配置的分词权重，获取置信度最高的分词中权重最高的一个分词，作为该分词库中置信度最高的分词。

可见，实施图5所描述的电子设备，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

此外，实施图5所描述的电子设备，能够及时根据电子设备的使用情况对每个科目对应的分词库进行更新，从而降低了数据维护和升级成本，并进一步提高文本识别的准确率。

请一并参阅图6，图6是本发明实施例公开的又一种电子设备的结构示意图。其中，图6所示的电子设备是由图5所示的电子设备进行优化得到的。与图5所示的电子设备相比较，图6所示的电子设备还包括：

上述第一输出单元411，用于在纠正单元408获得最终的文本识别结果之后，在电子屏幕上输出该文本识别结果；

检测单元413，用于检测通过上述电子屏幕对该文本识别结果包括的部分内容的涂抹操作；

在一个实施例中，检测单元413检测用户通过电子屏幕对文本识别结果包括的部分内容的涂抹操作，接下来，上述第一输出单元411对该部分内容进行高亮突出显示，以供用户确认是否手动订正该部分内容，从而实现灵活的修改。

第三获取单元414，用于获取用户针对上述部分内容输入的订正内容；

第二处理单元415，用于将上述部分内容替换为订正内容，完成人工校对；

第四获取单元416，用于在第二处理单元415将上述部分内容替换为订正内容，完成人工校对之后，根据该人工校对后获得的文本校对结果，获取该文本校对结果的真实语义；

第三判断单元417，用于根据该真实语义，判断上述文本校对结果的语言情感；

第五获取单元418，用于根据上述语言情感获取预先配置的对应于该语言情感的声纹特征；

第二输出单元419，用于采用该声纹特征对上述文本校对结果进行报读。

在一个实施例中，电子设备可以是设置于某一学习环境(如教室、图书馆)内供教学使用的电子设备。当教师或学生希望利用其对某一文本(如需要学生听写的英语课文片段)进行报读时，可以将该文本的纸质资料放置于该电子设备能够识别的位置范围内；该电子设备通过自身或外接的拍摄模组对上述纸质资料进行拍摄，获得待识别的文本图片，进行预处理和识别后，第二输出单元419对该文本进行报读；进一步的，当该学习环境内存在多个用户(如多个学生)时，电子设备可以对环境音(包括多个用户产生的噪声以及报读回音)进行检测，之后第二输出单元419根据检测结果调整报读音量，从而照顾处于不同距离的用户的收听感受；更进一步的，当电子设备检测到一个用户位于某一特定的位置范围内时，可以触发模仿模式，获取该用户的声纹特征；然后，第五获取单元418根据该声纹特征获取预先配置的声纹特征中最接近于该用户的一种，再由第二输出单元419使用该声纹特征进行报读，从而促进用户与电子设备进行互动，提升学习的趣味性和用户学习的积极性。

可见，实施图6所描述的电子设备，能够识别易被混淆误判的相似字符并根据科目信息进行纠正，从而提高文本识别的准确率。

此外，实施图6所描述的电子设备，能够借助人工校对对文本识别结果进行灵活的修改，从而能够纠正错误的文本识别结果，进一步提高文本识别结果的准确率。

此外，实施图6所描述的电子设备，能够以文本的真实语义为基础处理和输出文本识别结果，从而提升学习的趣味性和用户学习的积极性，有效提升用户的使用体验。

请参阅图7，图7是本发明实施例公开的又一种电子设备的结构示意图。如图7所示，该电子设备可以包括：

存储有可执行程序代码的存储器701；

与存储器701耦合的处理器702；

其中，处理器702调用存储器701中存储的可执行程序代码，执行图1～图3任意一种文本识别方法中的全部或部分步骤。

此外，本发明实施例进一步公开了一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行图1～图3任意一种文本识别方法中的全部或部分步骤。

此外，本发明实施例进一步公开一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机图1～图3任意一种文本识别方法中的全部或部分步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种基于相似字符识别的文本识别方法及电子设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于相似字符识别的文本识别方法，其特征在于，包括：

2.根据权利要求1所述的文本识别方法，其特征在于，所述针对所述目标科目对应的所述分词词语，获取所述目标科目对应的分词库中置信度最高的分词，包括：

3.根据权利要求1或2所述的文本识别方法，其特征在于，所述从所述若干个潜在科目中，获取所述总置信度最高的潜在科目，作为目标科目之后，所述方法还包括：

4.根据权利要求1或2所述的文本识别方法，其特征在于，在获得最终的文本识别结果之后，所述方法还包括：

在电子屏幕上输出所述文本识别结果；

获取用户针对所述部分内容输入的订正内容；

将所述部分内容替换为所述订正内容，完成人工校对。

5.根据权利要求4所述的文本识别方法，其特征在于，所述将所述部分内容替换为所述订正内容，完成人工校对之后，所述方法还包括：

根据所述真实语义，判断所述文本校对结果的语言情感；

采用所述声纹特征对所述文本校对结果进行报读。

6.一种电子设备，其特征在于，包括：

7.根据权利要求6所述的电子设备，其特征在于，所述第二获取单元，包括：

8.根据权利要求6或7所述的电子设备，其特征在于，所述电子设备还包括：

9.根据权利要求6或7所述的电子设备，其特征在于，所述电子设备还包括：

第一输出单元，用于在所述纠正单元获得最终的文本识别结果之后，在电子屏幕上输出所述文本识别结果；

10.根据权利要求9所述的电子设备，其特征在于，所述电子设备还包括：

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行权利要求1～5任一种所述基于相似字符识别的文本识别方法。