CN107203508A

CN107203508A - 盲文文件生成方法及系统

Info

Publication number: CN107203508A
Application number: CN201610152695.4A
Authority: CN
Inventors: 贾鹏; 李皞; 周月明
Original assignee: Fuji Xerox Industry Development China Co Ltd
Current assignee: Fuji Xerox Industry Development China Co Ltd
Priority date: 2016-03-17
Filing date: 2016-03-17
Publication date: 2017-09-26

Abstract

本发明提供了一种盲文文件生成方法，包括：获取目标文件的文本以获得文本内容信息；基于该文本内容信息对文本执行语句分词处理以获得语句分词信息；基于该语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息；基于该分词拼音信息对文本执行盲文转换处理以获得盲文点字信息，该盲文文件生成方法还包括校正处理，该校正处理包括以下至少一者：响应于用户选择对文本执行歧义校正以更新该文本内容信息，以用于后续语句分词处理；响应于用户选择对文本执行语句分词校正以更新该语句分词信息，以用于后续分词拼音标注处理；及响应于用户选择对文本执行分词拼音校正以更新该分词拼音信息，以用于后续盲文转换处理。

Description

盲文文件生成方法及系统

技术领域

本发明涉及盲文处理技术领域，尤其涉及盲文文件生成方法及系统。

背景技术

盲人作为一个特殊群体，需要社会给予更多的关心与照顾，盲人教育也在世界范围内得到广泛关注。中国在2014年明确规定盲人在参加高考要提供盲文试卷，并在2015年高考中正式提供盲文高考试卷，因此在日常的教学过程中，除了利用语音等技术手段提高教学质量以外，依然需要加强盲人学生的盲文学习水平。而另一方面，据北京青年报2014年6月20日《汉语盲文首个“数据库”开建》新闻消息，过去半个世纪中国正式出版的盲文读物只有约4000种，远不能满足盲人的学习需要。

因此，本领域迫切需要有便捷的方案来通过现有的明眼材料来生成盲文材料。

发明内容

以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览，并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。

根据本发明的一方面，提供了一种盲文文件生成方法，包括：

获取目标文件的文本以获得文本内容信息；

基于该文本内容信息对文本执行语句分词处理以获得语句分词信息；

基于该语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息；

基于该分词拼音信息对文本执行盲文转换处理以获得盲文点字信息，

其特征在于，该盲文文件生成方法还包括校正处理，该校正处理包括以下至少一者：

响应于用户选择对文本执行歧义校正以更新该文本内容信息，以用于后续语句分词处理；

响应于用户选择对文本执行语句分词校正以更新该语句分词信息，以用于后续分词拼音标注处理；及

响应于用户选择对文本执行分词拼音校正以更新该分词拼音信息，以用于后续盲文转换处理。

在一实例中，该获取目标文件的文本以获得文本内容信息包括：

对该目标文件执行扫描处理以生成该目标文件的目标文件图像；以及

对该目标文件图像执行OCR处理以生成该文本内容信息。

在一实例中，执行该语句分词校正包括：

基于该文本内容信息和该语句分词信息生成分词校正图像，该分词校正图像中包括分词标记；

打印该分词校正图像以获得分词校正图像的纸质文件；

对经用户修改了分词标记的该分词校正图像的纸质文件执行扫描处理以生成经修改的分词校正图像；

识别该经修改的分词校正图像中的分词标记以获得经校正的分词方案；以及

基于经校正的分词方案更新该语句分词信息。

在一实例中，该分词标记为位于文字下方的下划线，位于同一下划线上的文字被分为一个词语，其中该分词标记的识别包括基于修改后的下划线将位于同一下划线上的文字分为一个词语。

在一实例中，该分词校正图像还包括位于文字和初始下划线下方的手工修改区域，该用户通过在该手工修改区域中添加下划线来修改该分词标记。

在一实例中，该分词校正图像还包括指示该语句分词信息在数据库中的存储路径的路径图像，其中执行该语句分词校正还包括：

识别该经修改的分词校正图像中的该路径图像以获得该存储路径；以及

基于该存储路径定位所要更新的该语句分词信息。

在一实例中，该路径图像为条形码或二维码中的任意一者。

在一实例中，执行该分词拼音校正包括：

基于该文本内容信息、该语句分词信息和该分词拼音信息生成拼音校正图像，该拼音校正图像中包括关于每个多音字的多音选项；

打印该拼音校正图像以获得拼音校正图像的纸质文件；

对经用户选择了多音选项的该拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像；

识别该经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案；以及

基于经校正的拼音方案更新该分词拼音信息。

在一实例中，每个多音字的多音选项位于相应多音字的正上方，每个多音选项前方设有复选框，用户通过对多音选项的复选框的涂黑来选择多音选项，其中该多音选项的选择包括基于各多音字上方的各多音选项前方的复选框的颜色识别来确定各多音字的拼音。

在一实例中，每个多音字正上方最靠近的多音选项为相应多音字的默认选项，在用户没有涂黑一多音字的任何复选框的情况下，被确定为该多音字的拼音。

在一实例中，该拼音校正图像还包括指示该分词拼音信息在数据库中的存储路径的路径图像，其中执行该分词拼音校正还包括：

识别该经选择的拼音校正图像中的该路径图像以获得该存储路径；以及

基于该存储路径定位所要更新的该分词拼音信息。

在一实例中，该路径图像为条形码或二维码中的任意一者。

在一实例中，执行该语句分词校正包括：

基于该文本内容信息和该语句分词信息生成分词校正图像以经由用户界面显示，该分词校正图像中包括分词标记；

经由该用户界面接收用户对该分词标记的修改；

基于经修改的分词标记获得经校正的分词方案；以及

基于经校正的分词方案更新该语句分词信息。

在一实例中，执行该分词拼音校正包括：

基于该文本内容信息、该语句分词信息和该分词拼音信息生成拼音校正图像以经由用户界面显示；

经由该用户界面接收用户对各多音字的多音选项的选择；

基于用户对各多音字的多音选项的选择获得经校正的拼音方案；以及

基于经校正的拼音方案更新该分词拼音信息。

在一实例中，执行该歧义校正包括：

基于该文本内容信息查找同音词歧义数据库以确定有同音歧义的同音词；

建议各同音词的哑音定字注释方案以经由用户界面显示；

经由该用户界面接收用户对各同音词的哑音定字注释方案的编辑以确定经校正的哑音定字注释方案；以及

基于校正的哑音定字注释方案更新该文本内容信息。

根据本发明的另一方面，提供了一种盲文文件生成系统，包括：

获取模块，用于获取目标文件的文本以获得文本内容信息；

分词模块，用于基于该文本内容信息对文本执行语句分词处理以获得语句分词信息；

拼音标注模块，用于基于该语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息；

转换模块，用于基于该分词拼音信息对文本执行盲文转换处理以获得盲文点字信息，

其特征在于，该盲文文件生成系统还包括以下至少一者：

歧义校正模块，用于响应于用户选择对文本执行歧义校正以更新该文本内容信息，以用于后续语句分词处理；

分词校正模块，用于响应于用户选择对文本执行语句分词校正以更新该语句分词信息，以用于后续分词拼音标注处理；及

拼音校正模块，用于响应于用户选择对文本执行分词拼音校正以更新该分词拼音信息，以用于后续盲文转换处理。

在一实例中，获取模块包括：

扫描模块，用于对该目标文件执行扫描处理以生成该目标文件的目标文件图像；以及

OCR模块，用于对该目标文件图像执行OCR处理以生成该文本内容信息。

在一实例中，该系统还包括打印模块，以及该获取模块还包括扫描模块和图像识别模块，

其中该分词校正模块包括第一图像创建模块和第一更新模块，该第一图像创建模块用于基于该文本内容信息和该语句分词信息生成分词校正图像，该分词校正图像中包括分词标记，

该打印模块用于打印该分词校正图像以获得分词校正图像的纸质文件，

该扫描模块用于对经用户修改了分词标记的该分词校正图像的纸质文件执行扫描处理以生成经修改的分词校正图像，以及该图像识别模块用于识别该经修改的分词校正图像中的分词标记以获得经校正的分词方案，

该第一更新模块用于基于经校正的分词方案更新该语句分词信息。

在一实例中，该分词标记为位于文字下方的下划线，位于同一下划线上的文字被分为一个词语，其中该图像识别模块基于修改后的下划线将位于同一下划线上的文字分为一个词语。

在一实例中，该分词校正图像还包括指示该语句分词信息在数据库中的存储路径的路径图像，

其中该图像识别模块还用于识别该经修改的分词校正图像中的该路径图像以获得该存储路径，

该第一更新模块基于该存储路径定位所要更新的该语句分词信息。

在一实例中，该路径图像为条形码或二维码中的任意一者。

在一实例中，还包括打印模块，以及该获取模块还包括扫描模块和图像识别模块，

其中该拼音校正模块包括第二图像创建模块和第二更新模块，该第二图像创建模块用于基于该文本内容信息、该语句分词信息和该分词拼音信息生成拼音校正图像，该拼音校正图像中包括关于每个多音字的多音选项，

该打印模块用于打印该拼音校正图像以获得拼音校正图像的纸质文件，

该扫描模块用于对经用户选择了多音选项的该拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像，以及该图像识别模块，用于识别该经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案，

该第二更新模块用于基于经校正的拼音方案更新该分词拼音信息。

在一实例中，每个多音字的多音选项位于相应多音字的正上方，每个多音选项前方设有复选框，用户通过对多音选项的复选框的涂黑来选择多音选项，其中该图像识别模块基于各多音字上方的各多音选项前方的复选框的颜色识别来确定各多音字的拼音。

在一实例中，该拼音校正图像还包括指示该分词拼音信息在数据库中的存储路径的路径图像，

其中该图像识别模块还用于识别该经选择的拼音校正图像中的该路径图像以获得该存储路径，

该更新模块基于该存储路径定位所要更新的该分词拼音信息。

在一实例中，该路径图像为条形码或二维码中的任意一者。

在一实例中，还包括用于与用户交互的用户界面，

该分词校正模块包括：

第一图像创建模块，用于基于该文本内容信息和该语句分词信息生成分词校正图像以经由该用户界面显示，该分词校正图像中包括分词标记，其中该用户界面接收用户对该分词标记的修改以获得经校正的分词方案；以及

第一更新模块，用于基于经校正的分词方案更新该语句分词信息。

在一实例中，还包括用于与用户交互的用户界面，

该拼音校正模块包括：

第二图像创建模块，用于基于该文本内容信息、该语句分词信息和该分词拼音信息生成拼音校正图像以经由该用户界面显示，其中该用户界面接收用户对各多音字的多音选项的选择以获得经校正的拼音方案；以及

第二更新模块，用于基于经校正的拼音方案更新该分词拼音信息。

在一实例中，还包括用于与用户交互的用户界面，

该歧义校正模块包括：

查找模块，用于基于该文本内容信息查找同音词歧义数据库以确定有同音歧义的同音词；

哑音定字建议模块，用于建议各同音词的哑音定字注释方案以经由该用户界面显示，其中该用户界面接收用户对各同音词的哑音定字注释方案的编辑以确定经校正的哑音定字注释方案；以及

第三更新模块，用于基于校正的哑音定字注释方案更新该文本内容信息。

附图说明

在结合以下附图阅读本公开的实施例的详细描述之后，能够更好地理解本发明的上述特征和优点。在附图中，各组件不一定是按比例绘制，并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。

图1是示出了根据本发明的一方面的盲文文件生成系统的框图；

图2是示出了分词校正图像的示意图；

图3是示出了通过用户界面执行分词方案修改的人机交互过程的示意图；

图4是示出了拼音校正图像的示意图；

图5是示出了通过用户界面执行拼音方案修改的人机交互过程的示意图；

图6是示出了盲文文件的打印输出的一个示例的示意图；

图7是示出了根据本发明的实施例的盲文文件生成系统的一种架构的示意图；以及

图8是示出了根据本发明的一方面的盲文文件生成方法的流程图。

具体实施方式

以下结合附图和具体实施例对本发明作详细描述。注意，以下结合附图和具体实施例描述的诸方面仅是示例性的，而不应被理解为对本发明的保护范围进行任何限制。

图1是示出了根据本发明的一方面的盲文文件生成系统1000的框图。如图1所示，系统1000可包括获取模块1110、打印模块1120、UI模块1130、分词模块1140、拼音标注模块1150、转换模块1160、歧义校正模块1170、分词校正模块1180、拼音校正模块1190、以及数据库1200。注意，这里示出的模块并不是每一个都是必需的，可以根据需要省去一个或多个模块，或者可以根据实现的需要增添一个或多个必要的模块。

获取模块1110可用于获取目标文件的文本以获得文本内容信息。目标文件可以是用户希望生成盲文的文件，该目标文件可以是已经存储在数据库1200中的电子文件，或者也可以是纸质的明眼文稿。

获取模块1110可包括扫描模块1112和OCR识别模块1114。在此实例中可以处理目标文件是纸质的明眼文稿的情形。例如，扫描模块1112可对纸质的目标文件执行扫描处理以生成该目标文件的目标文件图像，然后OCR模块1114可扫描该目标文件图像以识别出其中的文字信息，这些文字信息作为目标文件的文本内容信息被生成，并且可以存储在数据库1200中。

在获得文本内容信息后，分词模块1140可基于该文本内容信息对文本执行语句分词处理，以获得语句分词信息。分词模块1140可根据汉语分词规则、盲文分词连写规则、以及包含词频词性信息的汉语语料数据库对文本进行分词。所获得的分词方案作为语句分词信息可以存储在数据库1200中。

汉语盲文为表音型文字，当汉语字词转换成盲文之后，仅保留汉语的读音部分。换言之，盲文转换是以汉语字词的读音为基础的，因此，还需要得到文本的拼音信息。

为此，在获得分词方案后，拼音标注模块1150可基于语句分词信息对文本执行分词拼音标注处理，以获得分词拼音信息。例如，拼音标注模块1150可以基于分词处理的结果，查询汉语语料数据库，结合词频词性信息，完成分词拼音标注。所标注的分词拼音作为分词拼音信息可存储在数据库1200中。

然后，转换模块1160可基于分词拼音信息对文本执行盲文转换以获得盲文点字信息。在盲文领域，汉语盲文点字方案包括现行盲文或双拼盲文。现行盲文方案可进一步选择盲文是否全部标调。不选择全部标调，则根据盲文词库统计的现行盲文标调方案标调。这些选择皆可以作为盲文文件生成参数由用户进行设置。

实践中，转换模块1160可基于盲文文件生成参数，结合汉语文本，分词及分词拼音信息，根据盲文的拼音编码表，拼法规则和标调规则将各分词的拼音转换成盲文点字编码，以获得盲文点字信息。

双拼盲文的转换过程中，还需要使用汉语分词的文本信息进行特殊处理。如轻声“的”、“地”、“得”，极常用同音同调词“他”、“她”、“它”的同音分化以及哑音定字的特殊转化处理。重复音节和重复音组如“哥哥”、“向前，向前，向前！”以及常用词尾和词语采用对应的简写方法来表示。汉语中的标点符号，阿拉伯数字以及英文字符则直接根据盲文编码表生成对应的盲文点字编码。编码转换完成以后可以获得盲文点字信息，该盲文点字信息可存储在数据库1200中。

盲文电子文件文件格式包括但不限于.BRL文件。用户可选择输出方式，包括但不限于：打印为纸质文档或输出为电子文件到USB，Email，MailBox等等。

特别地，本发明关注汉语到盲文翻译过程中必不可少的用户干预过程，提供一种消除汉语到盲文翻译过程中特有的分词歧义、同音歧义以及多音歧义的解决方案。

为此，本发明提供了歧义校正模块1170、分词校正模块1180、拼音校正模块1190。

歧义校正模块1170可用于响应于用户选择对文本执行歧义校正以更新文本内容信息。特别地，歧义校正模块1170可主要用于消除同音歧义。如前所述，汉语盲文为表音型文字，当汉语字词转换成盲文之后，仅保留了汉语的读音部分，而汉语明文所包含的字形内容已缺失，所以无法单独通过盲文来分辨同音字词。

例如语句A：甲到达“中点”的同时乙恰好到达“终点”。

这里的“中点”和“终点”为同音词，且会产生同音歧义，使得盲人读者无法辨别。因此，需要消除同音歧义。

歧义校正模块1170可包括查找模块1172、哑音定字建议模块1174和第三更新模块1176。查找模块1172可基于文本内容信息查找同音词歧义数据库，以确定有同音歧义的同音词。例如，以上文语句A为例，“中点”和“终点”皆为有同音歧义的同音词。哑音定字建议模块1174可建议各同音词的哑音定字注释方案以经由UI模块1130显示，例如UI模块1130可以是多功能机的控制面板。用户可通过文本编辑的方式增加、修改或删除注释方案。例如，针对上述语句A，哑音定字注释方案为：甲到达中(间)点的同时乙恰好到达终(了)点。

除了同音歧义，古文中的一些单字词也可以采用类似的方式来明确含义。

例如语句B：两岸猿声啼不住。

为例消除歧义，可采用哑音定字注释方案：两岸猿(猴)声啼(叫)不住。

第三更新模块1176可基于校正的哑音定字注释方案更新文本内容信息，从而消除文本内容中的文字歧义。

分词校正模块1180主要对分词模块1140自动获得的分词方案进行校正，因为分词模块1140自动执行的分词方案并不一定完全正确。为了校正分词方案，首先需要向用户展示分词模块1140的分词方案，然后再接受用户对分词方案的修改。

在此有两种实施方式，第一种实施方式是利用打印模块1120。分词校正模块1180包括第一图像创建模块1182和第一更新模块1184。第一图像创建模块1182可基于文本内容信息和语句分词信息生成分词校正图像，该分词校正图像中可包括分词标记用以指示分词方案。作为示例，分词标记可以是位于文字下方的下划线，位于同一下划线上的文字被分为一个词语。图2中示出了作为示例的分词校正图像。

打印模块1120可打印出该分词校正图像以获得其纸质文件。然后用户可以在该纸质文件的图像上修改分词标记。例如，在图2中，在文字和初始下划线的下方还包括由虚线框表示的手工修改区域，用户可以在该手工修改区域中添加下划线以修改分词方案。

用户手工修改后，扫描模块1112对该纸质文件进行扫描以生成经修改的分词校正图像，然后图像识别模块1116可识别该经用户修改的分词校正图像中的分词标记，例如手工修改区域中的下划线，获得经校正的分词方案，即在经校正的分词方案中将手工修改区域中的同一下划线上的文字分为一个词语，以修改最初的分词方案。实践中，图像识别模块1116可利用图像处理技术识别指定修改区域内的划线信息并对比记录的原始各分词及汉字的位置信息，从而获得哪些字处于同一下划线上从而应被分为一个词语的信息。

然后，第一更新模块1184可基于经校正的分词方案来更新存储在数据库1200中的语句分词信息。在特定实例中，为了定位语句分词信息在数据库1200中的存储位置，分词校正图像中还可包括指示语句分词信息在数据库1200中的存储路径的路径图像，例如条形码或二维码等等。图2中示出了路径图像为二维码的示例。图像识别模块1116可识别经修改的分词校正图像中的该路径图像以获得语句分词信息的存储路径，第一更新模块1184可基于该存储路径在数据库1200中定位所要更新的语句分词信息。

作为示例，图2中所示的分词校正图像还包括手工修改示例以引导用户完成分词方案的修改。

第二种向用户展示分词方案的方式是直接利用UI模块1130。第一图像创建模块1182可基于文本内容信息和语句分词信息生成分词校正图像以直接经由用户界面显示。此时，用户经由用户界面对分词标记的修改来修改分词方案。即，UI模块1130接收用户对分词标记的修改以获得经校正的分词方案，第一更新模块1184可基于经校正的分词方案更新语句分词信息。

在此示例中第一图像创建模块1182创建的分词校正图像与先前类似，皆是通过分词标记来体现分词方案。但是在用户界面中，可以有更加灵活多样形式的分词标记，例如，下划线、斜杠、空格等等。用户可以自行对分词标记进行设置。

例如，分词模块1140自动给出的分词方案如下：

上海市长江路

假设用户实际想表示的是：

上海市长江路

图3中示出了分词方案的人机交互修改过程。

拼音校正模块1190可响应于用户选择对文本执行分词拼音校正以更新分词拼音信息。拼音校正模块1190主要对拼音标注模块1150自动获得的拼音方案进行校正，因为拼音标注模块1150自动执行的拼音方案并不一定完全正确。为了校正拼音方案，首先需要向用户展示拼音标注模块1140的拼音方案，然后再接受用户对拼音方案的修改。

在此有两种实施方式，第一种实施方式是也利用打印模块1120和获取模块1110。拼音校正模块1190可包括第二图像创建模块1192和第二更新模块1194。第二图像创建模块1192可基于文本内容信息、语句分词信息和分词拼音信息生成拼音校正图像，该拼音校正图像中包括关于每个多音字的多音选项。作为示例，每个多音字的多音选项位于相应多音字的正上方，每个多音选项前方设有复选框，复选框中被涂黑则表示该复选框对应的拼音选项被选中。图4中示出了作为示例的拼音校正图像。

打印模块1120可打印拼音校正图像以获得拼音校正图像的纸质文件，然后用户可以在该纸质文件的图像上选择多音选项。例如，在图4中，用户可通过对多音选项前方的复选框的涂黑来选择多音选项。

用户选择后，扫描模块1112可对经用户选择了多音选项的拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像，然后图像识别模块1116可识别经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案，即将复选框被涂黑的拼音选项确定为所对应文字的拼音。实践中，图像识别模块1116可利用图像处理技术识别哪些复选框被涂黑，利用被涂黑的复选框的位置信息确定对应的文字，从而将该对应文字的拼音确定为此被选中的拼音选项。

在特定示例中，每个多音字正上方最靠近的多音选项为相应多音字的默认选项，在用户没有涂黑一多音字的任何复选框的情况下，被确定为该多音字的拼音。

然后，第二更新模块1194可基于经校正的拼音方案更新分词拼音信息。在特定实例中，为了定位分词拼音信息在数据库1200中的存储位置，拼音校正图像中还可包括指示分词拼音信息在数据库1200中的存储路径的路径图像，例如条形码或二维码等等。图4中示出了路径图像为二维码的示例。图像识别模块1116可识别经选择的拼音校正图像中的该路径图像以获得分词拼音信息的存储路径，第二更新模块1194可基于该存储路径在数据库1200中定位所要更新的分词拼音信息。

作为示例，图4中所示的拼音校正图像还包括手工修改示例以引导用户完成拼音方案的修改。

第二种向用户展示拼音方案的方式是直接利用UI模块1130。第二图像创建模块1192可基于文本内容信息和语句分词信息生成分词校正图像以直接经由用户界面显示。此时，用户经由用户界面对分词标记的修改来修改分词方案。即，UI模块1130接收用户对分词标记的修改以获得经校正的分词方案，第一更新模块1184可基于经校正的分词方案更新语句分词信息。

第二种向用户展示拼音方案的方式是直接利用UI模块1130。第二图像创建模块1192可基于文本内容信息、语句分词信息和分词拼音信息生成拼音校正图像以直接经由用户界面显示，该拼音校正图像中可包括关于每个多音字的多音选项。此时，用户经由用户界面对多音选项的选择来确定多音字的拼音。即，UI模块1130接收用户对多音字的多音选项的选择以获得经校正的拼音方案，第二更新模块1194可基于经校正的拼音方案更新分词拼音信息。

在此示例中第二图像创建模块1192创建的拼音校正图像大体与先前类似，皆需要用户能够对拼音选项进行选择。但是在用户界面中，可以有更加灵活多样形式的选项选择形式，图5示出了拼音选项选择的人机交互界面的示例。

在图5所示的示例中，最初所有的“好”字都被标注了第四音调，用户通过点击“好”字可以出现两个选项，从而可以选择所希望的拼音选项，例如第三音调的读音。

经过上述人为参与的校正过程，转换得到的盲文点字信息是相对准确的，而且根据需要可以进行多次上述校正过程。转换后的盲文点字信息可以预定的盲文电子文件格式输出。作为示例，可以打印出包含文本、拼音标注以及盲文点字的纸质文稿以供校对或盲文学习之用，如图6所示。

上文描述的盲文文件生成系统1000可以是集中式的，即所有的模块都集中在一个设备上，或者也可以是分布式的，即分布在不同的设备上。而且，各模块之间也可以是相互共用的，例如歧义校正模块1170、分词校正模块1180和拼音校正模块1190的第一更新模块1176、第二更新模块1184和第三更新模块1194可以是共用的同一更新模块。分词校正模块1180和拼音校正模块1190的第一图像创建模块1182和第二图像创建模块1192可以是共用的同一图像创建模块。

图7示出了根据一实施例的盲文文件生成系统7000的架构。如图7所示，盲文文件7000生成系统可以由多功能机7100和服务器7200构成，两者可通过互联网或局域网进行连接。

在图7所示的架构中，图1中描述的扫描模块、OCR模块、图像识别模块、打印模块、UI模块皆可位于多功能机7100上，而分词模块、拼音标注模块、转换模块、歧义校正模块、分词校正模块、拼音校正模块以及数据库可位于服务器7200上。

在另一实施例中，盲文文件生成系统可以完全集中在多功能机上，由此可以不依赖网络环境。

在其他实施例中，用于显示校正图像的用户界面可以通过类似智能手机的大屏移动终端。例如在校正图像中显示用以指示存储位置信息的路径图像，例如二维码，用户可通过智能手机的摄像头扫描该路径图像来访问所要校正的信息，并通过智能手机自身的用户界面来替代盲文文件生成系统自带的用户界面。

另外移动终端设备通过拍照等方式部分替换前一实施例中的多功能机文件扫描功能，并能够将OCR功能部署在移动终端上。生成的盲文文件也可以通过通信手段保存输出到移动终端上。

图8是示出了根据本发明的一方面的盲文文件生成方法8000的流程图。如图8所示，盲文文件生成方法8000可包括以下步骤。

在步骤8100，获取目标文件的文本以获得文本内容信息。

在一实例中，该目标文件可以是纸质的文件，此时，获取过程可包括对目标文件执行扫描处理以生成该目标文件的目标文件图像，然后对目标文件图像执行OCR处理以生成该文本内容信息。

在步骤8100后，盲文文件生成方法8000可以选择性地包括歧义校正步骤8200，在此步骤中，可响应于用户选择对文本执行歧义校正以更新文本内容信息。

步骤8200具体可包括同音歧义校正。在同音歧义校正中，首先基于文本内容信息查找同音词歧义数据库以确定有同音歧义的同音词，然后建议各同音词的哑音定字注释方案以经由用户界面显示，经由用户界面接收用户对各同音词的哑音定字注释方案的编辑以确定经校正的哑音定字注释方案，然后基于校正的哑音定字注释方案更新所述文本内容信息。类似地，步骤8200还可包括古文单字歧义校正。

在步骤8300，可基于文本内容信息对文本执行语句分词处理以获得语句分词信息。

实践中，在文本内容信息的基础上，可根据汉语分词规则，盲文分词连写规则，以及包含词频词性信息的汉语语料数据库进行分词。

在步骤8300之后，盲文文件生成方法8000可以选择性地包括分词校正步骤8400，在此步骤中，响应于用户选择对文本执行语句分词校正以更新语句分词信息。

在步骤8400的一实施例中，可基于文本内容信息和语句分词信息生成分词校正图像，其中包括分词标记。具体而言，这里的图像生成是结构化成像，即在指定的位置上生成包含服务器上文件存储路径信息，手工修改示例，文本内容，分词标记即分词下划线。然后，打印分词校正图像以获得分词校正图像的纸质文件，对经用户修改了分词标记的分词校正图像的纸质文件执行扫描处理以生成经修改的分词校正图像，再通过识别所述经修改的分词校正图像中的分词标记以获得经校正的分词方案，最后可基于经校正的分词方案更新语句分词信息。

在此实施例中，分词校正图像还可包括指示语句分词信息在数据库中的存储路径的路径图像，通过识别经修改的分词校正图像中的路径图像以获得存储路径，然后基于该存储路径定位所要更新的语句分词信息。

在另一实施例中，可以不通过纸质文件来接收用户选择。在此实施例中，可基于文本内容信息和语句分词信息生成分词校正图像以经由用户界面显示，该分词校正图像中包括分词标记，然后经由用户界面接收用户对分词标记的修改，基于经修改的分词标记获得经校正的分词方案，最后基于经校正的分词方案更新所述语句分词信息。

在步骤8500，基于语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息。

实践中，在分词处理结果的基础上，查询汉语料数据库，结合词频词性信息，完成分词拼音标注。分词有多音歧义的场合，则同时记录歧义部分多音选项。

在步骤8500之后，盲文文件生成方法8000可以选择性地包括拼音校正步骤8600，在此步骤中，响应于用户选择对文本执行分词拼音校正以更新分词拼音信息。

在步骤8600的一实施例中，可基于文本内容信息、语句分词信息和分词拼音信息生成拼音校正图像，该拼音校正图像中包括关于每个多音字的多音选项，打印该拼音校正图像以获得拼音校正图像的纸质文件。对经用户选择了多音选项的拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像，通过识别经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案，最后基于经校正的拼音方案更新分词拼音信息。

在此实施例中，拼音校正图像还可包括指示分词拼音信息在数据库中的存储路径的路径图像，通过识别经选择的拼音校正图像中的该路径图像以获得所述存储路径，由此基于该存储路径定位所要更新的分词拼音信息。

在另一实施例中，可以不通过纸质文件来接收用户选择。在此实施例中，可基于文本内容信息、语句分词信息和分词拼音信息生成拼音校正图像以经由用户界面显示，经由用户界面接收用户对各多音字的多音选项的选择，然后基于用户对各多音字的多音选项的选择获得经校正的拼音方案，再基于经校正的拼音方案更新所述分词拼音信息。

在步骤8700，基于分词拼音信息对文本执行盲文转换处理以获得盲文点字信息。

在盲文领域，汉语盲文点字方案包括现行盲文或双拼盲文。现行盲文方案可进一步选择盲文是否全部标调。不选择全部标调，则根据盲文词库统计的现行盲文标调方案标调。这些选择皆可以作为盲文文件生成参数由用户进行设置。

实践中，可基于盲文文件生成参数，结合汉语文本，分词及分词拼音信息，根据盲文的拼音编码表，拼法规则和标调规则将各分词的拼音转换成盲文点字编码，以获得盲文点字信息。

尽管为使解释简单化将上述方法图示并描述为一系列动作，但是应理解并领会，这些方法不受动作的次序所限，因为根据一个或多个实施例，一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。

根据本发明的方案，通过人机交互方式消除歧义后，能够大幅提高汉语文本到盲文点字转换的正确性，从而提供高质量的盲文文件。通过基于汉语语料库，盲文分词连写规则和拼音标注的自动处理，用户只需要关注较少的引起歧义的部分，从而使普通用户也能完成盲文生成过程中的校正工作。用户可以根据自身的操作习惯，选择多种歧义处理方式来完成汉语文本到盲文文件的生成处理。降低了完成该项工作所需的学习成本。

拥有上述功能的多功能机可以配置在社区文印中心或便利店等公共场所，用户可以方便地实现明眼文稿到盲文文件的生成处理而不需要配置专门的设备和软件，节约了用户的使用成本。

而且打印输出的包括汉语文字，拼音以及盲文点字的纸质文件，可以帮助非视障人群学习盲文点字，了解盲文的书写规则，从而提升社会对盲文的关注度。

本领域技术人员将可理解，信息、信号和数据可使用各种不同技术和技艺中的任何技术和技艺来表示。例如，以上描述通篇引述的数据、指令、命令、信息、信号、位(比特)、码元、和码片可由电压、电流、电磁波、磁场或磁粒子、光场或光学粒子、或其任何组合来表示。

本领域技术人员将进一步领会，结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性，各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性，但这样的实现决策不应被解读成导致脱离了本发明的范围。

结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器，但在替换方案中，该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中，存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中，处理器和存储介质可作为分立组件驻留在用户终端中。

在一个或多个示例性实施例中，所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品，则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者，其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定，这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如，如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来，则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟，其中盘(disk)往往以磁的方式再现数据，而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。

对本公开的各种修改对本领域技术人员来说都将是显而易见的，且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此，本公开并非旨在被限定于本文中所描述的示例和设计，而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims

1.一种盲文文件生成方法，包括：

获取目标文件的文本以获得文本内容信息；

基于所述文本内容信息对文本执行语句分词处理以获得语句分词信息；

基于所述语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息；

基于所述分词拼音信息对文本执行盲文转换处理以获得盲文点字信息，

其特征在于，所述盲文文件生成方法还包括校正处理，所述校正处理包括以下至少一者：

响应于用户选择对文本执行歧义校正以更新所述文本内容信息，以用于后续语句分词处理；

响应于用户选择对文本执行语句分词校正以更新所述语句分词信息，以用于后续分词拼音标注处理；及

响应于用户选择对文本执行分词拼音校正以更新所述分词拼音信息，以用于后续盲文转换处理。

2.如权利要求1所述的盲文文件生成方法，其特征在于，所述获取目标文件的文本以获得文本内容信息包括：

对所述目标文件执行扫描处理以生成所述目标文件的目标文件图像；以及

对所述目标文件图像执行OCR处理以生成所述文本内容信息。

3.如权利要求1所述的盲文文件生成方法，其特征在于，执行所述语句分词校正包括：

基于所述文本内容信息和所述语句分词信息生成分词校正图像，所述分词校正图像中包括分词标记；

打印所述分词校正图像以获得分词校正图像的纸质文件；

对经用户修改了分词标记的所述分词校正图像的纸质文件执行扫描处理以生成经修改的分词校正图像；

识别所述经修改的分词校正图像中的分词标记以获得经校正的分词方案；以及

基于经校正的分词方案更新所述语句分词信息。

4.如权利要求3所述的盲文文件生成方法，其特征在于，所述分词标记为位于文字下方的下划线，位于同一下划线上的文字被分为一个词语，其中所述分词标记的识别包括基于修改后的下划线将位于同一下划线上的文字分为一个词语。

5.如权利要求4所述的盲文文件生成方法，其特征在于，所述分词校正图像还包括位于文字和初始下划线下方的手工修改区域，所述用户通过在所述手工修改区域中添加下划线来修改所述分词标记。

6.如权利要求3所述的盲文文件生成方法，其特征在于，所述分词校正图像还包括指示所述语句分词信息在数据库中的存储路径的路径图像，其中执行所述语句分词校正还包括：

识别所述经修改的分词校正图像中的所述路径图像以获得所述存储路径；以及

基于所述存储路径定位所要更新的所述语句分词信息。

7.如权利要求6所述的盲文文件生成方法，其特征在于，所述路径图像为条形码或二维码中的任意一者。

8.如权利要求1所述的盲文文件生成方法，其特征在于，执行所述分词拼音校正包括：

基于所述文本内容信息、所述语句分词信息和所述分词拼音信息生成拼音校正图像，所述拼音校正图像中包括关于每个多音字的多音选项；

打印所述拼音校正图像以获得拼音校正图像的纸质文件；

对经用户选择了多音选项的所述拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像；

识别所述经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案；以及

基于经校正的拼音方案更新所述分词拼音信息。

9.如权利要求8所述的盲文文件生成方法，其特征在于，每个多音字的多音选项位于相应多音字的正上方，每个多音选项前方设有复选框，用户通过对多音选项的复选框的涂黑来选择多音选项，其中所述多音选项的选择包括基于各多音字上方的各多音选项前方的复选框的颜色识别来确定各多音字的拼音。

10.如权利要求9所述的盲文文件生成方法，其特征在于，每个多音字正上方最靠近的多音选项为相应多音字的默认选项，在用户没有涂黑一多音字的任何复选框的情况下，被确定为该多音字的拼音。

11.如权利要求8所述的盲文文件生成方法，其特征在于，所述拼音校正图像还包括指示所述分词拼音信息在数据库中的存储路径的路径图像，其中执行所述分词拼音校正还包括：

识别所述经选择的拼音校正图像中的所述路径图像以获得所述存储路径；以及

基于所述存储路径定位所要更新的所述分词拼音信息。

12.如权利要求11所述的盲文文件生成方法，其特征在于，所述路径图像为条形码或二维码中的任意一者。

13.如权利要求1所述的盲文文件生成方法，其特征在于，执行所述语句分词校正包括：

基于所述文本内容信息和所述语句分词信息生成分词校正图像以经由用户界面显示，所述分词校正图像中包括分词标记；

经由所述用户界面接收用户对所述分词标记的修改；

基于经修改的分词标记获得经校正的分词方案；以及

基于经校正的分词方案更新所述语句分词信息。

14.如权利要求1所述的盲文文件生成方法，其特征在于，执行所述分词拼音校正包括：

基于所述文本内容信息、所述语句分词信息和所述分词拼音信息生成拼音校正图像以经由用户界面显示；

经由所述用户界面接收用户对各多音字的多音选项的选择；

基于经校正的拼音方案更新所述分词拼音信息。

15.如权利要求1所述的盲文文件生成方法，其特征在于，执行所述歧义校正包括：

基于所述文本内容信息查找同音词歧义数据库以确定有同音歧义的同音词；

建议各同音词的哑音定字注释方案以经由用户界面显示；

经由所述用户界面接收用户对各同音词的哑音定字注释方案的编辑以确定经校正的哑音定字注释方案；以及

基于校正的哑音定字注释方案更新所述文本内容信息。

16.一种盲文文件生成系统，包括：

获取模块，用于获取目标文件的文本以获得文本内容信息；

分词模块，用于基于所述文本内容信息对文本执行语句分词处理以获得语句分词信息；

拼音标注模块，用于基于所述语句分词信息对文本执行分词拼音标注处理以获得分词拼音信息；

转换模块，用于基于所述分词拼音信息对文本执行盲文转换处理以获得盲文点字信息，

其特征在于，所述盲文文件生成系统还包括以下至少一者：

歧义校正模块，用于响应于用户选择对文本执行歧义校正以更新所述文本内容信息，以用于后续语句分词处理；

分词校正模块，用于响应于用户选择对文本执行语句分词校正以更新所述语句分词信息，以用于后续分词拼音标注处理；及

拼音校正模块，用于响应于用户选择对文本执行分词拼音校正以更新所述分词拼音信息，以用于后续盲文转换处理。

17.如权利要求16所述的盲文文件生成系统，其特征在于，获取模块包括：

扫描模块，用于对所述目标文件执行扫描处理以生成所述目标文件的目标文件图像；以及

OCR模块，用于对所述目标文件图像执行OCR处理以生成所述文本内容信息。

18.如权利要求16所述的盲文文件生成系统，其特征在于，还包括打印模块，以及所述获取模块还包括扫描模块和图像识别模块，

其中所述分词校正模块包括第一图像创建模块和第一更新模块，所述第一图像创建模块用于基于所述文本内容信息和所述语句分词信息生成分词校正图像，所述分词校正图像中包括分词标记，

所述打印模块用于打印所述分词校正图像以获得分词校正图像的纸质文件，

所述扫描模块用于对经用户修改了分词标记的所述分词校正图像的纸质文件执行扫描处理以生成经修改的分词校正图像，以及所述图像识别模块用于识别所述经修改的分词校正图像中的分词标记以获得经校正的分词方案，

所述第一更新模块用于基于经校正的分词方案更新所述语句分词信息。

19.如权利要求18所述的盲文文件生成系统，其特征在于，所述分词标记为位于文字下方的下划线，位于同一下划线上的文字被分为一个词语，其中所述图像识别模块基于修改后的下划线将位于同一下划线上的文字分为一个词语。

20.如权利要求19所述的盲文文件生成系统，其特征在于，所述分词校正图像还包括位于文字和初始下划线下方的手工修改区域，所述用户通过在所述手工修改区域中添加下划线来修改所述分词标记。

21.如权利要求18所述的盲文文件生成系统，其特征在于，所述分词校正图像还包括指示所述语句分词信息在数据库中的存储路径的路径图像，

其中所述图像识别模块还用于识别所述经修改的分词校正图像中的所述路径图像以获得所述存储路径，

所述第一更新模块基于所述存储路径定位所要更新的所述语句分词信息。

22.如权利要求21所述的盲文文件生成系统，其特征在于，所述路径图像为条形码或二维码中的任意一者。

23.如权利要求16所述的盲文文件生成系统，其特征在于，还包括打印模块，以及所述获取模块还包括扫描模块和图像识别模块，

其中所述拼音校正模块包括第二图像创建模块和第二更新模块，所述第二图像创建模块用于基于所述文本内容信息、所述语句分词信息和所述分词拼音信息生成拼音校正图像，所述拼音校正图像中包括关于每个多音字的多音选项，

所述打印模块用于打印所述拼音校正图像以获得拼音校正图像的纸质文件，

所述扫描模块用于对经用户选择了多音选项的所述拼音校正图像的纸质文件执行扫描处理以生成经选择的拼音校正图像，以及所述图像识别模块，用于识别所述经选择的拼音校正图像中的多音选项的选择以获得经校正的拼音方案，

所述第二更新模块用于基于经校正的拼音方案更新所述分词拼音信息。

24.如权利要求23所述的盲文文件生成系统，其特征在于，每个多音字的多音选项位于相应多音字的正上方，每个多音选项前方设有复选框，用户通过对多音选项的复选框的涂黑来选择多音选项，其中所述图像识别模块基于各多音字上方的各多音选项前方的复选框的颜色识别来确定各多音字的拼音。

25.如权利要求24所述的盲文文件生成系统，其特征在于，每个多音字正上方最靠近的多音选项为相应多音字的默认选项，在用户没有涂黑一多音字的任何复选框的情况下，被确定为该多音字的拼音。

26.如权利要求23所述的盲文文件生成系统，其特征在于，所述拼音校正图像还包括指示所述分词拼音信息在数据库中的存储路径的路径图像，

其中所述图像识别模块还用于识别所述经选择的拼音校正图像中的所述路径图像以获得所述存储路径，

所述更新模块基于所述存储路径定位所要更新的所述分词拼音信息。

27.如权利要求26所述的盲文文件生成系统，其特征在于，所述路径图像为条形码或二维码中的任意一者。

28.如权利要求16所述的盲文文件生成系统，其特征在于，还包括用于与用户交互的用户界面，

所述分词校正模块包括：

第一图像创建模块，用于基于所述文本内容信息和所述语句分词信息生成分词校正图像以经由所述用户界面显示，所述分词校正图像中包括分词标记，其中所述用户界面接收用户对所述分词标记的修改以获得经校正的分词方案；以及

第一更新模块，用于基于经校正的分词方案更新所述语句分词信息。

29.如权利要求16所述的盲文文件生成系统，其特征在于，还包括用于与用户交互的用户界面，

所述拼音校正模块包括：

第二图像创建模块，用于基于所述文本内容信息、所述语句分词信息和所述分词拼音信息生成拼音校正图像以经由所述用户界面显示，其中所述用户界面接收用户对各多音字的多音选项的选择以获得经校正的拼音方案；以及

第二更新模块，用于基于经校正的拼音方案更新所述分词拼音信息。

30.如权利要求16所述的盲文文件生成系统，其特征在于，还包括用于与用户交互的用户界面，

所述歧义校正模块包括：

查找模块，用于基于所述文本内容信息查找同音词歧义数据库以确定有同音歧义的同音词；

哑音定字建议模块，用于建议各同音词的哑音定字注释方案以经由所述用户界面显示，其中所述用户界面接收用户对各同音词的哑音定字注释方案的编辑以确定经校正的哑音定字注释方案；以及

第三更新模块，用于基于校正的哑音定字注释方案更新所述文本内容信息。