CN107368474B - 一种汉文到盲文的自动高效翻译转换方法 - Google Patents

一种汉文到盲文的自动高效翻译转换方法 Download PDF

Info

Publication number
CN107368474B
CN107368474B CN201710550659.8A CN201710550659A CN107368474B CN 107368474 B CN107368474 B CN 107368474B CN 201710550659 A CN201710550659 A CN 201710550659A CN 107368474 B CN107368474 B CN 107368474B
Authority
CN
China
Prior art keywords
braille
chinese
pinyin
characters
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710550659.8A
Other languages
English (en)
Other versions
CN107368474A (zh
Inventor
杨文珍
吴新丽
宣建强
汪文妃
莫灿林
竺志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201710550659.8A priority Critical patent/CN107368474B/zh
Publication of CN107368474A publication Critical patent/CN107368474A/zh
Application granted granted Critical
Publication of CN107368474B publication Critical patent/CN107368474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种汉文到盲文的自动高效翻译转换方法。对输入的文本文件进行预处理并对汉字字符首先采取分词连写处理,实现词组分割;将所输入的汉字文本中的字符划分为汉字字符和符号字符(数字、标点等);对符号字符直接进行符盲转换,生成12位的盲文信息码;对汉字字符串先进行汉字到拼音的转换,再将拼音按照是否为单方音节区分以不同方式进行拼盲转换生成12位的盲文信息码。将取得的盲文信息码以12位0/1格式存储并在盲文显示器上进行显示。本发明克服了拼盲转换现有技术中将每个拼音直接和拼音盲文对照表匹配而导致效率低下的问题,具有通用性强,移植简单,转换效率高等特点,对硬件要求低、性能可靠,能够适用于便携式盲文阅读系统的设计开发。

Description

一种汉文到盲文的自动高效翻译转换方法
技术领域
本发明涉及一种语言翻译转换方法,具体说是计算机领域的一种汉文到盲文的自动高效翻译转换方法,本发明属于虚拟现实研究中的触觉控制生成领域和盲用阅读系统的点字控制领域。
背景技术
盲人作为视觉功能障碍者,其接受外部信息的渠道狭窄,据世界卫生组织(WHO)的最近两次调查报告显示,2002年全球有超过1.61亿人视力受损,其中盲人数目3700万,而在2010年视力受损人数上升到2.85亿,其中盲人数目约3900万,而我国盲人数量占有825万,另据2006年第二次全国残疾人抽样调查公布数据推算,我国视力残疾人数约1233万,占残疾人总人数的14.86%。人口的增长、老龄化以及社会潜在伤残风险,造成盲人和视力残疾人数始终呈上涨趋势,并在未来的一段时间内盲人群体数量也将基本维持不变。由此可见自然语言与盲文之间的翻译转换研究意义重大以及高效便捷的盲文翻译机器的需求之迫切。
我国汉语盲文的机器翻译随着计算机技术和盲文标准的实施逐步发展的,是为适应我国盲文书写规则而建立起来的一套理论方法。国内对现行盲文的机器翻译研究居多。
汉字与西欧语言不同,西欧语言是以字母为基础的表音文字,一方一般对应一个或部分字母,一个单词由多方组成;而现代汉字是一种表意文字,常见汉字大概有3000-5000。
我国对汉语盲文的翻译研究是在不断进步和完善的,好的盲文翻译系统必须具备可扩充的语料库,同时具有结合语境变化灵活运行的规则库,因此必须利用现有的优秀自然语言处理和文本汉字处理方法,才能达到较好质量的盲文翻译。
发明内容
为了解决背景技术中存在的问题,本发明研究虚拟触觉显示技术在盲用阅读器中的应用,综合分析了国内外在汉盲转换系统中所涉及的中文分词连写、汉拼转换、TTS及盲字点显执行器的研究状况,提供设计了一种汉文到盲文的自动高效翻译转换方法。
为实现上述的发明目的,如图1所示,本发明采用下述的技术方案:
(1)对输入的文本文件进行预处理;
(2)将预处理后的文本中的字符划分归类为汉字字符和非汉字字符(标点,数字等);
(3)对汉字字符的文本进行基于词典的最大匹配的分词连写处理,实现词组分割;
(4)对非汉字字符串和汉字字符串分别进行符盲转换,生成12位的盲文信息码,根据盲文信息码在盲文显示器上进行显示。
所述步骤(1)的预处理包括:对文本文件的文件编码进行探测识别,根据字符编码找到汉字编码范围和非汉字编码范围,排除非汉字编码方式构成的文本文字,保留以汉字编码方式构成的文本文字,分成汉字和符号,同时根据编码范围识别正确的汉字。
所述步骤(1)具体仅保留GBK、unicode和utf-8编码方式的文本字符。
所述步骤(3)中基于词典的最大匹配的分词连写处理具体包括:利用已构建的汇集常用词语的汉语词典库对汉字字符的文本进行分词连写处理,具体是以从小到大的渐变步长正向将输入文本与汉语词典库词语中的常用词语进行匹配实现遍历分割,进而实现分词连写。
所述已构建的汇集常用词语的汉语词典库中的常用词语按首字母排序。
所述的步骤(4)对非汉字字符串进行符盲转换具体是:
利用自建的针对非汉字字符的符号盲文对照表,将文本中的所有非汉字字符转换为12位的符号性盲文编码,作为盲文信息码;
所述的符号盲文对照表具体为下表1和表2:
表1
Figure BDA0001344353020000021
Figure BDA0001344353020000031
表2
标点符号 盲文编码 标点符号 盲文编码
000100000000 000011011000
000010011000 000011010000
· 000001001000 ( 000011011000
. 000001001000 ) 000011011000
000000010001 000010001000
000110000110 000010011000
000110000110 000010010000
000110000110 000011000000
000110000000 —— 001001000000
000011011000 - 001001000000
上表中,由0,1构成的12位序列号表示非汉字字符的符号性盲文编码,符号性盲文编码是按照每个盲文的两方十二个高低点位顺序编号对盲文点位的凸起和非凸起状态进行编码。其中的1表示盲文点位的凸起状态,0表示盲文点位的凸起状态。这里所列出的是非汉字字符及其对应的符号性盲文编码。
所述的步骤(4)对汉字字符串进行符盲转换具体是:
先进行汉字拼音转换传递,并分辨出每个汉字的音调,对于汉字拼音转换后得到的拼音串,采用以下方式进行拼音到盲文的转换,转换为符号性盲文编码以12位盲文点列的格式进行存储;
a)对汉字拼音串进行音素的识别和分割提取,分为整体认读音节、声母和韵母;
b)将每个拼音串分割后所得到的音素利用自建的音素盲文对照表,得到每个音素对应的6位符号性盲文编码。对于整体认读音节,将其匹配所得的6位符号性盲文编码直接与“000000”字符串顺序连接,完成12位汉盲的转换。对于非整体认读音节,则将其声母和韵母分别匹配所得的6位符号性盲文编码依次组合成为12位的符号性盲文编码,并以12位盲文点列的格式进行存储;
所述音素盲文对照表具体为下表3:
表3
Figure BDA0001344353020000032
Figure BDA0001344353020000041
Figure BDA0001344353020000051
上表中,由0,1构成的12位序列号表示汉字字符所属音节的符号性盲文编码,这里所列出的是汉字字符所属音节及其对应的符号性盲文编码。
所述步骤a)中,对于每个汉字的拼音串,采用正向最大匹配算法,以从长到短的步长将拼音串中的拼音字母与音素盲文对照表中的音素进行逐一匹配,获得是否匹配的结果,初始步长取该拼音串的字母总数;若在最大步长下匹配成功,则终止匹配,若否,则修改步长,以最长声母的两个字母的步长预匹配,当匹配成功后,则对剩余字母直接进行韵母匹配。
所述的符号盲文对照表、音素盲文对照表和音素表均以结构体数组存储;并且所述音素盲文对照表中的音素是按整体认读音节、声母和韵母种类依次顺序存储排列,对于整体认读音节、声母和韵母每个种类中的音素字母长度按从大到小依次存储排列。
本发明方法进行翻译转换的思路包含了对汉字文本进行编码处理、非法字符过滤、分词连写处理、汉拼转换、多音字识别、字符识别、音素分割、盲文对照、点位整合。
本发明的有益效果是:
本发明在拼音转盲文过程中按照整体认读音节、声母、韵母的分类对每个拼音字符串进行分割提取,并采用正向最大匹配算法,克服了拼音转盲文现有技术中将每个拼音直接和拼音盲文对照表进行遍历匹配而导致效率低下的问题,具有通用性强,移植简单,转换效率高等特点,对硬件要求低、性能可靠,能够适用于便携式盲文阅读系统的设计开发。
附图说明
图1为本汉盲翻译转换方法的流程示意图;
图2为本汉盲翻译转换方法中分词连写的操作流程;
图3为本汉盲翻译转换方法中拼音转盲文的操作流程。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步的说明:
本发明的实施例及其具体实施过程如下:
(1)对输入的文本文件进行预处理;
对文本文件的文件编码进行探测识别,根据字符编码找到汉字编码范围和非汉字编码范围,排除非汉字编码方式构成的文本文字,保留以汉字编码方式构成的文本文字,分成汉字和符号,同时根据编码范围识别正确的汉字。
文本编码过滤是处理里一个重要步骤,字符必须编码后才能被计算机处理,汉字的编码方式有GBK,unicode,utf-8等,表1列出了常见中文文件编码的标识属性,GNU出品的libiconv转码库能较好的实现常见文件编码识别和互相转换。
具体实施调用C语言库文件<stdio.h>中fopen函数以文本模式打开用户文件,然后读取文件内前3个字节与表4所列文件标识符进行比较匹配,实现四种文件编码的识别判断。对于其它编码形式文件只需要利用现有文件编辑器如notpad++进行编码转换后再输入翻译系统,在windows下利用自带的API函数WideCharToMultiByte将unicode编码转换为GB2312编码。并以该编码文本作为本翻译系统的标准处理文本。
表4中文文件编码标识及属性
Figure BDA0001344353020000061
Figure BDA0001344353020000071
(2)将预处理后的文本中的字符划分归类为汉字字符和非汉字字符(标点,数字等);
对经编译的处理文本进行汉拼转换首先需要汉字和非汉字的识别分类过程,字符识别是翻译系统的入口,经过预处理中的编码识别和转换,得到GBK编码的文本文字,极大简化汉字的识别。而汉字的GBK编码为双字节编码,只要第一个字节是大于127就固定表示这是一个汉字的开始,这是本程序识别汉字和非汉字的关键,查看GBK的编码范围为0x8140~0xA0FE,但要剔除xx7F的码位,其中常见汉字的编码范围0x8140~0xA0FE,0xB0A1~0xF7FE,GBK编码兼容ASCII码,根据一般阅读需要只对标准ASCII范围内的非汉字的数字符号和字母进行转换,提高转换和阅读效率。其余进行过滤,不做转换处理。
具体实施逐次提取一个待翻译文本段的两个字节的字符串text[3]="xx",当text[0]值域处于汉字GBK编码值区域范围内,则转到汉盲转换子系统,若处于汉字标点的编码值域,则转到标点盲文转换子程序,若text[0]小于126,则转到符号(字符、数组等)转换子程序,实现转换的分流处理。
(3)对汉字字符的文本进行基于词典的最大匹配的分词连写处理,实现词组分割。
分词连写的具体流程是这样的:输入一段文本S,从左到右将待分词文本中词典库最长词组长度的连续字符与词典库进行匹配,如果匹配不成功,则逐次减小连续字符的长度进行多次扫描匹配,直到匹配成功,获取词长最大的词。经分词连写操作后S分解为WS1,WS2··WSN词串,分别将这些词串做拼音转换处理得到拼音串PS1,PS2··PSN,再将各个拼音串转换得到的盲文编码顺序连接,实现分词连写。分词连写较于对文本S直接拼音转换可提高程序执行效率并准确识别多音字。
(4)对非汉字字符串和汉字字符串分别进行符盲转换
(4.1)对非汉字字符串进行符盲转换具体是:
利用自建的针对非汉字字符的符号盲文对照表,将文本中的所有非汉字字符转换为12位的符号性盲文编码,作为盲文信息码;
比如当在一段文本中扫描到“1”时,则遍历符号盲文对照表中的元素对其进行匹配,匹配成功则获取相应的盲文编码。
(4.2)对汉字字符串进行符盲转换具体是:
(4.2.1)先进行汉字拼音转换传递:
汉语拼音的转换是图1汉盲转换的核心步骤,汉字拼音转换的难点在于汉语多音字的处理,而当多音字以词为单位组合时,可根据词组来确定读音,汉拼转换前首先进行的是汉字分词连写处理基本上划分出词串,以此词串作为拼音转换的操作对象就能缩小多音字识别的取词范围,简化了程序算法。
本发明在汉拼转换中通过创建单音字汉字拼音库和面向盲人日常阅读的常用的多音字词组拼音库并以多音字拼音库为优先查询表实现词串的匹配识别,以多音字拼音库为优先查询表。
汉拼转换主要通过建立汉字拼音对照表,实现转换。汉拼转换的子系统构造含有汉字、拼音、声调的结构体类型,并建立该汉字拼音结构体类型数组表。同时也构建了常用多音字词表的结构体数组,以达到对多音字转换的一定正确性,减少盲人摸读时的误读和误解频次。
汉拼转换具体是以遍历查表的方式将待转换的汉字文本与结构体数组中各个元素作为两个参数以字符串比较来进行汉字匹配判断,当匹配到汉字后,就查到汉字在同一结构体中对应的拼音,从而得到汉字对应的拼音。
(4.2.2)对于汉字拼音转换后得到的拼音串,采用以下方式进行拼音到盲文的转换,转换为12位的符号性盲文编码,作为盲文信息码:
a)对拼音串进行音素的识别和分割提取,分为整体认读音节、声母和韵母;
本发明方法在拼音转盲文中音素盲文对照表的存储采取结构体数组的形式,并创建音素-盲符结构体数组,而音素-盲符对照结构体类型中包含三个结构体变量,声母、韵母、整体认读音节和它们对应的盲符,由于韵母自成音节和整体认读音节所表示的字均为单方盲字,为此增加一个空方使所有的盲字都为两方形式的统一输出。通过此结构体数组来关联拼音和符号性盲文编码,并最终获取单个拼音串的12位符号性盲文编码。
上面所述的拼盲转换的具体过程是这样的:输入拼音串时,首先需要判别输入的拼音串,若为整体认读音节则根据盲文对照表直接转换生成盲字,而若为声韵拼读的拼音,则需要拆分声母韵母后进行音素的识别匹配,保证后续转换的顺利。而当声母韵母分别匹配完成后,需要再次将声韵盲符合并起来,完成一个12位盲字的生成。
由于汉拼转换中返回的是拼音串而非音盲结构体中的音素单元,需要进行拼音的音素匹配。为此本发明设计出一种正向最大匹配算法,对于每个汉字的拼音串,采用正向最大匹配算法,对于每个汉字的拼音串,采用正向最大匹配算法,以从长到短的步长将拼音串中的拼音字母与音素盲文对照表中的音素进行逐一匹配,获得是否匹配的结果,初始步长取该拼音串的字母总数;若在最大步长下匹配成功,则终止匹配,若否,则修改步长,以最长声母的两个字母的步长预匹配,当匹配成功后,则对剩余字母直接进行韵母匹配。同时考虑到与单方音节相比,声韵拼读音节的匹配过程要复杂得多,判断步数也多,因此,本发明特意根据拼音的构成形式把音素盲文对照表遍历匹配的先后顺序安排如下:单方音节(包含整体认读音节和自成音节韵母(零声母)),声韵拼读音节。先将待转换拼音直接与单方音节数组中的各个元素进行字符比较,匹配成功的单方音节对应的盲文即为待转换拼音的盲字点列,同时需要补0以两方12位数据的格式存储表示。
若不属于单方音节,需要对拼音的音素进行分割提取和匹配。同样地,按照正向最大匹配的原则获得与待转换音素最为匹配的音素。同时先匹配字符最长的声母,由此,为减少程序判断,本发明巧妙地在声母-盲文结构体数组的初始化里把字符最长的声母放在前面,达到准确匹配。
b)将每个拼音串分割后所得到的音素利用自建的音素盲文对照表,得到每个音素对应的6位符号性盲文编码。对于整体认读音节,将其匹配所得的6位符号性盲文编码直接与“000000”字符串顺序连接,完成12位汉盲的转换。对于非整体认读音节,则将其声母和韵母分别匹配所得的6位符号性盲文编码依次组合成为12位的符号性盲文编码。
在韵母匹配中根据已经匹配的声母字串长度来确定待转换拼音中韵母字串的地址,再次与音素-盲符结构体中的韵母进行查表匹配。
最后将声母盲字点列与韵母盲字点列拼接,如图3所示,从而完成拼音到盲符点列的转换,并进行转换成功判断。转换成功后,最终生成12位的盲文信息码,根据盲文信息码在盲文显示器上进行显示。
例如拼音串“yuan”,这是一个具有单方音节的拼音串,因此执行单方音节匹配子程序。将单方音节-盲符结构体数组中的音素与拼音串“yuan”进行依次匹配,直到完全匹配上为止,从而找到与之匹配的音素及其对应的6位符号性盲文编码。然后将所得到的6位符号性盲文编码末尾补“000000”组成两方12位的盲文点列。
例如拼音串“zui”,这是一个具有声韵拼读音节的拼音串,在与单方音节-盲符结构体数组中元素匹配的时候得到匹配不成功的结果,因此转到声韵拼读音节匹配子程序。将声母盲符结构体数组前三个字符最长的声母依次与拼音串“zui”比较前两个字母,结果不相同,然后只需将声母盲符结构体数组中的单个字母的声母依次和“z”进行匹配即可,继而找到完全匹配的声母及其对应的6位符号性盲文编码。再来匹配韵母,将韵母盲符结构体数组中的音素依次和“ui”匹配,得到与之完全匹配的韵母及其对应的6位符号性盲文编码。最后分别将声母韵母的6位符号性盲文编码顺序连接组成12位的盲文点列。
本发明在拼音转盲文过程中将拼音串分为整体认读音节和非整体认读音节两大类,并把非整体认读音节拆分成声母和韵母分别进行匹配,大大降低了程序运行步数,也使程序逻辑清晰化,简单化。另外,采用正向最大匹配法使本发明方法实现的结果更为准确。

Claims (4)

1.一种汉文到盲文的自动高效翻译转换方法,其特征在于主要包括如下步骤:
(1)对输入的文本文件进行预处理;
(2)将预处理后的文本中的字符划分归类为汉字字符和非汉字字符;
(3)对汉字字符的文本进行基于词典的最大匹配的分词连写处理,实现词组分割;
(4)对非汉字字符串和汉字字符串分别进行符盲转换,生成12位的盲文信息码,根据盲文信息码在盲文显示器上进行显示;
所述的步骤(4)对非汉字字符串进行符盲转换具体是:利用自建的针对非汉字字符的符号盲文对照表,将文本中的所有非汉字字符转换为12位的符号性盲文编码,作为盲文信息码;
所述的符号盲文对照表中,由0,1构成的12位序列号表示非汉字字符的符号性盲文编码,符号性盲文编码是按照每个盲文的两方十二个高低点位顺序编号对盲文点位的凸起和非凸起状态进行编码;
所述的步骤(4)对汉字字符串进行符盲转换具体是:
先进行汉字拼音转换传递,对于汉字拼音转换后得到的拼音串,采用以下方式进行拼音到盲文的转换,转换为符号性盲文编码以12位盲文点列的格式进行存储;
a)对汉字拼音串进行音素的识别和分割提取,分为整体认读音节、声母和韵母;
b)将每个拼音串分割后所得到的音素利用自建的音素盲文对照表,得到每个音素对应的6位符号性盲文编码;
对于整体认读音节,将其匹配所得的6位符号性盲文编码直接与“000000”字符串顺序连接,完成12位汉盲的转换;
对于非整体认读音节,则将其声母和韵母分别匹配所得的6位符号性盲文编码依次组合成为12位的符号性盲文编码,并以12位盲文点列的格式进行存储;
所述音素盲文对照表中,由0,1构成的12位序列号表示汉字字符所属音节的符号性盲文编码,这里所列出的是汉字字符所属音节及其对应的符号性盲文编码;
所述a)中,对于每个汉字的拼音串,采用正向最大匹配算法,以从长到短的步长将拼音串中的拼音字母与音素盲文对照表中的音素进行逐一匹配,获得是否匹配的结果,初始步长取该拼音串的字母总数;若在最大步长下匹配成功,则终止匹配,若否,则修改步长,以最长声母的两个字母的步长预匹配,当匹配成功后,则对剩余字母直接进行韵母匹配。
2.根据权利要求1所述的一种汉文到盲文的自动高效翻译转换方法,其特征在于:所述步骤(1)的预处理包括:对文本文件的文件编码进行探测识别,排除非汉字编码方式构成的文本文字,保留以汉字编码方式构成的文本文字,同时根据编码范围识别正确的汉字。
3.根据权利要求1所述的一种汉文到盲文的自动高效翻译转换方法,其特征在于:所述步骤(3)中基于词典的最大匹配的分词连写处理具体包括:利用已构建的汇集常用词语的汉语词典库对汉字字符的文本进行分词连写处理,具体是以从大到小的渐变步长正向将输入文本与汉语词典库词语中的常用词语进行匹配实现遍历分割,进而实现分词连写。
4.根据权利要求1所述的一种汉文到盲文的自动高效翻译转换方法,其特征在于:所述的符号盲文对照表、音素盲文对照表均以结构体数组存储;并且所述音素盲文对照表中的音素是按整体认读音节、声母和韵母种类依次顺序存储排列,对于整体认读音节、声母和韵母每个种类中的音素字母长度按从大到小依次存储排列。
CN201710550659.8A 2017-07-07 2017-07-07 一种汉文到盲文的自动高效翻译转换方法 Active CN107368474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710550659.8A CN107368474B (zh) 2017-07-07 2017-07-07 一种汉文到盲文的自动高效翻译转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710550659.8A CN107368474B (zh) 2017-07-07 2017-07-07 一种汉文到盲文的自动高效翻译转换方法

Publications (2)

Publication Number Publication Date
CN107368474A CN107368474A (zh) 2017-11-21
CN107368474B true CN107368474B (zh) 2020-08-04

Family

ID=60306100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710550659.8A Active CN107368474B (zh) 2017-07-07 2017-07-07 一种汉文到盲文的自动高效翻译转换方法

Country Status (1)

Country Link
CN (1) CN107368474B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992457B (zh) * 2017-12-01 2021-12-03 深圳乐信软件技术有限公司 一种信息转换方法、装置、终端设备及存储介质
CN108597008B (zh) * 2017-12-13 2021-08-31 西安电子科技大学 基于自然文本的人机智能交互控制平台
CN108491441B (zh) * 2018-02-12 2022-02-01 北京联合大学 一种盲文信息统计系统
CN110705556B (zh) * 2019-09-18 2023-04-25 佛山职业技术学院 一种盲文转化仪、转化方法及存储介质
TWI747275B (zh) * 2020-05-08 2021-11-21 陳盈秀 用於電子裝置之點字轉換方法及其電腦程式產品
CN111814437A (zh) * 2020-05-28 2020-10-23 杭州视氪科技有限公司 一种基于深度学习的盲文转中文方法
CN111753503B (zh) * 2020-06-19 2023-11-21 兰州大学 一种面向盲人的数学公式编辑方法及装置
CN111814495B (zh) * 2020-07-10 2024-03-22 兰州大学 一种基于svg的电路图到盲文转换方法及系统
CN111881696B (zh) * 2020-07-31 2024-02-23 兰州大学 一种cml到化学盲文的转换系统及方法
CN116432603B (zh) * 2023-03-27 2023-10-13 之江实验室 一种存算一体汉语盲文芯片

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166683A (ja) * 1999-12-08 2001-06-22 Nec Software Niigata Ltd 自動点訳システム及びそれを用いた自動点訳方法
CN1591414B (zh) * 2004-06-03 2010-04-21 华建电子有限责任公司 一种汉语到盲文的自动翻译转换方法
CN105404621A (zh) * 2015-09-25 2016-03-16 中国科学院计算技术研究所 一种用于盲人读取汉字的方法及系统
CN105630770A (zh) * 2015-12-23 2016-06-01 华建宇通科技(北京)有限责任公司 一种基于sc文法的分词标音连写方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166683A (ja) * 1999-12-08 2001-06-22 Nec Software Niigata Ltd 自動点訳システム及びそれを用いた自動点訳方法
CN1591414B (zh) * 2004-06-03 2010-04-21 华建电子有限责任公司 一种汉语到盲文的自动翻译转换方法
CN105404621A (zh) * 2015-09-25 2016-03-16 中国科学院计算技术研究所 一种用于盲人读取汉字的方法及系统
CN105630770A (zh) * 2015-12-23 2016-06-01 华建宇通科技(北京)有限责任公司 一种基于sc文法的分词标音连写方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"汉字盲文转换系统的设计";杨潮等;《北京印刷学院学报》;20111226;第19卷(第6期);第36-38页 *

Also Published As

Publication number Publication date
CN107368474A (zh) 2017-11-21

Similar Documents

Publication Publication Date Title
CN107368474B (zh) 一种汉文到盲文的自动高效翻译转换方法
KR101083540B1 (ko) 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법
US8977535B2 (en) Transliterating methods between character-based and phonetic symbol-based writing systems
CN109241540B (zh) 一种基于深度神经网络的汉盲自动转换方法和系统
CN101133411A (zh) 非罗马字符的容错罗马化输入方法
US20100106481A1 (en) Integrated system for recognizing comprehensive semantic information and the application thereof
CN112507734B (zh) 一种基于罗马化维吾尔语的神经机器翻译系统
Sodhar et al. Identification of issues and challenges in romanized Sindhi text
Wang et al. Chinese-braille translation based on braille corpus
Salah et al. A review paper on malayalam text to Braille transliteration
CN103246354A (zh) 以通用语文字编码表达汉字的输入法及其键盘
CN103164396A (zh) 汉维哈柯电子辞典及其自动转译汉维哈柯语的方法
CN111897958B (zh) 基于自然语言处理的古诗词分类方法
CN111581991B (zh) 一种基于端到端神经机器翻译的汉盲翻译方法及系统
CN111428509A (zh) 一种基于拉丁字母的维吾尔语处理方法和系统
CN109766015A (zh) 汉字拉丁码输入法
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
Joshi et al. Input Scheme for Hindi Using Phonetic Mapping
CN104615269B (zh) 一种藏文拉丁全简双拼编码方法及其智能输入系统
Thaine et al. Vocalic and Consonantal Grapheme Classification through Spectral Decomposition
Rejitha Letter Based Processing of Indic Script–Malayalam Case Study
Snae et al. A Framework for an Ontology-Driven Multi-Lingual Transcription System with IPA Representation
CN114564969A (zh) 一种汉盲翻译处理系统
CN114356117A (zh) 一种溜歌粤语拼音中文输入法
KR20000053095A (ko) 비음성문자를 컴퓨터에 입력하기 위한 대용 워드로 전환하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant