CN104615269B - 一种藏文拉丁全简双拼编码方法及其智能输入系统 - Google Patents
一种藏文拉丁全简双拼编码方法及其智能输入系统 Download PDFInfo
- Publication number
- CN104615269B CN104615269B CN201510056949.8A CN201510056949A CN104615269B CN 104615269 B CN104615269 B CN 104615269B CN 201510056949 A CN201510056949 A CN 201510056949A CN 104615269 B CN104615269 B CN 104615269B
- Authority
- CN
- China
- Prior art keywords
- word
- character
- latin
- ancient india
- latin alphabet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明是一种藏文拉丁全简双拼编码方法及其智能输入系统,涉及中文信息处理领域。本编码方法中,藏文元辅音的编码与国际通用的Wylie拉丁转写保持一致,仅2个字符不同,即分别用w、a编码,同时设定7项基本编码规则。其余藏梵字符兼顾读音和字形进行编码。所述系统包括:智能匹配模块、词典存储模块、输入/组词模块和方言处理模块。输入时采用QWERTY键盘的小写字母和少量ASCII码。直接简拼遇缺字时,可全拼输入所缺字词,之后再次输入该字词时便可简拼。本发明解决了现有藏文输入法需要使用拉丁大小写字母和较多ASCII码符号,词表里缺词时无法简拼,不能完全实现输入任意藏梵字符、音节的问题,所实现的藏梵文拉丁转写编码方法也符合英文习惯。
Description
技术领域
本发明涉及中文信息处理领域,尤其涉及一种藏文拉丁全简双拼编码方法及其智能输入系统。
背景技术
目前,涉及拉丁转写藏文输入法专利申请的有:公开(公告)号为CN1045308A,申请人为航天工业部第七一○研究所罗圣仪等的“藏文输入编码法及其键盘”;公开(公告)号为CN100403239C申请人为西北民族大学王维兰等的“基于英文键盘的藏文输入法”;公开(公告)号为CN1230714A申请人为西藏自治区拉萨56111部队魏盛涛的“藏文计算机输入方法及键盘”等。此外,还有现有研究藏文扩展拉丁转写方案的网页(www.thlib.org/reference/ transliteration/)。这类藏文输入法以藏文的拉丁转写编码对应计算机QWERTY键盘为基础,此类输入法可简称为“藏文拉丁转写输入法”。
现有“藏文拉丁转写输入法”存在以下不足:在藏文拉丁转写编码方案中需使用拉丁大小写字母和较多ASCII码符号;藏梵文以基字为主有纵横排列组合的形式中,采用对部件横向组合与纵向多层叠加组合音节的处理方式存在问题;遇到词表里缺词时无法简拼;仅限于对固定词表的联想提示和调用;不能实现现代藏文与拉丁转写的双向准确转换;不能完全实现输入任意藏文或梵音字符、音节,如“缩写字”
发明内容
本发明的目的在于提供一种藏文拉丁全简双拼编码方法及其智能输入系统,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明的一种藏文拉丁全简双拼编码方法,所述编码方法包括藏梵文拉丁代字编码表和基本编码规则;
所述藏文拉丁代字编码表中的藏文字母分别用拉丁字母w、a编码代字,其它28个藏文字母均与Wylie编码规则中的拉丁字母保持一致。
优选地,所述基本编码规则包括:
规则一,凡有读音的藏文和梵音部件,均以相同或相近读音的拉丁字母作为代字读写编码,并与计算机标准键盘的英文小写字母相对应;
规则二,反写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“l”,取的读音;
厚写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“h”,取下加的读音;
规则三,4个藏文元音的编码与Wylie编码规则中拉丁代字保持一致,即为:
藏文元音用拉丁字母i代字,藏文元音用拉丁字母u代字,藏文元音用拉丁字母e代字,藏文元音用拉丁字母o代字;
9个梵音元音与拉丁代字的对应关系为:
梵音元音用拉丁字母ai代字,梵音元音用拉丁字母ii代字,
梵音元音用拉丁字母rii代字,梵音元音用拉丁字母raii代字,
梵音元音用拉丁字母lii代字,梵音元音用拉丁字母laii代字,
梵音元音用拉丁字母au代字,梵音元音用拉丁字母ee代字,
梵音元音用拉丁字母oo代字;
规则四,藏梵文下加字的拉丁代字为:其基字编码+a;
规则五,藏文数字对应阿拉伯数字0~9;
规则六,常用藏梵字符对应的拉丁字母和ASCII码代字为:
藏梵字符隔字符用空格代字;
藏梵字符隔句符用ASCII码符号,代字;
藏梵字符用拉丁字母v代字,藏梵字符用拉丁字母v代字;
藏梵字符用ASCII码符号左括号“(”代字,藏梵字符用ASCII码符号右括号“)”代字;
藏梵字符用拉丁字母gm代字,藏梵字符用拉丁字母xm代字;
藏梵字符用ASCII码符号代字,藏梵字符用ASCII码符号:代字;
藏梵字符用ASCII码符号:代字,藏梵字符用拉丁字母hlt代字;
规则七:非常用藏梵字符均以与其字母名称或字形名称读音相似的拉丁代字和ASCII码符号加以表示。
优选地,在规则七中,所述非常用藏梵字符均以与其字母名称或字形名称读音相似的拉丁代字或符号加以表示,具体为:
藏梵字符用拉丁字母nyt代字,藏梵字符用拉丁字母gm代字,
藏梵字符用拉丁字母bld代字,藏梵字符用拉丁字母nyt代字,
藏梵字符用拉丁字母yd代字,藏梵字符用拉丁字母zj代字,
藏梵字符用拉丁字母cj代字,藏梵字符用拉丁字母cj代字,
藏梵字符用拉丁字母al代字,藏梵字符用ASCII码符号…代字,
藏梵字符用拉丁字母nt代字,藏梵字符用ASCII码符号::代字,
藏梵字符用拉丁字母gl代字,藏梵字符用ASCII码符号[代字,
藏梵字符用ASCII码符号]代字,藏梵字符用拉丁字母aom代字,
藏梵字符用拉丁字母a代字,藏梵字符用拉丁字母au:代字,
藏梵字符用ao:代字,藏梵字符用拉丁字母v代字,
藏梵字符用拉丁字母v:代字,藏梵字符用拉丁字母z代字,
藏梵字符用拉丁字母vy代字,藏梵字符用拉丁字母vs代字,
藏梵字符用ASCII码符号::代字,藏梵字符用拉丁字母ny代字,
藏梵字符用拉丁字母ny代字,藏梵字符用拉丁字母nyno代字,
藏梵字符用拉丁字母km代字,藏梵字符用拉丁字母nydz代字,
藏梵字符用ASCII码符号.代字,藏梵字符用ASCII码符号..代字,
藏梵字符用ASCII码符号…代字,藏梵字符用拉丁字母x代字,
藏梵字符用拉丁字母xx代字,藏梵字符用.x代字,
藏梵字符用拉丁字母x代字,藏梵字符用x.代字,
藏梵字符用拉丁字母o代字,藏梵字符用拉丁字母o代字,
藏梵字符用拉丁字母o代字,藏梵字符用拉丁字母oo代字,
藏梵字符用拉丁字母z代字,藏梵字符用拉丁字母dj代字,
藏梵字符用拉丁字母rr代字,藏梵字符用拉丁字母dj代字,
藏梵字符用拉丁字母dj代字,藏梵字符用拉丁字母tm代字,
藏梵字符用拉丁字母pg代字,藏梵字符用拉丁字母pg代字,
藏梵字符用拉丁字母pg代字,藏梵字符用拉丁字母xxx代字。
优选地,所述基本编码规则还包括:罕见梵音字符未予以编码,直接在输入状态下,采用“插入”功能选择输入所述罕见梵音字符。
本发明的一种藏文拉丁全简双拼编码的智能输入系统,该输入系统包括:智能匹配模块、词典存储模块、输入/组词模块和方言处理模块;
所述智能匹配模块,将用户输入的编码串与编码概率表存储的编码进行匹配,获取是否匹配结果,若是“不匹配”结果,将所述编码串拆分后,每个拆分部分再进行匹配,临时组成词组,生成候选提示,并将所述候选提示发送给所述输入/组词模块;若是“匹配”结果,依据编码概率表将所述编码串转写成藏梵文;
所述输入/组词模块,依据组词输入提示,依次输入自造词的各个拉丁字符获得新词,并将新词存储到所述词典存储模块;
所述词典存储模块,存储常用的藏梵文字词和罕见梵音字符;
所述方言处理模块,将用户的方言编码转换为标准编码;
所述拉丁字符串包括拉丁字母和/或ASCII码符号。
优选地,使用所述智能输入系统输入藏梵文时,采用QWERTY键盘全拼完成第一次输入的藏梵文字词所对应的拉丁代字,其后输入时即可简拼完成输入,具体为:
在全拼藏文时,藏文和梵文元音的输入规则一致,均为基字字符的拉丁代字输入结束时再输入元音的拉丁代字;
在简拼输入藏文时,无需考虑元音、上加、下加、前加、后加和再后加字,每个音节只输入基字即可。
优选地,在输入藏梵文拉丁代字时,无大写字母和上档键的切换,所述上档键为Shift键。
本发明的一种藏文拉丁全简双拼编码的智能输入方法,使用计算机标准键盘QWERTY键盘,全简双拼智能输入藏文梵文包括以下步骤:
S1,用户按需输入藏梵文的拉丁代字或ASCII码编码串;
S2,所述编码串进行编码概率匹配,如果匹配,则显示所述编码串对应的候选编码提示,转向S4;如果不匹配,则转向S3,
S3,启动智能词组,将所述编码串分拆后,再进行编码概率匹配,生成临时组成词组,显示候选编码提示,转向S4;
S4,判断用户从所述显示候选编码提示中选择一个候选编码提示与所述编码串是否匹配,如果匹配,选择所述候选编码提示对应的藏梵文字词,输入完成;如果不匹配,转向S5;
S5,进入组词模式,根据组词输入提示依次输入自造词的各个拉丁字符和/或ASCII码符号,获得新词,完成新词输入。
优选地,步骤S1中,若用户定义了方言编码,则将用户输入的方言编码串转换成标准编码串;
在步骤S5之后,还存在步骤S6,将获得的新词添加到用户词典中。
优选地,步骤S4中所显示的藏梵文字词为储存在用户词典中的字词。
本发明采用计算机标准键盘QWERTY,与现有的“藏文拉丁转写输入法”相比,有以下几点有益效果:
1、在藏文拉丁转写编码方法中仅使用拉丁小写字母,只对梵文图形符号使用极少ASCII码符号;
2、藏梵文以基字为主有纵横排列组合的形式,对叠字的处理方式为对纵向多层叠加组合的下加部件代字之下加“a”表示,避免与部件的横向组合抵牾;
3、本发明实现了全拼与简拼相结合,由词典自动生成简拼编码,如遇“缺词”时可全拼输入一次,以后使用时便可简拼之;
4、本发明具有智能化处理功能,可对固定词表高频优先调用,亦可根据用户的需要生成动态扩展词表;
5、可以实现现代藏文与拉丁转写的双向准确转换;
6、完全可以输入任意藏文或梵音字符、音节,如“缩写字”
7、可以根据用户所持方言(卫藏、安多、康巴)以及个人习惯进行自定义方言编码设置。
附图说明
图1是实施例1中所述藏文拉丁全简双拼编码方法及其智能输入系统的结构示意图;
图2是实施例2中所述藏文拉丁全简双拼编码的智能输入方法的流程图;
图3是实施例2中概率表计算流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例的藏文拉丁全简双拼编码方法包括:藏梵文拉丁代字编码表和基本编码规则;
所述藏梵文拉丁代字编码表中的藏梵文字母分别用拉丁字母中的w、a编码代字,其他28个藏梵文字母均与国际通用的Wylie编码规则中拉丁字母保持一致。国际通用的wylie编码规则中辅音需在其后写出元音a来表示,本发明则无需写出,详见表1藏梵文拉丁代字编码表。
表1藏梵文拉丁代字编码表
本实施例中,所述基本编码规则包括:
规则一,凡有读音的藏文和梵音部件,均以相同或相近读音的拉丁字母作为代字读写编码,并与计算机标准键盘的英文小写字母相对应;
规则二,反写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“l”,取读音;详见表2即反写梵音字母与拉丁代字实例表。
表2反写梵音字母与拉丁代字实例表
厚写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“h”,取下加读音;详见表3即厚写梵音字母与拉丁代字实例表。
表3厚写梵音字母与拉丁代字实例表
特殊梵音字母的拉丁代字为:在所述梵音字母代字“k”之下加反写梵音字母“shla”代字;详见表4,特殊梵音字母与拉丁代字表。
表4特殊梵音字母与拉丁代字表
规则三,4个藏文元音与Wylie编码规则中拉丁代字保持一致,即为:
藏文元音用拉丁字母i代字,藏文元音用拉丁字母u代字,藏文元音用拉丁字母e代字,藏文元音用拉丁字母o代字,详见表5。
表5藏元音与拉丁代字表
9个梵音元音与拉丁代字的对应关系,详见表6,梵音元音与拉丁代字表。
表6梵音元音与拉丁代字表
规则四,藏梵文下加字的拉丁代字为:其基字编码+a;具体的解释为在相同字形之基字所对应的拉丁代字后加一个拉丁字母a;变形下加字拉丁代字表如表7。
表7变形下加字拉丁代字表
规则五,藏文数字对应阿拉伯数字0~9,详见表8;
表8藏文数字与阿拉伯数字对照表
规则六,常用藏梵字符对应的拉丁代字和ASCII码符号为:
藏梵字符隔字符用空格代字;
藏梵字符隔句符用ASCII码符号,代字;
藏梵字符用拉丁字母v代字,藏梵字符用拉丁字母v代字;
藏梵字符用ASCII码符号左括号(代字,藏梵字符用ASCII码符号右括号)代字;
藏梵字符用拉丁字母gm代字,藏梵字符用拉丁字母xm代字;
藏梵字符用ASCII码符号代字,藏梵字符用ASCII码符号:代字;
藏梵字符用ASCII码符号:代字,藏梵字符用拉丁字母hlt代字;
规则七:非常用藏梵字符均以与其字母名称或字形名称读音相似的拉丁代字和符号加以表示,详见表9。
表9非常用藏梵字符与拉丁代字对照表
由于拉丁字母有限,不可能给每个字符分配一个唯一的代字,即使能分配,也可能与其读音失却关联性。故可理解为:不同的字母,如有相同的读音或类似的写法,则其编码也相同。比如和形状类似,所以采用相同编码“::”。当然可以给后者定一个“::o”这样的编码,但是因为本输入系统支持重码选择,所以用“::”输入更简单。
本实施例中,所述基本编码规则还包括:罕见梵音字符未予以编码,直接在输入状态下,采用“插入”功能选择输入所述罕见梵音字符。
实施例2
参照图1,本实施例中的藏文拉丁全简双拼编码的智能输入系统,基于实施例1所述藏文拉丁全简双拼编码方法的智能输入系统,该输入系统包括:智能匹配模块、词典存储模块、输入/组词模块和方言处理模块;所述智能匹配模块,将用户输入的编码串与编码概率表存储的编码进行匹配,获取是否匹配结果,若是“不匹配”结果,将所述编码串拆分后,每个拆分部分再进行匹配,临时组成词组,生成候选提示,并将所述候选提示发送给所述输入/组词模块;若是“匹配”结果,依据编码概率表将所述编码串转写成藏梵文;所述输入/组词模块,依据组词输入提示,依次输入自造词的各个拉丁字符获得新词,并将新词存储到所述词典存储模块;所述词典存储模块,存储常用的藏梵文字词和罕见梵音字符;所述方言处理模块,将用户的方言编码转换为标准编码;所述拉丁字符串包括拉丁字母和/或ASCII码符号。
本实施例中所述标准编码是被实施例1中所述藏文拉丁全简双拼编码方法识别中编码。
本实施例中,输入藏梵文拉丁代字时无大写字母和上档键的切换,所述上档键为Shift键。藏梵字符隔字符单独输入时用ASCII码符号/输入。
本实施例中,使用所述智能输入系统输入藏文和梵文时,采用计算机QWERTY键盘,依照所述藏梵文拉丁代字编码表和所述基本输入规则,直接全拼第一次输入的藏梵文,在其后输入时仅仅用简拼即可完成输入在先输入过的藏梵文,具体为:
在全拼藏文时,藏文和梵文元音的输入规则一致,均为基字字符的拉丁代字输入结束时再输入元音的拉丁代字;
在简拼输入藏文时,无需考虑元音、上加、下加、前加、后加和再后加字,每个音节只输入基字即可。
本实施例中,用计算机标准键盘(英文QWERTY键盘)上的26个键位:a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、z分别对应表示拉丁字母a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、z,不同数量拉丁字母的组合所代表的藏文,用相应数量的键位表示。
本实施例中,与现有的“藏文拉丁转写输入法”需在输入基字所对应的拉丁代字中用“+”号等符号表示下加的衔接符号相比,本实施例只需在基字所对应的拉丁代字后直接添加拉丁字母“a”即可;本实施例中所述藏梵文下加字与拉丁代字对照表,如表10。
表10藏梵文下加字与拉丁代字对照表
在本实施例中,译音字用拉丁代字hpha输入;因为在本输入系统建立时就已经将特殊梵音字符集图形文字存储在系统中,特殊梵音字母及图形文字调用“插入”功能选择输入,即双击“输入法开启”即可启动“插入字符”功能;可以按本发明中所述藏梵文拉丁代字编码方法和基本输入规则,以“全拼”方式输入任意字符、音节,也可根据词典生成的简拼编码进行“简拼”输入;如遇“缺词”时可全拼输入一次,其后便可简拼。
本实施例中所述系统具有智能化处理功能,可对固定词典高频优先调用,亦可根据用户的需要自定义造字、造词生成动态扩展词典。
本实施例中所述系统具有按照藏语方言语音设置“方言编码”的功能。藏语有卫藏话、安多话、康巴话等方言,每种方言对某几个藏文字母的读音都有所差别。比如对藏文字母本系统中的标准编码为b,国际通用Wylie规则中的标准编码为ba,卫藏方言读ba,安多方言读wa。因此在“安多方言编码”中,可设置w对应于本系统的标准编码的b。另外,本系统的“方言编码”不局限于以上3种主要的藏语方言,使用者可以根据自己的发音设置适合自己的编码。下表是安多方言编码示例,如表11:
表11安多方言编码示例
实施例3:
参照图2,本实施例的藏文拉丁全简双拼编码的智能输入方法,基于实施例2中所述藏文拉丁全简双拼编码方法的智能输入系统,使用计算机标准键盘QWERTY键盘,全简双拼智能输入藏文和梵文包括以下步骤:
S1,用户按需输入藏梵文的拉丁代字或ASCII码编码串;
S2,判断所述拉丁代字或ASCII码编码串是否是方言编码,如果是,将用户输入的方言编码串转换成系统识别的拉丁代字或ASCII码编码串,进入S3;如果不是,直接进入S3;
S3,所述编码串进行编码概率匹配,如果匹配,则显示所述编码串对应的候选编码提示,转向S5;如果不匹配,则转向S4,
S4,启动智能词组,将所述编码串分拆后,再进行编码概率匹配,生成临时组成词组,显示候选编码提示,转向S5;
S5,判断用户从所述显示候选编码提示中选择一个候选编码提示与所述编码串是否匹配,如果匹配,选择所述候选编码提示对应的藏梵文字词,输入完成;如果不匹配,转向S6;
S6,进入组词模式,根据组词输入提示依次输入自造词的各个拉丁字符和/或ASCII码符号,获得新词,完成新词输入。
本实施例中,在步骤S6之后,还存在步骤S7,将获得的新词添加到用户词典中。
本实施例中,步骤S5中所显示的藏梵文字词为储存在用户词典中的字词。
本实施例中,在显示的所述编码串对应的候选编码提示时,是按照匹配概率从大到小依次排列。
本实施例中,从编码到藏文音节或词的概率表计算,可以在线下完成;参照图3,说明本实施例2中所述编码串进行编码概率匹配,编码串被送入到藏文分词程序中,计算编码串中编码的概率,如表12所示。
表12编码概率表示
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
1、本发明藏文拉丁转写编码方法仅使用拉丁小写字母和较少ASCII码符号;
2、藏梵文以基字为主有纵横排列组合的形式,对叠字的处理方式为对纵向多层叠加组合的下加部件代字之下加“a”表示,避免与部件的横向组合抵牾;
3、本发明实现了全拼与简拼相结合,由词典自动生成简拼编码,如遇“缺词”时可全拼输入一次,以后使用时便可简拼;
4、本发明具有智能化处理功能,可对固定词表高频优先调用,亦可根据用户的需要生成动态扩展词表;
5、可以实现现代藏文与拉丁转写的双向准确转换;
6、完全可以输入任意藏文或梵音字符、音节,如“缩写字”
7、可以根据用户所持方言(卫藏、安多、康巴)以及个人习惯进行方言设置。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (7)
1.一种藏文拉丁全简双拼编码方法,其特征在于:所述编码方法包括藏梵文拉丁代字编码表和基本编码规则;
所述藏文拉丁代字编码表中的藏文字母分别用拉丁字母w、a编码代字,其它28个藏文字母均与Wylie编码规则中的拉丁字母保持一致;
所述基本编码规则包括:
规则一,凡有读音的藏文和梵音部件,均以相同或相近读音的拉丁字母作为代字读写编码,并与计算机标准键盘的英文小写字母相对应;
规则二,反写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“l”,取的读音;
厚写梵音字母的拉丁代字为:在所述梵音字母的藏文正写字母所对应的拉丁代字后加“h”,取下加的读音;
规则三,4个藏文元音的编码与Wylie编码规则中拉丁代字保持一致,即为:
藏文元音用拉丁字母i代字,藏文元音用拉丁字母u代字,藏文元音用拉丁字母e代字,藏文元音用拉丁字母o代字;
9个梵音元音与拉丁代字的对应关系为:
梵音元音用拉丁字母ai代字,梵音元音用拉丁字母ii代字,
梵音元音用拉丁字母rii代字,梵音元音用拉丁字母raii代字,
梵音元音用拉丁字母lii代字,梵音元音用拉丁字母laii代字,
梵音元音用拉丁字母au代字,梵音元音用拉丁字母ee代字,
梵音元音用拉丁字母oo代字;
规则四,藏梵文下加字的拉丁代字为:其基字编码+a;
规则五,藏文数字对应阿拉伯数字0~9;
规则六,常用藏梵字符对应的拉丁字母和ASCII码代字为:
藏梵字符隔字符用空格代字;
藏梵字符隔句符用ASCII码符号,代字;
藏梵字符用拉丁字母v代字,藏梵字符用拉丁字母v代字;
藏梵字符用ASCII码符号左括号(代字,藏梵字符用ASCII码符号右括号)代字;
藏梵字符用拉丁字母gm代字,藏梵字符用拉丁字母xm代字;
藏梵字符用ASCII码符号′代字,藏梵字符用ASCII码符号:代字;
藏梵字符用ASCII码符号:代字,藏梵字符用拉丁字母hlt代字;
规则七:非常用藏梵字符均以与其字母名称或字形名称读音相似的拉丁代字和ASCII码符号加以表示;
所述非常用藏梵字符均以与其字母名称或字形名称读音相似的拉丁代字或符号加以表示,具体为:
藏梵字符用拉丁字母nyt代字,藏梵字符用拉丁字母gm代字,
藏梵字符用拉丁字母bld代字,藏梵字符用拉丁字母nyt代字,
藏梵字符用拉丁字母yd代字,藏梵字符用拉丁字母zj代字,
藏梵字符用拉丁字母cj代字,藏梵字符用拉丁字母cj代字,
藏梵字符用拉丁字母al代字,藏梵字符用ASCII码符号…代字,
藏梵字符用拉丁字母nt代字,藏梵字符用ASCII码符号::代字,
藏梵字符用拉丁字母gl代字,藏梵字符用ASCII码符号[代字,
藏梵字符用ASCII码符号]代字,藏梵字符用拉丁字母aom代字,
藏梵字符用拉丁字母a代字,藏梵字符用拉丁字母au:代字,
藏梵字符用ao:代字,藏梵字符用拉丁字母v代字,
藏梵字符用拉丁字母v:代字,藏梵字符用拉丁字母z代字,
藏梵字符用拉丁字母vy代字,藏梵字符用拉丁字母vs代字,
藏梵字符用ASCII码符号::代字,藏梵字符用拉丁字母ny代字,
藏梵字符用拉丁字母ny代字,藏梵字符用拉丁字母nyno代字,
藏梵字符用拉丁字母km代字,藏梵字符用拉丁字母nydz代字,
藏梵字符用ASCII码符号.代字,藏梵字符用ASCII码符号..代字,
藏梵字符用ASCII码符号…代字,藏梵字符×用拉丁字母x代字,
藏梵字符××用拉丁字母xx代字,藏梵字符○×用.x代字,
藏梵字符×用拉丁字母x代字,藏梵字符※用x.代字,
藏梵字符○用拉丁字母o代字,藏梵字符○用拉丁字母o代字,
藏梵字符用拉丁字母o代字,藏梵字符用拉丁字母oo代字,
藏梵字符用拉丁字母z代字,藏梵字符用拉丁字母dj代字,
藏梵字符用拉丁字母rr代字,藏梵字符用拉丁字母dj代字,
藏梵字符用拉丁字母dj代字,藏梵字符用拉丁字母tm代字,
藏梵字符用拉丁字母pg代字,藏梵字符用拉丁字母pg代字,
藏梵字符用拉丁字母pg代字,藏梵字符用拉丁字母xxx代字;
所述基本编码规则还包括:罕见梵音字符未予以编码,直接在输入状态下,采用“插入”功能选择输入所述罕见梵音字符。
2.一种藏文拉丁全简双拼编码的智能输入系统,其特征在于,基于如权利要求1所述藏文拉丁全简双拼编码方法的智能输入系统,该输入系统包括:智能匹配模块、词典存储模块、输入/组词模块和方言处理模块;
所述智能匹配模块,将用户输入的编码串与编码概率表存储的编码进行匹配,获取是否匹配结果,若是“不匹配”结果,将所述编码串拆分后,每个拆分部分再进行匹配,临时组成词组,生成候选提示,并将所述候选提示发送给所述输入/组词模块;若是“匹配”结果,依据编码概率表将所述编码串转写成藏梵文;
所述输入/组词模块,依据组词输入提示,依次输入自造词的各个拉丁字符获得新词,并将新词存储到所述词典存储模块;
所述词典存储模块,存储常用的藏梵文字词和罕见梵音字符;
所述方言处理模块,将用户的方言编码转换为标准编码;
所述拉丁字符串包括拉丁字母和/或ASCII码符号。
3.根据权利要求2所述藏文拉丁全简双拼编码的智能输入系统,其特征在于,使用所述智能输入系统输入藏梵文时,采用QWERTY键盘全拼完成第一次输入的藏梵文字词所对应的拉丁代字,其后输入时即可简拼完成输入,具体为:
在全拼藏文时,藏文和梵文元音的输入规则一致,均为基字字符的拉丁代字输入结束时再输入元音的拉丁代字;
在简拼输入藏文时,无需考虑元音、上加、下加、前加、后加和再后加字,每个音节只输入基字即可。
4.根据权利要求3所述藏文拉丁全简双拼编码的智能输入系统,其特征在于,在输入藏梵文拉丁代字时,无大写字母和上档键的切换,所述上档键为Shift键。
5.一种藏文拉丁全简双拼编码的智能输入方法,其特征在于,基于如权利要求2-4任意一项所述藏文拉丁全简双拼编码的智能输入系统的智能输入方法,使用计算机标准键盘QWERTY键盘,全简双拼智能输入藏文梵文包括以下步骤:
S1,用户按需输入藏梵文的拉丁代字或ASCII码编码串;
S2,所述编码串进行编码概率匹配,如果匹配,则显示所述编码串对应的候选编码提示,转向S4;如果不匹配,则转向S3,
S3,启动智能词组,将所述编码串分拆后,再进行编码概率匹配,生成临时组成词组,显示候选编码提示,转向S4;
S4,判断用户从所述显示候选编码提示中选择一个候选编码提示与所述编码串是否匹配,如果匹配,选择所述候选编码提示对应的藏梵文字词,输入完成;如果不匹配,转向S5;
S5,进入组词模式,根据组词输入提示依次输入自造词的各个拉丁字符和/或ASCII码符号,获得新词,完成新词输入。
6.根据权利要求5所述藏文拉丁全简双拼编码的智能输入方法,其特征在于,步骤S1中,若用户定义了方言编码,则将用户输入的方言编码串转换成标准编码串;
在步骤S5之后,还存在步骤S6,将获得的新词添加到用户词典中。
7.根据权利要求5所述藏文拉丁全简双拼编码的智能输入方法,其特征在于,步骤S4中所显示的藏梵文字词为储存在用户词典中的字词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510056949.8A CN104615269B (zh) | 2015-02-04 | 2015-02-04 | 一种藏文拉丁全简双拼编码方法及其智能输入系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510056949.8A CN104615269B (zh) | 2015-02-04 | 2015-02-04 | 一种藏文拉丁全简双拼编码方法及其智能输入系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104615269A CN104615269A (zh) | 2015-05-13 |
CN104615269B true CN104615269B (zh) | 2018-01-16 |
Family
ID=53149753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510056949.8A Active CN104615269B (zh) | 2015-02-04 | 2015-02-04 | 一种藏文拉丁全简双拼编码方法及其智能输入系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104615269B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966474B (zh) * | 2021-02-20 | 2024-05-24 | 中央民族大学 | 一种基于多级注意力机制的藏文机器阅读理解方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60204113D1 (de) * | 2002-03-22 | 2005-06-16 | Sony Ericsson Mobile Comm Ab L | Texteingabe in ein elektronisches Kommunikationsgerät |
CN100403239C (zh) * | 2005-07-16 | 2008-07-16 | 西北民族大学 | 基于英文键盘的藏文输入法 |
CN100370398C (zh) * | 2005-08-31 | 2008-02-20 | 内蒙古蒙科立软件有限责任公司 | 现代藏文和梵音藏字的字处理系统 |
EP1860576A1 (en) * | 2006-05-23 | 2007-11-28 | Harman/Becker Automotive Systems GmbH | Indexing big world lists in databases |
CN101303644A (zh) * | 2007-05-08 | 2008-11-12 | 西北民族大学 | 基于Windows OS与Linux OS的梵音藏文输入法 |
CN101788852A (zh) * | 2010-01-27 | 2010-07-28 | 暨南大学 | 一种基于简拼的藏文词组输入法 |
CN103984420B (zh) * | 2014-04-10 | 2017-11-14 | 中央民族大学 | 一种基于拼音的藏文智能输入法 |
-
2015
- 2015-02-04 CN CN201510056949.8A patent/CN104615269B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104615269A (zh) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105957518B (zh) | 一种蒙古语大词汇量连续语音识别的方法 | |
Habash | Introduction to Arabic natural language processing | |
CN107368474B (zh) | 一种汉文到盲文的自动高效翻译转换方法 | |
US20130191115A1 (en) | Methods and Systems for Transcribing or Transliterating to an Iconphonological Orthography | |
CN102640107A (zh) | 信息处理装置 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
Ferlus | What were the four divisions of Middle Chinese? | |
Hadamitzky et al. | Japanese Kanji & Kana:(JLPT All Levels) A Complete Guide to the Japanese Writing System (2,136 Kanji and 92 Kana) | |
CN104615269B (zh) | 一种藏文拉丁全简双拼编码方法及其智能输入系统 | |
CN105045410A (zh) | 一种形式化拼音和汉字对应识别的方法 | |
Teshome et al. | Phoneme-based English-Amharic statistical machine translation | |
JP2013516673A (ja) | 文字表示方法及び文字入力方法 | |
CN106325540B (zh) | 一种滇东北次方言苗文的简笔输入法及其应用 | |
CN109766015A (zh) | 汉字拉丁码输入法 | |
Li et al. | The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian | |
CN100399245C (zh) | 中文拼音声调笔划组合输入法 | |
CN101968682B (zh) | 一种汉语输入法及其系统 | |
CN111381687A (zh) | 汉字形、音形两用码及音、形和音形码同台交叉输入汉字的平台 | |
Poupard | Between the Oral and the Literary: The Case of the Naxi Dongba Texts | |
Joshi et al. | Input Scheme for Hindi Using Phonetic Mapping | |
Park et al. | Hangeul (Korean alphabet) Notation Method based on Hunminjeongeum, for the Pronunciations of [sh],[zh], and [ch] in Chinese Language | |
JPH0969109A (ja) | 文書検索方法及び文書検索装置 | |
CN107066113A (zh) | 二十部件单字二码输入法 | |
CN101082838A (zh) | 音顺码汉字输入法 | |
CN104598046A (zh) | 首音码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |