CN102566904A - 西夏文语音仿真平台的全息码交换终端 - Google Patents
西夏文语音仿真平台的全息码交换终端 Download PDFInfo
- Publication number
- CN102566904A CN102566904A CN2011103835451A CN201110383545A CN102566904A CN 102566904 A CN102566904 A CN 102566904A CN 2011103835451 A CN2011103835451 A CN 2011103835451A CN 201110383545 A CN201110383545 A CN 201110383545A CN 102566904 A CN102566904 A CN 102566904A
- Authority
- CN
- China
- Prior art keywords
- voice
- holographic
- xia dynasty
- tangut
- west xia
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种西夏文全息码交换终端,由西夏文用户界面、全息码组装交换模块以及西夏字体语音联动处理模块等构成全息码交换功能的主体架构,完成从西夏文字形构件面板点击输入到西夏文字体及对应语音输出的全过程。包含所述同构映射矩阵的西夏文全息码交换终端,运用B-S三层逻辑模式,通过公共云端链路与西夏文语音仿真平台相联;并通过终端界面实现便捷友好的人-机互动。本发明为西夏文语音仿真平台建立西夏单元音构型、使西夏语音格局回归藏缅语大家庭、最终导出特定文本的西夏语音奠定了坚实的基础,为计算音韵学在西夏学研究中的应用提供了便捷友好的前端操控设备。
Description
技术领域
本发明属于语音仿真技术领域,涉及计算音韵学,尤其是西夏音韵学领域的西夏语音格局之计算机重构技术。
技术背景
西夏语音的研究,历经了整整一个世纪,至今仍未曾解决语音格局的基本问题。西夏文语音仿真平台,采用计算音韵学和数据库技术,率先导出了西夏语单元音构型,终结了西夏语音采用斯拉夫语音构型的尴尬历史,让西夏语音格局终于回归藏缅语的大家庭,为最终导出特定文本的西夏语音奠定了坚实的基础。
目前,西夏文的信息处理还基本上停留在字处理的阶段,西夏字库的机内码不统一,较常见到的至少有如下5种:日本文字镜协会、台湾历史语言研究所、宁夏大学、同济大学、美国加大柏克莱分校等。而且,多数系统的西夏字库内码区间与汉字库内码区间重叠,导致计算音韵学难以在西夏语音研究中得到应用。人们迫切需要一种机内码独立、编码与字形对称同构的交换码,才能让西夏文本在互联网上畅通无阻。全息码交换终端的发明解决了西夏学界面对的种种难题,为计算音韵学在西夏学研究中的应用提供了可靠的技术平台以及便捷友好的终端操控设备。
经对现有技术的文献检索发现,西夏文语音仿真平台是首创的中古语音仿真平台,全息码交换终端作为该平台的关键设备,填补了计算音韵学、西夏学以及相关技术领域的一个空白。
发明内容
本发明的目的在于提供一种西夏文语音仿真平台的全息码交换终端(TheComputer Simulation System for Tangut Phonology-HoloInfo Codes Commutative TerminalDevice),西夏文全息码交换终端通过公共云端链路与西夏文语音仿真平台相连,实现从西夏文字形构件面板(触摸屏)点击输入(兼容鼠标)到西夏文字体及对应语音输出的联动交换。
本发明的主要内容包括:终端设备总体架构、全息码交换过程模型、西夏字形构件面板、全息码同构映射矩阵以及西夏文用户界面(GUI)等五大部分。全息码交换终端是西夏文语音仿真平台的关键设备之一,该平台的宗旨在于运用计算音韵学方法和数据库技术解决西夏语音的世纪难题,重建符合藏缅语语音构型的西夏语音格局,最终让特定的文本输出西夏语音。
西夏文全息码交换终端(100),运用全息码交换过程模型,通过公共云端链路与西夏文语音仿真平台相联;其核心技术之一,就是全息交换码(同构映射矩阵元素组的集合),并通过终端界面实现便捷友好的人-机互动。
全息码交换过程模型(131<->300),实现了从西夏字形构件面板到全息交换码以及标准键盘字符([a~z]26个拉丁字母和[2~9]8个数字)的双重映射,在西夏文用户界面的人-机交互过程中触发语音联动,同步输出西夏字体及其对应的西夏语音。
西夏文字形构件面板(166),用频度统计分析方法,将构件按频度统计结果分成三个层次:高频构件、中频构件和低频构件,前30个高频构件将面板分成30个构件区(196/198)。构件频度分层方案,构造了“见字识码”和“见码识字”双向映射,导出了编码与字形的对称同构。
全息码同构映射矩阵(176)的元素组,构成了全息交换码的主键域,其逻辑接口一端联接西夏文语音库,另一端联接字形构件面板,通过交换终端的核心,实现了字体与语音输出的联动;同构映射矩阵的元素组,同时又与西夏文字形构件区(196/198)直接关联。
西夏文用户界面(140/142),通过服务器端的三层逻辑(300)访问西夏文字体和语音数据库,全息码交换终端的字体和语音处理模块,以及人机交互组件160、162、164、180、182等,完成西夏文字体显示和语音联动输出。
全息码交换终端的发明解决了西夏学界面对的种种难题,为西夏文语音仿真平台导出西夏单元音构型、让西夏语音格局回归藏缅语大家庭、最终导出特定文本的西夏语音奠定了坚实的基础,为计算音韵学在西夏学研究中的应用提供了便捷友好的前端操控设备。
附图说明
图1全息码交换终端的总体架构框图。
图2全息码交换过程模型功能/数据框图。
图3西夏文用户界面及字形构件面板示意图。
图4全息交换码高中频构件映射矩阵示意图。
图5全息交换码中低频构件映射矩阵示意图。
图6西夏文字体语音交互及码本编辑组件示意图。
具体实施方式
以下结合附图实施示例对本发明进一步说明如下:
1、终端设备的总体架构
西夏文全息码交换终端的体系架构,设计为三层逻辑模式,通过公共云端链路与西夏文语音仿真平台联接,其功能/数据框图见图1。全息码交换终端100采用通用的移动信息设备,具备经由I/O接口104连接多个外围设备,包括触摸屏110、扬声器112、鼠标键盘114以及外部存储设备116等,并安装具有多媒体功能的操作系统。环境架构软件130保存在存储器104中,并在CPU102上运行,全息码交换程序131在环境架构的支撑下运行。全息码交换程序包含西夏文用户界面(GUI)132、全息码组装交换模块134以及西夏字体语音联动处理模块136等等。其中,文本发送和图形、语音接收模块(CT)属于调用支撑环境的标准模块,不作具体说明。
西夏文用户界面(GUI)132、全息码组装交换模块134以及西夏字体语音联动处理模块136一起构成全息码交换功能的主体架构,完成从西夏文字形构件面板点击输入到西夏文字体及其对应语音输出的全过程。西夏文全息码交换终端内部的数据流程已在图1中标明,数据流程可以进一步解析如下:
{开始}→{点击}→【用户界面132】→{生成字形码}→【全息码组装模块134】→{组装成全息交换码}→【SND ROUTINE144】→{将文本数据发送到服务器}→【云端链路108】→{接收服务器回传}→【REC ROUTINE146】→{字体与语音数据}→【字体语音联动处理模块136】→{传输}→【字体与语音面板132】→{显示西夏字体与对应的语音}→{结束}
注:上述流程中,{}表示操作,【】表示相关操作关涉的目标对象。
2、全息码交换过程模型
全息交换码逻辑接口一端联接西夏文语音库,另一端联接字形构件面板,通过交换终端,实现了从字形构件面板(触摸屏)点击输入到西夏字体及语音输出的联动交换,其功能/数据逻辑模型见图2。
全息码交换程序131的西夏文用户界面(GUI)132、全息码组装交换模块134以及西夏字体语音联动处理模块136等构成了西夏文全息交换码技术的主要功能。其中,西夏文用户界面(GUI)132,由西夏字体语音输出160和西夏字形构件面板166两大模块组成。西夏文语音仿真平台,通过公共云端链路108与全息码交换终端100联接,全息交换码从终端100发向服务平台300,西夏字体和语音从平台300传回终端100,详细的数据流程可以表述如下:
{开始}→{点击}→【字形构件面板166】→{点击}→【输入按钮180】→{生成字形码}→【全息码组装模块134】→{扫描表1组装全息交换码}→【SNDROUTINE144】→{三层服务处理}→【控制业务314】→{数据库存取}→【西夏字体数据库310】→【西夏语音数据库312】→{接收服务器回传}→【RECROUTINE146】→{图形与语音数据}→【字体语音联动处理模块136】→{传输}→【字体与语音面板160】→{显示西夏字体与对应的语音}→{结束}
在数据流程中,全息码组装环节是通过扫描西夏文字体语音表实现的,该表包含在全息码交换程序中,示例如下表:
表1全息交换码组装扫描表
全息交换码技术,不仅解决了西夏文输入和互联网交流中存在的难题,更重要的是构建了西夏字体和语音联动的有效机制,成为西夏文语音仿真平台的关键技术之一。
3、西夏字形构件面板
西夏文全息码交换终端的用户界面(GUI)132由西夏字形构件面板166等多个模块构成,见图3。左方142模块包含西夏字体显示160、西夏语音机读162、全息码跟踪164以及全息码文本处理168等组件,主要靠调用环境架构软件的标准模块来实现,放到后面再作说明。
西夏字形构件面板166(见图3右方)是全息码交换终端的重心之一。首先应用数据库技术对西夏字形构件作出频度统计分析,按频度分析结果将构件分成三个层次:高频构件(30个)、中频构件(90个)和低频构件(96个),其中,频度排序前30个高频构件将面板分成30个构件区(196/198),采用人机工程学的原理,按频度分布配置于构件面板构件区的高频层格,其配置结果见166上方。然后,按照本发明的关联原则,分别把中、低频构件归入构件区的左右两列中、低频层格。图3的196示意的构件区分层配置,与下表的高频构件和中、低频构件与构件区空间分层对应方式互为参照:
表2高频构件与中低频构件的空间分层表
196构件区的高频层格对应字母,198的高频层格对应数字。高频构件与中低频构件之间的关联,要遵循特定的原则,这样见到高频构件就自然而然联想到中低频构件,以下对关联原则作一简要说明:
①起笔关联,绝大部分西夏文字形构件都是按首笔的横、竖、撇、点、折
五种分类笔画关联起来的;
②增笔关联,当同一类字形构件中,增加不同数量的小笔画,比如框中加一横、两横、三横等等;
③首末关联,在西夏文字形构件中,有一类只用在一个字的起始,还有一类只用在一个字末尾,这样就可以把它们组合在一个构件区;
④频度关联,有些构件拼装可以构成频移,此类产生频移的构件,可以按频度的分布组合在一个构件区;
⑤框架关联,在西夏文字形构件中,有一类可以用作字体的框架,那么,
该框架与原构件(非框架构件)就组合在一个构件区。
至关重要的是,仅用高频构件所生成的代码即可涵盖全部西夏文字,中低频构件主要是为了缩减全息码的码长和降低点击次数而设置的,在码长无关紧要的应用场合,完全可以忽略中低频构件的配置。
注:当鼠标移到面板的任一构件区时,自动显示该区对应的值。
西夏文字形构件面板166的下方还有两行构件区,第一行统一配置西夏文数字1~10,第二行则可根据用户的需要配置10个专业相关的西夏文常用字。面板中的输入按钮180、重读按钮182等,构成西夏文全息码组装发送和西夏语音回传的人机交互组件,为界面的便捷友好提供必要的工具。
4、全息码同构映射矩阵
按照西夏文字结构顺序点击构件面板构件区的相应层格,系统就依据全息码同构映射矩阵176自动转换成全息码,见图4、5。在构件区高频层格,点击一次对应一个字符,A~Z,2、3、5、7,总共30个字符。构件区中频层格,点击一次对应2个字符,第一个字符即高频字符,第二个字符是a,e,u,2,其具体组合见图4构件区中频层格。构件区低频层格,点击一次也对应2个字符,第一个字符同前,第二个字符则是3,4,5,6,8,9,其具体组合见图5构件区低频层格。全息同构映射矩阵与西夏字形面板构件区的对应如下表所示:
表4全息同构映射矩阵与构件区的对应关系
西夏文字形构件区196共有26个:(a)~(z),从构件区196(q)到全息码同构映射矩阵的对应关系如下表:
表3构件区196(q)对应的全息码同构映射矩阵
从上表可知,高频层格对应1个字符,中低频层格则对应2个字符,这样配置符合人机工程学的基本原则。再加上构件区198(2)、(3)、(5)和(7)计4个,在面板上方共有30个,称主导区,高频字形构件统一配置在这些构件区的高频层格,适合全部用户。面板下方的20个构件区称辅助区,第一行10个区配置西夏文数字1~10,第二行则可根据用户需要自由配置以适合不同的专业需要。
中、低频构件是为缩减码长、降低点击次数设置的,因此,对那些对码长没有特别要求的用户,就可以完全不必顾及。所以,在字形构件面板166上(见图3)中频构件用菱形点表示,低频构件用虚圆点表示。
5、西夏文用户界面(GUI)
西夏文用户界面(GUI)(132图6)由字形构件面板模块140和字体语音交互模块142构成。其中,字体语音交互模块包含了西夏字体显示160、全息码跟踪162、语音机读164以及全息码本处理168等组件。西夏字体显示160、全息码跟踪162、西夏语音机读164以及西夏语音重读182四个组件构成了用户界面的西夏字体和语音输出的人机交互功能,为增添界面灵活性提供了必要的工具,直观地显示了西夏字体和语音的联动功能,见图6左方。全息码本处理组件168,见图6右上方,则完全采用环境架构的标准模块,可以在字体语音交互模块142和字形构件面板模块140之间切换,以适应不同规模格式的全息码用户码本编辑处理的需要,其他按钮组件功能就不再展开。
西夏文用户界面(GUI)132的人机交互操作流程可以简要表述如下:
{开始}→{跟踪点击}→【全息码跟踪162】→{点击}→【输入按钮180】→{字体码}→【全息码文本处理168】→{存储}→【Ho1oInfo Code116】→①::
②→【REC ROUTINE146】→{图形数据}→【西夏字体显示160】→{语音数据}→【语音机读164】→{显示西夏字体与输出语音}→{结束}上述流程中,存储环节所保存的HoloInfo码本文件,由西夏字形构件区196和198的标准键盘字符串构成(即同构映射矩阵的元素组)。构件区196和198的基本区别是:前者高频层格对应字母,而后者则对应数字。低频层格也有区别:前者对应3,4,5,6,后者则为3,8,5,9,构件区198共有4个:(2)、(3)、(5)和(7),从构件区198(2)到全息码同构映射矩阵的对应关系如下表:
表5构件区198(2)对应的全息码同构映射矩阵
其余198构件区所对应的全息码同构映射矩阵的元素为:3、32、33、35、38、39、3a、3e、3u、5、52、53、55、58、59、5a、5e、5u、7、72、73、75、78、79、7a、7e、7u,全部元素都可从上表直接推导出来。
Claims (5)
1.西夏文全息码交换终端(100),其特征在于:运用全息码交换过程模型,通过公共云端链路与西夏文语音仿真平台相联;其核心技术之一,就是全息交换码,并通过终端界面实现便捷友好的人-机互动。
2.根据权利要求1所述的全息码交换过程模型(131<->300),其特征在于:从西夏字形构件面板到全息交换码以及标准键盘字符([a~z]26个拉丁字母和[2~9]8个数字)的双重映射,在西夏文用户界面的人-机交互过程中触发语音联动,同步输出西夏字体及对应的西夏语音。
3.根据权利要求2所述的西夏文字形构件面板(166),其特征在于:按频度统计分析结果将构件分成三个层次:高频构件、中频构件和低频构件,前30个高频构件将面板分成30个构件区(196/198)。构件频度分层方案,构造了“见字识码”和“见码识字”双向映射,导出了编码与字形的对称同构。
4.根据权利要求1所述的全息交换码(176),其特征在于:逻辑接口一端联接西夏文语音库,另一端联接字形构件面板,通过交换终端的同构映射矩阵,实现了字体与语音输出的联动;同构映射矩阵的元素组,构成了全息交换码的主键域,这些元素组同时又与构件区(196/198)直接关联。
5.根据权利要求2所述的西夏文用户界面(140/142),其特征在于:通过服务器端的三层逻辑(300)访问西夏文字体和语音数据库,协同全息码交换终端的字体和语音处理模块,以及人机交互组件,完成西夏文字体显示和语音联动输出;HoloInfo Code116存储了完整的全息码本(同构映射矩阵元素组的集合),承载了本发明关键技术的主体设计思想。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110383545.1A CN102566904B (zh) | 2011-11-25 | 2011-11-25 | 一种基于西夏文全息码交换界面的西夏语音终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110383545.1A CN102566904B (zh) | 2011-11-25 | 2011-11-25 | 一种基于西夏文全息码交换界面的西夏语音终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102566904A true CN102566904A (zh) | 2012-07-11 |
CN102566904B CN102566904B (zh) | 2016-08-03 |
Family
ID=46412440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110383545.1A Expired - Fee Related CN102566904B (zh) | 2011-11-25 | 2011-11-25 | 一种基于西夏文全息码交换界面的西夏语音终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102566904B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104536590A (zh) * | 2014-12-24 | 2015-04-22 | 同济大学 | 基于西夏文声韵字根输入法的嵌入式软键盘系统 |
TWI497408B (zh) * | 2012-12-31 | 2015-08-21 | Via Tech Inc | 語音交互系統、行動終端裝置及語音通信的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008071099A1 (fr) * | 2006-09-05 | 2008-06-19 | Beijing Sogou Technology Development Co., Ltd. | Procédé et système permettant d'entrer un mot/diagramme artistique dans un programme d'application |
CN101866639A (zh) * | 2009-04-20 | 2010-10-20 | 龙旗科技(上海)有限公司 | 用于手持终端设备的多层人机界面系统 |
CN102073388A (zh) * | 2011-01-16 | 2011-05-25 | 唐加春 | 一种适用于音码输入法的人机交互模式 |
CN102117159A (zh) * | 2009-04-30 | 2011-07-06 | 广东国笔科技股份有限公司 | 一种人机界面交互系统和方法 |
-
2011
- 2011-11-25 CN CN201110383545.1A patent/CN102566904B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008071099A1 (fr) * | 2006-09-05 | 2008-06-19 | Beijing Sogou Technology Development Co., Ltd. | Procédé et système permettant d'entrer un mot/diagramme artistique dans un programme d'application |
CN101866639A (zh) * | 2009-04-20 | 2010-10-20 | 龙旗科技(上海)有限公司 | 用于手持终端设备的多层人机界面系统 |
CN102117159A (zh) * | 2009-04-30 | 2011-07-06 | 广东国笔科技股份有限公司 | 一种人机界面交互系统和方法 |
CN102073388A (zh) * | 2011-01-16 | 2011-05-25 | 唐加春 | 一种适用于音码输入法的人机交互模式 |
Non-Patent Citations (1)
Title |
---|
叶建雄等: "面向语音拟构的西夏谷文献数据库结构设计及实现", 《西夏学》, 30 September 2010 (2010-09-30), pages 204 - 212 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI497408B (zh) * | 2012-12-31 | 2015-08-21 | Via Tech Inc | 語音交互系統、行動終端裝置及語音通信的方法 |
CN104536590A (zh) * | 2014-12-24 | 2015-04-22 | 同济大学 | 基于西夏文声韵字根输入法的嵌入式软键盘系统 |
CN104536590B (zh) * | 2014-12-24 | 2017-12-15 | 同济大学 | 基于西夏文声韵字根输入法的嵌入式软键盘系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102566904B (zh) | 2016-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20130198219A1 (en) | Disambiguating associations | |
CN100550020C (zh) | 一种用于解决中文软件多语言支持问题的方法和装置 | |
Hoque et al. | Chart question answering: State of the art and future directions | |
CA2579052A1 (en) | Multi language text input in a handheld electronic device | |
CN107679151A (zh) | 一种基于ela大数据驾驶舱系统的数据处理方法 | |
CN102566904A (zh) | 西夏文语音仿真平台的全息码交换终端 | |
CN100451926C (zh) | 基于笔画和汉字基本部件的汉字输入法 | |
Sasarak et al. | min: A multimodal web interface for math search | |
Ricaurte et al. | 6. Debating and Developing Digital Humanities in China: New or Old? | |
CN102053955A (zh) | 一种符号输入的方法和系统 | |
CN105488219B (zh) | 网页信息自动录入方法及系统 | |
CN101118465A (zh) | 数字化输入和调用文字信息的新方案 | |
CN101055554A (zh) | 一种电子词典 | |
CN102053718B (zh) | 用于生成汉字的方法以及键盘输入设备 | |
CN104536590B (zh) | 基于西夏文声韵字根输入法的嵌入式软键盘系统 | |
Vikas | Multilingualism for cultural diversity and universal access in cyberspace: an Asian perspective | |
CN102799281A (zh) | 区位汉字输入法 | |
Chen et al. | Debating and Developing Digital Humanities in China | |
CN102681674A (zh) | 笔划及区位汉字输入法 | |
CN107748762A (zh) | 一种基于ela大数据驾驶舱技术的系统 | |
CN109002187A (zh) | 中文键盘、软键盘、写字板、输入法和信息交换码方法 | |
Murphy | Transforming health science libraries around the globe: The impact of technology | |
CN201298232Y (zh) | 触摸屏式多语种翻译装置 | |
Horvath | Digital Brush Talk | |
CN205485963U (zh) | 输入结构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160803 Termination date: 20181125 |