CN101118542A - 一种中文字符的转换方法及其系统 - Google Patents
一种中文字符的转换方法及其系统 Download PDFInfo
- Publication number
- CN101118542A CN101118542A CNA2006100890206A CN200610089020A CN101118542A CN 101118542 A CN101118542 A CN 101118542A CN A2006100890206 A CNA2006100890206 A CN A2006100890206A CN 200610089020 A CN200610089020 A CN 200610089020A CN 101118542 A CN101118542 A CN 101118542A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- converted
- pinyin
- mentioned
- index value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提出一种中文字符的转换方法,该方法包含以下步骤:(1)构建一个数组与中文字符的拼音首字母的对应表;(2)获取待转换的中文字符的索引值;(3)按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母。本发明方法能够快速地提高由中文字符得到其拼音首字母的处理速度,并且无需太多内存空间。
Description
技术领域
本发明涉及一种字符的转换方法,尤其是一种中文字符的转换方法,以及为实现此方法而采用的系统。
背景技术
近年来,随着数字电视(Digital TV,DTV)、高清数字电视(High Definition TV,HDTV)以及网络电视(Internet Protocol TV,IPTV)的发展,人们对作为其辅助设备的机顶盒(Set TopBox,STB)也提出了更多的要求。机顶盒要能够支持视频点播、网络浏览、信息服务等业务功能,它作为一种家用数字平台将被广泛用于不断扩大的交互式多媒体数字内容服务领域。在使用机顶盒进行搜索时,由于机顶盒上没有中文键盘,因此如果想通过机顶盒在电视屏幕上搜索电视节目,只能借助于机顶盒上的英文键盘进行输入。也就是说,需要通过英文键盘输入拼音对中文电视节目进行搜索。
如果机顶盒上也没有英文键盘,则可以通过一个在电视屏幕上的软键盘对电视节目进行搜索,在该软键盘上具有英文键盘,能够通过该键盘输入拼音实现对中文电视节目的搜索。
现有技术中如果要将中文字符转换为其拼音首字母,一般通过先检索中文字符、再由该中文字符查找其拼音首字母的方法进行,如图1所示。图1的左边是拼音字母的排列表,该表的排列顺序类似于汉语字典的排列顺序,图1的右边是与同一个拼音相对应的一系列中文字符。如果要将一个中文字符转换为其拼音首字母,则首先用中文字符检索方法检索到该中文字符,然后从图1所示的表中找到该中文字符对应的拼音,进而找到其首字母。例如,如果要查找电影“英雄”,首先通过中文字符检索方法检索到“英”,然后从图1中可以找到“英”所对应的拼音为“ying”,从而得到其拼音首字母“y”,对“雄”的处理过程与“英”类似。尽管上述方法能够将中文字符转换为其拼音首字母,但是上述检索中文字符的过程需要的时间较长,尤其在需要检索的中文字符较多(例如电影名称比较长的时候)会花费更多的检索时间,从而为使用者带来不便。而且,由于存储图1所示的拼音与汉字对应表需要一定数量的内存空间,因此对于转换系统的内存容量也提出了更多要求。
发明内容
因此,本发明的主要目的在于提供一种中文字符的转换方法,将中文字符快速地转换为拼音首字母或者拼音首字母的组合,以便使用者在输入该拼音方式时,能够快速查找到对应的中文字符。
为达到上述目的,本发明的技术方案具体是这样实现的:一种中文字符的转换方法,该方法包含以下步骤:
(1)构建数组与中文字符的拼音首字母的对应表;
(2)获取待转换的中文字符的索引值;
(3)按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母。
根据本发明的一个方面,在步骤(2)中,将待转换的中文字符的编码值减去中文字符编码表中的一个基础值,得到待转换的中文字符的索引值。
根据本发明的另一个方面,上述中文字符的编码为统一码。
根据本发明的再一个方面,将待转换的中文字符的统一码值减去中文字符统一码表中的第一个中文字符的统一码值,得到待转换的中文字符的索引值。
根据本发明的又一个方面,通过中文字符与中文字符统一码的对照表获取上述待转换的中文字符的统一码值。
根据本发明的又一个方面,通过函数获取上述待转换的中文字符的统一码值。
相应地,本发明还提出一种中文字符的转换系统,该系统包括以下单元:
(1)用于存储数组与中文字符的拼音首字母的对应表的存储单元
(2)用于获取待转换的中文字符的索引值的计算单元;
(3)用于按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母的查找单元。
在上述装换系统中,上述计算单元中包括一个编码单元,用于将待转换的中文字符转换为中文字符编码值。通常这种中文字符的编码为统一码。
可见,本发明所提供的一种中文字符的转换方法及其系统,具有以下的优点和特点:
(1)采用本发明方法将中文字符转化为其拼音首字母时,可以先将中文字符用函数生成其编码值,然后减去一个编码值的基础值,得到中文字符的索引值,再在构建的数组与中文字符的拼音首字母对应表中查找索引值即可得到中文字符的拼音首字母。由于中文字符用函数生成其编码值的速度很快,其后减去基础值而得到索引值、再由索引值查找的过程同样非常迅速,因此本方法能够快速地提高由中文字符得到其拼音首字母的处理速度。
(2)本发明方法中使用函数将中文字符生成其编码值无需消耗很多内存,同样,在其后减去基础值而得到索引值、再由索引值查找的过程同样无需太多内存空间,因此节省了大量的内存。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的描述,其中:
图1是现有技术中将中文字符转换为其拼音首字母的方法示意图。
图2是现有技术中中文字符与统一码的对照表节选。
图3是本发明的中文字符转换方法的实施例。
具体实施方式
中文字符可以采用多种形式进行编码,例如处理汉字常用的GB2312编码。而统一码Unicode(也称万国码、单一码)则是一种在计算机上使用的字符编码。它为包括中文在内的每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
每个中文字符都有与其相对应的统一码Unicode。中文字符与统一码Unicode的对应关系可以由一个对照表加以确定,该对照表的节选如图2所示。图2中的第一行和第一列表明Unicode编码值,行和列的交叉点处的中文字符表明对应的该Unicode码的中文字符。例如,0x4E00(十六进制,“0x”表示十六进制)对应中文字符“一”,0x4E01对应中文字符“丁”,0x4E02对应中文字符“丂”。
通过上述对照表能够查找到与一个中文字符对应的Unicode码。采用计算机处理时,通常将上述对照表编写为程序或者函数,只要输入中文字符,通过上述程序或者函数就能够得到其相应的Unicode码。目前比较常用的是利用Java编写的函数。
图2是本发明的中文字符转换方法的实施例。在该实施例中,第一步,首先设置一个数组array,数组下标从0开始,数组长度为20902,标识着一共有20902个汉字。然后构建一个该数组array与中文字符的拼音首字母的对应表,其中与数组下标相应的数组元素对应的是按顺序排列的Unicode编码的中文字符的拼音首字母。例如,与第一个数组下标0相应的数组元素array[0]对应的是Unicode编码表中的第一个中文字符“一”的拼音首字母“y”;与第二个数组下标1相应的数组元素array[1]对应的是Unicode编码表中的第二个中文字符“丁”的拼音首字母“d”;与第三个数组下标2相应的数组元素array[2]对应的是Unicode编码表中的第三个中文字符“丂”的拼音首字母“y”,以此类推,一直对应到Unicode编码表中最后一个中文字符。
第二步,假设使用该方法时待转换的中文字符是“英雄”,则首先处理第一个汉字“英”。上面已经提及,现有技术中已有将中文字符转化为其统一码Unicode的方法,例如通过程序或者函数进行获取。因此通过上述函数就可以得到“英”的Unicode码,为0x82F1。类似地,通过函数可以得到中文字符“雄”的Unicode码,为0x96C4。
然后,将上述将待转换的中文字符的Unicode码值减去中文字符与Unicode编码对照表中第一个中文字符的Unicode码值,得到待转换的中文字符的索引值。由于对照表中第一个中文字符是“一”,其Unicode码值为0x4E00,因此,用中文字符“英”的Unicode码值0x82F1减去“一”的Unicode码值0x4E00,得到中文字符“英”的索引值,该索引值为0x34F1,用十进制表示为13553。类似地,用中文字符“雄”的Unicode码值0x96C4减去“一”的Unicode码值0x4E00,得到中文字符“英”的索引值,该索引值为0x48C4,用十进制表示为18628。
第三步,按照上述索引值在步骤一构建的数组与中文字符的拼音首字母对应表中查找上述待转换的中文字符的拼音首字母。按照得到的上述索引值,“英”的索引值为“13553”,“雄”的索引值为“18628”,通过步骤一中构建的数组array与中文字符的拼音首字母的对应表中可以查到,array[13553]对应的英文首字母为“y”,array[18628]对应的英文首字母为“x”,也就是说,“英雄”的拼音首字母为“yx”。
本发明的另外一个实施例涉及一种中文字符的转换系统,该系统包括以下单元:
(1)用于存储数组与中文字符的拼音首字母的对应表的存储单元;
(2)用于获取待转换的中文字符的索引值的计算单元;
(3)用于按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母的查找单元。
在上述转换系统中,上述计算单元中包括一个编码单元,用于将待转换的中文字符转换为中文字符编码值。通常这种中文字符的编码为统一码。
本发明虽然以机顶盒为主说明本发明方法的适用场合,但是并不仅限于机顶盒,在与其相似的产品上都可以适用本发明方法及其系统。
从上述实施例可以看出,本发明方法能够快速地提高由中文字符得到其拼音首字母的处理速度,并且无需太多内存空间。
Claims (9)
1.一种中文字符的转换方法,其特征在于该方法包含以下步骤:
(1)构建数组与中文字符的拼音首字母的对应表;
(2)获取待转换的中文字符的索引值;
(3)按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母。
2.根据权利要求1所述的中文字符的转换方法,其特征在于:在步骤(2)中,将待转换的中文字符的编码值减去中文字符编码表中的一个基础值,得到待转换的中文字符的索引值。
3.根据权利要求2所述的中文字符的转换方法,其特征在于:上述中文字符的编码为统一码。
4.根据权利要求3所述的中文字符的转换方法,其特征在于:将待转换的中文字符的统一码值减去中文字符统一码表中的第一个中文字符的统一码值,得到待转换的中文字符的索引值。
5.根据权利要求4所述的中文字符的转换方法,其特征在于:通过中文字符与中文字符统一码的对照表获取上述待转换的中文字符的统一码值。
6.根据权利要求4所述的中文字符的转换方法,其特征在于:通过中文字符与中文字符统一码的编码函数获取上述待转换的中文字符的统一码值。
7.一种中文字符的转换系统,其特征在于上述系统包括以下单元:
(1)用于存储数组与中文字符的拼音首字母的对应表的存储单元;
(2)用于获取待转换的中文字符的索引值的计算单元;
(3)用于按照上述索引值在上述对应表中查找上述待转换的中文字符的拼音首字母的查找单元。
8.根据权利要求7所述的中文字符的转换系统,其特征在于:上述计算单元中包括一个编码单元,用于将待转换的中文字符转换为中文字符编码值。
9.根据权利要求8所述的中文字符的转换系统,其特征在于:上述中文字符的编码为统一码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006100890206A CN101118542A (zh) | 2006-07-31 | 2006-07-31 | 一种中文字符的转换方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006100890206A CN101118542A (zh) | 2006-07-31 | 2006-07-31 | 一种中文字符的转换方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101118542A true CN101118542A (zh) | 2008-02-06 |
Family
ID=39054660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006100890206A Pending CN101118542A (zh) | 2006-07-31 | 2006-07-31 | 一种中文字符的转换方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101118542A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101686274A (zh) * | 2008-09-22 | 2010-03-31 | 深圳富泰宏精密工业有限公司 | 联系人查找系统及方法 |
CN101833381A (zh) * | 2010-05-19 | 2010-09-15 | 北京友录在线科技发展有限公司 | 一种手持设备通讯录的拼音反查方法 |
CN103235789A (zh) * | 2013-03-29 | 2013-08-07 | 惠州市德赛西威汽车电子有限公司 | 一种汉字转换为拼音及首字母的方法 |
CN106776494A (zh) * | 2016-10-26 | 2017-05-31 | 江苏芯艾科半导体有限公司 | 一种利用视觉符号组合图形表征测试产品测量结果的方法 |
CN110019649A (zh) * | 2017-12-25 | 2019-07-16 | 北京新媒传信科技有限公司 | 一种建立、搜索索引树的方法及装置 |
CN110298027A (zh) * | 2018-03-22 | 2019-10-01 | 卡西欧计算机株式会社 | 显示装置、显示系统、显示方法以及记录介质 |
CN111614977A (zh) * | 2017-12-28 | 2020-09-01 | 贵州白山云科技股份有限公司 | 网络系统中文本内容传输优化方法和系统 |
CN115563634A (zh) * | 2022-09-29 | 2023-01-03 | 北京海泰方圆科技股份有限公司 | 一种检索方法、装置、设备及介质 |
-
2006
- 2006-07-31 CN CNA2006100890206A patent/CN101118542A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101686274A (zh) * | 2008-09-22 | 2010-03-31 | 深圳富泰宏精密工业有限公司 | 联系人查找系统及方法 |
CN101686274B (zh) * | 2008-09-22 | 2013-10-09 | 深圳富泰宏精密工业有限公司 | 联系人查找系统及方法 |
CN101833381A (zh) * | 2010-05-19 | 2010-09-15 | 北京友录在线科技发展有限公司 | 一种手持设备通讯录的拼音反查方法 |
CN101833381B (zh) * | 2010-05-19 | 2012-03-21 | 北京友录在线科技发展有限公司 | 一种手持设备通讯录的拼音反查方法 |
CN103235789A (zh) * | 2013-03-29 | 2013-08-07 | 惠州市德赛西威汽车电子有限公司 | 一种汉字转换为拼音及首字母的方法 |
CN103235789B (zh) * | 2013-03-29 | 2016-08-10 | 惠州市德赛西威汽车电子股份有限公司 | 一种汉字转换为拼音及首字母的方法 |
CN106776494A (zh) * | 2016-10-26 | 2017-05-31 | 江苏芯艾科半导体有限公司 | 一种利用视觉符号组合图形表征测试产品测量结果的方法 |
CN110019649A (zh) * | 2017-12-25 | 2019-07-16 | 北京新媒传信科技有限公司 | 一种建立、搜索索引树的方法及装置 |
CN111614977A (zh) * | 2017-12-28 | 2020-09-01 | 贵州白山云科技股份有限公司 | 网络系统中文本内容传输优化方法和系统 |
CN110298027A (zh) * | 2018-03-22 | 2019-10-01 | 卡西欧计算机株式会社 | 显示装置、显示系统、显示方法以及记录介质 |
CN115563634A (zh) * | 2022-09-29 | 2023-01-03 | 北京海泰方圆科技股份有限公司 | 一种检索方法、装置、设备及介质 |
CN115563634B (zh) * | 2022-09-29 | 2023-08-15 | 北京海泰方圆科技股份有限公司 | 一种检索方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101118542A (zh) | 一种中文字符的转换方法及其系统 | |
US6877003B2 (en) | Efficient collation element structure for handling large numbers of characters | |
CN102141916B (zh) | 嵌入式设备及其在osd界面显示语言文字的方法 | |
CN102662926B (zh) | 字库的存储与访问方法 | |
CN102413297A (zh) | 一种在电视机上实现网页浏览的方法及电视机 | |
CN102236423A (zh) | 一种字符自动补充的方法、装置和输入法系统 | |
US20130197898A1 (en) | Method and apparatus for translation | |
CN101398830B (zh) | 词库模糊查询方法及词库模糊查询系统 | |
CN104572685A (zh) | 数据排序方法 | |
CN1704935A (zh) | 网页浏览器的简易输入方法 | |
CN101622615B (zh) | 用于生成数据流的设备和方法以及用于读取数据流的设备和方法 | |
CN101394564A (zh) | 解码jpeg应用中的可变长度码 | |
US7671781B2 (en) | System and method for producing character on interactive equipment | |
US7260780B2 (en) | Method and apparatus for providing foreign language text display when encoding is not available | |
US6393445B1 (en) | System for transforming Chinese character forms in real-time between a traditional character form and a simplified character form | |
CN102185891B (zh) | 基于中间件平台的在线电子词典查询系统 | |
CN102103586A (zh) | 一种多语种双向混排字幕的编辑系统 | |
CN101551798A (zh) | 翻译输入法及字库 | |
CN113573125B (zh) | 一种基于svg字库的字幕渲染方法及系统 | |
CN102117159B (zh) | 一种人机界面交互系统和方法 | |
CN103888800A (zh) | 控制方法和控制装置 | |
CN1466039A (zh) | 可以进行中文和多种文字输入的电子遥控器 | |
TW561360B (en) | Method and system for case conversion | |
CN2834054Y (zh) | 一种快速查找电视频道的专用菜单 | |
CN117290523B (zh) | 基于动态索引表的全文检索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080206 |