CN1577325A - 繁体中文字/简体中文字翻译方法 - Google Patents

繁体中文字/简体中文字翻译方法 Download PDF

Info

Publication number
CN1577325A
CN1577325A CNA2004100343578A CN200410034357A CN1577325A CN 1577325 A CN1577325 A CN 1577325A CN A2004100343578 A CNA2004100343578 A CN A2004100343578A CN 200410034357 A CN200410034357 A CN 200410034357A CN 1577325 A CN1577325 A CN 1577325A
Authority
CN
China
Prior art keywords
chinese
word
simplified form
chinese character
traditional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100343578A
Other languages
English (en)
Inventor
陈彦甫
约翰·W·邓斯莫伊尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1577325A publication Critical patent/CN1577325A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种将简体中文字翻译为繁体中文字以及将繁体中文字翻译为简体中文字的方法被公开。本发明包括字符转换程序(CCP)。CCP接受以Big 5、GB2312、ASCII或任何Unicode编码方案的字符,并且将所述字符翻译为Unicode。如果输入的字符是简体中文字,则CCP确定相应繁体中文字。如果输入的字符是繁体中文字,则CCP确定相应简体中文字。CCP然后显示输入的简体中文字和相应繁体中文字,或反之亦然。如果输入的字符是繁体中文字并且没有相应简体中文字,则CCP显示一个消息来指示繁体中文字没有相应简体中文字。

Description

繁体中文字/简体中文字翻译方法
技术领域
本发明涉及一种用于将简体中文字翻译为繁体中文字以及将繁体中文字翻译为简体中文字的方法。
背景技术
诸如汉语这样的基于汉藏语系的语言与诸如英语这样的基于拉丁语系的语言有很大不同。中文不包括字母表。相反,中文包括超过6万个独立汉字(character)。6万个汉字的每个具有不同的含义。认识大约1200个汉字就足够阅读中文报纸。中文学院毕业生认识大约3000个汉字。
中文在词(word)的概念上也与基于拉丁语系的语言不同。在中文中,汉字串不包括空格,一个词结尾和另一个词开头的理解完全基于上下文。汉字在含义、发音和在它们被书写的方式上非常准确。如果以串形式向一个汉字添加汉字,则增强了第一个汉字的含义,但是通常它不被改变。
汉字总是发单个音节。没有两音节的汉字。每个汉字具有5个基音之一。这5个基音为中文带来了歌唱的质量,因为一些汉字以高音调发音,一些以低音调发音,一些以升调或降调发音。音调对语言是重要的,没有音调,中文将不容易被理解。例如,汉字“ma”根据音调可以表示“妈”或“马”或“吗”。在中国有许多方言。从一种方言到另一种方言,口语基本上不可理解。但是,仅仅有一种中文文字。中文文字被所有的方言理解。其它汉藏语系语言,诸如日文、韩语和越南语与中文一样使用多个字符。但是,这些语言没有共同的书写或口语含义,这类似于英语、西班牙语和法语使用公共的字母表但是不可互换的方式。
在1949年中国共产革命之后,共产党对中文作出了几个改变。首先,传统的“从上向下”和“从右向左”的书写中文的方法被屏弃。中华人民共和国(PRC或中国大陆)现在按照西文,“从左向右”然后“从上向下”进行书写。其次,选择了单一的方言普通话,它现在在所有的学校中作为基本中文被教授。第三,PRC改变了大约四分之一的汉字以将它们减少到大约几行或几划。这种形式的中文被称为“简体中文”。在PRC,简体中文现在被广泛使用,但是台湾和香港仍然使用称为“繁体中文”的更费事形式的中文。PRC也采用由多数西方国家使用的阿拉伯数字系统,并且因特网的出现正在使得英语出现在许多中文语句中。
PRC也引入了“拼音”(中文的语音版本)来帮助孩子学习这种语言。拼音使用英文的26个字母外加在一些元音上的4个音调来指示如何发音汉字。当学生被教授使用汉字时通常从大约4岁到大约7岁使用拼音。拼音对于从外语常用语手册来说汉语的旅游者和商人也是很有益的。另外,拼音对于计算机用户是普及的,因为它是从键盘输入汉字的最简单方式。
在计算机中,所有的汉藏语系语言被16比特的字符表示,而英语和拉丁语系语言8比特的字符表示。传统上,为每种语言产生独立的编码。英语和其它拉丁语系语言使用ASCII编码。简体中文使用GB2312编码。繁体中文使用Big 5编码,等等。换句话说,使用Big 5编码的计算机不能读取GB2312或ASCII编码的计算机代码。这种编码的多样性是混乱的,并且在不同的编码之间没有标准化。Unicode协会已经开发了一种单一的编码,它并入了世界上所有的主要语言。存在使用Unicode和替代在计算机应用中的所有其它编码的强大动向。Unicode对于在计算机内的每个字符使用16个比特。Unicode具有65,000个不同的字符,并且每种主要语言被映射为这个Unicode范围的不同部分。因此,Unicode可以用作所有的世界语言的单一编码方案。
但是,Unicode的问题之一是可以使用在Unicode内不同的方案来表示独立的字符、字母或符号。两种最常见的编码方案是UTF-8和UCS-2。UTF-8是二进制(基数2)Unicode编码方案,它将每个字符、字母或符号表示为一个、两个或三个字节,每个字节为8个比特。相反,UCS-2是16进制(基数16)的Unicode编码方案,它将每个字符、字母或符号表示为8个16进制数字。一个16进制数字等同于4个比特,1个字节可以由两个16进制数字表达。下面的表1显示在UTF-8和UCS-2之间的差别。
UCS-2(16进制的) UTF-8(二进制) 说明
 0000 007F  0xxxxxxx ASCII
 0080 07FF  110xxxxx 10xxxxxx 多达U+07FF
 0800 FFFF  1110xxxx 10xxxxxx 10xxxxxx 其它UCS-2
                        表1
用户可以根据用户期望的需要来选择使用USC-2方案或UTF-8方案来编码。例如,当从一个位置向另一个发送数据时,由于在可变字节流长度(即,1-3字节,如表1所示)中固有的发送效率,UTF-8是优选的编码方案。但是,当在数据库中存储同一信息时,UCS-2是优选的编码方案,因为均匀的数据长度使得可以进行较快的搜索和比较操作(即8个16进制数字,如表1所示)。在UCS-2和UTF-8之间的转换功能是可以获得的,这由在此通过引用而被并入的、题目为“在数据库引擎中的表级Unicode处理”的美国专利申请公布2003/0078921来证明。
在开发Unicode之前,在简体中文和繁体中文之间的计算机化的文字翻译器是不可能的,因为GB2312代码不能明白Big5代码,反之亦然。需要从简体中文向繁体中文的翻译或从繁体中文向简体中文的翻译的用户被迫查找在印刷的字典中的翻译。如果用户期望计算机实现的翻译,则用户被迫使用拼音、英文或一些其它的语言来作为在简体中文和繁体中文之间的中介。因此,需要用于在繁体中文和简体中文之间直接翻译的自动方法。类似地,需要一种用于利用Unicode在简体中文和繁体中文之间翻译的计算机化方法。
发明内容
本发明是用于将简体中文字翻译为繁体中文字以及将繁体中文字翻译为简体中文字的方法。本发明的软件实施例是可以在万维网网页上工作的计算机程序或作为在独立计算机上的程序的计算机程序。本发明的软件实施例包括字符转换程序(CCP)。CCP接受Big 5、GB2312、ASCII或任何Unicode编码方案的字符,并且将所述字符翻译为Unicode。CCP然后确定是否所述字符是繁体中文字或简体中文字。如果输入的字符是简体中文字,则CCP使用简体中文/繁体中文转换表来确定相应繁体中文字。如果输入的字符是繁体中文字,则CCP使用简体中文/繁体中文转换表来确定相应简体中文字。CCP然后显示输入的简体中文字和相应繁体中文字,或显示输入的繁体中文字和相应简体中文字。如果被输入的字符是繁体中文字并且没有相应简体中文字,则CCP显示一个消息来指示繁体中文字没有简体中文字的等同物。
附图说明
在所附的权利要求中给出了相信具有新颖性的特征。但是,通过下面结合附图详细描述说明性的实施例,本发明本身以及优选使用方式、另外的目的及其优点将最佳地被理解。
图1是用于实现本发明的计算机网络的图示;
图2是用于实现本发明的存储器的图示;
图3是本发明的字符转换程序(CCP)的逻辑的图示;
图4是本发明的图形用户界面(GUI)的图示。
具体实施方式
在此使用的术语“Big 5”指的是用于繁体中文字集的编码语言。
在此使用的术语“计算机”指的是能够与用户或其它计算机交互的、包括处理器、存储器和操作系统的机器,应当包括但不限于台式计算机、笔记本计算机、个人数字助理(PDA)、服务器、手持计算机和类似的器件。
在此使用的术语“GB2312”指的是用于简体中文字集的编码语言。
在此使用的“Unicode”指的是由Unicode协会开发的编码语言,包括世界上多数语言,其中包括简体中文字集和繁体中文字集。
图1是与本发明相关联的计算机网络90。计算机网络90包括与网络96电子连接的本地机器95。本地机器95经由网络96电子连接到远程机器94和远程机器93。本地机器95也经由网络96电子连接到服务器91和数据库92。网络96可以是诸如局域网(LAN)这样的简化网络连接,或者可以是诸如广域网(WAN)或因特网这样的较大网络。而且,图1中所述的计算机网络90意欲作为可以包括本发明的可能操作网络的表示,不意欲作为结构的限定。
包括处理器、存储器和输入/输出器件的连接和定位的计算机的内部配置是本领域内公知的。本发明是可以在计算机程序中实现的方法。参见图2,本发明的方法通过字符转换程序(CCP)200以软件实现。在此所述的CCP 200可以被存储在图1中所述的任何计算机的存储器中。或者,CCP 200可以被存储在外部存储器,诸如可拆卸盘或CD-ROM。存储器100指的是在图1的计算机之一内的存储器。存储器100也包括Unicode翻译器程序102、简体中文/繁体中文转换表104。本发明可以通过存储器100连接到Unicode翻译器程序102和简体中文/繁体中文转换表104。作为本发明的一部分,存储器100可以配置CCP 200。处理器106可以执行在CCP 200内包括的指令。
在替代的实施例中,CCP 200可以被存储在其它计算机的存储器中。在其它计算机的存储器中存储CCP 200使得处理器工作负荷被分布在多个处理器上而不是单个处理器上。CCP 200在各种存储器上的进一步配置是本领域内的技术人员公知的。
在所述优选实施例中,本发明是可以从因特网访问的网页。本发明的CCP200的逻辑的流程图被图解在图3中。CCP 200是用于将简体中文字翻译为繁体中文字以及将繁体中文字翻译为简体中文字的程序。当用户访问万维网网页时,CCP 200启动(202)。用户然后输入中文字(204)。在步骤204输入的中文字可以是繁体中文字或简体中文字。而且,在步骤204的输入可以是以GB2312、Big 5或任何Unicode格式。CCP 200接受GB2312、Big 5或Unicode编码(即UTF-8),因为CCP 200将字符数据翻译为UCS-2数据(206)。CCP200可以利用图2中的Unicode翻译程序102来将输入的字符翻译为USC-2数据。虽然GB2312和Big5彼此不兼容,但是GB2312和Big 5都与Unicode兼容。换句话说,以GB2312编码的万维网网页不识别Big5字符,以Big 5编码的万维网网页不识别GB2312字符。但是,以Unicode编码的万维网网页识别GB2312字符和Big 5字符,因为Unicode包括GB2312字符和Big 5字符。
CCP 200然后确定输入的字符是否是简体中文字(212)。如果输入的字符不是简体中文字,则CCP 200进行到步骤214。如果输入的字符是简体中文字,则CCP 200在简体中文/繁体中文转换表212中查找简体中文字,并且确定相应繁体中文字(210)。简体中文/繁体中文转换表212是将繁体中文字索引到简体中文字以及将简体中文字索引到繁体中文字的JAVATM散列表。简体中文/繁体中文转换表212可以是类似于图2中的简体中文/繁体中文转换表104。在散列表中的数据是以UCS-2 Unicode格式的。因为存在大约1,250个简体中文字,散列表包括大约2500项-一项用于一个简体中文字和一个相应繁体中文字。CCP然后进行到步骤224。
返回步骤214,CCP 200然后确定输入的字符是否是繁体中文字(214)。如果输入的字符不是繁体中文字,则CCP 200显示一个消息:输入的字符不是认识的简体中文字或繁体中文字并且结束(226)。如果输入的字符是繁体中文字,则CCP 200确定是否输入的字符具有相应简体中文字(216)。通过确定是否在简体中文/繁体中文转换表212中存在输入的字符来确定一个繁体中文字是否具有相应简体中文字。如果输入的字符没有相应简体中文字,则CCP 200显示一个消息来指示输入的繁体中文字没有相应简体中文字(222)并且结束(226)。如果输入的字符具有简体中文等同物,则CCP 200使用简体中文/繁体中文转换表212来确定相应简体中文字(218)并且进行到步骤224。
在步骤224,CCP 200显示输入的字符和字符等同物(224)。如果输入的字符是简体中文字,则CCP 200首先显示输入的简体中文字,并且在输入的简体中文字后面显示相应繁体中文字。类似地,如果输入的字符是繁体中文字,则CCP 200首先显示输入的简体中文字,并且在输入的繁体中文字后面显示相应简体中文字。CCP 200然后结束(226)。
转向图4,其中图解了本发明的图形用户界面(GUI)300的实施例。GUI300是本发明的万维网页面实施例的内容的示例。GUI 300也是在单个计算机上可运行的、本发明的独立计算机程序实施例的显示的示例。GUI 300包括用户输入字段302。用户可以利用计算机的复制和粘贴操作来向用户输入区302中输入字符。在复制和粘贴操作中,用户加亮所期望的字符,从菜单选择“复制”,将光标放置到用户输入区302中,并且从菜单选择“粘贴”。被加亮的字符然后显示在用户输入字段302中。本领域内的普通技术人员知道用于在计算机上实现复制和粘贴操作的方法。用户也可以通过本领域内普通技术人员所知道的方法来向用户输入区302中输入字符。
作为本发明的一部分,当用户使用复制和粘贴操作来向用户输入区302中输入字符时,CCP 200将识别所输入的字符而不论在被加亮的“复制”文本中使用的编码格式如何。例如,用户可能正在观看以繁体中文所写的另一个万维网页面,并且遇到用户不认识的一个字。用户可以随后加亮不认识的字,复制所述字,在用户输入区302中粘贴所述字,单击提交按键304来确定与所述繁体字相当的简体字。本发明接受在其他万维网页面中使用的Big 5编码,因为Big 5与Unicode兼容。在另一个示例中,用户可能正在观看以简体中文所写的另一个万维网页面,并且遇到用户不认识的一个字。用户可以随后加亮不认识的字,复制所述字,在用户输入区302中粘贴所述字,单击提交按键304来确定与所述简体字相当的繁体字。本发明接受在其他万维网页面中使用的GB2312编码,因为GB2312与Unicode兼容。如果使用Big 5或GB2312编码来实现本发明,则本发明将依赖于编码语言而被限于简体中文或繁体中文。
在用户已经在用户输入区302中插入了字符或字后,用户可以单击提交按键304。提交按键304指令CCP 200分析在用户输入区302中的字符。如图4中所示,用户已经输入了简化中文字符guó,它表示国。CCP 200在用户输入区域302下显示简体中文字306、相应繁体中文字308。用户可以输入所期望的多个字符,并且随意继续利用本发明。
参照上述说明,应当明白,包括大小、材料、形状、形式、功能和操作方式的本发明的部分的最佳空间关系被认为是对于本领域内的技术人员显然和明显的,并且本发明意欲包括附图中所述的内容和说明书中所述的内容的所有等同关系。通过记录或删除在本说明书中包括的一些步骤,本发明的新颖精神仍然可以得到体现。本发明的精神不意欲被以除了由所附的权利要求的适当结构之外的任何方式限定。

Claims (30)

1.一种方法,包括:使用Unicode来确定简体中文字的相应繁体中文字。
2.按照权利要求1的方法,还包括:将简体中文字接受为用户输入,其中以GB2312或Unicode来编码所述简体中文字。
3.按照权利要求1的方法,还包括:将简体中文字从GB2312翻译为Unicode。
4.按照权利要求1的方法,还包括:访问转换表以确定繁体中文字。
5.按照权利要求4的方法,其中所述转换表是JAVA散列表。
6.按照权利要求1的方法,其中不使用中间语言来确定繁体中文字。
7.按照权利要求1的方法,还包括:显示简体中文字、繁体中文字。
8.一种方法,包括:使用Unicode来确定繁体中文字的相应简体中文字。
9.按照权利要求8的方法,还包括:将繁体中文字接受为用户输入,其中以Big 5或Unicode来编码所述简体中文字。
10.按照权利要求8的方法,还包括:将繁体中文字从Big 5翻译为Unicode。
11.按照权利要求8的方法,还包括:访问转换表以确定简体中文字。
12.按照权利要求11的方法,其中所述转换表是JAVA散列表。
13.按照权利要求8的方法,其中不使用中间语言来确定简体中文字。
14.按照权利要求8的方法,还包括:显示繁体中文字、简体中文字。
15.按照权利要求8的方法,其中翻译步骤还包括:
确定繁体中文字是否具有相应简体中文字;
响应于繁体中文字具有相应简体中文字的确定,使用Unicode来确定繁体中文字的相应简体中文字。
16.一种在计算机上可操作的程序产品,所述程序产品包括:
一种计算机可用介质;
其中所述计算机可用介质包括下述指令:
用于使用Unicode来确定简体中文字的相应繁体中文字的指令。
17.按照权利要求16的程序产品,还包括:用于将简体中文字接受为用户输入的指令,其中以GB2312或Unicode来编码所述简体中文字。
18.按照权利要求16的程序产品,还包括:用于将简体中文字从GB2312翻译为Unicode的指令。
19.按照权利要求16的程序产品,还包括:用于访问转换表以确定繁体中文字的指令。
20.按照权利要求19的程序产品,其中所述转换表是JAVA散列表。
21.按照权利要求16的程序产品,其中不使用中间语言来确定繁体中文字。
22.按照权利要求16的程序产品,还包括:显示简体中文字、繁体中文字。
23.一种在计算机上可操作的程序产品,所述程序产品包括:
一种计算机可用介质;
其中所述计算机可用介质包括下述指令:
用于使用Unicode来确定繁体中文字的相应简体中文字的指令。
24.按照权利要求23的程序产品,还包括:用于将繁体中文字接受为用户输入的指令,其中以Big 5或Unicode来编码所述简体中文字。
25.按照权利要求23的程序产品,还包括:用于将繁体中文字从Big 5翻译为Unicode的指令。
26.按照权利要求23的程序产品,还包括:用于访问转换表以确定简体中文字的指令。
27.按照权利要求26的程序产品,其中所述转换表是JAVA散列表。
28.按照权利要求23的程序产品,其中不使用中间语言来确定简体中文字。
29.按照权利要求23的程序产品,还包括:用于显示繁体中文字、简体中文字的指令。
30.按照权利要求23的程序产品,其中翻译步骤还包括:
用于确定繁体中文字是否具有相应简体中文字的指令;
响应于繁体中文字具有相应简体中文字的确定,用于使用Unicode来确定繁体中文字的相应简体中文字的指令。
CNA2004100343578A 2003-07-10 2004-04-12 繁体中文字/简体中文字翻译方法 Pending CN1577325A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/617,530 2003-07-10
US10/617,530 US20050010392A1 (en) 2003-07-10 2003-07-10 Traditional Chinese / simplified Chinese character translator

Publications (1)

Publication Number Publication Date
CN1577325A true CN1577325A (zh) 2005-02-09

Family

ID=33564989

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100343578A Pending CN1577325A (zh) 2003-07-10 2004-04-12 繁体中文字/简体中文字翻译方法

Country Status (2)

Country Link
US (1) US20050010392A1 (zh)
CN (1) CN1577325A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184095A (zh) * 2011-01-30 2011-09-14 广东佳和通信技术有限公司 融合通信系统的中文显示系统及方法
CN105224539A (zh) * 2014-05-29 2016-01-06 腾讯科技(深圳)有限公司 页面文件的处理方法和装置
US9519871B1 (en) 2015-12-21 2016-12-13 International Business Machines Corporation Contextual text adaptation
CN108108337A (zh) * 2016-11-25 2018-06-01 北大方正集团有限公司 简繁互转方法及装置
CN112036121A (zh) * 2020-08-31 2020-12-04 浪潮商用机器有限公司 一种简体汉字与繁体汉字转换方法及相关装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050057512A1 (en) * 2003-07-17 2005-03-17 Min-Wen Du Browsing based Chinese input method
US8137105B2 (en) 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US7739376B2 (en) * 2005-03-07 2010-06-15 Sap Aktiengesellschaft Message filtering
US7840399B2 (en) * 2005-04-07 2010-11-23 Nokia Corporation Method, device, and computer program product for multi-lingual speech recognition
JP4143661B2 (ja) * 2006-09-11 2008-09-03 インターナショナル・ビジネス・マシーンズ・コーポレーション テスト用リソース・ファイル及びテスト用フォントを用いた国際化ソフトウェアのテスト方法、装置及びプログラム
US20080120317A1 (en) * 2006-11-21 2008-05-22 Gile Bradley P Language processing system
US9824071B2 (en) * 2008-12-03 2017-11-21 Microsoft Technology Licensing, Llc Viewing messages and message attachments in different languages
US8341252B2 (en) * 2009-10-30 2012-12-25 Verisign, Inc. Internet domain name super variants
CN103885941A (zh) * 2012-12-24 2014-06-25 鸿富锦精密工业(深圳)有限公司 专利申请文件转换系统及方法
WO2014162211A2 (en) * 2013-03-15 2014-10-09 Translate Abroad, Inc. Systems and methods for displaying foreign character sets and their translations in real time on resource-constrained mobile devices
CN104360988B (zh) * 2014-10-17 2017-10-20 北京锐安科技有限公司 中文字符的编码方式的识别方法和装置
CN117252154B (zh) * 2023-11-20 2024-01-23 北京语言大学 一种基于预训练语言模型的中文简繁字符转换方法及系统

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611996A (en) * 1983-08-01 1986-09-16 Stoner Donald W Teaching machine
TW268115B (zh) * 1991-10-14 1996-01-11 Omron Tateisi Electronics Co
US5309358A (en) * 1992-02-18 1994-05-03 International Business Machines Corporation Method for interchange code conversion of multi-byte character string characters
US5444445A (en) * 1993-05-13 1995-08-22 Apple Computer, Inc. Master + exception list method and apparatus for efficient compression of data having redundant characteristics
US5583761A (en) * 1993-10-13 1996-12-10 Kt International, Inc. Method for automatic displaying program presentations in different languages
US5525060A (en) * 1995-07-28 1996-06-11 Loebner; Hugh G. Multiple language learning aid
US5893133A (en) * 1995-08-16 1999-04-06 International Business Machines Corporation Keyboard for a system and method for processing Chinese language text
US5873111A (en) * 1996-05-10 1999-02-16 Apple Computer, Inc. Method and system for collation in a processing system of a variety of distinct sets of information
US6522330B2 (en) * 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method
US5897630A (en) * 1997-02-24 1999-04-27 International Business Machines Corporation System and method for efficient problem determination in an information handling system
US6381567B1 (en) * 1997-03-05 2002-04-30 International Business Machines Corporation Method and system for providing real-time personalization for web-browser-based applications
US6022221A (en) * 1997-03-21 2000-02-08 Boon; John F. Method and system for short- to long-term memory bridge
US6023714A (en) * 1997-04-24 2000-02-08 Microsoft Corporation Method and system for dynamically adapting the layout of a document to an output device
US6077085A (en) * 1998-05-19 2000-06-20 Intellectual Reserve, Inc. Technology assisted learning
US6266668B1 (en) * 1998-08-04 2001-07-24 Dryken Technologies, Inc. System and method for dynamic data-mining and on-line communication of customized information
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6314469B1 (en) * 1999-02-26 2001-11-06 I-Dns.Net International Pte Ltd Multi-language domain name service
US6438515B1 (en) * 1999-06-28 2002-08-20 Richard Henry Dana Crawford Bitextual, bifocal language learning system
US6567973B1 (en) * 1999-07-28 2003-05-20 International Business Machines Corporation Introspective editor system, program, and method for software translation using a facade class
US7051019B1 (en) * 1999-08-17 2006-05-23 Corbis Corporation Method and system for obtaining images from a database having images that are relevant to indicated text
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
EP1281133B1 (en) * 2000-04-27 2018-11-28 Webfeat, Inc. Method and system for retrieving search results from multiple disparate databases
US20020022953A1 (en) * 2000-05-24 2002-02-21 Bertolus Phillip Andre Indexing and searching ideographic characters on the internet
US20020069047A1 (en) * 2000-12-05 2002-06-06 Pinky Ma Computer-aided language learning method and system
US20020085018A1 (en) * 2001-01-04 2002-07-04 Chien Ha Chun Method for reducing chinese character font in real-time
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
US8001118B2 (en) * 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US7040987B2 (en) * 2001-04-11 2006-05-09 Walker Digital, Llc Method and apparatus for remotely customizing a gaming device
US6999916B2 (en) * 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
US6905340B2 (en) * 2001-07-18 2005-06-14 Mentormate Llc Educational device and method
US20030040899A1 (en) * 2001-08-13 2003-02-27 Ogilvie John W.L. Tools and techniques for reader-guided incremental immersion in a foreign language text
US20030180699A1 (en) * 2002-02-26 2003-09-25 Resor Charles P. Electronic learning aid for teaching arithmetic skills
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184095A (zh) * 2011-01-30 2011-09-14 广东佳和通信技术有限公司 融合通信系统的中文显示系统及方法
CN105224539A (zh) * 2014-05-29 2016-01-06 腾讯科技(深圳)有限公司 页面文件的处理方法和装置
CN105224539B (zh) * 2014-05-29 2021-05-11 腾讯科技(深圳)有限公司 页面文件的处理方法和装置
US9519871B1 (en) 2015-12-21 2016-12-13 International Business Machines Corporation Contextual text adaptation
US9672476B1 (en) 2015-12-21 2017-06-06 International Business Machines Corporation Contextual text adaptation
CN108108337A (zh) * 2016-11-25 2018-06-01 北大方正集团有限公司 简繁互转方法及装置
CN112036121A (zh) * 2020-08-31 2020-12-04 浪潮商用机器有限公司 一种简体汉字与繁体汉字转换方法及相关装置

Also Published As

Publication number Publication date
US20050010392A1 (en) 2005-01-13

Similar Documents

Publication Publication Date Title
CN1558341A (zh) 汉字/拼音/英文翻译方法
CN1577325A (zh) 繁体中文字/简体中文字翻译方法
US8328558B2 (en) Chinese / English vocabulary learning tool
CN102479208A (zh) 汉语语音码多样网页信息搜索转换翻译方法
CN101118540A (zh) 汉字汉语拼音与汉语语音码双向可逆转换方法
Josan et al. A Punjabi to Hindi machine transliteration system
US20050027547A1 (en) Chinese / Pin Yin / english dictionary
Aranta et al. Utilization Of Hexadecimal Numbers In Optimization Of Balinese Transliteration String Replacement Method
Starr Design considerations for multilingual web sites
Gutkin et al. Extensions to Brahmic script processing within the Nisaba library: new scripts, languages and utilities
CN1054219C (zh) 一种汉语拼音输入法及其键盘
CN1027839C (zh) 中华双拼汉字编入的计算机键盘
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Freigang Automation of translation: past, presence, and future
CN1106146A (zh) 电脑汉字声韵调编码输入法及其键盘
Vijayanand et al. Named entity recognition and transliteration for Telugu language
Chaturvedi et al. A Tool for Transliteration of Bilingual Texts Involving Sanskrit
Tedla amLite: Amharic Transliteration Using Key Map Dictionary
Baker et al. Mapping multiple South Asian 8-bit character sets to the Unicode Standard
Курибаяши On the development and utilization of Web-dictionary of Mongolian traditional dictionaries
Ojha Computing in Indian Languages for Knowledge Management: Technology Perspectives and Linguistic Issues
CN1614539A (zh) 声韵输入法
Fu Construction on Parallel Corpus System for English Translation of Liaoning Dialect
Shi et al. Chinese online-problems and solutions
CN86103506A (zh) “一键双值”键盘及中外文字高速输入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication