CN102033617A - 手持电子设备中的多语言文本输入 - Google Patents
手持电子设备中的多语言文本输入 Download PDFInfo
- Publication number
- CN102033617A CN102033617A CN2010105932432A CN201010593243A CN102033617A CN 102033617 A CN102033617 A CN 102033617A CN 2010105932432 A CN2010105932432 A CN 2010105932432A CN 201010593243 A CN201010593243 A CN 201010593243A CN 102033617 A CN102033617 A CN 102033617A
- Authority
- CN
- China
- Prior art keywords
- language
- data
- application program
- text input
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 35
- 230000004044 response Effects 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Input From Keyboards Or The Like (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种系统提供了手持电子设备中的多语言文本输入。该系统包括在手持电子设备中实现的一个或多个应用程序,应用程序包括要求对应用程序可用的语言数据进行访问的文本输入应用程序。一个或多个语言数据库包含来自多种不同语言的语言数据,其中,该语言数据可由包括文本输入应用程序的至少一个应用程序使用。接口向应用程序提供了对一个或多个语言数据库的不同语言的语言数据中的至少一些进行访问,以便包括文本输入应用程序的应用程序接收不同的语言。
Description
本申请是申请日为2005年8月30日、发明名称为“手持电子设备中的多语言文本输入”的专利申请200580032706.5的分案申请。
技术领域
本发明大体上涉及一种手持电子设备,更具体地,涉及一种在一个或多个应用程序(如,由手持电子设备运行的文本输入应用程序)中输入不同的语言的方法和系统。
背景技术
手持电子设备正在普及。示例包括例如:个人数据助理(PDA)、手持计算机、双向寻呼机、蜂窝电话、文本消息设备等。许多这种手持电子设备结合了无线通信,不过其它手持电子设备是不能与其它设备进行通信的单机设备。
随着手持电子设备变得更加普及,存在对于更多功能和复杂性的增长的需求。尽管普遍提供了多种功能,例如地址簿、拼写检查和文本输入,但是文本输入尤其变得更加复杂。这至少部分是由于使这些手持电子设备且更小重量上更轻的趋势。如果键要直接由人的手指激励,则制造更小的手持电子设备的限制在于键盘的物理尺寸。一般地,有两种解决这种问题的方式。一种方式是调整用于文本输入的移动电话固有的十数字键区。这要求每一个按键支持多字符输入。第二种方式是通过集中(double up)字符来减少按键的数量,以寻求缩小传统的全键盘,例如“qwerty”键盘。在这两种情况下,通过对代表多个字符的按键的激励而产生的输入是不清楚的。设计不同的方案来对来自多个字符按键的输入进行解译。一些方案要求激励按键特定次数来标识所期望的字符。其它的方案使用软件来逐步缩小特定顺序的键击所预期的字母的可能组合。例如,这种方式使用能够包含前缀、普通词(generic word)、书面词等的多个列表。
典型地,不同的应用程序具有它们所利用的自己的数据库或者多个数据库。因此,地址簿应用程序具有仅用于该应用程序的它自己的地址列表,拼写检查程序具有它自己的单词数据库,以及尽管文本应用程序可以具有特定一种语言的多个列表(例如,单词列表;前缀列表;n-gram列表;学习列表),但是那些列表仅由该文本应用程序使用。这会导致数据的重复和存储器的低效率使用,限制了减少手持电子设备的大小、重量和能量使用的能力。
在可能期望多种不同语言的输入(例如,英语/法语或英语/西班牙语)时,文本输入的无歧义问题甚至更加重要。在语言之间进行切换以输入该语言的单词是不灵便的。此外,对于设备的空间需求更高。
欧洲专利申请号No.EP 1031913A2公开了一种具有预测编辑器应用程序的便携电话。通过显示器和键盘来建立人机接口。处理器执行指令,并从存储器中读写数据。存储器中的软件指令包括操作系统、歧义消解程序及其词汇表,以及可选地,包括一个或多个应用程序。词汇表模块包括词典,该词典包含由用户定义并用作编辑语言的语言(例如,英语)的单词、个性化用户定义单词(如,由标准编辑器输入的单词)、以及从电话簿复制的单词。缺省语言符合电话的显示文本语言。改变为另一语言将会引起预定编辑器程序在新的语言下运行。
国际公开号No.WO 2004/059459A1公开了一种包括用于输入文本的预测编辑器应用程序的移动电话。通过显示器和键盘来建立人机接口。处理器执行指令,并从存储器中读写数据。存储器中的软件指令包括操作系统、菜单控制软件、压缩-解压缩软件、歧义消解软件和应用程序。词汇表模块包括词典,该词典包含例如英语语言的单词、个性化用户定义单词(如,由标准编辑器输入的单词)、以及从电话簿复制的单词。一个词汇表模块用作编辑语言。将不同自然语言的三个或七个语言包存储于移动终端中,从而用户可以选择他们想要在标准编辑器上使用的一种语言。
存在对用于手持电子设备中的多语言文本输入的系统和方法的改进空间。
发明内容
本发明满足了这些需求及其它,本发明允许采用使用相同书写字母或字母表(例如,拉丁文;西里尔字母)的多种不同语言中的语言数据的多语言文本输入。这节省了空间,并且不需要在文本输入期间在不同的语言之间进行切换。
根据本发明的方案,手持电子设备中的一个或多个应用程序(包括文本输入应用程序)共享一个或多个不同的语言数据库,从而减小了存储器的负担。因此,例如,文本输入应用程序可以使用一个或多个不同的语言数据库,用于来自多种不同语言的语言数据的多语言文本输入。通常,应用程序可以访问来自一个语言数据库的语言数据,不同的语言数据库中的一些或所有都包含可由它使用的语言数据。
根据本发明的一方面,一种用于手持电子设备中的多语言文本输入的系统包括:在手持电子设备中实现的至少一个应用程序,所述至少一个应用程序包括要求对可用的语言数据进行访问的文本输入应用程序;至少一个语言数据库,包含来自多种不同语言的语言数据,其中,多种不同的语言可由包括文本输入应用程序的所述至少一个应用程序中的至少一个所使用;以及接口,用于向所述至少一个应用程序提供对所述至少一个语言数据库的不同语言的语言数据中的至少一些的访问,以便包括文本输入应用程序的所述至少一个应用程序接收不同的语言。
所述至少一个语言数据库可以是包含来自两种或更多种不同语言的混合信息的单个语言数据库。
语言数据可以包括使用相同的书写字母(script)或字母表的多种不同语言的混合。
所述至少一个语言数据库可以是包含来自多种不同语言的信息的多个语言数据库。
不同语言数据库中的第一个可以包含来自不同语言中的第一语言的信息;以及不同语言数据库中的第二个可以包含来自不同语言中的第二语言的信息。
不同语言数据库中的第一个可以包含来自不同语言中的第一语言的信息;以及不同语言数据库中的第二个可以包含来自不同语言中的第二语言和第三语言的信息。
作为本发明的另一方面,一种手持电子设备中的多语言文本输入的方法包括:在手持电子设备中实现至少一个应用程序,所述至少一个应用程序包括要求对可用的语言数据进行访问的文本输入应用程序;使用至少一个语言数据库,所述至少一个语言数据库包含来自多种不同语言的语言数据,其中,多种不同语言可由包括文本输入应用程序的所述至少一个应用程序中的至少一个所使用;以及将至少一个应用程序与所述至少一个语言数据库的不同语言的语言数据中的至少一些相接口,以便包括文本输入应用程序的所述至少一个应用程序接收不同的语言。
该方法可以将包括来自两种或更多种不同语言的混合信息的单个语言数据库用作所述至少一个语言数据库。
该方法可以将文本输入应用程序和拼写检查应用程序用作所述至少一个应用程序;并将可由文本输入应用程序和拼写检查应用程序使用的多个单词、以及仅可由文本输入应用程序使用的单词的频率数据包括在不同语言的语言数据中。
该方法可以输入包括不同语言的语言数据中的至少一些的文本输入;以及无缝地提供预测文本而不考虑不同语言的文本输入。
该方法可以包括:所述不同语言的所述语言数据中的所述至少一些包括使用相同的书写字母或字母表的多种不同语言的混合。
该方法可以将包括来自多种不同语言的信息的多个不同语言数据库用作至少一个语言数据库。
附图说明
当结合附图阅读时,可以从以下对优选实施例的描述中获得对本发明的全面理解,其中:
图1是结合本发明的手持电子设备的前视图。
图2是示出了图1的手持电子设备的主要组件的结构框图。
图3是图2示出的组件之一的数据适配器的功能图。
图4是示出了根据本发明实施例的图1的手持电子设备的其它主要组件的结构框图。
图5是示出了创建紧凑的语言数据的方法的流程图。
具体实施方式
尽管本发明可应用于广泛范围内的手持电子设备,但是结合缩减键盘5和文本输入的歧义消解来公开本发明。
图1示出了无线手持电子设备1,这只是可以应用本发明的一种类型的手持电子设备。手持电子设备1包括键盘5和指轮6形式的输入设备3,用于控制手持电子设备的功能并生成文本和其它输入。键盘5构成了紧凑的“qwerty”键盘,其中,每个按键7用于输入字母表中的两个或者甚至三个字母。因而,最初通过按下这些按键之一而生成的输入的模糊之处在于,不确定想要选择哪个字母。如先前所讨论的,设计了不同的方案来消除由分配了多个字母用于输入的这些按键7所生成的输入的歧义。所使用的特定方案与本发明无关。然而,使用软件来逐渐缩小特定顺序的键击所预期的字母的可能组合的文本输入应用程序使用特定一种语言的多个语言列表。公知地,在显示器9上显示通过键盘5和指轮6所提供的输入。
转向图2,输入设备3提供了对执行系统11的键击输入,其中,执行系统11可以是操作系统、java虚拟机、运行时间环境等。手持电子设备1实现了多个应用程序13。这些应用程序可以包括地址簿15、文本输入17、解译应用程序19、拼写检查应用程序21和多个其它应用程序,直至应用程序n 23。
应用程序13中的每个都要求对该应用程序运行并产生有意义输出所需的数据进行访问。这种数据存储于多个数据库25中。例如,地址簿应用程序15要求对存储于地址数据库27中的收件人姓名、邮件地址和/或电子邮件地址等进行访问。地址簿应用程序15与多数其它应用程序13的不同之处在于,地址簿应用程序15仅从地址数据库27中提取信息,地址数据库27是寻址所需的特定数据的唯一位置。仅从一个数据库中进行提取的另一应用程序是自动文本应用程序(未示出)。自动文本应用程序对完全的文本提供了简化的输入(如为“bestregards”提供“BR”)和其它简写的输入。这种应用程序通过允许用户仅通过提供常用的单词或词组的隐含代码来加速输入而提高了效率。因此,其它更一般的数据库不能向自动文本应用程序提供有用的信息。
一些应用程序13(如,文本输入应用程序17)利用多种类型的语言数据。例如,典型的无歧义类型的文本输入应用程序利用存储于普通词列表数据库29中的普通词列表。这种文本输入应用程序也可以使用存储于新单词列表数据库31中的新单词列表和存储于学习列表数据库33中的学习列表。文本输入应用程序17可以使用的、在图2中未示出的附加列表可以包括前缀列表和n-gram列表。也可以提供主要与应用程序23中的一个或多个相关联的附加数据库35(例如,不受限制地,一种或多种不同语言的语言)。
实现无歧义的文本输入应用程序17显示在按键输入序列中每一阶段处可能的变量,其中,变量根据使用频率进行排序、并且整个单词优先。因此,主要与文本输入应用程序17相关联、或为文本输入应用程序17的使用所创建的数据库包括使用数据的频率,作为语言数据的一部分。例如,这包括普通词列表数据库29、新单词列表数据库31和学习列表数据库33。
其它应用程序可以使用主要用于一个应用程序的数据库。例如,拼写检查应用程序21(在示例系统中,该应用程序不具有特别为它创建的特定数据库)可以利用其它数据库中的数据。因此,拼写检查应用程序从普通词列表数据库29、新单词列表数据库31和学习列表数据库33中进行提取。然而,拼写检查不需要、因而不使用这些数据库中的使用数据频率。这示出了以下示例:一些数据库包含了特定应用程序可以使用的一些信息和不能使用的一些信息。
另一方面,利用使用数据频率的文本输入应用程序17可以利用不提供使用数据频率的数据库,如,地址数据库27。如将会解释的,可以在不存在使用频率的地方自动地分配使用频率。应当注意,拼写检查应用程序21也可以利用存储于地址数据库27中的数据。拼写检查应用程序21不需要使用频率,因而不需要生成如文本输入应用程序17的情况下的那种数据。
应用程序13中的每个与数据库25进行通信,数据库25包含应用程序可以通过接口37使用的数据。在地址簿应用程序15的情况下(仅可以利用来自地址数据库27的数据),直接连接39提供了该接口。这种直接连接是公知的,其中,应用程序可以形成对数据的请求,并以固定格式对响应进行处理。可以利用多个数据库25中的数据的应用程序(如,文本输入应用程序17)需要与每个这种数据库相关联的数据适配器41、以及数据适配器与应用程序之间的通路43,作为接口37。在这种设置下,应用程序用公式表达(formulate)了数据请求,该数据请求在适合的路径43上转发至与多个数据库25相关联的数据适配器41,其中,数据库25包含数据请求可用的数据。数据适配器41从相关联的数据库中获得所请求的数据,并经由适合的路径43将数据返回应用程序。因此,应用程序可以响应对数据的单个请求,接收来自多个数据库的响应。然后,例如,应用程序通过消除重复响应和对响应进行分类,来从由多个数据库返回的响应中进行选择。对响应进行分类可以包括根据使用频率对响应进行分类。
图3示出了数据适配器41的功能组织。接口模块45接收对来自应用程序13的数据的请求,并将该数据请求传送至逻辑电路47,逻辑电路47用公式表达可由读取器49理解的查询,其中,该查询包含来自应用程序的数据请求中的自变量(argument)。读取器49从相关联的数据库25中读取所请求的数据,并将该数据返回逻辑电路,逻辑电路通过接口模块45,生成返回请求应用程序13的响应。在生成响应的过程中,所选择的逻辑电路47可以应用于从数据库接收到的结果。例如,当请求应用程序需要使用数据的频率,而数据库并不包含该信息时,逻辑电路可以分配使用频率。在示例性数据适配器41中,逻辑电路47应用了使用频率范围内的大约前25%的使用频率。可以使用其它设置来在所需时分配使用频率。在分配使用频率、或者从数据库接收到使用频率作为由读取器返回的结果的一部分时,可以在生成响应的过程中应用如根据使用频率进行分类之类的附加逻辑电路。然后,将由逻辑电路生成的响应通过接口模块返回请求应用程序。
从以上可以理解,通过由多个应用程序来共享多个数据库,可以更加有效地使用手持电子设备的存储资源,从而可以减小这种设备的尺寸、重量和能量消耗。
在处理语言词典(如,语言数据库35)的过程中包括与以上结合图2和3所讨论的相同的处理。尽管可以使用全键盘(未示出)或其它适合的输入设备,但是所公开的方法和系统允许从图1的缩减键盘5输入来自不同语言的字符。如图4所示,所公开的方法和系统使用图1的手持电子设备中的一个或多个不同的语言数据库51、53、55、57,提供了多语言文本输入。在手持电子设备1中实现一个或多个应用程序13(包括文本输入应用程序17),并且该应用程序要求对可使用的语言数据进行访问。例如,每个应用程序(如,图4的17、21和23)需要对可由该应用程序使用的不同语言数据59、61、63、65进行访问。不同的语言数据库51、53、55、57包含来自可由应用程序使用的多种不同语言的各个不同语言数据59、61、63、65。因而,接口41可以向应用程序13中的一个或多个提供对不同语言数据库51、53、55、57中的一个、一些或所有的访问,以便包括文本输入应用程序17的那些应用程序接收所述一个或多个数据库的不同语言的语言数据中的至少一些。
将会理解,应用程序13中的一些可以访问不同语言数据库51、53、55、57中的一个、一些或所有,以及各个不同的语言数据59、61、63、65。
所公开的方法和系统提供了使用相同的书写字母或字母表的不同语言数据的多语言文本输入(如,59、61、63、65),其中包括两种或多种不同语言之间的混合(例如,不受限制地,英语、法语和德语)。这里,存在多个示例。
示例1
第一示例是一个语言源51,包含来自两种或多种不同语言的混合信息(例如,不受限制地,英语单词、法语单词和德语单词,以及这些单词中的每个的频率)。
示例2
第二示例是两个或多个不同的语言源53、55,包含来自两种或多种不同语言的各自不同的语言数据61、63。这里,不同的语言数据库53、55包含来自使用相同的书写字母或字母表的多种不同语言的信息。
示例3
作为示例2的更加特定的示例,可以存在包含来自第一语言(例如,不受限制地,英语)的信息61的第一语言源53,以及包含来自第二、不同的语言(例如,不受限制地,德语)的信息63的第二、不同的语言源55。
示例4
作为示例2的另一更加特定的示例,可以存在包含来自第一语言(例如,不受限制地,英语)的信息61的第一语言源53,以及包含来自两个或多个第二、不同的语言(例如,不受限制地,法语和德语)的信息65的第二、不同的语言源57。
可以如以下结合示例5所讨论地来创建语言数据(如,61)。
示例5
图5是示出了创建紧凑语言数据的方法的流程图。该方法使用包含单词频率信息的单词列表来产生紧凑语言数据,并包括单词前缀索引和统计字符替换。例如,见美国专利申请序列号No.2004/0006455。
该方法在步骤500处,从由单词频率计算方法产生的输出文件中读取单词列表。然后,对单词列表中的单词按照字母进行分类。
该方法在步骤501继续,对单词列表中的绝对频率进行归一化。由相对频率来代替每个绝对频率。通过应用可由用户指定的函数,将绝对频率映射至相对频率。可能的函数包括抛物线、高斯、双曲线或线性分布。
该方法在的步骤502继续,创建字符映射表。字符映射表用于在后续步骤中对单词进行编码。当执行编码时,使用字符映射表中的那些字符的字符索引来代替原始单词中的字符。由于字母语言的字母表的大小远小于256,所以单个字节足以存储统一字符编码标准(Unicode)的字符数据。例如,如果统一字符编码标准的字符0×3600位于字符映射表中的索引10处,则可以将该字符表示为10。字符在字符映射表中的位置并不重要,它基于字符出现在所给单词列表中的顺序。
该方法在步骤504继续,对单词列表中的单词进行分组。每组中的单词具有给定长度的公共前缀,并通过频率来分类。单词最初由两个字符长的前缀进行分组。如果以相同的两字符前缀开始的单词多于256个,则将使用更长的前缀来执行额外的分组。例如,如果单词列表包含具有前缀“co”的520个单词,则将会把该组分为具有前缀“com”、“con”等的前缀。
该方法在步骤506继续,产生为每组单词设置的频率。为了减小存储频率信息所需的空间量,仅以全精度保留每组单词的最大频率。将每个其它单词的频率保持为该组中的单词最大频率的百分比。该技术引起了一些精度损失,但是这对于文本输入预测来说是可以接受的,并导致了频率信息的较小存储需求。
该方法以步骤508继续。为了减小将单词存储于单词列表中所需的数据量,使用替换索引来代替单词中最频繁出现的字符序列。n-gram(即,n个字符的序列)的替换实现了由单个字符来表示多个字符。将该信息存储于替换表中。对替换表编索引,从而将每个n-gram映射至替换索引。然后,可以在每次n-gram出现在单词中时,通过使用替换表中的替换索引来代替每个n-gram,以将单词压缩。
该方法在步骤510继续,在步骤510中,如上所述,使用字符映射表和替换表,将单词组编码为字节序列。从单词本身中删除用于将单词集合成组的前缀。结果,每个单词由字节序列来表示,字节序列包括在给定前缀的情况下找到原始单词所需的所有数据。
该方法在步骤511继续,创建单词定义表。单词定义表存储在步骤506处计算的频率设置和在510处产生的编码后的数据。
该方法在步骤512继续,创建偏移表。偏移表包含表示单词组的字节序列。该表实现了对表示特定单词组的字节序列的开始的标识。偏移表用于对字节序列进行定位,该字节序列包括以公共前缀开始的特定组的编码后的单词。
该方法以步骤514结束。在该步骤中,将由该方法所产生的语言数据存储于已经创建了的表中。将数据表(包括字符映射表、替换表、偏移表和单词定义表)存储于输出文件中。
可选地,可以在步骤514处存储在创建紧凑语言数据的方法期间收集的统计数据。统计数据包括存储于替换表中的n-gram在语言数据中的单词中出现的频率、语言数据中的单词的个数、单词列表和从中生成单词列表的语料库(corpus)、语言数据中的单词个数与单词列表和语料库之间的比。
将会理解,以上的示例5的教导可以应用于使用相同的书写字母或字母表的不同语言(例如,英语;法语;德语)。
以下的示例6-8包括使用图4的不同语言数据库51、53、55、57中的一个、一些或所有的不同应用程序13。这些应用程序以相同的方式工作,除了对于文本预测(示例6和7),应用程序17请求以不同的可能前缀开始的所有单词,而对于歧义消解,应用程序17仅请求对于每个可能前缀的最频繁使用的单词。
示例6
文本应用程序17包括使用图1的缩减键盘5的文本预测。在文本输入时,系统使用来自不同的语言源51、53、55、57的一个、一些或所有的不同语言数据59、61、63、65中的一个、一些或所有,以无缝地提供预测文本,而不考虑输入文本属于什么语言。
示例7
诸如23的另一文本输入应用程序包括使用全键盘(未示出)的文本预测。同样,在文本输入时,系统使用来自不同的语言源51、53、55、57的一个、一些或所有的不同语言数据59、61、63、65中的一个、一些或所有,来无缝地提供预测文本,而不考虑输入文本属于什么语言。
示例8
应用程序21包括拼写检查。系统包括文本输入应用程序17和拼写检查应用程序21。不同的语言数据库51、53、55、57包括可由文本输入应用程序17和拼写检查应用程序21使用的多个单词、以及仅可由文本输入应用程序17使用的单词的频率数据67、69、71、73。
尽管为了公开的清楚,这里参考了示例性显示器9,用于显示在按键输入序列中的每个阶段处可能的不同情况、以及来自执行系统11的其它输出信息,但是将会理解,这种信息可以在硬拷贝上存储、打印,可以经计算机修改,或者可以与其它数据组合。应当认为所有这种处理均落入了这里所使用的术语“显示器(display)”或“显示(displaying)”的范围内。
尽管详细地示出了本发明的特定实施例,但是本领域的技术人员将会理解,根据该公开的整个教导,可以对细节进行不同的修改和改变。因此,所公开的特定设置仅是示意性的,但是并不作为对本发明范围的限制,本发明的范围由所附权利要求及其等同物给出。
Claims (6)
1.一种用于手持电子设备中的多语言文本输入的系统,所述系统包括:
在所述手持电子设备中实现的缩减键盘;
在所述手持电子设备中实现的多语言文本输入应用程序和拼写检查应用程序;
语言数据库,所述语言数据库包含来自使用相同书写字母或字母表的多种不同语言的混合信息、以及针对语言数据库中每个单词的频率数据;以及
数据适配器,用于将来自所述语言数据库的、针对所请求的数据的响应返回多语言文本输入应用程序和拼写检查应用程序,
其中所述多语言文本输入应用程序和拼写检查应用程序根据所述频率数据对所述响应进行分类,
其中所述多语言文本输入应用程序和拼写检查应用程序使用缩减键盘,
所述缩减键盘包括多个按键,以及
所述多个按键中的每一个包括来自相同书写字母或字母表的多个字母。
2.如权利要求1所述的系统,其中,所述语言数据库是包含来自多种不同语言的信息的多个语言数据库。
3.如权利要求2所述的系统,其中,所述多语言文本输入应用程序响应于针对数据的单个请求,接收来自多个语言数据库的响应。
4.一种手持电子设备中的多语言文本输入的方法,所述方法包括:
在所述手持电子设备中实现缩减键盘;
在所述手持电子设备中实现需要访问可用语言数据的多语言文本输入应用程序和拼写检查应用程序;
使用语言数据库,所述语言数据库包含来自使用相同书写字母或字母表的多种不同语言的混合信息、以及针对语言数据库中每个单词的频率数据;以及
在所述手持电子设备中实现数据适配器,所述数据适配器用于将来自所述语言数据库的、针对所请求的数据的响应返回多语言文本输入应用程序和拼写检查应用程序;
实现所述多语言文本输入应用程序和拼写检查应用程序,以根据所述频率数据对所述响应进行分类;
实现包括多个按键的所述缩减键盘;以及
实现包括来自相同书写字母或字母表的多个字母的所述多个按键中的每一个。
5.如权利要求4所述的方法,还包括:
输入包括不同语言的多语言文本输入;以及
无缝地提供预测文本而不考虑所述多语言文本输入的不同语言。
6.如权利要求4所述的方法,还包括:
响应于针对数据的单个请求,从多个语言数据库接收响应。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04255258.8 | 2004-08-31 | ||
EP04255258A EP1630649A1 (en) | 2004-08-31 | 2004-08-31 | System and method for multilanguage text input in a handheld electronic device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800327065A Division CN101027628A (zh) | 2004-08-31 | 2005-08-30 | 手持电子设备中的多语言文本输入 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102033617A true CN102033617A (zh) | 2011-04-27 |
Family
ID=34930611
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800327065A Pending CN101027628A (zh) | 2004-08-31 | 2005-08-30 | 手持电子设备中的多语言文本输入 |
CN2010105932432A Pending CN102033617A (zh) | 2004-08-31 | 2005-08-30 | 手持电子设备中的多语言文本输入 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800327065A Pending CN101027628A (zh) | 2004-08-31 | 2005-08-30 | 手持电子设备中的多语言文本输入 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP1630649A1 (zh) |
CN (2) | CN101027628A (zh) |
CA (1) | CA2579052C (zh) |
DE (1) | DE112005002100T5 (zh) |
GB (1) | GB2432955A (zh) |
WO (1) | WO2006024147A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112005239A (zh) * | 2018-03-30 | 2020-11-27 | 爱维士软件有限责任公司 | 消息传递应用中的自动语言选择 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112007002412B4 (de) * | 2006-11-10 | 2014-06-26 | Research In Motion Limited | Handgehaltene bzw.tragbare elektronische Vorrichtung mit einer Eingabevorrichtung mit mehreren Achsen und einem wählbaren Sprach-Indikator für eine Sprachauswahl, und zugehöriges Verfahren |
GB2456957B (en) * | 2006-11-10 | 2011-11-23 | Research In Motion Ltd | Handheld electronic device having multiple axis input device and selectable input mode indicator, and associated method |
US8069028B2 (en) | 2006-11-10 | 2011-11-29 | Research In Motion Limited | Handheld electronic device having selectable language indicator for language selection and method therefor |
US8069029B2 (en) | 2006-11-10 | 2011-11-29 | Research In Motion Limited | Handheld electronic device having multiple-axis input device and selectable language indicator for language selection, and associated method |
US9329753B2 (en) | 2006-11-10 | 2016-05-03 | Blackberry Limited | Handheld electronic device having selectable language indicator and menus for language selection and method therefor |
WO2008055360A1 (en) | 2006-11-10 | 2008-05-15 | Research In Motion Limited | Multi-language, multiple-axis disambiguation handheld device |
US20080131031A1 (en) * | 2006-12-05 | 2008-06-05 | Sherryl Lee Lorraine Scott | Handheld electronic device with diacritical selection and text disambiguation |
US8274410B2 (en) | 2007-10-22 | 2012-09-25 | Sony Ericsson Mobile Communications Ab | Data input interface and method for inputting data |
EP2120130A1 (en) * | 2008-05-11 | 2009-11-18 | Research in Motion Limited | Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input |
US8924446B2 (en) | 2011-12-29 | 2014-12-30 | Verisign, Inc. | Compression of small strings |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4326591B2 (ja) * | 1995-07-26 | 2009-09-09 | テジック・コミュニケーションズ・インコーポレーテッド | 減少型キーボード曖昧さ除去システム |
ES2182363T3 (es) * | 1997-09-25 | 2003-03-01 | Tegic Communications Inc | Sistema de resolucion de ambiguedades de teclado reducido. |
US7712053B2 (en) * | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
JP4430240B2 (ja) * | 1999-01-26 | 2010-03-10 | マービン ブランバーグ | スピードタイピング装置及び方法 |
GB2347247A (en) * | 1999-02-22 | 2000-08-30 | Nokia Mobile Phones Ltd | Communication terminal with predictive editor |
GB2347239B (en) * | 1999-02-22 | 2003-09-24 | Nokia Mobile Phones Ltd | A communication terminal having a predictive editor application |
AU2002361224A1 (en) * | 2002-12-27 | 2004-07-22 | Nokia Corporation | Predictive text entry and data compression method for a mobile communication terminal |
-
2004
- 2004-08-31 EP EP04255258A patent/EP1630649A1/en not_active Ceased
-
2005
- 2005-08-30 WO PCT/CA2005/001309 patent/WO2006024147A1/en active Application Filing
- 2005-08-30 CN CNA2005800327065A patent/CN101027628A/zh active Pending
- 2005-08-30 CA CA2579052A patent/CA2579052C/en active Active
- 2005-08-30 GB GB0706057A patent/GB2432955A/en not_active Withdrawn
- 2005-08-30 DE DE112005002100T patent/DE112005002100T5/de not_active Withdrawn
- 2005-08-30 CN CN2010105932432A patent/CN102033617A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112005239A (zh) * | 2018-03-30 | 2020-11-27 | 爱维士软件有限责任公司 | 消息传递应用中的自动语言选择 |
Also Published As
Publication number | Publication date |
---|---|
GB0706057D0 (en) | 2007-05-09 |
EP1630649A1 (en) | 2006-03-01 |
CA2579052A1 (en) | 2006-03-09 |
CN101027628A (zh) | 2007-08-29 |
DE112005002100T5 (de) | 2007-07-26 |
CA2579052C (en) | 2012-10-30 |
GB2432955A (en) | 2007-06-06 |
WO2006024147A1 (en) | 2006-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8401838B2 (en) | System and method for multilanguage text input in a handheld electronic device | |
CN102033617A (zh) | 手持电子设备中的多语言文本输入 | |
US7548849B2 (en) | Method for generating text that meets specified characteristics in a handheld electronic device and a handheld electronic device incorporating the same | |
CN100334530C (zh) | 简化键盘多义性消除系统 | |
US7649478B1 (en) | Data entry using sequential keystrokes | |
US9798717B2 (en) | Human-to-mobile interfaces | |
US20050041011A1 (en) | Method and user interface for entering text | |
US9851983B2 (en) | Method for generating text in a handheld electronic device and a handheld electronic device incorporating the same | |
WO2001029976A1 (en) | Method for generating characters and/or symbols and the information and communication service method thereby | |
KR20100046043A (ko) | 키패드 텍스트 입력의 명확화 | |
US20040044422A1 (en) | System and method for intelligent text input | |
EP1722294B1 (en) | Method for generating text in a handheld electronic device and a handheld electronic device incorporating the same | |
CA2606328C (en) | Method for generating text that meets specified characteristics in a handheld electronic device and a handheld electronic device incorporating the same | |
CN100517319C (zh) | 管理手持电子设备中的数据库的系统和方法 | |
WO2004006081A2 (en) | System and method for intelligent text input in a mobile device | |
JP3492981B2 (ja) | 音声仮名文字の入力順序を生成するための入力システム | |
US20060047628A1 (en) | System and method for managing databases in a handheld electronic device | |
EP1221082B1 (en) | Use of english phonetics to write non-roman characters | |
KR20230022675A (ko) | 한글 문장예측 입력시스템 | |
KR20180123618A (ko) | 비확정키를 이용한 검색 입력시스템 | |
KR20230037415A (ko) | 한글 문장예측 입력시스템 | |
KR20180123755A (ko) | 비확정키 검색 입력시스템 | |
KR20180123223A (ko) | 문장 예측입력시스템 | |
KR20180123946A (ko) | 검색을 위한 비확정키 입력시스템 | |
KR20180126350A (ko) | 검색을 위한 문장예측 입력시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20110427 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |