CN102577334A - 用于自动预测性选择网络浏览器的输入法的方法和装置 - Google Patents

用于自动预测性选择网络浏览器的输入法的方法和装置 Download PDF

Info

Publication number
CN102577334A
CN102577334A CN2010800460486A CN201080046048A CN102577334A CN 102577334 A CN102577334 A CN 102577334A CN 2010800460486 A CN2010800460486 A CN 2010800460486A CN 201080046048 A CN201080046048 A CN 201080046048A CN 102577334 A CN102577334 A CN 102577334A
Authority
CN
China
Prior art keywords
webpage
inspection
code
language
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800460486A
Other languages
English (en)
Inventor
M·W·帕登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102577334A publication Critical patent/CN102577334A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72445User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/58Details of telephonic subscriber devices including a multilanguage function
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/70Details of telephonic subscriber devices methods for entering alphabetical characters, e.g. multi-tap or dictionary disambiguation

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Telephone Function (AREA)

Abstract

一种用于在网络浏览器处预测性地选择输入法的方法和装置。一旦用户输入了识别网页的信息,就对网页的上下文信息进行检查以针对网页自动地、预测性地选择适当的输入法。一旦选择了输入法,就可以应用相应的预测性打字程序。

Description

用于自动预测性选择网络浏览器的输入法的方法和装置
背景技术
输入法是一种允许用户输入不在他们的其它输入设备(例如键盘)上直接表示的字符、符号或词的机制。输入法通常用于从标准QWERTY键盘输入非拉丁字符,例如中文、日文、韩文或者印度语文字。输入法还用于在较小的输入设备(例如移动电话小键盘)上输入拉丁字母字符。当较小的输入设备或键盘用于移动电话和数字助理时,输入法也同样用于基于拉丁语的语言。通过操作系统部件或程序来启用输入法。
当在多语言环境下操作时,网络浏览器应该支持多种输入法。这允许输入来自不同书写文字的字符。当在多于一种语言的环境中可能使用单一文字(例如拉丁字母)时,这可能是困难的。
对于浏览器而言将用户的本国输入法或者可能最近使用的输入法设置为默认值,是当前通常的做法。然后用户可以手动选择另外的输入法。选择新的输入法可能要求选择任意组合的文字、语言和/或地区。
虽然手动选择对于以一种文字或语言使用网络应用的用户而言是足够的,但是这对于真正的多语言用户和应用而言就变得不方便。这对于移动设备而言特别如此,其中这些移动设备的小键盘倾向于要求需要多次按键来改变输入法。这些额外的按键大大地影响了可用性。
预测性打字选择作为文本输入的加速手段已经变得广为流行,特别是在手机业内。通过检查前几次按键或者输入的字符、可能以及包括最近输入的词和先前选择的记忆的上下文,预测性打字选择可以向用户提供可能的完成的列表,以从中进行选择。然而,为了应用适当的预测性文本算法,输入的文字和语言必须是已知的。除了上面指出的不足以外,手动选择输入法的改变所需要的额外输入消耗掉了预测性打字加速的益处。
发明内容
下面给出对一个或多个方面的简要概述,以提供对这些方面的基本理解。该概述不是对全部预期方面的泛泛概括,也不旨在标识全部方面的关键或重要元素或者描述任意或全部方面的范围。其目的仅在于作为后文所提供的更详细描述的序言,以简化形式提供一个或多个方面的一些构思。
各个方面包括通过自动地、预测性地选择正确的输入法而不要求用户进行另外的选择,针对多语言应用来增强网络浏览器输入法的可用性。
各个方面包括一种用于在网络浏览器处预测性地选择输入法的方法,所述方法包括:分析网页的至少一个上下文因素;基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法;接收用户输入;以及根据所选择的输入法来显示所述用户输入。
对所述至少一个因素的分析可以包括:检查用于所述网页的文本编码方法,检查所述网页上的词以根据所述词来确定语言,检查嵌入在所述网页中的元信息,检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。所述网页可以包括通用字符编码,并且对所述至少一个因素的分析可以包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
如果所述分析包括检查网页上的词以确定所述词的语言,则所述分析可以包括:确定所述网页上表示的语言的频率分布以及将权重应用到所表示的语言。
检查嵌入在所述网页中的元信息还可以包括:确定所述元信息是否包括语言标记。URI或URL可以包括国际化域名,并且所述分析还可以包括:检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。各种分析可以相互任意组合进行使用,并且可以给不同因素的分析结果赋予权重。
各个方面还可以包括基于所选择的输入法来应用预测性打字。
其它方面包括一种计算机程序产品,包括:计算机可读介质,其具有:用于使计算机接收网页的第一输入的代码;用于使所述计算机分析所述网页的至少一个上下文因素的代码;用于使所述计算机基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的代码;用于使所述计算机接收第二用户输入的代码;以及用于使所述计算机根据所选择的输入法来显示所述第二用户输入的代码。
其它方面包括一种装置,包括:用于检查网页的至少一个上下文因素的模块;用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的模块;用于接收用户输入的模块;以及用于传输所述用户输入以根据所选择的输入法进行显示的模块。
其它方面包括一种装置,包括:检查部件,用于分析网页的至少一个上下文因素;输入法选择部件,用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法;显示装置;以及用户接口,用于接收用户输入并根据所选择的输入法将所述用户输入呈现给所述显示装置。
所述检查部件可以被配置为检查用于所述网页的文本编码方法。所述网页可以包括通用字符编码,并且所述检查部件可以被配置为检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
所述检查部件被配置为检查所述网页上的词以根据所述词来确定语言。所述检查部件还可以被配置为确定所述网页上表示的语言的频率分布。所述输入法选择部件可以被配置为将权重应用到所表示的语言。所述检查部件可以被配置为检查嵌入在所述网页中的元信息并确定所述元信息是否包括语言标记。所述检查部件可以被配置为检查所述网页的URI或URL。当所述URI或URL包括国际化域名时,所述检查部件还可以被配置为检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。
所述装置可以包括预测性打字方法选择部件,被配置为基于所选择的输入法来应用预测性打字算法。
为了实现上述及相关目的,一个或多个方面包括下文详细描述的并在权利要求中特别指出的特征。下面的描述和附图将详细给出所述一个或多个方面的某些示例性的特征。但是,这些特征只是表示可以利用各方面的原理的多种方式中的几种方式,并且所述描述旨在包括所有这些方面及其等同形式。
附图说明
在下文中将结合附图来描述所公开的方面,附图用于对所公开的方面进行举例说明而不是进行限制,在附图中相同的标号表示相同的元素,并且其中:
图1示出了用于预测性地选择输入法的示例性方法。
图2示出了用于预测性地选择输入法的另一示例性方法。
图3示出了用于预测性地选择输入法的计算机设备。
图4示出了用于预测性地选择输入法的计算机设备。
具体实施方式
现在参考附图描述了各个方面。在下面的描述中,为了解释的目的,给出了大量的具体细节,以便提供对一个或多个方面的全面理解。然而,很明显的是,可以在不具有这些具体细节的情况下实现这些方面。
如前面所指出的,用户需要进行手动选择以便在输入法之间进行改变。用户访问的每个网页包括大量的上下文信息,其反而可以由浏览器用来进行输入方法的自动、预测性选择。当用户与不同的网页交互时,这会消除需要多语言用户对输入法进行手动改变的不便。
因此,各个方面包括使用来自网页的上下文信息来进行输入法的自动预测性选择。然后将所选择的输入法应用到从用户接收到的任何输入,例如打字。一旦已经选择了输入法,还可以应用用于预测性打字的适当算法。
图1示出了自动地预测性地选择输入法的示例性方法。在101处,从用户接收网页的第一输入。该网页包含多个上下文因素,其中可以分析这些上下文因素以便预测性地选择最适合于该网页的输入法。在102处,针对该网页对至少一个上下文因素进行分析。下文更详细地描述了示例性因素。在103处,基于102中的分析自动地、预测性地选择输入法。
多种输入法可以对应于单一的语言。针对共同语言的输入法至少可以基于文字、语言和/或地区的任意组合而不同。对输入法的自动、预测性选择不要求用户对文字、语言或地区进行任何手动选择。除了识别网页的信息以外,不要求用户输入任何信息。一旦用户已经选择了网页,就基于与该网页相关的上下文信息自动地选择输入法。
将网页显示给用户。在104处,一旦已经预测性地选择了输入法,就从用户接收第二输入。该第二输入可以是网页处的打字或其它输入。在105处,根据预测性地选择的输入法在网页处显示第二输入。例如,如果预测性地选择了日语输入法,则将根据特定的输入法以日语显示从用户接收到的任何打字输入。
如果用户然后请求第二网页,则对第二网页的上下文信息进行分析以便基于第二网页来预测性地选择输入法。例如,对第二网页上下文因素的分析可能指示应该选择英语输入法。一旦确定并选择了适当的输入法,就根据所选择的输入法以英语显示用户接收到的任何打字。
因此,当多语言用户在网页之间移动时,自动地、预测性地选择针对每个网页的适当的输入法,从而减少了多语言用户对输入法进行手动改变的需要。虽然自动地、预测性地选择了输入法,但是用户仍然可以在任何时间手动地改变输入法。
在106处,一旦已经选择了适当的输入法,就可以选择相应的预测性打字算法并将其应用到来自用户的第二输入。该预测性打字算法减少了用户需要的打字量。
在分析网页来预测性地选择输入法的过程中可以考虑各种因素。可以对多于一个的因素进行分析,并给结果赋予权重或顺序,以针对网页选择最可能的输入法。
一个示例性实现可以包括检查用于特定网页上的文本的文本编码方法,以便网络浏览器进行适当输入法的自动、预测性选择。
例如,用于网页的文本编码方法可以是Shift JIS文本编码。这是对日语字符进行编码的日本国家标准,其在JIS X 0208:1997中定义,该标准的全部内容通过引用的方式并入本文。一旦确定了网页是使用Shift JIS文本编码进行编码的,就可以选择日语输入法。在选择了输入法之后,可以选择相应的预测性打字程序。在此情形下,可以将日语预测性打字程序应用到用户在网页上输入的任何文本。
虽然描述了Shift JIS和日语输入法,但是还有与各种语言(例如中文、俄语、韩语、泰语、希腊语、希伯来语等等)相关的各种类型的文本编码。
第二示例性实现可以包括检查网页中的代码点的数值分布。网页中使用的一种类型的文本编码是通用字符编码(UCS),例如ISO/IEC 10646: 2003 Universal Multiple-Octet Coded Character Set中定义的UCS-4,通过引用的方式将其全部内容并入本文。由于UCS是一种通用类型的文本编码,所以不能仅仅基于对使用UCS的识别来自动选择输入法。相反,可以对代码点(字符码)的数值分布进行检查来识别相应的输入法。检查可以包括启发式地使用代码点所聚集的数值范围来确定输入法。
例如,在网页上可以包括处于特定代码范围内的多个字符。例如,使用UCS-4,范围0xAC00~0xD7AF(韩语部分)中的聚类将暗示网页包括韩语字符。因此,检查代码点的分布将暗示选择韩语输入法。类似地,0x3040~0x309F(平假名部分)中的聚类对应于日语字符,并暗示选择日语输入法。
在特定网页中可能识别出多于一种类型的聚类。例如,包含大部分日语字符的网页还可以包括一部分英语。为了正确地选择输入法,可以给来自检查的结果在组合起来识别最适合的输入法以前赋予权重或顺序。例如,可以基于网页处使用的代码范围的数量对结果进行加权。对于前面的例子,大部分日语代码范围将超过英语代码范围,从而意味着应该选择日语输入法而不是英语输入法。
在第三示例性实现中,可以检查网页处实际的词来确定输入法。检查词可以包括将词与字典进行比较以确定它们属于哪种语言。
要注意的是,给定的词可能出现在多于一种语言中。该词将表示其出现的语言中的每种语言。所表示的语言的频率分布可以用于表示所识别的语言中的每种语言在网页上出现的数量。该频率分布可以启发式地用于选择输入法。例如,可以选择最具代表性的语言作为输入法。
可以将另外级别的权重和顺序应用到各种词或识别的语言以便更准确地选择输入法。例如,包含大部分法语单词的页面强烈暗示应该选择法语作为输入法。然而,包含大部分古典拉丁语单词和少部分英语单词的页面将暗示以英语作为输入法,这是因为使用古典拉丁语输入法是非常罕见的。因此,可以给古典拉丁语赋予降低的权重以减少其对输入法选择的影响。可以根据语言或与语言对应的输入法的当前使用级别来给各种类型的语言或输入法赋予权重和顺序。
在第四示例性实现中,可以针对语言标记来检查嵌入在网页中的元信息。例如,语言标记可以包括在HTML片段中。在W3C HTML 4.01  http://www.w3.org/TR/html401/中描述了定义HTML和元数据元素的国际标准,其全部内容通过引用的方式并入本文。
例如,HTML片段可以包括暗示选择日语输入法的<html lang=“jp”>。可以由其它类似的语言标记来暗示其它语言的输入法。
在第五示例性实现中,可以检查页面的统一资源定位符(URL)或统一资源标识符(URI)。可以对页面的顶级域(TLD)进行启发式地检查,以确定隐含的地理位置。在http://data.iana.org/TLD/tlds-alpha-by-domain.txt 的IANA列表中给出了互联网上顶级域的正式列表,其全部内容通过引用的方式并入本文。可以基于在隐含的地理位置处所使用的相应的语言来选择输入法。如果在该地理位置使用多于一种的语言,则可以将权重或顺序应用到这些语言中的每种语言。与所有示例性实现一样,该方法可以与任何其它方法组合起来使用,以在用于该地理位置的语言中进行选择。
例如,网页的URI可以具有以下形式http://someserver.cn/page.html。“cn”表示服务的地理位置为中国。因此,应该选择中文输入法。
第六示例性实现可以包括检查网页的URL或URI中的代码点的数值分布。URI或URL的主机部分可以是国际化域名(IDN)。通过引用的方式将IETF RFC 3940 Internationalizing Domain Names的全部内容并入本文,其定义了用于定义国际域名的国际标准。当URL或URI包括国际化域名时,域名将不直接对应于具体的地理位置。在此情形下,可以检查域名中的代码点的数值分布(其类似于第二示例性实现中描述的检查),以便识别可能的语言并从中选择输入法。
可以以任意组合的方式使用这些示例性实现,并且可以与网页的其它上下文因素的分析组合起来使用这些示例性实现。
当组合起来使用时,可以给各种检查的结果赋予权重或顺序,以针对网页生成适当输入法的更准确的组合选择。图2示出了示例性方法,其包括给多个上下文因素的分析赋予权重或顺序。与图1类似,在201处,从用户接收访问网页的请求。在202处,检查关于网页的第一因素。在203处,检查关于网页的第二因素。在204处,将权重或顺序应用到第一因素和第二因素的检查结果。在205处,在赋予权重或顺序之后对结果进行组合。在206处,基于组合的结果来选择输入法。一旦选择了输入法,还可以基于所选择的输入法来选择用于预测性打字的算法。
图3示出了计算机设备300的各个方面,其根据网页上的上下文信息自动地、预测性地选择输入法。计算机设备300包括处理器301,用于执行与本文描述的部件和功能中的一个或多个相关联的处理功能。处理器301可以包括单组或多组处理器或者多内核处理器。进一步,可以将处理器301实现为集成处理系统和/或分布式处理系统。
计算机设备300还包括存储器302,例如用于存储处理器301执行的应用的本地版本。存储器302可以包括计算机可用的任何类型的存储器,例如随机存取存储器(RAM)、只读存储器(ROM)、磁带、磁盘、光盘、易失性存储器、非易失性存储器及其任意组合。存储器可以存储计算机程序,其包括计算机软件和/或数据,其中当执行计算机程序时,计算机程序使计算机设备能够检查网页上的至少一个因素,以基于检查来选择输入法,以及基于输入法的选择来选择预测性打字方法。具体而言,计算机软件和/或数据使处理器301、检查部件306、输入法选择部件307和预测性打字选择部件308能够执行本文描述的过程。
进一步,计算机设备300包括通信部件303,其提供利用本文描述的硬件,软件和服务来建立和维护与一个或多个部分的通信。通信部件303可以执行计算机设备300上的部件之间的通信,以及计算机设备300和外部设备(例如位于通信网络上的设备和/或串行或本地连接到计算机设备300的设备)之间的通信。例如,通信部件300可以包括一个或多个总线,并且还可以包括分别与发射机和接收机相关联的发射链部件和接收链部件,用于与外部设备进行交互。例如,通信部件300可以允许从计算机设备转发图形、文本和其它数据用以在显示单元上进行显示。
计算机设备300可以包括显示接口310,用于显示这种图形、文本和其它数据。例如,一旦选择了输入法,就可以转发计算机设备300接收到的任何用户输入,用以根据所选择的输入法进行显示或被显示。
另外,计算机设备300还可以包括数据存储装置304,其可以是硬件和/或软件的任何适当的组合,其提供结合本文描述的方面而采用的信息、数据库和程序的大容量存储。例如,数据存储装置304可以是处理器301当前不执行的应用的数据仓库。
计算机设备300还可以包括用户接口部件305,用于从计算机设备300的用户接收输入,并且还用于生成呈现给用户的输出。用户接口部件305可以包括一个或多个输入设备,包括但不限于键盘、数字键盘、鼠标、触摸感应显示装置、导航键、功能键、麦克风、语音识别部件、能够从用户接收输入的任何其它机制或者上述的任意组合。进一步,用户接口部件305可以包括一个或多个输出设备,包括但不限于显示装置、扬声器、触觉反馈装置、打印机、能够向用户呈现输出的任何其它机制或者上述的任意组合。
计算机设备300还可以包括检查部件306,其检查网页的上下文因素。例如,如前面所述的,该部件可以检查网页上使用的文本编码方法、网页上使用的代码点的数值分布、网页上实际的词、网页中嵌入的元信息、网页的URL/IRU以及网页的URL/URI中使用的文本编码方法中的任何一种。检查部件306可以分析网页上的至少一个上下文因素以根据该因素确定指示的语言和输入法。
计算机设备300还可以包括输入法选择部件307。该部件自动地、预测性地选择输入法,以将该输入法应用到用户选择的网页上的用户输入。该部件可以基于检查部件指示的输入法来进行选择。可替换地,该部件可以给在检查部件处检查的多个因素的结果赋予权重和顺序,并将结果进行组合以选择适当的输入法。
计算机设备300还可以包括预测性打字选择部件308。该部件选择用于预测性打字的算法,以将该算法应用到用户选择的网页上的用户输入。基于相应的所选择的输入法来选择适当的算法。
计算机设备300还可以包括软件驱动程序309,用于执行存储在计算机设备300处的计算机程序。
在本申请中使用的术语“部件”、“模块”、“系统”等旨在包括与计算机相关的实体,例如但不限于硬件、固件、硬件和软件的组合、软件或执行中的软件。例如,部件可以是但并不仅限于:处理器上运行的进程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。举例来说,运行在计算设备上的应用程序和计算设备二者都可以是部件。一个或多个部件可以位于执行的进程和/或线程内,并且部件可以位于一台计算机上和/或分布于两台或更多台计算机之间。另外,可以通过其上存储了各种数据结构的各种计算机可读介质执行这些部件。这些部件可以通过本地和/或远程进程,例如根据具有一个或多个数据分组的信号(例如,来自于一个部件的数据,其中该部件通过所述信号与本地系统、分布式系统中的另一个部件进行交互,和/或在网络(如互联网)上与其它系统进行交互)来进行通信。。
此外,本文结合终端(其可以是有线终端或无线终端)描述了各个方面。终端还可以被称为系统、设备、用户单元、用户站、移动站、移动台、移动设备、远程站、远程终端、接入终端、用户终端、终端、通信设备、用户代理、用户装置或用户设备(UE)。无线终端可以是蜂窝电话、卫星电话、无绳电话、会话发起协议(SIP)电话、无线本地环路(WLL)站、个人数字助理(PDA)、具有无线连接能力的手持设备、计算设备或连接到无线调制解调器的其它处理设备。基站可以用于与无线终端进行通信,还可以被称为接入点、节点B或某种其它术语。
参考图4,示出了系统400,其基于对与网站相关联的因素的分析来预测性地选择输入法。例如,系统400可以至少部分地位于计算机设备、移动设备等等内。应当清楚的是,将系统400表示为包括功能方框,其中这些功能方框可以是表示由处理器、软件或其组合(例如,固件)所实现的功能的功能方框。系统400包括可以结合操作的电子部件的逻辑组合402。例如,逻辑组合402可以包括用于检查网页的至少一个上下文因素的模块404。例如,检查可以包括:检查用于网页的文本编码方法、检查网页上使用的代码点的数值分布、检查网页上使用的实际的词、检查网页中嵌入的元数据、检查网页的URI/URL以及检查网页的URL/URI的代码点的分布。
进一步,逻辑组合402可以包括用于基于对网页的至少一个上下文因素的分析来自动地预测性地选择多种输入法中的一种输入法的模块406。
进一步,逻辑组合402可以包括用于接收用户输入的模块408以及用于传输用户输入以根据所选择的输入法进行显示的模块410。从而,将根据自动地、预测性地选择的输入法来显示任何的用户输入(例如打字)。因此,可以自动地选择适当的输入法,而不需要用户进行手动选择。
另外,系统400可以包括存储器412,其保存用于执行与电子部件404、406、408和410相关联的功能的指令。虽然将电子部件404、406、408和410示出为位于存储器412的外部,但是应当理解的是,电子部件404、406、408和410中的一个或多个可以存在于存储器412内部。
此外,术语“或者”旨在表示包括性的“或者”而不是排他性的“或者”。也就是说,除非另外说明,或者从上下文能清楚得知,否则短语“X使用A或者B”旨在表示任何自然的包括性排列。也就是说,下列例子中的任何一种都满足短语“X使用A或者B”:X使用A;X使用B;或者X使用A和B二者。另外,除非另外说明或从上下文能清楚得知是针对单数形式,否则本申请和所附的权利要求书中使用的冠词“一”和“一个”一般应解释为表示“一个或多个”。
本申请描述的技术可以用于各种无线通信系统,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA和其它系统。术语“系统”和“网络”通常可以替换使用。CDMA系统可以实现诸如通用陆地无线电接入(UTRA)、cdma2000等的无线电技术。UTRA包括宽带CDMA(W-CDMA)和CDMA的其它变型。进一步,cdma2000涵盖IS-2000、IS-95和IS-856标准。TDMA系统可以实现诸如全球移动通信系统(GSM)的无线电技术。OFDMA系统可以实现诸如演进UTRA(E-UTRA)、超移动宽带(UMB)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、Flash-OFDM
Figure BDA0000152620990000111
等的无线电技术。UTRA和E-UTRA是通用移动电信系统(UMTS)的一部分。3GPP长期演进(LTE)是UMTS的一个版本,其利用了E-UTRA,其中E-UTRA在下行链路上使用OFDMA,在上行链路上使用SC-FDMA。在名为“第三代合作伙伴计划”(3GPP)的组织的文档中描述了UTRA、E-UTRA、UMTS、LTE和GSM。另外,在名为“第三代合作伙伴计划2”(3GPP2)的组织的文档中描述了cdma2000和UMB。进一步,这种无线通信系统还可以包括对等(例如,移动设备对移动设备的)自组织网络系统,其通常使用非成对未授权的频谱、802.xx无线LAN、蓝牙和任何其它短程或长程无线通信技术。
将根据系统给出各个方面或特征,其中该系统可以包括多个设备、部件、模块等等。应当理解和清楚的是,各种系统可以包括另外的设备、部件、模块等和/或可以不包括结合附图讨论的设备、部件、模块等的全部。也可以使用这些方法的组合。
可以采用被设计用于执行本文所述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或其任意组合来实现或执行结合本文所公开的实施例而描述的各种示例性的逻辑、逻辑方框、模块和电路。通用处理器可以是微处理器,但是可替换地,该处理器也可以是任何常规的处理器、控制器、微控制器或者状态机。也可以将处理器实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器与DSP内核的结合,或者任何其它此种结构。另外,至少一个处理器可包括一个或多个用于执行上述步骤和/或操作中的一个或多个的模块。
进一步,结合本文公开的方面描述的方法或者算法的步骤和/或操作可直接体现在硬件、由处理器执行的软件模块或两者的组合中。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。示例性的存储介质可以耦合至处理器,使得处理器能够从该存储介质读取信息,并向该存储介质写入信息。可替换地,存储介质也可以是处理器的组成部分。进一步,在一些方面中,处理器和存储介质可以位于ASIC中。另外,ASIC可以位于用户终端中。可替换地,处理器和存储介质也可以作为分立组件存在于用户终端中。另外,在一些方面中,方法或算法的步骤和/或操作可以作为一个代码和/或指令或者代码和/或指令的任意组合或者代码和/或指令的集合而存在于机器可读介质和/或计算机可读介质上,其中机器可读介质和/或计算机可读介质可以并入到计算机程序产品中。
在一个或多个方面中,所描述的功能可以实现在硬件、软件、固件、或其任意适合的组合中。如果在软件中实现,则功能可以作为一个或多个指令或代码在计算机可读介质上存储或传输。计算机可读介质包括计算机存储介质和通信介质两者,包括有助于将计算机程序从一个位置转移到另一位置的任何介质。存储介质可以是可由计算机存取的任何可用的介质。举例来说,而非限制性地,这种计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备或可以用于以指令或数据结构的形式携带或存储想要的程序代码并可由计算机存取的任何其它介质。另外,可以将任何连接称为计算机可读介质。例如,如果使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或例如红外、无线电和微波的无线技术从网站、服务器或其它远程来源来传输软件,那么同轴电缆、光纤光缆、双绞线、DSL或例如红外、无线电和微波的无线技术包括在介质的定义中。本文所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字通用光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁的方式再现数据,而光盘采用激光以光学的方式再现数据。上述的组合也应当包括在计算机可读介质的范围内。
虽然上述公开内容讨论了示例性方面和/或实施例,但是应当注意,在不脱离所描述方面和/或实施例的范围的前提下,可以在本文中进行各种改变和修改,其中所描述方面和/或实施例的范围由所附权利要求定义。此外,虽然可以以单数形式描述或要求保护所述方面和/或实施例的元素,但是,除非明确说明限于单数形式,否则可以预料到复数形式。另外,除非另外说明了,否则任何方面和/或实施例的全部或部分可以与任何其它方面和/或实施例的全部或部分一起来利用。

Claims (50)

1.一种用于在网络浏览器处预测性地选择输入法的方法,所述方法包括:
分析网页的至少一个上下文因素;
基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法;
接收用户输入;以及
根据所选择的输入法来显示所述用户输入。
2.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查用于所述网页的文本编码方法。
3.根据权利要求1所述的方法,其中,所述网页包括通用字符编码,并且其中,对所述至少一个因素的所述分析包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
4.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查所述网页上的词以根据所述词来确定语言。
5.根据权利要求4所述的方法,还包括:
确定所述网页上表示的语言的频率分布。
6.根据权利要求5所述的方法,还包括:
将权重应用到所表示的语言。
7.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查嵌入在所述网页中的元信息。
8.根据权利要求7所述的方法,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
9.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
10.根据权利要求9所述的方法,其中,所述URI或URL包括国际化域名,所述方法还包括:
检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。
11.根据权利要求1所述的方法,其中,对所述至少一个因素的所述分析包括下述中的至少两项:检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言;检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
12.根据权利要求11所述的方法,还包括:
给不同因素的分析结果赋予权重。
13.根据权利要求1所述的方法,还包括:
基于所选择的输入法来应用预测性打字。
14.一种计算机程序产品,包括:
计算机可读介质,包括:
用于使计算机接收网页的第一输入的代码;
用于使所述计算机分析所述网页的至少一个上下文因素的代码;
用于使所述计算机基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法的代码;
用于使所述计算机接收第二用户输入的代码;以及
用于使所述计算机根据所选择的输入法来显示所述第二用户输入的代码。
15.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查用于所述网页的文本编码方法。
16.根据权利要求14所述的计算机程序产品,其中,所述网页包括通用字符编码,并且其中,对所述至少一个因素的所述分析包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
17.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查所述网页上的词以根据所述词来确定语言。
18.根据权利要求17所述的计算机程序产品,还包括:
用于使计算机确定所述网页上表示的语言的频率分布的代码。
19.根据权利要求18所述的计算机程序产品,还包括:
用于使计算机将权重应用到所表示的语言的代码。
20.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查嵌入在所述网页中的元信息。
21.根据权利要求20所述的计算机程序产品,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
22.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
23.根据权利要求22所述的计算机程序产品,其中,所述URI或URL包括国际化域名,所述方法还包括:
用于使计算机检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围的代码。
24.根据权利要求14所述的计算机程序产品,其中,对所述至少一个因素的所述分析包括下述中的至少两项:检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言;检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
25.根据权利要求24所述的计算机程序产品,还包括:
用于使计算机给不同因素的分析结果赋予权重的代码。
26.根据权利要求14所述的计算机程序产品,还包括:
用于使计算机基于所选择的输入法来应用预测性打字的代码。
27.一种装置,包括:
用于检查网页的至少一个上下文因素的模块;
用于基于对所述网页的所述至少一个上下文因素的分析来自动地、预测性地选择多种输入法中的一种输入法的模块;
用于接收用户输入的模块;以及
用于传输所述用户输入以根据所选择的输入法进行显示的模块。
28.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查用于所述网页的文本编码方法。
29.根据权利要求27所述的装置,其中,所述网页包括通用字符编码,并且其中,所述检查所述至少一个因素包括检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
30.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查所述网页上的词以根据所述词来确定语言。
31.根据权利要求30所述的装置,还包括:
用于确定所述网页上表示的语言的频率分布的模块。
32.根据权利要求31所述的装置,还包括:
用于将权重应用到所表示的语言的模块。
33.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查嵌入在所述网页中的元信息。
34.根据权利要求33所述的装置,其中,所述检查嵌入在所述网页中的元信息进一步包括确定所述元信息是否包括语言标记。
35.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括检查所述网页的统一资源定位符(URL)或统一资源标识符(URI)。
36.根据权利要求35所述的装置,其中,所述URI或URL包括国际化域名,所述方法还包括:
用于检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围的模块。
37.根据权利要求27所述的装置,其中,所述检查所述至少一个因素包括下述中的至少两项:检查用于所述网页的文本编码方法;检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围;检查所述网页上的词以根据所述词来确定语言;检查嵌入在所述网页中的元信息;以及检查所述网页的URI或URL。
38.根据权利要求37所述的装置,还包括:
用于给不同因素的分析结果赋予权重的模块。
39.根据权利要求27所述的装置,还包括:
用于基于所选择的输入法来应用预测性打字的模块。
40.一种装置,包括:
检查部件,用于分析网页的至少一个上下文因素;
输入法选择部件,用于基于对所述网页的所述至少一个上下文因素的所述分析来自动地、预测性地选择多种输入法中的一种输入法;
显示装置;以及
用户接口,用于接收用户输入并根据所选择的输入法将所述用户输入呈现给所述显示装置。
41.根据权利要求40所述的装置,其中,所述检查部件被配置为检查用于所述网页的文本编码方法。
42.根据权利要求40所述的装置,其中,所述网页包括通用字符编码,并且其中,所述检查部件被配置为检查所述网页的代码点的数值分布以确定所述代码点所聚集的范围。
43.根据权利要求40所述的装置,其中,所述检查部件被配置为检查所述网页上的词以根据所述词来确定语言。
44.根据权利要求43所述的装置,其中,所述检查部件还被配置为确定所述网页上表示的语言的频率分布。
45.根据权利要求44所述的装置,其中,所述输入法选择部件被配置为将权重应用到所表示的语言。
46.根据权利要求40所述的装置,其中,所述检查部件被配置为检查嵌入在所述网页中的元信息。
47.根据权利要求46所述的装置,其中,所述检查部件还被配置为确定所述元信息是否包括语言标记。
48.根据权利要求40所述的装置,其中,所述检查部件被配置为检查所述网页的URI或URL。
49.根据权利要求48所述的装置,其中,所述URI或URL包括国际化域名,并且,所述检查部件还被配置为检查所述URI或URL中的代码点的分布以确定所述代码点所聚集的范围。
50.根据权利要求40所述的装置,还包括:
预测性打字方法选择部件,被配置为基于所选择的输入法来应用预测性打字算法。
CN2010800460486A 2009-10-14 2010-10-13 用于自动预测性选择网络浏览器的输入法的方法和装置 Pending CN102577334A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/579,225 2009-10-14
US12/579,225 US20110087962A1 (en) 2009-10-14 2009-10-14 Method and apparatus for the automatic predictive selection of input methods for web browsers
PCT/US2010/052516 WO2011047057A1 (en) 2009-10-14 2010-10-13 Method and apparatus for the automatic predictive selection of input methods for web browsers

Publications (1)

Publication Number Publication Date
CN102577334A true CN102577334A (zh) 2012-07-11

Family

ID=43431064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800460486A Pending CN102577334A (zh) 2009-10-14 2010-10-13 用于自动预测性选择网络浏览器的输入法的方法和装置

Country Status (7)

Country Link
US (1) US20110087962A1 (zh)
EP (1) EP2489176A1 (zh)
JP (1) JP2013508817A (zh)
KR (1) KR20120082453A (zh)
CN (1) CN102577334A (zh)
TW (1) TW201124882A (zh)
WO (1) WO2011047057A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294547A (zh) * 2013-04-28 2013-09-11 华为终端有限公司 输入法调用方法、调用装置和终端

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9348808B2 (en) 2011-12-12 2016-05-24 Empire Technology Development Llc Content-based automatic input protocol selection
KR20130123251A (ko) * 2012-05-02 2013-11-12 삼성전자주식회사 웹 브라우저를 위한 키 보드 구성 방법 및 장치와 그 방법에 대한 프로그램 소스를 저장한 기록 매체
KR101393794B1 (ko) * 2012-08-17 2014-05-12 주식회사 팬택 입력기의 종류를 결정하는 단말기 및 방법
US20140092020A1 (en) * 2012-09-28 2014-04-03 Yaad Hadar Automatic assignment of keyboard languages
US9063636B2 (en) * 2013-06-10 2015-06-23 International Business Machines Corporation Management of input methods
US10430595B2 (en) * 2016-09-22 2019-10-01 International Business Machines Corporation Systems and methods for rule based dynamic selection of rendering browsers
WO2022061857A1 (en) * 2020-09-28 2022-03-31 Orange Method for operating a terminal when accessing a web page defined by a code in a markup language

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1329799A2 (en) * 2002-01-11 2003-07-23 Sap Ag Operating a browser to display first and second virtual keyboard areas that the user changes directly or indirectly
US20040205675A1 (en) * 2002-01-11 2004-10-14 Thangaraj Veerappan System and method for determining a document language and refining the character set encoding based on the document language
EP1480421A1 (en) * 2003-05-20 2004-11-24 Sony Ericsson Mobile Communications AB Automatic setting of a keypad input mode in response to an incoming text message
US20050102616A1 (en) * 2000-05-05 2005-05-12 Aspect Communications Corporation Dynamic localization for documents using language setting
US20070085835A1 (en) * 2005-10-14 2007-04-19 Research In Motion Limited Automatic language selection for improving text accuracy
US20090070098A1 (en) * 2007-09-06 2009-03-12 Google Inc. Dynamic Virtual Input Device Configuration

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW421750B (en) * 1997-03-14 2001-02-11 Omron Tateisi Electronics Co Language identification device, language identification method and storage media recorded with program of language identification
US6157905A (en) * 1997-12-11 2000-12-05 Microsoft Corporation Identifying language and character set of data representing text
US6272456B1 (en) * 1998-03-19 2001-08-07 Microsoft Corporation System and method for identifying the language of written text having a plurality of different length n-gram profiles
CA2359131C (en) * 1999-12-08 2006-02-07 Ntt Docomo, Inc. Portable telephone and terminal equipment
JP2006067620A (ja) * 1999-12-08 2006-03-09 Ntt Docomo Inc 携帯電話機および端末装置
JP2001306592A (ja) * 2000-04-19 2001-11-02 Ntt Hokkaido Telemart Inc インターネット上で運用されるWebページ検索エンジンにおける目録作成方法および検索方法
CA2323856A1 (en) * 2000-10-18 2002-04-18 602531 British Columbia Ltd. Method, system and media for entering data in a personal computing device
US20020143523A1 (en) * 2001-03-30 2002-10-03 Lakshmi Balaji System and method for providing a file in multiple languages
GB0111012D0 (en) * 2001-05-04 2001-06-27 Nokia Corp A communication terminal having a predictive text editor application
US8027832B2 (en) * 2005-02-11 2011-09-27 Microsoft Corporation Efficient language identification
JP2006302091A (ja) * 2005-04-22 2006-11-02 Konica Minolta Photo Imaging Inc 翻訳装置及びそのプログラム
US8380488B1 (en) * 2006-04-19 2013-02-19 Google Inc. Identifying a property of a document
US20080182599A1 (en) * 2007-01-31 2008-07-31 Nokia Corporation Method and apparatus for user input
JP4420045B2 (ja) * 2007-03-07 2010-02-24 ブラザー工業株式会社 画像処理装置
US8473276B2 (en) * 2008-02-19 2013-06-25 Google Inc. Universal language input
WO2011004367A1 (en) * 2009-07-09 2011-01-13 Eliyahu Mashiah Content sensitive system and method for automatic input language selection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102616A1 (en) * 2000-05-05 2005-05-12 Aspect Communications Corporation Dynamic localization for documents using language setting
EP1329799A2 (en) * 2002-01-11 2003-07-23 Sap Ag Operating a browser to display first and second virtual keyboard areas that the user changes directly or indirectly
US20040205675A1 (en) * 2002-01-11 2004-10-14 Thangaraj Veerappan System and method for determining a document language and refining the character set encoding based on the document language
EP1480421A1 (en) * 2003-05-20 2004-11-24 Sony Ericsson Mobile Communications AB Automatic setting of a keypad input mode in response to an incoming text message
US20070085835A1 (en) * 2005-10-14 2007-04-19 Research In Motion Limited Automatic language selection for improving text accuracy
US20090070098A1 (en) * 2007-09-06 2009-03-12 Google Inc. Dynamic Virtual Input Device Configuration

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294547A (zh) * 2013-04-28 2013-09-11 华为终端有限公司 输入法调用方法、调用装置和终端
WO2014177033A1 (zh) * 2013-04-28 2014-11-06 华为终端有限公司 输入法调用方法、调用装置和终端

Also Published As

Publication number Publication date
KR20120082453A (ko) 2012-07-23
JP2013508817A (ja) 2013-03-07
EP2489176A1 (en) 2012-08-22
US20110087962A1 (en) 2011-04-14
TW201124882A (en) 2011-07-16
WO2011047057A1 (en) 2011-04-21

Similar Documents

Publication Publication Date Title
CN102577334A (zh) 用于自动预测性选择网络浏览器的输入法的方法和装置
CN101568918B (zh) 基于web的搭配错误证明
RU2424547C2 (ru) Предсказание слова
CN100428241C (zh) 用于定义和翻译聊天缩略语的系统和方法
JP5066631B2 (ja) 応答判定装置、応答判定方法、応答判定プログラム、記録媒体、および、応答判定システム
US7890146B2 (en) Method and system for providing selected service by displaying numbers and strings corresponding to inputted buttons
US20050108017A1 (en) Determining language for word recognition event
US20100050074A1 (en) Context sensitive, error correction of short text messages
CN101183360B (zh) 字符输入编辑方法
CN102495855A (zh) 自动登录方法及装置
CN102239490A (zh) 用于调整文本串的长度以配合显示器大小的方法和设备
JP4460620B2 (ja) 情報サービス提供方法およびサーバ
US8271263B2 (en) Multi-language text fragment transcoding and featurization
CN102722544A (zh) 字符串的解码方法和装置
KR101377385B1 (ko) 정보 처리 장치
Rukzio et al. Automatic form filling on mobile devices
CN100511236C (zh) 用于嵌入式浏览器的网页编码语言自动识别方法及装置
KR101579601B1 (ko) 폼 입력값의 클라이언트 및 서버 이중 검증을 위한 방법 및 장치
US20080243477A1 (en) Multi-staged language classification
WO2009002091A2 (en) Internet search service method and system thereof
CN113992390A (zh) 一种钓鱼网站的检测方法及装置、存储介质
KR20130103239A (ko) 번역 기능을 구비한 웹 브라우징 서비스 제공 방법, 서버 및 단말
JP2006092223A (ja) 携帯通信端末及び多言語表示制御方法
JP5165704B2 (ja) 有害文書判定方法、有害文書判定装置および有害文書判定プログラム
KR20200025032A (ko) 특허 문서 번역 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120711