CN103558908A - 帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术 - Google Patents
帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术 Download PDFInfo
- Publication number
- CN103558908A CN103558908A CN201310154271.8A CN201310154271A CN103558908A CN 103558908 A CN103558908 A CN 103558908A CN 201310154271 A CN201310154271 A CN 201310154271A CN 103558908 A CN103558908 A CN 103558908A
- Authority
- CN
- China
- Prior art keywords
- word
- subscriber equipment
- translations
- language
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04886—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术。一种计算机实现的技术包括在用户设备处从用户接收第一输入,该第一输入包括第一基于字母表的语言的第一词,其是非基于字母表的语言的音译,其是基于语标的语言和基于音节的语言中的一个。该技术然后将该第一词与来自与第二基于字母表的语言和基于语标或基于音节的语言相关联的一个或多个数据存储的多个潜在翻译的词进行比较。该技术然后可以为该多个潜在翻译的词中的每一个生成概率分值,该概率分值指示适当翻译的可能性。该技术然后可以向用户提供该多个潜在翻译的词中的部分或全部,并且用户可以选择适当翻译的词来获取选择的词,其然后可以通过用户设备的显示器被显示。
Description
技术领域
本公开涉及到计算设备的文本输入,以及更特别地,涉及帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术。
背景技术
此文所提供的背景技术说明用于对本公开的内容作一般性说明的目的。发明人的某些工作(即已在此背景技术部分中作出描述的工作)以及说明书中关于某些尚未成为申请日之前的现有技术的内容,无论是以明确或隐含的方式均不被视为相对于本公开的现有技术。
“用户设备”一般是指具有用户接口、显示器和处理器的计算设备。例如,用户设备可以是台式计算机。用户设备还可以包括移动设备,诸如移动电话、平板计算机等。用户设备可以选择性连接到诸如因特网和/或移动电话网的网络。用户可以通过诸如键盘的用户接口将例如文本的信息输入到用户设备。然而,由于尺寸限制,许多用户设备可以包括部分基于QWERTY的物理键盘。另外或替选,用户设备可以包括既向用户显示信息又从用户接收输入的触摸显示器,例如电容感测显示器。例如,这些用户设备可以向用户显示与部分基于QWERTY的键盘相似的字符布局。
发明内容
提供了一种计算机实现的技术。该技术包括通过用户设备的用户接口,从该用户设备的用户接收第一输入,该用户设备进一步包括显示器和处理器,该第一输入包括拼音词,该拼音词表示实体的名称。该技术包括在该用户设备处,将该拼音词与来自第一数据存储的多个中文词进行比较,该多个中文词是该拼音词的潜在翻译,该多个中文词中的每一个包括一个或多个汉字。该技术包括在该用户设备处,将该拼音词与来自第二数据存储的多个英语词进行比较,该多个英语词是该拼音词的潜在翻译。该技术包括在该用户设备处,基于与拼音词的各个比较为该多个中文词和该多个英语词中的每一个生成概率分值,每一个概率分值指示该多个中文词和该多个英语词中的相应一个是拼音词的适当翻译的可能性。该技术包括通过该用户设备的显示器向用户提供多个翻译的词,该多个翻译的词具有最高概率分值并且包括该多个中文词中的至少一个和该多个英语词中的至少一个。该技术包括通过该用户设备的用户接口,接收用户对该多个翻译的词中的一个的选择以获取选择的词。该技术还包括通过该用户设备的显示器显示该选择的词。
还提供了另一个计算机实现的技术。该技术包括通过用户设备的用户接口,从该用户设备的用户接收第一输入,该用户设备进一步包括显示器和处理器,该第一输入包括第一基于字母表的语言的第一词,该第一基于字母表的语言是非基于字母表的语言的音译,该非基于字母表的语言是基于语标的语言和基于音节的语言中的一个。该技术包括在该用户设备处,将该第一词与来自第一数据存储的多个第二词进行比较,该多个第二词为非基于字母表的语言,该多个第二词是第一词的潜在翻译。该技术包括在该用户设备处,将第一词与来自第二数据存储的多个第三词进行比较,该多个第三词为第二基于字母表的语言,该第二基于字母表的语言不同于第一基于字母表的语言,该第三多个词是第一词的潜在翻译。该技术包括在该用户设备处,使用语言模型基于与第一词的各个比较为该多个第二词和该多个第三词中的每一个生成概率分值,每一个概率分值指示该多个第二词和该多个第三词中的一个是第一词的适当翻译的可能性。该技术包括通过该用户设备的显示器向用户提供多个翻译的词,该多个翻译的词基于该多个第二词、多个第三词和概率分值。该技术包括通过该用户设备的用户接口从用户接收第二输入,该第二输入指示对该多个翻译的词中的一个的选择以获取选择的词。该技术还包括通过该用户设备的显示器显示该选择的词。
还提供了系统。该系统包括输入控制模块,其通过用户设备的用户接口,从该用户设备的用户接收第一输入,该用户设备进一步包括显示器和处理器,该第一输入包括第一基于字母表的语言的第一词,该第一基于字母表的语言是非基于字母表的语言的音译,该非基于字母表的语言是基于语标的语言和基于音节的语言中的一个。该系统包括比较模块,其(i)在该用户设备处,将该第一词与来自第一数据存储的多个第二词进行比较,该多个第二词为非基于字母表的语言,该多个第二词是第一词的潜在翻译;以及(ii)在该用户设备处,将第一词与来自第二数据存储的多个第三词进行比较,该多个第三词为第二基于字母表的语言,该第二基于字母表的语言不同于第一基于字母表的语言,该第三多个词是第一词的潜在翻译。该系统还包括评分模块,其在该用户设备处,使用语言模型基于与第一词的各个比较为该多个第二词和该多个第三词中的每一个生成概率分值,每一个概率分值指示该多个第二词和该多个第三词中的一个是第一词的适当翻译的可能性。输入控制模块还(i)通过该用户设备的显示器向用户提供多个翻译的词,该多个翻译的词基于该多个第二词、多个第三词和概率分值;(ii)通过该用户设备的用户接口从用户接收第二输入,该第二输入指示对该多个翻译的词中的一个的选择以获取选择的词;以及(iii)通过该用户设备的显示器显示该选择的词。
本公开的适用性的进一步领域将从在下文提供的详细描述变得显而易见。应当理解的是,详细描述和具体示例仅意在说明的目的,并不意在限制本公开的范围。
附图说明
将从详细描述和附图更充分理解本公开,其中:
图1图示根据本公开的一些实施方式的用户与示例用户设备的交互;
图2是根据本公开的一些实施方式的图1的用户设备的功能框图;
图3是根据本公开的一些实施方式的图1的用户设备的用户接口模块的示例的功能框图;
图4是根据本公开的一些实施方式的图3的用户接口模块的翻译模块的功能框图;
图5是根据本公开的一些实施方式的用于帮助用户以多种不同语言将实体的名称文本输入到用户设备的示例技术的流程图;以及
图6是根据本公开的一些实施方式的用于帮助用户使用拼音输入以英语和中文将实体的名称文本输入到用户设备的示例技术的流程图。
具体实施方式
现参考图1,示出了示例用户设备100。如所示,用户设备100可以是移动设备,诸如移动电话、平板计算机等。然而,用户设备100还可以是非便携式计算设备,诸如台式计算机等。用户设备100一般包括显示器104。例如,显示器104可以是如所示的触摸显示器,诸如电容感测显示器。如前所述,用户设备100可以另外或替选地包括物理的部分基于QWERTY的键盘(未示出)。然而,为了简便目的,触摸显示器104和用户触摸输入分别是在此参考的显示和用户输入技术。触摸显示器104可以向用户108显示信息,并且从用户108接收输入。例如,用户108可以使用一个或多个手指112通过触摸显示器104向用户设备100输入信息。
诸如图1的用户设备100的用户设备广泛可用,因此,可以在全球许多不同国家被使用。因此,用户设备可以被配置成以多种不同语言向用户显示信息和/或从用户接收信息。输入法编辑器或IME是允许用户向用户设备输入特定语言的软件应用。例如,IME可以为用户提供输入各种基于拉丁语/英语字母表的语言。然而,存在基于其他字符或符号的许多其他语言。这些语言可以被表征为基于音节和基于语标的语言。
一种广泛使用的基于语标的语言是中文,其包括成千上万的独特字符。例如,拼音是中文的基于英语字母表的音译。音译是指将一种文字转换成另一种的过程,例如将汉字转换成基于英语字母表的字母。换句话说,拼音提供对汉字进行基于英语字母表的表示的系统。仅作为示例,“ni hao”是“您好”的拼音表示,其意为英语中的“hello”。因此,用于移动设备的一个IME可以是基于拼音的IME,以为文本消息、电子邮件等提供汉字的输入。
然而,在一些情况下,用户可能必须以对例如中文用户的用户来说是外语的例如英语的语言输入实体的名称。实体可以是组织、人或场所的名称、游戏中的角色等。实体的名称可能更难翻译,因此,许多翻译可能是不正确的。此外,典型的IME不允许用户输入例如日语的基于音节的语言或例如中文的基于语标的语言的音译,来获取基于音节或基于语标的语言以及例如英语的另一种基于字母表的语言两者的候选列表。仅作为示例,IME可能需要中文用户输入拼音音译,以首先选择实体的名称的正确中文表示,其然后可以被翻译成英语。
因此,提供了用于帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术。虽然在移动设备的背景下一般地描述了所述技术,然而,所述技术可以应用于任何适当的用户设备。所述技术总体上提供了以多种不同语言对实体的名称到用户设备的更快用户输入。所述技术从包括用户接口、显示器和处理器的用户设备的用户接收第一输入。该第一输入包括第一基于字母表的语言的第一词。该第一基于字母表的语言是非基于字母表的语言的音译。该非基于字母表的语言是基于音节的语言和基于语标的语言中的一个。例如,第一基于字母表的语言可以是拼音,以及非基于字母表的语言可以是中文。
所述技术然后执行两种不同的比较。所述技术将第一词与来自第一数据存储的多个第二词进行比较,该多个第二词是非基于字母表的语言的。该多个第二词包括第一词的潜在翻译。所述技术还将第一词与来自第二数据存储的多个第三词进行比较,该多个第三词是第二基于字母表的语言的。该多个第三词也包括第一词的潜在翻译。例如,第二基于字母表的语言可以是英语。所述技术然后基于各个比较为该多个第二词和该多个第三词中的每一个生成概率分值,每一个概率分值指示该多个第二词和该多个第三词中的相应一个是第一词的认可翻译的可能性。所述技术然后通过用户设备的显示器向用户提供多个翻译的词,该多个翻译的词基于该多个第二词、该多个第三词和概率分值。
换句话说,该多个翻译的词可以是该多个第二词和该多个第三词的子集。该多个翻译的词可以包括该多个第二词中的至少一个和该多个第三词中的至少一个。例如,该多个翻译的词可以包括该多个第二词和该多个第三词的子集。该子集包括在该多个第二词和该多个第三词中、具有比其他词高的相应概率分值的词。在一些实施方式中,可以根据该多个第一词和该多个第二词的相应概率分值对它们进行排名,以生成排名的多个翻译的词,然后,可以从其选择该多个翻译的词。所述技术通过用户设备从用户接收第二输入,该第二输入指示对该多个翻译的词中的一个的选择以获取选择的翻译的词。所述技术然后通过用户设备的显示器向用户提供选择的翻译的词。
现参考图2,示出了用户设备100的示例。如前所述,用户设备100包括触摸显示器104。例如,触摸显示器104可以是电容感测显示器。触摸显示器104向用户108显示信息,并且接收用户108所输入的信息。如前所述,用户设备100可以另外或替选地包括物理的字符布局,例如,部分基于QWERTY的键盘,以供从用户108接收输入。用户设备100可以进一步包括用户接口模块200、处理器204以及通信模块208。应当理解的是,用户设备100可以包括另外的计算组件,诸如存储器等。
用户接口模块200通过用户设备100的触摸显示器104控制与用户108的通信。用户接口模块200可以通过用户设备100的触摸显示器104向用户108提供各种不同的字符输入配置。例如,用户接口模块200可以通过用户设备100的触摸显示器104向用户108提供标准QWERTY键盘形式。替选地,用户接口模块200可以向用户108提供标准12键配置,其也被认为是基于T9输入的字符配置。
用户接口模块200还可以例如通过所提供的字符输入配置从用户108接收输入。然而,用户接口模块200还可以包括允许用户108以不同语言输入字符的各种IME,例如拼音到中文和英语IME。因此,用户接口模块200还可以通过对例如拼音的用户输入进行翻译,将从用户108接收到的输入转换成一个或多个期望语言,例如中文和英语。例如,用户接口模块200在对用户输入进行翻译(稍后将详细描述)时可以结合多个语言数据存储来使用语言模型。
处理器204控制用户设备100的大部分操作。因此,处理器204可以既与用户接口模块200又与通信模块208通信。例如,处理器204可以执行任务,所述任务诸如但不限于:加载/控制用户设备100的操作系统、为通信模块208加载/配置通信参数、控制用户接口模块200的IME参数、以及控制存储器存储/检索操作,例如以加载各种参数。
通信模块208控制在用户设备100和其他设备之间的通信。仅作为示例,通信模块208可以提供在用户设备100和与用户108和/或因特网相关联的其他用户之间的通信。用户设备100可以典型地通过三个通信介质中的一个或多个进行通信:计算网络250,例如因特网(在下文中“网络250”);移动电话网254;以及卫星网258。也可以实现其他通信介质。例如,通信模块208可以被配置用于有线和无线网络连接两者,例如,射频(RF)通信。
现参考图3,示出了用户接口模块200的示例。用户接口模块200可以包括输入控制模块300、翻译模块304、第一语言数据存储308和第二语言数据存储312。虽然在此示出并描述了两个模块和两个数据存储,然而,用户接口模块200可以包括其他适当的计算组件,诸如另外的数据存储、其他存储器等。替选地,第一和/或第二语言数据存储308、312可以是一个物理数据存储或存储器的部分。
输入控制模块300通过用户设备100的触摸显示器104从用户108接收第一输入。该第一输入包括第一基于字母表的语言的第一词。例如,该第一基于字母表的语言可以是拼音。该第一基于字母表的语言还是非基于字母表的语言的音译。该第一词可以表示诸如组织、人、场所等的实体的名称。非基于字母表的语言可以是基于音节的语言或基于语标的语言。例如,非基于字母表的语言可以是中文(基于语标的语言)。输入控制模块300还可以控制是否通过用户设备100的触摸显示器104向用户108提供第一输入的(以及哪些)翻译以供选择。
更具体地,输入控制模块300(结合翻译模块304)可以通过用户设备100的触摸显示器104向用户108提供多个翻译的词,该多个翻译的词表示第一词的各种翻译。输入控制模块300然后可以通过用户设备100的触摸显示器104从用户108接收第二输入。该第二输入指示对该多个翻译的词中的一个的选择以获取选择的翻译的词。输入控制模块300然后可以通过用户设备100的触摸显示器104向用户108提供选择的翻译的词。例如,选择的翻译的词可以替代第一词。还可以将选择的翻译的词提供给处理器204以供处理和/或提供给通信模块208以供传输,例如文本消息或电子邮件。
翻译模块304从输入控制模块300接收第一输入。翻译模块304将第一词与多个第二词和多个第三词中的每一个进行比较。该多个第二词来自非基于字母表的语言并且包括第一词的潜在翻译。该多个第三词来自第二基于字母表的语言并且也包括第一词的潜在翻译。例如,第二基于字母表的语言可以是英语。基于各个比较,翻译模块304可以为该多个第二词和该多个第三词中的每一个生成概率分值。翻译模块304然后可以基于该多个第二词、该多个第三词和其相应概率分值来生成多个翻译的词。
第一语言数据存储308可以存储非基于字母表的语言的符号或字符的词典。因此,该多个第二词可以由翻译模块304使用语言模型从第一语言数据存储308进行检索。替选地,该多个第二词可以包括存储在第一语言数据存储308中的每一个词。类似地,第二语言数据存储312可以存储第二基于字母表的语言的词的词典。因此,该多个第三词可以由翻译模块304使用语言模型从第二语言数据存储312进行检索。替选地,该多个第三词可以包括存储在第二语言数据存储312中的每一个词。
换句话说,在该多个第二或第三词分别包括在第一和/或第二语言数据存储308、312中的每一个词的情况下,可以使用语言模型对整个第一和/或第二语言数据存储308、312进行评分。此外,虽然在此示出并描述了两个多个词(多个第二词和第三词)和两个语言数据存储,然而,可以实现其他数量的多个词和/或语言数据存储。另外,虽然在此描述了拼音到中文和英语翻译,然而,可以实现其他语言。
现参考图4,示出了翻译模块304的示例。翻译模块304可以包括比较模块400、评分模块404和排名模块408。虽然在下面示出并描述了这三个模块,然而,翻译模块304可以进一步包括其他适当的计算组件,诸如存储器等。
比较模块400首先将第一词与来自第一语言数据存储308的多个第二词进行比较。如前所述,该多个第二词可以包括第一语言数据存储308中的每一个词。替选地,可以使用语言模型从第一语言数据存储308检索该多个第二词,从而,该多个第二词指示整个第一语言数据存储308的具有更可能是第一词的认可翻译的词的子集。比较模块400然后可以将第一词与来自第二语言数据存储312的多个第三词进行比较。类似于上述,该多个第三词可以包括来自第二语言数据存储312的每一个词或可以使用语言模型从第二语言数据存储312进行检索。
评分模块404接收该第一词、该多个第二词以及该多个第三词。评分模块404使用语言模型为该多个第二词和该多个第三词中的每一个生成概率分值。例如,该语言模型可以不同于用来检索多个第二词和/或多个第三词的语言模型。另外,该另一个语言模型可能更复杂。每一个概率分值指示该多个第二词和该多个第三词中的相应一个是第一词的认可翻译的可能性。可以将概率分值输出到输入控制模块300和/或输出到排名模块408(参见下述)。
排名模块408可以从评分模块404接收该多个第二词、该多个第三词和其相应的概率分值。排名模块408基于该多个第二词和该多个第三词的相应概率分值对它们进行排名。例如,排名模块408可以从最高概率分值到最低概率分值对该多个第二词和该多个第三词进行排名。排名模块408然后可以生成多个翻译的词以供输入控制模块300提供给用户108。如前所述,该多个翻译的词可以是该多个第二词和该多个第三词的子集。
在一些实施例中,排名模块408可以仅提供预先确定的数量的翻译的词。换句话说,该多个翻译的词可以具有预先确定的最大词数。例如,该预先确定的翻译的词数可以是用户所选择的词数,例如输入到用户设备100的参数。另外,预先确定的翻译的词数可以基于用户设备100的配置,例如触摸显示器104的尺寸。例如,与用于台式计算机的预先确定的词数相比,用于移动设备的预先确定的翻译的词数可以小。
仅作为示例,用户108在德国旅行时可能期望输入词“Zurich”。然而,用户108可能只知道Zurich的拼音表示:“Sulishi”。因此,用户108可以将第一词“Sulishi”输入到用户设备100。在比较模块400进行比较、评分模块404进行评分并且排名模块408进行排名之后,可以向用户108提供下面多个翻译的词:
1、苏黎世2、Zürich3、Zurich4、肃立,
其分别代表(翻译的)Zurich、Zürich、Zurich和“Stood”。
另外,仅作为示例,用户108可能期望输入词“Elizabeth”以与英国朋友通信。然而,用户108可能只知道Elizabeth的拼音表示:“Vilishabai”。因此,用户108可以将第一词“Vilishabai”输入到用户设备100。在比较模块400进行比较、评分模块404进行评分并且排名模块408进行排名之后,可以向用户108提供下面多个翻译的词:
1、伊丽莎白2、Elizabeth3、一粒沙,
其分别代表(翻译的)Elizabeth,Elizabeth和“A sand”。
另外或替选,仅作为示例,在一些实施方式中,用户108可以输入英语来既获取拼音表示又获取中文翻译。例如,当用户108能够看见或读到实体的名称,但是不知道拼音表示以便获取中文翻译时,该技术可以是有用的。仅作为示例,用户108在德国旅行时可能看见或读到“Zurich”,但是可能不知道“Zurich”的拼音表示以便获取中文翻译。用户108可以将第一词“Zurich”输入到用户设备100。在比较模块400进行比较、评分模块404进行评分并且排名模块408进行排名之后,可以向用户108提供下面多个翻译的词:
1、苏黎世2、组日常3、阻日成4、组,
其分别表示(翻译的)Zurich、“Group daily”、“ResistanceRi-Cheng”和“Group”。
另外,仅作为示例,用户108在英国旅行时可能看见或读到“London”,但是可能不知道“London”的拼音表示以便获取中文翻译。用户108可以将第一词“London”输入到用户设备100。在比较模块400进行比较、评分模块404进行评分并且排名模块408进行排名之后,可以向用户108提供下面多个翻译的词:
1、伦敦2、咯难得哦你3、咯,
其分别表示(翻译的)London,“Oh you slightly rare”和“Slightly”。
最后,仅作为示例,用户108可能看见或读到名称“Smith”,但是可能不知道“Smith”的拼音表示以便获取中文翻译。用户108可以将第一词“Smith”输入到用户设备100。在比较模块400进行比较、评分模块404进行评分并且排名模块408进行排名之后,可以向用户108提供下面多个翻译的词:
1、史密斯2、施密特和3、水蜜桃4、施密特,
其分别表示(翻译的)Smith、“Schmidt and”、“Peach”和“Schmidt”。
现参考图5,用于帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术500的示例在504开始。在504,输入控制模块300从用户设备100的用户108接收第一输入,该第一输入包括第一基于字母表的语言的第一词。该第一基于字母表的语言是非基于字母表的语言的音译,以及该非基于字母表的语言是基于语标的语言和基于音节的语言中的一个。在508,翻译模块304将第一词与来自第一语言数据存储308的多个第二词进行比较。该多个第二词为非基于字母表的语言,以及该多个第二词包括第一词的潜在翻译。
在512,翻译模块304将第一词与来自第二语言数据存储312的多个第三词进行比较。该多个第三词是第二基于字母表的语言的。该第二基于字母表的语言不同于第一基于字母表的语言。该第三多个词包括第一词的潜在翻译。在516,翻译模块304基于与第一词的各个比较为该多个第二词和该多个第三词中的每一个生成概率分值。每一个概率分值指示该多个第二词和该多个第三词中的一个是第一词的认可翻译的可能性。
在520,输入控制模块300通过用户设备100的触摸显示器104向用户108提供多个翻译的词,该多个翻译的词基于该多个第二词、该多个第三词和概率分值。在524,输入控制模块300从用户108接收第二输入,该第二输入指示对该多个翻译的词中的一个的选择以获取选择的翻译的词。在528,输入控制模块300通过用户设备100的触摸显示器104向用户108提供选择的翻译的词。技术500然后可以结束或返回到504以供一个或多个另外的循环。
现参考图6,用于帮助用户使用拼音输入将实体的英语和中文名称文本输入到用户设备的技术600的示例在604开始。在604,输入控制模块300从用户设备100的用户108接收第一输入,该第一输入包括拼音词,该拼音词表示实体的名称。在608,翻译模块304将该拼音词与来自第一语言数据存储308的多个中文词进行比较,该多个中文词是该拼音词的翻译,该多个中文词中的每一个包括一个或多个汉字。
在612,翻译模块304将该拼音词与来自第二语言数据存储312的多个英语词进行比较,该多个英语词是该拼音词的翻译。在616,翻译模块304基于与该拼音词的各个比较为该多个中文词和该多个英语词中的每一个生成概率分值,每一个概率分值指示该多个中文词和该多个英语词中的一个是该拼音词的认可翻译的可能性。
在620,输入控制模块300通过用户设备100的触摸显示器104向用户108提供多个翻译的词,该多个翻译的词具有最高概率分值,以及该多个翻译的词包括该多个中文词中的至少一个和该多个英语词中的至少一个。在624,输入控制模块300接收用户108对该多个翻译的词中的一个的选择以获取选择的翻译的词。在628,输入控制模块300通过用户设备100的触摸显示器104向用户108提供选择的翻译的词。技术600然后可以结束或返回到604以供一个或多个另外的循环。
提供了示例实施例,以使本公开将向本领域技术人员全面、详尽地表达范围。阐述了大量具体细节,诸如特定组件、设备和方法的示例,以提供对本公开的实施例的全面理解。对本领域技术人员将显而易见的是,该具体细节不一定被利用,示例实施例可以以许多不同形式具体化,并且两个都不应被解释为限制本公开的范围。在一些示例实施例中,没有详细描述众所周知的过程、众所周知的设备结构以及众所周知的技术。
本文使用的术语仅出于描述特定示例实施例的目的,并且并不意在限制。如本文所使用,单数形式不定冠词和定冠词可以意在也包括复数形式,除非语境另外清楚指出。用语“和/或”包括相关联的列出项中的一个或多个的任何和所有组合。用语“包括”、“包含”和“具有”是包括一切的,因此指定所说明的特征、完整物、步骤、操作、元素和/或组件的存在,但是并不排除一个或多个其他特征、完整物、步骤、操作、元素、组件和/或其群组的存在或添加。本文描述的方法步骤、过程和操作不应被解释为必须要求它们按照所述或所图示的特定顺序执行,除非明确被识别为执行顺序。还应当理解的是,可以利用另外或替选步骤。
尽管用语第一、第二、第三等可以在本文用来描述各种元素、组件、区、层和/或部分,然而,这些元素、组件、区、层和/或部分不应当受这些用语限制。这些用语可以仅用来将一个元素、组件、区、层或部分与另一个区、层或部分进行区分。诸如“第一”、“第二”和其他数字用语的用语当在本文中被使用时,并不暗示次序或顺序,除非由语境清楚指出。因此,下述第一元素、组件、区、层或部分可以被称为第二元素、组件、区、层或部分,而不会背离示例实施例的教导。
如本文所使用,用语模块可以是指下述、是下述的部分、或包括下述:专用集成电路(ASIC);电子电路;组合逻辑电路;现场可编程门阵列(FPGA);执行代码的处理器(共享、专用或组)、或在联网集群或数据中心中的处理器和存储的分布式网络所执行的过程;提供所述功能性的其他适当组件;或上述部分或全部的组合,诸如在片上系统中。用语模块可以包括存储一个或多个处理器所执行的代码的存储器(共享、专用或组)。
如上所使用的用语代码可以包括软件、固件、字节码和/或微码,并且可以指程序、例程、函数、类和/或对象。如上所使用的用语共享意为可以使用单个(共享)处理器来执行来自多个模块的部分或全部代码。另外,可以通过单个(共享)存储器存储来自多个模块的部分或全部代码。如上所使用的用语组意为可以使用一组处理器来执行来自单个模块的部分或全部代码。另外,可以使用一组存储器来存储来自单个模块的部分或全部代码。
本文所述的技术可以通过一个或多个处理器所执行的一个或多个计算机程序来实现。所述计算机程序包括被存储在非暂时性有形计算机可读介质上的处理器可执行指令。所述计算机程序还可以包括已存储的数据。非暂时性有形计算机可读介质的非限制性示例是非易失性存储器、磁存储和光存储。
上面描述的一些部分在对信息的操作的算法和符号表示方面提供了在本文描述的技术。这些算法描述和表示是数据处理领域的技术人员用来向本领域技术人员更有效表达其工作实质的手段。这些操作当在功能上或逻辑上被描述时,应当被理解为由计算机程序实现。此外,还已证明有时便利的是,作为模块或以功能名称引用操作的这些安排,而不失一般性。
除非另外明确说明为从上面论述显而易见,应当理解的是,在整个描述中,利用诸如“处理”或“计算(computing)”或“计算(calculating)”或“确定”或“显示”等的用语的论述是指计算机系统或类似电子计算设备的动作和处理,其在该计算机系统存储器或寄存器或其他这样的信息存储、传输或显示设备内操纵并变换被表示为物理(电子)量的数据。
所述技术的某些方面包括本文以算法形式描述的过程步骤和指令。应当注意的是,所述过程步骤和指令可以以软件、固件或硬件具体化,以及当以软件具体化时,可以被下载以驻存在实时网络操作系统所使用的不同平台上并从所述不同平台进行操作。
本公开还涉及用于执行本文的操作的装置。该装置可以为所需目的被特定构建,或其可以包括由存储在计算机可以访问的计算机可读介质上的计算机程序选择性激活或重新配置的通用计算机。这样的计算机程序可以被存储在有形计算机可读存储介质中,诸如但不限于:任何类型的盘,包括软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁或光卡、专用集成电路(ASIC)、或适于存储电子指令并且每一个被耦接到计算机系统总线的任何类型的介质。此外,在本说明书中所引用的计算机可以包括单处理器或可以是为增加的计算能力利用多处理器设计的体系结构。
本文提供的算法和操作并不与任何特定计算机或其他装置存在内在关联。各种通用系统根据本文的教导也可以与程序一起使用,或可以证明便利的,构建更专门的装置来执行所需方法步骤。多种这些系统所需的结构以及等价变体对本领域技术人员将是显而易见的。另外,没有参考任何特定编程语言描述本公开。应当理解的是,可以使用多种编程语言来实现如本文所述的本公开的教导,并且为本发明的实现和最佳模式的公开提供了对特定语言的任何引用。
本公开非常适于在无数拓扑结构上的各种各样的计算机网络系统。在这个领域内,较大网络的配置和管理包括通过诸如因特网的网络被通信耦接到不相似的计算机和存储设备的存储设备和计算机。
为说明和描述目的,已提供了实施例的前面描述。其并不意在穷尽或限制本公开。特定实施例的单个元素或特征一般不限于该特定实施例,而是,在适用情况下,是可交换的并且可以在选择的实施例中被使用,即使没有被明确示出或描述。这还可以以许多方式变化。这样的变化不应被认为是背离本公开,以及所有这样的修改意在被包括在本公开的范围内。
Claims (20)
1.一种计算机实现的方法,包括:
通过用户设备的用户接口,从所述用户设备的用户接收第一输入,所述用户设备进一步包括显示器和处理器,所述第一输入包括拼音词,所述拼音词表示实体的名称;
在所述用户设备处,将所述拼音词与来自第一数据存储的多个中文词进行比较,所述多个中文词是所述拼音词的潜在翻译,所述多个中文词中的每一个包括一个或多个汉字;
在所述用户设备处,将所述拼音词与来自第二数据存储的多个英语词进行比较,所述多个英语词是所述拼音词的潜在翻译;
在所述用户设备处,基于与所述拼音词的各个比较为所述多个中文词和所述多个英语词中的每一个生成概率分值,每一个概率分值指示所述多个中文词和所述多个英语词中的相应一个是所述拼音词的适当翻译的可能性;
通过所述用户设备的所述显示器向所述用户提供多个翻译的词,所述多个翻译的词具有最高概率分值并且包括所述多个中文词中的至少一个和所述多个英语词中的至少一个;
通过所述用户设备的所述用户接口,接收所述用户对所述多个翻译的词中的一个的选择以获取选择的词;以及
通过所述用户设备的所述显示器显示所述选择的词。
2.一种计算机实现的方法,包括:
通过用户设备的用户接口,从所述用户设备的用户接收第一输入,所述用户设备进一步包括显示器和处理器,所述第一输入包括第一基于字母表的语言的第一词,所述第一基于字母表的语言是非基于字母表的语言的音译,所述非基于字母表的语言是基于语标的语言和基于音节的语言中的一个;
在所述用户设备处,将所述第一词与来自第一数据存储的多个第二词进行比较,所述多个第二词为所述非基于字母表的语言,所述多个第二词是所述第一词的潜在翻译;
在所述用户设备处,将所述第一词与来自第二数据存储的多个第三词进行比较,所述多个第三词为第二基于字母表的语言,所述第二基于字母表的语言不同于所述第一基于字母表的语言,所述第三多个词是所述第一词的潜在翻译;
在所述用户设备处,使用语言模型基于与所述第一词的各个比较为所述多个第二词和所述多个第三词中的每一个生成概率分值,每一个概率分值指示所述多个第二词和所述多个第三词中的一个是所述第一词的适当翻译的可能性;
通过所述用户设备的所述显示器向所述用户提供多个翻译的词,所述多个翻译的词基于所述多个第二词、所述多个第三词和所述概率分值;
通过所述用户设备的所述用户接口从所述用户接收第二输入,所述第二输入指示对所述多个翻译的词中的一个的选择以获取选择的词;以及
通过所述用户设备的所述显示器显示所述选择的词。
3.根据权利要求2所述的计算机实现的方法,其中所述第一词是实体的名称。
4.根据权利要求3所述的计算机实现的方法,其中所述实体是人、场所或组织。
5.根据权利要求3所述的计算机实现的方法,其中所述多个翻译的词包括所述多个第二词中的至少一个和所述多个第三词中的至少一个。
6.根据权利要求5所述的计算机实现的方法,进一步包括:基于所述多个第二词和所述多个第三词的相应概率分值对所述多个第二词和所述多个第三词进行排名,以获取排名的多个翻译的词。
7.根据权利要求6所述的计算机实现的方法,进一步包括:通过选择所述排名的多个翻译的词的子集,生成所述多个翻译的词。
8.根据权利要求7所述的计算机实现的方法,其中所述排名的多个翻译的词的所述子集是基于所述概率分值被选择的,所述多个翻译的词是所述多个翻译的词中的比所述多个翻译的词的剩余者具有更高的概率分值的翻译的词。
9.根据权利要求8所述的计算机实现的方法,其中所述多个翻译的词包括预先确定的数量的翻译的词,所述预先确定的数量基于对通过所述用户设备的所述显示器进行查看是适当的翻译的词数。
10.根据权利要求9所述的计算机实现的方法,其中所述预先确定的数量基于所述用户设备的类型。
11.根据权利要求2所述的计算机实现的方法,进一步包括以下的至少一个:(i)将所述选择的词提供给所述处理器以供处理;以及(ii)将所述选择的词提供给所述用户设备的通信模块以通过网络通信给另一个用户设备或服务器。
12.一种系统,包括:
输入控制模块,所述输入控制模块通过用户设备的用户接口,从所述用户设备的用户接收第一输入,所述用户设备进一步包括显示器和处理器,所述第一输入包括第一基于字母表的语言的第一词,所述第一基于字母表的语言是非基于字母表的语言的音译,所述非基于字母表的语言是基于语标的语言和基于音节的语言中的一个;
比较模块,所述比较模块
(i)在所述用户设备处,将所述第一词与来自第一数据存储的多个第二词进行比较,所述多个第二词为所述非基于字母表的语言,所述多个第二词是所述第一词的潜在翻译,以及
(ii)在所述用户设备处,将所述第一词与来自第二数据存储的多个第三词进行比较,所述多个第三词为第二基于字母表的语言,所述第二基于字母表的语言不同于所述第一基于字母表的语言,所述第三多个词是所述第一词的潜在翻译;以及
评分模块,所述评分模块在所述用户设备处,使用语言模型基于与所述第一词的各个比较为所述多个第二词和所述多个第三词中的每一个生成概率分值,每一个概率分值指示所述多个第二词和所述多个第三词中的一个是所述第一词的适当翻译的可能性,
其中所述输入控制模块还
(i)通过所述用户设备的所述显示器向所述用户提供多个翻译的词,所述多个翻译的词基于所述多个第二词、所述多个第三词和所述概率分值,
(ii)通过所述用户设备的所述用户接口从所述用户接收第二输入,所述第二输入指示对所述多个翻译的词中的一个的选择以获取选择的词,以及
(iii)通过所述用户设备的所述显示器显示所述选择的词。
13.根据权利要求12所述的系统,其中所述第一词是实体的名称。
14.根据权利要求13所述的系统,其中所述实体是人、场所或组织。
15.根据权利要求13所述的系统,其中所述多个翻译的词包括所述多个第二词中的至少一个和所述多个第三词中的至少一个。
16.根据权利要求15所述的系统,进一步包括排名模块,所述排名模块基于所述多个第二词和所述多个第三词的相应概率分值对所述多个第二词和所述多个第三词进行排名,以获取排名的多个翻译的词。
17.根据权利要求16所述的系统,其中所述输入控制模块通过选择所述排名的多个翻译的词的子集,生成所述多个翻译的词。
18.根据权利要求17所述的系统,其中所述排名的多个翻译的词的所述子集是基于所述概率分值被选择的,所述多个翻译的词是所述多个翻译的词中的比所述多个翻译的词的剩余者具有更高的概率分值的翻译的词。
19.根据权利要求18所述的系统,其中所述多个翻译的词包括预先确定的数量的翻译的词,所述预先确定的数量基于对通过所述用户设备的所述显示器进行查看是适当的翻译的词数。
20.根据权利要求12所述的系统,其中所述比较模块进行以下的至少一个:(i)将所述选择的词提供给所述处理器以供处理;以及(ii)将所述选择的词提供给所述用户设备的通信模块以通过网络通信给另一个用户设备或服务器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/459,926 | 2012-04-30 | ||
US13/459,926 US8818791B2 (en) | 2012-04-30 | 2012-04-30 | Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103558908A true CN103558908A (zh) | 2014-02-05 |
Family
ID=49478062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310154271.8A Pending CN103558908A (zh) | 2012-04-30 | 2013-04-28 | 帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术 |
Country Status (4)
Country | Link |
---|---|
US (2) | US8818791B2 (zh) |
JP (1) | JP5703331B2 (zh) |
KR (1) | KR101507977B1 (zh) |
CN (1) | CN103558908A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015192313A1 (en) * | 2014-06-17 | 2015-12-23 | Google Inc. | Input method editor for inputting names of geographic locations |
CN106980390A (zh) * | 2016-01-18 | 2017-07-25 | 富士通株式会社 | 辅助翻译输入方法和辅助翻译输入设备 |
CN108463815A (zh) * | 2016-01-07 | 2018-08-28 | Mz知识产权控股有限责任公司 | 聊天数据的命名实体识别 |
CN113128240A (zh) * | 2021-04-20 | 2021-07-16 | 连通(杭州)技术服务有限公司 | 一种商户名称翻译的方法及设备 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8818791B2 (en) * | 2012-04-30 | 2014-08-26 | Google Inc. | Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages |
US10650103B2 (en) | 2013-02-08 | 2020-05-12 | Mz Ip Holdings, Llc | Systems and methods for incentivizing user feedback for translation processing |
US9231898B2 (en) | 2013-02-08 | 2016-01-05 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9298703B2 (en) | 2013-02-08 | 2016-03-29 | Machine Zone, Inc. | Systems and methods for incentivizing user feedback for translation processing |
US8996352B2 (en) | 2013-02-08 | 2015-03-31 | Machine Zone, Inc. | Systems and methods for correcting translations in multi-user multi-lingual communications |
US9600473B2 (en) * | 2013-02-08 | 2017-03-21 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9031829B2 (en) | 2013-02-08 | 2015-05-12 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9384191B2 (en) * | 2013-09-25 | 2016-07-05 | International Business Machines Corporation | Written language learning using an enhanced input method editor (IME) |
CN104657343B (zh) * | 2013-11-15 | 2017-10-10 | 富士通株式会社 | 识别音译名的方法及装置 |
US10108599B2 (en) * | 2014-06-06 | 2018-10-23 | Ebay Inc. | Language platform |
US10162811B2 (en) | 2014-10-17 | 2018-12-25 | Mz Ip Holdings, Llc | Systems and methods for language detection |
US9372848B2 (en) | 2014-10-17 | 2016-06-21 | Machine Zone, Inc. | Systems and methods for language detection |
US10175770B2 (en) | 2016-10-13 | 2019-01-08 | International Business Machines Corporation | Proactive input method editor switching |
US10769387B2 (en) | 2017-09-21 | 2020-09-08 | Mz Ip Holdings, Llc | System and method for translating chat messages |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050086590A1 (en) * | 1999-11-05 | 2005-04-21 | Microsoft Corporation | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors |
JP2006235856A (ja) * | 2005-02-23 | 2006-09-07 | Sony Ericsson Mobilecommunications Japan Inc | 端末機器、入力候補辞書選択方法 |
CN101551798A (zh) * | 2008-03-31 | 2009-10-07 | 任鹏 | 翻译输入法及字库 |
CN101566882A (zh) * | 2009-06-02 | 2009-10-28 | 腾讯科技(深圳)有限公司 | 文字输入系统及文字输入方法 |
CN101697109A (zh) * | 2009-10-26 | 2010-04-21 | 北京搜狗科技发展有限公司 | 一种获取输入法候选项的方法及系统 |
CN102193643A (zh) * | 2010-03-15 | 2011-09-21 | 北京搜狗科技发展有限公司 | 一种文字输入方法和具有翻译功能的输入法系统 |
CN102236643A (zh) * | 2010-04-29 | 2011-11-09 | 英业达股份有限公司 | 同时显示多语字词与例句的处理系统及其方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6418872A (en) * | 1987-07-13 | 1989-01-23 | Ricoh Kk | Input processing method for roman character with word processor |
US6789231B1 (en) | 1999-10-05 | 2004-09-07 | Microsoft Corporation | Method and system for providing alternatives for text derived from stochastic input sources |
US7149970B1 (en) | 2000-06-23 | 2006-12-12 | Microsoft Corporation | Method and system for filtering and selecting from a candidate list generated by a stochastic input method |
JP4012143B2 (ja) | 2003-12-16 | 2007-11-21 | キヤノン株式会社 | 情報処理装置およびデータ入力方法 |
US7398199B2 (en) * | 2004-03-23 | 2008-07-08 | Xue Sheng Gong | Chinese romanization |
US20060106769A1 (en) | 2004-11-12 | 2006-05-18 | Gibbs Kevin A | Method and system for autocompletion for languages having ideographs and phonetic characters |
CN100530171C (zh) * | 2005-01-31 | 2009-08-19 | 日电(中国)有限公司 | 字典学习方法和字典学习装置 |
US7506254B2 (en) * | 2005-04-21 | 2009-03-17 | Google Inc. | Predictive conversion of user input |
US20070021956A1 (en) * | 2005-07-19 | 2007-01-25 | Yan Qu | Method and apparatus for generating ideographic representations of letter based names |
CN101286092A (zh) | 2007-04-11 | 2008-10-15 | 谷歌股份有限公司 | 具有第二语言模式的输入法编辑器 |
US8706474B2 (en) * | 2008-02-23 | 2014-04-22 | Fair Isaac Corporation | Translation of entity names based on source document publication date, and frequency and co-occurrence of the entity names |
CN104360987B (zh) * | 2008-05-11 | 2018-01-19 | 黑莓有限公司 | 使能对文本输入进行直译的移动电子设备及相关方法 |
JP5751537B2 (ja) | 2008-09-17 | 2015-07-22 | 有限会社新英プラナーズ | 国際対応型日本語入力システム |
US8326602B2 (en) * | 2009-06-05 | 2012-12-04 | Google Inc. | Detecting writing systems and languages |
WO2011050494A1 (en) * | 2009-10-29 | 2011-05-05 | Google Inc. | Generating input suggestions |
US8731901B2 (en) * | 2009-12-02 | 2014-05-20 | Content Savvy, Inc. | Context aware back-transliteration and translation of names and common phrases using web resources |
US8463592B2 (en) * | 2010-07-27 | 2013-06-11 | International Business Machines Corporation | Mode supporting multiple language input for entering text |
US8977535B2 (en) * | 2011-04-06 | 2015-03-10 | Pierre-Henry DE BRUYN | Transliterating methods between character-based and phonetic symbol-based writing systems |
US20120290287A1 (en) * | 2011-05-13 | 2012-11-15 | Vadim Fux | Methods and systems for processing multi-language input on a mobile device |
CN104145235A (zh) * | 2011-12-12 | 2014-11-12 | 谷歌公司 | 用于使用触摸式计算设备输入多字符复合辅音或元音并音译为另一种语言的技术 |
US8818791B2 (en) * | 2012-04-30 | 2014-08-26 | Google Inc. | Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages |
-
2012
- 2012-04-30 US US13/459,926 patent/US8818791B2/en not_active Expired - Fee Related
-
2013
- 2013-04-26 JP JP2013093550A patent/JP5703331B2/ja active Active
- 2013-04-28 CN CN201310154271.8A patent/CN103558908A/zh active Pending
- 2013-04-30 KR KR20130048362A patent/KR101507977B1/ko active IP Right Grant
-
2014
- 2014-08-22 US US14/466,292 patent/US9442902B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050086590A1 (en) * | 1999-11-05 | 2005-04-21 | Microsoft Corporation | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors |
JP2006235856A (ja) * | 2005-02-23 | 2006-09-07 | Sony Ericsson Mobilecommunications Japan Inc | 端末機器、入力候補辞書選択方法 |
CN101551798A (zh) * | 2008-03-31 | 2009-10-07 | 任鹏 | 翻译输入法及字库 |
CN101566882A (zh) * | 2009-06-02 | 2009-10-28 | 腾讯科技(深圳)有限公司 | 文字输入系统及文字输入方法 |
CN101697109A (zh) * | 2009-10-26 | 2010-04-21 | 北京搜狗科技发展有限公司 | 一种获取输入法候选项的方法及系统 |
CN102193643A (zh) * | 2010-03-15 | 2011-09-21 | 北京搜狗科技发展有限公司 | 一种文字输入方法和具有翻译功能的输入法系统 |
CN102236643A (zh) * | 2010-04-29 | 2011-11-09 | 英业达股份有限公司 | 同时显示多语字词与例句的处理系统及其方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015192313A1 (en) * | 2014-06-17 | 2015-12-23 | Google Inc. | Input method editor for inputting names of geographic locations |
US10386935B2 (en) | 2014-06-17 | 2019-08-20 | Google Llc | Input method editor for inputting names of geographic locations |
CN111176456A (zh) * | 2014-06-17 | 2020-05-19 | 谷歌有限责任公司 | 用于输入地理位置名称的输入法编辑器 |
CN111176456B (zh) * | 2014-06-17 | 2023-06-06 | 谷歌有限责任公司 | 用于输入地理位置名称的输入法编辑器 |
CN108463815A (zh) * | 2016-01-07 | 2018-08-28 | Mz知识产权控股有限责任公司 | 聊天数据的命名实体识别 |
CN106980390A (zh) * | 2016-01-18 | 2017-07-25 | 富士通株式会社 | 辅助翻译输入方法和辅助翻译输入设备 |
CN113128240A (zh) * | 2021-04-20 | 2021-07-16 | 连通(杭州)技术服务有限公司 | 一种商户名称翻译的方法及设备 |
CN113128240B (zh) * | 2021-04-20 | 2024-08-30 | 连通(杭州)技术服务有限公司 | 一种商户名称翻译的方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
US8818791B2 (en) | 2014-08-26 |
US9442902B2 (en) | 2016-09-13 |
US20140365204A1 (en) | 2014-12-11 |
US20130289973A1 (en) | 2013-10-31 |
KR20130122584A (ko) | 2013-11-07 |
JP5703331B2 (ja) | 2015-04-15 |
JP2013232193A (ja) | 2013-11-14 |
KR101507977B1 (ko) | 2015-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103558908A (zh) | 帮助用户以多种不同语言将实体的名称文本输入到用户设备的技术 | |
US9262412B2 (en) | Techniques for predictive input method editors | |
CN111488740B (zh) | 一种因果关系的判别方法、装置、电子设备及存储介质 | |
US9116885B2 (en) | Techniques for a gender weighted pinyin input method editor | |
US20170046330A1 (en) | Context specific language model for input method editor | |
CN105814556B (zh) | 语境敏感的输入工具 | |
US20180173694A1 (en) | Methods and computer systems for named entity verification, named entity verification model training, and phrase expansion | |
JP2012521025A (ja) | インプットメソッドエディタ | |
US20220139386A1 (en) | System and method for chinese punctuation restoration using sub-character information | |
CN106484678A (zh) | 一种短文本相似度计算方法及装置 | |
US11481547B2 (en) | Framework for chinese text error identification and correction | |
CN111274813A (zh) | 语言序列标注方法、装置存储介质及计算机设备 | |
CN111176456B (zh) | 用于输入地理位置名称的输入法编辑器 | |
CN105683873A (zh) | 容错输入法编辑器 | |
CN114064845A (zh) | 关系表示模型的训练方法、装置及电子设备 | |
US10546061B2 (en) | Predicting terms by using model chunks | |
CN117271755B (zh) | 基于人工智能的客诉闭环规则引擎管理控制方法 | |
CN114722841B (zh) | 翻译方法、装置及计算机程序产品 | |
CN113822057B (zh) | 地点信息确定方法、装置、电子设备以及存储介质 | |
Daud et al. | Predictive Text Entry Method for Somali Language on Mobile Phone | |
CN118886501A (zh) | 基于大模型的对话方法、模型训练方法、装置和电子设备 | |
CN114580378A (zh) | 一种语句生成模型的训练方法、语句生成方法、装置、设备及介质 | |
CN116187280A (zh) | 一种文本生成方法、装置、设备及存储介质 | |
CN114881051A (zh) | 翻译质量确定方法、相关装置及计算机程序产品 | |
CN115640445A (zh) | 搜索请求响应方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140205 |