CN112154442A - 短语级缩写的文本录入和转换 - Google Patents

短语级缩写的文本录入和转换 Download PDF

Info

Publication number
CN112154442A
CN112154442A CN201980033957.7A CN201980033957A CN112154442A CN 112154442 A CN112154442 A CN 112154442A CN 201980033957 A CN201980033957 A CN 201980033957A CN 112154442 A CN112154442 A CN 112154442A
Authority
CN
China
Prior art keywords
text
word
phrase
probability
parsed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980033957.7A
Other languages
English (en)
Inventor
C-F·U·曼比
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN112154442A publication Critical patent/CN112154442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

提供了用于接受短语、句子或段落的缩减的文本录入并且概率性地确定缩减的文本到全文对应文本的最可能转换并且对其进行显示的方法、移动电子设备和计算机程序产品。缩减的文本被接受并且根据预定义缩减模式被解析以产生已解析文本元素。已解析文本元素使用n元语法知识和/或语言模型被评估以标识与元素对应的最可能词。对应的最可能词被用于通过评估最可能词中从一个词向下一词的转变的可能性来在短语级别评估缩减的文本,以计算针对最可能词的各种组合的短语概率。(多个)最可能短语部分基于短语概率而被输出。

Description

短语级缩写的文本录入和转换
背景技术
预测性自动完成文本录入是一种在一些文本处理工具中实现的用于在仅有限数量的文本录入之后自动完成词文本(在某些情况下只需1到3次击键)的功能。预测性自动完成文本录入工具通过使用户输入较少击键来输入完整词来节省用户时间。这样的工具在用于发送文本消息(例如,短消息服务(SMS)消息等)、电子邮件或其他文本密集型应用的移动设备上特别有价值,特别是考虑到移动设备上的键盘相对较小。预测性自动完成文本录入也可以称为“词完成”。预测性自动完成文本录入通过减少必须输入的字符数来提高文本录入效率(即,提高速度并且减少错误)。
发明内容
提供本“发明内容”以便以简化的形式介绍一些概念,这些概念将在下面的“具体实施方式”中进一步描述。本“发明内容”既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
提供了能够解决词级自动校正的局限性的方法、装置和计算机程序产品,从而使得能够在短语、句子或段落级别进行校正。在各方面,由用户输入缩写的文本,缩写的文本可以对应于全文短语,诸如句子或段落。基于缩写的文本来生成一个或多个全文短语,全文短语根据关于缩写的文本与全文短语对应的概率而被显示。
在一种实现中,缩减的文本处理模块被启用以接受缩写的文本,根据预定义模式解析缩减的文本,以生成已解析文本元素的序列,并且确定一个或多个全文短语,其中的词最可能对应于已解析文本元素,并且在计算设备的显示组件上显示一个或多个全文短语。在一个示例中,分析已解析文本元素的序列的每个已解析文本元素以确定词概率集合,每个概率是特定已解析文本元素与特定词对应的概率。此外,分析词概率集合以确定多个短语概率,每个短语概率是缩减的文本与特定全文短语、句子或段落对应的概率。
在另一方面,缩写的文本被显示在电子设备的显示组件上,并且显示的文本还可以包括标记已解析文本元素的序列的指示。
下面参考附图详细描述本发明的其他特征和优点以及各种实施例的结构和操作。注意,实施例不限于本文中描述的特定实施例。本文中提出这样的实施例仅出于说明性目的。基于本文中包含的教导,其他实施例对(多个)相关领域的技术人员将是很清楚的。
附图说明
结合在本文中并且构成说明书的一部分的附图示出了本申请的实施例,并且与说明书一起进一步用于解释实施例的原理并且使得相关领域的技术人员能够制造和使用实施例。
图1示出了根据示例实施例的配备成接受和处理缩减的文本录入的移动电子设备的框图。
图2示出了根据示例实施例的用于基于短语与缩减的文本录入对应的概率来接收和处理缩减的文本以产生和显示短语的方法的流程图。
图3示出了根据示例实施例的示例缩减的文本处理模块。
图4示出了根据实施例的用于在显示组件上提供从缩减的文本录入解析出的已解析文本元素的指示的过程。
图5示出了根据实施例的显示组件,该显示组件示出了从缩减的文本录入解析出的已解析文本元素的示例指示。
图6示出了根据示例实施例的用于在显示组件上提供具有与缩减的文本录入对应的最高概率的短语的过程。
图7示出了根据实施例的用于在显示组件上提供具有与缩减的文本录入对应的最高相应概率的多个短语的过程。
图8是可以用于实现各种实施例的示例性的基于处理器的计算机系统的框图。
通过以下结合附图进行的详细描述,本发明的特征和优点将变得更加明显,在附图中,相同的附图标记始终标识相应的元素。在附图中,相似的附图标记通常表示相同、功能相似和/或结构相似的元素。元素首次出现的图形由相应附图标记中(多个)最左边的数字指示。
具体实施方式
I.引言
本说明书和附图公开了结合本发明的特征的一个或多个实施例。本发明的范围不限于所公开的实施例。所公开的实施例仅例示了本发明,并且所公开的实施例的修改版本也被本发明涵盖。本发明的实施例由所附权利要求书限定。
在说明书中对“一个实施例”、“实施例”、“示例实施例”等的引用指示所描述的实施例可以包括特定的特征、结构或特性,但是每个实施例可以不必包括特定的特征、结构或特性。而且,这样的短语不一定是指相同的实施例。此外,当结合实施例描述特征、结构或特性时,可以认为结合其他实施例(无论是否明确描述)来实现这样的特征、结构或特性在本领域技术人员的知识范围内。
本发明的很多示例性实施例描述如下。注意,本文中提供的任何节/小节标题都不旨在是限制性的。在整个本文中描述了实施例,并且在任何节/小节下可以包括任何类型的实施例。此外,在任何节/小节中公开的实施例可以按照任何方式与在相同节/小节和/或不同节/小节中描述的任何其他实施例组合。
II.示例实施例。
预测性自动完成文本录入是一种在一些文本处理工具中实现的用于在仅有限数量的文本录入之后自动完成词文本(在某些情况下只需1到3次击键)的功能。预测性自动完成文本录入工具通过使用户输入较少击键来输入完整词来节省用户时间。这样的工具在用于发送文本消息(例如,短消息服务(SMS)消息等)、电子邮件或其他文本密集型应用的移动设备上特别有价值,特别是考虑到移动设备上的键盘相对较小。预测性自动完成文本录入也可以称为“词完成”。
预测性自动完成文本录入通过减少必须输入的字符数来提高文本录入的效率(即,提高速度并且减少错误)。但是,当前的自动完成文本录入工具被配置为仅在词级别运行。也就是说,文本录入用于预测性地自动完成单个词,而不是允许用户继续输入在短语、句子或段落级别预测性自动完成的文本。通过潜在地校正每个输入的词而不是在短语级别进行校正,用户被迫减慢其总体文本录入速度并且打断自己的思路以查看预测性自动完成文本录入是否正确地自动完成了最后的词。
本文中描述的实施例使得包括诸如智能电话或平板计算机等移动设备在内的电子设备能够根据预定义缩减模式来接受缩减的文本,确定关于缩减的文本与多个全文短语(可以包括短语、句子和/或段落)对应的概率,并且根据这样的概率在电子设备的显示组件上显示一个或多个全文短语。根据一个实施例,确定这样的概率可以按照各种方式而被完成。
在下文中,当所描述的实施例涉及“缩写的句子级文本录入”、“缩写的句子级文本”、“缩写的文本”、“缩减的文本”等时,应当理解,实施例不限于句子,而是,这些术语包含短语、句子和段落。
在实施例中,这样的缩写的文本文本录入和转换可以在设备中以各种方式被实现。例如,图1示出了根据示例实施例的被配置为执行缩写的文本文本录入和转换的移动电子设备102的框图。如图1所示,移动电子设备102包括显示组件104、文本输入模块110和缩减的文本处理模块112。显示组件104包括显示用户界面106的显示屏。移动电子设备102及其特征描述如下。
移动电子设备102可以是任何类型的移动计算机或计算设备,诸如手持设备(例如,
Figure BDA0002788614240000041
设备、RIM
Figure BDA0002788614240000042
设备、个人数字助理(PDA))、膝上型计算机、笔记本计算机、平板计算机(例如,Apple iPadTM、Microsoft SurfaceTM等)、上网本、移动电话(例如,智能电话,诸如Apple iPhone、Google AndroidTM电话、Microsoft
Figure BDA0002788614240000051
电话等)、可穿戴设备(例如,虚拟现实眼镜、头盔和护目镜、手表(例如,
Figure BDA0002788614240000052
))和其他类型的移动设备。此外,尽管将移动电子设备102指示为移动设备,但是实施例也可以在包括个人计算机在内的固定设备中实现。
显示组件104是移动电子设备102的显示器,该显示器用于向移动电子设备102的用户显示文本(文本字符,包括字母数字字符、算术符号等)以及可选的图形。例如,显示组件104可以包括作为移动电子设备102的一部分或全部表面的显示屏。显示屏可以是或者不是触摸敏感的。显示组件104可以是LED(发光二极管)型显示器、OLED(有机发光二极管)型显示器、LCD(液晶显示器)型显示器、等离子显示器、或者可以有或没有背光的其他类型的显示器。
文本输入模块110被配置为接收由用户提供给移动电子设备102的缩减的文本114。移动电子设备102可以被配置为从一个或多个用户界面设备接受缩减的文本114,诸如键盘(例如,用户可以键入文本)、拇指轮、指示设备、滚球、棒状指示器、触敏显示器、任何数目的虚拟界面元素(例如,由显示组件104显示在用户界面106中的虚拟键盘或其他用户界面元素)、和/或本文中其他各处描述或其他已知方式的其他用户界面元素。在另一实施例中,移动电子设备102包括触觉接口,该触觉接口被配置为通过向用户施加力、振动和/或运动来通过触摸感觉将移动电子设备102与用户接口。例如,移动电子设备102的用户可以穿戴手套或其他假体以提供触觉接触。
在一个实施例中,文本输入模块110可以存储缩减的文本114(例如,在存储器或其他存储装置中),并且将缩减的文本114传递给显示组件104以进行显示,如图1所示。文本输入模块110可以按照任何形式(例如,作为字符数据、显示像素数据、光栅化图形等)向显示组件104提供缩减的文本114。根据一个或多个实施例,文本输入模块110还可以将缩减的文本114提供给缩减的文本处理模块112以进行处理和转换,如下面进一步详细描述的。
在一个实施例中,用户界面106是图形用户界面(GUI),该GUI包括其中可以显示显示的文本108的显示区域。例如,用户界面106可以是可以在其中显示文本的文字处理工具或消息传递工具的图形窗口,并且可以可选地由文本输入模块110生成以由显示组件104显示。
在一个实施例中,并且如上所述,缩减的文本处理模块112可以从文本输入模块110接收缩减的文本114。在实施例中,缩减的文本处理模块112可以被包括在文本输入模块110中,或者可以与文本输入模块110分离,但仍被包括在移动电子设备102中(如图1所示)。在另一实施例中,缩减的文本处理模块112可以与移动电子设备102分离,并且可以由移动电子设备102通过网络来访问,诸如个域网(PAN)、局域网(LAN)、广域网(WAN)、或诸如互联网等网络的组合。例如,缩减的文本处理模块112可以由移动电子设备102通过服务器处的网络(诸如在网络服务、云服务等中)访问。
在一个实施例中,并且如在下文中更详细地描述的,缩减的文本处理模块112可以被配置为自动解析缩减的文本114,并且概率性地确定可能与缩减的文本114对应的一个或多个短语/句子/段落。例如,在一个实施例中,缩减的文本处理模块112可以将缩减的文本114自动解析为已解析元素序列,并且确定关于每个元素与多个词中的任何词对应的词概率。
在一个实施例中,当将缩减的文本114提供给显示组件104以进行显示时,文本输入模块110还可以提供标识缩减的文本114中的已解析元素序列的每个已解析元素的指示或其他信息,从而允许显示组件104分别和不同地显示它们。例如,当缩减的文本114在用户界面106中显示为显示的文本108时,与已解析元素序列的每个已解析元素对应的文本字符可以按照对比的粗体、不同的颜色进行显示和/或以其他方式渲染以允许已解析元素的视觉区分。
在一个实施例中,缩减的文本处理模块112可以部分地基于上述词概率来进一步确定短语概率,其中每个短语概率是缩减的文本与特定词序列(即,短语、句子或段落)对应的概率。在一个实施例中,在确定短语概率时,缩减的文本处理模块112可以将一个或多个对应预测的短语118提供给显示组件104以在用户界面106中显示。
如图1所示,缩减的文本处理模块108生成(多个)预测的短语118,预测的短语118是经由文本输入模块110从用户接收的缩减的文本114的全文版本。在一个实施例中,用户可以根据预定义缩减模式输入缩减的文本。例如,用户可以输入他们想输入的句子、短语或段落中的每个词的前两个字母。如果是单字母词,则仅输入单个字母。例如,用户可以输入“mahaalila”,并且文本处理模块108可以输出“mary had a little lamb”作为预测的短语118以在显示组件104上显示。在另一实施例中,可以通过用空格填充输入来将单字母词输入为两个字符,以简化解析。在这样的实施例中,“mary had a little lamb”对应于输入的缩减的文本“mahaa lila”。
在实施例中,移动电子设备102的文本处理模块108可以按照各种方式从“mahaalila”生成“mary had a little lamb”。例如,图2示出了根据示例实施例的用于从缩减的文本录入概率地生成和显示全文短语的示例方法的流程图200。在一个实施例中,流程图200的每个阶段可以由移动电子设备102的缩减的文本处理模块112执行。然而,注意,在其他实施例中,流程图200的步骤可以由电子移动设备102的其他模块或组件执行。例如,下文中描述为由缩减的文本处理模块112执行的任何操作可以被集成为一个或多个其他模块,诸如例如文本输入模块110。基于以下关于流程图200的讨论,其他结构和操作实施例对(多个)相关领域的技术人员将是很清楚的。
流程图200在步骤202开始。在流程图200的步骤202中,在电子设备处从用户接收缩减的文本。例如,如图1所示,移动电子设备102的文本输入模块110接收缩减的文本114。缩减的文本114是由用户根据预定义缩减模式而输入的文本。缩减模式是一个规则,其规定在文本录入期间要输入短语中词的哪些字符。上面刚刚描述了一个这样的缩减模式,其中缩减的文本由每个词的前两个字母组成,单字母词用空格填充。当然,在实施例中,其他缩减模式也是可能的。例如,另一缩减模式可以由每个词的第一和最后的字母组成,其中单字母词又用空格填充。在这种缩减模式下,“mary had a little lamb”对应于缩减的文本“myhda lelb”。其他示例缩减模式以及所得到的缩减的文本为:
·首字母加上第一元音:
ο“the dinosaur was furious”→“tediwafu”
·首字母加上最后的字母再加上语调音节的元音:
ο“slow speaking can help”→“sowsegcanhep”
·首2个字母加上最后的字母:
ο“important papers should not get lost”→“imtpasshdnotgetlot”
除了字母的选择,其他实施例的缩减模式可以允许文本录入中的歧义以解决不确定的拼写。如果用户不知道如何拼写词并且猜测某些部分,或者他们拼写错误,则可能会出现不确定的拼写。例如,元音“i”和“y”以及“e”在语音上可能是模棱两可的。将这个概念和上面示出的最后的缩减模式(即,前2个字母+最后的字母)应用于短语“the eclipseyields glee”可能会产生缩减的文本“theyceyesgli”。
在实施例中,用户可以选择要由例如移动电子设备102识别的优选缩减模式。如果用户和设备102都知道在任何给定时间正在使用哪种缩减模式,则由移动电子设备102进行的从缩减的文本到全文的转换可以更容易。这是因为,缩减模式指示实施例如何解析在步骤202接收的缩减的文本。缩减的文本的解析是消除缩减的文本歧义并且确定可以与缩减的文本对应的可能的全文短语的第一步。然而,在一个实施例中,移动电子设备102可以被配置为通过以下方式来确定用户应用于缩减的文本114的特定缩减模式:根据本文中描述的实施例来分析缩减的文本114并且通过各种可接受的缩减模式的列表来排序。
继续流程图200的步骤204,根据预定义缩减模式来解析缩减的文本,以生成已解析文本元素的序列。例如,如图1所示,文本输入模块110可以将缩减的文本114提供给缩减的文本处理模块112,并且缩减的文本处理模块112可以被配置为执行解析。
例如,再次参考包括每个词的前两个字母的缩减模式,短语“mary had a littlelamb”映射到缩减的文本“mahaa lila”。缩减的文本处理模块112可以被配置为基于短语的每个词被精确地映射到两个文本字符的这一知识来将缩减的文本“mahaa lila”解析为已解析文本元素的序列。因此,从“mahaa lila”解析出的已解析文本元素的序列由每个词的两字符文本元素组成:“ma”、“ha”、“a”、“li”和“la”。每个缩减模式(包括上面示出的)都会导致每个全文词的恒定数目的字符被输入作为缩减的文本。因此,缩减的文本处理模块112可以基于对应恒定数目来将这样的缩减的文本明确地解析为已解析文本元素的序列。已解析文本元素的序列的每个已解析文本元素对应于全文短语的特定词。然而,不可能总是完美地确定哪个特定全文词对应于特定已解析文本元素。例如,已解析文本元素“ma”可以对应于以字母“ma”开头的任何词(例如,mary、made、mad、man、mars等)。因此,“mahaa lila”可以是“Mary had a little lamb”,也可以是“manacles handle a likely larcenist”。与常规的单词自动校正技术相比,实施例使用完整短语转换以使得能够更好地预测这样的词。
再次参考图2,在步骤206中,通过针对序列的每个已解析文本元素确定对应词概率集合来确定与序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率。例如,图1的缩减的文本处理模块112可以被配置为确定与在步骤204确定的已解析文本元素的序列对应的词概率集合。缩减的文本处理模块112可以被配置为通过在步骤206确定关于给定已解析文本元素与一个或多个词对应的概率并且如下面进一步详细描述地确定关于已解析文本元素的序列与特定全文短语对应的概率来尝试解决词确定中的任何歧义。
例如,对于在步骤204生成的已解析文本元素的序列的每个已解析文本元素,缩减的文本处理模块112可以被配置为生成关于所讨论的已解析文本元素与相应词集合对应的词概率集合。例如,基于上面的示例,将“Mary had a little lamb”的缩减的文本解析为文本元素:“ma”、“ha”、“a”、“li”和“la”。使用该示例,缩减的文本处理模块112可以生成关于已解析文本元素“ma”与特定词对应的概率集合。在示例实施例中,该集合可以由预定数目的元组组成,每个元组具有形式(word,word_probability),其中word是全文词,而word_probability是给定已解析文本元素与word对应的概率。假定每个集合包含五个最可能的词,在一个实施例中,与已解析文本元素“ma”对应的集合可以是:[(“many”,p1),(“make”,p2),(“may”,p3),(“made”,p4),(“man”,p5)],其中p1-p5是与每个词对应的概率。
为了确定集合中每个元组的word_probability,缩减的文本处理模块112可以使用词列表和提供遇到词的概率的基于词的语言模型,并且使用本领域已知的方法(诸如表格查找、哈希映射、尝试等)查找给定已解析文本元素的精确匹配或模糊匹配。在实施例中,语言模型和算法与词或词部分一起工作,并且可以基于特定词、词类别(诸如“运动”)、词性(诸如“名词”)、或这样的部分的更复杂的序列来编码看到另一词或词部分接连出现的可能性,诸如在语法模型或神经网络模型(诸如递归神经网络或卷积神经网络)中。
在一个实施例中,并且继续前面的示例,缩减的文本处理模块112通过为剩余的已解析文本元素计算另外的概率集合来继续。在当前示例中,已解析文本元素“ha”、“a”、“li”和“la”。缩减的文本处理模块112生成词概率集合(在步骤204生成的每个已解析文本元素的序列有一个集合),其中每个集合包括关于某些词与每个已解析文本元素对应的概率。最终,缩减的文本处理模块112从缩减的文本输入生成全文短语。正如可以将已解析文本元素映射到多个可能词上一样,可以将已解析文本元素集合的不同词集合映射到多个可能短语上。当然,并非所有这样的短语都是一样的。再次提到“Mary had a little lamb”的示例,而“Mary had a little lamb”和“manacles handle a likely larcenist”之间的模棱两可,可以理解,在后的短语必须基本上可能性小于在前的短语,因为事实上,日常写作中很少使用词“manacles”和“larcenist”。因此,缩减的文本处理模块112可以使用词概率集合来概率性地确定可以映射到缩减的文本114上的一个或多个可能短语。
流程图600的步骤206进行到步骤208。在步骤208中,基于词概率集合来确定与多个短语对应的短语概率集合,该短语概率集合中的每个短语概率是缩减的文本是短语中的相应短语的缩减的文本表示的概率。在一个实施例中,缩减的文本处理模块112确定与多个短语对应的短语概率集合。集合中的每个短语概率表示关于在流程图200的步骤202处接收的缩减的文本是相应短语的缩减的文本表示的概率。与上述词概率集合相似,短语概率集合可以由多个元组组成,每个元组的形式为(phase,phase_probability),其中phase是全文短语,而phase_probability是在步骤202接收的缩减的文本与该phase对应的概率。
在实施例中,在步骤208,由缩减的文本处理模块112使用由缩减的文本处理模块112确定的词概率集合部分地确定短语概率。特别地,缩减的文本处理模块112可以使用词概率和算法(诸如在一个实施例中为维特比算法)、或基于短语的语言模型以基于从一个词到另一词的转变的可能性来查找词序列的可能匹配项。这样的可能性可以基于提供遇到特定词序列的概率的短语列表和语言模型。例如,可以使用n元语法知识,该知识反映关于词“ha”跟随词“ma”的概率。在所考虑的词“ma”是“Mary”的情况下,缩减的文本处理模块112还可以考虑在名词、专有名词和/或女性专有名词之后的词“ha”的实例。也就是说,词概率和/或语言模型不仅可以基于特定相邻词来编码看到另一词的可能性,还可以考虑词类别(诸如“运动”)、词性(诸如“名词”)、或这样的部分的更复杂的序列,诸如在由缩减的文本处理模块112实现的语法模型或神经网络模型(诸如递归神经网络或卷积神经网络)中。
在步骤208确定短语概率时,并且进一步参考“mary had a little lamb”的示例,缩减的文本处理模块112可以在周围词候选的上下文中考虑已解析文本元素“a”。在此,“a”无疑是词“a”,并且当缩减的文本处理模块112在已解析文本元素的序列中往回继续(walkback up)时,缩减的文本处理模块112还可以通过考虑哪些词最有可能在“a”之前并且最有可能在每个n元语法之前来向后继续。
应当注意,分别结合步骤206和208的词和短语描述的集合和元组仅是示例性的,并且不应当推断出特定数据结构或其他数据格式或处理。实际上,本文中下面描述的其他实施例分别处理词和短语以及与其相关联的概率。如图1所示,缩减的文本处理模块112生成一个或多个预测的短语118(其包括短语概率集合以包含最可能的短语的概率)、以及将这样的概率与特定短语相关联的一些手段。
在前面对流程图200的步骤204-208的讨论中,还应当理解,有时这样的步骤可以按照不同的顺序执行或者甚至与其他步骤同时执行。例如,在实施例中,如步骤202所示的在电子设备处接收缩减的文本可以连续发生,并且随着缩减的文本的每个字符被输入,可以发生与在步骤204解析这样的缩减的文本相关联的处理以生成已解析文本元素。也就是说,即使在其中接收缩减的文本的步骤202的执行期间,步骤204-208中的一些或全部步骤仍可能发生,因为可以实时地评估和更新词和/或短语概率。同样,在步骤208仍然基于先前输入确定短语概率集合的同时,可以基于最近输入的缩减的文本的字符来在步骤204确定或更新词概率集合。
在步骤208确定短语概率集合之后,流程图200继续执行步骤210。在步骤210中,至少基于短语概率集合来在显示组件上提供短语中的至少一个短语。在一个实施例中,如图1所示,缩减的文本处理模块112可以提供(多个)预测的短语118以在显示组件104的用户界面106中显示为显示的文本108。在一个实施例中,可以在(多个)预测的短语118中提供与最高概率相关联的单个短语以显示为显示的文本108。在一个实施例中,这样的显示可以通过自动用短语代替缩减的文本114来进行。在另一实施例中,可以给用户选项以将最可能短语替换为缩减的文本114。备选地,可以在(多个)预测的短语118中提供多个短语(具有最高概率)以显示为显示的文本108,并且用户可以与用户界面106交互以选择一个短语来进行替换。
如上所述,在一个实施例中,流程图200的每个阶段可以由移动电子设备102的缩减的文本处理模块112执行。缩减的文本处理模块112可以按照各种方式被配置为执行这些功能。例如,图3示出了根据实施例的缩减的文本处理模块112的示例。图3的缩减的文本处理模块112包括文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308和词/短语库310。缩减的文本处理模块112被配置为接收缩减的文本312,并且向显示组件输出已解析文本元素320的指示,向显示组件输出一个或多个短语326,或这两者。缩减的文本处理模块112的以下描述开始于文本解析器302接受缩减的文本312。
缩减的文本处理模块112被配置为接收缩减的文本312(例如,根据图2的步骤202),并且将其转发给文本解析器302。如上所述,缩减的文本312是图1的缩减的文本114的示例,并且是由用户根据预定义缩减模式在用户界面处输入的文本的电子表示,其中缩减模式是一个规则,其规定在文本录入期间要输入短语中词的哪些字符。一个示例性的预定义缩减模式要求用户输入短语中的每个词的前两个字母。再次,如上所述,这样的缩减模式将导致用户为“Mary had a little lamb”输入“mahaa lila”,其中“mahaa lila”是缩减的文本312。
文本解析器302可以被配置为根据预定义缩减模式解析缩减的文本312(例如,根据图2的步骤204)以生成已解析文本314。在一个实施例中,已解析文本314对应于上面关于流程图200所述的已解析文本元素的序列。以“mary had a little lamb”为例,其中缩减的文本312的形式为“mahaa lila”,并且预定义缩减模式包括每个词的前两个字母,已解析文本314被生成为“Ma”、“ha”、“a”、“li”和“la”。在一个实施例中,在文本解析器302解析缩减的文本312以生成已解析文本314之后,关于如何将缩减的文本312解析为已解析文本314的信息可以用于以能够指示如何解析已解析文本314的方式在显示设备上显示缩减的文本312。如下面进一步详细描述的,这样的指示诸如通过使用颜色或者通过下划线、斜体或粗体强调来将每个已解析文本元素与任何相邻已解析文本元素区分开。在一个实施例中,已解析文本314由图3的词概率生成器304接收以确定关于已解析文本314的每个元素与特定词对应的可能性。
在一个实施例中,词概率生成器304被配置为确定词概率和词(例如,根据图2的步骤206),如图3所示。除了从文本解析器302接受已解析文本314,词概率生成器304还可以被配置为基于来自词/短语库310的已解析文本314来查找和接受词和词概率对。在一个实施例中,词/短语库310包含或提供用于各种类型的n元语法的n元语法概率统计。例如,词/短语库310可以包含或提供以字母“Ma”开头的词的概率统计。更具体地,或短语库310可以被配置为提供例如以字母“Ma”开头的前10个最常见的词、以及每个词的概率或频率统计。
在一个实施例中,词概率生成器304可以被配置为取回例如以每个元素的字母开头的10个最常见的词和已解析文本314。再次参考上述示例,在词概率生成器304从词/短语库310接收10个最常见的词“Ma”及其相应概率之后,词概率生成器304针对“ha”、“li”和“la”中的每个在词/短语库310中查询其相应概率的10个最常见的词(注意,已解析文本314的元素“a”是特例,因为“a”是不模糊的词,因此不需要概率性地确定)。也就是说,词概率生成器304的实施例被配置为确定可以映射到解析文本314的每个元素上的全文词、以及关于每个这样的映射是正确的相应概率。但是,应当理解,前面对词概率产生器304取回10个最常见的词/概率的描述仅仅是示例性的。在实施例中,词概率生成器304可以被配置为取回或接收大于或少于10个词/概率。在备选实施例中,词概率生成器304可以被配置为仅在这样的概率超过指定阈值的情况下接收或查询词及其相应概率。
在基于已解析文本314收集候选词及其相应概率之后,词概率生成器304被配置为将词概率316和词322提供给短语概率生成器306。基于词概率316和词322,短语概率生成器306被配置为生成短语324及其相应短语概率318(例如,根据图2的步骤208)。短语概率生成器306被配置为与词/短语库310交互,以通过评估在另一词322之后看到特定词322的可能性来确定短语324和短语概率318。在某些情况下,词是众所周知(例如,“a”),短语概率生成器可以通过反向通过词序列来确定短语324和短语概率318。也就是说,实施例可以评估在已知词322之前看到短语中的特定词322的可能性。如上所述,该确定可以基于词/短语库310中包含的n元语法知识、以及基于短语的语言模型,该模型可以基于从一个词到另一词的转换的可能性来查找词序列的可能匹配项。在确定短语324和短语概率318之后,短语概率生成器306被配置为将其传递给短语选择器308。
缩减的文本处理模块112的短语选择器308被配置为从短语324中选择一个或多个短语326以进行显示(例如,根据图2的步骤208)。如下面更详细描述的,短语选择器308可以被配置为选择单个短语324以输出到显示器。在一个实施例中,短语选择器308选择单个短语326以输出到显示器,短语326对应于在短语概率318中具有最高短语概率的短语324。在另一实施例中,短语选择器308可以被配置为从短语324中选择预定数目的短语,并且输出其作为短语326以进行显示。在一个实施例中,短语选择器308。在一个实施例中,被选择用于输出到显示器的多个短语326是在短语概率318中具有最高对应概率的短语324。在备选实施例中,被选择用于输出到显示器的多个短语326是在短语概率318中具有超过预定阈值的概率的短语324。
尽管词概率生成器304、短语概率生成器306和词/短语库310被描述为彼此分离,但是对于本领域技术人员而言很清楚的是,上述每个的操作可以全部或部分地合并到同一组件中。例如,在一些实施例中,词概率生成器304、短语概率生成器306和词/短语库310可以被组合到同一组件中,因为词概率生成器304的输出仅被提供给短语概率生成器306,并且词/短语库310为这些组件提供服务。基于前面的描述,其他结构实施例对于相关领域的技术人员将是很清楚的。
缩减的文本处理模块112可以按照各种方式操作以选择用于显示的(多个)短语326、以及分别由短语选择器308和文本解析器302输出的已解析文本元素320的指示。例如,在一个实施例中,短语选择器308可以根据流程图200的步骤210进行操作,并且可选地执行附加步骤。例如,在执行如图2所示的流程图200的方法步骤之后,实施例可以根据图4来执行。特别地,图4示出了提供用于在例如图1的显示组件104上显示附加信息的步骤的流程图400。流程图400描述如下。
在步骤402中,在显示组件上提供序列的已解析文本元素的指示。在一个实施例中,文本解析器302(图3)可以向用户界面106(图1)提供已解析文本302的已解析文本元素的指示以用于显示用户界面106中显示的缩减的文本114中的已解析文本元素的序列的指示。
例如,图5示出了根据实施例的显示组件104,该显示组件104示出了从缩减的文本录入504解析出的已解析文本元素的示例指示。在图5中,显示组件104显示用户界面106,该用户界面106包括文本录入框,在该文本录入框中,用户输入“Mahaa lila”作为缩减的文本504,缩减的文本504是所描述的“mary had a little lamb”示例的缩减的文本。在图4的步骤402处,如图5所示,显示缩减的文本504。但是,此外,包括缩减的文本504的已解析文本元素506A-506E(对应于“Ma”、“ha”、“a”、“li”和“la”)序列的每个元素都已经用用于突出显示每个已解析文本元素之间的边界的指示进行了修饰。在一个实施例中,文本解析器302向用户界面106提供已解析文本的指示,以使得能够为每个已解析文本元素进行不同显示。特别地,图5的元素506A-506E对应于上面刚表示的已解析文本元素。在一个实施例中,每个已解析文本元素以不同方式显示,例如,如图5所示,其中每个已解析文本元素都以不同字体特征依次渲染。也就是说,在一个实施例中,以粗体和带下划线的字体样式显示交替的已解析文本元素506A、506C和506E。中间元素506B和506D以斜体字体样式显示。以这样的方式渲染所接收的缩减的文本,以使得每个已解析文本元素对用户来说都是很清楚的,向用户提供了有用的反馈,该用户意识到活动的缩减模式,可以更轻松地注意到是否有错字输入并且可以采取校正措施。
注意,粗体、带下划线和斜体字体样式仅仅是以不同方式显示已解析文本元素的序列的每个的一种示例方式。可以单独或以任何组合使用任何其他方式,包括不同的颜色、灰度、字体大小、间距等,以便以区别方式指示已解析文本元素。
如上文中在流程图200的步骤210中所述,实施例可以在显示组件上提供与在流程图200的步骤208确定的短语概率集合相关联的至少一个短语。例如,图6示出了流程图600,流程图600提供了用于选择要显示的短语的步骤602。特别地,在步骤602中,在显示组件上提供具有短语概率集合中的最高概率的多个短语中的短语。在一个实施例中,短语选择器308被配置为在多个短语中选择被确定为具有短语概率集合中的最高概率的短语以在用户界面106中显示。
然而,与多个短语中最有可能短语相关联的概率可能并不总是足够充分地不同以使最高概率有意义地不同。或者,可能希望显示多个短语供用户选择。例如,图7示出了流程图700,流程图700包括步骤702,步骤702提供针对这种情况的备选实施例。具体地,在步骤702中,在电子设备的显示组件上提供与具有短语概率集合中的最高概率的短语对应的多个短语中的预定数目的短语。在一个实施例中,短语选择器308被配置为选择被确定为具有短语概率集合中的最高概率的多个短语以在用户界面106中显示。例如,在一个实施例中,具有最高概率的预定数目的短语可以被选择,或者所选择的数目可以基于概率阈值(即,仅选择短语概率超过某个阈值的短语)。在又一实施例中,预定数目可以由其他标准规定,诸如电子设备的显示组件上的可用屏幕区域(例如,可以选择诸如3等固定数目,因为只有3条显示线可用)。
III.示例计算机系统实现
移动电子设备102、文本输入模块110、缩减的文本处理模块112、文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308以及流程图200、400、600和700可以实现为硬件、或与软件和/或固件结合的硬件。例如,文本输入模块110、缩减的文本处理模块112、文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308和/或流程图200、400、600和/或700可以被实现为被配置为在一个或多个处理器中执行并且存储在计算机可读存储介质中的计算机程序代码/指令。备选地,文本输入模块110、缩减的文本处理模块112、文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308和/或流程图200、400、600和/或700可以被实现为硬件逻辑电路系统(例如,由晶体管、逻辑门、运算放大器、一个或多个专用集成电路(ASIC)、一个或多个现场可编程门阵列(FPGA)等组成的电路)。
例如,在一个实施例中,文本处理模块112、文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308和/或流程图200、400、600和/或700中的一个或多个(以任何组合)可以一起在SoC中实现。SoC可以包括集成电路芯片,该集成电路芯片包括处理器(例如,中央处理单元(CPU)、微控制器、微处理器、数字信号处理器(DSP)等)、存储器、一个或多个通信接口、和/或其他电路中的一种或多种,并且可以可选地执行所接收的程序代码和/或包括嵌入式固件以执行功能。
图8描绘了可以在其中实现实施例的计算设备800的示例性实现。例如,移动电子设备102可以在类似于固定或移动计算机实施例中的计算设备800的一个或多个计算设备中实现,包括计算设备800的一个或多个特征和/或替代特征。本文中提供的对计算设备800的描述是出于说明的目的而提供的,并且不意图是限制性的。如(多个)相关领域的技术人员已知的,实施例可以在其他类型的计算机系统中实现。
如图8所示,计算设备800包括一个或多个处理器(被称为处理器电路802)、系统存储器804、和将包括系统存储器804在内的各种系统组件耦合到处理器电路802的总线806。处理器电路802是在一个或多个物理硬件电路设备元件和/或集成电路设备(半导体材料芯片或管芯)中实现为中央处理单元(CPU)、微控制器、微处理器和/或其他物理硬件处理器电路的电和/或光电路。处理器电路802可以执行存储在计算机可读介质中的程序代码,诸如操作系统830、应用程序832、其他程序834等的程序代码。总线806表示使用各种总线架构中的任何一种的几种类型的总线结构中的任何一种或多种,包括存储器总线或存储器控制器、外围总线、加速图形端口、以及处理器或本地总线。系统存储器804包括只读存储器(ROM)808和随机存取存储器(RAM)810。基本输入/输出系统812(BIOS)存储在ROM808中。
计算设备800还具有以下驱动中的一种或多种:用于读取和写入硬盘的硬盘驱动814、用于读取或写入可移动磁盘818的磁盘驱动816、和用于读取或写入可移动光盘822(诸如CD ROM、DVD ROM或其他光学介质)的光盘驱动820。硬盘驱动814、磁盘驱动816和光盘驱动820分别通过硬盘驱动接口824、磁盘驱动接口826和光盘驱动接口828连接到总线806。驱动及其关联的计算机可读介质为计算机提供计算机可读指令、数据结构、程序模块和其他数据的非易失性存储。尽管描述了硬盘、可移动磁盘和可移动光盘,但是可以使用其他类型的基于硬件的计算机可读存储介质来存储数据,诸如闪存卡、数字视频磁盘、RAM、ROM和其他硬件存储介质。
多个程序模块可以存储在硬盘、磁盘、光盘、ROM或RAM上。这些程序包括操作系统830、一个或多个应用程序832、其他程序834和程序数据836。应用程序832或其他程序834可以包括例如用于实现以下各项的计算机程序逻辑(例如,计算机程序代码或指令):文本处理模块112、文本解析器302、词概率生成器304、短语概率生成器306、短语选择器308、和/或流程图200、400、600和/或700(包括流程图200、400、600和700的任何合适的步骤)、和/或本文中描述的其他实现。
用户可以通过诸如键盘838和指示设备840等输入设备将命令和信息输入到计算设备800中。其他输入设备(未示出)可以包括麦克风、操纵杆、游戏手柄、碟形卫星天线、扫描仪、触摸屏和/或触摸板、用于接收语音输入的语音识别系统、用于接收手势输入的手势识别系统等。这些和其他输入设备通常通过耦合到总线806的串行端口接口842连接到处理器电路802,但是可以通过诸如并行端口、游戏端口或通用串行总线(USB)等其他接口连接。
显示屏844也经由诸如视频适配器846等接口连接到总线806。显示屏844可以在计算设备800外部或并入计算设备800中。显示屏844可以显示信息,并且是用于接收用户命令和/或其他信息(例如,通过触摸、手指手势、虚拟键盘等)的用户界面。除了显示屏844,计算设备800还可以包括其他外围输出设备(未示出),诸如扬声器和打印机。
计算设备800通过适配器或网络接口850、调制解调器852、或用于通过网络建立通信的其他装置连接到网络848(例如,互联网)。如图8所示,可以是内部的或外部的调制解调器852可以经由串行端口接口842连接到总线806,如图8所示,或者可以使用包括并行接口在内的另一种接口类型连接到总线806。
如本文中使用的,术语“计算机程序介质”、“计算机可读介质”和“计算机可读存储介质”用于指代物理硬件介质,诸如与硬盘驱动814相关联的硬盘、可移动磁盘818、可移动光盘822、其他物理硬件介质,诸如RAM、ROM、闪存卡、数字视频磁盘、zip磁盘、MEM、基于纳米技术的存储设备、以及其他类型的物理/有形硬件存储介质。这样的计算机可读存储介质与通信介质区别并且不重叠(不包括通信介质)。通信介质在诸如载波等调制数据信号中体现计算机可读指令、数据结构、程序模块或其他数据。术语“调制数据信号”是指具有以能够将信息编码为信号的方式来设置或改变其一个或多个特征的信号。作为示例而非限制,通信介质包括无线介质(诸如声学、RF、红外和其他无线介质)以及有线介质。实施例还涉及这样的通信介质,其与涉及计算机可读存储介质的实施例分开并且不重叠。
如上所述,计算机程序和模块(包括应用程序832和其他程序834)可以存储在硬盘、磁盘、光盘、ROM、RAM或其他硬件存储介质上。这样的计算机程序也可以经由网络接口850、串行端口接口842或任何其他接口类型来接收。当由应用执行或加载时,这样的计算机程序使得计算设备800能够实现本文中描述的实施例的特征。因此,这样的计算机程序表示计算设备800的控制器。
实施例还涉及包括存储在任何计算机可读介质上的计算机代码或指令的计算机程序产品。这样的计算机程序产品包括硬盘驱动、光盘驱动、存储设备包、便携式存储棒、存储卡、以及其他类型的物理存储硬件。
IV.附加示例实施例
本文中描述了一种从缩减的输入文本录入产生文本短语的计算机实现的方法。该方法包括:在电子设备处接收缩减的文本;根据预定义缩减模式解析缩减的文本,以生成已解析文本元素的序列;通过针对序列的每个已解析文本元素确定对应词概率集合来确定与序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率;基于词概率集合来确定与多个短语对应的短语概率集合,短语概率集合中的每个短语概率是缩减的文本是短语中的相应短语的缩减的文本表示的概率;以及在电子设备的用户界面处提供短语中的至少一个短语。
在前述方法的一个实施例中,预定义缩减模式将每个已解析文本元素定义为包括对应词的预定数目的词首字母或对应词的预定数目的最终字母中的至少一项。
在前述方法的一个实施例中,预定义缩减模式还将每个已解析文本元素定义为包括对应词的第一元音或对应词的语调音节的元音。
前述方法的另一实施例还包括在电子设备的用户界面上提供序列的已解析文本元素的指示。
在前述方法的一个实施例中,序列的已解析文本元素的指示包括颜色编码方案的颜色。
在前述方法的另一实施例中,颜色编码方案向已解析文本元素分配颜色,每个已解析文本元素被分配与已解析文本元素与词对应的所确定的概率对应的颜色编码方案的颜色。
前述方法的另一实施例还包括在电子设备的用户界面上提供具有第二多个概率中的最高概率的多个短语中的单个短语。
前述方法的一个实施例还包括在电子设备的用户界面上提供与具有第二多个概率中的最高概率的短语对应的多个短语中的预定数目的短语。
本文中描述了一种移动电子设备。该移动电子设备包括:显示组件,能够至少显示文本字符;文本输入模块,接收由用户提供给移动电子设备的缩减的文本;以及缩减的文本处理模块,包括:文本解析器,被配置为根据预定义缩减模式解析缩减的文本,以生成已解析文本元素的序列;词概率生成器,被配置为通过针对序列的每个已解析文本元素确定对应词概率集合来确定与序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率;短语概率生成器,被配置为基于词概率集合来确定与多个短语对应的短语概率集合,短语概率集合中的每个短语概率是缩减的文本是短语中的相应短语的缩减的文本表示的概率;以及短语选择器,被配置为在显示组件上提供短语中的至少一个短语。
在前述移动电子设备的一个实施例中,预定义缩减模式将每个已解析文本元素定义为包括对应词的预定数目的词首字母或对应词的预定数目的最终字母中的至少一项。
在前述移动电子设备的一个实施例中,预定义缩减模式还将每个已解析文本元素定义为包括对应词的第一元音或对应词的语调音节的元音。
在前述移动电子设备的另一实施例中,文本解析器还被配置为向显示组件提供序列的已解析文本元素的指示。
在前述移动电子设备的一个实施例中,序列的已解析文本元素的指示包括颜色编码方案的颜色。
在前述移动电子设备的另一实施例中,颜色编码方案向已解析文本元素分配颜色,每个已解析文本元素被分配与已解析文本元素与词对应的所确定的概率对应的颜色编码方案的颜色。
在前述移动电子设备的另一实施例中,短语选择器被配置为向显示组件提供具有第二多个概率中的最高概率的多个短语中的单个短语。
在前述移动电子设备的另一实施例中,短语选择器被配置为向显示组件提供与具有第二多个概率中的最高概率的短语对应的多个短语中的预定数目的短语。
本文中描述了一种计算机程序产品,包括其上记录有计算机程序逻辑的计算机可读存储器设备,该计算机程序逻辑在由计算设备的至少一个处理器执行时引起至少一个处理器执行操作。这些操作包括:在电子设备处接收缩减的文本;与具有第二多个概率中的最高概率的短语对应的多个短语中的预定数目的短语;通过针对序列的每个已解析文本元素确定对应词概率集合来确定与序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率;基于词概率集合来确定与多个短语对应的短语概率集合,短语概率集合中的每个短语概率是缩减的文本是短语中的相应短语的缩减的文本表示的概率;以及在电子设备的用户界面处提供短语中的至少一个短语。
在前述计算机程序产品的一个实施例中,预定义缩减模式将每个已解析文本元素定义为包括对应词的预定数目的词首字母或对应词的预定数目的最终字母中的至少一项。
在前述计算机程序产品的另一实施例中,预定义缩减模式还将每个已解析文本元素定义为包括对应词的第一元音或对应词的语调音节的元音。
在前述计算机程序产品的一个实施例中,上述操作还包括在电子设备的用户界面上提供序列的已解析文本元素的指示。
V.结论
尽管上面已经描述了本发明的各种实施例,但是应当理解,它们仅以示例而非限制的方式给出。(多个)相关领域的技术人员将理解,在不脱离所附权利要求书中限定的本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。因此,本发明的广度和范围不应当由任何上述示例性实施例限制,而应当仅根据所附权利要求及其等同物来限定。

Claims (15)

1.一种从缩减的输入文本录入产生文本短语的计算机实现的方法,包括:
在电子设备处接收缩减的文本;
根据预定义缩减模式解析所述缩减的文本,以生成已解析文本元素的序列;
通过针对所述序列的每个已解析文本元素确定对应词概率集合来确定与所述序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率;
基于所述词概率集合来确定与多个短语对应的短语概率集合,所述短语概率集合中的每个短语概率是所述缩减的文本是所述短语中的相应短语的缩减的文本表示的概率;以及
在所述电子设备的用户界面处提供所述短语中的至少一个短语。
2.根据权利要求1所述的计算机实现的方法,其中所述预定义缩减模式将每个已解析文本元素定义为包括对应词的预定数目的词首字母或所述对应词的预定数目的最终字母中的至少一项。
3.根据权利要求2所述的计算机实现的方法,其中所述预定义缩减模式还将每个已解析文本元素定义为包括所述对应词的第一元音或所述对应词的语调音节的元音。
4.根据权利要求1所述的计算机实现的方法,还包括:
在所述电子设备的用户界面上提供所述序列的所述已解析文本元素的指示。
5.根据权利要求4所述的计算机实现的方法,其中所述序列的所述已解析文本元素的所述指示包括颜色编码方案的颜色。
6.根据权利要求5所述的计算机实现的方法,其中所述颜色编码方案向所述已解析文本元素分配颜色,每个已解析文本元素被分配与所述已解析文本元素与所述词对应的所确定的所述概率对应的所述颜色编码方案的颜色。
7.根据权利要求1所述的计算机实现的方法,还包括:
在所述电子设备的所述用户界面上提供具有第二多个概率中的最高概率的所述多个短语中的单个短语。
8.根据权利要求7所述的计算机实现的方法,还包括:
在所述电子设备的所述用户界面上提供与具有所述第二多个概率中的所述最高概率的所述短语对应的所述多个短语中的预定数目的短语。
9.一种移动电子设备,包括:
显示组件,能够至少显示文本字符;
文本输入模块,接收由用户提供给所述移动电子设备的缩减的文本;以及
缩减的文本处理模块,包括:
文本解析器,被配置为根据预定义缩减模式解析所述缩减的文本,以生成已解析文本元素的序列;
词概率生成器,被配置为通过针对所述序列的每个已解析文本元素确定对应词概率集合来确定与所述序列对应的词概率集合,词概率集合中的每个词概率是对应已解析文本元素是相应词的缩减的文本表示的概率;
短语概率生成器,被配置为基于所述词概率集合来确定与多个短语对应的短语概率集合,所述短语概率集合中的每个短语概率是所述缩减的文本是所述短语中的相应短语的缩减的文本表示的概率;以及
短语选择器,被配置为在所述显示组件上提供所述短语中的至少一个短语。
10.根据权利要求9所述的移动电子设备,其中所述预定义缩减模式将每个已解析文本元素定义为包括对应词的预定数目的词首字母或所述对应词的预定数目的最终字母中的至少一项。
11.根据权利要求10所述的移动电子设备,其中所述预定义缩减模式还将每个已解析文本元素定义为包括所述对应词的第一元音或所述对应词的语调音节的元音。
12.根据权利要求9所述的移动电子设备,其中所述文本解析器还被配置为向所述显示组件提供所述序列的所述已解析文本元素的指示。
13.根据权利要求12所述的移动电子设备,其中所述序列的所述已解析文本元素的所述指示包括颜色编码方案的颜色。
14.根据权利要求13所述的移动电子设备,其中所述颜色编码方案向所述已解析文本元素分配颜色,每个已解析文本元素被分配与所述已解析文本元素与所述词对应的所确定的所述概率对应的所述颜色编码方案的颜色。
15.一种其上记录有计算机程序逻辑的计算机可读介质,包括:
用于使处理器能够执行根据权利要求1至8中的任一项的计算机程序逻辑。
CN201980033957.7A 2018-05-22 2019-05-07 短语级缩写的文本录入和转换 Pending CN112154442A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/986,473 2018-05-22
US15/986,473 US10699074B2 (en) 2018-05-22 2018-05-22 Phrase-level abbreviated text entry and translation
PCT/US2019/030980 WO2019226316A1 (en) 2018-05-22 2019-05-07 Phrase-level abbreviated text entry and translation

Publications (1)

Publication Number Publication Date
CN112154442A true CN112154442A (zh) 2020-12-29

Family

ID=66554535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980033957.7A Pending CN112154442A (zh) 2018-05-22 2019-05-07 短语级缩写的文本录入和转换

Country Status (4)

Country Link
US (1) US10699074B2 (zh)
EP (1) EP3797366A1 (zh)
CN (1) CN112154442A (zh)
WO (1) WO2019226316A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10902738B2 (en) * 2017-08-03 2021-01-26 Microsoft Technology Licensing, Llc Neural models for key phrase detection and question generation
US10664658B2 (en) 2018-08-23 2020-05-26 Microsoft Technology Licensing, Llc Abbreviated handwritten entry translation
JP7315371B2 (ja) * 2019-05-07 2023-07-26 シャープ株式会社 表示制御装置、それを備えた画像形成装置および表示制御方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH077419B2 (ja) * 1989-06-30 1995-01-30 シャープ株式会社 機械翻訳装置における略称付き固有名詞処理方法
US6279018B1 (en) * 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
DE19910621C2 (de) * 1999-03-10 2001-01-25 Thomas Poetter Vorrichtung und Verfahren zum Verbergen von Informationen und Vorrichtung und Verfahren zum Extrahieren von Informationen
US7475343B1 (en) * 1999-05-11 2009-01-06 Mielenhausen Thomas C Data processing apparatus and method for converting words to abbreviations, converting abbreviations to words, and selecting abbreviations for insertion into text
DE10357475A1 (de) 2003-12-09 2005-07-07 Siemens Ag Kommunikationsvorrichtung und Verfahren zum Eingeben und Vorhersagen von Text
US20050267757A1 (en) * 2004-05-27 2005-12-01 Nokia Corporation Handling of acronyms and digits in a speech recognition and text-to-speech engine
US20070076862A1 (en) 2005-09-30 2007-04-05 Chatterjee Manjirnath A System and method for abbreviated text messaging
US7636703B2 (en) * 2006-05-02 2009-12-22 Exegy Incorporated Method and apparatus for approximate pattern matching
US20080294982A1 (en) * 2007-05-21 2008-11-27 Microsoft Corporation Providing relevant text auto-completions
GB0905457D0 (en) * 2009-03-30 2009-05-13 Touchtype Ltd System and method for inputting text into electronic devices
US8365059B2 (en) * 2009-11-03 2013-01-29 Oto Technologies, Llc E-reader semantic text manipulation
US20110184738A1 (en) * 2010-01-25 2011-07-28 Kalisky Dror Navigation and orientation tools for speech synthesis
US8914275B2 (en) * 2011-04-06 2014-12-16 Microsoft Corporation Text prediction
US20140039871A1 (en) * 2012-08-02 2014-02-06 Richard Henry Dana Crawford Synchronous Texts
KR20160029587A (ko) * 2014-09-05 2016-03-15 삼성전자주식회사 단위 또는 약어의 풀네임 음성출력 방법 및 장치
KR102325724B1 (ko) 2015-02-28 2021-11-15 삼성전자주식회사 다수의 기기에서 텍스트 데이터 동기화
US20160371250A1 (en) * 2015-06-16 2016-12-22 Microsoft Technology Licensing, Llc Text suggestion using a predictive grammar model
US10395177B2 (en) * 2015-12-10 2019-08-27 Microsoft Technology Licensing, Llc Optimized execution order correlation with production listing order
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10210147B2 (en) * 2016-09-07 2019-02-19 International Business Machines Corporation System and method to minimally reduce characters in character limiting scenarios
US10296659B2 (en) * 2016-09-26 2019-05-21 International Business Machines Corporation Search query intent
US11354503B2 (en) * 2017-07-27 2022-06-07 Samsung Electronics Co., Ltd. Method for automatically providing gesture-based auto-complete suggestions and electronic device thereof
US10489642B2 (en) * 2017-10-12 2019-11-26 Cisco Technology, Inc. Handwriting auto-complete function
US20190155916A1 (en) * 2017-11-22 2019-05-23 Facebook, Inc. Retrieving Content Objects Through Real-time Query-Post Association Analysis on Online Social Networks
US10664658B2 (en) 2018-08-23 2020-05-26 Microsoft Technology Licensing, Llc Abbreviated handwritten entry translation

Also Published As

Publication number Publication date
US20190361975A1 (en) 2019-11-28
US10699074B2 (en) 2020-06-30
EP3797366A1 (en) 2021-03-31
WO2019226316A1 (en) 2019-11-28

Similar Documents

Publication Publication Date Title
US10809914B2 (en) System and method for inputting text into electronic devices
US11416679B2 (en) System and method for inputting text into electronic devices
US10402493B2 (en) System and method for inputting text into electronic devices
US10073536B2 (en) Virtual keyboard input for international languages
US10664658B2 (en) Abbreviated handwritten entry translation
KR101522156B1 (ko) 텍스트 예측 방법 및 시스템
JP5362095B2 (ja) インプットメソッドエディタ
CA2547143C (en) Device incorporating improved text input mechanism
US9606634B2 (en) Device incorporating improved text input mechanism
US20150160855A1 (en) Multiple character input with a single selection
US8756499B1 (en) Gesture keyboard input of non-dictionary character strings using substitute scoring
CN112154442A (zh) 短语级缩写的文本录入和转换
US10417332B2 (en) Predicting text by combining attempts
Tantug A probabilistic mobile text entry system for agglutinative languages
US20200409474A1 (en) Acceptance of expected text suggestions
CN115145406A (zh) 文本输入方法、装置、计算机设备及存储介质
JP2004310349A (ja) 言語入力システム及び方法
KR20120072325A (ko) 문자를 예측하여 표시하기 위한 동적으로 생성된 키패드

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination