CN110998588A - 在保留含义的同时缩减文本长度 - Google Patents

在保留含义的同时缩减文本长度 Download PDF

Info

Publication number
CN110998588A
CN110998588A CN201880053621.2A CN201880053621A CN110998588A CN 110998588 A CN110998588 A CN 110998588A CN 201880053621 A CN201880053621 A CN 201880053621A CN 110998588 A CN110998588 A CN 110998588A
Authority
CN
China
Prior art keywords
text
length
desired length
electronic processor
version
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201880053621.2A
Other languages
English (en)
Inventor
G·Z·科塔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN110998588A publication Critical patent/CN110998588A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

用于缩减文本长度的方法和系统。一种系统包括电子处理器,其被配置为接收具有原始长度的文本,将该文本自动划分成多个分项,并且基于至少一个规则针对该文本自动选择变换集合。该电子处理器还被配置为自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度。响应于该替代长度等于或小于期望长度,该处理器被配置为输出具有等于或小于期望长度的替代长度的该文本的替代版本以便在用户界面内显示。

Description

在保留含义的同时缩减文本长度
技术领域
在本文中所描述的实施例涉及在不牺牲上下文或含义的情况下缩减文本长度,例如在用户界面的空间受限区域内显示的文本。
发明内容
软件应用通常通过一个或多个用户界面向用户显示文本。然而,用户界面可能是空间受限的从而用来显示文本的空间有限。例如,一些软件应用在单元格或网格内显示文本以用有序方式来呈现文本。类似地,诸如微软公司提供的
Figure BDA0002386254910000011
之类的生成演示的软件应用可能具有有限的区域来显示文本。当要在这样的空间受限区域内显示的文本不适配时,可以改变文本的大小或字体。然而,改变文本的大小或字体可能影响文本的可读性。可替代地或另外地,文本可以被截取或者用户界面可以要求用户滚动或者通过将扩展用户界面以查看整个文本。由此,在这些情况下,向用户显示的文本是不完整的或者难以理解的,这造成了低效并且可能导致人为错误。
因此,在本文中所提供的实施例提供了用于缩减文本长度的系统和方法等。特别地,所述方法和系统将文本修改为等于或小于期望的长度(在字符数量上),同时尽可能多地保留语义含义。所述方法和系统可以应用可配置的变换集合直到实现了期望的文本长度为止。与仅截取文本来实现期望的长度相比,该可配置的变换集合可以利用具有更少字符的替代文本来替换在文本中包括的一个或多个分项(term),从而在保留语义含义的同时缩减长度。在一些实施例中,该可配置的变换集合以预先确定的顺序被应用,其中,较不激进(aggressive)的变换在较激进的变换之前被应用。换句话说,用与原始文本紧密匹配的替代文本来替换原始文本的变换在用与原始文本区别较大的替代文本来替换原始文本的变换之前被应用。例如,用缩约(contraction)形式来替换短语的变换可以在用表情符号或缩写形式来替换分项的变换之前被应用,并且截取仅在所有变换都已经被应用时作为最终选项被执行。因此,以这种方式,可以尽可能多地保留语义含义。此外,该变换集合和变换的顺序可以是基于一种或多种规则而被自动选择的,从而更为智能地应用变换以尽可能多地保留语义含义。
例如,一个实施例提供了一种用于缩减文本长度的系统。所述系统包括电子处理器。所述电子处理器被配置为接收具有原始长度的文本,接收所述文本的期望长度,并且通过基于所述文本生成分项层级来将所述文本自动划分成多个分项。所述电子处理器还被配置为基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合。所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用。此外,所述电子处理器被配置为自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度。响应于所述替代长度等于或小于所述期望长度,所述电子处理器被配置为输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示。响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,所述电子处理器被配置为输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示
另一个实施例提供了一种用于缩减文本长度的方法。所述方法包括利用电子处理器来接收具有原始长度的文本以及所述文本的原始长度。所述方法还包括利用所述电子处理器,通过使用至少一个语法解析器基于所述文本生成分项层级来将所述文本自动划分成多个分项,以及基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合。所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用。所述方法还包括利用所述电子处理器自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度。所述方法还包括响应于所述替代长度等于或小于所述期望长度,利用所述电子处理器来输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示。所述方法还包括响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,利用所述电子处理器来输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示。
另一个实施例提供了一种包括指令的非瞬时计算机可读介质,所述指令能够由电子处理器执行以实行一组功能。所述一组功能包括:接收具有原始长度的文本,接收所述文本的期望长度,以及将所述文本自动划分成多个分项。所述一组功能还包括:基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合以及变换集合的顺序。所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用。所述一组功能还包括自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度。此外,所述一组功能包括响应于所述替代长度等于或小于所述期望长度,输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示。所述一组功能还包括:响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示。
附图说明
图1图示了包括在空间受限区域内显示的文本的用户界面。
图2示意性图示了根据一个实施例的用于输出文本的系统。
图3是图示了根据一个实施例的由图2的系统所执行的用于缩减文本长度的方法的流程图。
图4图示了根据一个实施例的作为图3的方法的一部分被选择的变换集合的一个示例。
图5图示了根据一个实施例的作为图3的方法的一部分向文本应用变换集合的一个示例。
具体实施方式
在以下描述和附图中描述并图示了一个或多个实施例。这些实施例不限于本文所提供的具体细节并且可以以各种方式进行修改。此外,可以存在本文没有描述的其他实施例。同样,在本文中被描述为由单个组件执行的功能可以以分布式方式由多个组件来执行。同样地,由多个组件执行的功能可以被联合并且由单个组件来执行。类似地,被描述为执行特定功能的组件也可以执行本文没有描述的另外的功能。例如,以某种方式“配置”的设备或结构是至少以该方式被配置的,但是也可以以没有列出的方式被配置。另外,本文所描述的一些实施例可以包括被配置为通过执行非瞬时计算机可读介质中存储的指令来实行所描述的功能的一个或多个电子处理器。类似地,本文所描述的实施例可以被实现为存储能够由一个或多个电子处理器所执行以实行所描述功能的指令的非瞬时计算机可读介质。如在本申请中所使用的,术语“非瞬时计算机可读介质”包括除瞬时、传播信号以外的所有计算机可读介质。因此,非瞬时计算机可读介质例如可以包括硬盘、CD-ROM、光学存储设备、磁存储设备、ROM(只读存储器)、RAM(随机访问存储器)、寄存器存储器、处理器高速缓存,或者它们的任何组合。
另外,本文所使用的短语和术语是用于描述的目的的,并且不应当被视为进行限制。例如,术语“包括”、“包含”、“含有”、“具有”及其变化形式的使用在本文意在涵盖随后所列出的项目及其等同形式以及另外的项目。术语“连接”和“耦合”被宽泛地使用并且涵盖了直接和间接的连接和耦合。另外,“连接”和“耦合”不限于物理或机械的连接或耦合,并且可以包括电器连接或耦合,无论是直接还是间接的。另外,电子通信和通知可以使用有线连接、无线连接、或者其组合来实行,并且可以在各种类型的网络、通信信道和连接上直接传送或者通过一个或多个中间设备来传送。此外,诸如第一和第二、顶部和底部等的关系术语在本文可以仅用于将一个实体或动作与另一个实体或动作进行区分,而不一定在这样的实体或动作之间要求或暗示任何实际的这样的关系或顺序。
如上文所描述的,在用户界面内显示的文本在该用户界面内可能并不适配,这影响用户阅读和理解文本的能力。例如,如在图1中所示,用户界面2包括诸如电子表格单元格的区域4,其显示文本5。区域4可能是空间受限的,这使得区域4的大小无法被改变(例如,因为区域4处于最大尺寸,因为改变大小将会影响用户界面2的格式,或者它们的组合)。因此,如在图1中所示,在区域4中显示的文本5可能由于该文本的长度超过区域4的大小而被截取。例如,假设文本5是“Christopher and Catherine went to the Department of MotorVehicles”。在这种情况下,如图1所示,在区域4中仅显示文本5的截取部分(“Christopherand Cather…”)。
由此,为了解决与在空间受限区域内输出文本相关联的这些和其他技术问题,本文所描述的系统和方法缩减文本的长度以适配在这样的空间受限区域之内,同时保留上下文和含义。特别地并且如下文更加详细描述的,瞬时系统和方法应用一种或多种变换以在并不牺牲语义含义的情况下缩减文本的长度,而不是仅截取文本以适配在区域内。
例如,图2示意性图示了用于输出文本的系统10。如图2所示,系统10包括用户设备14。应当理解的是,系统10作为示例被提供,并且在一些实施例中,系统10可以包括附加的组件。例如,系统10可以包括多个计算设备14、服务器、通信网络,等等。例如,系统10所执行的功能在本文被描述为在用户设备14处本地执行,文本在用户设备14处被输出给一个或多个用户。然而,在其他实施例中,该功能或者其一部分可以远离用户设备14被执行。例如,服务器(例如,云服务中包括的服务器)可以被配置为缩减通过用户设备14所输出的文本的长度。由此,在该情况下,用户设备14可以通过一个或多个通信网络(例如,诸如互联网之类的广域网,诸如蓝牙TM网络或Wi-Fi之类的局域网,等等)、通过一个或多个专用(有线或无线)连接或者它们的组合而(直接或者经由一个或多个中间设备)与一个或多个服务器进行通信以接收长度缩减的文本,并且在一些实施例中提供需要进行长度缩减的原始文本。
在一个实施例中,用户设备14是个人计算设备,例如台式计算机、膝上计算机、终端、智能电视、电子白板、平板计算机、智能电话、可穿戴设备等。如图2所示,用户设备14包括电子处理器20、存储器22、和人机接口(HMI)24。电子处理器20、存储器22、和HMI 24通过一个或多个通信线路或总线、以无线方式或者它们的组合进行通信。在一些实施例中,用户设备14包括图2所示那些组件以外的组件,并且用户设备14中包括的组件可以以各种配置来布置。例如,在一些实施例中,用户设备14还包括通信接口(收发机),其允许用户设备14通过如上文提到的通信网络与诸如一个或多个服务器之类的外部设备进行通信。用户设备14还可以执行在本申请中所描述功能以外的另外的功能。
电子处理器20可以包括微处理器、专用集成电路(ASIC)或另一合适的电子设备。电子处理器20被配置为从存储器22获取数据,并且执行与本文所描述的过程和方法相关的软件等。存储器22包括非瞬时性计算机可读存储介质。
HMI 24包括输入设备、输出设备、或者它们的组合。例如,HMI 24可以包括显示设备、触摸屏、键盘、小键盘、按钮、光标控制设备、打印机、扬声器、虚拟现实头戴式耳机、麦克风,等等。在一些实施例中,用户设备14包括多个HMI。例如,用户设备14可以包括触摸屏和小键盘。在一些实施例中,HMI 24被包括在与用户设备14相同的外壳中。然而,在其他实施例中,HMI 24可以处于用户设备14外部,但是可以通过有线或无线连接与用户设备14通信。例如,在一些实施例中,用户设备14包括经由线缆连接至用户设备14的显示设备。如下文更详细描述的,用户设备14中包括的一个或多个HMI 24可以从用户接收文本,并且可以输出具有缩减长度的所接收的文本的替代版本。
例如,如图2所示,用户设备14包括以能够由电子处理器20执行的格式存储在存储器22中的文本缩减应用26。文本缩减应用26(当由电子处理器20执行时)接收文本并且生成所接收的文本的替代版本,所述替代版本通过移除字符、将短语缩短为缩约形式、利用首字母缩写形式替代词语等而具有比所接收的文本更短的长度。在一些实施例中,在本文被描述为与文本缩减应用26执行的功能在电子处理器20所执行的多个应用之间进行分布。例如,在一些实施例中,在本文被描述为涉及文本长度缩减的某些方面(例如,具体变换)的功能可以通过与文本缩减应用26交互(作为插件)的单独变换应用来提供。
图3图示了系统10所执行的缩减文本长度的方法30。方法30在本文被描述为由用户设备14的电子处理器通过执行文本缩减应用26来实行。然而,如上文所述,在一些实施例中,方法30(或者其一部分)可以由一个或多个其他设备来实行,例如能够通过云服务访问的一个或多个服务器。
如在图3中所示,方法30包括利用电子处理器20接收具有原始长度的文本(在框31处)。电子处理器20可以通过HMI 24接收来自用户的文本,所述HMI 24例如触摸屏、麦克风(被翻译成文本的音频数据)、小键盘等。可替代地或另外地,电子处理器20可以从存储器22或者从在外部设备中所包括的存储器接收文本,所述外部设备例如是通过通信网络与用户设备14进行通信的服务器。
所述文本可以包括字母字符、数字、空格、符号、表情图标、标点符号等。所述文本的原始长度可以是字符的数量或者长度测量(例如,英寸、毫米等)。如在本申请中所使用的,字符的数量可以包括所接收的文本的包括字母字符、数字、图标、表情、标点符号、空格等在内的所有部分。电子处理器20可以与文本一同接收该文本的长度,作为单独用户输入、作为与该文本相关联的元数据等。可替代地或另外地,电子处理器20诸如可以通过对在文本中包括的字符数量进行计数来确定所接收的文本的长度。
如在图3中所示,方法30还可以包括利用电子处理器20接收所接收的文本的期望长度(在框32)。电子处理器20可以通过HMI 24从用户接收期望长度。例如,用户可以经由HMI 24提供原始文本预计该文本的期望长度。可替代地或另外地,电子处理器20可以基于用户界面内将显示该文本的区域来确定文本的期望长度。例如,当文本要在电子文档的特定单元格或字段内被显示时,电子处理器20可以确定在该单元格或字段内适配的文本长度,例如基于该单元格或字段的宽度、高度或此二者以及该文本的大小和字体。在其他实施例中,电子处理器20可以使用预先确定的默认长度作为期望的长度。再一次,该期望长度可以被指定为字符的数量或者长度测量,例如以英寸、厘米等为单位的长度。
所接收的文本包括多个分项。例如,在一个实施例中,电子处理器20被配置为将所接收的文本划分成多个分项。分项可以是段落、句子、词语、一个或多个字母等。因此,如本申请中所使用的,分项可以是所接收的文本的任何部分。作为一个示例,假设所接收的文本是“Christopher does not have an appointment.”。在该情况下,电子处理器20可以将该文本划分成离散的段落、句子、和词语。特别地,电子处理器20可以将该示例文本划分成一个段落、一个句子、和六个词语,并且可以将该划分的层级存储在存储器中,例如以下的示例层级。
Figure BDA0002386254910000081
电子处理器20可以使用一个或多个语法解析器以将文本划分成多个分项。所述语法解析器可以使用标点符号、句子结构、存储的语法规则等将文本划分成分项。在一些实施例中,电子处理器20使用针对文本语言唯一的语法解析器。例如,当文本是英语时,电子处理器20可以使用针对英语语言唯一的语法解析器以将文本划分成分项。类似地,当文本是西班牙语时,电子处理器20可以使用针对西班牙语语言唯一的语法解析器以将文本划分成分项。在一些实施例中,电子处理器20可以接收已经被划分成分项的文本,而不是将文本划分成分项。例如,电子处理器20最初可以接收作为多个分项的文本或者可以接收文本以及分项的单独层级两者。
如在图3中所示,方法30还包括针对文本选择变换集合(在框33处)。例如,如在图4中所示,文本缩减应用26可以被配置为应用来自可用变换的集合(变换A、B、C、D、E、F、G、H、I和J)的一种或多种变换以缩减文本的长度。在一些实施例中,可以以任何顺序或组合来应用任何数量的变换。例如,如在图4中所示,作为一个示例,仅变换C、F和J被应用,并且变换J被首先应用,变换F被第二个应用,而变换C被最后应用。
电子处理器20可以基于用户所选择的配置来选择变换集合。例如,在一些实施例中,电子处理器20可以被配置为显示可用变换的列表并且接收从该列表中选择变换集合的用户输入。该集合可以包括可用变换中的一个或全部。在一些实施例中,用户可以类似地能够选择该变换集合内的变换的顺序。如下文更详细描述的,用户所指定的顺序可以被电子处理器20使用以顺序地应用变换直到文本的长度被缩减为期望长度为止。
在一些实施例中,用户可以针对文本的不同类型或者其他条件来配置变换集合(和变换的顺序)。例如,当文本包括数字时,用户可以指定变换的第一集合(和顺序),并且当文本包括字母字符时,用户可以指定变换的第二集合。类似地,用户可以针对通过诸如文字处理应用之类的第一类型的应用所提供的文本来配置变换的第一集合(和顺序),并且可以针对通过诸如电子表单、数据库、或演示应用之类的第二类型的应用所提供的文本来配置变换的第二集合(和顺序)。因此,在这些情况下,电子处理器20可以被配置为从用户先前设置的多个配置中选择变换的可应用集合。由此,用户可以针对个体文本来选择变换集合,或者可以建立要应用于文本的一个或多个默认变换集合。
类似地,在一些实施例中,电子处理器20可以被配置为应用一种或多种规则以针对所接收的文本自动地选择变换集合或变换的顺序或者其组合。所述规则可以是基于以下项的:文本或其部分(文本中包括的一个或多个字符)、请求缩减的用户的标识符(标识个体用户或用户角色)、输出文本的软件应用、文本的原始长度、文本的期望长度、分项层级,或者它们的组合。由此,电子处理器20可以被配置为自动地选择(并排序)变换,而不是让用户配置变换的集合(和顺序)。例如,取决于原始长度和期望长度之间的差异,电子处理器20可以被配置为自动地选择较激进的变换或者较不激进的变换。一般而言,变换越激进,经变换的文本与原始文本(在长度、实质、或二者上)就相差越大。例如,如下文所描述的将短语“can not”替换为“can't”的变换可以被认为没有将短语“can not”替换为“not”的变换或者将短语“can not”替换为图标
Figure BDA0002386254910000101
的变换激进。类似地,当文本相比于字母字符包括许多数字时,则电子处理器可以被配置为自动选择适用于变换数字的变换。如上文提到的,电子处理器20可以被配置为使用类似的规则自动地选择的所选择的变换的顺序。例如,在一些实施例中,电子处理器20将变换从较不激进到较激进进行排序,以使得较不激进的变换在较激进的变换之前被应用。由此,以该方式,可以保留尽可能多的语义含义。在一些实施例中,电子处理器20可以被配置为在必要情况下向用户显示所选择的变换(以及这样的变换的顺序)以供批准或修改。
通过文本缩减应用26可用的变换可以以各种方式来缩减文本长度(而不是仅是无法保留语义含义的截取),并且在本文中提供了一些非限制性示例。例如,可用变换可以包括从多个分项中的一个或多个创建缩约形式的变换(缩约变换)。作为示例,当所接收的文本是如上文提供的“Christopher does not have an appointment.”时,电子处理器20可以应用缩约变换以用分项“doesn't”来替换分项“does”和“not”。电子处理器20可以使用查找表、规则、或数据库来查找合适的缩约形式并且用其来替换分项。
可用变换还可以包括从多个分项中的一个或多个创建首字母缩写形式的变换(首字母缩写变换)。例如,当所接收的文本为“The United States of America has aDepartment of Defense”时,电子处理器20可以应用首字母缩写变换以用首字母缩写形式“USA”来替换分项“United States of America”并且用首字母缩写形式“DoD”来替换分项“Department of Defense”。电子处理器20可以使用查找表、规则、或数据库来查找合适的首字母缩写形式并且利用其来替换分项。例如,电子处理器20可以通过识别专有名词或标题并且利用合适的首字母缩写形式替换这样的分项来自动生成首字母缩写形式。例如,当所接收的文本包括分项“the software engineering department”时,电子处理器20可以被配置为用分项“the SED”或者仅“SED”来替换该分项。
类似地,变换集合可以包括这样的变换,该变换识别具有多个大写字母的复合词并且基于大写字母来利用首字母缩写或缩写词来缩短该复合词(PascalCase变换)。例如,当所接收的文本为“The name for the module is TransformGeneratorModule”时,电子处理器20可以应用PascalCase变换以用分项“TGM”来替换分项“TransformGeneratorModule”。电子处理器20可以使用查找表、规则、或数据库来查找合适的首字母缩写或缩写词并且利用其来替换分项。
可用的变换还可以包括这样的变换,该变换消除诸如冠词之类的向文本添加较少语义价值的分项(丢弃分项变换)。例如,当所接收的文本为“The dog and the cat ranaround the yard.”时,电子处理器20应用丢弃分项变换以从该文本中消除冠词“the”。电子处理器20可以使用查找表、规则、或数据库等来查找并删除提供非显著语义含义的分项。
可用变换还可以包括这样的变换,该变换利用较短的版本或符号来替换诸如个体词语的分项(查找并替换变换)。例如,当所接收的文本为“January and February arecold months.”时,电子处理器20可以应用查找并替换变换以分别用“Jan”和“Feb”来替换“January”和“February”,并且用和字符(“&”)来替换分项“and”。作为另外的示例,电子处理器20可以应用查找并替换变换以用“apt”替换“appointment”,用“apt”替换“apartment”,用“w/o”替换“without”,等等。电子处理器20可以使用查找表、规则、或数据库等来针对分项辨识较短的版本和符号。
可用变换还可以包括用昵称来替换名字的变换(昵称变换)。例如,当所接收的文本为“Christopher does not have an appointment”时,电子处理器可以应用昵称变换以用“Chris”替换“Christopher”。电子处理器20可以使用查找表、规则、或数据库等来查找昵称并利用其来替换名字。
可用变换还可以包括用缩写词或速记版本来替换分项的变换(缩写变换)。在一些实施例中,缩写词包括在短消息服务(SMS)通信中普遍使用的缩写词。例如,当所接收的文本为“A straight road is before you.”时,电子处理器20可以应用缩写变换以分别用“str8”、“b4”和“u”来替换分项“straight”、“before”和“you”。电子处理器20可以使用查找表、规则、或数据库等来识别具有普遍认可的缩写或速记版本的分项。
可用变换还可以包括利用表情图标来替换分项的变换(表情图标变换)。例如,当所接收的文本为“Being outside makes me happy.”时,电子处理器20可以应用表情图标变换以用笑脸表情图标
Figure BDA0002386254910000111
来替代分项“happy”。在一些实施例中,电子处理器20还可以用一个或多个表情图标来替代多个分项。例如,当所接收的文本为“the man is happy”时,电子处理器20可以用表示“男人”的表情图标
Figure BDA0002386254910000121
表示“is”或关系的表情图标(“→”)、以及表示“happy”的表情图标
Figure BDA0002386254910000122
来替换整个文本。因此,在该示例中,用表情图标串
Figure BDA0002386254910000123
来替换文本“the man is happy”。电子处理器20可以使用查找表、规则、或数据库等来识别表情图标并且利用其替换分项。
可用的变换还可以包括识别列表并且用缩短的版本来替换在该列表中所包括的元素的变换(列表缩减变换)。例如,当所接收的文本为“Get eggs,milk,butter,andcheese from the store.”时,电子处理器20可以应用列表缩减变换以用缩短的列表“e,m,b,c”来替换列表“eggs,milk,butter,and cheese”。可替代地或另外地,电子处理器20可以通过将预定数量的元素以外的全部内容都替换为分项“etc.”、“et al.”等来缩短该列表。例如,使用以上的示例文本,电子处理器20可以用列表“eggs,milk,etc.”来替换列表“eggs,milk,butter,and cheese”。类似地,在一些实施例中,电子处理器20可以通过用通用项替换列表或者其部分来缩短列表。例如,使用以上示例,电子处理器20可以用“groceries”或“food”来替换“eggs,milk,butter,and cheese”。电子处理器20可以使用查找表、规则、或数据库等来识别并缩短列表。例如,电子处理器20可以通过查找标点符号(逗号、分号等)、连接词(“and”、“or”或“nor”)等来识别列表。
可用的变换还可以包括去除额外空格的变换(空格变换)。例如,当所接收的文本包括句子“The cat was happy.The dog was also happy.”时,电子处理器20可以被配置为用一个空格或零个空格来替换所述句子之间的双重空格。类似地,在一些实施例中,电子处理器20可以在另一个变换去除或替换原始文本中的分项时应用空格变换。例如,当原始文本是“The dog and the cat lived in the house.”并且电子处理器20从该文本中移除了“the”时,由该移除所生成的文本的替代版本可以包括额外的空格(被移除的分项之前或之后的空格)。由此,电子处理器20可以被配置为识别文本中的多个空格并且移除空格以将空格数量减少至一个或零个。
由此,使用诸如上文所描述的一种或多种变换,可以以各种方式来缩减文本的长度。特别地,每个变换在文本中所包括的一个或多个分项满足与该变换相关联的条件时修改所接收的文本。例如,缩约变换在文本的分项包括具有可用缩约形式的词语时用缩约形式来替换多个词语。类似地,昵称变换在文本的分项包括专有名词时用昵称替换专有名词。由此,变换在各种条件被满足时提供各种类型的修改。
同样,配置所应用的变换集合以及应用变换的顺序两者的能力允许文本缩减针对特定用户、特定文本等而被定制。例如,当文本在正式商务会面期间被显示时,将全名变换为昵称或者用表情图标替换分项可能无法被观众很好地理解或者可能引起混淆。类似地,仅用单个字母表示来替换分项列表而不是截取会被用作缩短文本的最终手段,这是因为所述字母表示可能无法被观众完全理解。例如,当长文本需要在小空间中适配时,与将文本缩减数个字符相比更为剧烈的变换可以是可接受的。在一些实施例中,用户还可以配置个体变换,例如通过消除特定缩约形式、缩写词、昵称等以进一步定制长度缩减。因此,可配置变换可以适合于用户需求和偏好。实际上,在一些实施例中,电子处理器20(或者单独的应用或设备)可以被配置为使用机器学习来学习什么类型的变换应当用于特定用户、特定类型的文本、特定缩减等。特别地,电子处理器20可以跟踪用户所进行(或者在被电子处理器20应用之后由用户移除)的长度缩减来学习用户偏好。
如在图3中所示,在变换集合被选择(在框33处)之后,电子处理器20将该集合中包括的每个变换顺序地(以变换集合所定义的次序)应用于满足每个变换的条件的多个分项中的每个分项,从而生成具有替代长度的文本的替代版本(在框34处)。电子处理器20在该替代长度大于期望长度时继续该过程(在框35处)。然而,响应于该替代长度等于或小于期望长度(在框35处),电子处理器20输出该文本最新的替代版本(在框37处),其如上文所描述的可以由用户设备14在用户界面内被显示。可替换地,如在图3中所示,响应于替代长度大于期望长度(在框35处)并且所选择的变换集合中的每个变换都已经被应用(在框38处),电子处理器20输出具有期望长度的文本的经截取的版本(在框39处)。在一些实施例中,该文本的经截取的版本包括被截取为期望长度的原始文本。在其他实施例中,当该文本的替代版本基于一种或多种变换被生成的时,由电子处理器所输出的该文本的经截取的版本包括被截取为期望长度的该文本的最新的替代版本。
由此,如在图3中所示,电子处理器20顺序地应用第一变换、第二变换、第三变换等,直到实现了期望长度或者所有变换都已经被应用为止。例如,取决于所接收的文本,电子处理器20可以取决于在文本中所包括的任何分项是否满足与变换相关联的条件而将每个变换应用于零个或更多个分项。
在一些实施例中,电子处理器20在多个分项所定义的层级内以深度优先方式应用变换。由此,在该配置中,电子处理器20可以最初处理词语,接着是短语,随后是句子,并且随后是段落。同样,相比于朝向所接收的文本末尾定位的分项,电子处理器20可以以朝向所接收的文本前方定位的分项作为开始。
在输出长度缩减的文本时,电子处理器20可以在用户界面内输出文本并且可以向用户指示文本长度已经被缩减。例如,电子处理器20可以以预先确定的颜色、字体、样式、动画等来显示文本,或者可以显示通知用户文本长度已经被缩减的图标或其他标记。电子处理器20还可以(在用户界面内)提供一种选择机制,其允许用户查看原始文本(所述原始文本在长度缩减过程期间被电子处理器20保留在存储器中)。电子处理器20可以例如在弹出窗口内替代长度缩减文本或者附加于长度缩减文本来显示原始文本。因此,基于通过用户界面所接收的输入,电子处理器20可以查看原始文本和长度缩减的文本两者,并且根据需要可选地在两者者之间进行切换。然而,如上文关于图3所描述的,由于文本的长度被缩减的同时保留了上下文和含义,所以用户仍然能够通过所显示的文本版本快速地阅读并理解该文本。
图5图示了应用如上文关于图3所描述的变换的一个示例。在该示例中,原始文本50是“Christopher and Catherine went to the Department of Motor Vehicles.”,其具有六十七个字符的原始长度并且期望长度是二十个字符。同样,在该示例中,所选择的变换集合(按顺序)包括如上文所描述的昵称变换51、首字母缩写变换52、查找并替换变换53、丢弃分项变换54、和列表缩减变换55。
如在图5中所示,昵称变换51作为第一变换被应用于原始文本50。电子处理器20使用该昵称变换将原始文本50缩减为文本的替代版本56a“Chris and Catherine went tothe Department of Motor Vehicles.”以及文本的替代版本56b“Chris and Cathy wentto the Department of Motor Vehicles.”。由此,在该示例中,昵称变换51被应用了两次,这是因为原始文本50中包括的两个分项满足与昵称变换51相关联的条件(两个分项表示具有可用昵称的名字)。
替代文本56a将原始文本的长度缩减为六十一个字符,而替代文本56b将原始文本的长度缩减为五十七个字符。由于这两个长度都大于期望长度,所以电子处理器20行进至下一个变换。应当理解的是,电子处理器20可以被配置为每次生成文本的替代版本时(在对原始文本的每次修改之后)将所接收的文本的替代长度与期望长度进行比较。然而,在其他实施例中,电子处理器20可以被配置为在电子处理器20完成对变换的应用之后比较文本的替代长度。
在一些实施例中,电子处理器20将每个替代文本(例如,替代文本56a和56b)存储在诸如存储器22之类的存储器中。存储在缩减过程期间生成的替代文本允许电子处理器20(或者访问存储的替代文本的另一设备)在特定文本的期望长度改变时使用存储的替代文本。例如,当用户修改单元格或字段大小但是没有修改在该单元格或字段中包括的文本时,电子处理器20可以访问该文本的存储的替代版本而不是从原始文本开始执行上文描述的缩减方法。特别地,当期望长度增加时,电子处理器20可以访问具有等于或小于增加后的期望长度的最大长度的存储的替代文本。类似地,当期望长度减小时,电子处理器20可以访问具有最小长度的存储的替代文本并且使用该文本作为缩减过程的起始文本。
返回图5,在第一变换被应用之后,电子处理器20应用首字母缩写变换52作为第二变换。如在图5中所示,该变换生成替代文本57“Chris and Cathy went to the DoMV.”。替代文本57的长度是三十三个字符。由于替代文本57的长度大于期望长度,所以电子处理器20应用查找并替换变换作为第三变换。
如图5所示,查找并替换变换生成替代文本58“Chris&Cathy went to theDoMV.”。替代文本58的长度是三十一个字符。由于替代文本58的长度大于期望长度,所以电子处理器20应用丢弃分项变换作为第四变换。丢弃分项变换生成替代文本59“Chris&Cathywent to DoMV.”。替代文本59的长度是二十七个字符,其大于期望长度。因此,电子处理器20应用列表缩减变换作为第五变换以生成替代文本60“C&C went to DoMV.”(通过辨识出“Chris&Cathy”为列表)。替代文本60的长度是十七个字符。由此,该长度小于期望长度(二十个字符),并且电子处理器20输出替代文本60以便在用户界面内显示。
因此,在本文中所描述的实施例提供了用于在不牺牲上下文或含义的情况下缩减文本长度的方法和系统,所述文本诸如在用户界面的空间受限区域内显示的文本。如上文提到的,本文所描述的长度缩减功能可以由用户计算机在本地执行,由服务器在远程执行,或者是其组合。同样,如上文所描述的,经长度缩减的文本可以经由通过显示设备、触摸屏、虚拟现实头戴式耳机、或类似电子设备所显示的用户界面而被输出,并且本文所描述的长度缩减功能可以在文本被最初显示之前或之后被应用。例如,在一些实施例中,显示文本的用户界面可以包括允许用户开启和关闭长度缩减的选择机制(例如,按钮或菜单选项)。此外,应当理解的是,本文所描述的长度缩减功能可以用于缩减要通过打印机输出、在通信网络上传输等的文本的长度。另外,本文所描述的长度缩减功能可以用于将数据转换为不同格式或类型,用于压缩数据,或者用于执行具有数据约束或大小要求的其他活动。
在以下权利要求中阐述了一些实施例的各种特征和优点。

Claims (15)

1.一种用于缩减文本长度的方法,所述方法包括:
利用电子处理器来接收具有原始长度的文本;
利用所述电子处理器来接收所述文本的期望长度;
利用所述电子处理器,通过使用至少一个语法解析器基于所述文本生成分项层级来将所述文本自动划分成多个分项;
利用所述电子处理器,基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合,所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用;
利用所述电子处理器自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度;
响应于所述替代长度等于或小于所述期望长度,利用所述电子处理器来输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示;以及
响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,利用所述电子处理器来输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示。
2.根据权利要求1所述的方法,其中,接收所述期望长度包括基于所述用户界面来自动确定所述期望长度。
3.根据权利要求1所述的方法,还包括自动选择所述变换集合的顺序,所述顺序定义了对所述变换集合的应用的顺序,并且所述顺序是从最不激进到较激进。
4.一种用于缩减文本长度的系统,所述系统包括:
电子处理器,其被配置为:
接收具有原始长度的文本;
接收所述文本的期望长度;
通过基于所述文本生成分项层级来将所述文本自动划分成多个分项;
基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合,所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用;
自动地将在所述变换集合中包括的每个变换顺序地应用至在所述分项层级中包括的所述多个分项中满足与每个变换相关联的条件的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度;
响应于所述替代长度等于或小于所述期望长度,输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示;以及
响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示。
5.根据权利要求4所述的系统,其中,所述电子处理器被配置为基于所述分项层级以深度优先的方式将在所述变换集合中包括的每个变换顺序地应用至所述多个分项。
6.根据权利要求4所述的系统,其中,所述电子处理器还被配置为自动选择所述变换集合的顺序,所述顺序定义了对所述变换集合的应用的顺序,其中,所述变换集合的所述顺序是从最不激进到较激进的。
7.根据权利要求6所述的系统,其中,所述电子处理器被配置为基于从由以下项组成的群组中选择的至少一项来自动选择所述变换集合的所述顺序:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用。
8.根据权利要求4所述的系统,其中,所述电子处理器还被配置为:
将所述文本的每个替代版本存储在存储器中,
接收所述文本的经更新的期望长度,
基于所述经更新的期望长度来获取在所述存储器中存储的所述文本的替代版本,以及
基于从所述存储器获取的所述文本的所述替代版本来输出具有所述经更新的期望长度的所述文本的替代版本。
9.一种包括指令的计算机可读介质,所述指令能够由电子处理器执行以实行一组功能,所述一组功能包括:
接收具有原始长度的文本;
接收所述文本的期望长度;
将所述文本自动划分成多个分项;
基于至少一个规则来针对所述文本从多个可用变换中自动选择变换集合以及所述变换集合的顺序,所述至少一个规则与从由以下项组成的群组中选择的至少一项相关联:用户的标识符、所述文本、所述分项层级、所述原始长度、所述期望长度、和输出所述文本的软件应用;
自动地将在所述变换集合中包括的每个变换顺序地应用至满足与每个变换相关联的条件的多个分项中的每个分项,以生成具有小于所述原始长度的替代长度的所述文本的替代版本,而所述替代长度大于所述期望长度;
响应于所述替代长度等于或小于所述期望长度,输出具有等于或小于所述期望长度的所述替代长度的所述文本的所述替代版本,以便在用户界面内显示;以及
响应于所述替代长度在对所述变换集合中包括的每个变换的应用之后大于所述期望长度,输出被截取至所述期望长度的所述文本的版本以便在所述用户界面内显示。
10.根据权利要求9所述的计算机可读介质,其中,所述一组功能还包括:
将所述文本的每个替代版本存储在存储器中;
接收所述文本的经更新的期望长度;
基于所述经更新的期望长度来获取在所述存储器中存储的所述文本的替代版本;以及
基于从所述存储器获取的所述文本的所述替代版本来输出具有所述经更新的期望长度的所述文本的替代版本。
11.根据权利要求10所述的计算机可读介质,其中,基于从所述存储器获取的所述文本的所述替代版本来输出具有所述经更新的期望长度的所述文本的所述替代版本包括:当所述经更新的期望长度大于所述期望长度时输出从所述存储器获取的所述文本的所述替代版本。
12.根据权利要求10所述的计算机可读介质,其中,基于从所述存储器获取的所述文本的所述替代版本来输出具有所述经更新的期望长度的所述文本的所述替代版本包括:当所述经更新的期望长度小于所述期望长度时,将在所述变换集合中包括的至少一个变换应用至所述多个分项中满足与在从所述存储器获取的所述文本的所述替代版本中包括的至少一个变换相关联的条件的每个分项。
13.根据权利要求10所述的计算机可读介质,其中,输出被截取为所述期望长度的所述文本的所述版本包括从由以下项组成的群组中选择的至少一项:输出所接收的被截取为所述期望长度的所述文本,以及输出被截取为所述期望长度的具有最短长度的所述文本的替代版本。
14.根据权利要求10所述的计算机可读介质,其中,所述期望长度在从由字符数量和长度测量所组成的群组中选择的至少一项中被指定。
15.根据权利要求10所述的计算机可读介质,其中,所述一组功能还包括:响应于与被输出以便在所述用户界面内显示的所述文本的所述替代版本相关联的用户输入而输出所接收的所述文本的至少一部分。
CN201880053621.2A 2017-08-22 2018-06-05 在保留含义的同时缩减文本长度 Withdrawn CN110998588A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/682,899 US20190065446A1 (en) 2017-08-22 2017-08-22 Reducing text length while preserving meaning
US15/682,899 2017-08-22
PCT/US2018/035931 WO2019040147A1 (en) 2017-08-22 2018-06-05 REDUCING THE LENGTH OF TEXT WHILE PRESERVING THE MEANING

Publications (1)

Publication Number Publication Date
CN110998588A true CN110998588A (zh) 2020-04-10

Family

ID=62779015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880053621.2A Withdrawn CN110998588A (zh) 2017-08-22 2018-06-05 在保留含义的同时缩减文本长度

Country Status (3)

Country Link
US (1) US20190065446A1 (zh)
CN (1) CN110998588A (zh)
WO (1) WO2019040147A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419720A (zh) * 2021-07-06 2021-09-21 北京理工大学 一种面向源代码的缩写词扩展必要性自动判定方法
CN115664739A (zh) * 2022-10-17 2023-01-31 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7243106B2 (ja) * 2018-09-27 2023-03-22 富士通株式会社 修正候補提示方法、修正候補提示プログラムおよび情報処理装置
CN112989231B (zh) * 2019-12-02 2024-08-09 北京搜狗科技发展有限公司 一种信息展示方法、装置和电子设备
CN112528674B (zh) * 2020-12-14 2023-06-30 网易(杭州)网络有限公司 文本处理方法、模型的训练方法、装置、设备及存储介质
US11593548B2 (en) 2021-04-20 2023-02-28 Snap Inc. Client device processing received emoji-first messages
US11531406B2 (en) 2021-04-20 2022-12-20 Snap Inc. Personalized emoji dictionary
US11888797B2 (en) * 2021-04-20 2024-01-30 Snap Inc. Emoji-first messaging

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5691708A (en) * 1995-08-14 1997-11-25 Lotus Development Corporation Text abstraction method and apparatus
US7069207B2 (en) * 2001-01-26 2006-06-27 Microsoft Corporation Linguistically intelligent text compression
US7602379B2 (en) * 2001-06-19 2009-10-13 Hewlett-Packard Development Company, L.P. Digital annotator
US7503001B1 (en) * 2002-10-28 2009-03-10 At&T Mobility Ii Llc Text abbreviation methods and apparatus and systems using same
US7315902B2 (en) * 2002-12-19 2008-01-01 International Business Machines Corporation Compression and abbreviation for fixed length messaging
US7698269B2 (en) * 2005-11-29 2010-04-13 Yahoo! Inc. URL shortening and authentication with reverse hash lookup
DE102008010419A1 (de) * 2007-05-03 2008-11-13 Navigon Ag Vorrichtung und Verfahren zur Erstellung eines Textobjekts
US8001482B2 (en) * 2007-12-21 2011-08-16 International Business Machines Corporation Method of displaying tab titles
US8717305B2 (en) * 2008-03-04 2014-05-06 Apple Inc. Touch event model for web pages
US8620641B2 (en) * 2008-05-16 2013-12-31 Blackberry Limited Intelligent elision
US20100145676A1 (en) * 2008-12-09 2010-06-10 Qualcomm Incorporated Method and apparatus for adjusting the length of text strings to fit display sizes
US8996995B2 (en) * 2009-02-25 2015-03-31 Nokia Corporation Method and apparatus for phrase replacement
US20110016389A1 (en) * 2009-07-15 2011-01-20 Freedom Scientific, Inc. Bi-directional text contraction and expansion
US8365059B2 (en) * 2009-11-03 2013-01-29 Oto Technologies, Llc E-reader semantic text manipulation
JP5409896B2 (ja) * 2010-03-23 2014-02-05 シャープ株式会社 情報表示装置及び文書データ編集方法
US8281232B2 (en) * 2010-04-22 2012-10-02 Rockmelt, Inc. Integrated adaptive URL-shortening functionality
TWI413922B (zh) * 2010-04-23 2013-11-01 Primax Electronics Ltd 觸控板之控制方法與應用該方法之觸控裝置
US8749499B2 (en) * 2010-06-08 2014-06-10 Sap Ag Touch screen for bridging multi and/or single touch points to applications
US20110313756A1 (en) * 2010-06-21 2011-12-22 Connor Robert A Text sizer (TM)
WO2012024442A2 (en) * 2010-08-17 2012-02-23 Google Inc. Touch-based gesture detection for a touch-sensitive device
CN105955617B (zh) * 2011-06-03 2019-07-12 谷歌有限责任公司 用于选择文本的手势
US8812737B2 (en) * 2011-09-19 2014-08-19 Google Inc. Context-specific unicode characters in shortened URLs
US20130104038A1 (en) * 2011-10-19 2013-04-25 TinyURL, LLC Method for automatic url shortening
US9311286B2 (en) * 2012-01-25 2016-04-12 International Business Machines Corporation Intelligent automatic expansion/contraction of abbreviations in text-based electronic communications
US9766797B2 (en) * 2012-09-13 2017-09-19 International Business Machines Corporation Shortening URLs using touchscreen gestures
GB2509889A (en) * 2012-10-15 2014-07-23 Kieran Hayes Compressing text for software input
JP5998964B2 (ja) * 2013-01-31 2016-09-28 カシオ計算機株式会社 辞書情報表示装置、辞書情報表示方法、辞書情報表示プログラム、辞書情報表示システム、およびそのサーバ装置、端末装置
US8782550B1 (en) * 2013-02-28 2014-07-15 Google Inc. Character string replacement
US20150277744A1 (en) * 2014-03-27 2015-10-01 Motorola Mobility Llc Gesture Text Selection
US9922015B2 (en) * 2014-10-09 2018-03-20 International Business Machines Corporation System for handling abbreviation related text using profiles of the sender and the recipient
US10210147B2 (en) * 2016-09-07 2019-02-19 International Business Machines Corporation System and method to minimally reduce characters in character limiting scenarios

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419720A (zh) * 2021-07-06 2021-09-21 北京理工大学 一种面向源代码的缩写词扩展必要性自动判定方法
CN113419720B (zh) * 2021-07-06 2022-01-07 北京理工大学 一种面向源代码的缩写词扩展必要性自动判定方法
CN115664739A (zh) * 2022-10-17 2023-01-31 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统
CN115664739B (zh) * 2022-10-17 2024-05-07 山东大学 基于流量特征匹配的用户身份属性主动检测方法及系统

Also Published As

Publication number Publication date
US20190065446A1 (en) 2019-02-28
WO2019040147A1 (en) 2019-02-28

Similar Documents

Publication Publication Date Title
CN110998588A (zh) 在保留含义的同时缩减文本长度
EP2795441B1 (en) Systems and methods for identifying and suggesting emoticons
CN105814519B (zh) 将图像或标签输入到电子设备的系统和方法
JP6033326B2 (ja) コンテンツベースの自動的な入力プロトコルの選択
US10565520B2 (en) Feature extraction for machine learning
EP2648072A2 (en) Character or word input method, input apparatus and terminal
US20150169537A1 (en) Using statistical language models to improve text input
CN105138586A (zh) 一种文件查找方法及装置
US20190155884A1 (en) Dynamic Digital Document Visual Aids in a Digital Medium Environment
CN112559672B (zh) 信息检测方法、电子设备及计算机存储介质
JP4891438B2 (ja) キーパッドテキスト入力の多義性解消
US9557818B2 (en) Contextually-specific automatic separators
CN110785762B (zh) 用于编写电子消息的系统和方法
EP1679614A2 (en) Method and apparatus for providing foreign language text display when encoding is not available
JP6031764B2 (ja) 文字入力用のプログラムおよび情報処理装置ならびに文字入力動作の設定方法
US20180018315A1 (en) Information processing device, program, and information processing method
JP2022017173A (ja) 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
US11899904B2 (en) Text input system with correction facility
JP5674140B2 (ja) テキスト入力装置、テキスト入力受付方法及びプログラム
KR20130016867A (ko) 민감한 단어를 표시할 수 있는 사용자 단말,및 사용자 단말의 민감한 단어 표시 방법
JP5262249B2 (ja) 情報処理装置
JP2010244402A (ja) 電子書籍表示装置、電子書籍表示方法および電子書籍表示プログラム
JP2007164278A (ja) 日本語処理装置、日本語処理方法及び日本語処理用プログラム
JP2014235511A (ja) 情報処理装置、制御方法、及びコンピュータプログラム
CN104699263A (zh) 获取符号串的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200410

WW01 Invention patent application withdrawn after publication