CN105637507A - 文本跨度的智能选择 - Google Patents

文本跨度的智能选择 Download PDF

Info

Publication number
CN105637507A
CN105637507A CN201480055252.2A CN201480055252A CN105637507A CN 105637507 A CN105637507 A CN 105637507A CN 201480055252 A CN201480055252 A CN 201480055252A CN 105637507 A CN105637507 A CN 105637507A
Authority
CN
China
Prior art keywords
word
candidate
text span
user
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480055252.2A
Other languages
English (en)
Other versions
CN105637507B (zh
Inventor
P·潘特尔
M·盖蒙
A·D·富克斯曼
B·科尔迈尔
P·基拉卡马里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN105637507A publication Critical patent/CN105637507A/zh
Application granted granted Critical
Publication of CN105637507B publication Critical patent/CN105637507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度。文档和指示文档中特定位置的位置指针被接收并且被输入到不同的候选文本跨度生成方法。从不同的候选文本跨度生成方法中的每一个接收关于一个或多个记分候选文本跨度的排名列表。机器学习总体模型用于对从不同的候选文本跨度生成方法中的每一个接收到的每个记分候选文本跨度进行重新记分。所述总体模型是利用机器学习方法和来自真实意图用户文本跨度选择数据集的特征来训练的。从所述总体模型接收重新记分候选文本跨度排名列表。

Description

文本跨度的智能选择
背景技术
在当今的生产力环境中,用户在各应用中消费或著作各种内容的同时不断地研究话题,其中这些应用可以包括诸如电子阅读器等阅读器应用以及诸如文本处理器、电子表单、演示程序和社交网络等生产力应用。用户通常使用万维网(下文简称为Web)来研究话题。例如,用户可以在当前对他们显示的文档内选择文本跨度,并且随后可以针对选定的文本跨度搜索Web。
由于诸如经济全球化和正在进行中的计算、数据通信和计算机网络技术方面的进步的因素,全球范围的用户正在变得越来越移动化。现在各种类型的移动计算设备可通过商业方式获得,其允许用户普遍且方便地在移动的同时执行完全独立的计算与数据通信活动。智能手机和平板式计算机是此种移动计算设备的两个示例。移动计算设备的普及度持续快速增长,可获得的移动计算应用的类型也持续快速增长。因此,常规地使用移动计算设备来执行它们的在线计算、通信和信息管理任务(诸如刚刚描述的话题研究)的用户数量持续快速地增长。事实上,移动计算设备已经变成了许多用户的主要计算设备。
发明内容
提供该发明内容以便以下文在具体实施方式部分中进一步描述的简化形式来引入概念的选集。该发明内容不意在确定权利要求主题的关键特征或重要特征,也不意在用来辅助确定权利要求主题的范围。
本文所描述的智能选择技术实施例一般涉及对形成用户想要选择的单个词或一系列的两个或更多个词的文本跨度进行预测。在一个示例性实施例中,包括字符串的文档被接收到,并且指示文档中特定位置的位置指针也被接收到。然后,文档和位置指针输入到多个不同的候选文本跨度生成方法。然后,从不同的候选文本跨度生成方法中的每一个接收关于一个或多个记分候选文本跨度的排名列表。然后,使用机器学习总体模型(machine-learnedensemblemodel)来对从不同候选文本跨度生成方法中的每一个接收到的每个记分候选文本跨度进行重新记分,其中总体模型是利用机器学习方法和来自真实意图的用户文本跨度选择数据集的特征来训练的。然后,从总体模型接收重新记分候选文本跨度的排名列表。
在另一示例性实施例中,将文档和位置指针输入到机器学习超链接意图模型。然后,从超链接意图模型接收记分候选文本跨度的排名列表。
附图说明
结合下面的说明书、随附权利要求和附图,将更好的理解本文所描述的智能选择技术实施例的具体的特征、方面和优点,在附图中:
图1是示出用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的过程的简化形式的一个实施例的流程图。
图2是示出用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的总体学习架构的简化形式的示例性实施例的图。
图3是示出用于构建由本文所描述的智能选择技术实施例所使用的真实意图的用户文本跨度选择的数据集的大规模群集源方法的简化形式的示例性实施例的流程图。
图4是示出使用超链接意图模型方法来识别预测用户想要选择什么的候选文本跨度的过程的简化形式的示例性实施例的流程图。
图5是提供用于图4示范的过程的译码流的示例性实施例的简化形式的图形图示的图。
图6A和6B是示出用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的过程的简化形式的另一实施例的流程图。
图7是示出可以实现如本文所述的智能选择技术的各个实施例和要素的通用计算机系统的简化示例的图。
具体实施方式
在智能选择技术实施例的以下描述中,参考了附图,附图构成说明书的一部分,并且在附图中通过示例的方式示出了能够实践智能选择技术的具体实施例。应理解,能够使用其它实施例,并且能够做出进行结构的改变,而不偏离智能选择技术实施例的范围。
还值得注意的是,为了清楚起见,借助具体术语来描述本文所描述的智能选择技术实施例,并不意在将这些实施例限于如此选择的具体术语。此外,应当理解,每个具体术语包括它的以广义上类似的方式操作来实现类似目的的全部技术等同词。本文提到的“一个实施例”或“另一实施例”或“示例性实施例”或“替选实施例”或“一个实现方式”或“另一实现方式”或“示例性实施方案”或“替选实施方案”意指与实施例或实现方式相结合描述的特定的特征、特定的结构或特定的特性能够包含在智能选择技术的至少一个实施例中。短语“在一个实施例中”、“在另一实施例中”、“在示例性实施例中”、“在替选实施例中”、“在一个实现方式中”、“在另一实现方式中”、“在示例性实现方式中”和“在替选实现方式中”在说明书各地方的出现不一定都指代同一实施例或实现方式,也不指代其它实施例/实现方式的相互排斥的单独的或替选的实施例/实现方式。另外,代表了智能选择技术的一个或多个的实施例或实现方式的过程流的次序本质上不指示任何特定次序,不暗示智能选择技术的任何限制。
1.0由用户进行的文本选择
术语“文档”在本文用来指代包括字符串(例如,文本)且能够显示在计算设备的显示屏上的任何信息项。术语“文本跨度”在本文用来指代包含在文档内且形成单一单元(例如,文本跨度形成实体、概念或话题)的一个或多个字符的序列(例如,文本的一个跨度)。从而,文本跨度能够形成单个词或者一系列两个或更多个的词,以及其它事物。在本文所描述的智能选择技术实施例中,用户选择他们正在阅读或著作的文档中的文本跨度。术语“触摸使能计算设备”在本文用来指代任何具有自然触摸用户接口的计算设备,自然触摸用户接口包括用户能够在其上面做出触摸手势的触摸敏感显示屏。
如计算与用户接口领域所意识到的,传统的个人计算机(PC)和膝上型/笔记本计算机长期以来包括指针设备(例如,鼠标、或跟踪板/触摸板等等),用户能够使用该指针设备来选择显示给他们的信息的期望的项或部分。更特别地,以及通过示例而不是限制的方式,几十年来,传统PC和膝上型/笔记本计算机的用户已经依赖于使用指针设备来选择当前所显示的文档内的文本跨度,并且对选定的文本跨度执行各种功能。这些功能的示例包括但不限于:复制和粘贴选定的文本跨度,在词典或词库中查找选定的文本跨度,针对选定的文本跨度来搜索Web,以及翻译选定的文本跨度。
如上文所述的,常规地使用移动计算设备来执行其在线计算、通信和信息管理任务(诸如前述的在各种应用中消费或著作各种内容的同时研究话题)的用户的数量持续快速地增长。还如计算和用户接口领域所意识到的,移动计算设备仅是触摸使能计算设备的一个示例。当今,PC和膝上型/笔记本计算机还经常配置为触摸使能计算设备。因此,许多用户目前惯常地经由与各种触摸使能计算设备(的例如触摸敏感显示屏上的触摸手势)的触摸交互来执行文本跨度和相关功能选择。
还如计算和用户接口领域所意识到的,指针设备提供了高度的选择分辨能力(例如,选择分辨率)。虽然触摸使能计算设备的自然触摸用户接口能够为用户提供与计算设备的更加直观且存在争议的更加自然形式的用户交互,但是自然触摸用户接口还提供了比指针设备显著低程度的选择分辨能力。
2.0文本跨度的智能选择
一般而言,本文所描述的智能选择技术实施例提供了新的自然语言处理和文本选择范例,其允许用户选择当前正显示给用户的文档内的文本跨度。更特别地,给定包括字符串的文档中的特定位置的用户选择,智能选择技术实施例预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度,其中该预测的文本跨度在上下文与文档的内容相关。换言之,智能选择技术实施例基于用户在文档中选定的特定位置(例如,单个字符以及其它可能的事物)来预测用户的关注焦点。通过示例而不是限制的方式,假设用户正在触摸使能计算设备上阅读或著作关于叙利亚危机的文章并且他们在文章中出现的句子“TheRussianFederationhasproposedaplanforthedestructionofSyria’schemicalweapons”中的词“Federation”的任意部分上轻敲。智能选择技术实施例可能预测到,即使用户选择了词“Federation”,他们想要选择文本跨度“RussianFederation”(例如,他们想要的关注焦点是“RussianFederation”)。通过另一示例,假设用户正在阅读或著作体育新闻文章并且他们在文章中出现的句子“TheSanFrancisco49ersscoredbiginlastMonday’sgame”中的词“San”的任意部分上轻敲。智能选择技术实施例可能预测到,即使用户选择了词“San”,他们想要选择文本跨度“SanFrancisco49ers”(例如,他们想要的关注焦点是“SanFrancisco49ers”)。
在本文所描述的智能选择技术的示例性实施例中,智能选择技术实施例所执行的文本跨度预测适用于如下情况:用户想要对文本跨度进行研究,从而学习关于它的更多。用户可能进行的示范性的研究类型包括但不限于查找词典或词库或维基百科(Wikipedia)中的文本跨度,或者针对文本跨度搜索Web,或者翻译文本跨度。
值得注意的是,虽然本文在用户使用触摸使能计算设备来在计算设备的触摸敏感显示屏上阅读或著作文档的上下文中描述了智能选择技术实施例,其中用户通过在特定位置上方做出单一触摸手势(例如,轻敲)来选择文档中的该特定位置,但是智能选择技术的替选实施例是可能的,其中用户能够利用其它各种模态(modality)来选择位置。通过示例而不是限制的方式,在用户正用来阅读/著作文档的计算设备包括指针设备的情况下,用户能够利用指针设备来选择文档中的特定位置。在用户正用来阅读/著作文档的计算设备包括语音识别能力的情况下,用户能够通过讲出特定词来选择对应于文档中的该特定词的文档中的特定位置。在用户正用来阅读/著作文档的计算设备包括能够用来跟踪用户眼睛注视的面向用户的视频照相机的情况下,用户能够通过注视特定位置来选择文档中的该特定位置。
图1示出了用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的过程的简化形式的一个实施例。如图1所例示的,该过程开始于接收包含字符串的文档(动作100)。然后,接收指示文档中特定位置的位置指针(动作102)。在本文所描述的智能选择技术的示例性实施例中,用户正在使用触摸使能计算设备且文档显示在计算设备的触摸敏感显示屏上,位置指针能够通过在文档中特定位置上用户触摸(例如,轻敲)显示屏来生成。在该特定位置对应于文档中具体字符的情况下,位置指针将是指示用户在文档中选定的该具体字符的字符偏移量。
再次参考图1,在文档和位置指针已经被接收到(动作100和102)之后,它们被输入到多个不同的候选文本跨度生成方法(动作104),其示例性实施例将在下文进行更详细描述。然后,从不同的候选文本跨度生成方法中的每一个接收关于一个或多个记分候选文本跨度的排名列表(动作106)。然后,使用机器学习总体模型来对从不同的候选文本跨度生成方法中的每一个接收到的每个记分候选文本跨度进行重新记分,其中该模型是利用机器学习方法和来自由本文所述的智能选择技术实施例构建的真实意图用户文本跨度选择数据集的特征来训练的(动作108)。各种机器学习方法能够用于训练该总体模型。通过示例而不是限制的方式,在本文所描述的智能选择技术的一个实施例中,用来训练总体模型的机器学习方法是逻辑回归。在智能选择技术的另一实施例中,用来训练总体模型的机器学习方法是常规的梯度提升决策树方法。在智能选择技术的又另一实施例中,用来训练总体模型的机器学习方法是常规的支持向量机方法。下文更详细描述了机器学习总体模型和真实意图(true-intended)用户文本跨度选择数据集。然后,从机器学习的总体模型接收重新记分候选文本跨度排名列表(动作110)。
再次参考图1,在已从机器学习总体模型接收到重新记分候选文本跨度排名列表(动作110)之后,用户想要选择的文本跨度的一个或多个预测以如下方式提供给用户。在本文所描述的智能选择技术的一个实施例中,识别重新记分候选文本跨度排名列表中具有最高得分的候选文本跨度(动作112),并且将所述识别的候选文本跨度作为对用户想要选择的文本跨度的预测显示给用户(动作114)。如根据下文的进一步详述所意识到的,所述识别的候选文本跨度在上下文与文档内容相关,并且可以是单个词或者包括两个或更多个词的短语。在智能选择技术的另一实施例中,重新记分候选文本跨度排名列表中的具有最高得分的两个或更多个候选文本跨度被识别(动作116),并且这些识别的候选文本跨度作为对用户想要选择的文本跨度的提议预测被显示给用户(动作118)。同样如下文的进一步详述所意识到的,这些识别的候选文本跨度中的每一个在上下文与文档的内容相关,并且可以是单个词或者包括两个或更多个词的短语。
图2示出了用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的总体学习架构(ensemblelearningframework)的简化形式的示例性实施例。如图2中所例示的,总体学习架构200包括前述多个不同的候选文本跨度生成方法202、机器学习总体模型204和真实意图用户文本跨度选择数据集206。真实意图用户文本跨度选择数据集206与机器学习总体模型204之间的虚线指示:数据集206仅用于训练模块204。在本文所描述的智能选择技术的示例性实施例中,不同的候选文本跨度生成方法202可以包括但不限于:多个不同的语言单元检测器方法210、或多个不同的试探方法212、或一个或多个不同的语言单元检测器方法210、或一个或多个不同的试探方法212的组合。不同的语言单元检测器方法210可以包括但不限于:超链接意图模型方法208、一个或多个不同的命名实体辨识器方法214、一个或多个的不同名词短语检测器方法216以及知识库查找方法218。不同的试探方法212可以包括但不限于:假设由位置指针识别的词是用户想要选择的文本跨度的试探220,以及基于大写的试探222。
同样如图2中所例示的并且如下文更详细说明的,不同的候选文本跨度生成方法202中的每一个接收用户正着手的文档以及指示文档中特定位置的位置指针,以及输出关于一个或多个记分候选文本跨度的排名列表。机器学习总体模型204接收文档、位置指针以及从不同的候选文本跨度生成方法202输出的全部记分候选文本跨度,对每个接收到的记分候选文本跨度重新记分,以及输出重新记分候选文本跨度排名列表。如下文更详细说明的,机器学习总体模型204是利用前述机器学习方法和来自真实意图用户文本跨度选择数据集206的特征来训练的元模型。
本文所描述的智能选择技术实施例由于各种原因是有益的,原因包括但不限于以下所述。智能选择技术实施例与任何触摸使能计算设备兼容且因此能够实现在任何触摸使能计算设备上。智能选择技术实施例还允许用户通过在触摸敏感显示屏上执行仅单个触摸手势(例如,轻敲)(例如,用户无须为选择多词文本跨度而执行一系列复杂的触摸手势)就能够选择多词文本跨度。智能选择技术实施例因此将常规的自然触摸用户接口以如下方式增强:使得在触摸使能计算设备上选择多词文本跨度时的用户体验明显更不麻烦。智能选择技术实施例还执行恢复(例如,预测)用户意图的语义任务。因此,智能选择技术实施例明显优于各种独立的常规语言分析方法,并且产生明显更精确的对用户想要选择的文本跨度的预测。
2.1智能选择范例定义
该章节描述了用于实现本文所描述的智能选择技术实施例的范例的简化形式的示例性实施例。
D表示全部文档的集合。用户选择在此处定义为指示给定文档中的特定位置d∈D的位置指针。如上文所述,在该特定位置对应于d中的具体字符的情况下,位置指针将是指示用户在d中选定的该具体字符的字符偏移量。S表示D中所有可能的用户选择的集合。Sd表示d中所有可能的用户选择的集合。σ=〈x,y〉表示d中给定的记分候选文本跨度(例如,智能选择),其中x∈Sd表示d中给定的候选文本跨度,并且表示该候选文本跨度的得分。φ表示由给定的文档和用户选择组成的对偶来产生关于一个或多个记分候选文本跨度的排名列表(例如,关于一个或多个记分智能选择的排名列表)的智能选择函数。φ能够由以下表达式给出:
φ : D × S → ( σ 1 , ... , σ | S d | | x i ∈ S d , y i ≥ y i + 1 ) .
使φ的输出由记分候选文本跨度排名列表构成而不是仅由单个文本跨度构成是有益的,因为这允许本文所描述的智能选择技术的实施例——其中向用户提议n个最高等级的候选文本跨度的列表(n是规定数)。
给定在文档d中进行的用户选择s,τ表示代表着用户想要选择什么的目标文本跨度。将意识到,本文所描述的不同的候选文本跨度生成方法中的每一个对应于智能选择函数φ的单独的实现方式。本文所描述的智能选择技术实施例使用机器学习总体模型,该机器学习总体模型是利用上述机器学习方法(例如,逻辑回归、或常规的梯度提升决策树方法或常规的支持向量机方法以及其它)以及来自真实意图用户文本跨度选择数据集的特征来训练的,以对由不同的候选文本跨度生成方法输出的记分候选文本跨度的组合集合进行评估和重新记分。因此,智能选择技术实施例能够用于从任何〈d,s〉对偶(例如,从任何文档中的任何用户选择)恢复/预测τ。
将意识到,即使对于人类,根据位置指针来预测用户的意图选择的任务也并非是不重要的。虽然存在一些非常清楚的切割案例(诸如在句子“WhileinDC,BarackObamametwith…”中将对词“Obama”的任何部分的用户选择扩展到“BarackObama”),但是还存在其它的用户意图取决于诸如他们的兴趣的外在因素(以及其它可能的外在因素)的案例。通过示例而不是限制的方式,给定在文本跨度“UniversityofCaliforniaatSantaCruz”中的对词“California”的任何部分进行的用户选择,一些(虽然可能是极少数)用户可能对California州感兴趣,而其它用户可能对大学系统的UniversityofCalifornia感兴趣,而另外其它用户可能对位于SantaCruz的UniversityofCalifornia特别感兴趣。
2.2真实意图用户文本跨度选择的数据集
该部分描述了用于训练机器学习总体模型的真实意图用户文本跨度选择的数据集的构建。在本文所描述的智能选择技术的示例性实施例中,该数据集是利用使规定的用户集合与常规的触摸使能电子阅读设备交互的真实世界应用来构建的。在该应用中,集合中的每个用户正在阅读显示在电子阅读器上的给定书,并且从书中选择他们希望得到额外信息的文本跨度,其中该信息能够来自于各种在线信息资源,诸如词典或词库或维基百科或Web搜索以及各种其它在线信息资源。由于电子阅读器设备的自然触摸用户接口,集合中的每个用户受限于仅触摸单个词。注意的是,智能选择技术的替选实施例也是可能的,其中集合中的一个或多个的用户能够以各种其它方式做出他们的文本跨度选择。通过示例而不是限制的方式,给定用户能够阅读他们的书的纸质形式,并且能够利用亮光笔来做出他们的文本跨度选择。给定用户还能够在被配置有指针设备的计算设备的显示器屏幕上阅读他们的书,并且能够利用该指针设备来做出他们的文本跨度选择。
图3示出了用于构建真实意图用户文本跨度选择的数据集的大规模群集源方法的简化形式的示例性实施例。图3例示的群集源方法可视为大规模群集源(crowd-sourced)用户研究/练习。如在线信息资源领域所领悟到的,Wikibooks(其从http://www.wikibooks.org/可得到)是公共可得到的开放内容课本库。群集源方法实施例使用来自Wikibooks的英文课本的整个集合,其中该集合由横跨诸如计算、人类学和科学以及其它大量类别的2,696个课本构成。
如图3中例示的,群集源方法以选择来自公共书库中的规定数量的书的样本开始(动作300)。在本文所描述的智能选择技术的示例性实施例中,公共书库是Wikibooks,并且书的规定数量是100。其它实施例也是可能的,其中能够使用任何其它公共书库,并且其中书规定数量可以小于或大于100。然后,从每本选定的书中随机地采样一个段落(动作302)。随后,由规定数量的群集源用户来评估每个采样的段落,其中每个群集源(crowd-sourced)用户被指示利用诸如上述的在线信息资源而从他们想要更多地获知的样本段落中选择文本跨度(动作304)。在本文所描述的智能选择技术的示例性实施例中,群集源用户的规定数量是100,但是其它实施例也是可能的,其中群集源用户的规定数量可以是小于或大于100。
参考图3,在不同的群集源用户已经从采样的段落中选择他们的文本跨度(动作304)之后,从每个采样的段落中选择的文本跨度、连同规定从中选择文本跨度的特定采样段落的信息以及选择该文本跨度的用户数量一起,被存储在真实意图用户文本跨度选择数据集中。因此,所得到的真实意图用户文本跨度选择数据集包括〈d,τ〉对偶的集合,其中d规定给定的采样段落,并且τ规定由一个或多个群集源用户从该段落中选择的文本跨度以及选择该文本跨度的用户数量(换言之,τ是真实意图用户选择)。在本文所描述的智能选择技术的示例性实施例中,〈d,τ〉对偶中的每一个被指派给五个随机选出的合并(fold)中的一个(这将在下文进行更详细说明),其用来训练机器学习总体模型。直观地,将意识到选择真实意图用户文本跨度选择数据集中的给定文本跨度的用户越多,该文本跨度就越可能为从中选择该文本跨度的采样段落的读者所感兴趣。本文所描述的智能选择技术的示例性实施例因此使用选择真实意图用户文本跨度选择数据集中的每个文本跨度的用户的数量作为文本跨度将由正在阅读包含该文本跨度的文档的用户选择的可能性的代理。
在已经构建了真实意图用户文本跨度选择数据集之后,用模拟用户文本跨度选择测试集对该真实意图用户文本跨度选择数据集进行如下增强。测试案例在本文定义成三元组〈d,s,τ〉,其中d规定给定采样段落,s规定模拟用户文本跨度选择,并且τ规定从该段落选出的文本跨度以及选择该文本跨度的用户的数量。对于真实意图用户文本跨度选择数据集中的每个〈d,τ〉对偶,规定数量(n)的对应测试案例是通过模拟基于触摸的用户文本跨度选择{〈d,τ,s1〉,...,〈d,τ,sn〉}来构建的,其中s1,...,sn对应于τ中的单个词。换言之,τ中的每个词被视为候选用户选择。其中仅单个用户选择τ的全部测试案例可以基于如下观察来丢弃:这些测试案例主要涉及到误差和噪声,诸如全部句子以及无意义的长句子片段,以及其它。所得到的其余测试案例的流量加权多集合(traffic-weightedmulti-set)被表示为测试集TALL。因此,每个测试案例〈d,s,τ〉在TALL中出现k次,其中k是在d中选择了τ的群集源用户的数量。
然后,将测试集TALL中的用户选择的分布划分成三个其它测试集,即THEAD、TTORSO和TTAIL。更特别地,在通常在统计领域中采用的分层采样方法之后:构建测试集THEAD,其包括频繁选择的意图用户选择;构建另一测试集TTORSO,其包括不太频繁选择的意图用户选择;并且构建又另一测试集TTAIL,其包括极少选择的意图用户选择。
2.3候选文本跨度生成方法
如自然语言处理领域意识到的,能够使用各种候选文本跨度生成方法来识别具有连贯特性的多词文本跨度。同样如自然语言处理领域意识到的,用户文本跨度选择经常是命名实体或名词短语或概念。该部分提供了能够由本文所描述的智能选择技术实施例使用的不同的候选文本跨度生成方法的示例性实施例的更详细说明。在随后的该更详细说明中,将理解的是本文所描述的位置指针识别用户在他们正着手的文档中选择的词。
本文所描述的真实意图用户文本跨度选择数据集中的信息指示,命名实体仅构成了用户想要选择的文本跨度的四分之一(近似地),而名词短语和概念分别构成了用户想要选择的文本跨度的其它部分。因此,将意识到,没有单个常规的语言分析方法足以解决全部的不同用户文本跨度选择可能性。本文所描述的智能选择技术的一个实施例利用两个或更多个不同候选文本跨度生成方法的组合,从而受益于它们的互补能力来解决所有的不同类型的可能的用户意图文本跨度选择。
2.3.1语言单元检测器方法
该章节提供了能够由本文所描述的智能选择技术实施例使用的不同的语言单元检测器方法的示例性实施例的更详细的说明。从随后的更详细说明中意识到,本文所描述的示例性的语言单元检测器方法能够识别将由位置指针所识别的词纳入的命名实体、或名词短语、或概念。换言之,本文所描述的语言单元检测器方法使用基于语言成分(linguisticconstituency)或者基于知识库参与(knowledgebasepresence)的语言单元的概念。因此,在本文所述的每个语言单元检测器方法中,纳入了由位置指针所识别的词的任何检测到的语言单元可被当作候选文本跨度来对待。基于“给定的文本跨度越长(例如,在文本跨度中的字符越多),其就越具体,并且越有可能是用户想要选择的”这一假设,由每个语言单元检测器方法所识别的每个候选文本跨度是基于候选文本跨度的归一化长度来记分的。因此,具有最大归一化长度的候选文本跨度将被赋予最高得分。
2.3.1.1命名实体辨识器方法
如自然语言处理领域将意识到的,存在能够用于识别诸如人、地方、组织等命名实体的各种常规命名实体辨识器方法。一般而言,本文所描述的智能选择技术实施例能够使用任何命名实体辨识器方法或两个或更多个不同的命名实体辨识器方法的任意组合。更特别地,在本文所述的智能选择技术的一个实施例中,能够使用任何命名实体辨识器方法来识别作为纳入了由位置指针所识别的词的命名实体的候选文本跨度。在智能选择技术的另一实施例中,任何两个或更多个不同的命名实体辨识器方法的组合能够用来识别作为将由位置指针所识别的词纳入的命名实体的候选文本跨度。在智能选择技术的示例性实施例中,当给定的命名实体辨识器方法不能识别纳入了由位置指针所识别的词的命名实体时,命名实体辨识器方法将会把该词作为其所识别的候选文本跨度而输出。
2.3.1.2名词短语检测器方法
如自然语言处理领域意识到的,存在能够用于识别诸如名词短语的语言成分的各种常规的名词短语检测器方法(有时称为剖析程序(parser)或分块程序(chunker))。一般而言,本文所描述的智能选择技术实施例能够使用任何名词短语检测器方法或者两个或更多个不同的名词短语检测器方法的任意组合。更特别地,在本文所描述的智能选择技术的一个实施例中,学习借助最大熵模型来剖析自然语言的常规的名词短语检测器方法用来识别作为将由位置指针所识别的词纳入的名词短语的候选文本跨度。在智能选择技术的另一实施例中,任意两个或更多个不同的名词短语检测器方法的组合能够用来识别作为将由位置指针所识别的词纳入的名词短语的候选文本跨度。在智能选择技术的示范性的实施例中,当给定的名词短语检测器方法不能识别纳入了由位置指针识别的词的任何名词短语时,命名实体辨识器方法将该词输出作为其所识别的候选文本跨度。
2.3.1.3知识库查找方法
在本文所描述的智能选择技术实施例中使用的知识库查找方法基于“知识库中的概念以及其它条目(entry)本质上是为人感兴趣的事物”的假设。知识库查找方法使用Web图形来识别候选文本跨度,所述候选文本跨度是:将由位置指针所识别的词纳入的命名实体、或将该词纳入的名词短语、或将该词纳入的概念。Web图形可以包括来自任意知识库的信息或者两个或更多个不同知识库的任意组合。能够由智能选择技术实施例所使用的示例性的知识库包括但不限于:Wikipedia(可从http://en.wikipedia.rog得到)、Freebase(可从http://www.freebase.com/得到)、以及来自供应针对如娱乐和金融(以及许多其它)等特定信息域的在线信息的提供商的一个或多个付费推送。在智能选择技术的示例性实施例中,当知识库查找方法不能识别将由位置指针所识别的词纳入的Web图形中的任何条目时,知识库查找方法将该词输出作为其所识别的候选文本跨度。
2.3.1.4超链接意图模型方法
如根据下面的更详细说明所意识到的,超链接意图模型方法是一种机器学习语言单元检测器方法,其基于如下直觉:在大的知识库中的锚文本(anchortext)可以是关于用户可能想要更多地获知什么的良好表示(例如,超链接意图模型方法假设这样的锚文本本质上类似于用户将在研究任务期间选择的文本跨度)。如因特网和在线信息领域将意识到的,锚文本是超链接中的可见的、用户可选的文本,常常给予用户关于超链接目的地的内容的描述性或上下文的信息。超链接意图模型建立于如下事实之上:即,知识库编辑者写入用于用户所可能感兴趣的实体、概念以及其它事物的锚文本。给定由位置指针所识别的词,超链接意图模型方法使用机器学习超链接意图方法来识别纳入该词的候选文本跨度,其中这些候选文本跨度中的每一个是从大的知识库中恢复的锚文本。在本文所描述的智能选择技术的示例性实施例中,大的知识库是Wikipedia,但是值得注意的是,智能选择技术的替选实施例也是可能的:其中能够使用任何其它类型的大的知识库,或者能够使用两个或更多个不同的知识库的组合。
更特别地,以及将如下文更详细描述的,给定由位置指针所识别的文档中的词,超链接意图模型方法经由利用两个不同的二元分类器所做出的贪婪二元决策来迭代地决定是否在文档中将该词向其左侧扩展一个词,或者在文档中向其右侧扩展一个词,其中迭代继续直到满足规定的停止条件。在本文所描述的智能选择技术的一个实施例中,该停止条件是:分类器指派的扩展概率在给定阈值以下。在本文所描述的智能选择技术的另一实施例中,该停止条件是达到最大预定选择长度。
图4示出了使用机器学习超链接意图模型来识别将由位置指针所识别的词纳入的候选文本跨度的过程的简化形式的示例性实施例。图5提供了用于图4例示的过程的译码流程的示例性实施例的简化形式的图形图示。如图4所例示的,过程开始于将由位置指针所识别的词指派为当前的候选文本跨度(动作400)。然后评估当前候选文本跨度的向其左侧一个词的扩展(动作402),其中该评估包括使用超链接意图模型和左向二元分类器来对该左向扩展进行记分(动作404),并且然后将该左向扩展及其得分存储在记分候选文本跨度排名列表中(动作406)。然后评估当前候选文本跨度向其右侧一个词的扩展(动作408),其中该评估包括使用超链接意图模型和右向二元分类器来对该右向扩展进行记分(动作410),然后将该右向扩展及其得分存储在记分候选文本跨度排名列表中(动作412)。值得注意的是,刚刚描述的对当前候选文本跨度向其左侧一个词的扩展的记分包括从外向内(fromtheoutsidein)评估该左向扩展(例如,从在当前候选文本跨度的紧邻左侧的词到候选文本跨度中的最左侧词的视角)。类似地,刚刚描述的对当前候选文本跨度向其右侧一个词的扩展的记分包括从外向内评估该右向扩展(例如,从当前候选文本跨度的紧邻右侧的词到候选文本跨度中的最右侧词的视角)。
再参考图4,在已经评估了当前候选文本跨度向其左侧一词的扩展以及向其右侧一词的扩展(动作402和408)之后,然后选择对于将当前候选文本跨度向其左侧扩展一词的得分以及对于将当前候选文本跨度向其右侧扩展一词的得分中的较大者(动作414)。每当该选定得分大于规定阈值时(动作416,是),对应选定得分的扩展被指派为当前候选文本跨度(动作418),并且重复动作402-416。每当该选定得分不大于规定阈值时(动作416,否),将记分候选文本跨度排名列表输出(动作420)。
利用由随机地从知识库采样的锚文本自动生成的训练数据集来训练机器学习超链接意图模型,其中该训练数据包括肯定训练示例和否定训练示例。在本文所描述的智能选择技术的示例性实施例中,该训练数据集合以如下方式生成。规定数量的锚文本首先从大的知识库随机采样,其中每个采样的锚文本被当作用户意图选择来对待,并且每个采样锚文本中的每个词被当作模拟用户文本跨度选择来对待。然后,对于每个采样的锚文本,进行下面的动作。对于在由位置指针所识别的词的左侧且是采样锚文本的部分的每个词生成肯定训练示例。对于在由位置指针所识别的词的右侧且是采样锚文本的部分的每个词也生成肯定训练示例。对于在由位置指针所识别的词的左侧且在采样锚文本之外的每个词生成否定训练示例。对于在由位置指针所识别的词的右侧且在采样锚文本之外的每个词也生成否定训练示例。通过从不是任何采样锚文本的部分的大的知识库采样随机词也生成额外的否定训练示例。在大的知识库是Wikipedia的该训练实施例的示例性实现方式中,规定数量是8192,并且最终训练数据的集合包括近似260万个数据点,肯定训练示例与否定训练示例之比是1:20。
如图5中所例示的,在本文所描述的智能选择技术的示例性实施例中,左向二元分类器使用逻辑回归和左向特征集合,该左向特征集合包括在当前候选文本跨度上计算的特征(500)(初始为由位置指针所识别的词)、在当前候选文本跨度左侧的一个词(502)上计算的特征以及在该一个词502紧邻左侧的另一词506上计算的特征。类似地,右向二元分类器使用逻辑回归和右向特征集合,该右向特征集合包括在当前候选文本跨度(500)上计算的特征,在当前候选文本跨度右侧的一个词(504)上计算的特征,以及在该一个词504紧邻右侧的另一词508上计算的特征。左向特征集合和右向特征集合中的特征能够组合成以下五个不同的特征类。
第一特征类包括字符级特征,诸如大写、全大写格式、字符长度、开放/封闭的圆括号的存在、数字与非字母字符的存在及位置、以及最小和平均字符一元语法/二元语法/三元语法频率。在智能选择技术的示例性实施例中,这些频率基于根据大的知识库中的信息内容离线计算出的频率表。第二特征类包括停止词(stop-word)特征,其指示在出现于停止词列表中的停止词的存在。第三特征类包括TF-IDF(术语频率-逆文档频率)得分,其根据用于大知识库的信息内容统计预先计算出。第四特征类包括知识库特征,其指示给定字符串是否匹配前述Web图形中的项或项的部分。第五特征类包括捕获当前候选文本跨度的全字符串以及当前候选文本跨度的左侧/右侧的候选扩展词的全字符串的词法特征。
2.3.2试探方法
除了命名实体辨识器、名词短语检测器、用于识别候选文本跨度的知识库查找与超链接意图模型方法之外,各种试探方法也能够用于识别候选文本跨度。这种试探方法的示例将在下文更进一步详述。
在本文所述的智能选择技术的一个实施例中,使用试探,其假设由位置指针所识别的词是用户想要选择的文本跨度。因此,该特定试探仅输出作为由位置指针识别的词的单个候选文本跨度。
在本文所描述的智能选择技术的另一实施例中,使用基于大写的试探,其基于英语语言正确名称是大写的事实。假设用户是正在阅读或著作包含文本跨度“BarackObama”的文档的用户。如果用户选择词“Barack”的任何部分或词“Obama”的任何部分,则很可能用户对多词文本跨度“BarackObama”感兴趣。因此,基于大写的试探的示例性的实现方式以如下方式操作。每当由位置指针识别的词是大写的时,基于大写的试探将评估文档中该大写词左侧的字符串以及文档中该大写词的右侧的字符串,并且将该大写词扩展到大写词的最长可能不中断序列。基于大写的试探随后将输出该大写词的该最长可能不中断序列。基于大写的试探还可以输出存在于该大写词的该最长可能不中断序列内且包括由位置指针识别的大写词的每个其它的大写词子序列。通过示例而不是限制的方式,在用户选择文本跨度“WilliamF.Buckley,Jr.”内的词“Buckley”的任何部分的情况下,基于大写的试探将输出候选文本跨度“WilliamF.Buckley,Jr.”,并且还可以输出候选文本跨度:“F.Buckley”、“WilliamF.Buckley”、“Buckley,Jr.”和“F.Buckley,Jr.”。
2.4机器学习总体模型
机器学习总体模型是使用总体学习方法来对从不同候选文本跨度生成方法中的每一个接收到的每个记分候选文本跨度重新记分的元模型。如上所述,机器学习总体模型是利用机器学习方法(例如,逻辑回归、或常规的梯度提升决策树方法、或常规的支持向量机方法以及其它)和来自真实意图用户文本跨度选择数据集的特征来训练的。机器学习总体模型包括22个不同的特征,其能够分组成以下三个不同的特征类。第一特征类包括与单个候选文本跨度生成方法有关的特征。第二特征类包括与位置指针所识别的词有关的特征。第三特征类包括与由不同候选文本跨度生成方法输出的每个记分候选文本跨度有关的特征。
给定由机器学习总体模型重新记分的特定记分候选文本跨度,第一特征类中的特征包括特定候选文本跨度生成方法是否生成特定记分候选文本跨度且对指派给它的该特定方法记分。在该特定记分候选文本跨度不在由给定候选文本跨度生成方法输出的排名列表中的情况下,机器学习总体模型将其得分设置为零。在第二特征类和第三特征类中的特征解释了由位置指针识别的词的以及特定记分候选文本跨度的长度和大写特性(例如,记号(token)长度、大写记号的比率、大写字符的比率、第一记号和最后一记号是否大写,等等)。
如上所述的,在本文所描述的智能选择技术的示例性实施例中,真实意图用户文本跨度选择数据集中的每个〈d,τ〉对偶被指派给五个随机选的合并(fold)中的一个。通过在这些合并上执行交叉验证来训练机器学习总体模型。换言之,对于真实意图用户文本跨度选择数据集中的每个合并,使用机器学习总体模型来对该合并中的每一个<d,τ>对偶进行记分,同时使用其他四个合并中的<d,τ>对偶作为该模型的训练数据。值得注意的是,用于给定的<d,s>对偶的全部的真实意图用户文本跨度选择被指派给单个合并,使得在机器学习总体模型训练期间不能看到来自模拟用户文本跨度选择的测试集合的任何模拟用户文本跨度选择。
3.0额外的实施例
虽然已经具体参考实施例描述了智能选择技术,但是应当理解,可以在不偏离智能选择技术的真正的精神和范围的情况下对其做出改变和修改。通过示例而非限制的方式,图6A和图6B示出了用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的过程的简化形式的另一实施例。如图6A所例示的,该过程以接收包括字符串的文档而开始(动作600)。然后,接收指示文档中的特定位置的位置指针(动作602)。在该特定位置对应于文档中的具体字符的情况下,位置指针将是指示文档中用户选定的该特定字符的字符偏移量。然后将文档和位置指针输入到前述机器学习超链接意图模型中(动作604)。然后,从超链接意图模型接收记分候选文本跨度排名列表(动作606)。然后,以如下方式将用户想要选择的文本跨度的一个或多个预测提供给用户。在本文所述的智能选择技术的一个实施例中,记分候选文本跨度排名列表中的具有最高得分的候选文本跨度被识别(动作608),并且该被识别的候选文本跨度作为对用户想要选择的文本跨度的预测显示给用户(动作610)。在智能选择技术的另一实施例中,记分候选文本跨度排名列表中的具有最高得分的两个或更多个的候选文本跨度被识别(动作612),并且这些被识别的候选文本跨度作为他们想要选择的文本跨度的提议预测而显示给用户(动作614)。
如图6B所例示的,文本跨度预测处理的替选实施例也是可能的:其中前述的机器学习总体模型用来对从超链接意图模型接收到的记分候选文本跨度中的每个进行重新记分(动作616)。然后,从总体模型接收到重新记分候选文本跨度排名列表(动作618)。然后,以如下方式将用户想要选择的文本跨度的一个或多个预测提供给用户。在本文所描述的智能选择技术的一个实施例中,重新记分候选文本跨度排名列表中的具有最高得分的候选文本跨度被识别(动作620),并且该被识别的候选文本跨度作为对用户想要选择的文本跨度的预测而显示给用户(动作622)。在智能选择技术的另一实施例中,重新记分候选文本跨度排名列表中具有最高得分的两个或更多个候选文本跨度被识别(动作624),并且这些被识别的候选文本跨度作为对用户想要选择的文本跨度的提议预测而显示给用户(动作626)。
还值得注意的是,任意或全部的前述实施例能够以任何期望形成额外的混合实施例的组合使用。虽然以特定于结构特征和/或方法行为的语言描述了智能选择技术实施例,但是应当理解的是,在随附权利要求中限定的主题不必局限于上述的具体特征或行为。相反,上述的具体特征和行为被公开作为实现权利要求的示例形式。
4.0示例性的操作环境
本文送描述的智能选择技术实施例能够在若干类型的通用或专用计算系统环境或配置内运行。图7示出了可以实现如本文所述的智能选择技术的各实施例和要素的通用计算机系统的简化示例。值得注意的是,由图7所示的简化计算设备10中的虚线或点划线所表示的任何框代表了简化计算设备的替选实施例。如下文所描述的,任何或全部的这些替选实施例可以与在该文档中通篇描述的其他替选实施例相结合使用。简化的计算设备10典型地见于具有至少某最小计算能力的设备,诸如个人计算机(PC)、服务器计算机、手持式计算设备、膝上型或移动计算机、诸如蜂窝电话和个人数字助理(PDA)等通信设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子设备、网络PC、微型计算机、主机式计算机以及音频或视频媒体播放器。
为了允许设备实现本文所描述的智能选择技术实施例,设备应当具有使能进行基本计算操作的足够的计算能力和系统存储器。特别地,图7所示的简化的计算设备10的计算能力通常由一个或多个处理单元12来示出,并且还可以包括一个或多个的图形处理单元(GPU)14,任一或两个与系统存储器16通信。注意,简化的计算设备10的处理单元12可以是专用微处理器(诸如数字信号处理器(DSP)、极长指令字(VLIW)处理器、现场可编程门阵列(FGPA)、或其他微控制器)或者可以是具有一个或多个处理核的常规的中央处理单元(CPU)。
另外,图7所示的简化的计算设备10还可以包括诸如通信接口18等其他组件。简化的计算设备10还可以包括一个或多个的常规计算机输入设备20(例如,指针设备、键盘、音频(例如,语音)输入设备、视频输入设备、触觉输入设备、手势识别设备、用于接收有线或无线数据传输的设备,等等)。简化的计算设备10还可以包括其他任选的组件,诸如一个或多个的常规计算机输出设备22(例如,(一个或多个)显示设备24、音频输出设备、视频输出设备、用于发射无线或有线数据传输的设备,等等)。注意,用于通用计算机的典型的通信接口18、输入设备20、输出设备22和存储设备26是本领域技术人员公知的,将不在此详述。
图7所示的简化的计算设备10还可以包括各种计算机可读介质。计算机可读介质可以是能够由计算机10经由存储设备26访问的任何可用介质,并且可以包括易失性和非易失性的介质,其可以是可移除的28和/或非可移除的30,用于存储诸如计算机可读或计算机可执行指令、数据结构、程序模块或其他数据的信息。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质是指有形的计算机可读或机器可读介质或者诸如数字多功能盘(DVD)、光盘(CD)、软盘、磁带驱动器、硬盘驱动器、光盘驱动器、固态存储器设备、随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存或其他存储器技术、磁盒、磁带、磁盘存储或其他磁存储设备的存储设备。
诸如计算机可读或计算机可执行指令、数据结构、程序模块等信息的留存还能够通过使用各种前述通信介质(与计算机存储介质相对)中的任一个对一个或多个调制数据信号或载波或其他传输机制或通信协议进行编码来实现,并且可以包括任何有线或无线信息输送机制。注意,术语“调制数据信号”或“载波”一般是指以对该信号中的信息进行编码的方式进行设定或改变其一个或多个特性的信号。例如,通信介质可以包括诸如载有一个或多个调制数据信号的有线网络或直接接线连接的有线介质以及诸如声波、射频(RF)、红外、激光以及用于发射和/或接收一个或多个调制数据信号或载波的其它无线介质等无线介质。
此外,具体实施本文所描述的一些或全部的各种智能选择技术实施例或其部分的软件、程序和/或计算机程序产品可以从计算机可读或机器可读介质或存储设备以及呈计算机可执行指令或其他数据结构形式的通信介质的任意期望组合来存储、接收、发送或读取。
最后,本文所描述的智能选择技术实施例可进一步用计算设备执行的诸如程序模块的计算机可执行指令的一般背景来描述。一般地,程序模块包括执行特定任务或实现特定的抽象数据类型的例程、程序、对象、组件、数据结构等。智能选择技术实施例还可以实现于分布式计算环境中,其中任务由通过一个或多个通信网络链接的一个或多个远程处理设备来执行,或者在通过一个或多个通信网络链接的一个或多个设备云内执行。在分布式计算环境中,程序模块可位于包括媒体存储设备的本地计算机存储介质和远程计算机存储介质两者中。另外,前述指令可以部分地或者完全地实现为硬件逻辑电路,其可以包括或者可以不包括处理器。

Claims (10)

1.一种用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的计算机实现方法,包括:
使用计算机来执行以下处理动作:
接收包含字符串的文档;
接收指示所述文档中的特定位置的位置指针;
将所述文档和所述位置指针输入到多个不同的候选文本跨度生成方法;
从所述不同的候选文本跨度生成方法中的每一个接收关于一个或多个记分候选文本跨度的排名列表;
使用机器学习总体模型来对从所述不同的候选文本跨度生成方法中的每一个接收到的每个所述记分候选文本跨度进行重新记分,所述总体模型是利用机器学习方法和来自真实意图用户文本跨度选择的数据集的特征来训练的;以及
从所述总体模型接收重新记分候选文本跨度排名列表。
2.如权利要求1所述的方法,进一步包括以下动作:
识别所述重新记分候选文本跨度排名列表中的具有最高得分的候选文本跨度;以及
向所述用户显示所述识别的候选文本跨度,以作为对用户想要选择的文本跨度的预测。
3.如权利要求1所述的方法,其中所述不同的候选文本跨度生成方法包括以下任一:
多个不同的语言单元检测器方法;或者
多个不同的试探方法;或者
一个或多个不同的语言单元检测器方法和一个或多个不同的试探方法的组合。
4.如权利要求3所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且所述不同的语言单元检测器方法包括超链接意图模型方法,所述超链接意图模型方法使用机器学习超链接意图模型来识别纳入了所述识别的词的候选文本跨度。
5.如权利要求3所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且所述不同的语言单元检测器方法包括一个或多个不同命名的实体辨识器方法,其中每个所述实体辨识器方法识别包含纳入了所述识别的词的命名实体的候选文本跨度。
6.如权利要求3所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且所述不同的语言单元检测器方法包括一个或多个不同名词短语检测器方法,其中每个所述名词短语检测器方法识别包含纳入了所述识别的词的名词短语的候选文本跨度。
7.如权利要求3所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且所述不同的语言单元检测器方法包括知识库查找方法,所述知识库查找方法使用Web图形来识别将纳入了所述识别的词的命名实体、或纳入了所述识别的词的名词短语、或纳入了所述识别的词的概念包括在内的候选文本跨度,所述Web图形包括来自一个或多个不同的知识库的信息。
8.如权利要求3所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且所述不同的试探方法包括以下中的一个或多个:
假设所述识别的词为用户想要选择的文本跨度的试探;或者
基于大写的试探,每当所述识别的词是大写的时,所述基于大写的试探评估所述识别的词的左侧的字符串和所述识别的词的右侧的字符串,并且将所述识别的词扩展到大写词的最长可能不中断序列。
9.一种用于预测形成用户想要选择的单个词或一系列两个或更多个词的文本跨度的计算机实现方法,包括:
使用计算机来执行以下处理动作:
接收包含字符串的文档;
接收指示所述文档中的特定位置的位置指针;
将所述文档和所述位置指针输入到机器学习超链接意图模型;以及
从所述超链接意图模型接收记分候选文本跨度排名列表。
10.如权利要求9所述的方法,其中所述位置指针识别用户在所述文档中选定的词,并且从所述超链接意图模型接收记分候选文本跨度排名列表的动作包括以下动作:
(a)将所述识别的词指派为当前候选文本跨度;
(b)评估所述当前候选文本跨度的向其左侧一个词的扩展,所述评估包括使用所述超链接意图模型和左向二元分类器来对所述左向扩展记分以及将所述左向扩展及其得分存储在所述记分候选文本跨度排名列表中的动作;
(c)评估所述当前候选文本跨度的向其右侧一个词的扩展,所述评估包括使用所述超链接意图模型和右向二元分类器来对所述右向扩展记分以及将所述右向扩展及其得分存储在所述记分候选文本跨度排名列表中的动作;
(d)选择对于将所述当前候选文本跨度向其左侧扩展一个词的得分和对于将所述当前候选文本跨度向其右侧扩展一个词的得分中的较大者;
(e)每当所述选定得分大于规定阈值时,将对应于所述选定得分的扩展指派为所述当前候选文本跨度,以及重复动作(b)-(e)。
CN201480055252.2A 2013-10-07 2014-10-01 文本跨度的智能选择 Active CN105637507B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361887954P 2013-10-07 2013-10-07
US61/887,954 2013-10-07
US14/245,646 2014-04-04
US14/245,646 US9436918B2 (en) 2013-10-07 2014-04-04 Smart selection of text spans
PCT/US2014/058506 WO2015053993A1 (en) 2013-10-07 2014-10-01 Smart selection of text spans

Publications (2)

Publication Number Publication Date
CN105637507A true CN105637507A (zh) 2016-06-01
CN105637507B CN105637507B (zh) 2019-03-08

Family

ID=51790877

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480055252.2A Active CN105637507B (zh) 2013-10-07 2014-10-01 文本跨度的智能选择
CN201480055402.XA Pending CN105612517A (zh) 2013-10-07 2014-10-07 上下文洞察及探索

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201480055402.XA Pending CN105612517A (zh) 2013-10-07 2014-10-07 上下文洞察及探索

Country Status (6)

Country Link
US (2) US9436918B2 (zh)
EP (2) EP3055789A1 (zh)
KR (1) KR20160067202A (zh)
CN (2) CN105637507B (zh)
TW (1) TW201519075A (zh)
WO (2) WO2015053993A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536733A (zh) * 2017-03-02 2018-09-14 埃森哲环球解决方案有限公司 人工智能数字代理
CN109917988A (zh) * 2017-12-13 2019-06-21 腾讯科技(深圳)有限公司 选中内容显示方法、装置、终端及计算机可读存储介质
CN112955893A (zh) * 2018-10-30 2021-06-11 谷歌有限责任公司 文档的自动超链接
US11113608B2 (en) 2017-10-30 2021-09-07 Accenture Global Solutions Limited Hybrid bot framework for enterprises

Families Citing this family (235)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10193990B2 (en) * 2005-10-26 2019-01-29 Cortica Ltd. System and method for creating user profiles based on multimedia content
US10776585B2 (en) 2005-10-26 2020-09-15 Cortica, Ltd. System and method for recognizing characters in multimedia content
US10387914B2 (en) 2005-10-26 2019-08-20 Cortica, Ltd. Method for identification of multimedia content elements and adding advertising content respective thereof
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US10691642B2 (en) 2005-10-26 2020-06-23 Cortica Ltd System and method for enriching a concept database with homogenous concepts
US10614626B2 (en) 2005-10-26 2020-04-07 Cortica Ltd. System and method for providing augmented reality challenges
US9384196B2 (en) 2005-10-26 2016-07-05 Cortica, Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US10372746B2 (en) 2005-10-26 2019-08-06 Cortica, Ltd. System and method for searching applications using multimedia content elements
US20160321253A1 (en) 2005-10-26 2016-11-03 Cortica, Ltd. System and method for providing recommendations based on user profiles
US8818916B2 (en) 2005-10-26 2014-08-26 Cortica, Ltd. System and method for linking multimedia data elements to web pages
US10742340B2 (en) 2005-10-26 2020-08-11 Cortica Ltd. System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto
US11019161B2 (en) 2005-10-26 2021-05-25 Cortica, Ltd. System and method for profiling users interest based on multimedia content analysis
US9646005B2 (en) 2005-10-26 2017-05-09 Cortica, Ltd. System and method for creating a database of multimedia content elements assigned to users
US11003706B2 (en) 2005-10-26 2021-05-11 Cortica Ltd System and methods for determining access permissions on personalized clusters of multimedia content elements
US10607355B2 (en) 2005-10-26 2020-03-31 Cortica, Ltd. Method and system for determining the dimensions of an object shown in a multimedia content item
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US10621988B2 (en) 2005-10-26 2020-04-14 Cortica Ltd System and method for speech to text translation using cores of a natural liquid architecture system
US10585934B2 (en) 2005-10-26 2020-03-10 Cortica Ltd. Method and system for populating a concept database with respect to user identifiers
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
JP2014099052A (ja) * 2012-11-14 2014-05-29 International Business Maschines Corporation テキストを編集する装置、データ処理方法およびプログラム
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US9485543B2 (en) 2013-11-12 2016-11-01 Google Inc. Methods, systems, and media for presenting suggestions of media content
US9552395B2 (en) 2013-11-13 2017-01-24 Google Inc. Methods, systems, and media for presenting recommended media content items
US9721002B2 (en) * 2013-11-29 2017-08-01 Sap Se Aggregating results from named entity recognition services
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
KR102135367B1 (ko) * 2014-01-23 2020-07-17 엘지전자 주식회사 이동 단말기 및 그것의 제어 방법
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US11334720B2 (en) 2019-04-17 2022-05-17 International Business Machines Corporation Machine learned sentence span inclusion judgments
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9824079B1 (en) 2014-07-11 2017-11-21 Google Llc Providing actions for mobile onscreen content
KR20160021524A (ko) * 2014-08-18 2016-02-26 엘지전자 주식회사 이동 단말기 및 이의 제어방법
US9965559B2 (en) 2014-08-21 2018-05-08 Google Llc Providing automatic actions for mobile onscreen content
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10210146B2 (en) 2014-09-28 2019-02-19 Microsoft Technology Licensing, Llc Productivity tools for content authoring
US10402061B2 (en) 2014-09-28 2019-09-03 Microsoft Technology Licensing, Llc Productivity tools for content authoring
US10528597B2 (en) * 2014-09-28 2020-01-07 Microsoft Technology Licensing, Llc Graph-driven authoring in productivity tools
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10534502B1 (en) * 2015-02-18 2020-01-14 David Graham Boyers Methods and graphical user interfaces for positioning the cursor and selecting text on computing devices with touch-sensitive displays
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9703541B2 (en) 2015-04-28 2017-07-11 Google Inc. Entity action suggestion on a mobile device
US10402410B2 (en) * 2015-05-15 2019-09-03 Google Llc Contextualizing knowledge panels
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US9971940B1 (en) * 2015-08-10 2018-05-15 Google Llc Automatic learning of a video matching system
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10178527B2 (en) 2015-10-22 2019-01-08 Google Llc Personalized entity repository
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
EP3171281A1 (en) * 2015-11-17 2017-05-24 Dassault Systèmes Thematic web corpus
US10055390B2 (en) * 2015-11-18 2018-08-21 Google Llc Simulated hyperlinks on a mobile device based on user intent and a centered selection of text
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US11037015B2 (en) 2015-12-15 2021-06-15 Cortica Ltd. Identification of key points in multimedia data elements
US11195043B2 (en) 2015-12-15 2021-12-07 Cortica, Ltd. System and method for determining common patterns in multimedia content elements based on key points
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105786977B (zh) * 2016-02-05 2020-03-03 北京百度网讯科技有限公司 基于人工智能的移动搜索方法和装置
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10650007B2 (en) 2016-04-25 2020-05-12 Microsoft Technology Licensing, Llc Ranking contextual metadata to generate relevant data insights
CN105975540A (zh) 2016-04-29 2016-09-28 北京小米移动软件有限公司 信息显示方法及装置
US10783178B2 (en) 2016-05-17 2020-09-22 Google Llc Generating a personal database entry for a user based on natural language user interface input of the user and generating output based on the entry in response to further natural language user interface input of the user
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10831763B2 (en) * 2016-06-10 2020-11-10 Apple Inc. System and method of generating a key list from multiple search domains
US10769182B2 (en) 2016-06-10 2020-09-08 Apple Inc. System and method of highlighting terms
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
WO2018053735A1 (zh) * 2016-09-21 2018-03-29 朱小军 一种搜索方法及系统
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
KR101881439B1 (ko) * 2016-09-30 2018-07-25 주식회사 솔트룩스 문서 작성을 위한 능동적 지식 추천 시스템 및 방법
US10535005B1 (en) 2016-10-26 2020-01-14 Google Llc Providing contextual actions for mobile onscreen content
US11032410B2 (en) * 2016-11-08 2021-06-08 Microsoft Technology Licensing, Llc Mobile data insight platforms for data analysis
JP6833999B2 (ja) * 2016-11-23 2021-02-24 プライマル フュージョン インコーポレイテッド 機械学習分類器とともに知識表現を使用するためのシステム及び方法
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11237696B2 (en) 2016-12-19 2022-02-01 Google Llc Smart assist for repeated actions
TWI603320B (zh) * 2016-12-29 2017-10-21 大仁科技大學 全域對話系統
CN108279828A (zh) * 2016-12-30 2018-07-13 北京搜狗科技发展有限公司 一种启动应用程序的方法、装置和终端
US11138208B2 (en) 2016-12-30 2021-10-05 Microsoft Technology Licensing, Llc Contextual insight system
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11003839B1 (en) 2017-04-28 2021-05-11 I.Q. Joe, Llc Smart interface with facilitated input and mistake recovery
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10783320B2 (en) * 2017-05-16 2020-09-22 Apple Inc. Device, method, and graphical user interface for editing screenshot images
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US11108709B2 (en) * 2017-05-25 2021-08-31 Lenovo (Singapore) Pte. Ltd. Provide status message associated with work status
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US11760387B2 (en) 2017-07-05 2023-09-19 AutoBrains Technologies Ltd. Driving policies determination
US11899707B2 (en) 2017-07-09 2024-02-13 Cortica Ltd. Driving policies determination
US11816622B2 (en) 2017-08-14 2023-11-14 ScoutZinc, LLC System and method for rating of personnel using crowdsourcing in combination with weighted evaluator ratings
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10747756B2 (en) * 2017-09-28 2020-08-18 Oracle International Corporation Recommending fields for a query based on prior queries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN107844327B (zh) * 2017-11-03 2020-10-27 南京大学 一种实现上下文一致性的检测系统及检测方法
US10909191B2 (en) 2017-11-20 2021-02-02 Rovi Guides, Inc. Systems and methods for displaying supplemental content for an electronic book
CN111433767A (zh) * 2017-11-20 2020-07-17 乐威指南公司 用于过滤电子书的补充内容的系统和方法
US10909193B2 (en) * 2017-11-20 2021-02-02 Rovi Guides, Inc. Systems and methods for filtering supplemental content for an electronic book
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10303771B1 (en) 2018-02-14 2019-05-28 Capital One Services, Llc Utilizing machine learning models to identify insights in a document
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10831812B2 (en) * 2018-03-20 2020-11-10 Microsoft Technology Licensing, Llc Author-created digital agents
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10853332B2 (en) * 2018-04-19 2020-12-01 Microsoft Technology Licensing, Llc Discovering schema using anchor attributes
US10978056B1 (en) * 2018-04-20 2021-04-13 Facebook, Inc. Grammaticality classification for natural language generation in assistant systems
US10963273B2 (en) 2018-04-20 2021-03-30 Facebook, Inc. Generating personalized content summaries for users
US11676220B2 (en) 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US11320983B1 (en) * 2018-04-25 2022-05-03 David Graham Boyers Methods and graphical user interfaces for positioning a selection, selecting, and editing, on a computing device running applications under a touch-based operating system
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US10846544B2 (en) 2018-07-16 2020-11-24 Cartica Ai Ltd. Transportation prediction system and method
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11126870B2 (en) 2018-10-18 2021-09-21 Cartica Ai Ltd. Method and system for obstacle detection
US11181911B2 (en) 2018-10-18 2021-11-23 Cartica Ai Ltd Control transfer of a vehicle
US20200133308A1 (en) 2018-10-18 2020-04-30 Cartica Ai Ltd Vehicle to vehicle (v2v) communication less truck platooning
US10839694B2 (en) 2018-10-18 2020-11-17 Cartica Ai Ltd Blind spot alert
US11244176B2 (en) 2018-10-26 2022-02-08 Cartica Ai Ltd Obstacle detection and mapping
US10748038B1 (en) 2019-03-31 2020-08-18 Cortica Ltd. Efficient calculation of a robust signature of a media unit
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US10789535B2 (en) 2018-11-26 2020-09-29 Cartica Ai Ltd Detection of road elements
CN109543022B (zh) * 2018-12-17 2020-10-13 北京百度网讯科技有限公司 文本纠错方法和装置
US11200461B2 (en) * 2018-12-21 2021-12-14 Capital One Services, Llc Methods and arrangements to identify feature contributions to erroneous predictions
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109918555B (zh) * 2019-02-20 2021-10-15 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质
US11643005B2 (en) 2019-02-27 2023-05-09 Autobrains Technologies Ltd Adjusting adjustable headlights of a vehicle
US11285963B2 (en) 2019-03-10 2022-03-29 Cartica Ai Ltd. Driver-based prediction of dangerous events
US11694088B2 (en) 2019-03-13 2023-07-04 Cortica Ltd. Method for object detection using knowledge distillation
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11132548B2 (en) 2019-03-20 2021-09-28 Cortica Ltd. Determining object information that does not explicitly appear in a media unit signature
US10776669B1 (en) 2019-03-31 2020-09-15 Cortica Ltd. Signature generation and object detection that refer to rare scenes
US11222069B2 (en) 2019-03-31 2022-01-11 Cortica Ltd. Low-power calculation of a signature of a media unit
US10789527B1 (en) 2019-03-31 2020-09-29 Cortica Ltd. Method for object detection using shallow neural networks
US10796444B1 (en) 2019-03-31 2020-10-06 Cortica Ltd Configuring spanning elements of a signature generator
US11275892B2 (en) 2019-04-29 2022-03-15 International Business Machines Corporation Traversal-based sentence span judgements
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11550865B2 (en) 2019-08-19 2023-01-10 Dropbox, Inc. Truncated search results that preserve the most relevant portions
US11347756B2 (en) 2019-08-26 2022-05-31 Microsoft Technology Licensing, Llc Deep command search within and across applications
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11593662B2 (en) 2019-12-12 2023-02-28 Autobrains Technologies Ltd Unsupervised cluster generation
US10748022B1 (en) 2019-12-12 2020-08-18 Cartica Ai Ltd Crowd separation
US10956295B1 (en) * 2020-02-26 2021-03-23 Sap Se Automatic recognition for smart declaration of user interface elements
US11590988B2 (en) 2020-03-19 2023-02-28 Autobrains Technologies Ltd Predictive turning assistant
US11827215B2 (en) 2020-03-31 2023-11-28 AutoBrains Technologies Ltd. Method for training a driving related object detector
US11768945B2 (en) * 2020-04-07 2023-09-26 Allstate Insurance Company Machine learning system for determining a security vulnerability in computer software
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11756424B2 (en) 2020-07-24 2023-09-12 AutoBrains Technologies Ltd. Parking assist
US11900046B2 (en) * 2020-08-07 2024-02-13 Microsoft Technology Licensing, Llc Intelligent feature identification and presentation
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models
JPWO2022107328A1 (zh) * 2020-11-20 2022-05-27
US11983208B2 (en) * 2021-02-16 2024-05-14 International Business Machines Corporation Selection-based searching using concatenated word and context
US20220366513A1 (en) * 2021-05-14 2022-11-17 Jpmorgan Chase Bank, N.A. Method and apparatus for check fraud detection through check image analysis
CN113641724B (zh) * 2021-07-22 2024-01-19 北京百度网讯科技有限公司 知识标签挖掘方法、装置、电子设备及存储介质
WO2023028599A1 (en) * 2021-08-27 2023-03-02 Rock Cube Holdings LLC Systems and methods for time-dependent hyperlink presentation
WO2023135477A1 (en) * 2022-01-13 2023-07-20 High Sec Labs Ltd. System and method for secure copy-and-paste opertions between hosts through a peripheral sharing device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574840A (en) * 1994-08-29 1996-11-12 Microsoft Corporation Method and system for selecting text utilizing a plurality of text using switchable minimum granularity of selection
CN100478949C (zh) * 2004-03-31 2009-04-15 Google公司 具有实体检测的查询改写
CN102648464A (zh) * 2009-09-30 2012-08-22 思科技术公司 用于从网络数据中生成词汇的系统和方法
CN103258534A (zh) * 2012-02-21 2013-08-21 联发科技股份有限公司 语音命令识别方法和电子装置

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US7000197B1 (en) * 2000-06-01 2006-02-14 Autodesk, Inc. Method and apparatus for inferred selection of objects
US6907581B2 (en) * 2001-04-03 2005-06-14 Ramot At Tel Aviv University Ltd. Method and system for implicitly resolving pointing ambiguities in human-computer interaction (HCI)
US20070136251A1 (en) * 2003-08-21 2007-06-14 Idilia Inc. System and Method for Processing a Query
JP4278050B2 (ja) * 2004-01-30 2009-06-10 ソフトバンクモバイル株式会社 検索装置及び情報提供システム
GB0407816D0 (en) * 2004-04-06 2004-05-12 British Telecomm Information retrieval
US7603349B1 (en) * 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7856441B1 (en) * 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US20060074883A1 (en) * 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
US8838562B1 (en) * 2004-10-22 2014-09-16 Google Inc. Methods and apparatus for providing query parameters to a search engine
WO2007118424A1 (en) * 2006-04-13 2007-10-25 Zhang, Sheng Web search on mobile devices
US8706748B2 (en) * 2007-12-12 2014-04-22 Decho Corporation Methods for enhancing digital search query techniques based on task-oriented user activity
US20100241663A1 (en) * 2008-02-07 2010-09-23 Microsoft Corporation Providing content items selected based on context
US8650507B2 (en) * 2008-03-04 2014-02-11 Apple Inc. Selecting of text using gestures
US8786556B2 (en) * 2009-03-12 2014-07-22 Nokia Corporation Method and apparatus for selecting text information
US20100289757A1 (en) * 2009-05-14 2010-11-18 Budelli Joey G Scanner with gesture-based text selection capability
US9262063B2 (en) 2009-09-02 2016-02-16 Amazon Technologies, Inc. Touch-screen user interface
EP2488963A1 (en) * 2009-10-15 2012-08-22 Rogers Communications Inc. System and method for phrase identification
JP5752708B2 (ja) 2010-01-11 2015-07-22 アップル インコーポレイテッド 電子テキスト処理及び表示
US8704783B2 (en) * 2010-03-24 2014-04-22 Microsoft Corporation Easy word selection and selection ahead of finger
US9069416B2 (en) * 2010-03-25 2015-06-30 Google Inc. Method and system for selecting content using a touchscreen
US8719246B2 (en) * 2010-06-28 2014-05-06 Microsoft Corporation Generating and presenting a suggested search query
US9069754B2 (en) * 2010-09-29 2015-06-30 Rhonda Enterprises, Llc Method, system, and computer readable medium for detecting related subgroups of text in an electronic document
US8818981B2 (en) * 2010-10-15 2014-08-26 Microsoft Corporation Providing information to users based on context
US20120102401A1 (en) * 2010-10-25 2012-04-26 Nokia Corporation Method and apparatus for providing text selection
JP5087129B2 (ja) * 2010-12-07 2012-11-28 株式会社東芝 情報処理装置及び情報処理方法
US9645986B2 (en) 2011-02-24 2017-05-09 Google Inc. Method, medium, and system for creating an electronic book with an umbrella policy
KR20120102262A (ko) * 2011-03-08 2012-09-18 삼성전자주식회사 휴대용 단말기가 열람하는 텍스트에서 원하는 내용을 선택하는 방법 및 장치
DE112011105305T5 (de) * 2011-06-03 2014-03-13 Google, Inc. Gesten zur Textauswahl
US8612584B2 (en) 2011-08-29 2013-12-17 Google Inc. Using eBook reading data to generate time-based information
US9612670B2 (en) * 2011-09-12 2017-04-04 Microsoft Technology Licensing, Llc Explicit touch selection and cursor placement
US9128581B1 (en) * 2011-09-23 2015-09-08 Amazon Technologies, Inc. Providing supplemental information for a digital work in a user interface
US20150205490A1 (en) * 2011-10-05 2015-07-23 Google Inc. Content selection mechanisms
US8626545B2 (en) 2011-10-17 2014-01-07 CrowdFlower, Inc. Predicting future performance of multiple workers on crowdsourcing tasks and selecting repeated crowdsourcing workers
CN103294706A (zh) * 2012-02-28 2013-09-11 腾讯科技(深圳)有限公司 触摸式终端中的文本搜索方法和装置
US9292192B2 (en) * 2012-04-30 2016-03-22 Blackberry Limited Method and apparatus for text selection
US9916396B2 (en) * 2012-05-11 2018-03-13 Google Llc Methods and systems for content-based search
CN104412212A (zh) * 2012-06-29 2015-03-11 微软公司 输入法编辑器
US9009169B2 (en) * 2012-09-20 2015-04-14 Intelliresponse Systems Inc. Disambiguation framework for information searching

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574840A (en) * 1994-08-29 1996-11-12 Microsoft Corporation Method and system for selecting text utilizing a plurality of text using switchable minimum granularity of selection
CN100478949C (zh) * 2004-03-31 2009-04-15 Google公司 具有实体检测的查询改写
CN102648464A (zh) * 2009-09-30 2012-08-22 思科技术公司 用于从网络数据中生成词汇的系统和方法
CN103258534A (zh) * 2012-02-21 2013-08-21 联发科技股份有限公司 语音命令识别方法和电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LEV FINKELSTEIN ETC.: ""Placing Search in Context:The Concept Revisited"", 《ACM TRANSACTIONS ON INFORMATION SYSTEMS》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536733A (zh) * 2017-03-02 2018-09-14 埃森哲环球解决方案有限公司 人工智能数字代理
US11113608B2 (en) 2017-10-30 2021-09-07 Accenture Global Solutions Limited Hybrid bot framework for enterprises
CN109917988A (zh) * 2017-12-13 2019-06-21 腾讯科技(深圳)有限公司 选中内容显示方法、装置、终端及计算机可读存储介质
CN112955893A (zh) * 2018-10-30 2021-06-11 谷歌有限责任公司 文档的自动超链接

Also Published As

Publication number Publication date
US9436918B2 (en) 2016-09-06
EP3055787A1 (en) 2016-08-17
US20150100562A1 (en) 2015-04-09
CN105637507B (zh) 2019-03-08
WO2015054218A1 (en) 2015-04-16
WO2015053993A1 (en) 2015-04-16
EP3055789A1 (en) 2016-08-17
KR20160067202A (ko) 2016-06-13
US20150100524A1 (en) 2015-04-09
CN105612517A (zh) 2016-05-25
TW201519075A (zh) 2015-05-16

Similar Documents

Publication Publication Date Title
CN105637507A (zh) 文本跨度的智能选择
Rodriguez et al. A computational social science perspective on qualitative data exploration: Using topic models for the descriptive analysis of social media data
Xing et al. Cognitive-inspired domain adaptation of sentiment lexicons
WO2022078102A1 (zh) 一种实体识别方法、装置、设备以及存储介质
WO2021139701A1 (zh) 一种应用推荐方法、装置、存储介质及电子设备
CN111386686B (zh) 用于回答与文档相关的查询的机器阅读理解系统
WO2017040436A1 (en) Distributed server system for language understanding
US10635733B2 (en) Personalized user-categorized recommendations
Machicao et al. Authorship attribution based on life-like network automata
CN104462056A (zh) 基于深度文档分析的主动知识指导
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
JP2014106661A (ja) ユーザ状態予測装置及び方法及びプログラム
CN110852047A (zh) 一种文本配乐方法、装置、以及计算机存储介质
Wang et al. Capturing emotion distribution for multimedia emotion tagging
Xiong et al. Affective impression: Sentiment-awareness POI suggestion via embedding in heterogeneous LBSNs
CN115269786A (zh) 可解释的虚假文本检测方法、装置、存储介质以及终端
US20170293691A1 (en) Identifying Abandonment Using Gesture Movement
Xia Application technology on collaborative training of interactive learning activities and tendency preference diversion
Hakimov et al. Combining textual and graph-based features for named entity disambiguation using undirected probabilistic graphical models
Tu Named entity recognition and emotional viewpoint monitoring in online news using artificial intelligence
US20230004568A1 (en) Multiple semantic hypotheses for search query intent understanding
Islam et al. Beyond Words: Unraveling Text Complexity with Novel Dataset and A Classifier Application
Sainani et al. Extracting special information to improve the efficiency of resume selection process
Giulianelli et al. Semi-supervised emotion lexicon expansion with label propagation
Witting et al. 3.18 RT, adduct formation, and calibration curve sharing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant