CN106462564A - 在文档内提供实际建议 - Google Patents
在文档内提供实际建议 Download PDFInfo
- Publication number
- CN106462564A CN106462564A CN201580023503.3A CN201580023503A CN106462564A CN 106462564 A CN106462564 A CN 106462564A CN 201580023503 A CN201580023503 A CN 201580023503A CN 106462564 A CN106462564 A CN 106462564A
- Authority
- CN
- China
- Prior art keywords
- text
- end value
- entity
- value
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
在文档内提供建议的方法、系统和设备,包括在计算机存储介质上编码的计算机程序。在一个方面,一种方法包括:通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在所述文本输入之前已包括在所述文档中的先前文本;基于包括在所述文本输入中的实体文本来识别实体;基于包括在所述文本输入中的属性文本来识别所述实体的属性;生成指定所述实体和所述属性的查询;将所述查询提供给搜索系统,所述搜索系统针对包括在所述查询中的所述实体的所述属性提供结果值;以及将所述结果值作为建议提供给所述用户装置以用于包括在所述文档中。
Description
背景技术
本说明书涉及在文档内提供建议。
文档编辑应用向作者提供许多工具以辅助用户草拟文档,诸如文字处理文档、电子邮件消息、和网络博客帖子。这些工具所提供的辅助变化极大,从用于设计布局和格式化文本的设计辅助工具,到用于跟踪文档改变的修订跟踪工具。其它工具基于包括在文档中的文本来提供辅助,诸如检查文本的拼写错误的拼写检查工具以及检查文本的语法错误的语法检查工具。文档编辑应用所提供的各个工具通常被设计为增强草拟文档的用户体验。
发明内容
本说明书描述与提供建议以用于包括在文档中有关的技术。
通常,本说明书中所描述的主题的一个创新方面可被具体实现于方法中,所述方法包括以下动作:通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在文本输入之前已已包括在所述文档中的先前文本;基于包括在所述文本输入中的实体文本来识别实体;基于包括在所述文本输入中的属性文本来识别所述实体的属性;生成指定所述实体和所述属性的查询;将所述查询提供给搜索系统,所述搜索系统针对包括在所述查询中的所述实体的所述属性提供结果值;以及将所述结果值作为建议提供给所述用户装置以用于包括在所述文档中。此方面的其它实施例包括被配置为执行所述方法的动作的对应系统、设备以及在计算机储存器装置上编码的计算机程序。
这些和其它实施例可各自可选地包括下列特征中的一个或更多。所述方法可包括:识别包括在文本输入中的第一值,该第一值针对实体的属性;基于结果值确定第一值具有替选值;以及向用户装置提供致使显示替选值指示的数据。
提供结果值可包括用结果值替换第一值。
所述结果值可具有置信度得分,该置信度得分指示对于实体的属性而言结果值正确的置信度,并且该方法还可包括:基于结果值的置信度得分确定结果值将被提供给用户装置,并且其中,结果值仅响应于确定将提供结果值而被提供。
所述搜索系统可针对包括在查询中的实体的属性提供多个结果值,并且所述多个结果值中的每一个结果值可具有置信度得分,该置信度得分指示对于实体的属性而言结果值正确的置信度,并且该方法还可包括:基于置信度得分生成所述多个结果值中的两个或更多结果值的列表,其中,所述两个或更多结果值中的每一个结果值根据该结果值的置信度得分被置于所述列表中的有序位置中,并且其中,将结果值提供给用户装置包括向用户装置提供致使呈现所述列表的数据。
所述实体文本可包括代词,并且识别实体可包括从与文档关联的其它文本识别实体,所述其它文本是所述代词所对应于的文本。
该方法还可包括:识别包括在文本输入中的限定,所述限定与对实体的属性的潜在值的限制对应,并且所述查询还可包括所述限制。
通常,本说明书中所描述的主题的另一方面可被具体实现于方法中,所述方法包括动作:通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在文本输入之前已包括在所述文档中的先前文本;识别包括在文本输入中的查询指示符,所述查询指示符包括一个或更多预定的字符,并且作为响应:基于包括在所述文本输入中的实体文本来识别实体,基于包括在所述文本输入中的属性文本来识别实体的属性,生成指定所述实体和所述属性的查询,将所述查询提供给搜索系统,所述搜索系统针对包括在所述查询中的实体的属性提供结果值,并且将所述结果值作为建议提供给用户装置以用于包括在所述文档中,其中,所述识别实体、识别属性、生成查询、提供所述查询以及提供所述值是响应于识别到所述查询指示符而执行的。此方面的其它实施例包括被配置为执行所述方法的动作的对应系统、设备以及在计算机储存器装置上编码的计算机程序。
这些和其它实施例可各自可选地包括以下特征:将结果值提供给用户装置可包括用结果值替换查询指示符。
本说明书中所描述的主题的特定实施例可被实现为实现以下优点中的一个或更多。提供建议以用于包括在文档中可减少用户手动地草拟文档部分的需要。用户可能忘记或者不知道各种事实或者用户希望包括在文档中的其它信息,建议系统可通过向他们提供用户所需的信息来辅助用户,而无需对该辅助的明确的用户请求。用户还可通过提供指令文档编辑应用为用户请求建议的一个或更多字符来在文档内请求建议。另外,文档编辑应用可检查包括在文档中的事实以验证其准确性,将不准确的事实通知给用户和/或提供正确的事实。以上述方式提供建议可增强用户的文档创作体验并且向用户提供满足其信息需要的信息。
本说明书中所描述的主题的一个或更多实施例的细节在附图和下面的描述中阐述。主题的其它特征、方面和优点将从描述、附图和权利要求书变得显而易见。
附图说明
图1是针对文档提供建议的示例环境的框图。
图2是在文档内提供建议的示例处理的图示。
图3是针对文档提供建议的示例过程的流程图。
图4A是显示文本建议以用于包括在文档中的第一示例环境的图示。
图4B是显示文本建议以用于包括在文档中的第二示例环境的图示。
图5是示例数据处理设备的框图。
各种图中的相似的附图标记和指代指示相似的元件。
具体实施方式
建议系统为编辑文档的用户提供建议。文档是包含文本的计算机文件,诸如文字处理文档、电子邮件消息、博客帖子、SMS、MMS或相似的文本消息、或者网页以及应用中的文本输入域等。用户可利用文档编辑应用来编辑文档,所述文档编辑应用可包括例如文字处理器应用、电子邮件客户端应用、图示应用、电子表格应用、基于web的博客应用等。建议系统可使用来自各种源的信息以通过提供建议来辅助用户草拟和/或编辑文档。建议的大小范围可以是根据建议字符、字、短语、句子、段落、公式、缩写、符号等。如本文所用,“字”可涵盖上述中的任何,例如,建议“字”可以是一个或更多字符、字、短语、句子、段落、公式、缩写、符号等。是否提供建议、如何提供建议以及建议的内容取决于与例如编辑文档的用户、包括在文档中的现有文本、用户正在插入的当前文本、与编辑文档的用户有关的用户数据、关于其它用户和/或其它用户的文档的信息、和/或其它信息有关的各种类型的信息。
在一些实现方式中,建议系统可识别与文档的文本中所引用的实体有关的事实,并且将这些事实作为建议提供给编辑文档的用户装置。在一些实现方式中,实体是谈话的话题。在一些实现方式中,实体是可彼此区分的概念或事物,诸如通过其对应属性将实体联系起来的知识图中的实体。例如,用户可向文档中键入“加拿大的首都是??(”。建议系统可识别实体加拿大以及属性首都并且向搜索系统制订查询,搜索系统将提供“渥太华”作为用户正在寻找的事实。
建议系统获得提供给文档编辑应用(诸如文字处理应用或电子邮件草拟应用)的文本输入(例如,字符、字和短语)以用于包括在文档(诸如文字处理文档或电子邮件)中。建议系统在文本输入中识别实体以及实体的属性。例如,文本输入“碳的原子量是”包括实体“碳”和属性“原子量”。
然后,建议系统基于实体和实体属性来生成查询。例如,查询可以是“碳的原子量”。也可生成其它类型的查询,诸如查询具有对应属性的实体的索引的数据库查询。搜索查询被提供给搜索系统(诸如互联网搜索引擎或数据库搜索系统),搜索系统针对属性提供结果值。在先前示例中,向互联网搜索引擎提供搜索查询“碳的原子量是多少”可使得搜索引擎提供结果值“12”。
搜索引擎所提供的结果值可作为建议被提供给用户装置以用于包括在文档中。在一些实现方式中,文本输入可包括属性的值,建议系统可例如基于与结果值的比较来确定包括在文本输入中的值是否正确。在文本输入包括不正确的值的情况下,建议系统可向用户通知错误和/或建议正确的值。例如,如果文本输入是“碳的原子量是6”,则基于与正确值12的比较,值6可被识别为不正确。正确的值可被提供给用户装置作为对不正确的值的建议替换。在一些实现方式中,“不正确”的值无需为错误的,而是替选建议值可能更好或者更适当。如果文本输入包括存在替选值的值,则可提供替选值作为原始值的建议替换。
在这里所讨论的系统收集关于用户的个人信息或者可能使用个人信息的情况下,可向用户提供机会来控制程序或特征是否收集用户信息(例如,关于用户的社交网络、社交行为或活动、职业、用户的偏好或者用户的当前位置)或者控制是否和/或如何从可能与用户更相关的内容项管理系统接收内容。另外,某些数据可在被存储或使用之前按照一种或更多种方式来处理,以使得个人可识别信息被移除。例如,用户的身份可被处理以使得不会确定用户的个人可识别信息,或者在获得位置信息的情况下用户的地理位置可被一般化(例如达到城市、邮政编码或者州级别),以使得无法确定用户的特定位置。因此,用户可控制信息如何关于用户被收集以及被内容项管理系统使用。
这些特征和附加特征在下面更详细地描述。
图1是为文档提供建议的示例环境100的框图。诸如局域网(LAN)、广域网(WAN)、互联网或其组合的计算机网络102将用户装置104连接至文档系统108。在线环境100可包括任何数量的用户装置104。在一些实现方式中,用户装置104与文档系统108之间的连接可为本地的,例如,文档系统108可以是用户装置的一部分或者直接连接至用户装置,而非跨网络102连接。
用户装置104是能够经网络102来请求和接收诸如文档的资源的电子装置。示例用户装置104包括个人计算机、移动通信装置以及可经网络102发送和接收数据的其它装置。用户装置104通常包括诸如web浏览器的用户应用以方便经网络102发送和接收数据。web浏览器可使得用户能够显示通常位于网站处的网页上的文本、图像、视频、音乐、web应用以及其它信息并与其交互。
文档系统108与一个或更多用户装置104通信以例如通过提供文档编辑应用界面来使用户装置104能够访问文档。例如,文档系统108可以是:提供电子邮件界面的电子邮件服务器,用户装置104通过该电子邮件界面来读取和编写电子邮件;或者提供界面的云文字处理服务器,用户装置104通过该界面来创建、修改和共享文字处理文档、演示和电子表格。
建议系统110提供建议以用于包括在文档中。例如,建议系统110可从用户装置接收文本输入,并且建议系统110可使用文本输入来确定是否提供建议,如果提供建议,则识别建议文本以提供给用户装置。建议系统110可从文档系统108接收文本输入,或者在一些实现方式中,直接从用户装置接收文本输入。在一些实现方式中,建议系统110可包括能够识别文本中实体、属性、属性值以及它们之间的关系的实体识别组件(或者连接至实体系统)。
搜索系统116针对查询提供搜索结果。搜索系统116可以是例如互联网搜索系统、数据库搜索系统或者另一类型的搜索系统或者搜索系统类型的组合。搜索系统116可从建议系统110接收查询,并且作为响应提供搜索结果。例如,互联网搜索引擎可接收诸如“碳的原子量”的查询,并且互联网搜索引擎可搜索互联网资源的索引以获得该查询的一个或更多结果。
文档数据112用于存储由文档系统112使用的数据,并且可包括例如文档文件、用户数据和性能度量。建议数据114用于存储由建议系统110使用的数据,并且可包括例如建议的索引、建议模型训练数据、建议的性能度量、实体的索引和实体属性。搜索数据118用于存储由搜索系统116使用的数据,并且可包括例如资源索引。资源索引还可包括描述实体及其对应属性的索引或者其它可搜索数据结构。其它信息也可被存储在文档数据112、建议数据114和/或搜索数据118中。尽管在示例环境100中单独地描绘了储存器装置,在一些实现方式中文档数据112、建议数据114和/或搜索数据118中的一些或全部可在其它数据储存器装置中组合或单独地存储。
类似地,尽管文档系统108、建议系统110和搜索系统116被彼此分离地描绘,在一些实现方式中它们可以是同一系统的一部分。例如,建议系统110可以是文档系统108的组件。在一些实现方式中,可使用附加组件或系统(与所描绘的组件之一分离或者包括在所描绘的组件之一中)。例如,可使用与建议系统110分离的实体系统以识别文本内的实体和属性。在一些实现方式中,文档系统108或其一部分(诸如文档编辑应用)可包括在用户装置上。例如,在用户装置上本地运行的文档编辑应用可通过网络102与文档系统108、建议系统110和/或搜索系统116通信。
图2是用于在文档内提供建议的示例过程200的图示。文档系统108从用户装置204接收文本输入202。例如,文档系统108可以是提供用户装置204用来草拟文字处理文档的文档编辑应用的文字处理系统,文本输入202可以是用户装置提供以用于包括在文档中的文本,例如,针对文档的文本输入可以是“加拿大的首都是??”。在一些实现方式中,提供文本输入202的文档包括先前已包括在文档中的先前文本(例如,早前在草拟会话中由用户装置204输入或者在先前编辑阶段期间保存在文档中)。文本输入可由用户装置204利用任何数量的输入方法来提供,诸如基于硬件或软件的键盘输入和/或由用户装置204或者单独的转录服务/装置转录为文本的语音输入。
文本输入202被提供给建议系统110以识别一个或更多建议以用于包括在文档中。在一些实现方式中,文档系统108或建议系统110识别文本输入202中的查询指示符206(例如,“??”),并且仅响应于接收到文本输入中的查询指示符206来识别和/或提供建议。查询指示符206可包括一个或更多预定字符,当文档系统108接收到所述预定字符时,触发建议的识别。例如,示例文本输入202中的字符“??”可以是文档系统108用来确定应该何时向建议系统110提供文本输入202的字符的特殊组合。当然,字符、数字、标点等的许多其它不同组合可充当查询指示符。
在一些实现方式中,将文本输入202提供给建议系统110的决策可基于文本输入202的内容和/或上下文,该决策可独立于查询指示符206。例如,基于文本输入202的内容进行的确定可包括确定文本输入202是否包括拼写错误或者确定文本输入202是否包括对建议系统110已知的实体的引用。基于文本输入202的上下文的示例确定可包括确定用户的键入速度是否满足阈值键入速度、确定先前建议的接受率是否满足阈值接受率、或者文本输入202中的字或短语是否与文档的先前文本中的字或短语匹配。其它方法(包括上述方法的一个或更多组合)可用于确定应该向用户装置204提供建议。
建议系统110基于包括在文本输入202中的实体文本208来识别实体。例如,“加拿大的首都是??”包括实体文本208“加拿大”。可通过与建议系统110分离或者包括在建议系统110中的实体识别系统来执行识别。例如,文本输入202可被提供给实体识别模型,该实体识别模型被训练以识别文本内的实体。作为另一示例,可将文本输入202中的字和/或短语与实体索引进行比较以识别包括在文本输入202中的实体。也可使用用于识别文本输入202内的一个或更多实体的其它方法。例如,在一些实现方式中,实体文本可包括代词,并且可从包括在文档中的其它文本(诸如包括在文档中的该代词前面的文本)识别实体。例如,作为文本输入的“它的首都是”包括实体文本“它”,并且实体系统可确定在文本输入前面的句子的主语以确定“它”所指代的实体。
建议系统110还基于包括在文本输入202中的属性文本210来识别所识别的实体的属性。例如,“加拿大的首都是??”包括属性文本210“首都”。与实体识别一样,可通过与建议系统110分离或者包括在建议系统110中的实体识别系统来执行属性识别。例如,文本输入202可被提供给属性识别模型,该属性识别模型被训练以识别文本内的实体属性。作为另一示例,可将文本输入202中的字和/或短语与实体属性索引进行比较以识别包括在文本输入202中的实体属性。在一些实现方式中,可将在文本输入202中识别的实体的属性与文本输入202中的字和短语进行比较以识别匹配。例如,实体加拿大可具有诸如大小、人口、官方语言、GDP、建立日和首都等等的许多属性。当在文本输入202中识别出加拿大时,实体识别系统可将加拿大的属性的列表与文本输入202进行比较以识别文本输入202中所引用的加拿大的属性。也可使用用于识别文本输入202内的一个或更多实体属性的其它方法(包括方法的组合)。
在文本输入202中识别到实体(例如,加拿大)和实体属性(例如,首都)之后,建议系统110生成指定实体和实体属性的查询212。例如,示例处理200描绘了查询212“加拿大的首都是哪里??”尽管示出了自然语言查询,可生成任何适当的查询类型,诸如未结构化查询或者甚至结构化查询语言的查询。由建议系统110生成的查询212的类型和内容可取决于该查询将被提供至的搜索系统116的类型。例如,可向语义搜索系统116提供语义查询,而可向数据库搜索系统提供数据库查询。
在一些实现方式中,文本输入中可包括限制属性的潜在值的一个或更多限定。例如,文本输入“声音在水中的速度是”包括实体“声音”、实体属性“速度”和限定“在水中”。在这种情况下,所述限定是对值的限制,其可以包括在提供给搜索系统116的搜索查询中。尽管上述示例指示“在水中”是对实体“声音”的“速度”属性的限制,在一些实现方式中,某些限制可包括在它们自己的属性中,例如,“在水中的速度”可以是实体“”声音的属性。
查询212被提供给搜索系统116,搜索系统116将响应于查询212提供一个或更多结果值。如上所述,可向不同类型的搜索系统116提供查询212(例如,互联网搜索引擎和/或数据库搜索系统)。搜索系统116识别所接收的查询212中描述的实体的属性的一个或更多属性值。例如,搜索系统116可使用实体索引来确定实体加拿大具有属性“首都”,该属性的值为例如“渥太华”,加拿大的首都。
在一些实现方式中,每个结果值214具有置信度得分,其指示结果值214正确的置信度的度量。在示例过程200中,例如按照0至1的等级,结果值214具有置信度得分1.0,指示结果值214“渥太华”是加拿大的首都的置信度的最大度量。也可使用置信度的其它度量,诸如正确识别的可能性或者指示介于0和无穷大之间的置信度的度量的矢量。
在一些实现方式中,搜索系统116可针对特定查询提供多个结果值214。所述多个值可在特殊字符的位置处以下拉上下文菜单的形式提供。例如,文本输入可以是“??在电影“超级英雄”中扮演超级英雄”。针对该文本输入生成的示例查询可以是“谁在“超级英雄”中扮演超级英雄?”。例如,如果电影超级英雄中有多位超级英雄角色和/或如果存在多部名为超级英雄的电影,则针对在名为超级英雄的电影中扮演超级英雄的演员可存在多个结果值。在这种情况下,每个结果值的置信度得分可用于指示搜索系统116具有最高置信度的结果值。
在一些实现方式中,文本输入可包括文本输入中所引用的实体的属性的值,并且搜索系统116或建议系统110可基于搜索系统116所提供的结果值来确定该值是否正确。例如,文本输入可以是加拿大的首都是多伦多”。在此示例中,建议系统110可基于“多伦多”和“安大略”的比较以及结果值“安大略”的置信度得分确定,并且使用该信息确定文本输入是不正确的和/或存在替选值。在这种情况下,建议系统110可提供“安大略”作为对“多伦多”的建议替换。在一些实现方式中,可提供附加或替选建议。例如,多伦多也可以是实体,并且它可具有属性“的首都”,属性值为“安大略”。由于在此示例文本输入中该特定错误的本质,可向用户装置提供附加或替选建议以用“安大略”替换“多伦多”。
在一些实现方式中,建议系统110基于结果值214的置信度得分来确定任何结果值214是否将作为建议216提供。例如,具有最高置信度得分的结果值可被选择以用于作为建议呈现。在一些实现方式中,结果值214可根据其置信度得分来排序,并且最前面的N个被选择以用于作为建议呈现,其中N是正整数。在一些实现方式中,可使用一个或更多阈值,例如,如果结果值214的相应置信度得分满足预定的置信度得分阈值,则只有结果值214才可被选择以用于作为建议216呈现。
在多个替选建议可有资格呈现的情况下,如果将仅提供一个建议,则与一个或两个建议关联的置信度得分可用于确定提供哪一建议。在一些实现方式中,置信度得分可至少部分地基于文本输入的上下文。利用错误文本输入的先前示例“加拿大的首都是多伦多”,在该文本输入之前已包括在文档中的先前文本可能指示该文档与安大略有关,而非加拿大,这可增加建议用“安大略”替换“加拿大”的可能性,而非用“渥太华”替换“多伦多”。
由搜索系统116识别的结果值214中的至少一个作为建议216被提供给用户装置204。例如,建议系统110可选择具有最高置信度得分的结果值214以提供给用户装置204。在将要提供多个结果值的实现方式中,建议系统110可例如根据其置信度得分来对结果值进行排列,并且将结果值提供给用户装置以用于(例如,在根据置信度得分排序的列表中)显示。在一些实现方式中,将结果值214作为建议216提供给用户装置204包括用结果值替换查询指示符206。例如,文档系统108可在用户的文档中用结果值214“渥太华”替换字符“??”。建议可被提供用于各种不同的应用类型,诸如电子表格应用、图示应用和微博应用等等;还可使用用于提供建议和/或通知的其它用户界面选项,诸如挑选列表、嵌套列表、注脚等。
尽管在示例过程200的图示中分离地描绘了诸如文档系统108、建议系统110和搜索系统116的各种组件,所述组件可被包括在单个系统中(如包围所述组件的点线所示)或者与所描绘的组合不同的组合的系统中(例如,包括分离的实体识别组件的系统中)。
图3是为文档提供建议的示例过程300的流程图。过程300可由诸如上面参照图2描述的系统的建议系统执行。
获得由用户装置提供给文档编辑应用的文本输入(302)。所述文本输入被提供给文档编辑应用以用于包括在文档中,并且该文档包括在该文本输入之前已包括在文档中的先前文本。例如,电子邮件应用可包括允许用户草拟并经由电子邮件与其他用户交流的应用界面。针对电子邮件的文本输入可包括“我的航班预计在??到达,因此请来接我别迟到”。
在一些实现方式中,识别包括在文本输入中的查询指示符(304)。例如,字符“??”可已经被预先定义为查询指示符。在一些实现方式中,是否针对文本输入提供建议可取决于是否已在文本输入中识别到查询指示符。替选地,系统可被配置为即使在缺少查询指示符的情况下也提供建议。
基于包括在文本输入中的实体文本来识别实体(306)。例如,文本输入可被提供给实体识别模型,该实体识别模型提供该文本输入的一个或更多实体作为输出。实体文本是表示实体的文本。在示例文本输入“我的航班预计在??到达,因此请来接我别迟到”中,文本“航班”可以是表示航班的实体文本,并且文本“我”也可以是表示电子邮件的作者的实体文本。实体文本所表示的具体航班可在文档的其它文本或者与该作者关联的其它文本(例如,作者先前引用过该特定航班的文档中的文本或者包括在先前接收的电子邮件中的指示该特定航班的文本)中识别。在一些实现方式中,实体文本包括代词,并且识别实体包括从与该文档关联的其它文本识别实体,所述其它文本是所述代词所对应于的文本。在上述示例中,实体文本“我”是指代该文档的作者的代词。在一些情况下,代词可从例如前面的句子或段落的主语来识别并且指代该主语。
基于包括在文本输入中的属性文本来识别实体的属性(308)。例如,也可使用实体识别模型来识别文本输入中的实体的属性。在一些实现方式中,可使用分离的模型来识别文本输入内的属性。作为示例,在文本输入中识别的实体可在索引中具有指示哪些字可能是实体的属性的属性词项(例如,关键字)。例如,实体“航班”可与指示属性的关键字(诸如“起飞”、“正在起飞”、“起飞时间”等)关联,以表示航班的起飞时间的属性。
在一些实现方式中,识别包括在文本输入中的第一值,该第一值针对实体的属性。例如,如果文本输入为“我的航班预计在上午9:00到达,因此请来接我别迟到”,则文本“上午9:00”可被识别为属性“到达时间”的第一值。在这种情况下,可检查第一值的准确性。
生成指定实体和属性的查询(310)。利用先前的示例,实体文本“航班”可表示特定航线的航班406,并且属性文本“到达”可表示航班406的到达时间,并且所生成的查询可为“航班406预计何时到达?”。诸如航线和/或航班的日期的其它信息也可被包括在查询中。在一些实现方式中,识别包括在文本输入中的限定,所述限定与对实体的属性的潜在值的限制对应,并且查询包括所述限制。例如,在先前的示例中,两个航班可能与电子邮件的作者关联,并且文本输入可包括诸如“第一”航班或“第二”航班的限定词,其可用于识别应该针对哪一航班生成查询。作为另外的示例,文本输入“1950年标准美国邮政邮票的价格为??”包括限定“1950年”,其可被包括在查询中。
将查询提供给搜索系统,该搜索系统针对包括在查询中的实体的属性提供结果值(312)。例如,查询可被提供给互联网搜索引擎、实体搜索系统、或者另一搜索系统或搜索系统的组合以识别查询的一个或更多结果值。例如,搜索系统可为查询“航班406预计何时到达?”提供航班406的到达时间(例如,上午10:00)。
在识别出第一值的实现方式中,可基于该结果值确定第一值不正确。例如,文本输入“我的航班预计在上午9:00到达,因此请来接我别迟到”包括第一值“上午9:00”。搜索系统所提供的结果值可为“上午10:00”。在这种情况下,第一值可被识别为不正确的值,因为它与搜索系统所提供的结果值不匹配。在一些实现方式中,可确定第一值具有替选值,例如,值可能非不正确,而是可能存在更好的值。在上述情况下,在一些实现方式中,可向用户装置提供使得显示不正确或替选值指示的数据(例如,不正确值的弹出或高亮)。
在一些实现方式中,结果值具有置信度得分,其指示对于实体的属性而言结果值正确的置信度。在这些实现方式中,可基于结果值的置信度得分确定结果值将被提供给用户装置,并且该结果值可仅响应于确定将提供结果值来提供。例如,可使用预定的置信度得分阈值来控制将结果值作为建议提供给用户装置,例如,结果值必须具有0.75以上的置信度得分以作为建议被提供给用户装置。
在一些实现方式中,搜索系统针对包括在查询中的实体的属性提供多个结果值,并且每个结果值具有置信度得分,其指示对于实体的属性而言结果值正确的置信度。在这些实现方式中,可基于置信度得分生成两个或更多结果值的列表,其中每个结果值根据该结果值的置信度得分被置于列表中的有序位置中。例如,如果结果值是距离的度量(例如,从纽约到伦敦的距离),则多个距离测量可得到值,包括使用公里作为距离度量的度量,而另一结果值可按照英里来表示同一距离。两个结果值可均为正确的,具有相对高的置信度度量,并且二者可例如按照列表呈现给用户装置,以使得用户可从以英里表示的测量或者以公里表示的测量中选择。
将结果值作为建议提供给用户装置以用于包括在文档中(314)。可使用多种方法来将建议提供给用户装置。在一些实现方式中,结果值作为原位建议提供,其可包括将结果值插入文本输入内的适当位置中(有通知或没有通知)。在识别出不正确或替选值的实现方式中,不正确值或者识别出替选值的值可由结果值替换。在将要提供多个建议的实现方式中,可向用户装置提供使得显示可选择结果值的列表的数据,从而允许用户选择将哪一结果值包括在文档中。在使用查询指示符的实现方式中,提供给用户装置的结果值可替换查询指示符。
图4A和图4B是显示文本建议以用于包括在文档中的示例环境的图示。图4A描绘了用于电子通信的示例基于web的电子邮件应用400。在电子邮件的正文中,已经针对文本“碳的原子量是6”识别出不正确值402。示例建议404“12”可以是作为值“6”的纠正提供的建议。例如,建议系统可向搜索系统发送查询以识别碳的原子量,并且在识别出输入文本中的不正确值之后,向文档系统提供将要提供给用户装置的建议。
图4B描绘了用于创建文字处理文档的示例文字处理应用450。文本包括指示文档系统应该向建议系统寻求建议的查询指示符452。在查询指示符452之前的任何或所有字可被提供给建议系统,该建议系统提供以弹出形式示出的文本建议454。如上所述,图4A和图4B中描绘文本建议的图示是示例,并且也可使用其它方法来显示文本建议,包括显示建议置信度的指示符、就自动插入的文本建议提供通知、提示用户认证以获得建议和/或提供标识文本建议的源的指示符。
图5是示例数据处理设备500的框图。系统500包括处理器510、存储器520、储存器装置530、和输入/输出装置540。组件510、520、530和540中的每一个可例如利用系统总线550来互连。处理器510能够处理用于在系统500内执行的指令。在一个实现方式中,处理器510是单线程处理器。在另一实现方式中,处理器510是多线程处理器。处理器510能够处理存储在存储器520中或储存器装置530上的指令。
存储器520存储系统500内的信息。在一个实现方式中,存储器520是计算机可读介质。在一个实现方式中,存储器520是易失性存储器单元。在另一实现方式中,存储器520是非易失性存储器单元。
储存器装置530能够为系统500提供大容量存储。在一个实现方式中,储存器装置530是计算机可读介质。在各种不同的实现方式中,储存器装置530可例如包括硬盘装置、光盘装置、或者一些其它大容量储存器装置。
输入/输出装置540为系统500提供输入/输出操作。在一个实现方式中,输入/输出装置540可包括一个或更多网络接口装置,例如以太网卡、串行通信装置(例如,RS-232端口)、和/或无线接口装置(例如,802.11卡)。在另一实现方式中,输入/输出装置可包括被配置为接收输入数据并且将输出数据发送给其它输入/输出装置(例如,键盘、打印机和显示装置560)的驱动器装置。然而,也可使用其它实现方式,诸如移动计算装置、移动通信装置、机顶盒电视客户端装置等。
本说明书中所描述的主题和操作的实施例可被实现于数字电子电路中、或者计算机软件、固件或硬件中(包括本说明书中所公开的结构及其结构上的等同物)、或者它们中的一个或多个的组合中。本说明书中所描述的主题的实施例可被实现为一个或多个计算机程序,即,计算机程序指令的一个或多个模块,其被编码于计算机存储介质上以便于由数据处理设备执行或者控制数据处理设备的操作。
计算机存储介质可以是或者可被包括在计算机可读储存器装置、计算机可读储存器衬底、随机或串行存取存储器阵列或装置、或者它们中的一个或多个的组合中。此外,尽管计算机存储介质不是传播信号,但是计算机存储介质可以是被编码于人为生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质还可以是或者被包括在一个或多个分离的物理组件或介质(例如,多个CD、盘或者其它储存器装置)中。
本说明书中所描述的操作可被实现为由数据处理设备对存储在一个或多个计算机可读存储介质上或者从其它源接收的数据执行的操作。
术语“数据处理设备”涵盖了用于处理数据的所有类型的设备、装置和机器,包括例如可编程处理器、计算机、芯片上系统或者上述中的多个或组合。设备可包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件以外,所述设备还可包括为所述的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行环境、虚拟机或者它们中的一个或多个的组合的代码。所述设备和执行环境可实现各种不同的计算模型基础结构,例如web服务、分布式计算和网格计算基础结构。
计算机程序(也称作程序、软件、软件应用、脚本或代码)可按照包括编译或解释语言、声明或过程语言的任何形式的编程语言来编写,并且它可按照任何形式来部署,包括作为独立程序或者作为模块、组件、子例程、对象或者适合用在计算环境中的其它单元。计算机程序可以(但无需)对应于文件系统中的文件。程序可被存储在保存其它程序或数据的文件的一部分(例如,存储在标记语言文档中的一个或多个脚本)中、专用于所述程序的单个文件中、或者多个协同的文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。计算机程序可被部署为在一个计算机上或者在位于一个地点或分布在多个地点并通过通信网络互连的多个计算机上执行。
本说明书中所描述的处理和逻辑流程可由一个或多个可编程处理器来执行,其执行一个或多个计算机程序以通过对输入数据操作并生成输出来执行动作。所述处理和逻辑流程还可由专用逻辑电路执行并且所述设备也可被实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器二者以及任何类型的数字计算机的任一个或多个处理器。通常,处理器将从只读存储器或者随机存取存储器或者这二者接收指令和数据。计算机的基本元件是用于依据指令执行动作的处理器以及用于存储指令和数据的一个或多个存储器装置。通常,计算机还将包括用于存储数据的一个或多个大容量储存器装置(例如,磁盘、磁光盘或光盘),或者在操作上耦合以从其接收数据或向其传送数据,或者这二者。然而,计算机无需具有此类装置。此外,计算机可被嵌入另一装置中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器、或者便携式储存器装置(例如,通用串行总线(USB)闪速驱动器)等等。适合于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器装置,包括例如半导体存储器装置,例如EPROM、EEPROM和闪速存储器装置;磁盘,例如内部硬盘或可移除盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可通过专用逻辑电路来补充或者被并入其中。
为了提供与用户的交互,本说明书中所描述的主题的实施例可被实现于具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)以及用户可通过其向计算机提供输入的键盘和指示装置(例如,鼠标或者轨迹球)的计算机上。也可使用其它类型的装置来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如视觉反馈、听觉反馈或者触觉反馈;并且来自用户的输入可按照任何形式来接收,包括声音、话语或触觉输入。另外,计算机可通过向用户所使用的装置发送文档以及从其接收文档(例如,通过响应于从用户的用户装置上的web浏览器接收的请求向该web浏览器发送网页)来与用户交互。
本说明书中所描述的主题的实施例可被实现于包括后端组件(例如数据服务器)或者包括中间件组件(例如应用服务器)或者包括前端组件(例如具有图形用户界面或者Web浏览器的用户计算机,用户可通过其来与本说明书中所描述的主题的实现方式交互)或者一个或多个此类后端、中间件或前端组件的任何组合的计算系统中。系统的组件可通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、网际网(例如,互联网)和对等网络(例如,自组对等网络)。
计算系统可包括用户和服务器。用户和服务器通常彼此远离,并且通常通过通信网络来交互。用户和服务器的关系通过在相应计算机上运行并且彼此具有用户-服务器关系的计算机程序来建立。在一些实施例中,服务器将数据(例如,HTML页面)发送给用户装置(例如,为了将数据显示给与用户装置交互的用户以及从该用户接收用户输入)。在服务器处可从用户装置接收在用户装置处生成的数据(例如,用户交互的结果)。
尽管本说明书包含许多具体实现方式细节,但是这些细节不应被解释为对任何发明或者要求保护的内容的范围的限制,而应当被解释为针对特定发明的特定实施例的特征的描述。在本说明书中在单独的实施例的背景下描述的某些特征也可被组合地实现于单个实施例中。相反地,在单个实施例的背景下描述的各种特征也可单独地或者按照任何合适的子组合被实现于多个实施例中。此外,尽管上面可能将特征描述为按照某些组合起作用并且甚至初始如此要求保护,但是来自要求保护的组合的一个或多个特征在一些情况下可从组合中删去,并且要求保护的组合可涉及子组合或者子组合的变体。
类似地,尽管在附图中按照特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序或者以连续顺序来执行,或者要求全部图示的操作均被执行才能实现所期望的结果。在某些环境中,多任务和并行处理可为有利的。此外,在上述实施例中的各种系统组件的分离不应被理解为在所有实施例中均要求这样的分离,应当理解,所描述的程序组件和系统通常可被一起集成到单个软件产品中或者被封装到多个软件产品中。
因此,已描述了主题的特定实施例。其它实施例在以下权利要求的范围内。在一些情况下,权利要求中记载的动作可按照不同的顺序来执行并且仍然实现所期望的结果。另外,在附图中描绘的处理未必要求所示的特定顺序或者连续顺序才能实现所期望的结果。在某些实现方式中,多任务和并行处理可为有利的。
Claims (20)
1.一种由数据处理设备实现的方法,所述方法包括:
通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在所述文本输入之前在所述文档中已包括的先前文本;
基于在所述文本输入中包括的实体文本来识别实体;
基于在所述文本输入中包括的属性文本来识别所述实体的属性;
生成指定所述实体和所述属性的查询;
将所述查询提供给搜索系统,所述搜索系统针对在所述查询中包括的所述实体的所述属性来提供结果值;以及
将所述结果值作为建议提供给所述用户装置,以用于包括在所述文档中。
2.根据权利要求1所述的方法,所述方法还包括:
识别在所述文本输入中包括的第一值,所述第一值是用于所述实体的所述属性;
基于所述结果值,确定所述第一值具有替选值;以及
向所述用户装置提供致使显示替选值指示的数据。
3.根据权利要求2所述的方法,其中,提供所述结果值包括:用所述结果值替换所述第一值。
4.根据权利要求1所述的方法,其中,所述结果值具有置信度得分,所述置信度得分指示对于所述实体的所述属性而言所述结果值是正确的置信度,并且其中,所述方法还包括:
基于所述结果值的所述置信度得分,确定所述结果值将被提供给所述用户装置,并且其中,仅响应于确定将要提供所述结果值而提供所述结果值。
5.根据权利要求1所述的方法,其中,所述搜索系统针对在所述查询中包括的所述实体的所述属性提供多个结果值,并且所述多个结果值中的每一个结果值具有置信度得分,所述置信度得分指示对于所述实体的所述属性而言所述结果值是正确的置信度,并且其中,所述方法还包括:
基于所述置信度得分,生成所述多个结果值中的两个或更多结果值的列表,其中,根据所述结果值的所述置信度得分,所述两个或更多结果值中的每一个结果值被置于所述列表中的有序位置中,并且其中,将所述结果值提供给所述用户装置包括:向所述用户装置提供致使呈现所述列表的数据。
6.根据权利要求1所述的方法,其中,所述实体文本包括代词,并且其中,识别所述实体包括:从与所述文档关联的其它文本识别所述实体,所述其它文本是所述代词所对应的文本。
7.根据权利要求1所述的方法,所述方法还包括:
识别在所述文本输入中包括的限定,所述限定与对所述实体的所述属性的潜在值的限制对应,并且其中,所述查询还包括所述限制。
8.一种由数据处理设备实现的方法,所述方法包括:
通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在所述文本输入之前在所述文档中已包括的先前文本;
识别在所述文本输入中包括的查询指示符,所述查询指示符包括一个或更多预定的字符,并且作为响应:
基于在所述文本输入中包括的实体文本来识别实体;
基于在所述文本输入中包括的属性文本来识别所述实体的属性;
生成指定所述实体和所述属性的查询;
将所述查询提供给搜索系统,所述搜索系统针对在所述查询中包括的所述实体的所述属性来提供结果值;以及
将所述结果值作为建议提供给所述用户装置,以用于包括在所述文档中;
其中,所述识别实体、识别属性、生成查询、提供所述查询以及提供所述值是响应于识别到所述查询指示符而执行的。
9.根据权利要求8所述的方法,其中,将所述结果值提供给所述用户装置包括:用所述结果值替换所述查询指示符。
10.一种系统,包括:
一个或更多数据处理设备;以及
存储指令的数据储存器装置,所述指令在被所述一个或更多数据处理设备执行时,致使所述一个或更多数据处理设备执行操作,所述操作包括:
通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在所述文本输入之前在所述文档中已包括的先前文本;
基于在所述文本输入中包括的实体文本来识别实体;
基于在所述文本输入中包括的属性文本来识别所述实体的属性;
生成指定所述实体和所述属性的查询;
将所述查询提供给搜索系统,所述搜索系统针对在所述查询中包括的所述实体的所述属性来提供结果值;以及
将所述结果值作为建议提供给所述用户装置,以用于包括在所述文档中。
11.根据权利要求10所述的系统,其中,所述操作还包括:
识别在所述文本输入中包括的第一值,所述第一值是用于所述实体的所述属性;
基于所述结果值,确定所述第一值具有替选值;以及
向所述用户装置提供致使显示替选值指示的数据。
12.根据权利要求11所述的系统,其中,提供所述结果值包括:用所述结果值替换所述第一值。
13.根据权利要求10所述的系统,其中,所述结果值具有置信度得分,所述置信度得分指示对于所述实体的所述属性而言所述结果值是正确的置信度,并且其中,所述操作还包括:
基于所述结果值的所述置信度得分,确定所述结果值将被提供给所述用户装置,并且其中,仅响应于确定将要提供所述结果值而提供所述结果值。
14.根据权利要求10所述的系统,其中,所述搜索系统针对在所述查询中包括的所述实体的所述属性提供多个结果值,并且所述多个结果值中的每一个结果值具有置信度得分,所述置信度得分指示对于所述实体的所述属性而言所述结果值是正确的置信度,并且其中,所述操作还包括:
基于所述置信度得分,生成所述多个结果值中的两个或更多结果值的列表,其中,根据所述结果值的所述置信度得分,所述两个或更多结果值中的每一个结果值被置于所述列表中的有序位置中,并且其中,将所述结果值提供给所述用户装置包括:向所述用户装置提供致使呈现所述列表的数据。
15.根据权利要求10所述的系统,其中,所述实体文本包括代词,并且其中,识别所述实体包括:从与所述文档关联的其它文本识别所述实体,所述其它文本是所述代词所对应的文本。
16.根据权利要求10所述的系统,其中,所述操作还包括:
识别在所述文本输入中包括的限定,所述限定与对所述实体的所述属性的潜在值的限制对应,并且其中,所述查询还包括所述限制。
17.一种包括指令的计算机可读介质,所述指令在被一个或更多数据处理设备执行时,致使所述一个或更多数据处理设备执行操作,所述操作包括:
通过用户装置获得提供给文档编辑应用的文本输入,所述文本输入被提供给文档编辑应用以用于包括在文档中,并且其中,所述文档包括在所述文本输入之前在所述文档中已包括的先前文本;
基于在所述文本输入中包括的实体文本来识别实体;
基于在所述文本输入中包括的属性文本来识别所述实体的属性;
生成指定所述实体和所述属性的查询;
将所述查询提供给搜索系统,所述搜索系统针对在所述查询中包括的所述实体的所述属性来提供结果值;以及
将所述结果值作为建议提供给所述用户装置,以用于包括在所述文档中。
18.根据权利要求17所述的计算机可读介质,其中,所述操作还包括:
识别在所述文本输入中包括的第一值,所述第一值是用于所述实体的所述属性;
基于所述结果值,确定所述第一值具有替选值;以及
向所述用户装置提供致使显示替选值指示的数据。
19.根据权利要求18所述的计算机可读介质,其中,提供所述结果值包括:用所述结果值替换所述第一值。
20.根据权利要求17所述的计算机可读介质,其中,所述结果值具有置信度得分,所述置信度得分指示对于所述实体的所述属性而言所述结果值是正确的置信度,并且其中,所述操作还包括:
基于所述结果值的所述置信度得分,确定所述结果值将被提供给所述用户装置,并且其中,仅响应于确定将要提供所述结果值而提供所述结果值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/275,478 US20150324339A1 (en) | 2014-05-12 | 2014-05-12 | Providing factual suggestions within a document |
US14/275,478 | 2014-05-12 | ||
PCT/US2015/029872 WO2015175337A1 (en) | 2014-05-12 | 2015-05-08 | Providing factual suggestions within a document |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106462564A true CN106462564A (zh) | 2017-02-22 |
Family
ID=53180897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580023503.3A Pending CN106462564A (zh) | 2014-05-12 | 2015-05-08 | 在文档内提供实际建议 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150324339A1 (zh) |
EP (1) | EP3143513A1 (zh) |
CN (1) | CN106462564A (zh) |
WO (1) | WO2015175337A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020233444A1 (zh) * | 2019-05-21 | 2020-11-26 | 北京字节跳动网络技术有限公司 | 在线文档插入信息方法及装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6421669B2 (ja) * | 2015-03-26 | 2018-11-14 | 富士通株式会社 | 評価方法、評価プログラム、及び評価装置 |
US10503818B2 (en) * | 2016-01-14 | 2019-12-10 | Microsoft Technology Licensing, Llc. | Content authoring inline commands |
US11188710B2 (en) * | 2016-12-30 | 2021-11-30 | Dropbox, Inc. | Inline content item editor commands |
WO2019164470A1 (en) * | 2018-02-20 | 2019-08-29 | Microstrategy Incorporated | Intelligent recommendations |
US11270215B2 (en) * | 2018-02-20 | 2022-03-08 | Microstrategy Incorporated | Intelligent recommendations |
CA3231830A1 (en) | 2019-08-05 | 2021-02-11 | Ai21 Labs | Systems and methods of controllable natural language generation |
US11947563B1 (en) * | 2020-02-29 | 2024-04-02 | The Pnc Financial Services Group, Inc. | Systems and methods for collecting and distributing digital experience information |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060224570A1 (en) * | 2005-03-31 | 2006-10-05 | Quiroga Martin A | Natural language based search engine for handling pronouns and methods of use therefor |
CN102622413A (zh) * | 2012-02-17 | 2012-08-01 | 清华大学 | 一种回答自然语言问题的方法与装置 |
CN102737039A (zh) * | 2011-04-07 | 2012-10-17 | 北京百度网讯科技有限公司 | 索引建立方法、搜索方法和搜索结果排序方法及对应装置 |
US20130124964A1 (en) * | 2011-11-10 | 2013-05-16 | Microsoft Corporation | Enrichment of named entities in documents via contextual attribute ranking |
US8688698B1 (en) * | 2011-02-11 | 2014-04-01 | Google Inc. | Automatic text suggestion |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8620083B2 (en) * | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US9507879B2 (en) * | 2014-01-02 | 2016-11-29 | Adobe Systems Incorporated | Query formation and modification |
-
2014
- 2014-05-12 US US14/275,478 patent/US20150324339A1/en not_active Abandoned
-
2015
- 2015-05-08 WO PCT/US2015/029872 patent/WO2015175337A1/en active Application Filing
- 2015-05-08 EP EP15722909.7A patent/EP3143513A1/en not_active Withdrawn
- 2015-05-08 CN CN201580023503.3A patent/CN106462564A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060224570A1 (en) * | 2005-03-31 | 2006-10-05 | Quiroga Martin A | Natural language based search engine for handling pronouns and methods of use therefor |
US8688698B1 (en) * | 2011-02-11 | 2014-04-01 | Google Inc. | Automatic text suggestion |
CN102737039A (zh) * | 2011-04-07 | 2012-10-17 | 北京百度网讯科技有限公司 | 索引建立方法、搜索方法和搜索结果排序方法及对应装置 |
US20130124964A1 (en) * | 2011-11-10 | 2013-05-16 | Microsoft Corporation | Enrichment of named entities in documents via contextual attribute ranking |
CN102622413A (zh) * | 2012-02-17 | 2012-08-01 | 清华大学 | 一种回答自然语言问题的方法与装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020233444A1 (zh) * | 2019-05-21 | 2020-11-26 | 北京字节跳动网络技术有限公司 | 在线文档插入信息方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2015175337A1 (en) | 2015-11-19 |
US20150324339A1 (en) | 2015-11-12 |
EP3143513A1 (en) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11709829B2 (en) | Retrieving context from previous sessions | |
US10832008B2 (en) | Computerized system and method for automatically transforming and providing domain specific chatbot responses | |
CN106462565B (zh) | 在文档内更新文本 | |
CN106462564A (zh) | 在文档内提供实际建议 | |
US11599729B2 (en) | Method and apparatus for intelligent automated chatting | |
US10572590B2 (en) | Cognitive matching of narrative data | |
US9881010B1 (en) | Suggestions based on document topics | |
JP5379138B2 (ja) | 領域辞書の作成 | |
Chen et al. | A bibliometric review of natural language processing empowered mobile computing | |
US11675975B2 (en) | Word classification based on phonetic features | |
CN108701125A (zh) | 用于建议表情符号的系统和方法 | |
US10579727B2 (en) | Hybrid grammatical and ungrammatical parsing | |
CN105408891A (zh) | 用于多用户多语言通信的系统和方法 | |
CN110187780B (zh) | 长文本预测方法、装置、设备和存储介质 | |
US20180276210A1 (en) | Dynamic summary generator | |
US20180101521A1 (en) | Avoiding sentiment model overfitting in a machine language model | |
CN109978629A (zh) | 一种广告投放方法、装置、电子设备及存储介质 | |
Arshi Saloot et al. | Twitter corpus creation: The case of a Malay Chat-style-text Corpus (MCC) | |
KR20160141682A (ko) | 메신저 기반 서비스 제공 장치 및 이를 이용한 방법 | |
CN110738056A (zh) | 用于生成信息的方法和装置 | |
KR20200032873A (ko) | 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템 및 그 제어 방법 | |
CN107220249A (zh) | 基于分类的全文搜索 | |
US20220398381A1 (en) | Digital content vernacular analysis | |
CN114528409A (zh) | 一种对信访件要素信息的抽取结果评价的方法及装置 | |
TW201901487A (zh) | 能對網路資料進行解析並據以模擬特定對象之方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170222 |