CN114600112A - 使用自然语言处理的文档标记和导航 - Google Patents
使用自然语言处理的文档标记和导航 Download PDFInfo
- Publication number
- CN114600112A CN114600112A CN202080048247.4A CN202080048247A CN114600112A CN 114600112 A CN114600112 A CN 114600112A CN 202080048247 A CN202080048247 A CN 202080048247A CN 114600112 A CN114600112 A CN 114600112A
- Authority
- CN
- China
- Prior art keywords
- text document
- model
- text
- nlp
- markup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04815—Interaction with a metaphor-based environment or interaction object displayed as three-dimensional, e.g. changing the user viewpoint with respect to the environment or object
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种方法,包括获得文本文档,通过第一自然语言处理(NLP)模型生成文本文档的第一标记,并且显示文本文档和第一标记。所述方法还包括接收与第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述方法还包括,基于与第一标记的所述部分的用户交互,选择第二NLP模型,通过第二NLP模型来处理文本文档的所述部分,其中第二NLP模型与第一NLP模型不同。所述方法还包括基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记,并且显示文本文档和第二标记。
Description
背景技术
自然语言处理(NLP)算法允许计算设备分析自然语言数据,诸如书写的文本或说出的词。NLP算法可以采取基于规则的算法、统计算法和/或机器学习算法的形式。例如,各种人工神经网络架构可以被训练以执行NLP任务。NLP任务的示例包括文档解析、确定词、短语、句子或段落的语义表示、情感分析和文本的机器翻译等。
发明内容
自然语言处理(NLP)模型/算法可以被用于改进文本文档的方面的导航和有效表示两者。具体地,第一NLP模型可以生成表示文本文档的方面的第一标记。与第一标记的部分的交互可以表明读者对文本文档的相应部分或方面感兴趣。基于所述交互,第二NLP模型可以被用于生成指向文本文档的相应部分或方面的第二标记。因此,与文本文档的用户交互可以驱动用于处理文本文档的NLP模型的序列,从而生成为特定用户定制的标记序列,这与例如使用一个NLP模型以通用方式处理文本文档而不考虑用户交互——其中可能需要大量的计算处理资源——相反。
在第一示例实施例中,一种方法可以包括获得文本文档,通过由第一NLP模型处理文本文档来生成文本文档的第一标记,并且通过用户接口显示文本文档和文本文档的第一标记。所述方法还可以包括接收与文本文档的第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述方法还可以包括,基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过该第二NLP模型来处理文本文档的所述部分。第二NLP模型可以与第一NLP模型不同。所述方法还可以包括,基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记,并且通过用户接口显示文本文档和文本文档的第二标记。
在第二示例实施例中,一种系统可以包括处理器和其上存储有指令的非暂时性计算机可读介质,当指令被处理器执行时,使得处理器执行操作。操作可以包括获得文本文档,通过由第一NLP模型处理文本文档来生成文本文档的第一标记,并且通过用户接口显示文本文档和文本文档的第一标记。所述操作还可以包括接收与文本文档的第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述操作可以另外包括,基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过该第二NLP模型来处理文本文档的所述部分。第二NLP模型可以与第一NLP模型不同。所述操作还可以包括,基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记,并且通过用户接口显示文本文档和文本文档的第二标记。
在第三示例实施例中,非暂时性计算机可读存储介质上可以存储有指令,当由计算设备执行时,这些指令使得计算设备执行操作。操作可以包括获得文本文档,通过由第一NLP模型处理文本文档来生成文本文档的第一标记,并且通过用户接口显示文本文档和文本文档的第一标记。所述操作还可以包括接收与文本文档的第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述操作可以另外包括,基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过该模型来处理文本文档的所述部分。第二NLP模型可以与第一NLP模型不同。所述操作还可以包括,基于选择第二自NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记,并且通过用户接口显示文本文档和文本文档的第二标记。
在第四示例实施例中,系统可以包括用于获得文本文档的装置、用于通过由第一装置模型处理文本文档来生成文本文档的第一标记的装置、以及用于显示文本文档和文本文档的第一标记的装置。所述系统还可以包括用于接收与文本文档的第一标记的一部分的用户交互的装置。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述系统还可以包括用于基于与文本文档的第一标记的一部分的用户交互来选择第二装置模型的装置,通过该第二装置模型来处理文本文档的所述部分。第二NLP模型可以与第一NLP模型不同。所述系统还可以包括用于基于选择第二装置模型,通过由第二装置模型处理文本文档的至少所述部分来生成文本文档的第二标记的装置。所述系统还可以包括用于显示文本文档和文本文档的第二标记的装置。
通过阅读以下详细描述,并适当参考附图,这些以及其他实施例、方面、优点和替代方案对于本领域普通技术人员来说将变得显而易见。此外,本文提供的概述和其他描述和附图旨在仅通过示例的方式说明实施例,因此,许多变化是可能的。例如,结构元件和过程步骤可以被重新排列、组合、分布、消除或以其他方式改变,同时保持在所要求保护的实施例的范围内。
附图说明
图1图示了根据示例实施例的计算设备。
图2图示了根据示例实施例的计算系统。
图3A图示了根据示例实施例的NLP系统。
图3B图示了根据示例实施例的NLP模型之间的映射。
图4图示了根据示例实施例的摘要标记。
图5图示了根据示例实施例的实体标记。
图6图示了根据示例实施例的主题标记。
图7A、7B和7C图示了根据示例实施例的结构标记
图8图示了根据示例实施例的流程图
具体实施方式
本文描述了示例方法、设备和系统。应当理解,词语“示例”和“示例性的”在本文用来表示“用作示例、实例或说明”。本文描述为“示例”、“示例性的”和/或“说明性的”的任何实施例或特征不必须被解释为比其他实施例或特征优选或有利,除非如此陈述。因此,在不脱离本文呈现的主题的范围的情况下,能够利用其他实施例,并且能够进行其他改变。
因此,本文描述的示例实施例并不意味着是限制性的。将容易理解的是,如本文一般描述的和附图中图示的,本公开的方面能够以多种不同的配置来布置、替换、组合、分离和设计。
此外,除非上下文另有建议,否则每个附图中所示的特征可以彼此结合使用。因此,附图通常应被视为一个或多个总体实施例的组成方面,应当理解,并非所有示出的特征对于每个实施例都是必要的。
此外,本说明书或权利要求中的元件、块或步骤的任何列举都是出于清楚的目的。因此,这种列举不应被解释为要求或暗示这些元件、块或步骤遵循特定的安排或以特定的顺序执行。除非另有说明,否则附图不是按比例绘制的。
I.概述
阅读电子文本文档,诸如网站上提供的新闻文章、电子书和/或发表的论文,可以通过指示文章的结构和/或内容的标记来促进。在一些情况下,用户指定的(例如,作者指定的)注释,诸如基于用户指定的标题生成的内容表或文档大纲,可以通过表示文档的结构来促进在文本文档中的导航。然而,有时不提供这种用户指定的注释,或者没有有意义地表示文本文档的各个部分的内容。因此,读者可能能够使用例如文档大纲找到文档的特定部分,但是在没有一定程度上详细导航和阅读该特定部分的情况下,可能不知道该特定部分陈述了什么。导航可以包括涉及计算处理资源的一个或多个导航输入。通过使经由交互式用户接口的导航在如何导航文档方面更加直观,这种计算处理资源能够更有效地被使用。
在其他情况下,文档内容的摘要,诸如导言部分,可以促进理解文档的方面,但可能没有足够详细地链接到整个文本文档的相应部分。因此,读者可能能够确定文本文档试图传达的总体思想,但是可能不知道阅读文本文档的哪些部分以获得关于总体思想的特定子主题的附加信息。与上面类似,这可以包括一个或多个涉及计算处理资源的导航输入,以便读者确定要阅读哪个章节。
因此,本文提供了被配置为通过提供链接导航和摘要的标记来促进文本文档的阅读的系统、操作和设备。具体地,标记可以通过由至少两个NLP模型/算法处理文本文档来生成。第一NLP模型可以被配置成生成第一标记,该第一标记以相对较高的概括性水平表示文本文档的各个方面。例如,第一标记可以包括将文本文档整体概括的句子、在文本文档中检测到的实体的列表、在文本文档中识别的文本的类别和/或文本文档的段落结构的表示。第一标记可以通过用户接口与文本文档一起显示,这可以允许读者与第一标记的部分进行交互。
如本文所使用的,“标记”可以包括强调和/或指示文本文档的部分的任何方式。文本文档的所述部分通常可以通过一个或多个视觉标记来强调和/或指示,例如通过使用突出显示、下划线、边框、阴影、不同字体样式和/或大小和/或不同颜色中的一个或多个。标记可以被提供来给予文本文档的所述部分相对于未标记的其他部分的强调。
与第一标记的特定部分的用户交互可以表明对文本文档的相应部分或方面感兴趣。因此,基于与第一标记的特定部分的用户交互,可以选择第二NLP模型,用于处理文本文档的至少相应部分,并生成第二标记。因为第一标记的特定部分与文本文档的相应部分或方面相关联,所以第二NLP模型的处理可以集中在文本文档的相应部分或方面,从而允许第二标记促进理解/消费用户已经表现出兴趣的内容。因此,NLP模型可以允许文档的导航被链接到文本文档的内容和/或由文本文档的内容驱动,并且可以在不取决于预定义的文档标记(例如,文档大纲、内容表、介绍章节等)或其他注释来操作。
第二标记可以以相对高的特异性水平表示文本文档的方面。也就是说,第二标记可以更详细地表示文本文档的对应部分和/或与其相关的部分,而不是整体表示文本文档。例如,第二标记可以包括概括文档的特定部分的句子、由第一标记的特定部分概括的文本文档的部分的指示、与特定实体语义相关的附加实体的指示、与特定类别相关联的句子的指示和/或文本文档的特定段落的论证结构。
在一些情况下,第一标记可以包括由第一多个NLP模型独立于任何用户请求而生成的第一多个标记。因此,文本文档可以与第一多个(高级)标记一起自动显示。基于读者与这些标记中的一个的交互,可以从第二多个NLP模型中选择第二NLP模型。因此,可以响应于用户输入来生成和显示第二标记。当文本文档也没有被第二多个自然语言处理模型自动处理时,可以减少专用于由NLP模型处理文本的计算量,尤其是对于长文本文档。此外,通过基于用户交互提供第二标记,而不是自动提供所有潜在类型的第二标记,可以保持或改进用户接口的可导航性和美观性。
通过与第一标记和/或第二标记交互,读者能够快速有效地导航文本文档。例如,一旦提供了特定的第二标记,读者可以能够导航回第一标记(例如,通过使用“返回”按钮滚动)、选择其不同部分,并被提供不同的第二标记。因此,读者能够更有效地定位感兴趣的文本文档的特定部分(例如,使用更少的交互)、更快地理解文档的不同部分如何与其中讨论的各种思想相关,和/或花费更少的时间阅读读者不感兴趣的文本。提供第一标记和第二标记的好处可以随着文本文档长度的增加而增加,因为在没有标记的情况下,长文本文档通常需要更长的解析时间。
II.示例计算设备
图1图示了示例计算设备100。计算设备100以移动电话的形式因素示出。然而,计算设备100可以可替代地实现为膝上型计算机、平板计算机或可穿戴计算设备,以及其他可能性。计算设备100可以包括各种元件,诸如主体102、显示器106以及按钮108和110。计算设备100还可以包括一个或多个相机,诸如前置相机104和后置相机112。
显示器106可以表示阴极射线管(CRT)显示器、发光二极管(LED)显示器、液晶(LCD)显示器、等离子显示器、有机发光二极管(OLED)显示器或本领域已知的任何其他类型的显示器。计算设备100可以包括环境光传感器,其可以连续地或不时地确定场景的环境亮度(例如,根据可见光)。在一些实施方式中,环境光传感器能够用于调节显示器106的显示亮度。
图2是示出示例计算系统200的一些组件的简化框图。作为示例而非限制,计算系统200可以是蜂窝移动电话(例如智能手机)、计算机(诸如台式、笔记本、平板或手持计算机)、家庭自动化组件、数字录像机(DVR)、数字电视、遥控器、可穿戴计算设备、游戏控制台、机器人设备、车辆或一些其他类型的设备。因此,计算系统200可以表示例如计算设备100的方面。
计算系统200可以被配备有至少一些文本处理和/或文本显示能力。应当理解,计算系统200可以表示物理文本处理系统、文本处理应用在其上以软件方式运行的特定物理硬件平台,或者被配置为执行文本处理功能的硬件和软件的其他组合。
如图2所示,计算系统200可以包括通信接口202、用户接口204、处理器206和数据存储器208,所有这些都可以通过系统总线、网络和/或其他连接机制210通信地链接在一起。
通信接口202可以允许计算系统200使用模拟或数字调制与其他设备、接入网络和/或传输网络进行通信。因此,通信接口202可以促进电路交换和/或分组交换通信,诸如普通老式电话服务(POTS)通信和/或互联网协议(IP)或其他分组通信。例如,通信接口202可以包括芯片组和天线,其被安排用于与无线电接入网络或接入点进行无线通信。此外,通信接口202可以采取有线接口的形式或包括有线接口,诸如以太网、通用串行总线(USB)或高清多媒体接口(HDMI)端口。通信接口202还可以采取无线接口的形式或包括无线接口,诸如Wi-Fi、全球定位系统(GPS)或广域无线接口(例如,WiMAX或3GPP长期演进(LTE))。然而,其他形式的物理层接口和其他类型的标准或专有通信协议可以在通信接口202上使用。此外,通信接口202可以包括多个物理通信接口(例如,Wi-Fi接口、接口和广域无线接口)。
用户接口204可用于允许计算系统200与人类或非人类用户交互,诸如从用户接收输入并向用户提供输出。因此,用户接口204可以包括输入组件,诸如小键盘、键盘、触敏面板、计算机鼠标、轨迹球、操纵杆、麦克风等。用户接口204还可以包括一个或多个输出组件,诸如显示屏,其例如可以与触敏面板相结合。显示屏可以基于CRT、LCD和/或LED技术,或者现在已知或以后开发的其他技术。用户接口204还可以被配置成经由扬声器、扬声器插孔、音频输出端口、音频输出设备、耳机和/或其他类似设备来生成听觉输出。用户接口204还可以被配置为通过麦克风和/或其他类似设备接收和/或捕获可听话语、噪声和/或信号。
处理器206可以包括一个或多个通用处理器——例如微处理器——和/或一个或多个专用处理器——例如数字信号处理器(DSP)、图形处理单元(GPU)、浮点单元(FPU)、网络处理器或专用集成电路(ASIC)。数据存储208可以包括一个或多个易失性和/或非易失性存储组件,诸如磁、光、闪存或有机存储,并且可以整体或部分地与处理器206集成。数据存储208可以包括可移动和/或不可移动组件。
处理器206能够执行存储在数据存储器208中的程序指令218(例如,编译或非编译的程序逻辑和/或机器代码),以执行本文描述的各种功能。因此,数据存储器208可以包括其上存储有程序指令的非暂时性计算机可读介质,该程序指令在由计算系统200执行时使得计算系统200执行本说明书和/或附图中公开的任何方法、过程、算法和/或操作。处理器206对程序指令218的执行可以导致处理器206使用数据212。
举例来说,程序指令218可以包括安装在计算系统200上的操作系统222(例如,操作系统核、设备驱动程序和/或其他模块)和一个或多个应用程序220(例如,相机功能、地址簿、电子邮件、网络浏览、社交网络、音频到文本功能、文本翻译功能和/或游戏应用)。类似地,数据212可以包括操作系统数据216和应用数据214。操作系统数据216可以主要由操作系统222访问,并且应用数据214可以主要由一个或多个应用程序220访问。应用数据214可以被布置在对计算系统200的用户可见或隐藏的文件系统中。
应用程序220可以通过一个或多个应用编程接口(API)与操作系统222通信。这些应用程序接口可以促进例如应用程序220读取和/或写入应用数据214、经由通信接口202发送或接收信息、在用户接口204上接收和/或显示信息等。
在一些白话中,应用程序220可以被简称为“应用程序(APP)”。另外,应用程序220可以通过一个或多个在线应用商店或应用市场下载到计算系统200。然而,应用程序也可以以其他方式安装在计算系统200上,例如经由网络浏览器或通过计算系统200上的物理接口(例如,USB端口)。
III.用于文本文档的基于NLP的摘要和导航的示例系统
图3A图示了被配置为促进导航和表示文本文档的方面的示例系统。具体地,系统可以包括被配置为生成文本文档300的标记的NLP模块302,以及被配置为显示标记并允许与其交互的渲染模块304。文本文档300可以包括包含和/或表示文本的任何文档,诸如网页、由文字处理器生成的文档、口头陈述/讨论的抄本,和/或表示文本的图像等。
实际上,NLP模块302、渲染模块304以及这些模块的组件可以被实现为被配置为执行本文描述的操作的专用电路,和/或被配置为执行定义本文描述的操作的软件指令的通用电路。NLP模块302和/或渲染模块304可以被实现为被配置为显示文本文档300的客户端设备的操作系统的部分、由客户端设备执行的软件应用(例如,web浏览器)的部分,和/或被配置为向客户端设备提供文本文档300的服务器设备的部分,以及其他可能性。例如,NLP模块302和/或渲染模块304的方面可以被存储在数据存储器208中、由处理器206执行,和/或通过用户接口204显示/交互。
具体地,NLP模块302可以包括第一NLP模型(或多个)312和第二NLP模型(或多个)320。第一NLP模型312可以被配置为生成文本文档300的第一标记(或多个)314。在一些实施方式中,基于用户简档306,第一NLP模型312可以被配置为生成第一标记314,和/或第二NLP模型320可以被配置为生成第二标记(或多个)322,用户简档306可以与正在为其生成第一标记314和/或第二标记322的特定用户相关联。用户简档306可以包括标记交互历史308和预定偏好310。标记交互历史308可以定义特定用户与先前生成的标记的先前交互,并且可以当特定用户与为不同文本文档生成的各种标记交互时随时间更新。预定偏好310可以包括由特定用户选择的各种设置,这些设置定义NLP模块302和/或渲染模块304如何对于特定用户正在查看的文本文档进行操作。例如,预定偏好310可以指示特定用户希望被提供的标记的类型、用户希望被省略的标记的类型,和/或提供或省略这些标记的条件(例如,为长于200个词的文本提供标记,否则省略标记)。
在一些实施方式中,NLP模块302可以分阶段操作。具体地,文本文档300可以首先由第一NLP模型312处理,以生成第一标记314。基于第一标记314和文本文档300,渲染模块304可以被配置为生成和显示文本文档300和第一标记314的渲染316。渲染316可以包括图形用户界面的一个或多个屏幕、组件和/或其他方面,该图形用户界面被配置为显示根据第一标记314可视地注释的文本文档300。例如,第一标记314可以邻近文本文档300显示和/或覆盖在文本文档300之上。
渲染316可以以交互方式表示第一标记314,使得第一标记314的方面可以由用户选择或以其他方式与用户交互,从而允许用户指示对文本文档300的特定方面的兴趣。例如,第一标记314的特定部分可以通过悬停在该特定部分上和/或点击该特定部分(例如,经由鼠标)、轻敲该特定部分(例如,经由触摸屏)、凝视该特定部分(例如,经由眼睛跟踪设备),和/或使用空间手势与该特定组件交互(例如,经由虚拟和/或增强现实设备)以及其他可能性来选择和/或交互。因此,基于与显示渲染316的用户接口的用户交互,渲染模块304可以被配置为生成与第一标记314的用户交互318的表示。用户交互318可以包括,例如对第一标记314的特定部分的选择,其可以与文本文档300的特定部分相关联。例如,第一标记314的特定部分可以基于表示、覆盖在文本文档300的特定部分之上和/或以其他方式链接到文本文档300的特定部分来生成。
基于用户交互318,NLP模块302可以被配置为从第二NLP模型(或多个)320中选择至少一个NLP模型(本文称为第二NLP模型),通过该模型来进一步处理文本文档300。第二NLP模型可以处理文本文档300,从而生成第二标记322。具体地,第二NLP模型可以被配置为至少处理与第一标记314的所选部分相关联的文本文档300的特定部分。在一些情况下,取决于第二NLP模型和/或第一标记314的所选部分,可以处理整个文本文档300,以便识别其与第一标记314的所选部分相关联的方面。
基于和/或响应于从NLP模块302接收到第二标记322,渲染模块304可以被配置为显示文本文档300和第二标记322的渲染324。渲染316和324可以通过分别提供第一NLP模型312和第二NLP模型320的输出的视觉表示来促进用户浏览和/或理解文本文档300的方面。在一些情况下,渲染模块304还可以允许用户通过渲染324与第二标记322的部分交互,这可以允许用户浏览第二标记322、返回第一标记314,和/或导致生成和/或显示另外的(例如,不同的)第二标记322。
因此,第一NLP模型312可被视为提供独立于用户交互的文本文档300的第一处理级别或阶段,而第二NLP模型320可被视为提供至少部分基于一个或多个用户交互的文本文档300的第二处理级别或阶段。具体地,第一NLP模型312可以包括第一多个NLP模型,每个模型被配置为以不同的方式处理文本文档300并生成相应的标记(或多个)。图3B图示并讨论了可能的NLP模型类型的示例。因此,第一NLP模型312可以被配置为概括、组织、注释和/或以其他方式表示文本文档300的方面的第一多个不同标记。在一些情况下,第一NLP模型312可以提供文本文档300的方面的粗略、一般或其他高级表示。因此,第一NLP模型320可以被配置为整体处理文本文档300,而不关注其子集。
取决于用户简档306和/或文本文档300,第一标记314可以包括可以由第一NLP模型312生成的第一多个不同标记的子集或全部。例如,预定偏好310可以指示将为特定用户查看的文本文档提供第一多个不同标记中的哪些标记。可替换地或附加地,NLP模块302可以被配置为对文本文档300进行分类(例如,基于其来源、作者、流派、长度和/或其他属性),并且基于该分类,确定将为文本文档300提供第一多个不同标记中的哪些标记。
第二NLP模型320可以包括第二多个NLP模型,每个模型被配置为以不同的方式处理文本文档300并生成相应的标记(或多个)。因此,第二NLP模型320可以被配置为生成第二多个不同的标记,这些标记概括、组织、注释和/或以其他方式表示文本文档300的方面。在一些情况下,第二多个NLP模型可以提供文本文档300的方面的精细的、详细的或者更低级别的表示。因此,一个或多个第二NLP模型320可以被配置为处理文本文档300的子集/部分,而不是整体处理文本文档300。
第二标记322可以包括第二多个不同标记的子集,子集是基于用户交互318确定的。具体地,每个第一NLP模型312可以被映射到第二NLP模型320中的至少一个NLP模型。因此,与第一标记314的特定部分的用户交互318可以指示第二NLP模型320中的哪一个将被用于执行文本文档300的进一步处理。也就是说,用户交互318可以是从第二NLP模型320中选择第二NLP模型的基础。
例如,第一NLP模型312可以包括六个不同的NLP模型,每个模型被配置为生成不同类型的标记。因此,第一标记314可以包括六种不同类型的标记,并且每种类型的标记可以与该类型的标记的一个或多个实例相关联。当文本文档300被第一次向用户示出时,系统可能不知道用户想要如何消费文本文档300的内容和/或与文本文档300的内容交互,和/或用户查看文本文档300时的目标是什么。因此,NLP模块302可以被配置为通过六种不同的NLP模型中的每一种来处理文本文档300,以生成六种不同类型的标记,这些标记可以由渲染模块304显示。通过与六种类型的标记中的一个的特定实例(即,部分)交互,用户可以指示用户想要如何消费文本文档300的内容。具体地,与六种类型的标记中的一个的特定实例的交互可以指示用户找到对文本文档300最有帮助的NLP处理或标记的类型。
第一NLP模型312和第二NLP模型320之间的划分在计算处理方面提供了效率,尤其是(但不是必须的)当文本文档300非常长时,因为第一NLP模型312可以在一般的处理水平上操作,而更详细和具体的处理可能仅基于用户随后希望经由所选择的第二NLP模型导航什么和/或如何导航来执行。
具体地,基于用户交互318,NLP模块302可以被配置为选择第二NLP模型320中的一个或多个,通过第二NLP模型320来进一步处理文本文档300,以提供用户期望发现有用的附加标记(即,第二标记322)。因此,不是在与文本文档300的用户交互之前用每个第二NLP模型320处理文本文档300,而是可以基于用户交互来选择第二NLP模型320的子集。由于一些NLP模型的执行可能是计算密集型的,并且用户可能不使用由此生成的一些标记,所以分阶段处理文本文档300减少了NLP模块302执行的浪费计算量。计算工作可以专用于例如,执行通过其来显示文本文档300的软件应用(例如,网络浏览器)从而通过减少和/或避免软件应用中明显的变慢和/或加载时间来改善用户体验。
此外,通过分阶段提供标记,文本文档300的视觉美感不太可能由于向用户显示大量和/或压倒性的信息而降低。例如,因为第一标记314可以提供文本文档300的方面的高级表示,所以与第二NLP模型320可以生成的第二多个不同标记相比,第一标记314可以相对稀疏。因此,当用于注释文本文档300时,第一标记314可能不会杂乱或对文本文档300的视觉吸引力产生负面影响。此外,一旦第一标记314的部分被选择,则第一标记314的未被选择的方面可以被隐藏,从而为第二标记322的显示释放空间。由于第二标记322表示可由第二NLP模型生成的第二多个不同标记的子集,而不是全部,所以渲染324可以提供进一步帮助导航和/或理解文本文档300而不会不利地影响其视觉吸引力的标记量。
此外,提供了改进的灵活性,因为可以涉及特定NLP模型的软件更新,无论是一个或多个第一NLP模型312和/或一个或多个第二NLP模型320,都可以基于每个模型进行更新,而不必更新例如全局模型和/或不必使这样的全局模型停止使用一段时间。此外,特定NLP模型中的故障或错误可能不会影响NLP模块302的其他组件(例如,其他NLP模型)。
与第一标记314的特定部分的用户交互(例如,用户交互318)和/或与第二标记322的用户交互可以被存储为标记交互历史308的部分。因此,这些用户交互可以被用于选择提供用户可能找到有用的标记的NLP模型(例如,基于与其的频繁交互),而省略提供用户不太可能找到有用的标记的NLP模型(例如,基于与其的罕见和/或不存在的交互)。在一些实施方式中,基于规则的算法和/或机器学习模型可以被配置为基于用户简档306选择用于为特定用户生成第一标记312的第一NLP模型312的子集。
此外,在一些情况下,与第一标记314和/或第二标记322的用户交互可以用于定义训练数据,基于该训练数据可以训练第一NLP模型312和/或第二NLP模型320。具体地,用户交互可以指示特定标记对于特定类型的文本文档和/或与特定用户简档相关联的用户是有用的、正确的和/或期望的。类似地,缺少用户交互(例如,随着时间)可以指示特定的标记对于特定类型的文本文档和/或与特定用户简档相关联的用户是无用的、不正确的和/或不期望的。因此,每个生成的标记可以基于它是否已经被交互来标注,从而定义“真值”数据,基于该“真值”数据,可以训练和/或再训练NLP模型以提供更准确地表示文本文档内容的输出。
IV.NLP模型的示例映射和标记
图3B图示了第一NLP模型312和第二NLP模型320之间的示例映射,以及可以生成的不同标记。例如,第一NLP模型312可以包括四个NLP模型:第一NLP摘要模型330、第一NLP实体模型340、第一NLP主题模型350和第一NLP结构模型360。类似地,第二NLP模型可以包括四个对应的NLP模型:第二NLP摘要模型334、第二NLP实体模型344、第二NLP主题模型354和第二NLP结构模型364。这些NLP模型中的每一个可以包括和/或基于基于规则的算法、统计算法和/或机器学习算法。
第一NLP摘要模型330可以被配置为生成第一摘要标记332。当选择第一摘要标记332的一部分时,与所选部分相关联的文本文档300的至少对应部分可以由第二NLP摘要模型334处理,从而生成第二摘要标记336。
在第一示例中,第一NLP摘要模型330可以是摘要生成模型(例如,抽象式摘要模型或提取式摘要模型),其被配置为生成提供文本文档300的相应部分的摘要的一个或多个词的多个集合。例如,一个或多个词的每个集合可以形成短语或句子,其概括文本文档300的相应部分(例如,句子、段落或形成章节的一系列段落)和/或在文本文档300内描述的相应思想/概念。第二NLP摘要模型334可以是摘要映射模型,其被配置为识别由特定词集合概括的文本文档300的章节。
因此,可以向用户提供概括文本文档300的多个方面的多个短语或句子,并且基于用户选择特定的短语或句子,可以向用户提供形成所选短语或句子的基础的文本文档300的部分的指示。例如,形成所选短语或句子的基础的文本文档300的部分可以被突出显示、用边界框指示、以不同的字体和/或颜色示出,和/或以其他方式视觉上与其他文本分开。因此,用户可以能够快速浏览文本文档300的部分的摘要,选择特定摘要,从而在文本文档300中找到解决用户感兴趣的特定概念、想法和/或主题的原始文本。
附加地或可替换地,在第二示例中,由第一NLP摘要模型330生成的词的多个集合可以以高概括性水平概括文本文档300和/或可以整体概括文本文档300(而不是仅概括其部分)。摘要模型330因此可以被称为粗略摘要(生成)模型。第二NLP摘要模型334可以是精细摘要(生成)模型,其被配置为生成一个或多个词的一个或多个附加集合,该集合提供文本文档300的特定部分的摘要。在一些情况下,粗略摘要模型和精细摘要模型可以基于相同的底层算法或模型,但是可以被限定为处理文本文档300的不同部分、处理不同数量的文本和/或生成不同长度的摘要。
因此,例如,可以向用户提供将文本文档300整体概括的多个短语或句子。基于选择特定短语或句子,可以向用户提供一个或多个附加短语或句子,这些附加短语或句子提供关于与所选短语或句子相对应的文档的部分(例如,章节)的附加细节。因此,用户可以能够快速导航提供不同细节水平的文本文档300的摘要,诸如通过连续获得文本文档300的部分的更详细的摘要。
第一NLP实体模型340可以被配置为生成第一实体标记342。当选择第一实体标记342的一部分时,与所选部分相关联的文本文档300的至少对应部分可以由第二NLP实体模型344处理,从而生成第二实体标记346。
例如,第一NLP实体模型340可以是被配置为生成/识别在文本文档300中存在的多个实体的命名实体识别模型。例如,多个实体中的每个实体可以表示个人、组织、地点、时间、百分比和/或货币价值以及其他可能性。第二NLP实体模型344可以是被配置为识别文本文档300内的实体之间的语义关系的共指消解模型。具体地,共指消解模型可以被配置为识别与特定实体语义相关的一个或多个实体。
因此,例如,可以向用户提供在文本文档300内标识的实体的列表,并且基于用户选择特定实体,可以向用户提供文本文档300中引用和/或以其他方式与该特定实体相关的其他实体的指示。因此,用户可以能够在文本文档300中快速找到引用特定实体的部分,并因此提供关于该特定实体的附加信息,从而允许用户专注于阅读文本文档300中与该特定实体相关的部分。
第一NLP主题模型350可以被配置为生成第一主题标记352。当选择第一主题标记352的一部分时,与所选部分相关联的文本文档300的至少对应部分可以由第二NLP主题模型354处理,从而生成第二主题标记356。
在第一示例中,第一NLP主题模型350可以是被配置为生成在文本文档300中存在的多个文本类别的粗略文本分类模型。文本分类模型可以包括词、短语和/或句子嵌入算法,和/或被配置为对由此生成的嵌入进行聚类的算法。在一些情况下,多个类别可以包括在文本文档300中提到、讨论和/或以其他方式包括的多个主题。示例主题可以包括技术、政治、经济、历史、娱乐和/或其副主题。在其他情况下,粗略文本分类模型可以被配置为基于文本文档300的主题和/或副主题来确定多个类别。例如,文本文档300可以被确定为关于股票市场的主题,并且类别因此可以包括看涨类别、看跌类别和中性类别。在另一示例中,文本文档300可以被确定为产品评论,并且类别因此可以包括正面情感类别、负面情感类别和中性情感类别。其他主题和/或类别也是可能的。
第二NLP主题模型354可以是被配置为在文本文档300内识别与特定类别相关联的一个或多个句子的精细文本分类模型。因此,例如,可以向用户提供与文本文档300相关联的类别列表,并且基于选择特定类别,可以向用户提供文本文档300中属于该特定类别的一个或多个句子的指示。例如,当文本文档300表示产品评论并且用户选择正面情感类别时,可以可视地指示讨论特定产品的优点(而不是,例如缺点)的句子。因此,用户可以能够在文本文档300内快速找到其与特定主题和/或其上的观点相关联的部分。
在第二示例中,第一NLP主题模型350可以是被配置为生成在文本文档300中存在的文本的多个蕴含类别的文本分类模型。蕴含类别可以与例如在文本文档300内讨论的立场和/或观点相对应。每个蕴含类别可以表示在文本文档300中识别的和/或基于文本文档300生成的特定假设。在一些情况下,由粗略文本分类模型生成的每个类别可以构成特定假设和/或与特定假设相关联。
第二NLP主题模型354可以是文本蕴含模型,其被配置为识别/确定特定蕴含类别和文本文档300的部分之间的文本蕴含的程度。文本蕴含模型可以基于和/或包括一个或多个自然语言推理算法。文本蕴含的程度可以是指示文本文档300的部分是否包含特定类别(例如,假设)、是否与特定类别抵触,或者两者皆不(例如,独立于特定类别)的量化度量。因此,例如,可以向用户提供与由文本文档300提出的各种假设相对应的蕴含类别的列表,并且基于选择特定的蕴含类别,可以向用户提供文本文档300中的每个句子是否支持、抵触和/或独立于特定的蕴含类别的指示。因此,用户可以能够在文本文档300中快速找到支持、抵触和/或独立于对一个或多个主题的各种立场和/或观点的部分。
第一NLP结构模型360可以被配置为生成第一结构标记362。当选择第一结构标记362的一部分时,与所选部分相关联的文本文档300的至少对应部分可以由第二NLP结构模型364处理,从而生成第二结构标记366。
例如,第一NLP结构模型360可以是文档结构解析模型,其被配置为生成表示在文本文档300中存在的段落的层次的树结构。例如,树结构可以包括与文本文档300的预定义章节(例如,由文档的标题或其他结构特征描绘,其可以例如通过识别下划线、字体大小、字体样式和/或行距中的一个或多个来自动确定)相对应的一个或多个标题节点。在一些情况下,取决于每个相应的标题节点,树结构还可以包括与包括在相应标题下的相应段落相对应的一个或多个段落节点。第二NLP结构模型364可以是论证挖掘模型,其被配置为生成特定段落或一系列段落的论证结构的表示。论证结构可以被表示为例如一个或多个子节点,这取决于表示特定段落的节点和/或取决于提供特定段落的相应标题。这些子节点中的每一个可以表示特定的短语和/或句子,并且可以根据由特定的短语和/或句子表示的论证的部分来标注。例如,子节点可以被标注为“主张”、“理由”、“证据”、“保证”和/或“反诉”等。
因此,例如,可以向用户提供在文本文档300内标识的层次的视觉表示,并且基于在该层次内选择特定节点(与例如标题和/或段落相对应),可以向用户提供与该特定节点相关联的论证结构的进一步视觉表示。因此,用户可以能够快速确定文本文档300的整体结构,识别其不同部分渲染的论证,和/或确定论证的逻辑组织。
V.基于NLP的文本文档的标记示例
图4图示了由NLP摘要模型(例如,NLP摘要模型330和334)生成的示例标记。具体地,图4图示了显示文本文档404、摘要标记402和摘要标记408的图形用户界面(GUI)400。具体地,文本文档404可以由摘要生成模型处理以生成摘要标记402,该摘要标记402包括三个句子,每个句子概括文本文档404的不同部分。特别地,摘要标记402的第一句与文本文档404的第一段相对应,摘要标记402的第二句与文本文档404的第二段相对应,摘要标记402的第三句与文本文档404的第三段和第四段相对应。
在一些实施方式中,文本文档404的这种处理可以在通过GUI 400显示文本文档404之前,和/或在没有对由该处理生成的标记的明确用户请求的情况下进行。因此,响应于显示文本文档404的请求,GUI 400可以显示文本文档404和摘要标记402。也就是说,可以基于对显示文本文档404的请求自动提供摘要标记402,而不取决于生成/显示摘要标记402的附加请求。
另一方面,摘要标记408可能直到用户从摘要标记402中选择对应的句子才被生成,如框/选择406所示。具体地,从摘要标记402中选择406第二句可以使得摘要映射模型识别由第二句概括的文本文档404的部分(即,其第二段),并且所述部分的视觉识别可以经由GUI 400显示。类似地,从摘要标记402中选择不同的句子(例如,第三句)可以再次使得摘要映射模型识别由不同的句子概括的文本文档404的其他部分(例如,其第三段和第四段),并且可以经由GUI 400显示其他部分的视觉识别。在一些实施方式中,在文本文档404的部分最初不由GUI 400渲染的情况下(例如,如果其第二段当前不可见并且涉及文本文档的稍后的屏幕外部分),所述部分的视觉识别可以包括跳转/移动到所述屏幕外部分。
图4所示的摘要标记402可以基于被配置为从文本文档404的部分中选择一个或多个词(例如,单个词、短语和/或句子)来充当其摘要的提取式摘要生成模型的输出。为了说明清楚,摘要标记402包括取自文本文档404的完整句子。在其他实施方式中,摘要标记402可以基于抽象式摘要生成模型的输出,并且因此可以包括没有明确出现在文本文档404中的词、短语和/或句子。因此,摘要映射模型的具体实施方式可以至少部分取决于摘要标记402的所选部分是由提取式还是抽象式摘要生成模型生成的。
在其他实施方式中,从摘要标记402中选择第二句可以替代地导致精细摘要模型处理文本文档404的第二段,并且生成以更高的细节水平概括第二段的一个或多个附加词。因此,取代通过标记408可视地指示第二段,而是可以通过GUI 400显示一个或多个附加词(未示出)(例如,在文本文档404中的第一段和第二段之间、与第二段相邻,或者在图形用户界面400的另一区域/组件中)。
图5图示了由NLP实体模型(例如,NLP实体模型340和344)生成的示例标记。具体地,图5图示了被配置为在其中显示文本文档504、实体标记502和实体标记508的GUI 500。具体地,文本文档504可以由命名实体识别模型处理,以生成实体标记502,其包括在文本文档504中提到的四个实体。特别地,这四个实体包括“Meowbank”、“Edison Motors Inc.(爱迪生汽车公司)”、“FTA”(即联邦运输管理局)和“Senate Commerce Committee(参议院商务委员会)”在其他实施方式中,取代作为侧面板提供,实体标记502可以通过例如以类似于用于实体标记508的方式、在文本文档504内直接突出显示每个实体而与文本文档504一起提供。
在一些实施方式中,文本文档504的这种处理可以在通过GUI 500显示文本文档504之前和/或在没有对由该处理生成的标记的明确用户请求的情况下进行。因此,可以基于显示文本文档504的请求自动提供实体标记502,而不取决于生成/显示实体标记502的附加请求。另一方面,实体标记508可能不被生成,直到用户从实体标记502中选择对应的实体,如块/选择506所示。
具体地,从实体标记502中选择506“Meowbank”实体可以使得共指消解模型识别文本文档504中与“Meowbank”语义相关的实体(例如,引用相同实体、定义实体的属性等),并且语义相关实体的视觉标识可以经由GUI 500显示。因此,选择“Meowbank”可以导致“company representative(公司代表)”、“Kristen Meowbank”、“vehicle engineer(车辆工程师)”和“she(她)”在文本文档504中被突出显示,如实体标记508共同指示的。类似地,从实体标记502中选择不同的实体(例如,Edison Motors Inc.)可以再次导致共指消解模型识别文本文档504中与不同实体语义相关的附加实体(例如,第三段中的“Edison”),并且附加实体的视觉识别可以经由GUI 500显示。
图6图示了由NLP主题模型(例如,NLP主题模型350和354)生成的示例标记。具体地,图6图示了被配置为在其中显示文本文档604、主题标记602和主题标记608的GUI 600。具体地,文本文档604可以由文本分类模型处理以生成主题标记602,其包括看涨前景/类别610、中性前景/类别612和看跌前景/类别614。
取决于文本文档604的内容和/或所使用的文本分类模型的类型,主题标记602可以包括多个不同的类别。在图6所示的示例中,由于文本文档604讨论股票市场,所以主题标记602分别包括看涨类别610、中性类别612和看跌类别614。在另一示例中,文本文档可以是产品评论,并且主题标记因此可以包括“正面”类别、“中性”类别和“负面”类别。在另一示例中,文本文档可以是主张特定立场的文章,并且主题标记因此可以包括“同意”类别、“无所谓”类别和“不同意”类别。在一些情况下,附加地或可替换地,每个类别可以是文本蕴含类别,其表示例如可以相对于文本文档604内的陈述蕴含、抵触或中立的相应假设。
在一些实施方式中,文本文档604的这种处理可以在通过GUI 600显示文本文档604之前,和/或在没有对由该处理生成的标记的明确用户请求的情况下进行。因此,可以基于显示文本文档604的请求自动提供主题标记602,而不依赖于生成/显示主题标记602的附加请求。另一方面,主题标记608可能直到用户从主题标记602中选择相应的主题才生成。
例如,从主题标记602中选择看跌前景614,如其图案填充所示,可以使得第二文本分类模型识别文本文档604中与该类别相关联的句子,并且可以经由GUI 600显示该关联程度的视觉识别。例如,第二文本分类模型可以是精细文本分类模型,其被配置为识别属于所选类别的句子,和/或确定每个句子与所选类别的关系有多密切。因此,对看跌前景614的选择可以使得第一句、第四句、第五句和第六句在文本文档604中被可视地指示,如主题标记608所共同指示的。
此外,看跌类别614和每个“看跌”句子之间的关联的程度或强度可以通过用不同的颜色或图案突出每个“看跌”句子来可视地指示。因此,第一句和第四句通过高度变暗的模式来指示强关联(即,非常看跌的句子),第五句通过中度变暗的模式来指示中度关联(即,中度看跌的句子),第六句通过略微变暗的模式来指示弱关联(即,略微看跌的句子)。在一些情况下,对看跌前景614的选择可以附加地或可替换地导致除了第一句、第四句、第五句和第六句之外的句子可以被隐藏和/或变得视觉上不明显。
类似地,从主题标记602中选择不同的类别(例如,看涨前景610)可以使得精细分类模型识别文本文档604中表达看涨情感的句子(例如,文本文档604中的第二句和第三句),并确定每个句子看涨的程度。这些看涨句子的视觉识别以及看涨情感的程度可以在GUI 600中显示为这些句子的视觉指示。
在每个类别表示文本蕴含假设的实现中,文本蕴含模型可以被配置为确定所选类别和文本文档604内的每个句子之间的文本蕴含程度。因此,例如,看跌前景614可以与假设“股票市场将失去价值”相关联,并且文本蕴含模型可以被配置为确定每个句子是否蕴含该假设、与该假设相抵触或者相对于该假设是中性的。可以通过GUI 600以类似于图6所示的方式可视地指示假设对于每个句子的蕴含程度、抵触程度或中性程度。
图7A、图7B和图7C图示了由NLP结构模型(例如,NLP结构模型360和364)生成的示例标记。具体地,图7A、图7B和图7C图示了被配置为在其中显示文本文档704、结构标记702和结构标记708的GUI 700,为了清楚说明,它们中的每一个被示出为不同图的部分。实际上,结构标记702和/或708可以显示在文本文档704的上面、下面、旁边和/或覆盖在文本文档704之上。
文本文档704可以由文档结构解析模型处理以生成结构标记702,其被组织为包括四个节点的树结构。这四个节点表示文本文档704中存在的段落的层次。具体地,这四个节点包括与文本文档704的主标题相对应的“动物偏好”节点706,以及取决于此与文本文档704的第一标题和段落相对应的“狗”节点710,与文本文档704的第二标题和段落相对应的“猫”节点714,以及与文本文档704的第三标题和段落相对应的“猫是外向者的优选宠物”节点712。在标题包含多于一个段落的情况下,标题可以由一个节点表示,并且其中的段落可以由取决于此的多个节点表示,或者段落和标题可以由单个节点共同表示。
在一些实施方式中,处理文本文档704以生成标记702可以在文本文档704通过GUI700显示之前,和/或在没有对标记702的明确用户请求的情况下进行。因此,可以基于显示文本文档704的请求自动提供结构标记702,而不取决于生成/显示结构标记702的附加请求。另一方面,结构标记708可能直到用户从结构标记702中选择了对应的节点才被生成。
例如,从结构标记702中选择节点712可以使得论证挖掘模型生成与节点712相关联的段落的论证结构的表示。论证结构可以由附加节点表示,每个附加节点可以指示由与所选节点(例如,节点712)相关联的段落所呈现的论证内的对应句子的角色。这些附加节点的可视表示可以通过GUI 700显示。
因此,选择节点712可以使得节点718、720、722、724、726、728和730(即论证结构节点718-730)作为结构标记708的一部分通过GUI 700显示。具体地,节点718可以指示文本文档704的第三段的第六句表示论点的主张,节点720可以指示文本文档704的第三段的第一句表示支持节点718的主张的理由,并且节点722和节点724可以指示文本文档704的第三段的第二句和第三句分别表示支持节点720的理由的证据。类似地,节点726可以指示文本文档704的第三段的第七句表示支持节点718的主张的理由,并且该理由没有任何证据支持。此外,节点728可以指示文本文档704的第三段的第四句表示支持节点718的主张的理由,并且节点730可以指示文本文档704的第三段的第五句表示支持节点728的理由的证据。
类似地,从结构标记702中选择不同的节点(例如,节点710)可以使得论证挖掘模型生成表示文本文档704中对应段落的论证结构(如果有的话)的附加论证结构节点。附加论证结构节点可以通过GUI 700显示。在一些情况下,先前显示的论证结构节点718-730可以从GUI 700中隐藏或移除,以给附加论证结构节点腾出空间。
在一些实施方式中,概括、实体、主题和/或结构标记中的两个或更多个,分别由标记402、502、602和702举例说明,可以作为特定文本文档的初始渲染的部分来提供。基于对这些标记中特定一个的部分的选择,未被选择的标记可以被隐藏,并且可以提供与所选择的标记相对应的附加标记(例如,标记408、508、608或708)。因此,文本文档最初可以用多种不同类型的第一标记来标记。一旦用户与第一标记中的一个交互,则响应于该交互生成的第二标记可以是与用户交互的标记相同的类型。用户可以能够返回查看多个不同类型的标记,选择第一标记中的不同一个。
VI.附加示例操作
图8图示了与确定标记以促进导航和理解文本文档相关的操作流程图。所述操作可以由计算设备100、计算系统200、NLP模块302、渲染模块304、计算设备的操作系统、网络浏览器应用和/或服务器设备以及其他可能性来执行。图8的实施例可以通过移除其中所示的任何一个或多个特征来简化。此外,这些实施例可以与任何先前附图的特征、方面和/或实现相结合,或者以其他方式在本文中描述。
框800可以涉及获得文本文档。
框802可以涉及通过由第一NLP模型处理文本文档来生成文本文档的第一标记。
框804可以涉及通过用户接口显示文本文档和文本文档的第一标记。
框806可以涉及接收与文本文档的第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。
框808可以涉及基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过该模型来处理文本文档的所述部分。第二NLP模型可以与第一NLP模型不同。
框810可以涉及基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记。
框812可以涉及通过用户接口显示文本文档和文本文档的第二标记。
在一些实施例中,生成文本文档的第一标记可以包括通过由第一多个NLP模型处理文本文档来生成文本文档的第一多个标记。第一多个NLP模型可以包括第一NLP模型。第一多个标记可以包括第一标记。显示文本文档和文本文档的第一标记可以包括显示文本文档和文本文档的第一多个标记。接收与文本文档的第一标记的部分的用户交互可以包括从第一多个标记中接收对第一标记的部分的选择。选择第二NLP模型可以包括基于从第一多个标记中选择第一标记的部分,从第二多个NLP模型中选择第二NLP模型。第二多个NLP模型的每个相应NLP模型可以与第一多个标记的对应标记相关联。
在一些实施例中,第一NLP模型可以包括摘要生成模型。第二NLP模型可以包括摘要映射模型。生成文本文档的第一标记可以包括由摘要生成模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合。与文本文档的第一标记的部分的用户交互可以包括选择多个集合中的特定集合。生成文本文档的第二标记可以包括通过摘要映射模型识别由特定集合概括的文本文档的部分。显示文本文档和文本文档的第二标记可以包括在文本文档内显示由特定集合概括的文本文档的部分的视觉指示。
在一些实施例中,第一NLP模型可以包括粗略摘要模型。第二NLP模型可以包括精细摘要模型。生成文本文档的第一标记可以包括由粗略摘要模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合。与文本文档的第一标记的部分的用户交互可以包括选择多个集合中的特定集合。特定集合可以提供文本文档部分的摘要。生成文本文档的第二标记可以包括由精细摘要模型生成一个或多个词的一个或多个附加集合,该集合提供文本文档的所述部分的相应子章节的摘要。显示文本文档和文本文档的第二标记可以包括显示一个或多个附加集合。
在一些实施例中,第一NLP模型可以包括命名实体识别模型。第二NLP模型可以包括共指消解模型。生成文本文档的第一标记可以包括由命名实体识别模型生成文本文档中存在的多个实体。与文本文档的第一标记的部分的用户交互可以包括选择多个实体中的特定实体。生成文本文档的第二标记可以包括由共指消解模型识别文本文档中与特定实体语义相关的一个或多个附加实体。文本文档的所述部分可以包括一个或多个附加实体。显示文本文档和文本文档的第二标记可以包括在文本文档内显示特定实体和一个或多个附加实体的视觉指示。
在一些实施例中,第一NLP模型可以包括粗略文本分类模型。第二NLP模型可以包括精细文本分类模型。生成文本文档的第一标记可以包括由粗略文本分类模型生成文本文档中存在的多个文本类别。与文本文档的第一标记的部分的用户交互可以包括选择多个文本类别中的特定类别。生成文本文档的第二标记可以包括通过精细文本分类模型识别文本文档中与特定类别相关联的一个或多个句子。文本文档的所述部分可以包括一个或多个句子。显示文本文档和文本文档的第二标记可以包括在文本文档内显示一个或多个句子的视觉指示。
在一些实施例中,第一NLP模型可以包括文本分类模型。第二NLP模型可以包括文本蕴含模型。生成文本文档的第一标记可以包括由文本分类模型生成文本文档中存在的文本的多个蕴含类别。与文本文档的第一标记的部分的用户交互可以包括选择多个蕴含类别中的特定蕴含类别。生成文本文档的第二标记可以包括通过文本蕴含模型识别特定蕴含类别和文本文档中的一个或多个句子之间的文本蕴含程度。文本文档的所述部分可以包括一个或多个句子。显示文本文档和文本文档的第二标记可以包括在文本文档内显示文本蕴含程度的视觉指示。
在一些实施例中,第一NLP模型可以包括文档结构解析模型。第二NLP模型可以包括论证挖掘模型。生成文本文档的第一标记可以包括由文档结构解析模型生成表示文本文档中存在的段落的层次的树结构。与文本文档的第一标记的部分的用户交互可以包括从树结构中选择表示对应段落的特定节点。生成文本文档的第二标记可以包括由论证挖掘模型生成对应段落的论证结构的表示。文档的所述部分可以包括对应的段落。显示文本文档和文本文档的第二标记可以包括显示对应段落的论证结构的视觉表示作为树结构的部分。
在一些实施例中,显示文本文档和文本文档的第一标记可以包括在文本文档上方显示第一标记,使得第一标记在用户接口内先于(precede)文本文档。
在一些实施例中,显示文本文档和文本文档的第二标记可以包括显示覆盖在文本文档之上的第二标记,使得第二标记看起来与用户接口内的文本文档集成在一起。
在一些实施例中,第一标记可以在与文本文档的用户交互之前生成,并且独立于与文本文档的用户交互。
在一些实施例中,第一NLP模型或第二NLP模型中的至少一个的训练数据可以基于(i)与文本文档的第一标记的部分的用户交互或(ii)与文本文档的第二标记的用户交互中的一个或多个来生成。第一NLP模型或第二NLP模型中的至少一个可以通过基于训练数据的训练来更新。
在一些实施例中,可以基于以下一个或多个来更新用户简档:(i)与文本文档的第一标记的部分的用户交互或(ii)与文本文档的第二标记的用户交互。第一NLP模型可以进一步被配置为基于用户简档生成第一标记,或者第二NLP模型可以进一步被配置为基于用户简档生成第二标记。
在一些实施例中,可以基于用户简档来选择第一NLP模型,该用户简档包括以下中的至少一个:(i)与显示文本文档相关联的用户偏好或(ii)具有先前文本文档的先前标记的用户交互历史。
在一些实施例中,可以确定文本文档的分类,并且可以基于文本文档的分类来选择第一NLP模型。
在一些实施例中,文本文档的第一标记的生成、第二NLP理模型的选择以及文本文档的第二标记的生成均可由计算设备的操作系统执行,并且用户接口可由计算设备提供。
在一些实施例中,文本文档的第一标记的生成、第二NLP模型的选择以及文本文档的第二标记的生成均可由通信连接到计算设备的服务器设备来执行,用户接口由所述计算设备提供。
在一些实施例中,文本文档的第一标记的生成、第二NLP模型的选择以及文本文档的第二标记的生成可以各自由被配置为由计算设备执行的网络浏览器应用来执行,并且用户接口可以由网络浏览器应用提供。
VII.结论
本公开不限于本申请中描述的旨在说明各种方面的特定实施例。在不脱离其范围的情况下可以进行许多修改和变化,这对于本领域技术人员来说是显而易见的。除了本文描述的方法和装置之外,本公开范围内的功能等同的方法和装置对于本领域的技术人员来说从前面的描述中将是显而易见的。这种修改和变化旨在落入所附权利要求的范围内。
以上详细描述参照附图描述了所公开的系统、设备和方法的各种特征和操作。在附图中,相似的符号通常标识相似的组件,除非上下文另有指示。本文和附图中描述的示例性实施例并不意味着是限制性的。在不脱离本文渲染的主题的范围的情况下,可以利用其他实施例,并且可以进行其他改变。将容易理解的是,如本文一般描述的和附图中示出的,本公开的方面可以以多种不同的配置来布置、替换、组合、分离和设计。
关于附图中的任何或所有消息流程图、场景和流程图,如本文所讨论的,每个步骤、块和/或通信能够表示根据示例实施例的信息处理和/或信息传输。替代实施例包括在这些示例实施例的范围内。在这些替代实施例中,例如,根据所涉及的功能,被描述为步骤、块、传输、通信、请求、响应和/或消息的操作能够不按所示或所讨论的顺序来执行,包括基本上同时或相反的顺序。此外,更多或更少的块和/或操作能够与本文讨论的任何消息流程图、场景和流程图一起使用,并且这些消息流程图、场景和流程图能够部分或全部彼此组合。
表示信息处理的步骤或块可以与能够被配置为执行本文描述的方法或技术的特定逻辑功能的电路对应。可替换地或附加地,表示信息处理的块可以与模块、段或程序代码的部分(包括相关数据)对应。程序代码可以包括可由处理器执行以实现方法或技术中的特定逻辑操作或动作的一个或多个指令。程序代码和/或相关数据可以存储在任何类型的计算机可读介质上,诸如包括随机存取存储器(RAM)、磁盘驱动器、固态驱动器或其他存储介质的存储设备。
计算机可读介质还可以包括非暂时性计算机可读介质,诸如短时间存储数据的计算机可读介质,如寄存器存储器、处理器高速缓存和RAM。计算机可读介质还可以包括存储程序代码和/或数据更长时间的非暂时性计算机可读介质。因此,计算机可读介质可以包括辅助或永久长期储存器,如只读存储器(ROM)、光盘或磁盘、固态驱动器、光盘只读存储器(CD-ROM)。计算机可读介质也可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是,例如计算机可读存储介质或有形存储设备。
此外,表示一个或多个信息传输的步骤或块可以与同一物理设备中的软件和/或硬件模块之间的信息传输相对应。然而,其他信息传输可以在不同物理设备中的软件模块和/或硬件模块之间进行。
附图中所示的特定布置不应被视为限制。应当理解,其他实施例可以包括给定附图中所示的或多或少的每个元件。此外,一些示出的元件可以被组合或省略。此外,示例实施例可以包括附图中未示出的元件。
虽然本文已经公开了各种方面和实施例,但是其他方面和实施例对于本领域技术人员来说是显而易见的。本文公开的各种方面和实施例是处于说明的目的,而不是为了限制,真正的范围由所附权利要求指示。
Claims (20)
1.一种计算机实现的方法,包括:
获取文本文档;
通过由第一自然语言处理(NLP)模型处理文本文档来生成文本文档的第一标记;
通过用户接口显示文本文档和文本文档的第一标记;
接收与文本文档的第一标记的一部分的用户交互,其中,文本文档的第一标记的所述部分与文本文档的一部分相关联;
基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过第二NLP模型来处理文本文档的所述部分,其中,第二NLP模型与第一NLP模型不同;
基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记;以及
通过用户接口显示文本文档和文本文档的第二标记。
2.根据权利要求1所述的计算机实现的方法,其中:
生成文本文档的第一标记包括通过由第一多个NLP模型处理文本文档来生成文本文档的第一多个标记,
第一多个NLP模型包括第一NLP模型,
第一多个标记包括第一标记,
显示文本文档和文本文档的第一标记包括显示文本文档和文本文档的第一多个标记,
接收与文本文档的第一标记的一部分的用户交互包括接收从第一多个标记中对第一标记的一部分的选择,
选择第二NLP模型包括基于从第一多个标记中选择第一标记的一部分,从第二多个NLP模型中选择第二NLP模型,并且
第二多个NLP模型中的每个相应NLP模型与第一多个标记的对应标记相关联。
3.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括摘要生成模型,
第二NLP模型包括摘要映射模型,
生成文本文档的第一标记包括由摘要生成模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合,
与文本文档的第一标记的一部分的用户交互包括选择多个集合中的特定集合,
生成文本文档的第二标记包括由摘要映射模型识别由特定集合概括的文本文档的部分,并且
显示文本文档和文本文档的第二标记包括在文本文档内显示由特定集合概括的文本文档的一部分的视觉指示。
4.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括粗略摘要模型,
第二NLP模型包括精细摘要模型,
生成文本文档的第一标记包括由粗略摘要模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合,
与文本文档的第一标记的一部分的用户交互包括选择多个集合中的特定集合,
所述特定集合提供文本文档的所述部分的摘要,
生成文本文档的第二标记包括由精细摘要模型生成一个或多个词的一个或多个附加集合,所述集合提供文本文档的所述部分的相应子章节的摘要,以及
显示文本文档和文本文档的第二标记包括显示一个或多个附加集合。
5.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括命名实体识别模型,
第二NLP模型包括共指消解模型,
生成文本文档的第一标记包括由命名实体识别模型生成文本文档中存在的多个实体,
与文本文档的第一标记的一部分的用户交互包括选择多个实体中的特定实体,
生成文本文档的第二标记包括由共指消解模型识别文本文档中与特定实体语义相关的一个或多个附加实体,
文本文档的所述部分包括一个或多个附加实体,并且
显示文本文档和文本文档的第二标记包括在文本文档内显示特定实体和一个或多个附加实体的视觉指示。
6.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括粗略文本分类模型,
第二NLP模型包括精细文本分类模型,
生成文本文档的第一标记包括由粗略文本分类模型生成文本文档中存在的多个文本类别,
与文本文档的第一标记的一部分的用户交互包括选择多个文本类别中的特定类别,
生成文本文档的第二标记包括由精细文本分类模型识别文本文档中与特定类别相关联的一个或多个句子,
文本文档的所述部分包括一个或多个句子,并且
显示文本文档和文本文档的第二标记包括在文本文档内显示一个或多个句子的视觉指示。
7.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括文本分类模型,
第二NLP模型包括文本蕴含模型,
生成文本文档的第一标记包括由文本分类模型生成文本文档中存在的文本的多个蕴含类别,
与文本文档的第一标记的一部分的用户交互包括选择多个蕴含类别中的特定蕴含类别,
生成文本文档的第二标记包括通过文本蕴含模型识别特定蕴含类别和文本文档中的一个或多个句子之间的文本蕴含程度,
文本文档的所述部分包括一个或多个句子,并且
显示文本文档和文本文档的第二标记包括在文本文档内显示文本蕴含程度的视觉指示。
8.根据权利要求1-2中任一项所述的计算机实现的方法,其中:
第一NLP模型包括文档结构解析模型,
第二NLP模型包括论证挖掘模型,
生成文本文档的第一标记包括由文档结构解析模型生成表示文本文档中存在的段落的层次的树结构,
与文本文档的第一标记的一部分的用户交互包括从树结构中选择表示对应段落的特定节点,
生成文本文档的第二标记包括由论证挖掘模型生成对应段落的论证结构的表示,
文档的所述部分包括对应的段落,并且
显示文本文档和文本文档的第二标记包括显示对应段落的论证结构的视觉表示作为树结构的部分。
9.根据权利要求1-8中任一项所述的计算机实现的方法,其中,显示文本文档和文本文档的第一标记包括:
在文本文档上方显示第一标记,使得第一标记在用户接口内先于文本文档。
10.根据权利要求1-8中任一项所述的计算机实现的方法,其中,显示文本文档和文本文档的第二标记包括:
显示覆盖在文本文档之上的第二标记,使得第二标记在用户接口内看起来与文本文档集成在一起。
11.根据权利要求1-10中任一项所述的计算机实现的方法,其中,第一标记在与文本文档的用户交互之前生成,并且独立于与文本文档的用户交互。
12.根据权利要求1-11中任一项所述的计算机实现的方法,进一步包括:
基于(i)与文本文档的第一标记的一部分的用户交互或(ii)与文本文档的第二标记的用户交互中的一个或多个,为第一NLP模型或第二NLP模型中的至少一个生成训练数据;以及
基于训练数据,通过训练来更新第一NLP模型或第二NLP模型中的至少一个。
13.根据权利要求1-12中任一项所述的计算机实现的方法,进一步包括:
基于以下中的一个或多个来更新用户简档:(i)与文本文档的第一标记的一部分的用户交互或(ii)与文本文档的第二标记的用户交互,其中,第一NLP模型中的至少一个被进一步配置为基于用户简档生成第一标记,或者第二NLP模型被进一步配置为基于用户简档生成第二标记。
14.根据权利要求1-12中任一项所述的计算机实现的方法,进一步包括:
基于用户简档选择第一NLP模型,所述用户简档包括以下中的至少一个:(i)与显示文本文档相关联的用户偏好或(ii)与先前文本文档的先前标记的用户交互历史。
15.根据权利要求1-14中任一项所述的计算机实现的方法,进一步包括:
确定文本文档的分类;以及
基于文本文档的分类选择第一NLP模型。
16.根据权利要求1-15中任一项所述的计算机实现的方法,其中,文本文档的第一标记的生成、第二NLP模型的选择以及文本文档的第二标记的生成中的每个由计算设备的操作系统执行,并且其中,用户接口由所述计算设备提供。
17.根据权利要求1-15中任一项所述的计算机实现的方法,其中,文本文档的第一标记的生成、第二NLP模型的选择以及文本文档的第二标记的生成中的每个由服务器设备执行,服务器设备通信地连接到提供用户接口的计算设备。
18.根据权利要求1-15中任一项所述的计算机实现的方法,其中,文本文档的第一标记的生成、第二NLP模型的选择以及文本文档的第二标记的生成中的每个由被配置为由计算设备执行的网络浏览器应用来执行,并且其中,用户接口由所述web浏览器应用提供。
19.一种系统,包括:
处理器;以及
其上存储有指令的非暂时性计算机可读介质,当所述指令由处理器执行时,使得处理器执行根据权利要求1-18中任一项所述的操作。
20.一种其上存储有指令的非暂时性计算机可读介质,当指令由计算设备执行时,使得计算设备执行根据权利要求1-18中任一项所述的操作。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2020/053208 WO2022071917A1 (en) | 2020-09-29 | 2020-09-29 | Document mark-up and navigation using natural language processing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114600112A true CN114600112A (zh) | 2022-06-07 |
Family
ID=72840669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080048247.4A Pending CN114600112A (zh) | 2020-09-29 | 2020-09-29 | 使用自然语言处理的文档标记和导航 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220318485A1 (zh) |
EP (1) | EP3997609A1 (zh) |
CN (1) | CN114600112A (zh) |
WO (1) | WO2022071917A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230079455A1 (en) * | 2021-08-26 | 2023-03-16 | Tata Consultancy Services Limited | Systems and methods for generating causal insight summary |
US20230196020A1 (en) * | 2021-12-17 | 2023-06-22 | Capital One Services, Llc | Learning framework for processing communication session transcripts |
US11914664B2 (en) * | 2022-02-08 | 2024-02-27 | International Business Machines Corporation | Accessing content on a web page |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080300872A1 (en) * | 2007-05-31 | 2008-12-04 | Microsoft Corporation | Scalable summaries of audio or visual content |
US8442940B1 (en) * | 2008-11-18 | 2013-05-14 | Semantic Research, Inc. | Systems and methods for pairing of a semantic network and a natural language processing information extraction system |
US20140372102A1 (en) * | 2013-06-18 | 2014-12-18 | Xerox Corporation | Combining temporal processing and textual entailment to detect temporally anchored events |
US10380253B2 (en) * | 2014-03-04 | 2019-08-13 | International Business Machines Corporation | Natural language processing with dynamic pipelines |
JPWO2016092924A1 (ja) * | 2014-12-09 | 2017-09-14 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
US10418026B2 (en) * | 2016-07-15 | 2019-09-17 | Comcast Cable Communications, Llc | Dynamic language and command recognition |
US10558467B2 (en) * | 2017-03-30 | 2020-02-11 | International Business Machines Corporation | Dynamically generating a service pipeline comprising filtered application programming interfaces |
CN108959312B (zh) * | 2017-05-23 | 2021-01-29 | 华为技术有限公司 | 一种多文档摘要生成的方法、装置和终端 |
US11050700B2 (en) * | 2017-11-03 | 2021-06-29 | Salesforce.Com, Inc. | Action response selection based on communication message analysis |
US11055354B2 (en) * | 2017-11-03 | 2021-07-06 | Salesforce.Com, Inc. | Omni-platform question answering system |
US20190294669A1 (en) * | 2018-03-20 | 2019-09-26 | Microsoft Technology Licensing, Llc | Smart Narrative Consumption Platform |
US10360304B1 (en) * | 2018-06-04 | 2019-07-23 | Imageous, Inc. | Natural language processing interface-enabled building conditions control system |
US10978046B2 (en) * | 2018-10-15 | 2021-04-13 | Midea Group Co., Ltd. | System and method for customizing portable natural language processing interface for appliances |
US10650819B2 (en) * | 2018-10-15 | 2020-05-12 | Midea Group Co., Ltd. | System and method for providing portable natural language processing interface across multiple appliances |
US11120217B2 (en) * | 2018-12-18 | 2021-09-14 | Micro Focus Llc | Natural language translation-based orchestration workflow generation |
JP7331395B2 (ja) * | 2019-03-20 | 2023-08-23 | 富士フイルムビジネスイノベーション株式会社 | プロセス抽出装置およびプログラム |
US11748128B2 (en) * | 2019-12-05 | 2023-09-05 | International Business Machines Corporation | Flexible artificial intelligence agent infrastructure for adapting processing of a shell |
KR20210142891A (ko) * | 2020-05-19 | 2021-11-26 | 삼성에스디에스 주식회사 | 자연어 처리 모델을 맞춤화하기 위한 방법 및 장치 |
US11651158B2 (en) * | 2020-08-13 | 2023-05-16 | Salesforce, Inc. | Entity resolution for chatbot conversations |
US20220108086A1 (en) * | 2020-10-02 | 2022-04-07 | Salesforce.Com, Inc. | Coarse-to-fine abstractive dialogue summarization with controllable granularity |
-
2020
- 2020-09-29 US US17/594,217 patent/US20220318485A1/en active Pending
- 2020-09-29 CN CN202080048247.4A patent/CN114600112A/zh active Pending
- 2020-09-29 WO PCT/US2020/053208 patent/WO2022071917A1/en unknown
- 2020-09-29 EP EP20790152.1A patent/EP3997609A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3997609A1 (en) | 2022-05-18 |
WO2022071917A1 (en) | 2022-04-07 |
US20220318485A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109801347B (zh) | 一种可编辑图像模板的生成方法、装置、设备和介质 | |
US9785623B2 (en) | Identifying a set of related visible content elements in a markup language document | |
KR101733943B1 (ko) | 계층적-체계화된 컨트롤 갤러리 제공 기법 | |
US11481832B2 (en) | Electronic apparatus and method for summarizing content thereof | |
US7917846B2 (en) | Web clip using anchoring | |
US8806325B2 (en) | Mode identification for selective document content presentation | |
CN100568226C (zh) | 用于重新格式化具有混乱超链接的区域的方法 | |
CN114600112A (zh) | 使用自然语言处理的文档标记和导航 | |
RU2645276C2 (ru) | Создание вариаций при преобразовании данных в потребляемый контент | |
CN111666776B (zh) | 文档翻译方法和装置、存储介质和电子设备 | |
US9703760B2 (en) | Presenting external information related to preselected terms in ebook | |
US20210209289A1 (en) | Method and apparatus for generating customized content based on user intent | |
CN113115096A (zh) | 界面信息切换方法、装置、电子设备和存储介质 | |
US10803236B2 (en) | Information processing to generate screen based on acquired editing information | |
US7620896B2 (en) | Intelligent agenda object for showing contextual location within a presentation application | |
CN108958731B (zh) | 一种应用程序界面生成方法、装置、设备和存储介质 | |
TWI447641B (zh) | 在可攜式裝置上顯示文件之方法與電腦程式產品 | |
US20160239156A1 (en) | Browser application and a method of operating the browser application | |
US9894120B2 (en) | Partial likes of social media content | |
US9100697B1 (en) | Intelligent full window web browser transparency | |
US11681417B2 (en) | Accessibility verification and correction for digital content | |
CN112667939A (zh) | 网页刷新方法、装置、电子设备以及存储介质 | |
TWI828490B (zh) | 翻頁式漫畫線上文字翻譯系統 | |
US20240126978A1 (en) | Determining attributes for elements of displayable content and adding them to an accessibility tree | |
US20220261439A1 (en) | System and method for annotating website content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |