CN111488437A - 在回答问题系统中实现来自结构化源的非结构化内容利用 - Google Patents

在回答问题系统中实现来自结构化源的非结构化内容利用 Download PDF

Info

Publication number
CN111488437A
CN111488437A CN202010068135.7A CN202010068135A CN111488437A CN 111488437 A CN111488437 A CN 111488437A CN 202010068135 A CN202010068135 A CN 202010068135A CN 111488437 A CN111488437 A CN 111488437A
Authority
CN
China
Prior art keywords
question
list
record
control logic
recognition control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010068135.7A
Other languages
English (en)
Other versions
CN111488437B (zh
Inventor
S·A·鲍克斯维尔
K·弗罗斯特
S·J·维尼尔
K·M·布莱克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN111488437A publication Critical patent/CN111488437A/zh
Application granted granted Critical
Publication of CN111488437B publication Critical patent/CN111488437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供用于在回答问题系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。系统接收问题。将问题提供为标记列表T(T1,T2,…,Tn)。接收包括记录R(R1,R2,…,Rk)的结构化源。将头部H(H1,H2,…,Hi)映射到记录。针对问题中的标记列表T(T1,T2,…,Tn)中的任何标记Ti,对每个记录R1、R2、…、Rk进行搜索。响应于在记录Rj中识别问题中的标记Ti,将标记Ti添加到跟踪结构。将映射到记录Rj的任何头部与问题中的标记列表T(T1,T2,…,Tn)比较。响应于在问题中识别映射到记录Rj的头部Hj,将头部Hj添加到跟踪结构。根据在问题中找出的标记顺序对跟踪结构排序,并将来自跟踪结构的已排序的条目作为问题的回答返回。

Description

在回答问题系统中实现来自结构化源的非结构化内容利用
技术领域
本发明总体上涉及数据处理领域,更具体地涉及用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。
背景技术
在能够回答问题的系统或者问答(Question Answer,QA)系统中,使用诸如数据库记录或电子表格这样的结构化源有时对回答问题是有利的。例如,在问题“古巴的总统是谁?”中,可以通过对表进行查阅并根据像记录中的其他实体或者头部这样的线索解释表的内容来合理地推断正确的回答。在将问题翻译成数据库查询以用于候选回答检索方面已经做了许多工作,但是它们往往需要大量的预备工作或训练数据。在将结构化源翻译成非结构化文本方面也已经做了许多工作,有时称为“表叙述”(table narration)。
需要机制以在能够回答问题的系统中高效地并且有效地实现来自结构化源的非结构化内容利用。
发明内容
本发明的主要方面在于提供用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。本发明的其他重要方面在于提供基本上没有负面效果并且克服现有技术部署的许多缺点的方法、系统和计算机程序产品。
简言之,提供用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。由系统接收问题。将问题提供为标记(token)列表T(T1,T2,…,Tn)。接收包括记录R(R1,R2,…,Rk)的结构化源。将头部H(H1,H2,…,Hi)映射到记录。针对问题中的标记列表T(T1,T2,…,Tn)中的任何标记Ti对每个记录R1、R2、…、Rk进行搜索。响应于在记录Rj中识别问题中的标记Ti,将标记Ti添加到跟踪结构(trackingstructure)。将映射到记录Rj的任何头部与问题中的标记列表T(T1,T2,…,Tn)比较。响应于在问题中识别映射到记录Rj的头部Hj,将头部Hj添加到跟踪结构。根据在问题中找出的标记顺序对跟踪结构进行排序,并将来自跟踪结构的已排序的条目作为问题的回答返回。
根据本发明的特征,从由表、电子表格、列表、数组以及数据库记录集合构成的组中选择结构化源。
根据本发明的特征,填充标记列表以模拟与问题比较的段落。
根据本发明的特征,回答得分模型直接对记录R(R1,R2,…,Rk)进行操作。
附图说明
通过在附图中例示说明的本发明的优选实施例的以下详细描述,可以最好地理解本发明以及以上和其他目的及优点,其中:
图1提供根据优选实施例的用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的示例计算机系统的框图;
图2A、图2B和图3分别是例示说明根据优选实施例的在能够回答问题的系统中实现来自结构化源的非结构化内容利用的示例系统操作的流程图;以及
图4是例示说明根据优选实施例的计算机程序产品的框图。
具体实施方式
在本发明的实施例的以下详细描述中,对例示说明可以实践本发明的示例实施例的附图进行参考。要理解的是,在不脱离本发明的范围的情况下可以利用其他实施例,并且可以进行结构上的改变。
本文中使用的术语仅是为了描述实施例而非意图限制本发明。如本文中所使用的,单数形式“一”“一个”和“该”意图也包括复数形式,除非上下文另外明确指出。还将理解的是,当在本说明书中使用术语“包括”和/或“包含”时,指定存在所述特征、整数、步骤、操作、元素和/或组件,但是不排除存在或添加一个或多个其他特征、整数、步骤、操作、元素、组件和/或其组。
根据本发明的特征,提供用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。
现在参考附图,在图1中,示出有根据优选实施例的总体上由附图标记100标出的实施本发明的示例系统,用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用。系统100包括计算机系统102,该计算机系统包括一个或多个处理器104或通用可编程中央处理单元(CPU)104。如图所示,计算机系统102包括单个CPU 104;然而,系统102可以包括对于相对大型的系统典型的多个处理器104。
根据优选实施例,计算机系统102包括具有操作系统108的系统存储器106、回答识别控制逻辑110以及跟踪结构111。系统存储器106是用于存储数据(包括程序)的随机存取半导体存储器。系统存储器106例如包括动态随机存取存储器(DRAM)、同步直接随机存取存储器(SDRAM)、当前双倍数据速率(DDRx)SDRAM、非易失性存储器、光学存储设备以及其他存储设备。
计算机系统102包括网络接口116以及存储设备112,该存储设备根据优选实施例包括结构化源114。结构化源114例如包括表、电子表格、列表、数组以及数据库记录集合。计算机系统102包括I/O接口118,该I/O接口用于向计算机系统组件传输数据和传输来自计算机系统组件的数据,该计算机系统组件包括CPU 104、包括操作系统108的存储器106、回答识别控制逻辑110、跟踪结构111、包括结构化源114的存储设备112及网络接口116、以及网络120以及用户查询系统输入和显示的查询回答122。
根据本发明的特征,回答识别控制逻辑110使得能够通过跟踪结构111和结构化源114进行回答识别。回答识别控制逻辑110在用户查询系统输入和显示的查询回答122处向用户显示查询回答信息122。
参考图2A、图2B以及图3,示出有根据优选实施例的总体上由附图标记200、230和300标出的图1的计算机系统102的相应的示例系统操作,用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用。
参考图2A,实现查询回答识别的系统操作200开始于接收问题的框202。如框204所示,问题被分解成标记列表T(T1,T2,…,Tn)。如框206所示,接收包括记录R(R1,R2,…,Rk)的结构化源。如框208所示,将头部H(H1,H2,…,Hi)映射到记录。如框208所示,针对问题中的标记列表T(T1,T2,…,Tn)中的任何标记Ti,对记录R(R1,R2,…,Rk)中的每个记录进行搜索。
如决策框212所示,进行对出现在记录Rj中的任何标记Ti的检查。如框214所示,响应于在问题中识别记录Rj中的标记Ti,将标记Ti添加到跟踪结构。如框216所示,将映射到记录Rj的任何头部与问题中的标记列表T(T1,T2,…,Tn)比较。
如框218所示,响应于在问题中识别映射到记录Rj的头部Hj,将头部Hj添加到跟踪结构。如框220所示,根据在问题中找出的标记顺序,对跟踪结构进行排序。如决策框222所示,将来自跟踪结构的已排序的条目作为问题的回答返回。
参考图2B,例如考虑以下问题:“古巴的总统是谁?”,提供实现查询回答识别的系统操作230。搜索检索25个非结构化文件,其中没有文件包括与我们的问题有关的信息。进一步假设还返回诸如简单的电子表格的结构化文件:
国家|首都|总统
法国|巴黎|埃马纽埃尔·马克龙
古巴|哈瓦那|劳尔·卡斯特罗
俄罗斯|莫斯科|弗拉基米尔·普京
现在,该结构化资源中的第二个记录与搜索问题有关。如下填充标记列表,该标记列表将模拟将与问题比较的段落。将因此构建标记列表:
在图2B中,如框232所示,令M为标记列表的列表并且针对表中的每个记录R。如框234所示,令L为标记列表,令K为标记列表的列表并且针对R中的每个条目E。如框236所示,令P为标记列表。如决策框238所示,进行条目E是否出现在问题中的检查。当条目E出现在问题中时,如框240所示将条目E添加到P。如决策框242所示,进行条目E的头部是否出现在问题中的检查。当条目E的头部出现在问题中时,如框244所示将条目E的头部添加到P。
如框246所示,根据单词在问题中出现的索引对P进行排序。如框248所示,根据第一个单词在问题中出现的索引对P进行排序。如框250所示,将标记列表P添加到标记列表的列表K。如框252所示,针对标记列表的列表K中的每个列表Q,将列表展开(flatten)。如框254所示,针对Q中的每个标记R,将R添加到标记列表L。如框256所示,将标记列表L添加到标记列表的列表M。
参考图3,提供实现查询回答识别的系统操作300。例如,考虑问题“古巴的总统是谁?”。针对第一个记录R产生空列表L,因为没有共同的标记。然而,针对第二个记录,我们将生成非空列表L。针对条目E=“古巴”,将“古巴”而非“国家”添加到P。针对条目E=“哈瓦那”,没有什么被添加到P。针对条目E=“劳尔·卡斯特罗”,则将实体“劳尔·卡斯特罗”和“总统”以该顺序添加到P。如框302所示,现在列表P本身看上去像示例列表P,[[古巴],[劳尔·卡斯特罗,总统]]。如框304所示,然后根据问题单词顺序,将P排序成:[[劳尔·卡斯特罗,总统],[古巴]]。如框306所示,然后将列表展开成:[劳尔·卡斯特罗,总统,古巴]。例如,考虑问题:“劳尔·卡斯特罗是哪个国家的总统?”,将产生“古巴,劳尔·卡斯特罗,总统”。
现在参考图4,例示说明本发明的一件制品或计算机程序产品400。计算机程序产品400有形地实施在包括记录介质402的非暂时性计算机可读存储介质上,诸如软盘、光学读取的光盘或CD-ROM形式的高容量只读存储器、磁带或者其他类似的计算机程序产品。如本文中所使用的计算机可读存储介质402本身不应被理解为是瞬时信号,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如通过光纤电缆的光脉冲)、或者通过线传输的电信号。记录介质402在非暂时性计算机可读存储介质402上存储程序资料或指令404、406、408和410,以实现用于在能够回答问题的系统(诸如图1的系统100)中利用来自结构化源的非结构化内容的方法。
本文中描述的计算机可读程序指令404、406、408和410可以从计算机可读介质下载到相应的计算/处理设备,或者经由例如因特网、局域网、广域网和/或无线网络的网络下载到外部计算机或外部存储设备。计算机程序产品400可以包括驻留为云应用的基于云的软件,通常由软件即服务(Software as a Service)的首字母缩略词(SaaS)相称。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令404、406、408和410,并转发计算机可读指令以存储在相应的计算/处理设备中的计算机可读存储介质中。
由记录的程序资料404、406、408和410定义的一系列程序指令或一个或多个相互关联的模块的逻辑配件对系统100进行指导以实现优选实施例的问答识别。
尽管已经参考附图中所示的本发明的实施例的细节描述了本发明,但是这些细节并非意图限制所附权利要求书所要求保护的本发明的范围。

Claims (20)

1.一种用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的系统,该系统包括:
回答识别控制逻辑;
所述回答识别控制逻辑和跟踪结构有形地实施在非暂时性机器可读介质中,该非暂时性机器可读介质用于利用来自结构化源的非结构化内容实现问题回答;
所述回答识别控制逻辑接收问题,并将所述问题分解成标记列表;
所述回答识别控制逻辑接收包括记录的结构化源,并将头部映射到记录;
所述回答识别控制逻辑针对所述问题中的所述标记列表中的任何标记对每个记录进行搜索,响应于在记录中识别所述问题中的标记,将所述标记添加到跟踪结构,并且将映射到所述记录的任何头部与所述问题中的所述标记列表进行比较,并且响应于在所述问题中识别映射到所述记录的头部,将所述头部添加到跟踪结构;
所述回答识别控制逻辑根据在所述问题中找出的标记顺序,对所述跟踪结构进行排序,并且将来自所述跟踪结构的已排序的条目作为所述问题的回答返回。
2.如权利要求1所述的系统,其中,所述结构化源从由表、电子表格、列表、数组以及数据库记录集合构成的组中选择。
3.如权利要求2所述的系统,其中,所述回答识别控制逻辑接收包括记录的结构化源并将头部映射到记录还包括:所述回答识别控制逻辑接收非结构化自由文本文档,并且接收包括记录的一个或多个结构化源。
4.如权利要求1所述的系统,其中,所述回答识别控制逻辑接收问题并将所述问题分解成标记列表包括:从查询用户接收非结构化自由文本问题。
5.如权利要求1所述的系统,其中,所述回答识别控制逻辑接收问题并将所述问题分解成标记列表包括:所述回答识别控制逻辑根据在所述问题中找出的标记顺序对所述跟踪结构进行排序并且将来自所述跟踪结构的已排序的条目作为所述问题的回答返回包括:所述回答识别控制逻辑向所述用户发送并显示查询回答。
6.如权利要求1所述的系统,其中,所述回答识别控制逻辑根据在所述问题中找出的标记顺序对所述跟踪结构进行排序包括:所述回答识别控制逻辑根据单词在所述问题中出现的索引,对标记列表进行排序。
7.如权利要求6所述的系统,其中,所述回答识别控制逻辑根据第一个单词在所述问题中出现的索引,对标记列表进行排序。
8.如权利要求7所述的系统,包括所述回答识别控制逻辑,包括:所述回答识别控制逻辑针对标记列表的列表中的每个列表,将所述列表展开。
9.一种用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法,该方法包括:
提供回答识别控制逻辑;
所述回答识别控制逻辑和跟踪结构有形地实施在非暂时性机器可读介质中,该非暂时性机器可读介质用于利用来自结构化源的非结构化内容实现问题回答;包括:
接收问题,并将所述问题分解成标记列表;
接收包括记录的结构化源,并将头部映射到记录;
针对所述问题中的所述标记列表中的任何标记对每个记录进行搜索,响应于在记录中识别所述问题中的标记,
将所述标记添加到跟踪结构,
将映射到所述记录的任何头部与所述问题中的所述标记列表进行比较,并且
响应于在所述问题中识别映射到所述记录的头部,将所述头部添加到跟踪结构;
根据在所述问题中找出的标记顺序,对所述跟踪结构进行排序,以及
将来自所述跟踪结构的已排序的条目作为所述问题的回答返回。
10.如权利要求9所述的方法,其中,接收包括记录的结构化源包括:接收从由表、电子表格、列表、数组以及数据库记录集合构成的组中选择的结构化源。
11.如权利要求9所述的方法,其中,接收问题并将所述问题分解成标记列表包括:从查询用户接收非结构化自由文本问题。
12.如权利要求9所述的方法,其中,接收问题并将所述问题分解成标记列表包括:根据单词在所述问题中出现的索引,对跟踪结构进行排序。
13.如权利要求12所述的方法,包括:根据第一个单词在所述问题中出现的索引,对所述跟踪结构进行排序。
14.如权利要求13所述的方法,包括:针对标记列表的列表中的每个列表,将所述列表展开。
15.如权利要求9所述的方法,其中,将来自所述跟踪结构的已排序的条目作为所述问题的回答返回包括:向所述用户发送并显示查询回答。
16.一种计算机可读存储介质,实施计算机程序产品,用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用,所述计算机程序产品用于利用来自结构化源的非结构化内容实现问题回答,包括:
接收问题,并将所述问题分解成标记列表;
接收包括记录的结构化源,并将头部映射到记录;
针对所述问题中的所述标记列表中的任何标记对每个记录进行搜索,响应于在记录中识别所述问题中的标记,
将所述标记添加到跟踪结构,
将映射到所述记录的任何头部与所述问题中的所述标记列表进行比较,并且
响应于在所述问题中识别映射到所述记录的头部,将所述头部添加到跟踪结构;
根据在所述问题中找出的标记顺序,对所述跟踪结构进行排序,以及
将来自所述跟踪结构的已排序的条目作为所述问题的回答返回。
17.如权利要求16所述的计算机可读存储介质,其中,接收包括记录的结构化源包括:接收从由表、电子表格、列表、数组以及数据库记录集合构成的组中选择的结构化源。
18.如权利要求16所述的计算机可读存储介质,其中,接收问题并将所述问题分解成标记列表包括:从查询用户接收非结构化自由文本问题。
19.如权利要求16所述的计算机可读存储介质,其中,将来自所述跟踪结构的已排序的条目作为所述问题的回答返回包括:向所述用户发送并显示查询回答。
20.一种计算机系统,包括被配置为进行根据权利要求9至15中的任意一项所述的方法中的步骤的模块。
CN202010068135.7A 2019-01-28 2020-01-21 在回答问题系统中实现来自结构化源的非结构化内容利用 Active CN111488437B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/258,957 2019-01-28
US16/258,957 US10915561B2 (en) 2019-01-28 2019-01-28 Implementing unstructured content utilization from structured sources in system for answering questions

Publications (2)

Publication Number Publication Date
CN111488437A true CN111488437A (zh) 2020-08-04
CN111488437B CN111488437B (zh) 2023-08-11

Family

ID=71732631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010068135.7A Active CN111488437B (zh) 2019-01-28 2020-01-21 在回答问题系统中实现来自结构化源的非结构化内容利用

Country Status (2)

Country Link
US (1) US10915561B2 (zh)
CN (1) CN111488437B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103124980A (zh) * 2010-09-24 2013-05-29 国际商业机器公司 包括从多个文档段收集答案的提供问题答案
US20170116250A1 (en) * 2015-10-23 2017-04-27 International Business Machines Corporation System and Method for Identifying Answer Key Problems in a Natural Language Question and Answering System
CN107257970A (zh) * 2014-12-18 2017-10-17 纽昂斯通讯公司 从结构化和非结构化数据源进行的问题回答
US20180081628A1 (en) * 2016-09-21 2018-03-22 International Business Machines Corporation Preserving Temporal Relevance in a Response to a Query

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266537B2 (en) * 2004-01-14 2007-09-04 Intelligent Results Predictive selection of content transformation in predictive modeling systems
US7792814B2 (en) 2005-09-30 2010-09-07 Sap, Ag Apparatus and method for parsing unstructured data
US8924269B2 (en) * 2006-05-13 2014-12-30 Sap Ag Consistent set of interfaces derived from a business object model
WO2012040676A1 (en) 2010-09-24 2012-03-29 International Business Machines Corporation Using ontological information in open domain type coercion
WO2012040356A1 (en) * 2010-09-24 2012-03-29 International Business Machines Corporation Providing question and answers with deferred type evaluation using text with limited structure
US9098484B2 (en) 2012-05-07 2015-08-04 Patrick Viry Structuring and editing a recursively multi-dimensional spreadsheet
US20140229344A1 (en) 2013-02-08 2014-08-14 Adrian G. Breef Systems and methods for parsing unknown codes obtained from a customizable spreadsheet application interface
KR20150129134A (ko) 2014-05-08 2015-11-19 한국전자통신연구원 질의 응답 시스템 및 그 방법
US10380246B2 (en) 2014-12-18 2019-08-13 International Business Machines Corporation Validating topical data of unstructured text in electronic forms to control a graphical user interface based on the unstructured text relating to a question included in the electronic form
US11775891B2 (en) * 2017-08-03 2023-10-03 Telepathy Labs, Inc. Omnichannel, intelligent, proactive virtual agent
US10878195B2 (en) 2018-05-03 2020-12-29 Microsoft Technology Licensing, Llc Automated extraction of unstructured tables and semantic information from arbitrary documents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103124980A (zh) * 2010-09-24 2013-05-29 国际商业机器公司 包括从多个文档段收集答案的提供问题答案
CN107257970A (zh) * 2014-12-18 2017-10-17 纽昂斯通讯公司 从结构化和非结构化数据源进行的问题回答
US20170116250A1 (en) * 2015-10-23 2017-04-27 International Business Machines Corporation System and Method for Identifying Answer Key Problems in a Natural Language Question and Answering System
US20180081628A1 (en) * 2016-09-21 2018-03-22 International Business Machines Corporation Preserving Temporal Relevance in a Response to a Query

Also Published As

Publication number Publication date
US20200242143A1 (en) 2020-07-30
US10915561B2 (en) 2021-02-09
CN111488437B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN102253936B (zh) 记录用户访问商品信息的方法及搜索方法和服务器
EP3611631A1 (en) Method, apparatus and device for generating entity relationship data, and storage medium
US20180210961A1 (en) Information search method and apparatus
DE102016125767A1 (de) Entdeckung einer verbundenen Entität
CN111552766B (zh) 使用机器学习来表征在引用图形上应用的参考关系
US11977567B2 (en) Method of retrieving query, electronic device and medium
US11182681B2 (en) Generating natural language answers automatically
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
KR20150018880A (ko) 정보 취합 분류의 디스플레이 방법 및 시스템
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN111563382A (zh) 文本信息的获取方法、装置、存储介质及计算机设备
US20140236939A1 (en) Systems and methods for topical grouping of search results and organizing of search results
CN114741570A (zh) 图数据库的查询方法、索引创建方法及相关设备
CN110110184B (zh) 信息查询方法、系统、计算机系统及存储介质
CN112307318A (zh) 一种内容发布方法、系统及装置
CN109783599A (zh) 基于多种存储介质的知识图谱检索方法及系统
CN117708270A (zh) 企业数据查询方法、装置、设备及存储介质
CN115210705A (zh) 具有无效值或等效值的关系表的向量嵌入模型
CN111488437B (zh) 在回答问题系统中实现来自结构化源的非结构化内容利用
CN113139558A (zh) 确定物品的多级分类标签的方法和装置
CN110866085A (zh) 数据反馈方法与装置
US20200110769A1 (en) Machine learning (ml) based expansion of a data set
US11669555B2 (en) System and method of creating index
CN108536872B (zh) 优化知识库结构的方法与装置
CN110472055B (zh) 用于标注数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant