CN113139036B - 一种信息交互方法及设备 - Google Patents
一种信息交互方法及设备 Download PDFInfo
- Publication number
- CN113139036B CN113139036B CN202010067585.4A CN202010067585A CN113139036B CN 113139036 B CN113139036 B CN 113139036B CN 202010067585 A CN202010067585 A CN 202010067585A CN 113139036 B CN113139036 B CN 113139036B
- Authority
- CN
- China
- Prior art keywords
- answer
- entity
- candidate
- semantic vector
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000003993 interaction Effects 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 160
- 230000014509 gene expression Effects 0.000 claims abstract description 32
- 230000004044 response Effects 0.000 claims abstract description 16
- 238000012216 screening Methods 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 61
- 230000008569 process Effects 0.000 description 18
- 239000000306 component Substances 0.000 description 16
- 239000000945 filler Substances 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000008358 core component Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 241000396377 Tranes Species 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000272041 Naja Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种信息交互方法及设备。该方法包括:接收接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本;获取知识库中与所述查询语句文本中实体指称对应的实体,并选择一个核心实体,根据所述核心实体的属性信息得到所述核心实体的候选三元组集合;抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合得到候选逻辑表达式集合;筛选所述候选逻辑表达式,得到所述查询请求对应的候选答案集合;根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。
Description
技术领域
本申请涉及通信技术,尤其涉及一种信息交互方法及设备。
背景技术
随着以深度学习为代表的人工智能技术的快速发展,人机对话成为人工智能产品(比如,智能音箱、智能电视、智能手机等)的代表性标志,得到工业界和学术界的广泛关注。人机对话产品不断涌现。其中,知识问答作为人机对话的重要形式,也是语音交互中的一个典型场景,问答系统为人类用更简单自然的方式与机器进行交互提供了可能。
问答系统的研究,是语义计算和自然语言处理的综合型应用,包含多种典型自然语言处理基本模型,例如实体识别,语义匹配等。当前学术界的研究往往仅关注单一模型在某一具体问题上的效果,而忽视在系统整体中的实用性,工业界的研究又出于对准确率和结果的可控性考虑,多数采用了在单一领域进行简单语义匹配的方法,限制了问答系统的领域扩展、知识更新和语义泛化能力。虽然知识问答在智能产品上已经产生了大量的应用,但是要实现人与机器之间更自然的口语化问答还有待研究。
目前的问答系统多是基于字面信息的语义解析和模板匹配,一方面很难克服语言的歧义性精准理解用户多样化的问题,另一方面由于其严重的依赖人工,昂贵的人力成本使其难以支撑新业务领域的拓展和快速的知识系统更新。
因此,需要提供一种使机器拥有更完善的口语化理解能力以及快速的领域扩展和知识更新机制的信息交互方法以完成人机交互过程。
发明内容
本申请实施例提供了一种信息交互方法,用以在人机交互过程中,通过对海量语料和大规模的知识图谱的学习,对用户问题进行深层次、知识化理解,结合知识查询、知识计算等多种技术,提供多领域、细粒度的知识问答系统,使得机器拥有更完善的口语化理解能力以及快速的领域扩展和知识更新机制,进而提高用户体验。
第一方面,本申请实施例提供的一种信息交互方法,包括:
接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本;
识别得到查询语句文本中的实体指称,获取知识库中与实体指称对应的实体;
从实体指称对应的实体中选择一个核心实体,并根据知识库中核心实体的属性信息得到核心实体的候选三元组集合,候选三元组集合中包括至少一个候选三元组,候选三元组用于描述核心实体与一个核心实体属性间的关系;
抽取用户查询语句文本中的关系信息得到关系集合,将关系集合中的关系分别与核心实体组合,得到候选逻辑表达式集合;
根据用户查询语句文本的依存关系,筛选候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及核心实体的候选三元组集合,得到查询请求对应的候选答案集合;
确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,并根据查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度选择查询请求对应的答案;
向智能设备发送查询响应,查询响应携带查询请求对应的答案。
本申请的实施中,从实体指称对应的实体中选择一个核心实体,具体包括:
获取实体指称对应的实体的信息丰富度以及搜索热度;
将实体指称对应的实体的搜索热度归一化后作为权重与实体指称对应的实体的信息丰富度相乘,得到实体指称对应的实体的分值;
根据实体指称对应的实体的分值选择一个核心实体。
本申请的实施中,确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,具体包括:
确定查询语句文本的语义向量与候选答案集合中每个答案的实体的语义向量间的相似度;
确定查询语句文本的语义向量与候选答案集合中每个答案的路径的语义向量间的相似度;
将查询语句文本的语义向量与候选答案集合中每个答案的实体的语义向量间的相似度与查询语句文本的语义向量与候选答案集合中每个答案的路径的语义向量间的相似度相加,得到查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度。
本申请的实施中,根据查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度选择查询请求对应的答案,包括:
在查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度中,获取最大相似度以及与最大相似度间的差值在设定间隔值之内的相似度,将获取到的相似度所对应的答案确定为预测答案,得到预测答案集合;
选择预测答案集合中相似度大于或等于设定阈值的预测答案,作为查询请求对应的答案。
本申请的实施中,核心实体的属性信息至少包括以核心实体为起始节点的路径上的至少一跳节点所对应的实体;其中,在知识图谱中,以核心实体为起始节点的子树中包括至少一条路径,该路径上至少包括一跳节点,其中相邻两跳节点对应于存在关系的两个实体。
第二方面,本申请实施例提供的一种服务器,包括:
接收模块,用于接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本;
实体指称获取模块,用于识别得到查询语句文本中的实体指称,获取知识库中与实体指称对应的实体;
核心实体候选三元组确定模块,用于从实体指称对应的实体中选择一个核心实体,并根据知识库中核心实体的属性信息得到核心实体的候选三元组集合,候选三元组集合中包括至少一个候选三元组,其中每个候选三元组用于描述核心实体与一个核心实体属性间的关系;
候选逻辑表达式集合确定模块,用于抽取用户查询语句文本中的关系信息得到关系集合,将关系集合中的关系分别与核心实体组合,得到候选逻辑表达式集合;
候选答案集合确定模块,用于根据用户查询语句文本的依存关系,筛选候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及核心实体的候选三元组集合,得到查询请求对应的候选答案集合;
答案选择模块,用于确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,并根据查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度选择查询请求对应的答案;
发送模块,用于向智能设备发送查询响应,查询响应携带查询请求对应的答案。
本申请的实施中,确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,具体包括:
确定查询语句文本的语义向量与候选答案集合中每个答案的实体的语义向量间的相似度;
确定查询语句文本的语义向量与候选答案集合中每个答案的路径的语义向量间的相似度;
将查询语句文本的语义向量与候选答案集合中每个答案的实体的语义向量间的相似度与查询语句文本的语义向量与候选答案集合中每个答案的路径的语义向量间的相似度相加,得到查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度。
第三方面,本申请实施例提供的一种服务器,包括:处理器和存储器;
存储器与处理器连接,配置为存储计算机指令;处理器与存储器连接,配置为执行计算机指令以使得服务器进行如上述第一方面中任一项所述的方法。
第四方面,本申请实施例提供的一种计算机存储介质,该计算机存储介质中存储有计算机程序指令,当指令在计算机上运行时,使得计算机执行上述第一方面中任一项所述的方法。
本申请的上述实施例中,在响应用户的查询语句文本时,一方面,面向结构化的全领域知识图谱,可以实现问答系统的快速知识更新和领域动态扩展;另一方面,通过查询语句文本和整个知识图谱在语义空间中的相似度关系,提高语义泛化能力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图;
图2中示例性示出了根据实施例中信息交互方法流程示意图;
图3中示例性示出了根据实施例中基于知识图谱的实体链接算法逻辑图;
图4中示例性示出了根据实施例中基于知识图谱的实体链接算法流程图;
图5中示例性示出了根据实施例中依存句法分析算法示意图;
图6中示例性示出了根据实施例中实体问答的系统结构图;
图7示例性示出了根据实施例中基于深度学习的问答排序模型示意图;
图8示例性示出了根据实施例中知识图谱表示学习方法的TransE模型示意图。
具体实施方式
为使本申请示例性实施例的目的、技术方案和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请中示出的示例性实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。
应当理解,本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语″包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
本申请中使用的术语″模块″,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
下面结合附图对本申请实施例进行详细描述,以下的部分实施例中,以信息交互设备为显示设备为例描述。
图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图。如图1中示出,用户可通过移动终端300和控制装置100操作显示设备200。
其中,控制装置100可以遥控器,包括红外协议通信或蓝牙协议通信,及其他短距离通信方式等,通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键,语音输入、控制面板输入等输入用户指令,来控制显示设备200。如:用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令,来实现控制显示设备200的功能。
在一些实施例中,也可以使用移动终端、平板电脑、计算机、笔记本电脑等设备控制显示设备200。例如,使用在移动终端上运行的应用程序控制显示设备200,该应用程序通过配置关联在移动终端的屏幕上,以直观的用户界面(UI)为用户提供各种控制。
示例的,移动终端300可与显示设备200安装软件应用,通过网络通信协议实现连接通信,实现一对一控制操作的和数据通信的目的。如:可以实现用移动终端300与显示设备200建立控制指令协议,将遥控控制键盘同步到移动终端300上,通过控制移动终端300上用户界面,实现控制显示设备200的功能。也可以将移动终端300上显示音视频内容传输到显示设备200上,实现同步显示功能。
如图1中还示出,显示设备200还与服务器400通过多种通信方式进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。示例的,显示设备200通过发送和接收信息,以及电子节目指南(EPG)互动,接收软件程序更新,或访问远程储存的数字媒体库。服务器400可以一组,也可以多组,可以一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。
显示设备200,可以为智能电视、智能音箱。具体智能产品类型、设备型号等不作限定,本领技术人员可以理解的是,显示设备200可以根据需要做性能和配置上一些改变。
显示设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能。示例的包括,网络电视、智能电视、互联网协议电视(IPTV)等。
示例性地,本申请实施例中的显示设备可以是具有语音交互功能的智能设备,比如智能电视、智能手机等,该显示设备可以响应用户查询请求,并在用户界面显示查询请求的响应结果。本申请实施例中的信息交互方法也适用具有语音交互功能的播放设备,比如智能音箱,该播放设备可以响应用户的查询请求,播放查询请求的响应结果。
服务器400中可配置有知识问答系统,并与智能设备进行信息交互,以处理用户的查询请求,从而实现智能人机交互。
知识问答系统有两个关键点:精准的问题理解和高质量的知识来源。近年来,大数据和深度学习技术的发展,在这两个关键点上带来了数据层面和模型层面的发展契机:
(1)从数据中进行问题的深度语义学习。问题理解由于语言表达的多样性和复杂性,很难人工制定一套规则完成问题的理解,因此,从海量数据中进行语义学习是必要的。社交问答网站的兴起,包括百度知道,搜狗问问等,由于用户在上面进行提问和回答,这些网站包含了大量的问答数据集,为问题理解学习提供优质数据资源。
(2)知识图谱提供高质量的知识来源。由于知识表述的多样性以及知识关联的复杂性,问答系统需要优质而大量的知识来源。借助百度百科、互动百科等开放词条数据,可以构建高准确率、海量规模、可快速更新的知识图谱,为问答系统提供结构化、关联化的知识来源,为高效的问题回答提供知识基础。
(3)深度语义匹配缩短跨越语义鸿沟。问答系统的核心在于问题语义和知识语义的理解与相似度计算,这是机器理解人类语言和知识表达的关联,也是跨越语义鸿沟的关键。人类倾向于使用多样化、非结构化的表达来描述问题和知识,而机器偏爱唯一化、结构化的知识。基于深度神经网络的问答系统可直接作用于缩短和跨越语义鸿沟,将多样而模糊的问题映射到具体而唯一的知识库中。
基于此,本申请实施例提供一种信息交互方法以及实现该方法的服务器,用以在人机交互过程中,响应用户查询请求时,基于结构化的全领域知识图谱和海量问答数据,利用神经网络对用户查询语句文本进行深层次、知识化的表示学习,并结合实体链接、关系抽取、依存句法分析等多种技术提高候选答案的召回率,使得机器拥有更完善的口语化理解能力以及快速的领域扩展和知识更新机制,进而提高用户体验。
为清楚说明本申请的实施例,下面给出一些语义分析相关的名词的相关解释。
名词性实体:是指客观存在并可相互区别的事物,包括具体的人、事、物、机构、抽象的概念或联系。
实体指称:指代实体的一个名称。
知识库:知识根据它们的应用领域特征、背景特征、使用特征、属性特征等而被构成便于利用的、有结构的组织形式,称为知识库。比如,在实体链接研究中所使用的中文知识库包括百度百科、互动百科、中文维基百科等,英文知识库包括维基百科等。
其中,知识库包括实体的相关信息,包括描述文本、类别标签、实体在搜索问答网站(比如搜狗、百度等)的搜索热度以及实体在知识库中的信息丰富度等信息,实体在知识库中的信息丰富度与实体在知识图谱中的路径数成正相关。
知识图谱:以可视化图谱结构展示实体的属性信息,属性信息包括实体的路径及该路径对应的另一实体,其中路径也可称为实体与另一实体间的关系。比如,实体刘德华与实体演员在知识图谱中的一条路径(关系)为职业,演员。
实体链接:将查询语句文本中的实体指称关联到知识库中的相应实体的过程。
举例来说,查询语句文本″刘德华的老婆是做什么的″,″刘德华″″老婆″为实体指称,其在知识库中相应实体为″刘德华_中国香港男演员、歌手、制片人、填词人″″老婆_汉语词语″,实体指称关联到知识库中相应实体的过程为实体链接。
本申请的实施例中,确定用户查询语句文本中实体指称在知识库中的核心实体,根据用户查询语句文本与核心实体的关系集合得到候选逻辑表达式,经依存句法分析,确定查询语句文本对应的候选答案集合,根据查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度确定查询语句文本对应的答案并响应。
图2中示例性示出了根据实施例中信息交互方法流程示意图。如图所示,该流程包括:
S201:智能设备接收到用户的语音请求,并向服务器发送查询请求。
该步骤中,用户打开智能设备中的语音助手,通过语音助手发送语音请求,智能设备可对语音请求进行去燥(包括去除回声和环境噪声),得到干净的语音请求。其中,语音助手可为智能手机、智能电视、智能音箱等智能设备的语音输入应用程序。
S202:服务器接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本。
该步骤中,用户查询语句文本可为智能设备识别得到的,也可为服务器识别得到的。
S203:服务器识别得到用户查询语句文本中的实体指称,获取知识库中与实体指称对应的实体,并从实体指称对应的实体中选择一个核心实体。
该步骤中,可根据知识库中实体的信息丰富度及搜索热度确定核心实体。其中,用户查询语句文本中,可能有多个实体指称,每个实体指称又可能会有多个候选实体,若用户查询语句文本中只有一个实体指称,其在知识库中的对应实体即为核心实体。
举例来说,用户查询语句文本为″刘德华的老婆是做什么的″,识别得到的实体指称为″刘德华″、″老婆″将该实体指称链接到知识库中的对应实体为″刘德华_中国香港男演员、歌手、制片人、填词人″,″老婆_汉语词语″,查询知识库得到对应实体″刘德华_中国香港男演员、歌手、制片人、填词人″的信息丰富度为38(即有38对三元组),对应实体″老婆_汉语词语″的信息丰富度为6(即有6对三元组),将两个对应实体的搜索热度进行归一化后作为权重分别乘以各自的信息丰富度,得到对应实体的最终得分,得分最高的对应实体″刘德华_中国香港男演员、歌手、制片人、填词人″作为核心实体。
该步骤中,确定核心实体的具体过程参见图3、图4,在此不做详细的描述。
S204:服务器根据知识库中核心实体的属性信息得到核心实体的候选三元组集合,候选三元组集合中包括至少一个候选三元组,其中每个候选三元组用于描述核心实体与一个核心实体属性间的关系。
该步骤中,核心实体的候选三元组可采用知识图谱表示学习的TransE模型学习得到。
以上述实施例为例,查询知识库中得到核心实体″刘德华_中国香港男演员、歌手、制片人、填词人″的属性信息,根据其两条关系路径内的属性信息组成候选三元组集合为{(刘德华_中国香港男演员、歌手、制片人、填词人,国籍,中国),(刘德华_中国香港男演员、歌手、制片人、填词人,民族、汉族),(刘德华_中国香港男演员、歌手、制片人、填词人,妻子,朱丽倩),(朱丽倩,职业,平面模特)...}。
其中,TransE模型的训练过程具体参见图8,在此不做详细描述。
S205:服务器抽取用户查询语句文本中的关系信息,得到关系集合,将关系集合中的关系分别与核心实体组合,得到候选逻辑表达式集合。
以上述实施例为例,用户查询语句文本″刘德华的老婆是做什么的″中关系泛化说法为:老婆、做什么,查询关系映射表,得到关系集合{妻子,职业},将关系集合中的关系分别与核心实体组合得到候选逻辑表达式集合{(刘德华_中国香港男演员、歌手、制片人、填词人:妻子),(刘德华_中国香港男演员、歌手、制片人、填词人:职业),(刘德华_中国香港男演员、歌手、制片人、填词人:妻子:职业)}。
该步骤中,关系信息抽取过程可参见表1,在此不进行详细的介绍。
S206:服务器根据用户查询语句文本的依存关系,筛选候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及核心实体的候选三元组集合,得到查询请求对应的候选答案集合。
以上述实施例为例,服务器对用户查询语句文本″刘德华的老婆是做什么的″进行依存句法分析,根据依存关系得到筛选后的逻辑表达式:(刘德华_中国香港男演员、歌手、制片人、填词人:妻子),(刘德华_中国香港男演员、歌手、制片人、填词人:妻子:职业),根据S204中的核心实体″刘德华_中国香港男演员、歌手、制片人、填词人″的候选三元组集合,得到用户查询请求对应的候选答案集合{妻子朱丽倩,妻子职业平面模特}。
该步骤中,根据用户查询语句文本的依存关系,筛选候选逻辑表达式的详细过程可参见图5,在此不进行详细描述。
S207:服务器确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,并根据查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度选择查询请求对应的答案。
可选地,查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度,可以是实体语义向量间的相似度,也可以是上述相似度再加上查询语句文本的语义向量与候选答案集合中的答案的路径的语义向量间的相似度之和。采用后者,可以从不同维度来衡量查询语句文本与候选答案的相似度,从而提高准确性。
其中,答案的路径的语义向量,即为答案中用于表述关系的单词或短语的语义向量。
具体地,确定查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度的过程,具体包括:确定查询语句文本的语义向量与候选答案集合中每个答案的实体的语义向量间的相似度;确定查询语句文本的语义向量与候选答案集合中每个答案的路径的语义向量间的相似度;将前面两个步骤计算出的相似度相加,得到查询语句文本的语义向量与候选答案集合中每个答案的语义向量间的相似度。
其中,上述流程中,可以将前面两个步骤计算出的相似度进行加权相加,不同相似度的权重可预先设置。
以上述实施例为例,用户查询语句文本记为q,q和候选答案集合中的每个候选答案组成候选问答对:
(q,a1):(刘德华的老婆是做什么的,妻子朱丽倩);
(q,a2):(刘德华的老婆是做什么的,妻子职业平面模特)。
将用户查询语句文本q利用预训练的LSTM语义转化模型转化为句子向量f(刘德华的老婆是做什么的)。
将候选答案a1中的实体(朱丽倩)和路径(妻子),利用预训练的TransE知识图谱转化模型分别转化为语义向量g1(朱丽倩)、g2(妻子);将候选答案a2中的实体和路径,利用预训练的TransE知识图谱转化模型分别转化为语义向量g3(平面模特)、g4(妻子职业)。
句子向量和候选答案向量的余弦相似度为:
Score1(q,a1)=cos(f,g1(朱丽倩))+cos(f,g2(妻子);
Score2(q,a2)=cos(f,g3(平面模特))+cos(f,g4(妻子职业)。
用户查询语句文本的答案可能会有多个,本申请实施例可采用如下方式,根据计算得到的余弦相似度确定用户查询语句文本对应的答案:
对句子向量和候选答案向量的相似度的值进行排序,得到相似度的最大值Smax,将与Smax的差值在间隔值M内的所有相似度所对应的候选答案作为预测答案,得到预测答案集合;将预测答案集合中相似度大于或等于设定阈值的相似度所对应的预测答案,作为用户查询语句文本对应的答案。
其中,间隔值M的区间为(0,1]。
S208:服务器向智能设备发送查询响应,查询响应携带查询请求对应的答案。
以上述实施例为例,用户查询语句文本″刘德华的老婆是做什么的″的对应答案为(妻子职业平面模特)。
本申请的实施例中,可采用基于知识图谱的实体链接算法确定用户查询请求中实体指称在知识库中对应的一个核心实体,图3中示例性示出了根据实施例中基于知识图谱的实体链接算法逻辑图。为清楚描述图3中实体链接算法的逻辑关系,图4中示例性示出了根据实施例中基于知识图谱的实体链接算法流程图。如图4所示,该流程包括:
S401:服务器根据知识库信息构建实体指称字典,实体指称字典包括实体指称对应的描述文本信息以及实体指称的先验流行度(知名度)等。
该步骤中,在知识库中全量词条进行关键词字段提取预存、统计修饰字段个数、获取新数据在百科词条中的排序等操作,事先构建实体指称字典,以便提取用户查询请求中的实体指称。
S402:服务器接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本,识别得到查询语句文本中的实体指称。
该步骤中,可根据S401中的实体指称字典识别得到查询语句文本中的实体指称。其中用户查询语句文本中,可能有多个实体指称,可能只有一个实体指称。
S403:服务器根据查询语句文本查询知识库,得到抽象、概念、宽泛性候选实体与名词性候选实体。
该步骤中,对于常见的抽象、概念、宽泛性的实体可根据候选实体的先验知名度(流行度)排名进行实体链接;对于名词性具有歧义的实体进行综合相似度计算方式确定最终的候选实体。
S404:服务器识别得到查询语句文本中无需消歧(唯一确定)的实体,获取查询语句文本中无需消歧的实体的入上下文信息。
S405:服务器提取抽象、概念、宽泛性候选实体的先验流行度(知名度)以及名词性候选实体的先验流行度(知名度)、描述文本、类别标签等信息。
该步骤中,衡量候选实体的先验流行度(知名度)的方法包括候选实体在百度百科页面的描述文本长度、候选实体查询频度以及实体指称到实体候选实体的链接频度等。
S406:服务器获取实体指称与候选实体相关度的综合信息。
该步骤中,综合信息包括候选实体的先验流行度(知名度)、实体指称所在查询语句文本中无需消歧的实体的上下文与名词性候选实体的关键词相似度、实体指称所在查询语句文本中无需消歧的实体的上下文的主题倾向与名词性候选实体的主题类别的相似度等。统计候选实体先验流行度大多依赖维基百科的训练预料,得到的是训练预料上的候选实体先验流行度分布,而标注的语料的实体流行度分布却并不一定和训练语料一致。若仅根据候选实体先验流行度确定实体指称的链接结果,而不考虑用户查询请求的上下文信息,可能导致无论用户查询请求的上下文是什么,都会链接到流行程度最高的候选实体。
S407:服务器根据综合信息的最佳权重进行候选实体排序。
该步骤中,候选实体排序权重包括抽象、概念、宽泛性的候选实体的先验流行度(知名度),实体指称所在查询语句文本中无需消歧的实体的上下文与名词性候选实体的关键词相似度,实体指称所在查询语句文本中无需消歧的实体的上下文的主题类别与名词性候选实体的主题类别的相似度等。
S408:服务器根据设定的阈值,从排序后的候选实体中选择一个与用户查询语句文本中实体指称对应的实体。
S409:根据实体指称对应的实体的先验流行度对实体指称对应的实体排序,从对应的实体中选择一个核心实体。
该步骤中,若用户查询语句文本中只有一个实体指称,其在知识库中的对应实体即为核心实体,若用户查询语句文本中有多个实体指称,则根据其对应的实体的先验流行度(知名度)、搜索热度等从对应的实体中选择一个核心实体。
本申请实施例对上述流程各步骤的时序没有严格限定,比如,S404也可以先于S403执行,或者S404和S405并行执行。
本申请的实施例中,通过泛化关系映射,对用户查询语句文本中的关系进行抽取,以用户查询请求″刘德华的老婆是做什么″的为例,表1示例性示出了本申请实施例中抽取用户查询语句文本中的关系信息。
表1、抽取用户查询语句文本中的关系信息
根据用户查询语句文本中的关系信息,经依存句法分析,将用户查询语句文本转化为逻辑表达式形式并进行筛选,利用用户查询语句文本中实体指称在知识库中对应的核心实体的属性信息,得到候选答案列表。
图5中示例性示出了根据实施例中依存句法分析算法示意图。依存句法分析(Dependency Parsing,DP)通过分析语言单位内成分之前的依存关系解释其句法结构,主张句子中核心动词是支配其他成分的中心成分,而它本身却不受其他任何成分的支配,所有受支配成分都以某种关系从属于支配者。依存语法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词(从属词),依存关系是和语义相关联的。依存关系的原理为:一个句子中只有一个成分是独立的,即核心成分;句子的其他成分都从属于某一成分,即除了核心成分外的部分;任何一个成分都不能依存于两个及以上的成分;如果成分A直接从属成分B,而成分C在句子中位于A和B之间,那么,成分C或者从属于A,或者从属于B,或者从属于A和B之间的某一成分(如果将从属关系用线条表示出来的话,线条不会发生交错);核心成分左右两边的其他成分相互不发生关系,相当于核心成分是一条界线,左右两边的部分不再发生支配关系。如图5所示,依存关系用一个依存弧(有向弧)表示,依存弧的方向为由从属词指向支配词,当然反过来也是可以的,按个人习惯统一表示即可,依存弧HED代表核心关系,依存弧SBV代表主谓关系,依存弧ADV代表状中结构关系,依存弧CMP代表动补结构关系,依存弧VOB代表动宾关系,依存弧ATT代表定中关系,依存弧代表RAD右附加关系,root代表要处理的用户查询文本语句。
示例性的,用户查询请求文本为″谁能介绍下爱情公寓2的主角们″的逻辑表达式形式为:
Lf1=爱情公寓:能;
Lf2=爱情公寓:介绍;
Lf3=爱情公寓:主角们;
…
Lfn=爱情公寓:能:介绍:主角们。
根据用户查询语句文本中的依存句法分析,得到筛选后的逻辑表达式为:Lf3=爱情公寓:主角们。利用用户查询语句文本中实体指称在知识库中对应的核心实体的属性信息以及依存关系,得到候选答案列表。
本申请的实施例中,确定用户查询请求对应的答案采用了深度学习的问答排序模型。图6中示例性示出了根据实施例中实体问答的系统结构图。如图6所示,根据用户查询文本和知识图谱确定候选答案集合,基于预训练的问答排序模型确定用户查询文本和候选答案的相似度,根据相似度得分和阈值确定对应的答案。
具体的,根据用户查询请求文本中的实体指称,基于知识图谱的实体链接算法,得到知识库中实体指称对应的实体的一个核心实体,利用事先学习的知识图谱中的实体以及实体的属性信息的向量的全局化信息,使用循环神经网络针对查询请求对应的候选答案的实体与路径两方面训练问题表示与答案表示,最后使用相似度得分选出最终的答案。
为清楚说明图6中问答系统结构间的关系,图7示例性示出了根据实施例中基于深度学习的问答排序模型示意图。
本申请的实施例中,基于深度学习的问答排序模型的训练过程包括:
获取用户查询语句文本的词向量,使用LSTM对查询语句文本的上下文信息进行特征提取;将得到的特征向量作为用户查询语句文本的语义向量f1(q);
用知识图谱表示模型TransE,获取候选答案在知识图谱中的答案实体的语义向量g1(a)以及答案路径的语义向量g2(a);
获取查询语句文本的语义向量与候选答案实体的语义向量间的相似度和查询语句文本的语义向量与候选答案路径的语义向量间的相似度的和,得到候选答案的得分是S(q,a)=cos(f1(q),g1(a))+cos(f1(q),g2(a));
确定损失函数L(q,a,c)=(M-S(q,a)+S(q,c))+,其中,M为间隔值参数,c为候选答案集合;
本申请的实施例中,基于深度学习的问答排序模型的预测过程包括:
获取用户查询语句文本的词向量,使用LSTM对查询语句文本的上下文信息进行特征提取;将得到的特征向量作为用户查询语句文本的语义向量f1(q);
用知识图谱表示模型TransE,获取候选答案在知识图谱中的答案实体的语义向量g1(a)以及答案路径的语义向量g2(a);
获取查询语句文本的语义向量与候选答案实体的语义向量间的相似度和查询语句文本的语义向量与候选答案路径的语义向量间的相似度的和,得到候选答案的得分是S(q,a)=cos(f1(q),g1(a))+cos(f1(q),g2(a));
预测答案A={a|Smax-s(q,a)<M}。
如图7中问题表示部分所示,采用词向量模型得到用户查询语句文本中的词向量,基于双向长短时记忆网络获取用户查询语句文本的上下文信息的特征向量,上下文信息的特征向量作为用户查询语句文本的语义向量,其中,所示双向长短时记忆网络为从左向右与从右向左两次长短时记忆网络训练过程。
具体的,可采用FastText、Word2Vec等词向量模型得到用户查询语句文本的语义向量。其中,Word2Vec模型的基本思想是首先将所有词语进行onehot编码,输入只有一个隐藏层的神经网络,定义好损失权重后进行训练,训练完成后,可用隐藏层的权重作为词的向量表示。一般分为CBOW(Continuous Bag-of-Words)与Skip-Gram两种模型。CBOW模型的训练输入是某一个特征词的上下文相关的词对应的词向量,而输出就是这特定的一个词的词向量。Skip-Gram模型和CBOW的思路是反着来的,即输入是特定的一个词的词向量,而输出是特定词对应的上下文词向量。
CBOW模型的训练过程包括:
输入上下文单词的onehot编码(假设单词向量空间dim为V,上下文单词个数为C);
所有onehot编码分别乘以共享的输入权重矩阵W(VN矩阵,N为自己设定的数,初始化权重矩阵W);
所得的向量相加求平均作为隐层向量,size为1N;
隐层向量乘以输出权重矩阵W′(NV矩阵);
得到向量(1V)激活函数处理得到V维概率分布(其中的每一维代表着一个单词);
概率最大的索引所指示的单词为预测出的中间词(target word),与真实标签的onehot编码比较误差(根据误差更新权重矩阵,误差越小越好)。
循环神经网络(recurrent neural network,RNN)是一类对时间显式建模的神经网络,用于构建RNN的神经元同样也接收来自其他神经元的加权输入。在RNN中,神经元既允许与更高的层建立连接,也允许与更低的层建立连接。RNN网络的这些隐合活性值会在同一序列的相邻输入之间被记忆。长短时记忆网络(Long Short Term Memory Network,LSTM)是一种特殊形式的RNN,专为解决梯度消失和梯度爆炸问题而设计的。LSTM架构将RNN中的普通神经元替换为其内部拥有少量记忆的LSTM单元(LSTM Cell)LSTM架构中负责学习的实际上是环绕门(surrounding gates),这些门都拥有一个非线性的激活函数(通常为sigmoid函数)。在原始的LSTM单元中,有两种门:一种负责学习如何对到来的活性值进行缩放,而另一种负责学习如何对输出的活性值进行缩放。
如图7中候选答案表示部分所示,知识库中包括用户查询语句文本对应答案的答案实体与答案路径信息,并采用TransE模型分别获取答案实体以及答案路径的语义向量。
具体的TransE模型可参见图8,再此不做详细的描述。
图8示例性示出了根据实施例中知识图谱表示学习方法的TranE模型示意图。如图8所示,h和t表示关系r首尾端实体。
TransE将实体和实体关系表示在低维稠密向量空间中,然后进行计算和推理。直观上,每个三元组示例(head,relation,tail)中的关系relation看做从实体head到实体tail的翻译,通过不断调整关系relation、实体head、实体tail的语义向量,使得实体head的语义向量与关系relation的语义向量的和尽可能与实体tail的语义向量相等,可以高效地计算实体、关系及其之间的复杂语义关联。
TranE模型的训练过程为:首先对实体head、实体tail以及实体head与实体tail间的关系relation进行初始化,然后对每一个正样本取一个负样本(常用正负样本选取方式为固定中间的关系relation,实体head、实体tail任意替换),然后利用合页损失函数尽可能使正负样本分开,最后采用随机梯度下降(Stochastic Gradient Descent,SGD)方法更新参数。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种信息交互方法,其特征在于,包括:
接收来自于智能设备的查询请求,根据所述查询请求得到用户查询语句文本;
识别得到所述查询语句文本中的实体指称,获取知识库中与所述实体指称对应的实体;
从所述实体指称对应的实体中选择一个核心实体,并根据知识库中所述核心实体的属性信息得到所述核心实体的候选三元组集合,所述候选三元组集合中包括至少一个候选三元组,所述候选三元组用于描述核心实体与一个核心实体属性间的关系;
抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合,得到候选逻辑表达式集合;
根据所述用户查询语句文本的依存关系,筛选所述候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及所述核心实体的候选三元组集合,得到所述查询请求对应的候选答案集合;
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,并根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;
向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。
2.如权利要求1所述的方法,其特征在于,从所述实体指称对应的实体中选择一个核心实体,具体包括:
获取所述实体指称对应的实体的信息丰富度以及搜索热度;
将所述实体指称对应的实体的搜索热度归一化后作为权重与所述实体指称对应的实体的信息丰富度相乘,得到所述实体指称对应的实体的分值;
根据所述实体指称对应的实体的分值选择一个核心实体。
3.如权利要求1所述的方法,其特征在于,确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,具体包括:
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度;
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度;
将所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度与所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度相加,得到所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度。
4.如权利要求1所述的方法,其特征在于,根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案,包括:
在所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度中,获取最大相似度以及与最大相似度间的差值在设定间隔值之内的相似度,将获取到的相似度所对应的答案确定为预测答案,得到预测答案集合;
选择所述预测答案集合中相似度大于或等于设定阈值的预测答案,作为所述查询请求对应的答案。
5.如权利要求1所述的方法,其特征在于,所述核心实体的属性信息至少包括以所述核心实体为起始节点的路径上的至少一跳节点所对应的实体;其中,在知识图谱中,以所述核心实体为起始节点的子树中包括至少一条路径,该路径上至少包括一跳节点,其中相邻两跳节点对应于存在关系的两个实体。
6.一种服务器,其特征在于,包括:
接收模块,用于接收来自于智能设备的查询请求,根据所述查询请求得到用户查询语句文本;
实体指称获取模块,用于识别得到所述查询语句文本中的实体指称,获取知识库中与所述实体指称对应的实体;
核心实体候选三元组确定模块,用于从所述实体指称对应的实体中选择一个核心实体,并根据知识库中所述核心实体的属性信息得到所述核心实体的候选三元组集合,所述候选三元组集合中包括至少一个候选三元组,其中每个候选三元组用于描述核心实体与一个核心实体属性间的关系;
候选逻辑表达式集合确定模块,用于抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合,得到候选逻辑表达式集合;
候选答案集合确定模块,用于根据所述用户查询语句文本的依存关系,筛选所述候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及所述核心实体的候选三元组集合,得到所述查询请求对应的候选答案集合;
答案选择模块,用于确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,并根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;
发送模块,用于向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。
7.如权利要求6所述的服务器,其特征在于,确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,具体包括:
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度;
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度;
将所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度与所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度相加,得到所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度。
8.一种服务器,其特征在于,包括:处理器和存储器;
所述存储器,与所述处理器连接,配置为存储计算机指令;所述处理器,与所述存储器连接,配置为执行所述计算机指令以使得所述服务器进行:
接收来自于智能设备的查询请求,根据所述查询请求得到用户查询语句文本;
识别得到所述查询语句文本中的实体指称,获取知识库中与所述实体指称对应的实体;
从所述实体指称对应的实体中选择一个核心实体,并根据知识库中所述核心实体的属性信息得到所述核心实体的候选三元组集合,所述候选三元组集合中包括至少一个候选三元组,所述候选三元组用于描述核心实体与一个核心实体属性间的关系;
抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合,得到候选逻辑表达式集合;
根据所述用户查询语句文本的依存关系,筛选所述候选逻辑表达式,并根据筛选后的候选逻辑表达式集合以及所述核心实体的候选三元组集合,得到所述查询请求对应的候选答案集合;
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,并根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;
向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。
9.如权利要求8所述的服务器,其特征在于,确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度,具体包括:
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度;
确定所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度;
将所述查询语句文本的语义向量与所述候选答案集合中每个答案的实体的语义向量间的相似度与所述查询语句文本的语义向量与所述候选答案集合中每个答案的路径的语义向量间的相似度相加,得到所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067585.4A CN113139036B (zh) | 2020-01-20 | 2020-01-20 | 一种信息交互方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067585.4A CN113139036B (zh) | 2020-01-20 | 2020-01-20 | 一种信息交互方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113139036A CN113139036A (zh) | 2021-07-20 |
CN113139036B true CN113139036B (zh) | 2022-07-01 |
Family
ID=76809278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010067585.4A Active CN113139036B (zh) | 2020-01-20 | 2020-01-20 | 一种信息交互方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113139036B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704445A (zh) * | 2021-10-28 | 2021-11-26 | 北京明略昭辉科技有限公司 | 知识库问答方法、装置、电子设备和存储介质 |
CN114021028A (zh) * | 2021-10-28 | 2022-02-08 | 四川启睿克科技有限公司 | 一种智能交互系统中实体相对热度获取方法 |
CN114297353B (zh) * | 2021-11-29 | 2024-04-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质及设备 |
CN114090795B (zh) * | 2022-01-11 | 2022-05-10 | 北京壬工智能科技有限公司 | 基于装备知识图谱的双向交互智能服务系统和方法 |
CN114141384A (zh) * | 2022-01-30 | 2022-03-04 | 北京欧应信息技术有限公司 | 用于检索医学数据的方法、设备和介质 |
CN114722155A (zh) * | 2022-04-19 | 2022-07-08 | 同方知网数字出版技术股份有限公司 | 一种基于航空装备的智能问答方法及系统 |
CN115186679A (zh) * | 2022-07-15 | 2022-10-14 | 广东广信通信服务有限公司 | 智能应答方法、装置、计算机设备及存储介质 |
CN115599892B (zh) * | 2022-12-15 | 2023-03-21 | 中国人民解放军国防科技大学 | 面向社交网络数据的语义搜索方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470343B1 (en) * | 1998-02-20 | 2002-10-22 | International Business Machines Corporation | Method, computer program product, system, and data structure for database data model extension |
CN108984778A (zh) * | 2018-07-25 | 2018-12-11 | 南京瓦尔基里网络科技有限公司 | 一种智能交互自动问答系统以及自我学习方法 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN110008354A (zh) * | 2019-04-10 | 2019-07-12 | 华侨大学 | 一种基于知识图谱的对外汉语学习内容的构建方法 |
CN110569369A (zh) * | 2019-09-16 | 2019-12-13 | 神州数码融信软件有限公司 | 银行金融系统知识图谱的生成方法及装置、应用方法及装置 |
-
2020
- 2020-01-20 CN CN202010067585.4A patent/CN113139036B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470343B1 (en) * | 1998-02-20 | 2002-10-22 | International Business Machines Corporation | Method, computer program product, system, and data structure for database data model extension |
CN108984778A (zh) * | 2018-07-25 | 2018-12-11 | 南京瓦尔基里网络科技有限公司 | 一种智能交互自动问答系统以及自我学习方法 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN110008354A (zh) * | 2019-04-10 | 2019-07-12 | 华侨大学 | 一种基于知识图谱的对外汉语学习内容的构建方法 |
CN110569369A (zh) * | 2019-09-16 | 2019-12-13 | 神州数码融信软件有限公司 | 银行金融系统知识图谱的生成方法及装置、应用方法及装置 |
Non-Patent Citations (1)
Title |
---|
知识库问答系统中实体关系抽取方法研究;张芳容等;《计算机工程与应用》(第11期);224-229 * |
Also Published As
Publication number | Publication date |
---|---|
CN113139036A (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113139036B (zh) | 一种信息交互方法及设备 | |
CN105808590B (zh) | 搜索引擎实现方法、搜索方法以及装置 | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
CN112328849A (zh) | 用户画像的构建方法、基于用户画像的对话方法及装置 | |
CN105512316B (zh) | 一种结合移动终端的知识服务系统 | |
JP2023076413A (ja) | 言語モデルを利用してドメインに特化した対話を提供する方法、コンピュータ装置、およびコンピュータプログラム | |
CN115114395B (zh) | 内容检索及模型训练方法、装置、电子设备和存储介质 | |
CN110795542A (zh) | 对话方法及相关装置、设备 | |
CN114328852B (zh) | 一种文本处理的方法、相关装置及设备 | |
KR20160032564A (ko) | 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체 | |
CN112650842A (zh) | 基于人机交互的客服机器人意图识别方法及相关设备 | |
KR20180116103A (ko) | 온톨로지 대화 관계망을 이용한 연속 대화 방법 및 시스템 | |
JP2022533200A (ja) | 地理的位置を検索する方法、装置、機器、コンピュータ記憶媒体及びコンピュータプログラム | |
KR20190046062A (ko) | 대화 시스템을 위한 대화 시나리오 데이터베이스 구축 방법 및 장치 | |
KR20210089249A (ko) | 음성패킷 추천방법, 장치, 설비 및 저장매체 | |
CN117474084B (zh) | 预训练模型与下游序列任务双向迭代方法、设备及介质 | |
CN116913278B (zh) | 语音处理方法、装置、设备和存储介质 | |
Lan et al. | Knowledge graph-based conversational recommender system in travel | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN111159467B (zh) | 一种处理信息交互的方法及设备 | |
JP7207543B2 (ja) | 情報推薦装置、情報推薦システム、情報推薦方法及び情報推薦プログラム | |
Wang et al. | UP4LS: User profile constructed by multiple attributes for enhancing linguistic steganalysis | |
CN116975016A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
KR20230064533A (ko) | 자가 대화 학습을 위한 지식 기반 대화 시스템 및 이의 학습 방법 | |
CN114970494A (zh) | 一种评论生成方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |