CN112650854B - 基于多知识图谱的智能答复方法、装置及计算机设备 - Google Patents

基于多知识图谱的智能答复方法、装置及计算机设备 Download PDF

Info

Publication number
CN112650854B
CN112650854B CN202011562101.XA CN202011562101A CN112650854B CN 112650854 B CN112650854 B CN 112650854B CN 202011562101 A CN202011562101 A CN 202011562101A CN 112650854 B CN112650854 B CN 112650854B
Authority
CN
China
Prior art keywords
current
user
entity name
knowledge
user side
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011562101.XA
Other languages
English (en)
Other versions
CN112650854A (zh
Inventor
张松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011562101.XA priority Critical patent/CN112650854B/zh
Publication of CN112650854A publication Critical patent/CN112650854A/zh
Priority to PCT/CN2021/091291 priority patent/WO2022134421A1/zh
Application granted granted Critical
Publication of CN112650854B publication Critical patent/CN112650854B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于多知识图谱的智能答复方法、装置、计算机设备及存储介质,涉及大数据和知识图谱,若检测到用户端发送的另一智能会话连接指令,获取与另一智能会话连接指令对应的目标用户画像;判断所述目标用户画像中是否对应绑定第一输出结果;若所述目标用户画像中绑定有第一输出结果,根据所述第一输出结果在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。实现了在不同的知识图谱库中根据用户画像对应的关键实体名称调用关联问题集,对于不同知识掌握程度的用户对应推荐相应信息,能有效提高用户获取信息的效率和准确率。

Description

基于多知识图谱的智能答复方法、装置及计算机设备
技术领域
本发明涉及大数据的知识图谱领域,尤其涉及一种基于多知识图谱的智能答复方法、装置、计算机设备及存储介质。
背景技术
目前,在服务器中所搭载的传统对话机器人一般按应用场景分为闲聊机器人、任务(垂直领域)机器人、问答(QA)机器人。上述常见的对话机器人在与用户进行智能问答的过程中,主要存在关键词匹配准确率较低、语法分析缺乏上下文、端到端生成可控性差、知识图谱仅基于简单事实、语义理解仅局限封闭领域等问题。
发明内容
本发明实施例提供了一种基于多知识图谱的智能答复方法、装置、计算机设备及存储介质,旨在解决现有技术中对话机器人在与用户进行智能问答的过程中,主要存在关键词匹配准确率较低、语法分析缺乏上下文、语义理解仅局限封闭领域的问题。
第一方面,本发明实施例提供了一种基于多知识图谱的智能答复方法,其包括:
若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像;
接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集;
根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集;
若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集;以及
若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
第二方面,本发明实施例提供了一种基于多知识图谱的智能答复装置,其包括:
连接建立单元,用于若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像;
当前实体识别单元,用于接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集;
第一问题集发送单元,用于根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集;
第二问题集发送单元,用于若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集;以及
结果绑定单元,用于若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于多知识图谱的智能答复方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于多知识图谱的智能答复方法。
本发明实施例提供了一种基于多知识图谱的智能答复方法、装置、计算机设备及存储介质,判断用户是否初次与智能对话机器人建立会话,从而从不同的知识图谱库中调用关联问题集,对于不同知识掌握程度的用户对应推荐相应信息,能有效提高用户获取信息的效率和准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于多知识图谱的智能答复方法的应用场景示意图;
图2为本发明实施例提供的基于多知识图谱的智能答复方法的流程示意图;
图3为本发明实施例提供的基于多知识图谱的智能答复装置的示意性框图;
图4为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的基于多知识图谱的智能答复方法的应用场景示意图;图2为本发明实施例提供的基于多知识图谱的智能答复方法的流程示意图,该基于多知识图谱的智能答复方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S109。
S101、接收并保存业务服务器上传的第一知识图谱库和第二知识图谱库;其中,所述第一知识图谱库中包括多个第一子知识图谱,每一第一子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系;所述第二知识图谱库中包括多个第二子知识图谱,每一第二子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系。
在本实施例中,为了更清楚的理解本申请的技术方案,下面对所涉及到的终端进行详细介绍。其中,本申请是在服务器的角度描述技术方案。
一是业务服务器,在业务服务器中,研发人员可以将预先构建的第一知识图谱库和第二知识图谱库上传至服务器。一旦上述知识图谱库存在更新的情况,直接由业务服务器上传至服务器进行更新即可。例如,以用户从服务器中获取产品知识或信息为例(产品可以是保险产品、理财产品、电子产品、体育用具产品等),第一知识图谱库中包括的多个第一子知识图谱对应是由用户针对一些产品的第一了解阶段(可以理解为需求激发阶段,用户更注重产品科普知识的获取)所关注问题的答复文本的集合,在第一知识图谱库中包括的多个第一子知识图谱是以产品相关的科普介绍为主;第二知识图谱库中包括的多个第二子知识图谱对应是由用户针对一些产品的第二了解阶段(可以理解为观念导入阶段,用户更注重产品的细节参数的获取)所关注问题的答复文本的集合,在第二知识图谱库中包括的多个第二子知识图谱是以产品相关的细节参数。
二是服务器,通过服务器可以存储由业务服务器上传的第一知识图谱库和第二知识图谱库,而且还存储了多个用户对应的用户画像,这些数据均作为服务器中部署的智能对话机器人的后台数据。其中用户画像中的标签关键词和上述两个知识图谱库中的实体名称存在的关系包括完全不相同、近似、及相同的关系。通过与用户对应的标签关键词可以在第一知识图谱库或第二知识图谱库中获取对应的关联问题集并发送至用户端。
三是用户端,与服务器通讯连接的用户端可以是一个也可以是多个,每一用户端在服务器中存储有对应的用户画像。若某一用户端与服务器中的智能对话机器人建立对话时,在服务器中可以获取到该用户端使用者的用户画像。
当服务器接收了由业务服务器上传的第一知识图谱库和第二知识图谱库,以及存储了多个用户对应的用户画像后,这些数据可以用于用户端与智能对话机器人建立的对话中,进行问题或知识点的推荐。
S102、若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像。
在本实施例中,当某一用户端(例如记为用户端A)与服务器建立通讯连接并开启智能会话后,服务器与该用户端建立连接,并获取与所述用户端对应的当前用户画像。其中,当前用户画像可以理解为该用户的基础画像特征。
具体实施时,在获取用户端对应的用户画像的过程如下:
获取所述用户端对应的用户唯一识别码,根据所述用户唯一识别码在本地的用户画像库中获取与所述用户端对应的当前用户画像。
在本实施例中,为了更准确的获取用户端的用户画像,是在用户端与服务器建立连接后,由服务器获取该用户端对应的用户唯一识别码(如电话号码、身份证号等),此时根据所述用户唯一识别码在服务器本地的用户画像库中,可以获取到与所述用户端唯一对应的当前用户画像。
S103、接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集。
在本实施例中,当用户端与服务器建立连接并与开启了与智能对话机器人之间的对话时,需根据所接收的对话文本初步分析用户意图。基于当前用户可能正在产生的对话主题,抽取本次对话过程中关联到的知识图谱的实体(例如孩子+健康这两个实体)。由于此时用户端是初次与智能对话机器人建立会话,此时可以基于本次对话流抽取的核心实体(如上述举例的孩子+健康),在第一知识图谱库中调用需求激发阶段的子知识图谱。
在一实施例中,步骤S103中对所述对话文本进行意图识别以得到意图识别关键词集的步骤包括:
将所述对话文本通过基于概率统计分词模型进行分词,得到与所述对话文本对应的分词结果;
通过词频-逆文本频率指数模型,抽取所述分词结果按频-逆文本频率指数降序排序后未超出预设的排名阈值的关键词,以组成意图识别关键词集。
在本实施例中,通过基于概率统计分词模型对对话文本进行分词时,例如令C=C1C2...Cm,C是待切分的汉字串,令W=W1W2...Wn,W是切分的结果,Wa,Wb,……,Wk是C的所有可能的切分方案。那么,基于概率统计分词模型就是能够找到目的词串W,使得W满足:P(W|C)=MAX(P(Wa|C),P(Wb|C)...P(Wk|C))的分词模型,上述分词模型得到的词串W即估计概率为最大之词串。通过基于概率统计分词模型即可对所述对话文本进行分词,从而得到与所述对话文本对应的分词结果。
之后使用词频-逆文本频率指数模型抽取分词结果中的关键词,其中词频-逆文本频率指数模型即TF-IDF模型,TF-IDF是Term Frequency–Inverse Document Frequency的简写。抽取所述分词结果按频-逆文本频率指数降序排序后位于预设的排名值之前的关键词,以组成意图识别关键词集。通过词频-逆文本频率指数模型能准确提取文本中的核心关键词,无需人工阅读后提取。
在一实施例中,步骤S103中获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集的步骤包括:
调用预先存储的实体名称库和同义词词典,并获取与所述同义词词典对应的词林;
根据所述词林在所述实体名称库中获取各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集。
在本实施例中,由于服务器的本地预先存储了由第一知识图谱库和第二知识图谱库中包括的个子知识图谱中的实体名称组成的实体名称库,而且还存储了用于判断词与词之间的相似度的同义词词典。其中,同义词词中包括的所有词组织在一棵或几棵树结构中(这一课树或多颗书记为词林),在词林中找到需判断词语相似度的两个词语分别对应的节点,两个节点的路径长度即可作为两个词语之间的语义距离(也可以理解为词语相似度)。
例如,所述意图识别关键词集中包括小孩和健康这两个意图关键词,在词林中获取到与小孩之间的路径长度最近的词语是育儿,此时可以将小孩这一意图关键词转换为育儿这一当前实体名称;同理,在词林中获取到与健康之间的路径长度最近的词语是健康大数据,此时可以将健康这一意图关键词转换为健康大数据。
通过上述同义词的转换关系,确保了能根据用户的对话能在知识图谱库中检索到对应的实体名称,从而可准确的向用户推送信息。
S104、根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集。
在本实施例中,当获取了用户意图对应的当前实体名称集后(例如上述举例的育儿+健康大数据),此时可以根据当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,以引导用户去咨询健康大数据+育儿相关的问题。智能对话机器人此时主要调用育儿这一实体在第一知识图谱库中对应的子知识图谱,还调用健康大数据这一实体在第一知识图谱库中对应的子知识图谱,获取了上述子知识图谱后调用与上述子知识图谱的分别对应的关联问题,以组成第一第一当前关联问题集,将所述第一当前关联问题集发送至用户端。
S105、若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集。
在本实施例中,当用户端在与智能对话机器人之间的对话框中查看了服务器所发送的第一当前关联问题集后,可以手动点击选择其中一个最感兴趣的问题以生成第一问题点击指令。例如用户点击了健康大数据这个实体名称下面的乳腺相关问题(具体如2019年乳腺健康大数据),则抽取到了这个问题中的关键实体名称(乳腺),接下来会根据乳腺这个实体名称,以及当前正在查看的(2019年乳腺健康大数据)所关联到的(健康大数据)这个实体名称,根据第一知识图谱库中实体之间的关联关系而关联到另外的实体(乳腺增生+女性癌症),同时展示以这两个关联实体下面的相关问题(80后女性如何避免得乳腺增生,女性癌症高发疾病有哪些?)。
上述举例的两个关联实体组成的是与所述第一目标实体名称对应的第一关联实体名称集,在获取了第一关联实体名称集后可以在服务器本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端,以引导用户去咨询乳腺增生+女性癌症相关的问题。
S106、若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
在本实施例中,当用户端在与智能对话机器人之间的对话框中查看了服务器所发送的第二当前关联问题集后,可以手动点击选择其中一个最感兴趣的问题以生成第二问题点击指令。例如,用户最终点击了女性癌症高发疾病有哪些,则根据这个相关问题,抽取到该用户A已经完成了需求激发阶段。此时输出一个“已完成女性癌症的科普知识了解”作为第一输出结果,这一第一数据结果可以作为一个用户标签增加至该用户对应的当前用户画像中,或者是可以将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
S107、若检测到用户端发送的另一智能会话连接指令,获取与另一智能会话连接指令对应的目标用户画像。
在本实施例中,当服务器检测到用户端发送的另一智能会话连接指令,此时可能是之前的用户A与智能对话机器人再次建立会话以更多的了解产品的相关细节(也就是该用户已经经历过需求激发阶段而进入观念导入阶段),也有可能是非用户A的另一用户B与智能对话机器人初次建立会话以了解产品的科普知识(也即该用户还未经历过需求激发阶段),此时可以根据与另一智能会话连接指令获取对应的目标用户画像。之后判断该目标用户画像是否对应一个第一输出结果,从而实现判断用户是否初次与智能对话机器人建立会话。
S108、判断所述目标用户画像中是否对应绑定第一输出结果。
在本实施例中,判断所述目标用户画像中是否对应绑定第一输出结果,即是判断用户是否初次与智能对话机器人建立会话,这样能在后续步骤中更精准的根据用户情况调用第一知识图谱库或是第二知识图谱库。
S109、若所述目标用户画像中绑定有第一输出结果,根据所述第一输出结果在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。
在本实施例中,所述目标用户画像中绑定有第一输出结果,表示是之前完成过至少一次沟通的用户与智能对话机器人再次建立会话以更多的了解产品的相关细节,此时不再像上述步骤中一样从第一知识图谱库获取关联问题集,而是根据所述第一输出结果对应的实体名称在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。通过这一方式,可以将已初步了解过产品科普知识的用户导向从第二知识图谱库中获取更专业的知识,无需再次了解产品的科普知识,从而提高用户获取信息的效率和准确率。
在一实施例中,步骤S108之后还包括:
若所述目标用户画像中未绑定有第一输出结果,将所述目标用户画像更新作为所述当前用户画像,返回执行接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集的步骤。
在本实施例中,所述目标用户画像中未绑定有第一输出结果,表示用户是初次与智能对话机器人建立会话,此时可以将该目标用户画像更新作为所述当前用户画像,返回执行步骤S103。通过这一方式,对于不同知识掌握程度的用户对应推荐相应信息,能有效提高用户获取信息的效率和准确率。
在一实施例中,步骤S109之后还包括:
将所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集均上传至区块链中。
在本实施例中,基于所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集得到对应的摘要信息,具体来说,摘要信息由所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。
用户设备可以从区块链中下载得该摘要信息,以便查证所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
该方法实现了对于不同知识掌握程度的用户根据对应的知识图谱推荐相应信息,能有效提高用户获取信息的效率和准确率。
本发明实施例还提供一种基于多知识图谱的智能答复装置,该基于多知识图谱的智能答复装置用于执行前述基于多知识图谱的智能答复方法的任一实施例。具体地,请参阅图3,图3是本发明实施例提供的基于多知识图谱的智能答复装置的示意性框图。该基于多知识图谱的智能答复装置100可以配置于服务器中。
如图3所示,基于多知识图谱的智能答复装置100包括:知识图谱库建立单元101、连接建立单元102、当前实体识别单元103、第一问题集发送单元104、第二问题集发送单元105、结果绑定单元106、目标用户画像获取单元107、目标用户画像判断单元108、第三问题集发送单元109。
知识图谱库建立单元101,用于接收并保存业务服务器上传的第一知识图谱库和第二知识图谱库;其中,所述第一知识图谱库中包括多个第一子知识图谱,每一第一子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系;所述第二知识图谱库中包括多个第二子知识图谱,每一第二子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系。
在本实施例中,当服务器接收了由业务服务器上传的第一知识图谱库和第二知识图谱库,以及存储了多个用户对应的用户画像后,这些数据可以用于用户端与智能对话机器人建立的对话中,进行问题或知识点的推荐。
连接建立单元102,用于若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像。
在本实施例中,当某一用户端(例如记为用户端A)与服务器建立通讯连接并开启智能会话后,服务器与该用户端建立连接,并获取与所述用户端对应的当前用户画像。其中,当前用户画像可以理解为该用户的基础画像特征。
具体实施时,在获取用户端对应的用户画像的过程如下:
获取所述用户端对应的用户唯一识别码,根据所述用户唯一识别码在本地的用户画像库中获取与所述用户端对应的当前用户画像。
在本实施例中,为了更准确的获取用户端的用户画像,是在用户端与服务器建立连接后,由服务器获取该用户端对应的用户唯一识别码(如电话号码、身份证号等),此时根据所述用户唯一识别码在服务器本地的用户画像库中,可以获取到与所述用户端唯一对应的当前用户画像。
当前实体识别单元103,用于接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集。
在本实施例中,当用户端与服务器建立连接并与开启了与智能对话机器人之间的对话时,需根据所接收的对话文本初步分析用户意图。基于当前用户可能正在产生的对话主题,抽取本次对话过程中关联到的知识图谱的实体(例如孩子+健康这两个实体)。由于此时用户端是初次与智能对话机器人建立会话,此时可以基于本次对话流抽取的核心实体(如上述举例的孩子+健康),在第一知识图谱库中调用需求激发阶段的子知识图谱。
在一实施例中,当前实体识别单元103包括:
分词单元,用于将所述对话文本通过基于概率统计分词模型进行分词,得到与所述对话文本对应的分词结果;
关键词抽取单元,用于通过词频-逆文本频率指数模型,抽取所述分词结果按频-逆文本频率指数降序排序后未超出预设的排名阈值的关键词,以组成意图识别关键词集。
在本实施例中,通过基于概率统计分词模型对对话文本进行分词时,例如令C=C1C2...Cm,C是待切分的汉字串,令W=W1W2...Wn,W是切分的结果,Wa,Wb,……,Wk是C的所有可能的切分方案。那么,基于概率统计分词模型就是能够找到目的词串W,使得W满足:P(W|C)=MAX(P(Wa|C),P(Wb|C)...P(Wk|C))的分词模型,上述分词模型得到的词串W即估计概率为最大之词串。通过基于概率统计分词模型即可对所述对话文本进行分词,从而得到与所述对话文本对应的分词结果。
之后使用词频-逆文本频率指数模型抽取分词结果中的关键词,其中词频-逆文本频率指数模型即TF-IDF模型,TF-IDF是Term Frequency–Inverse Document Frequency的简写。抽取所述分词结果按频-逆文本频率指数降序排序后位于预设的排名值之前的关键词,以组成意图识别关键词集。通过词频-逆文本频率指数模型能准确提取文本中的核心关键词,无需人工阅读后提取。
在一实施例中,当前实体识别单元103还包括:
词林获取单元,用于调用预先存储的实体名称库和同义词词典,并获取与所述同义词词典对应的词林;
当前实体名称集获取单元,用于根据所述词林在所述实体名称库中获取各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集。
在本实施例中,由于服务器的本地预先存储了由第一知识图谱库和第二知识图谱库中包括的个子知识图谱中的实体名称组成的实体名称库,而且还存储了用于判断词与词之间的相似度的同义词词典。其中,同义词词中包括的所有词组织在一棵或几棵树结构中(这一课树或多颗书记为词林),在词林中找到需判断词语相似度的两个词语分别对应的节点,两个节点的路径长度即可作为两个词语之间的语义距离(也可以理解为词语相似度)。
例如,所述意图识别关键词集中包括小孩和健康这两个意图关键词,在词林中获取到与小孩之间的路径长度最近的词语是育儿,此时可以将小孩这一意图关键词转换为育儿这一当前实体名称;同理,在词林中获取到与健康之间的路径长度最近的词语是健康大数据,此时可以将健康这一意图关键词转换为健康大数据。
通过上述同义词的转换关系,确保了能根据用户的对话能在知识图谱库中检索到对应的实体名称,从而可准确的向用户推送信息。
第一问题集发送单元104,用于根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集。
在本实施例中,当获取了用户意图对应的当前实体名称集后(例如上述举例的育儿+健康大数据),此时可以根据当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,以引导用户去咨询健康大数据+育儿相关的问题。智能对话机器人此时主要调用育儿这一实体在第一知识图谱库中对应的子知识图谱,还调用健康大数据这一实体在第一知识图谱库中对应的子知识图谱,获取了上述子知识图谱后调用与上述子知识图谱的分别对应的关联问题,以组成第一第一当前关联问题集,将所述第一当前关联问题集发送至用户端。
第二问题集发送单元105,用于若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集。
在本实施例中,当用户端在与智能对话机器人之间的对话框中查看了服务器所发送的第一当前关联问题集后,可以手动点击选择其中一个最感兴趣的问题以生成第一问题点击指令。例如用户点击了健康大数据这个实体名称下面的乳腺相关问题(具体如2019年乳腺健康大数据),则抽取到了这个问题中的关键实体名称(乳腺),接下来会根据乳腺这个实体名称,以及当前正在查看的(2019年乳腺健康大数据)所关联到的(健康大数据)这个实体名称,根据第一知识图谱库中实体之间的关联关系而关联到另外的实体(乳腺增生+女性癌症),同时展示以这两个关联实体下面的相关问题(80后女性如何避免得乳腺增生,女性癌症高发疾病有哪些?)。
上述举例的两个关联实体组成的是与所述第一目标实体名称对应的第一关联实体名称集,在获取了第一关联实体名称集后可以在服务器本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端,以引导用户去咨询乳腺增生+女性癌症相关的问题。
结果绑定单元106,用于若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
在本实施例中,当用户端在与智能对话机器人之间的对话框中查看了服务器所发送的第二当前关联问题集后,可以手动点击选择其中一个最感兴趣的问题以生成第二问题点击指令。例如,用户最终点击了女性癌症高发疾病有哪些,则根据这个相关问题,抽取到该用户A已经完成了需求激发阶段。此时输出一个“已完成女性癌症的科普知识了解”作为第一输出结果,这一第一数据结果可以作为一个用户标签增加至该用户对应的当前用户画像中,或者是可以将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
目标用户画像获取单元107,用于若检测到用户端发送的另一智能会话连接指令,获取与另一智能会话连接指令对应的目标用户画像。
在本实施例中,当服务器检测到用户端发送的另一智能会话连接指令,此时可能是之前的用户A与智能对话机器人再次建立会话以更多的了解产品的相关细节(也就是该用户已经经历过需求激发阶段而进入观念导入阶段),也有可能是非用户A的另一用户B与智能对话机器人初次建立会话以了解产品的科普知识(也即该用户还未经历过需求激发阶段),此时可以根据与另一智能会话连接指令获取对应的目标用户画像。之后判断该目标用户画像是否对应一个第一输出结果,从而实现判断用户是否初次与智能对话机器人建立会话。
目标用户画像判断单元108,用于判断所述目标用户画像中是否对应绑定第一输出结果。
在本实施例中,判断所述目标用户画像中是否对应绑定第一输出结果,即是判断用户是否初次与智能对话机器人建立会话,这样能在后续步骤中更精准的根据用户情况调用第一知识图谱库或是第二知识图谱库。
第三问题集发送单元109,用于若所述目标用户画像中绑定有第一输出结果,根据所述第一输出结果在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。
在本实施例中,所述目标用户画像中绑定有第一输出结果,表示是之前完成过至少一次沟通的用户与智能对话机器人再次建立会话以更多的了解产品的相关细节,此时不再像上述步骤中一样从第一知识图谱库获取关联问题集,而是根据所述第一输出结果对应的实体名称在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。通过这一方式,可以将已初步了解过产品科普知识的用户导向从第二知识图谱库中获取更专业的知识,无需再次了解产品的科普知识,从而提高用户获取信息的效率和准确率。
在一实施例中,基于多知识图谱的智能答复装置100还包括:
返回控制单元,用于若所述目标用户画像中未绑定有第一输出结果,将所述目标用户画像更新作为所述当前用户画像,返回执行接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集的步骤。
在本实施例中,所述目标用户画像中未绑定有第一输出结果,表示用户是初次与智能对话机器人建立会话,此时可以将该目标用户画像更新作为所述当前用户画像,返回执行接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集的步骤。通过这一方式,对于不同知识掌握程度的用户对应推荐相应信息,能有效提高用户获取信息的效率和准确率。
在一实施例中,基于多知识图谱的智能答复装置100还包括:
上链单元,用于将所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集均上传至区块链中。
在本实施例中,基于所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集得到对应的摘要信息,具体来说,摘要信息由所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。
用户设备可以从区块链中下载得该摘要信息,以便查证所述第一当前关联问题集、所述第二当前关联问题集及所述第三当前关联问题集是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
该装置实现了对于不同知识掌握程度的用户根据对应的知识图谱推荐相应信息,能有效提高用户获取信息的效率和准确率。
上述基于多知识图谱的智能答复装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图4,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于多知识图谱的智能答复方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于多知识图谱的智能答复方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的基于多知识图谱的智能答复方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的基于多知识图谱的智能答复方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于多知识图谱的智能答复方法,其特征在于,包括:
若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像;
接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集;
根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集;
若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集;以及
若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
2.根据权利要求1所述的基于多知识图谱的智能答复方法,其特征在于,还包括:
若检测到用户端发送的另一智能会话连接指令,获取与另一智能会话连接指令对应的目标用户画像;
判断所述目标用户画像中是否对应绑定第一输出结果;以及
若所述目标用户画像中绑定有第一输出结果,根据所述第一输出结果在本地的第二知识图谱库中获取对应的第三当前关联问题集,将所述第三当前关联问题集发送至用户端。
3.根据权利要求1所述的基于多知识图谱的智能答复方法,其特征在于,还包括:
接收并保存业务服务器上传的第一知识图谱库和第二知识图谱库;其中,所述第一知识图谱库中包括多个第一子知识图谱,每一第一子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系;所述第二知识图谱库中包括多个第二子知识图谱,每一第二子知识图谱对应若干个实体名称,且实体名称对应的实体之间存在关联关系。
4.根据权利要求2所述的基于多知识图谱的智能答复方法,其特征在于,还包括:
若所述目标用户画像中未绑定有第一输出结果,将所述目标用户画像更新作为所述当前用户画像,返回执行接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集的步骤。
5.根据权利要求1所述的基于多知识图谱的智能答复方法,其特征在于,所述获取与所述用户端对应的当前用户画像,包括:
获取所述用户端对应的用户唯一识别码,根据所述用户唯一识别码在本地的用户画像库中获取与所述用户端对应的当前用户画像。
6.根据权利要求1所述的基于多知识图谱的智能答复方法,其特征在于,所述对所述对话文本进行意图识别以得到意图识别关键词集,包括:
将所述对话文本通过基于概率统计分词模型进行分词,得到与所述对话文本对应的分词结果;
通过词频-逆文本频率指数模型,抽取所述分词结果按频-逆文本频率指数降序排序后未超出预设的排名阈值的关键词,以组成意图识别关键词集。
7.根据权利要求1所述的基于多知识图谱的智能答复方法,其特征在于,所述获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集,包括:
调用预先存储的实体名称库和同义词词典,并获取与所述同义词词典对应的词林;
根据所述词林在所述实体名称库中获取各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集。
8.一种基于多知识图谱的智能答复装置,其特征在于,包括:
连接建立单元,用于若检测到用户端发送的智能会话连接指令,与所述用户端建立连接,并获取与所述用户端对应的当前用户画像;
当前实体识别单元,用于接收用户端发送的对话文本,对所述对话文本进行意图识别以得到意图识别关键词集,获取与所述意图识别关键词集中各意图识别关键词分别对应的当前实体名称,以组成当前实体名称集;
第一问题集发送单元,用于根据所述当前实体名称集中各当前实体名称在本地的第一知识图谱库中获取对应的第一当前关联问题集,将所述第一当前关联问题集发送至用户端;其中,所述第一当前关联问题集中包括的关联问题子集的个数与所述当前实体名称集中包括的当前实体名称的个数相同,且每一当前实体名称对应所述第一当前关联问题集中的其中一个关联问题子集;
第二问题集发送单元,用于若检测用户端发送的与第一当前关联问题集对应的第一问题点击指令,获取与所述第一问题点击指令对应的第一目标实体名称,获取所述第一目标实体名称对应的第一关联实体名称集,根据所述第一关联实体名称集中各第一关联实体名称在本地的第一知识图谱库中获取对应的第二当前关联问题集,将所述第二当前关联问题集发送至用户端;其中,所述第二当前关联问题集中包括的关联问题子集的个数与所述第一关联实体名称集中包括的第一关联实体名称的个数相同,且每一第一关联实体名称对应所述第二当前关联问题集中的其中一个关联问题子集;以及
结果绑定单元,用于若检测用户端发送的与第二当前关联问题集对应的第二问题点击指令,获取与所述第二问题点击指令对应的第二目标实体名称增加完成标识以作为第一输出结果,将所述第一输出结果与所述当前用户画像进行一一映射以绑定。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于多知识图谱的智能答复方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于多知识图谱的智能答复方法。
CN202011562101.XA 2020-12-25 2020-12-25 基于多知识图谱的智能答复方法、装置及计算机设备 Active CN112650854B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011562101.XA CN112650854B (zh) 2020-12-25 2020-12-25 基于多知识图谱的智能答复方法、装置及计算机设备
PCT/CN2021/091291 WO2022134421A1 (zh) 2020-12-25 2021-04-30 基于多知识图谱的智能答复方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011562101.XA CN112650854B (zh) 2020-12-25 2020-12-25 基于多知识图谱的智能答复方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN112650854A CN112650854A (zh) 2021-04-13
CN112650854B true CN112650854B (zh) 2022-09-27

Family

ID=75362972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011562101.XA Active CN112650854B (zh) 2020-12-25 2020-12-25 基于多知识图谱的智能答复方法、装置及计算机设备

Country Status (2)

Country Link
CN (1) CN112650854B (zh)
WO (1) WO2022134421A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650854B (zh) * 2020-12-25 2022-09-27 平安科技(深圳)有限公司 基于多知识图谱的智能答复方法、装置及计算机设备
CN113314236A (zh) * 2021-06-01 2021-08-27 南华大学 一种面向高血压的智能问答系统
CN115146075B (zh) * 2022-07-11 2023-03-10 中科雨辰科技有限公司 一种获取知识图谱的数据处理系统
CN115412640B (zh) * 2022-11-02 2023-05-09 北京北投智慧城市科技有限公司 一种基于知识图谱的呼叫中心信息处理方法及装置
CN115810422B (zh) * 2022-12-07 2023-12-29 深圳市维康致远科技有限公司 基于ai技术的互联网智能自动诊疗应答系统
CN116821287B (zh) * 2023-08-28 2023-11-17 湖南创星科技股份有限公司 基于知识图谱和大语言模型的用户心理画像系统及方法
CN117633254B (zh) * 2024-01-26 2024-04-05 武汉大学 一种基于知识图谱的地图检索用户画像构建方法和系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408639A (zh) * 2014-10-22 2015-03-11 百度在线网络技术(北京)有限公司 多轮会话交互方法和系统
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
US20190164064A1 (en) * 2017-11-27 2019-05-30 Shanghai Xiaoi Robot Technology Co., Ltd. Question and answer interaction method and device, and computer readable storage medium
US11531858B2 (en) * 2018-01-02 2022-12-20 International Business Machines Corporation Cognitive conversational agent for providing personalized insights on-the-fly
CN108519998B (zh) * 2018-03-07 2021-05-14 云知声智能科技股份有限公司 基于知识图谱的问题引导方法及装置
US10678822B2 (en) * 2018-06-29 2020-06-09 International Business Machines Corporation Query expansion using a graph of question and answer vocabulary
CN110046238B (zh) * 2019-03-29 2024-03-26 华为技术有限公司 对话交互方法、图形用户界面、终端设备以及网络设备
CN110377715A (zh) * 2019-07-23 2019-10-25 天津汇智星源信息技术有限公司 基于法律知识图谱的推理式精准智能问答方法
CN110704596B (zh) * 2019-09-29 2023-03-31 北京百度网讯科技有限公司 基于话题的对话方法、装置和电子设备
CN110929016A (zh) * 2019-12-10 2020-03-27 北京爱医生智慧医疗科技有限公司 一种基于知识图谱的智能问答方法及装置
CN111026886B (zh) * 2019-12-26 2023-05-02 成都航天科工大数据研究院有限公司 一种针对专业场景的多轮对话处理方法
CN111339781B (zh) * 2020-02-10 2023-05-30 科大讯飞华南人工智能研究院(广州)有限公司 意图识别方法、装置、电子设备和存储介质
CN111400479B (zh) * 2020-04-14 2023-05-23 支付宝(杭州)信息技术有限公司 针对多轮对话的问题识别方法和装置
CN111552880B (zh) * 2020-04-30 2023-06-30 杭州网易再顾科技有限公司 基于知识图谱的数据处理方法、装置、介质及电子设备
CN112650854B (zh) * 2020-12-25 2022-09-27 平安科技(深圳)有限公司 基于多知识图谱的智能答复方法、装置及计算机设备

Also Published As

Publication number Publication date
WO2022134421A1 (zh) 2022-06-30
CN112650854A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN112650854B (zh) 基于多知识图谱的智能答复方法、装置及计算机设备
US20200301954A1 (en) Reply information obtaining method and apparatus
CN107346336B (zh) 基于人工智能的信息处理方法和装置
CN108304439B (zh) 一种语义模型优化方法、装置及智能设备、存储介质
CN110334179B (zh) 问答处理方法、装置、计算机设备和存储介质
CN109271631A (zh) 分词方法、装置、设备及存储介质
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN111831911A (zh) 查询信息的处理方法、装置、存储介质和电子装置
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
CN111310440A (zh) 文本的纠错方法、装置和系统
CN107862058B (zh) 用于生成信息的方法和装置
WO2021159812A1 (zh) 癌症分期信息处理方法、装置及存储介质
CN112231452A (zh) 基于自然语言处理的问答方法、装置、设备及存储介质
CN112256827A (zh) 一种手语翻译方法、装置、计算机设备及存储介质
CN110427470A (zh) 问答处理方法、装置及电子设备
CN111898363A (zh) 文本长难句的压缩方法、装置、计算机设备及存储介质
CN112199958A (zh) 概念词序列生成方法、装置、计算机设备及存储介质
CN111931503A (zh) 信息抽取方法及装置、设备、计算机可读存储介质
CN109033078B (zh) 语句类别识别方法及装置、存储介质、处理器
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN114255750B (zh) 数据集构建和任务式对话方法、电子设备和存储介质
CN116775815B (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN114913995A (zh) 自助就诊方法、装置、设备及存储介质
CN111556096B (zh) 信息推送方法、装置、介质及电子设备
CN113987202A (zh) 一种基于知识图谱的交互电话呼入方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant