CN114218378A - 一种基于知识图谱的内容推送方法、装置、设备及介质 - Google Patents

一种基于知识图谱的内容推送方法、装置、设备及介质 Download PDF

Info

Publication number
CN114218378A
CN114218378A CN202111638581.8A CN202111638581A CN114218378A CN 114218378 A CN114218378 A CN 114218378A CN 202111638581 A CN202111638581 A CN 202111638581A CN 114218378 A CN114218378 A CN 114218378A
Authority
CN
China
Prior art keywords
information
word vector
target
similarity
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111638581.8A
Other languages
English (en)
Inventor
王瑞国
许娟
张�林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202111638581.8A priority Critical patent/CN114218378A/zh
Publication of CN114218378A publication Critical patent/CN114218378A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于知识图谱的内容推送方法、装置、设备及介质,其中,将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。采用上述方法,将与目标用户的历史提问信息相似度最高的待推荐标签中的内容对该目标用户进行推送,有利于提高内容推送的有效性。

Description

一种基于知识图谱的内容推送方法、装置、设备及介质
技术领域
本发明涉及人机交互技术领域,具体而言,涉及一种基于知识图谱的内容推送方法、装置、设备及介质。
背景技术
在医疗领域中,应用人机交互技术的人机交互设备致力于为用户提供医疗咨询的推荐。现有技术中,在人机交互设备为用户推荐医疗领域的咨询内容时,通常只为该用户推荐系统设定好的特定内容,而这些特定内容有可能不是用户感兴趣的内容,使得用户很可能不对系统推荐的内容进行浏览,从而降低了内容推送的有效性。
发明内容
有鉴于此,本发明的目的在于提供一种基于知识图谱的内容推送方法、装置、设备及介质,有利于提高内容推送的有效性。
第一方面,本申请实施例提供了一种基于知识图谱的内容推送方法,应用于人机交互设备,所述方法包括:
将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;
针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
可选地,在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,所述方法还包括:
统计对所述目标用户的历史提问信息所推送的所有回复信息;
将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
可选地,在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,所述方法包括:
将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果;
将所述目标分词结果映射为第一词向量。
可选地,在将所述第一词向量分别和每个第二词向量进行相似度的计算时,所述方法包括:
将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yi变量进行余弦相似度的计算:
Figure BDA0003442836750000021
第二方面,本申请实施例提供了一种基于知识图谱的内容推送装置,所述装置包括:
第一词向量映射模块,用于将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;
相似度计算模块,用于针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
内容推荐模块,用于将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
可选地,所述装置还包括:
信息统计模块,用于在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,统计对所述目标用户的历史提问信息所推送的所有回复信息;
信息确认模块,用于将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
可选地,所述第一词向量映射模块在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,还用于:
将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果;
将所述目标分词结果映射为第一词向量。
可选地,所述相似度计算模块在将所述第一词向量分别和每个第二词向量进行相似度的计算时,还用于:
将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yl变量进行余弦相似度的计算:
Figure BDA0003442836750000031
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可选地实施方式中所述的基于知识图谱的内容推送方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可选地实施方式中所述的基于知识图谱的内容推送方法的步骤。
本发明实施例提供的一种基于知识图谱的内容推送方法、装置、设备及介质,其中,将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息,通过此步骤,可以对用户的历史提问信息中提到的关键信息进行提取,获取用户感兴趣的信息范围;针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算,通过将所有待推荐标签与用户可能感兴趣的信息进行相似度计算,可以得到用于描述目标用户对每个待推荐标签感兴趣程度的表征数据;将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度,采用上述方法,将与目标用户的历史提问信息相似度最高的待推荐标签中的内容对该目标用户进行推送,有利于提高内容推送的有效性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例一所提供的一种基于知识图谱的内容推送方法的流程图;
图2示出了本发明实施例一所提供的一种用户意图确定方法的流程图;
图3示出了本发明实施例一所提供的一种医疗智能问答系统的示意图;
图4示出了本发明实施例二所提供的一种基于知识图谱的内容推送装置的结构示意图;
图5示出了本发明实施例三所提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
为便于对本申请进行理解,下面结合图1示出的本发明实施例一所提供的一种基于知识图谱的内容推送方法的流程图描述的内容对本申请实施例一进行详细说明。
参见图1所述,图1示出了本发明实施例一所提供的一种基于知识图谱的内容推送方法的流程图,所述方法包括步骤S110~S130:
S110:将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息。
具体的,当人机交互设备接收到目标用户对该人机交互设备输入的文本信息后,对该文本信息进行分析以确定目标用户的交互意图,其中,所述交互意图包括与设备闲聊及获取知识性信息。
在确定目标用户的交互意图时,所述方法包括步骤S111~S113,图2示出了本发明实施例一所提供的一种用户意图确定方法的流程图。
S111:对目标用户输入的文本信息进行预处理,将所述文本信息中的英文、标点及非中文的字符进行删除,并将完成预处理后的文本作为进行用户意图识别的目标文本。
S112:将所述目标文本作为训练参数输入至训练好的文本分类模型中计算得到训练结果,并根据所述训练结果判别目标用户的输入意图是想通过该设备获取知识性信息还是与该设备进行闲聊,其中,在对文本分类模型进行训练时,使用Bert(BidirectionalEncoder Representation from Transformers)深度学习模型对用户与设备进行历史互动时产生的闲聊互动数据以及知识性互动数据进行文本分类训练,输入数据包括tokenembedding(词嵌入)、segment embedding(段嵌入)和attention mask(注意力机制掩码)。
S113:当训练结果的阈值小于预设阈值时,判定目标用户的输入意图为与设备进行闲聊,自动调用所述设备中的闲聊模块,并根据用户的闲聊输入信息实时对目标用户进行闲聊信息的推送,或者,当训练结果的阈值未落入预设阈值时,判定目标用户的输入意图为获取知识性信息,自动调用所述设备中的知识问答模块,并根据目标用户对知识性信息实时进行提问的提问信息对目标用户进行知识性信息的推送。
在步骤S113中,在调用所述设备中的闲聊模块用于对目标用户进行信息推送时,所述方法包括步骤S114.1~S114.6:
S114.1:构建与日常生活相关的闲聊数据集,并对所述闲聊数据集进行预处理,例如,对天气的询问,对日期的询问等。
S114.2:使用GPT(Generate Pre-Training Model,一种预训练模型)对上述经过预处理后的闲聊数据集进行训练。
S114.3:加载GPT预训练模型的预训练权重,以针对问答数据的生成模型。
S114.4:设置问答数据中的角色Embedding(嵌入),例如,将用户的输入记为全0,所述人机交互设备推送的消息记为全1。
S114.5:生成模型进行训练,并保存验证集上表现最优的最优模型。
S114.6:将用户的闲聊输入信息作为训练参数输入至训练好的所述最优模型中计算得到训练结果,并将所述训练结果对应的信息对目标用户进行推送。
在步骤S113中,在调用所述设备中的知识问答模块用于对目标用户进行信息推送时,所述方法包括步骤S115.1~S115:
S115.1:构建常见的医疗问答知识性数据库,并构建问答索引。
S115.2:将所述知识性数据库的key(键)输入到Bert模型中,取得数据库词向量,并将所述数据库词向量进行加权求和后得到第一句向量。
S115.3:将用户输入至所述设备的被判定为获取知识性信息的提问信息输入到Bert模型中,取得用户输入词向量,并将所述用户输入词向量进行加权求和后得到第二句向量。
S115.4:将所述第一句向量作为下述公式的xi变量,将所述第二句向量作为下述公式的yi变量进行余弦相似度的计算:
Figure BDA0003442836750000071
S115.5:根据所述相似度返回最高的key匹配的value(值),并将所述value向用户进行实时推送。
在根据用户的文本信息确定目标用户的交互意图后,需要从用户的所有提问信息中筛选出处于获取知识性信息的交互意图时的用户提问信息,即获取对知识性信息进行提问的历史提问数据,并将上述对知识性信息进行提问的历史提问数据映射为第一词向量。
S120:针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算。
具体的,将待推荐标签映射为第二词向量,并将通过步骤S110得到的第一词向量与通过S120得到的第二词向量进行相似度的计算,其中,所述待推荐标签包括但不限于与所述人机交互设备所应用的领域相关的信息的属性关键词。
例如,当所述人机交互设备应用于医疗领域中时,所述待推荐标签可以为“高血压”、“糖尿病”、“冠心病”等与医疗及疾病相关的词语;当所述人机交互设备应用于农业领域中时,所述待推荐标签可以为“小麦”、“水稻”、“苹果”等与农作物相关的词语。
需要说明的是,所述待推荐标签可以根据实际需要进行设定,在此不做具体限定,上述具体说明是对本发明实施例一的示意性说明,并不对本发明实施例一形成限定。
S130:将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
具体的,在将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户时,所述方法包括步骤S131~S134:
S131:判断所述目标用户对所述设备输入的信息是否有明显结束性短语,若存在则直接执行步骤S132~S134;若不存在明显结束性短语且预设时间内未获取到所述目标用户的输入信息,则在经过预设时间后,执行步骤S132~S134。
S132:当所述目标相似度大于预设阈值的待推荐标签作为用户画像标签信息,并将当前标签与历史标签进行融合,其中,所述用户画像历史标签被保存在所述设备的用户管理模块中,所述用户管理模块用于保存用户历画像历史标签信息和用户唯一的用户账号信息。
S133:针对每个待推荐标签,为每个待推荐标签分配与所述待推荐标签相关的待推荐内容,其中,所述待推荐内容包括但不限于针对待推荐标签的生活干预、注意事项、药物干预等相关内容。
需要说明的是,为每个待推荐标签分配与所述待推荐标签相关的待推荐内容可以根据实际需要进行设定,在此不做具体限定,上述具体说明是对本发明实施例一的示意性说明,并不对本发明实施例一形成限定。
S134:将与用户画像标签信息相匹配的待推荐标签的内容向目标用户进行推荐和展示。
在一个可行的实施方案中,在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,所述方法还包括:统计对所述目标用户的历史提问信息所推送的所有回复信息。
具体的,由于在得到用户对知识性信息进行提问的提问信息时,需要根据对用户的提问信息进行回复的推送信息中进行筛选,所以需要统计对所述目标用户的历史提问信息所推送的所有回复信息。
将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
具体的,针对目标用户的输入的提问信息进行意图判定,在对用户的意图进行判定后,将被判定为与设备进行闲聊的用户提问信息进行过滤删除,得到对知识性信息提问的目标提问信息。
在一个可行的实施方案中,在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,所述方法包括:将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果。
具体的,将目标用户对知识性信息提问的目标提问信息使用Jieba(“结巴”,一种中文分词方法)进行分词处理,并将完成分词处理后的数据中的停用词进行过滤去除;由于此时得到的分词结果可能还有多个相同字段,则需要对该分词结果进行去重,得到目标分词结果。
将所述目标分词结果映射为第一词向量。
在一个可行的实施方案中,在将所述第一词向量分别和每个第二词向量进行相似度的计算时,所述方法包括:将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yi变量进行余弦相似度的计算:
Figure BDA0003442836750000091
具体的,由于需要对用户的提问信息和待推荐标签进行匹配,这里采用余弦相似度函数分别计算用户的提问信息的第一词向量和每个待推荐标签的第二词向量的余弦相似度;从所有待推荐标签中,选择出与第一词向量的相似度满足预设阈值的至少一个目标待推荐标签作为与目标用户相匹配的待推荐标签,并将为所述待推荐标签分配的待推荐内容向目标用户进行推荐,使得用户可以看到自己更感兴趣的相关内容。
图3示出了本发明实施例一所提供的一种医疗智能问答系统的示意图,下面结合所述医疗智能问答系统300来说明本申请所提供的方案,所述医疗智能问答系统应用于医疗智能问答设备,所述医疗智能问答系统包括:
用户单元301,用于存储用户的用户信息,每一个用户在首次使用所述系统时,所述用户单元会为每个用户配置唯一标识或账号,使得用户在下次使用该系统时可以通过所述标识或者个人账号获取历史使用数据;还用于初始化用户画像信息以及保存历史的用户画像信息,在每次使用该系统登录用户账号时,初始化本次使用时的用户画像,并在本次使用产生的用户画像信息保存至所述目标用户的账号中。
意图识别单元302,用于根据目标用户的输入信息判断用户的交互意图,例如,当用户输入的文本信息为“今天的天气怎么样?”时,首先将该文本信息中的非中文字符进行删除得到“今天的天气怎么样”并将这句话输入至已经训练好的分类模型中得到训练结果为0.6,由于训练结果的数值小于预设阈值0.7,则调用所述设备中的回复单元和闲聊单元;当用户第二次输入的文本信息为“高血压有什么症状?”时,首先将该文本信息中的非中文字符进行删除得到“高血压有什么症状”并将这句话输入至已经训练好的分类模型中得到训练结果为0.8,由于训练结果的数值不小于预设阈值0.7,则调用所述设备中的回复单元和知识问答单元。
回复单元303,用于根据接收到的上层单元信息,组建回复单元信息,返回给用户进行下一步交互;还用于判断用户输入信息是否还有明显结束性短语,存在就进入画像生成单元。若30秒内未见用户输入其他信息就自动结束,进入画像生成单元,例如,当用户在进行当前文本信息输入时,输入了“我没有想知道的问题了”后,则直接调用画像生成单元生成用户画像并进行内容推送;当用户并未输入任何结束行短语后一段时间内,计算从用户从最后一次输入到当前时间经过了多长时间,如果这30秒内用户没有再进行文本的输入,则调用画像生成单元生成用户画像并进行内容推送,如果这30秒内用户进行了文本的输入,则重复上述判断输入信息是否有明显结束短语的步骤,直至调用画像生成单元生成用户画像并进行内容推送。
闲聊单元304,用于接收意图识别模块的调用信息,利用生成式模型根据用户输入生成回复信息,例如,当用户输入的文本信息为“今天的天气怎么样?”时,对用户的输入文本进行相关解析,放入闲聊模型中生成回复消息“今天是晴天”,并针对用户此次提问进行信息的推送。
知识问答单元305,用于接收意图识别模块的调用信息,利用利用余弦相似度检索问题和答案,例如,当用户输入的文本信息为“高血压有什么症状?”时,对用户的提问信息进行相关解析后,与数据库中的key进行相似度匹配,得到相似度最高的key对应的与高血压的症状相关的信息,并针对用户此次提问进行信息的推送。
画像生产单元306,用于根据系统聊天信息生成用户画像,融合历史用户画像信息,例如,对用户的与知识问答单元对应的提问信息进行Query分析(一种搜索词分析方法),提取出用户所关注的相关疾病或医学常识的标签“高血压”,并将历史用户画像信息“冠心病”与本次使用时得到的用户画像信息进行融合得到用户的画像信息标签为“高血压”和“冠心病”。
内容推送单元307,用于根据画像标签对用户进行相关医学常识的推荐,例如,经过用户画像单元的用户画像标签生成为“高血压”和“冠心病”,则将与高血压和冠心病相关的疾病症状信息、生活干预信息、饮食注意信息等相关内容对该用户进行推荐和展示。
实施例二
参见图4所示,图4示出了本发明实施例二所提供的一种基于知识图谱的内容推送装置的结构示意图,其中,所述基于知识图谱的内容推送装置400包括:
第一词向量映射模块401,用于将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;
相似度计算模块402,用于针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
内容推荐模块403,用于将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
在一个可行的实施方案中,所述装置还包括:
信息统计模块404,用于在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,统计对所述目标用户的历史提问信息所推送的所有回复信息;
信息确认模块405,用于将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
在一个可行的实施方案中,所述第一词向量映射模块401在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,还用于:
将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果;
将所述目标分词结果映射为第一词向量。
在一个可行的实施方案中,所述相似度计算模块402在将所述第一词向量分别和每个第二词向量进行相似度的计算时,还用于:
将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yi变量进行余弦相似度的计算:
Figure BDA0003442836750000131
实施例三
基于同一申请构思,参见图5所示,图5示出了本发明实施例三所提供的一种计算机设备的结构示意图,其中,如图5所示,本申请实施例三所提供的一种计算机设备500包括:
处理器501、存储器502和总线503,所述存储器502存储有所述处理器501可执行的机器可读指令,当计算机设备500运行时,所述处理器501与所述存储器502之间通过所述总线503进行通信,所述机器可读指令被所述处理器501运行时执行上述实施例一所示的一种基于知识图谱的内容推送方法的步骤。
具体地,所述机器可读指令被所述处理器501执行时可以执行如下处理:
将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;
针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
本发明实施例提供的一种基于知识图谱的内容推送方法、装置、设备及介质,其中,将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息,通过此步骤,可以对用户的历史提问信息中提到的关键信息进行提取,获取用户感兴趣的信息范围;针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算,通过将所有待推荐标签与用户可能感兴趣的信息进行相似度计算,可以得到用于描述目标用户对每个待推荐标签感兴趣程度的表征数据;将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度,采用上述方法,将与目标用户的历史提问信息相似度最高的待推荐标签中的内容对该目标用户进行推送,有利于提高内容推送的有效性。
实施例四
基于同一申请构思,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例中任一项所述的一种基于知识图谱的内容推送方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例所提供的进行基于知识图谱的内容推送的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本发明实施例所提供的一种基于知识图谱的内容推送的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于知识图谱的内容推送方法,其特征在于,应用于人机交互设备,所述方法包括:
将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用所述人机交互设备时在所述人机交互设备中输入的文本信息;
针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
2.根据权利要求1所述的方法,其特征在于,在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,所述方法还包括:
统计对所述目标用户的历史提问信息所推送的所有回复信息;
将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
3.根据权利要求1所述的方法,其特征在于,在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,所述方法包括:
将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果;
将所述目标分词结果映射为第一词向量。
4.根据权利要求1所述的方法,其特征在于,在将所述第一词向量分别和每个第二词向量进行相似度的计算时,所述方法包括:
将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yi变量进行余弦相似度的计算:
Figure FDA0003442836740000021
5.一种基于知识图谱的内容推送装置,其特征在于,所述装置包括:
第一词向量映射模块,用于将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量,其中,所述历史提问信息为所述目标用户在使用人机交互设备时在所述人机交互设备中输入的文本信息;
相似度计算模块,用于针对每个待推荐标签,将该待推荐标签映射为第二词向量,并将所述第一词向量分别和每个第二词向量进行相似度的计算;
内容推荐模块,用于将为目标相似度对应的待推荐标签分配的待推荐内容推送给所述目标用户,其中,目标相似度为大于预设阈值的相似度。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
信息统计模块,用于在将目标用户的历史提问信息中的对知识性信息进行提问的目标历史提问信息映射为第一词向量前,统计对所述目标用户的历史提问信息所推送的所有回复信息;
信息确认模块,用于将所述所有回复信息中的非知识性信息进行删除得到不包含非知识性信息的回复信息,将所述不包含非知识性信息的回复信息作为知识性信息。
7.根据权利要求5所述的装置,其特征在于,所述第一词向量映射模块在将目标用户的历史提问信息中的对知识性知识进行提问的目标历史提问信息映射为第一词向量时,还用于:
将所述目标历史提问信息进行中文分词处理后过滤停用词,对过滤后的中文分词结果进行去重处理得到目标分词结果;
将所述目标分词结果映射为第一词向量。
8.根据权利要求5所述的装置,其特征在于,所述相似度计算模块在将所述第一词向量分别和每个第二词向量进行相似度的计算时,还用于:
将所述第一词向量作为下述公式的xi变量,将所述第二词向量作为下述公式的yi变量进行余弦相似度的计算:
Figure FDA0003442836740000031
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4中任一所述的基于知识图谱的内容推送方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至4中任意一项所述的基于知识图谱的内容推送方法的步骤。
CN202111638581.8A 2021-12-29 2021-12-29 一种基于知识图谱的内容推送方法、装置、设备及介质 Pending CN114218378A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111638581.8A CN114218378A (zh) 2021-12-29 2021-12-29 一种基于知识图谱的内容推送方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111638581.8A CN114218378A (zh) 2021-12-29 2021-12-29 一种基于知识图谱的内容推送方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114218378A true CN114218378A (zh) 2022-03-22

Family

ID=80706722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111638581.8A Pending CN114218378A (zh) 2021-12-29 2021-12-29 一种基于知识图谱的内容推送方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114218378A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329200A (zh) * 2022-08-26 2022-11-11 国家开放大学 一种基于知识图谱和用户相似度的教学资源推荐方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329200A (zh) * 2022-08-26 2022-11-11 国家开放大学 一种基于知识图谱和用户相似度的教学资源推荐方法
CN115329200B (zh) * 2022-08-26 2024-04-26 国家开放大学 一种基于知识图谱和用户相似度的教学资源推荐方法

Similar Documents

Publication Publication Date Title
US11334635B2 (en) Domain specific natural language understanding of customer intent in self-help
CN112035636B (zh) 医疗问诊系统的问答管理方法、装置、设备及存储介质
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN110263248B (zh) 一种信息推送方法、装置、存储介质和服务器
CN111708873A (zh) 智能问答方法、装置、计算机设备和存储介质
EP3717984B1 (en) Method and apparatus for providing personalized self-help experience
CN110929016A (zh) 一种基于知识图谱的智能问答方法及装置
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110297893B (zh) 自然语言问答方法、装置、计算机装置及存储介质
CN112000894A (zh) 一种健康管理信息推送方法、装置、设备及存储介质
US10586174B2 (en) Methods and systems for finding and ranking entities in a domain specific system
CN114387061A (zh) 产品推送方法、装置、电子设备及可读存储介质
CN113111159A (zh) 问答记录生成方法、装置、电子设备及存储介质
CN109697676B (zh) 基于社交群的用户分析及应用方法和装置
CN114416929A (zh) 实体召回模型的样本生成方法、装置、设备及存储介质
CN112581297B (zh) 基于人工智能的信息推送方法、装置及计算机设备
CN114218378A (zh) 一种基于知识图谱的内容推送方法、装置、设备及介质
CN113821612A (zh) 信息查找方法以及装置
CN116303922A (zh) 咨询消息应答方法、装置、计算机设备、存储介质和产品
CN116089616A (zh) 主题文本获取方法、装置、设备及存储介质
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
CN112766779B (zh) 信息处理方法、计算机设备及存储介质
CN113707344A (zh) 基于ai的患者康复跟踪方法、装置、服务器及介质
CN113505293A (zh) 信息推送方法、装置、电子设备及存储介质
CN113704422A (zh) 一种文本推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination