CN111061859A - 基于知识图谱的数据处理方法、装置和计算机设备 - Google Patents

基于知识图谱的数据处理方法、装置和计算机设备 Download PDF

Info

Publication number
CN111061859A
CN111061859A CN201911213438.7A CN201911213438A CN111061859A CN 111061859 A CN111061859 A CN 111061859A CN 201911213438 A CN201911213438 A CN 201911213438A CN 111061859 A CN111061859 A CN 111061859A
Authority
CN
China
Prior art keywords
entity
data
key
elements
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911213438.7A
Other languages
English (en)
Other versions
CN111061859B (zh
Inventor
赵正锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhuiyi Technology Co Ltd
Original Assignee
Shenzhen Zhuiyi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhuiyi Technology Co Ltd filed Critical Shenzhen Zhuiyi Technology Co Ltd
Priority to CN201911213438.7A priority Critical patent/CN111061859B/zh
Publication of CN111061859A publication Critical patent/CN111061859A/zh
Application granted granted Critical
Publication of CN111061859B publication Critical patent/CN111061859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请涉及一种基于知识图谱的数据处理方法、装置、设备和存储介质。所述方法包括:接收终端发送的资源获取请求,对请求信息进行解析得到对应的业务类型和用户意图;根据业务类型从知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系;根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合;根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;将知识图谱数据发送至终端进行展示。采用本方法能够有效生成用户意图明确的知识图谱数据。

Description

基于知识图谱的数据处理方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于知识图谱的数据处理方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的迅速发展,互联网中会产生各种海量数据,对于这些海量数据通常需要进行大数据分析,因此出现了知识图谱技术。知识图谱是通过可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
然而,传统的知识图谱通常是将所有搜索到的三元组元素集合为一条边全部展示出来。在实体数据较多时,传统的知识图谱构建出的数据网络比较复杂,难以对图谱数据进行分析,知识图谱数据的生成效率较低,且构建出知识图谱数据的利用率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效生成用户意图明确的知识图谱数据的基于知识图谱的数据处理方法、装置、计算机设备和存储介质。
一种基于知识图谱的数据处理方法,所述方法包括:
接收终端发送的资源获取请求,所述资源获取请求包括请求信息;
对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图;
根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系;
根据所述用户意图和所述实体关系确定关键实体节点和次实体节点,根据所述关键实体节点和次实体节点将所述关联实体数据生成关键实体集合和次实体集合;
根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;
将所述知识图谱数据发送至所述终端并进行展示。
在其中一个实施例中,所述接收终端发送的资源获取请求之前,还包括:获取多个业务数据和关联数据,所述业务数据和关联数据包括属性信息;根据所述属性信息分析多个业务数据和关联数据对应的多个实体元素以及实体关系,根据所述属性信息和实体关系计算实体权重和关系权重;根据所述实体权重和关系权重计算实体元素之间的连接关系;根据所述实体关系和连接关系将多个实体元素生成实体集合,实体集合中包括多个实体元素和对应的属性信息;将所述实体集合根据图谱结构集成至知识图谱库中。
在其中一个实施例中,所述对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图包括:对所述请求信息进行分词,得到对应的文本词向量;计算多个文本词向量的实体特征,根据所述实体特征提取所述请求信息中的实体关键词,根据所述实体关键词确定所述请求信息中的实体信息;根据所述文本向量和所述实体关键词对所述请求信息进行意图分类,计算所述请求信息的用户意图,根据所述用户意图确定所述请求信息的业务类型。
在其中一个实施例中,所述根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系包括:根据所述用户意图分析对应的推测链路;根据所述用户意图从知识图谱库中获取实体列表,根据所述推测链路从所述知识图谱库中获取关联实体列表,所述实体关系列表和关联实体列表包括多个实体元素的属性信息和连接关系;根据所述用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系。
在其中一个实施例中,所述根据所述用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系包括:根据所述用户意图计算所述实体列表和关联实体列表中多个实体元素的实体权重;根据所述实体权重和属性信息确定多个实体元素之间的实体关系;根据所述实体权重和连接关系确定多个实体元素之间的链路关系。
在其中一个实施例中,所述根据所述关键实体节点和次实体节点将所述关联实体数据分别生成关键实体集合和次实体集合包括:根据所述用户意图和所述实体权重确定关键实体元素;根据所述关键实体元素确定关键实体节点和次实体节点;利用所述关键实体节点对应的实体元素以及属性信息生成关键实体集合;利用所述次实体节点对应的实体元素以及属性信息生成次实体集合。
在其中一个实施例中,所述根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据包括:根据所述实体关系和所述链路关系确定所述关键实体集合和次实体集合中实体元素的关系路径;通过图谱渲染组件根据关系路径分别对所述关键实体集合中的实体元素和所述次实体集合中的实体元素进行节点渲染;根据所述关系路径和所述实体关系对关键实体集合和次实体集合进行连接渲染;利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据。
在其中一个实施例中,所述通过图谱渲染组件根据关系路径分别对所述关键实体集合中的实体元素和所述次实体集合中的实体元素进行节点渲染包括:根据每个实体元素的实体权重计算实体元素的实体节点半径;根据所述实体节点半径对实体元素进行节点渲染。
在其中一个实施例中,所述利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据包括:对所述次实体集合对应的实体元素节点进行隐藏处理,对相应的次实体节点添加隐藏标签;所述隐藏标签用于指示终端通过触发所述隐藏标签后显示相应的次实体集合对应的实体元素;利用渲染后的关键实体集合和隐藏处理后和次实体集合生成对应的知识图谱数据。
一种基于知识图谱的数据处理装置,所述装置包括:
请求接收模块,用于接收终端发送的资源获取请求,所述资源获取请求包括请求信息;
信息解析模块,用于对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图;
关系分析模块,用于根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系;根据所述用户意图和所述实体关系确定关键实体节点和次实体节点,根据所述关键实体节点和次实体节点将所述关联实体数据生成关键实体集合和次实体集合;
图谱生成模块,用于根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;
数据发送模块,用于将所述知识图谱数据发送至所述终端并进行展示。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的基于知识图谱的数据处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于知识图谱的数据处理方法的步骤。
上述基于知识图谱的数据处理方法、装置、计算机设备和存储介质,接收终端发送的资源获取请求后,对资源获取请求中的请求信息进行解析,由此能够有效解析得到请求信息对应的业务类型和用户意图。根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系,根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合;根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据,根据实体关系和链路关系生成包括关键实体和次实体的知识图谱数据,由此能够有效生成层次分明和清晰的知识图谱数据。则将生成的知识图谱数据发送至终端,能够用户清晰明了地获取知识图谱数据对应的内容,有效提高了知识图谱数据的处理效率和利用率。
附图说明
图1为一个实施例中基于知识图谱的数据处理方法的应用场景图;
图2为一个实施例中基于知识图谱的数据处理方法的流程示意图;
图3为一个实施例中知识图谱数据链路分析模式下的局部界面示意图;
图4为一个实施例中知识图谱数据实体分析模式下的局部界面示意图;
图5为一个实施例中确定实体关系和链路关系步骤的流程示意图;
图6为一个实施例中生成关键实体集合和次实体集合步骤的流程示意图;
图7为一个实施例中生成知识图谱数据步骤的流程示意图;
图8为一个实施例中基于知识图谱的数据处理装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于知识图谱的数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104接收终端102发送的资源获取请求,服务器104对请求信息进行解析得到对应的业务类型和用户意图,根据业务类型从知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系;服务器104根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合;根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;服务器104将知识图谱数据发送至终端102进行展示。采用本方法能够有效生成用户意图明确的知识图谱数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于知识图谱的数据处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,接收终端发送的资源获取请求,资源获取请求包括请求信息。
其中,资源获取请求可以为用户基于图谱数据分析需求所发起的请求,资源获取请求中包括需求信息和业务信息等请求信息。例如可以应用于图谱数据搜索、交互问答、数据推送、故障检测以及数据辅助决策等应用场景中。
用户可以利用对应的终端输入需求信息或业务信息后,向服务器发送资源获取请求,资源获取请求中则携带了请求信息。
步骤204,对请求信息进行解析,得到请求信息对应的业务类型和用户意图。
其中,实体表示客观存在并可相互区别的事物。实体可以是具体的人、事、物,也可以是抽象的概念或联系。实体信息则指用于表示客观存在并可相互区别的事物的信息。用户意图可以表示为用户所想要获取的需求信息。
服务器接收终端发送的资源获取请求后,对资源获取请求携带的请求信息进行解析。具体地,服务器可以通过基于语义理解的意图识别模型对文本信息进行实体识别和实体抽取。服务器可以首先对请求信息进行分词,得到多个文本词向量。服务器进而计算多个文本词向量的实体特征,根据实体特征提取请求信息中的实体关键词,根据实体关键词确定请求信息中的实体信息。根据文本向量和实体关键词对请求信息进行意图分类,得到请求信息的用户意图,用户意图中可以包括多个实体信息。服务器则根据用户意图确定请求信息的业务类型,由此能够快速有效地识别出请求信息的业务类型和用户意图。
步骤206,根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系。
其中,服务器中存储了多个业务类型的知识图谱库,知识图谱库中存储了大量的图谱结构化的实体数据。其中,实体数据中包括多个实体元素的属性信息和连接关系。实体关系可以表示为实体元素之间的元素关联关系,链路关系可以表示为实体元素路径的连接关系。
服务器解析出请求信息对应的业务类型和用户意图后,根据业务类型从知识图谱库中获取用户意图对应的关联实体数据。服务器进而根据用户意图从知识图谱库获取对应的实体列表,实体列表中包括实体元素和属性信息以及实体元素之间的连接关系。服务器进而根据连接关系获取相邻的关联实体和相应的连接关系,并利用关联实体和相应的连接关系生成关联实体列表。关联实体数据则包括实体列表和关联实体列表。
服务器获取关联实体数据后,根据用户意图和属性信息确定多个实体的实体关系,根据推测链路和连接关系确定多个实体的链路关系。
进一步地,服务器还可以根据用户意图计算关联实体数据中多个实体的实体权重,根据实体权重确定多个实体之间的实体关系,并根据实体列表和关联实体列表中的连接关系和实体权重确定多个实体之间的链路关系。
步骤208,根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合。
其中,实体信息包括关键实体和非关键实体,关键实体节点可以表示为关键实体对应的实体元素,次实体节点可以表示为非关键实体对应的实体元素。例如,服务器还可以根据实体权重确定关键实体节点,除关键实体节点之外的实体则可以为次实体节点。
服务器根据用户意图和实体关系确定关键实体节点和次实体节点。其中,关键实体节点可以表示为关键实体对应的实体元素。例如关键实体可以为用户意图对应的直接目标实体元素。例如,若用户终端发送的请求信息为“清华大学坐落于哪里?”,服务器则可以温习出用户意图为“清华大学的位置”,其中包括的实体则包括“清华大学”和“清华大学的位置”,推测链路则可以包括“校长”、“隶属部门”等推测关系信息。其中的关键实体节点可以为“清华大学”和“清华大学的位置”,“校长”、“隶属部门”等对应的推测实体则可以为次实体节点。
服务器则将关键实体节点对应的实体元素和属性信息生成关键实体集合,将次实体节点对应的实体元素和属性信息生成次实体集合。
步骤210,根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的多个节点元素进行渲染,利用渲染后的实体集合生成知识图谱数据。
步骤212,将知识图谱数据发送至终端并进行展示。
其中,知识图谱(Knowledge Graph),也称为知识域可视化或知识领域映射地图,是指显示知识发展进程与结构关系的一系列各种不同的图形数据,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和展示知识及它们之间的相互联系。服务器可以预先构建图谱渲染组件,用于将关键实体集合和次实体集合的多个节点元素集成为对应的知识图谱数据。
服务器根据实体关系和链路关系将关联实体数据生成关键实体集合和次实体集合后,进而调用预设的图谱渲染组件,根据实体关系和链路关系对关键实体集合和次实体集合的多个节点元素进行渲染,利用渲染后的实体集合生成知识图谱数据,从而有效生成包括关键实体和次实体的知识图谱。其中,关键实体可以为展示的关键实体节点和关键关系的实体信息。实体节点中还可以包括实体简介信息,实体简介信息中可以包括实体关系数量和分析指标等属性信息。
其中,服务器生成的知识图谱数据中还可以包括链路分析模式和实体分析模式,链路分析模式可以充分展示知识图谱数据中的关键实体节点和关键关系,实体分析模式可以用于用户对知识图谱数据的局部实体区域进行分析。通过链路和实体两个分析侧片的切分,使得用户可以清晰得理解可视化知识图谱数据的全局信息和局部信息,清晰且有层次地展示了知识图谱数据对应的内容,是的用户能够有效地利用可视化的知识图谱数据获取数据并进行分析,有效提高了知识图谱数据的利用率。
服务器生成请求信息对应的知识图谱数据后,则将知识图谱数据发送至终端,并在终端的屏幕上进行展示,使得终端能够有效根据生成的知识图谱数据获取相应的资源数据。通过识别根据用户意图后,从知识图谱库中获取相应的关联实体数据,并分析出其中的实体关系和链路关系,进而根据实体关系和链路关系生成包括关键实体和次实体的知识图谱数据,由此能够有效生成层次分明和清晰的知识图谱数据,能够用户清晰明了地获取知识图谱数据对应的内容,有效提高了知识图谱数据的利用率。
例如,如图3所示,为链路分析模式对应的知识图谱局部示意图。例如用户的请求信息可以为“获取企业的业务绩效接口信息”。服务器生成的知识图谱中可以包括业务绩效接口集合、人事系统集合以及财务系统集合,每个结合中还包括多个实体元素,其中,业务绩效接口集合可以为关键实体集合,人事系统和财务系统集合可以为次实体集合。链路分析模式下展示图谱内容的关键节点和关键关系信息,隐藏非关键节点和属性信息。将知识图谱数据发送至终端后,用户可以在界面对知识图谱数据进行交互处理分析,通过交互设计用户可以在已有链路网络上根据图谱数据进一步展开隐藏的非关键节点信息。在链路分析模式下,用户可以充分的关注图谱上的关键关系信息,查询关键节点的属性,从而能够使得用户有效地利用可视化的知识图谱数据进行数据分析。
例如,如图4所示,为实体分析模式对应的知识图谱局部示意图。实体分析模式哈可以包括分析指标和关系数量对应的视图功能。例如用户的请求信息可以为“获取企业的业务绩效接口信息”。服务器生成的知识图谱中可以包括业务绩效接口集合、人事系统集合以及财务系统集合,每个结合中还包括多个实体元素,其中,业务绩效接口集合可以为关键实体集合,人事系统和财务系统集合可以为次实体集合。用户可以在实体分析模式下针对单一实体进行局部分析,其中,在生成知识图谱时还可以利用单点透视原理在视觉上的纵深感,以通过滚轮放缩进行实体分析。关系数量可以包括在原有的关系数量上拓展到所有的数字属性。在该实体分析模式下,用户可以通过可视化权重指标的选择,针对多种的数据面进行分析,从而有效提高了数据分析效率。
上述基于知识图谱的数据处理方法中,服务器接收终端发送的资源获取请求后,对资源获取请求中的请求信息进行解析,由此能够有效解析得到请求信息对应的业务类型和用户意图。服务器根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系,根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合;根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据,根据实体关系和链路关系生成包括关键实体和次实体的知识图谱数据,由此能够有效生成层次分明和清晰的知识图谱数据。服务器则将生成的知识图谱数据发送至终端,能够用户清晰明了地获取知识图谱数据对应的内容,有效提高了知识图谱数据的处理效率和利用率。
在一个实施例中,接收终端发送的资源获取请求之前,还包括:获取多个业务数据和关联数据,业务数据和关联数据包括属性信息;根据属性信息分析多个业务数据和关联数据对应的多个实体元素以及实体关系,根据属性信息和实体关系计算实体权重和关系权重;根据实体权重和关系权重计算实体元素之间的连接关系;根据实体关系和连接关系将多个实体元素生成实体集合,实体集合中包括多个实体元素和对应的属性信息;将实体集合根据图谱结构集成至知识图谱库中。
服务器在接收终端的资源获取请求之前,还可以预先构建知识图谱库,用以存储多个业务类型的实体关联数据等。其中,知识图谱库中存储的实体关联数据可以为结构化的数据源,也可以是非结构化的数据源,还可以是半结构化的数据源。
服务器可以从本地数据库或第三方数据库中获取大量的业务数据以及业务数据的关联数据。业务数据和关联数据均包括了属性信息。服务器则分析业务数据和关联数据的关系网络。具体地,服务器可以获取关系分析模型,将获取的业务数据和关联数据输入至关系分析模型中进行关系分析。其中,服务器根据属性信息分析多个业务数据以及关联数据对应的多个实体元素和实体关系,并根据属性信息和实体关系计算实体权重和关系权重。服务器根据实体权重和关系权重计算实体之间的连接关系,并根据实体关系和连接关系将多个实体元素生成实体集合,实体集合中包括多个实体元素和对应的属性信息。服务器进而根据预先配置的图谱结构将实体集合中的信息集成至知识图谱库中。由此能够有效构建图谱结构化的知识图谱库,使得服务器能够快速有效地从知识图谱库获取图谱结构化的知识图谱数据。
在一个实施例中,对请求信息进行解析,得到请求信息对应的业务类型和用户意图的步骤包括:对请求信息进行分词,得到对应的文本词向量;计算多个文本词向量的实体特征,根据实体特征提取请求信息中的实体关键词,根据实体关键词确定请求信息中的实体信息;根据文本向量和实体关键词对请求信息进行意图分类,计算请求信息的用户意图,根据用户意图确定请求信息的业务类型。
服务器接收终端发送的资源获取请求后,对资源获取请求携带的请求信息进行解析。具体地,服务器可以通过意图识别模型对文本信息进行实体识别和实体抽取。服务器可以首先对请求信息进行分词和特征提取,提取出多个文本词对应的文本词向量。服务器进而计算多个文本词向量的实体特征,根据实体特征提取请求信息中的实体关键词,将实体关键词和对应的实体特征类别确定为请求信息的实体信息。
在其中一个实施例中,服务器还可以预先业务类型对应的配置实体定义表,实体定义表中存储了业务类型所需的多种实体信息,实体定义表中的实体信息可以仅为实体特征类别。服务器可以将请求信息中的多个文本词与实体定义表中定义的多种实体信息进行匹配,根据匹配结果提取出请求信息中的实体特征类别,进而根据请求信息的上下文信息识别实体特征类别对应的实体关键词,利用实体特征类别和对应的实体关键词得到请求信息对应的实体信息。
服务器提取出请求信息中的实体信息后,进一步通过意图识别模型根据实体信息识别请求信息对应的用户意图。具体地,服务器根据实体特征和文本向量对请求信息进行意图分类,计算文本向量对应多个意图类别的概率。服务器将概率值最大的意图类别确定为目标意图类别,进而根据目标意图类别确定请求信息的用户意图。从而根据意图类别确定请求信息的用户意图,并根据用户意图匹配相应的业务类型,例如可以根据请求信息中的实体信息匹配相应的业务类型,并根据用户意图确定相匹配的业务类型中的目标业务类型,如相匹配的业务类型有多个时,则根据用户意图确认最匹配的业务类型。由此能够快速有效地识别出用户终端发送的请求信息的用户意图和业务类型。
在一个实施例中,如图5所示,根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系的步骤,具体包括以下内容:
步骤502,根据用户意图分析对应的推测链路。
步骤504,根据用户意图从知识图谱库中获取实体列表,根据推测链路从知识图谱库中获取关联实体列表,实体关系列表和关联实体列表包括多个实体元素的属性信息和连接关系。
步骤506,根据用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系。
服务器接收终端发送的资源获取请求后,对资源获取请求携带的请求信息进行解析,得到请求信息对应的业务类型和用户意图,服务器则根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据。
具体地,服务器还可以根据用户意图分析出推测链路,推测链路可以为用户意图对应的关系分析网。例如,推测链路可以包括推测实体、推测关系等用户意图对应的关联信息,如服务器可以采用类型推理和模式归纳等方式确定推理链路,以通过推测链路可以分析出用户意图对应的关联实体信息。服务器进而根据用户意图和推测链路从知识图谱库获取对应的实体列表,实体列表中包括实体元素和属性信息以及实体元素之间的连接关系。服务器进而根据连接关系获取相邻的关联实体和相应的连接关系,并利用关联实体和相应的连接关系生成关联实体列表。关联实体数据则包括实体列表和关联实体列表,实体列表和关联实体列表中包括多个实体元素以及实体元素的属性信息和实体元素之间的连接关系。其中,由于关联实体数据是从知识图谱库中获取的知识图谱结构的数据,获取的实体元素则包括预先分析并配置的实体属性信息和实体连接关系。
服务器获取实体列表和关联实体列表后,则可以进一步根据用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系。具体地,服务器可以根据用户意图和属性信息确定多个实体元素之间的实体关系,根据用户意图和连接关系确定多个实体元素之间的链路关系。由此能够有效地获取用户意图对应的知识图谱结构的关联实体数据,并能够快速有效地分析出实体元素之间的实体关系和链路关系。
在一个实施例中,根据用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系的步骤包括:根据用户意图计算所述实体列表和关联实体列表中多个实体元素的实体权重;根据实体权重和属性信息确定多个实体元素之间的实体关系;根据实体权重和连接关系确定多个实体元素之间的链路关系。
服务器接收终端发送的资源获取请求后,对资源获取请求携带的请求信息进行解析,得到请求信息对应的业务类型和用户意图,并根据用户意图分析相应的推测链路。服务器进而根据用户意图从知识图谱库中获取实体列表,根据推测链路从知识图谱库中获取关联实体列表,实体关系列表和关联实体列表包括多个实体元素的属性信息和连接关系。
服务器进而根据用户意图计算实体列表和关联实体列表中多个实体元素的实体权重,具体地,服务器可以计算实体列表和关联实体列表中多个实体元素与用户意图的相似度,根据相似度确定每个实体元素的实体权重,例如可以通过预设的相似度距离算法计算多个实体元素与用户意图的相似度距离,根据相似度距离确定每个实体元素的实体权重。
服务器进而根据实体权重和实体元素的属性信息确定多个实体元素之间的实体关系,并根据实体权重和连接关系确定多个实体元素之间的链路关系。由此能够有效地从知识图谱库中获取用户意图对应的实体列表和关联实体列表数据,并且能够有效地分析出多个实体元素之间的实体关系和链路关系。
在一个实施例中,如图6所示,根据关键实体节点和次实体节点将关联实体数据分别生成关键实体集合和次实体集合的步骤,具体包括以下内容:
步骤602,根据用户意图和实体权重确定关键实体元素。
步骤604,根据关键实体元素确定关键实体节点和次实体节点。
步骤606,利用关键实体节点对应的实体元素以及属性信息生成关键实体集合。
步骤608,利用次实体节点对应的实体元素以及属性信息生成次实体集合。
服务器根据用户意图和推理链路从知识图谱库中获取实体列表和关联实体列表后,根据用户意图计算实体列表和关联实体列表中多个实体元素的实体权重,根据实体权重和实体元素的属性信息确定多个实体元素之间的实体关系,并根据实体权重和连接关系确定多个实体元素之间的链路关系。
服务器进而根据用户意图和实体权重确定实体列表和关联实体列表中的关键实体元素,例如关键实体可以为用户意图对应的直接目标实体元素以及实体权重值较大的实体元素。例如,若用户终端发送的请求信息为“清华大学坐落于哪里?”,服务器则可以温习出用户意图为“清华大学的位置”,其中包括的实体则包括“清华大学”和“清华大学的位置”,推测链路则可以包括“校长”、“隶属部门”等推测关系信息。其中的关键实体节点可以为“清华大学”和“清华大学的位置”,“校长”、“隶属部门”等对应的推测实体则可以为次实体节点。
服务器确定出实体列表和关联实体列表中的关键实体元素后,由此可以根据关键实体元素确定出非关键实体元素,即非关键实体元素可以为次实体元素,例如可以将实体列表和关联实体列表中除关键实体元素之外的实体元素确定为次实体元素。服务器则可以根据关键实体元素和次实体元素确定关键实体节点和次实体节点。服务器进而将关键实体节点对应的实体元素和属性信息生成关键实体集合,将次实体节点对应的实体元素和属性信息生成次实体集合。由此能够有效地根据用户意图和实体权重分别生成关键实体集合和次实体集合,从而能够有效地突出重点的实体元素信息。
在一个实施例中,如图7所示,根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据的步骤,具体包括以下内容:
步骤702,根据链路关系确定关键实体集合和次实体集合中实体元素的关系路径。
步骤704,通过图谱渲染组件根据关系路径分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染。
步骤706,根据关系路径和实体关系对关键实体集合和次实体集合进行连接渲染。
步骤708,利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据。
其中,服务器可以预先构建图谱渲染组件,用于将关键实体集合和次实体集合的多个节点元素集成为对应的知识图谱数据。图谱渲染组件可以为基于弹簧能量模型的知识图谱渲染模型。
服务器对终端发送的的请求信息进行解析得到对应的业务类型和用户意图,根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据后,确定关联实体数据中多个实体的实体关系和链路关系。服务器根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合。服务器进而根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据。
具体地,服务器根据链路关系确定关键实体集合和次实体集合中各个实体元素之间的关系路径,其中,不同实体元素之间的关系路径可能也不同,实体元素之间的关系路径的大小由链路关系和实体关系决定,例如每个实体元素的重要程度可能不同,服务器则可以根据链路关系将实体元素按照重要程度确定关系路径的比例,从而确定出多个实体元素之间的关系路径。
服务器进而通过图谱渲染组件根据关系路径分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染,服务器可以将实体元素和次实体集合中的每个实体元素根据集合映射关系渲染为对应的实体节点。例如,集合映射关系可以为三元组映射关系,其中,三元组可以包括实体、属性和关系。其中,关键实体可以为展示的关键实体节点和关键关系的实体信息。
服务器通过图谱渲染组件分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染后,进一步通过图谱渲染组件根据关系路径和实体关系对关键实体集合和次实体集合进行连接渲染,从而将关键实体集合和次实体集合中的实体元素全部连接起来,从而利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据,从而有效生成包括关键实体和次实体的知识图谱。
在一个实施例中,通过图谱渲染组件根据关系路径分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染包括:根据每个实体元素的实体权重计算实体元素的实体节点半径;根据实体节点半径对实体元素进行节点渲染。
服务器根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合后,服务器进而根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据。
具体地,服务器还可以根据用户意图计算每个实体元素的实体权重,进而根据每个实体元素的实体权重计算实体元素的实体节点半径,实体节点半径可以用于表示实体节点的大小。例如,关键实体节点可以用较大的实体节点半径进行渲染,次实体节点可以用中等大小的实体节点半径进行渲染,次实体集合中包含的多个实体元素则可以用较小的实体节点半径进行渲染,以根据每个实体节点的重要程度显示不同大小的实体节点。
服务器进而根据实体节点半径对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染,根据关系路径和实体关系对关键实体集合和次实体集合进行连接渲染,并将关键实体集合和次实体集合中的实体元素全部连接起来。从而利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据,从而有效生成包括关键实体和次实体的知识图谱。通过根据实体权重分别确定每个实体元素的实体节点半径,由此能够有效地根据实体权重展示出不同大小的实体节点,进而能够清晰有效地展示出不同重要程度的实体元素信息。
在一个实施例中,利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据包括:对次实体集合对应的实体元素节点进行隐藏处理,对相应的次实体节点添加隐藏标签;隐藏标签用于指示终端通过触发所述隐藏标签后显示相应的次实体集合对应的实体元素;利用渲染后的关键实体集合和隐藏处理后和次实体集合生成对应的知识图谱数据。
服务器根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合后,服务器进而根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染。
具体地,服务器通过图谱渲染组件分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染,进一步通过图谱渲染组件根据关系路径和实体关系对关键实体集合和次实体集合进行连接渲染,从而将关键实体集合和次实体集合中的实体元素全部连接起来,从而利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据。服务器在集成对应的知识图谱的过程中,还可以对次实体集合对应的实体元素节点进行隐藏处理,例如服务器可以将次实体集合中的实体元素隐藏存储至次实体集合对应的次实体节点中,并对相应的次实体节点添加隐藏标签,进而利用渲染后的关键实体集合和隐藏处理后和次实体集合生成对应的知识图谱数据,从而有效生成包括关键实体和次实体的知识图谱。由此用户终端获取知识图谱数据后可以通过点击操作或触控操作等触发隐藏标签,从而可以展示次实体集合中隐藏的实体元素信息。通过对非关键实体集合中的实体元素进行隐藏处理,能够清晰有效地展示出关键的实体元素信息,使得用户能够首先获取关键的用户意图对应的信息。
应该理解的是,虽然图2、5-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、5-7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种基于知识图谱的数据处理装置,包括:请求接收模块802、信息解析模块804、关系分析模块806、图谱生成模块708和数据发送模块810,其中:
请求接收模块802,用于接收终端发送的资源获取请求,资源获取请求包括请求信息;
信息解析模块804,用于对请求信息进行解析,得到请求信息对应的业务类型和用户意图;
关系分析模块806,用于根据业务类型从对应的知识图谱库中获取用户意图对应的关联实体数据,确定关联实体数据中多个实体的实体关系和链路关系;根据用户意图和实体关系确定关键实体节点和次实体节点,根据关键实体节点和次实体节点将关联实体数据生成关键实体集合和次实体集合;
图谱生成模块808,用于根据实体关系和链路关系调用图谱渲染组件对关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;
数据发送模块810,用于将知识图谱数据发送至终端并进行展示。
在一个实施例中,该装置还包括知识图谱库构建模块,用于获取多个业务数据和关联数据,业务数据和关联数据包括属性信息;根据属性信息分析多个业务数据和关联数据对应的多个实体元素以及实体关系,根据属性信息和实体关系计算实体权重和关系权重;根据实体权重和关系权重计算实体元素之间的连接关系;根据实体关系和连接关系将多个实体元素生成实体集合,实体集合中包括多个实体元素和对应的属性信息;将实体集合根据图谱结构集成至知识图谱库中。
在一个实施例中,信息解析模块804还用于对请求信息进行分词,得到对应的文本词向量;计算多个文本词向量的实体特征,根据实体特征提取请求信息中的实体关键词,根据实体关键词确定请求信息中的实体信息;根据文本向量和实体关键词对请求信息进行意图分类,计算请求信息的用户意图,根据用户意图确定请求信息的业务类型。
在一个实施例中,关系分析模块806还用于根据用户意图分析对应的推测链路;根据用户意图从知识图谱库中获取实体列表,根据推测链路从知识图谱库中获取关联实体列表,实体关系列表和关联实体列表包括多个实体元素的属性信息和连接关系;根据用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系。
在一个实施例中,关系分析模块806还用于根据用户意图计算实体列表和关联实体列表中多个实体元素的实体权重;根据实体权重和属性信息确定多个实体元素之间的实体关系;根据实体权重和连接关系确定多个实体元素之间的链路关系。
在一个实施例中,关系分析模块806还用于根据用户意图和实体权重确定关键实体元素;根据关键实体元素确定关键实体节点和次实体节点;利用关键实体节点对应的实体元素以及属性信息生成关键实体集合;利用次实体节点对应的实体元素以及属性信息生成次实体集合。
在一个实施例中,图谱生成模块808还用于根据实体关系和链路关系确定关键实体集合和次实体集合中实体元素的关系路径;通过图谱渲染组件根据关系路径分别对关键实体集合中的实体元素和次实体集合中的实体元素进行节点渲染;根据关系路径和实体关系对关键实体集合和次实体集合进行连接渲染;利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据。
在一个实施例中,图谱生成模块808还用于根据每个实体元素的实体权重计算实体元素的实体节点半径;根据实体节点半径对实体元素进行节点渲染。
在一个实施例中,图谱生成模块808还用于对次实体集合对应的实体元素节点进行隐藏处理,对相应的次实体节点添加隐藏标签;隐藏标签用于指示终端通过触发隐藏标签后显示相应的次实体集合对应的实体元素;利用渲染后的关键实体集合和隐藏处理后和次实体集合生成对应的知识图谱数据。
关于基于知识图谱的数据处理装置的具体限定可以参见上文中对于基于知识图谱的数据处理方法的限定,在此不再赘述。上述基于知识图谱的数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储请求信息,知识图谱库以及知识图谱数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现本申请任意一个实施例中提供的基于知识图谱的数据处理方法的步骤。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于知识图谱的数据处理方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种基于知识图谱的数据处理方法,所述方法包括:
接收终端发送的资源获取请求,所述资源获取请求包括请求信息;
对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图;
根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系;
根据所述用户意图和所述实体关系确定关键实体节点和次实体节点,根据所述关键实体节点和次实体节点将所述关联实体数据生成关键实体集合和次实体集合;
根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;
将所述知识图谱数据发送至所述终端并进行展示。
2.根据权利要求1所述的方法,其特征在于,所述接收终端发送的资源获取请求之前,还包括:
获取多个业务数据和关联数据,所述业务数据和关联数据包括属性信息;
根据所述属性信息分析多个业务数据和关联数据对应的多个实体元素以及实体关系,根据所述属性信息和实体关系计算实体权重和关系权重;
根据所述实体权重和关系权重计算实体元素之间的连接关系;
根据所述实体关系和连接关系将多个实体元素生成实体集合,实体集合中包括多个实体元素和对应的属性信息;
将所述实体集合根据图谱结构集成至知识图谱库中。
3.根据权利要求1所述的方法,其特征在于,所述对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图包括:
对所述请求信息进行分词,得到对应的文本词向量;
计算多个文本词向量的实体特征,根据所述实体特征提取所述请求信息中的实体关键词,根据所述实体关键词确定所述请求信息中的实体信息;
根据所述文本向量和所述实体关键词对所述请求信息进行意图分类,计算所述请求信息的用户意图,根据所述用户意图确定所述请求信息的业务类型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系包括:
根据所述用户意图分析对应的推测链路;
根据所述用户意图从知识图谱库中获取实体列表,根据所述推测链路从所述知识图谱库中获取关联实体列表,所述实体关系列表和关联实体列表包括多个实体元素的属性信息和连接关系;
根据所述用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户意图、属性信息和连接关系确定多个实体元素之间的实体关系和链路关系包括:
根据所述用户意图计算所述实体列表和关联实体列表中多个实体元素的实体权重;
根据所述实体权重和属性信息确定多个实体元素之间的实体关系;
根据所述实体权重和连接关系确定多个实体元素之间的链路关系。
6.根据权利要求5所述的方法,其特征在于,所述根据所述关键实体节点和次实体节点将所述关联实体数据分别生成关键实体集合和次实体集合包括:
根据所述用户意图和所述实体权重确定关键实体元素;
根据所述关键实体元素确定关键实体节点和次实体节点;
利用所述关键实体节点对应的实体元素以及属性信息生成关键实体集合;
利用所述次实体节点对应的实体元素以及属性信息生成次实体集合。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据包括:
根据所述实体关系和所述链路关系确定所述关键实体集合和次实体集合中实体元素的关系路径;
通过图谱渲染组件根据关系路径分别对所述关键实体集合中的实体元素和所述次实体集合中的实体元素进行节点渲染;
根据所述关系路径和所述实体关系对关键实体集合和次实体集合进行连接渲染;
利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据。
8.根据权利要求7所述的方法,其特征在于,所述通过图谱渲染组件根据关系路径分别对所述关键实体集合中的实体元素和所述次实体集合中的实体元素进行节点渲染包括:
根据每个实体元素的实体权重计算实体元素的实体节点半径;
根据所述实体节点半径对实体元素进行节点渲染。
9.根据权利要求7所述的方法,其特征在于,所述利用渲染后的关键实体集合和次实体集合生成对应的知识图谱数据包括:
对所述次实体集合对应的实体元素节点进行隐藏处理,对相应的次实体节点添加隐藏标签;所述隐藏标签用于指示终端通过触发所述隐藏标签后显示相应的次实体集合对应的实体元素;
利用渲染后的关键实体集合和隐藏处理后和次实体集合生成对应的知识图谱数据。
10.一种基于知识图谱的数据处理装置,所述装置包括:
请求接收模块,用于接收终端发送的资源获取请求,所述资源获取请求包括请求信息;
信息解析模块,用于对所述请求信息进行解析,得到所述请求信息对应的业务类型和用户意图;
关系分析模块,用于根据所述业务类型从对应的知识图谱库中获取所述用户意图对应的关联实体数据,确定所述关联实体数据中多个实体的实体关系和链路关系;根据所述用户意图和所述实体关系确定关键实体节点和次实体节点,根据所述关键实体节点和次实体节点将所述关联实体数据生成关键实体集合和次实体集合;
图谱生成模块,用于根据所述实体关系和所述链路关系调用图谱渲染组件对所述关键实体集合和次实体集合的实体元素进行渲染,利用渲染后的实体集合生成知识图谱数据;
数据发送模块,用于将所述知识图谱数据发送至所述终端并进行展示。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
CN201911213438.7A 2019-12-02 2019-12-02 基于知识图谱的数据处理方法、装置和计算机设备 Active CN111061859B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911213438.7A CN111061859B (zh) 2019-12-02 2019-12-02 基于知识图谱的数据处理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911213438.7A CN111061859B (zh) 2019-12-02 2019-12-02 基于知识图谱的数据处理方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111061859A true CN111061859A (zh) 2020-04-24
CN111061859B CN111061859B (zh) 2023-09-12

Family

ID=70299275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911213438.7A Active CN111061859B (zh) 2019-12-02 2019-12-02 基于知识图谱的数据处理方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111061859B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752943A (zh) * 2020-05-19 2020-10-09 北京网思科平科技有限公司 一种图谱关系路径定位方法和系统
CN111782823A (zh) * 2020-07-30 2020-10-16 国网江苏省电力有限公司南通供电分公司 知识图谱在违章大数据分析中的应用
CN111782710A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 数据存储方法、装置、计算设备和介质
CN111932131A (zh) * 2020-08-12 2020-11-13 上海冰鉴信息科技有限公司 业务数据处理方法及装置
CN111930967A (zh) * 2020-10-13 2020-11-13 北京泰迪熊移动科技有限公司 一种基于知识图谱的数据查询方法、装置及存储介质
CN112153142A (zh) * 2020-09-24 2020-12-29 施耐德电气(中国)有限公司 数据交互方法和装置
CN112347204A (zh) * 2021-01-08 2021-02-09 药渡经纬信息科技(北京)有限公司 药物研发知识库构建方法及装置
CN112434188A (zh) * 2020-10-23 2021-03-02 杭州未名信科科技有限公司 一种异构数据库的数据集成方法、装置及存储介质
CN113486124A (zh) * 2021-05-24 2021-10-08 山东佳联电子商务有限公司 一种基于pca与知识图谱技术的银行不良资产经营管理系统、方法、设备及存储介质
CN113792137A (zh) * 2021-08-26 2021-12-14 广州云徙科技有限公司 一种中台研发物料检索方法、系统、智能终端和存储介质
CN111858966B (zh) * 2020-08-05 2021-12-31 龙马智芯(珠海横琴)科技有限公司 知识图谱的更新方法、装置、终端设备及可读存储介质
CN114168756A (zh) * 2022-01-29 2022-03-11 浙江口碑网络技术有限公司 搜索意图的查询理解方法和装置,存储介质和电子设备
CN114721833A (zh) * 2022-05-17 2022-07-08 中诚华隆计算机技术有限公司 一种基于平台业务类型的智能云端协调方法和装置
CN117033669A (zh) * 2023-10-08 2023-11-10 之江实验室 一种基于知识图谱的分析系统生成方法、装置及电子设备
WO2023216671A1 (zh) * 2022-05-07 2023-11-16 北京金堤科技有限公司 图谱展示方法、装置、存储介质及电子设备
WO2023246165A1 (zh) * 2022-06-24 2023-12-28 华为云计算技术有限公司 数据资产展示方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268582A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 信息查询方法及装置
CN108920497A (zh) * 2018-05-23 2018-11-30 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN110019836A (zh) * 2017-08-23 2019-07-16 中兴通讯股份有限公司 一种智能问答方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268582A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 信息查询方法及装置
CN110019836A (zh) * 2017-08-23 2019-07-16 中兴通讯股份有限公司 一种智能问答方法及装置
CN108920497A (zh) * 2018-05-23 2018-11-30 北京奇艺世纪科技有限公司 一种人机交互方法及装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752943A (zh) * 2020-05-19 2020-10-09 北京网思科平科技有限公司 一种图谱关系路径定位方法和系统
CN111782710A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 数据存储方法、装置、计算设备和介质
CN111782710B (zh) * 2020-06-30 2023-07-25 北京百度网讯科技有限公司 数据存储方法、装置、计算设备和介质
CN111782823A (zh) * 2020-07-30 2020-10-16 国网江苏省电力有限公司南通供电分公司 知识图谱在违章大数据分析中的应用
CN111858966B (zh) * 2020-08-05 2021-12-31 龙马智芯(珠海横琴)科技有限公司 知识图谱的更新方法、装置、终端设备及可读存储介质
CN111932131A (zh) * 2020-08-12 2020-11-13 上海冰鉴信息科技有限公司 业务数据处理方法及装置
CN111932131B (zh) * 2020-08-12 2024-03-15 上海冰鉴信息科技有限公司 业务数据处理方法及装置
CN112153142A (zh) * 2020-09-24 2020-12-29 施耐德电气(中国)有限公司 数据交互方法和装置
CN112153142B (zh) * 2020-09-24 2023-04-18 施耐德电气(中国)有限公司 数据交互方法和装置
CN111930967B (zh) * 2020-10-13 2021-02-09 北京泰迪熊移动科技有限公司 一种基于知识图谱的数据查询方法、装置及存储介质
CN111930967A (zh) * 2020-10-13 2020-11-13 北京泰迪熊移动科技有限公司 一种基于知识图谱的数据查询方法、装置及存储介质
CN112434188A (zh) * 2020-10-23 2021-03-02 杭州未名信科科技有限公司 一种异构数据库的数据集成方法、装置及存储介质
CN112434188B (zh) * 2020-10-23 2023-09-05 杭州未名信科科技有限公司 一种异构数据库的数据集成方法、装置及存储介质
CN112347204A (zh) * 2021-01-08 2021-02-09 药渡经纬信息科技(北京)有限公司 药物研发知识库构建方法及装置
CN113486124B (zh) * 2021-05-24 2022-02-11 山东佳联电子商务有限公司 一种基于pca与知识图谱技术的银行不良资产经营管理系统、方法、设备及存储介质
CN113486124A (zh) * 2021-05-24 2021-10-08 山东佳联电子商务有限公司 一种基于pca与知识图谱技术的银行不良资产经营管理系统、方法、设备及存储介质
CN113792137B (zh) * 2021-08-26 2023-06-09 广东云徙智能科技有限公司 一种中台研发物料检索方法、系统、智能终端和存储介质
CN113792137A (zh) * 2021-08-26 2021-12-14 广州云徙科技有限公司 一种中台研发物料检索方法、系统、智能终端和存储介质
CN114168756B (zh) * 2022-01-29 2022-05-13 浙江口碑网络技术有限公司 搜索意图的查询理解方法和装置,存储介质和电子设备
CN114168756A (zh) * 2022-01-29 2022-03-11 浙江口碑网络技术有限公司 搜索意图的查询理解方法和装置,存储介质和电子设备
WO2023216671A1 (zh) * 2022-05-07 2023-11-16 北京金堤科技有限公司 图谱展示方法、装置、存储介质及电子设备
CN114721833A (zh) * 2022-05-17 2022-07-08 中诚华隆计算机技术有限公司 一种基于平台业务类型的智能云端协调方法和装置
WO2023246165A1 (zh) * 2022-06-24 2023-12-28 华为云计算技术有限公司 数据资产展示方法、装置、设备及存储介质
CN117033669A (zh) * 2023-10-08 2023-11-10 之江实验室 一种基于知识图谱的分析系统生成方法、装置及电子设备
CN117033669B (zh) * 2023-10-08 2024-01-09 之江实验室 一种基于知识图谱的分析系统生成方法、装置及电子设备

Also Published As

Publication number Publication date
CN111061859B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN111061859B (zh) 基于知识图谱的数据处理方法、装置和计算机设备
WO2021004333A1 (zh) 基于知识图谱的事件处理方法、装置、设备和存储介质
US11669579B2 (en) Method and apparatus for providing search results
CN110457431B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
US10565523B2 (en) Security classification by machine learning
EP3855324A1 (en) Associative recommendation method and apparatus, computer device, and storage medium
US9158773B2 (en) Partial and parallel pipeline processing in a deep question answering system
US9754215B2 (en) Question classification and feature mapping in a deep question answering system
US9268767B2 (en) Semantic-based search system and search method thereof
CN111666401B (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
US20140172878A1 (en) Intelligent evidence classification and notification in a deep question answering system
US10956469B2 (en) System and method for metadata correlation using natural language processing
CN111192025A (zh) 职业信息匹配方法、装置、计算机设备和存储介质
CN111177405A (zh) 数据搜索匹配方法、装置、计算机设备和存储介质
CN111782824B (zh) 信息查询方法、装置、系统和介质
CN110399448B (zh) 中文地名地址搜索匹配方法、终端、计算机可读存储介质
CN109886719B (zh) 基于网格的数据挖掘处理方法、装置和计算机设备
US10228917B2 (en) Mapping of software code via user interface summarization
CN110532229B (zh) 证据文件检索方法、装置、计算机设备和存储介质
CN110737824A (zh) 内容查询方法和装置
CN111428009B (zh) 关系查询方法、装置、计算机设备和存储介质
CN116955856A (zh) 信息展示方法、装置、电子设备以及存储介质
CN116597443A (zh) 素材标签处理方法、装置、电子设备及介质
CN116594683A (zh) 一种代码注释信息生成方法、装置、设备及存储介质
US20200110769A1 (en) Machine learning (ml) based expansion of a data set

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant