CN112015914B - 一种基于深度学习的知识图谱搜索路径方法 - Google Patents

一种基于深度学习的知识图谱搜索路径方法 Download PDF

Info

Publication number
CN112015914B
CN112015914B CN202010891671.7A CN202010891671A CN112015914B CN 112015914 B CN112015914 B CN 112015914B CN 202010891671 A CN202010891671 A CN 202010891671A CN 112015914 B CN112015914 B CN 112015914B
Authority
CN
China
Prior art keywords
path
search
knowledge graph
search path
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010891671.7A
Other languages
English (en)
Other versions
CN112015914A (zh
Inventor
王鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Original Assignee
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd filed Critical Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority to CN202010891671.7A priority Critical patent/CN112015914B/zh
Publication of CN112015914A publication Critical patent/CN112015914A/zh
Application granted granted Critical
Publication of CN112015914B publication Critical patent/CN112015914B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Abstract

本发明公开了一种基于深度学习的知识图谱搜索路径方法,用于解决现有知识图谱搜索路径获取方法检索出的搜索路径过多、不准确的问题。所述方法包括:获取用户输入的关键词;在已构建的知识图谱图中,根据所述关键词获取多个搜索路径;根据预设路径长度算法计算所述每个搜索路径的长度;根据每个搜索路径的长度及预设可靠性算法,计算获取每个搜索路径的可靠性;将可靠性最高的搜索路径作为默认搜索路径提供给用户。该方法通过计算每个搜索路径的长度和可靠性,然后将可靠性最高的搜索路径作为默认搜索路径提供给用户,达到了提高用户体验感的目的。

Description

一种基于深度学习的知识图谱搜索路径方法
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种基于深度学习的知识图谱搜索路径方法。
背景技术
随着应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法快速发展,知识图谱数量也在爆发式的增加,知识图谱之间的关联性也越来越大。在知识图谱搜索过程中,搜索引擎往往采用关键词直接搜索、语义搜索、语境搜索等方式将搜索到的知识图谱展示给用户,但是往往展示出来的知识图谱多且还不是用户需要的,给用户带来了极差的体验。为了提升用户的体验,目前搜索引擎采用了根据用户输入的关键词生成搜索路径,用户可以使用此搜索路径,快速的获取到想要的知识图谱。但是,由于目前知识图谱量大而且关联性也强,使得生成的搜索路径条数比较多,甚至有些搜索路径还与用户输入的关键词不太相关,导致用户需要花大量的时间来排除不相关的搜索路径。因此急需一种知识图谱搜索路径获取方法,能将与用户输入的关键词密切相关的搜索路径提供给用户。
发明内容
本发明提供一种基于深度学习的知识图谱搜索路径方法,用于解决现有知识图谱搜索路径获取方法检索出的搜索路径过多、不准确的问题。本方明提供的一种基于深度学习的知识图谱搜索路径方法,通过计算每条搜索路径的长度和可靠性,然后将可靠性最高的搜索路径作为默认搜索路径提供给用户,达到了提高用户体验感的目的。
本发明提供一种基于深度学习的知识图谱搜索路径方法,包括以下步骤:
获取用户输入的关键词;
在已构建的知识图谱图中,根据所述关键词获取多个搜索路径;
根据预设路径长度算法计算所述每个搜索路径的长度;
根据每个搜索路径的长度及预设可靠性算法,计算获取每个搜索路径的可靠性;
将可靠性最高的搜索路径作为默认搜索路径提供给用户。
在一个实施例中,在所述获取用户输入的关键词之前,还包括:
将关联的知识图谱进行连接,生成知识图谱网络;
将所述知识图谱网络放入二维坐标系中,为其中的每个知识图谱分配二维坐标值。
在一个实施例中,所述预设路径长度算法为:
Figure BDA0002657220110000021
其中,Sj为第j个搜索路径的路径长度,m表示所述第j个搜索路径包括的路段总数量,i=1,2,…,m;xik,yik分别为所述第j个搜索路径中第i路段最后一个知识图谱的横坐标值和纵坐标值;xi,yi分别为所述第j个搜索路径中第i路段第一个知识图谱的横坐标值和纵坐标值。
在一个实施例中,所述预设可靠性算法为:
Figure BDA0002657220110000022
其中,Nj为第j个搜索路径的可靠性,S1为所述关键词在所述已构建的知识图谱图中的期望路径长度,n为所述关键词在所述已构建的知识图谱图中期望路径的总数量,ω为可靠性评价系数;S1,n,ω的值均为预设定值。
在一个实施例中,取值范围为[0.1,0.5]。
在一个实施例中,所述在已构建的知识图谱图中,根据所述关键词获取多个搜索路径,包括:
在已构建的知识图谱图中,采用关键词直接搜索、语义搜索、语境搜索中的任意一种或多种搜索方式获取搜索路径。
本发明提供一种基于深度学习的知识图谱搜索路径方法,先构建知识图谱,然后获取用户输入的关键词,并根据此关键词在知识图谱中对应获取多个搜索路径,获取的多个搜索路径均与关键词相关联,每个搜索路径都包括路径起点与路径终点,并对应生成坐标点,结合搜索路径的路径起点与路径终点并通过预设路径长度算法能够计算每个搜索路径对应的路径长度,然后通过预设可靠性算法进一步计算搜索路径的可靠性,搜索路径可靠性越高,搜索准确性越高,最后筛选出可靠性最高的搜索路径,并将可靠性最高的搜索路径设置为默认搜索路径,用户搜索时直接用默认搜索路径进行搜索,可靠性最高,且默认搜索路径涉及范围广,使得搜索更加全面,进一步提高了搜索结果与关键词的匹配度,也增强了搜索结果的可信度与搜索结果的准确度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于深度学习的知识图谱搜索路径方法实施例一的流程图;
图2为本发明实施例中一种基于深度学习的知识图谱搜索路径方法实施例二的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例中一种基于深度学习的知识图谱搜索路径方法实施例一流程图。如图1所示,该方法包括以下步骤S101-S105:
S101:获取用户输入的关键词;
本实施例中,获取用户输入的关键词方式较多,可以通过知识图谱搜索引擎的输入框,获取用户输入的关键词。
S102:在已构建的知识图谱图中,根据所述关键词获取多个搜索路径;
本实施例中,可以在已构建的知识图谱图中,采用关键词直接搜索、语义搜索、语境搜索中的任意一种或多种搜索方式获取搜索路径,其中所述路径中每个知识图谱都与关键词相关联;搜索路径是指用户为了获得想要的知识图谱所经历的搜索过程。
S103:根据预设路径长度算法计算所述每个搜索路径的长度;
本实施例中,搜索路径上的节点即为一个知识图谱,当搜索路径越长,也客观的体现了在路径上的知识图谱越多,使得搜索更加全面。
S104:根据每个搜索路径的长度及预设可靠性算法,计算获取每个搜索路径的可靠性;
本实施例中,搜索路径可靠性越高,能客观的体现对应的搜索路径准确性越高,继而将可靠性最高的搜索路径提供给用户,将最大程度减少用户搜索目标知识图谱时间,达到提升用户的体验感的目的。
S105:将可靠性最高的搜索路径作为默认搜索路径提供给用户。
本发明实施例提供的一种基于深度学习的知识图谱搜索路径方法,先获取用户输入的关键词,并根据获取的关键词在知识图谱中对应获取多个搜索路径,获取的多个搜索路径均与关键词相关联,然后通过预设路径长度算法计算每个搜索路径对应的路径长度,接着通过预设可靠性算法进一步计算搜索路径的可靠性,因搜索路径可靠性越高,搜索准确性也就越高,最后筛选出可靠性最高的搜索路径,并将可靠性最高的搜索路径设置为默认搜索路径,用户搜索时直接用默认搜索路径进行搜索,可靠性最高,且默认搜索路径涉及范围广,使得搜索更加全面,进一步提高了搜索结果与关键词的匹配度,也增强了搜索结果的可信度与搜索结果的准确度。
图2为本发明实施例中一种基于深度学习的知识图谱搜索路径方法实施例二流程图。如图2所示,该方法包括以下步骤:
S201:将关联的知识图谱进行连接,生成知识图谱网络;
S202:将所述知识图谱网络放入二维坐标系中,为其中的每个知识图谱分配二维坐标值;
本实施例中,每个知识图谱具有二维坐标值后,则可以通过对坐标值的一些简单数学计算就可以获得每条搜索路径的长度,计算简单方便。
S203:获取用户输入的关键词;
S204:在已构建的知识图谱图中,根据所述关键词获取多个搜索路径;
S205:根据预设路径长度算法计算所述每个搜索路径的长度;
本实施例中,所述预设路径长度算法为:
Figure BDA0002657220110000051
其中,Sj为第j个搜索路径的路径长度,m表示所述第j个搜索路径包括的路段总数量,i=1,2,…,m;例如,第j个搜索路径为知识图谱1→知识图谱2→知识图谱4→知识图谱5,则第j个搜索路径包括的路段可以为:知识图谱1→知识图谱2,知识图谱2→知识图谱4,知识图谱4→知识图谱5,共计3个路段;或者,也可以根据不同知识图谱连线斜率的相近性等其他预设分割方式对每个搜索路径的知识图谱进行分割,例如,第j个搜索路径为知识图谱1→知识图谱2→知识图谱4→知识图谱5,其中,在预设二维坐标系中,知识图谱1→知识图谱2的连线斜率为0.5,知识图谱2→知识图谱4的连线斜率为10,知识图谱4→知识图谱5的连线斜率为11,若预定分割规则为同一搜索路径上相邻两段知识图谱连线的斜率差异大于5时进行分割,则此时第j个搜索路径包括的路段可以为:知识图谱1→知识图谱2,知识图谱2→知识图谱5,共计2个路段。具体的路径分割规则根据需要由用户设置,此处不再赘述。
公式(1)中,xik,yik分别为所述第j个搜索路径中第i路段最后一个知识图谱的横坐标值和纵坐标值;xi,yi分别为所述第j个搜索路径中第i路段第一个知识图谱的横坐标值和纵坐标值。
S206:根据每个搜索路径的长度及预设可靠性算法,计算获取每个搜索路径的可靠性;
本实施例中,所述预设可靠性算法为:
Figure BDA0002657220110000061
其中,Nj为第j个搜索路径的可靠性,S1为所述关键词在所述已构建的知识图谱图中的期望路径长度,n为所述关键词在所述已构建的知识图谱图中期望路径的总数量,ω为可靠性评价系数;S1,n,ω的值均为预设定值,其中ω取值范围为[0.1,0.5]。
S207:将可靠性最高的搜索路径作为默认搜索路径提供给用户。
本发明实施例提供的一种基于深度学习的知识图谱搜索路径方法,每个搜索路径都包括路径起点与路径终点,根据路径起点知识图谱的坐标值及路径终点知识图谱的坐标值,即可快速的计算出路径长度,计算过程简单方便。然后根据每个搜索路径长度及预设可靠性算法,便可快速地计算出哪条搜索路径的可靠性最高,然后将可靠性最高的搜索路径提供的用户。使得本发明提供的基于深度学习的知识图谱搜索路径方法具有计算方式简单,计算效率快的优点。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (3)

1.一种基于深度学习的知识图谱搜索路径方法,其特征在于,包括:
获取用户输入的关键词;
在已构建的知识图谱图中,根据所述关键词获取多个搜索路径;
根据预设路径长度算法计算每个搜索路径的长度;
根据每个搜索路径的长度及预设可靠性算法,计算获取每个搜索路径的可靠性;
将可靠性最高的搜索路径作为默认搜索路径提供给用户;
其中,在所述获取用户输入的关键词之前,还包括:
将关联的知识图谱进行连接,生成知识图谱网络;
将所述知识图谱网络放入二维坐标系中,为其中的每个知识图谱分配二维坐标值;
其中,所述预设路径长度算法为:
Figure FDA0003065331960000011
其中,Sj为第j个搜索路径的路径长度,m表示所述第j个搜索路径包括的路段总数量,i=1,2,…,m;xik,yik分别为所述第j个搜索路径中第i路段最后一个知识图谱的横坐标值和纵坐标值;xi,yi分别为所述第j个搜索路径中第i路段第一个知识图谱的横坐标值和纵坐标值;
其中,所述预设可靠性算法为:
Figure FDA0003065331960000012
其中,Nj为第j个搜索路径的可靠性,S1为所述关键词在所述已构建的知识图谱图中的期望路径长度,n为所述关键词在所述已构建的知识图谱图中期望路径的总数量,ω为可靠性评价系数;S1,n,ω的值均为预设定值。
2.根据权利要求1所述的基于深度学习的知识图谱搜索路径方法,其特征在于,ω取值范围为[0.1,0.5]。
3.根据权利要求1-2项中任一项所述的基于深度学习的知识图谱搜索路径方法,其特征在于,所述在已构建的知识图谱图中,根据所述关键词获取多个搜索路径,包括:
在已构建的知识图谱图中,采用关键词直接搜索、语义搜索、语境搜索中的任意一种或多种搜索方式获取搜索路径。
CN202010891671.7A 2020-08-31 2020-08-31 一种基于深度学习的知识图谱搜索路径方法 Active CN112015914B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010891671.7A CN112015914B (zh) 2020-08-31 2020-08-31 一种基于深度学习的知识图谱搜索路径方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010891671.7A CN112015914B (zh) 2020-08-31 2020-08-31 一种基于深度学习的知识图谱搜索路径方法

Publications (2)

Publication Number Publication Date
CN112015914A CN112015914A (zh) 2020-12-01
CN112015914B true CN112015914B (zh) 2021-07-09

Family

ID=73502378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010891671.7A Active CN112015914B (zh) 2020-08-31 2020-08-31 一种基于深度学习的知识图谱搜索路径方法

Country Status (1)

Country Link
CN (1) CN112015914B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544106B (zh) * 2022-12-01 2023-02-28 云南电网有限责任公司信息中心 呼叫中心平台的内部事件检索方法、系统及计算机设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9772765B2 (en) * 2013-07-06 2017-09-26 International Business Machines Corporation User interface for recommended alternative search queries
US20170103337A1 (en) * 2015-10-08 2017-04-13 International Business Machines Corporation System and method to discover meaningful paths from linked open data
CN105550221B (zh) * 2015-12-04 2019-04-30 百度在线网络技术(北京)有限公司 信息搜索方法及装置
CN108287881A (zh) * 2017-12-29 2018-07-17 北京理工大学 一种基于随机游走关系发现的优化方法
CN109871417A (zh) * 2018-12-29 2019-06-11 国家开发银行 基于知识图谱的元数据可视化地图构建方法及系统
CN110837550B (zh) * 2019-11-11 2023-01-17 中山大学 基于知识图谱的问答方法、装置、电子设备及存储介质
CN111191042A (zh) * 2019-12-10 2020-05-22 同济大学 一种基于知识图谱路径语义关系的搜索准确性评价方法

Also Published As

Publication number Publication date
CN112015914A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
US10281284B2 (en) Hybrid road network and grid based spatial-temporal indexing under missing road links
CN106339510B (zh) 基于人工智能的点击预估方法及装置
CN112487168B (zh) 知识图谱的语义问答方法、装置、计算机设备及存储介质
WO2018227800A1 (zh) 一种神经网络训练方法及装置
US8250069B2 (en) Green's function formulations for pagerank algorithm using helmholtz wave equation representations of internet interactions
US20100063785A1 (en) Visualizing Relationships among Components Using Grouping Information
US20150339273A1 (en) Visualizing font similarities for browsing and navigation
CN108376164B (zh) 一种潜力主播的展示方法及装置
CN111651641B (zh) 一种图查询方法、装置及存储介质
US20190333256A1 (en) Methods and Systems For Simplified Graphical Depictions of Bipartite Graphs
US20110179013A1 (en) Search Log Online Analytic Processing
CN112015914B (zh) 一种基于深度学习的知识图谱搜索路径方法
JP5367632B2 (ja) 知識量推定装置及びプログラム
Song et al. Accurate and fast path computation on large urban road networks: A general approach
CN112015911B (zh) 一种海量知识图谱检索的方法
CN111645687A (zh) 变道策略确定方法、装置及存储介质
JP6854248B2 (ja) 境界探索テスト支援装置および境界探索テスト支援方法
Kels et al. Subdivision schemes of sets and the approximation of set-valued functions in the symmetric difference metric
US20160078651A1 (en) Proximity-Base Detail Reduction of Geographic Data
CN113568987B (zh) 知识图谱嵌入模型的训练方法、装置、计算机设备
Dehmer et al. Comparing large graphs efficiently by margins of feature vectors
JP2017167980A (ja) 特徴選択装置、特徴選択方法およびプログラム
JP2021026576A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN110909097A (zh) 多边形电子围栏生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20221020

Granted publication date: 20210709