CN116226541A - 一种基于知识图谱的网络热点信息推荐方法、系统及设备 - Google Patents

一种基于知识图谱的网络热点信息推荐方法、系统及设备 Download PDF

Info

Publication number
CN116226541A
CN116226541A CN202310528124.6A CN202310528124A CN116226541A CN 116226541 A CN116226541 A CN 116226541A CN 202310528124 A CN202310528124 A CN 202310528124A CN 116226541 A CN116226541 A CN 116226541A
Authority
CN
China
Prior art keywords
similarity
hot
event
hotspot
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310528124.6A
Other languages
English (en)
Other versions
CN116226541B (zh
Inventor
毛星亮
蒋政治
李琳
李芳芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN202310528124.6A priority Critical patent/CN116226541B/zh
Publication of CN116226541A publication Critical patent/CN116226541A/zh
Application granted granted Critical
Publication of CN116226541B publication Critical patent/CN116226541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网络信息技术领域,公开了一种基于知识图谱的网络热点信息推荐方法、系统及设备,该方法包括:获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;获取突发热点事件,并对突发热点事件进行关键词提取和知识抽取;根据突发热点事件和网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;根据评估得到的关键词相似度、实体属性相似度和关系相似度,进行热点事件及决策信息推荐。本发明实现了精准推荐突发网络热点事件的相似案例及决策信息,提高应对突发网络热点事件的能力的目的。

Description

一种基于知识图谱的网络热点信息推荐方法、系统及设备
技术领域
本发明涉及网络信息技术领域,尤其涉及一种基于知识图谱的网络热点信息推荐方法、系统及设备。
背景技术
市面上虽然有部分热点监测系统可以为用户进行热点事件推荐,但是市面上的热点监测系统,仅从关键词角度检索显示推荐结果,未能综合考虑诸多因素可能会对相似热点事件的推荐造成影响,从而容易导致推荐不准确的问题。此外,市面上的热点监测系统还缺乏应对突发网络热点事件进行决策信息推荐的问题。
目前也有部分基于知识图谱的热点事件推荐方法,但是目前的热点事件推荐方法,往往是从用户的历史点击行为、按照路径或者内容角度做出记录,不能及时精确地推送突发热点事件类似的案例,也不能为用户提供决策信息。
基于此,在面对突发热点事件时,如何准确地为用户推荐热点事件及决策信息依然是当前亟待解决的问题。
发明内容
基于此,本发明实施例提供一种基于知识图谱的网络热点信息推荐方法、系统及设备,旨在解决背景技术中的上述技术问题。
为解决上述问题,第一方面,本发明实施例提供了一种基于知识图谱的网络热点信息推荐方法,包括:
获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;
获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取;
根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;
根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
第二方面,本发明实施例还提供一种基于知识图谱的网络热点信息推荐系统,包括:
网络热点知识图谱构建模块,用于获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;
突发热点事件处理模块,用于获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取;
多维相似度评估模块,用于根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;
热点信息推荐模块,用于根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
第三方面,本发明实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的计算机可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读存储指令被所述处理器执行时实现上述第一方面的基于知识图谱的网络热点信息推荐方法。
本发明实施例提供的一种基于知识图谱的网络热点信息推荐方法、系统及设备,具有以下有益效果:
1)本发明实施例引入知识图谱到网络热点信息领域,借助知识图谱的优势对已发生热点事件及决策信息进行存储,相较于传统的热点事件存储模式,更有利于精确推送热点事件;
2)本发明实施例引入知识图谱中的实体、属性和关系,结合传统网络热点事件推荐方法中的关键词作为影响因素,相较于传统的热点事件推荐方法,热点事件推送更精确、更全面;
3)本发明实施例综合多维度的相似度进行热点事件及决策信息同步推荐,解决了当前市面上热点监测系统存在缺乏应对突发网络热点事件进行决策信息推荐的问题,提高了突发网络热点事件的应对能力和管理能力。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的一种基于知识图谱的网络热点信息推荐方法的流程图;
图2示出了本发明实施例所提供的网络热点知识图谱的示例图;
图3示出了本发明实施例所提供的一种基于知识图谱的网络热点信息推荐方法中步骤S10的流程图;
图4示出了本发明实施例所提供的一种基于知识图谱的网络热点信息推荐系统的结构示意图;
图5示出了本发明实施例所提供的一种计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
实施例1
如图1所示,本发明实施例所提供的一种基于知识图谱的网络热点信息推荐方法的流程图,该方法包括以下步骤:
S10,获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱。
具体的,在网络热点知识图谱构建过程中,首先从互联网收集相关热点事件及决策信息并存储在热点案例库中,然后从热点案例库中提取热点事件,对热点事件分别进行关键词提取和知识抽取后,通过三元组表示法构建网络热点知识图谱。其中,知识抽取包含实体、属性和关系抽取。
示例性的,如图2所示,构建的网络热点知识图谱以热点事件为主体,存在若干个实体以及与实体数目相同的关系,热点事件对应的决策信息将作为其中一个实体链接热点事件,其他实体一般为时间日期、人名和单位名称等,实体间的关系一般为时间、参与者和涉事单位等。
作为优选,如图3所示,所述步骤S10包括以下步骤:
S101,从互联网中收集已发生热点事件及对应的决策信息,存储至热点案例库中;
S102,从所述热点案例库中提取热点事件,通过关键词提取模型对所述热点事件进行关键词提取;
S103,通过联合抽取模型对所述热点事件进行实体、属性和关系抽取;
S104,将所述决策信息作为所述热点事件的实体,并结合提取的关键词和抽取的实体、属性和关系,通过知识图谱工具构建网络热点知识图谱。
在本实施例中,所述关键词提取模型为MDERank模型;所述联合抽取模型为BERT+BiLSTM+CRF模型;所述知识图谱工具为Neo4j工具。
也即,在网络热点知识图谱过程中,采用人工方式获取互联网上影响力较大或者知名度较高的已发生热点事件及对应的决策信息,并将已发生热点事件及对应的决策信息存储至热点案例库中,然后对从热点案例库中选取热点事件,采用MDERank模型进行关键词提取,MDERank模型采用对比学习方法,将对比学习方法引入至关键词提取中,关键词提取过程简便,并且准确度高,MDERank模型考虑了全局相似度,相较于其他关键词提取模型(如TF-IDF算法),更适应于新闻文本提取关键词。同时,采用BERT+BiLSTM+CRF模型进行实体、属性和关系抽取,BERT+BiLSTM+CRF模型可以同步抽取实体、属性和关系,相较于单独抽取实体、属性和关系的模型,准确度更高,对实体、属性和关系的抽取更为全面;最后,将热点事件的决策信息直接作为实体,结合提取及抽取的结果,采用Neo4j工具构建网络热点知识图谱,Neo4j工具是一个高性能的NOSQL图形数据库,可以将结构化数据存储在网络上而不是表中,是一个嵌入式的、基于磁盘的、具备完全的实务特性的Java持续化引擎。
进一步地,采用MDERank模型进行关键词提取具体包括以下步骤:
首先使用掩码掩盖词语并判别掩盖前后语义的第一变化情况,然后使用掩码掩盖其他词语并判别掩盖前后语义的第二变化情况,最后对比第一变化情况和第二变化情况,将语义变化最大的确定为关键词。
S20,获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取。
具体的,在突发热点事件相关信息提取过程中,首先面向互联网的突发热点事件,然后获取相关新闻报道,对热点事件分别进行关键词提取和知识抽取。该突发热点事件相关信息提取过程与网络热点知识图谱构建过程中的关键词提取和知识抽取所采用的技术手段一致,确保两个过程的技术手段一致,能够大大增加相似性对比及评估的准确度。
S30,根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估。
具体的,在多维度的相似度评估过程中,首先根据突发热点事件和网络热点知识图谱中的关键词,评估热点事件之间,即突发热点事件与网络热点知识图谱中的已发生热点事件之间的关键词相似度;然后根据突发热点事件和网络热点知识图谱中的实体和属性,评估热点事件之间的实体属性相似度;最后根据突发热点事件和网络热点知识图谱中的关系,评估热点事件之间的关系相似度。
在评估实体属性相似度时,可以先单独评估实体相似度和属性相似度,再进行加权,从而得到实体属性相似度;也可以先对实体和属性进行融合,再评估融合后的实体属性相似度。
需要说明的是,不同的相似度评估过程可以是同时进行,也可以是某一相似度评估过程优先进行。
作为优选,所述步骤S30可以包括以下步骤:
步骤S301,对所述突发热点事件和所述网络热点知识图谱中的关键词,通过词向量转换模型进行向量化后,通过计算词向量之间的余弦相似度,获得关键词相似度。
在步骤S301中,所述词向量转换模型为BERT(Bidirectional EncoderRepresentation from Transformers)模型。
也即,在评估关键词相似度时,首先使用BERT模型将关键词转换为词向量,然后采用基于余弦距离的相似度计算方法,计算词向量之间的余弦距离,从而得到关键词相似度,该关键词相似度可以表示为:
Figure SMS_1
上式中,
Figure SMS_3
为关键词相似度,且/>
Figure SMS_10
;/>
Figure SMS_13
、/>
Figure SMS_5
为热点事件;/>
Figure SMS_6
为热点事件/>
Figure SMS_8
的第/>
Figure SMS_12
个关键词;/>
Figure SMS_2
为热点事件/>
Figure SMS_9
的第/>
Figure SMS_14
个关键词;/>
Figure SMS_15
,/>
Figure SMS_4
为关键词的数量。可理解的,/>
Figure SMS_7
、/>
Figure SMS_11
可以分别表示突发热点事件和网络热点知识图谱中的已发生热点事件。
可以理解的是,本实施例采用BERT模型进行词向量转换,相较于其他词向量转换模型(如Skip-Gram模型),词向量化的结果准确度更好,结合余弦相似度,可以极大地提高关键词相似度的准确率。
步骤S302,对所述突发热点事件和所述网络热点知识图谱的实体属性合并,进行聚类分析后,选取所述突发热点事件的实体属性设为中心点,并通过计算所述网络热点知识图谱中的实体属性与所述中心点的欧式距离,得到实体属性相似度。
在步骤S302中,所述距离分析采用的聚类算法为DBSCAN算法。
也即,在评估实体属性相似度时,先通过DBSCAN算法进行聚类分析,DBSCAN算法是一种基于密度的空间聚类算法,可以对任意形状的稠密数据集进行聚类,相较于K-means之类的聚类算法,DBSCAN算法在聚类的同时发现异常点,对数据集中的异常点不敏感,最终聚类结果没有偏倚,更适用于对结构较不规范的热点事件及新闻文本进行聚类分析。
聚类分析后选择突发热点事件的实体属性作为中心点,使用基于欧式距离的相似度计算方法,计算突发热点事件与网络热点知识图谱中的实体属性之间的欧式距离,从而得到实体属性相似性,该实体属性相似度可以表示为:
Figure SMS_16
上式中,
Figure SMS_17
为实体属性相似度,且/>
Figure SMS_21
;/>
Figure SMS_23
、/>
Figure SMS_19
分别为热点事件/>
Figure SMS_20
的空间横坐标和纵坐标;/>
Figure SMS_22
、/>
Figure SMS_24
分别为热点事件/>
Figure SMS_18
的空间横坐标和纵坐标。
步骤S303,对所述突发热点事件和所述网络热点知识图谱中的关系进行文本相似度分析,得到关系相似度。
在评估关系相似度时,首先考虑到在网络热点知识图谱构建过程中以及突发热点事件信息提取过程中,均采用联合抽取方式进行实体之间的关系抽取,所以关系词可以存在包含、被包含、完全相同和完全不相同状态,例如:若关系词为发生时间与时间,则发生时间中包含时间,当采用关系词匹配算法
Figure SMS_25
进行关系词匹配时,关系相似度为:
Figure SMS_26
又例如:若关系词为发生时间与结束时间,则共同部分为时间,此时,关系词相似度为:
Figure SMS_27
其次,考虑到中英文语义结构的不同,为了保证中文语义相似度的准确性,选择关系词相似匹配字数大于等于2纳入计算,当关系相似匹配词字数小于2时,判定关系相似度为0。例如:若关系词为父亲和母亲,则相似匹配词为
Figure SMS_28
,“亲”的字符长度小于2,此时,直接将关系相似度设为0,即
Figure SMS_29
从而,关系相似度可以表示为:
Figure SMS_30
上式中,
Figure SMS_32
为关系相似度,且/>
Figure SMS_34
;/>
Figure SMS_37
为热点事件/>
Figure SMS_33
的第/>
Figure SMS_35
个关系;
Figure SMS_38
为热点事件/>
Figure SMS_40
的第/>
Figure SMS_31
个关系;/>
Figure SMS_36
,/>
Figure SMS_39
为关系的数量。
基于关键词相似度、实体属性相似度和关系相似度的表示式可知,关键词相似度
Figure SMS_41
可以代表热点事件关键词间的相似度,且/>
Figure SMS_42
值越大代表两者关键词相似度越大;实体属性相似度/>
Figure SMS_43
可以代表突发热点事件实体属性间的欧式距离,且/>
Figure SMS_44
值越大代表两者实体属性相似度越小;/>
Figure SMS_45
可以代表突发热点事件关系间的相似度,/>
Figure SMS_46
值越大代表两者关系相似度越大。/>
S40,根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
具体的,根据关键词、实体属性以及关系对相似热点事件的影响程度,确定关键词相似度、实体属性相似度和关系相似度对应的权重系数,然后对关键词相似度、实体属性相似度和关系相似度进行加权叠加,得到热点事件间的相似度,最后根据热点事件间的相似度选取最相似的热点事件及其对应的决策信息推荐给用户,从而完成网络热点信息推荐。
综上所述,本发明实施例提供的基于知识图谱的网络热点信息推荐方法具有以下有益效果:
1)本发明实施例引入知识图谱到网络热点信息领域,借助知识图谱的优势对已发生热点事件及决策信息进行存储,相较于传统的热点事件存储模式,更有利于精确推送热点事件;
2)本发明实施例引入知识图谱中的实体、属性和关系,结合传统网络热点事件推荐方法中的关键词作为影响因素,相较于传统的热点事件推荐方法,热点事件推送更精确、更全面;
3)本发明实施例综合多维度的相似度进行热点事件及决策信息同步推荐,解决了当前市面上热点监测系统存在缺乏应对突发网络热点事件进行决策信息推荐的问题,提高了突发网络热点事件的应对能力和管理能力。
在一可选实施例中,所述步骤S40包括以下步骤:
S401,对所述关键词相似度、所述实体属性相似度和所述关系相似度进行规范化。
在步骤S401中,为了确保相似度指标的规范性,对于各类相似度采用相应的算法进行规范化处理。
对于关键词相似度
Figure SMS_47
,其取值范围为/>
Figure SMS_48
,需要避免关键词相似度评估过程中出现负值,此时,可以引入自然常数/>
Figure SMS_49
取指数,来保证/>
Figure SMS_50
,从而保证关键词相似度的规范性,缩小了关键词相似度的取值范围。
对于实体属性相似度
Figure SMS_51
,其取值范围为/>
Figure SMS_52
,需要避免实体属性相似度评估过程中可能存在数据量过大的问题,此时,可以引入自然常数/>
Figure SMS_53
取指数并求倒数,来保证/>
Figure SMS_54
之间,从而保证实体属性相似度的规范性,大大缩短数据量。由于实体属性相似度/>
Figure SMS_55
的值越大,实体属性相似度越小,因此在后续构建事件相似度评估模型时,需要置于分母位置。
对于关系相似度
Figure SMS_56
,其取值范围为/>
Figure SMS_57
,需要避免在关系相似度评估过程中出现关系完全不相同,或者关系完全相同的极端现象,此时,可以引入自然常数/>
Figure SMS_58
并构建数学模型/>
Figure SMS_59
,来保证无论何种情况关系相似度/>
Figure SMS_60
的最终值都处于/>
Figure SMS_61
之间,此外,由于关系相似度与事件相似度为反比例关系,因此在构建事件相似度评估模型时,需要取倒数。
S402,根据规范化后的各相似度,结合关键词、实体属性和关系对相似热点事件的影响程度,构建并优化事件相似度评估模型;
在步骤S402中,由于关键词可直接进行热点事件分类,因此将关键词作为最大影响因素;由于实体属性主要涉及热点事件的主要信息和内容,因此将实体属性作为第二大影响因素;由于关系主要为辅助判断实体属性与热点事件间的关系,对事件相似性评估结果影响最小,因此把关系作为系数。综上考虑,构建的事件相似度评估模型为:
Figure SMS_62
上式中,
Figure SMS_63
为事件相似度;/>
Figure SMS_64
为规范化后的关键词相似度;/>
Figure SMS_65
为规范化后的实体属性相似度;/>
Figure SMS_66
为规范化后的关系相似度。
进一步地,对构建的事件相似度评估模型进行优化,保证
Figure SMS_67
的取值范围处于
Figure SMS_68
之间,限制了事件相似度评估结果的范围,保证了事件相似度评估模型的准确性和稳定性,便于取值。
S403,通过所述事件相似度评估模型获取事件相似性,并进行排序。
在步骤S403中,通过优化后的事件相似度评估模型计算最终的事件相似度
Figure SMS_69
,最终的事件相似度/>
Figure SMS_70
可以代表热点事件之间的相似度,然后,根据最终的事件相似度/>
Figure SMS_71
对网络热点知识图谱中的各热点事件,按照从小到大的顺序进行排序,得到排序结果。
S404,获取所述事件相似性最高的热点事件设为最相似的热点事件,并将所述最相似的热点事件及对应的决策信息推荐给用户。
在步骤S404中,从排序结果中选取事件相似度最高的热点事件作为最相似热点事件,并获取相应的决策信息,关联推荐给用户。可以理解的是,本实施例采用数学建模的方式对关键词、实体属性和关系进行综合分析,并对构建的事件相似度评估模型进一步优化,保证了事件相似度评估结果的规范化。此外,采用规范化的事件相似性进行推荐,进一步提高了热点事件及决策信息推荐的全面性和准确性,使对突发网络热点事件的应对更及时、更准确、更有效。
实施例2
如图4所示,本发明实施例还提供一种基于知识图谱的网络热点信息推荐系统,包括:
网络热点知识图谱构建模块110,用于获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;
突发热点事件处理模块120,用于获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取;
多维相似度评估模块130,用于根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;
热点信息推荐模块140,用于根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
在一些可选实施例中,所述网络热点知识图谱构建模块110包括:
热点收集存储子模块,用于从互联网中收集已发生热点事件及对应的决策信息,存储至热点案例库中;
关键词提取子模块,用于从所述热点案例库中提取热点事件,通过关键词提取模型对所述热点事件进行关键词提取;
知识抽取子模块,用于通过联合抽取模型对所述热点事件进行实体、属性和关系抽取;
知识图谱构建子模块,用于将所述决策信息作为所述热点事件的实体,并结合提取的关键词和抽取的实体、属性和关系,通过知识图谱工具构建网络热点知识图谱。
在一些可选实施例中,所述多维相似度评估模块130包括:
关键词相似度评估子模块,用于将所述突发热点事件和所述网络热点知识图谱中的关键词转换为词向量,通过计算所述词向量之间的余弦相似度,得到关键词相似度;
实体属性相似度评估子模块,用于对所述突发热点事件和所述网络热点知识图谱的实体属性进行聚类分析,选取所述突发热点事件的实体属性设为中心点,并通过计算所述网络热点知识图谱中的实体属性与所述中心点的欧式距离,得到实体属性相似度;
关系相似度评估子模块,用于对所述突发热点事件和所述网络热点知识图谱中的关系进行文本相似度分析,得到关系相似度。
在一些可选实施例中,所述热点信息推荐模块140包括:
规范化子模块,用于对所述关键词相似度、所述实体属性相似度和所述关系相似度进行规范化;
数学模型构建子模块,用于根据规范化后的各相似度,结合关键词、实体属性和关系对相似热点事件的影响程度,构建并优化事件相似度评估模型;
相似性处理子模块,用于通过所述事件相似度评估模型获取事件相似性,并进行排序;
推荐子模块,用于获取事件相似性最高的热点事件设为最相似热点事件,并将所述最相似热点事件及对应的决策信息推荐给用户。
可以理解的是,本实施例提供的基于知识图谱的网络热点信息推荐系统用于实现上述实施例的基于知识图谱的网络热点信息推荐方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
实施例3
基于同一技术构思,如图5所示,本发明实施例还提供了一种计算机设备,包括处理器1、存储器2和总线3,所述存储器2存储有所述处理器1可执行的计算机可读指令,当计算机设备运行时,所述处理器1与所述存储器2之间通过总线3通信,所述计算机可读指令被所述处理器1执行时实现任一项所述的基于知识图谱的网络热点信息推荐方法。
其中,处理器1在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器2中存储的程序代码或处理数据,例如执行等离子电源程序等。
存储器2至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、
硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器2在一些实施例中可以是等离子电源系统的内部存储单元,例如硬盘。存储器2在另一些实施例中也可以是等离子电源系统的外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card ,SMC),安全数字(Secure Digital ,SD)卡,闪存卡(Flash Card)等。进一步地,存储器2还可以既包括等离子电源系统的内部存储单元也包括外部存储设备。存储器2不仅可以用于存储安装于等离子电源系统的应用软件及各类数据,例如等离子电源程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,参考术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种基于知识图谱的网络热点信息推荐方法,其特征在于,包括:
获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;
获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取;
根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;
根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
2.根据权利要求1所述的基于知识图谱的网络热点信息推荐方法,其特征在于,所述获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱,包括:
从互联网中收集已发生热点事件及对应的决策信息,存储至热点案例库中;
从所述热点案例库中提取热点事件,通过关键词提取模型对所述热点事件进行关键词提取;
通过联合抽取模型对所述热点事件进行实体、属性和关系抽取;
将所述决策信息作为所述热点事件的实体,并结合提取的关键词和抽取的实体、属性和关系,通过知识图谱工具构建网络热点知识图谱。
3.根据权利要求1所述的基于知识图谱的网络热点信息推荐方法,其特征在于,所述根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估,包括:
对所述突发热点事件和所述网络热点知识图谱中的关键词,通过词向量转换模型进行向量化后,通过计算词向量之间的余弦相似度,获得关键词相似度;
对所述突发热点事件和所述网络热点知识图谱的实体属性合并,进行聚类分析后,选取所述突发热点事件的实体属性设为中心点,并通过计算所述网络热点知识图谱中的实体属性与所述中心点的欧式距离,得到实体属性相似度;
对所述突发热点事件和所述网络热点知识图谱中的关系进行文本相似度分析,得到关系相似度。
4.根据权利要求3所述的基于知识图谱的网络热点信息推荐方法,其特征在于,所述关键词相似度为:
Figure QLYQS_1
上式中,
Figure QLYQS_4
为关键词相似度,且/>
Figure QLYQS_8
;/>
Figure QLYQS_11
、/>
Figure QLYQS_5
为热点事件;/>
Figure QLYQS_6
为热点事件
Figure QLYQS_9
的第/>
Figure QLYQS_12
个关键词;/>
Figure QLYQS_2
为热点事件/>
Figure QLYQS_7
的第/>
Figure QLYQS_10
个关键词;/>
Figure QLYQS_13
,/>
Figure QLYQS_3
为关键词的数量;
所述实体属性相似度为:
Figure QLYQS_14
,/>
上式中,
Figure QLYQS_16
为实体属性相似度,且/>
Figure QLYQS_18
;/>
Figure QLYQS_20
、/>
Figure QLYQS_17
分别为热点事件/>
Figure QLYQS_19
的空间横坐标和纵坐标;/>
Figure QLYQS_21
、/>
Figure QLYQS_22
分别为热点事件/>
Figure QLYQS_15
的空间横坐标和纵坐标;
所述关系相似度为:
Figure QLYQS_23
上式中,
Figure QLYQS_25
为关系相似度,且/>
Figure QLYQS_27
;/>
Figure QLYQS_30
为热点事件/>
Figure QLYQS_26
的第/>
Figure QLYQS_29
个关系;/>
Figure QLYQS_32
为热点事件/>
Figure QLYQS_33
的第/>
Figure QLYQS_24
个关系;/>
Figure QLYQS_28
,/>
Figure QLYQS_31
为关系的数量。
5.根据权利要求3所述的基于知识图谱的网络热点信息推荐方法,其特征在于,所述根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐,包括:
对所述关键词相似度、所述实体属性相似度和所述关系相似度进行规范化;
根据规范化后的各相似度,结合关键词、实体属性和关系对相似热点事件的影响程度,构建并优化事件相似度评估模型;
通过所述事件相似度评估模型获取事件相似性,并进行排序;
获取所述事件相似性最高的热点事件设为最相似热点事件,并将所述最相似热点事件及对应的决策信息推荐给用户。
6.根据权利要求5所述的基于知识图谱的网络热点信息推荐方法,其特征在于,所述事件相似度评估模型为:
Figure QLYQS_34
上式中,
Figure QLYQS_35
为事件相似度;/>
Figure QLYQS_36
、/>
Figure QLYQS_37
和/>
Figure QLYQS_38
分别为关键词相似度、实体属性相似度和关系相似度;/>
Figure QLYQS_39
为规范化后的关键词相似度;/>
Figure QLYQS_40
为规范化后的实体属性相似度;/>
Figure QLYQS_41
为规范化后的关系相似度。
7.一种基于知识图谱的网络热点信息推荐系统,其特征在于,包括:
网络热点知识图谱构建模块,用于获取已发生热点事件及决策信息,进行关键词提取和知识抽取后,构建网络热点知识图谱;
突发热点事件处理模块,用于获取突发热点事件,并对所述突发热点事件进行关键词提取和知识抽取;
多维相似度评估模块,用于根据所述突发热点事件和所述网络热点知识图谱中的关键词、实体属性和关系,进行关键词相似度、实体属性相似度和关系相似度评估;
热点信息推荐模块,用于根据评估得到的所述关键词相似度、所述实体属性相似度和所述关系相似度,进行热点事件及决策信息推荐。
8.根据权利要求7所述的基于知识图谱的网络热点信息推荐系统,其特征在于,所述网络热点知识图谱构建模块包括:
热点收集存储子模块,用于从互联网中收集已发生热点事件及对应的决策信息,存储至热点案例库中;
关键词提取子模块,用于从所述热点案例库中提取热点事件,通过关键词提取模型对所述热点事件进行关键词提取;
知识抽取子模块,用于通过联合抽取模型对所述热点事件进行实体、属性和关系抽取;
知识图谱构建子模块,用于将所述决策信息作为所述热点事件的实体,并结合提取的关键词和抽取的实体、属性和关系,通过知识图谱工具构建网络热点知识图谱。
9.根据权利要求7所述的基于知识图谱的网络热点信息推荐系统,其特征在于,所述热点信息推荐模块包括:
规范化子模块,用于对所述关键词相似度、所述实体属性相似度和所述关系相似度进行规范化;
数学模型构建子模块,用于根据规范化后的各相似度,结合关键词、实体属性和关系对相似热点事件的影响程度,构建并优化事件相似度评估模型;
相似性处理子模块,用于通过所述事件相似度评估模型获取事件相似性,并进行排序;
推荐子模块,用于获取所述事件相似性最高的热点事件设为最相似热点事件,并将所述最相似热点事件及对应的决策信息推荐给用户。
10.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的计算机可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述计算机可读指令被所述处理器执行时实现如权利要求1至6中任一项所述的基于知识图谱的网络热点信息推荐方法。
CN202310528124.6A 2023-05-11 2023-05-11 一种基于知识图谱的网络热点信息推荐方法、系统及设备 Active CN116226541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310528124.6A CN116226541B (zh) 2023-05-11 2023-05-11 一种基于知识图谱的网络热点信息推荐方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310528124.6A CN116226541B (zh) 2023-05-11 2023-05-11 一种基于知识图谱的网络热点信息推荐方法、系统及设备

Publications (2)

Publication Number Publication Date
CN116226541A true CN116226541A (zh) 2023-06-06
CN116226541B CN116226541B (zh) 2023-07-28

Family

ID=86589631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310528124.6A Active CN116226541B (zh) 2023-05-11 2023-05-11 一种基于知识图谱的网络热点信息推荐方法、系统及设备

Country Status (1)

Country Link
CN (1) CN116226541B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090271417A1 (en) * 2008-04-25 2009-10-29 John Toebes Identifying User Relationships from Situational Analysis of User Comments Made on Media Content
CN110245204A (zh) * 2019-06-12 2019-09-17 桂林电子科技大学 一种基于定位及知识图谱的智能推荐方法
CN111813962A (zh) * 2020-09-07 2020-10-23 北京富通东方科技有限公司 一种用于知识图谱融合的实体相似度计算方法
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统
CN113722509A (zh) * 2021-09-07 2021-11-30 中国人民解放军32801部队 一种基于实体属性相似度的知识图谱数据融合方法
CN114048325A (zh) * 2021-11-11 2022-02-15 泰康保险集团股份有限公司 基于知识图谱的案件处理方法及装置、存储介质
CN114118310A (zh) * 2022-01-28 2022-03-01 航天宏康智能科技(北京)有限公司 基于综合相似度的聚类方法和装置
CN114218955A (zh) * 2021-12-28 2022-03-22 上海柯林布瑞信息技术有限公司 基于医疗知识图谱的辅助参考信息的确定方法及系统
CN114756686A (zh) * 2022-03-30 2022-07-15 同济大学 一种基于知识图谱的知识推理和故障诊断方法
CN114925160A (zh) * 2022-04-18 2022-08-19 北京急救中心 一种基于知识图谱技术的院前急救指导推荐系统和方法
CN115809340A (zh) * 2022-08-29 2023-03-17 南京南瑞信息通信科技有限公司 一种知识图谱的实体更新方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090271417A1 (en) * 2008-04-25 2009-10-29 John Toebes Identifying User Relationships from Situational Analysis of User Comments Made on Media Content
CN110245204A (zh) * 2019-06-12 2019-09-17 桂林电子科技大学 一种基于定位及知识图谱的智能推荐方法
CN111813962A (zh) * 2020-09-07 2020-10-23 北京富通东方科技有限公司 一种用于知识图谱融合的实体相似度计算方法
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统
CN113722509A (zh) * 2021-09-07 2021-11-30 中国人民解放军32801部队 一种基于实体属性相似度的知识图谱数据融合方法
CN114048325A (zh) * 2021-11-11 2022-02-15 泰康保险集团股份有限公司 基于知识图谱的案件处理方法及装置、存储介质
CN114218955A (zh) * 2021-12-28 2022-03-22 上海柯林布瑞信息技术有限公司 基于医疗知识图谱的辅助参考信息的确定方法及系统
CN114118310A (zh) * 2022-01-28 2022-03-01 航天宏康智能科技(北京)有限公司 基于综合相似度的聚类方法和装置
CN114756686A (zh) * 2022-03-30 2022-07-15 同济大学 一种基于知识图谱的知识推理和故障诊断方法
CN114925160A (zh) * 2022-04-18 2022-08-19 北京急救中心 一种基于知识图谱技术的院前急救指导推荐系统和方法
CN115809340A (zh) * 2022-08-29 2023-03-17 南京南瑞信息通信科技有限公司 一种知识图谱的实体更新方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RUORAN HUANG.ET AL: "Entity-aware Collaborative Relation Network with Knowledge Graph for Recommendation", CIKM \'21: PROCEEDINGS OF THE 30TH ACM INTERNATIONAL CONFERENCE ON INFORMATION & KNOWLEDGE MANAGEMENT, pages 3098 *
邢雪琪等: "基于知识图谱的商用飞机维修方案推荐系统集成建模", 浙江大学学报(工学版), pages 512 - 521 *

Also Published As

Publication number Publication date
CN116226541B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
US9275115B2 (en) Correlating corpus/corpora value from answered questions
US20170193086A1 (en) Methods, devices, and systems for constructing intelligent knowledge base
WO2022121171A1 (zh) 相似文本匹配方法、装置、电子设备及计算机存储介质
US20160098645A1 (en) High-precision limited supervision relationship extractor
CN109033320B (zh) 一种双语新闻聚合方法及系统
WO2020232898A1 (zh) 文本分类方法、装置、电子设备及计算机非易失性可读存储介质
US9092673B2 (en) Computing visual and textual summaries for tagged image collections
CN112329460A (zh) 文本的主题聚类方法、装置、设备及存储介质
CN113590645A (zh) 搜索方法、装置、电子设备及存储介质
US20190079820A1 (en) Log-based computer system failure signature generation
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN112528661A (zh) 实体相似度计算方法
CN114330335A (zh) 关键词抽取方法、装置、设备及存储介质
US10719663B2 (en) Assisted free form decision definition using rules vocabulary
KR20220074576A (ko) 마케팅 지식 그래프 구축을 위한 딥러닝 기반 신조어 추출 방법 및 그 장치
CN116226541B (zh) 一种基于知识图谱的网络热点信息推荐方法、系统及设备
WO2019231635A1 (en) Method and apparatus for generating digest for broadcasting
WO2021227951A1 (zh) 前端页面元素的命名
CN114637846A (zh) 视频数据处理方法、装置、计算机设备和存储介质
CN114548113A (zh) 基于事件的指代消解系统、方法、终端及存储介质
KR20220074572A (ko) 딥러닝 기반 신조어 추출 방법 및 그 장치
CN116136866B (zh) 基于知识图谱的中文新闻摘要事实性知识校正方法和装置
CN109918367A (zh) 一种结构化数据的清洗方法、装置、电子设备及存储介质
Bradshaw et al. Evaluating Better Document Representation in Clustering with Varying Complexity.
CN115563291A (zh) 表单结构生成方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant