CN116089624B - 基于知识图谱的数据推荐方法、装置和系统 - Google Patents

基于知识图谱的数据推荐方法、装置和系统 Download PDF

Info

Publication number
CN116089624B
CN116089624B CN202211441694.3A CN202211441694A CN116089624B CN 116089624 B CN116089624 B CN 116089624B CN 202211441694 A CN202211441694 A CN 202211441694A CN 116089624 B CN116089624 B CN 116089624B
Authority
CN
China
Prior art keywords
information
recommended
knowledge graph
user
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211441694.3A
Other languages
English (en)
Other versions
CN116089624A (zh
Inventor
王铁成
熊伟
吴迪
金璨
崔家奇
周嘉庚
王淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunlun Digital Technology Co ltd
China National Petroleum Corp
Original Assignee
Kunlun Digital Technology Co ltd
China National Petroleum Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunlun Digital Technology Co ltd, China National Petroleum Corp filed Critical Kunlun Digital Technology Co ltd
Priority to CN202211441694.3A priority Critical patent/CN116089624B/zh
Publication of CN116089624A publication Critical patent/CN116089624A/zh
Application granted granted Critical
Publication of CN116089624B publication Critical patent/CN116089624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的数据推荐方法和装置。所述方法包括根据当前用户的身份权限信息选择相关知识图谱和学科场景;从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与相关知识图谱中信息的相似度;根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对学科场景所涉及到的主题的兴趣程度;根据相似度和兴趣程度确定推荐度;根据推荐度确定向当前用户推荐的待推荐信息。能够为用户准确推荐信息,并且针对学科场景有针对性的推荐信息,助力用户快速构建研究场景,提高信息推荐的工作效率。

Description

基于知识图谱的数据推荐方法、装置和系统
技术领域
本发明涉及信息处理技术领域,特别涉及一种基于知识图谱的数据推荐方法、装置和系统。
背景技术
知识图谱被称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列图形,用可视化技术描述知识及其载体,挖掘、分析、构建和显示知识和载体间的相互联系;知识图谱具备强大的语义处理及开放互联能力,其构建技术包含对目标领域的知识表示、知识抽取、知识融合、知识推理和质量评估。通过知识抽取,从大量结构化、半结构化和非结构化的领域数据中抽取出知识图谱的组成元素,例如实体、关系、属性等,并将其存储进知识库中;知识融合即对知识库中的内容进行消歧、链接,用以进一步增强知识库内部的表达能力和逻辑性;知识推理即可推断出缺失的事实;质量评估可保证数据质量,提高知识图谱的可信度与准确性。当前,知识图谱技术已推广应用至信息推荐领域。
发明内容
本申请发明人发现,利用知识图谱技术进行信息推荐时,当数据规模有限或实体覆盖不足的情况下,可能产生推荐结果不准确的情况,因此需要对目标领域开展进一步的信息推荐算法融合研究,实现场景化、个性化推荐,进一步保障信息推荐的精准性。例如:油气上游业务研究领域存在学科交叉多、数据量庞大、数据结构关系复杂等现状,用户搜集、辨别、梳理数据的工作量较大,难以快速获取研究所需数据资源,构建研究场景的效率较低,目前针对油气上游业务无法做到精准的进行信息推荐。
鉴于上述问题和发现,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于知识图谱的数据推荐方法、装置和系统。
第一方面,本发明实施例提供一种基于知识图谱的数据推荐方法,包括:
根据当前用户的身份权限信息选择相关知识图谱和学科场景;
从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与所述相关知识图谱中信息的相似度;
根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度;
根据所述相似度和所述兴趣程度确定推荐度;
根据所述推荐度确定向当前用户推荐的待推荐信息。
在一个实施例中,所述从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与所述相关知识图谱中内容的相似度,包括:
使用下列公式计算得到待推荐信息i与所述相关知识图谱中信息j的相似度:
Scontent(i,j)=(c(i)×c(j))×(t(i)×t(j))×(1+e(i)×e(j));
其中,Scontent(i,j)表示待推荐信息i和知识图谱中的信息j的相似度;
c(i)和c(j)分别表示待推荐信息与知识图谱中的信息形成的信息网络;
t(i)和t(j)分别表示待推荐信息i和知识图谱中的信息j的主题向量;
e(i)和e(j)分别表示待推荐信息i和知识图谱中的信息j所涉及的实体向量。
在一个实施例中,主题向量t(i)是根据待推荐信息i中涉及到的实体类型和选择的学科场景构建的;t(j)是根据知识图谱中的信息j中涉及到的实体类型和选择的学科场景构建的;
实体向量e(i)是根据相关知识图谱从待推荐信息i中抽取所涉及的实体,根据抽取到的实体集合构建的;e(j)从知识图谱中的信息j中抽取所涉及的实体,根据抽取到的实体集合构建的,根据抽取到的实体集合构建的;
c(i)是根据实体向量e(i)涉及到的实体集合,从相关知识图谱中获取相关信息构建的;c(j)是根据实体向量e(j)涉及到的实体集合,从相关知识图谱中获取相关信息构建的。
在一个实施中,所述根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度,包括:
使用下列公式计算得到当前用户对所述学科场景所涉及到的主题的兴趣程度:
w(a,t)=fr(a,t)/fall(t);
其中,w(a,t)表示当前用户a对主题t的兴趣程度;
fr(a,t)表示当前用户a的历史行为数据中的信息属于或包含主题t的信息数量;
fall(t)表示所述相关知识图谱中属于或包含主题t的信息数量。
在一个实施例中,预先构建不同学科场景下的信息推荐候选集存储于信息数据库中;相应的,
所述从信息数据库中获取待推荐信息包括:根据选择的学科场景,从该学科场景的推荐信息候选集中选择待推荐信息;所述待推荐信息包括预置信息树、预置工作流、预置微件库、专业软件库、已归档项目成果、相关知识文档中的至少一项。
在一个实施例中,所述根据当前用户的身份权限信息选择学科场景,包括:
根据当前用户的身份权限信息,确定用户行为涉及到的用户个人页面、研究学科场景页面和浏览信息详情页面至少一个用户行为页面;
根据涉及到的用户行为页面选择用户感兴趣的学科场景。
在一个实施例中,还包括:
获取当前用户的关联用户的历史行为数据;
根据当前用户的历史行为数据和关联用户的历史行为数据,确定当前用户与关联用户之间的关联操作,从所述关联用户与所述关联操作相关信息中选择推荐信息推荐给当前用户。
第二方面,本发明实施例提供一种基于知识图谱的数据推荐装置,包括:
选择模块,用于根据当前用户的身份权限信息选择相关知识图谱和学科场景;
第一确定模块,用于从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与所述相关知识图谱中信息的相似度;
第二确定模块,用于根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度;
推荐模块,用于根据所述相似度和所述兴趣程度确定推荐度,根据所述推荐度确定向当前用户推荐的待推荐信息。
第三方面,本发明实施例提供一种基于知识图谱的数据推荐系统,包括:信息推荐服务器和终端设备;
所述信息推荐服务器中设置如前所述的基于知识图谱的数据推荐装置,用于确定向用户推荐的信息;
所述终端设备用于与用户进行人机交互,获取用户的输入信息以及将定向用户推荐的信息展示给用户。
第四方面,本发明实施例提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前所述的基于知识图谱的数据推荐方法。
第五方面,本发明实施例提供一种推荐服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前所述的基于知识图谱的数据推荐方法。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的基于知识图谱的数据推荐方法,可以根据用户的身份权限信息选择相关知识图谱和学科场景,基于学科场景和相关知识图谱,确定待推荐信息与相关知识图谱中内容的相似度;以及根据用户的历史行为数据中、相关知识图谱中各自与学科场景相关的信息,确定用户学科场景所涉及到的主题的兴趣程度,结合上述确定的相似度和兴趣程度来确定推荐度以便为用户推荐信息,从而能够基于知识图谱和综合信息推荐算法,在考虑用户权限、历史行为、研究学科和场景等多方面内容的情况下,关联各方面的数据、信息和成果为用户准确推荐信息;能够扩展用户的搜索结果、实现推荐范围扩大化,针对学科场景有针对性的推荐信息,助力用户快速构建研究场景,提高信息推荐的工作效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中基于知识图谱的数据推荐方法的流程图;
图2为本发明实施例中信息推荐服务体系结构示意图;
图3为本发明实施例中基于关联用户选择推荐信息推荐给当前用户的结构示意图;
图4为本发明实施例中基于知识图谱的数据推荐方法的流程图2;
图5为本发明实施例中基于知识图谱的数据推荐系统原理框架结构示意图;
图6为本发明实施例中基于知识图谱的数据推荐装置的结构示意图;
图7为本发明实施例中基于知识图谱的数据推荐系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中利用知识图谱技术进行信息推荐时推荐不精准的问题,本发明实施例提供一种基于知识图谱的数据推荐方法。
本发明实施例提供一种基于知识图谱的数据推荐方法,其流程如图1所示,包括如下步骤:
步骤S1:根据当前用户的身份权限信息选择相关知识图谱和学科场景;
步骤S2:从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与相关知识图谱中信息的相似度;
步骤S3:根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对学科场景所涉及到的主题的兴趣程度;
步骤S4:根据相似度和兴趣程度确定推荐度;
步骤S5:根据推荐度确定向当前用户推荐的待推荐信息。
在一些可选的实施例中,上述步骤S1,可以通过识别用户岗位权限,来获取用户信息,并对用户信息进行预处理,预处理具体涉及到的用户信息包含用户的身份权限标签,可选的,用户的身份权限标签可以是预设管理人员、总师、地质工程师或者油藏工程师等,根据用户的身份权限标签,选择用户适用的知识图谱和用户适用的学科场景,可选的,例如学科场景可以是测井解释,可以是构造建模,也可以是数值模拟,或者是其他的学科场景。
根据用户的身份权限标签选择相关的知识图谱和相关的学科场景,有助于实现场景化、个性化推荐,进一步保障信息推荐的精准性,能够使推荐结果更加准确。
对于任意一条待推荐信息,其被推荐与否受当前待推荐信息内容与相关知识图谱信息内容的相似度的影响,因此需要计算待推荐信息的内容与知识图谱的内容的相似度,由于基于内容的推荐算法的准确性依赖于对推荐信息形成的信息网络的准确度,因此引入了勘探开发知识图谱(知识库)中丰富的语义关联关系作为推荐辅助,将待推荐信息与知识图谱进行相似度、权重等计算,具体的,例如对于待推荐信息i,计算待推荐信息i与知识图谱中的信息j的相似度,下面对相似度的计算方法进行说明。
在一些可选的实施例中,上述步骤S2,可以使用下列公式计算得到待推荐信息i与相关知识图谱中信息j的相似度:
Scontent(i,j)=(c(i)×c(j))×(t(i)×t(j))×(1+e(i)×e(j)) (1);
其中,Scontent(i,j)表示待推荐信息i和知识图谱中的信息j的相似度;
下面对公式(1)中的参数进行说明:
1)、t(i)和t(j)分别表示待推荐信息i和知识图谱中的信息j的主题向量;
主题向量t(i)是根据待推荐信息i中涉及到的实体类型和选择的学科场景构建的;t(j)是根据知识图谱中的信息j中涉及到的实体类型和选择的学科场景构建的;
以勘探开发知识图谱的实体类型作为分类依据,例如实例类型可以是盆地、构造单元、地层和区块等中的至少一个,并用t=(t1,t2…;)表示主题向量,其中“t1”、“t2”表示该向量中的元素,相应的,对于待推荐信息i,t(i)表示与信息i携带的内容相关的主题向量,t(j)表示知识图谱中的信息j的主题向量。
2)、e(i)和e(j)分别表示待推荐信息i和知识图谱中的信息j所涉及的实体向量。
实体向量e(i)是根据相关知识图谱从待推荐信息i中抽取所涉及的实体,根据抽取到的实体集合构建的;e(j)从知识图谱中的信息j中抽取所涉及的实体,根据抽取到的实体集合构建的,根据抽取到的实体集合构建的;
以根据用户的身份权限信息选择的相关知识图谱为基础,抽取待推荐信息所涉及的实体,结合待推荐信息分析结果,对结果进行过滤,进一步得到与待推荐信息相关的实体集合,用向量e=(e1,e2…;)表示与待推荐信息相关的实体集合,其中e1、e2表示该实体集合中的元素,相应的,e(i)表示对待推荐信息i进行抽取,得到的待推荐信息i所涉及的多个实体组成的向量,e(j)表示抽取到的知识图谱中的信息j所涉及到的多个实体组成的向量。
3)、c(i)和c(j)分别表示待推荐信息i与知识图谱中的信息j形成的信息网络;
c(i)是根据实体向量e(i)涉及到的实体集合,从相关知识图谱中获取相关信息构建的;c(j)是根据实体向量e(j)涉及到的实体集合,从相关知识图谱中获取相关信息构建的;
以向量e表示的实体集合中的每一个实体为出发点,获取其在知识图谱中直接相关的学科研究微件、专业软件、成果表格、成果图件、预置工作流等类的信息,进而形成与该信息相关的网络,用向量c=(c1,c2…;)表示,相应的,c(i)表示根据待推荐信息i对应的实体向量e(i)和知识图谱的内容,获取的待推荐信息i的信息网络,c(j)表示根据实体向量e(j)和知识图谱的内容获取的i的信息网络。
在一些可选的实施例中,上述步骤S3,根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中与选择的学科场景相关的信息,确定当前用户对学科场景所涉及到的主题的兴趣程度,可以通过使用下列公式,计算得到当前用户对学科场景所涉及到的主题的兴趣程度:
w(a,t)=fr(a,t)/fall(t) (2)
其中,w(a,t)表示当前用户a对主题t的兴趣程度;
fr(a,t)表示当前用户a的历史行为数据中的信息属于或包含主题t的信息数量;
fall(t)表示相关知识图谱中属于或包含主题t的信息数量。
通过当前用户历史搜索过的关键字信息判断用户感兴趣的程度,其中fr(a,t)表示当前用户a历史搜索过的关键字信息中属于或包含主题t的信息数量,fall(t)表示知识图谱中属于或包含主题t的信息数量总和,w(a,t)能够表征用户a对主题信息t的兴趣程度。
在一些可选的实施例中,上述步骤S4,例如可以通过以下方式实现:
对任意一条待推荐信息,其被推荐与否既受知识图谱与当前待推荐信息内容相似度的影响,也与当前用户对其的兴趣程度相关,因此需要综合考虑这两类因素进行推荐度总权值的计算,比如,可以综合知识图谱与待推荐信息内容的相似度参数Scontent(i,j)、用户兴趣度参数w(a,t),以二者的乘积表征推荐度总权值,总权值数值越大,待推荐信息优先级越高,也可以选择其他方法计算确定待推荐信息的推荐度,比如加权计算,本发明实施例对此不做限定。
在一些可选的实施例中,上述步骤S5,例如可以通过下述方式确定向当前用户推荐的待推荐信息:
经过上述对于待推荐信息的推荐度的计算,得到多个待推荐信息组成的一个最终推荐信息集合。按照推荐度总权值从大到小的顺序,以信息树和知识推荐窗口的方式展示给用户,本发明实施例对此不做限定。
基于勘探开发平台和知识图谱技术,并结合信息推荐算法技术可以实现可视化展示勘探、开发、生产等学科及其下属子学科的核心知识结构,围绕学科研究场景组织相关数据资源及其对象载体。根据用户岗位权限、研究场景、学科专题进行关联数据、信息、成果的准确推荐,并能够扩展用户搜索结果,实现推荐范围扩大化,助力用户快速构建研究场景,提高研究工作效率。
在一些可选的实施例中,预先构建不同学科场景下的信息推荐候选集存储于信息数据库中;相应的,从信息数据库中获取待推荐信息包括:根据选择的学科场景,从该学科场景的推荐信息候选集中选择待推荐信息;待推荐信息包括预置信息树、预置工作流、预置微件库、专业软件库、已归档项目成果、相关知识文档中的至少一项。
在一些可选的实施例中,根据当前用户的身份权限信息选择学科场景,包括:
根据当前用户的身份权限信息,确定用户行为涉及到的用户个人页面、研究学科场景页面和浏览信息详情页面至少一个用户行为页面;
根据涉及到的用户行为页面选择用户感兴趣的学科场景。
上述基于知识图谱的数据推荐方法的实现流程中,提供了一种信息推荐服务体系,如图2所示,信息推荐服务体系可以提供用户个人页面、研究学科、场景页面和信息详情页面等人机交互页面。用户登录用户个人页面后,根据当前用户登录后的岗位身份开放权限,展示岗位权限下信息推荐集,并展示依据该当前用户历史搜索记录、关联信息、兴趣和偏好推荐信息集;当前用户选择某研究学科页面或者某研究场景页面时,页面展示该业务活动所需信息(数据、对象、成果等),同时在页面的知识推荐窗口推荐当前用户可能用到的信息,例如,这些信息可以是基于研究学科的信息推荐集、基于当前用户历史行为的信息推荐集、基于预置研究场景的信息推荐集、基于项目协同的信息推荐集和/或基于关联学科场景信息推荐集;信息详情页展示基于当前用户历史搜索信息及关联好友动态的信息推荐集,还可以是同作者信息推荐集等,以供当前用户对自身的信息需求进行追溯、查看、管理,可以大大降低用户开展研究工作前的数据搜集、整理、准备时间,同时通过推荐知识成果信息辅助用户决策,进而可提升平台研究环境的智能性,在推荐实施中,单个场景可以从多个角度进行信息推荐,以满足用户不同的研究工作所需。
在平台研究环境中,不同学科场景下的用户需求具有明显的区别,同时,受获取的用户信息不够全面丰富、分析技术不完善等因素影响,难以精准确定用户的实时信息需求,因此也难以通过单一的推荐服务全面满足用户需求,为解决这一问题,需要从用户典型场景出发,结合用户搜索记录,分析其需求特点,进而建立立体化的信息推荐服务体系,以更好地满足用户个性化需求。
在一些可选的实施例中,还包括:获取当前用户的关联用户的历史行为数据;
根据当前用户的历史行为数据和关联用户的历史行为数据,确定当前用户与关联用户之间的关联操作,从关联用户与关联操作相关信息中选择推荐信息推荐给当前用户。
用户和用户之间的信息推荐服务利用基于用户的协同过滤算法进行实现,用一个具体的例子进行说明,如图3所示,以用户A、用户B和用户C为例,涉及到的信息以信息1、信息2、信息3和信息4为例,在平台中,用户A与用户C之间为关联为好友的关系,若用户A对信息1和信息3产生了“点赞”和/或“引用”和/或“评论”等动态动作,同时用户C对信息1、信息3、信息4进行了上述关联动态动作,则将信息4判断为用户A可能感兴趣的信息并推荐给用户A。
本发明实施例应用勘探开发知识图谱及信息推荐技术,基于平台应用层对油气上游业务的学科划分、预置研究场景,根据用户身份及所选学科、场景、搜索记录,形成信息推荐集合,动态展示用户感兴趣的数据、成果、信息,展示方式以研究环境中的信息树和知识推荐窗口进行最终推荐信息的展示。
本发明实施例的应用可以大大降低用户开展研究工作前的数据搜集、整理、准备时间,同时通过推荐知识成果信息辅助用户决策,进而可提升平台研究环境的智能性。
以一个具体的实施例来说明上述基于知识图谱的数据推荐方法,其流程如图4所示,系统原理框架如图5所示,基于知识图谱的数据推荐方法对用户A(测井工程师)进行信息推荐的具体实现流程如下:
1、获取用户A登录后的身份权限信息,可以通过系统在用户A登录后根据用户A的登录信息在系统后台进行识别,用户A的身份是测井工程师;
2、获取用户A的根据身份权限信息选择的学科场景、知识图谱和信息数据库,例如与测井相关的学科场景,并获取与学科场景有关的测井解释;
3、获取用户A的历史行为数据,可以通过后台算法分析,确定用户A的历史行为,获取其相关行为数据;比如获取用户A的历史搜索关键字,比如用户A的历史点赞成果(该点赞信息是塔中1油田测井二次解释成果表,该表由关联用户B上传)等,又比如信息偏好特征数据;
4、基于上述获得的用户A选择的学科场景,执行信息推荐处理的过程,根据用户A选择的学科场景进行推荐匹配时,可以基于勘探开发数据湖和/或业务活动知识库筛选待推荐的信息,并结合知识图谱的知识映射、知识抽取、知识存储和知识融合的过程,对用户A进行信息推荐,推荐信息处理过程如下:
1)、对于信息数据库中的每条待推荐信息,在知识图谱中都会有对应的信息n,获取一条待推荐信息m及相应的知识图谱中的信息n;
2)、根据测井的学科场景,获得主题向量t(m)和主题向量t(n);
3)、依据知识图谱,抽取待推荐信息m涉及的实体,并结合待推荐信息分析结果对实体进行过滤,得到待推荐信息m的实体向量e(m);抽取知识图谱中涉及的实体,得到知识图谱中的实体向量e(n);
3)、根据e(m)和待推荐信息m在知识图谱中的相关信息,获取待推荐信息m的信息网络,进而得到向量c(m);根据e(n),获取知识图谱中的信息网络,进而得到向量c(n);
3)、根据用户A的历史搜索过的关键字信息和当前的学科场景,获取用户A历史搜索过的关键字信息中属于或包含当前学科场景主题t的信息数量,得到fr(A,t)
4)、根据知识图谱中属于或包含当前学科场景主题t的信息数量总和,得到fall(t);
5)、将t(m)、t(n)、e(m)、e(n)、c(m)和c(n)输入至到公式(1)中,得到待推荐信息m和知识图谱中的信息n的相似度Scontent(m,n)
6)、将fr(A,t)和fall(t)输入至公式(2)中,得到用于表征用户A对主题T的兴趣程度w(A,t);
7)、将相似度Scontent(m,n)和兴趣程度w(A,t),相乘,得到待推荐信息m的推荐度总权值;
8)、对于信息数据库中的每条待推荐信息,进行上述1)~7)的操作步骤,得到每条待推荐信息的推荐度总权值,推荐度总权值越大,该待推荐信息的优先级越高;
9)、对得到的每个推荐度总权值进行排序,以优先级又高到低的顺序,将多个待推荐信息组成一个最终的推荐信息集合;
5、基于上述获取的用户A的历史行为数据和/或用户A的关联用户C之间的行为数据,执行信息推荐处理的过程,根据用户A的历史搜索关键字和、或历史点赞成果进行推荐匹配时,推荐信息处理过程如下:
1)、获取用户A的“点赞”、“引用”、“评论”等历史行为,用户A对信息1和信息3产生了的“点赞”的动作;
2)、获取用户A的关联好友C的“点赞”、“引用”、“评论”等历史行为,用户C对信息1、信息3和信息4产生了“点赞”的动作;
3)、将信息4推荐给用户A;
6、将生成的最终的推荐信息集合和信息4组合以信息树、知识推荐方式展示给用户,比如根据用户A选择的学科场景,向用户A推荐的信息可以是:研究环境构成要素推荐、测井解释信息树、测井解释工作流和、或测井解释专业软件;根据用户A的历史行为数据和/或用户A的关联用户B之间的行为数据,向用户A推荐的信息可以是:知识推荐、塔中1油田测井解释参数表(用户B上传)、塔中1油田有效厚度下限分析报告(用户C上传)和/或测井专业软件LEAD使用手册。
基于同一发明构思,本发明实施例还提供一种基于知识图谱的数据推荐装置,该装置的结构如图6所示,包括:
选择模块61,用于根据当前用户的身份权限信息选择相关知识图谱和学科场景;
第一确定模块62:用于从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与相关知识图谱中信息的相似度;
第二确定模块63:用于根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对学科场景所涉及到的主题的兴趣程度;
推荐模块64,用于根据相似度和兴趣程度确定推荐度,根据推荐度确定向当前用户推荐的待推荐信息。
关于上述实施例中的基于知识图谱的数据推荐装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本发明实施例还提供一种基于知识图谱的数据推荐系统,该系统的结构如图7所示,包括:信息推荐服务器和终端设备;
信息推荐服务器71:信息推荐服务器中设置如前的基于知识图谱的数据推荐装置,用于确定向用户推荐的信息;
终端设备72:终端设备用于与用户进行人机交互,获取用户的输入信息以及将定向用户推荐的信息展示给用户。
基于同一发明构思,本发明实施例还提供一种计算机存储介质,计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前所述的基于知识图谱的数据推荐方法。
基于同一发明构思,本发明实施例还提供一种推荐服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现如前所述的基于知识图谱的数据推荐方法。
除非另外具体陈述,术语比如处理、计算、运算、确定、显示等等可以指一个或更多个处理或者计算系统、或类似设备的动作和/或过程,所述动作和/或过程将表示为处理系统的寄存器或存储器内的物理(如电子)量的数据操作和转换成为类似地表示为处理系统的存储器、寄存器或者其他此类信息存储、发射或者显示设备内的物理量的其他数据。信息和信号可以使用多种不同的技术和方法中的任何一种来表示。例如,在贯穿上面的描述中提及的数据、指令、命令、信息、信号、比特、符号和码片可以用电压、电流、电磁波、磁场或粒子、光场或粒子或者其任意组合来表示。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

Claims (10)

1.一种基于知识图谱的数据推荐方法,其特征在于,包括:
根据当前用户的身份权限信息选择相关知识图谱和学科场景;
从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与所述相关知识图谱中信息的相似度;
根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度,所述主题是根据所述学科场景和所述待推荐信息中涉及到的实体类型确定的;
根据所述相似度和所述兴趣程度确定推荐度;
根据所述推荐度确定向当前用户推荐的待推荐信息;
所述待推荐信息与所述相关知识图谱中信息的相似度,通过下述方式确定:
使用下列公式计算得到待推荐信息i与所述相关知识图谱中信息j的相似度:
Scontent(i,j)=(c(i)×c(j))×(t(i)×t(j))×(1+e(i)×e(j));
其中,Scontent(i,j)表示待推荐信息i和知识图谱中的信息j的相似度;
c(i)和c(j)分别表示待推荐信息i与知识图谱中的信息j形成的信息网络;
t(i)和t(j)分别表示待推荐信息i和知识图谱中的信息j的主题向量;所述主题向量t(i)是根据待推荐信息i中涉及到的实体类型和选择的学科场景构建的;t(j)是根据知识图谱中的信息j中涉及到的实体类型和选择的学科场景构建的;
e(i)和e(j)分别表示待推荐信息i和知识图谱中的信息j所涉及的实体向量。
2.如权利要求1所述的方法,其特征在于,其中:
实体向量e(i)是根据相关知识图谱从待推荐信息i中抽取所涉及的实体,根据抽取到的实体集合构建的;e(j)从知识图谱中的信息j中抽取所涉及的实体,根据抽取到的实体集合构建的;
c(i)是根据实体向量e(i)涉及到的实体集合,从相关知识图谱中获取相关信息构建的;c(j)是根据实体向量e(j)涉及到的实体集合,从相关知识图谱中获取相关信息构建的。
3.如权利要求1所述的方法,其特征在于,所述根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度,包括:
使用下列公式计算得到当前用户对所述学科场景所涉及到的主题的兴趣程度:
w(a,t)=fr(a,t)/fall(t);
其中,w(a,t)表示当前用户a对主题t的兴趣程度;
fr(a,t)表示当前用户a的历史行为数据中的信息属于或包含主题t的信息数量;
fall(t)表示所述相关知识图谱中属于或包含主题t的信息数量。
4.如权利要求1所述的方法,其特征在于,还包括:预先构建不同学科场景下的信息推荐候选集存储于信息数据库中;相应的,
所述从信息数据库中获取待推荐信息包括:根据选择的学科场景,从该学科场景的推荐信息候选集中选择待推荐信息;所述待推荐信息包括预置信息树、预置工作流、预置微件库、专业软件库、已归档项目成果、相关知识文档中的至少一项。
5.如权利要求1所述的方法,其特征在于,所述根据当前用户的身份权限信息选择学科场景,包括:
根据当前用户的身份权限信息,确定用户行为涉及到的用户个人页面、研究学科场景页面和浏览信息详情页面至少一个用户行为页面;
根据涉及到的用户行为页面选择用户感兴趣的学科场景。
6.如权利要求1-5任一所述的方法,其特征在于,还包括:
获取当前用户的关联用户的历史行为数据;
根据当前用户的历史行为数据和关联用户的历史行为数据,确定当前用户与关联用户之间的关联操作,从所述关联用户与所述关联操作相关信息中选择推荐信息推荐给当前用户。
7.一种基于知识图谱的数据推荐装置,其特征在于,包括:
选择模块,用于根据当前用户的身份权限信息选择相关知识图谱和学科场景;
第一确定模块,用于从信息数据库中获取待推荐信息,根据选择的学科场景和相关知识图谱,确定待推荐信息与所述相关知识图谱中信息的相似度;
第二确定模块,用于根据当前用户的历史行为数据中与选择的学科场景相关的信息,以及相关知识图谱中的信息与选择的学科场景相关的信息,确定当前用户对所述学科场景所涉及到的主题的兴趣程度,所述主题是根据所述学科场景和所述待推荐信息中涉及到的实体类型确定的;
推荐模块,用于根据所述相似度和所述兴趣程度确定推荐度,根据所述推荐度确定向当前用户推荐的待推荐信息;
所述待推荐信息与所述相关知识图谱中信息的相似度,通过下述方式确定:
使用下列公式计算得到待推荐信息i与所述相关知识图谱中信息j的相似度:
Scontent(i,j)=(c)(i)×c(j))×(t)(i)×t(j))×(1+e(i)×e(j));
其中,Scontent(i,j)表示待推荐信息i和知识图谱中的信息j的相似度;
c(i)和c(j)分别表示待推荐信息i与知识图谱中的信息j形成的信息网络;
t(i)和t(j)分别表示待推荐信息i和知识图谱中的信息j的主题向量;所述主题向量t(i)是根据待推荐信息i中涉及到的实体类型和选择的学科场景构建的;t(j)是根据知识图谱中的信息j中涉及到的实体类型和选择的学科场景构建的;
e(i)和e(j)分别表示待推荐信息i和知识图谱中的信息j所涉及的实体向量。
8.一种基于知识图谱的数据推荐系统,其特征在于,包括:信息推荐服务器和终端设备;
所述信息推荐服务器中设置如权利要求7所述的基于知识图谱的数据推荐装置,用于确定向用户推荐的信息;
所述终端设备用于与用户进行人机交互,获取用户的输入信息以及将定向用户推荐的信息展示给用户。
9.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1-6任一所述的基于知识图谱的数据推荐方法。
10.一种推荐服务器,其特征在于,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-6任一所述的基于知识图谱的数据推荐方法。
CN202211441694.3A 2022-11-17 2022-11-17 基于知识图谱的数据推荐方法、装置和系统 Active CN116089624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211441694.3A CN116089624B (zh) 2022-11-17 2022-11-17 基于知识图谱的数据推荐方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211441694.3A CN116089624B (zh) 2022-11-17 2022-11-17 基于知识图谱的数据推荐方法、装置和系统

Publications (2)

Publication Number Publication Date
CN116089624A CN116089624A (zh) 2023-05-09
CN116089624B true CN116089624B (zh) 2024-02-27

Family

ID=86205369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211441694.3A Active CN116089624B (zh) 2022-11-17 2022-11-17 基于知识图谱的数据推荐方法、装置和系统

Country Status (1)

Country Link
CN (1) CN116089624B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和系统
WO2020037930A1 (zh) * 2018-08-20 2020-02-27 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN111339429A (zh) * 2020-03-27 2020-06-26 上海景域智能科技有限公司 一种资讯推荐方法
CN112948569A (zh) * 2019-12-10 2021-06-11 中国石油天然气股份有限公司 基于活动知识图谱的科学工作流图版推送方法及装置
CN113449200A (zh) * 2020-03-26 2021-09-28 杭州海康威视数字技术股份有限公司 物品推荐方法、装置及计算机存储介质
CN113553510A (zh) * 2021-07-30 2021-10-26 华侨大学 一种文本信息推荐方法、装置及可读介质
WO2022048368A1 (zh) * 2020-09-02 2022-03-10 深圳壹账通智能科技有限公司 基于知识图谱的推荐方法、装置、计算机设备及存储介质
WO2022116537A1 (zh) * 2020-12-04 2022-06-09 上海帜讯信息技术股份有限公司 一种资讯推荐方法、装置、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753198B (zh) * 2020-06-22 2024-01-12 北京百度网讯科技有限公司 信息推荐方法和装置、以及电子设备和可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
WO2020037930A1 (zh) * 2018-08-20 2020-02-27 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法
CN110188208A (zh) * 2019-06-04 2019-08-30 河海大学 一种基于知识图谱的信息资源查询推荐方法和系统
CN112948569A (zh) * 2019-12-10 2021-06-11 中国石油天然气股份有限公司 基于活动知识图谱的科学工作流图版推送方法及装置
CN113449200A (zh) * 2020-03-26 2021-09-28 杭州海康威视数字技术股份有限公司 物品推荐方法、装置及计算机存储介质
CN111339429A (zh) * 2020-03-27 2020-06-26 上海景域智能科技有限公司 一种资讯推荐方法
WO2022048368A1 (zh) * 2020-09-02 2022-03-10 深圳壹账通智能科技有限公司 基于知识图谱的推荐方法、装置、计算机设备及存储介质
WO2022116537A1 (zh) * 2020-12-04 2022-06-09 上海帜讯信息技术股份有限公司 一种资讯推荐方法、装置、电子设备和存储介质
CN113553510A (zh) * 2021-07-30 2021-10-26 华侨大学 一种文本信息推荐方法、装置及可读介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于兴趣图谱的图书馆泛在服务模式构建研究;闫霏;;数字图书馆论坛(12);全文 *

Also Published As

Publication number Publication date
CN116089624A (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN111737495B (zh) 基于领域自分类的中高端人才智能推荐系统及其方法
Zhu et al. A survey on automatic infographics and visualization recommendations
Van Eck et al. Visualizing bibliometric networks
Xia et al. MVCWalker: Random walk-based most valuable collaborators recommendation exploiting academic factors
Mena‐Chalco et al. Brazilian bibliometric coauthorship networks
CN103425799A (zh) 基于主题的个性化研究方向推荐系统和推荐方法
Lee et al. Fundamentals of big data network analysis for research and industry
Atzmueller et al. Exploratory pattern mining on social media using geo-references and social tagging information
Shu Knowledge discovery in the social sciences: A data mining approach
Kewsuwun et al. A sentiment analysis model of agritech startup on Facebook comments using naive Bayes classifier.
Yoon et al. Exploring promising vacant technology areas in a technology-oriented company based on bibliometric analysis and visualisation
CN116186372A (zh) 一种能够提供个性化服务的书目系统
De Tré et al. Handling veracity in multi-criteria decision-making: A multi-dimensional approach
CN116049379A (zh) 知识推荐方法、装置、电子设备和存储介质
CN113157871B (zh) 应用人工智能的新闻舆情文本处理方法、服务器及介质
Panagiotidou et al. Communicating uncertainty in digital humanities visualization research
CN117056619A (zh) 确定用户行为特征的方法和装置
CN116089624B (zh) 基于知识图谱的数据推荐方法、装置和系统
CN116010681A (zh) 一种召回模型的训练及检索方法、装置及电子设备
Singh et al. Intelligent movie recommender framework based on content-based & collaborative filtering assisted with sentiment analysis
KR102282328B1 (ko) Lstm을 이용한 국가별 선호도 예측 시스템 및 방법
Utama et al. Scientific Articles Recommendation System Based On User’s Relatedness Using Item-Based Collaborative Filtering Method
KR102041915B1 (ko) 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법
Moalla et al. Integration of a multidimensional schema from different social media to analyze customers' opinions
Matsunaga et al. Data mining applications and techniques: A systematic review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant