CN116304303A - 一种基于知识图谱的资产推荐方法及系统 - Google Patents

一种基于知识图谱的资产推荐方法及系统 Download PDF

Info

Publication number
CN116304303A
CN116304303A CN202310049316.9A CN202310049316A CN116304303A CN 116304303 A CN116304303 A CN 116304303A CN 202310049316 A CN202310049316 A CN 202310049316A CN 116304303 A CN116304303 A CN 116304303A
Authority
CN
China
Prior art keywords
recommended
data
asset
data asset
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310049316.9A
Other languages
English (en)
Other versions
CN116304303B (zh
Inventor
金震
张京日
穆宇浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SunwayWorld Science and Technology Co Ltd
Original Assignee
Beijing SunwayWorld Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SunwayWorld Science and Technology Co Ltd filed Critical Beijing SunwayWorld Science and Technology Co Ltd
Priority to CN202310049316.9A priority Critical patent/CN116304303B/zh
Publication of CN116304303A publication Critical patent/CN116304303A/zh
Application granted granted Critical
Publication of CN116304303B publication Critical patent/CN116304303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的资产推荐方法及系统,其方法包括:S1:生成所有数据资产之间的血缘关系知识图谱;S2:基于血缘关系知识图谱和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果;用以基于血缘关系知识图谱和用户的行为数据以及数据资产间的关联性对数据资产进行相关挖掘,实现一种高精度的资产推荐方法。

Description

一种基于知识图谱的资产推荐方法及系统
技术领域
本发明涉及数据推荐技术领域,特别涉及一种基于知识图谱的资产推荐方法及系统。
背景技术
目前,在数据超市中,数据资产是客户定义的一类可以开放使用的数据资源,类似与电商平台里的商品。当用户浏览、访问或使用资产时,给用户提供个性化的资产推荐服务能提升用户与产品的黏度,用户能获得更好的使用体验。
但是,现存的技术多通过数据资产的内容相关性的角度,来实现数据资产的推荐,这种推荐机制推荐出的数据资产与用户已访问的数据资产自己的相关性程度不够高,进而导致用户对数据资产的黏度有所下降。
因此,本发明提出一种基于知识图谱的资产推荐方法及系统。
发明内容
本发明提供一种基于知识图谱的资产推荐方法及系统,用以基于血缘关系知识图谱中数据资产之间的血缘关系和用户的行为数据以及数据资产间的关联性,并结合协同过滤算法,实现对数据资产的相关挖掘,进而获得相关性程度更高的推荐结果,即实现了一种高精度的资产推荐方法。
本发明提供一种基于知识图谱的资产推荐方法,包括:
S1:生成数据资产库中所有数据资产之间的血缘关系知识图谱;
S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
优选的,所述的一种基于知识图谱的资产推荐方法,S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数,包括:
S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数;
S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数;
其中,第一待推荐数据资产集群包括:第一待推荐数据资产集群和第二待推荐数据资产集群;
第一待推荐数据资产包括:第三待推荐数据资产和第四待推荐数据资产;
相关系数包括:第一相关系数和第二相关系数。
优选的,所述的一种基于知识图谱的资产推荐方法,S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数,包括:
基于预设的血缘关系推荐机制确定出血缘关系推荐范围,基于用户的当前访问资产在血缘关系知识图谱中的位置和血缘关系推荐范围,在血缘关系知识图谱中划分出第一待推荐数据资产子集群;
基于血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数,计算出已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数。
优选的,所述的一种基于知识图谱的资产推荐方法,S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
对已访问数据资产进行特征提取,获得个性化访问数据资产特征;
基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群;
计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
优选的,所述的一种基于知识图谱的资产推荐方法,对已访问数据资产进行特征提取,获得个性化访问数据资产特征,包括:
确定出已访问数据资产中每个数据资产的基本属性,并将已访问数据资产中所有数据资产都拥有的基本属性作为共性属性,获得已访问数据资产的共性属性集群;
基于已访问数据资产生成数据资产访问记录链,基于已访问数据资产中每个数据资产的共性属性的第一表现值,确定出对应共性属性的数据资产表现值链;
基于数据资产表现值链和共性属性的属性拓展规则,确定出数据资产访问记录链中除当前访问资产以外剩余的每个数据资产的共性属性拓展权值,基于共性属性拓展值确定出对应共性属性的综合拓展权值;
将共性属性集群中综合拓展权值大于拓展权值阈值的共性属性作为目标依据拓展属性;
将所有目标依据拓展属性和对应的属性拓展规则当作个性化访问数据资产特征。
优选的,所述的一种基于知识图谱的资产推荐方法,基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群,包括:
基于个性化访问数据资产特征确定出所有目标依据拓展属性和对应的属性拓展规则;
确定出当前访问资产的目标依据拓展属性的第二表现值,基于对应目标依据拓展属性和属性拓展规则以及第二表现值确定出对应目标依据拓展属性的待筛选表现值范围;
将血缘关系知识图谱中满足对应目标依据拓展属性的待筛选表现值范围的数据资产作为第四待推荐数据资产,将基于所有目标依据拓展属性的待筛选表现值范围筛选出的第四待推荐数据资产汇总获得第二待推荐数据资产子集群。
优选的,所述的一种基于知识图谱的资产推荐方法,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
确定出第二待推荐数据资产子集群中每个第四待推荐数据资产满足的待筛选表现值范围对应的目标依据拓展属性的第三表现值;
基于当前访问资产的目标依据拓展属性的第二表现值和第三表现值以及对应目标依据拓展属性的待筛选表现值范围,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
优选的,所述的一种基于知识图谱的资产推荐方法,S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数,包括:
基于协同过滤算法和用户的行为数据,在大数据访问记录库中筛选出相似用户集群;
基于相似用户集群中的相似用户的资产访问记录,在血缘关系知识图谱中筛选出第二待推荐数据资产集群,并确定出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数。
优选的,所述的一种基于知识图谱的资产推荐方法,S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果,包括:
基于每个第三待推荐数据资产的第一相关系数和每个第四待推荐数据资产集群的第二相关系数以及每个第二待推荐数据资产的被推荐优先系数,生成资产推荐队列;
基于资产推荐队列获得数据资产推荐结果。
本发明提供一种基于知识图谱的资产推荐系统,包括:
生成模块,用于生成数据资产库中所有数据资产之间的血缘关系知识图谱;
第一确定模块,用于基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
第二确定模块,用于基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
推荐模块,用于基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于知识图谱的资产推荐方法流程图;
图2为本发明实施例中又一种基于知识图谱的资产推荐方法流程图;
图3为本发明实施例中一种基于知识图谱的资产推荐系统示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供了一种基于知识图谱的资产推荐方法,参考图1,包括:
S1:生成数据资产库中所有数据资产之间的血缘关系知识图谱;
S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
该实施例中,数据资产库即为用于存储所有数据资产的数据库。
该实施例中,数据资产指企业的数据资产。
该实施例中,血缘关系知识图谱即为包含数据资产库中所有数据资产之间的数据血缘关系的知识图谱。
该实施例中,血缘关系即为数据资产之间的数据血缘关系,即为在数据溯源的过程中找到相关数据之间的联系。
该实施例中,已访问数据资产即为用户在本次的数据资产访问过程中访问的所有数据资产。
该实施例中,个性化访问数据资产特征即为对用户的已访问数据资产进行特征提取后获得的特征,具体表现为用户访问过程中依据的数据资产的基本属性和属性拓展规则,属性拓展规则即当前访问数据资产的对应基本属性的值至下一个访问的数据资产的对应基本属性的值之间的拓展规则。
该实施例中,第一待推荐数据资产集群即为基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征确定出的可推荐给用户的数据资产构成的集群。
该实施例中,相关系数即为表征已访问数据资产和每个第一待推荐数据资产之间的相关程度的系数。
该实施例中,协同过滤算法即为通过用户的行为数据确定出可为用户推荐的数据资产的算法。
该实施例中,行为数据即为包含用户在本次访问数据资产过程中的数据资产访问、浏览过程和已访问的数据资产的数据。
该实施例中,第二待推荐数据资产集群即为基于协同过滤算法和用户的行为数据确定出可推荐给用户的数据资产构成的集群。
该实施例中,被推荐优先系数即为表征对应第二待推荐数据资产被推荐的优先程度的系数。
该实施例中,资产推荐结果即为基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数生成的可推荐给用户的数据资产结果。
以上技术的有益效果为:基于血缘关系知识图谱中数据资产之间的血缘关系和用户的行为数据以及数据资产间的关联性,并结合协同过滤算法,实现对数据资产的相关挖掘,进而获得相关性程度更高的推荐结果,即实现了一种高精度的资产推荐方法。
实施例2:
在实施例1的基础上,所述的一种基于知识图谱的资产推荐方法,S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数,参考图2,包括:
S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数;
S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数;
其中,第一待推荐数据资产集群包括:第一待推荐数据资产集群和第二待推荐数据资产集群;
第一待推荐数据资产包括:第三待推荐数据资产和第四待推荐数据资产;
相关系数包括:第一相关系数和第二相关系数。
该实施例中,当前访问资产即为用户最新访问的数据资产。
该实施例中,第一待推荐数据资产子集群即为基于用户的当前访问资产和血缘关系知识图谱中的血缘关系确定出的可推荐给用户的数据资产构成的集群。
该实施例中,第三待推荐数据资产即为第一待推荐数据资产子集群中包含的数据资产。
该实施例中,第一相关系数即为表征已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的相关程度的系数。
该实施例中,第二待推荐数据资产子集群即为基于用户的已访问数据资产的个性化访问数据资产特征确定出的可推荐给用户的数据资产构成的集群。
该实施例中,第四待推荐数据资产即为第二待推荐数据资产子集群中包含的数据资产。
该实施例中,第二相关系数即为表征已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的相关程度的系数。
以上技术的有益效果为:同时结合基于血缘关系知识图谱中的血缘关系以及已访问数据资产中的个性化访问数据资产特征确定出可推荐的数据资产,提高了数据资产推荐的精准度。
实施例3:
在实施例2的基础上,所述的一种基于知识图谱的资产推荐方法,S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数,包括:
基于预设的血缘关系推荐机制确定出血缘关系推荐范围,基于用户的当前访问资产在血缘关系知识图谱中的位置和血缘关系推荐范围,在血缘关系知识图谱中划分出第一待推荐数据资产子集群;
基于血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数,计算出已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数。
该实施例中,预设的血缘关系推荐机制即为预先确定的基于血缘关系确定可推荐数据资产的推荐机制,例如有:将血缘关系知识图谱中与当前访问的数据资产之间的最小单位血缘关系(例如:数据资产A与数据资产B有直接血缘关系(例如数据资产A由数据资产B生成,即为最小单位血缘关系),数据资产B与数据资产C有直接血缘关系,数据资产C与数据资产D有直接血缘关系,则数据资产A与数据资产C之间的最小单位血缘关系总数为3)的总数为3的数据资产作为可推荐数据资产。
该实施例中,基于血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数,计算出已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数,包括:
确定出血缘关系知识图谱中两个数据资产之间的最小单位血缘关系总数的最大值;
将血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数与对应最大值之间的比值作为第一相关系数。
以上技术的有益效果为:实现基于预设的血缘关系推荐机制对应的血缘关系推荐范围确定出可推荐给用户的数据资产,并基于血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数,计算出已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数。
实施例4:
在实施例2的基础上,所述的一种基于知识图谱的资产推荐方法,S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
对已访问数据资产进行特征提取,获得个性化访问数据资产特征;
基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群;
计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
以上技术的有益效果为:实现基于已访问数据资产的个性化访问数据资产特征在血缘关系知识图谱中筛选出第二待推荐数据资产子集群,并计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,即实现基于已访问数据的数据本身的属性实现数据资产的推荐。
实施例5:
在实施例4的基础上,所述的一种基于知识图谱的资产推荐方法,对已访问数据资产进行特征提取,获得个性化访问数据资产特征,包括:
确定出已访问数据资产中每个数据资产的基本属性,并将已访问数据资产中所有数据资产都拥有的基本属性作为共性属性,获得已访问数据资产的共性属性集群;
基于已访问数据资产生成数据资产访问记录链,基于已访问数据资产中每个数据资产的共性属性的第一表现值,确定出对应共性属性的数据资产表现值链;
基于数据资产表现值链和共性属性的属性拓展规则,确定出数据资产访问记录链中除当前访问资产以外剩余的每个数据资产的共性属性拓展权值,基于共性属性拓展值确定出对应共性属性的综合拓展权值;
将共性属性集群中综合拓展权值大于拓展权值阈值的共性属性作为目标依据拓展属性;
将所有目标依据拓展属性和对应的属性拓展规则当作个性化访问数据资产特征。
该实施例中,数据资产访问记录链即为基于已访问数据资产生成的包含本次访问过程中所有被访问的数据资产及其对应的访问顺序的链结构。
该实施例中,基本属性即为数据资产的基本属性,可以是数据内容方面的属性,例如:与用户相关的数据资产,与产品相关的数据资产;也可以是数据本身的属性,例如有:更新时间、数据规模等属性。
该实施例中,共性属性即为已访问数据资产中所有数据资产都拥有的基本属性。
该实施例中,共性属性集群即为已访问数据资产中所有数据资产都拥有的基本属性汇总后获得的集群。
该实施例中,第一表现值即为对应数据资产的对应共性属性的表现值,例如:对应数据资产的更新时间(共性属性)为2020年12月20日(第一表现值)。
该实施例中,共性属性的数据资产表现值链即为将已访问数据资产中每个数据资产的共性属性的第一表现值和数据资产访问记录链对应结合后获得的链结构。
该实施例中,属性拓展规则即为用户当前访问的数据资产的该共性属性的第一表现值和选择访问的下一数据资产的该共性属性的第一表现值的拓展规则,例如:当前访问的数据资产的更新时间(共性属性)为2020年12月20日(第一表现值),选择访问的下一数据资产的该共性属性的第一表现值可以是更新时间从2019年12月20日至2021年12月20日为止(即属性拓展规则)的数据资产。
该实施例中,基于数据资产表现值链和共性属性的属性拓展规则,确定出数据资产访问记录链中除当前访问资产以外剩余的每个数据资产的共性属性拓展权值,即为:
基于数据资产表现值链和共性属性的属性拓展规则,确定出数据资产访问记录链中除当前访问资产以外剩余的每个数据资产的对应共性属性的第一表现值和相邻下一个访问的数据资产的对应共性属性的第一表现值之间的差值;
确定出该差值和对应共性属性的属性拓展原则对应的待筛选表现值范围的比值;
将1与该比值的差值作为对应数据资产的共性属性拓展权值。
该实施例中,基于共性属性拓展值确定出对应共性属性的综合拓展权值,即为:
将对应共性属性的所有共性属性拓展值的平均值作为对应共性属性的综合拓展权值。
该实施例中,拓展权值阈值即为预设的用于筛选出目标依据拓展属性的综合拓展权值阈值。
该实施例中,目标依据拓展属性即为共性属性集群中综合拓展权值大于拓展权值阈值的共性属性。
以上技术的有益效果为:通过对已访问数据资产中所有数据资产的基本属性的共性属性的表现值的依次分析,并结合共性属性的属性拓展原则,确定出共性属性的综合拓展权值,再基于拓展权值阈值再共性属性集群中筛选出可作为后续推荐数据资产的依据的目标依据拓展属性,进而基于所有目标依据拓展属性和对应的属性拓展规则获得个性化访问数据资产特征,实现基于对已访问数据资产的本身属性和内容属性的分析,提供更高精度的数据资产推荐。
实施例6:
在实施例5的基础上,所述的一种基于知识图谱的资产推荐方法,基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群,包括:
基于个性化访问数据资产特征确定出所有目标依据拓展属性和对应的属性拓展规则;
确定出当前访问资产的目标依据拓展属性的第二表现值,基于对应目标依据拓展属性和属性拓展规则以及第二表现值确定出对应目标依据拓展属性的待筛选表现值范围;
将血缘关系知识图谱中满足对应目标依据拓展属性的待筛选表现值范围的数据资产作为第四待推荐数据资产,将基于所有目标依据拓展属性的待筛选表现值范围筛选出的第四待推荐数据资产汇总获得第二待推荐数据资产子集群。
该实施例中,第二表现值即为当前访问资产的目标依据拓展属性的表现值。
该实施例中,基于对应目标依据拓展属性和属性拓展规则以及第二表现值确定出对应目标依据拓展属性的待筛选表现值范围,例如:
当前访问的数据资产的数据规模(目标依据拓展属性)为2万个字段(第二表现值),属性拓展规则为数据规模的字段差值为2000个字段,则对应目标依据拓展属性的待筛选表现值范围为:数据规模范围为18000个字段至22000个字段。
该实施例中,第四待推荐数据资产即为血缘关系知识图谱中满足对应目标依据拓展属性的待筛选表现值范围的数据资产。
以上技术的有益效果为:基于个性化访问数据资产特征中所有目标依据拓展属性和对应的属性拓展规则以及当前访问资产的目标依据拓展属性的第二表现值,确定出目标依据拓展属性的待筛选表现值范围,进而实现基于个性化访问数据资产特征在血缘关系知识图谱中筛选出克推荐给用户的数据资产,实现基于个性化访问数据资产特征的高精度数据资产推荐。
实施例7:
在实施例5的基础上,所述的一种基于知识图谱的资产推荐方法,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
确定出第二待推荐数据资产子集群中每个第四待推荐数据资产满足的待筛选表现值范围对应的目标依据拓展属性的第三表现值;
基于当前访问资产的目标依据拓展属性的第二表现值和第三表现值以及对应目标依据拓展属性的待筛选表现值范围,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
该实施例中,第三表现值即为第四待推荐数据资产满足的待筛选表现值范围对应的目标依据拓展属性的表现值。
该实施例中,基于当前访问资产的目标依据拓展属性的第二表现值和第三表现值以及对应目标依据拓展属性的待筛选表现值范围,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
Figure BDA0004057090050000151
式中,α为已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,b2为当前访问资产的目标依据拓展属性的第二表现值,b3为每个第四待推荐数据资产满足的待筛选表现值范围对应的目标依据拓展属性的第三表现值,Cmax为对应目标依据拓展属性的待筛选表现值范围上限值,Cmin为对应目标依据拓展属性的待筛选表现值范围下限值;
基于上述公式可以准确计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
以上技术的有益效果为:基于当前访问资产的目标依据拓展属性的第二表现值和第三表现值以及对应目标依据拓展属性的待筛选表现值范围,可以准确计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,进而为后续的数据资产推荐提供准确依据。
实施例8:
在实施例1的基础上,所述的一种基于知识图谱的资产推荐方法,S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数,包括:
基于协同过滤算法和用户的行为数据,在大数据访问记录库中筛选出相似用户集群;
基于相似用户集群中的相似用户的资产访问记录,在血缘关系知识图谱中筛选出第二待推荐数据资产集群,并确定出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数。
该实施例中,大数据访问记录库即为包含所有访问过数据资产库的用户的数据资产访问全程的记录数据的数据库。
该实施例中,相似用户集群即为基于协同过滤算法和用户的行为数据在大数据访问记录库中筛选出与当前用户存在相似的访问行为的用户构成的集群。
该实施例中,资产访问记录即为相似用户的资产访问过程的记录。
该实施例中,相似用户即为基于协同过滤算法和用户的行为数据在大数据访问记录库中筛选出与当前用户存在相似的访问行为的用户。
该实施例中,确定出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数,包括:
基于所有相似用户的资产访问记录中包含对应第二待推荐数据资产的资产访问记录总条数,计算出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数,包括:
Figure BDA0004057090050000161
式中,β为第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数,z为所有相似用户的资产访问记录中包含对应第二待推荐数据资产的资产访问记录总条数,Z为所有相似用户的资产访问记录的总条数;
基于上述公式可以从相似用户的资产访问记录中的访问频率的角度,准确计算出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数。
以上技术的有益效果为:实现基于协同过滤算法和用户的行为数据筛选出相似用户集群,并基于相似用户的资产访问记录在血缘关系知识图谱中筛选出第二待推荐数据资产集群,并确定出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数,进而为后续的数据资产推荐提供准确依据。
实施例9:
在实施例2的基础上,所述的一种基于知识图谱的资产推荐方法,S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果,包括:
基于每个第三待推荐数据资产的第一相关系数和每个第四待推荐数据资产集群的第二相关系数以及每个第二待推荐数据资产的被推荐优先系数,生成资产推荐队列;
基于资产推荐队列获得数据资产推荐结果。
该实施例中,基于每个第三待推荐数据资产的第一相关系数和每个第四待推荐数据资产集群的第二相关系数以及每个第二待推荐数据资产的被推荐优先系数,生成资产推荐队列,包括:
将所有第三待推荐数据资产和第四待推荐数据资产集群以及第二待推荐数据资产进行去重汇总,获得最终待推荐数据资产;
将最终待推荐数据资产的第一相关系数和第二相关系数以及被推荐优先系数的平均值(当最终推荐数据资产只有第一相关系数和第二相关系数以及被推荐优先系数中的一种或两种时,则基于现有的系数求平均)作为最终被推荐优先系数;
基于最终被推荐优先系数从大到小的顺序,将所有最终待推荐数据资产排序,获得资产推荐队列。
该实施例中,资产推荐队列即为基于每个第三待推荐数据资产的第一相关系数和每个第四待推荐数据资产集群的第二相关系数以及每个第二待推荐数据资产的被推荐优先系数生成的由最终可以推荐给用户的所有数据资产排序获得的队列。
该实施例中,基于资产推荐队列获得数据资产推荐结果,即为:
基于实际推荐需求,在资产推荐队列中提取最终推荐给用户的数据资产,获得数据资产推荐结果。
以上技术的有益效果为:实现综合基于血缘关系和用户的欣慰数据以及已访问数据的本身属性获得的推荐结果,获得最终的推荐结果。
实施例10:
本发明提供了一种基于知识图谱的资产推荐系统,参考图3,包括:
生成模块,用于生成数据资产库中所有数据资产之间的血缘关系知识图谱;
第一确定模块,用于基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
第二确定模块,用于基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
推荐模块,用于基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
以上技术的有益效果为:基于血缘关系知识图谱中数据资产之间的血缘关系和用户的行为数据以及数据资产间的关联性,并结合协同过滤算法,实现对数据资产的相关挖掘,进而获得相关性程度更高的推荐结果,即实现了一种高精度的资产推荐方法。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于知识图谱的资产推荐方法,其特征在于,包括:
S1:生成数据资产库中所有数据资产之间的血缘关系知识图谱;
S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
2.根据权利要求1所述的一种基于知识图谱的资产推荐方法,其特征在于,S2:基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数,包括:
S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数;
S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数;
其中,第一待推荐数据资产集群包括:第一待推荐数据资产集群和第二待推荐数据资产集群;
第一待推荐数据资产包括:第三待推荐数据资产和第四待推荐数据资产;
相关系数包括:第一相关系数和第二相关系数。
3.根据权利要求2所述的一种基于知识图谱的资产推荐方法,其特征在于,S201:基于用户的当前访问资产和血缘关系知识图谱中的血缘关系,确定出第一待推荐数据资产子集群以及已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数,包括:
基于预设的血缘关系推荐机制确定出血缘关系推荐范围,基于用户的当前访问资产在血缘关系知识图谱中的位置和血缘关系推荐范围,在血缘关系知识图谱中划分出第一待推荐数据资产子集群;
基于血缘关系知识图谱中当前访问资产和每个第三待推荐数据资产之间的最小单位血缘关系总数,计算出已访问数据资产和第一待推荐数据资产子集群中每个第三待推荐数据资产之间的第一相关系数。
4.根据权利要求2所述的一种基于知识图谱的资产推荐方法,其特征在于,S202:基于用户的已访问数据资产的个性化访问数据资产特征,确定出第二待推荐数据资产子集群以及已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
对已访问数据资产进行特征提取,获得个性化访问数据资产特征;
基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群;
计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
5.根据权利要求4所述的一种基于知识图谱的资产推荐方法,其特征在于,对已访问数据资产进行特征提取,获得个性化访问数据资产特征,包括:
确定出已访问数据资产中每个数据资产的基本属性,并将已访问数据资产中所有数据资产都拥有的基本属性作为共性属性,获得已访问数据资产的共性属性集群;
基于已访问数据资产生成数据资产访问记录链,基于已访问数据资产中每个数据资产的共性属性的第一表现值,确定出对应共性属性的数据资产表现值链;
基于数据资产表现值链和共性属性的属性拓展规则,确定出数据资产访问记录链中除当前访问资产以外剩余的每个数据资产的共性属性拓展权值,基于共性属性拓展值确定出对应共性属性的综合拓展权值;
将共性属性集群中综合拓展权值大于拓展权值阈值的共性属性作为目标依据拓展属性;
将所有目标依据拓展属性和对应的属性拓展规则当作个性化访问数据资产特征。
6.根据权利要求5所述的一种基于知识图谱的资产推荐方法,其特征在于,基于个性化访问数据资产特征,在血缘关系知识图谱中筛选出第二待推荐数据资产子集群,包括:
基于个性化访问数据资产特征确定出所有目标依据拓展属性和对应的属性拓展规则;
确定出当前访问资产的目标依据拓展属性的第二表现值,基于对应目标依据拓展属性和属性拓展规则以及第二表现值确定出对应目标依据拓展属性的待筛选表现值范围;
将血缘关系知识图谱中满足对应目标依据拓展属性的待筛选表现值范围的数据资产作为第四待推荐数据资产,将基于所有目标依据拓展属性的待筛选表现值范围筛选出的第四待推荐数据资产汇总获得第二待推荐数据资产子集群。
7.根据权利要求5所述的一种基于知识图谱的资产推荐方法,其特征在于,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数,包括:
确定出第二待推荐数据资产子集群中每个第四待推荐数据资产满足的待筛选表现值范围对应的目标依据拓展属性的第三表现值;
基于当前访问资产的目标依据拓展属性的第二表现值和第三表现值以及对应目标依据拓展属性的待筛选表现值范围,计算出已访问数据资产和第二待推荐数据资产子集群中每个第四待推荐数据资产之间的第二相关系数。
8.根据权利要求1所述的一种基于知识图谱的资产推荐方法,其特征在于,S3:基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数,包括:
基于协同过滤算法和用户的行为数据,在大数据访问记录库中筛选出相似用户集群;
基于相似用户集群中的相似用户的资产访问记录,在血缘关系知识图谱中筛选出第二待推荐数据资产集群,并确定出第二待推荐数据资产集群中每个第二待推荐数据资产的被推荐优先系数。
9.根据权利要求2所述的一种基于知识图谱的资产推荐方法,其特征在于,S4:基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果,包括:
基于每个第三待推荐数据资产的第一相关系数和每个第四待推荐数据资产集群的第二相关系数以及每个第二待推荐数据资产的被推荐优先系数,生成资产推荐队列;
基于资产推荐队列获得数据资产推荐结果。
10.一种基于知识图谱的资产推荐系统,其特征在于,包括:
生成模块,用于生成数据资产库中所有数据资产之间的血缘关系知识图谱;
第一确定模块,用于基于血缘关系知识图谱中的血缘关系和用户的已访问数据资产的个性化访问数据资产特征,确定出第一待推荐数据资产集群以及已访问数据资产和每个第一待推荐数据资产之间的相关系数;
第二确定模块,用于基于协同过滤算法和用户的行为数据,确定出第二待推荐数据资产集群和每个第二待推荐数据资产的被推荐优先系数;
推荐模块,用于基于每个第一待推荐数据资产的相关系数和每个第二待推荐数据资产的被推荐优先系数,获得数据资产推荐结果。
CN202310049316.9A 2023-02-01 2023-02-01 一种基于知识图谱的资产推荐方法及系统 Active CN116304303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310049316.9A CN116304303B (zh) 2023-02-01 2023-02-01 一种基于知识图谱的资产推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310049316.9A CN116304303B (zh) 2023-02-01 2023-02-01 一种基于知识图谱的资产推荐方法及系统

Publications (2)

Publication Number Publication Date
CN116304303A true CN116304303A (zh) 2023-06-23
CN116304303B CN116304303B (zh) 2023-09-08

Family

ID=86836783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310049316.9A Active CN116304303B (zh) 2023-02-01 2023-02-01 一种基于知识图谱的资产推荐方法及系统

Country Status (1)

Country Link
CN (1) CN116304303B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150370798A1 (en) * 2014-06-18 2015-12-24 Facebook, Inc. Ranking and Filtering Groups Recommendations
CN111506823A (zh) * 2020-03-11 2020-08-07 平安科技(深圳)有限公司 信息推荐方法、装置及计算机设备
CN111768231A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 产品信息推荐方法及装置
CN112149004A (zh) * 2020-10-30 2020-12-29 中国科学院计算技术研究所 一种基于协同知识图谱的个性化推荐方法
CN112711591A (zh) * 2020-12-31 2021-04-27 天云融创数据科技(北京)有限公司 基于知识图谱的字段级的数据血缘确定方法及装置
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
WO2022116537A1 (zh) * 2020-12-04 2022-06-09 上海帜讯信息技术股份有限公司 一种资讯推荐方法、装置、电子设备和存储介质
CN114707056A (zh) * 2022-03-04 2022-07-05 深圳大学 一种基于知识图谱的可解释推荐方法及相关装置
CN114733202A (zh) * 2022-04-08 2022-07-12 南京信息职业技术学院 一种基于moba类游戏技能加点的推荐方法
CN114925273A (zh) * 2022-05-23 2022-08-19 天津众群科技有限公司 基于大数据分析的用户行为预测方法及ai预测分析系统
CN115168744A (zh) * 2022-08-09 2022-10-11 舟山广播电视总台 基于用户画像和知识图谱的广电技术知识推荐方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150370798A1 (en) * 2014-06-18 2015-12-24 Facebook, Inc. Ranking and Filtering Groups Recommendations
CN111506823A (zh) * 2020-03-11 2020-08-07 平安科技(深圳)有限公司 信息推荐方法、装置及计算机设备
CN111768231A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 产品信息推荐方法及装置
CN112149004A (zh) * 2020-10-30 2020-12-29 中国科学院计算技术研究所 一种基于协同知识图谱的个性化推荐方法
WO2022116537A1 (zh) * 2020-12-04 2022-06-09 上海帜讯信息技术股份有限公司 一种资讯推荐方法、装置、电子设备和存储介质
CN112711591A (zh) * 2020-12-31 2021-04-27 天云融创数据科技(北京)有限公司 基于知识图谱的字段级的数据血缘确定方法及装置
CN113190593A (zh) * 2021-05-12 2021-07-30 《中国学术期刊(光盘版)》电子杂志社有限公司 一种基于数字人文知识图谱的搜索推荐方法
CN114707056A (zh) * 2022-03-04 2022-07-05 深圳大学 一种基于知识图谱的可解释推荐方法及相关装置
CN114733202A (zh) * 2022-04-08 2022-07-12 南京信息职业技术学院 一种基于moba类游戏技能加点的推荐方法
CN114925273A (zh) * 2022-05-23 2022-08-19 天津众群科技有限公司 基于大数据分析的用户行为预测方法及ai预测分析系统
CN115168744A (zh) * 2022-08-09 2022-10-11 舟山广播电视总台 基于用户画像和知识图谱的广电技术知识推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙雨生;陈玉慧;廖盼;: "社交图谱及其应用研究", 情报理论与实践, no. 04 *

Also Published As

Publication number Publication date
CN116304303B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
CN107391687B (zh) 一种面向地方志网站的混合推荐系统
US11756245B2 (en) Machine learning to generate and evaluate visualizations
US20220284457A1 (en) Customer clustering using integer programming
US11755769B2 (en) Differentially private query budget refunding
CN108885624B (zh) 信息推荐系统及方法
US20180300296A1 (en) Document similarity analysis
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
CN103593392A (zh) 用于生成推荐的方法和系统
JP6668892B2 (ja) アイテム推薦プログラム、アイテム推薦方法およびアイテム推薦装置
US20040267553A1 (en) Evaluating storage options
CN111079009A (zh) 一种用于政务地图服务的用户兴趣检测方法及系统
Zhang et al. Reputationpro: The efficient approaches to contextual transaction trust computation in e-commerce environments
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
JP2017201535A (ja) 判定装置、学習装置、判定方法及び判定プログラム
Lin Association rule mining for collaborative recommender systems.
US10191988B2 (en) System and method for returning prioritized content
CN116304303B (zh) 一种基于知识图谱的资产推荐方法及系统
CN114756758B (zh) 一种混合推荐方法和系统
CN111125158A (zh) 数据表处理方法、装置、介质及电子设备
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
US10496693B2 (en) Unified classification and ranking strategy
CN110959157A (zh) 加速大规模相似性计算
CN108985811A (zh) 用于精准营销的方法、装置及电子设备
US7756854B2 (en) Minimization of calculation retrieval in a multidimensional database
CN110941714A (zh) 分类规则库构建方法、应用分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant