CN116756431B - 不完备形式背景下基于近似概念的信息或物品推荐方法 - Google Patents

不完备形式背景下基于近似概念的信息或物品推荐方法 Download PDF

Info

Publication number
CN116756431B
CN116756431B CN202311020148.7A CN202311020148A CN116756431B CN 116756431 B CN116756431 B CN 116756431B CN 202311020148 A CN202311020148 A CN 202311020148A CN 116756431 B CN116756431 B CN 116756431B
Authority
CN
China
Prior art keywords
user
information
concept
articles
approximate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311020148.7A
Other languages
English (en)
Other versions
CN116756431A (zh
Inventor
刘博涛
刘忠慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202311020148.7A priority Critical patent/CN116756431B/zh
Publication of CN116756431A publication Critical patent/CN116756431A/zh
Application granted granted Critical
Publication of CN116756431B publication Critical patent/CN116756431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了不完备形式背景下基于近似概念的信息或物品推荐方法,属于大数据技术领域。该方法包括以下步骤:获取已有的同类信息或同类物品的数据信息,同时获取用户对前述信息或物品的获得信息;利用用户是否获得过信息或物品,生成用户与信息或物品的不完备形式背景;在不完备形式背景下,采用启发式方法为每个用户生成X近似概念,得到X近似概念集合;最终基于X近似概念集合,融入用户相似度计算推荐置信度,实现对每个用户进行信息或物品的个性化推荐。本发明的方法,将不完备形式背景下的不确定信息纳入概念的生成当中,与部分经典方法相比该方法有更好的推荐效果。

Description

不完备形式背景下基于近似概念的信息或物品推荐方法
技术领域
本发明涉及大数据技术领域,具体涉及一种不完备形式背景下基于近似概念的信息或物品推荐方法。
背景技术
利用已有信息,对用户进行信息或物品推荐是目前的研究热点,几乎所有的大型软件上都有相应的推荐方法。将形式概念分析运用到推荐领域目前已有许多研究成果,基于概念格的推荐算法时间复杂度高,并不适用于数据量大的情况,且这些方法都是基于完备形式背景,并没有考虑存信息缺失的情况,在进行个性化推荐时效果不佳。
发明内容
为解决上述至少一种问题,本发明提出了一种不完备形式背景下基于近似概念的信息或物品推荐方法,其不需要构造复杂的概念格,只需为每个用户构造近似概念。该方法将不完备形式背景的缺失信息运用到概念生成当中,在进行个性化推荐时将用户相似性融入到推荐置信度算法当中,有效的提高了推荐效果。
本发明的技术方案如下,不完备形式背景下基于近似概念的信息或物品推荐方法,包括如下步骤:
S1、获取已有的同类信息或同类物品的数据信息,同时获取用户对前述信息或物品的获得信息;
S2、利用用户是否获得过信息或物品,生成用户与信息或物品的不完备形式背景;
S3、在S2的不完备形式背景下,采用启发式方法为每个用户生成X近似概念,得到X近似概念集合;
S4、基于X近似概念集合,融入用户相似度计算推荐置信度,对每个用户进行信息或物品的个性化推荐。
本发明的有益效果在于:在不完备形式背景下以概念外延相似度为优化目标为每个用户生成X近似概念,降低了时间复杂度。由于越相似的用户推荐准确率越高,本发明在基于X近似概念计算推荐置信度时结合了用户的相似度,提高了推荐的准确率。本发明实现了在不完备形式背景下高效,精准的向目标用户进行个性化推荐的方法。
具体实施方式
为了对本发明的技术特征、目的和有益效果有更加清楚的理解,现对本发明的技术方案进行以下详细说明,但不能理解为对本发明的可实施范围的限定。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护范围。
下面结合实施例对本发明进一步说明。
不完备形式背景下基于近似概念的信息或物品推荐方法,包括以下步骤:
S1、获取已有的同类信息或同类物品的数据信息,同时获取用户对前述信息或物品的获得信息;
其中,本步骤中,主要获得的信息有:用户,已有的同类信息或同类物品,每一个用户对已有的同类信息或同类物品的获得情况,该获得情况有以下几种形式:该用户获得过该物品或该信息,该用户未获得过该物品或该信息,该用户对该物品或该信息的获得情况缺失。
S2、利用用户是否获得过信息或物品,生成用户与信息或物品的不完备形式背景;
具体的,基于S1中获得的数据信息,建立相应的数据集:用户集O={u0,u1,…,ua},式中,a表示用户总个数,信息或物品集A={m0,m1…mb},式中,b为同类信息或同类物品的总个数。
根据用户对信息或物品的获得情况,建立获取集R*∈O×A,同时,对获取集R*内的个体元素进行赋值,赋值规则如下:对于获取集R*内的个体元素(u,m),当用户u获得过信息或物品m时,(u,m)的赋值为r(u,m)=1;当用户u未获得过信息或物品m,(u,m)的赋值为r(u,m)=0;当用户u对信息或物品m的获得情况不确定时,(u,m)的赋值为r(u,m)=*。
最终,建立用户与信息或物品的不完备形式背景F*={O,A,R*}。
S3、在S2的不完备形式背景下,采用启发式方法为每个用户生成X近似概念,得到X近似概念集合;
本步骤中,首先生成一个用户的概念,随后基于概念更新概念外延生成X近似概念;后重复前述操作,直至获得用户集每一个用户的X近似概念。其具体操作如下:
对于用户获取该用户曾经获得过的信息或物品并生成集合Mu={mu|r(u,mu)=1,mu∈A},对于该集合中的信息或物品,以其总体获得人数对其进行排序,取获得人数最多的信息或物品作为概念内涵I,通过共有对象算子g(I)产生概念外延E,并通过共有属性算子f(E)对概念内涵I更新。以概念外延用户集合平均相似度OSS(E)为优化目标对概念进行更新,将排序Mu中的mu依次并入I,若OSS(g(I∪{mu}))≥OSS(E),则E=g(I∪{mu}),I=f(E);若OSS(g(I∪{mu}))≤OSS(E)则停止更新生成用户u的概念C=(E,I)。
对于共有属性算子f(),其含义是对于概念外延用户集合E,f(E)表示用户集合E中每个用户之间所共有的属性的集合;对于共有对象算子g(),其含义是对于概念内涵属性集合I,g(I)表示属性集合I中所有属性都被包含的用户集合,这两者都属于本领域常见算子,因此对其不予赘述。
其中,OSS()表示用户集合平均相似度:设定OSS(U)表示计算用户集合U所有对象间的平均相似度/>|*|表示集合的基数;Sim(ui,uj)表示两个用户间的余弦相似度:M={mij|r(ui,mij)≠*,r(uj,mij)≠*,mij∈A}。OSS(E)表示计算概念外延用户集合平均相似度。
基于概念C=(E,I)更新概念外延E生成X近似概念:在F*下筛选出不完全获得概念内涵I中信息或物品的用户集合UI={u~E|r(u~E,mI)≠0,u~E∈O-E},逐个验证UI中的用户u~E,是否满足OSS(E∪{u~E})≥OSS(E),若满足则将u~E保留在UI,若不满足则更新UI=UI-{u~E},最终更新X近似概念外延Ex=E∪UI,获得X近似概念Cx=(Ex,I)。
重复上述操作,直至获得用户集中每一个用户的X近似概念。
S4、基于X近似概念集合,融入用户相似度计算推荐置信度,对每个用户进行信息或物品个性化推荐。
对于用户筛选出u未获得的信息或物品集M~u={m~u|r(u,m~u)=0,m~u∈A},以及X近似概念集合Cx中概念外延包含u的所有X近似概念/>计算每个m~u基于/>的推荐置信度/>判断其与推荐置信度阈值λ的大小关系,若/> 使得/>则向用户u推荐m~u,否则不推荐;其中,推荐置信度的计算公式如下:
式中,为基于X近似概念/>向用户u推荐m~u的推荐置信度,/>表示的外延,Sim(u,u′)表示用户和用户之间的余弦相似度。
为了进一步使得本领域技术人员理解本发明实施例的方法,下面采用具体的例子进行说明。
选取待推荐信息为电影,根据不同的数据来源,获取相应的数据集,如表1所示。
表1获取的原始数据集
同时,为了模拟不完备形式背景,通过随机抽取的方法,将数据集中的部分信息处理成缺失,其中信息缺失率设置为0.1。
同时,为了突出本发明实施例中方法(RXCS)的优势,采用本领域多种常见的推荐方法进行对比,比如kNN(k=5)算法、IBCF算法、GRHC算法和GreConD-kNN算法,这些算法属于本领域常见的算法,因此在此对其具体操作过程不予赘述。最终测试结果如表2所示。
表2算法准确性测试结果
表2中,采用准确率precision、召回率recall和F1值来对其推荐质量进行评价,这三个指标是本领域常见的用于评价准确性的指标,因此对其计算方法不予赘述。其中,表2中的粗体是多个方法中效果较好的结果。
从表2可以看出,对于3个数据集来讲,利用本发明实施例的方法的推荐效果,优于其他常见的推荐算法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (2)

1.不完备形式背景下基于近似概念的信息或物品推荐方法,其特征在于,包括以下步骤:
S1、获取已有的同类信息或同类物品的数据信息,同时获取用户对前述信息或物品的获得信息;
S2、利用用户是否获得过信息或物品,生成用户与信息或物品的不完备形式背景,具体包括以下步骤:
建立用户集O={u0,u1,…,ua},式中,a表示用户总个数;建立信息或物品集,A={m0,m1…mb},式中,b为同类信息或同类物品的总个数;
根据用户对信息或物品的获得情况,建立获取集R*∈O×A,同时,对获取集R*内的个体元素进行赋值,赋值规则如下:对于获取集R*内的个体元素(u,m),当用户u获得过信息或物品m时,(u,m)的赋值为r(u,m)=1;当用户u未获得过信息或物品m,(u,m)的赋值为r(u,m)=0;当用户对信息或物品的获得情况不确定时,(u,m)的赋值为r(u,m)=*;
最终,建立用户与信息或物品的不完备形式背景;
S3、在S2的不完备形式背景下,采用启发式方法为每个用户生成X近似概念,得到X近似概念集合,具体步骤如下:
采用启发式为用户生成概念C=(E,I):对于不完备形式背景F*={O,A,R*},R*∈O×A,对于用户获取该用户u曾经获得过的信息或物品Mu={mu|r(u,mu)=1,mu∈A},并以获得信息或物品的人数对其进行排序,将拥有人数最多的信息或物品作为概念内涵I,通过共有对象算子g(I)产生概念外延E,并通过共有属性算子f(E)对概念内涵I更新;以概念外延用户集合平均相似度OSS(E)为优化目标对概念进行更新,将排序后的Mu中的mu依次并入I,若OSS(g(I∪{mu}))≥OSS(E),则E=g(I∪{mu}),I=f(E);若OSS(g(I∪{mu}))≤OSS(E)则停止更新,生成用户u的概念C=(E,I),式中,OSS()表示用户集合平均相似度;
基于概念C=(E,I)更新概念外延E生成X近似概念:在F*下筛选出不完全获得概念内涵I中信息或物品的用户集合逐个验证UI中的用户u~E,是否满足OSS(E∪{u~E})≥OSS(E),若满足则将u~E保留在UI,若不满足则更新UI=UI-{u~E},最终更新X近似概念外延Ex=E∪UI,获得X近似概念Cx=(Ex,I);
重复上述步骤,为O中的每个用户生成X近似概念,得到X近似概念集合Cx
S4、基于X近似概念集合,融入用户相似度计算推荐置信度,对每个用户进行信息或物品的个性化推荐。
2.根据权利要求1所述的方法,其特征在于,S4中,其具体步骤如下所示:
对于O中的每个用户进行个性化推荐:对于不完备形式背景F*={O,A,R*},对于用户筛选出u未获得的信息或物品集M~u={m~u|r(u,m~u)=0,m~u∈A},以及X近似概念集合Cx中概念外延包含u的所有X近似概念/>计算每个m~u基于/>的推荐置信度/>并判断其与推荐置信度阈值λ的大小关系,若/> 使得则向用户u推荐m~u,否则不推荐;其中,推荐置信度/>的计算公式如下:
式中,为基于X近似概念/>向用户u推荐m~u的推荐置信度,/>表示/>的概念外延,Sim(u,u′)表示用户u和用户u′之间的余弦相似度。
CN202311020148.7A 2023-08-14 2023-08-14 不完备形式背景下基于近似概念的信息或物品推荐方法 Active CN116756431B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311020148.7A CN116756431B (zh) 2023-08-14 2023-08-14 不完备形式背景下基于近似概念的信息或物品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311020148.7A CN116756431B (zh) 2023-08-14 2023-08-14 不完备形式背景下基于近似概念的信息或物品推荐方法

Publications (2)

Publication Number Publication Date
CN116756431A CN116756431A (zh) 2023-09-15
CN116756431B true CN116756431B (zh) 2023-10-31

Family

ID=87953602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311020148.7A Active CN116756431B (zh) 2023-08-14 2023-08-14 不完备形式背景下基于近似概念的信息或物品推荐方法

Country Status (1)

Country Link
CN (1) CN116756431B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912637A (zh) * 2016-04-08 2016-08-31 西藏飞跃智能科技有限公司 一种基于知识的用户兴趣挖崛方法
CN107122989A (zh) * 2017-03-21 2017-09-01 浙江工业大学 一种面向化妆品的多角度混合推荐方法
EP3314903A1 (en) * 2015-06-26 2018-05-02 British Telecommunications public limited company Digital content provision
CN110580526A (zh) * 2019-08-30 2019-12-17 太原理工大学 基于乐观概念的不完备决策信息系统规则提取算法
CN111090743A (zh) * 2019-11-26 2020-05-01 华南师范大学 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置
CN111241420A (zh) * 2020-01-10 2020-06-05 云境商务智能研究院南京有限公司 一种基于社交网络信息扩散感知的推荐方法
CN111597217A (zh) * 2020-05-07 2020-08-28 辽宁师范大学 基于模糊对象语言概念格的个性化推荐方法
CN113553399A (zh) * 2021-07-16 2021-10-26 山东建筑大学 基于模糊语言近似概念格的文本搜索方法及系统
CN113590806A (zh) * 2021-08-02 2021-11-02 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN114119069A (zh) * 2021-10-29 2022-03-01 大箴(杭州)科技有限公司 资源管理产品推荐方法及装置、电子设备、存储介质
CN114708056A (zh) * 2022-03-08 2022-07-05 山东建筑大学 一种基于模糊对象语言概念格聚类的个性化商品推荐方法
CN116204721A (zh) * 2023-03-10 2023-06-02 南京邮电大学 基于用户记录反馈与搜索内容的概念格推荐方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10247928A1 (de) * 2001-10-31 2003-05-28 Ibm Auslegen von Empfehlungssystemen, so dass sie allgemeine Eigenschaften im Empfehlungsprozess behandeln
US20160205003A1 (en) * 2015-01-08 2016-07-14 Formcept Technologies and Solutions Private Limited Method to provide inferred intentional data analysis to user(s), using IoT (Internet of Things) devices

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3314903A1 (en) * 2015-06-26 2018-05-02 British Telecommunications public limited company Digital content provision
CN105912637A (zh) * 2016-04-08 2016-08-31 西藏飞跃智能科技有限公司 一种基于知识的用户兴趣挖崛方法
CN107122989A (zh) * 2017-03-21 2017-09-01 浙江工业大学 一种面向化妆品的多角度混合推荐方法
CN110580526A (zh) * 2019-08-30 2019-12-17 太原理工大学 基于乐观概念的不完备决策信息系统规则提取算法
CN111090743A (zh) * 2019-11-26 2020-05-01 华南师范大学 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置
CN111241420A (zh) * 2020-01-10 2020-06-05 云境商务智能研究院南京有限公司 一种基于社交网络信息扩散感知的推荐方法
CN111597217A (zh) * 2020-05-07 2020-08-28 辽宁师范大学 基于模糊对象语言概念格的个性化推荐方法
CN113553399A (zh) * 2021-07-16 2021-10-26 山东建筑大学 基于模糊语言近似概念格的文本搜索方法及系统
CN113590806A (zh) * 2021-08-02 2021-11-02 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN114119069A (zh) * 2021-10-29 2022-03-01 大箴(杭州)科技有限公司 资源管理产品推荐方法及装置、电子设备、存储介质
CN114708056A (zh) * 2022-03-08 2022-07-05 山东建筑大学 一种基于模糊对象语言概念格聚类的个性化商品推荐方法
CN116204721A (zh) * 2023-03-10 2023-06-02 南京邮电大学 基于用户记录反馈与搜索内容的概念格推荐方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Application of ART and concept similarity in E-commerce recommendation system;Xu Hong-sheng等;《Computer Engineering and Applications》;第213-17页 *
The Efficiency of a DoParallel Algorithm and an FCA Network Graph Applied to Recommendation System;Vilakone, Phonexay等;《APPLIED SCIENCES-BASEL》;第1-18页 *
启发式概念构造的组推荐方法;刘忠慧等;《计算机科学与探索》;第703-711页 *
基于形式概念分析的推荐算法研究及应用;陈昊文;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-476 *
近似概念的遗传生成算法及其推荐应用;刘忠慧等;《计算机应用》;第412-418页 *

Also Published As

Publication number Publication date
CN116756431A (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN109190043B (zh) 推荐方法及装置,存储介质,电子设备及推荐系统
CN104599084B (zh) 一种群体计算的质量控制方法及装置
CN108334580A (zh) 一种结合链接和属性信息的社区发现方法
US11074274B2 (en) Large scale social graph segmentation
CN108960486B (zh) 基于灰支持向量回归机预测适应值的交互式集合进化方法
CN116756431B (zh) 不完备形式背景下基于近似概念的信息或物品推荐方法
CN112817940A (zh) 基于梯度压缩的联邦学习数据处理系统
CN112148942B (zh) 基于数据聚类的业务指标数据分类方法及装置
CN104573036B (zh) 一种基于距离的求解二维空间中代表性节点集的方法
Young et al. Clustering of heterogeneous populations of networks
CN108921189B (zh) 针对社交网络用户属性的推演方法及装置
Shin et al. Selected tree classifier combination based on both accuracy and error diversity
CN105740313B (zh) 设计等值域图
CN103793504B (zh) 一种基于用户偏好与项目属性的聚类初始点选择方法
CN115422414A (zh) 一种审批流程可视化配置方法
CN112836767B (zh) 联邦建模方法、装置、设备、存储介质及程序产品
JP2010073195A (ja) 協調フィルタリング処理方法および協調フィルタリング処理プログラム
CN114678114A (zh) 应用于智慧医疗的大数据挖掘评估方法及大数据挖掘系统
Li et al. Investigating aesthetic features to model human preference in evolutionary art
Wieśniak Two-qutrit entanglement: 56-years old algorithm challenges machine learning
CN108932274A (zh) 一种基于角色组合的最优组查询方法
CN108595843B (zh) 一种动态自适应的众创设计方案数据寻优方法
CN112765413A (zh) 一种基于用户特征的图数据查询推荐方法
CN105095277B (zh) 跨领域观点数据的分类方法和装置
CN107945187A (zh) 一种深度形状先验提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant