CN113590806B - 基于对象三元语言概念的个性化新闻推荐方法及系统 - Google Patents
基于对象三元语言概念的个性化新闻推荐方法及系统 Download PDFInfo
- Publication number
- CN113590806B CN113590806B CN202110880549.4A CN202110880549A CN113590806B CN 113590806 B CN113590806 B CN 113590806B CN 202110880549 A CN202110880549 A CN 202110880549A CN 113590806 B CN113590806 B CN 113590806B
- Authority
- CN
- China
- Prior art keywords
- language
- ternary
- concept
- condition
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于对象三元语言概念的个性化新闻推荐方法及系统,包括:获取已知不同性别不同年龄段用户对已有新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;从对象三元语言概念集合中,提取出语言值三元决策规则;获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐新闻推荐给对应的用户群体。针对待推荐新闻,依据不同年龄段的喜好特征,给出相应群体的最佳新闻推荐结果,使得推荐的新闻更符合用户群体的喜好,更能促进用户的阅读兴趣,增加阅读率。
Description
技术领域
本发明涉及数据挖掘和智能信息处理技术领域,特别是涉及基于对象三元语言概念的个性化新闻推荐方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
形式概念分析,又称为概念格,是一种重要的数据分析理论,该理论以形式背景为基础,借由哲学中概念这一人类思维的基本单元进行形式化的表达。将从形式背景中提炼出的概念进行进一步的关系整合,即可形成概念格,可以对知识进行可视化的表达,从中不仅可以获取对象与属性之间的关系,而且可以得到概念之间的关系。
1995年,Wille等人在形式概念分析的基础上提出三元概念分析。三元概念分析的本质思想是把概念的二元关系推广到三元关系上,用以处理生活中日益增多的三维数据。目前关于三元概念分析的理论研究主要包括概念三元格的构造,三元蕴含及关联规则挖掘,三元模态算子,三元概念聚类等。此外,基于三元概念分析,王霞等将粗糙集上、下近似算子引入到三元概念分析中,提出了对象定向三元概念和属性定向三元概念,推广了三元概念分析。为了简化三元背景和概念三元格的表达方式,祁建军等提出了一种三元背景和概念三元格的信息简化方法。李俊余等从二元背景出发来描述三元概念,研究一个三元背景的三元概念和所有非空条件子集确定的二元背景的二元概念之间的关系。王冰洁等通过引入渐进式的方法,提出了概念三元格的构造算法。Li等人在构建基于映射背景的概念的基础上,提出了一种针对三元决策背景的规则获取方法,可以被看作是一种多源数据决策分析的信息融合技术。
在生活中,人们在对事物进行表达时并不是单纯地使用“是”或“不是”来进行描述,更多的则是使用自然语言来描述二者甚至多者之间的关系。用语言值表示定性概念,是人类思维的基础,既具有随机性,又具有模糊性。而如何处理语言值信息也是当下的一个热点问题,Xu等引入犹豫模糊语言术语集,该方法使分析和计算具有不确定性的语言表达成为可能,并为基于语言知识开发更全面、更强大的决策理论和方法打开了大门。Liao等为在决策过程中有效地处理定性信息,提出了概率语言术语集,从而实现使用表达式的计算,可以看作是使用单词进行计算的高级过程。徐扬等提出了一种基于格值逻辑的语言真值格蕴涵代数,研究其代数特征并在其中引入了来自解析理论的推导概念,探讨在语言真值格蕴涵代数中的特殊派生及它们的相关关系。裴峥等针对一类评价语言集,借鉴形式概念分析的学术思想,研究了该评价语言集的层次结构,通过评价语言刻画对象的适合度,研究了评价语言值推理。邹丽等基于语言值直觉模糊代数和直觉模糊形式背景,提出了语言值直觉模糊概念格的模式识别方法,并将其应用于中医疾病诊断识别中。Cui等提出了一个面向对象的语言概念格来描述属性之间的语言优势关系,结合粒度计算的思想,构建面向对象的语言粒度概念格,提出的基于对象优势关系的面向属性的语言概念格可以处理不同重要性下的语言信息。
规则提取作为形式概念分析中的重要研究方向之一,在三元形式概念分析中也有着重要的地位。获取决策规则对于人们做决策推理时具有重要意义,现已被广泛应用于金融投资、推荐系统、人因工程、医疗诊断等诸多方面。魏玲等提出决策形式背景的概念并给出概念格的属性约简,张菁等基于含有多值决策信息的决策形式背景,提出序决策形式背景的概念及其序决策概念格的相关理论。贺晓丽等将属性粒化思想引入到不完备形式概念分析中,研究了粒化前后不完备决策形式背景中近似决策形式背景中近似规则之间的关系。延安等通过构建形式向量树形拓扑图,提出了一种基于形式向量的决策信息系统最简规则提取算法,并借助树形拓扑图实现了规则提取过程中的可视化。Liu等基于模糊语言形式背景,构造了一个多专家模糊语言概念格用于处理多专家的语言评估信息。通过语言评估矩阵,提出一种用于多专家模糊语言形式背景的最大化偏差法,用以解决专家权重未知的问题,通过多专家模糊语言概念格的语言聚合算子,可以获得相应的关联规则。Qin等基于面向对象的概念和面向属性的概念,提出了面向对象的决策规则和面向属性的决策规则。结合条件概念格和决策概念格的范围集上的等价关系,提出了规则获取方法。陈泽华等从粗糙集角度出发,在提出增广形式背景的极概念生成算法的同时提出了一种新的无冗余属性的决策规则获取算法,有效地处理了不完备形式背景上的规则提取问题。
人工智能作为一门与哲学、心理学、计算机科学、脑科学等诸多学科都有着紧密联系的新兴学科,国际人工智能联合大会曾提出其需要重点研究的问题,其中大部分都需要考虑不确定性。因此,研究具有模糊语言信息的不确定性推理问题具有重要研究意义。目前,基于概率推理、证据推理、模糊推理、信息推理等各种不确定性推理方法被广泛应用于医学诊断、公共管理等现实问题中。Chen等提出一种基于模糊推理的新型人脸图像增强方法来解决照明变化的挑战,所提出的模糊推理模型会生成自适应增强功能,可以纠正和改善明不均匀和对比度低的问题。Dong等人设计并实现了一种基于案例推理和模糊逻辑相结合的棉花疾病诊断方法,将模糊逻辑集成到案例推理中可以得到更加灵活和准确的模型。Li等采用特征选择的技术来判断各个属性的相对重要程度,然后进行评估和排序,将属性分数集成在流行的尺度和基于移动变换的模糊推理算法中,形成了一种用于属性排序支持的模糊插值推理的新方法,该方法仅需两个最接近的相邻规则即可执行准确的插值推理,从而避免了搜索和使用除即时规则之外的多个规则进行计算的需要。Luo等提出了一种新的基于区间值模糊集的五元蕴涵算法并给出基于区间值模糊推理的R型五元蕴涵解。
发明人发现,现有的个性化新闻推荐过程中缺乏针对性,尤其是不同新闻内容分类板块的新闻推荐,只是随机的依据发布时间来进行推荐,没有对用户的状况进行进一步的了解,没有针对不同的用户群体的喜好给出不同的新闻推荐策略。
发明内容
为了解决现有技术的不足,本发明提供了基于对象三元语言概念的个性化新闻推荐方法及系统;对于待推荐的新闻,依据不同用户人群评价的特征,给出相应的推荐结果,使得推荐的新闻更符合用户的需求,更能吸引用户的阅读兴趣。
第一方面,本发明提供了基于对象三元语言概念的个性化新闻推荐方法;
基于对象三元语言概念的个性化新闻推荐方法,包括:
获取已知不同性别不同年龄段用户对已有新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;
从对象三元语言概念集合中,提取出语言值三元决策规则;
获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐新闻推荐给对应的用户群体。
第二方面,本发明提供了基于对象三元语言概念的个性化新闻推荐系统;
基于对象三元语言概念的个性化新闻推荐系统,包括:
获取模块,其被配置为:获取已知不同性别不同年龄段用户对已有新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;
提取模块,其被配置为:从对象三元语言概念集合中,提取出语言值三元决策规则;
新闻推荐模块,其被配置为:获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐新闻推荐给对应的用户群体。
第三方面,本发明还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及处理器,用于运行所述计算机可读指令,其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
与现有技术相比,本发明的有益效果是:
本发明提出一种新的描述模型,用于描述在动态条件下的对象与属性之间的模糊语言关系;
本发明推荐系统可以在条件发生改变时,无需进行重复计算,就可给出对应的概念,节省时间;
本发明推荐系统考虑了条件的改变,不同条件下给出不同的推荐结果,更加符合个性化新闻推荐的需求。针对待推荐新闻,依据不同年龄段的喜好特征,给出相应群体的最佳新闻推荐结果,使得推荐的新闻更符合用户群体的喜好,更能促进用户的阅读兴趣,增加阅读率。
本发明是一种可用于描述由模糊语言表示三维数据关系的模型和在动态条件下的基于模糊属性三元语言概念的个性化推荐方法。对象三元语言概念的提出,既可以处理三维数据中对象和属性之间的不确定性关系,又可以在条件发生改变时无需大量的重新计算,在节省时间和空间的基础上,快速得到概念并进行计算。
本发明附加方面的优点将在下面的描述中部分给出,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的方法流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、课程或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、课程或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
实施例一
本实施例提供了基于对象三元语言概念的个性化新闻推荐方法;
如图1所示,基于对象三元语言概念的个性化新闻推荐方法,包括:
S1:获取已知不同性别不同年龄段用户对于已有新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;
S2:从对象三元语言概念集合中,提取出语言值三元决策规则;
S3:获取待推荐用户的数据,根据语言值三元决策规则,为用户推荐对应的新闻。
进一步地,所述S1:获取已知不同性别不同年龄段用户对于已有新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;具体包括:
S11:随机抽取不同板块已有的各个新闻,获取不同新闻的特征指标、不同年龄段用户对新闻各个特征指标的评价,不同性别用户群体对不同新闻的喜爱程度和对不同新闻质量的满意度;
基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;
S12:对得到的多个条件-语言值子背景进行对比,去除重复项;
S13:针对去除重复项的多个条件-语言值子背景,计算出所有的条件-对象语言概念;
S14:依次遍历所有的条件-对象语言概念,根据对象三元语言概念定义,获取对应的条件集;
判断条件集与条件-对象语言概念对应的条件是否相同;
若相同,则将对象三元语言概念构成对象三元语言概念规则;
若不相同,则获得新的对象三元语言概念,将新的对象三元语言概念放入集合中,构成对象三元语言概念集合。
进一步地,所述对象三元语言概念定义,为:
进一步地,所述S2:从对象三元语言概念集合中,提取出语言值三元决策规则;具体包括:
S21:判断对象三元语言概念集合中是否存在冗余概念,若存在冗余概念,则将冗余概念从集合中移除;若不存在冗余概念,则进入S22;
S22:基于移除冗余概念后的对象三元语言概念集合,生成在语言值条件三元背景和语言值决策三元背景上的第一概念集合和第二概念集合;
S23:遍历第二概念集合中的概念,在第一概念集合中根据对象相等的原则,找到对应的概念;将两个概念分别作为规则前件和规则后件,构成一个规则,将规则加入到规则集中;
S24:去除规则集中的冗余规则,得到若干个语言值三元决策规则。
进一步地,所述S3:获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体;具体包括:
S31:对对象三元语言概念集合中的对象三元语言概念进行处理,得到在语言值三元决策背景下的对象三元语言概念规则;
S32:计算对象三元语言概念规则与规则前件之间的相似度,选择相似度最大的对象三元语言概念规则;
S33:将规则前件中的语言值描述进行聚合,计算聚合结果;
S34:将相似度最大的对象三元语言概念规则与聚合结果进行运算,得到推理结果;所述推理结果为待推荐新闻的目标用户群体。
示例性的,所述S34的运算,是指:
其中,n表示对象三元语言概念(A1,A2,A3)(A1',A2',A3')中的属性集的元素个数,m表示对象三元语言概念(B1,B2,B3)中属性集的元素个数,表示对应的属性的语言值描述。(A1,A2,A3)表示一个语言值三元概念,描述某新闻在不同年龄段用户的条件下其不同评价指标的被评价程度。
示例性的,所述S11:随机抽取不同板块已有的各个新闻,获取不同新闻的特征指标、不同年龄段用户对新闻各个特征指标的评价,不同性别用户群体对不同新闻的喜爱程度和对不同新闻质量的满意度;
其中,不同板块已有的各个新闻,例如:时政板块、公益板块、财经板块、文学论坛板块、文娱板块等。
不同新闻的评价指标,例如是指:新闻的内容丰富程度,具有风格特色程度,紧跟时事、讲解清晰程度;通过问卷,打分等方式获得。
不同年龄段用户对新闻各个特征指标的评价;通过问卷,打分等方式获得。
不同性别用户群体对不同新闻的喜爱程度;通过问卷,打分等方式获得。
不同性别用户群体对不同新闻质量的满意度;通过问卷,打分等方式获得。
进一步地,所述S11中,基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;具体包括:
S111:语言值三元背景X=(X1,X2,X3,L),其中对象集X1={g1,g2,...,gp},对象集用于表示p条新闻;属性集X2={m1,m2,...,mq},属性集用于表示新闻的q个评价指标;条件集X3={b1,b2,...,br}及在语言术语集上的语言值关系L:X1×X2×X3→S,S={sα|α=-τ,…,-1,0,1,…,τ},所述p为对象总个数,q为属性总个数,r为条件总个数;条件集用于表示用户的年龄段;S表示用户对每个评价指标的评价结果;
S112:对语言值三元背景进行处理,得到语言值三元决策背景(X1,X2,X3,L,N2,N3,J);收集用户g在条件b下具有属性m的语言概念L(g,m,b),g∈X1,m∈X2,b∈X3,L(g,m,b)=sα∈S,初始化对象集X1,属性集X2,条件集X3与语言概念的语言值三元决策背景(X1,X2,X3,L)作为训练集;计算每个条件子集bi所对应的条件-语言值子背景。
进一步地,所述S12:对得到的多个条件-语言值子背景进行对比,去除重复项;具体包括:
对比得到的所有条件-语言值子背景,若存在相同的两个或多个条件-语言值子背景,则只保留一个。
进一步地,所述S13:针对去除重复项的多个条件-语言值子背景,计算出所有的条件-对象语言概念;具体包括:
进一步地,所述S14:根据所有的条件-对象语言概念,获取条件集;判断条件集与第i个条件是否相同,若相同,则构成对象三元语言概念;若不相同,则获得新的对象三元语言概念,将新的对象三元语言概念放入集合中,构成对象三元语言概念集合;具体包括:
根据~L(k)~诱导算子的定义:
进一步地,所述S22:基于移除冗余概念后的对象三元语言概念集合,生成在语言值条件三元背景和语言值决策三元背景上的第一概念集合和第二概念集合;具体包括:
生成在语言值条件三元背景(X1,X2,X3,L)和语言值决策三元背景(X1,N2,N3,J)上的概念,记为ξ(X1,X2,X3,L)和ξ(X1,N2,N3,J)。
进一步地,所述S23:遍历第二概念集合中的概念,在第一概念集合中根据对象相等的原则,找到对应的概念;将两个概念分别作为规则前件和规则后件,构成一个规则,将规则加入到规则集中;具体包括:
遍历ξ(X1,N2,N3,J)中的概念,在ξ(X1,X2,X3,L)中根据对象相等的原则找到对应的概念,构成一个规则,加入到规则集RL中。
进一步地,所述S24:去除规则集中的冗余规则,得到若干个语言值三元决策规则;具体包括:
对于任意的RL中的两个规则(E1,H1)→(D1,G1)和(E2,H2)→(D2,G2),若E1=E2,H1=H2,或者D1=D2,G1=G2,则{g,(E1,H1)→(D1,G1)}是RL中的冗余规则,去除规则集RL中的冗余规则。
进一步地,所述S3:获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体;其中,获取待推荐新闻的数据,包括:群体用户中的男女性别比例,不同年龄段用户在对新闻的内容丰富程度、风格特色、紧跟时事、讲解清晰程度这些方面期望达到的最低标准。
进一步地,所述S32:计算对象三元语言概念规则与规则前件之间的相似度,选择相似度最大的对象三元语言概念规则;具体包括:
根据相似度公式计算对象三元语言概念(A1',A2',A3')与规则前件(A1,A2,A3)之间的相似度,排序后选择相似度最大的规则;
其中,相似度公式:
其中,n表示对象三元语言概念中的属性集的元素个数,τ表示语言术语集的元素个数,表示对应的属性的语言值描述,|A3∩A3′|表示对应的条件集的交集的个数,|A3∪A3′|表示对应的条件集的并集的个数。a表示两个对象三元语言概念对应评价值的语言值评价,τ表示在评价体系中使用的语言术语集中正整数元素的个数。
进一步地,所述S33:将规则前件中的语言值描述进行聚合,计算聚合结果;
将规则前件(A1,A2,A3)中的语言值描述进行聚合(规则前件中的对象三元语言概念进行交运算),计算的结果,记为H。A1,B1代表对象,A2,B2代表属性,及对应的语言值描述,A3,B3代表条件。ai,bj表示对应的语言值描述。
进一步地,所述S34:将对象三元语言概念规则与聚合结果进行运算,得到推理结果。
将(A1',A2',A3')与H进行运算,得到推理结果。
其中,A1,A2,A3,A1',A2',A3'表示对应的评价标准的语言值描述,B1,B2,B3表示规则中对应结果的语言值描述。
本发明的基于对象三元语言概念的不确定性推理方法研究,按照如下步骤进行:
A数据采集与预处理:
A1.语言值三元背景X=(X1,X2,X3,L,N2,N3,J),对象集X1={u1,u2,u3,u4}为四条新闻;属性集X2={a1,a2,a3,a4}表示不同新闻的评价指标,分别是内容丰富程度、风格特色、紧跟时事、讲解清晰程度;条件集X3={c1,c2,c3,c4}为四个年龄段,分别为少年(7-17岁)、青年(18-45岁)、中年(46-69岁)、老年(大于69岁);S={sα|α=-2,-1,0,1,2}表示X1,X2和X3之间的5个层次的关系;属性集N2={a5,a6}分别代表新闻受欢迎程度和新闻综合质量;N3={c5,c6}分别代表男性群体和女性群体;
L(X1,X2,X3)∈S={s-2="非常差",s-1="差",s0="一般",s1="好",s2="非常好"}代表了待推荐新闻在评价指标上的表现,以及不同性别群体对此新闻受欢迎程度和综合质量的评判。
A2.收集用户g在条件b下具有属性m的语言概念L(g,m,b),g∈X1,m∈X2,b∈X3,L(g,m,b)=sα∈S,初始化对象集X1,属性集X2,条件集X3与语言概念的语言值三元决策背景(X1,X2,X3,L,N2,N3,J)作为训练集,如表1-1和表1-2所示;计算每个条件子集bi所对应的条件-语言值子背景,我们可以将表1-1和表1-2拆分成15个条件-语言值子背景,分别记为
表1-1语言值三元决策背景(X1,X2,X3,L,N2,N3,J)
表1-2语言值三元决策背景(X1,X2,X3,L,N2,N3,J)
B.对得到的15个条件子语言背景进行对比,对于存在相同的两个或多个条件-语言值子背景,只保留一个;
C.在条件子语言背景上,求得其上的所有条件-对象语言概念,共计225个;
D.根据判断求得的条件集C3与bi是否相同,若相同则构成对象三元语言概念(C1,C2,C3);若不同,则对象三元语言概念记为(C1,C2,C3∨bi);将求得概念放入集合Q中,构成对象三元语言概念集合;
E.判断对象三元语言概念集合中是否存在冗余概念,若存在则将其从概念集中移除;
F.生成在语言值条件三元背景(X1,X2,X3,L)和语言值决策三元背景(X1,N2,N3,J)上的概念,记为ξ(X1,X2,X3,L)和ξ(X1,N2,N3,J):
表2对象三元语言概念
G.遍历ξ(X1,N2,N3,J)中的概念,在ξ(X1,X2,X3,L)中根据对象相等的原则找到对应的概念,构成一个规则,加入到规则集RL中;
H.对于任意的RL中的两个规则(E1,H1)→(D1,G1)和(E2,H2)→(D2,G2),若E1=E2,H1=H2,或者D1=D2,G1=G2,则{g,(E1,H1)→(D1,G1)}是RL中的冗余规则,去除规则集RL中的冗余规则,最终得到10个语言值三元决策规则:
R1#{({(a1,s2),(a2,s1),(a3,s1),(a4,s-1)},c1c2c3)→({(a5,s1),(a6,s2)},c5)}
R2#{({(a1,s0),(a2,s1),(a3,s0),(a4,s0)},c1c2c3c4)→({(a5,s2),(a6,s0)},c5c6)}
R3#{({(a1,s0),(a2,s1),(a3,s0),(a4,s-1)},c1c2c3c4)→({(a5,s-1),(a6,s0)},c5c6)}
R4#{({(a1,s0),(a2,s-1),(a3,s0),(a4,s0)},c2c3)→({(a5,s0),(a6,s-1)},c5c6)}
R5#{({(a1,s0),(a2,s-1),(a3,s-1),(a4,s-1)},c1c2c3c4)→({(a5,s-1),(a6,s-1)},c5c6)}
R6#{({(a1,s-1),(a2,s-1),(a3,s-2),(a4,s0)},c1c2)→({(a5,s-2),(a6,s0)},c5)}
R7#{({(a1,s-1),(a2,s0),(a3,s-2),(a4,s-1)},c2c3)→({(a5,s-2),(a6,s0)},c5)}
R8#{({(a1,s-1),(a2,s-1),(a3,s-2),(a4,s0)},c2c3)→({(a5,s0),(a6,s-1)},c6)}
R9#{({(a1,s-1),(a2,s-1),(a3,s-2),(a4,s0)},c2)→({(a5,s-2),(a6,s-1)},c5c6)}
R10#{({(a1,s-2),(a2,s-1),(a3,s-2),(a4,s-1)},c1c2c3c4)→({(a5,s-1),(a6,s-1)},c6)}
I.对对象三元语言概念进行处理,得到在语言值三元决策背景下的对象三元语言概念规则;
J.根据相似度公式:
其中n表示对象三元语言概念中的属性集的元素个数,τ表示语言术语集的元素个数,表示对应的属性的语言值描述,|A3∩A3′|表示对应的条件集的交集的个数,|A3∪A3′|表示对应的条件集的并集的个数,计算对象三元语言概念(A1',A2',A3')与规则前件(A1,A2,A3)之间的相似度,OTLCS(R1,A')=0.771,OTLCS(R2,A')=0.688,OTLCS(R3,A')=0.675,OTLCS(R4,A')=0.604,OTLCS(R5,A')=0.688,OTLCS(R6,A')=0.592,OTLCS(R7,A')=0.592,OTLCS(R8,A')=0.592,OTLCS(R9,A')=0.425,OTLCS(R10,A')=0.65。排序后选择相似度最大的规则;
本发明公开了一种可用于描述由模糊语言表示三维数据关系的模型和在动态条件下的基于模糊属性三元语言概念的个性化推荐方法。按照如下步骤进行:数据处理,将收集到的训练数据集初始化成语言值三元背景;构造对象三元语言概念及概念格;构建语言值三元决策背景;构建对象三元语言概念的规则提取方法;构造基于对象三元语言概念的模糊推理模型;构造基于语言值三元决策背景的推理步骤。
实施例二
本实施例提供了基于对象三元语言概念的个性化新闻推荐系统;
基于对象三元语言概念的个性化新闻推荐系统,包括:
获取模块,其被配置为:获取已知不同性别不同年龄段用户对于不同新闻多个特征指标的评价,通过语言值三元决策背景,求得对象三元语言概念集合;
提取模块,其被配置为:从对象三元语言概念集合中,提取出语言值三元决策规则;
新闻内容推荐模块,其被配置为:获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体。
此处需要说明的是,上述获取模块、提取模块和新闻内容推荐模块对应于实施例一中的步骤S1至S3,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.基于对象三元语言概念的个性化新闻推荐方法,其特征是,包括:
获取已知不同性别不同年龄段用户对于不同新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;具体包括:
随机抽取不同板块已有的各个新闻,获取不同新闻的特征指标、不同年龄段用户对新闻各个特征指标的评价,不同性别用户群体对不同新闻的喜爱程度和对不同新闻质量的满意度;基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;
对得到的多个条件-语言值子背景进行对比,去除重复项;
针对去除重复项的多个条件-语言值子背景,计算出所有的条件-对象语言概念;
依次遍历所有的条件-对象语言概念,根据对象三元语言概念定义,获取对应的条件集;判断条件集与条件-对象语言概念对应的条件是否相同;若相同,则将对象三元语言概念构成对象三元语言概念规则;若不相同,则获得新的对象三元语言概念,将新的对象三元语言概念放入集合中,构成对象三元语言概念集合;
基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;具体包括:
语言值三元背景X=(X1,X2,X3,L),其中对象集X1={g1,g2,...,gp},对象集用于表示p条新闻;属性集X2={m1,m2,...,mq},属性集用于表示新闻的q个评价指标;条件集X3={b1,b2,...,br}及在语言术语集上的语言值关系L:X1×X2×X3→S,S={sα|α=-τ,…,-1,0,1,…,τ},所述p为对象总个数,q为属性总个数,r为条件总个数;条件集用于表示用户的年龄段;S表示用户对每个评价指标的评价结果;
对语言值三元背景进行处理,得到语言值三元决策背景(X1,X2,X3,L,N2,N3,J);收集用户g在条件b下具有属性m的语言概念L(g,m,b),g∈X1,m∈X2,b∈X3,L(g,m,b)=sα∈S,初始化对象集X1,属性集X2,条件集X3与语言概念的语言值三元决策背景(X1,X2,X3,L)作为训练集;计算每个条件子集bi所对应的条件-语言值子背景;
从对象三元语言概念集合中,提取出语言值三元决策规则;
获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体。
2.如权利要求1所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,从对象三元语言概念集合中,提取出语言值三元决策规则;具体包括:
判断对象三元语言概念集合中是否存在冗余概念,若存在冗余概念,则将冗余概念从集合中移除;若不存在冗余概念,则进入下一步;
基于移除冗余概念后的对象三元语言概念集合,生成在语言值条件三元背景和语言值决策三元背景上的第一概念集合和第二概念集合;
遍历第二概念集合中的概念,在第一概念集合中根据对象相等的原则,找到对应的概念;将两个概念分别作为规则前件和规则后件,构成一个规则,将规则加入到规则集中;
去除规则集中的冗余规则,得到若干个语言值三元决策规则。
3.如权利要求1所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体;具体包括:
对对象三元语言概念集合中的对象三元语言概念进行处理,得到在语言值三元决策背景下的对象三元语言概念规则;
计算对象三元语言概念规则与规则前件之间的相似度,选择相似度最大的对象三元语言概念规则;
将规则前件中的语言值描述进行聚合,计算聚合结果;
将相似度最大的对象三元语言概念规则与聚合结果进行运算,得到推理结果;所述推理结果为针对待推荐新闻更适合哪类用户群体。
4.如权利要求1所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,对得到的多个条件-语言值子背景进行对比,去除重复项;具体包括:
对比得到的所有条件-语言值子背景,若存在相同的两个或多个条件-语言值子背景,则只保留一个。
7.如权利要求2所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,基于移除冗余概念后的对象三元语言概念集合,生成在语言值条件三元背景和语言值决策三元背景上的第一概念集合和第二概念集合;具体包括:
生成在语言值条件三元背景(X1,X2,X3,L)和语言值决策三元背景(X1,N2,N3,J)上的概念,记为ξ(X1,X2,X3,L)和ξ(X1,N2,N3,J)。
8.如权利要求2所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,遍历第二概念集合中的概念,在第一概念集合中根据对象相等的原则,找到对应的概念;将两个概念分别作为规则前件和规则后件,构成一个规则,将规则加入到规则集中;具体包括:
遍历ξ(X1,N2,N3,J)中的概念,在ξ(X1,X2,X3,L)中根据对象相等的原则找到对应的概念,构成一个规则,加入到规则集RL中。
10.如权利要求3所述的基于对象三元语言概念的个性化新闻推荐方法,其特征是,计算对象三元语言概念规则与规则前件之间的相似度,选择相似度最大的对象三元语言概念规则;具体包括:
根据相似度公式计算对象三元语言概念(A1',A2',A3')与规则前件(A1,A2,A3)之间的相似度,排序后选择相似度最大的规则;
其中,相似度公式:
13.基于对象三元语言概念的个性化新闻推荐系统,其特征是,包括:
获取模块,其被配置为:获取已知不同性别不同年龄段用户对于不同新闻多个特征指标的评价结果,通过语言值三元决策背景,求得对象三元语言概念集合;具体包括:
随机抽取不同板块已有的各个新闻,获取不同新闻的特征指标、不同年龄段用户对新闻各个特征指标的评价,不同性别用户群体对不同新闻的喜爱程度和对不同新闻质量的满意度;基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;
对得到的多个条件-语言值子背景进行对比,去除重复项;
针对去除重复项的多个条件-语言值子背景,计算出所有的条件-对象语言概念;
依次遍历所有的条件-对象语言概念,根据对象三元语言概念定义,获取对应的条件集;判断条件集与条件-对象语言概念对应的条件是否相同;若相同,则将对象三元语言概念构成对象三元语言概念规则;若不相同,则获得新的对象三元语言概念,将新的对象三元语言概念放入集合中,构成对象三元语言概念集合;
基于获取的数据,构建语言值三元决策背景;根据语言值三元决策背景,计算每个条件子集所对应的条件-语言值子背景;具体包括:
语言值三元背景X=(X1,X2,X3,L),其中对象集X1={g1,g2,...,gp},对象集用于表示p条新闻;属性集X2={m1,m2,...,mq},属性集用于表示新闻的q个评价指标;条件集X3={b1,b2,...,br}及在语言术语集上的语言值关系L:X1×X2×X3→S,S={sα|α=-τ,…,-1,0,1,…,τ},所述p为对象总个数,q为属性总个数,r为条件总个数;条件集用于表示用户的年龄段;S表示用户对每个评价指标的评价结果;
对语言值三元背景进行处理,得到语言值三元决策背景(X1,X2,X3,L,N2,N3,J);收集用户g在条件b下具有属性m的语言概念L(g,m,b),g∈X1,m∈X2,b∈X3,L(g,m,b)=sα∈S,初始化对象集X1,属性集X2,条件集X3与语言概念的语言值三元决策背景(X1,X2,X3,L)作为训练集;计算每个条件子集bi所对应的条件-语言值子背景;
提取模块,其被配置为:从对象三元语言概念集合中,提取出语言值三元决策规则;
新闻推荐模块,其被配置为:获取待推荐新闻的数据,根据语言值三元决策规则,将待推荐的新闻推荐给适合的用户群体。
14.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1-12任一项所述的方法。
15.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行权利要求1-12任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110880549.4A CN113590806B (zh) | 2021-08-02 | 2021-08-02 | 基于对象三元语言概念的个性化新闻推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110880549.4A CN113590806B (zh) | 2021-08-02 | 2021-08-02 | 基于对象三元语言概念的个性化新闻推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113590806A CN113590806A (zh) | 2021-11-02 |
CN113590806B true CN113590806B (zh) | 2022-05-27 |
Family
ID=78253655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110880549.4A Active CN113590806B (zh) | 2021-08-02 | 2021-08-02 | 基于对象三元语言概念的个性化新闻推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590806B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049956B (zh) * | 2022-01-12 | 2022-06-24 | 山东建筑大学 | 基于属性导出模糊对象语言概念格的疾病诊断预测系统 |
CN116756431B (zh) * | 2023-08-14 | 2023-10-31 | 西南石油大学 | 不完备形式背景下基于近似概念的信息或物品推荐方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663010A (zh) * | 2012-03-20 | 2012-09-12 | 复旦大学 | 基于标注语义的个性化图像浏览与推荐方法及系统 |
JP2014241498A (ja) * | 2013-06-11 | 2014-12-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 番組推薦装置 |
CN107992531A (zh) * | 2017-11-21 | 2018-05-04 | 吉浦斯信息咨询(深圳)有限公司 | 基于深度学习的新闻个性化智能推荐方法与系统 |
CN109062999A (zh) * | 2018-07-06 | 2018-12-21 | 无锡众创未来科技应用有限公司 | 一种基于用户行为的个性化新闻推荐方法及装置 |
CN112989208A (zh) * | 2021-04-30 | 2021-06-18 | 武汉卓尔数字传媒科技有限公司 | 一种信息推荐方法、装置、电子设备及存储介质 |
CN113065062A (zh) * | 2021-03-09 | 2021-07-02 | 北京工业大学 | 一种基于用户阅读时间行为的新闻推荐方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6226791B2 (ja) * | 2014-03-24 | 2017-11-08 | Kddi株式会社 | レコメンド装置、レコメンドシステム及びレコメンド方法 |
CN104216965B (zh) * | 2014-08-21 | 2018-11-20 | 北京金山安全软件有限公司 | 信息推荐方法和装置 |
CN109101505B (zh) * | 2017-06-20 | 2021-09-03 | 北京搜狗科技发展有限公司 | 一种推荐方法、推荐装置和用于推荐的装置 |
CN108133407B (zh) * | 2017-12-21 | 2021-12-24 | 湘南学院 | 一种基于软集决策规则分析的电子商务推荐技术及系统 |
CN109684538A (zh) * | 2018-12-03 | 2019-04-26 | 重庆邮电大学 | 一种基于用户个人特征的推荐方法及推荐系统 |
CN111597217B (zh) * | 2020-05-07 | 2023-06-16 | 辽宁师范大学 | 基于模糊对象语言概念格的个性化推荐方法 |
CN112487291B (zh) * | 2020-11-28 | 2022-06-10 | 重庆邮电大学 | 一种基于大数据的个性化新闻推荐方法及装置 |
-
2021
- 2021-08-02 CN CN202110880549.4A patent/CN113590806B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663010A (zh) * | 2012-03-20 | 2012-09-12 | 复旦大学 | 基于标注语义的个性化图像浏览与推荐方法及系统 |
JP2014241498A (ja) * | 2013-06-11 | 2014-12-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 番組推薦装置 |
CN107992531A (zh) * | 2017-11-21 | 2018-05-04 | 吉浦斯信息咨询(深圳)有限公司 | 基于深度学习的新闻个性化智能推荐方法与系统 |
CN109062999A (zh) * | 2018-07-06 | 2018-12-21 | 无锡众创未来科技应用有限公司 | 一种基于用户行为的个性化新闻推荐方法及装置 |
CN113065062A (zh) * | 2021-03-09 | 2021-07-02 | 北京工业大学 | 一种基于用户阅读时间行为的新闻推荐方法及系统 |
CN112989208A (zh) * | 2021-04-30 | 2021-06-18 | 武汉卓尔数字传媒科技有限公司 | 一种信息推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Personalised News and Blog Recommendations based on User Location, Facebook and Twitter User Profiling;Gabriella Kazai 等;《ACM》;20160707;第1129-1132页 * |
基于用户反馈信息的新闻推荐系统设计与实现;何希真;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20150915;I138-1648 * |
Also Published As
Publication number | Publication date |
---|---|
CN113590806A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Segu et al. | Batch normalization embeddings for deep domain generalization | |
CN111199550B (zh) | 图像分割网络的训练方法、分割方法、装置和存储介质 | |
Xie et al. | Scut-fbp: A benchmark dataset for facial beauty perception | |
Yuan et al. | One person, one model, one world: Learning continual user representation without forgetting | |
CN113590806B (zh) | 基于对象三元语言概念的个性化新闻推荐方法及系统 | |
CN113269540B (zh) | 专家系统的更新方法、业务处理方法及装置 | |
Tembusai et al. | K-nearest neighbor with k-fold cross validation and analytic hierarchy process on data classification | |
CN112733602B (zh) | 关系引导的行人属性识别方法 | |
CN113256275B (zh) | 专家系统的更新方法、业务处理方法及装置 | |
CN111259264A (zh) | 一种基于生成对抗网络的时序评分预测方法 | |
CN109542949A (zh) | 一种基于形式向量的决策信息系统知识获取方法 | |
Zhou et al. | Reliable knowledge graph fact prediction via reinforcement learning | |
CN113537623A (zh) | 基于注意力机制及多模态的服务需求动态预测方法及系统 | |
CN112817442A (zh) | 基于ffm的多任务情况下态势信息分类推荐系统及方法 | |
Angayarkanni | Predictive analytics of chronic kidney disease using machine learning algorithm | |
Zouinina et al. | Efficient k-anonymization through constrained collaborative clustering | |
CN113780027A (zh) | 一种基于增广图卷积的多标签物体识别方法、装置及设备 | |
Zhao et al. | Streaming adaptive nonparametric variational autoencoder | |
Young | Imputation for random forests | |
CN111143573A (zh) | 基于用户反馈信息进行知识图谱目标节点预测的方法 | |
CN113256274B (zh) | 基于专家系统的业务处理方法及装置 | |
Jain et al. | Joint matrix-tensor factorization for knowledge base inference | |
Zhou | New Techniques for Learning Parameters in Bayesian Networks. | |
CN116401451B (zh) | 一种融合多维度策略体系构建的流程分析方法及系统 | |
CN118135496B (zh) | 一种基于双流卷积神经网络的课堂行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |