CN111523590A - 面向评分矩阵的多数据源融合方法 - Google Patents

面向评分矩阵的多数据源融合方法 Download PDF

Info

Publication number
CN111523590A
CN111523590A CN202010318220.4A CN202010318220A CN111523590A CN 111523590 A CN111523590 A CN 111523590A CN 202010318220 A CN202010318220 A CN 202010318220A CN 111523590 A CN111523590 A CN 111523590A
Authority
CN
China
Prior art keywords
scoring
user
scoring matrix
score
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010318220.4A
Other languages
English (en)
Other versions
CN111523590B (zh
Inventor
莫毓昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202010318220.4A priority Critical patent/CN111523590B/zh
Publication of CN111523590A publication Critical patent/CN111523590A/zh
Application granted granted Critical
Publication of CN111523590B publication Critical patent/CN111523590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种面向评分矩阵的多数据源融合方法,包括:获取分别来自两个数据源的评分矩阵;对两个评分矩阵进行分析,识别用户不一致的评分数据记录,并进行数据处理;对两个评分矩阵进行分析,识别商品不一致的评分数据记录,并进行数据处理;在对评分矩阵DS1和评分矩阵DS2进行分析识别,删除用户不一致和商品不一致的相关评分数据记录后,得到处理后的评分矩阵DS1和处理后的评分矩阵DS2;将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合。本发明提供一种面向评分矩阵的多数据源融合方法,首先将用户不一致和商品不一致的相关评分数据记录删除,然后再进行数据融合,提高数据融合的准确性,从而最终提高商品推荐精准性。

Description

面向评分矩阵的多数据源融合方法
技术领域
本发明属于数据融合处理技术领域,具体涉及一种面向评分矩阵的多数据源融合方法。
背景技术
互联网的出现和普及给用户带来了大量的信息,满足用户在信息时代对信息的需求,但随着网络的迅速发展,网上信息量大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的信息,对信息的使用效率反而降低,这就是信息超载问题。
解决信息超载问题一个非常有潜力的办法是推荐系统,推荐系统现已广泛应用于很多领域,其中最典型的应用领域是电子商务领域。
在电子商务领域,现有商品推荐系统主要实现方式为:从多个电子商务平台收集购买用户对商品的评分数据;然后,对来源多个电子商务平台的评分数据进行汇总分析,得到反应用户购买特征的特征信息;最后,针对用户特征信息,实现对用户的个性化商品推荐。由此可见,来源多个电子商务平台的评分数据是实现精准推荐的基础,然后,在对来源多个电子商务平台的评分数据进行汇总时,主要存在以下问题:对于来源不同电子商务平台的评分矩阵,常常出现用户不一致或商品不一致的情况,其中,用户不一致是指:两个不同来源的评分矩阵中,用户ID相同,但实际上为不同的用户,例如,平台1中,小王的用户ID为1254874;而在平台2中,小李的用户ID同样为1254874。商品不一致是指:两个不同来源的评分矩阵中,商品ID相同,但实际上为不同的商品。因此,在对不同来源的评分矩阵进行汇总时,由于在数据汇总时已脱离平台,因此,当出现用户不一致或商品不一致的情况时,会导致数据汇总结果出现偏差,从而直接影响最终的商品推荐精准性。
发明内容
针对现有技术存在的缺陷,本发明提供一种面向评分矩阵的多数据源融合方法,可有效解决上述问题。
本发明采用的技术方案如下:
本发明提供一种面向评分矩阵的多数据源融合方法,包括以下步骤:
步骤1,获取分别来自两个数据源的评分矩阵,分别为:评分矩阵DS1和评分矩阵DS2;其中,每个评分矩阵由多条评分数据记录组成;每条评分数据记录为某个用户标识的用户,对某个商品标识的商品进行的评分;
步骤2,对两个评分矩阵进行分析,识别用户不一致的评分数据记录,并进行数据处理,方法如下:
步骤2.1,遍历评分矩阵DS1中的用户标识以及评分矩阵DS2中的用户标识,判断是否存在评分矩阵DS1中的用户标识与评分矩阵DS2中的用户标识相同的情况,如果不存在,则执行步骤3;如果存在,则执行步骤2.2;
步骤2.2,设评分矩阵DS1中的用户标识U1与评分矩阵DS2中的用户标识U2相同,则遍历评分矩阵DS1,查找到用户标识U1在评分矩阵DS1的所有评分数据记录,从而得到用户标识U1在评分矩阵DS1进行评分的商品集合P1
遍历评分矩阵DS2,查找到用户标识U2在评分矩阵DS2的所有评分数据记录,从而得到用户标识U2在评分矩阵DS2进行评分的商品集合P2
对商品集合P1和商品集合P2进行交集运算,得到共同商品集合P0=(p1,p2,...,pn);其中,n为共同商品集合P0中的商品数量;
步骤2.3,对共同商品集合P0=(p1,p2,...,pn)中的商品种类进行分析,将属于同一商品种类的商品划分到一个子集合中,从而得到若干个子集合,对于每个子集合,均执行以下步骤:
步骤2.3.1,设任意子集合为R0=(r1,r2,...,rm);m为子集合R0中的商品数量;
步骤2.3.2,得到用户标识U1对子集合R0中的每个商品在评分矩阵DS1中的评分,得到评分集合Score1:
Score1={score1(U1,r1),score1(U1,r2),...,score1(U1,rm)}
其中:
score1(U1,r1)代表用户标识U1对子集合R0中的商品r1在评分矩阵DS1中的评分;
score1(U1,r2)代表用户标识U1对子集合R0中的商品r2在评分矩阵DS1中的评分;
依此类推
score1(U1,rm)代表用户标识U1对子集合R0中的商品rm在评分矩阵DS1中的评分;
得到用户标识U2对子集合R0中的每个商品在评分矩阵DS2中的评分,得到评分集合Score2:
Score2={score2(U2,r1),score2(U2,r2),...,score2(U2,rm)}
其中:
score2(U2,r1)代表用户标识U2对子集合R0中的商品r1在评分矩阵DS2中的评分;
score2(U2,r2)代表用户标识U2对子集合R0中的商品r2在评分矩阵DS2中的评分;
依此类推
score2(U2,rm)代表用户标识U2对子集合R0中的商品rm在评分矩阵DS2中的评分;
步骤2.3.3,分析比较评分集合Score1和评分集合Score2,得到所有满足以下条件的一致性用户评分序对,所有的一致性用户评分序对形成一致性用户评分序对集合Con;而所有的非一致性用户评分序对形成非一致性用户评分序对集合NCon:
一致性用户评分序对判断条件:
1)评分集合Score1中的两个不同元素,score1(U1,ra)和score1(U1,rb),其中,a≠b;
评分集合Score2中的两个不同元素:score2(U2,ra)和score2(U2,rb);
2)如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)≤score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)≥score2(U2,rb),即:用户标识U1对评分矩阵DS1中两个不同商品的评分高低感受,与用户标识U2对评分矩阵DS2中的同样两个商品的评分高低感受一致,则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对;
相反,如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)>score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)<score2(U2,rb),则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对;
步骤2.3.4,对于一致性用户评分序对集合Con中的每一对一致性用户评分序对,采用下式计算一致性用户评分序对距离值,然后将一致性用户评分序对集合Con中每个一致性用户评分序对对应的距离值相加,得到一致性集合距离值Dcon;
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对,则一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
对于非一致性用户评分序对集合NCon中的每一对非一致性用户评分序对,采用下式计算非一致性用户评分序对距离值,然后将非一致性用户评分序对集合NCon中每个非一致性用户评分序对对应的距离值相加,得到非一致性集合距离值Dncon:
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对,则非一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
步骤2.3.5,采用下式计算评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2之间的用户相似度sim1:
Figure BDA0002460294380000051
其中:
|Con|代表一致性用户评分序对集合Con中的元素数量;
|NCon|代表非一致性用户评分序对集合NCon中的元素数量;
步骤2.3.6,确定用户相似度阈值;如果用户相似度sim1小于用户相似度阈值,则得出评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2为不一致用户,则评分矩阵DS1中所有与用户标识U1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与用户标识U2有关的评分数据记录均删除;
步骤3,对两个评分矩阵进行分析,识别商品不一致的评分数据记录,并进行数据处理,方法如下:
步骤3.1,遍历评分矩阵DS1中的商品标识以及评分矩阵DS2中的商品标识,判断是否存在评分矩阵DS1中的商品标识与评分矩阵DS2中的商品标识相同的情况,如果不存在,则执行步骤4;如果存在,则执行步骤3.2;
步骤3.2,设评分矩阵DS1中的商品标识PR1与评分矩阵DS2中的商品标识PR2相同,则遍历评分矩阵DS1,查找到商品标识PR1在评分矩阵DS1的所有评分数据记录,从而得到商品标识PR1在评分矩阵DS1中被评分的用户集合UR1
遍历评分矩阵DS2,查找到商品标识PR2在评分矩阵DS2的所有评分数据记录,从而得到商品标识PR2在评分矩阵DS2中被评分的用户集合UR2
对用户集合UR1和用户集合UR2进行交集运算,得到共同用户集合UR0=(ur1,ur2,...,urf);其中,f为共同用户集合UR0中的用户数量;
步骤3.3,分析评分矩阵DS1,得到共同用户集合UR0中每个用户对评分矩阵DS1中的商品标识PR1的评分,得到评分集合Score3:
Score3={score3(ur1,PR1),score3(ur2,PR1),...,score3(urf,PR1)}
其中:
score3(ur1,PR1)代表用户标识ur1对商品标识PR1在评分矩阵DS1中的评分;
score3(ur2,PR1)代表用户标识ur2对商品标识PR1在评分矩阵DS1中的评分;
依此类推
score3(urf,PR1)代表用户标识urf对商品标识PR1在评分矩阵DS1中的评分;
分析评分矩阵DS2,得到共同用户集合UR0中每个用户对评分矩阵DS2中的商品标识PR2的评分,得到评分集合Score4:
Score4={score4(ur1,PR2),score4(ur2,PR2),...,score4(urf,PR2)}
其中:
score4(ur1,PR2)代表用户标识ur1对商品标识PR2在评分矩阵DS2中的评分;
score4(ur2,PR2)代表用户标识ur2对商品标识PR2在评分矩阵DS2中的评分;
依此类推
score4(urf,PR2)代表用户标识urf对商品标识PR2在评分矩阵DS2中的评分;
步骤3.4,采用下式计算评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分对距离值集合DScore1:
Figure BDA0002460294380000071
获得商品评分对距离值集合DScore1中的低四分位数Q'1和高四分位数Q'3,计算得到四分位数安全距IQR'=Q'3-Q'1
将IQR'作为评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分距离dis1,即dis1=IQR';
步骤3.5,确定商品评分距离阈值;如果商品评分距离dis1大于商品评分距离阈值,则得出评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2为不一致商品,则评分矩阵DS1中所有与商品标识PR1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与商品标识PR2有关的评分数据记录均删除;
步骤4,在对评分矩阵DS1和评分矩阵DS2进行分析识别,删除用户不一致和商品不一致的相关评分数据记录后,得到处理后的评分矩阵DS1和处理后的评分矩阵DS2
将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合。
优选的,步骤2.3.6中,采用以下方法确定用户相似度阈值:
1)设评分矩阵DS1中一共有k种用户标识,分别与评分矩阵DS2中的对应用户标识相同;则对于每种用户标识,均计算得到用户相似度sim1,因此,共计算得到k个用户相似度sim1,分别表示为:sim1(1),sim1(2),...,sim1(k);
由此得到用户相似度集合SIM={sim1(1),sim1(2),...,sim1(k)}
2)确定用户相似度集合SIM中的低四分位数Q1和高四分位数Q3,计算得到四分位数全距IQR=Q3-Q1
3)将Q1-1.5IQR作为异常值截断点,即为用户相似度阈值。
优选的,步骤3.5中,采用以下方法确定商品评分距离阈值:
1)设评分矩阵DS1中一共有v种商品标识,分别与评分矩阵DS2中的对应商品标识相同;则对于每种商品标识,均计算得到商品评分距离dis1,因此,共计算得到v个商品评分距离dis1,分别表示为:dis1(1),dis1(2),...,dis1(v);
由此得到商品评分距离集合DIS={dis1(1),dis1(2),...,dis1(v)}
2)确定商品评分距离集合DIS中的低四分位数Q”1和高四分位数Q”3,计算得到四分位数安全距IQR”=Q”3-Q”1
3)将Q”3+1.5IQR”作为异常值截断点,即为商品评分距离阈值。
优选的,步骤4中,将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合,具体为:
1)将处理后的评分矩阵DS1和处理后的评分矩阵DS2中的评分进行归一化处理,得到归一化的评分矩阵DS1和归一化的评分矩阵DS2
2)分析归一化的评分矩阵DS1和归一化的评分矩阵DS2,如果某一用户标识针对某一商品标识,仅在一个归一化的评分矩阵中具有评分,则该用户标识针对该商品标识的评分不变,直接表示在融合评分矩阵FScore中;
如果某一用户标识针对某一商品标识,在评分矩阵DS1和评分矩阵DS2中都具有评分,则将在评分矩阵DS1和评分矩阵DS2中的评分进行算术平均计算,得到最终评分,并表示在融合评分矩阵FScore中。
本发明提供的面向评分矩阵的多数据源融合方法具有以下优点:
本发明提供一种面向评分矩阵的多数据源融合方法,首先将用户不一致和商品不一致的相关评分数据记录删除,然后再进行数据融合,提高数据融合的准确性,从而最终提高商品推荐精准性。
附图说明
图1为本发明提供的面向评分矩阵的多数据源融合方法的流程示意图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参考图1,本发明提供一种面向评分矩阵的多数据源融合方法,包括以下步骤:
步骤1,获取分别来自两个数据源的评分矩阵,分别为:评分矩阵DS1和评分矩阵DS2;其中,每个评分矩阵由多条评分数据记录组成;每条评分数据记录为某个用户标识的用户,对某个商品标识的商品进行的评分;例如,评分矩阵DS1是来自京东网站的评分矩阵,评分矩阵DS2为来自淘宝网站的评分矩阵。
步骤2,对两个评分矩阵进行分析,识别用户不一致的评分数据记录,并进行数据处理,方法如下:
步骤2.1,遍历评分矩阵DS1中的用户标识以及评分矩阵DS2中的用户标识,判断是否存在评分矩阵DS1中的用户标识与评分矩阵DS2中的用户标识相同的情况,如果不存在,则执行步骤3;如果存在,则执行步骤2.2;
步骤2.2,设评分矩阵DS1中的用户标识U1与评分矩阵DS2中的用户标识U2相同,则遍历评分矩阵DS1,查找到用户标识U1在评分矩阵DS1的所有评分数据记录,从而得到用户标识U1在评分矩阵DS1进行评分的商品集合P1
遍历评分矩阵DS2,查找到用户标识U2在评分矩阵DS2的所有评分数据记录,从而得到用户标识U2在评分矩阵DS2进行评分的商品集合P2
对商品集合P1和商品集合P2进行交集运算,得到共同商品集合P0=(p1,p2,...,pn);其中,n为共同商品集合P0中的商品数量;
步骤2.3,对共同商品集合P0=(p1,p2,...,pn)中的商品种类进行分析,将属于同一商品种类的商品划分到一个子集合中,从而得到若干个子集合,对于每个子集合,均执行以下步骤:
步骤2.3.1,设任意子集合为R0=(r1,r2,...,rm);m为子集合R0中的商品数量;
步骤2.3.2,得到用户标识U1对子集合R0中的每个商品在评分矩阵DS1中的评分,得到评分集合Score1:
Score1={score1(U1,r1),score1(U1,r2),...,score1(U1,rm)}
其中:
score1(U1,r1)代表用户标识U1对子集合R0中的商品r1在评分矩阵DS1中的评分;
score1(U1,r2)代表用户标识U1对子集合R0中的商品r2在评分矩阵DS1中的评分;
依此类推
score1(U1,rm)代表用户标识U1对子集合R0中的商品rm在评分矩阵DS1中的评分;
得到用户标识U2对子集合R0中的每个商品在评分矩阵DS2中的评分,得到评分集合Score2:
Score2={score2(U2,r1),score2(U2,r2),...,score2(U2,rm)}
其中:
score2(U2,r1)代表用户标识U2对子集合R0中的商品r1在评分矩阵DS2中的评分;
score2(U2,r2)代表用户标识U2对子集合R0中的商品r2在评分矩阵DS2中的评分;
依此类推
score2(U2,rm)代表用户标识U2对子集合R0中的商品rm在评分矩阵DS2中的评分;
步骤2.3.3,分析比较评分集合Score1和评分集合Score2,得到所有满足以下条件的一致性用户评分序对,所有的一致性用户评分序对形成一致性用户评分序对集合Con;而所有的非一致性用户评分序对形成非一致性用户评分序对集合NCon:
一致性用户评分序对判断条件:
1)评分集合Score1中的两个不同元素,score1(U1,ra)和score1(U1,rb),其中,a≠b;
评分集合Score2中的两个不同元素:score2(U2,ra)和score2(U2,rb);
2)如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)≤score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)≥score2(U2,rb),即:用户标识U1对评分矩阵DS1中两个不同商品的评分高低感受,与用户标识U2对评分矩阵DS2中的同样两个商品的评分高低感受一致,则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对;
相反,如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)>score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)<score2(U2,rb),则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对;
步骤2.3.4,对于一致性用户评分序对集合Con中的每一对一致性用户评分序对,采用下式计算一致性用户评分序对距离值,然后将一致性用户评分序对集合Con中每个一致性用户评分序对对应的距离值相加,得到一致性集合距离值Dcon;
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对,则一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
对于非一致性用户评分序对集合NCon中的每一对非一致性用户评分序对,采用下式计算非一致性用户评分序对距离值,然后将非一致性用户评分序对集合NCon中每个非一致性用户评分序对对应的距离值相加,得到非一致性集合距离值Dncon:
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对,则非一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
步骤2.3.5,采用下式计算评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2之间的用户相似度sim1:
Figure BDA0002460294380000121
其中:
|Con|代表一致性用户评分序对集合Con中的元素数量;
|NCon|代表非一致性用户评分序对集合NCon中的元素数量;
由此可以看出,满足一致性用户评分序对的评分序对越多并且Dcon越小,则用户越趋向于一致;而满足非一致性用户评分序对的评分序对越多并且Dncon越大,则用户越趋向于不一致。
步骤2.3.6,确定用户相似度阈值;
如果用户相似度sim1小于用户相似度阈值,则得出评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2为不一致用户,则评分矩阵DS1中所有与用户标识U1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与用户标识U2有关的评分数据记录均删除;
具体的,步骤2.3.6中,采用以下方法确定用户相似度阈值:
1)设评分矩阵DS1中一共有k种用户标识,分别与评分矩阵DS2中的对应用户标识相同;则对于每种用户标识,均计算得到用户相似度sim1,因此,共计算得到k个用户相似度sim1,分别表示为:sim1(1),sim1(2),...,sim1(k);
由此得到用户相似度集合SIM={sim1(1),sim1(2),...,sim1(k)}
2)确定用户相似度集合SIM中的低四分位数Q1和高四分位数Q3,计算得到四分位数全距IQR=Q3-Q1
3)将Q1-1.5IQR作为异常值截断点,即为用户相似度阈值。
因此,本发明中,异常值截断点的设置值并非一个固定值,而是根据用户相似度集合的具体情况而相应变化,此种方式识别得到的用户之间的一致性结果更为准确。
步骤3,对两个评分矩阵进行分析,识别商品不一致的评分数据记录,并进行数据处理,方法如下:
步骤3.1,遍历评分矩阵DS1中的商品标识以及评分矩阵DS2中的商品标识,判断是否存在评分矩阵DS1中的商品标识与评分矩阵DS2中的商品标识相同的情况,如果不存在,则执行步骤4;如果存在,则执行步骤3.2;
步骤3.2,设评分矩阵DS1中的商品标识PR1与评分矩阵DS2中的商品标识PR2相同,则遍历评分矩阵DS1,查找到商品标识PR1在评分矩阵DS1的所有评分数据记录,从而得到商品标识PR1在评分矩阵DS1中被评分的用户集合UR1
遍历评分矩阵DS2,查找到商品标识PR2在评分矩阵DS2的所有评分数据记录,从而得到商品标识PR2在评分矩阵DS2中被评分的用户集合UR2
对用户集合UR1和用户集合UR2进行交集运算,得到共同用户集合UR0=(ur1,ur2,...,urf);其中,f为共同用户集合UR0中的用户数量;
步骤3.3,分析评分矩阵DS1,得到共同用户集合UR0中每个用户对评分矩阵DS1中的商品标识PR1的评分,得到评分集合Score3:
Score3={score3(ur1,PR1),score3(ur2,PR1),...,score3(urf,PR1)}
其中:
score3(ur1,PR1)代表用户标识ur1对商品标识PR1在评分矩阵DS1中的评分;
score3(ur2,PR1)代表用户标识ur2对商品标识PR1在评分矩阵DS1中的评分;
依此类推
score3(urf,PR1)代表用户标识urf对商品标识PR1在评分矩阵DS1中的评分;
分析评分矩阵DS2,得到共同用户集合UR0中每个用户对评分矩阵DS2中的商品标识PR2的评分,得到评分集合Score4:
Score4={score4(ur1,PR2),score4(ur2,PR2),...,score4(urf,PR2)}
其中:
score4(ur1,PR2)代表用户标识ur1对商品标识PR2在评分矩阵DS2中的评分;
score4(ur2,PR2)代表用户标识ur2对商品标识PR2在评分矩阵DS2中的评分;
依此类推
score4(urf,PR2)代表用户标识urf对商品标识PR2在评分矩阵DS2中的评分;
步骤3.4,采用下式计算评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分对距离值集合DScore1:
Figure BDA0002460294380000151
获得商品评分对距离值集合DScore1中的低四分位数Q'1和高四分位数Q'3,计算得到四分位数安全距IQR'=Q'3-Q'1
将IQR'作为评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分距离dis1,即dis1=IQR';
步骤3.5,确定商品评分距离阈值;
如果商品评分距离dis1大于商品评分距离阈值,则得出评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2为不一致商品,则评分矩阵DS1中所有与商品标识PR1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与商品标识PR2有关的评分数据记录均删除;
步骤3.5中,采用以下方法确定商品评分距离阈值:
1)设评分矩阵DS1中一共有v种商品标识,分别与评分矩阵DS2中的对应商品标识相同;则对于每种商品标识,均计算得到商品评分距离dis1,因此,共计算得到v个商品评分距离dis1,分别表示为:dis1(1),dis1(2),...,dis1(v);
由此得到商品评分距离集合DIS={dis1(1),dis1(2),...,dis1(v)}
2)确定商品评分距离集合DIS中的低四分位数Q”1和高四分位数Q”3,计算得到四分位数安全距IQR”=Q”3-Q”1
3)将Q”3+1.5IQR”作为异常值截断点,即为商品评分距离阈值。
本发明中,采用四分位数安全距IQR”作为商品评分距离标准,由此得到的商品不一致性结果的稳定性更好,可以避免某些情绪影响下评分差值极大的极端数据的干扰。并且,异常值截断点的设置值并非一个固定值,而是根据商品评分距离集合的具体情况而相应变化,此种方式识别得到的商品之间的不一致性结果更为准确。
步骤4,在对评分矩阵DS1和评分矩阵DS2进行分析识别,删除用户不一致和商品不一致的相关评分数据记录后,得到处理后的评分矩阵DS1和处理后的评分矩阵DS2
将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合。
步骤4中,将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合,具体为:
1)将处理后的评分矩阵DS1和处理后的评分矩阵DS2中的评分进行归一化处理,得到归一化的评分矩阵DS1和归一化的评分矩阵DS2
具体的,融合数据时,首先要统一评分标准Z分制,比如,数据源1的评分采用5分制,而数据源2的评分采用10分制,数据源3的评分采用百分制等。具体归一化方法为:将每个数据源的评分,都除以最高分制Z,获得0和1之间小数形式的评分数据。
2)分析归一化的评分矩阵DS1和归一化的评分矩阵DS2,如果某一用户标识针对某一商品标识,仅在一个归一化的评分矩阵中具有评分,则该用户标识针对该商品标识的评分不变,直接表示在融合评分矩阵FScore中;
如果某一用户标识针对某一商品标识,在评分矩阵DS1和评分矩阵DS2中都具有评分,则将在评分矩阵DS1和评分矩阵DS2中的评分进行算术平均计算,得到最终评分,并表示在融合评分矩阵FScore中。
需要强调的是,本发明描述的面向评分矩阵的多数据源融合方法,是针对两个数据源的情况进行的描述,本领域普通技术人员可以理解,当需要对多个数据源进行数据融合时,只需要两两数据源之间采用本发明方法进行处理即可。例如,当需要对3个数据源进行数据融合时,首先采用本发明方法对第1个数据源和第2个数据源进行数据融合,得到融合数据1;然后再采用本发明方法对融合数据1和第3个数据源进行数据融合,得到最终的融合数据。
本发明提供的面向评分矩阵的多数据源融合方法具有以下优点:
本发明提供一种面向评分矩阵的多数据源融合方法,首先识别到多数据源中用户重名和商品重名的情况,然后,将用户不一致和商品不一致的相关评分数据记录删除,然后再进行数据融合,提高数据融合的准确性,从而最终提高商品推荐精准性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (4)

1.一种面向评分矩阵的多数据源融合方法,其特征在于,包括以下步骤:
步骤1,获取分别来自两个数据源的评分矩阵,分别为:评分矩阵DS1和评分矩阵DS2;其中,每个评分矩阵由多条评分数据记录组成;每条评分数据记录为某个用户标识的用户,对某个商品标识的商品进行的评分;
步骤2,对两个评分矩阵进行分析,识别用户不一致的评分数据记录,并进行数据处理,方法如下:
步骤2.1,遍历评分矩阵DS1中的用户标识以及评分矩阵DS2中的用户标识,判断是否存在评分矩阵DS1中的用户标识与评分矩阵DS2中的用户标识相同的情况,如果不存在,则执行步骤3;如果存在,则执行步骤2.2;
步骤2.2,设评分矩阵DS1中的用户标识U1与评分矩阵DS2中的用户标识U2相同,则遍历评分矩阵DS1,查找到用户标识U1在评分矩阵DS1的所有评分数据记录,从而得到用户标识U1在评分矩阵DS1进行评分的商品集合P1
遍历评分矩阵DS2,查找到用户标识U2在评分矩阵DS2的所有评分数据记录,从而得到用户标识U2在评分矩阵DS2进行评分的商品集合P2
对商品集合P1和商品集合P2进行交集运算,得到共同商品集合P0=(p1,p2,...,pn);其中,n为共同商品集合P0中的商品数量;
步骤2.3,对共同商品集合P0=(p1,p2,...,pn)中的商品种类进行分析,将属于同一商品种类的商品划分到一个子集合中,从而得到若干个子集合,对于每个子集合,均执行以下步骤:
步骤2.3.1,设任意子集合为R0=(r1,r2,...,rm);m为子集合R0中的商品数量;
步骤2.3.2,得到用户标识U1对子集合R0中的每个商品在评分矩阵DS1中的评分,得到评分集合Score1:
Score1={score1(U1,r1),score1(U1,r2),...,score1(U1,rm)}
其中:
score1(U1,r1)代表用户标识U1对子集合R0中的商品r1在评分矩阵DS1中的评分;
score1(U1,r2)代表用户标识U1对子集合R0中的商品r2在评分矩阵DS1中的评分;
依此类推
score1(U1,rm)代表用户标识U1对子集合R0中的商品rm在评分矩阵DS1中的评分;
得到用户标识U2对子集合R0中的每个商品在评分矩阵DS2中的评分,得到评分集合Score2:
Score2={score2(U2,r1),score2(U2,r2),...,score2(U2,rm)}
其中:
score2(U2,r1)代表用户标识U2对子集合R0中的商品r1在评分矩阵DS2中的评分;
score2(U2,r2)代表用户标识U2对子集合R0中的商品r2在评分矩阵DS2中的评分;
依此类推
score2(U2,rm)代表用户标识U2对子集合R0中的商品rm在评分矩阵DS2中的评分;
步骤2.3.3,分析比较评分集合Score1和评分集合Score2,得到所有满足以下条件的一致性用户评分序对,所有的一致性用户评分序对形成一致性用户评分序对集合Con;而所有的非一致性用户评分序对形成非一致性用户评分序对集合NCon:
一致性用户评分序对判断条件:
1)评分集合Score1中的两个不同元素,score1(U1,ra)和score1(U1,rb),其中,a≠b;
评分集合Score2中的两个不同元素:score2(U2,ra)和score2(U2,rb);
2)如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)≤score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)≥score2(U2,rb),即:用户标识U1对评分矩阵DS1中两个不同商品的评分高低感受,与用户标识U2对评分矩阵DS2中的同样两个商品的评分高低感受一致,则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对;
相反,如果score1(U1,ra)≤score1(U1,rb)时,score2(U2,ra)>score2(U2,rb);
或者,如果score1(U1,ra)≥score1(U1,rb)时,score2(U2,ra)<score2(U2,rb),则两个用户评分序对(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对;
步骤2.3.4,对于一致性用户评分序对集合Con中的每一对一致性用户评分序对,采用下式计算一致性用户评分序对距离值,然后将一致性用户评分序对集合Con中每个一致性用户评分序对对应的距离值相加,得到一致性集合距离值Dcon;
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为一致性用户评分序对,则一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
对于非一致性用户评分序对集合NCon中的每一对非一致性用户评分序对,采用下式计算非一致性用户评分序对距离值,然后将非一致性用户评分序对集合NCon中每个非一致性用户评分序对对应的距离值相加,得到非一致性集合距离值Dncon:
如果(score1(U1,ra),score2(U2,ra))和(score1(U1,rb),score2(U2,rb))为非一致性用户评分序对,则非一致性用户评分序对距离值为:
max{|score1(U1,ra)-score2(U2,ra)|,|(score1(U1,rb)-score2(U2,rb)|}
步骤2.3.5,采用下式计算评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2之间的用户相似度sim1:
Figure FDA0002460294370000041
其中:
|Con|代表一致性用户评分序对集合Con中的元素数量;
|NCon|代表非一致性用户评分序对集合NCon中的元素数量;
步骤2.3.6,确定用户相似度阈值;如果用户相似度sim1小于用户相似度阈值,则得出评分矩阵DS1中用户标识U1与评分矩阵DS2中用户标识U2为不一致用户,则评分矩阵DS1中所有与用户标识U1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与用户标识U2有关的评分数据记录均删除;
步骤3,对两个评分矩阵进行分析,识别商品不一致的评分数据记录,并进行数据处理,方法如下:
步骤3.1,遍历评分矩阵DS1中的商品标识以及评分矩阵DS2中的商品标识,判断是否存在评分矩阵DS1中的商品标识与评分矩阵DS2中的商品标识相同的情况,如果不存在,则执行步骤4;如果存在,则执行步骤3.2;
步骤3.2,设评分矩阵DS1中的商品标识PR1与评分矩阵DS2中的商品标识PR2相同,则遍历评分矩阵DS1,查找到商品标识PR1在评分矩阵DS1的所有评分数据记录,从而得到商品标识PR1在评分矩阵DS1中被评分的用户集合UR1
遍历评分矩阵DS2,查找到商品标识PR2在评分矩阵DS2的所有评分数据记录,从而得到商品标识PR2在评分矩阵DS2中被评分的用户集合UR2
对用户集合UR1和用户集合UR2进行交集运算,得到共同用户集合UR0=(ur1,ur2,...,urf);其中,f为共同用户集合UR0中的用户数量;
步骤3.3,分析评分矩阵DS1,得到共同用户集合UR0中每个用户对评分矩阵DS1中的商品标识PR1的评分,得到评分集合Score3:
Score3={score3(ur1,PR1),score3(ur2,PR1),...,score3(urf,PR1)}
其中:
score3(ur1,PR1)代表用户标识ur1对商品标识PR1在评分矩阵DS1中的评分;
score3(ur2,PR1)代表用户标识ur2对商品标识PR1在评分矩阵DS1中的评分;
依此类推
score3(urf,PR1)代表用户标识urf对商品标识PR1在评分矩阵DS1中的评分;
分析评分矩阵DS2,得到共同用户集合UR0中每个用户对评分矩阵DS2中的商品标识PR2的评分,得到评分集合Score4:
Score4={score4(ur1,PR2),score4(ur2,PR2),...,score4(urf,PR2)}
其中:
score4(ur1,PR2)代表用户标识ur1对商品标识PR2在评分矩阵DS2中的评分;
score4(ur2,PR2)代表用户标识ur2对商品标识PR2在评分矩阵DS2中的评分;
依此类推
score4(urf,PR2)代表用户标识urf对商品标识PR2在评分矩阵DS2中的评分;
步骤3.4,采用下式计算评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分对距离值集合DScore1:
Figure FDA0002460294370000051
获得商品评分对距离值集合DScore1中的低四分位数Q'1和高四分位数Q'3,计算得到四分位数安全距IQR'=Q'3-Q'1
将IQR'作为评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2之间的商品评分距离dis1,即dis1=IQR';
步骤3.5,确定商品评分距离阈值;如果商品评分距离dis1大于商品评分距离阈值,则得出评分矩阵DS1中商品标识PR1与评分矩阵DS2中商品标识PR2为不一致商品,则评分矩阵DS1中所有与商品标识PR1有关的评分数据记录均删除,同时,将评分矩阵DS2中所有与商品标识PR2有关的评分数据记录均删除;
步骤4,在对评分矩阵DS1和评分矩阵DS2进行分析识别,删除用户不一致和商品不一致的相关评分数据记录后,得到处理后的评分矩阵DS1和处理后的评分矩阵DS2
将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合。
2.根据权利要求1所述的面向评分矩阵的多数据源融合方法,其特征在于,步骤2.3.6中,采用以下方法确定用户相似度阈值:
1)设评分矩阵DS1中一共有k种用户标识,分别与评分矩阵DS2中的对应用户标识相同;则对于每种用户标识,均计算得到用户相似度sim1,因此,共计算得到k个用户相似度sim1,分别表示为:sim1(1),sim1(2),...,sim1(k);
由此得到用户相似度集合SIM={sim1(1),sim1(2),...,sim1(k)}
2)确定用户相似度集合SIM中的低四分位数Q1和高四分位数Q3,计算得到四分位数全距IQR=Q3-Q1
3)将Q1-1.5IQR作为异常值截断点,即为用户相似度阈值。
3.根据权利要求1所述的面向评分矩阵的多数据源融合方法,其特征在于,步骤3.5中,采用以下方法确定商品评分距离阈值:
1)设评分矩阵DS1中一共有v种商品标识,分别与评分矩阵DS2中的对应商品标识相同;则对于每种商品标识,均计算得到商品评分距离dis1,因此,共计算得到v个商品评分距离dis1,分别表示为:dis1(1),dis1(2),...,dis1(v);
由此得到商品评分距离集合DIS={dis1(1),dis1(2),...,dis1(v)}
2)确定商品评分距离集合DIS中的低四分位数Q”1和高四分位数Q”3,计算得到四分位数安全距IQR”=Q”3-Q”1
3)将Q”3+1.5IQR”作为异常值截断点,即为商品评分距离阈值。
4.根据权利要求1所述的面向评分矩阵的多数据源融合方法,其特征在于,步骤4中,将处理后的评分矩阵DS1和处理后的评分矩阵DS2进行数据融合,具体为:
1)将处理后的评分矩阵DS1和处理后的评分矩阵DS2中的评分进行归一化处理,得到归一化的评分矩阵DS1和归一化的评分矩阵DS2
2)分析归一化的评分矩阵DS1和归一化的评分矩阵DS2,如果某一用户标识针对某一商品标识,仅在一个归一化的评分矩阵中具有评分,则该用户标识针对该商品标识的评分不变,直接表示在融合评分矩阵FScore中;
如果某一用户标识针对某一商品标识,在评分矩阵DS1和评分矩阵DS2中都具有评分,则将在评分矩阵DS1和评分矩阵DS2中的评分进行算术平均计算,得到最终评分,并表示在融合评分矩阵FScore中。
CN202010318220.4A 2020-04-21 2020-04-21 面向评分矩阵的多数据源融合方法 Active CN111523590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010318220.4A CN111523590B (zh) 2020-04-21 2020-04-21 面向评分矩阵的多数据源融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010318220.4A CN111523590B (zh) 2020-04-21 2020-04-21 面向评分矩阵的多数据源融合方法

Publications (2)

Publication Number Publication Date
CN111523590A true CN111523590A (zh) 2020-08-11
CN111523590B CN111523590B (zh) 2023-04-07

Family

ID=71903627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010318220.4A Active CN111523590B (zh) 2020-04-21 2020-04-21 面向评分矩阵的多数据源融合方法

Country Status (1)

Country Link
CN (1) CN111523590B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743480A (zh) * 2021-08-19 2021-12-03 中国电子科技集团公司第二十七研究所 基于相互一致性的多源数据融合异常值识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN104463637A (zh) * 2014-12-23 2015-03-25 北京石油化工学院 一种基于电商平台的商品推荐方法、装置及服务器
US20180047036A1 (en) * 2016-08-11 2018-02-15 Ricoh Company, Ltd. User behavior analysis method and device as well as non-transitory computer-readable medium
CN108280738A (zh) * 2017-12-13 2018-07-13 西安电子科技大学 基于图像和社会化标签的商品推荐方法
CN109658210A (zh) * 2019-02-18 2019-04-19 苏州大学 一种商品推荐方法、装置、设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN104463637A (zh) * 2014-12-23 2015-03-25 北京石油化工学院 一种基于电商平台的商品推荐方法、装置及服务器
US20180047036A1 (en) * 2016-08-11 2018-02-15 Ricoh Company, Ltd. User behavior analysis method and device as well as non-transitory computer-readable medium
CN108280738A (zh) * 2017-12-13 2018-07-13 西安电子科技大学 基于图像和社会化标签的商品推荐方法
CN109658210A (zh) * 2019-02-18 2019-04-19 苏州大学 一种商品推荐方法、装置、设备以及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李琳 等: "融合评分矩阵与评论文本的商品推荐模型", 《计算机学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743480A (zh) * 2021-08-19 2021-12-03 中国电子科技集团公司第二十七研究所 基于相互一致性的多源数据融合异常值识别方法

Also Published As

Publication number Publication date
CN111523590B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN108876537B (zh) 一种用于网上商场系统的混合推荐方法
CN106446228B (zh) 一种web页面数据的采集分析方法及装置
CN109064285B (zh) 一种获得商品推荐序列及商品推荐方法
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
CN103377250B (zh) 基于邻域的top‑k推荐方法
US8751458B2 (en) Method and system for saving database storage space
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN104933172A (zh) 一种基于用户搜索行为的信息推送方法和装置
JP2019508756A (ja) 電子配信プラットフォーム上で提示対象を選択および推奨するための方法および装置
Tan et al. Time series clustering: A superior alternative for market basket analysis
CN110046196A (zh) 标识关联方法及装置、电子设备
CN111882399B (zh) 服务信息推荐方法、装置、计算机系统及可读存储介质
US20140101146A1 (en) System and process for discovering relationships between entities based on common areas of interest
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN116739626A (zh) 商品数据挖掘处理方法、装置、电子设备及可读介质
CN110827101A (zh) 一种店铺推荐的方法和装置
CN111523590B (zh) 面向评分矩阵的多数据源融合方法
CN112182071A (zh) 数据关联关系挖掘方法、装置、电子设备及存储介质
CN112966504A (zh) 名称识别及关联推荐方法、装置、计算机设备及存储介质
AU2021105123A4 (en) Redundancy rule screening method for association rule mining and device thereof
CN111651477A (zh) 基于语义相似度的多源异构商品一致性判别方法和装置
CN116910650A (zh) 数据识别方法、装置、存储介质及计算机设备
CN106168975A (zh) 目标用户浓度的获取方法及装置
CN111160975A (zh) 一种目标用户确定方法、装置、设备及计算机存储介质
CN108614811B (zh) 一种数据分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 321004 No.588, Yingbin Avenue, Wucheng District, Jinhua City, Zhejiang Province

Applicant after: Mo Yuchang

Address before: The city of Quanzhou City, Fujian province Fengze District 362000 Hua Road No. 269

Applicant before: Mo Yuchang

GR01 Patent grant
GR01 Patent grant