CN112270463A - 多方数据集结处理方法、装置、电子设备和介质 - Google Patents
多方数据集结处理方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN112270463A CN112270463A CN202011107299.2A CN202011107299A CN112270463A CN 112270463 A CN112270463 A CN 112270463A CN 202011107299 A CN202011107299 A CN 202011107299A CN 112270463 A CN112270463 A CN 112270463A
- Authority
- CN
- China
- Prior art keywords
- user
- credit
- value
- data
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 35
- 238000004220 aggregation Methods 0.000 title claims abstract description 35
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000003211 malignant effect Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 abstract description 34
- 230000002159 abnormal effect Effects 0.000 abstract description 15
- 230000008569 process Effects 0.000 abstract description 11
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000011158 quantitative evaluation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种多方数据集结处理方法、装置、电子设备和介质。本申请中多方数据集结处理方法包括:获取待处理数据,所述待处理数据包括多个用户对多个对象中的每个对象的评分;分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值;根据所述待处理数据和所述用户的信用值获得所述对象的目标评分,可以在多方数据集结处理中合理整合多方信息,在评价处理过程中,不损失有效评分信息的情况下消除一定异常评价的影响,使评价信息更客观。
Description
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种多方数据集结处理方法、装置、电子设备和介质。
背景技术
在项目评审、招聘选拔、资产估价、评优评奖、用户点评、服务评价、学科评估等各类评估、评选活动中,经常涉及到评分机制,作为评委身份的一类用户评分主导了结果。
而在这类评分过程中也经常会遇到同样的问题:如何将多个用户的数据进行综合,比如如何将多方评分集结成最终评分,其难点在于如何解决异常评分问题。如果处理不当,少量用户的异常评分就会严重影响最终评分结果。一般的,“去掉一个最高分、去掉一个最低分,然后再求平均值”就是一种解决异常评分的常用方法,但是这种简单处理方法显然会损失很多有效信息,而且当有多个最高分或最低分的时候也会失效,适用性低。
发明内容
本申请提供了一种多方数据集结处理方法、装置、电子设备和介质。
第一方面,提供了一种多方数据集结处理方法,包括:
获取待处理数据,所述待处理数据包括多个用户对多个对象中的每个对象的评分;
分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值;
根据所述待处理数据和所述用户的信用值获得所述对象的目标评分。
在一种可选的实施方式中,所述分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值,包括:
获取所述用户的信用初始值;
通过迭代法分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,更新所述用户的信用初始值,确定所述用户的信用值。
在一种可选的实施方式中,所述通过迭代法分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,更新所述用户的信用初始值,确定所述用户的信用值,包括:
获取所述用户的信用初始值,根据所述用户的信用初始值,对所述待处理数据中每个所述对象所获的评分进行加权平均处理,获得所述对象的实力值;
根据所述对象的实力值和所述待处理数据,获得每个用户的可信度得分集合,包括所述每个用户对所述每个对象的评分的可信度;
根据所述每个用户的可信度得分集合,确定所述每个用户的目标可信度;
根据所述目标可信度更新所述每个用户的信用值,将更新后的每个用户的信用值代入所述信用初始值进行计算;
重复以上步骤直至所述用户的信用值变化幅度小于给定阈值,或者,达到最大迭代次数,获得所述用户的信用值。
在一种可选的实施方式中,所述根据所述每个用户的可信度得分集合,确定所述每个用户的目标可信度,包括:
获得所述每个用户的可信度得分集合中的可信度平均值,作为所述每个用户的目标可信度;或者,
将所述每个用户的可信度得分集合中的可信度最大值或最小值,作为所述每个用户的目标可信度。
在一种可选的实施方式中,所述根据所述待处理数据和所述用户的信用值获得所述对象的目标评分,包括:
根据所述用户的信用值,对所述待处理数据中每个所述对象所获的评分进行加权平均处理,获得所述对象的目标评分。
在一种可选的实施方式中,在所述确定所述每个用户的目标可信度之后,所述方法还包括:
将所述目标可信度最低,并且所述目标可信度低于可信度阈值的用户标记为嫌疑恶评用户;和/或,
将所述信用值低于信用阈值的用户标记为所述嫌疑恶评用户。
可选的,所述方法还包括:
在检测到所述嫌疑恶评用户在在评分时对应的信用值至少两次低于所述信用阈值的情况下,限制所述嫌疑恶评用户的评分权限。
第二方面,提供了一种多方数据集结处理装置,包括:
获取模块,用于获取待处理数据,所述待处理数据包括多个用户对多个对象中的每个对象的评分;
处理模块,用于分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值;
所述处理模块还用于,根据所述待处理数据和所述用户的信用值获得所述对象的目标评分。
第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。
第四方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。
本申请通过获取待处理数据,上述待处理数据包括多个用户对多个对象中的每个对象的评分,然后分析上述待处理数据中上述多个用户中的每个用户与其他用户的评分差异,确定上述用户的信用值,根据上述待处理数据和上述用户的信用值获得上述对象的目标评分,可以在多方数据集结处理中合理整合多方信息,在评价处理过程中,降低提供异常数据用户的信用权重,并且不需要去掉评分,不会损失有效的评分信息,可以消除一定异常评价的影响,使评价信息更客观。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种多方数据集结处理方法的流程示意图;
图2为本申请实施例提供的另一种多方数据集结处理方法的流程示意图;
图3为本申请实施例提供的一种多方数据集结处理装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种多方数据集结处理方法的流程示意图。该方法可包括:
101、获取待处理数据,上述待处理数据包括多个用户对多个对象中的每个对象的评分。
本申请实施例的执行主体可以为一种多方数据集结处理装置,可以为电子设备,具体实现中,上述电子设备为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备,也可以为一种服务器,服务器在网络中为其它客户端提供计算或者应用服务。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。在一种可选的实施方式中,上述多方数据集结处理方法可以通过相应的软件程序运行。用户可以通过客户端的应用程序进行对对象进行评分操作。
其中,上述对象可以是用户进行评分的对象,包括但不限于参评选手、各类商品、服务、提供服务的平台、机构、店面或者员工等,用户可以为评委或者作为类似评委的角色给出评分。上述待处理数据可以是至少两个用户对对象的评分数据,可以对多个用户给一个或者多个对象的评分进行统计分析。
可以假设有N个用户,有M个对象,上述N和M均为大于1的整数。用户可对M个对象中的部分或者全部进行评分。评分系统可限制评分范围,用户仅可对给出的对象进行评分,例如限定用户仅能对其订单产品进行评分,如购买过的商品、入住过的酒店。在服务类软件平台,评分系统可根据预设的范围规则主动向用户推送评分请求,用户作为用户可对评分请求中的对象进行评分。本申请实施例对发起评分的方式和规则不做限制。
具体的,为了便于进行统计分析,可假设N个用户对M个对象进行评分,记第i个用户bi对第j个对象aj的评分为rij>0,即若第i个用户bi未对第j个对象aj评分,则rij=0。其中每个用户评分的对象可以是完全相同的或者不完全相同(有重叠)的。
具体的,可以记所有给对象aj评分的用户集合为Uj,即Uj={irij>0};记所有被用户bi评分的对象集合为Vi,即Vi={jrij>0}。
102、分析上述待处理数据中上述多个用户中的每个用户与其他用户的评分差异,确定上述用户的信用值。
为了消除异常数据的影响,本方法引入用户的信用值的概念,需要注意的是本申请实施例中的用户信用值不是由用户日常行为累积的信用值,而是在评分中与其他用户的评分差异。总体来讲可以是,在同一批对象的评分中,给对象的评分与其他用户越接近,该用户的信用值越高。
具体的,可以根据上述待处理数据,生成评分矩阵R=(rij)M×M,通过对各用户所给出的评分进行打分的方式,分析各个用户与其他用户的评分差异,评估用户评分的信用值,作为计算对象最终得分的参考。
在一种实施方式中,上述步骤102可包括:
获取上述用户的信用初始值;
通过迭代法分析上述待处理数据中上述多个用户中的每个用户与其他用户的评分差异,更新上述用户的信用初始值,确定上述用户的信用值。
对于多用户评分的处理,可以预设各个用户的信用初始值为1,再根据预设的迭代方法进行处理,更新上述用户的信用初始值,至用户信用值变化幅度小于给定阈值,或者达到最大迭代次数,以获得最终的用户的信用值。
103、根据上述待处理数据和上述用户的信用值获得上述对象的目标评分。
具体的,在获得上述用户的信用值之后,可以根据各个用户的信用值,对上述待处理数据中用户给出的评分进行调整,主要是基于各个用户的信用值进行加权,来计算最终对象的评分。
在一种可选的实施方式中,上述步骤103可包括:
根据上述用户的信用值,对上述待处理数据中每个上述对象所获的评分进行加权平均处理,获得上述对象的目标评分。
通过上述用户的信用值作参考,对对象获得的多个评分进行加权平均处理,即使用上述用户的信用值占全部用户信用值之和的比值作为权重,来分别计算各个对象的得分平均值,从而获得各个对象的实力值(上述目标评分),能够使对象获得的评分更客观。
本申请通过获取待处理数据,上述待处理数据包括点评用户对对象的评分信息,分析上述待处理数据确定上述点评用户的信用值,根据上述待处理数据和上述点评用户的信用值确定上述对象的实力值,再根据上述对象的实力值对上述对象进行排序,获得上述对象的目标评分,可以在评价处理过程中消除一定异常评价的影响,使评价信息更客观。
请参阅图2,图2是本申请实施例提供的一种多方数据集结处理方法中信用值迭代方法的流程示意图。如图2所示,该迭代方法可以适用于如图1所示实施例中的多方数据集结处理方法。具体可包括:
201、获取上述用户的信用初始值,根据上述用户的信用初始值,对上述待处理数据中每个上述对象所获的评分进行加权平均处理,获得上述对象的实力值。
本申请实施例的执行主体可以为一种多方数据集结处理装置,可以为电子设备,具体实现中,上述电子设备为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备,也可以为一种服务器,服务器在网络中为其它客户端提供计算或者应用服务。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。在一种可选的实施方式中,上述多方数据集结处理方法可以通过相应的软件程序运行。用户可以通过客户端的应用程序进行对对象进行评分操作。
本申请实施例中用户的信用值表示为Ci。在图1所示实施例的背景下,假设N个用户对M个对象进行评分,记第i个用户bi对第j个对象aj的评分为rij>0;若第i个用户bi未对第j个对象aj评分,则rij=0。可以通过输入评分矩阵R=(rij)M×M的形式进行处理。
可选的,上述初始信用值为1的情况下,对每个对象所获的评分进行加权平均处理即为计算算数平均值。具体的,上述步骤101可包括:
(1)令每个用户的初始信用值Ci均为1,即:
C1=C2=C3=...=Ci=CN=1。
(2)计算每个对象所获评分的加权平均值作为该对象的实力值Qj,即:
202、根据上述对象的实力值和上述待处理数据,获得每个用户的可信度得分集合,包括上述每个用户对上述每个对象的评分的可信度。
具体的,对于各个用户对每个对象的评分的可信度,可以理解为计算每个用户对于每个对象评分的得分,具体的计算方法可如下:
(3)计算每个用户对于每个对象vj评分的得分Zij,即:
如果rij=0,则令Zij=∞。
在获得每个用户对上述每个对象的评分的可信度之后,可以执行步骤203。
203、根据上述每个用户的可信度得分集合,确定上述每个用户的目标可信度。
要基于前述获得的用户的可信度得分集合,确定用户的一个目标可信度,用于进一步计算用户的信用值。
在一种可选的实施方式中,上述上述根据上述每个用户的可信度得分集合,确定上述每个用户的目标可信度,包括:
获得上述每个用户的可信度得分集合中的可信度平均值,作为上述每个用户的目标可信度。即具体可以表示为:
在另一种实施方式中,也可以将上述每个用户的可信度得分集合中的可信度最大值或最小值,作为上述每个用户的目标可信度,本申请实施例对此不做限制。
可选的,在上述确定上述每个用户的目标可信度之后,上述方法还包括:
将上述目标可信度最低,并且上述目标可信度低于可信度阈值的用户标记为嫌疑恶评用户;和/或,
将上述信用值低于信用阈值的用户标记为上述嫌疑恶评用户。
具体的,可以根据需要设置上述可信度阈值,在计算各个用户的目标可信度之后,可以确定其中目标可信度最低的用户,并将该最低的目标可信度与上述可信度阈值进行比较,若该最低的目标可信度低于可信度阈值,则将对应的用户标记为嫌疑恶评用户。
在一种可选的实施方式中,上述步骤102之后,该方法还包括:
当检测到上述点评用户的信用值低于预设信用阈值的情况下,将上述点评用户标记为嫌疑恶评用户;
当检测到上述嫌疑恶评用户在评价时对应的信用值至少两次低于上述预设信用阈值的情况下,限制上述嫌疑恶评用户的评价权限。
可以根据需要设置上述预设信用阈值,在确定用户在评分中的信用值之后还可以比较用户的信用值和上述预设信用阈值,若有用户的信用值低于预设信用阈值,则将该用户标记为嫌疑恶评用户,记录在系统中,并可以向该用户发送提示信息,以提示其慎重客观地进行评分。
进一步可选的,上述方法还包括:
在检测到上述嫌疑恶评用户在在评分时对应的信用值至少两次低于上述信用阈值的情况下,限制上述嫌疑恶评用户的评分权限。
信用值低的情况可以理解为该用户的评分与其他用户的评分差异较大,有恶意评分的嫌疑。在此之后的评分中,若作为嫌疑恶评用户,发生至少两次在评价时其对应的信用值低于上述预设信用阈值的情况,可以在一定的周期内禁止该嫌疑恶评用户的评分资格。可以对信用值较低的嫌疑恶评用户或者恶评用户制定一系列的惩罚措施,本申请实施例对此不做限制。
204、根据上述目标可信度更新上述每个用户的信用值,将更新后的每个用户的信用值代入上述信用初始值进行计算。
205、重复以上步骤直至上述用户的信用值变化幅度小于给定阈值,或者,达到最大迭代次数,获得上述用户的信用值。
上述将更新后的每个用户的信用值代入上述信用初始值进行计算,重复执行的步骤指的是继续进行迭代计算。具体的,通过上述步骤进行迭代即重复(2)-(5),直至用户信用值变化幅度小于给定阈值δ,即:
或者,达到最大迭代次数Itmax。则最后可以输出实力值Qj作为对象vj的最终聚合评分。以上为信用值迭代的具体方法,在获得各个用户最终的信用值可以再执行如图1所示实施例中步骤103的具体描述,即(2)中的公式进行计算,获得各对象的最终评分,此处不再赘述。
举例来讲,表1为本申请实施例提供的一种原始评分列表,假设5个用户对5个对象按照百分制打分,具体评分情况如表1所示。假设5个对象的真实实力值依次为95、90、85、80、75,从表1可以看出u1、u2、u3三位用户的打分较为接近真实实力值,用户u4对每一位对象的评分均相同,有消极评价的嫌疑,用户u5的评分与真实实力严重不符,有恶意评价的嫌疑。如果直接采用平均值方法,5位对象的评分依次为85.00、84.60、82.80、82.60、79.80,其中对象v1和v2的评分由于用户u4和u5的异常评分明显低于其真实实力值。如果简单采用“去掉一个最高分、去掉一个最低分”的方法,5位对象的评分依次为90.00、87.00、82.67、80.33、77.00,也未能有效消除异常评分的影响。
v<sub>1</sub> | v<sub>2</sub> | v | v<sub>4</sub> | v<sub>5</sub> | |
u<sub>1</sub> | 95 | 90 | 85 | 80 | 75 |
u<sub>2</sub> | 94 | 91 | 86 | 81 | 73 |
u<sub>3</sub> | 96 | 92 | 83 | 82 | 76 |
u<sub>4</sub> | 80 | 80 | 80 | 80 | 80 |
u<sub>5</sub> | 60 | 70 | 80 | 90 | 95 |
表1
下面采用本申请实施例的多方数据集结处理方法来计算最终聚合评分,选取阈值δ=10-4,最大迭代次数Itmax=100,惩罚系数θ=100,具体计算过程如表2所示。表2为本申请实施例提供的一种用户信用值和对象实力值迭代计算过程示意表,从表2可知,经过11次迭代,最后得到的各对象聚合评分依次为94.65、90.59、84.87、80.73、74.59,与真实实力值非常接近。从表2可以看出,在迭代过程中用户u4和u5的信用值(C4和C5)被逐渐调低,其在聚合评分中的权重也逐渐变小,从而有效消除了消极评价和恶意评价的影响,对于异常评价具有很强的鲁棒性。
C<sub>1</sub> | C<sub>2</sub> | C<sub>3</sub> | C<sub>4</sub> | C<sub>5</sub> | Q<sub>1</sub> | Q<sub>2</sub> | Q<sub>3</sub> | Q<sub>4</sub> | Q<sub>5</sub> | Δ | |
t=0 | 1 | 1 | 1 | 1 | 1 | 85.0 | 84.6 | 82.8 | 82.6 | 79.8 | |
t=1 | 0.038 | 0.025 | 0.110 | 0.079 | 0.000 | 90.5 | 87.8 | 82.6 | 80.9 | 76.8 | 2.124 |
t=2 | 0.168 | 0.111 | 0.300 | 0.049 | 0.000 | 94.1 | 90.3 | 83.8 | 81.1 | 75.5 | 0.247 |
t=3 | 0.452 | 0.333 | 0.455 | 0.023 | 0.000 | 94.8 | 90.7 | 84.4 | 80.9 | 74.9 | 0.393 |
t=4 | 0.620 | 0.479 | 0.385 | 0.021 | 0.000 | 94.7 | 90.6 | 84.7 | 80.8 | 74.6 | 0.232 |
t=5 | 0.692 | 0.527 | 0.339 | 0.021 | 0.000 | 94.6 | 90.6 | 84.8 | 80.7 | 74.6 | 0.098 |
t=6 | 0.722 | 0.541 | 0.324 | 0.021 | 0.000 | 94.6 | 90.6 | 84.8 | 80.7 | 74.6 | 0.036 |
t=7 | 0.732 | 0.544 | 0.319 | 0.022 | 0.000 | 94.6 | 90.6 | 84.8 | 80.7 | 74.5 | 0.011 |
t=8 | 0.735 | 0.545 | 0.318 | 0.022 | 0.000 | 94.6 | 90.6 | 84.8 | 80.7 | 74.5 | 0.003 |
t=9 | 0.736 | 0.545 | 0.317 | 0.022 | 0.000 | 94.6 | 90.5 | 84.8 | 80.7 | 74.5 | 0.001 |
t=10 | 0.736 | 0.545 | 0.317 | 0.022 | 0.000 | 94.6 | 90.5 | 84.8 | 80.7 | 74.5 | 0.000 |
t=11 | 0.736 | 0.545 | 0.317 | 0.022 | 0.000 | 94.6 | 90.5 | 84.8 | 80.7 | 74.5 | 0.000 |
表2
目前很多评价系统使用定量评价的方式,例如某平台1中用户进行评论时还可以对电影或书籍进行一星到五星的评价,将用户的评价换算成0到10分,再求均值就得到了电影和书籍的评分;某平台2中用户可以对餐厅按照“总体”、“口味”、“环境”、“服务”四个维度进行一星到五星的评分;某平台3中用户可以对酒店按照“卫生”、“环境”、“服务”、“设施”四个维度进行1分到5分的评分;某平台4中用户可以对商品按照“好评”、“中评”、“差评”三档进行整体评价,再从“描述相符”、“物流服务”、“服务态度”三个维度进行1分到5分的评分。
上述定量评价的最大优点是直观,但是,目前基于定量评价的在线点评方式也面临很多瓶颈问题。虽然各类评分系统都规定了评分量纲,但是很难统一评价尺度。有的用户尺度很严,很好的受评评对象也只给三星;有的用户尺度很松,很差的对象也给三星。对于不同尺度的评分,如果简单求均值很难得到客观的总体评分。并且由于缺乏有效甄别机制,大多数在线评分系统对于恶意差评、水军刷分等异常评分的鲁棒性都较差,特别是对于点评数量很少的对象,少数异常评分就会拉低或拉高对象的整体评分。
相对于上述一般的在线评分系统存在的问题,本申请实施例中的多方数据集结处理方法,通过比对每个用户与其他用户的评分差异,迭代计算每个用户的信用值,再以信用值为权重计算加权平均分,通过降低提供异常数据用户的信用权重,可有效消除消极评价和恶意评价等异常数据的影响,提供更客观公正的评分机制和评价环境。
基于上述多方数据集结处理方法实施例的描述,本申请实施例还公开了一种多方数据集结处理装置。请参见图3,多方数据集结处理装置300包括:
获取模块310,用于获取待处理数据,上述待处理数据包括多个用户对多个对象中的每个对象的评分;
处理模块320,用于分析上述待处理数据中上述多个用户中的每个用户与其他用户的评分差异,确定上述用户的信用值;
上述处理模块320还用于,根据上述待处理数据和上述用户的信用值获得上述对象的目标评分。
可选的,上述处理模块320具体用于:
获取上述用户的信用初始值;
通过迭代法分析上述待处理数据中上述多个用户中的每个用户与其他用户的评分差异,更新上述用户的信用初始值,确定上述用户的信用值。
可选的,上述处理模块320还具体用于:
获取上述用户的信用初始值,根据上述用户的信用初始值,对上述待处理数据中每个上述对象所获的评分进行加权平均处理,获得上述对象的实力值;
根据上述对象的实力值和上述待处理数据,获得每个用户的可信度得分集合,包括上述每个用户对上述每个对象的评分的可信度;
根据上述每个用户的可信度得分集合,确定上述每个用户的目标可信度;
根据上述目标可信度更新上述每个用户的信用值,将更新后的每个用户的信用值代入上述信用初始值进行计算;
重复以上步骤直至上述用户的信用值变化幅度小于给定阈值,或者,达到最大迭代次数,获得上述用户的信用值。
可选的,上述处理模块320还具体用于:
获得上述每个用户的可信度得分集合中的可信度平均值,作为上述每个用户的目标可信度;或者,
将上述每个用户的可信度得分集合中的可信度最大值或最小值,作为上述每个用户的目标可信度。
可选的,上述处理模块320还具体用于:
根据上述用户的信用值,对上述待处理数据中每个上述对象所获的评分进行加权平均处理,获得上述对象的目标评分。
可选的,上述处理模块320还用于,在上述确定上述每个用户的目标可信度之后,将上述目标可信度最低,并且上述目标可信度低于可信度阈值的用户标记为嫌疑恶评用户;和/或,
将上述信用值低于信用阈值的用户标记为上述嫌疑恶评用户。
可选的,上述处理模块320还用于,在检测到上述嫌疑恶评用户在在评分时对应的信用值至少两次低于上述信用阈值的情况下,限制上述嫌疑恶评用户的评分权限
根据本申请的一个实施例,图1和图2所示的方法所涉及的各个步骤均可以是由图3所示的多方数据集结处理装置300中的各个模块执行的,此处不再赘述。
本申请实施例中的多方数据集结处理装置300,可以获取待处理数据,上述待处理数据包括点评用户对对象的评分信息,分析上述待处理数据确定上述点评用户的信用值,根据上述待处理数据和上述点评用户的信用值确定上述对象的实力值,再根据上述对象的实力值对上述对象进行排序,获得上述对象的目标评分,可以在评价处理过程中消除一定异常评价的影响,使评价信息更客观。
基于上述方法实施例以及装置实施例的描述,本申请实施例还提供一种电子设备。请参见图4,该电子设备400至少包括处理器401、输入设备402、输出设备403以及计算机存储介质404。其中,电子设备内的处理器401、输入设备402、输出设备403以及计算机存储介质404可通过总线或其他方式连接。
计算机存储介质404可以存储在电子设备的存储器中,上述计算机存储介质404用于存储计算机程序,上述计算机程序包括程序指令,上述处理器401用于执行上述计算机存储介质404存储的程序指令。处理器401(或称CPU(Central Processing Unit,中央处理器))是电子设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能;在一个实施例中,本申请实施例上述的处理器401可以用于进行一系列的处理,包括如图1和图2所示实施例中方法等等。
本申请实施例还提供了一种计算机存储介质(Memory),上述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括电子设备中的内置存储介质,当然也可以包括电子设备所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了电子设备的操作系统。并且,在该存储空间中还存放了适于被处理器401加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
在一个实施例中,可由处理器401加载并执行计算机存储介质中存放的一条或多条指令,以实现上述实施例中的相应步骤;具体实现中,计算机存储介质中的一条或多条指令可以由处理器401加载并执行图1和/或图2中方法的任意步骤,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。
Claims (10)
1.一种多方数据集结处理方法,其特征在于,包括:
获取待处理数据,所述待处理数据包括多个用户对多个对象中的每个对象的评分;
分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值;
根据所述待处理数据和所述用户的信用值获得所述对象的目标评分。
2.根据权利要求1所述的多方数据集结处理方法,其特征在于,所述分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值,包括:
获取所述用户的信用初始值;
通过迭代法分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,更新所述用户的信用初始值,确定所述用户的信用值。
3.根据权利要求2所述的多方数据集结处理方法,其特征在于,所述通过迭代法分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,更新所述用户的信用初始值,确定所述用户的信用值,包括:
获取所述用户的信用初始值,根据所述用户的信用初始值,对所述待处理数据中每个所述对象所获的评分进行加权平均处理,获得所述对象的实力值;
根据所述对象的实力值和所述待处理数据,获得每个用户的可信度得分集合,包括所述每个用户对所述每个对象的评分的可信度;
根据所述每个用户的可信度得分集合,确定所述每个用户的目标可信度;
根据所述目标可信度更新所述每个用户的信用值,将更新后的每个用户的信用值代入所述信用初始值进行计算;
重复以上步骤直至所述用户的信用值变化幅度小于给定阈值,或者,达到最大迭代次数,获得所述用户的信用值。
4.根据权利要求3所述的多方数据集结处理方法,其特征在于,所述根据所述每个用户的可信度得分集合,确定所述每个用户的目标可信度,包括:
获得所述每个用户的可信度得分集合中的可信度平均值,作为所述每个用户的目标可信度;或者,
将所述每个用户的可信度得分集合中的可信度最大值或最小值,作为所述每个用户的目标可信度。
5.根据权利要求1-4任一项所述的多方数据集结处理方法,其特征在于,所述根据所述待处理数据和所述用户的信用值获得所述对象的目标评分,包括:
根据所述用户的信用值,对所述待处理数据中每个所述对象所获的评分进行加权平均处理,获得所述对象的目标评分。
6.根据权利要求5所述的多方数据集结处理方法,其特征在于,在所述确定所述每个用户的目标可信度之后,所述方法还包括:
将所述目标可信度最低,并且所述目标可信度低于可信度阈值的用户标记为嫌疑恶评用户;和/或,
将所述信用值低于信用阈值的用户标记为所述嫌疑恶评用户。
7.根据权利要求6所述的多方数据集结处理方法,其特征在于,所述方法还包括:
在检测到所述嫌疑恶评用户在在评分时对应的信用值至少两次低于所述信用阈值的情况下,限制所述嫌疑恶评用户的评分权限。
8.一种多方数据集结处理装置,其特征在于,包括:
获取模块,用于获取待处理数据,所述待处理数据包括多个用户对多个对象中的每个对象的评分;
处理模块,用于分析所述待处理数据中所述多个用户中的每个用户与其他用户的评分差异,确定所述用户的信用值;
所述处理模块还用于,根据所述待处理数据和所述用户的信用值获得所述对象的目标评分。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的多方数据集结处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的多方数据集结处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011107299.2A CN112270463A (zh) | 2020-10-16 | 2020-10-16 | 多方数据集结处理方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011107299.2A CN112270463A (zh) | 2020-10-16 | 2020-10-16 | 多方数据集结处理方法、装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112270463A true CN112270463A (zh) | 2021-01-26 |
Family
ID=74338949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011107299.2A Pending CN112270463A (zh) | 2020-10-16 | 2020-10-16 | 多方数据集结处理方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112270463A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469279A (zh) * | 2015-11-24 | 2016-04-06 | 杭州师范大学 | 一种商品的质量评价方法和装置 |
US20180137565A1 (en) * | 2015-09-07 | 2018-05-17 | Tencent Technology (Shenzhen) Company Limited | Method, device, and storage medium for determining credit score |
CN111242656A (zh) * | 2018-11-28 | 2020-06-05 | 中国移动通信集团浙江有限公司 | 一种基于电信大数据的用户信用评价方法及系统 |
CN111275526A (zh) * | 2020-01-20 | 2020-06-12 | 南京财经大学 | 一种基于极差的电商水军识别方法 |
-
2020
- 2020-10-16 CN CN202011107299.2A patent/CN112270463A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137565A1 (en) * | 2015-09-07 | 2018-05-17 | Tencent Technology (Shenzhen) Company Limited | Method, device, and storage medium for determining credit score |
CN105469279A (zh) * | 2015-11-24 | 2016-04-06 | 杭州师范大学 | 一种商品的质量评价方法和装置 |
CN111242656A (zh) * | 2018-11-28 | 2020-06-05 | 中国移动通信集团浙江有限公司 | 一种基于电信大数据的用户信用评价方法及系统 |
CN111275526A (zh) * | 2020-01-20 | 2020-06-12 | 南京财经大学 | 一种基于极差的电商水军识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020192289A1 (zh) | 确定关系网络图中图节点向量的方法及装置 | |
US8914862B2 (en) | Cloud identification processing and verification | |
CN112085172B (zh) | 图神经网络的训练方法及装置 | |
CN114207648A (zh) | 在计算环境中自动更新支付信息的技术 | |
CN110225104B (zh) | 数据获取方法、装置及终端设备 | |
US20170140417A1 (en) | Campaign Effectiveness Determination using Dimension Reduction | |
US20140025418A1 (en) | Clustering Based Resource Planning, Work Assignment, and Cross-Skill Training Planning in Services Management | |
US20120084226A1 (en) | Measuring or estimating user credibility | |
US20220261591A1 (en) | Data processing method and apparatus | |
CN108062692B (zh) | 一种录音推荐方法、装置、设备及计算机可读存储介质 | |
CN110348471B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN115082209A (zh) | 业务数据风险预警方法、装置、计算机设备及存储介质 | |
CN111090877B (zh) | 数据生成、获取方法及对应的装置、存储介质 | |
CN110035053B (zh) | 用于检测欺诈性的用户-内容提供者对的方法和系统 | |
CN111754287A (zh) | 物品筛选方法、装置、设备和存储介质 | |
CN111400663B (zh) | 模型训练方法、装置、设备及计算机可读存储介质 | |
CN112270463A (zh) | 多方数据集结处理方法、装置、电子设备和介质 | |
CN112269924A (zh) | 基于排名的点评方法、装置、电子设备和介质 | |
KR101462858B1 (ko) | 기업의 해외 진출 역량 평가 방법 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN113076339A (zh) | 一种数据缓存方法、装置、设备及存储介质 | |
CN110347905A (zh) | 确定信息关联度、信息推荐的方法、装置和存储介质 | |
CN111339434A (zh) | 信息推荐方法、装置、电子设备及计算机存储介质 | |
CN116664016B (zh) | Esg子议题的筛选方法、装置、电子设备和可读存储介质 | |
CN113328978B (zh) | 恶意用户识别方法及装置、计算机存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |