CN111209531B - 关联度的处理方法、装置和存储介质 - Google Patents

关联度的处理方法、装置和存储介质 Download PDF

Info

Publication number
CN111209531B
CN111209531B CN201811394058.3A CN201811394058A CN111209531B CN 111209531 B CN111209531 B CN 111209531B CN 201811394058 A CN201811394058 A CN 201811394058A CN 111209531 B CN111209531 B CN 111209531B
Authority
CN
China
Prior art keywords
user
time period
processed
current
association degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811394058.3A
Other languages
English (en)
Other versions
CN111209531A (zh
Inventor
窦亚光
成亚雄
谷松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811394058.3A priority Critical patent/CN111209531B/zh
Publication of CN111209531A publication Critical patent/CN111209531A/zh
Application granted granted Critical
Publication of CN111209531B publication Critical patent/CN111209531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种关联度的处理方法、装置和存储介质,该方法包括:接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量;根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度;根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数;根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度。本发明获取的合并关联度更加贴切用户真实的关系强度,且具有普适性。

Description

关联度的处理方法、装置和存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种关联度的处理方法、装置和存储介质。
背景技术
无论是在物理世界中还是互联网中,用户与其他用户之间存在着纷繁复杂的关系网络。任何两个用户之间的关系强度为关联度,按照关联度将用户连接起来就构成了用户关系网络。在用户关系网络角度进行用户与用户的特征分析与刻画,会更加贴近现实世界,能够实现对用户个性化的服务,提高对用户的服务质量,具有巨大的应用价值。而要构建用户关系网络并进行网络分析就需要先进行关联度的计算。
用户每天都在与移动应用进行交互,不断有新数据的产出,千亿级别的数据全量参与关联度的计算代价很大,甚至由于数据规模极过大,导致计算无法开展。因此,用户间关联度的计算就需要进行分批次分时间段进行(比如按月处理),然后将不同时间段计算得到关联度按照时间排序,得到用户的关联度时序序列,将用户关联度时序序列进行合并,得到用户关联度的最终分值。用户数据是随着时间不断产生的,当新数据产出时,可以计算得到当前时间段内的用户关联度,这样整合历史关联度与当前时段关联度就可以实现关联度合并迭代计算,计算量小且将历史信息与当前信息进行了整合,可实践性强。
现有技术中,对历史关联度和当前时段关联度进行关联度合并的方法主要包括:平均值法,指数平滑法、自回归-移动平均法等;平均值法是将从历史某个时间段至当前时间段的关联度进行加权平均,获取当前时间段的合并关联度;指数平滑法是按照某个固定的权重将前一时间段的合并关联度与当前时间段的关联度进行合并;自回归-移动平均法是对不同的用户数据进行训练,获取每个用户的关联度误差系数,根据该关联度误差系数、历史时间段的关联度获取当前时间段的合并关联度。
但现有技术中的关联度合并方法存在获取的合并关联度不准确的问题;用户的关联度数据具有波动性,平均值法、指数平滑法会把有意义的信息(如历史高分关联度)掩盖,对数据的变化趋势不够敏感;自回归-移动平均法需要对不同的用户训练得到不同的关联度误差系数结果,不适合对所有用户关联对构建通用模型。
发明内容
本发明提供一种关联度的处理方法、装置和存储介质,本发明获取的合并关联度更加贴切用户真实的关系强度,且针对每个用户均适用,具有普适性。
本发明的第一方面提供一种关联度的处理方法,包括:
接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;
根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度。
可选的,所述获取所述待处理用户在所述当前时间段的合并关联度之前,还包括:
获取所述待处理用户在所述当前时间段的当前关联度。
可选的,所述获取所述处理用户在所述当前时间段的当前关联度,包括:
获取所述待处理用户在所述当前时间段的不同属性的多个关联度;
根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;
将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。
可选的,所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数;
所述获取所述待处理用户在所述当前时间段的合并关联度,包括:
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度;其中,获取所述待选合并关联度X'i+n具体如下公式所示:
其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;
将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。
可选的,所述获取所述待处理用户在所述当前时间段的当前关联度之后,还包括:
确定所述当前关联度是否为0;
若是,则将所述空值确定为0;
若否,则将所述空值确定为1。
可选的,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;
所述获取当前时间段的待处理用户的关联用户的数量,包括:
将所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。
可选的,所述根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度之前,还包括:
根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。
可选的,所述根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数之前,还包括:
根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。
可选的,所述方法还包括:
若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。
本发明的第二方面提供一种关联度的处理装置,包括:
接收模块,用于接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
置信度获取模块,用于根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;
矫正参数获取模块,用于根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;
合并关联度获取模块,用于根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度。
可选的,所述装置还包括:当前关联度获取模块;
所述当前关联度获取模块,用于获取所述待处理用户在所述当前时间段的当前关联度。
可选的,所述当前关联度获取模块,具体用于获取所述待处理用户在所述当前时间段的不同属性的多个关联度;根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。
可选的,所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数。
可选的,合并关联度获取模块,具体用于根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度;其中,获取所述待选合并关联度X'i+n具体如下公式所示:
其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;
将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。
可选的,所述装置还包括:确定模块;
所述确定模块,用于确定所述当前关联度是否为0;若是,则将所述空值确定为0;若否,则将所述空值确定为1。
可选的,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;所述当前时间段的待处理用户的关联用户的数量为:所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。
可选的,所述装置还包括:置信度模型获取模块;
所述置信度模型获取模块,用于根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。
可选的,所述装置还包括:矫正参数模型获取模块;
所述矫正参数模型获取模块,用于根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。
可选的,所述合并关联度获取模块,还用于若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。
本发明的第三方面提供一种关联度的处理装置,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述关联度的处理装置执行上述关联度的处理方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述关联度的处理方法。
本发明提供一种关联度的处理方法、装置和存储介质,该方法包括接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量;根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度;根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数,矫正参数用于对待处理用户在当前时间段的当前关联度的权重进行校正,当前关联度用于表示待处理用户在当前时间段的用户关系强度;根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度,合并关联度用于表示待处理用户在第一个时间段至合并关联度对应的时间段的用户关系强度。本发明获取的合并关联度更加贴切用户真实的关系强度,且针对每个用户均适用,具有普适性。
附图说明
图1为本发明提供的关联度的处理方法适用的场景示意图;
图2为本发明提供关联度的处理方法的流程示意图一;
图3为本发明提供获取待处理用户在当前时间段的合并关联度的示例图;
图4为本发明提供关联度的处理方法的流程示意图二;
图5为本发明提供关联度的处理方法的流程示意图三;
图6为本发明提供的关联度的处理装置的结构示意图一;
图7为本发明提供的关联度的处理装置的结构示意图二;
图8为本发明提供的关联度的处理装置的结构示意图三。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在用户的关联度数据量很大的前提下,采用分批次分时间段进行(比如按月处理)用户关联度的计算,然后将不同时间段计算得到关联度按照时间排序,得到用户的关联度时序序列。示例性的,假设获取的用户的关联度时序序为xi,xi+1,xi+2,xi+3,…,xi+n,其中,xi为获取的第一个时间段的用户的关联度,其中i表示为总的采集时间段内的第i个时间段,该用户的关联度时序序包括n个时间段的用户关联度。
将用户关联度的时序序列进行合并,得到用户关联度的最终分值。用户数据是随着时间不断产生的,当新数据产出时,可以计算得到当前时间段内的用户关联度,这样整合历史关联度与当前时段关联度就可以实现关联度合并迭代计算,计算量小且将历史信息与当前信息进行了整合,可实践性强。
现有技术中,对历史关联度和当前时段关联度进行关联度合并的方法主要包括:平均值法,指数平滑法、自回归-移动平均法、当前值法和最大值法。
1、平均值法:将n个时间段的用户关联度的平均值确定为当前时间段的合并关联度,具体如下式公式一所示:
其中,Xi+n为当前时间段的合并关联度,xi+j为任意一个时间段的用户关联度,αj为每个时间段的用户关联度的权重,这个权重一般为经验值,如每个时间段可以是一个月,每个月具有对应的关联度的系数权重值,具体的,所有时间段的权重的加和为1。
平均值法需要大量的历史关联度数据,用户行为表现为波动性,如在3月的关联度数据量较大,但在4月份用户的关联度为0,而移动平均法会把有波动性的信息掩盖,对数据的变化趋势不够敏感。
2、指数平滑法:按照某个固定权重将上一个时间段的合并关联度和当前时间段的关联度进行合并,获取当前时间段的合并关联度,具体如下公式二所示:
Xi+n=αxi+n+(1-α)Xi+n-1 公式二
其中,xi+n为当前时间段的关联度,α为固定权重,Xi+n-1为上一时间段的合并关联度,具体的,第一个时间段的合并关联度为第一个时间段的关联度。
指数平滑法具有很好的平滑性能,但不能对用户行为的波动性,如将历史关联度高分值或者关联度空缺值信息进行遮盖,对数据的变化趋势不够敏感。
3、自回归-移动平均法:对前p个时间段的合并关联度进行合并,获取当前时间段的合并关联度,具体如下公式三所示:
其中,c为常数项,一般为定值;εi+n为当前时间段的误差补偿项,εi+n-j为任意一个时间段的误差补偿项,θj为对应的时间段的误差补偿项系数,αj为对应的时间段的平滑经验系数,一般为经验值;p为向前追溯的时间段的个数。
自回归-移动平均法中需要获取每个时间段的误差补偿项和误差补偿项系数,现有技术中通常将同一用户的关联度作为训练样本,获取每个时间段对应的误差补偿项和误差补偿项系数。这种方式对于不同的用户需要训练不同的训练模型,不具有通用性。
4、当前值法:将当前时间段的关联度作为当前时间段的合并关联度。
当前值法仅考虑当前时间段的关联度,忽略了历史信息,对数据的波动性极为敏感,损失信息过多。
5、最大值法:将所有时间段的关联度的最大值作为当前时间段的合并关联度。
最大值法能够反映关联度的最大值水平,对数据变动捕捉滞后。
本发明的关联度的处理方法就是为了解决现有技术中获取合并关联度的问题,使得获取的合并关联度不仅能够反映采集时间段的用户关联度的波动性,即关联度高分值保持其稳定性,关联度空缺值应予以衰减,且对历史关联度数据和当前时间段的关联度数据之间进行合理的权衡。进而使得获取的当前时间段的合并关联度能够更加贴切的反映用户的真实关系强度。
图1为本发明提供的关联度的处理方法适用的场景示意图,如图1所示,本发明提供的关联度的处理方法适用的场景包括:关联度的处理装置和服务器。其中,关联度处理装置用于接收关联度处理请求,该关联度处理请求可以是请求获取用户A与用户B的当前时间段的合并关联度,也可以是获取用户A与其他有关联的用户的合并关联度。具体的,该关联度处理请求中包括用户的关联度信息,其中的关联度信息可以是关联度处理装置从服务器中获取的。
值得注意的是,服务器为多个,每个服务器中存储有关联度来源不同的关联度。示例性的,图1中示出的服务器A为应用程序A对应的服务器,服务器A根据用户A与用户B互动信息数目以及互动时长作为获取用户A与用户B之间的关联度的依据;图2中示出的服务器B为基站A对应的服务器,服务器B通过用户A对应的终端的轨迹、用户B对应的终端的轨迹获取用户A与用户B之间的关联度。关联度处理装置可以根据所有服务器中的用户A与用户B之间的关联度数据,进行合并关联度的处理。
图2为本发明提供关联度的处理方法的流程示意图一,图2所示方法流程的执行主体可以为关联度的处理装置,该关联度的处理装置可由任意的软件和/或硬件实现。如图2所示,本实施例提供的关联度的处理方法可以包括:
S201,接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量。
本实施例中的关联度处理请求为获取当前时间段的合并关联度的请求,具体的,该关联度处理请求可以是由技术人员触发的或者是由关联度的处理装置周期性触发的。
一种可实施的方式是:在关联度处理装置上设置有显示界面,该显示界面上设置有触发控件;技术人员想要获取用户A和用户B或者用户A与其他有关联的用户的合并关联度在当前时间段的合并关联度时,触发该触发控件以使关联度处理装置接收到关联度处理请求。
另一种可实施的方式是:由于本实施例中获取合并关联度的前提是获取每个时间段的关联度,其中,获取关联度的时间段可以预先设置,如可以设置每隔一个月获取一次关联度,一段时间后,可以获取一组关联度时序序列。具体的,关联度处理装置可以在多个服务器中获取用户的关联度。本实施例中获取当前时间段的合并关联度的请求的周期可以与获取关联度的周期相同,即关联度处理装置每获取一个时间段的关联度,就进行合并关联度的请求,进而获取该时间段的合并关联度。
本实施例中,关联度处理请求包括当前时间段的待处理用户的关联用户的数量,当前时间段为从上一个时间段至当前时间的时间段;待处理用户可以为一个用户或者多个用户。
具体的,当待处理用户为多个时,如用户A和用户B,即本实施例中是为了获取当前时间段的用户A和用户B的合并关联度;则待处理用户的关联用户的数量为与用户A的关联用户的数量和用户B的关联用户的数量的加和。其中,关联用户指的是在当前时间段与待处理用户有关联的用户,如用户A的关联用户可以是在应用程序A中与用户A有互动的用户,或者与用户A有信息来往的用户。
示例性的,用户A的关联用户的数量为80个,用户B的关联用户的数量为100个,则待处理用户的关联用户的数量为180个。
具体的,当待处理用户为一个时,如用户A,即本实施例中是为了获取当前时间段的用户A的合并关联度,即用户A与其他所有关联的用户的合并关联度;则待处理用户的关联用户的数量为与用户A的关联用户的数量,以及用户A的关联用户的关联用户的数量的加和。
示例性的,用户A的关联用户的数量为2个,即用户B和用户C,而用户B的关联用户为80个,用户C的关联用户为100个,则待处理用户的关联用户的数量为182个。
S202,根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度。
本实施例中,在关联度处理装置中预先存储有关联用户的数量与置信度的对应关系,其中,关联用户的数量与置信度的对应关系可以采用如下表一所示的方式进行存储。表一中示例性的示出了关联用户的数量的范围与置信度的对应关系,可以想到的是,该对应关系可以是具体的关联用户的数量与置信度的对应关系。
表一
关联用户的数量 置信度
0-100 0.4
101-500 0.6
501-1000 0.8
可以想到的是,用户的关联用户的数量越多,代表该用户越活跃,该用户被服务器捕捉到的信息就越丰富,获取的关联度也就越可靠,相应的,置信度的值也就越大。
本实施例中,关联度处理装置也可以预先获取关联用户的数量与置信度的对应关系,具体的,关联度处理装置根据多个用户的关联用户的数量样本,以及每个用户的置信度样本,获取关联用户的数量与置信度的对应关系。其中,该对应关系可以是线性关系、指数关系或者其他更为复杂的关系。本实施例对此不做限制。
S203,根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数。
本实施例中的当前关联度用于表示待处理用户在当前时间段的用户关系强度;矫正参数用于对待处理用户在当前时间段的当前关联度的权重进行校正。
其中,在关联度处理装置中预先存储有置信度与矫正参数的对应关系,其中,矫正参数与置信度的对应关系可以采用如下表二所示的方式进行存储。
表二
置信度 矫正参数
0.4 a
0.6 b
0.8 c
具体的,在获取待处理用户在当前时间段的合并关联度时,需要对待处理用户的上一时间段的合并关联度和当前时间段的关联度进行合并,合并就是将上一时间段的合并关联度和当前时间段的关联度按照一定的权重比例进行加和。然而,本实施例为了使得待处理用户的历史关联度和当前关联度具有较好的权衡,根据待处理用户的置信度获取与置信度对应的矫正参数,该矫正参数用于对当前关联度的权重进行校正,使得获取更为准确的合并关联度。
本实施例中,关联度处理装置也可以预先获取置信度与矫正参数的对应关系,具体的,关联度处理装置根据多个用户的置信度样本,以及每个用户的矫正参数样本,获取置信度与矫正参数的对应关系。其中,该对应关系可以是线性关系、指数关系或者其他更为复杂的关系。本实施例对此不做限制。
S204,根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度。
本实施例中,关联度处理装置获取当前时间段对应的校正参数后,可以采用矫正参数,对当前关联度和当前关联度的权重的乘积进行校正,以及,采用矫正参数,对待处理用户在上一个时间段的合并关联度以及合并关联度的权重进行校正,使得待处理用户的历史关联度和当前关联度具有较好的权衡,进而获取待处理用户在当前时间段的合并关联度。本实施例中的合并关联度用于表示待处理用户在第一个时间段至合并关联度对应的时间段的用户关系强度。
可以想到的是,本实施中的权重具体可以为当前关联度和上一个时间段的合并关联度的权重参数。待处理用户的关联用户的数量的不同,即待处理用户的活跃度的不同,具有不同的关联度的置信度,进而具有不同的校正参数,进而对当前关联度和上一个时间段的合并关联度的权重参数进行校正,使得待处理用户在当前时间段的合并关联度在用户的历史关联度和当前关联度具有较好的权衡,使得获取的当前时间段的合并关联度具有较高的准确性。
本实施例中的关联用户的数量与置信度与用户本身无关,而与用户的关联用户的数量有关,进一步的,置信度与矫正参数的对应关系与用户本身也无关,而与用户的关联用户的数量有关。即本实施例中的关联用户的数量与置信度的对应关系,以及,置信度与矫正参数的对应关系具有普适性,即对所有的用户都适用。
图3为本发明提供获取待处理用户在当前时间段的合并关联度的示例图,如图3所示,待处理用户的关联度的时序序列为xi,xi+1,xi+2,xi+3,…,xi+n,待处理用户的合并关联度的时序序列为Xi,Xi+1,Xi+2,Xi+3,…,Xi+n,其中,待处理用户第一个时间段的关联度为xi,本实施例将第一个时间段的关联度作为第一合并关联度,即xi=Xi。第二个时间段的合并关联度为按照本申请中的关联度处理方法,根据第一合并关联度Xi,第二时间段的关联度为xi+1,以及第二时间段的矫正参数、第二时间段的权重参数,获取第二个时间段的合并关联度Xi+1……,以此类推,根据第n-1个时间段的合并关联度Xi+n-1,第n-1时间段的关联度为xi+n-1,以及第n-1时间段的矫正参数、第n-1时间段的权重参数等,获取第n个时间段的合并关联度Xi+n
本实施例提供一种扣费方法,该方法包括接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量;根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度;根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数,矫正参数用于对待处理用户在当前时间段的当前关联度的权重进行校正,当前关联度用于表示待处理用户在当前时间段的用户关系强度;根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度,合并关联度用于表示待处理用户在第一个时间段至合并关联度对应的时间段的用户关系强度。本实施例获取的合并关联度更加贴切用户真实的关系强度,且针对每个用户均适用,具有普适性。
在上述实施例的基础上,下面结合图4对本发明提供的关联度的处理方法进行进一步说明,图4为本发明提供关联度的处理方法的流程示意图二,如图4所示,本实施例提供的关联度的处理方法可以包括:
S401,接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量。
S402,根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度。
S403,根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数。
S404,获取待处理用户在当前时间段的当前关联度。
本实施例中,关联度处理请求包括当前时间段的待处理用户的关联用户的数量,具体的,该关联度处理请求还包括待处理用户的标识,关联度的处理装置根据待处理用户的标识,在包含不同来源的关联度的服务器中获取不同来源的用户关联度。本实施例中,由于同一个用户的关联度的来源不同,即每个关联度服务器采用不同的方式获取该用户的关联度,因此,关联度的处理装置在多个服务器中获取用户的关联度后,不能直接相加获取该用户的关联度,因为每个关联度服务器采用不同的方式获取该用户的关联度,因此不同来源的关联度具有不同的属性。
具体的,关联度的处理装置获取待处理用户在当前时间段的不同属性的多个关联度;根据每个属性的关联度对应的转化关系,将当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;再将相同属性的多个关联度的加和确定为待处理用户在当前时间段的当前关联度。
本实施例中,每个属性的关联度对应的线性转化关系可以为线性转化关系,具体的,该线性转化关系可以预先存储在关联度的处理装置中;具体的,线性转化关系可如下公式四所示:
x'i=rtixi+sti 公式四
其中,x'i为转化后的关联度,xi为转化前的关联度,rti和sti为线性转化关系中的系数,其中,每个不同来源的关联度对应的不同的线性转化关系中的系数。
具体的,本实施例中的每个不同来源的关联度对应的不同的线性转化关系中的系数可以采用神经网络深度学习的方式,对每个不同来源的关联度对应的不同的线性转化关系中的系数进行训练,最终获取每个不同来源的关联度对应的不同的线性转化关系中的最优系数。
S405,根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度。
本实施例中的当前关联度的权重为权重参数,权重参数包括:平滑系数、空值衰减系数和空值,待处理用户在当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数。
值得注意的是,由于用户在不同的时间段(如不同月份)存在不同的活跃度,有可能某些时间段,该用户的行为未能被捕捉到,若单纯的把该用户的关联度作为0,容易造成数据的波动和关联度的低估。本实施例中,在获取待处理用户在当前时间段的当前关联度后,确定当前关联度是否为0,即当前时间段用户是与其他用户没有关联。其中,本实施例提供的权重参数中包括:空值;若当前关联度为0时,将空值确定为0;若当前关联度不为0时,则将空值确定为1。
本实施例中,根据待处理用户在上一个时间段的合并关联度、当前关联度、平滑系数、空值衰减系数和空值,当前平滑系数校正参数和当前空值衰减系数校正参数,获取待处理用户在当前时间段的待选合并关联度;其中,获取待选合并关联度X'i+n具体如下公式五所示:
其中,α为平滑系数,θi+n为当前平滑系数校正参数,δ为空值衰减系数,为当前空值衰减系数校正参数,x'i+n为当前关联度,Xi+n-1为待处理用户在上一个时间段的合并关联度,i为待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为空值。
其中,平滑系数和空值衰减系数为预先确定值,在不同的置信度对应的矫正参数不同的情况下,校正后的平滑系数和空值衰减系数不同;本实施例中,将当前关联度是否为0进行区别对待,引入了空值,空值越小,上一时间段的合并关联度的权重就越大,也就是空值对结果的影响越小。
本实施例中,关联度的处理装置在获取待选合并关联度后,该待选合并关联度为上一时间段的合并关联度与当前时间段的关联度进行合并后的当前时间段的待选合并关联度,具体的,本实施例中将待选合并关联度和当前关联度中的最大值确定为待处理用户在当前时间段的合并关联度。即本实施例中由于用户的关联度具有波动性,用户活跃度变低后,与其相关的关系的关联度会逐渐冷却,这样可能发生关联度变小的数据。但是当后续某个时间段,关联度高分值再出现时,应该对该关联度进行激活,重新回归关联度高分值状态,对衰减的关联度进行强化,这种方式可类比于人类的记忆曲线。
本实施例采用的是将待选合并关联度和当前关联度中的最大值确定为待处理用户在当前时间段的合并关联度,实现了对历史关联度中的高分值进行了激活。
值得注意的是,本实施例中若上一个时间段为获取待处理用户的关联度的第一个时间段,则将第一个时间段的关联度确定为待处理用户在上一个时间段的合并关联度。
其中,本实施例中的S401-S403、S405具体可参照上述实施例中的S201-S403、S204中的相关描述,在此不作赘述。
本实施例中,首先获取当前时间段的不同属性的多个关联度,按照每个属性的关联度对应的转化关系,转化为相同属性的多个关联度,获取用户当前时间段的当前关联度,使得来源不同的多个关联度能够进行加和;进一步的,引入空值,针对当前关联度获取空值,使得获取的合并关联度具有较高的稳定性,避免产生大的波动;且将待选合并关联度和当前关联度中的最大值确定为待处理用户在当前时间段的合并关联度,保证了用户关联度高分值的获取,使得能为准确的获取更为贴切用户实际的合并关联度。
在上述实施例的基础上,下面结合图5对本发明提供的关联度的处理方法进行进一步说明,图5为本发明提供关联度的处理方法的流程示意图三,如图5所示,本实施例提供的关联度的处理方法可以包括:
S501,接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量。
本实施例中的待处理用户包括第一用户和第二用户,即本实施例中获取的是第一用户和第二用户在当前时间段的合并关联度;待处理用户在上一个时间段的合并关联度用于表示第一用户和第二用户,在第一个时间段至上一个时间段的关系强度,所待处理用户的当前关联度用于表示第一用户和第二用户在当前时间段的关系强度;当前时间段的待处理用户的关联用户的数量包括:第一用户的关联用户的第一数量和第二用户的关联用户的第二数量。
本实施例中,将第一数量和第二数量的加和确定为待处理用户的关联用户的数量。
S502,根据每个样本用户的关联用户的数量,以及,每个样本用户的置信度,训练置信度模型,置信度模型用于确定关联用户的数量与置信度的对应关系。
本实施例中,关联度的处理装置可预先获取置信度模型,该置信度模型用于确定关联用户的数量与置信度的对应关系。具体的,该置信度模型是预先获取的,并非每次获取当前时间段的合并关联度时均需要重新获取置信度模型。
关联度的处理装置具体根据每个样本用户的关联用户的数量,以及,每个样本用户的置信度,训练置信度模型,其中,样本用户的关联用户的数量可以是关联度的处理装置在多个服务器中获取的样本参数。
S503,根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度。
S504,根据每个样本用户的置信度,以及,每个样本用户的矫正参数,训练矫正参数模型,矫正参数模型用于确定置信度与矫正参数的对应关系。
本实施例中,关联度的处理装置可预先训练矫正参数模型,该训练矫正参数模型用于确定置信度与矫正参数的对应关系。具体的,该矫正参数模型是预先获取的,并非每次获取当前时间段的合并关联度时均需要重新矫正参数模型。
关联度的处理装置具体根据每个样本用户的置信度,以及,每个样本用户的矫正参数,训练矫正参数模型,其中,述样本用户的置信度,可以是关联度的处理装置在上述置信度模型中获取的。
本实施例中的置信度模型和矫正参数模型与用户本身无关,而与用户的关联用户的数量有关。即本实施例中的置信度模型和矫正参数模型具有普适性,即对所有的用户都适用。
S505,根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数。
S506,获取待处理用户在当前时间段的当前关联度。
S507,根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度。
其中,本实施例中的S503、S505-S507具体可参照上述实施例中的S202、S403-S405中的相关描述,在此不作赘述。
本实施例中,预先根据每个样本用户的关联用户的数量,以及,每个样本用户的置信度,训练置信度模型,置信度模型用于确定关联用户的数量与置信度的对应关系,根据每个样本用户的置信度,以及,每个样本用户的矫正参数,训练矫正参数模型,矫正参数模型用于确定置信度与矫正参数的对应关系。本实施例中的置信度模型和矫正参数模型与用户本身无关,而与用户的关联用户的数量有关。即本实施例中的置信度模型和矫正参数模型具有普适性,即对所有的用户都适用。
图6为本发明提供的关联度的处理装置的结构示意图一,如图6所示,该关联度的处理装置600包括:接收模块601、置信度获取模块602、矫正参数获取模块603和合并关联度获取模块604。
接收模块601,用于接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
置信度获取模块602,用于根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度;
矫正参数获取模块603,用于根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数,矫正参数用于对待处理用户在当前时间段的当前关联度的权重进行校正,当前关联度用于表示待处理用户在当前时间段的用户关系强度;
合并关联度获取模块604,用于根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度,合并关联度用于表示待处理用户在第一个时间段至合并关联度对应的时间段的用户关系强度。
本实施例提供的关联度的处理装置与上述关联度的处理方法实现的原理和技术效果类似,在此不作赘述。
可选的,图7为本发明提供的关联度的处理装置的结构示意图二,如图7所示,该关联度的处理装置600还包括:当前关联度获取模块605、确定模块606、置信度模型获取模块607和矫正参数模型获取模块608。
当前关联度获取模块605,用于获取待处理用户在当前时间段的当前关联度。
确定模块606,用于确定当前关联度是否为0;若是,则将空值确定为0;若否,则将空值确定为1。
置信度模型获取模块607,用于根据每个样本用户的关联用户的数量,以及,每个样本用户的置信度,训练置信度模型,置信度模型用于确定关联用户的数量与置信度的对应关系。
矫正参数模型获取模块608,用于根据每个样本用户的置信度,以及,每个样本用户的矫正参数,训练矫正参数模型,矫正参数模型用于确定置信度与矫正参数的对应关系。
可选的,当前关联度获取模块605,具体用于获取待处理用户在当前时间段的不同属性的多个关联度;根据每个属性的关联度对应的转化关系,将当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;将相同属性的多个关联度的加和确定为待处理用户在当前时间段的当前关联度。
可选的,当前关联度的权重为权重参数,权重参数包括:平滑系数、空值衰减系数和空值,待处理用户在当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数。
可选的,合并关联度获取模块604,具体用于根据待处理用户在上一个时间段的合并关联度、当前关联度、平滑系数、空值衰减系数和空值,当前平滑系数校正参数和当前空值衰减系数校正参数,获取待处理用户在当前时间段的待选合并关联度;其中,获取待选合并关联度X'i+n具体如下公式所示:
其中,α为平滑系数,θi+n为当前平滑系数校正参数,δ为空值衰减系数,为当前空值衰减系数校正参数,x'i+n为当前关联度,Xi+n-1为待处理用户在上一个时间段的合并关联度,i为待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为空值;
将待选合并关联度和当前关联度中的最大值确定为待处理用户在当前时间段的合并关联度。
可选的,待处理用户包括第一用户和第二用户,待处理用户在上一个时间段的合并关联度用于表示第一用户和第二用户,在第一个时间段至上一个时间段的关系强度,所待处理用户的当前关联度用于表示第一用户和第二用户在当前时间段的关系强度;当前时间段的待处理用户的关联用户的数量包括:第一用户的关联用户的第一数量和第二用户的关联用户的第二数量;当前时间段的待处理用户的关联用户的数量为:第一数量和第二数量的加和确定为待处理用户的关联用户的数量。
可选的,合并关联度获取模块604,还用于若上一个时间段为获取待处理用户的关联度的第一个时间段,则将第一个时间段的关联度确定为待处理用户在上一个时间段的合并关联度。
图8为本发明提供的关联度的处理装置的结构示意图三,该关联度的处理装置例如可以是终端设备,比如智能手机、平板电脑、计算机等。如图8所示,该关联度的处理装置800包括:存储器801和至少一个处理器802。
存储器801,用于存储程序指令。
处理器802,用于在程序指令被执行时实现本实施例中的关联度的处理方法,具体实现原理可参见上述实施例,本实施例此处不再赘述。
该关联度的处理装置800还可以包括及输入/输出接口803。
输入/输出接口803可以包括独立的输出接口和输入接口,也可以为集成输入和输出的集成接口。其中,输出接口用于输出数据,输入接口用于获取输入的数据,上述输出的数据为上述方法实施例中输出的统称,输入的数据为上述方法实施例中输入的统称。
本发明还提供一种可读存储介质,可读存储介质中存储有执行指令,当关联度的处理装置的至少一个处理器执行该执行指令时,当计算机执行指令被处理器执行时,实现上述实施例中的关联度的处理方法。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。关联度的处理装置的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得关联度的处理装置实施上述的各种实施方式提供的关联度的处理方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在上述网络设备或者终端设备的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:ApplicationSpecific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (20)

1.一种关联度的处理方法,其特征在于,包括:
接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;
根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度;
所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数;所述获取所述待处理用户在所述当前时间段的合并关联度,包括:
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度。
2.根据权利要求1所述的方法,其特征在于,所述获取所述待处理用户在所述当前时间段的合并关联度之前,还包括:
获取所述待处理用户在所述当前时间段的当前关联度。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待处理用户在所述当前时间段的当前关联度,包括:
获取所述待处理用户在所述当前时间段的不同属性的多个关联度;
根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;
将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。
4.根据权利要求1所述的方法,其特征在于,获取所述待选合并关联度X'i+n具体如下公式所示:
其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;
将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。
5.根据权利要求4所述的方法,其特征在于,所述获取所述待处理用户在所述当前时间段的当前关联度之后,还包括:
确定所述当前关联度是否为0;
若是,则将所述空值确定为0;
若否,则将所述空值确定为1。
6.根据权利要求1所述的方法,其特征在于,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;
所述当前时间段的待处理用户的关联用户的数量为:所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度之前,还包括:
根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。
8.根据权利要求7所述的方法,其特征在于,所述根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数之前,还包括:
根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。
10.一种关联度的处理装置,其特征在于,包括:
接收模块,用于接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
置信度获取模块,用于根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;
矫正参数获取模块,用于根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;
合并关联度获取模块,用于根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度;
所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数;
所述合并关联度获取模块,具体用于根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:当前关联度获取模块;
所述当前关联度获取模块,用于获取所述待处理用户在所述当前时间段的当前关联度。
12.根据权利要求11所述的装置,其特征在于,
所述当前关联度获取模块,具体用于获取所述待处理用户在所述当前时间段的不同属性的多个关联度;根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。
13.根据权利要求10所述的装置,其特征在于,
获取所述待选合并关联度X'i+n具体如下公式所示:
其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;
将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:确定模块;
所述确定模块,用于确定所述当前关联度是否为0;若是,则将所述空值确定为0;若否,则将所述空值确定为1。
15.根据权利要求10所述的装置,其特征在于,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;所述当前时间段的待处理用户的关联用户的数量为:所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。
16.根据权利要求10-15任一项所述的装置,其特征在于,所述装置还包括:置信度模型获取模块;
所述置信度模型获取,用于根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。
17.根据权利要求16所述的装置,其特征在于,所述装置还包括:矫正参数模型;
所述矫正参数模型,用于根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。
18.根据权利要求10所述的装置,其特征在于,
所述合并关联度获取模块,还用于若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。
19.一种关联度的处理装置,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述关联度的处理装置执行权利要求1-9任一项所述的方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现权利要求1-9任一项所述的方法。
CN201811394058.3A 2018-11-21 2018-11-21 关联度的处理方法、装置和存储介质 Active CN111209531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811394058.3A CN111209531B (zh) 2018-11-21 2018-11-21 关联度的处理方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811394058.3A CN111209531B (zh) 2018-11-21 2018-11-21 关联度的处理方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN111209531A CN111209531A (zh) 2020-05-29
CN111209531B true CN111209531B (zh) 2023-08-08

Family

ID=70783974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811394058.3A Active CN111209531B (zh) 2018-11-21 2018-11-21 关联度的处理方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN111209531B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312168A (ja) * 1998-04-28 1999-11-09 Nippon Telegr & Teleph Corp <Ntt> 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体
JP2010211287A (ja) * 2009-03-06 2010-09-24 Ntt Docomo Inc ユーザ間関連度分析装置、ユーザ間関連度分析システム及びユーザ間関連度分析方法
CN103077220A (zh) * 2012-12-29 2013-05-01 中国科学院深圳先进技术研究院 一种基于用户群关联度的个性化推荐方法及系统
JP2013137460A (ja) * 2011-12-28 2013-07-11 Toyota Motor Corp 音声認識装置、方法、及びプログラム
CN104239327A (zh) * 2013-06-17 2014-12-24 中国科学院深圳先进技术研究院 一种基于位置信息的移动互联网用户行为分析方法及装置
WO2015026386A1 (en) * 2013-08-19 2015-02-26 Thomson Licensing Method and apparatus for utility-aware privacy preserving mapping through additive noise
CN105608179A (zh) * 2015-12-22 2016-05-25 百度在线网络技术(北京)有限公司 确定用户标识的关联性的方法和装置
WO2018125373A1 (en) * 2016-12-29 2018-07-05 Google Llc Systems and methods for identifying and characterizing signals contained in a data stream

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5995520B2 (ja) * 2011-06-14 2016-09-21 キヤノン株式会社 画像に関する処理支援システム、情報処理装置、及び画像に関する処理影支援方法
US8165812B2 (en) * 2011-07-25 2012-04-24 Clean Power Research, L.L.C. Computer-implemented system and method for estimating power data for a photovoltaic power generation fleet
US20180129960A1 (en) * 2016-11-10 2018-05-10 Facebook, Inc. Contact information confidence
US10693748B2 (en) * 2017-04-12 2020-06-23 Microsoft Technology Licensing, Llc Activity feed service

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312168A (ja) * 1998-04-28 1999-11-09 Nippon Telegr & Teleph Corp <Ntt> 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体
JP2010211287A (ja) * 2009-03-06 2010-09-24 Ntt Docomo Inc ユーザ間関連度分析装置、ユーザ間関連度分析システム及びユーザ間関連度分析方法
JP2013137460A (ja) * 2011-12-28 2013-07-11 Toyota Motor Corp 音声認識装置、方法、及びプログラム
CN103077220A (zh) * 2012-12-29 2013-05-01 中国科学院深圳先进技术研究院 一种基于用户群关联度的个性化推荐方法及系统
CN104239327A (zh) * 2013-06-17 2014-12-24 中国科学院深圳先进技术研究院 一种基于位置信息的移动互联网用户行为分析方法及装置
WO2015026386A1 (en) * 2013-08-19 2015-02-26 Thomson Licensing Method and apparatus for utility-aware privacy preserving mapping through additive noise
CN105608179A (zh) * 2015-12-22 2016-05-25 百度在线网络技术(北京)有限公司 确定用户标识的关联性的方法和装置
WO2018125373A1 (en) * 2016-12-29 2018-07-05 Google Llc Systems and methods for identifying and characterizing signals contained in a data stream

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王冲.《计算机应用》.基于用户反馈与主题关联度的网页排序算法改进,2015,全文. *

Also Published As

Publication number Publication date
CN111209531A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN106780045B (zh) 保单信息批改方法和装置
US8214492B2 (en) Method and system for adapting a session timeout period
US8983976B2 (en) Dynamically expiring crowd-sourced content
CN108307318B (zh) 一种用户信息获取方法及装置,电子设备
CN108965951B (zh) 广告的播放方法及装置
CN109565452A (zh) 用于确定最优策略的系统和方法
JP7085486B2 (ja) ユーザ挙動データの処理方法及び装置
WO2015148420A1 (en) User inactivity aware recommendation system
CN110535943B (zh) 数据处理方法、装置、电子设备及存储介质
CN109241450B (zh) 锁屏内容的推荐方法及装置
CN114797036A (zh) 一种专注力训练方案制定方法、装置、设备及存储介质
JP2011192103A (ja) 評価装置、方法及びプログラム
CN111209531B (zh) 关联度的处理方法、装置和存储介质
CN108550019B (zh) 一种简历筛选方法及装置
CN113934920B (zh) 目标信息的推送方法、设备及存储介质
CN107067276A (zh) 确定对象影响力的方法及装置
CN109087022A (zh) 用户稳定性的分析方法、装置、介质及电子设备
US20230400378A1 (en) Vibration evaluation method and apparatus, computer device, storage medium, and computer program product
CN112711739B (zh) 一种数据处理方法、装置及服务器、存储介质
CN112437349B (zh) 一种视频流推荐方法及相关装置
CN114201696A (zh) 一种消息推送方法及装置、存储介质、计算机设备
CN108062350A (zh) 一种数据处理方法、节点设备及计算机可读介质
CN114169451A (zh) 行为数据分类处理方法、装置、设备及存储介质
CN113704236A (zh) 政务系统数据质量评估方法、装置、终端及存储介质
CN113780703A (zh) 一种指标调整方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant