CN111506826A - 基于亲密度的用户推荐方法、装置、设备及存储介质 - Google Patents

基于亲密度的用户推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111506826A
CN111506826A CN202010182282.7A CN202010182282A CN111506826A CN 111506826 A CN111506826 A CN 111506826A CN 202010182282 A CN202010182282 A CN 202010182282A CN 111506826 A CN111506826 A CN 111506826A
Authority
CN
China
Prior art keywords
index
user
class
class user
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010182282.7A
Other languages
English (en)
Inventor
邓成杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202010182282.7A priority Critical patent/CN111506826A/zh
Publication of CN111506826A publication Critical patent/CN111506826A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于亲密度的用户推荐方法、装置、设备及存储介质。所述方法包括:根据预设平台内的源数据解析出一类用户指标和二类用户指标,并根据一类用户指标和二类用户指标生成指标分析宽表;根据系数分析模型确定一类用户指标与二类用户指标之间的指标相关系数,并将指标相关系数添加至指标分析宽表中;从指标分析宽表中获取指标相关系数满足指标预选条件的多组一类用户指标和二类用户指标,并确定对应的亲密度判定模型;根据所有亲密度判定模型确定二类用户关联名单中每一个一类用户与二类用户的亲密度,向二类用户推荐亲密度满足预设推荐值的一类用户。本发明基于亲密度进行用户推荐,增强了推荐的目的性。

Description

基于亲密度的用户推荐方法、装置、设备及存储介质
技术领域
本发明涉及数据分析领域,具体涉及一种基于亲密度的用户推荐方法、装置、设备及存储介质。
背景技术
随着互联网络的快速发展,在工作、生活以及各种社交上人们之间的交互越来越频繁,而用户在选择交互对象时,通常想要挑选一些具有一定关联度的其他用户作为交互对象进行沟通,但是在实际的交互过程中,用户往往无法从海量的数据中去区分其他用户是否与其存在关联(比如,存在用户个人资料的部分重叠、存在互访行为或共同参与行为等),因此,用户对于交互对象的选择往往是根据主观意识进行随机挑选,如此交互的效果往往无法达到用户需求。比如,在金融业务交互中,例如,银行贷款、保险、理财等,在用户与业务员进行业务交互时,代理人会挑选一些有一定亲密度的客户进行沟通,但是在挑选客户进行沟通时,往往只能根据业务员自身的主观意识或者经验进行挑选,该种挑选方式目的性不强,无法保证客户转换率,降低了工作效率。
发明内容
本发明实施例提供一种基于亲密度的信息推荐方法、装置、设备及存储介质,通过准确度量的亲密度进行用户推荐,增强了推荐目的性,提高了用户之间的粘度,且提高了用户的工作效率。
一种基于亲密度的用户推荐方法,包括:
获取预设平台内的源数据;
根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表;
根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中;
从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型;
获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,向所述二类用户推荐所述亲密度满足预设推荐值的所述一类用户。
一种基于亲密度的用户推荐装置,包括:
数据获取模块,用于获取预设平台内的源数据;
解析模块,用于根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表;
系数分析模块,用于根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中;
亲密度判定模块,用于从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型;
推荐模块,用于获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,向所述二类用户推荐所述亲密度满足预设推荐值的所述一类用户。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于亲密度的用户推荐方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于亲密度的用户推荐方法。
本发明提供的基于亲密度的用户推荐方法、装置、设备及存储介质,利用从预设平台内的源数据解析出的一类用户指标和二类用户指标生成指标分析宽表之后,获取一类用户指标与二类用户指标之间的指标相关系数,并添加至指标分析宽表中,进而获取指标分析宽表中指标相关系数满足指标预选条件的多组一类用户指标和二类用户指标,并确定各组一类用户指标和二类用户指标对应的亲密度判定模型,此时根据亲密度判定模型确定二类用户关联名单中每一个一类用户与二类用户的亲密度,向二类用户推荐亲密度满足预设推荐值的一类用户。本发明通过系数分析模型准确分析出不同用户之间的共性,即不同指标之间的相关程度,并根据不同用户之间的共性来度量不同用户之间的亲密度,进而根据亲密度进行用户推荐,增强了推荐目的性,提高了用户之间的粘度,且提高了用户的工作效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于亲密度的用户推荐方法的应用环境示意图;
图2是本发明一实施例中基于亲密度的用户推荐方法的流程图;
图3是本发明一实施例中基于亲密度的用户推荐方法的步骤S10的流程图;
图4是本发明一实施例中基于亲密度的用户推荐方法的步骤S30的流程图;
图5是本发明一实施例中基于亲密度的用户推荐方法的步骤S40的流程图;
图6是本发明一实施例中基于亲密度的用户推荐装置的原理框图;
图7是本发明一实施例中基于亲密度的用户推荐装置的亲密度判定模块的原理框图;
图8是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的基于亲密度的用户推荐方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于亲密度的用户推荐方法,以该方法应用在图1中的服务器为例进行说明,包括以下步骤:
S10,获取预设平台内的源数据。
在本实施例中,所述源数据是指用于分析预设平台内一类用户与二类用户之间亲密度的数据,包括但不限于预设平台内的一类用户信息、二类用户信息、一类用户与二类用户的行为信息。其中,一类用户与二类用户的行为信息包括但不限于互访行为、单向访问行为、共同参与等信息。所述一类用户与所述二类用户可以根据需求设置,例如,若预设平台为针对金融业务设置的金融业务服务平台,则一类用户可以是注册该金融业务服务平台的客户、二类用户可以是业务员。又比如,若预设平台为游戏平台,则一类用户可以是该游戏平台未组建游戏团队的游戏用户,而二类用户是指该游戏平台已组建游戏团队的游戏用户。
作为优选,在一具体实施例中,如图2所示,所述步骤S10具体包括以下步骤:
S101,接收数据采集指令,根据数据采集指令启动第一采集线程、第二采集线程和第三采集线程。
也即,在接收到用户发送的数据采集指令时,启动用于采集一类用户信息的第一采集线程、用于采集二类用户信息的第二采集线程以及用于采集一类用户与二类用户的行为信息的第三采集线程,以通过不同的采集线程从预设平台内采集数据,有利于提高数据采集效率。
S102,通过所述第一采集线程采集所述预设平台内的一类用户信息。
以一类用户为注册预设平台的客户为例,通过第一采集线程采集客户的职业等级、学历等信息作为一类用户信息。
S103,通过所述第二采集线程采集所述预设平台内的二类用户信息。
以二类用户为业务员为例,通过第二采集线程采集业务员的司龄、工作经历、工作业绩等信息作为二类用户信息。
S104,通过所述第三采集线程采集所述预设平台内的一类用户与二类用户的行为信息。
以一类用户为客户、二类用户为业务员为例,通过第三采集线程分别采集一段时间内客户访问业务员(或业务员访问客户)的次数作为互访行为,采集一段时间内客户在预设平台上对业务员发表的内容进行评论、回复、点赞、转发等行为作为单向访问行为,以及采集客户与业务员共同参与线下互动拜访、产品买卖等行为作为共同参与,并将互访行为、单向访问行为和共同参与等信息作为一类用户与二类用户的行为信息。
S105,根据所述一类用户信息、所述二类用户信息以及所述行为信息得到源数据。
也即,将第一采集线程采集的一类用户信息、第二采集线程采集的二类用户信息、第三采集线程采集的一类用户与二类用户的行为信息,作为预设平台内的源数据存储至数据库中。
可理解的,所述步骤S102、所述步骤S103和所述步骤S104可以是某一步骤优先执行,也可以是同时执行。
S20,根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表。
具体的,根据需求设置第一关键词和第二关键词,从源数据中提取出包含第一关键词的第一文本,并统计第一文本中第一关键词的出现概率,进而根据第一关键词的出现概率确定一类用户指标,也即,将第一文本中出现概率满足预设概率阈值的第一关键词作为第一用户指标;同时从源数据中提取包含第二关键词的第二文本,并统计第二文本中第二关键词的出现概率,进而根据第二关键词的出现概率确定二类用户指标。以一类用户为客户、二类用户为业务员为例,一类用户指标可以是客户在一个月内点击或转发业务员发表的文章次数,二类用户指标可以是业务员拥有的客户数量。
进一步的,根据一类用户指标和二类用户指标生成指标分析宽表。该指标分析宽表中的第Mp行用于表征第p个一类用户指标,所述指标分析宽表中的第Nq列用于表征第q个二类用户指标,而第Mp行与第Nq列的对应位置可以表征第p个一类用户指标与第q个二类用户指标的相关程度。
作为优选,在一具体实施例中,所述步骤S20具体包括以下步骤:
首先根据预设的第一关键词从所述源数据中提取出一类用户指标,并根据预设的第二关键词从所述源数据中提取出二类用户指标;然后以所述一类用户指标作为行和所述二类用户指标作为列,构建所述指标分析宽表。
具体的,从源数据中分别提取出包含第一关键词的第一文本和包含第二关键词的第二文本,根据第一文本中第一关键词的出现概率确定第一用户指标,并根据第二文本中第一关键词的出现概率确定二类用户指标,进而分别统计一类用户指标的数量以及二类用户指标的数量,并以所述一类用户指标作为行和所述二类用户指标作为列来构建M行N列指标分析宽表,其中,M为所述指标分析宽表的行数,N为所述指标分析宽表的列数,且所述指标分析宽表的行数与所述一类用户指标的数量相同,所述指标分析宽表的列数与所述二类用户指标的数量相同。
S30,根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中。
作为优选,在一具体实施例中,所述步骤S30具体包括以下步骤:
S301,从所述指标分析宽表中选取所述一类用户指标和所述二类用户指标。
S302,分别获取所述一类用户指标对应的第一分析样本和所述二类用户指标对应的第二分析样本;所述第一分析样本包含所述一类用户指标关联的多个指标值;所述第二分析样本包含所述二类用户指标关联的多个指标值。
S303,将所述第一分析样本和所述第二分析样本输入至预设的系数分析模型中,并接收所述系数分析模型输出的指标相关系数。
S304,将所述指标相关系数添加至所述指标分析宽表中的对应位置;该对应位置由选取的所述一类用户指标所在行和选取的所述二类用户指标所在列确定的。
具体的,首先获取对应于一类用户指标的第一分析样本和对应于二类用户指标的第二分析样本,该第一分析样本中包含一类用户指标关联的多个指标值(例如,预设平台内有N个代理人,每个代理人的司龄分别为S1、S2、……、Sn,则第一分析样本为包含S1、S2、……、Sn的样本),而该第二分析样本中包含二类用户指标关联的多个指标值,优选的,所述第一分析样本的数据量与所述第二分析样本的数据量相同;然后将第一分析样本和第二分析样本输入至预设的系数分析模型中,令系数分析模型根据第一分析样本中包含的所有指标值和第二分析样本中包含的所有指标值,自动计算一类用户指标与二类用户指标之间的指标相关系数,并将计算获得的指标相关系数输出;最后在接收系数分析模型输出的指标相关系数时,根据一类用户指标所在行和二类用户指标所在列确定出指标相关系数在指标分析宽表中的具体位置,并将该指标相关系数添加在该确定的该具体位置中。且作为优选,所述系数分析模型为:
Figure BDA0002412975170000081
其中,r为指标相关系数;Xi为与所述一类用户指标对应的第一分析样本中的第i个指标值;Yi为与所述二类用户指标对应的第二分析样本中的第i个指标值;n为指标值的数量。
可理解的,所述指标相关系数可以度量一类用户指标与二类用户指标的相关程度,且指标相关系数的取值范围为[-1,1]。若指标相关系数的绝对值越大,则表明一类用户指标与二类用户指标的相关程度越高;而若一类用户指标与二类用户指标线性相关,则指标相关系数取值为1(正线性相关)或-1(负线性相关)。
S40,从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型。
在本实施例中,所述指标预选条件为所述一类用户指标和所述二类用户指标的指标相关系数的绝对值大于或等于预设系数阈值,例如,0.5。
所述亲密度判定模型由多条关联规则组合而成;所述关联规则根据指标相关系数满足指标预选条件的一组一类用户指标和二类用户指标生成的,且所述关联规则是形如“A→B”的蕴涵式,其中,A称为关联规则的先决条件,B称为关联规则的必然结果。作为优选,一组一类用户指标和二类用户指标仅且关联一个亲密度判定模型。
具体的,标记出指标分析宽表中的指标相关系数的绝对值大于或等于预设系数阈值的至少一组一类用户指标和二类用户指标,也即,若指标分析宽表中第p个一类用户指标和第q个二类用户指标之间的指标相关系数的绝对值大于或等于预设系数阈值,则在指标分析宽表中标记出第p个一类用户指标和第q个二类用户指标,此时,可以利用预设平台内的作业记录信息,自该作业记录信息中提取出第p个一类用户指标的第一信息样本(第一信息样本可以存在第p个一类用户指标关联的多个相同指标值),并基于第一信息样本生成第一集合,且自该作业记录信息中提取出第q个二类用户指标的第二信息样本(第一信息样本可以存在第q个二类用户指标关联的多个相同指标值),并基于第二信息样本生成第二集合;其中,该第一集合和该第二集合包含至少一个的项。
进一步的,根据预设平台内的所有作业记录信息生成包含多个项集的作业集合,并将第一集合、第二集合以及作业集合输入至预设的亲密度分析模型中,并接收亲密度分析模型输出的亲密度判定模型,并将第p个一类用户指标和第q个二类用户指标之间的所述指标相关系数与所述亲密度判定模型进行关联存储。优选的,所述亲密度分析模型为步骤S404中的亲密度分析模型,该亲密度分析模型中包含规则预选条件以及用于计算规则的支持度、置信度和提升度的计算模型。
S50,获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,根据所述亲密度向所述二类用户推荐亲密度满足预设推荐值的所述一类用户。
可理解的,在接收到预设平台内某个二类用户发送的推荐请求时,根据推荐请求获取与二类用户关联的一类用户,而根据与二类用户关联的一类用户生成二类用户关联名单。此时,根据所述步骤S40中获得的各组一类用户指标和二类用户指标对应的亲密度判定模型,来确定二类用户关联名单每一个一类用户与该二类用户之间的亲密度,进而根据亲密度为该二类用户推荐匹配度满足预设推荐值的一类用户。
作为优选,所述步骤S50具体包括以下步骤:
首先,接收二类用户发送的推荐请求,根据所述推荐请求获取二类用户关联名单,该二类用户关联名单中包含与所述二类用户关联的一类用户。
然后,获取所述二类用户关联名单中每一个一类用户的一类用户指标,并获取该一类用户的一类用户指标。
最后,根据所述二类用户关联名单中每一个一类用户的一类用户指标、所述二类用户的二类用户指标以及各个所述亲密度判定模型,获取每一个所述一类用户与所述二类用户的亲密度,将亲密度满足预设推荐值的所有一类用户作为推荐用户名单发送至所述二类用户。
可理解的,接收二类用户发送的推荐请求之后,从二类用户关联名单中随机选取一个一类用户,获取该一类用户的所有一类用户指标以及每一个一类用户指标关联的指标值,同时获取该二类用户的所有二类用户指标以及每一个二类用户指标关联的指标值,此时,将该一类用户的所有一类用户指标以及该二类用户的所有二类用户指标标记为一次查询信息,同时根据所有一类用户指标关联的指标值以及所有二类用户指标关联的指标值生成多个数组集合,并将生成的数组集合标记为二次查询信息。
进一步的从数据库查询出满足一次查询信息的指标相关系数,标记出与指标相关系数关联的亲密度判定模型,并从标记的亲密度判定模型查询出满足二次查询信息的亲密度判定模型,也即,检测标记的亲密度判定模型中是否存在满足二次查询信息的关联规则,在标记的亲密度判定模型中存在满足二次查询信息的关联规则时,则确定该亲密度判定模型为满足二次查询信息的亲密度判定模型,统计满足二次查询信息的亲密度判定模型得到规则匹配数目,累加所有亲密度判定模型包含的规则总数目,并根据规则匹配数目和规则总数目得到该一类用户与该二类用户的亲密度。根据上述亲密度计算方式得到二类用户关联名单中每一个一类用户与该二类用户的亲密度之后,将亲密度满足预设推荐值的所有一类用户作为推荐用户名单发送至该二类用户。
综上所述,本实施例利用在预设平台内的源数据解析出一类用户指标和二类用户指标生成指标分析宽表之后,根据预设的系数分析模型确定一类用户指标与二类用户指标之间的指标相关系数,并添加至指标分析宽表中,进而获取指标分析宽表中指标相关系数满足指标预选条件的多组一类用户指标和二类用户指标,并确定各组一类用户指标和二类用户指标获取对应的亲密度判定模型,此时根据亲密度判定模型确定二类用户关联名单中每一个一类用户与二类用户的亲密度,向二类用户推荐亲密度满足预设推荐值的一类用户。本实施例通过系数分析模型准确分析出不同用户之间的共性,进而根据不同用户之间的共性来度量不同用户之间的亲密度,进而基于亲密度进行用户推荐,增强了推荐目的性,提高了用户之间的粘度,且提高了用户的工作效率。
在一实施例中,如图5所示,所述步骤S40具体包括以下步骤:
S401,获取所述预设平台内的作业记录信息,根据所述作业记录信息生成包含多个项集的作业集合;每一条所述作业记录信息对应所述作业集合中的一个所述项集。
在本实施例中,每一条所述作业记录信息可以包含一类用户指标、以及一类用户指标关联的指标值、二类用户指标、二类用户指标关联的指标值等信息。
具体的,获取所述预设平台内预设采集期间(比如,一个季度的第一天至最后一天为一个采集期间)的所有作业记录信息,并从每一条作业记录信息中提取出一组具有对应关系的指标值,进而根据提取出的一组指标值构成一个项集,并根据所有项集构成作业集合。
S402,将所述指标分析宽表中的所述指标相关系数满足指标预选条件的所述一类用户指标和所述二类用户指标进行标记,从所述作业记录信息中提取与标记的所述一类用户指标对应的第一信息样本,以及与标记的所述二类用户指标对应的第二信息样本。
可理解的,该指标分析宽表中包含一类用户的多个一类用户指标、二类用户的多个二类用户指标、以及每一个一类用户指标与每一个二类用户指标之间的指标相关系数。也即,当指标分析宽表中包含M个一类用户指标和N个二类用户指标时,指标分析宽表中的指标相关系数即有M*N个。
作为优选,将所述步骤S401获取的所有作业记录信息存放在作业记录文件,可以根据需求设置一类用户指标的优先级顺序以及二类用户指标的优先级顺序,并根据一类用户指标的优先级顺序对作业记录文件中的所有作业记录信息进行信息整理之后,得到第一备份文件,同时根据二类用户指标的优先级顺序对作业记录文件中的所有作业记录信息进行信息整理之后,得到第二备份文件。此时,在确定出相关指标系数的绝对值大于或等于预设系数阈值的一类用户指标和二类用户指标之后,基于所述第一备份文件来提取一类用户指标对应的第一信息样本,并基于所述第二备份文件来提取二类用户指标对应的第二信息样本,有利于提高数据处理效率。
需要说明的是,对于相关指标系数的绝对值小于预设系数阈值的一类用户指标和二类用户指标,两者并不具有影响关系,提取出来的关联规则意义不大,无法对整体亲密度关联规则作出贡献。
S403,根据所述第一信息样本生成与所述一类用户指标对应的第一集合,并根据所述第二信息样本生成与所述二类用户指标对应的第二集合。
具体的,对第一信息样本中包含的一类用户指标关联的多个指标值进行合并,得到第一集合,并对第二信息样本中包含的二类用户指标关联的多个指标值进行合并,得到第二集合,该第一集合和第一集合中每一个元素均不相同。
S404,将所述第一集合、所述第二集合和所述作业集合输入至预设的亲密度分析模型中,接收并存储所述亲密度分析模型输出的亲密度判定模型。
在本实施例中,将第一集合、第二集合和作业集合输入至亲密度分析模型之后,亲密度分析模型会根据第一集合和第二集合得到组合集(每一个组合集对应一条关联规则),并根据组合集和作业集自动计算规则的支持度、置信度和提升度,进而基于规则的支持度、置信度和提升度自动筛选出满足规则预选条件的关联规则,并根据满足规则预选条件的关联规则生成亲密度判定模型之后输出。作为优选,规则预选条件以及用于计算规则的支持度、置信度和提升度的计算模型,已预先配置在所述亲密度分析模型中。其中,所述规则预选条件是指规则的提升度大于预设提升度阈值,且规则的置信度满足置信度最高,规则的支持度在满足上述两个子条件的前提下满足支持度最小。
所述支持度可以表示组合集在作业集合中出现的概率,若作业集合为I={i1,i2,……,in},第一集合为X={A1,A2,……,An},第二集合为Y={B1,B2,……,Bm},in为作业集合中的项集,A为第一集合中的元素,B为第二集合中的元素,则该支持度的计算模型为:
Support(A→B)=P(A,B)/P(I)=P(A∪B)/P(I)=num(A∪B)/num(I)
其中,Support(A→B)表示关联规则“A→B”的支持度;num(A∪B)表示集合X和集合Y中的元素所构成的组合集在作业集合出现的个数(个数也叫次数);num(I)表示作业集合中所有项集的个数。
所述置信度可以表示在先决条件A发生的情况下,由关联规则“A→B”推出必然结果B出现的概率,也即含有元素A的组合集中,含有元素B的可能性。该置信度的计算模型可以为:
Confidence(A→B)=P(B|A)=P(A∪B)/P(A)
其中,Confidence(A→B)表示关联规则“A→B”的置信度;P(B|A)表示在先决条件A发生的情况下,由关联规则“A→B”推出必然结果B出现的概率。
所述提升度可以表示含有先决条件A的条件下,同时含有必然结果Y的概率,与B总体发生的概率之比。该提升度的计算模型可以为:
Lift(A→B)=P(B|A)/P(B)
其中,Lift(A→B)表示关联规则“A→B”的提升度;P(B)表示B出现的总概率。
综上所述,本实施例获取预设平台内的作业记录信息,根据作业记录信息生成作业集合,从作业记录信息提取出与标记的一类用户指标对应的第一信息样本,并根据第一信息样本生成第一集合,同时从作业记录信息提取出与标记的二类用户指标对应的第二信息样本,并根据第二信息样本生成第二集合,进而将第一集合、第二集合和作业集合输入至亲密度分析模型中,接收亲密度分析模型输出的亲密度判定模型。本实施例利用亲密度分析模型获得亲密度判定模型,进而根据该亲密度判定模型获得一类用户与二类用户的亲密度,提高了亲密度的准确度。
在一实施例中,如图6所示,提供一种基于亲密度的用户推荐装置,该基于亲密度的用户推荐装置与上述实施例中基于亲密度的用户推荐方法一一对应。该基于亲密度的用户推荐装置包括以下模块,各功能模块详细说明如下:
数据获取模块110,用于获取预设平台内的源数据。
解析模块120,用于根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表。
系数分析模块130,用于根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中。
亲密度判定模块140,用于从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型。
推荐模块150,用于获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,向所述二类用户推荐所述亲密度满足预设推荐值的所述一类用户。
在一实施例中,所述数据获取模块110包括以下子模块,各功能子模块详细说明如下:
接收子模块,用于接收数据采集指令,根据数据采集指令启动第一采集线程、第二采集线程和第三采集线程。
第一采集子模块,用于通过所述第一采集线程采集所述预设平台内的一类用户信息。
第二采集子模块,用于通过所述第二采集线程采集所述预设平台内的二类用户信息。
第三采集子模块,用于通过所述第三采集线程采集所述预设平台内的一类用户与二类用户的行为信息。
数据组合子模块,用于根据所述一类用户信息、所述二类用户信息以及所述行为信息得到源数据。
在一实施例中,所述解析模块120包括以下子模块,各功能子模块详细说明如下:
提取子模块,用于根据预设的第一关键词从所述源数据中提取出一类用户指标,并根据预设的第二关键词从所述源数据中提取出二类用户指标。
构建子模块,用于以所述一类用户指标作为行和所述二类用户指标作为列,构建所述指标分析宽表。
在一实施例中,所述系数分析模块130包括以下子模块,各功能子模块详细说明如下:
选取子模块,用于从所述指标分析宽表中选取所述一类用户指标和所述二类用户指标。
样本获取子模块,用于分别获取所述一类用户指标对应的第一分析样本和所述二类用户指标对应的第二分析样本;所述第一分析样本包含所述一类用户指标关联的多个指标值;所述第二分析样本包含所述二类用户指标关联的多个指标值。
系数分析子模块,用于将所述第一分析样本和所述第二分析样本输入至预设的系数分析模型中,并接收所述系数分析模型输出的指标相关系数。
添加子模块,用于将所述指标相关系数添加至所述指标分析宽表中的对应位置;该对应位置由选取的所述一类用户指标所在行和选取的所述二类用户指标所在列确定的。
在一实施例中,所述系数分析模块130中,所述系数分析模型为:
Figure BDA0002412975170000171
其中,r为指标相关系数;Xi为与所述一类用户指标对应的第一分析样本中的第i个指标值;Yi为与所述二类用户指标对应的第二分析样本中的第i个指标值;n为指标值的数量。
在一实施例中,如图7所示,所述亲密度判定模块140包括以下子模块,各功能子模块详细说明如下:
信息获取子模块141,用于获取所述预设平台内的作业记录信息,根据所述作业记录信息生成包含多个项集的作业集合;每一条所述作业记录信息对应所述作业集合中的一个所述项集。
样本提取子模块142,用于将所述指标分析宽表中的所述指标相关系数满足指标预选条件的所述一类用户指标和所述二类用户指标进行标记,从所述作业记录信息中提取与标记的所述一类用户指标对应的第一信息样本,以及与标记的所述二类用户指标对应的第二信息样本。
集合生成子模块143,用于根据所述第一信息样本生成与所述一类用户指标对应的第一集合,并根据所述第二信息样本生成与所述二类用户指标对应的第二集合。
输出子模块144,用于将所述第一集合、所述第二集合和所述作业集合输入至预设的亲密度分析模型中,接收并存储所述亲密度分析模型输出的亲密度判定模型。
关于基于亲密度的用户推荐装置的具体限定可以参见上文中对于基于亲密度的用户推荐方法的限定,在此不再赘述。上述基于亲密度的用户推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机可读指令被处理器执行时以实现一种基于亲密度的用户推荐方法。
在一实施例中,提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现如上述实施例中的基于亲密度的用户推荐方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现如上述实施例中的基于亲密度的用户推荐方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、存储器总线直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元或模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元或模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于亲密度的用户推荐方法,其特征在于,包括:
获取预设平台内的源数据;
根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表;
根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中;
从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型;
获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,向所述二类用户推荐所述亲密度满足预设推荐值的所述一类用户。
2.如权利要求1所述的基于亲密度的用户推荐方法,其特征在于,所述从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型,包括:
获取所述预设平台内的作业记录信息,根据所述作业记录信息生成包含多个项集的作业集合;每一条所述作业记录信息对应所述作业集合中的一个所述项集;
将所述指标分析宽表中的所述指标相关系数满足指标预选条件的所述一类用户指标和所述二类用户指标进行标记,从所述作业记录信息中提取与标记的所述一类用户指标对应的第一信息样本,以及与标记的所述二类用户指标对应的第二信息样本;
根据所述第一信息样本生成与所述一类用户指标对应的第一集合,并根据所述第二信息样本生成与所述二类用户指标对应的第二集合;
将所述第一集合、所述第二集合和所述作业集合输入至预设的亲密度分析模型中,接收并存储所述亲密度分析模型输出的亲密度判定模型。
3.如权利要求1所述的基于亲密度的用户推荐方法,其特征在于,所述获取预设平台内的源数据,包括:
接收数据采集指令,根据数据采集指令启动第一采集线程、第二采集线程和第三采集线程;
通过所述第一采集线程采集所述预设平台内的一类用户信息;
通过所述第二采集线程采集所述预设平台内的二类用户信息;
通过所述第三采集线程采集所述预设平台内的一类用户与二类用户的行为信息;
根据所述一类用户信息、所述二类用户信息以及所述行为信息得到源数据。
4.如权利要求1所述的基于亲密度的用户推荐方法,其特征在于,所述根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表,包括:
根据预设的第一关键词从所述源数据中提取出一类用户指标,并根据预设的第二关键词从所述源数据中提取出二类用户指标;
以所述一类用户指标作为行和所述二类用户指标作为列,构建所述指标分析宽表。
5.如权利要求1所述的基于亲密度的用户推荐方法,其特征在于,所述根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中,包括:
从所述指标分析宽表中选取所述一类用户指标和所述二类用户指标;
分别获取所述一类用户指标对应的第一分析样本和所述二类用户指标对应的第二分析样本;所述第一分析样本包含所述一类用户指标关联的多个指标值;所述第二分析样本包含所述二类用户指标关联的多个指标值;
将所述第一分析样本和所述第二分析样本输入至预设的系数分析模型中,并接收所述系数分析模型输出的指标相关系数;
将所述指标相关系数添加至所述指标分析宽表中的对应位置;该对应位置由选取的所述一类用户指标所在行和选取的所述二类用户指标所在列确定的。
6.如权利要求5所述的基于亲密度的用户推荐方法,其特征在于,所述系数分析模型为:
Figure FDA0002412975160000031
其中,r为指标相关系数;Xi为与所述一类用户指标对应的第一分析样本中的第i个指标值;Yi为与所述二类用户指标对应的第二分析样本中的第i个指标值;n为指标值的数量。
7.一种基于亲密度的用户推荐装置,其特征在于,包括:
数据获取模块,用于获取预设平台内的源数据;
解析模块,用于根据所述源数据解析出一类用户指标和二类用户指标,并根据所述一类用户指标和所述二类用户指标生成指标分析宽表;
系数分析模块,用于根据预设的系数分析模型确定所述一类用户指标与所述二类用户指标之间的指标相关系数,并将所述指标相关系数添加至所述指标分析宽表中;
亲密度判定模块,用于从所述指标分析宽表中获取所述指标相关系数满足指标预选条件的多组所述一类用户指标和所述二类用户指标,并确定各组所述一类用户指标和所述二类用户指标对应的亲密度判定模型;
推荐模块,用于获取二类用户和二类用户关联名单,并根据所有所述亲密度判定模型确定所述二类用户关联名单中每一个一类用户与所述二类用户的亲密度,向所述二类用户推荐所述亲密度满足预设推荐值的所述一类用户。
8.如权利要求7所述的基于亲密度的用户推荐装置,其特征在于,所述亲密度判定模块包括:
信息获取子模块,用于获取所述预设平台内的作业记录信息,根据所述作业记录信息生成包含多个项集的作业集合;每一条所述作业记录信息对应所述作业集合中的一个所述项集;
样本提取子模块,用于将所述指标分析宽表中的所述指标相关系数满足指标预选条件的所述一类用户指标和所述二类用户指标进行标记,从所述作业记录信息中提取与标记的所述一类用户指标对应的第一信息样本,以及与标记的所述二类用户指标对应的第二信息样本;
集合生成子模块,用于根据所述第一信息样本生成与所述一类用户指标对应的第一集合,并根据所述第二信息样本生成与所述二类用户指标对应的第二集合;
输出子模块,用于将所述第一集合、所述第二集合和所述作业集合输入至预设的亲密度分析模型中,接收并存储所述亲密度分析模型输出的亲密度判定模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至6任一项所述基于亲密度的用户推荐方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至6任一项所述基于亲密度的用户推荐方法。
CN202010182282.7A 2020-03-16 2020-03-16 基于亲密度的用户推荐方法、装置、设备及存储介质 Pending CN111506826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010182282.7A CN111506826A (zh) 2020-03-16 2020-03-16 基于亲密度的用户推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010182282.7A CN111506826A (zh) 2020-03-16 2020-03-16 基于亲密度的用户推荐方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111506826A true CN111506826A (zh) 2020-08-07

Family

ID=71867090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010182282.7A Pending CN111506826A (zh) 2020-03-16 2020-03-16 基于亲密度的用户推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111506826A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538020A (zh) * 2021-07-05 2021-10-22 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538020A (zh) * 2021-07-05 2021-10-22 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置
CN113538020B (zh) * 2021-07-05 2024-03-26 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置

Similar Documents

Publication Publication Date Title
US12003393B2 (en) Parallel computational framework and application server for determining path connectivity
CN109241415B (zh) 项目推荐方法、装置、计算机设备及存储介质
US9152969B2 (en) Recommendation ranking system with distrust
US9922134B2 (en) Assessing and scoring people, businesses, places, things, and brands
US8260903B2 (en) System and method for assessing the usability and accessibility of Web 2.0 features and functionalities of websites
US20170286429A1 (en) Computer System for Automated Assessment at Scale of Topic-Specific Social Media Impact
US20150026120A1 (en) Systems and methods for visualizing social graphs
MX2012003721A (es) Sistemas y metodos para analitica de datos graficos sociales para determinar conectividad dentro de una comunidad.
US20150095105A1 (en) Industry graph database
CN110472884A (zh) Esg指标监控方法、装置、终端设备及存储介质
CN109783227A (zh) 任务分配方法、装置、系统及计算机可读存储介质
US11551243B2 (en) Systems and methods for finding an interaction subset within a set of interactions
US20120303714A1 (en) Method for managing a personalized social network map in an application server which provides personalized content, and program recording medium for executing the method
WO2019119627A1 (zh) FoF资产行业分析方法、终端和计算机可读存储介质
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
US11295325B2 (en) Benefit surrender prediction
CN111506826A (zh) 基于亲密度的用户推荐方法、装置、设备及存储介质
CN106575418A (zh) 建议的关键词
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
CN116501979A (zh) 信息推荐方法、装置、计算机设备及计算机可读存储介质
KR101462858B1 (ko) 기업의 해외 진출 역량 평가 방법
CN117151358A (zh) 工单派发方法、装置、电子设备、存储介质和程序产品
TWI419071B (zh) Active knowledge management system, method and computer program product for problem solving
US9460234B2 (en) System and method of determining complexity of collaborative effort
Karthikeyan et al. Meta Analytical Literature Study on Business Intelligence and Its Applications; a Techno-Business Leadership Perspective

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination