CN110020025A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN110020025A
CN110020025A CN201710901668.7A CN201710901668A CN110020025A CN 110020025 A CN110020025 A CN 110020025A CN 201710901668 A CN201710901668 A CN 201710901668A CN 110020025 A CN110020025 A CN 110020025A
Authority
CN
China
Prior art keywords
personnel
relation
data
behavior
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710901668.7A
Other languages
English (en)
Other versions
CN110020025B (zh
Inventor
秦伟
唐超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710901668.7A priority Critical patent/CN110020025B/zh
Publication of CN110020025A publication Critical patent/CN110020025A/zh
Application granted granted Critical
Publication of CN110020025B publication Critical patent/CN110020025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本文公开了一种数据处理方法及装置;上述数据处理方法,包括:获取设定范围内至少两个人员的关系数据,关系数据包括人员的至少两种行为数据;基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。如此,提高了关系亲密度的计算准确性。

Description

一种数据处理方法及装置
技术领域
本发明涉及数据处理技术,尤其涉及一种数据处理方法及装置。
背景技术
目前,人员之间的关系很难用一个分值衡量,通常采用人员之间的关系亲密度来表示两个人之间的关系密切程度。计算关系亲密度的核心是确定人员之间各种关系的权重。然而,目前主要根据经验人为设定人员之间各种关系的权重,导致关系亲密度的计算不准确,且无法根据数据变化及时调整权重。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本申请实施例提供一种数据处理方法及装置,能够提高关系亲密度的计算准确性。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
在示例性实施方式中,所述基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度,可以包括:通过以下方式确定任一关系特征的权重:
基于获取的人员之间的属性关系以及行为关系的数据,确定所述关系特征对应的原始数据条数以及相关数据条数;根据所述关系特征对应的原始数据条数以及相关数据条数,计算所述关系特征的权重。
在示例性实施方式中,所述根据所述关系特征对应的原始数据条数以及相关数据条数,计算所述关系特征的权重,可以包括:
确定所述关系特征的权重等于所述关系特征对应的原始数据条数与相关数据条数的比值;或者,
计算所述关系特征对应的原始数据条数与相关数据条数的比值,对所述比值进行归一化处理后得到所述关系特征的权重。
在示例性实施方式中,所述基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度,还可以包括:
针对两个人员之间存在的任一种关系特征,计算第一数值,所述第一数值等于所述两个人员存在所述关系特征的次数与所述关系特征的权重的乘积;
计算第二数值,所述第二数值等于所述两个人员之间存在的所有关系特征对应的第一数值之和,或者,所述第二数值等于所述两个人员之间存在的所有关系特征对应的第一数值与一常数之和;
对所述第二数值进行归一化处理后得到所述两个人员之间的关系亲密度。
在示例性实施方式中,上述方法还可以包括:基于获取的人员之间的属性关系以及行为关系的数据,确定人员之间的一种或多种关系特征。
在示例性实施方式中,所述计算得到人员之间的关系亲密度,可以包括:
计算所述设定范围内的目标人员与第一人群中任一人员之间的关系亲密度,所述第一人群包括所述设定范围内除所述目标人员外的人员;
所述计算得到人员之间的关系亲密度之后,上述方法还可以包括:根据所述目标人员与所述第一人群中任一人员之间的关系亲密度,构建所述目标人员的关系网络。
在示例性实施方式中,所述根据所述目标人员与所述第一人群中任一人员之间的关系亲密度,构建所述目标人员的关系网络,可以包括:
从所述第一人群中筛选出与所述目标人员之间的关系亲密度满足条件的人员;根据筛选出的所述人员,构建所述目标人员的关系网络。
第二方面,本申请实施例提供一种数据处理装置,包括:
第一获取模块,适于获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;
第二获取模块,适于基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
数据处理模块,适于基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
第三方面,本申请实施例提供一种设备,包括:存储器、处理器以及存储在所述存储器上并在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现以下操作:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
第四方面,本申请实施例提供一种计算机可读介质,存储有数据处理程序,所述数据处理程序被处理器执行时实现以下操作:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
在本申请实施例中,获取设定范围内至少两个人员的关系数据,关系数据包括人员的至少两种行为数据;基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度;如此,提高了关系亲密度计算的准确性。
当然,实施本申请的任一产品不一定需要同时达到以上所有优点。
附图说明
图1为本申请实施例提供的数据处理方法的流程图;
图2为本申请实施例提供的数据处理方法的一种示例流程图;
图3为本申请实施例提供的数据处理方法的另一示例流程图;
图4为本申请实施例提供的数据处理方法的示例示意图;
图5为本申请实施例提供的数据处理装置的示意图。
具体实施方式
以下结合附图对本申请实施例进行详细说明,应当理解,以下所说明的实施例仅用于说明和解释本申请,并不用于限定本申请。
需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
一些实施方式中,执行数据处理方法的计算设备可包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存(memory)。
内存可能包括计算机可读介质中的非永久性存储器、随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。内存可能包括模块1,模块2,……,模块N(N为大于2的整数)。
计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM),快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1为本申请实施例提供的一种数据处理方法的流程图。如图1所示,本实施例提供的数据处理方法,包括以下步骤:
S101、获取设定范围内至少两个人员的关系数据,关系数据包括人员的至少两种行为数据;
S102、基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
S103、基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
其中,设定范围内人员可以根据实际场景确定;比如,设定范围内人员可以包括某一应用(APP,Application)的全部注册用户,或者,设定范围内人员可以包括某一公司的全部员工或该公司某一部门内的员工。然而,本申请对此并不限定。
其中,关系数据可以包括人员的至少两种行为数据,比如,人员的注册行为数据、操作行为数据等。然而,本申请对此并不限定。
本实施例中,可以将设定范围内人员的全部信息定义为全量数据,全量数据可以包括设定范围内全部人员的全部的关系数据;以设定范围内人员包括一应用的全部注册用户为例,全量数据可以包括:该应用的全部注册用户的注册信息、任一注册用户对该应用的全部操作信息等;其中,一个注册用户的注册信息比如可以包括:账号名称、个人身份信息、地址信息、联系电话、邮箱等;若该应用为购物应用,则任一注册用户对该应用的操作信息可以包括:注册用户对该应用的访问时间信息、注册用户在该应用上购买的物品信息、付款方式信息、邮寄地址信息等。然而,本申请对此并不限定。
示例性地,本实施例的方法还可以包括:
基于获取的人员之间的属性关系以及行为关系的数据,确定人员之间的一种或多种关系特征。
其中,基于对关系数据的分析,可以得到人员之间的属性关系以及行为关系的数据。通过挖掘人员之间的属性关系和行为关系中的至少一项,可以确定一种或多种关系特征。
示例性地,关系特征可以基于实际场景中人员的全量数据确定。然而,本申请对此并不限定。在其他实现方式中,关系特征也可以通过预定义方式确定。
其中,属性关系指人员的固有特性(比如,户籍地址、联系电话等)之间的关系;基于属性关系确定的关系特征比如可以包括:具有相同的户籍地址、具有相同的收货地址、联系电话所属的地区相同。
其中,行为关系指人员产生的动作或行为之间存在的关系;基于行为关系确定的关系特征比如可以包括:采用相同的聊天工具进行沟通、采用相同的WIFI网络进行网络访问。
在示例性实施方式中,S103可以包括:通过以下方式确定任一关系特征的权重:
基于获取的人员之间的属性关系以及行为关系的数据,确定该关系特征对应的原始数据条数以及相关数据条数;根据该关系特征对应的原始数据条数以及相关数据条数,计算该关系特征的权重。
其中,根据关系特征对应的原始数据条数以及相关数据条数,计算关系特征的权重,可以包括:
确定关系特征的权重等于关系特征对应的原始数据条数与相关数据条数的比值;或者,
计算关系特征对应的原始数据条数与相关数据条数的比值,对该比值进行归一化处理后得到关系特征的权重。
其中,关系特征对应的原始数据条数可以根据全量数据中具有该关系特征的数据条目确定;关系特征对应的相关数据条数可以根据从全量数据挖掘出的任两个人员之间存在该关系特征的数据条目确定。其中,相关数据条数为通过数据膨胀方式得到的,相关数据条数大于原始数据条数。举例而言,以100个人员为例,以一种关系特征为使用相同WIFI网络访问一购物应用为例,其中,100个人员都采用过WIFI网络T访问过该购物应用,则该关系特征对应的原始数据条数为100,该关系特征生成的任两人之间的相关数据条数为(100×99)/2=4950。
在示例性实施方式中,关系亲密度可以采用[0,1]之间的数值来表示。然而,本申请对此并不限定。在其他实现方式中,可以采用其他范围的数值来表示。
在示例性实施方式中,S103还可以包括:
针对两个人员之间存在的任一种关系特征,计算第一数值,第一数值等于这两个人员存在该关系特征的次数与该关系特征的权重的乘积;
计算第二数值,第二数值等于这两个人员之间存在的所有关系特征对应的第一数值之和,或者,第二数值等于这两个人员之间存在的所有关系特征对应的第一数值与一常数之和;
对该第二数值进行归一化处理后得到这两个人员之间的关系亲密度。
在本实施例中,膨胀率计算模型可以包括以下两个部分:关系特征的权重计算、关系亲密度的计算;其中,在计算人员间的关系特征的权重时,根据关系特征对应的原始数据条数和相关数据条数确定关系特征的权重,其中,相关数据条数通过数据膨胀方式得到,关系特征对应的原始数据条数和相关数据条数会根据人员的关系数据的变化而变化,因此可以根据数据变化动态及时调整关系特征的权重;然后,基于关系特征的权重,计算人员间的关系亲密度,从而提高关系亲密度的计算准确性。
下面通过图2所示示例对膨胀率计算模型中关系特征的权重计算和关系亲密度计算进行举例说明。
图2为本申请实施例提供的数据处理方法的一种示例流程图。如图2所示,本示例包括以下步骤:
S201、根据设定范围内多个人员的全量数据,挖掘出n种关系特征,其中,任一种关系特征采用Bi表示,n为正整数,i为大于0且小于或等于n的正整数;
S202、计算关系特征Bi对应的原始数据条数Si;
S203、计算关系特征Bi对应的任两人的相关数据条数Pi;
其中,关于原始数据条数和相关数据条数的确定方式如前所述,故于此不再赘述;
S204、根据以下式子计算关系特征Bi的权重Wi:
或者,
其中,sigmoid函数的表达式为:
S205、计算任两个人员之间的关系亲密度R;
其中,假设两个人员存在关系特征Bi的次数为Ci,则两人之间的关系亲密度的计算公式如下:
其中,B为常数。
比如,两人共用同一个WIFI上网2次,用聊天工具聊天1次,户籍地址相同;则可以将同WIFI上网、聊天、同户籍地址作为三种关系特征,计算三种关系特征的权重分别w1、w2、w3,则最终两人的关系亲密度可以为:R=sigmoid(2×w1+1×w2+1×w3+B)。
在示例性实施方式中,本实施例的数据处理方法可以由服务端计算设备执行。比如,服务端计算设备可以根据存储的某一应用的所有注册用户的信息,采用本实施例的数据处理方法计算任两个注册用户之间的关系亲密度。
在示例性实施方式中,本实施例的数据处理方法可以由客户端计算设备执行。比如,客户端计算设备上可以运行一应用,在该应用上接收到用户指示的关系亲密度计算请求之后,向服务端计算设备查询相关信息(比如,任一关系特征的权重),然后根据查询到的信息,采用本实施例的关系亲密度计算公式计算本端用户与该应用的其他用户之间的关系亲密度。
综上可见,本实施例提供的数据处理方法中,对人员间关系亲密度给出了定量的分析和计算,提高了关系亲密度计算的准确性。而且关系亲密度计算涉及的关系特征的权重可以基于设定范围内至少两个人员的关系数据或全量数据确定,如此,可以根据关系数据或全量数据的动态变化及时调整权重。
图3为本申请实施例提供的数据处理方法的另一示例流程图。如图3所示,本示例提供的数据处理方法,包括以下步骤:
S301、获取设定范围内至少两个人员的关系数据,关系数据包括人员的至少两种行为数据;
S302、基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
S303、基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算设定范围内的目标人员与第一人群中任一人员之间的关系亲密度,其中,第一人群包括设定范围内除所述目标人员外的人员;
S304、根据目标人员与第一人群中任一人员之间的关系亲密度,构建目标人员的关系网络。
在本实施例中,步骤S301和S302的执行过程可以参照图1对应实施例中对步骤S101和S102的描述,故于此不再赘述。
其中,目标人员可以根据实际场景确定,本申请对此并不限定。在示例性实施方式中,当本实施例的数据处理方法由客户端计算设备执行时,目标人员可以为客户端计算设备的用户。
在本实施例中,在步骤S303中,需要计算设定范围的目标人员与第一人群中任一人员之间的关系亲密度,关于任两个人员之间的关系亲密度的计算方式可以参照图1对应的实施例中步骤S103的描述,故于此不再赘述。
在示例性实施方式中,S304可以包括:
从第一人群中筛选出与目标人员之间的关系亲密度满足条件的人员;
根据筛选出的人员,构建目标人员的关系网络。
在本实施方式中,以关系亲密度越大表示人员之间的关系密切程度越高为例,可以从设定范围内的人员中,筛选出与目标人员之间的关系亲密度大于或等于阈值的人员,即筛选出的人员与目标人员之间的关系密切程度较高;基于筛选出的人员,构建目标人员的关系网络。
图4所示为目标人员A1的关系网络,其中,从设定范围内筛选出的人员可以包括A2至A9;其中,A1与A2之间的关系亲密度为R1,A1与A3之间的关系亲密度为R2,A1与A4之间的关系亲密度为R3,A1与A5之间的关系亲密度为R4,A1与A6之间的关系亲密度为R5,A1与A7之间的关系亲密度为R6,A1与A8之间的关系亲密度为R7,A1与A9之间的关系亲密度为R8;其中,R1、R2、R3均大于R4和R5,R4和R5均大于R6、R7、R8。如图4可见,人员A2至A9与A1之间的距离越近,与A1之间的关系密切程度越高,即A1与A2、A3及A4之间的关系较密切。
在其他实现方式中,可以在一个关系网络中体现多个目标人员与其他人员的关系密切程度。然而,本申请对此并不限定。
本实施例中,基于关系亲密度构建关系网络,后续可以在关系网络上运行更多算法,为实现多种类型业务需求提供重要基础。
图5为本申请实施例提供的数据处理装置的示意图。如图5所示,本实施例提供的数据处理装置,包括:
第一获取模块501,适于获取设定范围内至少两个人员的关系数据,其中,关系数据包括人员的至少两种行为数据;
第二获取模块502,适于基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
数据处理模块503,适于基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
在示例性实施方式中,本实施例的装置还可以包括:关系确定模块,适于基于获取的人员之间的属性关系以及行为关系的数据,确定一种或多种关系特征。
在示例性实施方式中,数据处理模块503,可以适于通过以下方式确定任一关系特征的权重:
基于获取的人员之间的属性关系以及行为关系的数据,确定关系特征对应的原始数据条数以及相关数据条数;根据关系特征对应的原始数据条数以及相关数据条数,计算关系特征的权重。
在示例性实施方式中,数据处理模块503,可以适于通过以下方式根据关系特征对应的原始数据条数以及相关数据条数,计算关系特征的权重:
确定关系特征的权重等于该关系特征对应的原始数据条数与相关数据条数的比值;或者,计算该关系特征对应的原始数据条数与相关数据条数的比值,对该比值进行归一化处理后得到该关系特征的权重。
在示例性实施方式中,数据处理模块503还可以适于通过以下方式基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度:
针对两个人员之间存在的任一种关系特征,计算第一数值,第一数值等于这两个人员存在该关系特征的次数与该关系特征的权重的乘积;
计算第二数值,第二数值等于这两个人员之间存在的所有关系特征对应的第一数值之和,或者,第二数值等于这两个人员之间存在的所有关系特征对应的第一数值与一常数之和;
对第二数值进行归一化处理后得到这两个人员之间的关系亲密度。
在示例性实施方式中,数据处理模块503可以适于计算设定范围内的目标人员与第一人群中任一人员之间的关系亲密度,第一人群包括设定范围内除目标人员外的人员;
数据处理模块503还可以适于根据目标人员与第一人群中任一人员之间的关系亲密度,构建目标人员的关系网络。
关于本实施例的数据处理装置的相关说明可以参照上述方法实施例的说明,故于此不再赘述。
此外,本申请实施例还提供一种设备,包括:存储器、处理器以及存储在存储器上并在处理器上运行的数据处理程序,该数据处理程序被处理器执行时实现以下操作:获取设定范围内至少两个人员的关系数据,关系数据包括人员的至少两种行为数据;基于关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
关于上述操作的说明可以操作上述实施例提供的数据处理方法的步骤的描述,故于此不再赘述。
此外,本申请实施例还提供一种计算机可读介质,存储有数据处理程序,该数据处理程序被处理器执行时实现上述数据处理方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块或单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块或单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上显示和描述了本申请的基本原理和主要特征和本申请的优点。本申请不受上述实施例的限制,上述实施例和说明书中描述的只是说明本申请的原理,在不脱离本申请精神和范围的前提下,本申请还会有各种变化和改进,这些变化和改进都落入要求保护的本申请范围内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;
基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
2.根据权利要求1所述的方法,其特征在于,所述基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度,包括:
通过以下方式确定任一关系特征的权重:
基于获取的人员之间的属性关系以及行为关系的数据,确定所述关系特征对应的原始数据条数以及相关数据条数;根据所述关系特征对应的原始数据条数以及相关数据条数,计算所述关系特征的权重。
3.根据权利要求2所述的方法,其特征在于,所述根据所述关系特征对应的原始数据条数以及相关数据条数,计算所述关系特征的权重,包括:
确定所述关系特征的权重等于所述关系特征对应的原始数据条数与相关数据条数的比值;或者,
计算所述关系特征对应的原始数据条数与相关数据条数的比值,对所述比值进行归一化处理后得到所述关系特征的权重。
4.根据权利要求2或3所述的方法,其特征在于,所述基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度,还包括:
针对两个人员之间存在的任一种关系特征,计算第一数值,所述第一数值等于所述两个人员存在所述关系特征的次数与所述关系特征的权重的乘积;
计算第二数值,所述第二数值等于所述两个人员之间存在的所有关系特征对应的第一数值之和,或者,所述第二数值等于所述两个人员之间存在的所有关系特征对应的第一数值与一常数之和;
对所述第二数值进行归一化处理后得到所述两个人员之间的关系亲密度。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
基于获取的人员之间的属性关系以及行为关系的数据,确定人员之间的一种或多种关系特征。
6.根据权利要求1所述的方法,其特征在于,所述计算得到人员之间的关系亲密度,包括:
计算所述设定范围内的目标人员与第一人群中任一人员之间的关系亲密度,所述第一人群包括所述设定范围内除所述目标人员外的人员;
所述计算得到人员之间的关系亲密度之后,所述方法还包括:根据所述目标人员与所述第一人群中任一人员之间的关系亲密度,构建所述目标人员的关系网络。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标人员与所述第一人群中任一人员之间的关系亲密度,构建所述目标人员的关系网络,包括:
从所述第一人群中筛选出与所述目标人员之间的关系亲密度满足条件的人员;
根据筛选出的所述人员,构建所述目标人员的关系网络。
8.一种数据处理装置,其特征在于,包括:
第一获取模块,适于获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;
第二获取模块,适于基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;
数据处理模块,适于基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
9.一种设备,其特征在于,包括:存储器、处理器以及存储在所述存储器上并在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现以下操作:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
10.一种计算机可读介质,其特征在于,存储有数据处理程序,所述数据处理程序被处理器执行时实现以下操作:
获取设定范围内至少两个人员的关系数据,所述关系数据包括人员的至少两种行为数据;基于所述关系数据的分析,获取人员之间的属性关系以及行为关系的数据;基于获取的人员之间的属性关系以及行为关系的数据,利用膨胀率计算模型,计算得到人员之间的关系亲密度。
CN201710901668.7A 2017-09-28 2017-09-28 一种数据处理方法及装置 Active CN110020025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710901668.7A CN110020025B (zh) 2017-09-28 2017-09-28 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710901668.7A CN110020025B (zh) 2017-09-28 2017-09-28 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN110020025A true CN110020025A (zh) 2019-07-16
CN110020025B CN110020025B (zh) 2022-11-15

Family

ID=67186357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710901668.7A Active CN110020025B (zh) 2017-09-28 2017-09-28 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN110020025B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765435A (zh) * 2019-10-23 2020-02-07 北京旷视科技有限公司 确定人员身份属性的方法、装置和电子设备
CN111324772A (zh) * 2019-07-24 2020-06-23 杭州海康威视系统技术有限公司 一种人员关系确定方法、装置、电子设备及存储介质
CN111652304A (zh) * 2020-05-28 2020-09-11 浙江大华技术股份有限公司 人员亲密度分析方法、终端及存储介质
CN111708821A (zh) * 2020-06-19 2020-09-25 浙江大华技术股份有限公司 人员亲密度的确定方法、装置及存储介质
CN114168691A (zh) * 2022-02-11 2022-03-11 南京拓界信息技术有限公司 基于大数据的可视化人物关系挖掘管理系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102457812A (zh) * 2010-10-26 2012-05-16 中国移动通信集团北京有限公司 基于移动社区类网络应用的群组生成方法、系统及装置
US20130124535A1 (en) * 2011-11-16 2013-05-16 Electronics And Telecommunications Research Institute Apparatus and method for calculating intimacy
US20130166574A1 (en) * 2011-12-27 2013-06-27 Nhn Corporation Social network service system and method for recommending friend of friend based on intimacy between users
CN105631750A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 民航旅客团体发现方法
CN106776781A (zh) * 2016-11-11 2017-05-31 深圳云天励飞技术有限公司 一种人群关系网络分析方法及装置
CN106844673A (zh) * 2017-01-24 2017-06-13 山东亿海兰特通信科技有限公司 一种基于公安数据获取多维人员关系亲密度的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102457812A (zh) * 2010-10-26 2012-05-16 中国移动通信集团北京有限公司 基于移动社区类网络应用的群组生成方法、系统及装置
US20130124535A1 (en) * 2011-11-16 2013-05-16 Electronics And Telecommunications Research Institute Apparatus and method for calculating intimacy
US20130166574A1 (en) * 2011-12-27 2013-06-27 Nhn Corporation Social network service system and method for recommending friend of friend based on intimacy between users
CN105631750A (zh) * 2015-12-25 2016-06-01 中国民航信息网络股份有限公司 民航旅客团体发现方法
CN106776781A (zh) * 2016-11-11 2017-05-31 深圳云天励飞技术有限公司 一种人群关系网络分析方法及装置
CN106844673A (zh) * 2017-01-24 2017-06-13 山东亿海兰特通信科技有限公司 一种基于公安数据获取多维人员关系亲密度的方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324772A (zh) * 2019-07-24 2020-06-23 杭州海康威视系统技术有限公司 一种人员关系确定方法、装置、电子设备及存储介质
CN111324772B (zh) * 2019-07-24 2023-04-07 杭州海康威视系统技术有限公司 一种人员关系确定方法、装置、电子设备及存储介质
CN110765435A (zh) * 2019-10-23 2020-02-07 北京旷视科技有限公司 确定人员身份属性的方法、装置和电子设备
CN110765435B (zh) * 2019-10-23 2022-05-17 北京旷视科技有限公司 确定人员身份属性的方法、装置和电子设备
CN111652304A (zh) * 2020-05-28 2020-09-11 浙江大华技术股份有限公司 人员亲密度分析方法、终端及存储介质
CN111652304B (zh) * 2020-05-28 2023-04-07 浙江大华技术股份有限公司 人员亲密度分析方法、终端及存储介质
CN111708821A (zh) * 2020-06-19 2020-09-25 浙江大华技术股份有限公司 人员亲密度的确定方法、装置及存储介质
CN111708821B (zh) * 2020-06-19 2023-07-14 浙江大华技术股份有限公司 人员亲密度的确定方法、装置及存储介质
CN114168691A (zh) * 2022-02-11 2022-03-11 南京拓界信息技术有限公司 基于大数据的可视化人物关系挖掘管理系统及方法

Also Published As

Publication number Publication date
CN110020025B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN110020025A (zh) 一种数据处理方法及装置
US9703986B1 (en) Decentralized reputation service for synthetic identities
CN110175913A (zh) 基于区块链的数据处理系统、方法、计算设备及存储介质
CN110046998A (zh) 跨链用权系统及方法、装置、电子设备、存储介质
CN107679856B (zh) 基于交易的业务控制方法和装置
WO2020015406A1 (zh) 一种基于区块链对版权使用者进行信用评价的方法及装置
CN105391594B (zh) 识别特征账号的方法及装置
CN110033247B (zh) 支付渠道推荐方法及其系统
WO2016145993A1 (zh) 一种用户设备识别方法及系统
Xiong et al. Reward-based spatial crowdsourcing with differential privacy preservation
TW202004597A (zh) 基於區塊鏈的虛擬資源交付、群眾募資方法及裝置
US10691640B1 (en) Storing an asset update record
CN104809132A (zh) 一种获取网络主体社交关系类型的方法及装置
CN107689950A (zh) 数据发布方法、装置、服务器和存储介质
CN109857943A (zh) 权限等级确定方法、装置、计算机设备及可读存储介质
CN112052480A (zh) 一种模型训练过程中的隐私保护方法、系统及相关设备
CN107070871A (zh) 一种身份验证的方法及装置
CN112001786A (zh) 基于知识图谱的客户信用卡额度配置方法及装置
CN106874293A (zh) 一种数据处理方法及装置
CN105138897B (zh) 确定用户权限的方法及装置
TW201926087A (zh) 問題推送方法及裝置
CN106250999A (zh) 预测流失率的方法、装置和系统
CN110119633A (zh) 一种数据处理方法及计算设备
TW202026993A (zh) 一種優惠金額確定方法、裝置、網路設備及電腦可讀存儲介質
CN109996252B (zh) 基于用户感知的区域扩容方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40010834

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant