CN109740069A - 一种用户间亲密关系的识别方法及装置 - Google Patents
一种用户间亲密关系的识别方法及装置 Download PDFInfo
- Publication number
- CN109740069A CN109740069A CN201811385178.7A CN201811385178A CN109740069A CN 109740069 A CN109740069 A CN 109740069A CN 201811385178 A CN201811385178 A CN 201811385178A CN 109740069 A CN109740069 A CN 109740069A
- Authority
- CN
- China
- Prior art keywords
- user
- node
- space
- time
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种用户间亲密关系的识别方法及装置,涉及数据处理技术领域。所述方法包括:根据预先收集的用户数据构建二分网络,根据二分网络中用户节点和时空节点对应的连边,统计特征数据;根据特征数据,计算不同用户相遇的偶然概率;根据偶然概率,识别具有亲密关系的用户,并计算亲密度。本申请中,基于用户数据并结合时空属性维度构建二分网络,实现了用户之间亲密关系的有效识别,对于相关机构而言,不仅能够更好的对相应的用户进行管理和分配,而且对于机构的决策制定具有一定的指导意义。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种用户间亲密关系的识别方法及装置。
背景技术
随着国内高校校园网络的高速发展,智慧校园已经成为校园建设的重要内容。校园一卡通作为其基础部分,被广泛应用于学生生活的各个领域,从而积累了海量的信息。目前,基于一卡通信息的数据挖掘受到广泛关注。姜楠等人通过优化的K-means聚类算法和Apriori关联规则算法分别针对学生消费行为和学生学习行为,进行消费习惯聚类分析和学习行为关联度分析;该方法采用决策树算法评估聚类结果,所得结果对学校后勤管理部门有一定的帮助。费小丹等人通过K-means聚类算法对一卡通消费数据进行分析,建立基于聚类结果的贫困生指数算法计算每个学生的贫困生指数;该研究分析的贫困生情况,可以辅助高校资助决策工作。Y Qian,Q Shi等人通过使用K-means算法以及时间序列算法分析和预测学生的行为和食堂情况;该研究为大学决策者和购物者制定计划提供数据支持。HuiYan等人利用Apriori算法对校园学生的学习和生活数据进行关联分析,挖掘出他们的成绩与图书馆借书信息,出勤和互联网使用状态之间的关联关系;该研究可以使高校管理人员根据关联分析的结果更好地指导学生学习。
上述研究工作为学校监管方面起到了一定的辅助作用,但还存在一些不足,一方面,挖掘数据都集中在校园一卡通消费数据和学习相关数据上,属于低纬度的数据分析,隐藏在高校网络数据中的校园时空数据尚未得到充分探索;另一方面,挖掘结果都是针对学生财务和学生成绩做分析,并没有研究到校园社交方面。而高纬度的时空数据,恰好通过时间地点信息对学生的社交有所反应,因而,为进一步了解学生的社交,进而为学校在学生关怀、学生管理等方面提供优化策略,基于高纬度的时空数据的探索和研究是有必要的。
发明内容
基于智慧校园在学生信息研究方面的不足,本申请提出一种用户间亲密关系的识别方法及装置。
一方面,本申请提出一种用户间亲密关系的识别方法,包括:
根据预先收集的用户数据构建二分网络,所述二分网络包括用户集合、时空集合、所述用户集合中用户节点与所述时空集合中时空节点之间的连边;
根据所述用户节点和所述时空节点对应的连边,统计特征数据;
根据所述特征数据,计算不同用户相遇的偶然概率;
根据所述偶然概率,识别具有亲密关系的用户,并计算亲密度。
其中,所述用户数据包括各用户的用户标识、出现时间和出现地点;
可选的,所述根据预先收集的用户数据构建二分网络,包括:
识别所述用户数据中的各用户标识,将相同的用户标识作为同一用户节点,得到用户集合;
根据所述出现时间确定总时长,根据预设时间长度将所述总时长划分为多个时段并作为时间节点;
识别所述用户数据中的各出现地点,将相同的出现地点作为同一空间节点;
将所述时间节点与所述空间节点彼此组合为时空节点,得到时空集合;
根据各用户的出现时间和出现地点,在所述用户集合中的相应的用户节点与所述时空集合中的相应的时空节点之间建立连边,得到边集;
所述用户集合、所述时空集合与所述边集构成二分网络。
可选的,将各节点对应的连边数量作为各节点的度,将与两个用户节点均有连边的时空节点作为所述两个用户节点的邻居节点,并将所述两个用户节点称为第一关联用户节点;
所述根据所述用户节点和所述时空节点对应的连边,统计特征数据,包括:
统计所述时空集合中各时空节点的度,根据所述各时空节点的度,将所述二分网络划分为多个二分子网络;
统计所述二分子网络中各用户节点的度、各第一关联用户节点的邻居节点的数量、时空节点的数量。
可选的,所述根据所述各时空节点的度,将所述二分网络划分为多个二分子网络,包括:
根据所述各时空节点的度,将所述时空集合划分为多个时空子集合,所述时空子集合中的各时空节点具有相同的度;
将所述多个时空子集合分别与所述用户集合及所述边集中相应的连边,构成多个二分子网络。
可选的,所述根据所述特征数据,计算不同用户相遇的偶然概率,包括:
依次假设各二分子网络中各第一关联用户节点中的两个用户节点是偶然相遇;
根据所述第一关联用户节点中的两个用户节点的度、所述第一关联用户节点的邻居节点的数量、所述第一关联用户节点对应的时空子集合中时空节点的数量确定满足的超几何分布;
比较所述第一关联用户节点中两个用户节点的度的大小,得到小的度,根据所述小的度、所述第一关联用户节点对应的时空子集合中时空节点的数量、所述超几何分布,计算所述第一关联用户节点中两个用户节点相遇的偶然概率。
可选的,所述根据所述偶然概率,识别具有亲密关系的用户,包括:
判断所述偶然概率是否小于概率阈值,是则判定相应第一关联用户节点中的两个用户节点具有亲密关系,否则判定相应第一关联用户节点中的两个用户节点不具有亲密关系。
可选的,所述将所述二分网络划分为多个二分子网络之后,还包括:通过投影的方式,分别构建所述多个二分子网络的用户关系网络;
对应的,所述判定相应第一关联用户节点中的两个用户节点不具有亲密关系时,还包括:更新对应的用户关系网络。
可选的,所述通过投影的方式,分别构建所述多个二分子网络的用户关系网络,包括:提取各二分子网络中的用户集合,识别各二分子网络中的各第一关联用户节点,并在相应的用户集合中对应用户节点之间添加连边,得到用户关系网络;
对应的,所述更新相应的用户网络关系,具体为:在相应的用户关系网络中,删除对应的连边。
可选的,将所述用户关系网络中的连边对应的用户节点作为第二关联用户节点,所述计算亲密度,包括:
依次确定当前各用户关系网络中的第二关联用户节点对应的各邻居节点;
根据确定的各邻居节点的度、各时空节点的度,分别计算确定的各邻居节点的权值;
根据计算的各邻居节点的权值,计算对应的第二关联用户节点中两个用户节点的亲密度,并对所述亲密度进行归一化。
第二方面,本申请提出一种用户间亲密关系的识别装置,包括:
第一构建模块,用于根据预先收集的用户数据构建二分网络,所述二分网络包括用户集合、时空集合、所述用户集合中用户节点与所述时空集合中时空节点之间的连边;
统计模块,用于根据所述用户节点和所述时空节点对应的连边,统计特征数据;
第一计算模块,用于根据所述特征数据,计算不同用户相遇的偶然概率;
识别模块,用于根据所述偶然概率,识别具有亲密关系的用户;
第二计算模块,用于计算具有亲密关系的用户的亲密度。
本申请的优点在于:
本申请中的方法,不局限于研究学校中学生之间的亲密关系和社交状态,还可以应用于如企事业等机构,分析员工之间的亲密关系。通过分析用户数据并覆盖时空属性维度,构建二分网络,并基于该二分网络,分析用户的行为特征,计算不同用户相遇的偶然概率,从而实现了不同用户之间亲密关系的有效识别,对于相关机构而言,不仅能够更好的对相应的用户进行管理和分配,而且对于机构的决策制定具有一定的指导意义。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1为根据本申请实施方式的一种用户间亲密关系的识别方法流程图;
附图2为步骤101的细化流程图;
附图3为二分网络的示意图;
附图4为步骤102的细化流程图;
附图5为步骤103的细化流程图;
附图6为亲密度归一化的细化流程图;
附图7为根据本申请实施方式的一种用户间亲密关系的识别装置框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
基于智慧校园在学生信息研究方面的不足,本申请提出一种适用于各种个体之间亲密度识别的方法,而不局限于校园中学生之间亲密度的分析,具体如下。
根据本申请的实施方式,提出一种用户间亲密关系的识别方法,如图1所示,包括:
步骤101:根据预先收集的用户数据构建二分网络,二分网络包括用户集合、时空集合、用户集合中用户节点与时空集合中时空节点之间的连边;
其中,用户数据包括各用户的用户标识、出现时间和出现地点;
以预先收集校园中各学生的学生数据为例,学生数据可以为学生通过学校为其分配的一卡通在食堂、超市、游泳馆、图书馆等不同地点的使用记录,其中一卡通的卡号或者学生的学号可以作为学生的标识,一卡通的使用时间即为学生的出现时间、一卡通的使用地点即为学生的出现地点。
根据本申请的实施方式,如图2所示,步骤101包括:
步骤101-1:识别收集的用户数据中的各用户标识,将相同的用户标识作为同一用户节点,得到用户集合;
例如,收集的学生数据包括多个学生甲的一卡通的使用记录,识别得到多个学生甲的学号,将该多个学号作为一个学生节点,即该学生节点对应于学生甲。
进一步的,将得到的用户集合记为P={P1,P2…Pn},其中,n为用户的总数量。
步骤101-2:根据收集的用户数据中的各出现时间确定总时长,根据预设时间长度将所述总时长划分为多个时段并作为时间节点;
具体的,在收集的用户数据中查找最早出现时间和最晚出现时间,并根据最早出现时间和最晚出现时间确定总时长。
进一步的,得到的各时间节点构成时间节点集合,时间节点集合记为T={T1,T2…Tb},其中,b为时间节点的数量。
步骤101-3:识别收集的用户数据中的各出现地点,将相同的出现地点作为同一空间节点;
本实施例中,各空间节点构成空间节点集合,空间节点集合记为S={S1,S2…Sa},其中a为时空节点的数量。
步骤101-4:将时间节点与空间节点彼此组合为时空节点,得到时空集合;
具体的,时空集合为ST={(S1,T1)…(Sx,Ty)…(Sa,Tb)},其中,1<x<a,1<y<b,即时空集合中含有a*b个时空节点。
步骤101-5:根据各用户的出现时间和出现地点,在所述用户集合中的相应的用户节点与所述时空集合中的相应的时空节点之间建立连边,得到边集;
其中,连边代表某用户节点在某时间节点出现在某空间节点,边集记为E;
例如,用户P1在T1时间节点出现在空间节点S1,在T3时间节点出现在空间节点S2,则P1与时空节点(S1,T1)和(S2,T3)分别建立连边。
步骤101-6:所述用户集合、所述时空集合与所述边集构成二分网络。
其中,二分网络记为G=(P,ST,E),二分网络的示意图如图3所示。
进一步的,本申请中,将各节点对应的连边数量作为各节点的度,将与两个用户节点均有连边的时空节点作为该两个用户节点的邻居节点,并将该两个用户节点称为第一关联用户节点;
例如,图3中,按照从左至右的顺序,对用户节点和时空节点依次编号,用户节点P1的度是2,时空节点(S1,T1)是用户节点P1和P2的邻居节点,用户节点P1和P2为第一关联用户节点。
步骤102:根据用户节点和时空节点对应的连边,统计特征数据;
根据本申请的实施方式,如图4所示,步骤102包括:
步骤102-1:统计所述时空集合中各时空节点的度,根据各时空节点的度,将二分网络划分为多个二分子网络;
具体的,统计所述时空集合中各时空节点对应的连边数量,并作为相应时空节点的度;
进一步的,根据各时空节点的度,将二分网络划分为多个二分子网络,包括:
步骤A1:根据各时空节点的度,将时空集合划分为多个时空子集合,所述时空子集合中的各时空节点具有相同的度;
本申请中,将时空子集合记为STd,表示度为d的时空节点构成的时空子集合,也表示该时空子集合的度为d,且STd∈ST。
例如,将度为3的各时空节点划分至同一时空子集合,该时空子集合记为ST3,该时空子集合的度为3。
步骤A2:将所述多个时空子集合分别与所述用户集合及所述边集中相应的连边,构成多个二分子网络。
本申请中,各二分子网络中的时空子集合的度又为对应的二分子网络的度;例如,空子集合ST3所在的二分子网络的度为3。
根据本申请的实施方式,将二分网络划分为多个二分子网络之后,还包括:
步骤B:通过投影的方式,分别构建各二分子网络的用户关系网络;
具体的,提取各二分子网络中的用户集合,识别各二分子网络中的各第一关联用户节点,并在相应的用户集合中对应用户节点之间添加连边,得到用户关系网络;
步骤102-2:统计各二分子网络中各用户节点的度、各第一关联用户节点的邻居节点的数量、时空节点的数量。
步骤103:根据统计的特征数据,计算不同用户相遇的偶然概率;
根据本申请的实施方式,如图5所示,步骤103包括:
步骤103-1:依次假设各二分子网络中各第一关联用户节点中的两个用户节点是偶然相遇;
具体的,原假设H0:当前的第一关联用户节点中的两个用户节点是偶然相遇;备择假设H1:当前的第一关联用户节点中的两个用户节点不是偶然相遇;
步骤103-2:根据第一关联用户节点中的两个用户节点的度、第一关联用户节点的邻居节点的数量、第一关联用户节点对应的时空子集合中时空节点的数量确定满足的超几何分布;
具体的,第一关联用户节点中的两个用户节点分别记为Pi和Pj,超几何分布为:其中,X为假设的用户节点Pi和用户节点Pj的邻居节点的数量,为第一关联用户节点对应的度为d的时空子集合中时空节点的数量,为用户节点Pi在度为d的二分子网络中的度,为用户节点Pj在度为d的二分子网络中的度,C表示组合。
步骤103-3:比较第一关联用户节点中两个用户节点的度的大小,得到小的度,根据所述小的度、第一关联用户节点对应的时空子集合中时空节点的数量、所述几何分布,计算所述第一关联用户节点中两个用户节点相遇的偶然概率。
具体的,根据以下公式计算所述第一关联用户节点中两个用户节点相遇的偶然概率:其中,是用户节点Pi和用户节点Pj的实际邻居节点的数量。
步骤104:根据计算的偶然概率,识别具有亲密关系的用户,并计算亲密度。
其中,根据计算的偶然概率,识别具有亲密关系的用户,包括:判断计算的偶然概率是否小于概率阈值,是则判定相应第一关联用户节点中的两个用户节点具有亲密关系,即接受备择假设;否则判定相应第一关联用户节点中的两个用户节点不具有亲密关系,即拒绝原假设。其中,概率阈值优选为0.05。
进一步的,当判定相应第一关联用户节点中的两个用户节点不具有亲密关系时,还包括:更新对应的用户关系网络;具体的,在相应的用户关系网络中,删除对应的连边。
本申请中,将用户关系网络中的连边对应的用户节点作为第二关联用户节点,其中,第二关联用户节点中的两个用户节点与相应的第一关联用户节点中的两个用户节点相同;
对应的,如图6所示,步骤104中,计算亲密度,包括:
步骤C1:依次确定当前各用户关系网络中的第二关联用户节点对应的各邻居节点;
具体的,依次根据当前各用户关系网络中剩余的第二关联用户节点,在对应二分子网络中的时空子集合中查找相应的第一关联用户节点的各邻居节点。
步骤C2:根据确定的各邻居节点的度、各时空节点的度,分别计算确定的各邻居节点的权值;
具体的,依次将确定的邻居节点作为当前邻居节点,将各二分子网络或者二分网络中各时空节点的度加和,将该加和与当前邻居节点的度相除,得到当前邻居节点的权值;即公式:其中,Wcd为当前邻居节点ScTd的权值,1<c<a,1<d<b,为当前邻居节点ScTd的度。
步骤C3:根据计算的各邻居节点的权值,计算对应的第二关联用户节点中两个用户节点的亲密度,并对亲密度进行归一化。
具体的,将计算的各邻居节点的权值加和,得到对应的第二关联用户节点中两个用户节点的亲密度;即公式:Fij=∑Wcd,其中,Fij为第二关联用户节点中用户节点Pi和用户节点Pj的亲密度。
进一步的,对亲密度进行归一化,包括:确定计算的各邻居节点的权值中的最小值和最大值,根据所述最小值和最大值对亲密度进行归一化;归一化公式为:其中,min(F)为计算的各邻居节点的权值中的最小值,max(F)为计算的各邻居节点的权值中的最大值,0≤Fi`j<1。
根据本申请的实施方式,方法还可以包括:在归一化处理后的各亲密度中筛选大于亲密度阈值的亲密度,并根据筛选的亲密度构建相应用户的朋友关系网络;具体的,将筛选的亲密度对应的各用户作为用户节点,并在有亲密关系的用户之间添加连边,形成朋友关系网络。
进一步的,方法还可以包括:根据朋友关系网络识别与某个用户节点有亲密关系的其他用户节点之间的关系;
具体的,在所述其他用户节点中任意两个用户节点之间建立虚拟连边,统计所述虚拟连边的数量及所述其他用户节点之间实际连边的数量,将所述实际连边的数量与所述虚拟连边的数量求商得到该某个用户节点的聚类系数,根据聚类系数确定所述其他用户之间的紧密程度。
其中,聚类系数具体用于描述所述其他用户节点也具有亲密关系、互为朋友的比例,能够体现出该某个用户节点的朋友圈是否紧密。
例如,在朋友关系网络中,用户节点P1分别与用户节点P3、P4、P6、P8之间有连边,用户节点P3分别与P4、P6有连边、用户节点P6与P8之间有连边;则在用户节点P3、P4、P6、P8之间,分别建立虚拟连边,虚拟连边的数量为6,用户节点P3、P4、P6、P8之间的实际连边的数量为3,则用户节点P1的聚类系数为3/6=0.5。
至此,本申请中,通过分析收集的用户数据,结合时空属性维度构建二分网络,从而基于该二分网络分析用户的行为特征,实现了用户之间亲密关系的有效识别,对于相关机构而言,不仅能够更好的对相应的用户进行管理和分配,而且对于机构的决策制定具有一定的指导意义。例如对于校园,能够有效的体现各学生之间的亲密程度、社交朋友关系,可及时发现孤立的学生,从而便于校方更好的作出学生关怀、教学科研、后勤和管理等多个方面的决策;对于企事业单位而言,则能够充分体现员工之间的亲密程度、朋友关系等,对于企事业单位的员工管理、项目人员分配等各方面具有一定的指导意义。
实施例二
根据本申请的实施方式,还提出一种用户间亲密关系的识别装置,如图7所示,包括:
第一构建模块201,用于根据预先收集的用户数据构建二分网络,所述二分网络包括用户集合、时空集合、所述用户集合中用户节点与所述时空集合中时空节点之间的连边;
统计模块202,用于根据所述用户节点和所述时空节点对应的连边,统计特征数据;
第一计算模块203,用于根据所述特征数据,计算不同用户相遇的偶然概率;
识别模块204,用于根据所述偶然概率,识别具有亲密关系的用户;
第二计算模块205,用于计算具有亲密关系的用户的亲密度。
其中,用户数据包括各用户的用户标识、出现时间和出现地点。
根据本申请的实施方式,第一构建模块201具体用于:
识别所述用户数据中的各用户标识,将相同的用户标识作为同一用户节点,得到用户集合;
根据所述出现时间确定总时长,根据预设时间长度将所述总时长划分为多个时段并作为时间节点;
识别所述用户数据中的各出现地点,将相同的出现地点作为同一空间节点;
将所述时间节点与所述空间节点彼此组合为时空节点,得到时空集合;
根据各用户的出现时间和出现地点,在所述用户集合中的相应的用户节点与所述时空集合中的相应的时空节点之间建立连边,得到边集;
所述用户集合、所述时空集合与所述边集构成二分网络。
本申请中,将各节点对应的连边数量作为各节点的度,将与两个用户节点均有连边的时空节点作为所述两个用户节点的邻居节点,并将所述两个用户节点称为第一关联用户节点。
对应的,统计模块202包括:第一统计子模块、划分子模块和第二统计子模块,其中:
第一统计子模块,用于统计时空集合中各时空节点的度;
划分子模块,用于根据所述各时空节点的度,将所述二分网络划分为多个二分子网络;
第二统计子模块,用于统计所述二分子网络中各用户节点的度、各第一关联用户节点的邻居节点的数量、时空节点的数量。
进一步的,划分子模块,具体用于:
根据所述各时空节点的度,将所述时空集合划分为多个时空子集合,所述时空子集合中的各时空节点具有相同的度;
将所述多个时空子集合分别与所述用户集合及所述边集中相应的连边,构成多个二分子网络。
根据本申请的实施方式,第一计算模块203包括:假设子模块、第一确定子模块、第一计算子模块,其中:
假设子模块,用于依次假设各二分子网络中各第一关联用户节点中的两个用户节点是偶然相遇;
第一确定子模块,用于根据所述第一关联用户节点中的两个用户节点的度、所述第一关联用户节点的邻居节点的数量、所述第一关联用户节点对应的时空子集合中时空节点的数量确定满足的超几何分布;
第一计算子模块,用于比较所述第一关联用户节点中两个用户节点的度的大小,得到小的度,根据所述小的度、所述第一关联用户节点对应的时空子集合中时空节点的数量、所述超几何分布,计算所述第一关联用户节点中两个用户节点相遇的偶然概率。
根据本申请的实施方式,识别模块204具体用于:
判断第一计算模块203计算的偶然概率是否小于概率阈值,是则判定相应第一关联用户节点中的两个用户节点具有亲密关系,否则判定相应第一关联用户节点中的两个用户节点不具有亲密关系。
根据本申请的实施方式,该装置还包括:第二构建模块和更新模块,其中:
第二构建模块,用于通过投影的方式,分别构建所述多个二分子网络的用户关系网络;
更新模块,用于当识别模块204判定相应第一关联用户节点中的两个用户节点不具有亲密关系时,更新对应的用户关系网络。
进一步的,第二构建模块具体用于:提取各二分子网络中的用户集合,识别各二分子网络中的各第一关联用户节点,并在相应的用户集合中对应用户节点之间添加连边,得到用户关系网络;
对应的,更新模块具体用于:在相应的用户关系网络中,删除对应的连边。
本申请中,将用户关系网络中的连边对应的用户节点作为第二关联用户节点;
第二计算模块205包括:第二确定子模块、第二计算子模块、第三计算子模块和归一化子模块,其中:
第二确定子模块,用于依次确定当前各用户关系网络中的第二关联用户节点对应的各邻居节点;
第二计算子模块,用于根据确定的各邻居节点的度、各时空节点的度,分别计算确定的各邻居节点的权值;
第三计算子模块,用于根据计算的各邻居节点的权值,计算对应的第二关联用户节点中两个用户节点的亲密度;
归一化子模块,用于对所述亲密度进行归一化。
根据本申请的实施方式,还提出一种用户间亲密关系的识别设备,包括:一个或多个处理器、存储一个或多个程序的存储装置;当所述程序被所述处理器执行时,实现如实施例一所述的用户间亲密关系的识别方法。
进一步的,所述存储装置可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以进一步包括只读存储单元(ROM)。
根据本申请的实施方式,还提出一种计算机可读存储介质,其上存储有计算机程序(即程序产品),当该计算机程序被处理器执行时,实现如实施例一所述的用户间亲密关系的识别方法。
进一步的,所述计算机可读存储介质包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。
需要说明的,本说明书中的各实施例采用相关的方式描述,各实施例之间相同相似的部分互相参考即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种用户间亲密关系的识别方法,其特征在于,包括:
根据预先收集的用户数据构建二分网络,所述二分网络包括用户集合、时空集合、所述用户集合中用户节点与所述时空集合中时空节点之间的连边;
根据所述用户节点和所述时空节点对应的连边,统计特征数据;
根据所述特征数据,计算不同用户相遇的偶然概率;
根据所述偶然概率,识别具有亲密关系的用户,并计算亲密度。
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括各用户的用户标识、出现时间和出现地点;
所述根据预先收集的用户数据构建二分网络,包括:
识别所述用户数据中的各用户标识,将相同的用户标识作为同一用户节点,得到用户集合;
根据所述出现时间确定总时长,根据预设时间长度将所述总时长划分为多个时段并作为时间节点;
识别所述用户数据中的各出现地点,将相同的出现地点作为同一空间节点;
将所述时间节点与所述空间节点彼此组合为时空节点,得到时空集合;
根据各用户的出现时间和出现地点,在所述用户集合中的相应的用户节点与所述时空集合中的相应的时空节点之间建立连边,得到边集;
所述用户集合、所述时空集合与所述边集构成二分网络。
3.根据权利要求1所述的方法,其特征在于,将各节点对应的连边数量作为各节点的度,将与两个用户节点均有连边的时空节点作为所述两个用户节点的邻居节点,并将所述两个用户节点称为第一关联用户节点;
所述根据所述用户节点和所述时空节点对应的连边,统计特征数据,包括:
统计所述时空集合中各时空节点的度,根据所述各时空节点的度,将所述二分网络划分为多个二分子网络;
统计所述二分子网络中各用户节点的度、各第一关联用户节点的邻居节点的数量、时空节点的数量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述各时空节点的度,将所述二分网络划分为多个二分子网络,包括:
根据所述各时空节点的度,将所述时空集合划分为多个时空子集合,所述时空子集合中的各时空节点具有相同的度;
将所述多个时空子集合分别与所述用户集合及所述边集中相应的连边,构成多个二分子网络。
5.根据权利要求3所述的方法,其特征在于,所述根据所述特征数据,计算不同用户相遇的偶然概率,包括:
依次假设各二分子网络中各第一关联用户节点中的两个用户节点是偶然相遇;
根据所述第一关联用户节点中的两个用户节点的度、所述第一关联用户节点的邻居节点的数量、所述第一关联用户节点对应的时空子集合中时空节点的数量确定满足的超几何分布;
比较所述第一关联用户节点中两个用户节点的度的大小,得到小的度,根据所述小的度、所述第一关联用户节点对应的时空子集合中时空节点的数量、所述超几何分布,计算所述第一关联用户节点中两个用户节点相遇的偶然概率。
6.根据权利要求5所述的方法,其特征在于,所述根据所述偶然概率,识别具有亲密关系的用户,包括:
判断所述偶然概率是否小于概率阈值,是则判定相应第一关联用户节点中的两个用户节点具有亲密关系,否则判定相应第一关联用户节点中的两个用户节点不具有亲密关系。
7.根据权利要求6所述的方法,其特征在于,
所述将所述二分网络划分为多个二分子网络之后,还包括:通过投影的方式,分别构建所述多个二分子网络的用户关系网络;
所述判定相应第一关联用户节点中的两个用户节点不具有亲密关系时,还包括:更新对应的用户关系网络。
8.根据权利要求7所述的方法,其特征在于,
所述通过投影的方式,分别构建所述多个二分子网络的用户关系网络,包括:提取各二分子网络中的用户集合,识别各二分子网络中的各第一关联用户节点,并在相应的用户集合中对应用户节点之间添加连边,得到用户关系网络;
所述更新相应的用户网络关系,具体为:在相应的用户关系网络中,删除对应的连边。
9.根据权利要求8所述的方法,其特征在于,将所述用户关系网络中的连边对应的用户节点作为第二关联用户节点,所述计算亲密度,包括:
依次确定当前各用户关系网络中的第二关联用户节点对应的各邻居节点;
根据确定的各邻居节点的度、各时空节点的度,分别计算确定的各邻居节点的权值;
根据计算的各邻居节点的权值,计算对应的第二关联用户节点中两个用户节点的亲密度,并对所述亲密度进行归一化。
10.一种用户间亲密关系的识别装置,其特征在于,包括:
第一构建模块,用于根据预先收集的用户数据构建二分网络,所述二分网络包括用户集合、时空集合、所述用户集合中用户节点与所述时空集合中时空节点之间的连边;
统计模块,用于根据所述用户节点和所述时空节点对应的连边,统计特征数据;
第一计算模块,用于根据所述特征数据,计算不同用户相遇的偶然概率;
识别模块,用于根据所述偶然概率,识别具有亲密关系的用户;
第二计算模块,用于计算具有亲密关系的用户的亲密度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811385178.7A CN109740069A (zh) | 2018-11-20 | 2018-11-20 | 一种用户间亲密关系的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811385178.7A CN109740069A (zh) | 2018-11-20 | 2018-11-20 | 一种用户间亲密关系的识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109740069A true CN109740069A (zh) | 2019-05-10 |
Family
ID=66356969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811385178.7A Pending CN109740069A (zh) | 2018-11-20 | 2018-11-20 | 一种用户间亲密关系的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740069A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143639A (zh) * | 2019-12-27 | 2020-05-12 | 同盾(广州)科技有限公司 | 用户亲密度计算方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104519497A (zh) * | 2015-01-12 | 2015-04-15 | 武汉大学 | 一种基于用户活动特征的基站划分方法 |
CN106682212A (zh) * | 2016-12-31 | 2017-05-17 | 复旦大学 | 一种基于用户移动行为的社会关系分类方法与装置 |
CN107464141A (zh) * | 2017-08-07 | 2017-12-12 | 北京京东尚科信息技术有限公司 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
CN107885778A (zh) * | 2017-10-12 | 2018-04-06 | 浙江工业大学 | 一种基于动态临近点谱聚类的个性化推荐方法 |
CN108268566A (zh) * | 2017-01-04 | 2018-07-10 | 腾讯科技(深圳)有限公司 | 一种数据关系确定方法及装置 |
-
2018
- 2018-11-20 CN CN201811385178.7A patent/CN109740069A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104519497A (zh) * | 2015-01-12 | 2015-04-15 | 武汉大学 | 一种基于用户活动特征的基站划分方法 |
CN106682212A (zh) * | 2016-12-31 | 2017-05-17 | 复旦大学 | 一种基于用户移动行为的社会关系分类方法与装置 |
CN108268566A (zh) * | 2017-01-04 | 2018-07-10 | 腾讯科技(深圳)有限公司 | 一种数据关系确定方法及装置 |
CN107464141A (zh) * | 2017-08-07 | 2017-12-12 | 北京京东尚科信息技术有限公司 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
CN107885778A (zh) * | 2017-10-12 | 2018-04-06 | 浙江工业大学 | 一种基于动态临近点谱聚类的个性化推荐方法 |
Non-Patent Citations (2)
Title |
---|
姜晓兵: "《数据、模型与决策》", 31 January 2017 * |
童睿: "《基于一卡通消费数据的学生成绩预测和朋友关系网络检测研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143639A (zh) * | 2019-12-27 | 2020-05-12 | 同盾(广州)科技有限公司 | 用户亲密度计算方法、装置、设备及介质 |
CN111143639B (zh) * | 2019-12-27 | 2021-05-07 | 同盾(广州)科技有限公司 | 用户亲密度计算方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210141814A1 (en) | Concept-level user intent profile extraction and applications | |
Nettleton | Data mining of social networks represented as graphs | |
Hasan et al. | Urban activity pattern classification using topic models from online geo-location data | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
US20130198191A1 (en) | Method for detecting communities in massive social networks by means of an agglomerative approach | |
Wang et al. | Analysis of user behaviors by mining large network data sets | |
CN104679810A (zh) | 用于基于移动装置数据产生简档的方法和系统 | |
Hu et al. | Co-clustering enterprise social networks | |
Hexmoor | Computational network science: an algorithmic approach | |
Velichety et al. | Finding a needle in the haystack-recommending online communities on social media platforms using network and design science | |
CN113129010A (zh) | 一种基于复杂网络模型的欺诈团伙挖掘系统及其挖掘方法 | |
Maji et al. | Identification of city hotspots by analyzing telecom call detail records using complex network modeling | |
Wiedemann et al. | Unlocking social network analysis methods for studying human mobility | |
CN109740069A (zh) | 一种用户间亲密关系的识别方法及装置 | |
Oselio et al. | Information extraction from large multi-layer social networks | |
CN114969525B (zh) | 音乐社交推荐方法、系统、装置及存储介质 | |
Zhang et al. | Extracting evolutionary communities in community question answering | |
Apreleva et al. | Predicting the location of users on Twitter from low density graphs | |
Nguyen et al. | Discovering social community structures based on human mobility traces | |
Güneş et al. | Ga-tvrc-het: genetic algorithm enhanced time varying relational classifier for evolving heterogeneous networks | |
Crnovrsanin et al. | Social network discovery based on sensitivity analysis | |
Sowmya et al. | Social recommendation system using network embedding and temporal information | |
Li et al. | Understanding service integration of online social networks: A data-driven study | |
Ntalianis et al. | Multiresolution organization of social media users’ profiles: Fast detection and efficient transmission of characteristic profiles | |
Schunk | An Analysis on The Network Structure of Influential Communities in Twitter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190510 |
|
RJ01 | Rejection of invention patent application after publication |