CN103605791B - 信息推送系统和信息推送方法 - Google Patents
信息推送系统和信息推送方法 Download PDFInfo
- Publication number
- CN103605791B CN103605791B CN201310646421.7A CN201310646421A CN103605791B CN 103605791 B CN103605791 B CN 103605791B CN 201310646421 A CN201310646421 A CN 201310646421A CN 103605791 B CN103605791 B CN 103605791B
- Authority
- CN
- China
- Prior art keywords
- relation
- group
- data
- user
- child
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提出了一种信息推送系统和一种信息推送方法,包括:数据采集单元,用于采集用户的通信记录数据;关系数据生成单元,用于根据通信记录数据生成基于用户群的关系数据;过滤单元,用于对基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;分类单元,用于提取每一子用户群的目标关系数据的特征数据,根据特征数据对所有子用户群进行分类;推送单元,用于将指定类别的信息推送至对应于指定类别的子用户群。本发明能够根据用户的通信记录数据分析用户之间的关系,形成用户群,并根据关系边的特征生成多个子用户群,对每个子用户群进行聚类分析,提取子用户群的特征数据,根据特征数据对子用户群进行分类,以方便信息的推送。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种信息推送系统和一种信息推送方法。
背景技术
大多数的信息(例如软件信息、产品信息)推送都是以固定的模式进行推送,例如统计用户的使用数量,将用户使用最多的信息推送给用户,并没有考虑用户的使用习惯或用户与周边环境之间的关系,推送给用户的信息就并不是用户需要的,造成信息推送的资源浪费,也使得用户只能按照推送的信息进行盲目使用。
发明内容
本发明正是基于上述问题,提出了一种信息推送方案,能够采集用户的通信记录数据,分析用户的通信记录数据,根据用户的通信记录数据形成用户群,提取特征数据,将用户群进行分类,使信息能够进行有目的性的推送。
有鉴于此,根据本发明的一个方面,提出了一种服务器,包括:一种信息推送系统,其特征在于,包括:数据采集单元,用于采集用户的通信记录数据;关系数据生成单元,连接至所述数据采集单元,用于根据所述通信记录数据生成基于用户群的关系数据;过滤单元,连接至所述关系数据生成单元,用于对所述基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;分类单元,连接至所述过滤单元,用于提取每一子用户群的目标关系数据的特征数据,根据所述特征数据对所有子用户群进行分类;推送单元,连接至所述分类单元,用于将指定类别的信息推送至对应于所述指定类别的子用户群。
采集用户的通信记录数据,该通信记录数据包括但不限于用户的呼叫记录、短信记录、彩信记录。根据通信记录数据可以形成基于通信关系网络的用户群,由于数据较多,因此删除关系较弱的关系数据,将用户群进行分离,形成子用户群。为了使信息能够有目的的进行推送,还需要对子用户群进行分类,将信息推送给与其类别相同的子用户群。这样就避免了相关技术中按照固定模式进行信息推送所导致的盲目推送,使推送的信息不符合用户的使用习惯的问题,本发明能够将合适的信息推送给真正需要的用户,提高推送效率和准确率。
在上述技术方案中,优选的,所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录;所述关系数据生成单元包括:关系边确定单元,根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;权重值计算单元,根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;关系类型确定单元,将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;用户状态确定单元,根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;目标关系数据生成单元,根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
为了便于后续的用户群分析,需对采集的通信记录数据进行分析,通信记录中包括联系者与被联系者,分析用户之间的关系,两个用户节点之间的边为关系边,该关系边是通信关系网络的边,因此基于通信记录数据能够形成基于大用户群的关系数据,根据用户之间的通信频率以及通信内容,还可以确定每一关系边的关系类型,形成具有多种关系类型的用户群,以及用户群中每一个用户的通信情况。
在上述技术方案中,优选的,所述过滤单元包括:介数值计算单元,计算所述多叉树数据结构中的每一关系边的介数值;子用户群形成单元,在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;群中心节点确定单元,将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点,以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量,汇总所有边关系向量得到所述基于子用户群的目标关系数据。
介数值代表了每一用户与其他用户之间的亲密度,如果用户A经过多个用户之后才能联系上用户B,那么用户A与用户B之间的介数值较高,说明亲密度较低,用户A与用户B之间的关系较弱,因此可以删除用户群中关系较弱的关系边。因此用户群就被分裂成多个子用户群,对于每个子用户群,确定该子用户群的中心节点,中心节点即最活跃的用户。可以根据用户的使用情况来确定最活跃的用户。以该中心节点为基准,进行聚类分析,形成基于子用户群的关系数据。
在上述技术方案中,优选的,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;所述分类单元根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。在形成多个子用户群之后,还需对这多个子用户群进行分类,以便信息能够进行有目的的推送。在分类时,需提取每个子用户群的特征数据,根据子用户群的特征数据来对子用户群进行归类,这样就可以进行信息推送给与其属于同一类别的一个或多个子用户群。
在上述任一技术方案中,优选的,还可以包括:多因素正交化处理单元,用于接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
将信息推送给用户群之后,还能够接收用户群的反馈使用数据,根据多因素正交化方式对使用数据进行处理,得到正交矩阵,符合实际应用场景。
根据本发明的又一方面,还提供了一种信息推送方法,包括:采集用户的通信记录数据;根据所述通信记录数据生成基于用户群的关系数据;对所述基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;提取每一子用户群的目标关系数据的特征数据,根据所述特征数据对所有子用户群进行分类;将指定类别的信息推送至对应于所述指定类别的子用户群。
采集用户的通信记录数据,该通信记录数据包括但不限于用户的呼叫记录、短信记录、彩信记录。根据通信记录数据可以形成基于通信关系网络的用户群,由于数据较多,因此删除关系较弱的关系数据,将用户群进行分离,形成子用户群。为了使信息能够有目的的进行推送,还需要对子用户群进行分类,将信息推送给与其类别相同的子用户群。这样就避免了相关技术中按照固定模式进行信息推送所导致的盲目推送,使推送的信息不符合用户的使用习惯的问题,本发明能够将合适的信息推送给真正需要的用户,提高推送效率和准确率。
在上述技术方案中,优选的,所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录;所述根据所述通信记录数据生成基于用户群的关系数据的步骤包括:根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
为了便于后续的用户群分析,需对采集的通信记录数据进行分析,通信记录中包括联系者与被联系者,分析用户之间的关系,两个用户节点之间的边为关系边,该关系边是通信关系网络的边,因此基于通信记录数据能够形成基于大用户群的关系数据,根据用户之间的通信频率以及通信内容,还可以确定每一关系边的关系类型,形成具有多种关系类型的用户群,以及用户群中每一个用户的通信情况。
在上述任一技术方案中,优选的,所述对所述基于用户群的关系数据进行过滤的步骤包括:计算所述多叉树数据结构中的每一关系边的介数值;在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点;以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量;汇总所有边关系向量得到所述基于子用户群的目标关系数据。
介数值代表了每一用户与其他用户之间的亲密度,如果用户A经过多个用户之后才能联系上用户B,那么用户A与用户B之间的介数值较高,说明亲密度较低,用户A与用户B之间的关系较弱,因此可以删除用户群中关系较弱的关系边。因此用户群就被分裂成多个子用户群,对于每个子用户群,确定该子用户群的中心节点,中心节点即最活跃的用户。可以根据用户的使用情况来确定最活跃的用户。以该中心节点为基准,进行聚类分析,形成基于子用户群的关系数据。
在上述技术方案中,优选的,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。
在上述任一技术方案中,优选的,还可以包括:接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
在形成多个子用户群之后,还需对这多个子用户群进行分类,以便信息能够进行有目的的推送。在分类时,需提取每个子用户群的特征数据,根据子用户群的特征数据来对子用户群进行归类,这样就可以进行信息推送给与其属于同一类别的一个或多个子用户群。将信息推送给用户群之后,还能够接收用户群的反馈使用数据,根据多因素正交化方式对使用数据进行处理,得到正交矩阵,符合实际应用场景。
附图说明
图1示出了根据本发明的实施例的信息推送系统的框图;
图2示出了根据本发明的实施例的信息推送方法的流程图;
图3示出了根据本发明的实施例的所采集的数据类型示意图;
图4示出了根据本发明的实施例的数据采集的流程图;
图5示出了根据本发明的实施例的关系数据构建的流程图;
图6示出了根据本发明的实施例的关系数据过滤的流程图;
图7示出了根据本发明的实施例的用户群划分和信息推送的流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的信息推送系统的框图。
如图1所示,根据本发明的实施例的信息推送系统100可以包括:数据采集单元102,用于采集用户的通信记录数据;关系数据生成单元104,连接至所述数据采集单元102,用于根据所述通信记录数据生成基于用户群的关系数据;过滤单元106,连接至所述关系数据生成单元104,用于对所述基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;分类单元108,连接至所述过滤单元106,用于提取每一子用户群的目标关系数据的特征数据,根据所述特征数据对所有子用户群进行分类;推送单元110,连接至所述分类单元108,用于将指定类别的信息推送至对应于所述指定类别的子用户群。
采集用户的通信记录数据,该通信记录数据包括但不限于用户的呼叫记录、短信记录、彩信记录。根据通信记录数据可以形成基于通信关系网络的用户群,由于数据较多,因此删除关系较弱的关系数据,将用户群进行分离,形成子用户群。为了使信息能够有目的的进行推送,还需要对子用户群进行分类,将信息推送给与其类别相同的子用户群。这样就避免了相关技术中按照固定模式进行信息推送所导致的盲目推送,使推送的信息不符合用户的使用习惯的问题,本发明能够将合适的信息推送给真正需要的用户,提高推送效率和准确率。
在上述技术方案中,优选的,所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录;所述关系数据生成单元104包括:关系边确定单元1042,根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;权重值计算单元1044,根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;关系类型确定单元1046,将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;用户状态确定单元1048,根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;目标关系数据生成单元,根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
为了便于后续的用户群分析,需对采集的通信记录数据进行分析,通信记录中包括联系者与被联系者,分析用户之间的关系,两个用户节点之间的边为关系边,该关系边是通信关系网络的边,因此基于通信记录数据能够形成基于大用户群的关系数据,根据用户之间的通信频率以及通信内容,还可以确定每一关系边的关系类型,形成具有多种关系类型的用户群,以及用户群中每一个用户的通信情况。
在上述技术方案中,优选的,所述过滤单元106包括:介数值计算单元1062,计算所述多叉树数据结构中的每一关系边的介数值;子用户群形成单元1064,在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;群中心节点确定单元1066,将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点,以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量,汇总所有边关系向量得到所述基于子用户群的目标关系数据。
介数值代表了每一用户与其他用户之间的亲密度,如果用户A经过多个用户之后才能联系上用户B,那么用户A与用户B之间的介数值较高,说明亲密度较低,用户A与用户B之间的关系较弱,因此可以删除用户群中关系较弱的关系边。因此用户群就被分裂成多个子用户群,对于每个子用户群,确定该子用户群的中心节点,中心节点即最活跃的用户。可以根据用户的使用情况来确定最活跃的用户。以该中心节点为基准,进行聚类分析,形成基于子用户群的关系数据。
在上述技术方案中,优选的,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;所述分类单元108根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。
在形成多个子用户群之后,还需对这多个子用户群进行分类,以便信息能够进行有目的的推送。在分类时,需提取每个子用户群的特征数据,根据子用户群的特征数据来对子用户群进行归类,这样就可以进行信息推送给与其属于同一类别的一个或多个子用户群。
在上述任一技术方案中,优选的,还可以包括:多因素正交化处理单元112,用于接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
将信息推送给用户群之后,还能够接收用户群的反馈使用数据,根据多因素正交化方式对使用数据进行处理,得到正交矩阵,符合实际应用场景。
图2示出了根据本发明的实施例的信息推送方法的流程图。
如图2所示,根据本发明的实施例的信息推送方法可以包括以下步骤:步骤202,采集用户的通信记录数据,根据通信记录数据生成基于用户群的关系数据;步骤204,对基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;步骤206,提取每一子用户群的目标关系数据的特征数据,根据特征数据对所有子用户群进行分类;步骤208,将指定类别的信息推送至对应于指定类别的子用户群。
采集用户的通信记录数据,该通信记录数据包括但不限于用户的呼叫记录、短信记录、彩信记录。根据通信记录数据可以形成基于通信关系网络的用户群,由于数据较多,因此删除关系较弱的关系数据,将用户群进行分离,形成子用户群。为了使信息能够有目的的进行推送,还需要对子用户群进行分类,将信息推送给与其类别相同的子用户群。
这样就避免了相关技术中按照固定模式进行信息推送所导致的盲目推送,使推送的信息不符合用户的使用习惯的问题,本发明能够将合适的信息推送给真正需要的用户,提高推送效率和准确率。
在上述技术方案中,优选的,所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录。
所述根据所述通信记录数据生成基于用户群的关系数据的步骤包括:根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
为了便于后续的用户群分析,需对采集的通信记录数据进行分析,通信记录中包括联系者与被联系者,分析用户之间的关系,两个用户节点之间的边为关系边,该关系边是通信关系网络的边,因此基于通信记录数据能够形成基于大用户群的关系数据,根据用户之间的通信频率以及通信内容,还可以确定每一关系边的关系类型,形成具有多种关系类型的用户群,以及用户群中每一个用户的通信情况。
在上述任一技术方案中,优选的,所述对所述基于用户群的关系数据进行过滤的步骤包括:计算所述多叉树数据结构中的每一关系边的介数值;在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点;以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量;汇总所有边关系向量得到所述基于子用户群的目标关系数据。
介数值代表了每一用户与其他用户之间的亲密度,如果用户A经过多个用户之后才能联系上用户B,那么用户A与用户B之间的介数值较高,说明亲密度较低,用户A与用户B之间的关系较弱,因此可以删除用户群中关系较弱的关系边。因此用户群就被分裂成多个子用户群,对于每个子用户群,确定该子用户群的中心节点,中心节点即最活跃的用户。可以根据用户的使用情况来确定最活跃的用户。以该中心节点为基准,进行聚类分析,形成基于子用户群的关系数据。
在上述技术方案中,优选的,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。
在上述任一技术方案中,优选的,还可以包括:接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
在形成多个子用户群之后,还需对这多个子用户群进行分类,以便信息能够进行有目的的推送。在分类时,需提取每个子用户群的特征数据,根据子用户群的特征数据来对子用户群进行归类,这样就可以进行信息推送给与其属于同一类别的一个或多个子用户群。将信息推送给用户群之后,还能够接收用户群的反馈使用数据,根据多因素正交化方式对使用数据进行处理,得到正交矩阵,符合实际应用场景。
如图3所示,为本实施例中所采集的数据类型,获取电信核心网络域的呼叫记录信息、短信记录、彩信记录、话费缴纳记录等。基于用户呼叫记录中的通话被叫方、主叫方、通话时长等数据建立用户的关系网络,并以呼叫次数的均值为关系的权重的构成因素之一;根据短信记录中的收件人、发件人等数据作为计算用户关系网络的边的权重因素之二;根据彩信记录中的收件人、发件人、信息内容大小等数据作为计算用户关系网络的边的权重因素之三;根据边的权重计算结果设定边的关系类型,主要包括亲情关系、友情关系等;根据话费缴纳记录计算个人用户的活跃度和贡献度。
根据上面采集的数据将用户关系数据构造成图的表示方式,将所有的用户关系连接在一起,构造完整的图型数据结构。进一步地,将如上所述中用户关系网络数据以边的权重计算每个用户的度中心性和紧密度中心性,根据权重值去除数值较小的边。根据上述数据,将欧式距离差值较小、且结点度中心性值差值较小的节点提取到一起。进一步地,将如上所述的用户关系数据组成向量,包括用户移动手机号码、活跃度、贡献度、度中心性值、紧密度中心性值、边集合、权重集合等数据,并利用neighbourhood(相邻)方式对部分数据进行聚类分析。根据聚合后的结果对用户群体进行拆分,形成子用户群。
对子用户群进行欧式距离计算和活跃度、贡献度、边权重之和计算等,得出子用户群的特征数据。根据子用户群的特征数据进行K均值聚类分析,对这些关系群体进行分类。将信息推送给相应的子用户群,并将反馈结果进行统计归纳,利用多因素正交化原理计算得到正交矩阵,同理得出产品的各个剖面的信息。
下面结合图4至图7针对图2中的各步骤进行详细说明。
图4示出了根据本发明的实施例的数据采集的流程图。
如图4所示,步骤402,以呼叫次数的均值为关系权重,基于用户呼叫记录中的通话被叫方、主叫方、通话时长等数据建立用户的通话关系网络。
步骤404,以短信通信条数的均值为关系权重,基于短信记录中的收件人、发件人等数据作为计算用户短信通信关系网络的边。
步骤406,以彩信通信条数的均值为关系权重,基于彩信记录中的收件人、发件人、内容大小等数据作为计算用户彩信通信关系网络的边。
图5示出了根据本发明的实施例的关系数据构建的流程图。
如图5所示,根据采集模块获取的数据的边的权重构建关系数据具体包括:
步骤502,计算呼叫用户、短信用户、彩信用户在全网用户的所占比重值,并设定各种关系边的乘数因子。
步骤504,根据用户间呼叫频数、短信联系频数、彩信联系频数与如上述的乘数因子做乘积,将该计算结果作为两个用户结点之间的边的权重。
步骤506,根据亲情关系、友情关系权重标准值来标识出用户间的关系类型,并对用户的所有关系细分为保持关系、单向关系、相互关系等。
步骤508,以话费缴纳记录中的缴费金额、缴费时间之商计算单位时间内用户贡献度,并对计算时间段内,统一求和作为该用户的贡献值。
步骤510,以缴费时间的频率作为用户活跃值。
步骤512,根据上述数据在内存中构建多叉树数据结构,并以缓存和数据库两种方式存储。
图6示出了根据本发明的实施例的关系数据过滤的流程图。
如图6所示,根据构建后的数据进行弱联系过滤,对异常结点进行删除的步骤具体包括:
步骤602,计算各个边的介数值,并根据Girvan-Newman理论,删除高介数值的边。
步骤604,根据边分裂后的群体数据,分别计算各个群体中紧密度中心性值最高的结点,以此结点为群体中心点,以此结点将其他结点和其之间的边权重值构成该群体中心点的关系向量,再汇总所有向量数据生成该系统的关系群体中心点记录集。
步骤606,根据neighbourhood方式对该数据进行聚类分析。
图7示出了根据本发明的实施例的用户群划分和信息推送的流程图
如图7所示,根据如上所述整理分类后的数据,进一步地对这些群体进行特征描述,再对关系群体向量进行聚类,得到该系统内的关系群体分类的步骤具体包括:
步骤702,根据如上所述分类数据进行逐条统计,记录所有节点。
步骤704,计算如上数据中每个群体的特征数据,包括欧式距离、贡献度之和、活跃度之和以及边权重之和等。
步骤706,将如上数据中的每个值按照K均值方式进行聚类分析,得到关系群体分类数据。
步骤706,根据实际场景选择各个群体中的中心节点用户或其他特征用户,将信息(软件信息、产品信息等)推送给对应的子用户群,采集自用户群反馈的使用数据,通过多因素正交化方法对该使用数据进行计算,得到正交矩阵,所得到的计算结果接近真实场景。
以上结合附图详细说明了根据本发明的技术方案,本发明能够根据用户的通信记录数据分析用户之间的关系,形成用户群,并根据关系边的特征生成多个子用户群,对每个子用户群进行聚类分析,提取子用户群的特征数据,根据特征数据对子用户群进行分类,使信息能够有目的的进行推送,提高了推送效率和推送准确率,也减少了资源的浪费。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种信息推送系统,其特征在于,包括:
数据采集单元,用于采集用户的通信记录数据;
关系数据生成单元,连接至所述数据采集单元,用于根据所述通信记录数据生成基于用户群的关系数据;
过滤单元,连接至所述关系数据生成单元,用于对所述基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;
分类单元,连接至所述过滤单元,用于提取每一子用户群的目标关系数据的特征数据,根据所述特征数据对所有子用户群进行分类;
推送单元,连接至所述分类单元,用于将指定类别的信息推送至对应于所述指定类别的子用户群;
所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录;
所述关系数据生成单元包括:
关系边确定单元,根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;
权重值计算单元,根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;
关系类型确定单元,将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;
用户状态确定单元,根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;
目标关系数据生成单元,根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
2.根据权利要求1所述的信息推送系统,其特征在于,所述过滤单元包括:
介数值计算单元,计算所述多叉树数据结构中的每一关系边的介数值;
子用户群形成单元,在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;
群中心节点确定单元,将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点,以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量,汇总所有边关系向量得到所述基于子用户群的目标关系数据。
3.根据权利要求2所述的信息推送系统,其特征在于,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;
所述分类单元根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。
4.根据权利要求1至3中任一项所述的信息推送系统,其特征在于,还包括:
多因素正交化处理单元,用于接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
5.一种信息推送方法,其特征在于,包括:
采集用户的通信记录数据;
根据所述通信记录数据生成基于用户群的关系数据;
对所述基于用户群的关系数据进行过滤处理,生成基于子用户群的目标关系数据;
提取每一子用户群的目标关系数据的特征数据,根据所述特征数据对所有子用户群进行分类;
将指定类别的信息推送至对应于所述指定类别的子用户群;
所述通信记录数据包括:呼叫记录、短信记录、彩信记录和/或话费缴纳记录;
所述根据所述通信记录数据生成基于用户群的关系数据的步骤包括:
根据每一用户的呼叫记录内容、短信记录内容和/或彩信记录内容确定通信关系网络中的每一关系边,并设置每一关系边的乘数因子,所述关系边是两个用户节点之间的边;
根据所述关系边的呼叫频数、短信频数和/或彩信频数和所述乘数因子,计算出所述关系边的权重值;
将所述权重值与标准权重值进行匹配,确定每一关系边的关系类型;
根据用户的话费缴纳记录确定每一用户的活跃值、贡献值;
根据每一关系边的权重值和关系类型构建多叉树数据结构,以生成所述基于用户群的关系数据。
6.根据权利要求5所述的信息推送方法,其特征在于,所述对所述基于用户群的关系数据进行过滤的步骤包括:
计算所述多叉树数据结构中的每一关系边的介数值;
在所述多叉树数据结构中删除对应于介数值大于预设值的关系边,形成多个子用户群;
将每一子用户群中活跃值最高的用户节点作为所述子用户群的群中心节点;
以所述群中心节点为基准,获取与所述群中心节点相关联的边关系向量;
汇总所有边关系向量得到所述基于子用户群的目标关系数据。
7.根据权利要求6所述的信息推送方法,其特征在于,每一子用户群的所述特征数据包括欧式距离、子用户群中各用户的贡献度之和、活跃值之和和关系边的权重值之和;
根据所述特征数据对所有子用户群进行聚类计算,得到多类子用户群。
8.根据权利要求5至7中任一项所述的信息推送方法,其特征在于,还包括:
接收所述指定类别的子用户群反馈的使用数据,采用多因素正交化方式对所述使用数据进行处理,得到所述指定类别的信息的使用状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310646421.7A CN103605791B (zh) | 2013-12-04 | 2013-12-04 | 信息推送系统和信息推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310646421.7A CN103605791B (zh) | 2013-12-04 | 2013-12-04 | 信息推送系统和信息推送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103605791A CN103605791A (zh) | 2014-02-26 |
CN103605791B true CN103605791B (zh) | 2017-08-25 |
Family
ID=50124013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310646421.7A Active CN103605791B (zh) | 2013-12-04 | 2013-12-04 | 信息推送系统和信息推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605791B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105281925B (zh) * | 2014-06-30 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 网络业务用户群组划分的方法和装置 |
CN104573034B (zh) * | 2015-01-15 | 2018-03-23 | 中国联合网络通信集团有限公司 | 基于cdr话单的用户群体划分方法和系统 |
CN105872268B (zh) * | 2015-01-23 | 2018-12-04 | 中国移动通信集团四川有限公司 | 一种呼叫中心用户来电目的预测方法及装置 |
CN104820709B (zh) * | 2015-05-18 | 2018-12-11 | 中国联合网络通信集团有限公司 | 一种移动用户数据处理、推送方法及相应的系统 |
CN105049334A (zh) * | 2015-08-04 | 2015-11-11 | 新浪网技术(中国)有限公司 | 电子邮件过滤方法及装置 |
CN107168808A (zh) * | 2017-03-30 | 2017-09-15 | 太仓鸿策腾达网络科技有限公司 | 一种通讯进程智能推送系统 |
CN109936525B (zh) | 2017-12-15 | 2020-07-31 | 阿里巴巴集团控股有限公司 | 一种基于图结构模型的异常账号防控方法、装置以及设备 |
CN108053261B (zh) * | 2017-12-27 | 2021-05-14 | 网智天元科技集团股份有限公司 | 营销信息处理方法与系统 |
CN108154425B (zh) * | 2018-01-19 | 2021-03-26 | 广州天源信息科技股份有限公司 | 一种结合社会网络和位置的线下商户推荐方法 |
CN109246220B (zh) * | 2018-09-19 | 2021-08-17 | 南方科技大学 | 一种消息推送系统及方法 |
CN109756563B (zh) * | 2018-12-17 | 2022-09-30 | 平安科技(深圳)有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN110135912B (zh) * | 2019-05-17 | 2022-05-13 | 北京百度网讯科技有限公司 | 一种信息推送方法、装置、服务器和存储介质 |
CN110675196A (zh) * | 2019-09-27 | 2020-01-10 | 中国工商银行股份有限公司 | 用户识别方法、装置、电子设备和存储介质 |
CN111339468B (zh) * | 2020-02-28 | 2023-08-04 | 北京嘀嘀无限科技发展有限公司 | 信息推送方法、装置、电子设备和存储介质 |
CN112312336A (zh) * | 2020-11-02 | 2021-02-02 | 安徽泡泡云信息技术服务有限公司 | 一种基于5g网络的短信推送用户系统 |
CN112699108A (zh) * | 2020-12-25 | 2021-04-23 | 中科恒运股份有限公司 | 婚姻登记系统数据重构方法、装置及终端设备 |
CN113706251B (zh) * | 2021-08-30 | 2024-04-26 | 平安国际智慧城市科技股份有限公司 | 基于模型的商品推荐方法、装置、计算机设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258020A (zh) * | 2013-05-02 | 2013-08-21 | 华南师范大学 | 一种结合sns和搜索引擎技术的推荐系统与方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8620996B2 (en) * | 2007-11-19 | 2013-12-31 | Motorola Mobility Llc | Method and apparatus for determining a group preference in a social network |
CN101217515A (zh) * | 2008-01-03 | 2008-07-09 | 腾讯科技(深圳)有限公司 | 基于问题分类推送问题的系统及方法 |
CN101685458B (zh) * | 2008-09-27 | 2012-09-19 | 华为技术有限公司 | 一种基于协同过滤的推荐方法和系统 |
CN102541886B (zh) * | 2010-12-20 | 2015-04-01 | 郝敬涛 | 一种识别用户群和用户之间关系的系统和方法 |
CN103049496B (zh) * | 2012-12-07 | 2016-08-17 | 北京百度网讯科技有限公司 | 一种对多个用户进行用户群划分的方法、装置与设备 |
-
2013
- 2013-12-04 CN CN201310646421.7A patent/CN103605791B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258020A (zh) * | 2013-05-02 | 2013-08-21 | 华南师范大学 | 一种结合sns和搜索引擎技术的推荐系统与方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103605791A (zh) | 2014-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605791B (zh) | 信息推送系统和信息推送方法 | |
CN102083010B (zh) | 一种用户信息筛选方法和设备 | |
CN109640312B (zh) | “黑卡”识别方法、电子设备及计算机可读取存储介质 | |
CN109978608A (zh) | 目标用户画像的营销标签分析提取方法及系统 | |
US20130268595A1 (en) | Detecting communities in telecommunication networks | |
CN113961712B (zh) | 一种基于知识图谱的诈骗电话分析方法 | |
CN105281925B (zh) | 网络业务用户群组划分的方法和装置 | |
CN108462785B (zh) | 一种恶意呼叫电话的处理方法及装置 | |
CN101686444B (zh) | 垃圾短信发送号码实时检测系统及方法 | |
CN107330050A (zh) | 一种个性化推荐方法及系统 | |
CN106778876A (zh) | 基于移动用户轨迹相似性的用户分类方法和系统 | |
CN106228371A (zh) | 一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法 | |
CN105869035A (zh) | 一种移动用户信用评估方法及装置 | |
CN103902636B (zh) | 基于过滤聚类法推送信息的方法和服务器 | |
CN109711746A (zh) | 一种基于复杂网络的信用评估方法和系统 | |
CN108985954B (zh) | 一种建立各标识的关联关系的方法以及相关设备 | |
CN102215504A (zh) | 新入网用户的类别识别方法及系统 | |
CN104217088B (zh) | 运营商移动业务资源的优化方法与系统 | |
CN107527240A (zh) | 一种运营商行业产品口碑营销效果鉴定系统及方法 | |
US20130211873A1 (en) | Determining a churn risk | |
CN113641827A (zh) | 一种基于知识图谱的网络诈骗识别方法及系统 | |
CN110677269B (zh) | 通信用户关系的确定方法、装置和计算机可读存储介质 | |
CN112559899A (zh) | 一种用户画像生成方法 | |
CN114780612B (zh) | 一种基于主题事件的时间关联挖掘目标人员的系统及方法 | |
CN105808568B (zh) | 一种上下文分布式推理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |