CN110784862A - 一种基于用户通联数据的移动用户影响力评估方法和系统 - Google Patents

一种基于用户通联数据的移动用户影响力评估方法和系统 Download PDF

Info

Publication number
CN110784862A
CN110784862A CN201911018089.3A CN201911018089A CN110784862A CN 110784862 A CN110784862 A CN 110784862A CN 201911018089 A CN201911018089 A CN 201911018089A CN 110784862 A CN110784862 A CN 110784862A
Authority
CN
China
Prior art keywords
mobile user
user
mobile
influence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911018089.3A
Other languages
English (en)
Inventor
王佩
李超
付戈
丁煜
于淼
项文秀
姚军亮
李娟�
史成洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Original Assignee
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS, National Computer Network and Information Security Management Center filed Critical Institute of Information Engineering of CAS
Priority to CN201911018089.3A priority Critical patent/CN110784862A/zh
Publication of CN110784862A publication Critical patent/CN110784862A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于用户通联数据的移动用户影响力评估方法和系统。该方法包括:移动用户通联数据采集,即从移动网络中采集用户的通话数据,短信数据以及用户的基础信息;移动用户数据处理,即从移动用户通联数据中中提取用户的主被叫关系、通话时长、交互关系以及用户的资费;移动用户标记,即根据给定的移动用户类型信息进行匹配用户对用户进行标记;移动用户影响力评估,即根据移动用户的通联信息以及用户属性等信息对移动用户影响力计算。本发明利用从移动通讯网络上获取的移动用户通联数据以及移动用户属性信息,利用排序算法对移动用户的影响力进行评估,能够有效的解决移动用户的影响力评估问题。

Description

一种基于用户通联数据的移动用户影响力评估方法和系统
技术领域
本发明属于信息技术领域,涉及移动用户影响力评估技术,尤其涉及一种基于用户通联数据的移动用户影响力评估方法和系统。
背景技术
随着移动通讯技术的飞速发展,以及移动用户的迅速增长,加速了移动网络的大数据时代的来临。近年来,移动社会网络的研究一直是研究人员重视的方向,移动社会网络的研究涉及到计算机科学,社会心理学,社会学等诸多领域。同时,移动用户在移动社会网络中的重要性也被工业界和学术界所重视。因此,移动用户影响力评估一直是移动社会网络研究的热点。
现有的用户影响力评估,主要是针对社交网络进行研究,很少将关注点聚焦在移动网络中,然而随着近年来移动网络的飞速发展,大部分的社交媒体软件都支持移动端登录,并且移动用户的数量也在逐年增加。因此,针对移动网络用户的影响力评估显得尤为重要,移动网络用户影响力评估不仅能够帮助移动网络公司对具体用户进行评级,为不同用户推荐更加适合的服务,同时也可以针对影响力用户进行监控防止微博谣言的传播。所以针对移动网络用户影响力评估方法的研究更应该受到广大研究人员的重视。然而,面对如此巨大的移动用户群体,以及交互的多样性,很多社交网络的用户影响力评估方法并不能够很好的评价用户影响力,如何有效的利用移动网络用户的通联数据及用户属性来评价用户的影响力是移动网络用户影响力亟待解决的问题。
发明内容
本发明针对现有的移动用户影响力评估问题的不足,重点考虑如何利用用户通联数据作为目标来进行研究,提供一种基于用户通联数据的移动用户影响力评估方法和系统,利用从移动通讯网络上获取的移动用户通联数据以及移动用户属性信息,利用排序算法对移动用户的影响力进行评估,能够有效的解决移动用户的影响力评估问题。
为实现上述发明目的,本发明提供一种基于用户通联数据的移动用户影响力评估方法,包括以下步骤:
采集移动用户的通联数据;
根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量;
根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力。
进一步地,采集移动用户的通联数据的步骤包括:
获取移动用户的短信数据;
获取移动用户在T时间段内的所有通话数据;
获取移动用户的个人属性信息。
进一步地,所述根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量,包括:
根据移动用户的短信数据形成移动用户的短信收发关系图;
根据移动用户的通话数据中的主被叫关系及通话时长,构建移动用户通话关系图;
根据权重将短信收发关系图与移动用户通话关系图合并成移动用户通联关系图;
根据移动用户个人属性生成移动用户属性向量。
进一步地,所述移动用户个人属性包括:姓名、身份证号、性别、住址、入网日期等信息。
进一步地,所述根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力,包括:
根据移动用户属性向量与选定的移动用户类型的匹配关系,对移动用户进行标记;
根据对移动用户的标记结果设置移动用户的初始影响力,然后使用PageRank启发式的排序方法对移动用户通联关系图中的用户计算移动用户影响力。
进一步地,所述对移动用户进行标记的步骤为:
根据移动用户属性向量与选定的移动用户类型的匹配关系,对用户进行标记。如果用户属性向量A与移动用户类型l相匹配,则将用户属性向量A对应的用户的标记值设为1,否则为0。
进一步地,所述根据对移动用户的标记结果设置移动用户的初始影响力,包括:将标记值为1的移动用户初始影响力设置为1,将标记值为0的初始用户影响力设置为0。
基于同一发明构思,本发明还提供一种基于用户通联数据的移动用户影响力评估系统,其包括:
数据采集模块,负责采集移动用户的通联数据;
数据处理模块,负责根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量;
影响力评估模块,负责根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力。
进一步地,所述影响力评估模块包括:
标记子模块,负责根据移动用户属性向量与选定的移动用户类型的匹配关系,对移动用户进行标记;
影响力评估子模块,负责根据对移动用户的标记结果设置移动用户的初始影响力,然后使用PageRank启发式的排序方法对移动用户通联关系图中的用户计算移动用户影响力。
本发明的有益效果如下:
1、本发明提出一种基于用户通联数据的移动用户影响力评估方法,该技术主要考虑移动通讯网络中用户的通联关系及用户属性来对传统的用户影响力评估问题进行改进,并取得了良好的影响力评估效果。
2、本发明能够有效的针对大规模移动通讯网络进行用户影响力评估,具有较高的传播效果,可以用于运营商对用户的星级评价。
附图说明
图1是本发明实施例中的移动用户影响力评估方法的总体流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
图1是本实施例提供的移动用户影响力评估方法的总体流程图,包括移动用户通联数据采集、移动用户数据处理、移动用户标记、移动用户影响力评估。该方法详述如下:
在步骤101,移动用户数据采集是指从移动网络中获取用户的短信数据、通话数据以及用户属性信息。
在步骤102中,移动用户数据处理是指从移动网络中提取用户的短信关系、通话关系、以及用户的属性信息。
根据所提取的短信数据建立短信收发关系图G<U,E,W>,其中U表示移动用户集合,E表示边的集合,W表示边的权重;该权重W的值根据短信收发的频次设置,短信收发的频次越高,权重W的值越大。
根据用户的属性生成用户属性向量A={a1,a2,…an},其中a1~an表示用户姓名、身份证、性别、地址等用户属性。
根据用户的通话关系建立移动用户通话关系图G’<U,E’,W’>,其中U表示移动用户集合,E’表示边的集合,W’表示边的权重。该权重W’的值根据通话频次设置,通话频次越高,权重W’的值越大。
将短信收发关系图与移动用户通话关系图合并成移动用户通联关系图G”<U,E”,W”>,其中U表示移动用户集合,E”=E+E’表示边的集合,W”=x*W+y*W’表示边的权重。其中,x、y表示拟合系数。
在步骤103中移动用户标记是指根据给定的移动网络用户属性,对用户进行标记。
为了能够标记所需的移动网络用户,需要对选定的移动用户类型进行设置,选定用户类型向量l={l1,l2,…lm}。其中l1、l2…lm表示用户属性向量A中的属性a1~an中的m个属性,m≤n。通过使用下面公式进行用户类型匹配:
Figure BDA0002246344270000041
其中,sim(A,l)等于1表示用户属性向量A与移动用户类型l相匹配。对于sim(A,l)等于1的移动用户ui设置初始影响力ComRank(ui)=1,其他移动用户的初始影响力ComRank(ui)=0。
在步骤104中,移动用户影响力评估,是指根据用户的通联关系以及用户属性等信息计算用户的影响力积分。
在传统的PageRank算法的基础上,本发明针对现有的移动网络提出一种对PageRank算法的部分改进方法,提出基于用户行为偏好的排序方法,称为ComRank算法。
Figure BDA0002246344270000042
其中,ComRank(u)表示移动用户u的影响力,W”(v,u)表示用户v对用户u的行为权重,即移动用户通联关系图中连接用户v和用户u的边的权重。因此用户v对用户u的行为偏好等于用户v对用户u的行为权重比上用户v对所有用户的行为权重和即
Figure BDA0002246344270000043
β表示影响力衰减积分通常等于0.15,N(u)表示用户u的邻居节点集合,N(v)表示用户v的邻居节点集合。
基于同一发明构思,本发明另一个实施例提供一种基于用户通联数据的移动用户影响力评估系统,其包括:
数据采集模块,负责采集移动用户的通联数据;
数据处理模块,负责根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量;
影响力评估模块,负责根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力。
所述影响力评估模块包括:
标记子模块,负责根据移动用户属性向量与选定的移动用户类型的匹配关系,对移动用户进行标记;
影响力评估子模块,负责根据对移动用户的标记结果设置移动用户的初始影响力,然后使用PageRank启发式的排序方法对移动用户通联关系图中的用户计算移动用户影响力。
基于同一发明构思,本发明的另一个实施例提供一种计算机/服务器,其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。
基于同一发明构思,本发明的另一个实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。
本发明未详细阐述的部分属于本领域技术人员的公知技术。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的原理和范围,本发明的保护范围应以权利要求书所述为准。

Claims (10)

1.一种基于用户通联数据的移动用户影响力评估方法,其特征在于,包括以下步骤:
采集移动用户的通联数据;
根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量;
根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力。
2.根据权利要求1所述的方法,其特征在于,所述采集移动用户的通联数据,包括:
获取移动用户的短信数据;
获取移动用户在某时间段内的所有通话数据;
获取移动用户的个人属性信息。
3.根据权利要求1所述的方法,其特征在于,所述根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量,包括:
根据移动用户的短信数据形成移动用户的短信收发关系图;
根据移动用户的通话数据中的主被叫关系及通话时长,构建移动用户通话关系图;
根据权重将短信收发关系图与移动用户通话关系图合并成移动用户通联关系图;
根据移动用户个人属性生成移动用户属性向量。
4.根据权利要求1所述的方法,其特征在于,所述移动用户个人属性包括:姓名、身份证号、性别、住址、入网日期。
5.根据权利要求1所述的方法,其特征在于,所述根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力,包括:
根据移动用户属性向量与选定的移动用户类型的匹配关系,对移动用户进行标记;
根据对移动用户的标记结果设置移动用户的初始影响力,然后使用PageRank启发式的排序方法对移动用户通联关系图中的用户计算移动用户影响力。
6.根据权利要求5所述的方法,其特征在于,所述对移动用户进行标记,包括:如果用户属性向量A与移动用户类型向量l相匹配,则将该用户属性向量A对应的用户的标记值设为1,否则为0。
7.根据权利要求6所述的方法,其特征在于,所述根据对移动用户的标记结果设置移动用户的初始影响力,包括:将标记值为1的移动用户的初始影响力设置为1,将标记值为0的用户的初始影响力设置为0。
8.根据权利要求1所述的方法,其特征在于,所述使用PageRank启发式的排序方法计算移动用户影响力,移动用户影响力的计算公式为:
其中,ComRank(u)表示移动用户u的影响力,W”(v,u)表示用户v对用户u的行为权重,
Figure FDA0002246344260000022
表示用户v对用户u的行为偏好,即等于用户v对用户u的行为权重比上用户v对所有用户的行为权重和;β表示影响力衰减积分,N(u)表示用户u的邻居节点集合,N(v)表示用户v的邻居节点集合。
9.一种基于用户通联数据的移动用户影响力评估系统,其特征在于,包括:
数据采集模块,负责采集移动用户的通联数据;
数据处理模块,负责根据采集的移动用户的通联数据,生成移动用户通联关系图和移动用户属性向量;
影响力评估模块,负责根据移动用户通联关系图和移动用户属性向量,使用PageRank启发式的排序方法计算移动用户影响力。
10.根据权利要求9所述的系统,其特征在于,所述影响力评估模块包括:
标记子模块,负责根据移动用户属性向量与选定的移动用户类型的匹配关系,对移动用户进行标记;
影响力评估子模块,负责根据对移动用户的标记结果设置移动用户的初始影响力,然后使用PageRank启发式的排序方法对移动用户通联关系图中的用户计算移动用户影响力。
CN201911018089.3A 2019-10-24 2019-10-24 一种基于用户通联数据的移动用户影响力评估方法和系统 Pending CN110784862A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911018089.3A CN110784862A (zh) 2019-10-24 2019-10-24 一种基于用户通联数据的移动用户影响力评估方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911018089.3A CN110784862A (zh) 2019-10-24 2019-10-24 一种基于用户通联数据的移动用户影响力评估方法和系统

Publications (1)

Publication Number Publication Date
CN110784862A true CN110784862A (zh) 2020-02-11

Family

ID=69387614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911018089.3A Pending CN110784862A (zh) 2019-10-24 2019-10-24 一种基于用户通联数据的移动用户影响力评估方法和系统

Country Status (1)

Country Link
CN (1) CN110784862A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591569A (zh) * 2024-01-16 2024-02-23 北京大也智慧数据科技服务有限公司 具有影响力的用户筛选方法、装置、存储介质及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130073988A1 (en) * 2010-06-02 2013-03-21 Layar B.V. Acquiring, ranking and displaying points of interest for use in an augmented reality service provisioning system and graphical user interface for displaying such ranked points of interest
CN105095419A (zh) * 2015-07-15 2015-11-25 哈尔滨工程大学 一种面向微博特定类型用户的信息影响力最大化方法
CN107895279A (zh) * 2017-10-23 2018-04-10 中国联合网络通信集团有限公司 基于用户话单的用户影响力确定方法及装置
CN107977386A (zh) * 2016-10-25 2018-05-01 航天信息股份有限公司 一种识别审计事件中的敏感用户的方法及装置
CN109741199A (zh) * 2018-12-29 2019-05-10 中国移动通信集团江苏有限公司 社交影响力确定方法、装置、设备及计算机存储介质
CN110020154A (zh) * 2017-12-04 2019-07-16 北京京东尚科信息技术有限公司 用于确定用户影响力的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130073988A1 (en) * 2010-06-02 2013-03-21 Layar B.V. Acquiring, ranking and displaying points of interest for use in an augmented reality service provisioning system and graphical user interface for displaying such ranked points of interest
CN105095419A (zh) * 2015-07-15 2015-11-25 哈尔滨工程大学 一种面向微博特定类型用户的信息影响力最大化方法
CN107977386A (zh) * 2016-10-25 2018-05-01 航天信息股份有限公司 一种识别审计事件中的敏感用户的方法及装置
CN107895279A (zh) * 2017-10-23 2018-04-10 中国联合网络通信集团有限公司 基于用户话单的用户影响力确定方法及装置
CN110020154A (zh) * 2017-12-04 2019-07-16 北京京东尚科信息技术有限公司 用于确定用户影响力的方法及装置
CN109741199A (zh) * 2018-12-29 2019-05-10 中国移动通信集团江苏有限公司 社交影响力确定方法、装置、设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁鹏: "面向移动数据的多维度社区发现和影响力分析", 《中国优秀博硕士学位论文全文数据库(硕士)信息科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591569A (zh) * 2024-01-16 2024-02-23 北京大也智慧数据科技服务有限公司 具有影响力的用户筛选方法、装置、存储介质及设备

Similar Documents

Publication Publication Date Title
CN106980692B (zh) 一种基于微博特定事件的影响力计算方法
CN104778173B (zh) 目标用户确定方法、装置及设备
CN103024017B (zh) 一种社交网络重要目标及社区群体识别方法
US9785888B2 (en) Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information
CN109062914A (zh) 用户推荐方法和装置,存储介质和服务器
WO2023273295A1 (zh) 基于聚类技术的企业esg指数确定方法及相关产品
CN114612743A (zh) 深度学习模型的训练方法、目标对象识别方法和装置
CN110224859A (zh) 用于识别团伙的方法和系统
Sun et al. Opinion spam detection based on heterogeneous information network
CN110784862A (zh) 一种基于用户通联数据的移动用户影响力评估方法和系统
Sitorus et al. Sensing trending topics in twitter for greater Jakarta area
CN110633410A (zh) 信息处理方法及装置、存储介质、电子装置
CN104484330B (zh) 基于分档关键词阈值组合评估的垃圾评论预选方法及装置
CN109858900A (zh) 一种支付信息推送方法、装置及终端设备
CN111464687A (zh) 一种陌生呼叫请求的处理方法及装置
CN109145633A (zh) 轨迹数据隐私保护方法、电子设备、存储介质及系统
CN115048563A (zh) 基于熵权法的跨社交网络用户身份匹配方法、介质及装置
CN115063858A (zh) 视频人脸表情识别模型训练方法、装置、设备及存储介质
CN109739848B (zh) 一种数据提取方法
CN111080463B (zh) 一种关键通讯节点识别方法、装置及介质
CN114625893A (zh) 一种媒体资源召回方法、装置、服务器及存储介质
Dai et al. An identification model of water army based on data analysis
CN112565797A (zh) 一种页面请求处理方法、装置、电子设备及介质
CN115271987B (zh) 一种基于手机数据的跨应用群体关系分析方法
KR102144122B1 (ko) 적합도 기반의 온라인 광고 효과 계산 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211

RJ01 Rejection of invention patent application after publication