CN110971770B - 基于话单数据分析的社会关系疏密度推定方法及系统 - Google Patents

基于话单数据分析的社会关系疏密度推定方法及系统 Download PDF

Info

Publication number
CN110971770B
CN110971770B CN201911184808.9A CN201911184808A CN110971770B CN 110971770 B CN110971770 B CN 110971770B CN 201911184808 A CN201911184808 A CN 201911184808A CN 110971770 B CN110971770 B CN 110971770B
Authority
CN
China
Prior art keywords
call
target user
user
contact
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911184808.9A
Other languages
English (en)
Other versions
CN110971770A (zh
Inventor
陈浩
伍孟轩
王涛
陈威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN HONGXU INFORMATION TECHNOLOGY CO LTD
Original Assignee
WUHAN HONGXU INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN HONGXU INFORMATION TECHNOLOGY CO LTD filed Critical WUHAN HONGXU INFORMATION TECHNOLOGY CO LTD
Priority to CN201911184808.9A priority Critical patent/CN110971770B/zh
Publication of CN110971770A publication Critical patent/CN110971770A/zh
Application granted granted Critical
Publication of CN110971770B publication Critical patent/CN110971770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/41Billing record details, i.e. parameters, identifiers, structure of call data record [CDR]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于话单数据分析的社会关系疏密度推定方法及系统,方法包括:获取目标用户的话单数据;根据目标用户的话单数据,确定表征目标用户与每一个联系用户之间社会关系疏密度的评价参数;基于评价参数,计算目标用户与每一个联系用户之间的社会关系权值,其中,权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。本发明通过对目标用户的话单数据进行分析,得到目标用户与每一个联系用户之间的社会关系的权值,根据社会关系权值合理快速的分析归类出目标人员的重要联系对象,可以对目标人员的分析起到很大的作用。

Description

基于话单数据分析的社会关系疏密度推定方法及系统
技术领域
本发明属于数据分析技术领域,尤其涉及一种基于话单数据分析的社会关系疏密度推定方法、系统及电子设备。
背景技术
当前社会,手机已经成为人们生活中不可或缺的一种通讯工具,而电话是通讯过程中最及时高效且最普遍的一种方式,人们在通过手机进行交流的时候,必然会产生通话话单数据。因此,如何通过话单数据来对目标用户的社会关系进行自动合理的分析,是话单分析工作中面临的重要问题。
然而,现阶段对于目标用户相关话单数据的监控和分析,缺乏科学合理的数据模型设计和快速自动的分析算法。过多的依赖人工操作使得分析人员疲于应对,这往往造成许多隐藏在话单数据中的有效线索不能被快速准确的挖掘出来。
发明内容
为克服上述现有问题或者至少部分地解决上述问题,本发明实施例提供一种基于话单数据分析的社会关系疏密度推定方法、系统及电子设备。
根据本发明实施例的第一方面,提供一种基于话单数据分析的社会关系疏密度推定方法,包括:
获取目标用户的话单数据;
根据所述目标用户的话单数据,确定表征所述目标用户与每一个联系用户之间社会关系疏密度的评价参数;
基于所述评价参数,计算所述目标用户与每一个联系用户之间的社会关系权值,其中,所述权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
在上述技术方案的基础上,本发明实施例还可以作出如下改进。
进一步的,所述评价参数包括所述目标用户与每一个联系用户的通话频率评价参数、通话时长评价参数、非正常时段通话评价参数和漫游通话评价参数。
进一步的,通过如下方式确定所述目标用户与每一个联系用户的通话频率评价参数:
根据所述目标用户在第一预设时间段内与所有联系用户的总通话次数与所述目标用户在所述第一预设时间段内与任一联系用户的通话次数,确定所述目标用户与所述任一联系用户的通话频率评价参数。
进一步的,通过如下方式确定所述目标用户与每一个联系用户的通话时长评价参数:
根据所述目标用户在第二预设时间段内与所有联系用户的总通话时长与所述目标用户在所述第二预设时间段内与任一联系用户的通话时长,确定所述目标用户与所述任一联系用户的通话时长评价参数。
进一步的,通过如下方式确定所述目标用户与每一个联系用户的非正常时段通话评价参数:
确定在第三预设时间段内的每一个非正常通话时间段;
根据在第三预设时间段内的所有非正常通话时间段,所述目标用户的总通话次数和所述目标用户与任一联系用户之间的通话次数,确定所述目标用户与所述任一联系用户的非正常时段通话评价参数。
进一步的,所述确定在第三预设时间段内的每一个非正常通话时间段包括:
将所述第三预设时间段划分为多个子时间段;
统计所述目标用户在每一个子时间段内的通话次数,并计算所述目标用户在每一个子时间段内的平均通话次数;
若所述目标用户在任一子时间段内的通话次数与所述目标用户在每一个子时间段内的平均通话次数的比值小于预设阈值,则所述任一子时间段为非正常通话时间段。
进一步的,通过如下方式确定所述目标用户与每一个联系用户的漫游通话评价参数:
根据在第四预设时间段内,所述目标用户与所有联系用户之间的漫游通话次数和所述目标用户与任一联系用户之间的漫游通话次数,确定所述目标用户与所述任一联系用户的漫游通话评价参数。
进一步的,通过如下方式计算所述目标用户与每一个联系用户之间的社会关系权值包括:
Figure BDA0002292145380000031
式中,V0表示目标用户,Vi表示联系用户,
Figure BDA0002292145380000032
表示目标用户与联系用户之间的社会关系权值,
Figure BDA0002292145380000033
表示目标用户与联系用户的通话频率评价参数,α为通话频率评价参数的调整因子,
Figure BDA0002292145380000034
表示目标用户与联系用户的通话时长评价参数,β为通话时长评价参数的调整因子,
Figure BDA0002292145380000035
表示目标用户与联系用户的非正常时段通话评价参数,γ为非正常时段通话评价参数的调整因子,
Figure BDA0002292145380000036
表示目标用户与联系用户的漫游通话评价参数,δ为漫游通话评价参数的调整因子。
根据本发明实施例的第二方面,提供一种基于话单数据分析的社会关系疏密度推定系统,包括:
获取模块,用于获取目标用户的话单数据;
确定模块,用于根据所述目标用户的话单数据,确定表征所述目标用户与每一个联系用户之间社会关系疏密度的评价参数;
计算模块,用于基于所述评价参数,计算所述目标用户与每一个联系用户之间的社会关系权值,其中,所述权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
根据本发明实施例的第三个方面,还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器调用所述程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的基于话单数据分析的社会关系疏密度推定方法。
根据本发明实施例的第四个方面,还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的基于话单数据分析的社会关系疏密度推定方法。
本发明实施例提供一种基于话单数据分析的社会关系疏密度推定方法、系统及电子设备,该方法通过对目标用户的话单数据进行分析,得到目标用户与每一个联系用户之间的社会关系的权值,根据社会关系权值合理快速的分析归类出目标人员的重要联系对象,可以对目标人员的分析起到很大的作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于话单数据分析的社会关系疏密度推定方法整体流程示意图;
图2为本发明实施例提供的基于话单数据分析的社会关系疏密度推定方法整体流程示意图;
图3为本发明实施例提供的基于话单数据分析的社会关系疏密度推定系统整体结构示意图;
图4为本发明实施例提供的电子设备整体结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在本发明实施例中,提供一种基于话单数据分析的社会关系疏密度推定方法,图1为本发明实施例提供的基于话单数据分析的社会关系疏密度推定方法整体流程示意图,该方法包括:
S1,获取目标用户的话单数据;
S2,根据所述目标用户的话单数据,确定表征所述目标用户与每一个联系用户之间社会关系疏密度的评价参数;
S3,基于所述评价参数,计算所述目标用户与每一个联系用户之间的社会关系权值,其中,所述权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
可以理解的是,在本发明实施例中,基于目标用户与每一个联系用户之间的通话数据,可以了解目标用户与每一个联系用户之间关系的亲疏度。具体为,获取目标用户的话单数据。其中,目标用户的话单数据包括目标用户与每一个联系用户之间的通话记录。
根据目标用户与其它的联系用户之间通话的话单数据,确定出表征目标用户与每一个联系用户之间社会关系疏密度的评价参数,基于评价参数,来计算表征目标用户与每一个联系用户之间的社会关系疏密度的权值。
本发明实施例能够根据目标用户与其它联系用户之间的话单数据,分析出目标用户与每一个联系用户之间关系的表征疏密度的社会关系权值,根据社会关系权值合理快速的分析归类出目标人员的重要联系对象,可以对目标人员的分析起到很大的作用。
在上述实施例的基础上,本发明实施例中,评价参数包括所述目标用户与每一个联系用户的通话频率评价参数、通话时长评价参数、非正常时段通话评价参数和漫游通话评价参数。
可以理解的是,对于分析的目标用户,目标人员的通话清单进行采集,如有明确的关联对象,可将关联对象的通话清单一并采集。
由于获取的话单数据通常来源于不同的基础电信企业,各基础电信企业提供的文件格式与数据结构无法保持一致,因此需要将多个话单的相关数据按照统一的数据结构组合在一起,提取计算社会关系权值所需的各种数据以便于参数的计算和算法的调用。涉及的到的转换字段有:机主号码,即目标用户,在本发明实施例中虚拟为节点V0;对方号码,每一个目标人员社会关系的分析对象,即目标用户通话的联系用户,即与V0产生通信的节点Vi;通话时间,取每个通话发生的所在的整点小时;通话时长,将每次通话的时间长度转换为秒数;通话地点,分为本地和所有漫游通话所在的外地城市的信息,均单独记录;通话类型,记为本地通话和漫游通话。
当对话单数据中提取的数据字段进行统一数据结构后,对目标用户的通话清单数据进行过滤,清除掉与分析目标明显无关联的干扰数据,如广告电话、骚扰电话等。在具体进行过滤的过程中,建立号码筛选数据库,其中,号码筛选数据库中记录有所有标记过的广告电话、垃圾电话等号码。从目标用户对应的对方号码中删除掉标记为广告电话或者垃圾电话等,得到与目标用户相关联的联系用户号码。
从过滤清洗后的话单数据中确定表征目标用户与每一个联系用户之间社会关系疏密度的评价参数,在本发明实施例中,评价参数包括目标用户与每一个联系用户的通话频率评价参数、通话时长评价参数、非正常时段通话评价参数和漫游通话评价参数。
在上述各实施例的基础上,本发明实施例中,通过如下方式确定目标用户与每一个联系用户的通话频率评价参数:
根据目标用户在第一预设时间段内与所有联系用户的总通话次数与目标用户在第一预设时间段内与任一联系用户的通话次数,确定目标用户与该任一联系用户的通话频率评价参数。
可以理解的是,通话频率评价参数用于确定目标用户与联系用户之间在一段时间内的通话次数占其所有通话次数的比例。假定获取话单数据的时间天数为n,设Ck(V0,Vi)表示在第k天时V0与Vi的通话次数,(k∈n),则可得V0与Vi平均每天的通话次数,如公式(1):
Figure BDA0002292145380000071
设Ck(V0)为第k天V0与所有联系用户的总通话次数,则平均每天V0的通话次数为公式(2)所示:
Figure BDA0002292145380000072
则V0与Vi的通话频率评价参数如公式(3)所示:
Figure BDA0002292145380000073
在上述各实施例的基础上,本发明实施例中,通过如下方式确定所述目标用户与每一个联系用户的通话时长评价参数:
根据所述目标用户在第二预设时间段内与所有联系用户的总通话时长与所述目标用户在所述第二预设时间段内与任一联系用户的通话时长,确定所述目标用户与所述任一联系用户的通话时长评价参数。
可以理解的是,设Tk(V0,Vi)为第k天目标用户V0与每一个联系用户Vi的通话时长,同样(k∈n),则通过公式(4)可得V0与Vi平均每天的通话时长T(V0,Vi):
Figure BDA0002292145380000074
设Tk(V0)为V0第k天与所有联系用户之间的通话总时长,则由公式(5)可得V0平均每天通话时长T(V0)为:
Figure BDA0002292145380000081
则通过公式(6)可得V0与Vi的通话时长评价参数:
Figure BDA0002292145380000082
在上述各实施例的基础上,本发明实施例中,通过如下方式确定目标用户与每一个联系用户的非正常时段通话评价参数:
确定在第三预设时间段内的每一个非正常通话时间段;
根据在第三预设时间段内的所有非正常通话时间段,目标用户的总通话次数和目标用户与任一联系用户之间的通话次数,确定目标用户与任一联系用户的非正常时段通话评价参数。
其中,确定在第三预设时间段内的每一个非正常通话时间段包括:
将所述第三预设时间段划分为多个子时间段;
统计所述目标用户在每一个子时间段内的通话次数,并计算所述目标用户在每一个子时间段内的平均通话次数;
若所述目标用户在任一子时间段内的通话次数与所述目标用户在每一个子时间段内的平均通话次数的比值小于预设阈值,则所述任一子时间段为非正常通话时间段。
可以理解的是,通常非正常通话时段的默认设定都是在半夜至清晨,但本发明实施例将其改进为以目标用户V0的实际通话情况为准,设S={S1,S2,S3,……,Sq}为对V0话单中统计出的所有的共q个非0次通话时间段(即在该时间段内目标用户V0的通话次数不为0)集合,每个时间段为整点1小时,可知q<=24。设Sk(V0)为获取的共计n天内的V0话单数据中,在第k个非0次通话时段内V0的通话次数,其中k∈q。则通过公式(7)可得V0平均每个非0次通话时段内的通话次数S(V0):
Figure BDA0002292145380000083
对于每个Sk(V0)来说,若满足Sk(V0)<=1/3*S(V0),则取该时段为非正常通话时段,k∈q,即将通话次数不超过三分之一均值的时段认为是非正常通话时段。由上述条件可以得到V0的所有非正常通话时段的集合FS={FS1,FS2,FS3,……,FSf},其中f为非正常通话时段个数,f<q。
设CFk(V0,Vi)为第k天内V0与Vi在非正常时段通话的次数,该值由第k天FS集合中各时段V0与Vi通话次数相加得到,进而可通过公式(8)求得V0与Vi平均每天的非正常时段通话次数:
Figure BDA0002292145380000091
设CFk(V0)为V0在第k天非正常时段内所有通话次数,再根据公式(9)可得出V0平均每天的非正常时段通话次数:
Figure BDA0002292145380000092
最终得到非正常时段通话评价参数,即V0与Vi在非正常时段内通话与V0在非正常时段内所有通话的比值,如公式(10):
Figure BDA0002292145380000093
在上述各实施例的基础上,本发明实施例中,通过如下方式确定所述目标用户与每一个联系用户的漫游通话评价参数:
根据在第四预设时间段内,目标用户与所有联系用户之间的漫游通话次数和所述目标用户与任一联系用户之间的漫游通话次数,确定所述目标用户与所述任一联系用户的漫游通话评价参数。
可以理解的是,设Y为V0所有发生漫游通话城市的集合,Y={Y1,Y2,Y3,……,Yj},其中j为所有发生漫游通话的外地城市个数,又设m为V0与Vi产生漫游通话的外地城市个数,可知m<j。设CYk(V0,Vi)表示V0与Vi在第k个外地城市产生的漫游通话次数,k<m,可通过公式(11)得出V0与Vi发生漫游通话的总次数。
Figure BDA0002292145380000094
假设CYk(V0)表示V0在第k个外地共计发生的漫游通话次数,k∈j,则V0在所有外地城市的漫游通话总次数如公式(12)所示:
Figure BDA0002292145380000101
由此可通过公式(13)得出V0与Vi漫游通话评价参数:
Figure BDA0002292145380000102
即V0与Vi间漫游通话所占V0通话的比值乘以平衡调整参数m/j(即V0与Vi发生漫游通话的城市个数比上V0所有漫游城市个数)。
在上述各实施例的基础上,本发明实施例中,通过如下方式计算所述目标用户与每一个联系用户之间的社会关系权值包括:
Figure BDA0002292145380000103
式中,V0表示目标用户,Vi表示联系用户,
Figure BDA0002292145380000104
表示目标用户与联系用户之间的社会关系权值,
Figure BDA0002292145380000105
表示目标用户与联系用户的通话频率评价参数,α为通话频率评价参数的调整因子,
Figure BDA0002292145380000106
表示目标用户与联系用户的通话时长评价参数,β为通话时长评价参数的调整因子,
Figure BDA0002292145380000107
表示目标用户与联系用户的非正常时段通话评价参数,γ为非正常时段通话评价参数的调整因子,
Figure BDA0002292145380000108
表示目标用户与联系用户的漫游通话评价参数,δ为漫游通话评价参数的调整因子。
可以理解的是,针对上述确定出来的四个评价参数,分别设定对应的调整因子,即α为通话频率评价参数的调整因子,β为通话时长评价参数的调整因子,γ为非正常时段通话评价参数的调整因子,δ为漫游通话评价参数的调整因子。
起初4个调整因子α、γ、β、δ的值默认为1,可以通过前馈神经网络中误差反馈的思想来对调整因子的取值做输入调整,调整因子取值范围设定在[0,2]之间,若某项调整因子取0即为忽略该项对应的评价参数对社会关系权值的影响,亦可增大或减小调整因子的取值来放大或削弱某项评价参数的影响。
确定了四个评价参数以及对应的调整因子,根据公式(14)即可计算出V0与Vi之间的社会关系权值W(V0,Vi)。
本发明实施例通过灵活的调整因子取值,得到目标用户与各个联系用户之间的社会关系权值,该权值表征目标用户与各个联系用户之间的疏密度,根据疏密度可以将目标用户与联系用户之间的社会关系分为重要关系、工作关系、私密关系和漫游关系,准确的筛选出各种社会关系下目标用户的优先联系对象。针对评价参数调整因子的取值进行进一步分析可以得出如下结论:
(1)通话频率评价参数调整因子α的取值越大,则越加重双方通话次数对社会关系权值的影响,反之则会削弱通话次数的影响,通过调整α的取值,可以过滤掉类似于广告或骚扰电话等无意义的通联对象。
(2)放大通话时长评价参数调整因子β的取值,可以更好的凸显出重要的联系人,现实的社会关系中,通话时间越长的人越重要。
(3)针对非正常时段评价参数调整因子γ,放大该参数可以分析出目标的私密关系网,可以较好的屏蔽掉工作关系人;反之,削弱γ的取值会更好的凸显出正常工作关系的联系人。
(4)漫游通话评价参数调整因子δ主要是筛选目标用户在异地的联系人,并且,该参数对于私密关系的影响也较大,通常漫游状态下会更平凡联系私密对象。
综上,本发明实施例的社会关系权值的计算方法的优势在于对各评价参数精准的数学设计,以及对于最终的社会关系权值输出公式中各参数调整因子的合理修正以满足各种社会关系人的准确筛选。
参见图2,示出了本发明实施例提供的基于话单数据分析的社会关系疏密度推定方法的整体流程图,首先采集目标用户的话单数据,对话单数据进行数据结构的统一转换和清洗,得到转换和清洗后的话单数据。从话单数据中确定出评价参数,包括目标用户与每一个联系用户的通话频率评价参数、通话时长评价参数、非正常通话时段的通话评价参数和漫游通话评价参数。根据这些评价参数设定调整因子,计算目标用户与每一个联系用户的社会关系权值。
在本发明的另一个实施例中提供一种基于话单数据分析的社会关系疏密度推定系统,该系统用于实现前述各实施例中的方法。因此,在前述基于话单数据分析的社会关系疏密度推定方法的各实施例中的描述和定义,可以用于本发明实施例中各个执行模块的理解。图3为本发明实施例提供的基于话单数据分析的社会关系疏密度推定系统整体结构示意图,该系统包括:
获取模块31,用于获取目标用户的话单数据;
确定模块32,用于根据目标用户的话单数据,确定表征目标用户与每一个联系用户之间社会关系疏密度的评价参数;
计算模块33,用于基于所述评价参数,计算目标用户与每一个联系用户之间的社会关系权值,其中,权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
本发明实施例提供的基于话单数据分析的社会关系疏密度推定系统与前述实施例提供的基于话单数据分析的社会关系疏密度推定方法相对应,基于话单数据分析的社会关系疏密度推定系统的相关技术特征可参见基于话单数据分析的社会关系疏密度推定方法的相关技术特征,在此不再赘述。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)401、通信接口(Communications Interface)402、存储器(memory)403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储器403中的逻辑指令,以执行如下方法:获取目标用户的话单数据;根据目标用户的话单数据,确定表征目标用户与每一个联系用户之间社会关系疏密度的评价参数;基于评价参数,计算目标用户与每一个联系用户之间的社会关系权值,其中,权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
此外,上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:获取目标用户的话单数据;根据目标用户的话单数据,确定表征目标用户与每一个联系用户之间社会关系疏密度的评价参数;基于评价参数,计算目标用户与每一个联系用户之间的社会关系权值,其中,权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度。
本发明实施例提供的一种基于话单数据分析的社会关系疏密度推定方法、系统及电子设备,通过对目标用户的话单数据进行分析,得到目标用户与每一个联系用户之间的社会关系的权值,根据社会关系权值合理快速的分析归类出目标人员的重要联系对象,可以对目标人员的分析起到很大的作用。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种基于话单数据分析的社会关系疏密度推定方法,其特征在于,包括:
获取目标用户的话单数据;
根据所述目标用户的话单数据,确定表征所述目标用户与每一个联系用户之间社会关系疏密度的评价参数;
基于所述评价参数,计算所述目标用户与每一个联系用户之间的社会关系权值,其中,所述权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度:
其中,所述评价参数包括所述目标用户与每一个联系用户的通话频率评价参数、通话时长评价参数、非正常时段通话评价参数和漫游通话评价参数;
通过如下方式确定所述目标用户与每一个联系用户的非正常时段通话评价参数:
确定在第三预设时间段内的每一个非正常通话时间段;
根据在第三预设时间段内的所有非正常通话时间段,所述目标用户的总通话次数和所述目标用户与任一联系用户之间的通话次数,确定所述目标用户与所述任一联系用户的非正常时段通话评价参数;
所述确定在第三预设时间段内的每一个非正常通话时间段包括:
将所述第三预设时间段划分为多个子时间段;
统计所述目标用户在每一个子时间段内的通话次数,并计算所述目标用户在每一个子时间段内的平均通话次数;
若所述目标用户在任一子时间段内的通话次数与所述目标用户在每一个子时间段内的平均通话次数的比值小于预设阈值,则所述任一子时间段为非正常通话时间段;
通过如下方式确定所述目标用户与每一个联系用户的漫游通话评价参数:
根据在第四预设时间段内,所述目标用户与所有联系用户之间的漫游通话次数和所述目标用户与任一联系用户之间的漫游通话次数,确定所述目标用户与所述任一联系用户的漫游通话评价参数;
通过如下方式计算所述目标用户与每一个联系用户之间的社会关系权值包括:
Figure FDA0003004940790000021
式中,V0表示目标用户,Vi表示联系用户,
Figure FDA0003004940790000022
表示目标用户与联系用户之间的社会关系权值,
Figure FDA0003004940790000023
表示目标用户与联系用户的通话频率评价参数,α为通话频率评价参数的调整因子,
Figure FDA0003004940790000024
表示目标用户与联系用户的通话时长评价参数,β为通话时长评价参数的调整因子,
Figure FDA0003004940790000025
表示目标用户与联系用户的非正常时段通话评价参数,γ为非正常时段通话评价参数的调整因子,
Figure FDA0003004940790000026
表示目标用户与联系用户的漫游通话评价参数,δ为漫游通话评价参数的调整因子。
2.根据权利要求1所述的方法,其特征在于,通过如下方式确定所述目标用户与每一个联系用户的通话频率评价参数:
根据所述目标用户在第一预设时间段内与所有联系用户的总通话次数与所述目标用户在所述第一预设时间段内与任一联系用户的通话次数,确定所述目标用户与所述任一联系用户的通话频率评价参数。
3.根据权利要求1所述的方法,其特征在于,通过如下方式确定所述目标用户与每一个联系用户的通话时长评价参数:
根据所述目标用户在第二预设时间段内与所有联系用户的总通话时长与所述目标用户在所述第二预设时间段内与任一联系用户的通话时长,确定所述目标用户与所述任一联系用户的通话时长评价参数。
4.一种基于话单数据分析的社会关系疏密度推定系统,其特征在于,包括:
获取模块,用于获取目标用户的话单数据;
确定模块,用于根据所述目标用户的话单数据,确定表征所述目标用户与每一个联系用户之间社会关系疏密度的评价参数;
计算模块,用于基于所述评价参数,计算所述目标用户与每一个联系用户之间的社会关系权值,其中,所述权值表征所述目标用户与每一个联系用户之间的社会关系的疏密度;
通过如下方式确定所述目标用户与每一个联系用户的非正常时段通话评价参数:
确定在第三预设时间段内的每一个非正常通话时间段;
根据在第三预设时间段内的所有非正常通话时间段,所述目标用户的总通话次数和所述目标用户与任一联系用户之间的通话次数,确定所述目标用户与所述任一联系用户的非正常时段通话评价参数;
所述确定在第三预设时间段内的每一个非正常通话时间段包括:
将所述第三预设时间段划分为多个子时间段;
统计所述目标用户在每一个子时间段内的通话次数,并计算所述目标用户在每一个子时间段内的平均通话次数;
若所述目标用户在任一子时间段内的通话次数与所述目标用户在每一个子时间段内的平均通话次数的比值小于预设阈值,则所述任一子时间段为非正常通话时间段;
通过如下方式确定所述目标用户与每一个联系用户的漫游通话评价参数:
根据在第四预设时间段内,所述目标用户与所有联系用户之间的漫游通话次数和所述目标用户与任一联系用户之间的漫游通话次数,确定所述目标用户与所述任一联系用户的漫游通话评价参数;
通过如下方式计算所述目标用户与每一个联系用户之间的社会关系权值包括:
Figure FDA0003004940790000041
式中,V0表示目标用户,Vi表示联系用户,
Figure FDA0003004940790000042
表示目标用户与联系用户之间的社会关系权值,
Figure FDA0003004940790000043
表示目标用户与联系用户的通话频率评价参数,α为通话频率评价参数的调整因子,
Figure FDA0003004940790000044
表示目标用户与联系用户的通话时长评价参数,β为通话时长评价参数的调整因子,
Figure FDA0003004940790000045
表示目标用户与联系用户的非正常时段通话评价参数,γ为非正常时段通话评价参数的调整因子,
Figure FDA0003004940790000046
表示目标用户与联系用户的漫游通话评价参数,δ为漫游通话评价参数的调整因子。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述基于话单数据分析的社会关系疏密度推定方法的步骤。
CN201911184808.9A 2019-11-27 2019-11-27 基于话单数据分析的社会关系疏密度推定方法及系统 Active CN110971770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911184808.9A CN110971770B (zh) 2019-11-27 2019-11-27 基于话单数据分析的社会关系疏密度推定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911184808.9A CN110971770B (zh) 2019-11-27 2019-11-27 基于话单数据分析的社会关系疏密度推定方法及系统

Publications (2)

Publication Number Publication Date
CN110971770A CN110971770A (zh) 2020-04-07
CN110971770B true CN110971770B (zh) 2021-07-23

Family

ID=70031875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911184808.9A Active CN110971770B (zh) 2019-11-27 2019-11-27 基于话单数据分析的社会关系疏密度推定方法及系统

Country Status (1)

Country Link
CN (1) CN110971770B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136916A (zh) * 2010-01-25 2011-07-27 中国移动通信集团广西有限公司 话单计费方法及装置
CN107895279A (zh) * 2017-10-23 2018-04-10 中国联合网络通信集团有限公司 基于用户话单的用户影响力确定方法及装置
CN108428155A (zh) * 2018-03-20 2018-08-21 南京邮电大学 一种基于业务特征模型的行为处理分析方法
CN109428760A (zh) * 2017-09-04 2019-03-05 中国移动通信集团浙江有限公司 一种基于运营商数据的用户信用评估方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130311283A1 (en) * 2012-05-18 2013-11-21 Huawei Technologies Co., Ltd. Data mining method for social network of terminal user and related methods, apparatuses and systems
CN105069145A (zh) * 2015-08-20 2015-11-18 中国科学院计算技术研究所 用于确定社交网络用户关系强度的方法及系统
CN106686265A (zh) * 2015-11-10 2017-05-17 中国移动通信集团公司 基于通信记录的服务提供方法及装置
CN108268477A (zh) * 2016-12-30 2018-07-10 中国电信股份有限公司 一种基于话单的用户关系确定方法和装置
CN107423434B (zh) * 2017-08-03 2020-02-18 航天科工智慧产业发展有限公司 一种基于话单数据的潜在社会关系网络的挖掘方法
CN107729940A (zh) * 2017-10-20 2018-02-23 北京工业大学 一种用户话单大数据基站连接信息用户关系推定方法
CN107958423A (zh) * 2017-12-20 2018-04-24 广东宜通世纪科技股份有限公司 用户社会关系分析方法及存储介质、服务端
CN109542950A (zh) * 2018-11-14 2019-03-29 中国联合网络通信集团有限公司 社会关系的挖掘方法、装置、终端及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136916A (zh) * 2010-01-25 2011-07-27 中国移动通信集团广西有限公司 话单计费方法及装置
CN109428760A (zh) * 2017-09-04 2019-03-05 中国移动通信集团浙江有限公司 一种基于运营商数据的用户信用评估方法
CN107895279A (zh) * 2017-10-23 2018-04-10 中国联合网络通信集团有限公司 基于用户话单的用户影响力确定方法及装置
CN108428155A (zh) * 2018-03-20 2018-08-21 南京邮电大学 一种基于业务特征模型的行为处理分析方法

Also Published As

Publication number Publication date
CN110971770A (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN113765881A (zh) 异常网络安全行为的检测方法、装置、电子设备及存储介质
CN110401780B (zh) 一种识别诈骗电话的方法及装置
CN113783717B (zh) 智慧城市网络流量预测方法及系统
CN111199018A (zh) 异常数据检测方法、装置、存储介质及电子设备
CN115497272A (zh) 一种基于数字化建造的工期智能化预警系统及方法
CN114125154B (zh) 外呼策略参数调整方法、装置、计算机设备及存储介质
CN110381218B (zh) 一种识别电话诈骗团伙的方法及装置
CN108306846B (zh) 一种网络访问异常检测方法及系统
CN103560919B (zh) 一种基于语音业务的质量评估方法及设备
Arpasat et al. Improvement of call center customer service in a thai bank using disco fuzzy mining algorithm
CN110889526A (zh) 一种用户升级投诉行为预测方法及系统
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN112817834A (zh) 数据表评估方法及装置
CN109428760B (zh) 一种基于运营商数据的用户信用评估方法
CN110971770B (zh) 基于话单数据分析的社会关系疏密度推定方法及系统
CN111612366B (zh) 渠道质量评估方法、装置、电子设备及存储介质
CN113177837A (zh) 贷款申请人的贷款额度评估方法、装置、设备及存储介质
CN110807171A (zh) 基于权重划分的坐席人员擅长业务分析方法和装置
CN111090585A (zh) 一种基于众测过程的众测任务关闭时间自动预测方法
CN110399399B (zh) 用户分析的方法、装置、电子设备和存储介质
EP2919504A1 (en) Method and device for judging user repeatedly accessing network
CN111368859B (zh) 一种投诉预警处理方法及装置
CN109189743B (zh) 一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统
CN111209330A (zh) 一种识别一致行动人的方法及系统
CN112422333A (zh) 一种配网情况确定方法、系统及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant