CN112446556A - 基于表示学习和行为特征的通信网用户呼叫对象预测方法 - Google Patents

基于表示学习和行为特征的通信网用户呼叫对象预测方法 Download PDF

Info

Publication number
CN112446556A
CN112446556A CN202110106920.1A CN202110106920A CN112446556A CN 112446556 A CN112446556 A CN 112446556A CN 202110106920 A CN202110106920 A CN 202110106920A CN 112446556 A CN112446556 A CN 112446556A
Authority
CN
China
Prior art keywords
communication node
communication
training
user
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110106920.1A
Other languages
English (en)
Other versions
CN112446556B (zh
Inventor
刘峤
蓝天
曾义夫
代婷婷
宋明慧
周乐
孙建强
曾维智
吴祖峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110106920.1A priority Critical patent/CN112446556B/zh
Publication of CN112446556A publication Critical patent/CN112446556A/zh
Application granted granted Critical
Publication of CN112446556B publication Critical patent/CN112446556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供基于表示学习和行为特征的通信网用户呼叫对象预测方法,属于通信网络用户行为分析技术领域,包括:随机生成通信网络中各通信节点的初始向量,构造呼叫顺序网络;根据各用户呼叫历史记录提取三元组集合,构造并训练由LSTM循环神经网络和双线性层堆叠而成的图表示学习模型,获得所有通信节点的更新后通信节点向量;构造并训练由并行的通信时长‑位置加权层和双向‑长期短期记忆神经网络,堆叠前馈神经网络和双线性层而成的呼叫对象预测模型;待预测用户历史呼叫记录基于更新后通信节点向量和训练后呼叫对象预测模型,实现预测。本发明基于用户呼叫历史记录分析,根据通信节点拓扑信息、通信顺序信息和用户长短期行为特征实现预测。

Description

基于表示学习和行为特征的通信网用户呼叫对象预测方法
技术领域
本发明属于通信网络用户行为分析技术领域,具体涉及基于表示学习和行为特征的通信网用户呼叫对象预测方法。
背景技术
随着信息技术的更新换代,近年来移动通信工具特别是智能手机得到迅速普及,极大方便了人们的生活,并产生了海量的用户通信行为历史数据。然而,便捷的通信工具也成为了违法犯罪团伙的联系和组织手段,由于犯罪团伙组织的隐蔽性和执法人员侦察的滞后性,针对通信网络中用户的下一次通信对象预测已成为一个十分重要且有价值的问题,可有效辅助相关执法部门准确预测目标用户未来可能的通信对象从而提前开展通信监听与行动部署,可为例如公共安全领域中的维稳反恐等工作提供支持,具有广泛的应用前景。
然而,在大规模的用户呼叫历史行为数据中进行目标用户的下一次通信对象预测存在很多困难:首先,电信运营商多元化的服务与用户数据的迅速增长产生了海量的用户数据,往往一个市级范围内的通信数据中就含有千万级的用户,计算量大导致传统方法很难有效处理;另外,用户在通信网络中并不是独立存在的个体,而是存在关联并形成通信网络,并且用户的呼叫历史记录中蕴含了通信优先顺序等信息,仅考虑用户呼叫历史记录统计特征的通信对象预测方法或者仅针对用户在通信网中节点相似性的通信对象预测方法能力有限;此外,现有的对通信网中用户行为的研究主要聚焦在通信网整体流量变化分析,伪造号码识别,诈骗电话检测等问题上,对用户下一次通信对象的预测问题缺乏现成技术方案和深度研究。
因此,需要提出一种智能有效的通信对象预测方法,能够基于海量数据,将用户所在通信网络中拓扑信息与用户呼叫历史行为中的用户行为特征相结合,基于表示学习和深度学习的用户呼叫对象预测方法,准确高效的预测用户下一次的通信对象,从而满足公共安全等领域相关部门机构针对通信网用户的侦察和监控需求。
发明内容
本发明针对上述现有技术中存在的问题,提出了基于表示学习和行为特征的通信网用户呼叫对象预测方法,通过分析用户呼叫历史行为所产生的海量数据,预测用户的下一次呼叫对象。
本发明所采用的技术方案如下:
基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,包括以下步骤:
步骤1:随机生成通信网络中各通信节点的初始向量
Figure 862820DEST_PATH_IMAGE001
,得到通信节 点初始向量集合
Figure 452064DEST_PATH_IMAGE002
;其中,|V|为通信网络中通信节点的总个数;
步骤2:根据通信网络中各用户呼叫历史记录中的通信节点被呼叫的先后顺序构造呼 叫顺序网络G={V,E};其中,V为通信节点集合
Figure 678472DEST_PATH_IMAGE003
,E为V中各通信节点之间联系的 集合,即用户呼叫通信节点
Figure 745785DEST_PATH_IMAGE004
之后,呼叫另一个通信节点
Figure 419212DEST_PATH_IMAGE005
,那么会存在联系
Figure 163046DEST_PATH_IMAGE006
Figure 898921DEST_PATH_IMAGE007
Figure 284771DEST_PATH_IMAGE008
步骤3:定义步骤2所得呼叫顺序网络G={V,E}中的一条由起始通信节点
Figure 891333DEST_PATH_IMAGE004
、其次通信 节点
Figure 337227DEST_PATH_IMAGE005
和最终通信节点
Figure 232502DEST_PATH_IMAGE009
组成的通信顺序路径为一个三元组
Figure 422044DEST_PATH_IMAGE010
Figure 476587DEST_PATH_IMAGE011
,根据通信网络中各用户呼叫历史记录提取三元组集合
Figure 578535DEST_PATH_IMAGE012
,作为图 表示学习模型的训练集;
步骤4:构造并训练由LSTM(Long Short-Term Memory,长短期记忆网络)循环神经网络和双线性(Bi-Linear)层堆叠而成的图表示学习模型,得到各通信节点的更新后通信节点向量,具体步骤如下:
步骤4.1:从步骤3所得三元组集合
Figure 7112DEST_PATH_IMAGE013
中随机抽取N个三元 组作为所述图表示学习模型的一次批处理训练的训练数据
Figure 141290DEST_PATH_IMAGE014
Figure 315919DEST_PATH_IMAGE015
为起始通信节点的下标,
Figure 588769DEST_PATH_IMAGE016
为其次通信节点的下标,
Figure 510500DEST_PATH_IMAGE017
为最终通信节点的下标,
Figure 526998DEST_PATH_IMAGE018
为训 练数据中第j个三元组的起始通信节点,
Figure 415188DEST_PATH_IMAGE019
为训练数据中第j个三元组的其次通信节点,
Figure 124518DEST_PATH_IMAGE020
为训练数据中第j个三元组的最终通信节点;将
Figure 262107DEST_PATH_IMAGE014
中 各三元组的起始通信节点和其次通信节点的初始向量组成输入序列
Figure 675771DEST_PATH_IMAGE021
, 作为图表示学习模型中LSTM循环神经网络的输入,最终通信节点
Figure 965938DEST_PATH_IMAGE022
作为图表示学习模型的训练目标;
步骤4.2:将输入序列
Figure 95437DEST_PATH_IMAGE021
输入至时间步步长为2的 LSTM循环神经网络,所述LSTM循环神经网络的公式为:
Figure 736634DEST_PATH_IMAGE023
其中,
Figure 344202DEST_PATH_IMAGE024
为sigmoid激活函数;p表示当前时间步;
Figure 957717DEST_PATH_IMAGE025
,为 LSTM循环神经网络当前时间步的输入向量,在第一时间步中
Figure 258117DEST_PATH_IMAGE026
Figure 121031DEST_PATH_IMAGE027
, 在第二时间步中
Figure 532290DEST_PATH_IMAGE026
Figure 797049DEST_PATH_IMAGE028
Figure 268350DEST_PATH_IMAGE029
为输入门;
Figure 946456DEST_PATH_IMAGE030
为忘记门;
Figure 912138DEST_PATH_IMAGE031
为输出门;
Figure 298250DEST_PATH_IMAGE032
为LSTM循环神经网络当前时间步的内部记忆单元;
Figure 425606DEST_PATH_IMAGE033
为LSTM循环神经网络上一 时间步的内部记忆单元;
Figure 981221DEST_PATH_IMAGE034
为作用于当前时间步输入的输入门权重矩阵;
Figure 485014DEST_PATH_IMAGE035
为作用于上 一时间步输出的输入门权重矩阵;
Figure 317841DEST_PATH_IMAGE036
为作用于当前时间步输入的忘记门权重矩阵;
Figure 865366DEST_PATH_IMAGE037
为作用于上一时间步输出的忘记门权重矩阵;
Figure 190168DEST_PATH_IMAGE038
为作用于当前时间步输入的输出门权重 矩阵;
Figure 215762DEST_PATH_IMAGE039
为作用于上一时间步输出的输出门权重矩阵;
Figure 44041DEST_PATH_IMAGE040
为作用于当前时间步输入的 内部记忆单元权重矩阵;
Figure 28046DEST_PATH_IMAGE041
为作用于上一时间步输出的内部记忆单元权重矩阵;
Figure 840144DEST_PATH_IMAGE042
为当前时间步的输出状态;
Figure 200587DEST_PATH_IMAGE043
为上一时间步的输出状态,在第一时间步中
Figure 148952DEST_PATH_IMAGE043
为0;
得到输入序列
Figure 648066DEST_PATH_IMAGE021
在LSTM循环神经网络第一时间步和第 二时间步的输出,分别为
Figure 134411DEST_PATH_IMAGE044
Figure 49278DEST_PATH_IMAGE045
步骤4.3:将
Figure 101416DEST_PATH_IMAGE046
作为双线性层的输入,得到 通信网络中各通信节点的概率分布
Figure 505853DEST_PATH_IMAGE047
,即用户呼叫
Figure 688615DEST_PATH_IMAGE048
Figure 876014DEST_PATH_IMAGE019
后接 下来呼叫各通信节点的概率;所述双线性层的公式为:
Figure DEST_PATH_IMAGE050A
其中,
Figure 110555DEST_PATH_IMAGE051
为图表示学习模型中双线性层的权值矩阵;
Figure 404002DEST_PATH_IMAGE052
为通信节点初始向量集合
Figure 146830DEST_PATH_IMAGE053
的转置;
Figure 59292DEST_PATH_IMAGE054
为输入为训练集中第j个三元组时,第一个通信节点
Figure 617181DEST_PATH_IMAGE055
被预测到的概 率;
Figure 35524DEST_PATH_IMAGE056
为输入为训练集中第j个三元组时,第二个通信节点
Figure 514916DEST_PATH_IMAGE057
被预测到的概率;
Figure 309696DEST_PATH_IMAGE058
为输入为训练集中第j个三元组时,第|V|个通信节点
Figure 190933DEST_PATH_IMAGE059
被预测到的概率;
步骤4.4:以最终通信节点
Figure 983440DEST_PATH_IMAGE060
为图表示学习模型的训练目标,使 用反向传播算法对图表示学习模型进行训练,得到初次训练后图表示学习模型和更新后通 信节点向量
Figure 475427DEST_PATH_IMAGE061
Figure 136215DEST_PATH_IMAGE062
,所述反向传播算法所采用的目标损失函数为
Figure 888271DEST_PATH_IMAGE047
与最终通信节点
Figure 366526DEST_PATH_IMAGE060
的平均交叉熵损失
Figure 164717DEST_PATH_IMAGE063
Figure 566880DEST_PATH_IMAGE064
其中,
Figure 625971DEST_PATH_IMAGE065
为一次批处理训练的训练数据中第j个三元组的最终通信节点
Figure 822598DEST_PATH_IMAGE060
被预测到的概率;
步骤4.5:基于训练集
Figure 108085DEST_PATH_IMAGE013
中 的所有三元组,重复步骤4.1~4.4,依次对步骤4.4所得初次训练后图表示学习模型进行训 练,得到训练完成的图表示学习模型和通信网络中所有通信节点的更新后通信节点向量;
步骤5:构造并训练呼叫对象预测模型,所述呼叫对象预测模型由并行的通信时长-位置加权层和双向-长期短期记忆(Bi-LSTM)神经网络,堆叠前馈神经网络和双线性层而成;具体步骤如下:
步骤5.1:基于步骤4所得所有通信节点的更新后通信节点向量,根据随机一条用户呼 叫历史记录,获得对应的更新后通信节点向量序列
Figure 235310DEST_PATH_IMAGE066
,将更新后通信 节点向量序列
Figure 961958DEST_PATH_IMAGE066
中的向量序列
Figure 657381DEST_PATH_IMAGE067
作为呼叫对象 预测模型中通信时长-位置加权层和双向-长期短期记忆神经网络的输入,
Figure 289220DEST_PATH_IMAGE068
作为呼叫 对象预测模型的训练目标;其中,T为用户呼叫历史记录的通信节点长度;
步骤5.2:将向量序列
Figure 767606DEST_PATH_IMAGE067
作为通信时长-位置加权层的输入,计算 得到用户呼叫历史记录中各通信节点在该用户呼叫历史记录中关于位置和通信时长的长 期行为特征
Figure 942235DEST_PATH_IMAGE069
Figure 464352DEST_PATH_IMAGE070
其中,
Figure 599799DEST_PATH_IMAGE071
为用户呼叫历史记录中第t个更新后通信节点向量;
Figure 865564DEST_PATH_IMAGE072
为用户呼叫历史记 录中第t个通信节点的通信时长;
步骤5.3:将向量序列
Figure 301224DEST_PATH_IMAGE067
作为双向-长期短期记忆神经网络的输 入,所述双向-长期短期记忆神经网络的时间步步长为T-1,单向公式为:
Figure 259822DEST_PATH_IMAGE073
其中,
Figure 741619DEST_PATH_IMAGE074
为双向-长期短期记忆神经网络当前时间步的 输入向量;
Figure 561807DEST_PATH_IMAGE075
为当前时间步的输出状态;
Figure 513626DEST_PATH_IMAGE076
为上一时间步的输出状态,在第一时间步中
Figure 439862DEST_PATH_IMAGE076
为0;
Figure 471272DEST_PATH_IMAGE077
为双向-长期短期记忆神经网络当前时间步的内部记忆单元;
Figure 360731DEST_PATH_IMAGE078
为双向- 长期短期记忆神经网络上一时间步的内部记忆单元;
所述双向-长期短期记忆神经网络的输出为向量序列
Figure 20251DEST_PATH_IMAGE079
中各通信 节点的前向隐状态输出和后向隐状态输出,取用户最后一个通信节点的前向隐状态输出
Figure 540225DEST_PATH_IMAGE080
和用户第一个通信节点的后向隐状态输出
Figure 324511DEST_PATH_IMAGE081
,拼接得到含用户呼叫历史记录中顺序信 息的短期行为特征
Figure 735769DEST_PATH_IMAGE082
Figure 328425DEST_PATH_IMAGE083
其中,
Figure 550459DEST_PATH_IMAGE084
代表向量拼接;
步骤5.4:通过门控机制合成步骤5.2所得长期行为特征
Figure 149936DEST_PATH_IMAGE069
与步骤5.3所得短期行为 特征
Figure 318880DEST_PATH_IMAGE082
,得到门控机制输出权重g,门控机制所采用的前馈神经网络的公式为:
Figure 952993DEST_PATH_IMAGE085
其中,
Figure 939403DEST_PATH_IMAGE086
为饱和非线性激活函数;
Figure 980172DEST_PATH_IMAGE087
为短期行为特征的权重矩阵;
Figure 77441DEST_PATH_IMAGE088
为长期行 为特征的权重矩阵;
Figure 318059DEST_PATH_IMAGE089
为偏置向量;
进一步计算得到长短期行为特征
Figure 147474DEST_PATH_IMAGE090
Figure 924806DEST_PATH_IMAGE091
其中,
Figure 966712DEST_PATH_IMAGE092
代表哈达玛积;
步骤5.5:将长短期行为特征
Figure 309837DEST_PATH_IMAGE090
作为呼叫对象预测模型中双线性层的输入,计算得到概 率预测结果向量
Figure 638050DEST_PATH_IMAGE093
Figure 184569DEST_PATH_IMAGE094
其中,
Figure 545012DEST_PATH_IMAGE095
为呼叫对象预测模型中双线性层的权重矩阵;
Figure 962218DEST_PATH_IMAGE096
为第一个通信节点
Figure 117125DEST_PATH_IMAGE097
的概率预测结果;
Figure 416519DEST_PATH_IMAGE098
为第二个通信节点
Figure 128124DEST_PATH_IMAGE057
的概率预测结果;
Figure 914683DEST_PATH_IMAGE099
为第|V|个通信节 点
Figure 991223DEST_PATH_IMAGE100
的概率预测结果;
步骤5.6:以
Figure 27181DEST_PATH_IMAGE068
为训练目标,使用反向传播算法对呼叫对象预测模型进行训练,得到 初次训练后呼叫对象预测模型,所述反向传播算法所采用的目标损失函数为概率预测结果 向量
Figure 808055DEST_PATH_IMAGE101
Figure 934274DEST_PATH_IMAGE068
的交叉熵损失:
Figure 775191DEST_PATH_IMAGE102
其中,
Figure 32866DEST_PATH_IMAGE103
为呼叫对象预测模型训练过程中,训练目标
Figure 289535DEST_PATH_IMAGE068
被预测到的概率;
步骤5.7:基于所有用户呼叫历史记录,重复步骤5.1~步骤5.6,依次对步骤5.6所得初次训练后呼叫对象预测模型进行训练,得到训练完成的呼叫对象预测模型;
步骤6:根据图表示学习模型所得通信网络中各通信节点的更新后通信节点向量,获得待预测用户历史呼叫记录对应的待预测更新后通信节点向量序列,再将所得待预测更新后通信节点向量序列输入至步骤5所得训练完成的呼叫对象预测模型中,得到通信网络中所有通信节点的被呼叫概率,被呼叫概率最大的前K个通信节点代表最有可能被呼叫的对象;其中,K为预设值。
本发明的有益效果为:
1、本发明提出了基于表示学习和行为特征的通信网用户呼叫对象预测方法,基于用户呼叫历史记录所产生的海量数据展开分析,根据通信节点在呼叫顺序网络中的拓扑信息以及全网络的通信顺序信息,结合用户呼叫历史记录中的用户长期行为特征与短期行为特征信息,能实现实时有效的预测用户的下一次呼叫对象,该方法可有效辅助相关部门掌握目标用户的通信行为动态以及提前开展通信侦察与行动部署;
2、在图表示学习模型中,本发明创造性的提出基于用户呼叫历史记录构造的呼叫顺序网络,以用户呼叫的通信节点作为呼叫顺序网络图的节点,以通信节点的被呼叫顺序作为呼叫顺序网络图的边,构造呼叫顺序网络图;根据呼叫顺序网络训练图表示学习模型,生成含有网络拓扑信息和全局层面通信顺序信息的更新后通信节点向量,自动高效的完成对通信网络中各个通信节点的特征提取;
3、在呼叫对象预测模型中,本发明基于用户呼叫历史记录,提出用户的两种行为特征建模方法:一是设计通信时长-位置加权层,基于通信节点的被叫顺序和通信时长进行通信节点信息的加权整合,完成用户长期行为特征的计算;二是利用双向-长短期记忆神经网络处理用户呼叫历史对用户短期行为特征进行提取;最后采用基于前馈神经网络的门控机制方法,对用户不同类型的行为特征进行合成,实现基于用户自身呼叫行为特征来预测其下一次呼叫对象,取得了良好的效果;本发明通过在呼叫对象预测模型中使用图表示学习模型得到的更新后通信节点向量,将呼叫顺序网络中的拓扑信息与用户的呼叫历史记录中的行为信息结合在一起;
4、与现有对通信网用户行为分析技术相比,本发明采用端到端的表示学习方式,无需单独针对通信网中每个节点进行统计分析等特征工程,对用户行为的建模考虑到了用户呼叫历史记录中多方面的特点,信息利用更加充分全面;本发明具有过程简单易于实现,对不同特点的通信数据有着良好的泛化性,可在数据稀疏环境下稳定工作的优点。
附图说明
图1为本发明实施例1的基于表示学习和行为特征的通信网用户呼叫对象预测方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清晰,结合以下具体实施例,并参照附图,对本发明做进一步的说明。
实施例1:
本实施例提供了基于表示学习和行为特征的通信网用户呼叫对象预测方法,如图1所示,包括以下步骤:
步骤1:通信网络中各通信节点采用N(0,0.052)的正态分布随机初始化生成各通信节 点的初始向量
Figure 525388DEST_PATH_IMAGE104
,得到通信节点初始向量集合
Figure 943731DEST_PATH_IMAGE105
, 各通信节点的初始向量维度为100维;其中,|V|为通信网络中通信节点的总个数;
步骤2:根据通信网络中各用户呼叫历史记录中的通信节点被呼叫的先后顺序构造呼 叫顺序网络G={V,E};其中,V为通信节点集合
Figure 423122DEST_PATH_IMAGE106
,E为V中各通信节点之间联系的集 合,即用户呼叫通信节点
Figure 217903DEST_PATH_IMAGE004
之后,呼叫另一个通信节点
Figure 364720DEST_PATH_IMAGE107
,那么会存在联系
Figure 953964DEST_PATH_IMAGE006
Figure 717389DEST_PATH_IMAGE007
Figure 50282DEST_PATH_IMAGE008
步骤3:定义步骤2所得呼叫顺序网络G={V,E}中的一条由起始通信节点
Figure 989288DEST_PATH_IMAGE004
、其次通信 节点
Figure 15013DEST_PATH_IMAGE107
和最终通信节点
Figure 468997DEST_PATH_IMAGE108
组成的通信顺序路径为一个三元组
Figure 136738DEST_PATH_IMAGE010
Figure 461409DEST_PATH_IMAGE109
,根据通信网络中各用户呼叫历史记录提取三元组集合
Figure 392456DEST_PATH_IMAGE013
,作为图 表示学习模型的训练集;
步骤4:构造并训练由LSTM(Long Short-Term Memory,长短期记忆网络)循环神经网络和双线性(Bi-Linear)层堆叠而成的图表示学习模型,得到各通信节点的更新后通信节点向量,具体步骤如下:
步骤4.1:从步骤3所得三元组集合
Figure 333736DEST_PATH_IMAGE013
中随机抽取N个三元组作 为所述图表示学习模型的一次批处理训练的训练数据
Figure 867486DEST_PATH_IMAGE014
Figure 797396DEST_PATH_IMAGE015
为起始通信节点的下标,
Figure 492819DEST_PATH_IMAGE016
为其次通信节点的下标,
Figure 118798DEST_PATH_IMAGE017
为最终通信节点的下标,
Figure 190660DEST_PATH_IMAGE110
为 训练数据中第j个三元组的起始通信节点,
Figure 506234DEST_PATH_IMAGE019
为训练数据中第j个三元组的其次通信节 点,
Figure 762772DEST_PATH_IMAGE020
为训练数据中第j个三元组的最终通信节点;将
Figure 429377DEST_PATH_IMAGE111
中各三元组的起始通信节点和其次通信节点的初始向量组成输入序列
Figure 39350DEST_PATH_IMAGE021
,作为图表示学习模型中LSTM循环神经网络的输入,最终通信节 点
Figure 989857DEST_PATH_IMAGE112
作为图表示学习模型的训练目标;
步骤4.2:将输入序列
Figure 433608DEST_PATH_IMAGE021
输入至时间步步长为2的LSTM 循环神经网络,所述LSTM循环神经网络的公式为:
Figure 305618DEST_PATH_IMAGE023
其中,
Figure 719282DEST_PATH_IMAGE024
为sigmoid激活函数;p表示当前时间步;
Figure 212711DEST_PATH_IMAGE025
,为 LSTM循环神经网络当前时间步的输入向量,在第一时间步中
Figure 420838DEST_PATH_IMAGE026
Figure 514565DEST_PATH_IMAGE113
, 在第二时间步中
Figure 404024DEST_PATH_IMAGE026
Figure 142173DEST_PATH_IMAGE028
Figure 911415DEST_PATH_IMAGE029
为输入门;
Figure 367804DEST_PATH_IMAGE030
为忘记门;
Figure 733057DEST_PATH_IMAGE031
为输出门;
Figure 591292DEST_PATH_IMAGE032
为LSTM循环神经网络当前时间步的内部记忆单元;
Figure 531435DEST_PATH_IMAGE033
为LSTM循环神经网络上一时间步的 内部记忆单元;
Figure 209541DEST_PATH_IMAGE034
为作用于当前时间步输入的输入门权重矩阵;
Figure 440802DEST_PATH_IMAGE035
为作用于上一时间步 输出的输入门权重矩阵;
Figure 278177DEST_PATH_IMAGE114
为作用于当前时间步输入的忘记门权重矩阵;
Figure 264587DEST_PATH_IMAGE037
为作用于 上一时间步输出的忘记门权重矩阵;
Figure 305356DEST_PATH_IMAGE038
为作用于当前时间步输入的输出门权重矩阵;
Figure 402625DEST_PATH_IMAGE039
为作用于上一时间步输出的输出门权重矩阵;
Figure 100365DEST_PATH_IMAGE040
为作用于当前时间步输入的内部记 忆单元权重矩阵;
Figure 929781DEST_PATH_IMAGE115
为作用于上一时间步输出的内部记忆单元权重矩阵;
Figure 316900DEST_PATH_IMAGE042
为当前时 间步的输出状态;
Figure 342494DEST_PATH_IMAGE116
为上一时间步的输出状态,在第一时间步中
Figure 436352DEST_PATH_IMAGE116
为0;
得到输入序列
Figure 764565DEST_PATH_IMAGE021
在LSTM循环神经网络第一时间步和第 二时间步的输出,分别为
Figure 825931DEST_PATH_IMAGE117
Figure 874789DEST_PATH_IMAGE045
步骤4.3:将
Figure 338000DEST_PATH_IMAGE046
作为双线性层的输入,得到通 信网络中各通信节点的概率分布
Figure 837115DEST_PATH_IMAGE047
,即用户呼叫
Figure 870930DEST_PATH_IMAGE018
Figure 769485DEST_PATH_IMAGE019
后接下来 呼叫各通信节点的概率;所述双线性层的公式为:
Figure 100002_DEST_PATH_IMAGE118A
其中,
Figure 352782DEST_PATH_IMAGE119
为图表示学习模型中双线性层的权值矩阵;
Figure 226060DEST_PATH_IMAGE052
为通信节点初始向量集合
Figure 934122DEST_PATH_IMAGE053
的转置;
Figure 980575DEST_PATH_IMAGE120
为输入为训练集中第j个三元组时,第一个通信节点
Figure 842481DEST_PATH_IMAGE097
被预测到的概 率;
Figure 683398DEST_PATH_IMAGE121
为输入为训练集中第j个三元组时,第二个通信节点
Figure 426226DEST_PATH_IMAGE057
被预测到的概率;
Figure 135425DEST_PATH_IMAGE122
为输入为训练集中第j个三元组时,第|V|个通信节点
Figure 912888DEST_PATH_IMAGE100
被预测到的概率;
步骤4.4:以最终通信节点
Figure 924707DEST_PATH_IMAGE022
为图表示学习模型的训练目标,使用反 向传播算法对图表示学习模型进行训练,得到初次训练后图表示学习模型和更新后通信节 点向量
Figure 872940DEST_PATH_IMAGE061
Figure 995617DEST_PATH_IMAGE123
,所述反向传播算法所采用的目标损失函数为
Figure 893166DEST_PATH_IMAGE047
与 最终通信节点
Figure 200519DEST_PATH_IMAGE022
的平均交叉熵损失
Figure 511415DEST_PATH_IMAGE124
Figure 844307DEST_PATH_IMAGE125
其中,
Figure 845630DEST_PATH_IMAGE126
为一次批处理训练的训练数据中第j个三元组的最终通信节点
Figure 871355DEST_PATH_IMAGE022
被预测到的概率;
步骤4.5:基于训练集
Figure 794180DEST_PATH_IMAGE013
中的所有三元组,重复步骤4.1~4.4,依次对步骤4.4所得初次训练后图表示学习模型进行 训练,得到训练完成的图表示学习模型和通信网络中所有通信节点的更新后通信节点向 量;
步骤5:构造并训练呼叫对象预测模型,所述呼叫对象预测模型由并行的通信时长-位置加权层和双向-长期短期记忆(Bi-LSTM)神经网络,堆叠前馈神经网络和双线性层而成;具体步骤如下:
步骤5.1:基于步骤4所得所有通信节点的更新后通信节点向量,根据随机一条用户呼 叫历史记录,获得对应的更新后通信节点向量序列
Figure 258660DEST_PATH_IMAGE066
,将更新后通信 节点向量序列
Figure 334063DEST_PATH_IMAGE066
中的向量序列
Figure 858585DEST_PATH_IMAGE067
作为呼叫对象 预测模型中通信时长-位置加权层和双向-长期短期记忆神经网络的输入,
Figure 65445DEST_PATH_IMAGE068
作为呼叫 对象预测模型的训练目标;其中,T为用户呼叫历史记录的通信节点长度;
步骤5.2:将向量序列
Figure 474560DEST_PATH_IMAGE067
作为通信时长-位置加权层的输入,计 算得到用户呼叫历史记录中各通信节点在该用户呼叫历史记录中关于位置和通信时长的 长期行为特征
Figure 529104DEST_PATH_IMAGE069
Figure 349162DEST_PATH_IMAGE070
其中,
Figure 262891DEST_PATH_IMAGE071
为用户呼叫历史记录中第t个更新后通信节点向量;
Figure 334752DEST_PATH_IMAGE072
为用户呼叫历史记 录中第t个通信节点的通信时长;
步骤5.3:将向量序列
Figure 171033DEST_PATH_IMAGE067
作为双向-长期短期记忆神经网络的输 入,所述双向-长期短期记忆神经网络的时间步步长为T-1,单向公式为:
Figure 178303DEST_PATH_IMAGE073
其中,
Figure 172804DEST_PATH_IMAGE127
为双向-长期短期记忆神经网络当前时间步的 输入向量;
Figure 704149DEST_PATH_IMAGE128
为当前时间步的输出状态;
Figure 874230DEST_PATH_IMAGE076
为上一时间步的输出状态,在第一时间步中
Figure 301669DEST_PATH_IMAGE076
为0;
Figure 783466DEST_PATH_IMAGE077
为双向-长期短期记忆神经网络当前时间步的内部记忆单元;
Figure 72496DEST_PATH_IMAGE129
为双 向-长期短期记忆神经网络上一时间步的内部记忆单元;
所述双向-长期短期记忆神经网络的输出为向量序列
Figure 346351DEST_PATH_IMAGE130
中各通 信节点的前向隐状态输出和后向隐状态输出,取用户最后一个通信节点的前向隐状态输出
Figure 492162DEST_PATH_IMAGE080
和用户第一个通信节点的后向隐状态输出
Figure 461255DEST_PATH_IMAGE081
,拼接得到含用户呼叫历史记录中顺序信 息的短期行为特征
Figure 537664DEST_PATH_IMAGE082
Figure 947917DEST_PATH_IMAGE083
其中,
Figure 592525DEST_PATH_IMAGE131
代表向量拼接;
步骤5.4:通过门控机制合成步骤5.2所得长期行为特征
Figure 111231DEST_PATH_IMAGE069
与步骤5.3所得短期行为 特征
Figure 522490DEST_PATH_IMAGE082
,得到门控机制输出权重g,门控机制所采用的前馈神经网络的公式为:
Figure 115145DEST_PATH_IMAGE085
其中,
Figure 71600DEST_PATH_IMAGE132
为饱和非线性激活函数;
Figure 343181DEST_PATH_IMAGE087
为短期行为特征的权重矩阵;
Figure 636759DEST_PATH_IMAGE088
为长期行 为特征的权重矩阵;
Figure 265012DEST_PATH_IMAGE133
为偏置向量;
进一步计算得到长短期行为特征
Figure 657947DEST_PATH_IMAGE090
Figure 682404DEST_PATH_IMAGE134
其中,
Figure 779673DEST_PATH_IMAGE092
代表哈达玛积;
步骤5.5:将长短期行为特征
Figure 284604DEST_PATH_IMAGE090
作为呼叫对象预测模型中双线性层的输入,计算得到概 率预测结果向量
Figure 566549DEST_PATH_IMAGE101
Figure 219248DEST_PATH_IMAGE135
其中,
Figure 526732DEST_PATH_IMAGE136
为呼叫对象预测模型中双线性层的权重矩阵;
Figure 869858DEST_PATH_IMAGE137
为第一个通信节点
Figure 604596DEST_PATH_IMAGE097
的概率预测结果;
Figure 869224DEST_PATH_IMAGE098
为第二个通信节点
Figure 42716DEST_PATH_IMAGE057
的概率预测结果;
Figure 459922DEST_PATH_IMAGE099
为第|V|个通信 节点
Figure 959036DEST_PATH_IMAGE100
的概率预测结果;
步骤5.6:以
Figure 710961DEST_PATH_IMAGE068
为训练目标,使用反向传播算法对呼叫对象预测模型进行训练,得到 初次训练后呼叫对象预测模型,所述反向传播算法所采用的目标损失函数为概率预测结果 向量
Figure 625827DEST_PATH_IMAGE138
Figure 22173DEST_PATH_IMAGE068
的交叉熵损失:
Figure 347981DEST_PATH_IMAGE102
其中,
Figure 337934DEST_PATH_IMAGE103
为呼叫对象预测模型训练过程中,训练目标
Figure 118808DEST_PATH_IMAGE068
被预测到的概率;
步骤5.7:基于所有用户呼叫历史记录,重复步骤5.1~步骤5.6,依次对步骤5.6所得初次训练后呼叫对象预测模型进行训练,得到训练完成的呼叫对象预测模型;
步骤6:根据图表示学习模型所得通信网络中各通信节点的更新后通信节点向量,获得待预测用户历史呼叫记录对应的待预测更新后通信节点向量序列,再将所得待预测更新后通信节点向量序列输入至步骤5所得训练完成的呼叫对象预测模型中,得到通信网络中所有通信节点的被呼叫概率,被呼叫概率最大的前K个通信节点代表最有可能被呼叫的对象;其中,K为预设值。

Claims (4)

1.基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,包括以下步骤:
步骤1:随机生成通信网络中各通信节点的初始向量
Figure DEST_PATH_IMAGE002A
;其中,|V| 为通信网络中通信节点的总个数;
步骤2:根据通信网络中各用户呼叫历史记录中的通信节点被呼叫的先后顺序构造呼 叫顺序网络G={V,E};其中,V为通信节点集合
Figure DEST_PATH_IMAGE004A
,E为V中各通信节点之间联系的 集合;
步骤3:定义步骤2所得呼叫顺序网络G={V,E}中的一条由起始通信节点
Figure DEST_PATH_IMAGE006A
、其次通信节 点
Figure DEST_PATH_IMAGE008A
和最终通信节点
Figure DEST_PATH_IMAGE010A
组成的通信顺序路径为一个三元组
Figure DEST_PATH_IMAGE012A
Figure DEST_PATH_IMAGE014A
, 根据各用户呼叫历史记录提取三元组集合,作为图表示学习模型的训练集;
步骤4:构造由LSTM循环神经网络和双线性层堆叠而成的图表示学习模型,基于步骤3所得三元组集合对图表示学习模型进行训练,输入为由各三元组的起始通信节点和其次通信节点的初始向量组成的输入序列,训练目标为最终通信节点,训练完成得到所有通信节点的更新后通信节点向量;
步骤5:构造由并行的通信时长-位置加权层和双向-长期短期记忆神经网络,堆叠前馈神经网络和双线性层而成的呼叫对象预测模型,基于所有通信节点的更新后通信节点向量,根据各用户呼叫历史记录获得对应的更新后通信节点向量序列,以训练呼叫对象预测模型,输入为更新后通信节点向量序列除去最后一个更新后通信节点向量的向量序列,训练目标为最后一个更新后通信节点向量,得到含用户呼叫历史中的长短期行为特征的训练完成的呼叫对象预测模型;
步骤6:根据步骤4所得各通信节点的更新后通信节点向量,获得待预测用户历史呼叫记录对应的待预测更新后通信节点向量序列,输入至步骤5所得训练完成的呼叫对象预测模型中,得到通信网络中所有通信节点的被呼叫概率,被呼叫概率最大的前K个通信节点代表最有可能被呼叫的对象;其中,K为预设值。
2.根据权利要求1所述基于表示学习和行为特征的通信网用户呼叫对象预测方法,其 特征在于,步骤4采用批处理训练的方式训练图表示学习模型,一次批处理训练的训练数据 为
Figure DEST_PATH_IMAGE016A
,其中,
Figure DEST_PATH_IMAGE018A
为训练集中第j个三元组的起始通信节 点,
Figure DEST_PATH_IMAGE020A
为训练集中第j个三元组的其次通信节点,
Figure DEST_PATH_IMAGE022A
为训练集中第j个三元组的最终通信 节点,N为一次批处理训练的训练数据中三元组的个数;将
Figure DEST_PATH_IMAGE023A
中各三 元组的起始通信节点和其次通信节点的初始向量组成输入序列
Figure DEST_PATH_IMAGE025AAA
,作 为图表示学习模型中LSTM循环神经网络的输入,最终通信节点
Figure DEST_PATH_IMAGE027A
作为图 表示学习模型的训练目标。
3.根据权利要求2所述基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,步骤4中批处理训练的具体步骤如下:
步骤4.1:将输入序列
Figure DEST_PATH_IMAGE025AAAA
输入至时间步步长为2的LSTM循环神经 网络,得到输入序列
Figure DEST_PATH_IMAGE025AAAAA
在第一时间步和第二时间步的输出,分别 为
Figure DEST_PATH_IMAGE029A
Figure DEST_PATH_IMAGE031A
步骤4.2:将
Figure DEST_PATH_IMAGE033A
输入至双线性层,得到通信网络中各通信 节点的概率分布
Figure DEST_PATH_IMAGE035AA
Figure DEST_PATH_IMAGE037A
其中,
Figure DEST_PATH_IMAGE039A
为图表示学习模型中双线性层的权值矩阵;
Figure DEST_PATH_IMAGE041A
为各通信节点初始向量的 集合的转置;
Figure DEST_PATH_IMAGE043A
为输入为训练集中第j个三元组时,第一个通信节点
Figure DEST_PATH_IMAGE045AA
被预测到的概 率;
Figure DEST_PATH_IMAGE047A
为输入为训练集中第j个三元组时,第二个通信节点
Figure DEST_PATH_IMAGE049A
被预测到的概率;
Figure DEST_PATH_IMAGE051A
为输入为训练集中第j个三元组时,第|V|个通信节点
Figure DEST_PATH_IMAGE053A
被预测到的概率;
步骤4.3:以最终通信节点
Figure DEST_PATH_IMAGE054AAA
为图表示学习模型的训练目标,使用 反向传播算法对图表示学习模型进行训练,并得到更新后通信节点向量
Figure DEST_PATH_IMAGE056A
Figure DEST_PATH_IMAGE058A
,所述 反向传播算法所采用的目标损失函数为
Figure DEST_PATH_IMAGE035AAA
与最终通信节点
Figure DEST_PATH_IMAGE054AAAA
的平均交叉熵损失
Figure DEST_PATH_IMAGE060A
Figure DEST_PATH_IMAGE062A
其中,
Figure DEST_PATH_IMAGE064A
为训练集中第j个三元组的最终通信节点
Figure DEST_PATH_IMAGE054AAAAA
被预测 到的概率。
4.根据权利要求1所述基于表示学习和行为特征的通信网用户呼叫对象预测方法,其特征在于,步骤5中训练呼叫对象预测模型的具体步骤如下:
步骤5.1:基于所有通信节点的更新后通信节点向量,根据随机一条用户呼叫历史记 录,获得对应的更新后通信节点向量序列
Figure DEST_PATH_IMAGE066AA
,将更新后通信节点向量序列
Figure DEST_PATH_IMAGE066AAA
中的
Figure DEST_PATH_IMAGE068A
作为呼叫对象预测模型中通信时长-位置 加权层和双向-长期短期记忆神经网络的输入,
Figure DEST_PATH_IMAGE070AAAA
作为呼叫对象预测模型的训练目标; 其中,T为用户呼叫历史记录的通信节点长度;
步骤5.2:将
Figure DEST_PATH_IMAGE071AA
输入至通信时长-位置加权层,计算用户呼叫历史记 录中各通信节点关于位置和通信时长的长期行为特征
Figure DEST_PATH_IMAGE073AA
Figure DEST_PATH_IMAGE075A
其中,
Figure DEST_PATH_IMAGE077A
为用户呼叫历史记录中第t个更新后通信节点向量;
Figure DEST_PATH_IMAGE079A
为用户呼叫历史记录 中第t个通信节点的通信时长;
步骤5.3:将
Figure DEST_PATH_IMAGE071AAA
输入至时间步步长为T-1的双向-长期短期记忆神 经网络,得到用户最后一个通信节点的前向隐状态输出
Figure DEST_PATH_IMAGE081A
和用户第一个通信节点的后向 隐状态输出
Figure DEST_PATH_IMAGE083A
,拼接得到含用户呼叫历史记录中顺序信息的短期行为特征
Figure DEST_PATH_IMAGE085AA
Figure DEST_PATH_IMAGE087A
其中,
Figure DEST_PATH_IMAGE089A
代表向量拼接;
步骤5.4:将步骤5.2所得长期行为特征
Figure DEST_PATH_IMAGE073AAA
与步骤5.3所得短期行为特征
Figure DEST_PATH_IMAGE090A
输入至前 馈神经网络,得到门控机制输出权重g:
Figure DEST_PATH_IMAGE092A
其中,
Figure DEST_PATH_IMAGE094A
为饱和非线性激活函数;
Figure DEST_PATH_IMAGE096A
为短期行为特征的权重矩阵;
Figure DEST_PATH_IMAGE098
为长期行 为特征的权重矩阵;
Figure DEST_PATH_IMAGE100
为偏置向量;
进一步计算得到长短期行为特征
Figure DEST_PATH_IMAGE102
Figure DEST_PATH_IMAGE104
其中,
Figure DEST_PATH_IMAGE106
代表哈达玛积;
步骤5.5:将长短期行为特征
Figure DEST_PATH_IMAGE102A
输入至呼叫对象预测模型中的双线性层,得到概率预测 结果向量
Figure DEST_PATH_IMAGE108
Figure DEST_PATH_IMAGE110
其中,
Figure DEST_PATH_IMAGE112
为呼叫对象预测模型中双线性层的权重矩阵;
Figure DEST_PATH_IMAGE114
为第一个通信节点
Figure DEST_PATH_IMAGE115A
的 概率预测结果;
Figure DEST_PATH_IMAGE117A
为第二个通信节点
Figure DEST_PATH_IMAGE118A
的概率预测结果;
Figure DEST_PATH_IMAGE120A
为第|V|个通信节点
Figure DEST_PATH_IMAGE121A
的概率预测结果;
步骤5.6:以为训练目标,使用反向传播算法对呼叫对象预测模型进行训练,得到初次 训练后呼叫对象预测模型,所述反向传播算法所采用的目标损失函数为概率预测结果向量
Figure DEST_PATH_IMAGE122A
Figure DEST_PATH_IMAGE070AAAAA
的交叉熵损失:
Figure DEST_PATH_IMAGE124A
其中,
Figure DEST_PATH_IMAGE126
为呼叫对象预测模型训练过程中,训练目标
Figure DEST_PATH_IMAGE070AAAAAA
被预测到的概率;
步骤5.7:基于所有用户呼叫历史记录,重复步骤5.1~步骤5.6,依次对步骤5.6所得初次训练后呼叫对象预测模型进行训练,得到训练完成的呼叫对象预测模型。
CN202110106920.1A 2021-01-27 2021-01-27 基于表示学习和行为特征的通信网用户呼叫对象预测方法 Active CN112446556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110106920.1A CN112446556B (zh) 2021-01-27 2021-01-27 基于表示学习和行为特征的通信网用户呼叫对象预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110106920.1A CN112446556B (zh) 2021-01-27 2021-01-27 基于表示学习和行为特征的通信网用户呼叫对象预测方法

Publications (2)

Publication Number Publication Date
CN112446556A true CN112446556A (zh) 2021-03-05
CN112446556B CN112446556B (zh) 2021-04-30

Family

ID=74739850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110106920.1A Active CN112446556B (zh) 2021-01-27 2021-01-27 基于表示学习和行为特征的通信网用户呼叫对象预测方法

Country Status (1)

Country Link
CN (1) CN112446556B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111217A (zh) * 2021-04-22 2021-07-13 北京达佳互联信息技术有限公司 播放时长预测模型的训练方法、视频推荐方法及装置
CN113395172A (zh) * 2021-05-18 2021-09-14 中国电子科技集团公司第五十四研究所 一种基于通信网的重要用户发现及行为预测方法
CN114418733A (zh) * 2021-12-16 2022-04-29 上海浦东发展银行股份有限公司 一种基于前馈神经网络的摘机最佳时点预测方法及系统

Citations (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1368827A (zh) * 2001-02-09 2002-09-11 华为技术有限公司 一种实现预测呼出的方法
US20090132487A1 (en) * 2007-11-21 2009-05-21 Zvi Haim Lev System and method for video call based content retrieval, directory and web access services
US20100039393A1 (en) * 2008-08-15 2010-02-18 At&T Intellectual Property I, L.P. Text entry on touch screen cellphones by different pressure levels
US20140019207A1 (en) * 2012-07-11 2014-01-16 Sap Ag Interactive in-memory based sales forecasting
US20140278320A1 (en) * 2013-03-15 2014-09-18 Honeywell International Inc. System and method for selecting a respirator
CN104333521A (zh) * 2014-07-25 2015-02-04 广东顺德中山大学卡内基梅隆大学国际联合研究院 Mimo中继通信节点间干扰的迭代式消除方法及系统
CN104378515A (zh) * 2014-12-04 2015-02-25 上海澄美信息服务有限公司 呼叫中心话务量预测方法
CN104469703A (zh) * 2014-12-26 2015-03-25 北京中细软移动互联科技有限公司 一种集群呼叫系统的信道动态分配方法
CN105117773A (zh) * 2015-08-13 2015-12-02 国网浙江省电力公司经济技术研究院 基于模糊评价算法的电力通信光传输网络综合评估方法
CN106056241A (zh) * 2016-05-26 2016-10-26 中国太平洋保险(集团)股份有限公司 一种基于大数据预测用户行为的控制方法及装置
CN106657693A (zh) * 2017-01-13 2017-05-10 深圳市彬讯科技有限公司 一种呼叫系统预测式外呼方法及系统
CN106735954A (zh) * 2016-12-08 2017-05-31 大同煤矿集团有限责任公司 一种基于互联网的复合焦点时空同步钻孔控制系统
CN108388923A (zh) * 2018-03-08 2018-08-10 深圳市唯特视科技有限公司 一种基于对象检测器和递归神经网络的统一图解析网络
CN108432278A (zh) * 2015-12-01 2018-08-21 捷德移动安全有限责任公司 具有多个配置文件并针对验证命令设计的用户身份模块
CN108650426A (zh) * 2018-02-08 2018-10-12 中移在线服务有限公司 一种呼叫中心预测外呼方法及系统
CN108668265A (zh) * 2017-12-29 2018-10-16 西安电子科技大学 基于循环神经网络预测移动用户间相遇概率的方法
CN109451757A (zh) * 2016-06-21 2019-03-08 品点预测股份有限公司 在保持用户匿名的同时使用机器学习从行为数据预测心理度量简档
US20190128686A1 (en) * 2017-10-26 2019-05-02 International Business Machines Corporation Assessing personalized risk for a user on a journey
CN110765353A (zh) * 2019-10-16 2020-02-07 腾讯科技(深圳)有限公司 项目推荐模型的处理方法、装置、计算机设备和存储介质
US20200090289A1 (en) * 2017-05-25 2020-03-19 Johnson Controls Technology Company Model predictive maintenance system with integrated measurement and verification functionality
CN110928993A (zh) * 2019-11-26 2020-03-27 重庆邮电大学 基于深度循环神经网络的用户位置预测方法及系统
US20200145532A1 (en) * 2018-11-06 2020-05-07 Microsoft Technology Licensing, Llc Sequenced device alerting
US20200175285A1 (en) * 2018-11-29 2020-06-04 Toyota Jidosha Kabushiki Kaisha Information processing system, method of information processing, and program
CN111860691A (zh) * 2020-07-31 2020-10-30 福州大学 基于注意力和循环神经网络的专业立体视频视觉舒适度分类方法
CN111901485A (zh) * 2020-08-12 2020-11-06 中国银行股份有限公司 外呼系统的控制方法及装置
CN111901258A (zh) * 2020-05-08 2020-11-06 中兴通讯股份有限公司 上下行信道互易的实现方法、通信节点和存储介质
CN112132697A (zh) * 2020-08-21 2020-12-25 思藤(深圳)科技咨询有限公司 一种时空动态农业活动生命周期环境影响评估方法及在线平台系统
CN112163167A (zh) * 2020-11-10 2021-01-01 平安普惠企业管理有限公司 基于大数据平台的智能决策方法、系统、设备及介质

Patent Citations (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1368827A (zh) * 2001-02-09 2002-09-11 华为技术有限公司 一种实现预测呼出的方法
US20090132487A1 (en) * 2007-11-21 2009-05-21 Zvi Haim Lev System and method for video call based content retrieval, directory and web access services
US20100039393A1 (en) * 2008-08-15 2010-02-18 At&T Intellectual Property I, L.P. Text entry on touch screen cellphones by different pressure levels
US20140019207A1 (en) * 2012-07-11 2014-01-16 Sap Ag Interactive in-memory based sales forecasting
US20140278320A1 (en) * 2013-03-15 2014-09-18 Honeywell International Inc. System and method for selecting a respirator
CN104333521A (zh) * 2014-07-25 2015-02-04 广东顺德中山大学卡内基梅隆大学国际联合研究院 Mimo中继通信节点间干扰的迭代式消除方法及系统
CN104378515A (zh) * 2014-12-04 2015-02-25 上海澄美信息服务有限公司 呼叫中心话务量预测方法
CN104469703A (zh) * 2014-12-26 2015-03-25 北京中细软移动互联科技有限公司 一种集群呼叫系统的信道动态分配方法
CN105117773A (zh) * 2015-08-13 2015-12-02 国网浙江省电力公司经济技术研究院 基于模糊评价算法的电力通信光传输网络综合评估方法
CN108432278A (zh) * 2015-12-01 2018-08-21 捷德移动安全有限责任公司 具有多个配置文件并针对验证命令设计的用户身份模块
CN106056241A (zh) * 2016-05-26 2016-10-26 中国太平洋保险(集团)股份有限公司 一种基于大数据预测用户行为的控制方法及装置
CN109451757A (zh) * 2016-06-21 2019-03-08 品点预测股份有限公司 在保持用户匿名的同时使用机器学习从行为数据预测心理度量简档
CN106735954A (zh) * 2016-12-08 2017-05-31 大同煤矿集团有限责任公司 一种基于互联网的复合焦点时空同步钻孔控制系统
CN106657693A (zh) * 2017-01-13 2017-05-10 深圳市彬讯科技有限公司 一种呼叫系统预测式外呼方法及系统
US20200090289A1 (en) * 2017-05-25 2020-03-19 Johnson Controls Technology Company Model predictive maintenance system with integrated measurement and verification functionality
US20190128686A1 (en) * 2017-10-26 2019-05-02 International Business Machines Corporation Assessing personalized risk for a user on a journey
CN108668265A (zh) * 2017-12-29 2018-10-16 西安电子科技大学 基于循环神经网络预测移动用户间相遇概率的方法
CN108650426A (zh) * 2018-02-08 2018-10-12 中移在线服务有限公司 一种呼叫中心预测外呼方法及系统
CN108388923A (zh) * 2018-03-08 2018-08-10 深圳市唯特视科技有限公司 一种基于对象检测器和递归神经网络的统一图解析网络
US20200145532A1 (en) * 2018-11-06 2020-05-07 Microsoft Technology Licensing, Llc Sequenced device alerting
US20200175285A1 (en) * 2018-11-29 2020-06-04 Toyota Jidosha Kabushiki Kaisha Information processing system, method of information processing, and program
CN110765353A (zh) * 2019-10-16 2020-02-07 腾讯科技(深圳)有限公司 项目推荐模型的处理方法、装置、计算机设备和存储介质
CN110928993A (zh) * 2019-11-26 2020-03-27 重庆邮电大学 基于深度循环神经网络的用户位置预测方法及系统
CN111901258A (zh) * 2020-05-08 2020-11-06 中兴通讯股份有限公司 上下行信道互易的实现方法、通信节点和存储介质
CN111860691A (zh) * 2020-07-31 2020-10-30 福州大学 基于注意力和循环神经网络的专业立体视频视觉舒适度分类方法
CN111901485A (zh) * 2020-08-12 2020-11-06 中国银行股份有限公司 外呼系统的控制方法及装置
CN112132697A (zh) * 2020-08-21 2020-12-25 思藤(深圳)科技咨询有限公司 一种时空动态农业活动生命周期环境影响评估方法及在线平台系统
CN112163167A (zh) * 2020-11-10 2021-01-01 平安普惠企业管理有限公司 基于大数据平台的智能决策方法、系统、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程晓涛 等: ""基于多维多粒度分析的电信网用户行为模式挖掘"", 《网络与信息安全学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111217A (zh) * 2021-04-22 2021-07-13 北京达佳互联信息技术有限公司 播放时长预测模型的训练方法、视频推荐方法及装置
CN113111217B (zh) * 2021-04-22 2024-02-27 北京达佳互联信息技术有限公司 播放时长预测模型的训练方法、视频推荐方法及装置
CN113395172A (zh) * 2021-05-18 2021-09-14 中国电子科技集团公司第五十四研究所 一种基于通信网的重要用户发现及行为预测方法
CN114418733A (zh) * 2021-12-16 2022-04-29 上海浦东发展银行股份有限公司 一种基于前馈神经网络的摘机最佳时点预测方法及系统

Also Published As

Publication number Publication date
CN112446556B (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
CN112446556B (zh) 基于表示学习和行为特征的通信网用户呼叫对象预测方法
Zhao et al. A novel intrusion detection method based on lightweight neural network for internet of things
Solomatine et al. Data-driven modelling: concepts, approaches and experiences
Jain et al. Data mining techniques: a survey paper
Gwon et al. Network intrusion detection based on LSTM and feature embedding
CN109657837A (zh) 违约概率预测方法、装置、计算机设备和存储介质
Lyu et al. A novel attribute reconstruction attack in federated learning
Gallicchio et al. Randomized Machine Learning Approaches: Recent Developments and Challenges.
CN112153221B (zh) 一种基于社交网络图计算的通信行为识别方法
Xia et al. Traffic prediction based on ensemble machine learning strategies with bagging and lightgbm
Arora et al. A study of applications of RBF network
CN115409155A (zh) 基于Transformer增强霍克斯过程的信息级联预测系统及方法
He et al. Transferrable model-agnostic meta-learning for short-term household load forecasting with limited training data
CN113283902A (zh) 一种基于图神经网络的多通道区块链钓鱼节点检测方法
Liu et al. AGRM: attention-based graph representation model for telecom fraud detection
Liu et al. A network intrusion detection method based on CNN and CBAM
Mehrabian et al. A dynamic Bernstein graph recurrent network for wireless cellular traffic prediction
CN114896977A (zh) 一种物联网实体服务信任值的动态评估方法
CN111402028A (zh) 一种信息处理方法、装置及设备
CN109033288A (zh) 一种基于bp神经网络的智能终端安全等级分类方法
CN116523001A (zh) 电网薄弱线路识别模型构建方法、装置和计算机设备
Geng et al. A LSTM based campus network traffic prediction system
CN112906831B (zh) 一种结合网络结构与属性特征的通信网用户分类方法
CN114706977A (zh) 基于动态多跳图注意力网络的谣言检测方法及系统
Hou et al. DAG-Aware Variational Autoencoder for Social Propagation Graph Generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant