CN108053328A - 一种主叫号码对碎屏险业务需求的检测方法 - Google Patents

一种主叫号码对碎屏险业务需求的检测方法 Download PDF

Info

Publication number
CN108053328A
CN108053328A CN201711330643.2A CN201711330643A CN108053328A CN 108053328 A CN108053328 A CN 108053328A CN 201711330643 A CN201711330643 A CN 201711330643A CN 108053328 A CN108053328 A CN 108053328A
Authority
CN
China
Prior art keywords
firefly
calling number
neural network
basis function
radial basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711330643.2A
Other languages
English (en)
Other versions
CN108053328B (zh
Inventor
周兆全
邵延富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jing Heart Polytron Technologies Inc
Original Assignee
Guangzhou Jing Heart Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jing Heart Polytron Technologies Inc filed Critical Guangzhou Jing Heart Polytron Technologies Inc
Priority to CN201711330643.2A priority Critical patent/CN108053328B/zh
Publication of CN108053328A publication Critical patent/CN108053328A/zh
Application granted granted Critical
Publication of CN108053328B publication Critical patent/CN108053328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种主叫号码对碎屏险业务需求的检测方法。建立基于径向基函数神经网络的碎屏险检测模型;设计了所述径向基函数神经网络的输入、输出变量;设计了改进萤火虫算法计算初始化径向基函数神经网络参数,提高所述径向基函数神经网络的精度和收敛速度;分别提出了建立训练数据集和验证数据集的方法,提高训练效率;通过计算所述径向基函数神经网络的识别效果评估值,以识别效果评估值最大的径向基函数神经网络判别主叫号码是需要碎屏险电话、还是正常电话、还是疑似需要碎屏险电话。本发明提出的主叫号码对碎屏险业务需求的检测方法,计算速度快、推荐效果好,较好地满足手机碎屏险推荐需要。

Description

一种主叫号码对碎屏险业务需求的检测方法
技术领域
本发明属于通信大数据领域,具体涉及一种主叫号码对碎屏险业务需求的检测方法。
背景技术
随着手机屏幕的增大,手机屏幕遭遇风险的几率也随之提升,对应手机屏幕这个“瓷娃娃”的碎屏险业务也应运而生。
手机碎屏险业务是指消费者购买了手机碎屏险之后,可以在预定条件内享受相关公司为手机更换屏幕费用买单的服务。
为了针对性的进行推介,进而有效降低用户手机碎屏成本。当前亟待解决的问题是如何将已有的碎屏险号码通话属性进行分析,检测出需要手机碎屏险的号码。
发明内容
本发明的目的是为了解决目前现有的技术存在的不足,提出了一种改进萤火虫算法优化径向基函数神经网络主叫号码对碎屏险业务需求的检测方法。通过建立更能体现手机碎屏险推荐的数学模型,并提出了改进萤火虫算法优化径向基函数神经网络对问题进行求解,对用户是否需要手机碎屏险进行推荐。
一种主叫号码对碎屏险业务需求的检测方法,包括以下步骤:
S1、建立基于径向基函数神经网络的碎屏险检测模型:
其中,x1,x2,...,xn为输入变量,n=12为输入层节点数,ykj(k=1,2,...,n,j=1,2,...,m)为第k个输入样本对应的输出;wij(i=1,2...M,j=1,2,...,m)为隐含层至输出层的权值;m为输出向量的维数;M为隐含层节点数。φ(xk,ci)(k=1,2,...,n,i=1,2,...M)表示径向基函数(采用高斯函数),如式(2)
其中:σi为高斯函数的标准差;xk为第k个输入样本;ci为基函数中心;||xk-ci||为样本与中心的欧式距离。
S2、定义输入变量、输出变量,进一步包含如下步骤:
S2-1:定义式(1)所述径向基函数神经网络的输入变量,进一步包括:
式(1)所述x1,x2,...,xn为指定主叫号码在连续30天中的相关统计数据,其中
x1:7时至8时30分的呼叫次数;
x2:8时30分至10时30分的呼叫次数;
x3:10时30分至12时的呼叫次数;
x4:12时至14时的呼叫次数;
x5:14时至17时30分的呼叫次数;
x6:17时30分至18时的呼叫次数;
x7:18时至19时的呼叫次数;
x8:19时至22时的呼叫次数;
x9:22时至次日7时的呼叫次数;
x10:总呼叫次数;
x11:主叫所呼号码总数;
x12:主叫总通话时间。
S2-2:定义式(1)所述径向基函数神经网络检测模型输出层节点的输出变量y:y(0≤y≤1)为所述主叫号码需要碎屏险的置信度,即所述主叫号码需要碎屏险的概率。
S3、设计改进萤火虫算法,计算初始化径向基函数神经网络参数:ci,σi,wij,(i=1,2...M,j=1,2,...,m)。具体步骤:
S3-1:编码萤火虫个体:将初始化径向基函数神经网络参数ci,σi,wij(i=1,2...M,j=1,2,...,m)作为一个整体参数进行编码,每一个个体都包含了径向基函数神经网络所有的基函数中心、高斯函数标准差和隐含-输出层的权值。
S3-2:设置算法控制参数:随机生成n个萤火虫,形成初始的萤火虫种群,设置每个萤火虫的初始荧光素L0,感知半径Rs,初始步长s,最大步长smax,最小步长smin,荧光素挥发系数ρ,荧光素的更新率γ,令迭代技术器初始值t=0,设定算法的最大迭代次数tmax
S3-3:确定适应度函数:以正则化均方根误差作为萤火虫的适应度函数,如式(3)
其中:L为预测样本数;σ表示时间序列的标准方差;tp为第p个样本的期望输出;yp为第p个样本的实际输出。
S3-4:荧光素更新。更新每个萤火虫在第t代的荧光素值,如式(4)
li(t+1)=(1-ρ)li(t)+γf(xi(t+1)) (4)
其中li(t+1)表示第t+1次迭代中,萤火虫i的荧光素值;ρ为(0,1)的常数,表示控制荧光素值的参数。γ为常数,表示荧光素的更新率,f(xi(t+1))为适应度函数值;
S3-5:更新萤火虫位置。当萤火虫i找到具有更高荧光素值的萤火虫j时,如两者之间的距离小于决策半径时,则萤火虫i以式(5)的概率向萤火虫j移动;
其中,Pij为萤火虫i向萤火虫j移动的概率,是在决策半径内荧光素高的萤火虫个数,xj(t)表示第t代的第j个萤火虫的位置。
S3-5:自适应更新步长的策略。根据t对步长进行自适应更新,最后根据位置更新公式(6)对萤火虫位置进行更新。
其中s为移动步长,rand(0,1)为服从0到1的均匀分布函数,gsomax为整个萤火虫种群中适应度最大的萤火虫,并利用适应度函数,根据式(3)计算更新后位置目标函数值,进而更新全局最优值。
S3-6:更新决策域的范围。根据公式计算第i个萤火虫的动态决策域。其中为第i个萤火虫在t+1代的决策半径,Rs为感知半径,β为控制参数,nt为萤火虫周围邻居数目的阈值。
S3-7:若迭代次数超过了最大迭代次数tmax,或者达到设置的精度要求,则退出操作,否则返回到S3-4。
S3-8:解码最优个体。对萤火虫种群个体解码,得到ci,σi,wij(i=1,2,…,M;j=1,2,…,m)。
S4、建立训练数据集S和验证数据集T。
S4-1:S和T来源于连续30天的通话记录。
S4-2:计算30天的通话记录的主叫号码集合为U、需要碎屏险主叫号码集合为P、疑似需要碎屏险主叫号码集合为Q、正常主叫号码(即既非需要碎屏险电话,也非疑似需要碎屏险电话)集合为R。
S4-3:定义置信度:P中元素置信度定为1、Q中元素置信度定为random(40,60)*0.01、R中元素置信度定为0。
S4-4:确定训练数据集S,进一步包括:
S4-4-1:确定S中的需要碎屏险主叫号码集合SP,SP中元素的个数为min{[|P|*0.9],3000},SP中的元素随机地在P中选取。
S4-4-2:确定S中的疑似需要碎屏险主叫号码集合SQ,SQ中元素的个数为min{[|Q|*0.25],750},SQ中的元素随机地在Q中选取。
S4-4-3:确定S中的正常主叫号码集合SR,SR中元素的个数为min{[|R|*0.9],3000},SR中的元素随机地在R中选取。
S4-5:确定验证数据集T,进一步包括:
S4-5-1:确定T中需要碎屏险主叫号码集合TP,TP中元素的个数为min{[|P|*0.12],100},TP中的元素随机地在P-SP中选取。
S4-5-2:确定T中的疑似需要碎屏险主叫号码集合TQ,TQ中元素的个数为min{[|Q|*0.1],100},TQ中的元素随机地在Q-SQ中选取。
S4-5-3:确定T中的正常主叫号码集合TR,TR中元素的个数为min{[|R|*0.1],100},TR中的元素随机地在R-SR中选取。
S5、利用S中主叫号码和S3产生的初始值,对所述径向基函数神经网络进行训练。
S6、利用T中对所述反向传播神经网络进行验证,包括如下步骤:
S6-1:计算T中需要碎屏险主叫号码识别准确的主叫号码集合TP1。进一步包括:
TP1={x|x∈TP,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不小于0.75}
S6-2:计算T中疑似需要碎屏险主叫号码识别准确的主叫号码集合TQ1。进一步包括:
TQ1={x|x∈TQ,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y小于0.75、大于0.25}
S6-3:计算T中正常主叫号码识别准确的主叫号码集合TR1,进一步包括:
TR1={x|x∈TR,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不大于0.25}
S7、计算所述径向基函数神经网络的识别效果评估值进一步包括:
S8、S4~S7执行10次,记识别效果评估值最大的径向基函数神经网络OptAN。
S9、将待识别的主叫号码x对应的相关统计数据x1,x2,..,xn输入到OptAN;
S10、计算OptAN的输出y,如果y≥0.75,则主叫号码x为碎屏险电话;如果y≤0.25,则主叫号码x为正常电话;如果0.25<y<0.75,则主叫号码x为疑似碎屏险电话。
可选的,
步骤S2定义式(1)所述径向基函数神经网络的输入、输出变量,进一步包括:
S2-1:定义式(1)所述径向基函数神经网络的输入变量,进一步包括:
式(1)所述x1,x2,...,xn为指定主叫号码在连续30天中的相关统计数据,其中
x1:7时至8时30分的呼叫次数;
x2:8时30分至10时30分的呼叫次数;
x3:10时30分至12时的呼叫次数;
x4:12时至14时的呼叫次数;
x5:14时至17时30分的呼叫次数;
x6:17时30分至18时的呼叫次数;
x7:18时至19时的呼叫次数;
x8:19时至22时的呼叫次数;
x9:22时至次日7时的呼叫次数;
x10:总呼叫次数;
x11:主叫所呼号码总数;
x12:主叫总通话时间;
S2-2:定义式(1)所述径向基函数神经网络检测模型输出层节点的输出变量y:y(0≤y≤1)为所述主叫号码需要碎屏险的置信度,即所述主叫号码需要碎屏险的概率。
可选的,
步骤S4建立训练数据集S和验证数据集T,进一步包括:
S4-1:S和T来源于连续30天的通话记录;
S4-2:计算30天的通话记录的主叫号码集合为U、需要碎屏险主叫号码集合为P、疑似需要碎屏险主叫号码集合为Q、正常主叫号码(即既非需要碎屏险电话,也非疑似需要碎屏险电话)集合为R;
S4-3:定义置信度:P中元素置信度定为1、Q中元素置信度定为random(40,60)*0.01、R中元素置信度定为0;
S4-4:确定训练数据集S;
S4-5:确定验证数据集T。
可选的,
步骤S7计算所述径向基函数神经网络的识别效果评估值进一步包括:
可选的,
步骤S4-4确定训练数据集S,进一步包括:
S4-4-1:确定S中的需要碎屏险主叫号码集合SP,SP中元素的个数为min{[|P|*0.9],3000},SP中的元素随机地在P中选取;
S4-4-2:确定S中的疑似需要碎屏险主叫号码集合SQ,SQ中元素的个数为min{[|Q|*0.25],750},SQ中的元素随机地在Q中选取;
S4-4-3:确定S中的正常主叫号码集合SR,SR中元素的个数为min{[|R|*0.9],3000},SR中的元素随机地在R中选取。
可选的,
步骤S4-5确定验证数据集T,进一步包括:
S4-5-1:确定T中需要碎屏险主叫号码集合TP,TP中元素的个数为min{[|P|*0.12],100},TP中的元素随机地在P-SP中选取;
S4-5-2:确定T中的疑似需要碎屏险主叫号码集合TQ,TQ中元素的个数为min{[|Q|*0.1],100},TQ中的元素随机地在Q-SQ中选取;
S4-5-3:确定T中的正常主叫号码集合TR,TR中元素的个数为min{[|R|*0.1],100},TR中的元素随机地在R-SR中选取。
本发明实施例中,选择RBF径向基神经网络是因为它是一种性能优良的前向网络,具有无局部极小值问题,唯一最优逼近等优点,将RBF径向基神经网络与碎屏险推荐结合,从而起到很好的预测效果。选择萤火虫算法可以更快速、准确的找到RBF神经网络的网络参数基函数中心、高斯函数标准差和隐含-输出层的权值,所找的个体为最优值。
附图说明
图1为本发明的本发明专利流程图。
具体实施方式
结合附图说明来说明本发明的具体实施方式,为了证明本发明的优越性,本发明对电话通话记录进行训练和验证。本发明的一种主叫号码对碎屏险业务需求的检测方法的具体实施案例实施步骤如下:
S1、获取电话通话记录数据。将获取电话通话记录数据进行数据预处理后,将30天通话记录数据作为训练数据集和验证数据集,将一部分数据训练径向基函数神经网络连接权值以及基函数中心和高斯函数标准差参数构建径向基函数神经网络碎屏险检测模型,再对另一部分数据的主叫号码的通话记录实行单点单步识别。
S2、建立基于径向基函数神经网络的碎屏险检测模型:
其中,x1,x2,...,xn为输入变量,n=12为输入层节点数,ykj(k=1,2,...,n,j=1,2,...,m)为第k个输入样本对应的输出;wij(i=1,2...M,j=1,2,...,m)为隐含层至输出层 的权值;m为输出向量的维数;M为隐含层节点数(本发明专利案例为5个)。
φ(xk,ci)(k=1,2,...,n,i=1,2,...M)表示径向基函数(采用高斯函数),如式(2)
其中:σi为高斯函数的标准差;xk为第k个输入样本;ci为基函数中心;||xk-ci||为样本与中心的欧式距离。
S3、定义输入变量、输出变量,进一步包含如下步骤:
S3-1:定义式(1)所述径向基函数神经网络的输入变量,进一步包括:
式(1)所述x1,x2,...,xn为指定主叫号码在连续30天中的相关统计数据,其中
x1:7时至8时30分的呼叫次数;
x2:8时30分至10时30分的呼叫次数;
x3:10时30分至12时的呼叫次数;
x4:12时至14时的呼叫次数;
x5:14时至17时30分的呼叫次数;
x6:17时30分至18时的呼叫次数;
x7:18时至19时的呼叫次数;
x8:19时至22时的呼叫次数;
x9:22时至次日7时的呼叫次数;
x10:总呼叫次数;
x11:主叫所呼号码总数;
x12:主叫总通话时间。
S3-2:定义式(1)所述径向基函数神经网络检测模型输出层节点的输出变量y:y(0 ≤y≤1)为所述主叫号码需要碎屏险的置信度,即所述主叫号码需要碎屏险的概率
S4、设计改进萤火虫算法,计算初始化径向基函数神经网络参数:ci,σi,wij,(i=1,2...M,j=1,2,...,m),具体步骤:
S4-1:编码萤火虫个体:将初始化径向基函数神经网络参数ci,σi,wij(i=1,2...M,j=1,2,...,m)作为一个整体参数进行编码,每一个个体都包含了径向基函数神经网络所有的基函数中心、高斯函数标准差和隐含-输出层的权值。
S4-2:设置算法控制参数:随机生成n个萤火虫,形成初始的萤火虫种群,设置每个萤火虫的初始荧光素L0,感知半径Rs,初始步长s,最大步长smax,最小步长smin,荧光素挥发系数ρ,荧光素的更新率γ,令迭代技术器初始值t=0,设定算法的最大迭代次数tmax
S4-3:确定适应度函数:以正则化均方根误差作为萤火虫的适应度函数,如式(3)
其中:L为预测样本数;σ表示时间序列的标准方差;tp为第p个样本的期望输出;yp为第p个样本的实际输出。
S4-4:荧光素更新。更新每个萤火虫在第t代的荧光素值,如式(4)
li(t+1)=(1-ρ)li(t)+γf(xi(t+1)) (4)
其中li(t+1)表示第t+1次迭代中,萤火虫i的荧光素值;ρ为(0,1)的常数,表示控制荧光素值的参数。γ为常数,表示荧光素的更新率,f(xi(t+1))为适应度函数值;
S4-5:更新萤火虫位置。当萤火虫i找到具有更高荧光素值的萤火虫j时,如两者之间的距离小于决策半径时,则萤火虫i以式(5)的概率向萤火虫j移动;
其中,Pij为萤火虫i向萤火虫j移动的概率,是在决策半径内荧光素高的萤火虫个数,xj(t)表示第t代的第j个萤火虫的位置。
S4-5:自适应更新步长的策略。根据t对步长进行自适应更新,最后根据位置更新公式(6)对萤火虫位置进行更新。
其中s为移动步长,rand(0,1)为服从0到1的均匀分布函数,gsomax为整个萤火虫种群中适应度最大的萤火虫,并利用适应度函数,根据式(3)计算更新后位置目标函数值,进而更新全局最优值。
S4-6:更新决策域的范围。根据公式计算第i个萤火虫的动态决策域。其中为第i个萤火虫在t+1代的决策半径,Rs为感知半径,β为控制参数,nt为萤火虫周围邻居数目的阈值。
S4-7:若迭代次数超过了最大迭代次数tmax,或者达到设置的精度要求,则退出操作,否则返回到S4-4。
S4-8:解码最优个体。对萤火虫种群个体解码,得到ci,σi,wij(i=1,2,…,M;j=1,2,…,m)。
S5、建立训练数据集S和验证数据集T。
S5-1:S和T来源于连续30天的通话记录。
S5-2:计算30天的通话记录的主叫号码集合为U、需要碎屏险主叫号码集合为P、疑似需要碎屏险主叫号码集合为Q、正常主叫号码(即既非需要碎屏险电话,也非疑似需要碎屏险电话)集合为R。
S5-3:定义置信度:P中元素置信度定为1、Q中元素置信度定为random(40,60)*0.01、R中元素置信度定为0。
S5-4:确定训练数据集S,进一步包括:
S5-4-1:确定S中的需要碎屏险主叫号码集合SP,SP中元素的个数为min{[|P|*0.9],3000},SP中的元素随机地在P中选取(本发明专利案例为2700个)。
S5-4-2:确定S中的疑似需要碎屏险主叫号码集合SQ,SQ中元素的个数为min{[|Q|*0.25],750},SQ中的元素随机地在Q中选取(本发明专利案例为700个)。
S5-4-3:确定S中的正常主叫号码集合SR,SR中元素的个数为min{[|R|*0.9],3000},SR中的元素随机地在R中选取(本发明专利案例为2930个)。
S5-5:确定验证数据集T,进一步包括:
S5-5-1:确定T中需要碎屏险主叫号码集合TP,TP中元素的个数为min{[|P|*0.12],100},TP中的元素随机地在P-SP中选取(本发明专利案例为80个)。
S5-5-2:确定T中的疑似需要碎屏险主叫号码集合TQ,TQ中元素的个数为min{[|Q|*0.1],100},TQ中的元素随机地在Q-SQ中选取(本发明专利案例为60个)。
S5-5-3:确定T中的正常主叫号码集合TR,TR中元素的个数为min{[|R|*0.1],100},TR中的元素随机地在R-SR中选取(本发明专利案例为70个)。
S6、利用S中主叫号码和S4产生的初始值,对所述径向基函数神经网络进行训练。
S7、利用T中对所述反向传播神经网络进行验证,包括如下步骤:
S7-1:计算T中碎屏险主叫号码识别准确的主叫号码集合TP1,进一步包括:
TP1={x|x∈TP,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不小于0.75}
S7-2:计算T中疑似碎屏险主叫号码识别准确的主叫号码集合TQ1,进一步包括:
TQ1={x|x∈TQ,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y小于0.75、大于0.25}
S7-3:计算T中正常主叫号码识别准确的主叫号码集合TR1,进一步包括:
TR1={x|x∈TR,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不大于0.25}
S8、计算所述径向基函数神经网络的识别效果评估值进一步包括:
S9、S5~S8执行10次,记识别效果评估值最大的径向基函数神经网络OptAN。
S10、利用OptAN识别主叫号码是需要碎屏险电话、还是正常电话、还是疑似需要碎屏险电话。进一步包括:
S10-1、将待识别的主叫号码x对应的相关统计数据x1,x2,..,xn输入到OptAN;
S10-2、计算OptAN的输出y;
S10-3、如果y≥0.75,则主叫号码x为碎屏险电话;如果y≤0.25,则主叫号码x为正常电话;如果0.25<y<0.75,则主叫号码x为疑似碎屏险电话。
S11、结束。
本发明提出的一种主叫号码对碎屏险业务需求的检测方法,建立基于径向基函数神经网络的碎屏险检测模型,设计了改进萤火虫算法来优化径向基函数神经网络初始化径向基函数神经网络参数,提高所述径向基函数神经网络的精度和收敛速度;本发明提出的一种主叫号码对碎屏险业务需求的检测方法以较高的速度和精度识别主叫号码是需要碎屏险电话、还是正常电话、还是疑似需要碎屏险电话,在用户手机碎屏险推荐时有很好效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统可以通过其它的方式实现。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种主叫号码对碎屏险业务需求的检测方法,其特征在于,包括:
S1、建立基于径向基函数神经网络的碎屏险检测模型:
<mrow> <msub> <mi>y</mi> <mrow> <mi>k</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>&amp;phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>,</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>m</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,x1,x2,...,xn为输入变量,n为输入层节点数,ykj(k=1,2,...,n,j=1,2,...,m)为第k个输入样本对应的输出;
wij(i=1,2...M,j=1,2,...,m)为隐含层至输出层的权值;m为输出向量的维数;M为隐含层节点数;
φ(xk,ci)(k=1,2,...,n,i=1,2,...M)表示径向基函数;
<mrow> <mi>&amp;phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>,</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <mn>2</mn> <msubsup> <mi>&amp;sigma;</mi> <mi>i</mi> <mn>2</mn> </msubsup> </mrow> </mfrac> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>-</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中:σi为高斯函数的标准差;
xk为第k个输入样本;
ci为基函数中心;
||xk-ci||为样本与中心的欧式距离;
S2、定义式(1)所述径向基函数神经网络输入变量、输出变量;
S3、设计改进萤火虫算法,计算初始化径向基函数神经网络参数:ci,σi,wij,(i=1,2...M,j=1,2,...,m),具体步骤:
S3-1:编码萤火虫个体:将初始化径向基函数神经网络参数ci,σi,wij(i=1,2...M,j=1,2,...,m)作为一个整体参数进行编码,每一个个体都包含了径向基函数神经网络所有的基函数中心、高斯函数标准差和隐含-输出层的权值;
S3-2:设置算法控制参数:随机生成n个萤火虫,形成初始的萤火虫种群,设置每个萤火虫的初始荧光素L0,感知半径Rs,初始步长s,最大步长smax,最小步长smin,荧光素挥发系数ρ,荧光素的更新率γ,令迭代技术器初始值t=0,设定算法的最大迭代次数tmax
S3-3:确定适应度函数:以正则化均方根误差作为萤火虫的适应度函数,如式(3)
<mrow> <mi>f</mi> <mo>=</mo> <msqrt> <mrow> <mfrac> <mn>1</mn> <mrow> <mo>(</mo> <mi>L</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> <msup> <mi>&amp;sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>S</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>p</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
其中:L为预测样本数;σ表示时间序列的标准方差;tp为第p个样本的期望输出;yp为第p个样本的实际输出;
S3-4:荧光素更新;更新每个萤火虫在第t代的荧光素值,如式(4)
li(t+1)=(1-ρ)li(t)+γf(xi(t+1)) (4)
其中li(t+1)表示第t+1次迭代中,萤火虫i的荧光素值;ρ为(0,1)的常数,表示控制荧光素值的参数;γ为常数,表示荧光素的更新率,f(xi(t+1))为适应度函数值;
S3-5:更新萤火虫位置;当萤火虫i找到具有更高荧光素值的萤火虫j时,如两者之间的距离小于决策半径时,则萤火虫i以式(5)的概率向萤火虫j移动;
<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>l</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </munder> <msub> <mi>l</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中,Pij为萤火虫i向萤火虫j移动的概率,是在决策半径内荧光素高的萤火虫个数,xj(t)表示第t代的第j个萤火虫的位置;
S3-5:自适应更新步长的策略;根据t对步长进行自适应更新,最后根据位置更新公式(6)对萤火虫位置进行更新;
<mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>s</mi> <mfrac> <mrow> <msub> <mi>x</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>+</mo> <mi>r</mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <mrow> <mo>(</mo> <msub> <mi>gso</mi> <mrow> <mi>max</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>
其中s为移动步长,rand(0,1)为服从0到1的均匀分布函数,gsomax为整个萤火虫种群中适应度最大的萤火虫,并利用适应度函数,根据式(3)计算更新后位置目标函数值,进而更新全局最优值;
S3-6:更新决策域的范围;根据公式计算第i个萤火虫的动态决策域;其中为第i个萤火虫在t+1代的决策半径,Rs为感知半径,β为控制参数,nt为萤火虫周围邻居数目的阈值;
S3-7:若迭代次数超过了最大迭代次数tmax,或者达到设置的精度要求,则退出操作,否则返回到S3-4;
S3-8:解码最优个体;对萤火虫种群个体解码,得到ci,σi,wij(i=1,2,…,M;j=1,2,…,m);
S4、建立训练数据集S和验证数据集T;
S5、利用S中主叫号码和S3产生的初始值,对所述径向基函数神经网络进行训练;
S6、利用T中对所述反向传播神经网络进行验证,包括如下步骤:
S6-1:计算T中需要碎屏险主叫号码识别准确的主叫号码集合TP1,进一步包括:
TP1={x|x∈TP,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不小于0.75};
S6-2:计算T中疑似需要碎屏险主叫号码识别准确的主叫号码集合TQ1,进一步包括:
TQ1={x|x∈TQ,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y小于0.75、大于0.25};
S6-3:计算T中正常主叫号码识别准确的主叫号码集合TR1,进一步包括:
TR1={x|x∈TR,且x对应的相关统计数据x1,x2,..,xn作为所述径向基函数神经网络输入时,对应的输出值y不大于0.25};
S7、计算所述径向基函数神经网络的识别效果评估值
S8、S4~S7执行至少一次,记识别效果评估值最大的径向基函数神经网络OptAN;
S9、将待识别的主叫号码x对应的相关统计数据x1,x2,..,xn输入到OptAN;
S10、计算OptAN的输出y,如果y≥0.75,则主叫号码x为碎屏险电话;如果y≤0.25,则主叫号码x为正常电话;如果0.25<y<0.75,则主叫号码x为疑似碎屏险电话。
2.根据权利要求1所述的主叫号码对碎屏险业务需求的检测方法,其特征在于,所述的步骤S2定义式(1)所述径向基函数神经网络的输入、输出变量,进一步包括:
S2-1:定义式(1)所述径向基函数神经网络的输入变量,进一步包括:
式(1)所述x1,x2,...,xn为指定主叫号码在连续30天中的相关统计数据,其中,
x1:7时至8时30分的呼叫次数;
x2:8时30分至10时30分的呼叫次数;
x3:10时30分至12时的呼叫次数;
x4:12时至14时的呼叫次数;
x5:14时至17时30分的呼叫次数;
x6:17时30分至18时的呼叫次数;
x7:18时至19时的呼叫次数;
x8:19时至22时的呼叫次数;
x9:22时至次日7时的呼叫次数;
x10:总呼叫次数;
x11:主叫所呼号码总数;
x12:主叫总通话时间;
S2-2:定义式(1)所述径向基函数神经网络检测模型输出层节点的输出变量y:y(0≤y≤1)为所述主叫号码需要碎屏险的置信度,即所述主叫号码需要碎屏险的概率。
3.根据权利要求1所述的主叫号码对碎屏险业务需求的检测方法,其特征在于,所述的步骤S4建立训练数据集S和验证数据集T,进一步包括:
S4-1:S和T来源于连续30天的通话记录;
S4-2:计算30天的通话记录的主叫号码集合为U、需要碎屏险主叫号码集合为P、疑似需要碎屏险主叫号码集合为Q、正常主叫号码(即既非需要碎屏险电话,也非疑似需要碎屏险电话)集合为R;
S4-3:定义置信度:P中元素置信度定为1、Q中元素置信度定为random(40,60)*0.01、R中元素置信度定为0;
S4-4:确定训练数据集S;
S4-5:确定验证数据集T。
4.根据权利要求1所述的主叫号码对碎屏险业务需求的检测方法,其特征在于,所述的步骤S7计算所述径向基函数神经网络的识别效果评估值进一步包括:
5.根据权利要求3所述的主叫号码对碎屏险业务需求的检测方法,其特征在于,所述的步骤S4-4确定训练数据集S,进一步包括:
S4-4-1:确定S中的需要碎屏险主叫号码集合SP,SP中元素的个数为min{[|P|*0.9],3000},SP中的元素随机地在P中选取;
S4-4-2:确定S中的疑似需要碎屏险主叫号码集合SQ,SQ中元素的个数为min{[|Q|*0.25],750},SQ中的元素随机地在Q中选取;
S4-4-3:确定S中的正常主叫号码集合SR,SR中元素的个数为min{[|R|*0.9],3000},SR中的元素随机地在R中选取。
6.根据权利要求3所述的主叫号码对碎屏险业务需求的检测方法,其特征在于,所述的步骤S4-5确定验证数据集T,进一步包括:
S4-5-1:确定T中需要碎屏险主叫号码集合TP,TP中元素的个数为min{[|P|*0.12],100},TP中的元素随机地在P-SP中选取;
S4-5-2:确定T中的疑似需要碎屏险主叫号码集合TQ,TQ中元素的个数为min{[|Q|*0.1],100},TQ中的元素随机地在Q-SQ中选取;
S4-5-3:确定T中的正常主叫号码集合TR,TR中元素的个数为min{[|R|*0.1],100},TR中的元素随机地在R-SR中选取。
CN201711330643.2A 2017-12-13 2017-12-13 一种主叫号码对碎屏险业务需求的检测方法 Active CN108053328B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711330643.2A CN108053328B (zh) 2017-12-13 2017-12-13 一种主叫号码对碎屏险业务需求的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711330643.2A CN108053328B (zh) 2017-12-13 2017-12-13 一种主叫号码对碎屏险业务需求的检测方法

Publications (2)

Publication Number Publication Date
CN108053328A true CN108053328A (zh) 2018-05-18
CN108053328B CN108053328B (zh) 2022-06-24

Family

ID=62132466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711330643.2A Active CN108053328B (zh) 2017-12-13 2017-12-13 一种主叫号码对碎屏险业务需求的检测方法

Country Status (1)

Country Link
CN (1) CN108053328B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097236A (zh) * 2019-05-16 2019-08-06 南京工程学院 一种基于FA优化Elman神经网络的短期负荷预测方法
TWI703511B (zh) * 2019-07-09 2020-09-01 洽吧智能股份有限公司 螢幕裂損檢測系統
CN112989207A (zh) * 2021-04-27 2021-06-18 武汉卓尔数字传媒科技有限公司 一种信息推荐方法及装置、电子设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942574A (zh) * 2014-02-25 2014-07-23 浙江大学 3d手写识别svm分类器核参数选取方法及用途
CN106910337A (zh) * 2017-01-19 2017-06-30 长安大学 一种基于萤火虫算法与rbf神经网络的交通流预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942574A (zh) * 2014-02-25 2014-07-23 浙江大学 3d手写识别svm分类器核参数选取方法及用途
CN106910337A (zh) * 2017-01-19 2017-06-30 长安大学 一种基于萤火虫算法与rbf神经网络的交通流预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘研: "《基于萤火虫算法和 RBF 神经网络的高速公路交通流预测》", 《中国优秀硕士学位论文全文数据库》 *
杨松等: "《基于改进RBF神经网络的变形场插值算法研究》", 《计算机测量与控制》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097236A (zh) * 2019-05-16 2019-08-06 南京工程学院 一种基于FA优化Elman神经网络的短期负荷预测方法
TWI703511B (zh) * 2019-07-09 2020-09-01 洽吧智能股份有限公司 螢幕裂損檢測系統
CN112989207A (zh) * 2021-04-27 2021-06-18 武汉卓尔数字传媒科技有限公司 一种信息推荐方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN108053328B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN112270545A (zh) 基于迁移样本筛选的金融风险预测方法、装置和电子设备
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN108053328A (zh) 一种主叫号码对碎屏险业务需求的检测方法
CN114492279B (zh) 一种模拟集成电路的参数优化方法及系统
CN113435583A (zh) 基于联邦学习的对抗生成网络模型训练方法及其相关设备
CN115378988B (zh) 基于知识图谱的数据访问异常检测及控制方法、装置
CN116996272A (zh) 一种基于改进的麻雀搜索算法的网络安全态势预测方法
CN113298121B (zh) 基于多数据源建模的消息发送方法、装置和电子设备
WO2019234156A1 (en) Training spectral inference neural networks using bilevel optimization
CN117113350B (zh) 基于路径自适应的恶意软件检测方法、系统及设备
CN113379536A (zh) 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN117057258A (zh) 基于权重分配相关系数的黑启动过电压预测方法及系统
CN116776324A (zh) 一种基于云计算服务的异常用户行为处理方法及系统
CN114650321A (zh) 用于边缘计算的任务调度方法及边缘计算终端
CN114757391B (zh) 一种面向服务质量预测的网络数据空间设计与应用方法
CN111510473A (zh) 访问请求处理方法、装置、电子设备和计算机可读介质
CN110855474A (zh) Kqi数据的网络特征提取方法、装置、设备及存储介质
CN114296775B (zh) 基于大数据的智能运维方法及系统
CN109728958A (zh) 一种网络节点信任预测方法、装置、设备及介质
CN115495705A (zh) 评价函数确定方法、装置、电子设备以及存储介质
US20170255537A1 (en) Data-agnostic adjustment of hard thresholds based on user feedback
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
Ou et al. Deaps: Deep learning-based user-level proactive security auditing for clouds
CN112131607B (zh) 资源数据处理方法、装置、计算机设备和存储介质
CN117078789B (zh) 图像处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method for detecting service requirements of calling number for broken screen insurance

Effective date of registration: 20220831

Granted publication date: 20220624

Pledgee: Bank of China Limited Guangzhou Pearl River Branch

Pledgor: GUANGZHOU JOYSIM TECHNOLOGY CO.,LTD.

Registration number: Y2022980014139