CN105302918B - 一种从电话用户中筛选网站潜在用户的方法及系统 - Google Patents
一种从电话用户中筛选网站潜在用户的方法及系统 Download PDFInfo
- Publication number
- CN105302918B CN105302918B CN201510801534.9A CN201510801534A CN105302918B CN 105302918 B CN105302918 B CN 105302918B CN 201510801534 A CN201510801534 A CN 201510801534A CN 105302918 B CN105302918 B CN 105302918B
- Authority
- CN
- China
- Prior art keywords
- customer service
- service system
- screened
- user group
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012216 screening Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000009977 dual effect Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种从电话用户中筛选网站潜在用户的方法及系统,该方法包括:先从电话客服系统和网站客服系统中提取目标用户群,目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;接着利用由目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;最后利用筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。本申请实现了对网站客服系统的潜在用户进行有效地筛选,从而降低了网站推广成本和提高了推广效率。
Description
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种从电话用户中筛选网站潜在用户的方法及系统。
背景技术
当前,许多大型企业的客服系统通常包含电话客服系统和网站客服系统,而相较于网站客服系统,电话客服系统的搭建时间往往早于网站客服系统,由此使得电话客服系统的用户数量更多、用户范围更广,这也直接导致了电话客服系统的日常压力远远大于网站客服系统的日常压力。例如,国家电网公司旗下的95598电话客服系统日均访问量高达30万人次,而95598网站客服系统的日均访问量仅为2万人次。
为了对网站客服系统进行推广,以减少电话客服系统的日常压力,现在通常的做法是每当有用户用手机访问电话客服系统后,便将网站客服系统的网站链接下发至该用户的手机。然而,这种地毯式的推广手段需要消耗大量的成本,并且由于许多电话客服系统的用户并非是网站客服系统的潜在客户,这便会导致高额的推广成本遭到了严重地浪费,推广效率极低。
综上所述可以看出,如何对网站客服系统的潜在用户进行有效地筛选,以降低网站推广成本和提高推广效率是目前亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种从电话用户中筛选网站潜在用户的方法及系统,实现了对网站客服系统的潜在用户进行有效地筛选,从而降低了网站推广成本和提高了推广效率。其具体方案如下:
一种从电话用户中筛选网站潜在用户的方法,包括:
从电话客服系统和网站客服系统中提取目标用户群,所述目标用户群为对所述电话客服系统和所述网站客服系统都进行过访问的用户群;
利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群;其中,所述待筛选用户群为访问过所述电话客服系统但未对所述网站客服系统进行过访问的用户群。
优选的,所述利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数的过程,包括:
在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体;
确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数;
利用所述距离函数和所述超球体的半径,构建所述筛选函数。
优选的,所述在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体的过程,包括:
设所述训练样本集为D,D中的任一训练样本元素为xi,i∈{1,2,...,n};
利用非线性变换,将所述训练样本集D中的每一个训练样本元素映射到高维特征空间,相应地得到映射样本集,所述映射样本集中的每一个映射元素为φ(xi);其中,所述高维特征空间为维数大于预设值的特征空间;
在所述高维特征空间上建立一个超球体,并使所述超球体满足目标优化问题;所述目标优化问题为:
其中,R表示所述超球体的半径,a表示所述超球体的球心坐标,||·||表示欧氏距离,ξi表示松弛变量,C表示误差惩罚系数。
优选的,所述确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数的过程,包括:
引入拉格朗日函数,所述拉格朗日函数为:
其中,αi和βi为拉格朗日乘子,对R、αi和βi分别进行最小化处理,得到下式:
在所述目标优化问题上引入所述拉格朗日函数,得到目标对偶问题;所述目标对偶问题为:
其中,核函数K(xi,xj)=φ(xi)·φ(xj),并且所述目标对偶问题还满足KTT条件,所述KTT条件为:
(R2+ξi-||φ(xi)-a||2)αi=0;ξiβi=0
基于所述目标对偶问题,得到所述距离函数,所述距离函数具体为:
其中,所述距离函数d2(x)中的x表示任一待筛选样本。
优选的,所述利用所述距离函数和所述超球体的半径,构建所述筛选函数的过程,包括:
利用所述距离函数和所述超球体的半径,构建所述筛选函数,所述筛选函数为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))。
优选的,所述利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群的过程,包括:
设所述待筛选用户群的用户数量为N,N为正整数;
分别将所述待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
将所述N个待筛选样本输入所述筛选函数,相应地得到N个函数值;
将所述N个函数值中数值为1的函数值所对应的待筛选用户确定为所述网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;
将所述M个潜在用户确定为所述潜在用户群。
本发明还公开了一种从电话用户中筛选网站潜在用户的系统,包括:
目标用户群提取模块,用于从电话客服系统和网站客服系统中提取目标用户群,所述目标用户群为对所述电话客服系统和所述网站客服系统都进行过访问的用户群;
筛选函数构建模块,用于利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
潜在用户群获取模块,用于利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群;其中,所述待筛选用户群为访问过所述电话客服系统但未对所述网站客服系统进行过访问的用户群。
优选的,所述筛选函数构建模块包括:
超球体获取单元,用于在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体;
距离函数确定单元,用于确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数;
筛选函数构建单元,用于利用所述距离函数和所述超球体的半径,构建所述筛选函数。
优选的,所述筛选函数构建单元,具体用于利用所述距离函数和所述超球体的半径,构建所述筛选函数,所述筛选函数为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))
其中,R表示所述超球体的半径,a表示所述超球体的球心坐标,d2(x)表示所述距离函数,x表示任一待筛选样本。
优选的,设所述待筛选用户群的用户数量为N,N为正整数;所述潜在用户群获取模块包括:
待筛选样本获取单元,用于分别将所述待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
函数值获取单元,用于将所述N个待筛选样本输入所述筛选函数,相应地得到N个函数值;
潜在用户确定单元,用于将所述N个函数值中数值为1的函数值所对应的待筛选用户确定为所述网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;并将所述M个潜在用户确定为所述潜在用户群。
本发明中,先从电话客服系统和网站客服系统中提取目标用户群,目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;接着利用由目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;最后利用筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。可见,本发明事先将对电话客服系统和网站客服系统都进行过访问的用户群筛选出来,构成目标用户群,然后基于该目标用户群构建筛选函数,最后利用该筛选函数对待筛选用户群进行筛选,得到网站客服系统的潜在用户群,实现了对网站客服系统的潜在用户进行有效地筛选,从而降低了网站推广成本和提高了推广效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种从电话用户中筛选网站潜在用户的方法流程图;
图2为本发明实施例公开的一种具体的从电话用户中筛选网站潜在用户的方法流程图;
图3为本发明实施例公开的一种从电话用户中筛选网站潜在用户的系统结构示意图;
图4为本发明实施例公开的一种具体的从电话用户中筛选网站潜在用户的系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种从电话用户中筛选网站潜在用户的方法,参见图1所示,上述方法包括:
步骤S11:从电话客服系统和网站客服系统中提取目标用户群,该目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;
步骤S12:利用由上述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
步骤S13:利用上述筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,上述待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。
需要说明的是,上述每一个用户的用户属性具体可以包括用户编号、用户身份信息和用户状态信息等。
本发明实施例中,先从电话客服系统和网站客服系统中提取目标用户群,目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;接着利用由目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;最后利用筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。
可见,本发明实施例事先将对电话客服系统和网站客服系统都进行过访问的用户群筛选出来,构成目标用户群,然后基于该目标用户群构建筛选函数,最后利用该筛选函数对待筛选用户群进行筛选,得到网站客服系统的潜在用户群,实现了对网站客服系统的潜在用户进行有效地筛选,从而降低了网站推广成本和提高了推广效率。
本发明实施例公开了一种具体的从电话用户中筛选网站潜在用户的方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
参见图2所示,上一实施例步骤S12的过程,具体包括:
步骤S121:在训练样本集上执行单分类SVM算法(SVM,即Support VectorMachine,支持向量机),相应地得到一个超球体;上述训练样本集由上述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成。
步骤S122:确定用于计算任一待筛选样本到上述超球体的球心之间距离的距离函数;
步骤S123:利用上述距离函数和上述超球体的半径,构建筛选函数。
其中,上述步骤S121的过程,具体包括:
步骤S1211:设训练样本集为D,D中的任一训练样本元素为xi,i∈{1,2,...,n};利用非线性变换,将训练样本集D中的每一个训练样本元素映射到高维特征空间,相应地得到映射样本集,该映射样本集中的每一个映射元素为φ(xi);其中,上述高维特征空间为维数大于预设值的特征空间;
步骤S1212:在上述高维特征空间上建立一个超球体,并使该超球体满足目标优化问题;该目标优化问题具体为:
其中,R表示超球体的半径,a表示超球体的球心坐标,·表示欧氏距离,ξi表示松弛变量,C表示误差惩罚系数。
另外,上述步骤S122的过程,具体包括:
步骤S1221:引入拉格朗日函数,拉格朗日函数为:
其中,αi和βi为拉格朗日乘子,对R、αi和βi分别进行最小化处理,得到下式:
步骤S1222:在上述目标优化问题上引入上述拉格朗日函数,得到目标对偶问题;该目标对偶问题具体为:
其中,核函数K(xi,xj)=φ(xi)·φ(xj),并且上述目标对偶问题还满足KTT条件,该KTT条件具体为:
(R2+ξi-||φ(xi)-a||2)αi=0;ξiβi=0
步骤S1223:基于上述目标对偶问题,得到距离函数,该距离函数具体为:
其中,距离函数d2(x)中的x表示任一待筛选样本。
进一步的,上述步骤S123的过程,具体包括:利用上述距离函数和上述超球体的半径,构建筛选函数,该筛选函数具体为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))。
需要指出的是,上述sgn(·)表示符号函数。
更具体的,上一实施例步骤S13的过程,具体包括:
步骤S131:设待筛选用户群的用户数量为N,N为正整数;分别将待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
步骤S132:将上述N个待筛选样本输入筛选函数f(x),相应地得到N个函数值;
步骤S133:将上述N个函数值中数值为1的函数值所对应的待筛选用户确定为网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;
步骤S134:将上述M个潜在用户确定为潜在用户群。
在获取到潜在用户群后,便可将网站客服系统的网站链接以短信的形式下发至潜在用户群中每个用户的手机,从而提高了推广的针对性,由此降低了推广成本,提高了推广效率。
本发明实施例还公开了一种从电话用户中筛选网站潜在用户的系统,参见图3所示,该系统包括:
目标用户群提取模块31,用于从电话客服系统和网站客服系统中提取目标用户群,目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;
筛选函数构建模块32,用于利用由目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
潜在用户群获取模块33,用于利用筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。
参见图4所示,上述筛选函数构建模块32具体可以包括超球体获取单元321、距离函数确定单元322和筛选函数构建单元323;其中,
超球体获取单元321,用于在训练样本集上执行单分类SVM算法,相应地得到一个超球体;
距离函数确定单元322,用于确定用于计算任一待筛选样本到超球体的球心之间距离的距离函数;
筛选函数构建单元323,用于利用距离函数和超球体的半径,构建筛选函数。
其中,筛选函数构建单元323具体用于利用距离函数和超球体的半径,构建筛选函数,筛选函数为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))
其中,R表示超球体的半径,a表示超球体的球心坐标,d2(x)表示距离函数,x表示任一待筛选样本。
关于上述筛选函数的具体构建过程可参见前述实施例,在此不再赘述。
另外,设待筛选用户群的用户数量为N,N为正整数;则上述潜在用户群获取模块33包括待筛选样本获取单元、函数值获取单元和潜在用户确定单元;其中,
待筛选样本获取单元,用于分别将待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
函数值获取单元,用于将N个待筛选样本输入筛选函数,相应地得到N个函数值;
潜在用户确定单元,用于将N个函数值中数值为1的函数值所对应的待筛选用户确定为网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;并将M个潜在用户确定为潜在用户群。
本发明实施例中,先利用目标用户群提取模块,从电话客服系统和网站客服系统中提取目标用户群,目标用户群为对电话客服系统和网站客服系统都进行过访问的用户群;接着筛选函数构建模块利用由目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;最后潜在用户群获取模块利用筛选函数,对从电话客服系统中提取的待筛选用户群进行筛选,相应地得到网站客服系统的潜在用户群;其中,待筛选用户群为访问过电话客服系统但未对网站客服系统进行过访问的用户群。
可见,本发明实施例事先将对电话客服系统和网站客服系统都进行过访问的用户群筛选出来,构成目标用户群,然后基于该目标用户群构建筛选函数,最后利用该筛选函数对待筛选用户群进行筛选,得到网站客服系统的潜在用户群,实现了对网站客服系统的潜在用户进行有效地筛选,从而降低了网站推广成本和提高了推广效率。
最后,还需要说明的是,在本文中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种从电话用户中筛选网站潜在用户的方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种从电话用户中筛选网站潜在用户的方法,其特征在于,包括:
从电话客服系统和网站客服系统中提取目标用户群,所述目标用户群为对所述电话客服系统和所述网站客服系统都进行过访问的用户群;
利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群;其中,所述待筛选用户群为访问过所述电话客服系统但未对所述网站客服系统进行过访问的用户群;
其中,所述利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群的过程,包括:
设所述待筛选用户群的用户数量为N,N为正整数;
分别将所述待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
将所述N个待筛选样本输入所述筛选函数,相应地得到N个函数值;
将所述N个函数值中数值为1的函数值所对应的待筛选用户确定为所述网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;
将所述M个潜在用户确定为所述潜在用户群。
2.根据权利要求1所述的从电话用户中筛选网站潜在用户的方法,其特征在于,所述利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数的过程,包括:
在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体;
确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数;
利用所述距离函数和所述超球体的半径,构建所述筛选函数。
3.根据权利要求2所述的从电话用户中筛选网站潜在用户的方法,其特征在于,所述在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体的过程,包括:
设所述训练样本集为D,D中的任一训练样本元素为xi,i∈{1,2,...,n};
利用非线性变换,将所述训练样本集D中的每一个训练样本元素映射到高维特征空间,相应地得到映射样本集,所述映射样本集中的每一个映射元素为φ(xi);其中,所述高维特征空间为维数大于预设值的特征空间;
在所述高维特征空间上建立一个超球体,并使所述超球体满足目标优化问题;所述目标优化问题为:
其中,R表示所述超球体的半径,a表示所述超球体的球心坐标,||·||表示欧氏距离,ξi表示松弛变量,C表示误差惩罚系数。
4.根据权利要求3所述的从电话用户中筛选网站潜在用户的方法,其特征在于,所述确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数的过程,包括:
引入拉格朗日函数,所述拉格朗日函数为:
其中,αi和βi为拉格朗日乘子,对R、αi和βi分别进行最小化处理,得到下式:
αi=C-βi;
在所述目标优化问题上引入所述拉格朗日函数,得到目标对偶问题;所述目标对偶问题为:
其中,核函数K(xi,xj)=φ(xi)·φ(xj),并且所述目标对偶问题还满足KTT条件,所述KTT条件为:
(R2+ξi-||φ(xi)-a||2)αi=0;ξiβi=0
基于所述目标对偶问题,得到所述距离函数,所述距离函数具体为:
其中,所述距离函数d2(x)中的x表示任一待筛选样本。
5.根据权利要求4所述的从电话用户中筛选网站潜在用户的方法,其特征在于,所述利用所述距离函数和所述超球体的半径,构建所述筛选函数的过程,包括:
利用所述距离函数和所述超球体的半径,构建所述筛选函数,所述筛选函数为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))。
6.一种从电话用户中筛选网站潜在用户的系统,其特征在于,包括:
目标用户群提取模块,用于从电话客服系统和网站客服系统中提取目标用户群,所述目标用户群为对所述电话客服系统和所述网站客服系统都进行过访问的用户群;
筛选函数构建模块,用于利用由所述目标用户群中每一个用户的用户属性、电话客服系统访问痕迹以及网站客服系统访问痕迹构成的训练样本集,构建筛选函数;
潜在用户群获取模块,用于利用所述筛选函数,对从所述电话客服系统中提取的待筛选用户群进行筛选,相应地得到所述网站客服系统的潜在用户群;其中,所述待筛选用户群为访问过所述电话客服系统但未对所述网站客服系统进行过访问的用户群;
其中,设所述待筛选用户群的用户数量为N,N为正整数;所述潜在用户群获取模块包括:
待筛选样本获取单元,用于分别将所述待筛选用户群中每一个待筛选用户的电话客服系统访问痕迹以及相应的用户属性作为待筛选样本,相应地得到N个待筛选样本;
函数值获取单元,用于将所述N个待筛选样本输入所述筛选函数,相应地得到N个函数值;
潜在用户确定单元,用于将所述N个函数值中数值为1的函数值所对应的待筛选用户确定为所述网站客服系统的潜在用户,相应地得到M个潜在用户,M为不大于N的正整数;并将所述M个潜在用户确定为所述潜在用户群。
7.根据权利要求6所述的从电话用户中筛选网站潜在用户的系统,其特征在于,所述筛选函数构建模块包括:
超球体获取单元,用于在所述训练样本集上执行单分类SVM算法,相应地得到一个超球体;
距离函数确定单元,用于确定用于计算任一待筛选样本到所述超球体的球心之间距离的距离函数;
筛选函数构建单元,用于利用所述距离函数和所述超球体的半径,构建所述筛选函数。
8.根据权利要求7所述的从电话用户中筛选网站潜在用户的系统,其特征在于,所述筛选函数构建单元,具体用于利用所述距离函数和所述超球体的半径,构建所述筛选函数,所述筛选函数为:
f(x)=sgn(R2-||φ(x)-a||2)=sgn(R2-d2(x))
其中,R表示所述超球体的半径,a表示所述超球体的球心坐标,d2(x)表示所述距离函数,x表示任一待筛选样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510801534.9A CN105302918B (zh) | 2015-11-19 | 2015-11-19 | 一种从电话用户中筛选网站潜在用户的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510801534.9A CN105302918B (zh) | 2015-11-19 | 2015-11-19 | 一种从电话用户中筛选网站潜在用户的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105302918A CN105302918A (zh) | 2016-02-03 |
CN105302918B true CN105302918B (zh) | 2019-04-09 |
Family
ID=55200187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510801534.9A Active CN105302918B (zh) | 2015-11-19 | 2015-11-19 | 一种从电话用户中筛选网站潜在用户的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105302918B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090888A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种用户行为数据的分析方法和装置 |
CN104270429A (zh) * | 2014-09-19 | 2015-01-07 | 北京奇虎科技有限公司 | 一种推送应用到终端的方法和装置 |
CN104967552A (zh) * | 2014-11-12 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 消息推送方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100325139A1 (en) * | 2009-06-18 | 2010-12-23 | Microsoft Corporation | Service Provider Management Console |
-
2015
- 2015-11-19 CN CN201510801534.9A patent/CN105302918B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090888A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 一种用户行为数据的分析方法和装置 |
CN104270429A (zh) * | 2014-09-19 | 2015-01-07 | 北京奇虎科技有限公司 | 一种推送应用到终端的方法和装置 |
CN104967552A (zh) * | 2014-11-12 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 消息推送方法及装置 |
Non-Patent Citations (1)
Title |
---|
"基于支持向量机的垃圾邮件过滤技术研究";杨霁琳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20070915;第53、54页 |
Also Published As
Publication number | Publication date |
---|---|
CN105302918A (zh) | 2016-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103886048B (zh) | 一种基于聚类的增量数字图书推荐方法 | |
US10725737B2 (en) | Address information-based account mapping method and apparatus | |
JP5956263B2 (ja) | 評価装置、評価システム、利用者から提供された情報を評価する評価方法、およびコンピュータプログラム | |
CN113412608B (zh) | 内容推送方法、装置、服务端及存储介质 | |
CN103455559A (zh) | 一种应用自动推荐的方法及装置 | |
CN102904941B (zh) | 一种网络访问速度信息的处理、显示的方法和装置 | |
CN102184230A (zh) | 一种搜索结果的展示方法及装置 | |
CN106055650A (zh) | 地址标准化方法和装置 | |
CN102917135A (zh) | 一种推荐用户穿衣搭配的方法及装置 | |
CN104714961B (zh) | 一种住宿地点推荐方法、装置及系统 | |
CN104735169B (zh) | 一种居住社区群发现方法 | |
EP2916239A1 (en) | Method and device for providing search result on mobile terminal | |
CN105975479A (zh) | 一种基于标签库的电信用户兴趣度分析方法及系统 | |
CN102945263A (zh) | 一种用于确定多个访问对象之间的访问相关性信息的方法 | |
CN107835486A (zh) | 交通出行量计算方法及装置 | |
CN106650610A (zh) | 一种人脸表情数据收集方法及装置 | |
CN105224281A (zh) | 语音导航菜单动态生成方法及系统 | |
CN104159204A (zh) | 基于短信的信息交互方法和装置 | |
CN103258356A (zh) | 一种自动签到的方法 | |
CN104281646B (zh) | 基于微博数据的城市内涝检测方法 | |
CN106682056B (zh) | 不同应用软件之间相互关系的确定方法、装置及系统 | |
CN107133689A (zh) | 一种位置标记方法 | |
CN105302918B (zh) | 一种从电话用户中筛选网站潜在用户的方法及系统 | |
CN105761107A (zh) | 互联网产品中获取目标新增用户的方法及装置 | |
CN103079006A (zh) | 联系人管理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |