CN101355728A - 短信生命力系统及其判断方法 - Google Patents
短信生命力系统及其判断方法 Download PDFInfo
- Publication number
- CN101355728A CN101355728A CNA2008100247687A CN200810024768A CN101355728A CN 101355728 A CN101355728 A CN 101355728A CN A2008100247687 A CNA2008100247687 A CN A2008100247687A CN 200810024768 A CN200810024768 A CN 200810024768A CN 101355728 A CN101355728 A CN 101355728A
- Authority
- CN
- China
- Prior art keywords
- note
- sms
- ticket
- short message
- life energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明创造的短信生命力系统,它包括短信中心短信专家系统、FTP服务器、短信生命力主处理服务器、数据库Web服务器、服务终端,短信中心实时产生用户短信MO话单,短信中心短信专家系统实时将短信MO话单放到FTP服务器上,短信生命力主处理服务器对FTP服务器上短信中心MO话单多种维度有效处理后放入数据库Web服务器,若发现垃圾短信则进行相应处理,服务终端通过网页查询生命力数据制定营销方案,用户通过咨讯平台点播或定购业务。
Description
一、技术领域
本发明属于通信运营商的信息统计、搜集领域。可对网络中流转的短信按照内容进行统计、分析。该发明创造可直接应用于各通信运营商对其用户所发出短信进行基于内容的提炼、分析、推广等领域
二、背景技术
短信已成为人与人之间沟通的重要手段,极大影响了人们的生活方式。用户间流转着哪些短信也是运营商关注的问题
短信是移动运营商增值业务的主力军,业务规模仍需提升;点对点短信提升的策略:通过创作和转发短信获取积分、通过收集转发率高的短信激活短信转发需求。
如何获取转发率高的短信?以南京为例,每天点对点短信数有近2000万条,面对如此海量的数据,常见的对存储已发送的短信数据库进行分析、统计的方法不但要耗费大量资金购买高性能服务器和存储介质,且由于数据量过于庞大,不能实时计算出需要的结果。
目前各运营商有短信积分计算系统,即对特定用户的短信发送情况进行统计,但无对全网短信排名的系统。
如:《短信大奖堂》,可实时获取短信发送信息(点对点短信),针对发送信息记录按一定算法进行统计分析,能够准确的统计特定用户的积分,根据积分奖励规则给用户一定奖励,并可随时修改不同的积分统计规则,为短信业务的推广提供了可靠的技术保障。
如:《短信积分》,用户定购了该业务每天能收到系统下发的内容精彩的种子短信。该业务具有强大的用户奖励积分机制,用户通过种子短信转发、种子短信上传、参加主题活动等方式获得相应的积分作为奖励,获得积分可以参加抽奖和兑奖活动。以此对用户进行引导和激励,促进用户创作、转发有趣的种子短信,通过短信转发造成的病毒式感染效应,带来更大的短信转发量,促进短信业务的发展。
以上现有技术中,均需对短信中心数据库海量数据进行操作。短信中心数据库中,对于每条短信按以下格式进行存储(由于一条短信需记录73项信息,此处仅列出部分信息):
SM_ID | SM_SUBID | SERVICE_TYPE | ORGTON | ORGNPI | ORGADDR | DESTTON | DESTNPI | DESTADDR |
2555881441 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613812146780 |
2557803394 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613812359889 |
2557910204 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613852532319 |
2557694326 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613852772160 |
2557970013 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613862138318 |
2557970008 | 0 | 2 | 1 | 1065815401 | 1 | 1 | 8613770667445 | |
2557970061 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613815205794 |
2557969687 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613813604106 |
2557969625 | 0 | 1 | 1 | 10658154 | 1 | 1 | 8613775995646 | |
2557969766 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613852968938 |
2557964901 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613861783780 |
2557969910 | 0 | 1000 | 2 | 1 | 10658472 | 1 | 1 | 8613862521406 |
对短信中心数据库进行查询、统计操作存在两大问题:(1)对短信中心的数据库安全、性能造成影响。(2)在短信发送量巨大的情况下,无法得到统计结果。因为在分类、比对过程中,数据库语句的计算耗时是随着数据量的增多而几何增长的。例如南京一天的短信量在2千万以上,而南京动感地带用户是1百万以上,那么在2千万短信中筛选出动感地带用户发送的短信计算量为2000万×100万。该计算在一天内是无法完成。
本项目组运用多项创新技术,通过对短信数据的有效计算,得出短信人际传播模型以及短信生命力多维度研究成果。
三、发明内容
本发明通过对点对点短信MO话单按照多种维度有效处理,从而实现了实时统计短信发送的目的,避免了对短信中心数据库海量数据进行操作。
短信生命力研究成果实现了从多个维度统计短信的相关信息、统计发送排名上升最快的短信、跟踪某条短信的生长过程,同时,利用统计结果,进行垃圾短信的筛选。在取得相关数据的基础上,进行短信量提升营销。
本发明创造的技术方案是:短信生命力系统,它包括短信中心短信专家系统、FTP服务器、短信生命力主处理服务器、数据库Web服务器、服务终端,其中,短信中心短信专家系统实时将短信MO话单放到FTP服务器上,短信生命力主处理服务器通过对短信中心MO话单多种维度有效处理后放入数据库Web服务器,供服务终端查询、用户点播定购。最终查询信息包括各纬度下的短信内容、该短信当日发送总量,发送该短信的号码总量,短信综合排名、短信上升趋势。
短信生命力判断方法,其特征在于:
短信中心实时产生用户短信MO话单;
短信专家系统实时将短信MO话单放到FTP服务器上;
短信生命力主处理服务器对FTP服务器上短信MO话单多维度处理放入数据库Web服务器;
发现垃圾短信,发现机制主要包括:短信发送总量和发送短信号码总量之比、关键字过滤。即发送量很大而转发号码较少的短信可以判定为垃圾短信,另外包括“代开发票”、“高额贷款”等关键字的短信也可以判定为垃圾短信。对于垃圾短信可以提取出相应号码,对这些号码进行功能屏蔽。
服务终端通过网页查询生命力数据,制定营销方案;
用户通过咨讯平台点播或定购业务。
本发明的有益效果:
本发明针对现有技术中,在对短信进行统计时,对短信中心数据库中的海量数据进行操作,造成的影响短信中心数据库安全和性能甚至于无法得到统计结果的问题,提出了一种对短信MO话单数据进行操作得到短信统计信息的方案,克服了上述问题。本系统可统计发送排名上升最快的短信、跟踪某条短信的生长过程,同时,利用统计结果,进行垃圾短信的筛选。在取得相关数据的基础上,进行短信量提升营销。
四、附图说明
图1为本发明实施例中短信生命力系统原理图。
图2为本发明实施例中短信生命力系统物理结构图。
图3为本发明实施例中短信生命力系统逻辑结构图。
图4为本发明实施例中提高用户短信发送量的渠道图。
五、具体实施方式
下面结合附图和实施例对本发明进一步描述。
随用户发送短信而在短信中心实时产生的短信MO话单包含着一条短信的所有信息,对MO话单按照多种维度有效处理就可以实现实时统计短信发送。
短信生命力系统原理图如图1所示:短信中心实时产生短信MO话单,MO话单通过与静态维度表的矩阵运算,得出统计结果,即最终查询信息。最终查询信息包括各纬度下的短信内容、该短信当日发送总量,发送该短信的号码总量,短信综合排名、短信上升趋势。其中,静态维度表根据实际需要可以灵活多变。
本发明方法的流程包括以下步骤:
步骤1.短信中心实时产生用户短信MO话单。MO话单的格式为:
“1075557183,8613XXXXXXXXX,8613XXXXXXXXX,8613742142,8613800250500,0,0,0,0,0,0.168,0,8,2008/11/12 13:29:32,0,134,0,0,0,2007/08/29 13:29:32风铃的浪漫勾起对美好生活的向往;驼铃的深沉激起…”
每5分钟获取一次MO话单,MO话单中的数据量远远小于短信中心数据库中对其存储的数据量。
步骤2.短信中心短信专家系统实时将短信MO话单上传到FTP服务器上。
步骤3.短信生命力主处理服务器对FTP服务器上短信中心MO话单多种维度有效处理,并将处理结果保存到数据库Web服务器。这里的处理结果包括:各维度下的短信内容、该短信当日发送总量,发送该短信的号码总量,短信综合排名、短信上升趋势。
本步骤中,对MO话单的处理包括对垃圾短信的过滤和得出最终查询信息,整个流程具体包括如下步骤:
步骤31.将MO话单与静态维度表进行矩阵运算,得到最终查询信息。以图1所示的静态维度表为例,在对获取的MO话单分析时,首先进行“定长抛弃”,因为低于40个汉字的短信通常是用户之间问候或聊天的信息,是没有传播价值的,因此短信生命力系统只保留多于40个汉字的短信。其次进行“长短信拼接”,因为超过70个汉字的短信是分割发送的,因此若MO话单记录中的长短信标志位为1,则将该记录入栈,入栈的记录会根据发送和接收号码拼接为一条短信记录。然后有传播价值的短信会存入临时的短信记录表中,开始与静态纬度表进行矩阵运行,矩阵运算主要利用数据库自身的数据筛选功能,通过编写SQL语句比对短信记录表和静态纬度表中的数据,可以将短信按品牌或是地域分类为不同的分类记录表:动感地带短信表、全球通短信表、农村用户表等。
下一步将逐条读取各分类记录表中的短信,通过LCS算法计算该短信记录与当日各分类结果表中数据的相似度:(a)若与分类结果表中某条短信记录相似度超过80%,则分类结果表中相应短信记录的发送量增1,并进一步查询该短信记录对应的发送号码表,若该号码首次发送该内容的短信则发送号码量也增1,并删除分类记录表中的数据,(b)若与分类结果表中所有的数据相似度均低于80%,则分类结果表中新增此短信记录,并删除分类记录表中的数据。
每晚将当日各分类结果表中数据排行,并导入到总量表中。导入过程中,通过SQL语句读取昨日该短信的排名,并计算出上升位数。用于WEB页面的图标显示。
步骤32.对垃圾短信的过滤。本步骤中,可以根据短信发送总量和发送短信号码总量之比和/或根据关键字对短信进行过滤的方式进行。
在根据短信发送总量和发送短信号码总量之比的方式中,每晚在闲时,通过数据库存储过程,计算当日结果表中短信发送量和发送号码量之间的比值,若比值高于23,则将该短信插入到垃圾短信记录表中则。
在根据关键字对短信进行过滤的方式中,在分析MO话单时,会判断短信内容中是否包含设定的关键字,若存在则将该短信插入到垃圾短信记录表中。并记录发送方号码。
步骤4.服务终端通过网页查询生命力数据制定营销方案,市场部可以通过生命力系统的WEB页面查询短信的排行情况,以及该短信发送量的走势,对于走势减弱的强力短信或走势上升的潜力短信,通过短信俱乐部活动下发推广,拉高、拉长短信的生命力。
用户通过咨讯平台点播或定购业务,通过短信生命力系统的导出功能,导出所有短信记录,经过筛选后将短信同步到“短信连连发”系统中。“短信连连发”的用户可以通过点播的方式,获取优质短信。
图2是本发明创造实施例的短信生命力系统物理结构图,它包括短信中心短信专家系统、FTP服务器、短信生命力主处理服务器、数据库Web服务器、服务终端,短信中心实时产生用户短信MO话单,短信中心短信专家系统实时将短信MO话单放到FTP服务器上,短信生命力主处理服务器对FTP服务器上短信中心MO话单多种维度有效处理后放入数据库Web服务器,若发现垃圾短信则进行相应处理,服务终端通过网页查询生命力数据制定营销方案,用户通过咨讯平台点播或定购业务。
本系统主程序基于Borland C++Builder开发,采用Oracle构造数据库,Web服务器利用tomcat平台搭建。系统逻辑结构图如图3所示。
如图4所示,可以通过不同的渠道进行短信量的提升。例如:
通过短信生命力网站及时发布用户喜爱的TOP10短信内容。同时,短信生命力网站与现有的短信俱乐部等业务紧密结合,扩大了TOP10短信的影响力,延长了其生命周期。从2007年9月中旬开始,江苏移动南京分公司每天密切关注用户中流传的短信,从中筛选出节日短信、爱情短信、幽默短信、祝福短信各10条,上载至短信俱乐部供用户点播。用户平均每天点播各类短信达到7万条,再经过多次转发,短信数量有了爆发式的增长。据观察:一般节日前5天,用户群中流转量最大的前5条短信日均发送量均超过3万条,最高达到8万条,比推广前的单条最高3万条增加了一倍多。节日短信发展有效拉动了整体计费短信的提升,贡献度达近20%。10月1日至10日计费短信条数累计比上月同期增长三千万条,短信生命力系统在短信病毒式营销中收效显著。
具体实施方案中可得以体现出下面几个创新点:
1、新源头
不以短信中心数据库为数据来源,而是另辟蹊径,以短信MO话单,即实时产生的记录每条短信发送情况的纯文本为信息源头,从而避免了对海量数据库的操作,使对短信数据的深度挖掘成为可能;避免了对短信中心数据库的操作,确保系统安全。
2、高效率
在对短信MO话单的处理中,采用“定长抛弃”、“长短信拼接”等方法,大大加快了运算效率,实现了“即发即处理”、“即处理即显”。
3、优算法
由于在转发过程中用户可能会改动个别字或标点符号,如何判定两条短信内容是否相同一直是系统开发中的难点,通过优化LCS(longest common substring)算法,采用数据库匹配和算法匹配相结合解决了这个难点,通过该算法可以统计出同一内容或是内容基本一致的短信的总发送条数,再按照短信发送方号码进行唯一性筛选后即可以得出发送该短信的号码总数。而在计算短信排名和上升趋势方面,采用综合发送条数和发送的用户数为参数,套入生命力系统研究出的经验公式计算得出。
4、低投资
本系统只保存经过处理的各维度中排名前3000的短信。经估算,这些短信所占存储空间为短信总量的5%以下。整个系统对硬件性能、磁盘空间都要求不高,主处理服务器、数据库服务器、WEB服务器合设,硬件投资在5万元以下。
5、多维度
系统可根据多种维度、多种静态基准库与短信MO话单进行矩阵运算,为各种不同人群的短信精确营销提供弹药。
6、广用途
系统可用于点对点短信量营销、垃圾短信拦截,按垃圾短信内容引导用户使用集团短信业务等用途。
Claims (7)
1、一种短信生命力系统,它包括短信中心短信专家系统、FTP服务器、短信生命力主处理服务器、数据库Web服务器、服务终端,其特征在于:短信中心短信专家系统实时将短信MO话单放到FTP服务器上,短信生命力主处理服务器通过对短信中心MO话单多种维度有效处理后放入数据库Web服务器,供服务终端查询、用户点播定购。
2、一种短信生命力判断方法,其特征在于:
短信中心实时产生用户短信MO话单;
短信专家系统实时将短信MO话单放到FTP服务器上;
短信生命力主处理服务器对FTP服务器上短信MO话单多维度处理放入数据库Web服务器;
发现垃圾短信,进行相应处理;
服务终端通过网页查询生命力数据,制定营销方案;
用户通过咨讯平台点播或定购业务。
3、根据权利要求2所述的短信生命力判断方法,其特征在于:
所述短信生命力主处理服务器对FTP服务器上短信中心MO话单多种维度处理,处理结果包括:各维度下的短信内容、该短信当日发送总量,发送该短信的号码总量,短信综合排名、短信上升趋势。
4、根据权利要求2所述的短信生命力判断方法,其特征在于:
所述对MO话单的处理包括对垃圾短信的过滤和得出最终查询信息,整个流程具体包括如下步骤:
步骤一.将MO话单与静态维度表进行矩阵运算,得到最终查询信息;
步骤二.对垃圾短信的过滤,根据短信发送总量和发送短信号码总量之比和/或根据关键字对短信进行过滤的方式进行。
5、根据权利要求4所述的短信生命力判断方法,其特征在于:
步骤一中,在对获取的MO话单分析时,首先进行“定长抛弃”,只保留多于40个汉字的短信;其次进行“长短信拼接”,若MO话单记录中的长短信标志位为1,则将该记录入栈,入栈的记录会根据发送和接收号码拼接为一条短信记录;然后有传播价值的短信会存入临时的短信记录表中,开始与静态纬度表进行矩阵运行,矩阵运算主要利用数据库自身的数据筛选功能,通过编写SQL语句比对短信记录表和静态纬度表中的数据,将短信分类为不同的分类记录表,通过LCS算法计算分类记录表中的短信记录与当日各分类结果表中数据的相似度:若与分类结果表中某条短信记录相似度超过80%,则分类结果表中相应短信记录的发送量增1,并进一步查询该短信记录对应的发送号码表,若该号码首次发送该内容的短信则发送号码量也增1,并删除分类记录表中的数据;若与分类结果表中所有的数据相似度均低于80%,则分类结果表中新增此短信记录,并删除分类记录表中的数据。
6、根据权利要求4所述的短信生命力判断方法,其特征在于:
步骤一中,最终查询信息包括各纬度下的短信内容、该短信当日发送总量,发送该短信的号码总量,短信综合排名、短信上升趋势。
7、根据权利要求4所述的短信生命力判断方法,其特征在于:
步骤二中,在根据短信发送总量和发送短信号码总量之比的方式中,每晚在闲时,通过数据库存储过程,计算当日结果表中短信发送量和发送号码量之间的比值,若比值高于23,则将该短信插入到垃圾短信记录表中;在根据关键字对短信进行过滤的方式中,在分析MO话单时,会判断短信内容中是否包含设定的关键字,若存在则将该短信插入到垃圾短信记录表中,并记录发送方号码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100247687A CN101355728B (zh) | 2008-05-06 | 2008-05-06 | 短信生命力系统及其判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100247687A CN101355728B (zh) | 2008-05-06 | 2008-05-06 | 短信生命力系统及其判断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101355728A true CN101355728A (zh) | 2009-01-28 |
CN101355728B CN101355728B (zh) | 2011-12-14 |
Family
ID=40308263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100247687A Expired - Fee Related CN101355728B (zh) | 2008-05-06 | 2008-05-06 | 短信生命力系统及其判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101355728B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102905236A (zh) * | 2011-07-27 | 2013-01-30 | 华为技术有限公司 | 一种垃圾短消息监控方法、装置及系统 |
CN106202081A (zh) * | 2015-04-30 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 实时数据处理方法及装置 |
CN115114374A (zh) * | 2022-06-27 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 事务执行方法、装置、计算设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100505902C (zh) * | 2007-04-30 | 2009-06-24 | 中兴通讯股份有限公司 | 基于点对点短消息的短消息转发计数系统及计数方法 |
CN101080045B (zh) * | 2007-07-18 | 2012-01-11 | 中兴通讯股份有限公司 | 消息筛选分发系统和方法 |
CN101102533A (zh) * | 2007-07-27 | 2008-01-09 | 中国移动通信集团福建有限公司 | 短信发送统计方法和装置 |
CN100589606C (zh) * | 2007-10-24 | 2010-02-10 | 中兴通讯股份有限公司 | 一种短消息查询分析系统及方法 |
-
2008
- 2008-05-06 CN CN2008100247687A patent/CN101355728B/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102905236A (zh) * | 2011-07-27 | 2013-01-30 | 华为技术有限公司 | 一种垃圾短消息监控方法、装置及系统 |
CN106202081A (zh) * | 2015-04-30 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 实时数据处理方法及装置 |
CN106202081B (zh) * | 2015-04-30 | 2020-03-13 | 阿里巴巴集团控股有限公司 | 实时数据处理方法及装置 |
CN115114374A (zh) * | 2022-06-27 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 事务执行方法、装置、计算设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101355728B (zh) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104813320B (zh) | 处理数字通信量度量的系统和方法 | |
Taylor-Sakyi | Big data: Understanding big data | |
CN102426610B (zh) | 微博搜索排名方法及微博搜索引擎 | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
WO2008125038A1 (fr) | Procédé, système et serveur pour transmettre une publicité en fonction d'une caractéristique utilisateur | |
CN101026802A (zh) | 一种信息推送方法与装置 | |
CN106168953B (zh) | 面向弱关系社交网络的博文推荐方法 | |
CN107222566A (zh) | 信息推送方法、装置及服务器 | |
CN101916288B (zh) | 一种移动通信用户搜索请求响应系统及其处理方法 | |
CN105868267B (zh) | 一种移动社交网络用户兴趣的建模方法 | |
CN108269107B (zh) | 用户信息处理方法及装置 | |
CN104182506A (zh) | 日志管理方法 | |
CN108885624A (zh) | 信息推荐系统及方法 | |
CN103838819A (zh) | 一种信息发布方法及系统 | |
CN101256598A (zh) | 提高网络用户的满意度的方法和装置 | |
CN104077407A (zh) | 一种智能数据搜索系统及方法 | |
CN105893421A (zh) | Uv计算方法、装置 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN104346458A (zh) | 数据存储方法和存储设备 | |
CN101355728B (zh) | 短信生命力系统及其判断方法 | |
CN111538733A (zh) | 一种多维数据综合分析系统及其分析方法 | |
CN103853838A (zh) | 一种数据处理方法和装置 | |
CN109190027A (zh) | 多源推荐方法、终端、服务器、计算机设备、可读介质 | |
Lin et al. | Optimization analysis for an infinite capacity queueing system with multiple queue-dependent servers: genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111214 Termination date: 20200506 |
|
CF01 | Termination of patent right due to non-payment of annual fee |