CN102932481A - 自动获取手机终端信息的系统和方法 - Google Patents
自动获取手机终端信息的系统和方法 Download PDFInfo
- Publication number
- CN102932481A CN102932481A CN2012104618697A CN201210461869A CN102932481A CN 102932481 A CN102932481 A CN 102932481A CN 2012104618697 A CN2012104618697 A CN 2012104618697A CN 201210461869 A CN201210461869 A CN 201210461869A CN 102932481 A CN102932481 A CN 102932481A
- Authority
- CN
- China
- Prior art keywords
- mobile phone
- information
- phone terminal
- new architecture
- short message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
一种自动获取手机终端信息的系统和方法,所述的系统与短信业务网关连接,采集手机终端注册短信,所述的系统对手机资讯门户进行搜索,该系统在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元。本发明实现了用户手机终端信息的自动获取;并发对手机终端注册短信进行解析,提高了解析效率;同时对多个手机资讯门户进行爬虫搜索,提高了手机终端信息抓取的广度(更多终端信息)和深度(准确度)。
Description
技术领域
本发明涉及移动互联网、计算机软件等领域,具体涉及一种自动获取手机终端信息的系统和方法。
背景技术
目前,随着3G网络的商用,移动数据业务发展迅猛,运营商提供业务的种类不断增加。运营商对移动数据业务的关注正从“网络”向“用户”层面不断深化,如何管理好、发展好各类业务已经成为一个亟待解决的问题。
手机终端作为用户体验移动数据业务的物理设备,是用户对运营商服务的感知和体验效果的传导媒介,是用户选择业务类型的重要影响因素。在目前移动终端差异化、多样化、个性化的情况下,手机终端能力对业务体验、消费行为的影响也愈发凸显。在移动数据业务发展过程中,存在难以准确定位目标用户,确定适合用户的业务、内容和媒体格式等问题。
目前,通过分析手机终端注册短信、WAP上网行为等获取少量终端信息即机型参数和业务支持能力信息(机型参数例如:屏幕大小、分辨率,业务支持能力信息例如:是否支持Java),不能很好的满足精确营销需要;如果采用人工整理终端信息,则存在事务繁琐且工作量巨大的问题。机型参数和业务支持能力信息。
发明内容
名词解释:
终端信息:包括终端参数信息和业务支持能力信息等。终端参数信息,例如:屏幕大小、分辨率、操作系统类型等。业务支持能力信息,例如:是否支持KJAVA、是否支持流媒体、是否支持QQ等。
手机终端注册短信:终端以普通短信方式向服务器发送“终端注册信息”,内容包括:本机型号,本机ESN或MEID,插入本机UIM卡的IMSI,以及本机软件版本。注册过程完全在后台进行,即:无论是发送注册短消息,还是接收注册成功确认短消息,都不给用户以提示,也不在短消息收件箱和发件箱中显示短消息,避免干扰用户正常使用。
手机资讯门户:提供手机终端的行情资讯门户网站,可提供包括各类手机终端的参数和业务支持能力信息搜索和查询等服务,例如:手机信息网(http://shouji.tenaa.com.cn/),中关村在线(http://www.zol.com.cn/),太平洋电脑网(http://pconline.com.cn)。
爬虫种子门户:是选定用来通过爬虫程序获取机型参数和业务支持能力信息的手机资讯门户。
爬虫搜索或搜索爬虫:主要是通过爬虫程序抓取网页,对网页文本内容进行提取、分析的过程。
分布式并发技术:在此处指分布式处理技术,是分布式计算技术的一种。
一种自动获取手机终端信息的系统,所述的系统通过与短信业务网关连接,采集手机终端注册短信,所述的系统对手机资讯门户进行搜索,其特征是该系统在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元;
所述的注册短信采集单元用于从短信业务网关采集手机终端注册短信;
所述的注册短信解析单元用于解析手机终端注册短信获取用户信息;
所述的终端信息采集单元用于根据用户信息中的新机型名称在手机资讯门户进行搜索,获取终端信息即该新机型参数和业务支持能力信息;
所述的管理单元用于配置搜索相关信息和过滤搜索结果的相关信息。
本发明的管理单元包括爬虫种子和权重配置模块、终端信息名称配置模块和号段信息维护模块。
一种自动获取手机终端信息的方法,应用自动获取手机终端信息的系统,它包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信的步骤;
步骤B、解析手机终端注册短信获取用户信息的步骤;
步骤C、根据用户信息判断是否为新机型的步骤;如果不是新机型,则返回步骤A,如果是新机型,则转步骤D;
步骤D、根据新机型名称在手机资讯门户进行搜索获取该新机型相关网页的步骤;
步骤E、对步骤D获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;
步骤F、对步骤E获取的数据进行聚合处理,获得机型参数和业务支持能力信息,并写入终端信息数据库的步骤。
本发明的步骤A具体为:注册短信采集单元从短信业务网关采集手机终端注册短信,送往云端进行解析。
本发明的步骤B具体为:云端的注册短信解析单元采用分布式并发计算技术对多个手机注册短信进行并发解析处理,获取各用户信息并存入注册短信解析单元中的用户信息数据库;所述的用户信息包括手机号码、手机机型等。
本发明的步骤D具体为:采用爬虫搜索,在手机资讯门户中选择若干作为爬虫种子门户,以新机型名称作为爬虫关键词,利用分布式并发计算技术,同时对多个爬虫种子门户进行搜索,获取该新机型参数和业务支持能力信息。
本发明的步骤E具体为:对多个爬虫种子门户获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;所述的匹配过滤处理是对终端信息名称的匹配处理即根据机型参数和业务支持能力信息的名称进行过滤,获取终端信息即机型参数和业务支持能力信息。
本发明的有益效果:
本发明实现了用户手机终端信息的自动获取;并发对手机终端注册短信进行解析,提高了解析效率;同时对多个手机资讯门户进行爬虫搜索,提高了手机终端信息抓取的广度(更多终端信息)和深度(准确度)。手机终端信息可用于终端媒体格式实时适配,提升用户业务使用体验,用于移动业务精准营销和用户消费行为分析,支撑移动互联网流量经营。
附图说明
图1是本发明的流程示意图。
图2是本发明的应用场景示意图。
图3是本发明手机终端注册短信采集流程图。
图4是本发明手机终端信息采集流程图。
图5是本发明一实施例的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
本发明提出了一种自动获取手机终端信息的系统和方法。具体说明如下:
如图1所示,为本发明自动获取手机终端信息的系统和方法的流程示意图。包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信,送往云端进行解析;
步骤B、云端采用分布式计算技术对手机注册短信进行并发解析处理,获取用户信息(如:手机号码、手机机型等),写入用户信息数据库;
步骤C、判断手机是否为新机型,如果不是,转步骤A,否则,转步骤D;
步骤D、以机型名称作为爬虫关键词,利用云平台分布式并发技术,同时对多个爬虫种子门户进行搜索;
步骤E、对各爬虫程序抓取的网页进行去重处理,对剩余的网页进行语义分析、匹配过滤处理;
步骤F、进行聚合分析处理,获得机型参数和业务支持能力信息,并写入终端信息数据库;
本发明的应用场景如图2所示,由手机终端、短信业务网关、自动获取手机终端信息的系统和手机资讯门户等四部分构成。具体说明如下:
1、手机终端
用户开机时,判断终端的ESN(或pseudo-ESN 或MEID)和UIM卡的IMSI 参数对是否与上次关机时的参数对匹配。如果匹配,终端不做任何处理,继续执行后续的开机过程;如果不匹配,终端应将新的ESN/IMSI 参数对以及终端的软件版本和终端型号以短消息的方式上报短信业务网关。
2、短信业务网关
接收手机终端发送的注册短信,直接向手机终端信息自动采集系统转发或提供交换机镜像端口供采集。
3、自动获取手机终端信息的系统
从短信业务网关采集手机终端注册短信,解析获取用户号码、终端机型等信息,写入用户信息数据库。当发现手机终端为新机型时,利用爬虫技术,通过互联网从手机资讯门户进行爬虫搜索,然后对爬虫结果进行聚合分析处理,获得更多终端信息。
系统采用云计算理念设计,对采集的注册短信进行并发解析处理,提高注册短信解析效率;采用分布式计算技术,同时对多个手机资讯门户网站进行爬虫搜索,对搜索结果进行分析、聚合处理,提高终端信息采集广度(更多终端信息)和深度(准确度);系统采用分布式数据库技术,对数据进行众向分割处理,用户号码、机型信息存储在用户信息数据库,机型参数和业务支持能力信息存储在终端信息数据库,提高数据库的访问速度。
4、手机资讯门户
提供手机终端的行情资讯门户网站,可提供包括各类手机终端的参数和业务支持能力信息搜索和查询等服务。
手机终端注册短信采集和解析
1、手机终端注册短信采集
手机终端注册短信采集流程如图3所示,包括以下步骤:
步骤A、接收从短信业务网关转发或镜像的短消息;
步骤B、对接收短消息的目标端口、消息类型和目的接入号等进行判断;
步骤C、判断是否符合指定要求,如果符合,转步骤E,否则,转步骤D;
步骤D、丢弃该消息,继续接收下一条消息,转步骤A;
步骤E、将接收短消息发送到云端进行解析处理。
2、手机终端注册短信解析
手机终端信息存在于注册短信Content(内容)字段中,可根据相关技术规范进行解析。例如,Content字段解码后为:
<a1><b1>SAF-D9900</b1><b2>A1B2FD8E</b2><b3>460036120024361</b3><b4>5.2.20271.920C</b4></a1>DCFF32EB
各字段含义:
SAF-D9900:机型
A1B2FD8E:ESN或MEID信息
460036120024361:IMSI信息
5.2.20271.920C:手机的软件版本
DCFF32EB:CRC校验
终端信息采集
终端信息采集流程如图4所示,包括以下步骤:
步骤A、根据设置的爬虫种子(手机资讯门户URL),以机型名称作为关键词,并发进行爬虫搜索,抓取关联网页;
步骤B、对各爬虫程序抓取的网页进行去重复处理,对剩余的网页进行内容解析,根据设定的终端信息名称,分别进行语义分析和匹配过滤处理;
步骤C、对各爬虫程序分别搜索到的机型信息进行聚合分析处理,获得机型参数和业务支持能力信息;
爬虫结果分析处理
对剩余的网页进行内容解析,根据设定的各终端信息名称,分别进行语义分析和匹配过滤处理,获得各终端信息名称对应的搜索结果集,同时,计算搜索结果集中(m为)在各爬虫结果中出现的次数,搜索结果可信度使用表示,计算,m为,可信度的最大值为,对应的即为该终端信息名称对应的最终搜索结果。
以同时从“手机信息网”、“太平洋电脑网”和“中关村在线”搜索新机型摩托罗拉ME811终端信息“JAVA功能”为例进行说明,设置三个手机资讯门户网站的对搜索结果的影响权重分别为0.5、0.3和0.2。经过去重复、语义分析和匹配过滤处理后,各手机资讯门户搜索结果见下表:
搜索结果为“支持” | 搜索结果为“不详” | |
手机信息网 | 5个 | 0个 |
太平洋电脑网 | 3个 | 1个 |
中关村在线 | 2个 | 0个 |
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
Claims (7)
1.一种自动获取手机终端信息的系统,所述的系统通过与短信业务网关连接,采集手机终端注册短信,所述的系统对手机资讯门户进行搜索,其特征是该系统在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元;
所述的注册短信采集单元用于从短信业务网关采集手机终端注册短信;
所述的注册短信解析单元用于解析手机终端注册短信获取用户信息;
所述的终端信息采集单元用于根据用户信息中的新机型名称在手机资讯门户进行搜索,获取终端信息即该新机型参数和业务支持能力信息;
所述的管理单元用于配置搜索相关信息和过滤搜索结果的相关信息。
2.根据权利要求1所述的自动获取手机终端信息的系统,其特征是所述的管理单元包括爬虫种子和权重配置模块、终端信息名称配置模块和号段信息维护模块。
3.一种自动获取手机终端信息的方法,应用权利要求1所述的自动获取手机终端信息的系统,其特征是它包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信的步骤;
步骤B、解析手机终端注册短信获取用户信息的步骤;
步骤C、根据用户信息判断是否为新机型的步骤;如果不是新机型,则返回步骤A,如果是新机型,则转步骤D;
步骤D、根据新机型名称在手机资讯门户进行搜索获取该新机型相关网页的步骤;
步骤E、对步骤D获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;
步骤F、对步骤E获取的数据进行聚合处理,获得机型参数和业务支持能力信息,并写入终端信息数据库的步骤。
4.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤A具体为:注册短信采集单元从短信业务网关采集手机终端注册短信,送往云端进行解析。
5.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤B具体为:云端的注册短信解析单元采用分布式并发计算技术对多个手机注册短信进行并发解析处理,获取各用户信息并存入注册短信解析单元中的用户信息数据库;所述的用户信息包括手机号码、手机机型等。
6.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤D具体为:采用爬虫搜索,在手机资讯门户中选择若干作为爬虫种子门户,以新机型名称作为爬虫关键词,利用分布式并发计算技术,同时对多个爬虫种子门户进行搜索,获取该新机型参数和业务支持能力信息。
7.根据权利要求6所述的自动获取手机终端信息的方法,其特征是所述的步骤E具体为:对多个爬虫种子门户获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;所述的匹配过滤处理是对终端信息名称的匹配处理即根据机型参数和业务支持能力信息的名称进行过滤,获取终端信息即机型参数和业务支持能力信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104618697A CN102932481A (zh) | 2012-11-16 | 2012-11-16 | 自动获取手机终端信息的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104618697A CN102932481A (zh) | 2012-11-16 | 2012-11-16 | 自动获取手机终端信息的系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102932481A true CN102932481A (zh) | 2013-02-13 |
Family
ID=47647177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012104618697A Pending CN102932481A (zh) | 2012-11-16 | 2012-11-16 | 自动获取手机终端信息的系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102932481A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104023280A (zh) * | 2014-05-22 | 2014-09-03 | 深圳天珑无线科技有限公司 | 一种远程控制手机短信的方法及移动终端 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731800A (zh) * | 2005-08-19 | 2006-02-08 | 北京新网互联科技有限公司 | 短信网址电话通信系统及其方法 |
CN101022577A (zh) * | 2007-01-09 | 2007-08-22 | 杨李颖 | 短信搜索方法及其系统 |
US20090041013A1 (en) * | 2007-08-07 | 2009-02-12 | Mitchell Nathan A | Dynamically Assigning A Policy For A Communication Session |
US20090279492A1 (en) * | 2008-05-12 | 2009-11-12 | Research In Motion Limited | Methods And Apparatus For Use In Facilitating Access To A Communication Service Via A WLAN Hotspot |
CN101754126A (zh) * | 2009-11-16 | 2010-06-23 | 华为终端有限公司 | 发送短信、接收短信的方法、装置和系统 |
CN102075859A (zh) * | 2010-12-24 | 2011-05-25 | 大唐移动通信设备有限公司 | 一种基于lte系统的信息推送方法和系统 |
-
2012
- 2012-11-16 CN CN2012104618697A patent/CN102932481A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731800A (zh) * | 2005-08-19 | 2006-02-08 | 北京新网互联科技有限公司 | 短信网址电话通信系统及其方法 |
CN101022577A (zh) * | 2007-01-09 | 2007-08-22 | 杨李颖 | 短信搜索方法及其系统 |
US20090041013A1 (en) * | 2007-08-07 | 2009-02-12 | Mitchell Nathan A | Dynamically Assigning A Policy For A Communication Session |
US20090279492A1 (en) * | 2008-05-12 | 2009-11-12 | Research In Motion Limited | Methods And Apparatus For Use In Facilitating Access To A Communication Service Via A WLAN Hotspot |
CN101754126A (zh) * | 2009-11-16 | 2010-06-23 | 华为终端有限公司 | 发送短信、接收短信的方法、装置和系统 |
CN102075859A (zh) * | 2010-12-24 | 2011-05-25 | 大唐移动通信设备有限公司 | 一种基于lte系统的信息推送方法和系统 |
Non-Patent Citations (2)
Title |
---|
刘名博,邓中亮,符丽姹: "基于短信注册的终端信息管理系统的设计与实现", 《中国科技论文在线》, 28 March 2006 (2006-03-28) * |
谢莹,范冰冰,黄兴平: "移动服务平台终端智能适配框架的研究", 《计算机技术与发展》, no. 12, 17 March 2011 (2011-03-17) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104023280A (zh) * | 2014-05-22 | 2014-09-03 | 深圳天珑无线科技有限公司 | 一种远程控制手机短信的方法及移动终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862022B (zh) | 文化资源推荐系统 | |
US10216848B2 (en) | Method and system for recommending cloud websites based on terminal access statistics | |
CN103218431B (zh) | 一种能识别网页信息自动采集的系统 | |
US20150213042A1 (en) | Search term obtaining method and server, and search term recommendation system | |
US20150012519A1 (en) | Recommendation search method for search engine, device and computer readable storage medium | |
CN102855309B (zh) | 一种基于用户行为关联分析的信息推荐方法及装置 | |
CN103744856A (zh) | 联动性扩展搜索方法及装置、系统 | |
CN104899220A (zh) | 应用程序推荐方法和系统 | |
CN102315953A (zh) | 基于帖子的出现规律来检测垃圾帖子的方法及设备 | |
CN103248677B (zh) | 互联网行为分析系统及其工作方法 | |
KR101925950B1 (ko) | 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치 | |
CN103617266A (zh) | 个性化扩展搜索方法及装置、系统 | |
CN106528777A (zh) | 跨屏用户标识归一的方法及其系统 | |
CN107835132B (zh) | 一种流量来源跟踪的方法及装置 | |
CN102750352A (zh) | 浏览器中分类收藏历史访问记录的方法及装置 | |
CN103823811A (zh) | 用于处理日志的方法及其系统 | |
CN104615627A (zh) | 一种基于微博平台的事件舆情信息提取方法及系统 | |
CN102298617A (zh) | 一种用于获取目标页面的方法与设备 | |
CN110020161B (zh) | 数据处理方法、日志处理方法和终端 | |
CN103020208A (zh) | 一种与移动终端相适应的搜索方法及装置 | |
CN109064067B (zh) | 基于互联网的金融风险运营主体判定方法及装置 | |
CN103248513A (zh) | 基于Office办公套件的网络信息数据采集方法及系统 | |
CN117254983A (zh) | 涉诈网址检测方法、装置、设备及存储介质 | |
CN105095450A (zh) | 一种用于确定用户移动互联网访问兴趣点的方法 | |
CN102932481A (zh) | 自动获取手机终端信息的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130213 |