CN105429976A - 一种基于手机号码的网民行为分析方法及系统 - Google Patents
一种基于手机号码的网民行为分析方法及系统 Download PDFInfo
- Publication number
- CN105429976A CN105429976A CN201510772216.4A CN201510772216A CN105429976A CN 105429976 A CN105429976 A CN 105429976A CN 201510772216 A CN201510772216 A CN 201510772216A CN 105429976 A CN105429976 A CN 105429976A
- Authority
- CN
- China
- Prior art keywords
- data
- phone number
- netizen
- analysis
- network behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/302—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information gathering intelligence information for situation awareness or reconnaissance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明属于信息统计分析领域,具体涉及一种基于手机号码的网民行为分析方法及系统。本发明提出的一种基于手机号码的网民行为分析方法,对数据采集单元采集到的数据,首先进行格式校验,校验手机号码字段是否正确,若错误,则将数据去掉,对于通过验证的数据进行处理,得到手机号码区域信息,接着对单个网民的网络行为进行分析和区域内网民的网络行为进行分析。本发明可用于将同一公司内部的网民行为数据进行采集、整理、分析从而能够为网民制定更人性化的信息服务。
Description
技术领域
本发明属于信息统计分析领域,具体涉及一种基于手机号码的网民行为分析方法及系统。
背景技术
《中国互联网络发展状况统计报告》显示截至2015年6月我国的网民规模达6.68亿互联网普及率为48.8%,其中手机网民规模达5.94亿人,占我国总网民数的88.9%。随着手机终端大屏化和手机应用体验的不断提升,手机作为网民主要上网终端的趋势进一步明显。手机将作为我国互联网民接入的主要终端,网民将在手机端完成大部分的网络行为,伴随着手机号+短信验证码这种安全校验的风控模型的逐渐完善,网民将逐渐使用手机号码作为网络ID进行网络资源的访问通行证。
随着近几年互联网技术的快速发展,各行各业的互联网领导厂商已经基本确定、网络平台逐步的稳定、网民的网络行为也将趋向于规律。互联网市场的服务由原来的大范围撒网式服务,逐渐趋向于精细化服务,要想将网民牢牢的拴在自己的平台上,让其成为企业平台终极粉丝,那就需要互联网企业能够为网民提供人性化、个性化的服务。为了能够提供人性化、个性化的服务就需要针对单个网民个体的上网行为进行分析。
目前互联网企业的各个业务平台分析网民的行为处理方法是独立针对特定的业务系统独立开发一套行为分析平台,且各个业务系统间数据格式不统一,这就造成独立开发的行为分析平台的数据格式也不统一,这使得企业决策者如果需要站在比较高的层次上做决策的时候,就需要在各个业务系统对应的行为分析模块单独查询、收集数据后手动进行分析,这样处理比较费时、费力,而且分析的结果不全面、不准确。
发明内容
针对现有技术存在的问题,本发明提出的一种基于手机号码的网民行为分析方法,对数据采集单元采集到的数据,首先进行格式校验,校验手机号码字段是否正确,若错误,则将数据去掉,对于通过验证的数据进行处理,得到手机号码区域信息,接着对单个网民的网络行为进行分析和区域内网民的网络行为进行分析。
本发明提出了一种基于手机号码的网民行为分析系统,根据业务系统实现的环境的不同,将数据采集单元从整个分析系统中独立出来,将采集到的数据以统一的数据结构和数据格式,传送给消息中间服务器,数据处理与分析单元对这些数据统一的处理、分析等操作。
本发明采用如下技术方案:
一种基于手机号码的网民行为分析方法,包括以下步骤:
S1,数据采集单元设置于业务系统中,从业务系统中采集数据,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;
S2,数据处理与分析单元对消息中间服务器中的数据进行处理,对数据中的手机号码字段进行校验,若校验错误,则将该数据去掉;
S3,校验通过的数据,处理得到手机号码对应的区域信息,并将数据进行存储;
S4,基于手机号码对单个网民的网络行为进行分析,和基于区域信息对区域内网民的网络行为进行分析。
进一步的,步骤S1中数据结构还包括网民的网络行为和网络行为发生时间。
进一步的,步骤S1中数据采集单元将采集到的数据以Json格式传输到消息中间服务器中。
进一步的,步骤S1中包括多个数据采集单元,设置在多个业务系统中采集数据。
一种基于手机号码的网民行为分析系统,它包括数据采集单元、消息中间服务器和数据处理与分析单元,
数据采集单元,用于采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;
消息中间服务器,消息中间服务器用于存储数据采集单元传输来的数据;
数据处理与分析单元,从消息中间服务器下载数据,并对这些数据进行处理与分析,得到单个网民的网络行为分析结果和区域内网民的网络行为分析结果。
进一步的,数据采集单元将采集到的数据格式为Json格式。
进一步的,数据结构还包括网民的网络行为和网络行为发生时间。
进一步的,该系统包括多个数据采集单元,设置在多个业务系统中采集数据。
进一步的,数据处理与分析单元,包括数据格式校验模块、手机号码区域识别模块、数据存储模块和行为分析模块;
数据格式校验模块从消息中间服务器下载的数据进行校验,主要校验数据中的手机号码字段,若无手机号码或手机号码格式错误,则将该数据去掉;
手机号码区域识别模块处理校验通过的手机号码,得到手机号码对应的区域信息,该模块输出的数据结构包括手机号码、区域编码、网络行为、网络行为发生时间;
数据存储模块,将手机号码区域识别模块输出的数据进行分类存储;
行为分析模块,基于手机号码进行单个网民的网络行为、网络行为发生时间的多维度分析,基于区域进行区域网民的网络行为、网络行为发生时间的多维度分析。
更进一步的,行为分析模块独立部署,或作为现有的业务系统功能模块嵌入到业务系统。
本发明的数据采集单元与数据处理与分析单元通过消息中间件服务器进行通信,降低了系统间的耦合度。数据采集单元可部署在不同的业务系统中,采集不同业务系统的数据,以统一的数据结构和数据格式发送给信息中间服务器。在同一公司的不同业务系统,只要通过一个手机号码就能检索到持有这个手机号码的网民的行为数据,将同一公司内部的网民行为数据进行采集、整理、分析从而能够为网民制定更人性化的信息服务。
附图说明
图1是基于手机号码的网民行为分析系统的结构图;
图2是基于手机号码的网民行为分析系统的数据分析与处理单元结构图;
图3是数据分析与处理单元的流程图。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
现结合附图和具体实施方式对本发明进一步说明。
参阅图1所示,为基于手机号码的网民行为分析系统的结构图,它包括数据采集单元1、消息中间服务器2和数据处理与分析单元3,其中,本发明给出的实施例中包括三个数据采集单元1。
数据采集单元1,用于采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器2,数据结构至少包括网民的手机号码。将在业务系统中的有效源数据采集下来并传输到消息中间服务器2中。多个数据采集单元1设置在多个业务系统中,为了便于对数据的处理与分析,定义多个数据采集单元1将采集到的各个业务系统的有效源数据按指定的数据结构且以Json的数据格式传输到消息中间服务器2上,这样做的好处是大大降低了前端数据采集单元1与后端的数据处理与分析单元3的耦合性。在新的业务系统需要进行数据采集的时候,只需要在这个业务系统中设置一个数据采集单元1即可。
该实施例中的数据采集单元1为数据采集钩子(HOOK)。该实施例数据采集单元1定义采集的数据格式为网民的手机号码、网络行为和网络行为发生时间,网络行为包括行为类型大类和行为类型小类。其中,行为类型大类表示网民的自身行为,例如网民在电商网站就会产生“购买”这个行为大类,而行为类型小类指的是行为类型大类发生的对象,在行为类型大类为“购买”下,行为类型小类就表示购买的“产品类型”。数据采集钩子通过消息中间件的方式,将采集到的数据传送的消息中间件服务器2上。
前端数据采集单元1与后端数据处理与分析单元3采用消息中间件的方式通信,将系统间的耦合度降低,前端数据采集单元1以数据采集钩子(HOOK)的形式存在,本发明不限定数据采集钩子(HOOK)的实现方式,只限定数据采集钩子(HOOK)传输到消息中间件服务器上的数据格式为Json格式且数据结构中必须包含手机号码。
消息中间服务器2,消息中间服务器2用于存储数据采集单元1传输来的数据。所有的数据采集单元1向消息中间服务器2传输的数据,均为手机号码、网络行为和网络行为发生时间的数据结构,且数据格式为Json格式。
数据处理与分析单元3,从消息中间服务器2下载数据,并对这些数据进行处理与分析,得到单个网民的网络行为分析结果和区域内网民的网络行为分析结果。参阅图2所示,为基于手机号码的网民行为分析系统的数据分析与处理单元结构图,数据处理与分析单元3,包括数据格式校验模块31、手机号码区域识别模块32、数据存储模块33和行为分析模块34。
数据格式校验模块31从消息中间服务器2下载的数据进行校验,主要校验数据中的手机号码字段,如果手机号码字段校验失败(手机号码字段为空或手机号码格式错误等情况),则将数据去掉。
手机号码区域识别模块32处理校验通过的手机号码,得到手机号码对应的区域信息,该模块输出的数据结构包括手机号码、区域编码、行为类型大类、行为类型小类、行为发生时间。
数据存储模块33,将手机号码区域识别模块32输出的数据进行分类存储,存储方式以行为分析模块34的实现方式来确定。若分析单个网民的网络行为,则以手机号码为类进行存储;若分析区域网民的网络行为,则以区域编码为类进行存储。
行为分析模块34,基于手机号码进行单个网民的网络行为、网络行为发生时间的多维度分析,或基于区域进行区域网民的网络行为、网络行为发生时间的多维度分析。行为分析模块34可以独立部署,也可以作为现有的业务系统功能模块嵌入到业务系统。
参阅图3所示,为数据分析与处理单元的流程图,从消息中间服务器2下载相关数据后,数据格式校验模块31首先对数据格式中的手机号码字段进行校验,若校验失败,则将该组数据去掉。校验通过的数据传送给手机号码区域识别模块32,参照手机号码区域信息置换表进行处理,得到手机号码对应的区域信息,并将数据结果以手机号码、区域编码、行为类型大类、行为类型小类、行为发生时间的数据结构传输给行为分析模块34,对网民行为进行分析。行为分析模块34是至少包含两种分析方法:一是通过指定手机号码对单个网民进行行为类型大类、行为类型小类、行为发生时间的多维度分析,二是通过选择区域进行行为类型大类、行为类型小类、行为发生时间的多维度分析。
本发明基于以上系统提出一种基于手机号码的网民行为分析方法,包括以下步骤:
S1,数据采集单元从业务系统中采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;
S2,数据处理与分析单元对消息中间服务器中的数据进行处理,对数据中的手机号码字段进行校验,若校验错误,则将该数据去掉;
S3,校验通过的数据,处理得到手机号码对应的区域信息,并将数据进行存储;
S4,基于手机号码对单个网民的网络行为进行分析,和基于区域信息对区域内网民的网络行为进行分析。
步骤S1中数据结构还包括网民的网络行为和网络行为发生时间,数据格式为Json格式。此外,步骤S1中包括多个数据采集单元,设置在多个业务系统中采集数据。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
Claims (10)
1.一种基于手机号码的网民行为分析方法,其特征在于:包括以下步骤:
S1,数据采集单元设置于业务系统中,从业务系统中采集数据,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;
S2,数据处理与分析单元对消息中间服务器中的数据进行处理,对数据中的手机号码字段进行校验,若校验错误,则将该数据去掉;
S3,校验通过的数据,处理得到手机号码对应的区域信息,并将数据进行存储;
S4,基于手机号码对单个网民的网络行为进行分析,和基于区域信息对区域内网民的网络行为进行分析。
2.如权利要求1所述的基于手机号码的网民行为分析方法,其特征在于:所述步骤S1中数据结构还包括网民的网络行为和网络行为发生时间。
3.如权利要求1所述的基于手机号码的网民行为分析方法,其特征在于:所述步骤S1中数据采集单元将采集到的数据以Json格式传输到消息中间服务器中。
4.如权利要求1所述的基于手机号码的网民行为分析方法,其特征在于:步骤S1中包括多个数据采集单元,设置在多个业务系统中采集数据。
5.一种基于手机号码的网民行为分析系统,其特征在于:它包括数据采集单元、消息中间服务器和数据处理与分析单元,
数据采集单元,用于采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;
消息中间服务器,消息中间服务器用于存储数据采集单元传输来的数据;
数据处理与分析单元,从消息中间服务器下载数据,并对这些数据进行处理与分析,得到单个网民的网络行为分析结果和区域内网民的网络行为分析结果。
6.如权利要求5所述的基于手机号码的网民行为分析系统,其特征在于:所述数据采集单元将采集到的数据格式为Json格式。
7.如权利要求5所述的基于手机号码的网民行为分析系统,其特征在于:所述数据结构还包括网民的网络行为和网络行为发生时间。
8.如权利要求5-7任一项所述的基于手机号码的网民行为分析系统,其特征在于:该系统包括多个数据采集单元,设置在多个业务系统中采集数据。
9.如权利要求5-7任一项所述的基于手机号码的网民行为分析系统,其特征在于:所述数据处理与分析单元,包括数据格式校验模块、手机号码区域识别模块、数据存储模块和行为分析模块;
数据格式校验模块从消息中间服务器下载的数据进行校验,主要校验数据中的手机号码字段,若无手机号码或手机号码格式错误,则将该数据去掉;
手机号码区域识别模块处理校验通过的手机号码,得到手机号码对应的区域信息,该模块输出的数据结构包括手机号码、区域编码、网络行为、网络行为发生时间;
数据存储模块,将手机号码区域识别模块输出的数据进行分类存储;
行为分析模块,基于手机号码进行单个网民的网络行为、网络行为发生时间的多维度分析,基于区域进行区域网民的网络行为、网络行为发生时间的多维度分析。
10.如权利要求9所述的基于手机号码的网民行为分析系统,其特征在于:所述行为分析模块独立部署,或作为现有的业务系统功能模块嵌入到业务系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510772216.4A CN105429976A (zh) | 2015-11-13 | 2015-11-13 | 一种基于手机号码的网民行为分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510772216.4A CN105429976A (zh) | 2015-11-13 | 2015-11-13 | 一种基于手机号码的网民行为分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105429976A true CN105429976A (zh) | 2016-03-23 |
Family
ID=55507918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510772216.4A Pending CN105429976A (zh) | 2015-11-13 | 2015-11-13 | 一种基于手机号码的网民行为分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105429976A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073591A (zh) * | 2016-11-10 | 2018-05-25 | 北京宸信征信有限公司 | 一种具有身份属性的多源数据的整合存储系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102143224A (zh) * | 2011-01-25 | 2011-08-03 | 张金海 | 基于手机上网用户行为的分析方法和装置 |
CN102238045A (zh) * | 2010-04-27 | 2011-11-09 | 广州迈联计算机科技有限公司 | 一种无线互联网用户行为的预测系统和方法 |
CN102591995A (zh) * | 2012-03-12 | 2012-07-18 | 浙江大学城市学院 | 一种基于云数据中心的用户信息处理方法及装置 |
CN102624890A (zh) * | 2012-03-08 | 2012-08-01 | 广州铭信网标网络科技有限公司 | 一种为手机用户终端提供个性网页内容的方法和网标系统 |
CN103763124A (zh) * | 2013-12-26 | 2014-04-30 | 孙伟力 | 一种互联网用户行为分析预警系统及方法 |
-
2015
- 2015-11-13 CN CN201510772216.4A patent/CN105429976A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102238045A (zh) * | 2010-04-27 | 2011-11-09 | 广州迈联计算机科技有限公司 | 一种无线互联网用户行为的预测系统和方法 |
CN102143224A (zh) * | 2011-01-25 | 2011-08-03 | 张金海 | 基于手机上网用户行为的分析方法和装置 |
CN102624890A (zh) * | 2012-03-08 | 2012-08-01 | 广州铭信网标网络科技有限公司 | 一种为手机用户终端提供个性网页内容的方法和网标系统 |
CN102591995A (zh) * | 2012-03-12 | 2012-07-18 | 浙江大学城市学院 | 一种基于云数据中心的用户信息处理方法及装置 |
CN103763124A (zh) * | 2013-12-26 | 2014-04-30 | 孙伟力 | 一种互联网用户行为分析预警系统及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073591A (zh) * | 2016-11-10 | 2018-05-25 | 北京宸信征信有限公司 | 一种具有身份属性的多源数据的整合存储系统及方法 |
CN108073591B (zh) * | 2016-11-10 | 2021-10-12 | 北京宸信征信有限公司 | 一种具有身份属性的多源数据的整合存储系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230013506A1 (en) | Systems and methods for collecting, tracking, and storing system performance and event data for computing devices | |
KR101980286B1 (ko) | 애플리케이션별 자원 사용량 정보의 제공 기법 | |
US20170255546A1 (en) | System and method for automatic software development kit configuration and distribution | |
CN102694861B (zh) | 一种基于云技术的终端应用软件分类方法、装置及系统 | |
CN107977457B (zh) | 数据清算方法、系统和计算机可读存储介质 | |
US20160210632A1 (en) | Secured payment method and relevant device and system | |
CN107391746A (zh) | 日志分析方法、设备和计算机可读存储介质 | |
US20120117425A1 (en) | Method and apparatus for obtaining feedback from a device for recommendations | |
US10180893B2 (en) | System and method for providing additional functionality to developer side application in an integrated development environment | |
CN110020381A (zh) | 基于配置文件的校验方法、装置、设备和计算机存储介质 | |
CN109710490A (zh) | 客户端日志的采集方法、装置、存储介质和电子设备 | |
CN107295082A (zh) | 软件运行处理方法、装置及系统 | |
CN104881734A (zh) | 一种基于灰度发布引导产品改进的方法、装置及系统 | |
CN109062957A (zh) | 案源获取和推荐方法及系统 | |
CN105553770B (zh) | 一种数据采集控制方法和装置 | |
CN103491522A (zh) | 终端适配方法和装置 | |
CN102340791A (zh) | 一种用于实现数据一致性的系统和方法 | |
CN105224420B (zh) | 一种自动解析终端异常的分析方法及系统 | |
CN110765552A (zh) | 三维地质模型的属性信息展示方法及装置 | |
US11921615B2 (en) | Computer-implemented methods, computer-readable media and electronic devices for processing test electronic transactions | |
CN104168145B (zh) | 一种对无线通信单元进行无线升级的系统和方法 | |
CN107102876B (zh) | 一种应用推送的方法及装置 | |
CN105429976A (zh) | 一种基于手机号码的网民行为分析方法及系统 | |
CN109375923B (zh) | 变更数据处理方法、装置、存储介质、处理器及服务器 | |
CN108881345A (zh) | 消息推送方法及路由设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160323 |
|
RJ01 | Rejection of invention patent application after publication |