发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种能够自动将应用软件使用需求和使用终端信息收集并按照潜在价值进行分类和统计,从而有利于帮助应用平台采取有针对性的应用软件推广策略和提高用户满意度的基于应用软件的用户信息收集方法和系统。
为了实现上述目的,本发明采用的技术方案为:
一种基于应用软件的用户信息收集方法,所述方法包括以下步骤:
S10:获取并分析同一应用软件的用户终端设备数据子集;
S20:根据预设等级分类标准划分用户终端设备数据子集;
S30:提取用户网际协议地址和设备身份标识,并归类到对应类别的用户信息队列中,以建立信息库。
进一步地,所述步骤S20中所述预设等级分类标准如下:
第一类,访问过所述应用软件相关信息但未安装所述应用软件的用户终端设备数据子集;
第二类,已经安装所述应用软件的用户终端设备数据子集;
第三类,除了所述第一类和所述第二类以外的其他用户终端设备数据子集;
其中,等级由高到低依次为第一类、第三类、第二类。
进一步地,所述方法还包括:
S40:将信息库中每一类别下的用户网际协议地址和设备身份标识进行去重操作。
进一步地,所述步骤S40中包括:
S41:除去除最低等级类别以外的其他类别中存在的与最低等级类别重复的用户网际协议地址和设备身份标识。
进一步地,所述步骤S10中包括:
S11:根据用户终端设备数据集中的统一资源定位符和用户代理筛选出同一应用软件的用户终端设备数据子集。
一种基于应用软件的用户信息收集系统,所述系统包括:
获取分析模块,用于获取并分析同一应用软件的用户终端设备数据子集;
划分模块,用于根据预设等级分类标准划分用户终端设备数据子集;
建立模块,用于提取用户网际协议地址和设备身份标识,并归类到对应类别的用户信息队列中,以建立信息库。
进一步地,所述划分模块包括:
预设单元,用于预设等级分类标准。
进一步地,所述系统还包括:
去重模块,用于将信息库中每一类别下的用户网际协议地址和设备身份标识进行去重操作。
进一步地,所述去重模块包括:
顺序单元:用于预设去重顺序,以便根据预设去重顺序将信息库中每一类别下的用户网际协议地址和设备身份标识进行去重操作。
进一步地,所述获取分析模块包括:
筛选单元,用于根据用户终端设备数据集中的统一资源定位符和用户代理筛选出同一应用软件的用户终端设备数据子集。
采用上述技术方案后,本发明的有益效果是:(1)通过预设等级分类标准预先将从用户终端设备上的获取的用户终端设备数据子集精确的分类收集,并按照相应的潜在价值划分出等级,有利于信息的精准定位;
(2)通过提取用户网际协议地址和设备身份标识并归类到对应类别,可精准的收集用户终端的信息和推送路径,以便后期将推送消息按这些路径推送,另外对应类别的归类,有利于根据类别分类情况设计并推送不同的推广消息;
(3)多次数据信息采集分类后,类别之间或同一类别中会存在重复用户网际协议地址和设备身份标识,通过将信息库中每一类别下的用户网际协议地址和设备身份标识进行去重操作,有利于在利用这个信息库进行信息推送时避免信息重复推送,从而减少网络资源和物力财力的浪费。
(4)在用户终端设备中获取信息的途径决定了信息采集面广度以及信息准确度,本发明通过根据用户终端设备数据集中的统一资源定位符和用户代理筛选出同一应用软件的用户终端设备数据子集,可提高信息采集面广度以及信息准确度。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
各大应用平台为了扩大其软件的市场份额和提升自身的竞争力,投入了大量的广告和优惠政策,然而这些措施所面向的对象具有普遍性,推广效果并不理想。
如果能够精确定位客户,将潜在客户统计出来,从而有针对性的对这些客户采取对应推广措施,不仅有利于提高推广的精确性,而且还能够有利于市场份额的增长和市场竞争力的提高;另外,将目前已经拥有的客户统计出来,也针对性的推广相关信息,可以提高已有客户的满意度,带来更多的社会效益和经济效益。
实施例1
如图1所示,本实施例提供一种基于应用软件的用户信息收集方法,所述方法包括以下步骤:
S10:获取并分析同一应用软件(APP)的用户终端设备数据子集;
大数据时代,用户终端的网络行为数据大多被以数据包的形式储存,所以数据的收集不存在时效性的问题,但用户的需求有时具有时效性。
本步骤中,一般先选定某一应用平台的APP作为数据筛选依据,该应用平台设置定期自动根据本平台的APP网址类特征,从用户终端的数据包中查看并获取到与本平台APP有关的用户终端设备数据子集,然后进行分析处理。其中,用户终端设备数据子集中含有同一APP网址特征,通俗的说,就是包含用户终端使用和搜索本平台的同一APP的情况。
S20:根据预设等级分类标准划分用户终端设备数据子集;
本步骤中,应用平台根据预先设定好的等级分类标准,划分上一步骤中获取到的用户终端设备数据子集;分类标准以及等级的划分,可以决定信息的价值,应用平台可通过自定义的方式划分用户终端设备数据子集,优化信息分类,使零散的信息得到整合,有利于为应用平台的商业决策提供依据,从而带来更多的商业价值。
S30:提取用户网际协议地址(IP)和设备身份标识(ID),并归类到对应类别的用户信息队列中,以建立信息库。
信息的获取是为了了解客户群体的需求,如何根据信息展现的需求,实施相应策略满足需求才是最终目的。
本步骤中,将含有同一APP网址特征的所有用户终端设备数据子集的用户IP和设备ID提取出来,可精准的收集用户终端的信息和推送路径,方便后期将推送消息按这些路径推送,另外将用户IP和设备ID对应类别的归类,有利于根据类别分类情况设计并推送不同的推广消息,增加客户量的同时提高用户满意度。
实施例2
本实施例与之前实施例的区别在于,本实施例提供详细的等级分类标准,所述步骤S20中所述预设等级分类标准如下:
第一类,访问过所述APP相关信息但未安装所述APP的用户终端设备数据子集;
第二类,已经安装所述APP的用户终端设备数据子集;
第三类,除了所述第一类和所述第二类以外的其他用户终端设备数据子集;
其中,等级由高到低依次为第一类、第三类、第二类。
本实施例的等级分类标准中以潜在价值为分类依据,将访问过所述APP相关信息但未安装所述APP的用户终端设备数据子集作为最高等级,即作为最有潜在价值的信息集合,其他依次排序,有利于针对不同的用户潜在等级,激发平台中嵌入的推广信息系统,发送对应等级的安装或使用推广链接。
实施例3
本实施例与实施例2的区别在于,本实施例提供另一种详细的等级分类标准,所述步骤S20中所述预设等级分类标准如下:
第一类,访问过所述APP相关信息但未安装所述APP的用户终端设备数据子集;
第二类,已经安装了所述APP的用户终端设备数据子集;
第三类,除了所述第一类和所述第二类以外的其他用户终端设备数据子集中可以检测到所述APP信息的用户终端设备数据子集;
第四类,未检测到所述APP信息的用户终端设备数据子集。
其中,等级由高到低的顺序为第一类、第三类、第四类、第二类。
本实施例中同样以潜在价值作为分类依据,但更加细化的划分出潜在价值等级,更加有针对性的将除了第一类和第二类以外的其他类数据子集再一次划分,保障更多的信息可以得到恰当的利用。
实施例4
如图2、图3所示,本实施例与实施例3的区别在于,本实施例提供的一种基于应用软件的用户信息收集方法,进一步地还包括:
S40:将信息库中每一类别下的用户IP和设备ID进行去重操作。
具体地,所述步骤S40中包括:
S41:除去除最低等级类别以外的其他类别中存在的与最低等级类别重复的用户IP和设备ID。
由步骤S20可知,步骤S10中获取的所有用户终端设备数据子集可分为四类,假设以A代表第一类的设备信息,B代表第二类的设备信息,C代表第三类的设备信息和D代表第四类的设备信息,其中,设备信息包括用户IP和设备ID,ABCD潜在性用户等级由高到底顺序为:A>C>D>B。
通过步骤S30相应字段的提取,将每一类的用户终端设备数据子集中的用户IP和设备ID提取到ABCD对应储存用户设备信息的信息库中,由于应用平台的APP多种多样,一次或多次的数据收集过程中,ABCD四个不同类别下(包括类别之间以及类别中)可能会收集到相同的用户设备信息,因此,为了方便后期利用这些用户设备信息推送广告信息时避免信息重复推送,减少网络资源和物力财力的浪费,必要的对ABCD中每一类中的设备信息进行去重操作。
去重操作步骤如下:首先按步骤S41除去除最低等级类别以外的其他类别中存在的与最低等级类别重复的用户IP和设备ID,也就是说,在ACD中去除与B中重复的设备信息;然后在CD中去除与A中重复的设备信息,最后在D中去除与C中重复的设备信息。去重之后,就保证了用户IP和设备ID唯一性,在利用这些用户设备信息推送广告信息时,不会出现重复推送造成的资源浪费。
具体地,所述步骤S10中包括:
S11:根据用户终端设备数据集中的统一资源定位符(URL)和用户代理(UA)筛选出同一APP的用户终端设备数据子集。
本步骤中用户终端设备数据集就是用户终端设备在数据交互时产生的所有数据总和,这个数据总和一般会以数据集或数据包的形式,保存下来。
互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它;另外,用户代理(User Agent,简称UA),它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。通过判断UA给不同的操作系统、不同的浏览器发送不同的页面,直接快速而又准确。
综上所述,URL和UA中都包含有用户终端设备信息,缺一不可。所以本步骤中筛选出同一APP的用户终端设备数据子集,需要查看用户终端设备数据集中的URL和UA,当且仅当用户终端设备数据集中的URL和UA中具有本应用平台同一APP网址的一般特征时,才会被获取出来作为同一APP的用户终端设备数据子集。
本实施例以同一APP被使用和访问的情况作为收集依据,划分出同一APP潜在用户等级,并对应保存好用户的设备信息和推送路径,以便针对该同一APP设计相关推送策略,重复多次本实施例提供的方法,可将应用平台下所有APP使用和访问的情况整合出来,成为有更多商业价值的信息。
实施例5
如图4所示,本实施例提供一种基于应用软件的用户信息收集系统,所述系统包括:
获取分析模块100,用于获取并分析同一APP的用户终端设备数据子集;
划分模块200,用于根据预设等级分类标准划分用户终端设备数据子集;
建立模块300,用于提取用户IP和设备ID,并归类到对应类别的用户信息队列中,以建立信息库。
所述划分模块200包括:
预设单元210,用于预设等级分类标准。
具体地,所述系统还包括:
去重模块400,用于将信息库中每一类别下的用户IP和设备ID进行去重操作。
所述去重模块400包括:
顺序单元410:用于预设去重顺序,以便根据预设去重顺序将信息库中每一类别下的用户IP和设备ID进行去重操作。
所述获取分析模块100包括:
筛选单元110,用于根据用户终端设备数据集中的URL和UA筛选出同一APP的用户终端设备数据子集。
具体模块间工作原理如下:首先获取分析模块100会定期启动,获取分析模块100启动后,它当中的筛选单元110根据用户终端设备数据集中的URL和UA筛选出同一APP的用户终端设备数据子集,然后获取分析模块100提取出同一APP的用户终端设备数据子集并分析了解其中的数据字段包含的相关信息;
划分模块200则根据预设单元210中预设的等级分类标准,将获取分析模块100获取分析好的同一APP的用户终端设备数据子集按标准划分;
建立模块300接收这些划分好类别和等级高低同一APP的用户终端设备数据子集,提取当中的用户IP和设备ID,并归类到对应类别的用户信息队列中,从而建立一个包含用户IP和设备ID的、具有对应类别和等级高低的信息库;
去重模块400将信息库中重复的用户IP和设备ID去除,但是由于用户IP和设备ID有对应类别和等级高低,所以需要去重模块400依据顺序单元410中预设的去重顺序,将信息库中每一类别下的用户IP和设备ID进行去重操作。需要说明的是,去重模块400可以在所有APP的相关信息收集完毕后,只进行唯一一次的去重操作,从而加快信息收集速度。
综上,一次信息收集完毕,可帮助某一APP精确定位客户,了解客户需求,从而有针对性的对这些客户采取对应推广措施,不仅有利于提高推广的精确性,而且还能够有利于市场份额的增长和市场竞争力的提高。
多次信息收集完毕后,整合出一个更大的信息集,帮助更加了解客户群体的需求,从而产生更大的商业价值。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。