一种基于网络路由器的调研信息采集的方法和系统
技术领域
本发明涉及调研信息采集领域,特别是一种基于网络路由器的调研信息采集的方法。本发明还涉及一种基于网络路由器的调研信息采集系统。
背景技术
随着互联网技术的发展和普及,互联网已经成为了人们生活中不可缺少的一部分,上网成为了一种生活方式,中国网民已经超过6.8亿,平均一个网民有1.05台电脑和1.2部移动设备;数字电视也逐渐成为上网的工具。上网设备逐渐增多,接入网络的环境也从单一的家庭或办公室延展到网吧、餐厅、酒店、机场、车站、交通工具、旅游景点等公共场所。网络路由器也成了所有公共场所上网数据的集散点。因此通过网络路由器发放问卷、采集答案具有其他问卷采集方法不具备的实时精准高覆盖等特性,同时路由器对各个上网设备的数据包收发有完整的日志,这些日志能够较完整的还原网民在各个场所的上网行为特征,因此也可以作为问卷中隐含的数据进行采集。
在现有技术中,调研信息采集者通过互联网问卷平台招募的方法进行调研信息采集,使用的方法主要是:通过问卷平台中问卷调查的形式,收集用户对问卷的作答,根据答案整理总结调研信息。上述方法虽然相比早期通过路面访问、会议访问、招募广告等方法进行问卷采集具有一定的精准性、实时性且一定程度的扩大了覆盖范围,但是答案的准确性全部依赖回答人的记忆准确和诚信,导致了采集到的调研信息可信度低下。
发明内容
有鉴于此,本发明提供了一种基于网络路由器的调研信息采集的方法和系统,通过网络路由器发放问卷、采集答案可以解决现有技术不能实时精准高覆盖的问题,通过同时采集问卷中隐含的数据并进行分析,完善问卷答案的内容,解决采集到的调研信息可信度低的问题。
根据本发明的第一方面,本发明提供了一种基于网络路由器的调研信息采集方法,所述方法包括:
路由器从服务器获取问卷任务和分发策略;
路由器向符合策略条件的用户终端推送问卷的消息通知;
用户响应消息通知后从服务器获取问卷内容;
服务器收集问卷答案数据,所述答案数据包含显式作答和隐含数据中的至少一个,显示作答是用户对问卷问题回答的内容,隐含数据包含用户上网行为数据;和
服务器分析采集的数据获得最终调研信息。
优选地,所述分发策略包括:时段、地理位置、接入设备的类型、用户特征的行为中的一种或多种。
优选地,所述隐含数据包括设备隐含数据和跨设备隐含数据。
优选地,所述设备隐含数据包括对用户收发日志的特征分析、筛选、统计和聚合得到的设备的上网行为数据。
优选地,所述跨设备隐含数据包括用户在其他路由器上的行为数据,和/或通过组合后的行为数据。
本发明还提供一种基于网络路由器的调研信息采集系统,包括:
定制模块,定制问卷任务及分发策略和问卷内容;
问卷推送模块,向满足分发策略的用户终端推送调研问卷;
采集模块,收集用户设备的上网行为数据及问卷答案;
分析模块,分析处理显式作答、和设备隐含数据与跨设备隐含数据中的至少一种,得到最终调研信息;
存储模块,储存从各个路由器采集到的用户设备的上网行为数据、问卷答案和分析得到的最终调研信息。
优选地,所述定制模块还包括:
任务策略定制单元,定制问卷任务和任务分发的策略;
问卷内容定制单元,定制各调查问卷任务对应的问卷内容。
优选地,定制模块所定制的分发策略包括:
时段、地理位置、接入设备的类型、和用户特征的行为的一种或多种。
优选地,所述设备隐含数据包括对用户收发日志的特征分析、筛选、统计和聚合得到用户设备的上网行为统计数据。
优选地,所述跨设备隐含数据包括用户在其他路由器上的行为数据,和/或通过组合后的行为数据。
在本发明的一些实施方式中,所述跨设备隐含数据通过在存储模块中检索从其他路由器采集到的该用户设备的上网行为数据和/或问卷答案而获得。
附图说明
本发明的下列附图在此作为本发明的一部分用于理解本发明。
图1是示意地表示本发明一些实施方式的基于网络路由器的调研信息采集系统的结构图。
图2是示意地表示本发明一些实施方式的基于网络路由器的调研信息采集方法流程图。
图3是示意地表示本发明一些事实方式的基于网络路由器的调研信息采集方法示意图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
本发明中的术语“路由器”是连接因特网中各局域网、广域网的设备,它会根据信道的情况自动选择和设定路由,以最佳路径,按前后顺序发送信号。路由器是互联网络的枢纽。
本发明中的术语“问卷”是以问题的形式系统的记载需调查内容的一种载体,将问题传达给被问者,并使被问者乐于回答,通过得到的答案获取需要了解的信息。
本发明中的术语“HTTP协议”即超文本传输协议,是用于从WWW服务器传输超文本到本地浏览器的传输协议。
本发明中的术语“用户终端”中的用户是指设备的直接使用者,而用户终端指该使用者的终端设备,其通过连接服务器以获取服务。所述用户终端包括但不限于手机、手提电脑、PC、平板电脑、智能电视等。
本发明中的术语“设备特征ID”是指用以描述设备的特征参数,其与设备唯一对应,包括设备特征码、MAC地址、网络IP、国际移动用户识别码MSI、国际移动设备识别码IMEI、特定域名下的Cookie、特定网站的账户ID等。所述设备特征ID还包括通过整合设备信息,利用例如哈希算法等数学工具计算出的值。
所述设备信息包括但不限于所述用户设备的任意可直接获取的信息,如所述用户设备的IP地址、所述用户设备的实时网速或某一时间段内的平均网速、所述用户设备的操作系统名称、所述用户设备的操作系统版本号、所述用户设备的开发框架名称、所述用户设备的开发框架版本号、所述用户设备的系统配置等。特别的,所述设备信息还包括设备的硬件信息,包括但不限于整机的品牌、型号、序列号;芯片品牌、型号、序列号;传感器品牌、型号、序列号;传感器参数值、角速度、加速度;主板品牌、型号、序列号等。
所述设备信息还可以包括所述用户设备的可直接获取的设备特征信息;或是通过对所述设备信息的分析或统计,以获取的设备特征信息。优选地,所述设备特征信息包括以下至少任一项:
所述用户设备所对应的地域信息:其中,所述地域信息如国家、省、市、自治区、县、乡等行政区域或具体的经纬度等,所述地域信息可通过对所述用户设备的IP、GPS等信息进行分析后获取,或是直接根据所述用户设备的注册地等进行获取;
所述用户设备所对应的运营商信息:其中,所述运营商信息可根据对所述用户设备的IP、手机号等信息进行分析后获取;
所述用户设备所对应的网速:在此,所述网速包括但不限于实时网速或平均网速等,所述网速可以由所述用户设备自身统计,也可以借由第三方测试工具进行统计;
所述用户设备所对应的系统环境:在此,所述系统环境包括但不限于操作系统名称、版本号,开发框架的名称、版本号,系统配置等;
所述用户设备的在线状态/离线状态:即所述用户设备当前是否在线和/或一般在线时间与时长等信息。
在此,本领域技术人员应能理解,所述用户设备可以将可直接获取的所述设备相关信息发送至所述服务设备,由所述服务设备根据所述设备信息,进行所述设备特征信息的确定;此外,所述用户设备也可以根据所述设备信息,进行所述设备特征信息的确定,从而直接将所述设备特征信息发送至所述服务设备。
总体来说,本发明通过路由器从服务器获取问卷任务和分发策略,并向符合策略条件的用户终端推送问卷的消息,用户响应消息通知后从服务器获取问卷内容,服务器收集用户的问卷答案数据、上网行为数据并综合分析,获得最终调研信息。
图1是示意地表示本发明一些实施装置的结构图。
如图1所示在根据本发明所述的系统中,可以包括定制110、采集模块120、分析模块130、存储模块140、和问卷推送模块150。
所述定制模块110包括:任务策略定制单元1101、问卷内容定制单元1102,任务策略定制单元1101用于定制问卷的任务消息以及任务发放策略,所述的任务发放策略包括用户上网时段、客户端所在地理位置、接入路由器的客户端设备的类型、用户特征的行为等,路由器定时在服务器上获取任务策略定制单元1101中定制的问卷任务和分发策略,问卷内容定制单元1102用于定制问卷任务的具体内容,当用户响应了路由器推送的问卷任务消息后,用户终端从服务器获取又问卷内容定制单元1102定制的问卷,内容以具体问题的形式传达给被问者,并尽量使被问者乐于回答。
所述问卷推送模块150,通过步骤S220向满足分发策略的用户终端推送调研问卷。当用户终端接入路由器后,路由器通过解调并解析获取用户终端的设备特征信息。根据从服务器获取的问卷任务和分发策略,向满足分发策略的用户终端推送调研问卷。
所述采集模块120,通过步骤S240收集问卷答案数据,所述答案数据包含显式作答和隐含数据中的至少一个,显示作答是用户对问卷问题回答的内容,隐含数据包含用户上网行为数据,采集模块120向客户终端收集用户对问卷作答的答案,这部分数据称为显示作答数据,同时采集模块120还会向路由器收集用户上网行为日志,通过网络数据包日志的转储、分析、筛选、统计、聚合,无需依赖用户的回忆或诚信,就能完整的分析用户的上网行为统计特征,这部分信息作为问卷答案的隐含数据。
所述分析模块130,利用采集模块120采集到的问卷答案数据,包含显式作答和隐含数据中的至少一个,例如在有些情况下由于有些用户收到问卷内容时,有可能并未做任何回答,所以显式作答的答案数据是空的,但是用户的上网行为存在,这个时候隐含数据成为了用于分析的唯一基础数据,有些情况下客户对问卷作答,这时候分析的基础数据就包含显式作答和隐含数据两部分,分析模块130同时还会在存储模块140中检索本次收集到答案的用户设备,确认是否与通过其他路由器采集过行为特征数据和/或问卷答案的用户设备匹配,若用户设备匹配,这种跨路由器组合后的行为特征和/或问卷答案也可作为问卷的隐含数据,分析模块130将收集到的各类问卷答案数据(包括显式或隐含)通过步骤S250进行分析得到最终的调研信息。用户设备是否匹配可以通过比对设备特征ID或设备特征ID组实现,因为设备特征ID(例如网卡Mac地址、某些特定域名下的Cookie、特定网站的账户匿名ID)不会因为接入的路由器不同而改变,而且会作为HTTP数据包的参数传输,从而可以被路由器探知。另外,很多商用场所WiFi,需要输入手机号获取授权,因而手机号码也可以作为设备特征ID之一,用于识别不同路由器下的设备。
所述存储模块140,用于存储采集模块120从各个路由器采集到的用户设备的上网行为数据和问卷答案数据,也用于存储分析模块130经过分析处理最终得到的调研信息。
接下来参照图2是示意地表示使用本发明一些实施方式的方法的流程图。
具体而言,本发明的基于网络路由器的调研信息采集的方法包括以下步骤:
步骤S210,路由器定时从服务器获取最新的问卷任务和分发策略,所述分发策略,包括如:时段、地理位置、接入设备的类型、用户特征的行为等。
步骤S220,路由器向符合任务策略条件的终端设备推送问卷任务,所述用户终端可以是用户的电脑、手机等,具体的如:获取的任务发放策略是向在午夜12:00—1:00间上网的用户发放一类问卷任务,或向用手机上网的用户发放一类问卷任务,满足策略条件的即将问卷消息以HTML页面由通知、消息推送等方法推送给用户设备。由于路由器推送的消息基于HTTP标准协议,因此支持跨操作系统、跨设备的接入。
步骤S230,用户响应了路由器推送的问卷任务后,用户终端从服务器获取该问卷的问卷内容,并可对问卷的内容作答。
步骤S240,服务器收集问卷显式作答答案及隐含数据,所述显式作答答案是用户在终端上对问卷问题的回答答案,若客户未对问卷进行回答,那么收集到的显式作答答案数据将为空,所述的隐含数据是用户终端通过网络路由器上网,在路由器记录的用户上网日志数据包,被服务器从路由器上收集,日志的转储、分析、筛选、统计、聚合无需依赖用户的回忆或诚信,就能完整的分析用户的上网行为习惯,这部分数据也作为问卷答案的一部分。
步骤S250,服务器对问卷答案进行分析得到最终调研信息,所述问卷答案包括显式作答答案及隐含数据,所述隐含数据是本次从路由器上收集到的用户行为特征,同时系统会检索服务器存储答案数据中是否有该用户设备在其他路由器上的日志记录,若数据存在,这种跨路由器组合后的行为特征也作为问卷的隐含数据。
图3是示意地表示本发明一些实施方式的基于网络路由器的调研信息采集方法示意图。
在图3中,用户终端是智能手机,服务器与路由器分立,例如服务器定制了在咖啡馆使用智能手机上网的用户发放问卷的任务,希望通过问卷作答分析出此类用户男女比例,年龄段及在咖啡店上网的浏览内容,如:网上购物、看新闻、看电影、学习等,路由器定时的向服务器获取最新的问卷任务和分发策略,向符合策略条件的设备推送问卷的消息,用户响应消息通知后从分发控制系统中加载获取问卷内容,HTML页面由通知、消息推送等方法推送给用户设备,用户对有内容的问卷进行作答,并提交答案,服务器获取这部分显式作答的答案,如常识所知,用户对拿到问卷之后并不一定回作答,那么服务器收到的将是一份无答案数据的作答答案,或者用户对问题的回答并非真实情况,例如:用户并不愿意透露真实的年龄、性别等,或用户在咖啡馆上网通常是到新闻网站浏览新闻,但是在回答问卷时客户很随意的勾选了看电影的选项,这些行为会导致收集到的问卷答案可信度低,分析出的调研信息可用性差。
通过结合存储模块中该用户设备在其他场合上网的行为特征,可以校正调研问卷的答案。或者至少给调研问卷的校正提供参考。
实施例1
某母婴商店准备销售A、B、C三种品牌的尿不湿,需要对经常光顾的顾客进行调研,预测三种品牌未来的销售情况,以便决定采购数量。
设定推送策略为向连接进入该母婴商店WIFI的智能手机推送有关尿不湿消费意愿的调查问卷。所述推送策略存储于任务策略定制单元1101。
所述调查问卷的问题存储于问卷内容定制单元1102。
母婴商店的路由器从服务器(未示出)获取了上述推送策略和推送任务,并通过问卷推送模块150向连接到该路由器的智能手机推送调查问卷。
用户M通过智能手机接收到推送调查问卷的消息,从服务器下载并填写了调查问卷。
采集模块120收集问卷答案数据,包括显式作答的答案和手机网卡硬件的Mac地址。
在存储模块140中查询有与该手机网卡硬件的Mac地址匹配的用户上网行为数据,数据表明过去3个月,用户M一直通过其他路由器(例如家中或工作场所等)在J网站购买B品牌的尿不湿,并可查询到购买价格。
其中,所述用户上网行为数据可以是通过广泛布设本发明的系统采集而来,也可以从第三方数据公司购买,或者通过与数据持有公司进行商业合作获得。
在分析模块130中发现用户M在显式作答填写的是优先购买A品牌,在可接受的价格范围选项中也高于在J网站的购买价格。
该母婴商店可以通过大量收集问卷答案数据,综合分析显式作答和隐含数据的情况,决定采购尿不湿的品牌和数量,以及价格策略。
当然,除了手机网卡硬件的Mac地址以外,还可以采用其他可采集到的设备特征查询跨路由器的上网行为数据,例如手机号码、电子邮箱等。一般而言,推荐采用简单而无害的方式,比较容易得到被调查者的配合。
本发明中所述的基于网络路由器的调研信息采集的方法会在向用户终端收集显式作答答案的同时在路由器上收集隐含数据,所述的隐含数据指用户设备的上网行为统计特征,隐含数据通过网络数据包日志的转储、分析、筛选、统计、聚合,无需依赖用户的回忆或诚信,就能完整的分析用户的上网行为习惯,如用户在实际的上网过程中浏览那些新闻网站、浏览新闻的类型、在视频网站中观看的电影类型、购物网站中关注那类商品等,通过这些行为习惯的分析,能更准确的判断用户的性别、年龄、喜好,这些隐含数据作为问卷答案的一部分,用来对需要调研的内容进行分析,该用户的显示作答答案和隐含数据都会作为问卷答案存储在服务器上,并且在进行调研信息分析过程中,服务器会检索该用户设备在其他路由器上的行为统计特征,如果存在,可以跨路由器组合分析用户行为特征,此类跨路由器组合后行为特征作为问卷答案数据一同进行分析,从而得到准确性更高、可用性更强的调研信息。
本发明不限于上述实施方式,在本发明思想的范围内可以进行各种变更。本发明已通过上述实施例进行了说明,但应当理解的是,上述实施例只是用于举例和说明的目的,而非意在将本发明限制于所描述的实施例范围内。此外本领域技术人员可以理解的是,本发明并不局限于上述实施例,根据本发明教导还可以做出更多种的变型和修改,这些变型和修改均落在本发明所要求保护的范围以内。本发明的保护范围由附属的权利要求书及其等效范围所界定。