一种为手机用户终端提供个性网页内容的方法和网标系统
技术领域
本发明涉及通信系统,尤其是一种为用户手机终端提供个性网页内容的方法和网标系统。
背景技术
随着移动通信技术的发展和智能手机的普及,用户通过手机上网浏览互联网网页、进行网页搜索已变得非常普及。
针对通过手机浏览网页的用户,如果网站能对来访用户进行辨别,并对用户的需求爱好信息都能够有了解,就可根据用户需求优化用户在网站内寻找信息的流程,调整网站的内容分布,甚至可以根据每位的用户不同需求爱好提供个性化的网页内容,而这无疑可以极大提高网站的竞争力。同时,个性化的网页内容提供,也可优化站内广告的展示,提高广告点击为网站增加更多收入。
目前,网站采用在手机用户终端存储Cookie的方式对来访用户进行识别,然后通过调取该用户在当前网的过往历史记录,以分析用户的需求爱好信息,但是这种方法却存在很大的缺陷:其一、如果有的手机不支持Cookie存储或用户选择不保存Cookie都将导致网站无法对来访用户进行识别;其二、网站虽然可以对来访用户进行识别,但是却只能获取该用户在本网的历史记录信息,而无法获取用户访问全网的历史记录信息,导致获取的历史记录数据有限,分析出的用户的需求也不准确;其三、如果当前访问用户为新用户,则网站无法获取该用户的任何历史记录信息。
发明内容
本发明的一个目的是基于可稳定以及可全面获取手机终端用户的历史访问记录,提供一种为手机用户终端提供个性网页内容的方法,该方法包括:
对用户向移动网关发出的请求数据进行获取;请求数据包括RADIUS协议数据和HTTP网址请求数据;
对RADIUS协议数据进行分析,识别用户终端手机号,对用户进行区分,根据该用户终端是否为首次识别进行如下处理:
若该用户终端为首次识别,以用户终端手机号对用户进行区分记录保存,根据HTTP网址请求数据访问目标网站获取用户请求资源后,对获取的用户请求资源进行特征信息提取,记录保存在该用户目录下,作为生成用户标签的依据;用户标签包括用户的访问习惯、兴趣和关注的关键字信息;
若该用户终端为非首次识别,调取该用户目录下的用户标签插入用户HTTP网址请求数据中后发送给目标网站,目标网站根据用户标签对用户请求资源进行个性化内容提供;获取该用户请求资源,进行特征信息提取,记录保存在该用户目录下,作为生成用户标签的依据;
将用户请求资源通过移动网关返回给用户。
进一步,对RADIUS协议数据进行分析,识别用户终端手机号,对用户进行区分具体为:
对RADIUS协议数据进行分析,在识别出用户终端手机号后,先对手机号码进行3DES加密形成伪码,再对伪码进行加密生成用户唯一区别ID。
进一步,对获取的用户请求资源进行特征信息提取包括通过URL特征分析、SVM文本分析和主题词提取,生成包括用户的访问习惯、兴趣和关注的关键字信息。
本发明的另一个目的是基于可稳定以及可全面获取手机终端用户的历史访问记录,提供一种为手机用户终端提供个性网页内容的网标系统,该网标系统包括:
业务服务器单元,用于接收获取用户向移动网关发出的请求数据中的HTTP网址请求数据,以及根据HTTP网址请求数据访问目标网站获取用户请求资源后发送给移动网关;
RADIUS协议数据监听分析单元,用于对用户向移动网关发出的请求数据中的RADIUS协议数据进行监听获取,分析识别出用户终端手机号,对用户进行区分;
计算存储单元,对获取的用户请求资源进行特征信息提取,记录保存在已存有该用户的目录下,作为生成用户标签的依据;所述用户标签包括用户的访问习惯、兴趣和关注的关键字信息;
用户标签插入单元,用于当业务服务器单元根据HTTP网址请求访问目标网站时,将用户标签插入HTTP网址请求中。
进一步,该网标系统还包括:
加密单元,用于对识别出的用户终端手机号进行加密,生成用户唯一区别ID。
进一步,计算存储单元包括:
URL特征分析和SVM文本分析模块,用于对获取的用户请求资源进行URL特征分析和SVM文本分析,生成用户的访问习惯信息和兴趣信息;
主题词提取模块,用于对获取的用户请求资源进行主题词提取,生成用户关注的关键字信息;
存储模块,用于保存用户唯一区别ID,以及该ID下包含有用户的访问习惯信息、兴趣信息和关注的关键字信息的用户标签。
进一步,RADIUS协议数据监听分析单元采用分光监听的方式对RADIUS协议数据进行监听。
本发明的有益效果是:本发明一种为手机用户终端提供个性网页内容的方法,通过对手机用户终端的手机号码进行获取,作为区别用户的唯一标识,以及在对网站返回的该用户请求资源获取后进行特征信息提取,以形成包含有用户的访问习惯信息、兴趣信息和关注的关键字信息的用户标签,当已生成用户标签的用户再发送HTTP网址请求时,就将已存储在该用户目录下的用户标签插入到用户HTTP网址请求中,被请求的目标网站根据用户标签对该用户提供个性化页面内容。该方法对可以稳定而且全面地获取用户的历史访问记录,通过计算分析,从而形成精准的用户需求爱好信息,便捷实现网站对手机用户终端提供个性网页内容。
本发明的另一个有益效果是:本发明一种为手机用户终端提供个性网页内容的网标系统,作为移动网关和目标网站的中间数据处理系统,对用户向移动网关发出的请求数据进行获取,监听获取请求数据中的RADIUS协议数据,识别用户终端手机号,对用户进行区分,以及获取网站返回的该用户请求资源并进行特征信息提取,以形成包含有用户的访问习惯信息、兴趣信息和关注的关键字信息的用户标签,当已生成用户标签的用户再发送HTTP网址请求时,就将已存储在该用户目录下的用户标签插入到用户HTTP网址请求中,被请求的目标网站根据用户标签对该用户提供个性化页面内容。该网标系统可以稳定而且全面地获取用户的历史访问记录,通过计算分析,形成用户标签信息,便捷实现网站根据用户标签对手机用户终端提供个性网页内容。
附图说明
下面结合附图对本发明的具体实施方式作进一步说明:
图1是实施例一提供的本发明一种为手机用户终端提供个性网页内容的方法的步骤图;
图2是实施例二提供的本发明一种为手机用户终端提供个性网页内容的网标系统的结构框图;
图3是实施例三提供的本发明一种为手机用户终端提供个性网页内容的网标系统的结构框图;
图4是实施例四提供的本发明一种为手机用户终端提供个性网页内容的网标系统的结构框图。
具体实施方式
参照图1,实施例一提供的一种为手机用户终端提供个性网页内容的方法包括:
对用户向移动网关发出的请求数据进行获取;
对RADIUS协议数据进行分析,识别用户终端手机号,对用户进行区分,根据该用户终端是否为首次识别进行如下处理:
若该用户终端为首次识别,以用户终端手机号对用户进行区分记录保存,根据HTTP网址请求数据访问目标网站获取用户请求资源后,对获取的用户请求资源进行特征信息提取,记录保存在该用户目录下,作为生成用户标签的依据;
若该用户终端为非首次识别,调取该用户目录下的用户标签插入用户HTTP网址请求数据中后发送给目标网站,所述目标网站根据用户标签对用户请求资源进行个性化内容提供;获取该用户请求资源,进行特征信息提取,记录保存在该用户目录下,作为生成用户标签的依据;
将用户请求资源通过移动网关返回给用户。
在本实施例中,请求数据包括RADIUS协议数据和HTTP网址请求数据。由于用户的手机号码涉及个人的隐私信息,如果直接对用户的手机号码进行明码显示存储,如果数据遭到泄露,将会严重威胁到个人隐私安全。因此,对RADIUS协议数据进行分析,在识别出用户终端手机号后,先对手机号码进行3DES加密形成伪码,再对伪码进行加密生成用户唯一区别ID。如此,经过采用如此高强度的加密算法,就足以保护用户的隐私安全。
对获取的用户请求资源进行特征信息的提取包括通过URL特征分析、SVM文本分析和主题词提取,生成包括用户的访问习惯、兴趣和关注的关键字信息。由于用户通过移动网关发出的页面请求和因特网返回的请求资源都会进行记录,从而形成完整的用户请求/应答日志。通过定时采用URL特征分析对日志进行统计,就可得到用户上网时间、频度、爱好网站等访问记录,而定期采用SVM文本分析对应答内容进行分类就可得知用户的兴趣,从而得到页面的兴趣类标签。由于手机互联网中资讯内容类别较为集中,所以兴趣类标签的类别个数是比较有限的,常见的兴趣类标签如标签1电脑、通信、网络,标签2体育、运动,标签3媒体、传播,标签4医药、保健,标签5休闲娱乐,标签6社会等。但是采用SVM文本分析得到的兴趣类标签的范围还是很大,对用户的兴趣捕获显得不够精确。因此在采用SVM文本分析的同时,进行主题词提取技术以及基于时间的热度评价算法,抓获用户关注的关键字信息,从而对采用SVM文本分析得到的兴趣类标签再进行进一步的细化,如标签1电脑、通信、网络下可细分为电脑、互联网、家电和电子产品、手机、数码产品、游戏电玩、手机游戏,而对其中的手机类下又可进一步细分为手机软件、MP3、MP4和数码相机。
因此,通过对用户请求/应答日志采用URL特征分析、SVM文本分析和主题词提取,将形成包括用户访问习惯、兴趣和关注的关键字信息的用户标签,而且由于用户请求/应答日志的内容是包含用户所登录的全网记录,该用户标签的信息将非常全面,同时,即便该用户是首次登录某第三方网站,第三方网站通过插入到HTTP请求中的用户标签,也可获知该用户的用户访问习惯、兴趣和关注的重点,从而对返回的网站内容作个性化提供。
参照图2,实施例二提供的一种为手机用户终端提供个性网页内容的网标系统,该网标系统包括:
业务服务器单元,用于接收获取用户向移动网关发出的请求数据中的HTTP网址请求数据,以及根据HTTP网址请求数据访问目标网站获取用户请求资源后发送给移动网关;
RADIUS协议数据监听分析单元,用于对用户向移动网关发出的请求数据中的RADIUS协议数据进行监听获取,分析识别出用户终端手机号,对用户进行区分;
计算存储单元,对获取的用户请求资源进行特征信息提取,记录保存在已存有该用户的目录下,作为生成用户标签的依据;用户标签包括用户的访问习惯、兴趣和关注的关键字信息;
用户标签插入单元,用于当业务服务器单元根据HTTP网址请求访问目标网站时,将用户标签插入HTTP网址请求中。
在本实施例中,系统通过对用户向移动网关发出的请求数据中的RADIUS协议数据采用分光监听的方式进行监听获取,获得手机用户终端的手机号,并以此作为用户的唯一识别ID,对用户进行区分。由于手机号码的确定性和稳定性,从而也就保证了系统识别用户的准确性。同时,系统作为移动网关和目标网站之间的中介,对移动网关发过来的HTTP网址请求进行转发,通过访问因特网,获取目标网站返回的请求资源发送给移动网关,从而就可以形成保存在系统内的基于全网历史访问记录的用户请求/应答日志。请求/应答日志的建立与不断更新,使得对该用户日志内容特征信息的提取也更加丰富,由此形成的用户标签也就得到不断完善,使得反映出的用户的访问习惯、兴趣和关注的关键字等信息也更加精确。而系统通过将该用户标签插入到HTTP网址请求中访问目标网站后,目标网站就可基于该标签为用户提供给个性化的网页内容。
参照图3,实施例三提供的一种为手机用户终端提供个性网页内容的网标系统,在本实施例中,该系统还包括加密单元,用于对识别出的用户终端手机号进行加密,生成用户唯一区别ID。由于用户的手机号码涉及个人的隐私信息,如果直接对用户的手机号码进行明码显示存储,如果数据遭到泄露,将会严重威胁到个人隐私安全。因此,需要设置一加密单元对用户手机号码进行高强度的加密,加密单元可采用AES或3DES等算法进行加密。
参照图4,实施例四提供的一种为手机用户终端提供个性网页内容的网标系统,在本实施例中计算存储单元包括:
URL特征分析和SVM文本分析模块,用于对获取的用户请求资源进行URL特征分析和SVM文本分析,生成用户的访问习惯信息和兴趣信息;
主题词提取模块,用于对获取的用户请求资源进行主题词提取,生成用户关注的关键字信息;
存储模块,用于保存用户唯一区别ID,以及该ID下包含有用户的访问习惯信息、兴趣信息和关注的关键字信息的用户标签。
网标系统中计算存储单元通过URL特征分析和SVM文本分析模块以及主题词提取模块对形成的用户请求/应答日志进行定期分析计算,从而对形成的包含有用户访问习惯信息、兴趣信息和关注的关键字等信息的用户标签进行不断完善,使得目标网站根据插入HTTP网址请求的用户标签而提供的个性化网页内容也更加精确。
与此同时,网站根据用户标签信息优化用户在网站内寻找信息的流程,根据进入本网站用户标签的分布调整网站本身的内容资源,甚至是发展方向,以及通过用户标签优化站内广告展示,提高广告点击,从而增加网站收入。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。