CN103198098A - 一种网络信息投放方法和装置 - Google Patents
一种网络信息投放方法和装置 Download PDFInfo
- Publication number
- CN103198098A CN103198098A CN2013100777881A CN201310077788A CN103198098A CN 103198098 A CN103198098 A CN 103198098A CN 2013100777881 A CN2013100777881 A CN 2013100777881A CN 201310077788 A CN201310077788 A CN 201310077788A CN 103198098 A CN103198098 A CN 103198098A
- Authority
- CN
- China
- Prior art keywords
- network information
- user
- keyword
- information
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种网络信息投放方法和装置,涉及网络信息技术领域。所述方法包括:针对用户的网络行为,提取对应用户的各关键词和用户信息;根据所述各关键词查询对应的各网络信息;针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息匹配的网络信息;在过滤后的网络信息中选择至少一个网络信息投放给所述用户。本发明能更有针对性的进行网络信息投放,可降低对用户端的系统资源的不必要占用,可大大降低服务器对网络信息进行投放时的处理量,提高服务器的性能,提高服务器对网络信息的处理效率。
Description
技术领域
本发明涉及网络信息技术领域,特别是涉及一种网络信息投放方法和装置。
背景技术
随着互联网产业的发展,用户在网络中能够获取的信息也越来越多,各公司、企业等团体也通过互联网向网络中的用户有针对性的投放网络信息,比如网络广告。
网络广告也称为互联网广告,是指利用网站上的广告横幅、文本链接、多媒体等方法,在互联网刊登或发布广告,通过网络传递到互联网用户的一种高科技广告运作方式。这种新的广告形式使企业既能够方便地进行即时促销,又可以进行长期的品牌树立规划。
与传统的四大传播媒体(报纸、杂志、电视、广播)广告及近来备受垂青的户外广告相比,网络广告具有得天独厚的优势,是实施现代营销媒体战略的重要一部分。
随着互联网产业的发展,互联网广告已经成为大部分网站的盈利方式,广告投放量也越来越多。随着互联网的发展,用户在搜索网页并浏览时,广告系统根据搜索关键词进行关键词匹配,查找与搜索关键词相关联的广告投放给用户。
但是,针对上述关键词匹配模式的广告投放方式,很大部分的关键词所指向的广告并不是用户感兴趣的广告,可能是用户反感且熟悉的广告;上述方法无法使广告投放与用户的网络广告访问行为相适应,仍然容易对用户造成逆反心理,而且不必要的广告投放还浪费了大量的广告流量。因此,广告投放的准确度仍有待提高,让广告投放给最适合的人群,从而提高广告投放效果,避免浪费广告流量,是目前需要解决的技术问题。
发明内容
本发明是提供一种网络信息投放方法和装置,以通过网络信息投放的准确度,让网络信息投放给最适合的人群,从而提高网络信息投放效果,避免浪费网络信息流量。
为了解决上述问题,本发明公开了一种网络信息放方法,包括:
针对用户的网络行为,提取对应用户的各关键词和用户信息;
根据所述各关键词查询对应的各网络信息;
针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息匹配的网络信息;
在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
优选的,所述提取对应用户的用户信息包括:
从职业匹配过滤词典中提取的用户各职业以及对应各职业的反感网络信息的关键词;
所述职业匹配过滤词典通过预先针对全网数据和用户对网络信息的点击历史数据进行分析并构建;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词。
优选的,所述针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息最匹配的网络信息包括:
根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息。
优选的,所述预先针对全网数据和用户对网络信息的点击历史数据,进行分析并构建职业匹配过滤词典包括:
从所述全网数据中分析各用户的各职业类别的置信度;
针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词;
针对各职业类别和对应的网络信息关键词构建职业匹配过滤词典。
优选的,所述从所述全网数据中分析各用户的各职业类别的置信度包括:
按职业类别将全网数据进行分类;
针对任一职业类别的各网页信息,获取访问该职业类别网页的各用户以及与用户的职业信息;
针对每个用户,根据所述职业类别分类的权重、各职业信息的权重计算所述用户的该职业类别的置信度。
优选的,还包括:
针对每个用户,提取该用户在论坛网站的各职业信息;
进一步的,所述从所述全网数据中分析各用户的各职业类别的置信度包括:
针对每个用户,根据所述职业类别分类的权重、各职业信息的权重、论坛网站职业信息的权重计算所述用户的该职业类别的置信度。
优选的,所述针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词包括:
统计所述职业类别下,置信度大于第一阈值各用户的对各种网络信息类别的点击率;
将点击率小于第二阈值的各网络信息类别,提取该网络信息类别的网络信息类别关键词组合作为反感网络信息的关键词。
优选的,还包括:
持续获取所述用户的访问历史数据,统计用户的个性化的偏好类别;
根据所述偏好类别,调整针对该用户的职业匹配过滤词典。
优选的,所述根据所述偏好类别,调整针对该用户的职业匹配过滤词典包括:
针对用户偏好类型,增加对应该用户的职业匹配过滤词典中所述偏好类型对应的职业类别的置信度;
当所述权重达到权重阈值时,针对该职业类别的用户的网络信息点击历史数据,统计点击率低于点击阈值的网络信息类别,提取该类别网络信息的网络信息类别关键词作为反感网络信息的关键词。
优选的,根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息包括:
提取各网络信息的网络信息类别关键词,并将所述网络信息类别关键词与所述反感网络信息的关键词进行匹配;
根据匹配结果过滤所述各网络信息。
优选的,所述在过滤后的网络信息中选择至少一个网络信息投放给所述用户包括:
针对同一批关键词对应的过滤后的网络信息,在不同时段选择多个属于不同类别的网络信息投放给所述用户。
本发明还公开了一种网络信息投放装置,包括:
信息提取模块,用于针对用户的网络行为,提取对应用户的各关键词和用户信息;
网络信息获取模块,用于根据所述各关键词查询对应的各网络信息;
网络信息过滤模块,用于针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息匹配的网络信息;
投放模块,用于在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
与现有技术相比,本发明包括以下优点:
本发明首先利用全网数据和用户网络信息点击历史构建职业匹配过滤词典,职业匹配过滤词典利用了客观真实的网络数据,能客观的分析用户的职业以及用户反感的网络信息类型的反感网络信息的关键词。
然后本发明利用职业匹配过滤词典,过滤针对用户的关键词的反感信息,可有效避免用户产生逆反心理,并给用户访问网络带来了很好的体验;在该过程中,由于将与用户的关键词对应网络信息进行过滤,然后再从过滤后的网络信息中提取某个或者某些个网络信息投放给用户端,该种更有针对性的网络信息投放过程,可降低对用户端的系统资源的不必要占用,可大大降低服务器对网络信息进行投放时的处理量,提高服务器的性能,提高服务器对网络信息的处理效率。同时,比如对于广告数据的投放,有针对性的广告数据投放也避免了信息推送服务器不必要的广告数据投放,节省了其计算量和广告流量,并且在信息推送服务器性能不变的情况下可以大大提高其处理效率。
附图说明
图1是本发明实施例一的一种网络信息投放方法流程示意图;
图2是本发明实施例二的一种网络信息投放方法流程示意图;
图3是本发明实施例的一种职业匹配过滤词典构建流程示意图;
图4是本发明实施例三的一种网络信息投放装置结构示意图;
图5是本发明实施例四的一种网络信息投放装置结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
参照图1,示出了本发明实施例一的一种网络信息投放方法流程示意图,具体可以包括:
步骤50,针对用户的网络行为,提取对应用户的各关键词和用户信息;
当用户在网络中进行搜索等网络行为时,提取用户的关键词信息(比如用户输入的搜索关键词),和用户信息(比如用户的个性化信息,比如经过统计分析得到用户的反感网络信息的关键词(比如反感广告关键词)等,或者用户配置的反感网络信息的关键词等)。
从职业匹配过滤词典中提取的用户各职业以及对应各职业的反感网络信息的关键词;所述职业匹配过滤词典通过预先针对全网数据和用户对网络信息的点击历史数据进行分析并构建;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词。
在本申请中,所述的网络信息包括广告内容。
步骤60,根据所述各关键词查询对应的各网络信息;
针对用户网络行为的各关键词,从网络信息系统(比如广告系统)中查询对应匹配的各网络信息的数据。
步骤70,针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息最匹配的网络信息;
在针对用户的各关键词搜索得到各网络信息(比如各广告内容)后,本发明可利用用户信息过滤其反感的网络信息,投放与用户信息最匹配的网络信息给用户。
步骤80,在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
实施例二参照图2,示出了本发明实施例二的一种网络信息投放方法流程示意图,具体可以包括:
步骤100,预先针对全网数据和用户对网络信息的点击历史数据,进行分析并构建职业匹配过滤词典;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词;
在本发明实施例中,可抓取全网数据(比如各网站的各大内容版块网页的用户访问数据,比如新闻版块网页的用户访问数据,体育版块的用户访问数据等等),和从网络信息系统获取用户对各种网络信息的点击历史数据,然后基于全网数据和网络信息的点击历史数据进行分析,构建职业匹配过滤词典。
参照图2,其示出了本发明实施例的一种职业匹配过滤词典构建方法,包括:
步骤S101,从所述全网数据中分析各用户的各职业类别的置信度;
本发明实施例首先可获取全网数据,比如各种新闻网页的数据;还可从网络信息系统获取网络信息点击历史数据,这些都是本领域技术人员所熟知的,在此不详细说明。
本步骤则将全网数据中分析用户的各职业类别的置信度,比如表一为用户A职业类别置信度的示例:
表一
其中数字部分表示用户A对应每个职业的置信度,因为实际上用户可能存在多职业的情况,所以本发明实施例可以分析用户除了主职业之外的其他职业的置信度。
优选的,所述从所述全网数据中分析各用户的各职业类别的置信度包括:
步骤A11,按职业类别将全网数据进行分类;
比如对于各种新闻网页数据,按照职业类别对新闻网页数据进行分类,比如按律师职业类别,将各种新闻网页数据中的律师类新闻网页数据聚类在一起;按医生职业类别将各种新闻网页数据中的医疗类新闻网页数据聚类在一起。
在本发明实施例中,可针对每个职业类别提取相应的各核心关键词,然后将该职业类别的各核心关键词与各网页的网页内容进行匹配,获取该职业类别的网页数据。
步骤A12,针对任一职业类别的各网页信息,获取访问该职业类别网页的各用户以及与用户的职业信息;
比如对于律师新闻类别网页,则可将访问律师新闻类别网页的用户人群提取出来,并且可从网页信息中提取与用户相对应的职业相关信息(比如对于律师职业类别来说,其职业相关信息可包括:律师,律师助理,法官等具体的职业信息,或者从事法律工作,从事诉讼工作等与法律相关的具体描述信息,或者其所在工作单位的相关信息,比如律师事务所等)。又比如对于医疗新闻类别网页,则可将访问医疗新闻类别网页的用户人群提取出来,并且可从网页信息中提取与用户相对应的职业相关信息(比如对于医生职业类别来说,其职业相关信息可包括:医生,药剂师,护士,中医,西医,大夫等具体的职业信息,或者从事医务工作等与医疗相关的具体描述信息,或者其所在工作单位的相关信息,比如A医院等)。
步骤A13,针对每个用户,根据所述职业类别分类的权重、各职业信息的权重计算所述用户的该职业类别的置信度。
在本发明实施例中,对网页数据分类可设置一个权重,对各种职业信息也可设置权重,并且可对同一职业类别下:针对不同职业信息设置不同的权重。然后可根据权重计算每个用户在该职业下的权重。
比如前述对于医生职业类别的网页数据分类的权重为a;对医生,药剂师,护士,中医,西医,大夫等直接属于医生职业类别的信息设置权重为b1;对职业描述信息等间接直接提示属于医生职业类别的信息设置权重b2;对其他不属于医生职业类别的信息可设置权重b3。其中,在判断访问医疗新闻人群的条件下:与医生职业类别相关的权重的计算符号为正,与医生职业类别无关的权重的计算符号为负。然后可根据权重计算用户的该职业类别权重,比如用户A属于访问医疗新闻的人群,从网页信息中获取用户A的职业信息为医生,那么用户A属于医生职业类别的权重为a+b1。又比如用户B属于访问医疗新闻的人群,从网页信息中获取用户B的职业信息为律师,那么用户A属于医生职业类别的权重为a-b3。
进一步的,还包括:
步骤A14,针对每个用户,提取该用户在论坛网站的各职业信息;
比如获取各用户在百度贴吧、百度知道等论坛的账户数据,然后从账户数据中提取各种职业信息。
进一步的,所述从所述全网数据中分析各用户的各职业类别的置信度包括:
步骤A15,针对每个用户,根据所述职业类别分类的权重、各职业信息的权重、论坛网站职业信息的权重计算所述用户的该职业类别的置信度。
本发明实施例还可针对不同来源的职业信息设置不同的权重,比如从网页分类的网页信息中提取的职业信息设置权重m,对从论坛网站获取的职业信息设置权重n。然后计算用户的在该职业类别下的置信度。
步骤S102,针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词;
如前所述,本发明实施例可从网络信息系统获取各用户的网络信息点击历史数据。那么针对上述分析得到的各用户,有些用户的职业置信度高,有些用户的职业置信度低,那么本发明实施例中则可设置职业置信度阈值,达到该阈值则可确认用户从事该职业。然后即可针对每一职业类别下置信度大于第一阈值的各用户,获取该批用户的网络信息点击历史数据,然后按职业类别统计网络信息点击率,点击率低于阈值的可确认为反感网络信息,然后将对应的职业类别关键词作为反感网络信息的关键词。
优选的,所述针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词包括:
步骤B11,统计所述职业类别下,置信度大于第一阈值各用户的对各种网络信息类别的点击率;
即将确认属于该职业类别的用户的网络信息点击历史数据(比如广告点击历史数据)提取出来,然后对网络信息点击历史数据按网络信息类别(比如广告类别)分类,再统计各类别的网络信息类别点击率。比如将针对一职业类别,将置信度大于0.9的各用户对应的网络信息点击历史数据提取出来进行统计分析。
步骤B12,将点击率小于第二阈值的各网络信息类别,提取该网络信息类别的网络信息类别关键词组合作为反感网络信息的关键词。
比如,对于律师职业类别,统计对应律师职业的置信度高于第一阈值的各用户的广告点击历史数据,得到该类用户对律师事务所的广告点击率低于第二阈值(比如低于5%),那么可将律师事务所作为反感广告关键词(可对应反感网络信息的关键词)。又比如,对于教师职业类别,统计对应教师职业的置信度高于第一阈值的各用户的广告点击历史数据,得到该类用户对教育培训相关的广告点击率低于第二阈值,那么可将教育培训相关广告对应的广告类别关键词(可对应网络信息类别的关键词)(考研培训、考试培训、考前培训、四、六级培训等)作为反感广告关键词。
步骤S103,针对各职业类别和对应的网络信息关键词构建职业匹配过滤词典。
职业匹配过滤词典形式可如表二:
表二
在构建了职业匹配过滤词典后,则可进入网络信息投放流程:
步骤110,针对用户的网络行为,提取对应用户的各关键词,并从职业匹配过滤词典中提取的用户各职业以及对应各职业的反感网络信息的关键词;;
比如用户AAA在网页中搜索“法律”,那么则可提取该关键词“法律”,在本发明实施例中,职业匹配过滤词典中用户可对应多个职业,每个职业对应一个置信度,当置信度大于第一阈值时才确认用户从事该职业。那么在查找用户职业时,查找置信度大于阈值的职业。
针对前述AAA在职业匹配过滤词典中查找到用户AAA的职业为律师和吉他手,那么则提取律师和吉他手对应的反感广告的关键词“律师事务所、音乐培训、重型机械”,然后针对“律师事务所、音乐培训、重型机械”去过滤前述广告内容,则过滤掉律师事务所的广告内容。
步骤120,根据所述各关键词查询对应的各网络信息;
比如根据所述各关键词查询对应的广告内容,比如根据“律师”在广告系统中查找相关的各种广告内容,比如搜索到法律书籍广告,法律相关电影的广告,律师事务所的广告。
步骤130,根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息;
优选的,根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息包括:
步骤C11,提取各网络信息的网络信息类别关键词,并将所述网络信息类别关键词与所述反感网络信息的关键词进行匹配;
比如前述法律书籍广告,法律相关电影的广告,律师事务所的广告各自的网络信息类别关键词为“法律书籍”,“电影”,“律师事务所”,那么与“律师事务所、音乐培训、重型机械”匹配后,“律师事务所”匹配上。
步骤C12,根据匹配结果过滤所述各网络信息。
然后将匹配上的网络信息类别的内容过滤掉,那么过滤掉律师事务所的广告,保留法律书籍广告,法律相关电影的广告。
步骤140,在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
然后即可在过滤后的网络信息中选择至少一个网络信息投放给所述用户AAA。
所述在过滤后的网络信息中选择至少一个网络信息投放给所述用户包括:
步骤D11,针对同一批关键词对应的过滤后的网络信息,在不同时段选择多个属于不同类别的网络信息投放给所述用户。
比如保留的网络信息包括A1、A2、B1、B2、B3、C1、C2,其中A、B、C表示网络信息类别,数字1、2、3等表示某个类别下的各个具体的网络信息。
那么在不同时段选择不同类别的网络信息投放给用户,比如在11:00-13:00投放A1、B1、C1给用户AAA,在15:-17:00投放A2、B2、C2给用户AAA。
另外,在用户访问各种网页的过程中,本发明实施例还可结合点击效果分析用户行为,完善职业匹配过滤词典,即完善用户职业,用户的反感关键词等,随着时间推移,用户数据完善,可使用户的职业匹配过滤词典更加精确。
即,本发明实施例优选的,还包括:
步骤150,持续获取所述用户的访问历史数据,统计用户的个性化的偏好类别;
其中访问历史数据可包括用户点击非网络信息网页的历史数据(比如点击新闻内容的历史数据),也可包括用户点击网络信息的历史数据。比如对于点击新闻内容的数据,进行统计分析点击新闻内容得出用喜好、如喜爱体育,财经,娱乐,法制等。
步骤160,根据所述偏好类别,调整针对该用户的职业匹配过滤词典。
其中,所述根据所述偏好类别,调整针对该用户的职业匹配过滤词典包括:
步骤S161,针对用户偏好类型,增加对应该用户的职业匹配过滤词典中所述偏好类型对应的职业类别的置信度;
比如根据喜好增加职业色彩:喜爱体育的用户可能是个运动员,该用户职业词典中体育职业置信度便增加0.2。
步骤S162,当所述权重达到权重阈值时,针对该职业类别的用户的网络信息点击历史数据,统计点击率低于点击阈值的网络信息类别,提取该类别网络信息的网络信息类别关键词作为反感网络信息的关键词。
当前述体育职业置信度达到0.9,便统计分析这类用户哪一类网络信息点击率底,则列为反感网络信息类型,然后更新职业匹配过滤词典。随数据积累职业字典的完善,精准度越高。
参照图4,是本发明实施例三的一种网络信息投放装置结构示意图,包括:
信息提取模块A50,用于针对用户的网络行为,提取对应用户的各关键词和用户信息;
网络信息获取模块A60,用于根据所述各关键词查询对应的各网络信息;
网络信息过滤模块A70,用于针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息最匹配的网络信息;
投放模块A80,用于在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
优选的,还包括:
词典构建模块,用于预先针对全网数据和用户对网络信息的点击历史数据进行分析并构建职业匹配过滤词典;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词;
进一步的,所述信息提取模块包括:
第一信息提取模块,用于从职业匹配过滤词典中提取的用户各职业以及对应各职业的反感网络信息的关键词。
所述词典构建模块包括:
置信度分析模块,用于从所述全网数据中分析各用户的各职业类别的置信度;
反感关键分析模块,用于针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词;
第一词典构建模块,用于针对各职业类别和对应的网络信息关键词构建职业匹配过滤词典。
优选的,所述置信度分析模块包括:
分类模块,用于按职业类别将全网数据进行分类;
职业信息提取模块,用于针对任一职业类别的各网页信息,获取访问该职业类别网页的各用户以及与用户的职业信息;
置信度计算模块,用于针对每个用户,根据所述职业类别分类的权重、各职业信息的权重计算所述用户的该职业类别的置信度。
还包括:
论坛数据提取模块,用于针对每个用户,提取该用户在论坛网站的各职业信息;
进一步的,所述置信度计算模块包括:
第二置信度计算模块,用于针对每个用户,根据所述职业类别分类的权重、各职业信息的权重、论坛网站职业信息的权重计算所述用户的该职业类别的置信度。
优选的,所述反感关键分析模块包括:
点击率统计模块,用于统计所述职业类别下,置信度大于第一阈值各用户的对各种网络信息类别的点击率;
反感关键词提取模块,用于将点击率小于第二阈值的各网络信息类别,提取该网络信息类别的网络信息类别关键词组合作为反感网络信息的关键词。
优选的,还包括:
优化统计模块,用于持续获取所述用户的访问历史数据,统计用户的个性化的偏好类别;
优化调整模块,用于根据所述偏好类别,调整针对该用户的职业匹配过滤词典。
优选的,所述优化调整模块,包括:
权重调整模块,用于针对用户偏好类型,增加对应该用户的职业匹配过滤词典中所述偏好类型对应的职业类别的置信度;
第一优化调整模块,用于当所述权重达到权重阈值时,针对该职业类别的用户的网络信息点击历史数据,统计点击率低于点击阈值的网络信息类别,提取该类别网络信息的网络信息类别关键词作为反感网络信息的关键词。
优选的,所述网络信息过滤模块包括:
第一匹配模块,用于提取各网络信息的网络信息类别关键词,并将所述网络信息类别关键词与所述反感网络信息的关键词进行匹配;
第一过滤模块,用于根据匹配结果过滤所述各网络信息。
优选的,所述投放模块包括:
针对同一批关键词对应的过滤后的网络信息,在不同时段选择多个属于不同类别的网络信息投放给所述用户。
实施例四
参照图5,其示出了本发明实施例四的一种网络信息投放装置结构示意图,包括:
词典构建模块310,用于预先针对全网数据和用户对网络信息的点击历史数据,进行分析并构建职业匹配过滤词典;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词;
信息提取模块320,用于针对用户的网络行为,提取对应用户的各关键词和用户信息;
网络信息获取模块330,用于根据所述各关键词查询对应的各网络信息;
网络信息过滤模块340,用于依据用户信息查找职业匹配过滤词典中对应的职业类别,提取对应所述职业类别的反感网络信息的关键词,并根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息;
投放模块350,用于在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
优选的,所述词典构建模块包括:
置信度分析模块,用于从所述全网数据中分析各用户的各职业类别的置信度;
反感关键分析模块,用于针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词;
第一词典构建模块,用于针对各职业类别和对应的网络信息关键词构建职业匹配过滤词典。
优选的,所述置信度分析模块包括:
分类模块,用于按职业类别将全网数据进行分类;
职业信息提取模块,用于针对任一职业类别的各网页信息,获取访问该职业类别网页的各用户以及与用户的职业信息;
置信度计算模块,用于针对每个用户,根据所述职业类别分类的权重、各职业信息的权重计算所述用户的该职业类别的置信度。
还包括:
论坛数据提取模块,用于针对每个用户,提取该用户在论坛网站的各职业信息;
进一步的,所述置信度计算模块包括:
第二置信度计算模块,用于针对每个用户,根据所述职业类别分类的权重、各职业信息的权重、论坛网站职业信息的权重计算所述用户的该职业类别的置信度。
优选的,所述反感关键分析模块包括:
点击率统计模块,用于统计所述职业类别下,置信度大于第一阈值各用户的对各种网络信息类别的点击率;
反感关键词提取模块,用于将点击率小于第二阈值的各网络信息类别,提取该网络信息类别的网络信息类别关键词组合作为反感网络信息的关键词。
优选的,还包括:
优化统计模块,用于持续获取所述用户的访问历史数据,统计用户的个性化的偏好类别;
优化调整模块,用于根据所述偏好类别,调整针对该用户的职业匹配过滤词典。
优选的,所述优化调整模块,包括:
权重调整模块,用于针对用户偏好类型,增加对应该用户的职业匹配过滤词典中所述偏好类型对应的职业类别的置信度;
第一优化调整模块,用于当所述权重达到权重阈值时,针对该职业类别的用户的网络信息点击历史数据,统计点击率低于点击阈值的网络信息类别,提取该类别网络信息的网络信息类别关键词作为反感网络信息的关键词。
优选的,所述网络信息过滤模块包括:
第一匹配模块,用于提取各网络信息的网络信息类别关键词,并将所述网络信息类别关键词与所述反感网络信息的关键词进行匹配;
第一过滤模块,用于根据匹配结果过滤所述各网络信息。
优选的,所述投放模块包括:
针对同一批关键词对应的过滤后的网络信息,在不同时段选择多个属于不同类别的网络信息投放给所述用户。
需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本发明优选应用于嵌入式系统中。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上对本发明所提供的一种网络信息投放方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种网络信息放方法,其特征在于,包括:
针对用户的网络行为,提取对应用户的各关键词和用户信息;
根据所述各关键词查询对应的各网络信息;
针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息匹配的网络信息;
在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述提取对应用户的用户信息包括:
从职业匹配过滤词典中提取的用户各职业以及对应各职业的反感网络信息的关键词;
所述职业匹配过滤词典通过预先针对全网数据和用户对网络信息的点击历史数据进行分析并构建;所述职业匹配过滤词典包括用户各职业以及对应各职业的反感网络信息的关键词。
3.根据权利要求2所述的方法,其特征在于,所述针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息最匹配的网络信息包括:
根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息。
4.根据权利要求2所述的方法,其特征在于,所述预先针对全网数据和用户对网络信息的点击历史数据,进行分析并构建职业匹配过滤词典包括:
从所述全网数据中分析各用户的各职业类别的置信度;
针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词;
针对各职业类别和对应的网络信息的关键词构建职业匹配过滤词典。
5.根据权利要求3所述的方法,其特征在于,所述从所述全网数据中分析各用户的各职业类别的置信度包括:
按职业类别将全网数据进行分类;
针对任一职业类别的各网页信息,获取访问该职业类别网页的各用户以及与用户的职业信息;
针对每个用户,根据所述职业类别分类的权重、各职业信息的权重计算所述用户的该职业类别的置信度。
6.根据权利要求4所述的方法,其特征在于,还包括:
针对每个用户,提取该用户在论坛网站的各职业信息;
所述从所述全网数据中分析各用户的各职业类别的置信度包括:
针对每个用户,根据所述职业类别分类的权重、各职业信息的权重、论坛网站职业信息的权重计算所述用户的该职业类别的置信度。
7.根据权利要求4所述的方法,其特征在于,所述针对每一职业类别下置信度大于第一阈值的各用户,获取所述各用户的网络信息点击历史数据并分析该职业类别对应的反感网络信息的关键词包括:
统计所述职业类别下,置信度大于第一阈值各用户的对各种网络信息类别的点击率;
将点击率小于第二阈值的各网络信息类别,提取该网络信息类别的网络信息类别关键词组合作为反感网络信息的关键词。
8.根据权利要求2所述的方法,其特征在于,还包括:
持续获取所述用户的访问历史数据,统计用户的个性化的偏好类别;
根据所述偏好类别,调整针对该用户的职业匹配过滤词典。
9.据权利要求8所述的方法,其特征在于,所述根据所述偏好类别,调整针对该用户的职业匹配过滤词典包括:
针对用户偏好类型,增加对应该用户的职业匹配过滤词典中所述偏好类型对应的职业类别的置信度;
当所述权重达到权重阈值时,针对该职业类别的用户的网络信息点击历史数据,统计点击率低于点击阈值的网络信息类别,提取该类别网络信息的网络信息类别关键词作为反感网络信息的关键词。
10.据权利要求1所述的方法,其特征在于,根据所述反感网络信息的关键词过滤所述各网络信息中相应的网络信息包括:
提取各网络信息的网络信息类别关键词,并将所述网络信息类别关键词与所述反感网络信息的关键词进行匹配;
根据匹配结果过滤所述各网络信息。
11.据权利要求1所述的方法,其特征在于,所述在过滤后的网络信息中选择至少一个网络信息投放给所述用户包括:
针对同一批关键词对应的过滤后的网络信息,在不同时段选择多个属于不同类别的网络信息投放给所述用户。
12.一种网络信息投放装置,其特征在于,包括:
信息提取模块,用于针对用户的网络行为,提取对应用户的各关键词和用户信息;
网络信息获取模块,用于根据所述各关键词查询对应的各网络信息;
网络信息过滤模块,用于针对所述各网络信息,根据所述用户信息过滤用户反感的网络信息,获得与用户信息匹配的网络信息;
投放模块,用于在过滤后的网络信息中选择至少一个网络信息投放给所述用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100777881A CN103198098A (zh) | 2013-03-12 | 2013-03-12 | 一种网络信息投放方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100777881A CN103198098A (zh) | 2013-03-12 | 2013-03-12 | 一种网络信息投放方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103198098A true CN103198098A (zh) | 2013-07-10 |
Family
ID=48720656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013100777881A Pending CN103198098A (zh) | 2013-03-12 | 2013-03-12 | 一种网络信息投放方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103198098A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077366A (zh) * | 2014-06-13 | 2014-10-01 | 北京百度网讯科技有限公司 | 一种在网络设备中用于确定特征信息的方法和装置 |
CN104850546A (zh) * | 2014-02-13 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 移动媒介信息的展示方法和系统 |
CN105138702A (zh) * | 2015-09-30 | 2015-12-09 | 北京奇虎科技有限公司 | 一种基于搜索引擎的网络搜索方法及电子设备 |
CN105260436A (zh) * | 2015-09-30 | 2016-01-20 | 北京奇虎科技有限公司 | 一种网络搜索方法及电子设备 |
CN106060849A (zh) * | 2016-05-26 | 2016-10-26 | 重庆大学 | 一种异构网络中的网络制式优化分配方法 |
CN106651420A (zh) * | 2016-09-19 | 2017-05-10 | 深圳市东信时代信息技术有限公司 | 基于人群关键词定向的移动广告投放方法 |
CN107563912A (zh) * | 2017-08-29 | 2018-01-09 | 广东蔚海数问大数据科技有限公司 | 一种律师推荐方法及系统 |
CN108062688A (zh) * | 2017-12-14 | 2018-05-22 | 宁波升维信息技术有限公司 | 一种网络信息投放方法和装置 |
CN110909255A (zh) * | 2019-11-01 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 一种内容处理方法、装置及设备 |
CN111192076A (zh) * | 2019-12-12 | 2020-05-22 | 西安冉科信息技术有限公司 | 一种基于移动终端的推广信息投放方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075253A (zh) * | 2007-02-15 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种广告信息推送系统和方法 |
CN102207942A (zh) * | 2010-03-29 | 2011-10-05 | 上海博泰悦臻电子设备制造有限公司 | 基于标识信息匹配的搜索方法及搜索装置 |
CN102254265A (zh) * | 2010-05-18 | 2011-11-23 | 北京首家通信技术有限公司 | 一种富媒体互联网广告内容匹配、效果评估方法 |
-
2013
- 2013-03-12 CN CN2013100777881A patent/CN103198098A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075253A (zh) * | 2007-02-15 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种广告信息推送系统和方法 |
CN102207942A (zh) * | 2010-03-29 | 2011-10-05 | 上海博泰悦臻电子设备制造有限公司 | 基于标识信息匹配的搜索方法及搜索装置 |
CN102254265A (zh) * | 2010-05-18 | 2011-11-23 | 北京首家通信技术有限公司 | 一种富媒体互联网广告内容匹配、效果评估方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850546A (zh) * | 2014-02-13 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 移动媒介信息的展示方法和系统 |
CN104850546B (zh) * | 2014-02-13 | 2020-01-24 | 腾讯科技(深圳)有限公司 | 移动媒介信息的展示方法和系统 |
CN104077366A (zh) * | 2014-06-13 | 2014-10-01 | 北京百度网讯科技有限公司 | 一种在网络设备中用于确定特征信息的方法和装置 |
CN104077366B (zh) * | 2014-06-13 | 2018-03-23 | 北京百度网讯科技有限公司 | 一种在网络设备中用于确定特征信息的方法和装置 |
CN105260436B (zh) * | 2015-09-30 | 2019-02-12 | 北京奇虎科技有限公司 | 一种网络搜索方法及电子设备 |
CN105138702A (zh) * | 2015-09-30 | 2015-12-09 | 北京奇虎科技有限公司 | 一种基于搜索引擎的网络搜索方法及电子设备 |
CN105260436A (zh) * | 2015-09-30 | 2016-01-20 | 北京奇虎科技有限公司 | 一种网络搜索方法及电子设备 |
CN105138702B (zh) * | 2015-09-30 | 2019-12-10 | 北京奇虎科技有限公司 | 一种基于搜索引擎的网络搜索方法及电子设备 |
CN106060849A (zh) * | 2016-05-26 | 2016-10-26 | 重庆大学 | 一种异构网络中的网络制式优化分配方法 |
CN106060849B (zh) * | 2016-05-26 | 2019-08-20 | 重庆大学 | 一种异构网络中的网络制式优化分配方法 |
CN106651420A (zh) * | 2016-09-19 | 2017-05-10 | 深圳市东信时代信息技术有限公司 | 基于人群关键词定向的移动广告投放方法 |
CN107563912A (zh) * | 2017-08-29 | 2018-01-09 | 广东蔚海数问大数据科技有限公司 | 一种律师推荐方法及系统 |
CN108062688A (zh) * | 2017-12-14 | 2018-05-22 | 宁波升维信息技术有限公司 | 一种网络信息投放方法和装置 |
CN110909255A (zh) * | 2019-11-01 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 一种内容处理方法、装置及设备 |
CN110909255B (zh) * | 2019-11-01 | 2022-10-25 | 北京达佳互联信息技术有限公司 | 一种内容处理方法、装置及设备 |
CN111192076A (zh) * | 2019-12-12 | 2020-05-22 | 西安冉科信息技术有限公司 | 一种基于移动终端的推广信息投放方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103198098A (zh) | 一种网络信息投放方法和装置 | |
US20190361945A1 (en) | Analytics based on scalable hierarchical categorization of web content | |
CN103744981B (zh) | 一种基于网站内容用于网站自动分类分析的系统 | |
US7668823B2 (en) | Identifying inadequate search content | |
US9201863B2 (en) | Sentiment analysis from social media content | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
US9798820B1 (en) | Classification of keywords | |
US20110119267A1 (en) | Method and system for processing web activity data | |
CN104866554B (zh) | 一种基于社会化标注的个性化搜索方法及系统 | |
WO2020233344A1 (zh) | 一种搜索方法、装置及存储介质 | |
CN103473354A (zh) | 基于电子商务平台的保险推荐系统框架及保险推荐方法 | |
CN104281622A (zh) | 一种社交媒体中的信息推荐方法和装置 | |
CN101206674A (zh) | 以商品为媒介的增强型相关搜索系统及其方法 | |
CN103577534B (zh) | 搜索方法和搜索引擎 | |
CN102651011A (zh) | 一种确定文档特征和用户特征的方法和系统 | |
CN101401062A (zh) | 确定相关来源、查询及合并多个内容来源的结果的方法和系统 | |
CN103970796A (zh) | 查询偏好排序方法和装置 | |
CN103186574A (zh) | 一种搜索结果的生成方法和装置 | |
CN103577462A (zh) | 一种文档分类方法及装置 | |
KR20210037842A (ko) | 빅데이터 기반 키워드의 광고 마케팅 시스템 | |
TWI461942B (zh) | An ad management apparatus, an advertisement selecting apparatus, an advertisement management method, an advertisement management program, and a recording medium on which an advertisement management program is recorded | |
US8977948B1 (en) | System, method, and computer program for determining information associated with an extracted portion of content | |
CN102479193A (zh) | 一种基于匹配出价系数进行匹配搜索推广的方法和设备 | |
CN110148028A (zh) | 向用户推荐菜单的方法、装置及计算机可读存储介质 | |
CN115115407A (zh) | 城市一体化智能服务平台智能推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20170714 |