CN106204156A - 一种用于网络论坛的广告投放方法及装置 - Google Patents

一种用于网络论坛的广告投放方法及装置 Download PDF

Info

Publication number
CN106204156A
CN106204156A CN201610573767.2A CN201610573767A CN106204156A CN 106204156 A CN106204156 A CN 106204156A CN 201610573767 A CN201610573767 A CN 201610573767A CN 106204156 A CN106204156 A CN 106204156A
Authority
CN
China
Prior art keywords
user
key word
advertisement
word
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610573767.2A
Other languages
English (en)
Inventor
蒙道忠
王淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianya Community Network Polytron Technologies Inc
Original Assignee
Tianya Community Network Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianya Community Network Polytron Technologies Inc filed Critical Tianya Community Network Polytron Technologies Inc
Priority to CN201610573767.2A priority Critical patent/CN106204156A/zh
Publication of CN106204156A publication Critical patent/CN106204156A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及互联网应用技术领域,特别是一种用于网络论坛的广告投放方法及装置。该方法包括:获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;在词‑向量库中查找用户关键词和广告关键词对应的向量;根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;选取与用户匹配度最高的广告向用户投放。采用本发明能够找到具有语义相关的匹配词,实现针对不同用户的广告精准投放。

Description

一种用于网络论坛的广告投放方法及装置
技术领域
本发明涉及互联网应用技术领域,特别是一种用于网络论坛的广告投放方法及装置。
背景技术
随着互联网个性化时代的到来,广告投放亦出现根据用户属性精准投放的趋势。
在精准投放方面,现有技术只能做到根据投放请求关键词和广告关键词的匹配,无法实现真正的语义相关,也就无法实现更加准确、丰富、对用户有联想能力的精准投放。比如:投放请求关键词为:“科幻”时,传统方法只能找到具有“科幻”的关键词广告,不能实现关键词关联。如果通过人工关联关键词方法,比如关联“科幻”和“玄幻”,能一定程度实现模糊匹配,但是人工关联词库中的词汇有限,且无法准确判断两个词的语义相关度,进而不能准确关联到匹配度高的词汇,也就无法实现精准的广告投放。
广告投放的另一个关键在于获得用户关键词,用户关键词往往与用户信息关系紧密,如对不同性别、处于不同年龄阶段的用户针对性投放其感兴趣的广告。一般来说,电商网站的用户信息往往比较真实,如地址、交易信息等,但对于论坛网站(例如天涯社区)这类虚拟社区,因本身不存在真实的交易,用户在虚拟社区中使用的身份信息与其真实信息往往存在较大差异,因此难以获得贴近真实的用户关键词,进而无法对这些用户进行精准的广告投放。
发明内容
为了克服现有技术的缺陷,本发明提供一种用于网络论坛的广告投放方法及装置,为实现精准投放广告的目的,本发明结合论坛这类虚拟社区的特点做了两方面的改进,一方面,计算用户关键词与广告关键词的相似度,并进行相似度排序,选择相似度最高的广告进行投放,另一方面,通过修正用户的注册数据推测用户性别、年龄段,以及分析用户访问轨迹生成用户兴趣标签,从而获得贴近真实的用户关键词。
本发明采用技术方案如下:
一种用于网络论坛的广告投放方法,包括:
获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
在词-向量库中查找用户关键词和广告关键词对应的向量;
根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
选取与用户匹配度最高的广告向用户投放。
优选地,所述获取用户的关键词具体为:从所述用户画像库中提取用户的关键词;
在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
将所述用户信息及用户的关键词进行对应存储,形成用户画像库。
具体地,所述根据用户信息及用户访问过的帖子获得用户的性别和年龄段包括:
收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别和年龄段的概率模型;
收集需要修正性别和年龄段的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
具体地,所述根据用户信息及用户访问过的帖子获得用户的兴趣标签包括:
根据论坛中所有帖子的主题,创建多个兴趣主题;
提取用户历史访问的每个帖子的关键词,
计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
进一步地,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
对论坛帖子中的文本执行分词处理,得到文本的单词;
对所述文本的单词执行向量化处理,得到每个单词的向量;
将所述单词和向量对应存储,形成词-向量库。
相应地,本发明还提供了一种用于网络论坛的广告投放装置,包括:
获取模块,用于获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
查找模块,用于在词-向量模块中查找用户关键词和广告关键词对应的向量;
关键词匹配模块,用于根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
执行模块,用于选取与用户匹配度最高的广告向用户投放。
进一步地,所述装置还包括:
第一处理模块,用于根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
用户画像模块,用于存储用户信息及与用户信息对应的用户的关键词。
具体地,所述第一处理模块包括:
第一预处理单元,用于收集网络论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
模型生成单元,用于根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别、年龄段的概率模型;
第二预处理单元,用于收集需要修正性别、年龄的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
第一确定单元,用于将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
具体地,所述第一处理模块还包括:
第三预处理单元,用于根据论坛中所有帖子的主题,创建多个兴趣主题;
提取单元,用于提取用户历史访问的每个帖子的关键词;
第二确定单元,用于计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
进一步地,所述装置还包括:
第二处理模块,用于对论坛帖子中的文本执行分词处理,得到文本的单词;
对所述文本的单词执行向量化处理,得到每个单词的向量;
所述词-向量模块,用于存储单词及与所述单词对应的向量。
本发明的有益效果是:
(1)本发明通过计算用户关键词与广告关键词的相似度,并进行相似度排序,选择相似度最高的广告进行投放。采用本发明能够找到具有语义相关的匹配词,实现针对不同用户的广告精准投放。
(2)通过修正用户的注册数据推测用户性别、年龄段,以及分析用户访问轨迹生成用户兴趣标签,从而获得贴近真实的用户关键词,提升了用户画像的准确度。
(3)传统的生成兴趣标签方法,基本都是定义一些兴趣判别公式,然后计算满足公式的程度来判断兴趣,本发明采用模糊兴趣方式,采取多个关键词共同描绘一个兴趣主题,并使用统一方法,避免了每次都要针对不同兴趣标签定义不同公式,编程不同逻辑的麻烦,并且能更加准确、饱满的描绘用户兴趣。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例一的用于网络论坛的广告投放方法的流程图;
图2是本发明实施例一的构建用户画像库的方法的流程图;
图3是本发明实施例一的获得用户的性别和年龄段的方法的流程图:
图4是本发明实施例一的获得用户的兴趣标签的方法的流程图:
图5是本发明实施例一的构建词-向量库的方法的流程图;
图6是本发明的实施例二的用于网络论坛的广告投放方法的结构框图;
图7是本发明的实施例二的用于网络论坛的广告投放方法中第一处理模块的结构框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例一:
请参见图1,图1是本发明的用于网络论坛的广告投放方法的流程图。所述用于网络论坛的广告投放方法包括如下步骤:
S101、获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
S102、在词-向量库中查找用户关键词和广告关键词对应的向量;
S103、根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
S104、选取与用户匹配度最高的广告向用户投放。
下面就实施上述步骤S101-S104举例说明,其中,用户的用户关键词为:男性、青年、科技,广告A的关键词为:汽车、特斯拉,广告B的关键词为:水果、芒果。首先从“词-向量库”查找到这些关键词的向量,并两两计算余弦相似度,累加用户和某个广告的关键词相似度,如累加男性-汽车、男性-特斯拉、青年-汽车、青年-特斯拉、科技-汽车、科技-特斯拉的相似度,此累加结果作为用户和广告A的匹配度,累加男性-水果、男性-芒果、青年-水果、青年-芒果、科技-水果、科技-芒果的相似度,此累加结果作为用户和广告B的匹配度,如用户和广告A的匹配度高于用户和广告B的匹配度,则向用户投放匹配度更高的广告A。
进一步地,所述获取用户的关键词具体为:从所述用户画像库中提取用户的关键词;
参见图2,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
S201、根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
S202、将所述用户信息及用户的关键词进行对应存储,形成用户画像库。
参见图3,所述根据用户信息及用户访问过的帖子获得用户的性别和年龄段包括:
S301、收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
S302、根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别和年龄段的概率模型;
S303、收集需要修正性别和年龄段的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
S304、将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
很多虚拟社区的用户注册资料是不准确的,比如性别、年龄,本实施例以天涯社区为例,对上述步骤S301-S304进行详细说明,采用分析用户在天涯社区的行为轨迹来修正性别、年龄段(由于修正具体年龄较为困难,但修正年龄段较为容易,且通过年龄段即可实现广告的精准投放,因此,修正年龄段即可)。具体步骤为:
1)先收集天涯社区中已确认性别、年龄段的用户及其所有访问过的帖子,使用LDA算法分析所有这些帖子的主题分布,生成20个主题,提取每个主题的关键词。
2)由1)可以建立性别、年龄段和对应主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别、年龄段的概率模型。
3)收集需要修正性别、年龄段的用户所有访问的帖子,使用TF-IDF算法提取每个帖子的关键词,计算这些关键词和上述生成的20个主题的相似度,选取相似度最高的主题作为该用户最为关心的主题。
4)将用户最关心的主题输入神经网络概率模型,推测用户性别、所属年龄段。
参见图4,所述根据用户信息及用户访问过的帖子获得用户的兴趣标签包括:
S401、根据论坛中所有帖子的主题,创建多个兴趣主题;
S402、提取用户历史访问的每个帖子的关键词,
S403、计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
现以天涯社区为例,对上述步骤S401-S403进行说明。
(一)使用LDA(Latent Dirichlet Allocation,是一种文档主题生成模型,也称为一个三层贝叶斯概率模型)计算所有天涯论坛中的帖子,生成100个兴趣主题;
(二)使用TF-ID(Fterm frequency–inverse document frequency,是一种用于信息检索与数据挖掘的常用加权技术)计算每个帖子的关键词,通过关键词和100个主题的相似度计算每个帖子的主题;
(三)根据用户历史访问帖子的主题分布,计算用户最感兴趣的主题,使用用户最感兴趣的主题的关键词作为用户的兴趣标签。
进一步地,参见图5,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
S501、对论坛帖子中的文本执行分词处理,得到文本的单词;
S502、对所述文本的单词执行向量化处理,得到每个单词的向量;
S503、将所述单词和向量对应存储,形成词-向量库。
以天涯社区为例,实施步骤S501-S503具体包括:使用IKAnalyzer(IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包)对所有天涯帖子进行中文分词,分好词的语料使用word2vec(word to vector,是一个将单词转换成向量形式的工具)进行训练,获得每个词的100维向量表示,比如“科幻”表示为:(1.234,0.5434,0.56546……),将所述词和向量对应存储,形成词-向量库。该训练好的“词-向量库”供查找用户关键词和广告关键词对应的向量,可重复使用不必重新训练。
实施例二:
参考图6和图7,为实现上述实施例一所示的方法,本发明提供了一种用于网络论坛的广告投放装置的实施例,该装置与1-5所示的方法实施例相对应。
如图6所示,本实施例的用于网络论坛的广告投放装置包括:
获取模块100,用于获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
查找模块200,用于在词-向量模块中查找用户关键词和广告关键词对应的向量;
关键词匹配模块300,用于根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
执行模块400,用于选取与用户匹配度最高的广告向用户投放。
进一步地,所述装置还包括:
第一处理模块500,用于根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
用户画像模块,用于存储用户信息及与用户信息对应的用户的关键词。
具体地,参见图7,所述第一处理模块包括:
第一预处理单元501,用于收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
模型生成单元502,用于根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别、年龄段的概率模型;
第二预处理单元503,用于收集需要修正性别、年龄的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
第一确定单元504,用于将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
具体地,所述第一处理模块还包括:
第三预处理单元505,用于根据论坛中所有帖子的主题,创建多个兴趣主题;
提取单元,用于提取用户历史访问的每个帖子的关键词;
第二确定单元506,用于计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
更进一步地,所述装置还包括:
第二处理模块,用于对论坛帖子中的文本执行分词处理,得到文本的单词;
对所述文本的单词执行向量化处理,得到每个单词的向量;
所述词-向量模块,用于存储单词及与所述单词对应的向量。
本发明的有益效果是:
本发明通过计算用户关键词与广告关键词的相似度,并进行相似度排序,选择相似度最高的广告进行投放。采用本发明能够找到具有语义相关的匹配词,实现针对不同用户的广告精准投放。实践证明,实施本发明方案,相对原有精准投放系统平均提升了6%的广告点击率,利于提升公司的广告营收。
通过修正用户的注册数据推测用户性别、年龄段,以及分析用户访问轨迹生成用户兴趣标签,从而获得贴近真实的用户关键词,提升了用户画像的准确度。此外,传统的生成兴趣标签方法,基本都是定义一些兴趣判别公式,然后计算满足公式的程度来判断兴趣,本发明采用模糊兴趣方式,采取多个关键词共同描绘一个兴趣主题,并使用统一方法,避免了每次都要针对不同兴趣标签定义不同公式,编程不同逻辑的麻烦,并且能更加准确、饱满的描绘用户兴趣。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种用于网络论坛的广告投放方法,其特征在于,包括:
获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
在词-向量库中查找用户关键词和广告关键词对应的向量;
根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
选取与用户匹配度最高的广告向用户投放。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的关键词具体为:从所述用户画像库中提取用户的关键词;
在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
将所述用户信息及用户的关键词进行对应存储,形成用户画像库。
3.根据权利要求2所述的方法,其特征在于,所述根据用户信息及用户访问过的帖子获得用户的性别和年龄段包括:
收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别和年龄段的概率模型;
收集需要修正性别和年龄段的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
4.根据权利要求2所述的方法,其特征在于,所述根据用户信息及用户访问过的帖子获得用户的兴趣标签包括:
根据论坛中所有帖子的主题,创建多个兴趣主题;
提取用户历史访问的每个帖子的关键词,
计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
5.根据权利要求1所述的方法,其特征在于,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:
对论坛帖子中的文本执行分词处理,得到文本的单词;
对所述文本的单词执行向量化处理,得到每个单词的向量;
将所述单词和向量对应存储,形成词-向量库。
6.一种用于网络论坛的广告投放装置,其特征在于,包括:
获取模块,用于获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;
查找模块,用于在词-向量模块中查找用户关键词和广告关键词对应的向量;
关键词匹配模块,用于根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;
执行模块,用于选取与用户匹配度最高的广告向用户投放。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;
用户画像模块,用于存储用户信息及与用户信息对应的用户的关键词。
8.根据权利要求7所述的装置,其特征在于,所述第一处理模块包括:
第一预处理单元,用于收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;
模型生成单元,用于根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别、年龄段的概率模型;
第二预处理单元,用于收集需要修正性别、年龄的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,
第一确定单元,用于将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。
9.根据权利要求7所述的装置,其特征在于,所述第一处理模块还包括:
第三预处理单元,用于根据论坛中所有帖子的主题,创建多个兴趣主题;
提取单元,用于提取用户历史访问的每个帖子的关键词;
第二确定单元,用于计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二处理模块,用于对论坛帖子中的文本执行分词处理,得到文本的单词;
对所述文本的单词执行向量化处理,得到每个单词的向量;
所述词-向量模块,用于存储单词及与所述单词对应的向量。
CN201610573767.2A 2016-07-20 2016-07-20 一种用于网络论坛的广告投放方法及装置 Pending CN106204156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610573767.2A CN106204156A (zh) 2016-07-20 2016-07-20 一种用于网络论坛的广告投放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610573767.2A CN106204156A (zh) 2016-07-20 2016-07-20 一种用于网络论坛的广告投放方法及装置

Publications (1)

Publication Number Publication Date
CN106204156A true CN106204156A (zh) 2016-12-07

Family

ID=57493840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610573767.2A Pending CN106204156A (zh) 2016-07-20 2016-07-20 一种用于网络论坛的广告投放方法及装置

Country Status (1)

Country Link
CN (1) CN106204156A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651453A (zh) * 2016-12-28 2017-05-10 广州爱九游信息技术有限公司 面向网络平台的自动推广方法、系统和计算设备
CN107093115A (zh) * 2017-05-10 2017-08-25 杭州纸箱哥文化传播有限公司 一种精准营销的广告纸箱定制方法及系统
CN108009850A (zh) * 2017-11-30 2018-05-08 广州云移信息科技有限公司 一种营销广告方案匹配方法及系统
CN108280689A (zh) * 2018-01-30 2018-07-13 浙江省公众信息产业有限公司 基于搜索引擎的广告投放方法、装置以及搜索引擎系统
CN108288172A (zh) * 2017-12-21 2018-07-17 深圳市金立通信设备有限公司 广告dsp定向投放广告的方法及终端
CN108305057A (zh) * 2018-01-22 2018-07-20 平安科技(深圳)有限公司 电子红包的发放装置、方法及计算机可读存储介质
CN108346067A (zh) * 2018-01-23 2018-07-31 中国科学技术大学苏州研究院 基于自然语言处理的社交网络广告推送方法
CN108415935A (zh) * 2018-01-23 2018-08-17 北京奇虎科技有限公司 一种推送推荐消息的方法、装置
CN108596650A (zh) * 2018-03-26 2018-09-28 首媒科技(北京)有限公司 用于广告或商品信息投放的数据处理方法及装置
WO2019041520A1 (zh) * 2017-08-31 2019-03-07 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN109493146A (zh) * 2018-11-29 2019-03-19 深圳爱问科技股份有限公司 广告投放方法及装置
CN109635073A (zh) * 2018-10-18 2019-04-16 深圳壹账通智能科技有限公司 论坛社区应用管理方法、装置、设备及计算机可读存储介质
CN110020880A (zh) * 2018-01-10 2019-07-16 腾讯科技(深圳)有限公司 广告投放方法、装置及设备
CN112182354A (zh) * 2019-07-01 2021-01-05 北京百度网讯科技有限公司 用户信息的统计方法、装置、设备和存储介质
CN112182385A (zh) * 2020-09-28 2021-01-05 苏州远迪网络科技有限公司 一种网络竞价推广关键词优化方法和系统
CN112381570A (zh) * 2020-11-12 2021-02-19 广州易尊网络科技股份有限公司 一种面向目标用户的广告投放方法及装置
CN112465556A (zh) * 2020-12-07 2021-03-09 深圳市易售科技有限公司 一种广告显示方法、装置、系统及存储介质
CN113570413A (zh) * 2021-07-28 2021-10-29 杭州王道控股有限公司 广告关键词的生成方法、装置、存储介质及电子设备
CN113724022A (zh) * 2021-11-03 2021-11-30 北京达佳互联信息技术有限公司 关键词确定方法、装置、计算机设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156721A (zh) * 2011-03-29 2011-08-17 张栋 基于标签的互联网视频广告精准投放方法
CN104090888A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
US20160140634A1 (en) * 2014-11-17 2016-05-19 Institute For Information Industry System, method and non-transitory computer readable medium for e-commerce reputation analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156721A (zh) * 2011-03-29 2011-08-17 张栋 基于标签的互联网视频广告精准投放方法
CN104090888A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
US20160140634A1 (en) * 2014-11-17 2016-05-19 Institute For Information Industry System, method and non-transitory computer readable medium for e-commerce reputation analysis

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651453A (zh) * 2016-12-28 2017-05-10 广州爱九游信息技术有限公司 面向网络平台的自动推广方法、系统和计算设备
CN107093115A (zh) * 2017-05-10 2017-08-25 杭州纸箱哥文化传播有限公司 一种精准营销的广告纸箱定制方法及系统
CN107093115B (zh) * 2017-05-10 2021-05-25 杭州纸箱哥文化传播有限公司 一种精准营销的广告纸箱定制方法及系统
WO2019041520A1 (zh) * 2017-08-31 2019-03-07 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN108009850A (zh) * 2017-11-30 2018-05-08 广州云移信息科技有限公司 一种营销广告方案匹配方法及系统
CN108288172A (zh) * 2017-12-21 2018-07-17 深圳市金立通信设备有限公司 广告dsp定向投放广告的方法及终端
CN110020880B (zh) * 2018-01-10 2023-09-05 腾讯科技(深圳)有限公司 广告投放方法、装置及设备
CN110020880A (zh) * 2018-01-10 2019-07-16 腾讯科技(深圳)有限公司 广告投放方法、装置及设备
CN108305057A (zh) * 2018-01-22 2018-07-20 平安科技(深圳)有限公司 电子红包的发放装置、方法及计算机可读存储介质
CN108346067A (zh) * 2018-01-23 2018-07-31 中国科学技术大学苏州研究院 基于自然语言处理的社交网络广告推送方法
CN108415935A (zh) * 2018-01-23 2018-08-17 北京奇虎科技有限公司 一种推送推荐消息的方法、装置
CN108280689A (zh) * 2018-01-30 2018-07-13 浙江省公众信息产业有限公司 基于搜索引擎的广告投放方法、装置以及搜索引擎系统
CN108596650A (zh) * 2018-03-26 2018-09-28 首媒科技(北京)有限公司 用于广告或商品信息投放的数据处理方法及装置
CN109635073A (zh) * 2018-10-18 2019-04-16 深圳壹账通智能科技有限公司 论坛社区应用管理方法、装置、设备及计算机可读存储介质
CN109493146A (zh) * 2018-11-29 2019-03-19 深圳爱问科技股份有限公司 广告投放方法及装置
CN112182354A (zh) * 2019-07-01 2021-01-05 北京百度网讯科技有限公司 用户信息的统计方法、装置、设备和存储介质
CN112182385A (zh) * 2020-09-28 2021-01-05 苏州远迪网络科技有限公司 一种网络竞价推广关键词优化方法和系统
CN112381570A (zh) * 2020-11-12 2021-02-19 广州易尊网络科技股份有限公司 一种面向目标用户的广告投放方法及装置
CN112465556A (zh) * 2020-12-07 2021-03-09 深圳市易售科技有限公司 一种广告显示方法、装置、系统及存储介质
CN113570413A (zh) * 2021-07-28 2021-10-29 杭州王道控股有限公司 广告关键词的生成方法、装置、存储介质及电子设备
CN113570413B (zh) * 2021-07-28 2023-12-05 杭州王道控股有限公司 广告关键词的生成方法、装置、存储介质及电子设备
CN113724022A (zh) * 2021-11-03 2021-11-30 北京达佳互联信息技术有限公司 关键词确定方法、装置、计算机设备及介质

Similar Documents

Publication Publication Date Title
CN106204156A (zh) 一种用于网络论坛的广告投放方法及装置
US7519588B2 (en) Keyword characterization and application
CN103853824B (zh) 一种基于深度语义挖掘的内文广告发布方法与系统
CN103473283B (zh) 一种文本案例匹配方法
CN104933100B (zh) 关键词推荐方法和装置
US8682882B2 (en) System and method for automatically identifying classified websites
CN105045875B (zh) 个性化信息检索方法及装置
CN107577759A (zh) 用户评论自动推荐方法
US20090162824A1 (en) Automated learning from a question and answering network of humans
CN106682172A (zh) 一种基于关键词的文献研究热点推荐方法
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
CN106484764A (zh) 基于人群画像技术的用户相似度计算方法
CN108280114A (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN103886020B (zh) 一种房地产信息快速搜索方法
CN107885793A (zh) 一种微博热点话题分析预测方法及系统
CN103838756A (zh) 一种确定推送信息的方法及装置
KR20080048149A (ko) 카테고리 광고 시스템 및 방법
KR20210103401A (ko) 관심 지점에 관련된 정보를 사용자에게 제공하기 위한 방법 및 시스템
CN106294744A (zh) 兴趣识别方法及系统
CN113722478B (zh) 多维度特征融合相似事件计算方法、系统及电子设备
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
CN110609950B (zh) 一种舆情系统搜索词推荐方法及系统
CN102129477A (zh) 一种多模态联合的图像重排序方法
Vargiu et al. Improving contextual advertising by adopting collaborative filtering
CN102063454A (zh) 一种搜索与应用相结合的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207