CN108319615A - 推荐词获取方法和装置 - Google Patents

推荐词获取方法和装置 Download PDF

Info

Publication number
CN108319615A
CN108319615A CN201710035769.0A CN201710035769A CN108319615A CN 108319615 A CN108319615 A CN 108319615A CN 201710035769 A CN201710035769 A CN 201710035769A CN 108319615 A CN108319615 A CN 108319615A
Authority
CN
China
Prior art keywords
word
user
recommendation word
recommendation
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710035769.0A
Other languages
English (en)
Inventor
曹德强
黄浩
苏冬冬
周浩
范洪星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710035769.0A priority Critical patent/CN108319615A/zh
Publication of CN108319615A publication Critical patent/CN108319615A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出一种推荐词获取方法和装置,该方法包括:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。该方法能够更好满足用户需求。

Description

推荐词获取方法和装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种推荐词获取方法和装置。
背景技术
为了更好的满足用户需求,在一些垂直领域等无用户检索需求页面上可以向用户推荐关键词,比如,在百度百科页面上,有“猜你喜欢”这一项,当用户点击“猜你喜欢”这一项中的关键词后,会跳转到点击的关键词的链接页面。
相关技术中,推荐的关键词一般比较单一,不能很好满足用户需求。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种推荐词获取方法,该方法可以多分支触发,以更好满足用户需求。
本申请的另一个目的在于提出一种推荐词获取装置。
本申请实施例提出了一种推荐词获取方法,包括:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
本申请实施例提出了一种推荐词获取装置,包括:提取模块,用于对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取模块,用于获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
本申请实施例提出了一种设备,包括:一个或多个处理器;用于存储一个或多个程序的存储器;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行本申请实施例任一项所述的方法。
本申请实施例提出了一种非易失性计算机可读存储介质,当所述存储介质中的一个或多个程序由设备的一个或多个处理器执行时,使得所述一个或多个处理器执行本申请实施例任一项所述的方法。
本申请实施例提出了一种计算机程序产品,当所述计算机程序产品被设备中的一个或多个处理器执行时,使得所述一个或多个处理器执行本申请第一方面实施例任一项所述的方法。
本申请实施例,通过获取多分支的推荐词,可以获取更多维度的推荐词,从而更好满足用户需求。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提出的推荐词获取方法的流程示意图;
图2是本申请实施例中触发多分支推荐词获取的示意图;
图3是本申请实施例对各推荐词进行排序的示意图;
图4是本申请另一个实施例提出的推荐词获取方法的流程示意图;
图5是本申请一个实施例提出的推荐词获取装置的结构示意图;
图6是本申请另一个实施例提出的推荐词获取装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一个实施例提出的推荐词获取方法的流程示意图。
如图1所示,本实施例的方法包括:
S11:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息。
请求例如为用户在垂直领域的页面上产生的请求,比如,用户在百科页面中查询词条时的查询请求。
用户人群信息,包括但不限于用户ID、用户兴趣列表、用户会话(session)数据、用户点击行为等。页面上下文信息包括不限于用户的检索词(query)、页面标题、文章标题和文章内容。
具体的,用户人群信息可以直接从请求中提取,或者从cookie中提取,或者也可以根据历史数据获取,比如,请求中包含用户ID,则可以直接从请求中提取出用户ID,或者,某些网站为了辨别用户身份、进行session跟踪而在用户本地终端上存储数据作为cookie,则可以从cookie中获取用户会话数据,或者,通过日志记录的历史数据,获取到用户点击、搜索过的数据,从而获取用户兴趣列表等。
页面上下文信息可以从请求所打开的页面中提取,比如提取页面标题、页面中的文章标题、文章内容等。
S12:获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
根据获取的不同信息,对应各种信息可以分别触发相应分支的推荐词的获取,从而获取到多分支的推荐词。
比如,参见图2,页面上下文信息包括用户检索词(query)和页面标题(title),用户人群信息包括用户会话数据(session)、点击行为和兴趣点,则基于用户检索词(query)获取一个分支的推荐词,基于页面标题(title)获取一个分支的推荐词,基于用户会话数据(session)获取一个分支的推荐词,基于点击行为获取一个分支的推荐词,基于用户的兴趣点获取一个分支的推荐词,从而获取到多分支的推荐词。
在触发每个分支的推荐词的获取时,如图2所示,可以基于预先生成的机器翻译模型获取与页面上下文信息对应的推荐词,基于协同过滤和兴趣点获取与用户人群信息对应的推荐词。
具体的,机器翻译模型可以采用如下方式生成:
收集历史数据,所述历史数据包括:历史检索词及其对应的历史目标词,所述历史目标词包括:历史展现广告所对应的商业词或者广告标题,所述历史展现广告是被所述历史检索词触发展现的;
根据所述历史数据确定训练数据;
对所述训练数据进行训练,生成所述机器翻译模型。
上述在根据历史数据确定训练数据时,可以直接将历史数据作为训练数据,或者,在历史数据中,将选择率大于预设值的历史展现广告所对应的历史目标词及其对应的历史检索词作为训练数据。选择率可以具体为点击率,从而可以将点击较多的商业词或广告标题作为训练数据,进而训练生成的机器翻译模型将具有更高的商业价值。
经过训练,机器翻译模型的输入和输出分别为检索词和目标词,因此在应用到页面上下文信息的推荐词的获取时,可以将页面上下文信息作为检索词,作为模型输入,得到模型输出即为页面上下文信息对应的推荐词。
协同过滤常常被用于分辨某位特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析。协同过滤推荐(Collaborative Filteringrecommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
基于协同过滤获取与用户人群信息对应的推荐词可以具体包括:
基于用户人群信息获取各个用户对应的词集合,所述词集合中的词包括:用户历史点击的广告所对应的商业词或广告标题,以及,用户的兴趣点;
基于各个用户对应的词集合确定各个用户的相似用户;
对应各个用户,将未在用户对应的词集合中且在用户的相似用户对应的词集合中的词,确定为所述用户的推荐词。
比如,用户人群信息中记录有用户历史点击行为,依据该历史点击行为可以获取用户历史点击的广告,进而依据广告与商业词的对应关系,或者对广告标题进行提取,获取到用户历史点击的广告所对应的商业词或广告标题。
用户人群信息中还可以记录用户兴趣列表,用户兴趣列表中记录用户的一个或多个兴趣点,因此从用户人群信息中可以提取出兴趣点。用户的兴趣点可以依据用户历史搜索或点击行为确定,或者,也可以为用户自己设置的,比如,用户自己设置体育、游戏作为兴趣点等。
在得到上述的商业词或广告标题以及兴趣点后,可以将其组成用户对应的词集合,比如用户A对应的词集合包括{w11,w12,w13},用户B对应的词集合包括{w21,w22,w23}。在得到各个用户对应的词集合后可以据此确定用户的相似用户,确定相似用户的具体方式不限定,可以采用各种相关技术,比如可以依据词集合的重合度确定,即,假设各个用户对应的词集合中的词总数均为N,假设用户A和用户B对应的词集合中相同的词的个数为M,如果M/N的数值大于预设阈值,则确定用户A和用户B为相似用户。
在确定出各个用户的相似用户后,可以依据相似用户进行词推荐。比如,假设用户A和用户B为相似用户,以及假设上述例子中w12与w21相同,w13与w22相同,则将w11确定为用户B的推荐词,将w23确定为用户A的推荐词。
进一步的,该方法还可以包括:
对所述多分支的推荐词进行排序。
进一步的,在对推荐词进行排序后,该方法还可以包括:
在排序后的推荐词中按序选择预设个数的推荐词,并将所选择的推荐词推送给客户端,以供在客户端上展现所选择的推荐词。
例如,如图3所示,先对各分支内的推荐词进行排序,得到排序后的各分支(S31);再将排序后的各分支拼接成推荐词排序队列(S32);进一步的,还可以对该队列中的推荐词进行重排,得到重排后的队列(S33),以便在重排后的队列中选择排序在前的预设个数的推荐词进行展现。重排可以具体包括:针对所述推荐词排序队列内任意相邻的两个推荐词,将点击率及点击率与商业价值参数的乘积均高的推荐词前置。
如图4所示,先通过预处理提取出用户人群信息和页面上下文信息,再通过触发获取到多分支的推荐词,再进行排序。在对各分支内部的推荐词进行排序时,可以基于推荐词的点击率(CTR)和商业价值参数(CPM)的乘积进行,具体按照CTR*CPM进行降序进行排列。
具体的,可以对各个推荐词的历史数据进行统计,比如统计预设历史时间段内各个推荐词被点击的次数与被显示次数之比,从而得到各个推荐词的点击率。
一个推荐词的商业价值参数具体是指点击该推荐词到导流目标页面的广告的千次展示的费用。具体的,可以对各个推荐词的历史费用进行统计,比如统计历史数据中各个推荐词的千次展示费用,从而得到各个推荐词的商业价值参数。
在拼接得到一个统一的推荐词排序队列后,可以基于CTR和CTR*CPM进行重排,具体可以包括将点击率及点击率与商业价值参数的乘积均高的推荐词前置。比如,在该队列中,初始时,推荐词A排在推荐词B的前面,如果推荐词B的CTR数值比推荐词A的CTR数值大且推荐词B的CTR*CPM数值比推荐词A的CTR*CPM数值大,则将推荐词B重排到推荐词A的前面。通过对相邻两个词的一一比较,可以得到重排后的队列。
本实施例中,通过获取多分支的推荐词,可以获取更多维度的推荐词,从而更好满足用户需求。进一步的,基于机器翻译模型进行推荐词获取时,由于机器翻译模型可以基于历史广告展现数据生成,因此可以获取更高商业价值的推荐词,提高系统变现能力;另外,将商业价值参数引入到推荐词排序时,可以将商业价值较高的推荐词排序在前,可以进一步提高系统变现能力。
图5是本申请一个实施例提出的推荐词获取装置的结构示意图。
如图5所示,本实施例的装置50包括:提取模块51和获取模块52。
提取模块51,用于对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;
获取模块52,用于获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
一些实施例中,所述获取模块52具体用于:
基于预先生成的机器翻译模型获取与页面上下文信息对应的推荐词;
基于协同过滤和兴趣点获取与用户人群信息对应的推荐词。
一些实施例中,参见图6,该装置50还包括:
模型生成模块53,用于收集历史数据,所述历史数据包括:历史检索词及其对应的历史目标词,所述历史目标词包括:历史展现广告所对应的商业词或者广告标题,所述历史展现广告是被所述历史检索词触发展现的;根据所述历史数据确定训练数据;对所述训练数据进行训练,生成所述机器翻译模型。
一些实施例中,所述模型生成模块53具体用于:
将所述历史数据作为训练数据;或者,
在历史数据中,将选择率大于预设值的历史展现广告所对应的历史目标词及其对应的历史检索词作为训练数据。
一些实施例中,所述获取模块52具体用于:
基于用户人群信息获取各个用户对应的词集合,所述词集合中的词包括:用户历史点击的广告所对应的商业词或广告标题,以及,用户的兴趣点;
基于各个用户对应的词集合确定各个用户的相似用户;
对应各个用户,将未在用户对应的词集合中且在用户的相似用户对应的词集合中的词,确定为所述用户的推荐词。
一些实施例中,参见图6,该装置50还可以包括:
排序模块54,用于对所述多分支的推荐词进行排序。
一些实施例中,参见图6,该装置50还可以包括:
推送模块55,用于在排序后的推荐词中按序选择预设个数的推荐词,并将所选择的推荐词推送给客户端,以供在客户端上展现所选择的推荐词。
一些实施例中,所述排序模块54具体用于:
对各分支内部的推荐词进行排序,得到排序后的各分支;
将排序后的各分支拼接成推荐词排序队列。
一些实施例中,所述排序模块54具体用于:
计算各分支内部的推荐词的点击率和商业价值参数的乘积;
根据所述乘积对各分支内部的推荐词进行降序排列。
一些实施例中,所述排序模块54还用于:
针对所述推荐词排序队列内任意相邻的两个推荐词,将点击率及点击率与商业价值参数的乘积均高的推荐词前置。
可以理解的是,本实施例的装置与上述方法实施例对应,具体内容可以参见方法实施例的相关描述,在此不再详细说明。
本实施例中,通过获取多分支的推荐词,可以获取更多维度的推荐词,从而更好满足用户需求。进一步的,基于机器翻译模型进行推荐词获取时,由于机器翻译模型可以基于历史广告展现数据生成,因此可以获取更高商业价值的推荐词,提高系统变现能力;另外,将商业价值参数引入到推荐词排序时,可以将商业价值较高的推荐词排序在前,可以进一步提高系统变现能力。
本申请实施例提出了一种设备,包括:一个或多个处理器;用于存储一个或多个程序的存储器;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
本申请实施例提出了一种非易失性计算机可读存储介质,当所述存储介质中的一个或多个程序由设备的一个或多个处理器执行时,使得所述一个或多个处理器执行:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
本申请实施例提出了一种计算机程序产品,当所述计算机程序产品被设备中的一个或多个处理器执行时,使得所述一个或多个处理器执行:对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者非易失性计算机可读存储介质。该非易失性计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。该非易失性计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,该非易失性计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (22)

1.一种推荐词获取方法,其特征在于,包括:
对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;
获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词,包括:
基于预先生成的机器翻译模型获取与页面上下文信息对应的推荐词;
基于协同过滤获取与用户人群信息对应的推荐词。
3.根据权利要求2所述的方法,其特征在于,还包括:
收集历史数据,所述历史数据包括:历史检索词及其对应的历史目标词,所述历史目标词包括:历史展现广告所对应的商业词或者广告标题,所述历史展现广告是被所述历史检索词触发展现的;
根据所述历史数据确定训练数据;
对所述训练数据进行训练,生成所述机器翻译模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述历史数据确定训练数据,包括:
将所述历史数据作为训练数据;或者,
在历史数据中,将选择率大于预设值的历史展现广告所对应的历史目标词及其对应的历史检索词作为训练数据。
5.根据权利要求2所述的方法,其特征在于,所述基于协同过滤获取与用户人群信息对应的推荐词包括:
基于用户人群信息获取各个用户对应的词集合,所述词集合中的词包括:用户历史点击的广告所对应的商业词或广告标题,以及,用户的兴趣点;
基于各个用户对应的词集合确定各个用户的相似用户;
对应各个用户,将未在用户对应的词集合中且在用户的相似用户对应的词集合中的词,确定为所述用户的推荐词。
6.根据权利要求1所述的方法,其特征在于,还包括:
对所述多分支的推荐词进行排序。
7.根据权利要求6所述的方法,其特征在于,还包括:
在排序后的推荐词中按序选择预设个数的推荐词,并将所选择的推荐词推送给客户端,以供在客户端上展现所选择的推荐词。
8.根据权利要求6所述的方法,其特征在于,所述对所述多分支的推荐词进行排序包括:
对各分支内部的推荐词进行排序,得到排序后的各分支;
将排序后的各分支拼接成推荐词排序队列。
9.根据权利要求8所述的方法,其特征在于,所述对各分支内部的推荐词进行排序包括:
计算各分支内部的推荐词的点击率和商业价值参数的乘积;
根据所述乘积对各分支内部的推荐词进行降序排列。
10.根据权利要求8所述的方法,其特征在于,所述对所述多分支的推荐词进行排序还包括:
针对所述推荐词排序队列内任意相邻的两个推荐词,将点击率及点击率与商业价值参数的乘积均高的推荐词前置。
11.一种推荐词获取装置,其特征在于,包括:
提取模块,用于对接收的请求进行预处理,提取出用户人群信息和页面上下文信息;
获取模块,用于获取与所述用户人群信息和页面上下文信息对应的多分支的推荐词。
12.根据权利要求11所述的装置,其特征在于,所述获取模块具体用于:
基于预先生成的机器翻译模型获取与页面上下文信息对应的推荐词;
基于协同过滤获取与用户人群信息对应的推荐词。
13.根据权利要求12所述的装置,其特征在于,还包括:
模型生成模块,用于收集历史数据,所述历史数据包括:历史检索词及其对应的历史目标词,所述历史目标词包括:历史展现广告所对应的商业词或者广告标题,所述历史展现广告是被所述历史检索词触发展现的;根据所述历史数据确定训练数据;对所述训练数据进行训练,生成所述机器翻译模型。
14.根据权利要求13所述的装置,其特征在于,所述模型生成模块具体用于:
将所述历史数据作为训练数据;或者,
在历史数据中,将选择率大于预设值的历史展现广告所对应的历史目标词及其对应的历史检索词作为训练数据。
15.根据权利要求11所述的装置,其特征在于,所述获取模块具体用于:
基于用户人群信息获取各个用户对应的词集合,所述词集合中的词包括:用户历史点击的广告所对应的商业词或广告标题,以及,用户的兴趣点;
基于各个用户对应的词集合确定各个用户的相似用户;
对应各个用户,将未在用户对应的词集合中且在用户的相似用户对应的词集合中的词,确定为所述用户的推荐词。
16.根据权利要求11所述的装置,其特征在于,还包括:
排序模块,用于对所述多分支的推荐词进行排序。
17.根据权利要求16所述的装置,其特征在于,还包括:
推送模块,用于在排序后的推荐词中按序选择预设个数的推荐词,并将所选择的推荐词推送给客户端,以供在客户端上展现所选择的推荐词。
18.根据权利要求16所述的装置,其特征在于,所述排序模块具体用于:
对各分支内部的推荐词进行排序,得到排序后的各分支;
将排序后的各分支拼接成推荐词排序队列。
19.根据权利要求18所述的装置,其特征在于,所述排序模块具体用于:
计算各分支内部的推荐词的点击率和商业价值参数的乘积;
根据所述乘积对各分支内部的推荐词进行降序排列。
20.根据权利要求18所述的装置,其特征在于,所述排序模块还用于:
针对所述推荐词排序队列内任意相邻的两个推荐词,将点击率及点击率与商业价值参数的乘积均高的推荐词前置。
21.一种设备,其特征在于,包括:
一个或多个处理器;
用于存储一个或多个程序的存储器;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-10任一项所述的方法。
22.一种非易失性计算机可读存储介质,其特征在于,当所述存储介质中的一个或多个程序由设备的一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-10任一项所述的方法。
CN201710035769.0A 2017-01-18 2017-01-18 推荐词获取方法和装置 Pending CN108319615A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710035769.0A CN108319615A (zh) 2017-01-18 2017-01-18 推荐词获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710035769.0A CN108319615A (zh) 2017-01-18 2017-01-18 推荐词获取方法和装置

Publications (1)

Publication Number Publication Date
CN108319615A true CN108319615A (zh) 2018-07-24

Family

ID=62892195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710035769.0A Pending CN108319615A (zh) 2017-01-18 2017-01-18 推荐词获取方法和装置

Country Status (1)

Country Link
CN (1) CN108319615A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543113A (zh) * 2018-12-21 2019-03-29 北京字节跳动网络技术有限公司 确定点击推荐词的方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878476A (zh) * 2007-06-22 2010-11-03 谷歌公司 用于查询扩展的机器翻译
CN103164521A (zh) * 2013-03-11 2013-06-19 亿赞普(北京)科技有限公司 一种基于用户浏览和搜索行为的关键词计算方法及装置
CN103455507A (zh) * 2012-05-31 2013-12-18 国际商业机器公司 搜索引擎推荐方法及装置
EP2680172A2 (en) * 2012-06-29 2014-01-01 Orange Other user content-based collaborative filtering
US20140006440A1 (en) * 2012-07-02 2014-01-02 Andrea G. FORTE Method and apparatus for searching for software applications
CN103955465A (zh) * 2014-03-28 2014-07-30 百度在线网络技术(北京)有限公司 一种用于生成推荐页面的方法和装置
CN104731837A (zh) * 2013-12-22 2015-06-24 祁勇 一种基于辅助关键词的广告投放方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878476A (zh) * 2007-06-22 2010-11-03 谷歌公司 用于查询扩展的机器翻译
CN103455507A (zh) * 2012-05-31 2013-12-18 国际商业机器公司 搜索引擎推荐方法及装置
EP2680172A2 (en) * 2012-06-29 2014-01-01 Orange Other user content-based collaborative filtering
US20140006440A1 (en) * 2012-07-02 2014-01-02 Andrea G. FORTE Method and apparatus for searching for software applications
CN103164521A (zh) * 2013-03-11 2013-06-19 亿赞普(北京)科技有限公司 一种基于用户浏览和搜索行为的关键词计算方法及装置
CN104731837A (zh) * 2013-12-22 2015-06-24 祁勇 一种基于辅助关键词的广告投放方法
CN103955465A (zh) * 2014-03-28 2014-07-30 百度在线网络技术(北京)有限公司 一种用于生成推荐页面的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543113A (zh) * 2018-12-21 2019-03-29 北京字节跳动网络技术有限公司 确定点击推荐词的方法、装置、存储介质及电子设备
CN109543113B (zh) * 2018-12-21 2022-02-01 北京字节跳动网络技术有限公司 确定点击推荐词的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN108694223B (zh) 一种用户画像库的构建方法及装置
CN103324665B (zh) 一种基于微博的热点信息提取的方法和装置
CN103458042A (zh) 一种微博广告用户检测方法
CN104469508A (zh) 基于弹幕信息内容进行视频定位的方法、服务器和系统
CN108921624B (zh) 广告融合方法、装置、存储介质和终端设备
CN104615608A (zh) 一种数据挖掘处理系统及方法
CN106096629B (zh) 一种基于用户间相似关系的广告点击率预测方法
CN106062743A (zh) 用于关键字建议的系统和方法
CN104077417A (zh) 社交网络中的人物标签推荐方法和系统
KR101559719B1 (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
KR20140119269A (ko) 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법
CN107104875B (zh) 信息推送的方法和装置
JP2016110213A (ja) 情報処理装置、情報処理システム、端末装置、情報処理方法、及び情報処理プログラム
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
Chowdhary et al. Fake review detection using classification
CN109558531A (zh) 新闻信息推送方法、装置以及计算机设备
CN109388693A (zh) 一种确定分区意图的方法以及相关设备
CN110297967B (zh) 兴趣点确定方法、装置、设备及计算机可读存储介质
CN108205545B (zh) 一种为用户提供推荐信息的方法与设备
CN111597446A (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
Nourbakhsh et al. Newsworthy rumor events: A case study of twitter
Aljwari et al. Multi-scale machine learning prediction of the spread of arabic online fake news
CN108319615A (zh) 推荐词获取方法和装置
KR101486924B1 (ko) 소셜 네트워크 서비스를 이용한 미디어 콘텐츠 추천 방법
CN105528456B (zh) 基于用户类型的搜索界面展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180724

RJ01 Rejection of invention patent application after publication