CN111768234A - 为用户生成推荐文案的方法及设备、电子设备和介质 - Google Patents
为用户生成推荐文案的方法及设备、电子设备和介质 Download PDFInfo
- Publication number
- CN111768234A CN111768234A CN202010601006.XA CN202010601006A CN111768234A CN 111768234 A CN111768234 A CN 111768234A CN 202010601006 A CN202010601006 A CN 202010601006A CN 111768234 A CN111768234 A CN 111768234A
- Authority
- CN
- China
- Prior art keywords
- keywords
- nodes
- user
- advertisement
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003936 working memory Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开提供一种为用户生成推荐文案的方法及设备、电子设备和介质,涉及自然语言处理、深度学习领域,其中,该方法包括:分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自用户点击的网页中显示的广告的内容;将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边分别表示由其连接的两个关键词之间的关联程度;以及据匹配到的关系链中的节点生成相应的推荐文案,并将文案与该广告一同显示。
Description
技术领域
本公开涉及自然语言处理、深度学习领域,特别涉及为用户生成推荐文案的方法及设备、电子设备和介质。
背景技术
在百度知道、百度经验等网页中,用户的检索意图多样,而商业广告展现原理对用户不透明、与用户关联不清晰,从而造成用户疑惑、降低点击欲,不利商业变现系统效果最大化。现有技术和产品思路忽视内容页蕴含的业务关键点以及对应的用户延伸意图,只单方面表达广告本身信息。只表达广告本身信息,没有表征场景蕴含意图的业务关键点,更没有挖掘延伸需求,对用户而言广告展现逻辑不易理解,不利变现效率。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一个方面,提供了一种基于广告场景为用户生成推荐文案的方法,包括:分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自用户点击的网页中显示的广告的内容;将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,该关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边表示由其连接的两个关键词之间的关联程度;以及根据匹配到的关系链中的节点生成相应的推荐文案,并将文案与广告一同显示。
根据本公开的另一个方面,提供了一种基于广告场景为用户生成推荐文案的设备,包括:获取单元,被配置为分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自用户点击的网页中显示的广告的内容;匹配单元,将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,该关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边分别表示由其连接的两个关键词之间的关联程度;以及生成单元,被配置为根据匹配到的关系链中的节点生成相应的推荐文案,并将文案与广告一同显示。
根据本公开的另一个方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,该程序包括指令,该指令在由处理器执行时使处理器执行本公开所述的构建方法。
根据本公开的另一个方面,提供了一种存储程序的计算机可读存储介质,该程序包括指令,该指令在由电子设备的处理器执行时,致使电子设备执行本公开所述的构建方法。
根据本公开的一个方面,一种基于广告场景为用户生成推荐文案的方法能够理解场景蕴含的业务意图点,将用户意图与广告业务点结合,降低用户面对广告时的困惑,增强广告的可解释性,提升点击率和用户体验,进而提高系统的变现效率。
根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1是示出示例性实施例的基于广告场景为用户生成推荐文案的方法的流程图;
图2是示出示例性实施例的建立关系链图谱的方法流程图;
图3是示出示例性实施例的历史搜索日志中记录的部分示意图;
图4是示出示例性实施例的根据图2方法所建立的关系链图谱的部分示意图;
图5是示出示例性实施例的根据图1方法将推荐文案与广告一同显示的示意图;
图6是示出示例性实施例的基于广告场景为用户生成推荐文案的设备的示意性组成框图;以及
图7是示出能够应用于示例性实施例的示例性计算设备的结构框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
在例如百度知道、百度经验的网页中,该网页根据用户输入的检索词以及用户的点击选择进行显示。在该网页中,通常在例如右侧边栏或底部边栏的边栏上显示有推广的商业广告。但是,该商业广告展现原理对用户不透明、与用户关联不清晰,用户不清楚该广告是根据哪些内容或元素进行显示的,自然也就会造成用户疑惑、降低点击欲,不利商业变现系统效果最大化。本公开将通过提取用户侧和广告侧的关键词并计算该关键词之间的相似度,从而返回广告与用户意图的匹配性及潜在意图的延伸满足性,提升广告点击率。
图1是示出示例性实施例的基于广告场景为用户生成推荐文案的方法的流程图。如图1所示,方法100包括:分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自所述用户点击的网页中显示的广告的内容(步骤110);将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边分别表示由其连接的两个关键词之间的关联程度(步骤120);以及根据匹配到的关系链中的节点生成相应的推荐文案,并将文案与广告一同显示(步骤130)。
在步骤110中,分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自所述用户点击的网页中显示的广告的内容。
根据一些实施例,分别获取用户侧的关键词和广告侧的关键词包括:用户侧和广告侧中的短文本通过多标签预测算法获取关键词;以及用户侧和广告侧中的长文本通过核心词提取算法获取关键词。
根据一些实施例,用户输入的检索词、该用户点击的网页中的内容标题部分、以及用户点击的网页中显示的广告的内容标题部分一般为短文本,该部分内容默认为短文本,通过多标签预测算法获取关键词;而该用户点击的网页中的内容正文部分以及用户点击的网页中显示的广告的内容正文部分一般为长文本,该部分内容默认为长文本,通过核心词提取算法获取关键词。
根据一些实施例,用户输入的检索词默认为短文本,通过多标签预测算法获取关键词;而该用户点击的网页中的内容以及用户点击的网页中显示的广告的内容均默认为长文本,通过核心词提取算法获取关键词。
根据一些实施例,分别获取用户侧的关键词和广告侧的关键词包括:将获取的关键词与相关敏感词汇表进行匹配,以过滤掉匹配到的相关敏感词汇。
根据一些实施例,敏感词一般是指带有敏感政治倾向、暴力倾向、不健康色彩的词或不文明语。也可以根据网站自身实际情况,设定一些只适用于本网站的特殊敏感词,例如很多电子商务网站会将一些涉及侵犯知识产权,不宜销售的商品,例如“山寨”、“水货”、“盗版”、“刻录”等设置为敏感词。
根据一些实施例,设置敏感词词汇表,通过循环过程,依次将获取的关键词与敏感词列表进行匹配,以查找相匹配的关键词,如果找到则删除该关键词,最终得到过滤后的关键词。
在步骤120中,将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边分别表示由其连接的两个关键词之间的关联程度。
根据一些实施例,在执行该方法步骤之前,建立关系链图谱。图2是示出示例性实施例的建立关系链图谱的方法流程图。如图2所示,建立关系链图谱包括:获取历史搜索日志,统计该日志中记录的第一预定时间段内的相同的检索词和网页一同出现时的点击次数、以及相同的网页和广告一同出现时的点击次数(步骤210);分别获取每一个检索词、网页的内容以及广告的内容的关键词(步骤220);统计作为一同出现的关键词对的点击次数和,并记录该关键词对和该点击次数和作为初始统计数据(步骤230);以及将其点击次数和大于第一阈值的关键词对作为两端的节点、该点击次数和作为该节点之间的边的权重建立关系链图谱,其中权重表示边连接的节点之间的关联程度(步骤240)。
根据一些实施例,图3是示出示例性实施例的历史搜索日志中记录的部分示意图。如图3所示,该日志中显示的第一列表示时间信息;第二列表示第一检索信息;第三列为根据第二列中的第一检索信息所获得的第二检索信息;第四列表示由第一检索信息获取到第二检索信息后,用户是否点击了该第二检索信息,其中,“1”表示已点击,“0”表示未点击,当然,应当理解,其他表示形式也是可能的,并不限制于此。通过遍历该历史搜索日志第一预定时间段内(例如近半年内)记录的数据,统计该日志中记录的该时间段内的相同的检索词和网页一同出现时的该网页被点击的次数、以及相同的网页和广告一同出现时的该广告被点击的次数。即,如图3所示,根据时间信息从上到下依次遍历,即统计第二列为检索词1第三列为网页1时,第四列出现1的次数(所有的检索词1和网页1在一行中出现时累计的点击次数);第二列为检索词1第三列为网页2时,第四列出现1的次数;第二列为检索词1第三列为网页3时,第四列出现1的次数…第二列为网页1第三列为广告1时,第四列出现1的次数;以及第二列为网页2第三列为广告2时,第四列出现1的次数。然后,分别获取每一个检索词、网页的内容以及广告的内容的关键词,并统计作为一同出现的关键词对的点击次数和,并记录该关键词对和该点击次数和作为初始统计数据。例如,如上所述,统计出第二列为检索词1第三列为网页1时总共点击次数为2,并对检索词1提取关键词得到一个关键词:关键词1,对网页1提取关键词1得到一个关键词:关键词2,因此,关键词1和关键词2组成一个关键词对,其点击次数和即为2。当然,对检索词1和网页1提取关键词可能各自提取出多个关键词,则将检索词的多个关键词与网页的多个关键词一一组成关键词对即可。根据一些实施例,例如,获得检索词1的2个关键词和网页1的3个关键词,则可以组成6个关键词对,每一个关键词对均对应相同的该点击次数和。
根据一些实施例,将统计的所有的关键词对基于其点击次数和进行过滤,过滤掉其点击次数和小于第一阈值(例如:5)的那些关键词对,即只有满足一定相关性的关键词对才会用于生成该关系链图谱的节点,该过程保证了关系链图谱中的有边连接的节点之间满足一定的相关性条件。
根据一些实施例,建立所述关系链图谱还包括:每隔第二预定时间段统计所述日志中所述时间段内的相同的所述检索词和所述网页一同出现时的点击次数、以及相同的所述网页和所述广告一同出现时的点击次数;分别获取每一个检索词、网页的内容以及广告的内容的关键词;统计作为一同出现的关键词对的点击次数和并将该关键词对和该点击次数和累加到初始统计数据中以更新该初始统计数据;使用更新后的初始统计数据更新关系链图谱的节点和边的权重。
根据一些实施例,该第二预定时间段例如可以为一周或一个月,在此不做限制。
根据一些实施例,将所述获取的关键词与关系链图谱中的节点相匹配、以获取匹配到的至少包括一条边的关系链包括:将获取的用户侧的关键词和广告侧的关键词通过文本完全匹配方式与关系链图谱中的节点进行匹配以获取匹配的关系链;将该关系链中的权重最小的边所对应的权重作为该关系链的权重;过滤所获取的关系链中的其权重小于第二阈值的关系链。
根据一些实施例,该第二阈值大于第一阈值。由于最后要生成的文案需体现广告与用户意图的匹配性,因此用于生成文案的用户侧关键词和广告侧关键词之间需具有较高的相关性。该过程进一步过滤掉了相关性不高的关系链,只有满足该第二阈值条件(例如:10)才会用于生成文案;如果所有匹配的关系链的权重均小于该第二阈值,则不生成与该广告一同显示的文案。
根据一些实施例,基于最短路径算法将获取的关键词通过文本完全匹配方式与关系链图谱中的节点进行匹配以获取匹配的关系链。
在步骤130中,根据匹配到的关系链中的节点生成相应的推荐文案,并将文案与广告一同显示。
根据一些实施例,根据所述匹配到的关系链中的节点生成相应的推荐文案包括:选择匹配到的关系链中权重最大的关系链,将该关系链中的节点输入文案生成模型中以生成相应的推荐文案。
根据一些实施例,将匹配到的所有关系链均用于根据其节点生成相应的推荐文案,再通过优选模型(例如DNN点击率预估模型)选择出最佳的一条文案进行展现。
根据一些实施例,将该关系链中的两端的节点输入文案生成模型中以生成相应的推荐文案。
根据一些实施例,将该关系链中的所有节点均输入文案生成模型中以生成相应的推荐文案。
根据一些实施例,还包括对所述文案生成模型进行训练,以通过所述训练后的文案生成模型生成相应的推荐文案,其中,训练所述文案生成模型包括:构建包含多个关键词对及其对应的文案的训练样本,其中文案为基于所述关键词对撰写的推荐文案;以及通过所述训练样本对所述文案生成模型进行训练。
根据一些实施例,构建多个特征,该特征即为一个或多个关键词组成的词组,例如其中一个特征可以表示为:(v1,v2)=(suv,怀孕);构建标签,该标签为基于相应的特征由人工或机器撰写的推荐理由文案,例如根据(suv,怀孕)特征撰写的推荐理由文案可以为:rec_reason=“有孩子的家庭都在关注这个suv”。将构建的所有特征以及其对应的标签组成训练样本形式,例如:[(v1,v2),rec_reason],根据该训练样本对文案生成模型进行训练,以通过训练后的模型根据匹配的关键词生成相应的推荐文案。
根据一些实施例,所述文案体现所述关键词对中的每一个关键词的信息。
根据一些实施例,例如在图4所示的关系链图谱中最终匹配出权重最高的关系链为怀孕到SUV的关系链,其中w表示权重,将该关系链中的两端节点输入到文案生成模型中生成的文案可以为:有孩子的家庭都在关注这个suv。最后,将该生成的文案作为广告元素渲染展现,如图5所示。“有孩子的家庭都在关注这个suv”的文案既体现了“怀孕”关键词信息,也体现了“SUV”关键词信息。当然,该文案中也可以包含该输入的关键词,只要其能够体现每一个关键词的信息即可。
根据一些实施例,所述文案生成模型包括Seq2Seq模型。Seq2Seq模型是一种循环神经网络的变种,包括编码器(Encoder)和解码器(Decoder)两部分。Seq2Seq模型是自然语言处理中的一种重要模型,该模型可以将理解输入的文本序列的整个语义,然后输出翻译结果作为另一个序列。在该模型架构中,一组固定词汇从一种源语言翻译成目标语言。
本公开针对于自然网页中的广告,重视用户意图的多样性,理解广告场景蕴含的业务意图点,将网用户意图与广告业务点结合,降低用户面对广告时的困惑,增强了广告的可解释性,因此能够提升广告点击率和用户体验,进而提高系统的变现效率。
根据本公开的另一方面,如图6所示,还提供一种基于广告场景为用户生成推荐文案的设备,包括:获取单元610,被配置为分别获取用户侧的关键词和广告侧的关键词,其中用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,广告侧的关键词取自所述用户点击的网页中显示的广告的内容;匹配单元620,将获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,关系链图谱包括节点和连接节点的边,其中,节点对应于从历史搜索记录中提取的关键词,边分别表示由其连接的两个关键词之间的关联程度;以及生成单元630,被配置为根据匹配到的关系链中的节点生成相应的推荐文案,并将文案与广告一同显示。
这里,构建设备600的上述各单元610~630的操作分别与前面描述的步骤110~130的操作类似,在此不再赘述。
根据本公开的另一方面,还提供一种电子设备,可以包括:处理器;以及存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述的基于广告场景为用户生成推荐文案的方法。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据上述的基于广告场景为用户生成推荐文案的方法。
参见图6所示,现将描述计算设备2000,其是可以应用于本公开的各方面的硬件设备(电子设备)的示例。计算设备2000可以是被配置为执行处理和/或计算的任何机器,可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、机器人、智能电话、车载计算机或其任何组合。上述基于广告场景为用户生成推荐文案的方法可以全部或至少部分地由计算设备2000或类似设备或系统实现。
计算设备2000可以包括(可能经由一个或多个接口)与总线2002连接或与总线2002通信的元件。例如,计算设备2000可以包括总线2002、一个或多个处理器2004、一个或多个输入设备2006以及一个或多个输出设备2008。一个或多个处理器2004可以是任何类型的处理器,并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(例如特殊处理芯片)。输入设备2006可以是能向计算设备2000输入信息的任何类型的设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或遥控器。输出设备2008可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。计算设备2000还可以包括非暂时性存储设备2010或者与非暂时性存储设备2010连接,非暂时性存储设备可以是非暂时性的并且可以实现数据存储的任何存储设备,并且可以包括但不限于磁盘驱动器、光学存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁介质,光盘或任何其他光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓冲存储器和/或任何其他存储器芯片或盒、和/或计算机可从其读取数据、指令和/或代码的任何其他介质。非暂时性存储设备2010可以从接口拆卸。非暂时性存储设备2010可以具有用于实现上述方法和步骤的数据/程序(包括指令)/代码。计算设备2000还可以包括通信设备2012。通信设备2012可以是使得能够与外部设备和/或与网络通信的任何类型的设备或系统,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信设备和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算设备2000还可以包括工作存储器2014,其可以是可以存储对处理器2004的工作有用的程序(包括指令)和/或数据的任何类型的工作存储器,并且可以包括但不限于随机存取存储器和/或只读存储器设备。
软件要素(程序)可以位于工作存储器2014中,包括但不限于操作系统2016、一个或多个应用程序2018、驱动程序和/或其他数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序2018中,并且上述基于广告场景为用户生成推荐文案的方法可以通过由处理器2004读取和执行一个或多个应用程序2018的指令来实现。更具体地,上述基于广告场景为用户生成推荐文案的方法中,步骤110~步骤130可以例如通过处理器2004执行具有步骤110~步骤130的指令的应用程序2018而实现。此外,上述基于广告场景为用户生成推荐文案的方法中的其它步骤可以例如通过处理器2004执行具有执行相应步骤中的指令的应用程序2018而实现。软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如上述存储设备2010)中,并且在执行时可以被存入工作存储器2014中(可能被编译和/或安装)。软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现特定元件。例如,所公开的方法和设备中的一些或全部可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
还应该理解,前述方法可以通过服务器-客户端模式来实现。例如,客户端可以接收用户输入的数据并将所述数据发送到服务器。客户端也可以接收用户输入的数据,进行前述方法中的一部分处理,并将处理所得到的数据发送到服务器。服务器可以接收来自客户端的数据,并且执行前述方法或前述方法中的另一部分,并将执行结果返回给客户端。客户端可以从服务器接收到方法的执行结果,并例如可以通过输出设备呈现给用户。
还应该理解,计算设备2000的组件可以分布在网络上。例如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器的另一个处理器执行其他处理。计算系统2000的其他组件也可以类似地分布。这样,计算设备2000可以被解释为在多个位置执行处理的分布式计算系统。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (15)
1.一种基于广告场景为用户生成推荐文案的方法,其中,所述方法包括:
分别获取用户侧的关键词和广告侧的关键词,其中所述用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,所述广告侧的关键词取自所述用户点击的网页中显示的广告的内容;
将所述获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,所述关系链图谱包括节点和连接节点的边,其中,所述节点对应于从历史搜索记录中提取的关键词,所述边表示由其连接的两个关键词之间的关联程度;以及,
据所述匹配到的关系链中的节点生成相应的推荐文案,并将所述文案与所述广告一同显示。
2.如权利要求1所述的方法,其中,所述方法还包括建立所述关系链图谱,其中,建立所述关系链图谱包括:
获取所述历史搜索日志,统计所述日志中记录的第一预定时间段内的相同的所述检索词和所述网页一同出现时的点击次数、以及相同的所述网页和所述广告一同出现时的点击次数;
分别获取每一个所述检索词、网页的内容以及广告的内容的关键词;
统计作为一同出现的关键词对的点击次数和,并记录所述关键词对和所述点击次数和作为初始统计数据;以及,
将其点击次数和大于第一阈值的关键词对作为两端的节点、所述点击次数和作为所述节点之间的边的权重建立关系链图谱,其中所述权重表示所述边连接的所述节点之间的关联程度。
3.如权利要求2所述的方法,其中,所述建立所述关系链图谱还包括:
每隔第二预定时间段统计所述日志中所述时间段内的相同的所述检索词和所述网页一同出现时的点击次数、以及相同的所述网页和所述广告一同出现时的点击次数;
分别获取每一个所述检索词、所述网页的内容以及所述广告的内容的关键词;
统计作为一同出现的关键词对的点击次数和并将所述关键词对和所述点击次数和累加到所述初始统计数据中以更新所述初始统计数据;
使用更新后的所述初始统计数据更新所述关系链图谱的节点和边的权重。
4.如权利要求2或3所述的方法,其中,将所述获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链包括:
将所述获取的用户侧的关键词和广告侧的关键词通过文本完全匹配方式与所述关系链图谱中的节点进行匹配以获取匹配的关系链;
将所述关系链中的权重最小的边所对应的权重作为所述关系链的权重;
过滤所获取的关系链中的其权重小于第二阈值的关系链。
5.如权利要求4所述的方法,其中,基于最短路径算法将所述获取的关键词通过文本完全匹配方式与所述关系链图谱中的节点进行匹配以获取匹配的关系链。
6.如权利要求4所述的方法,其中,根据所述匹配到的关系链中的节点生成相应的推荐文案包括:
选择所述匹配到的关系链中权重最大的关系链,将所述关系链中的节点输入文案生成模型中以生成相应的推荐文案。
7.如权利要求6所述的方法,其中,将所述关系链中的两端的节点输入文案生成模型中以生成相应的推荐文案。
8.如权利要求6所述的方法,其中,所述方法还包括对所述文案生成模型进行训练,以通过所述训练后的文案生成模型生成相应的推荐文案,其中,训练所述文案生成模型包括:
构建包含多个关键词对及其对应的文案的训练样本,其中所述文案为基于所述关键词对撰写的推荐文案;以及
通过所述训练样本对所述文案生成模型进行训练。
9.如权利要求8所述的方法,其中,所述文案体现所述关键词对中的每一个关键词的信息。
10.如权利要求8所述的方法,其中,所述文案生成模型包括Seq2Seq模型。
11.如权利要求1所述的方法,其中,分别获取用户侧的关键词和广告侧的关键词包括:
所述用户侧和广告侧中的短文本通过多标签预测算法获取关键词;以及,
所述用户侧和广告侧中的长文本通过核心词提取算法获取关键词。
12.如权利要求1所述的方法,其中,分别获取用户侧的关键词和广告侧的关键词包括:
将所述获取的关键词与相关敏感词汇表进行匹配,以过滤掉匹配到的相关敏感词汇。
13.一种基于广告场景为用户生成推荐文案的设备,其中,所述设备包括:
获取单元,被配置为分别获取用户侧的关键词和广告侧的关键词,其中所述用户侧的关键词取自用户输入的检索词和用户点击的网页中的内容,所述广告侧的关键词取自所述用户点击的网页中显示的广告的内容;
匹配单元,将所述获取的关键词与关系链图谱中的节点相匹配,以获取匹配到的至少包括一条边的关系链,所述关系链图谱包括节点和连接节点的边,其中,所述节点对应于从历史搜索记录中提取的关键词,所述边分别表示由其连接的两个关键词之间的关联程度;以及,
生成单元,被配置为根据所述匹配到的关系链中的节点生成相应的推荐文案,并将所述文案与所述广告一同显示。
14.一种电子设备,包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-12中任一项所述的构建方法。
15.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由电子设备的处理器执行时,致使所述电子设备执行根据权利要求1-12中任一项所述的构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601006.XA CN111768234B (zh) | 2020-06-28 | 2020-06-28 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010601006.XA CN111768234B (zh) | 2020-06-28 | 2020-06-28 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111768234A true CN111768234A (zh) | 2020-10-13 |
CN111768234B CN111768234B (zh) | 2023-12-19 |
Family
ID=72722355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010601006.XA Active CN111768234B (zh) | 2020-06-28 | 2020-06-28 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111768234B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112487151A (zh) * | 2020-12-14 | 2021-03-12 | 深圳市欢太科技有限公司 | 文案生成方法及装置、存储介质与电子设备 |
CN113177160A (zh) * | 2021-05-25 | 2021-07-27 | 上海众源网络有限公司 | 一种推送文案生成方法、装置、电子设备及存储介质 |
CN113254824A (zh) * | 2021-05-14 | 2021-08-13 | 北京百度网讯科技有限公司 | 内容确定方法、设备、介质及程序产品 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080256034A1 (en) * | 2007-04-10 | 2008-10-16 | Chi-Chao Chang | System and method for understanding relationships between keywords and advertisements |
WO2008137590A2 (en) * | 2007-05-01 | 2008-11-13 | Google Inc. | Keyword and user association |
US20090174667A1 (en) * | 2008-01-09 | 2009-07-09 | Kenneth Kocienda | Method, Device, and Graphical User Interface Providing Word Recommendations for Text Input |
CN103365876A (zh) * | 2012-03-29 | 2013-10-23 | 北京百度网讯科技有限公司 | 基于关系图谱生成网络操作辅助信息的方法与设备 |
US20160162502A1 (en) * | 2014-12-05 | 2016-06-09 | Facebook, Inc. | Suggested Keywords for Searching Content on Online Social Networks |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN108121712A (zh) * | 2016-11-28 | 2018-06-05 | 北京国双科技有限公司 | 一种关键词存储方法及装置 |
US20180316635A1 (en) * | 2017-04-26 | 2018-11-01 | International Business Machines Corporation | Recommendation generator responsive to messaging content |
WO2018204763A2 (en) * | 2017-05-05 | 2018-11-08 | Orig3N, Inc. | Systems and methods for generating genetic profile test and related purchase recommendations via an artificial intelligence-enhanced chatbot |
CN109299379A (zh) * | 2018-10-30 | 2019-02-01 | 东软集团股份有限公司 | 文章推荐方法、装置、存储介质和电子设备 |
CN109508391A (zh) * | 2018-12-28 | 2019-03-22 | 北京金山安全软件有限公司 | 基于知识图谱的输入预测方法、装置和电子设备 |
CN110033851A (zh) * | 2019-04-02 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、存储介质及服务器 |
CN110188186A (zh) * | 2019-04-24 | 2019-08-30 | 平安科技(深圳)有限公司 | 医疗领域的内容推荐方法、电子装置、设备及存储介质 |
CN110597987A (zh) * | 2019-08-21 | 2019-12-20 | 微梦创科网络科技(中国)有限公司 | 一种搜索推荐方法及装置 |
CN110795627A (zh) * | 2019-10-28 | 2020-02-14 | 苏州跃盟信息科技有限公司 | 信息推荐方法及装置、电子设备 |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
JP2020098596A (ja) * | 2018-12-18 | 2020-06-25 | 富士通株式会社 | ウェブページから情報を抽出する方法、装置及び記憶媒体 |
-
2020
- 2020-06-28 CN CN202010601006.XA patent/CN111768234B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080256034A1 (en) * | 2007-04-10 | 2008-10-16 | Chi-Chao Chang | System and method for understanding relationships between keywords and advertisements |
WO2008137590A2 (en) * | 2007-05-01 | 2008-11-13 | Google Inc. | Keyword and user association |
US20090174667A1 (en) * | 2008-01-09 | 2009-07-09 | Kenneth Kocienda | Method, Device, and Graphical User Interface Providing Word Recommendations for Text Input |
CN103365876A (zh) * | 2012-03-29 | 2013-10-23 | 北京百度网讯科技有限公司 | 基于关系图谱生成网络操作辅助信息的方法与设备 |
US20160162502A1 (en) * | 2014-12-05 | 2016-06-09 | Facebook, Inc. | Suggested Keywords for Searching Content on Online Social Networks |
CN108121712A (zh) * | 2016-11-28 | 2018-06-05 | 北京国双科技有限公司 | 一种关键词存储方法及装置 |
US20180316635A1 (en) * | 2017-04-26 | 2018-11-01 | International Business Machines Corporation | Recommendation generator responsive to messaging content |
WO2018204763A2 (en) * | 2017-05-05 | 2018-11-08 | Orig3N, Inc. | Systems and methods for generating genetic profile test and related purchase recommendations via an artificial intelligence-enhanced chatbot |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN109299379A (zh) * | 2018-10-30 | 2019-02-01 | 东软集团股份有限公司 | 文章推荐方法、装置、存储介质和电子设备 |
JP2020098596A (ja) * | 2018-12-18 | 2020-06-25 | 富士通株式会社 | ウェブページから情報を抽出する方法、装置及び記憶媒体 |
CN109508391A (zh) * | 2018-12-28 | 2019-03-22 | 北京金山安全软件有限公司 | 基于知识图谱的输入预测方法、装置和电子设备 |
CN110033851A (zh) * | 2019-04-02 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、存储介质及服务器 |
CN110188186A (zh) * | 2019-04-24 | 2019-08-30 | 平安科技(深圳)有限公司 | 医疗领域的内容推荐方法、电子装置、设备及存储介质 |
CN110597987A (zh) * | 2019-08-21 | 2019-12-20 | 微梦创科网络科技(中国)有限公司 | 一种搜索推荐方法及装置 |
CN110795627A (zh) * | 2019-10-28 | 2020-02-14 | 苏州跃盟信息科技有限公司 | 信息推荐方法及装置、电子设备 |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112487151A (zh) * | 2020-12-14 | 2021-03-12 | 深圳市欢太科技有限公司 | 文案生成方法及装置、存储介质与电子设备 |
CN113254824A (zh) * | 2021-05-14 | 2021-08-13 | 北京百度网讯科技有限公司 | 内容确定方法、设备、介质及程序产品 |
CN113254824B (zh) * | 2021-05-14 | 2024-04-19 | 北京百度网讯科技有限公司 | 内容确定方法、设备、介质及程序产品 |
CN113177160A (zh) * | 2021-05-25 | 2021-07-27 | 上海众源网络有限公司 | 一种推送文案生成方法、装置、电子设备及存储介质 |
CN113177160B (zh) * | 2021-05-25 | 2024-04-23 | 上海众源网络有限公司 | 一种推送文案生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111768234B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509465B (zh) | 一种视频数据的推荐方法、装置和服务器 | |
CN107992531B (zh) | 基于深度学习的新闻个性化智能推荐方法与系统 | |
US20190287142A1 (en) | Method, apparatus for evaluating review, device and storage medium | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
Shankar et al. | An overview and empirical comparison of natural language processing (NLP) models and an introduction to and empirical application of autoencoder models in marketing | |
CN111768234B (zh) | 为用户生成推荐文案的方法及设备、电子设备和介质 | |
Khusro et al. | On methods and tools of table detection, extraction and annotation in PDF documents | |
US20170147544A1 (en) | Multimedia Document Summarization | |
CN110325986A (zh) | 文章处理方法、装置、服务器及存储介质 | |
US20160085745A1 (en) | Perspective data analysis and management | |
US20210103622A1 (en) | Information search method, device, apparatus and computer-readable medium | |
Arumugam et al. | Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications | |
Ranjan et al. | Comparative sentiment analysis of app reviews | |
Krstajić et al. | Story tracker: Incremental visual text analytics of news story development | |
WO2023108993A1 (zh) | 基于深度聚类算法的产品推荐方法、装置、设备及介质 | |
CN113778295A (zh) | 一种书籍推荐方法、装置、计算机设备及存储介质 | |
CN114443847A (zh) | 文本分类、文本处理方法、装置、计算机设备及存储介质 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN114222000B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN105117482A (zh) | 一种实现网站导航的方法和装置 | |
JP6868576B2 (ja) | 事象提示システムおよび事象提示装置 | |
CN114064894A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
US20160085843A1 (en) | Perspective data analysis and management | |
CN109190095B (zh) | 一种文章的生成方法及装置 | |
Mengle et al. | Mastering machine learning on Aws: advanced machine learning in Python using SageMaker, Apache Spark, and TensorFlow |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |