CN117522479A - 互联网广告精准投放方法及系统 - Google Patents

互联网广告精准投放方法及系统 Download PDF

Info

Publication number
CN117522479A
CN117522479A CN202311473736.6A CN202311473736A CN117522479A CN 117522479 A CN117522479 A CN 117522479A CN 202311473736 A CN202311473736 A CN 202311473736A CN 117522479 A CN117522479 A CN 117522479A
Authority
CN
China
Prior art keywords
internet advertisement
sequence
user
internet
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311473736.6A
Other languages
English (en)
Inventor
秦令今
裴潇
张国显
湛扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Chuangxinhe Technology Co ltd
Original Assignee
Beijing Chuangxinhe Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chuangxinhe Technology Co ltd filed Critical Beijing Chuangxinhe Technology Co ltd
Priority to CN202311473736.6A priority Critical patent/CN117522479A/zh
Publication of CN117522479A publication Critical patent/CN117522479A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种互联网广告精准投放方法及系统,涉及广告投放领域,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。

Description

互联网广告精准投放方法及系统
技术领域
本申请涉及广告投放领域,且更为具体地,涉及一种互联网广告精准投放方法及系统。
背景技术
互联网广告投放是一种通过互联网渠道向用户展示广告的方式。传统的互联网广告投放通常采用基于内容的广告投放方式,即根据网页或应用程序的内容将广告展示给用户。但是,基于内容的广告投放主要依赖于网页或应用程序的内容来确定广告的展示对象,而忽略了用户的个体特征和兴趣偏好,导致广告投放的精准度不高,往往无法准确匹配用户的需求和偏好,从而影响广告的效果和用户的体验。并且,由于传统的广告投放缺乏精准性,很多广告被展示给了不感兴趣或不相关的用户,导致广告资源的浪费。同时,频繁的广告干扰也会对用户造成困扰,降低用户对广告的接受度,且降低了广告的转化率和效果。
因此,期望一种优化的互联网广告精准投放方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种互联网广告精准投放方法及系统,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
根据本申请的一个方面,提供了一种互联网广告精准投放方法,其包括:
收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
获取待推送互联网广告的文本描述;
对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
根据本申请的另一个方面,提供了一种互联网广告精准投放系统,其包括:
信息采集模块,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
用户画像生成模块,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
用户画像属性语义理解模块,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
文本描述获取模块,用于获取待推送互联网广告的文本描述;
互联网广告语义理解模块,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
语义特征交互融合模块,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
结果生成模块,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
与现有技术相比,本申请提供的一种互联网广告精准投放方法及系统,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的互联网广告精准投放方法的流程图;
图2为根据本申请实施例的互联网广告精准投放方法的系统架构图;
图3为根据本申请实施例的互联网广告精准投放方法的训练阶段的流程图;
图4为根据本申请实施例的互联网广告精准投放方法的子步骤S7的流程图;
图5为根据本申请实施例的互联网广告精准投放系统的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
传统的广告投放缺乏精准性,很多广告被展示给了不感兴趣或不相关的用户,导致广告资源的浪费。同时,频繁的广告干扰也会对用户造成困扰,降低用户对广告的接受度,且降低了广告的转化率和效果。因此,期望一种优化的互联网广告精准投放方案。
在本申请的技术方案中,提出了一种互联网广告精准投放方法。图1为根据本申请实施例的互联网广告精准投放方法的流程图。图2为根据本申请实施例的互联网广告精准投放方法的系统架构图。如图1和图2所示,根据本申请的实施例的互联网广告精准投放方法,包括步骤:S1,收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;S2,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;S3,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;S4,获取待推送互联网广告的文本描述;S5,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;S6,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及,S7,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
特别地,所述S1,收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息。其中,所述行为数据包括浏览网页、搜索关键词、点击链接和购买商品等,所述基本信息包括年龄、性别、职业和收入等。
特别地,所述S2,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像。也就是,在得到所述被分析用户的行为数据和基本信息后,对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像,其中,所述用户画像包括用户的兴趣、需求、偏好等特征描述,以便于后续更为精准地为用户进行广告投放。
特别地,所述S3,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列。考虑到用户画像通常包括多个属性项,例如用户的兴趣、需求、偏好等数据信息,这些属性项之间具有着语义关联关系,共同对于用户的兴趣、需求和偏好的语义理解和特征刻画产生影响。因此,为了能够为被分析用户投放适配其个性化的广告,在本申请的技术方案中,进一步将所述用户画像中的各个属性项输入包含词嵌入层的第一上下文编码器以得到用户画像属性项语义特征向量的序列。具体地,对所述用户画像中的各个属性项进行分词处理以将所述用户画像中的各个属性项转化为由多个词组成的词序列;使用所述包含词嵌入层的第一上下文编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;使用所述包含词嵌入层的第一上下文编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及,将所述多个全局上下文语义特征向量进行级联以得到所述用户画像属性项语义特征向量的序列。
值得注意的是,上下文编码器是指一种深度神经网络模型,用于将输入序列中的上下文信息编码为一个固定维度的向量表示。它在自然语言处理和序列建模任务中广泛应用。上下文编码器的目标是捕捉输入序列中的语义和语法信息,以便后续的任务可以更好地理解和处理输入。它通常由循环神经网络(如长短时记忆网络LSTM或门控循环单元GRU)或者是自注意力机制(如Transformer)等模型组成。
特别地,所述S4和所述S5,获取待推送互联网广告的文本描述;以及,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列。也就是,获取待推送互联网广告的文本描述,并将所述待推送互联网广告的文本描述通过包含词嵌入层的第二上下文编码器中进行编码,以提取出所述待推送互联网广告的文本描述的语义理解特征信息,从而得到互联网广告描述词特征向量的序列。具体的,对所述待推送互联网广告的文本描述进行分词处理以将所述待推送互联网广告的文本描述转化为由多个词组成的词序列;使用所述包含词嵌入层的第二上下文编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;使用所述包含词嵌入层的第二上下文编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及,将所述多个全局上下文语义特征向量进行级联以得到所述互联网广告描述词特征向量的序列。
特别地,所述S6,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征。考虑到所述用户画像的各属性项语义特征和所述广告文本描述词语义特征之间具有着隐含的关联关系,这种关联关系对于广告和用户之间的适配度评估和精准投放具有重要作用。因此,为了将广告和用户的信息进行交互,从而获取更丰富的特征表示,在本申请的技术方案中,进一步将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量。应可以理解,在互联网广告投放中,广告的描述词特征可以提供广告的文本语义信息,而用户画像属性项语义特征可以提供用户的个体特征和兴趣偏好,通过将这两者进行交互融合,可以获得更全面、更准确的特征表示,从而更好地理解广告和用户之间的关系。特别地,所述注意力交互融合模块可以通过计算所述各个互联网广告描述词特征向量和所述各个用户画像属性项语义特征向量之间的注意力权重,将两者进行加权交互融合。这样的融合方式可以使得模型更加关注广告和用户之间的相关性,强化相关特征的表示,减弱无关特征的影响,为后续的广告和用户的适配度分析和广告投放决策提供更准确的依据。具体地,首先,计算所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列中任意两个特征向量之间的相关度以得到互联网广告-用户画像语义关联特征矩阵的序列;基于所述互联网广告-用户画像语义关联特征矩阵的序列,对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互注意力编码以得到注意力增强互联网广告描述词特征向量的序列和注意力增强用户画像属性项语义特征向量的序列;接着,融合所述互联网广告描述词特征向量的序列和所述注意力增强互联网广告描述词特征向量的序列中相应位置的特征向量以得到互联网广告描述词融合语义特征向量的序列,并融合所述用户画像属性项语义特征向量的序列和所述注意力增强用户画像属性项语义特征向量中相应位置的特征向量以得到用户画像属性项融合语义特征向量的序列;然后,对所述互联网广告描述词融合语义特征向量的序列进行最大值池化处理以得到互联网广告描述词融合语义最大值池化特征向量,并对所述用户画像属性项融合语义特征向量的序列进行最大值池化处理以得到用户画像属性项融合语义最大值池化特征向量;最后,融合所述互联网广告描述词融合语义最大值池化特征向量和所述用户画像属性项融合语义最大值池化特征向量以得到所述互联网广告-被分析用户交互融合特征向量。
特别地,所述S7,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。特别地,在本申请的一个具体示例中,如图4所示,所述S7,包括:S71,将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值;以及,S72,基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。
具体地,所述S71,将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值。也就是,利用所述互联网广告的语义特征和所述用户画像的语义特征之间的交互特征信息来进行分类处理,以此来对于待推送互联网广告与被分析用户之间的适配度进行分析和评估,并基于评估结果,确定是否将所述待推送互联网广告展示给所述被分析用户。这样,能够基于用户画像信息实现互联网广告的精准投放,提高广告投放的精准度和效果,同时降低广告的成本和资源浪费。更具体地,使用所述分类器的多个全连接层对所述互联网广告-被分析用户交互融合特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
分类器是指一种机器学习模型或算法,用于将输入数据分为不同的类别或标签。分类器是监督学习的一部分,它通过学习从输入数据到输出类别的映射关系来进行分类任务。
全连接层是神经网络中常见的一种层类型。在全连接层中,每个神经元都与上一层的所有神经元相连接,每个连接都有一个权重。这意味着全连接层中的每个神经元都接收来自上一层所有神经元的输入,并通过权重对这些输入进行加权求和,然后将结果传递给下一层。
Softmax分类函数是一种常用的激活函数,用于多分类问题。它将输入向量的每个元素转化为一个介于0和1之间的概率值,并且这些概率值的和等于1。Softmax函数常用于神经网络的输出层,特别适用于多分类问题,因为它能够将网络输出映射为各个类别的概率分布。在训练过程中,Softmax函数的输出可以用于计算损失函数,并通过反向传播算法来更新网络参数。值得注意的是,Softmax函数的输出并不会改变元素之间的相对大小关系,只是对其进行了归一化处理。因此,Softmax函数并不改变输入向量的特性,只是将其转化为概率分布形式。
具体地,所述S72,基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。也就是,在一个示例中,根据模型的输出结果和决策阈值,决定是否将待推送互联网广告展示给被分析用户。如果模型决策为展示广告,则将广告展示给用户;否则,不展示广告。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户,例如:收集所需的互联网广告数据和被分析用户的交互数据;从收集到的数据中提取特征。这可以包括用户的兴趣偏好、行为模式、购买力等特征。同时,还可以提取广告的相关特征,如广告的内容、广告主的品牌等;将用户的交互特征和广告特征进行融合。这可以通过特征组合、特征加权等方式进行;使用融合后的特征作为输入,建立一个预测模型来确定是否将待推送互联网广告展示给被分析用户。这可以是一个分类模型,如逻辑回归、支持向量机等,也可以是一个深度学习模型,如神经网络等;使用已标记的训练数据对模型进行训练;对于新的待推送互联网广告和被分析用户,将其特征输入训练好的模型中进行推断。模型将输出一个概率或预测结果,表示是否将广告展示给用户;根据业务需求和模型性能,确定一个适当的决策阈值。当模型输出的概率高于该阈值时,决策为将广告展示给用户;否则,决策为不展示广告;根据模型的输出结果和决策阈值,决定是否将待推送互联网广告展示给被分析用户。如果模型决策为展示广告,则将广告展示给用户;否则,不展示广告。
应可以理解,在利用上述神经网络模型进行推断之前,需要对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。也就是说,在本申请的互联网广告精准投放方法中,还包括训练阶段,用于对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
图3为根据本申请实施例的互联网广告精准投放方法的训练阶段的流程图。如图3所示,根据本申请实施例的互联网广告精准投放方法,包括:训练阶段,包括:S110,获取训练数据,所述训练数据包括被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息,待推送互联网广告的训练文本描述,以及,所述待推送互联网广告与被分析用户之间的适配度是否超过预定阈值的真实值;S120,对所述被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息进行处理和分析以得到训练用户画像;S130,将所述训练用户画像中的各个属性项输入所述包含词嵌入层的第一上下文编码器以得到训练用户画像属性项语义特征向量的序列;S140,将所述待推送互联网广告的训练文本描述通过所述包含词嵌入层的第二上下文编码器以得到训练互联网广告描述词特征向量的序列;S150,将所述训练互联网广告描述词特征向量的序列和所述训练用户画像属性项语义特征向量的序列通过所述注意力交互融合模块以得到训练互联网广告-被分析用户交互融合特征向量;S160,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量;S170,将所述优化训练互联网广告-被分析用户交互融合特征向量通过所述分类器以得到分类损失函数值;以及,S180,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
其中,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量,包括:将所述训练互联网广告描述词特征向量的序列进行级联以得到的第一级联特征向量,并将所述训练用户画像属性项语义特征向量的序列进行级联以得到的第二级联特征向量;对所述第一级联特征向量和所述第二级联特征向量进行平衡化融合校正以得到校正特征向量;以及,将所述校正特征向量与所述训练互联网广告-被分析用户交互融合特征向量进行融合以得到所述优化训练互联网广告-被分析用户交互融合特征向量。
特别地,在本申请的技术方案中,所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列分别表达所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的文本语义特征,由此,使用注意力交互融合模块来对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互时,可以实现所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的源文本语义特征分布的特征交互式融合。但是,本申请的申请人考虑到所述待推送互联网广告的文本描述和所述用户画像中的各个属性项文本的不同源文本语义分布强度,即,所述用户画像中的各个属性项文本在基于基本信息进行处理和分析的基础上,其源文本语义分布强度会大于所述待推送互联网广告的文本描述的源文本语义分布强度,由此,在通过注意力交互式融合来获得所述互联网广告-被分析用户交互融合特征向量时,可能导致所述互联网广告-被分析用户交互融合特征向量的表达不均衡,影响所述互联网广告-被分析用户交互融合特征向量的表达效果。基于此,优选地,对于所述互联网广告描述词特征向量的序列级联后得到的第一级联特征向量,例如记为V1和所述用户画像属性项语义特征向量的序列级联后得到的第二级联特征向量,例如记为V2进行特征插值式融合的目的损失自监督平衡化,以获得校正特征向量,例如记为Vc
其中V1是所述第一级联特征向量,V2是所述第二级联特征向量,和/>分别表示所述第一级联特征向量和所述第二级联特征向量的全局均值的倒数,且I是单位向量,⊙表示按位置点乘,/>表示按位置作差,⊕表示按位置相加,Vc是所述校正特征向量。也就是,在考虑到基于语义特征分布的注意力交互式融合的情况下,如果将待融合的所述第二级联特征向量V2视为所述第一级联特征向量V1的强文本语义特征增强输入,则可能损失所述第一级联特征向量V1的目标特征流形在类空间内的目标分布信息,导致类回归目的损失,因此通过对特征分布相对于彼此的离群分布(outlier distribution)进行交叉惩罚的方式,可以在特征插值式融合时实现特征增强和回归鲁棒的自监督式平衡,以提升所述第一级联特征向量V1和所述第二级联特征向量V2的特征融合效果。这样,再将所述校正特征向量Vc与所述互联网广告-被分析用户交互融合特征向量融合,就可以提升所述互联网广告-被分析用户交互融合特征向量的表达效果,以提升其通过分类器得到的分类结果的准确性。这样,能够基于用户画像为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告的精准投放,提高广告投放的精准度和效果,同时降低广告的成本和资源浪费。
综上,根据本申请实施例的互联网广告精准投放方法被阐明,其通过用户在互联网上的各种行为数据,如浏览网页、搜索关键词、点击链接、购买商品等,以及用户的基本信息,如年龄、性别、职业、收入等来构建用户画像,并在后端引入语义理解技术来进行用户画像和互联网广告的文本描述的语义交互分析,以此来为用户推送适合其需求和偏好的广告,通过这样的方式,能够实现互联网广告精准投放,提高广告的转化率和效果,同时降低广告的成本和资源浪费。
进一步地,还提供一种互联网广告精准投放系统。
图5为根据本申请实施例的互联网广告精准投放系统的框图。如图5所示,根据本申请实施例的互联网广告精准投放系统300,包括:信息采集模块310,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;用户画像生成模块320,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;用户画像属性语义理解模块330,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;文本描述获取模块340,用于获取待推送互联网广告的文本描述;互联网广告语义理解模块350,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;语义特征交互融合模块360,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及,结果生成模块370,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
如上所述,根据本申请实施例的互联网广告精准投放系统300可以实现在各种无线终端中,例如具有互联网广告精准投放算法的服务器等。在一种可能的实现方式中,根据本申请实施例的互联网广告精准投放系统300可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该互联网广告精准投放系统300可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该互联网广告精准投放系统300同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该互联网广告精准投放系统300与该无线终端也可以是分立的设备,并且该互联网广告精准投放系统300可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种互联网广告精准投放方法,其特征在于,包括:
收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
获取待推送互联网广告的文本描述;
对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
2.根据权利要求1所述的互联网广告精准投放方法,其特征在于,对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列,包括:将所述用户画像中的各个属性项输入包含词嵌入层的第一上下文编码器以得到所述用户画像属性项语义特征向量的序列。
3.根据权利要求2所述的互联网广告精准投放方法,其特征在于,对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列,包括:将所述待推送互联网广告的文本描述通过包含词嵌入层的第二上下文编码器以得到所述互联网广告描述词特征向量的序列。
4.根据权利要求3所述的互联网广告精准投放方法,其特征在于,对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征,包括:将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量作为所述互联网广告-被分析用户交互融合特征。
5.根据权利要求4所述的互联网广告精准投放方法,其特征在于,将所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列通过注意力交互融合模块以得到互联网广告-被分析用户交互融合特征向量作为所述互联网广告-被分析用户交互融合特征,包括:
计算所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列中任意两个特征向量之间的相关度以得到互联网广告-用户画像语义关联特征矩阵的序列;
基于所述互联网广告-用户画像语义关联特征矩阵的序列,对所述互联网广告描述词特征向量的序列和所述用户画像属性项语义特征向量的序列进行特征交互注意力编码以得到注意力增强互联网广告描述词特征向量的序列和注意力增强用户画像属性项语义特征向量的序列;
融合所述互联网广告描述词特征向量的序列和所述注意力增强互联网广告描述词特征向量的序列中相应位置的特征向量以得到互联网广告描述词融合语义特征向量的序列,并融合所述用户画像属性项语义特征向量的序列和所述注意力增强用户画像属性项语义特征向量中相应位置的特征向量以得到用户画像属性项融合语义特征向量的序列;
对所述互联网广告描述词融合语义特征向量的序列进行最大值池化处理以得到互联网广告描述词融合语义最大值池化特征向量,并对所述用户画像属性项融合语义特征向量的序列进行最大值池化处理以得到用户画像属性项融合语义最大值池化特征向量;以及
融合所述互联网广告描述词融合语义最大值池化特征向量和所述用户画像属性项融合语义最大值池化特征向量以得到所述互联网广告-被分析用户交互融合特征向量。
6.根据权利要求5所述的互联网广告精准投放方法,其特征在于,基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户,包括:
将所述互联网广告-被分析用户交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示待推送互联网广告与被分析用户之间的适配度是否超过预定阈值;以及
基于所述分类结果,确定是否将所述待推送互联网广告展示给所述被分析用户。
7.根据权利要求6所述的互联网广告精准投放方法,其特征在于,还包括训练步骤:用于对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
8.根据权利要求7所述的互联网广告精准投放方法,其特征在于,所述训练步骤,包括:
获取训练数据,所述训练数据包括被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息,待推送互联网广告的训练文本描述,以及,所述待推送互联网广告与被分析用户之间的适配度是否超过预定阈值的真实值;
对所述被分析用户在互联网上的各种训练行为数据和所述被分析用户的训练基本信息进行处理和分析以得到训练用户画像;
将所述训练用户画像中的各个属性项输入所述包含词嵌入层的第一上下文编码器以得到训练用户画像属性项语义特征向量的序列;
将所述待推送互联网广告的训练文本描述通过所述包含词嵌入层的第二上下文编码器以得到训练互联网广告描述词特征向量的序列;
将所述训练互联网广告描述词特征向量的序列和所述训练用户画像属性项语义特征向量的序列通过所述注意力交互融合模块以得到训练互联网广告-被分析用户交互融合特征向量;
对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量;
将所述优化训练互联网广告-被分析用户交互融合特征向量通过所述分类器以得到分类损失函数值;以及
基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含词嵌入层的第一上下文编码器、所述包含词嵌入层的第二上下文编码器、所述注意力交互融合模块和所述分类器进行训练。
9.根据权利要求8所述的互联网广告精准投放方法,其特征在于,对所述训练互联网广告-被分析用户交互融合特征向量进行特征分布优化以得到优化训练互联网广告-被分析用户交互融合特征向量,包括:
将所述训练互联网广告描述词特征向量的序列进行级联以得到的第一级联特征向量,并将所述训练用户画像属性项语义特征向量的序列进行级联以得到的第二级联特征向量;
对所述第一级联特征向量和所述第二级联特征向量进行平衡化融合校正以得到校正特征向量;以及
将所述校正特征向量与所述训练互联网广告-被分析用户交互融合特征向量进行融合以得到所述优化训练互联网广告-被分析用户交互融合特征向量。
10.一种互联网广告精准投放系统,其特征在于,包括:
信息采集模块,用于收集被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息;
用户画像生成模块,用于对所述被分析用户在互联网上的各种行为数据和所述被分析用户的基本信息进行处理和分析以得到用户画像;
用户画像属性语义理解模块,用于对所述用户画像中的各个属性项进行语义理解以得到用户画像属性项语义特征向量的序列;
文本描述获取模块,用于获取待推送互联网广告的文本描述;
互联网广告语义理解模块,用于对所述待推送互联网广告的文本描述进行语义理解以得到互联网广告描述词特征向量的序列;
语义特征交互融合模块,用于对所述用户画像属性项语义特征向量的序列和所述互联网广告描述词特征向量的序列进行语义特征交互融合以得到互联网广告-被分析用户交互融合特征;以及
结果生成模块,用于基于所述互联网广告-被分析用户交互融合特征,确定是否将所述待推送互联网广告展示给所述被分析用户。
CN202311473736.6A 2023-11-07 2023-11-07 互联网广告精准投放方法及系统 Pending CN117522479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311473736.6A CN117522479A (zh) 2023-11-07 2023-11-07 互联网广告精准投放方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311473736.6A CN117522479A (zh) 2023-11-07 2023-11-07 互联网广告精准投放方法及系统

Publications (1)

Publication Number Publication Date
CN117522479A true CN117522479A (zh) 2024-02-06

Family

ID=89746929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311473736.6A Pending CN117522479A (zh) 2023-11-07 2023-11-07 互联网广告精准投放方法及系统

Country Status (1)

Country Link
CN (1) CN117522479A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254785A (zh) * 2021-06-21 2021-08-13 腾讯科技(深圳)有限公司 推荐模型训练方法、推荐方法和相关设备
CN113706211A (zh) * 2021-08-31 2021-11-26 平安科技(深圳)有限公司 基于神经网络的广告点击率预测方法及系统
CN116228368A (zh) * 2023-03-15 2023-06-06 重庆邮电大学 一种基于深度多行为网络的广告点击率预测方法
CN116797290A (zh) * 2023-07-06 2023-09-22 滁州元宇数字科技有限公司 广告智能投放系统及其方法
CN116911929A (zh) * 2023-09-13 2023-10-20 北京茄豆网络科技有限公司 基于大数据的广告服务终端及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254785A (zh) * 2021-06-21 2021-08-13 腾讯科技(深圳)有限公司 推荐模型训练方法、推荐方法和相关设备
CN113706211A (zh) * 2021-08-31 2021-11-26 平安科技(深圳)有限公司 基于神经网络的广告点击率预测方法及系统
CN116228368A (zh) * 2023-03-15 2023-06-06 重庆邮电大学 一种基于深度多行为网络的广告点击率预测方法
CN116797290A (zh) * 2023-07-06 2023-09-22 滁州元宇数字科技有限公司 广告智能投放系统及其方法
CN116911929A (zh) * 2023-09-13 2023-10-20 北京茄豆网络科技有限公司 基于大数据的广告服务终端及方法

Similar Documents

Publication Publication Date Title
Liu et al. EDMF: Efficient deep matrix factorization with review feature learning for industrial recommender system
CN109345302B (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN111275521B (zh) 一种基于用户评论与满意层面嵌入的商品推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN110263160B (zh) 一种计算机问答系统中的问句分类方法
CN107683469A (zh) 一种基于深度学习的产品分类方法及装置
CN112288554B (zh) 商品推荐方法和装置、存储介质及电子装置
CN111563770A (zh) 一种基于特征差异化学习的点击率预估方法
CN111259140A (zh) 一种基于lstm多实体特征融合的虚假评论检测方法
CN113127737B (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN109189922B (zh) 评论评估模型的训练方法和装置
WO2024041483A1 (zh) 一种推荐方法及相关装置
CN116226785A (zh) 目标对象识别方法、多模态识别模型的训练方法和装置
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN108491477B (zh) 基于多维云和用户动态兴趣的神经网络推荐方法
CN116910357A (zh) 一种数据处理方法及相关装置
CN117522479A (zh) 互联网广告精准投放方法及系统
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统
Bonthu et al. Multi-label and Multi-class Classification on a Custom Dataset using Convolution Neural Networks
CN111666410B (zh) 商品用户评论文本的情感分类方法及系统
CN114862514A (zh) 一种基于元学习的用户偏好商品推荐方法
CN114519600A (zh) 一种融合相邻节点方差的图神经网络ctr预估算法
CN118043802A (zh) 一种推荐模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination