CN116911929B - 基于大数据的广告服务终端及方法 - Google Patents
基于大数据的广告服务终端及方法 Download PDFInfo
- Publication number
- CN116911929B CN116911929B CN202311174713.5A CN202311174713A CN116911929B CN 116911929 B CN116911929 B CN 116911929B CN 202311174713 A CN202311174713 A CN 202311174713A CN 116911929 B CN116911929 B CN 116911929B
- Authority
- CN
- China
- Prior art keywords
- training
- advertisement
- user
- semantic
- pushed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006399 behavior Effects 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims description 122
- 239000013598 vector Substances 0.000 claims description 113
- 230000003993 interaction Effects 0.000 claims description 67
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000004140 cleaning Methods 0.000 claims description 11
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000012790 confirmation Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于大数据的广告服务终端及方法。其首先收集用户的浏览历史、点击行为、购物记录和社交网络,接着,对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析,然后,将所述用户与待推送广告进行匹配,接着,将匹配成功的所述待推送广告以预定形式展示给所述用户,最后,收集所述用户对所述匹配成功的所述待推送广告的反馈。这样,可以了解用户对特定产品、服务或主题的兴趣程度,从而为其推送相关的广告内容。
Description
技术领域
本申请涉及广告服务领域,且更为具体地,涉及一种基于大数据的广告服务终端及方法。
背景技术
传统媒体可以覆盖大量的受众群体,但无法精确定位目标受众。传统媒体的广告内容通常是相对固定和统一的,无法根据不同用户的个性化需求进行定制。这种广告内容缺乏个性化,可能降低用户的兴趣和参与度。
现代消费者期望获得与自身兴趣和需求相关的广告内容,他们不再愿意接受大规模广告的打扰。随着大数据技术和人工智能的不断进步,广告行业可以利用海量的用户数据进行深度分析和个性化推荐,可以更精准地匹配广告内容和用户需求,提供更有针对性的广告体验。
因此,期待一种基于大数据的广告服务方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的广告服务终端及方法。其可以了解用户对特定产品、服务或主题的兴趣程度,从而为其推送相关的广告内容。
根据本申请的一个方面,提供了一种基于大数据的广告服务终端,其包括:
数据采集模块,用于收集用户的浏览历史、点击行为、购物记录和社交网络;
数据分析模块,用于对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;
广告匹配模块,用于将所述用户与待推送广告进行匹配;
广告展示模块,用于将匹配成功的所述待推送广告以预定形式展示给所述用户;
以及反馈评估模块,用于收集所述用户对所述匹配成功的所述待推送广告的反馈。
根据本申请的另一个方面,提供了一种基于大数据的广告服务方法,其包括:
收集用户的浏览历史、点击行为、购物记录和社交网络;
对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;
将所述用户与待推送广告进行匹配;
将匹配成功的所述待推送广告以预定形式展示给所述用户;
以及收集所述用户对所述匹配成功的所述待推送广告的反馈。
与现有技术相比,本申请提供的基于大数据的广告服务终端及方法,其首先收集用户的浏览历史、点击行为、购物记录和社交网络,接着,对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析,然后,将所述用户与待推送广告进行匹配,接着,将匹配成功的所述待推送广告以预定形式展示给所述用户,最后,收集所述用户对所述匹配成功的所述待推送广告的反馈。这样,可以了解用户对特定产品、服务或主题的兴趣程度,从而为其推送相关的广告内容。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的基于大数据的广告服务终端的框图示意图。
图2为根据本申请实施例的基于大数据的广告服务终端中的所述数据分析模块的框图示意图。
图3为根据本申请实施例的基于大数据的广告服务终端中的所述语义特征提取单元的框图示意图。
图4为根据本申请实施例的基于大数据的广告服务终端中的所述广告匹配模块的框图示意图。
图5为根据本申请实施例的基于大数据的广告服务终端中进一步包括的训练模块的框图示意图。
图6为根据本申请实施例的基于大数据的广告服务方法的流程图。
图7为根据本申请实施例的基于大数据的广告服务方法的子步骤S120的系统架构的示意图。
图8为根据本申请实施例的基于大数据的广告服务终端的应用场景图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
本申请提供了一种基于大数据的广告服务终端,图1为根据本申请实施例的基于大数据的广告服务终端的框图示意图。如图1所示,根据本申请实施例的基于大数据的广告服务终端100,包括:数据采集模块110,用于收集用户的浏览历史、点击行为、购物记录和社交网络;数据分析模块120,用于对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;广告匹配模块130,用于将所述用户与待推送广告进行匹配;广告展示模块140,用于将匹配成功的所述待推送广告以预定形式展示给所述用户;以及,反馈评估模块150,用于收集所述用户对所述匹配成功的所述待推送广告的反馈。
也就是,本申请的技术构思为基于用户的浏览历史、点击行为、购物记录和社交网络进行广告推送的匹配。具体而言,用户的浏览历史、点击行为和购物记录可以反映其兴趣和偏好。通过分析这些数据,可以了解用户对特定产品、服务或主题的兴趣程度,从而为其推送相关的广告内容。例如,若用户经常浏览和购买健身用品,可以向该用户推送与健身相关的广告。
相应地,如图2所示,所述数据分析模块120,包括:清洗和统计分析单元121,用于对所述用户的浏览历史、点击行为、购物记录和社交网络进行清洗和统计分析以得到用户画像;以及,语义特征提取单元122,用于提取所述用户画像的语义特征以得到用户画像语义编码特征向量。
具体地,所述数据分析模块对所述用户的浏览历史、点击行为、购物记录和社交网络进行数据分析与语义编码以得到用户画像语义编码特征向量。在本申请的实施例中,所述数据分析模块的实现方式为:先对所述用户的浏览历史、点击行为、购物记录和社交网络进行清洗和统计分析以得到用户画像;随后,将所述用户画像的各个维度特征通过词嵌入层以得到用户画像维度特征词嵌入向量的序列;再将所述用户画像维度特征词嵌入向量的序列通过基于转换器模块的上下文编码器以得到用户画像语义编码特征向量。
也就是,先利用用户的浏览历史、点击行为、购物记录和社交网络构建用户画像,以形成用户的综合描述和表征;再通过词嵌入层将用户画像中的信息进行向量化表示,以便于计算机的读取与识别;然后利用所述基于转换器模块的上下文编码器以捕获所述用户画像维度特征词嵌入向量的序列中基于全局性的上下文语义特征信息。
具体地,所述广告匹配模块用于将所述用户与待推送广告进行匹配。在本申请的实施例中,将所述用户与待推送广告进行匹配的编码过程,包括:先获取待推送广告的文本描述;随后,对所述待推送广告的文本描述进行语义编码以得到待推送广告语义特征向量;再将所述用户画像语义编码特征向量与所述待推送广告语义特征向量进行特征交互以得到用户画像-广告语义交互特征向量;进一步地,基于所述用户画像-广告语义交互特征向量,确定是否向所述用户推送所述待推送广告。也就是,通过构建用户信息与待推送广告之间的关联信息,确定两者之间的匹配度,进而智能化地判断是否向所述用户推送所述待推送广告。
在本申请的一个具体示例中,将所述用户画像语义编码特征向量与所述待推送广告语义特征向量进行特征交互以得到用户画像-广告语义交互特征向量的实现方式为:使用特征间注意力层来对所述用户画像语义编码特征向量和所述待推送广告语义特征向量进行基于注意力机制的特征交互以得到用户画像-广告语义交互特征向量。
值得一提的是,传统的注意力机制的目标在于学习一个注意力权重矩阵,应用于当前层的各个神经节点,对于那些重要的节点,赋予它们较大的权重,对于那些次要的节点,赋予它们较小的权重。由于每个神经节点都包含着某种特征信息,经过上述操作,神经网络就能从众多特征信息中选择出对当前任务目标更关键的信息。而所述特征间注意力层则不同,其更多地关注到了各个特征信息间的依赖关系。
相应地,如图3所示,所述语义特征提取单元122,包括:词嵌入子单元1221,用于将所述用户画像的各个维度特征通过词嵌入层以得到用户画像维度特征词嵌入向量的序列;以及,上下文编码子单元1222,用于将所述用户画像维度特征词嵌入向量的序列通过基于转换器模块的上下文编码器以得到所述用户画像语义编码特征向量。值得一提的是,词嵌入层是自然语言处理中的一种技术,用于将文本中的单词或词组映射到连续向量空间中的表示,也称为词嵌入向量,它的主要作用是将离散的文本符号转换为连续的向量表示,从而捕捉到单词之间的语义和语法关系。词嵌入层的用途包括:1.表示单词语义:通过词嵌入层,每个单词都可以表示为一个向量,向量的维度捕捉了单词的语义信息,相似的单词在向量空间中的距离也更接近,可以用于计算单词之间的相似度或寻找相关的单词。2.提取语境信息:词嵌入向量可以捕捉到单词在上下文中的语义信息。3.改善模型性能:使用词嵌入层可以提供更好的输入表示,有助于改善许多自然语言处理任务的性能。在所述语义特征提取单元中,词嵌入子单元1221将用户画像的各个维度特征通过词嵌入层转换为词嵌入向量的序列,这样可以将用户画像的离散特征表示为连续的向量表示,便于后续的处理和分析。上下文编码子单元1222则进一步利用基于转换器模块的上下文编码器,将用户画像维度特征词嵌入向量的序列转换为用户画像的语义编码特征向量,从而更好地捕捉用户画像的语义信息。
进一步地,转换器模块是一种神经网络模型,用于自然语言处理任务中的序列到序列(sequence-to-sequence)学习。转换器模块的主要作用是实现对序列数据的编码和解码,它由多个编码器层和解码器层组成,每个层都包含自注意力机制(self-attention)和前馈神经网络(feed-forward neural network)。转换器模块的关键特点和用途包括:1.自注意力机制:自注意力机制能够在编码器和解码器中建立输入序列内部的依赖关系,捕捉序列中不同位置之间的关联信息,它能够对序列中的每个位置进行加权处理,使得每个位置都能够考虑到其他位置的信息,从而更好地理解序列中的上下文。2.并行计算:转换器模块中的自注意力机制可以进行并行计算,因为每个位置的注意力权重是独立计算的,不需要像循环神经网络(RNN)那样按顺序进行计算,这使得转换器模块能够高效地处理长序列数据,提高了计算性能。3.捕捉全局信息:由于自注意力机制能够同时考虑序列中的所有位置,转换器模块能够更好地捕捉全局信息。4.适应不同任务:转换器模块的结构通用且灵活,可以应用于多种自然语言处理任务,通过调整模型的输入和输出设置,可以适应不同的任务需求。即,转换器模块通过自注意力机制和前馈神经网络的组合,能够有效地处理序列数据,捕捉全局信息,并适应不同的自然语言处理任务。它在机器翻译等任务中取得了显著的性能提升,并成为自然语言处理领域的重要基础模型之一。
在本申请的一个具体示例中,基于所述用户画像-广告语义交互特征向量,确定是否向所述用户推送所述待推送广告的实现方式为:将所述用户画像-广告语义交互特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向用户推送待推送广告。通过这样的方式,实现个性化的广告推荐和精准的广告投放,提高广告的效果和用户体验。
相应地,如图4所示,所述广告匹配模块130,包括:文本描述获取单元131,用于获取待推送广告的文本描述;语义编码单元132,用于对所述待推送广告的文本描述进行语义编码以得到待推送广告语义特征向量;特征交互单元133,用于将所述用户画像语义编码特征向量与所述待推送广告语义特征向量进行特征交互以得到用户画像-广告语义交互特征向量;以及,推送确认单元134,用于基于所述用户画像-广告语义交互特征向量,确定是否向所述用户推送所述待推送广告。
更具体地,所述特征交互单元133,进一步用于:使用特征间注意力层来对所述用户画像语义编码特征向量和所述待推送广告语义特征向量进行基于注意力机制的特征交互以得到所述用户画像-广告语义交互特征向量。值得一提的是,特征间注意力层是一种神经网络层,用于实现特征之间的注意力交互,它通过引入注意力机制,对不同特征之间的重要性进行建模,并根据这些重要性对特征进行加权组合,从而得到更具有信息量和表征能力的特征表示。特征间注意力层能够对不同的特征进行交互,使得每个特征都能够考虑到其他特征的信息,通过注意力机制,可以自动学习不同特征之间的相关性和重要性,从而更好地捕捉特征之间的交互关系。注意力机制可以对不同特征的重要性进行建模,通过计算特征之间的注意力权重,可以确定每个特征在特征交互中的贡献程度,这样可以更加关注那些对任务更有帮助的重要特征,提高模型的表现能力。特征间注意力层能够根据不同任务和输入数据的特点,自适应地学习特征的权重,这使得模型能够在不同场景下灵活地调整特征的重要性,从而适应不同的任务需求。在特征交互单元中,特征间注意力层用于对用户画像语义编码特征向量和待推送广告语义特征向量进行基于注意力机制的特征交互。通过计算两个特征向量之间的注意力权重,可以确定每个特征在交互过程中的贡献程度。然后,根据注意力权重对特征进行加权组合,得到用户画像-广告语义交互特征向量。这样可以更好地利用用户画像和广告之间的语义信息,提高推送确认的准确性和效果。换言之,特征间注意力层通过注意力机制实现特征之间的交互和重要性建模,能够提高特征表示的表征能力和适应性,对于推送确认任务中的用户画像和广告语义交互特征的处理非常有用。
更具体地,所述推送确认单元134,用于:将所述用户画像-广告语义交互特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向用户推送待推送广告。进一步地,所述推送确认单元134,进一步用于:使用所述分类器的全连接层对所述用户画像-广告语义交互特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
也就是,在本公开的技术方案中,所述分类器的标签包括向用户推送待推送广告(第一标签),以及,不向用户推送待推送广告(第二标签),其中,所述分类器通过软最大值函数来确定所述用户画像-广告语义交互特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“是否向用户推送待推送广告”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,是否向用户推送待推送广告的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“是否向用户推送待推送广告”的语言文本意义。
应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有Softmax分类函数。
值得一提的是,全连接编码是指将输入数据通过全连接层进行编码的过程。全连接层是神经网络中的一种常见层类型,其中每个神经元与前一层的所有神经元相连接,每个连接都有一个权重。在全连接层中,输入数据会通过权重和偏置项进行线性变换,并经过激活函数进行非线性变换。通过全连接层的线性变换和非线性激活函数,可以对输入数据进行复杂的特征提取和表示,全连接层能够将输入数据的不同维度之间的关系进行组合和编码,从而得到更高级的特征表示。全连接编码可以将输入数据的维度进行降低,从而减少模型的参数量和计算复杂度,通过降维和压缩,可以提高模型的效率和泛化能力,并减少过拟合的风险。全连接编码将用户画像-广告语义交互特征向量通过全连接层进行编码,得到编码分类特征向量。这个编码特征向量可以更好地表示用户画像和广告之间的交互信息,并提供给后续的分类器进行分类任务。在推送确认单元中,全连接编码用于对用户画像-广告语义交互特征向量进行编码,以得到编码分类特征向量。这样可以通过全连接层的非线性变换和特征提取,将输入特征进行编码和压缩,得到更具有表征能力的特征表示。接下来,编码分类特征向量会被输入到分类器的Softmax分类函数中,用于得到最终的分类结果。全连接编码在推送确认单元中的作用是提取用户画像-广告语义交互特征的高级表示,并为分类器提供更有信息量的输入。
进一步地,在本申请中,所述的基于大数据的广告服务终端,其还包括对所述基于转换器模块的上下文编码器、所述特征间注意力层和所述分类器进行训练的训练模块;其中,如图5所示,所述训练模块200,包括:训练数据获取单元210,用于获取训练数据,所述训练数据包括用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络,以及,待推送广告的训练文本描述和是否向用户推送所述待推送广告的真实值;训练清洗和统计分析单元220,用于对所述用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络进行清洗和统计分析以得到训练用户画像;训练词嵌入单元230,用于将所述训练用户画像的各个维度特征通过词嵌入层以得到训练用户画像维度特征词嵌入向量的序列;训练上下文编码单元240,用于将所述训练用户画像维度特征词嵌入向量的序列通过所述基于转换器模块的上下文编码器以得到训练用户画像语义编码特征向量;训练语义编码单元250,用于对所述待推送广告的训练文本描述进行语义编码以得到训练待推送广告语义特征向量;训练特征交互单元260,用于使用所述特征间注意力层来对所述训练用户画像语义编码特征向量和所述训练待推送广告语义特征向量进行基于注意力机制的特征交互以得到训练用户画像-广告语义交互特征向量;训练分类单元270,用于将所述训练用户画像-广告语义交互特征向量通过分类器以得到分类损失函数值;以及,训练迭代单元280,用于以所述分类损失函数值来对所述基于转换器模块的上下文编码器、所述特征间注意力层和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代。
在本申请的技术方案中,通过使用特征间注意力层来对所述训练用户画像语义编码特征向量和所述训练待推送广告语义特征向量进行基于注意力机制的特征交互以得到训练用户画像-广告语义交互特征向量,可以使得所述训练用户画像-广告语义交互特征向量表达训练用户画像关键词的上下文关联语义特征与待推送广告的训练文本描述的编码文本语义特征之间的特征交互,但另一方面,这种交互特征的提取也会使得所述训练用户画像-广告语义交互特征向量的整体特征分布偏离所述训练用户画像关键词和所述训练待推送广告的文本描述的源语义分布,尤其是在分类场景下,在分类器的权重矩阵迭代过程中导致类概率映射偏移,从而影响模型的训练效果,以及训练好的模型所得到的所述训练用户画像-广告语义交互特征向量的分类结果的准确性。
基于此,本申请的申请人在所述训练用户画像-广告语义交互特征向量通过分类器的训练过程中,进行权重矩阵的基于基准注释的外部边界约束。
相应地,在一个具体示例中,所述训练迭代单元280,进一步用于:在所述训练的每一轮迭代中,以如下优化迭代公式对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代;其中,所述优化迭代公式为:
;
;
;
其中,和/>分别是上次和本次迭代的权重矩阵,其中在首次迭代时,采用不同的初始化策略设置/>和/>,(例如,/>设置为单位矩阵而/>设置为待分类特征向量的均值对角矩阵),/>是所述用户画像-广告语义交互特征向量,且/>为列向量形式,/>表示转置操作,/>表示矩阵乘法,/>表示矩阵加法,/>表示迭代优化后的权重矩阵。
这里,通过以所述训练用户画像-广告语义交互特征向量在权重空间内的迭代关联表示来作为权重矩阵迭代的外部关联边界约束,从而在将前次的权重矩阵作为本次迭代过程中的基准注释(benchmark annotation)的情况下,减小权重空间迭代过程当中以所述训练用户画像-广告语义交互特征向量的类概率映射作为锚点的定向不匹配(orientedmismatch),可以进行权重矩阵在迭代过程中相对于所述训练用户画像-广告语义交互特征向量的类概率映射偏移的补偿,从而提升模型的训练效果,以及训练好的模型所得到的所述训练用户画像-广告语义交互特征向量的分类结果的准确性。
综上,基于本申请实施例的基于大数据的广告服务终端100被阐明,其可以了解用户对特定产品、服务或主题的兴趣程度,从而为其推送相关的广告内容。
如上所述,根据本申请实施例的基于本申请实施例的基于大数据的广告服务终端100可以实现在各种终端设备中,例如具有基于本申请实施例的基于大数据的广告服务算法的服务器等。在一个示例中,基于本申请实施例的基于大数据的广告服务终端100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于本申请实施例的基于大数据的广告服务终端100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于本申请实施例的基于大数据的广告服务终端100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于本申请实施例的基于大数据的广告服务终端100与该终端设备也可以是分立的设备,并且该基于大数据的广告服务终端100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
图6为根据本申请实施例的基于大数据的广告服务方法的流程图。如图6所示,根据本申请实施例的基于大数据的广告服务方法,其包括:S110,收集用户的浏览历史、点击行为、购物记录和社交网络;S120,对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;S130,将所述用户与待推送广告进行匹配;S140,将匹配成功的所述待推送广告以预定形式展示给所述用户;以及,S150,收集所述用户对所述匹配成功的所述待推送广告的反馈。
图7为根据本申请实施例的基于大数据的广告服务方法的子步骤S120的系统架构的示意图。如图7所示,在一个具体示例中,在上述基于大数据的广告服务方法中,对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析,包括:对所述用户的浏览历史、点击行为、购物记录和社交网络进行清洗和统计分析以得到用户画像;以及,提取所述用户画像的语义特征以得到用户画像语义编码特征向量。
这里,本领域技术人员可以理解,上述基于大数据的广告服务方法中的各个步骤的具体操作已经在上面参考图1到图5的基于大数据的广告服务终端100的描述中得到了详细介绍,并因此,将省略其重复描述。
图8为根据本申请实施例的基于大数据的广告服务终端的应用场景图。如图8所示,在该应用场景中,首先,收集用户的浏览历史、点击行为、购物记录和社交网络(例如,图8中所示意的D),然后,将所述用户的浏览历史、点击行为、购物记录和社交网络输入至部署有基于大数据的广告服务算法的服务器中(例如,图8中所示意的S),其中,所述服务器能够使用所述基于大数据的广告服务算法对所述用户的浏览历史、点击行为、购物记录和社交网络进行处理以得到用于表示是否向用户推送待推送广告的分类结果。
本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。
Claims (8)
1.一种基于大数据的广告服务终端,其特征在于,包括:
数据采集模块,用于收集用户的浏览历史、点击行为、购物记录和社交网络;
数据分析模块,用于对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;
广告匹配模块,用于将所述用户与待推送广告进行匹配;
广告展示模块,用于将匹配成功的所述待推送广告以预定形式展示给所述用户;
以及反馈评估模块,用于收集所述用户对所述匹配成功的所述待推送广告的反馈;
所述广告服务终端还包括对基于转换器模块的上下文编码器、特征间注意力层和分类器进行训练的训练模块;
其中,所述训练模块,包括:
训练数据获取单元,用于获取训练数据,所述训练数据包括用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络,以及,待推送广告的训练文本描述和是否向用户推送所述待推送广告的真实值;
训练清洗和统计分析单元,用于对所述用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络进行清洗和统计分析以得到训练用户画像;
训练词嵌入单元,用于将所述训练用户画像的各个维度特征通过词嵌入层以得到训练用户画像维度特征词嵌入向量的序列;
训练上下文编码单元,用于将所述训练用户画像维度特征词嵌入向量的序列通过所述基于转换器模块的上下文编码器以得到训练用户画像语义编码特征向量;
训练语义编码单元,用于对所述待推送广告的训练文本描述进行语义编码以得到训练待推送广告语义特征向量;
训练特征交互单元,用于使用所述特征间注意力层来对所述训练用户画像语义编码特征向量和所述训练待推送广告语义特征向量进行基于注意力机制的特征交互以得到训练用户画像-广告语义交互特征向量;
训练分类单元,用于将所述训练用户画像-广告语义交互特征向量通过分类器以得到分类损失函数值;
以及训练迭代单元,用于以所述分类损失函数值来对所述基于转换器模块的上下文编码器、所述特征间注意力层和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代;
所述训练迭代单元,进一步用于:
在所述训练的每一轮迭代中,以如下优化迭代公式对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代;
其中,所述优化迭代公式为:
;
;
;
其中,和/>分别是上次和本次迭代的权重矩阵,其中在首次迭代时,采用不同的初始化策略设置/>和/>,/>是所述用户画像-广告语义交互特征向量,且/>为列向量形式,表示转置操作,/>表示矩阵乘法,/>表示矩阵加法,/>表示迭代优化后的权重矩阵。
2.根据权利要求1所述的基于大数据的广告服务终端,其特征在于,所述数据分析模块,包括:
清洗和统计分析单元,用于对所述用户的浏览历史、点击行为、购物记录和社交网络进行清洗和统计分析以得到用户画像;
以及语义特征提取单元,用于提取所述用户画像的语义特征以得到用户画像语义编码特征向量。
3.根据权利要求2所述的基于大数据的广告服务终端,其特征在于,所述语义特征提取单元,包括:
词嵌入子单元,用于将所述用户画像的各个维度特征通过词嵌入层以得到用户画像维度特征词嵌入向量的序列;
以及上下文编码子单元,用于将所述用户画像维度特征词嵌入向量的序列通过基于转换器模块的上下文编码器以得到所述用户画像语义编码特征向量。
4.根据权利要求3所述的基于大数据的广告服务终端,其特征在于,所述广告匹配模块,包括:
文本描述获取单元,用于获取待推送广告的文本描述;
语义编码单元,用于对所述待推送广告的文本描述进行语义编码以得到待推送广告语义特征向量;
特征交互单元,用于将所述用户画像语义编码特征向量与所述待推送广告语义特征向量进行特征交互以得到用户画像-广告语义交互特征向量;
以及推送确认单元,用于基于所述用户画像-广告语义交互特征向量,确定是否向所述用户推送所述待推送广告。
5.根据权利要求4所述的基于大数据的广告服务终端,其特征在于,所述特征交互单元,进一步用于:
使用特征间注意力层来对所述用户画像语义编码特征向量和所述待推送广告语义特征向量进行基于注意力机制的特征交互以得到所述用户画像-广告语义交互特征向量。
6.根据权利要求5所述的基于大数据的广告服务终端,其特征在于,所述推送确认单元,用于:
将所述用户画像-广告语义交互特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向用户推送待推送广告。
7.一种基于大数据的广告服务方法,其特征在于,包括:
收集用户的浏览历史、点击行为、购物记录和社交网络;
对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析;
将所述用户与待推送广告进行匹配;
将匹配成功的所述待推送广告以预定形式展示给所述用户;
以及收集所述用户对所述匹配成功的所述待推送广告的反馈;
所述方法还包括对基于转换器模块的上下文编码器、特征间注意力层和分类器进行训练的训练步骤;
其中,所述训练步骤,包括:
获取训练数据,所述训练数据包括用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络,以及,待推送广告的训练文本描述和是否向用户推送所述待推送广告的真实值;
对所述用户的训练浏览历史、训练点击行为、训练购物记录和训练社交网络进行清洗和统计分析以得到训练用户画像;
将所述训练用户画像的各个维度特征通过词嵌入层以得到训练用户画像维度特征词嵌入向量的序列;
将所述训练用户画像维度特征词嵌入向量的序列通过所述基于转换器模块的上下文编码器以得到训练用户画像语义编码特征向量;
对所述待推送广告的训练文本描述进行语义编码以得到训练待推送广告语义特征向量;
使用所述特征间注意力层来对所述训练用户画像语义编码特征向量和所述训练待推送广告语义特征向量进行基于注意力机制的特征交互以得到训练用户画像-广告语义交互特征向量;
将所述训练用户画像-广告语义交互特征向量通过分类器以得到分类损失函数值;以及
以所述分类损失函数值来对所述基于转换器模块的上下文编码器、所述特征间注意力层和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代;
在所述训练的每一轮迭代中,以如下优化迭代公式对所述分类器的权重矩阵进行基于基准注释的外部边界约束迭代;
其中,所述优化迭代公式为:
;
;
;
其中,和/>分别是上次和本次迭代的权重矩阵,其中在首次迭代时,采用不同的初始化策略设置/>和/>,/>是所述用户画像-广告语义交互特征向量,且/>为列向量形式,表示转置操作,/>表示矩阵乘法,/>表示矩阵加法,/>表示迭代优化后的权重矩阵。
8.根据权利要求7所述的基于大数据的广告服务方法,其特征在于,对所述用户的浏览历史、点击行为、购物记录和社交网络进行分析,包括:
对所述用户的浏览历史、点击行为、购物记录和社交网络进行清洗和统计分析以得到用户画像;
以及提取所述用户画像的语义特征以得到用户画像语义编码特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174713.5A CN116911929B (zh) | 2023-09-13 | 2023-09-13 | 基于大数据的广告服务终端及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174713.5A CN116911929B (zh) | 2023-09-13 | 2023-09-13 | 基于大数据的广告服务终端及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116911929A CN116911929A (zh) | 2023-10-20 |
CN116911929B true CN116911929B (zh) | 2023-12-12 |
Family
ID=88360691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311174713.5A Active CN116911929B (zh) | 2023-09-13 | 2023-09-13 | 基于大数据的广告服务终端及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116911929B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934079A (zh) * | 2023-11-07 | 2024-04-26 | 北京创信众科技有限公司 | 基于物联网的广告精准推送方法、系统及存储介质 |
CN117611255B (zh) * | 2023-11-07 | 2024-06-25 | 北京创信众科技有限公司 | 基于大数据的广告运营方法及系统 |
CN117522479B (zh) * | 2023-11-07 | 2024-06-25 | 北京创信合科技有限公司 | 互联网广告精准投放方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
CN111177569A (zh) * | 2020-01-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的推荐处理方法、装置及设备 |
CN111882362A (zh) * | 2020-07-31 | 2020-11-03 | 苏州云开网络科技有限公司 | 一种基于5g通讯网络的人工智能广告投放系统 |
CN115689646A (zh) * | 2022-10-24 | 2023-02-03 | 中国农业银行股份有限公司 | 一种广告推送方法及其相关产品 |
CN116739695A (zh) * | 2023-05-11 | 2023-09-12 | 广东百鹿电子科技有限公司 | 基于大数据的电子商务管理系统及其方法 |
CN116738045A (zh) * | 2023-06-12 | 2023-09-12 | 安胜旗信息咨询(深圳)有限公司 | 基于用户浏览行为的精确推送系统 |
-
2023
- 2023-09-13 CN CN202311174713.5A patent/CN116911929B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
CN111177569A (zh) * | 2020-01-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的推荐处理方法、装置及设备 |
CN111882362A (zh) * | 2020-07-31 | 2020-11-03 | 苏州云开网络科技有限公司 | 一种基于5g通讯网络的人工智能广告投放系统 |
CN115689646A (zh) * | 2022-10-24 | 2023-02-03 | 中国农业银行股份有限公司 | 一种广告推送方法及其相关产品 |
CN116739695A (zh) * | 2023-05-11 | 2023-09-12 | 广东百鹿电子科技有限公司 | 基于大数据的电子商务管理系统及其方法 |
CN116738045A (zh) * | 2023-06-12 | 2023-09-12 | 安胜旗信息咨询(深圳)有限公司 | 基于用户浏览行为的精确推送系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116911929A (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116911929B (zh) | 基于大数据的广告服务终端及方法 | |
CN107423442B (zh) | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 | |
CN109101537B (zh) | 基于深度学习的多轮对话数据分类方法、装置和电子设备 | |
CN106980683B (zh) | 基于深度学习的博客文本摘要生成方法 | |
CN111209386B (zh) | 一种基于深度学习的个性化文本推荐方法 | |
CN110263235A (zh) | 信息推送对象更新方法、装置和计算机设备 | |
CN110751188B (zh) | 基于多标记学习的用户标签预测方法、系统及存储介质 | |
CN112667782A (zh) | 一种文本分类方法、装置、设备及存储介质 | |
CN116796045B (zh) | 一种多维度图书分级方法、系统及可读介质 | |
CN112287672A (zh) | 文本意图识别方法及装置、电子设备、存储介质 | |
Jiang et al. | Factorization meets neural networks: A scalable and efficient recommender for solving the new user problem | |
CN117333146A (zh) | 基于人工智能的人力资源管理系统及方法 | |
CN118261677A (zh) | 基于数据挖掘的客户信息分析管理系统及方法 | |
CN116956289B (zh) | 动态调整潜在黑名单和黑名单的方法 | |
CN117171413B (zh) | 用于数字藏品管理的数据处理系统及其方法 | |
CN113837802A (zh) | 一种时序过程与手机缺陷特征深度融合的二手手机价格预测算法 | |
CN117574915A (zh) | 基于多方数据源的公共数据平台及其数据分析方法 | |
CN111310048B (zh) | 基于多层感知机的新闻推荐方法 | |
CN114077661A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
CN117133408A (zh) | 用于青少年的心理咨询辅助系统及其方法 | |
JP2010272004A (ja) | 判別装置及び判別方法、並びにコンピューター・プログラム | |
Wei et al. | Sequential recommendation based on long-term and short-term user behavior with self-attention | |
CN113342964B (zh) | 一种基于移动业务的推荐类型确定方法及系统 | |
CN115269998A (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN112200602B (zh) | 用于广告推荐的神经网络模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |