CN116805256B - 基于情感分析的广告推送系统及方法 - Google Patents
基于情感分析的广告推送系统及方法 Download PDFInfo
- Publication number
- CN116805256B CN116805256B CN202310814597.2A CN202310814597A CN116805256B CN 116805256 B CN116805256 B CN 116805256B CN 202310814597 A CN202310814597 A CN 202310814597A CN 116805256 B CN116805256 B CN 116805256B
- Authority
- CN
- China
- Prior art keywords
- word embedding
- word
- embedding vector
- chaotic
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004458 analytical method Methods 0.000 title claims abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 151
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000010276 construction Methods 0.000 claims abstract description 6
- 230000000739 chaotic effect Effects 0.000 claims description 79
- 238000013507 mapping Methods 0.000 claims description 63
- 238000012300 Sequence Analysis Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 27
- 230000002996 emotional effect Effects 0.000 description 11
- 230000006399 behavior Effects 0.000 description 10
- 238000000926 separation method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及广告推送技术领域,具体涉及基于情感分析的广告推送系统及方法,所述系统包括:文本内容采集部分,用于采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;语义网络构建部分,用于基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;广告推送部分,用于根据提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。本发明实现了一种高效、准确的广告推送方案。
Description
技术领域
本公开涉及但不限于广告推送技术领域,具体涉及基于情感分析的广告推送系统及方法。
背景技术
随着互联网的普及和发展,广告行业迅速崛起并成为营销领域的重要组成部分。广告推送作为一种常用的营销手段,通过向目标用户推送相关的广告内容,以提高广告的曝光度、点击率和转化率。然而,传统的广告推送方法往往仅基于用户的基本信息或浏览行为,缺乏对用户情感状态的准确把握,无法实现个性化和精准的广告推送。因此,需要一种更高效、准确的广告推送方案来满足用户的需求和提升广告效果。
在目前的技术中,已经存在一些方法用于广告推送,其中包括基于用户基本信息的推送和基于用户浏览行为的推送。基于用户基本信息的推送方法,通过收集用户的性别、年龄、地理位置等基本信息,将广告内容定向推送给特定的用户群体。这种方法的优点是简单易行,但缺点是缺乏对用户实时情感状态的了解,推送内容无法真正与用户的需求和情感匹配。
另一种常见的方法是基于用户浏览行为的推送。通过分析用户在互联网上的浏览记录、点击行为和购买习惯等数据,将与用户兴趣相关的广告内容推送给用户。这种方法可以更加精准地针对用户的兴趣进行推送,提高广告的点击率。然而,该方法仍然存在一些问题。首先,仅基于用户浏览行为往往无法准确捕捉用户的情感状态,无法理解用户的真实需求。其次,用户的浏览行为可能受到多种因素的影响,包括临时兴趣、广告干扰等,因此无法完全代表用户的偏好和需求。最后,基于用户浏览行为的推送往往局限于已有数据,难以应对用户情感状态的实时变化。
因此,现有技术中仍存在以下问题:1)无法准确把握用户的情感状态和需求;2)推送内容缺乏个性化和情感匹配;3)难以应对用户情感状态的实时变化。为了解决这些问题,需要一种更高效、准确的广告推送方案,能够基于用户的情感状态和需求,实现个性化和精准的广告推送。
发明内容
本公开在于基于情感分析的广告推送系统及方法,利用文本内容采集、词嵌入模型、语义网络构建、混沌映射和时间序列分析等技术,实现了一种高效、准确的广告推送方案。
为了解决上述问题,本发明的技术方案是这样实现的:
基于情感分析的广告推送系统,所述系统包括:文本内容采集部分,用于采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;语义网络构建部分,用于基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;混沌映射部分,用于基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;混沌时间序列分析部分,用于在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;广告推送部分,用于根据提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。
进一步的,所述文本内容采集部分对输入文本进行预处理过程包括:对输入文本进行去除停用词、去除标点符号和进行次还原处理,得到预处理文本。
进一步的,所述词嵌入模型为GloVe模型、Word2Vec模型或BERT模型。
进一步的,所述混沌映射部分中预设的映射函数使用如下公式进行表示:
其中,xt表示当前时间步长迭代步骤的值,xt+1表示下一时间步长迭代步骤的值,α是映射函数的调整参数,控制映射的非线性程度,p是中心词汇相似度;t为时间步长;
在使用映射函数将词嵌入向量映射到混沌个空间时,对于每个词嵌入向量vi,将其作为初始值x0;同时,在语义网络中,设定一个上下文窗口大小,以待映射的词嵌入向量为中心,将上下文窗口大小覆盖下的其他词嵌入向量作为其相邻词嵌入向量;计算待映射的词嵌入向量与所有相邻词嵌入向量的归一化语义关系的强度的归一化值作为中心词汇相似度;针对每个词嵌入向量,使用映射函数将得到其对应的一组混沌序列,将该混沌序列,作为词嵌入向量的混沌时间序列。
进一步的,所述中心词汇相似度使用如下公式计算得到:
其中,vi是待映射的词嵌入向量,vj是相邻词嵌入向量,α是映射函数的调整参数,控制映射的非线性程度;N表示待映射的词嵌入向量的相邻词嵌入向量的数量,等于设定的上下文窗口大小的值。
进一步的,所述混沌时间序列分析部分,在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数的方法包括:将语义网络中的每条边视为一个轨道,随机选择一个节点作为初始条件,从初始条件开始,选择与初始条件对应的节点相连接的边视为一个主轨道;然后,选择一个与主轨道的空间垂直距离在设定阈值范围内的边作为相邻轨道;对于每个时间步长,计算主轨道和相邻轨道之间的欧氏距离,该欧式距离表示第i个时间步长时,主轨道和相邻轨道之间的距离为di;利用主轨道和相邻轨道之间的距离,计算Lyapunov指数。
进一步的,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中,t是时间步长的总数;di是第i个时间步长时,主轨道和相邻轨道之间的距离;d0是初始时刻的距离,d0=10-6。
进一步的,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中T是为时间步长的总数。
进一步的,所述时间步长的总数为设定值,取值为正整数。
一种基于情感分析的广告推送方法,所述方法包括以下步骤:
步骤1:采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;
步骤2:基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;
步骤3:基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;
步骤4:在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;
步骤5:提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。
本发明的基于情感分析的广告推送系统及方法,具有以下有益效果:
提升广告推送准确性:传统的广告推送往往基于用户的基本信息或浏览行为,缺乏对用户情感状态的准确把握。而本发明通过情感分析技术,能够从用户输入的文本内容中提取情感信息,并将其转化为情感点进行分析和推送。这样可以更准确地把握用户的情感需求和偏好,实现精准的广告推送,提高广告的点击率和转化率。
深度挖掘用户情感需求:本发明利用词嵌入模型将文本内容转换为向量表示,并构建语义网络来捕捉词嵌入向量之间的语义关系。通过混沌映射和时间序列分析,识别和提取具有情感特征的情感点,进一步挖掘用户情感需求。这样可以更全面、细致地了解用户的情感状态和偏好,为广告推送提供更具个性化和针对性的内容,增加用户的满意度和忠诚度。
实现动态和实时的广告定制:本发明利用混沌时间序列分析技术,通过计算Lyapunov指数来识别情感点。这些情感点反映了用户情感状态的突变和显著变化,对应于用户需求的变化和转折点。基于这些情感点,可以动态地调整广告推送策略,实时地定制和优化广告内容。这样能够更好地满足用户的变化需求,提供与用户情感状态高度匹配的广告体验。
提升用户体验和广告效果:本发明的广告推送系统能够根据提取到的情感点,从预先建立的广告内容库中检索到与情感点相关的广告内容进行推送。这样可以提供与用户情感需求高度匹配的广告信息,增加用户对广告的关注度和兴趣度,提升用户体验。同时,由于广告内容与用户情感状态高度契合,广告效果也会得到显著提升,提高广告的点击率、转化率和投资回报率。
附图说明
图1为本发明实施例提供的基于情感分析的广告推送系统的系统结构示意图。
具体实施方式
为了使本公开所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本公开进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本公开,并不用于限定本公开。。
参考图1,基于情感分析的广告推送系统,所述系统包括:文本内容采集部分,用于采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;语义网络构建部分,用于基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;混沌映射部分,用于基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;混沌时间序列分析部分,用于在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;广告推送部分,用于根据提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。
具体的,在文本预处理阶段,系统采集用户的输入文本并进行清洗和标准化,去除噪声、标点符号和停用词,并进行词干化和词形还原等操作。这样可以减少冗余信息和噪声干扰,提取出文本的关键特征。
接下来,预处理文本通过词嵌入模型进行转换,将文本中的词语映射到一个低维向量空间中,使得词语的语义关系得以保留。常用的词嵌入模型包括Word2Vec、GloVe和BERT等。
基于得到的词嵌入向量,构建语义网络。在语义网络中,每个节点代表一个词嵌入向量,节点之间的边表示词嵌入向量之间的语义关系。常用的语义关系度量是词嵌入向量之间的余弦相似度,它可以衡量向量之间的语义相似程度。
通过建立语义网络,系统可以捕捉词语之间的语义关联,从而更好地理解文本中的情感表达和情感倾向。
系统利用预设的映射函数将语义网络中的词嵌入向量映射到混沌空间。混沌空间是一个具有复杂、非线性特征的数学空间,它具有高度的不确定性和敏感性。
通过将词嵌入向量映射到混沌空间,系统可以构造混沌时间序列。混沌时间序列是在混沌系统中生成的一系列动态数据点,它具有非线性、随机和复杂的特征。这些时间序列可以提供关于词嵌入向量的动态特性和变化模式的信息。
在混沌时间序列分析阶段,系统对语义网络中的混沌时间序列进行时间序列分析。其中,关键的指标是Lyapunov指数,它是衡量混沌系统敏感性和预测能力的指标。Lyapunov指数描述了系统状态的指数级变化速率,可用于评估混沌时间序列的复杂程度。
系统设定一个Lyapunov指数的阈值,当计算得到的Lyapunov指数超过设定的阈值时,系统将该时间序列对应的词嵌入向量视为一个情感点。情感点表示具有情感特征的词嵌入向量,可能对应于用户表达的情感倾向或情感状态。
在广告推送阶段,系统利用提取到的情感点,即具有情感特征的词嵌入向量,提取对应的单词或关键词。这些单词可以作为用户情感倾向或需求的指示器。
系统从预先建立的广告内容库中检索包含这些单词的广告内容,并将这些内容推送给用户。通过将广告内容与用户的情感状态和需求匹配,广告推送系统能够提供更加个性化、相关和吸引用户的广告体验。
Lyapunov指数描述了系统状态的指数级变化速率。当Lyapunov指数超过阈值时,意味着对应的时间序列表现出了高度的不稳定性和复杂性。这表明词嵌入向量在混沌系统中的动态特性和变化模式与其他普通的词嵌入向量有所不同。由于Lyapunov指数的计算基于混沌系统的复杂性,当Lyapunov指数超过阈值时,表示对应的时间序列对应的词嵌入向量在混沌空间中具有较高的情感表达能力。这意味着该词嵌入向量很可能包含了用户输入文本中的情感倾向或情感状态。
优选地,所述文本内容采集部分对输入文本进行预处理过程包括:对输入文本进行去除停用词、去除标点符号和进行次还原处理,得到预处理文本。
停用词是指在文本中频繁出现但对文本含义贡献较小的常见词语,例如"a"、"the"、"is"等。这些词在情感分析中往往没有实际情感含义,因此在预处理过程中,会通过使用预定义的停用词列表或基于统计的方法,将这些停用词从输入文本中去除。标点符号在文本中用于表达语法结构和标点标记,例如句号、逗号、感叹号等。在情感分析中,标点符号通常没有实际情感含义,因此在预处理过程中,会将标点符号从输入文本中去除,以消除对情感分析的干扰。词形还原是将单词转换为它们的基本词干或词根形式的过程。在英语中,词形还原可以通过应用词法规则和词典来实现。通过将单词还原为它们的基本形式,可以减少词汇的变体,使模型更好地捕捉到单词之间的共享语义。
优选地,所述词嵌入模型为GloVe模型、Word2Vec模型或BERT模型。
GloVe模型是一种基于全局词频统计的词嵌入模型。它利用全局统计信息来学习词语之间的语义关系。GloVe模型将词语表示为稠密向量,其中向量的维度被设计为可以捕捉词语之间的共现关系。GloVe模型的训练过程使用全局词频和局部上下文词频之间的比值来优化损失函数,从而得到每个词语的向量表示。
Word2Vec模型是一种基于神经网络的词嵌入模型。它通过预测词语的上下文或根据上下文预测词语的方法来学习词向量。Word2Vec模型包括两种算法:Skip-gram和CBOW(ContinuousBag-of-Words)。Skip-gram模型通过给定中心词预测其周围的上下文词语,而CBOW模型则相反,通过给定上下文词语预测中心词。这些模型通过训练神经网络来学习词语的向量表示。
BERT模型是一种基于Transformer模型的预训练语言模型。与前两种模型不同,BERT模型旨在通过预训练阶段捕捉词语的上下文信息,并生成丰富的词嵌入表示。BERT模型采用了双向上下文建模,能够更好地理解词语在不同上下文中的含义。通过预训练和微调过程,BERT模型可以生成适用于各种下游自然语言处理任务的词向量表示。
优选地,所述混沌映射部分中预设的映射函数使用如下公式进行表示:
其中,xt表示当前时间步长迭代步骤的值,xt+1表示下一时间步长迭代步骤的值,α是映射函数的调整参数,控制映射的非线性程度,p是中心词汇相似度;t为时间步长;
在使用映射函数将词嵌入向量映射到混沌个空间时,对于每个词嵌入向量vi,将其作为初始值x0;同时,在语义网络中,设定一个上下文窗口大小,以待映射的词嵌入向量为中心,将上下文窗口大小覆盖下的其他词嵌入向量作为其相邻词嵌入向量;计算待映射的词嵌入向量与所有相邻词嵌入向量的归一化语义关系的强度的归一化值作为中心词汇相似度;针对每个词嵌入向量,使用映射函数将得到其对应的一组混沌序列,将该混沌序列,作为词嵌入向量的混沌时间序列。
参数α是映射函数的调整参数,用于控制映射的非线性程度。通过调整α的取值,可以改变映射函数的斜率和曲线形状。较大的α值会增加非线性程度,使得映射函数更为复杂,而较小的α值则使映射函数更接近线性。
公式中的p是中心词汇相似度,用于调节映射函数的变换效果。通过在映射函数中引入p,可以根据中心词汇相似度对映射结果进行平衡调节。这样可以使得具有不同相似度的词嵌入向量在混沌映射过程中得到不同的处理,从而更好地捕捉其情感特征。
公式中的非线性映射过程包括指数、对数和除法运算。指数函数exp(α·xt)对当前值xt进行非线性变换,增加了映射函数的非线性程度。除法运算和/>可以根据中心词汇相似度p进行平衡调节,确保结果在合理的范围内。
公式描述了当前值xt如何映射到下一步的值xt+1。通过反复迭代计算,将当前值映射为下一步的值,可以构造混沌时间序列。混沌时间序列具有非线性、随机和复杂的特性,能够提供有关词嵌入向量动态特性和变化模式的信息。
优选地,所述中心词汇相似度使用如下公式计算得到:
其中,vi是待映射的词嵌入向量,vj是相邻词嵌入向量,α是映射函数的调整参数,控制映射的非线性程度;N表示待映射的词嵌入向量的相邻词嵌入向量的数量,等于设定的上下文窗口大小的值。
本公式中的vi·vj表示中心词嵌入向量vi与相邻词嵌入向量vj之间的内积操作。内积可以衡量两个向量之间的相似度或相关性,值越大表示相似度越高。通过计算内积,可以度量中心词嵌入向量与相邻词嵌入向量之间的相似性程度。
公式中的指数函数exp(α·vi·vj)对内积相似度进行映射和放大。指数函数可以将相似度值非线性地映射到一个更大的范围,通过调整参数α控制映射的非线性程度。较大的α值会增强相似度的非线性变换效果,使得相似度值更为敏感。
公式中的分母表示对所有相邻词嵌入向量的相似度进行求和。这个求和操作的目的是对相似度值进行归一化处理,将其转化为概率分布形式。通过将相似度值除以总和,可以确保计算得到的中心词汇相似度p处于[0,1]的范围内,表示相似度的概率分布。
综上所述,通过本公式中的内积相似度计算、指数映射和非线性调节,以及归一化处词嵌入向量之间的关联程度或相似性程度。中心词汇相似度的计算可以用于在混沌映射部分中调节映射函数的变换效果,从而影响混沌时间序列的构造和后续情感点的提取。
优选地,所述混沌时间序列分析部分,在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数的方法包括:将语义网络中的每条边视为一个轨道,随机选择一个节点作为初始条件,从初始条件开始,选择与初始条件对应的节点相连接的边视为一个主轨道;然后,选择一个与主轨道的空间垂直距离在设定阈值范围内的边作为相邻轨道;对于每个时间步长,计算主轨道和相邻轨道之间的欧氏距离,该欧式距离表示第i个时间步长时,主轨道和相邻轨道之间的距离为di;利用主轨道和相邻轨道之间的距离,计算Lyapunov指数。
具体的,在语义网络中,每条边表示混沌时间序列中的一个状态或节点之间的关系。通过将每条边视为一个轨道,可以将混沌时间序列的演化过程表示为节点之间的跃迁。选择一个节点作为初始条件,并选择与初始条件对应的边作为一个主轨道。主轨道代表了初始条件对应的词嵌入向量在混沌时间序列中的演化路径。通过选择不同的初始条件和主轨道,可以探索混沌系统的不同演化模式。在混沌空间中,根据设定的阈值,选择与主轨道的空间垂直距离在阈值范围内的边作为相邻轨道。相邻轨道表示与主轨道在混沌空间中接近的其他演化路径。选择相邻轨道的目的是捕捉到混沌系统中不同轨道之间的关联性。对于每个时间步长,计算主轨道和相邻轨道之间的欧氏距离。欧氏距离是一种常用的距离度量,用于衡量两个轨道之间的差异或分离程度。通过计算欧氏距离,可以量化主轨道和相邻轨道之间的距离。利用主轨道和相邻轨道之间的距离,计算Lyapunov指数。Lyapunov指数用于衡量混沌系统中相邻轨道的分离速度或分离指数。一般来说,Lyapunov指数是通过对距离进行指数平均或积分来计算的。Lyapunov指数越大,表示系统的敏感性越高,轨道之间的分离速度越快。
优选地,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中,t是时间步长的总数;di是第i个时间步长时,主轨道和相邻轨道之间的距离;d0是初始时刻的距离,d0=10-6。
优选地,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中T是为时间步长的总数。
在连续时间情况下,Lyapunov指数通过求取轨道距离比值的极限来计算。公式中的表示在时间步长为t的过程中,计算主轨道和相邻轨道之间距离比值的自然对数,并对所有时间步长求取平均。这个平均值表示了轨道的分离速率。当时间步长t趋于无穷大时,Lyapunov指数λ表示轨道的指数分离速率。
在离散时间情况下,通过对一段时间内的距离比值取平均来近似计算Lyapunov指数。公式中的表示对一段时间内的主轨道和相邻轨道之间距离比值的自然对数进行求和,并对时间步长的总数T求取平均。这个平均值近似表示轨道的分离速率。
Lyapunov指数描述了混沌系统中轨道的指数分离性质。当Lyapunov指数为正时,表示系统的轨道在相空间中指数级地分离,表现出混沌行为;当Lyapunov指数为负时,表示系统的轨道会趋向于聚集在一起,表现出稳定行为。
通过计算Lyapunov指数,可以评估混沌系统的敏感性和预测能力。在混沌时间序列分析部分,计算Lyapunov指数有助于识别具有情感特征的情感点,即混沌时间序列中的显著变化点。这些情感点对应于混沌系统中的状态变化,可以通过提取相关的词嵌入向量和单词,为后续的广告推送提供准确的情感定位和目标定制。
优选地,所述时间步长的总数为设定值,取值为正整数。
一种基于情感分析的广告推送方法,所述方法包括以下步骤:
步骤1:采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;
步骤2:基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;
步骤3:基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;
步骤4:在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;
步骤5:提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
以上参照附图说明了本公开的优选实施例,并非因此局限本公开的权利范围。本领域技术人员不脱离本公开的范围和实质内所作的任何修改、等同替换和改进,均应在本公开的权利范围之内。
Claims (6)
1.基于情感分析的广告推送系统,其特征在于,所述系统包括:文本内容采集部分,用于采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;语义网络构建部分,用于基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;混沌映射部分,用于基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;混沌时间序列分析部分,用于在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;广告推送部分,用于根据提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送;所述混沌映射部分中预设的映射函数使用如下公式进行表示:
其中,xt表示当前时间步长迭代步骤的值,xt+1表示下一时间步长迭代步骤的值,α是映射函数的调整参数,控制映射的非线性程度,p是中心词汇相似度;t为时间步长;
在使用映射函数将词嵌入向量映射到混沌个空间时,对于每个词嵌入向量vi,将其作为初始值x0;同时,在语义网络中,设定一个上下文窗口大小,以待映射的词嵌入向量为中心,将上下文窗口大小覆盖下的其他词嵌入向量作为其相邻词嵌入向量;计算待映射的词嵌入向量与所有相邻词嵌入向量的归一化语义关系的强度的归一化值作为中心词汇相似度;针对每个词嵌入向量,使用映射函数将得到其对应的一组混沌序列,将该混沌序列,作为词嵌入向量的混沌时间序列;
所述混沌时间序列分析部分,在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数的方法包括:将语义网络中的每条边视为一个轨道,随机选择一个节点作为初始条件,从初始条件开始,选择与初始条件对应的节点相连接的边视为一个主轨道;然后,选择一个与主轨道的空间垂直距离在设定阈值范围内的边作为相邻轨道;对于每个时间步长,计算主轨道和相邻轨道之间的欧氏距离,该欧式距离表示第i个时间步长时,主轨道和相邻轨道之间的距离为di;利用主轨道和相邻轨道之间的距离,计算Lyapunov指数;
在连续时间情况下,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中,t是时间步长的总数;di是第i个时间步长时,主轨道和相邻轨道之间的距离;d0是初始时刻的距离,d0=10-6;
在离散时间情况下,所述利用主轨道和相邻轨道之间的距离,计算Lyapunov指数的方法包括:使用如下公式计算Lyapunov指数:
其中T是为时间步长的总数。
2.如权利要求1所述的基于情感分析的广告推送系统,其特征在于,所述文本内容采集部分对输入文本进行预处理过程包括:对输入文本进行去除停用词、去除标点符号和进行次还原处理,得到预处理文本。
3.如权利要求2所述的基于情感分析的广告推送系统,其特征在于,所述词嵌入模型为GloVe模型、Word2Vec模型或BERT模型。
4.如权利要求3所述的基于情感分析的广告推送系统,其特征在于,所述中心词汇相似度使用如下公式计算得到:
其中,vi是待映射的词嵌入向量,vj是相邻词嵌入向量,α是映射函数的调整参数,控制映射的非线性程度;N表示待映射的词嵌入向量的相邻词嵌入向量的数量,等于设定的上下文窗口大小的值。
5.如权利要求4所述的基于情感分析的广告推送系统,其特征在于,所述时间步长的总数为设定值,取值为正整数。
6.一种用于实现权利要求1至5之一任意一项所述系统的基于情感分析的广告推送方法,其特征在于,所述方法包括以下步骤:
步骤1:采集用户的输入文本,并将输入文本进行预处理,得到预处理文本,将预处理文本使用词嵌入模型转换为向量表示,得到词嵌入向量;
步骤2:基于词嵌入向量构建语义网络,语义网络中的每个节点代表一个词嵌入向量,每个边表示两个词嵌入向量之间的语义关系;所述语义关系的强度为词嵌入向量的余弦相似度;
步骤3:基于预设的映射函数,将语义网络中的每个词嵌入向量映射到混沌空间,再基于映射到混沌空间中的词嵌入向量构造混沌时间序列;
步骤4:在语义网络中对混沌时间序列进行时间序列分析,计算Lyapunov指数,设定一个阈值,当计算出的Lyapunov指数超过阈值时,则将该时间序列对应的词嵌入向量视为一个情感点,提取该词嵌入向量对应的单词;
步骤5:提取到的词嵌入向量的单词,从预先建立的广告内容库中检索到包含该单词的广告内容,进行推送。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310814597.2A CN116805256B (zh) | 2023-07-04 | 2023-07-04 | 基于情感分析的广告推送系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310814597.2A CN116805256B (zh) | 2023-07-04 | 2023-07-04 | 基于情感分析的广告推送系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116805256A CN116805256A (zh) | 2023-09-26 |
CN116805256B true CN116805256B (zh) | 2024-06-21 |
Family
ID=88080678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310814597.2A Active CN116805256B (zh) | 2023-07-04 | 2023-07-04 | 基于情感分析的广告推送系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116805256B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5918236A (en) * | 1996-06-28 | 1999-06-29 | Oracle Corporation | Point of view gists and generic gists in a document browsing system |
US7103915B2 (en) * | 2000-11-13 | 2006-09-05 | Digital Doors, Inc. | Data security system and method |
CA2391224A1 (en) * | 2001-06-25 | 2002-12-25 | Jonni Turner | System and method for recombinant media |
WO2004054649A1 (ja) * | 2002-12-12 | 2004-07-01 | Hidenori Ito | サウンド生成方法、コンピュータ読み取り可能な記憶媒体、スタンドアロン型サウンド生成再生装置及びネットワーク配信型サウンド生成再生システム |
CN104951786A (zh) * | 2015-06-08 | 2015-09-30 | 苏州珂锐铁电气科技有限公司 | 基于概率潜在语义分析模型的动态纹理识别和定位方法 |
CN105760445A (zh) * | 2016-02-03 | 2016-07-13 | 北京光年无限科技有限公司 | 用于过滤垃圾词的方法及系统 |
CN109034223A (zh) * | 2018-07-16 | 2018-12-18 | 湖南城市学院 | 一种混沌时间序列预测方法及系统 |
CN109543841A (zh) * | 2018-11-09 | 2019-03-29 | 北京泊远网络科技有限公司 | 深度学习方法、装置、电子设备及计算机可读介质 |
CN110598207B (zh) * | 2019-08-14 | 2020-09-01 | 华南师范大学 | 一种词向量获取方法、装置及存储介质 |
CN110825849A (zh) * | 2019-11-05 | 2020-02-21 | 泰康保险集团股份有限公司 | 文本信息情感分析方法、装置、介质及电子设备 |
CN113327122A (zh) * | 2020-02-28 | 2021-08-31 | 株式会社野村综合研究所 | 顾客分析装置 |
US11042700B1 (en) * | 2020-04-16 | 2021-06-22 | Capital One Services, Llc | Conciseness reconstruction of a content presentation via natural language processing |
US11586826B2 (en) * | 2020-10-01 | 2023-02-21 | Crowdsmart, Inc. | Managing and measuring semantic coverage in knowledge discovery processes |
CN113343706B (zh) * | 2021-05-27 | 2023-10-31 | 山东师范大学 | 基于多模态特征和语义规则的文本抑郁倾向检测系统 |
CN115731946A (zh) * | 2021-08-25 | 2023-03-03 | 中国移动通信集团天津有限公司 | 语音情感识别方法、装置、设备及存储介质 |
CN115270873A (zh) * | 2022-07-27 | 2022-11-01 | 中国银行股份有限公司 | 基于情感状态的资讯推荐生成方法及装置 |
-
2023
- 2023-07-04 CN CN202310814597.2A patent/CN116805256B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116805256A (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN108717408B (zh) | 一种敏感词实时监控方法、电子设备、存储介质及系统 | |
CN110309114B (zh) | 媒体信息的处理方法、装置、存储介质和电子装置 | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
CN111414461A (zh) | 一种融合知识库与用户建模的智能问答方法及系统 | |
CN108304479B (zh) | 一种基于图结构过滤的快速密度聚类双层网络推荐方法 | |
CN109086265B (zh) | 一种语义训练方法、短文本中多语义词消歧方法 | |
KR20200007713A (ko) | 감성 분석에 의한 토픽 결정 방법 및 장치 | |
CN107357793A (zh) | 信息推荐方法和装置 | |
CN110046943B (zh) | 一种网络消费者细分的优化方法及优化系统 | |
CN110598207A (zh) | 一种词向量获取方法、装置及存储介质 | |
CN117251551B (zh) | 一种基于大语言模型的自然语言处理系统及方法 | |
CN111241425A (zh) | 一种基于层次注意力机制的poi推荐方法 | |
CN113343120A (zh) | 基于情感防护的新闻智能推荐系统 | |
Manik et al. | Out-of-Scope Intent Detection on A Knowledge-Based Chatbot. | |
Üstün et al. | Unsupervised morphological segmentation using neural word embeddings | |
Lauren et al. | A low-dimensional vector representation for words using an extreme learning machine | |
Biggers et al. | A deep semantic matching approach for identifying relevant messages for social media analysis | |
CN116501840B (zh) | 一种用于获客营销的nlp智能分析方法 | |
CN116415593B (zh) | 一种研究前沿识别方法、系统、电子设备及存储介质 | |
CN110580280B (zh) | 新词的发现方法、装置和存储介质 | |
CN116805256B (zh) | 基于情感分析的广告推送系统及方法 | |
CN116756347A (zh) | 一种基于大数据的语义信息检索方法 | |
CN111767404A (zh) | 一种事件挖掘方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |