CN117851689A

CN117851689A - 基于用户行为分析的搜索引擎精准推荐方法

Info

Publication number: CN117851689A
Application number: CN202410263010.8A
Authority: CN
Inventors: 路华; 孟超然
Original assignee: Shandong Yiran Information Technology Co ltd
Current assignee: Shandong Yiran Information Technology Co ltd
Priority date: 2024-03-08
Filing date: 2024-03-08
Publication date: 2024-04-09

Abstract

本发明涉及内容推荐技术领域，具体涉及基于用户行为分析的搜索引擎精准推荐方法，包括以下步骤：用户行为收集；利用机器学习算法分析用户行为，对不同设备使用习惯和浏览深度、速度进行分析，以提取用户的具体偏好；生成用户画像，基于行为数据分析结果，考虑不同设备使用习惯和浏览深度及速度，创建详细用户画像；推荐算法优化，根据用户画像，包括用户的设备偏好和浏览习惯，优化搜索引擎的推荐算法；结果呈现，将优化后的搜索结果呈现，确保结果符合用户在不同设备上的使用习惯和浏览偏好。本发明，深入的行为数据分析使得推荐系统不仅反映了用户的显性需求，还能洞察到隐性的兴趣和习惯，从而提供更个性化的搜索体验。

Description

基于用户行为分析的搜索引擎精准推荐方法

技术领域

本发明涉及内容推荐技术领域，尤其涉及基于用户行为分析的搜索引擎精准推荐方法。

背景技术

现代搜索引擎技术已经实现了信息检索的高效性和广泛性，主要通过关键词匹配和基本的用户偏好分析来提供搜索结果，这些技术依赖于复杂的算法和大规模的数据索引，旨在从海量信息中快速提取相关内容，然而，尽管当前的搜索引擎在处理大量数据方面非常高效，它们在个性化和深入理解用户需求方面仍然存在限制。

缺乏深入的用户行为理解：目前的搜索引擎主要关注用户的显性搜索行为（如输入的关键词），而对用户的隐性需求（如浏览习惯、设备使用偏好）的理解不足。

个性化推荐的不足：虽然一些搜索引擎尝试通过跟踪用户的搜索历史来实现个性化，但这种方法往往不能全面反映用户的多元化需求和动态变化的兴趣。

跨设备搜索体验的一致性问题：随着多种设备的普及，用户的搜索行为在不同设备之间存在差异，现有技术未能充分适应这种跨设备的搜索体验。

随着人工智能和机器学习技术的发展，存在着对更智能、更个性化的搜索引擎技术的需求。这包括利用先进的数据分析技术深入理解用户的行为和偏好，并根据这些信息提供更加定制化的搜索结果，此外，随着用户在多种设备上进行搜索的趋势，对于能够跨设备提供一致且高质量搜索体验的技术的需求也在增长。

总结而言，尽管当前的搜索引擎技术在信息检索方面取得了巨大进展，但在个性化推荐、用户行为深度理解以及跨设备体验优化方面仍有待提升。

发明内容

基于上述目的，本发明提供了基于用户行为分析的搜索引擎精准推荐方法。

基于用户行为分析的搜索引擎精准推荐方法，包括以下步骤：

S1：用户行为收集，记录用户在目标搜索引擎的搜索历史、点击行为、页面停留时间，收集用户在不同设备上的搜索行为以及用户在目标搜索引擎的浏览深度和浏览速度；

S2：行为数据分析，利用机器学习算法分析用户行为，对不同设备使用习惯和浏览深度、速度进行分析，以提取用户的具体偏好；

S3：生成用户画像，基于行为数据分析结果，考虑不同设备使用习惯和浏览深度及速度，创建详细用户画像；

S4：推荐算法优化，根据用户画像，包括用户的设备偏好和浏览习惯，优化搜索引擎的推荐算法；

S5：结果呈现，将优化后的搜索结果呈现，确保结果符合用户在不同设备上的使用习惯和浏览偏好。

进一步的，所述S1具体包括：

S11，自动记录用户在目标搜索引擎上的每次搜索查询，包括搜索词、搜索时间和日期；

S12，监测和记录用户在搜索结果页面上的点击行为，包括点击的链接、点击时间以及点击顺序；

S13，记录用户在每个搜索结果页面上的停留时间，以衡量用户对特定内容的兴趣程度；

S14，识别用户使用的设备类型（手机、平板电脑、台式机等），并记录在不同设备上的搜索行为，包括设备特定的搜索查询和点击行为；

S15，评估用户在搜索结果页面的浏览深度（是否浏览至下一页）和浏览速度（页面间的快速切换或慢速阅读），推断用户对内容的兴趣和阅读习惯；

S16，对收集的数据被汇总和分析，以揭示用户的搜索偏好、兴趣领域以及在不同设备上的使用习惯。

进一步的，所述S2具体包括：

S21，设备使用习惯分析：应用机器学习算法分析用户在不同设备上的搜索行为差异，识别用户在各类设备上的偏好模式；

S22，浏览深度和速度模式识别：使用长短期记忆网络（LSTM），分析用户浏览网页的深度和速度，推断用户对内容的关注度和阅读习惯；

S23，个性化偏好提取：结合设备使用习惯和浏览深度、速度分析结果，运用K-均值聚类分析，综合识别和提取用户的个性化偏好；

S24，动态学习和优化：利用强化学习算法持续优化模型，以适应用户偏好和行为的变化，根据用户对推荐内容的实时反馈动态调整推荐策略。

进一步的，所述机器学习算法基于支持向量机（SVM）来分类和回归分析，找到一个超平面，使不同类别的数据被最大间隔分开，其中，

决策函数为：；

其中，表示向量和的内积，是拉格朗日乘子，是训练样本的类别标签；

目标函数为：；同时满足且。

进一步的，所述K均值聚类是无监督学习算法，用于将数据点划分为个集群，目标函数为：，其中，是第个集群中的数据点集合，是的均值。

进一步的，所述强化学习算法基于深度Q网络(DQN)，深度Q网络结合Q学习的原理和深度神经网络,用于在具有连续状态空间的问题中学习策略，Q学习更新规则为：

其中，是在状态下采取动作的预期回报，是学习率，是收到的奖励，是折扣因子。

进一步的，所述S3中的用户画像具体包括：

用户的设备偏好和在不同设备上的搜索习惯；

用户对各类内容的兴趣级别；

用户的信息消费模式，包括偏好快速浏览或深入阅读；

用户搜索活动的时间模式，包括特定时间段内的活跃度。

进一步的，所述S4具体包括：

设备偏好适应：根据用户画像中识别的设备使用偏好，调整推荐内容的呈现方式；

浏览习惯定制：利用用户画像中的浏览习惯数据，包括页面停留时间和浏览深度，调整推荐内容的深度和复杂度；

个性化推荐：结合用户的兴趣点、搜索历史和互动模式，提供个性化的搜索推荐。

进一步的，所述S4还包括动态优化，所述动态优化包括：

实时监控用户对推荐内容的点击率和互动情况，定期分析用户反馈数据，包括显式反馈（评分、评论）和隐式反馈（停留时间、浏览路径），以识别推荐内容的优势和不足，根据反馈数据，定期更新推荐算法，确保推荐内容与用户的最新偏好和行为模式保持一致。

本发明的有益效果：

本发明，通过对用户的搜索历史、点击行为、页面停留时间、浏览深度和速度等行为数据进行全面分析，能够精准地识别用户的兴趣点和浏览习惯，使用高级的机器学习技术，支持向量机（SVM）和K-均值聚类，能够从大量复杂数据中提取出用户的具体偏好模式，深入的行为数据分析使得推荐系统不仅反映了用户的显性需求，还能洞察到隐性的兴趣和习惯，从而提供更个性化的搜索体验。

本发明，利用收集和分析得到的行为数据，在创建用户画像时能够考虑用户的多维度信息，包括在不同设备上的使用习惯、信息获取的模式（快速浏览或深入阅读）、兴趣的广度和深度，这些画像不仅全面，而且具有动态性，能够根据用户行为的变化进行实时更新，保证了推荐内容随着用户的变化而适时调整，持续保持相关性和吸引力。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的推荐方法流程示意图；

图2为本发明实施例的行为数据分析流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本发明进一步详细说明。

需要说明的是，除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

如图1-2所示，基于用户行为分析的搜索引擎精准推荐方法，包括以下步骤：

S2：行为数据分析，利用机器学习算法分析用户行为，对不同设备使用习惯和浏览深度、速度进行分析，以提取用户的具体偏好，识别用户是否倾向于在特定设备上进行快速浏览或深入阅读；

S3：生成用户画像，基于行为数据分析结果，考虑不同设备使用习惯和浏览深度及速度，创建详细用户画像，这些画像不仅反映了用户的兴趣领域，还揭示了用户获取和处理信息的特定方式；

S4：推荐算法优化，根据用户画像，包括用户的设备偏好和浏览习惯，优化搜索引擎的推荐算法，对于经常在手机上进行快速搜索的用户，优化算法以提供更简洁、直接的搜索结果；

S5：结果呈现，将优化后的搜索结果呈现，确保结果符合用户在不同设备上的使用习惯和浏览偏好；

根据用户对推荐结果的反应，进一步调整推荐算法，持续监测用户对不同设备和浏览模式下推荐内容的反应，以细化算法调整。

S1具体包括：

S14，识别用户使用的设备类型（如手机、平板电脑、台式机等），并记录在不同设备上的搜索行为，包括设备特定的搜索查询和点击行为；

S2具体包括：

S22，浏览深度和速度模式识别：使用长短期记忆网络（LSTM），分析用户浏览网页的深度和速度，推断用户对内容的关注度和阅读习惯，长短期记忆网络LSTM单元包括四个主要部分：遗忘门（forget gate）、输入门（input gate）、细胞状态（cell state）和输出门（output gate）。这些部分共同工作，以决定网络应该存储、遗忘或输出什么信息，具体如下：

1.遗忘门(ForgetGate)：

其中是遗忘门的输出，是sigmoid函数，是遗忘门的权重矩阵，是上一时间步的LSTM单元输出，是当前时间步的输入，是偏差项。

2.输入门(InputGate)：

；

其中是输入门的激活函数，是候选细胞状态，分别是输入门和候选细胞状态的权重矩阵，是偏差项。

3.细胞状态更新(CellStateUpdate)：；

其中是当前细胞状态，是前一时间步的细胞状态。

4.输出门(OutputGate)和输出状态(OutputState)：

；

其中是输出门的激活函数，是输出门的权重矩阵，是偏差项，是当前时间步的输出。

在本发明中，LSTM用于分析用户的浏览深度和速度，是用户在特定时间点的行为特征(页面停留时间、点击行为等)，而LSTM网络的输出代表用户的浏览行为模式，通过训练LSTM网络，预测用户的行为趋势，并据此调整搜索引擎的推荐策略；

通过这种综合运用多种机器学习技术的方法，可以确保搜索引擎推荐系统不仅能精准地识别用户的内容偏好，而且能够根据用户的设备使用习惯和浏览方式提供更适宜的内容形式，系统设计既体现了创新性，又完美融合了您提出的核心想法，有效提升了搜索引擎推荐的个性化和用户满意度。

机器学习算法基于支持向量机（SVM）来分类和回归分析，找到一个超平面，使不同类别的数据被最大间隔分开，其中，

决策函数为：；

目标函数为：；同时满足且；

具体的参数定义为：

(拉格朗日乘子)：每个数据点对分类决策的影响程度。

(类别标签)：表示用户使用的设备类型。

应用：首先，收集包括设备类型、搜索查询、点击模式、页面停留时间特征的数据，使用这些数据训练SVM模型，训练过程中，算法尝试找到能够最大程度区分不同设备使用习惯的超平面，利用决策函数描述如何根据输入特征(用户的行为数据)来预测用户的设备偏好，这里，表示输入向量与训练数据的内积，其结果与拉格朗日乘子和类别标签结合，产生最终的分类决策。

K均值聚类是无监督学习算法，用于将数据点划分为个集群，目标函数为：，其中，是第个集群中的数据点集合，是的均值；

具体的参数定义为：

(簇中心)：代表了用户偏好的“中心点”，如某一类搜索和浏览行为的典型模式。

(数据点集合)：包含了具有相似搜索和浏览行为的用户群体。

应用：使用用户的行为数据(搜索词、点击的内容类型、互动频率等)作为输入，算法尝试将用户分成若干个群组，使得同一群组内的用户行为尽可能相似，而不同群组间的用户行为尽可能不同，使用目标函数描述聚类过程中的优化目标，即最小化每个群组内用户行为与该群组中心点的差异，每个群组的中心代表了该群组用户行为的平均或典型模式，通过分析这些中心点，可以识别出用户的个性化偏好。

强化学习算法基于深度Q网络(DQN)，深度Q网络结合Q学习的原理和深度神经网络,用于在具有连续状态空间的问题中学习策略，Q学习更新规则为：

其中，是在状态下采取动作的预期回报，是学习率，是收到的奖励，是折扣因子；

具体的参数定义为：

(动作价值函数)：表示在特定搜索场景(状态)下，采取特定行动（如推荐特定内容的预期效用。

(学习率)：决定了新学习信息覆盖旧信息的速度。

(即时奖励)：用户对推荐内容反应的即时评价，如点击表示正面反馈。

(折扣因子)：决定了未来奖励相对于即时奖励的重要性。

应用：DQN结合了深度学习和强化学习原理，用于根据用户对推荐内容的反馈(如点击、忽略)来优化搜索推荐策略，在强化学习框架下，搜索推荐系统被视为一个智能体 (agent)，该智能体通过与环境(用户)的互动来学习如何提高推荐的有效性，Q学习更新规则表示系统更新其行动(推荐内容)的预期回报的方式，这里，代表在特定状态(用户的当前需求)下采取特定行动(特定推荐)的预期回报，通过这种方式，学习哪些类型的推荐最能引起用户的积极反应，从而不断调整和优化推荐策略。

S3中的用户画像具体包括：

用户的设备偏好和在不同设备上的搜索习惯；

用户对各类内容（新闻、学术文章、娱乐信息等）的兴趣级别；

用户的信息消费模式，包括偏好快速浏览或深入阅读；

用户搜索活动的时间模式，包括特定时间段内的活跃度。

S4具体包括：

设备偏好适应：根据用户画像中识别的设备使用偏好，调整推荐内容的呈现方式；例如：

移动设备用户：为在移动设备（智能手机、平板）上搜索的用户提供适合小屏幕的内容，包括简短的文本摘要、较大的图片和触控友好的界面设计。

台式机/笔记本用户：为在台式机或笔记本上搜索的用户提供更丰富的内容格式，包括详细的文章、复杂的图表和交互式元素。

跨设备用户：对于同时在多种设备上活跃的用户，动态调整内容格式以适应当前使用的设备类型。

浏览习惯定制：利用用户画像中的浏览习惯数据，包括页面停留时间和浏览深度，调整推荐内容的深度和复杂度；例如：

深入阅读用户：识别喜欢深入研究的用户，并为他们推荐详尽的报告、长篇文章和深度分析。

快速浏览用户：对于倾向于快速获取信息的用户，提供摘要、图表和要点列表。

多样化浏览用户：对于既有深入阅读又有快速浏览习惯的用户，提供一个内容深度可调节的选项，让用户根据需要选择浏览模式。

个性化推荐：结合用户的兴趣点、搜索历史和互动模式，提供个性化的搜索推荐；例如：

根据用户特定的兴趣点，例如对特定主题、事件或作者的关注，提供相关内容的推荐。

分析用户的搜索历史和点击行为，预测并推荐相似或相关主题的内容。

结合用户的互动模式，如经常点击的内容类型或常访问的类别，优化推荐算法以提升相关推荐的准确性。

S4还包括动态优化，动态优化包括：

实时监控用户对推荐内容的点击率和互动情况，定期分析用户反馈数据，包括显式反馈（如评分、评论）和隐式反馈（如停留时间、浏览路径），以识别推荐内容的优势和不足，根据反馈数据，定期更新推荐算法，确保推荐内容与用户的最新偏好和行为模式保持一致。

本发明搜索引擎使用的推荐算法概述如下：

1.基于内容的推荐：

公式：

解释：这里，代表用户对项目的偏好评分，是用户的画像，是项目的特征，是一个相似度函数，如余弦相似度，用于计算用户画像和项目特征间的相似度。

2.协同过滤：

用户协同过滤：

公式：

解释：这里，代表用户对项目的偏好评分，是用户和其他用户间的相似度，是用户对项目的评分。

项目协同过滤：

公式：

解释：这里，代表用户对项目的偏好评分，是项目和其他项目间的相似度，是用户对项目的评分。

3.混合推荐系统结合了上述两种方法，使用神经网络模型来综合用户画像、项目特征和用户行为数据；

推荐系统的动态优化反馈循环：

公式：

解释：在这里，是更新后的评分，是原始评分，是学习率，是用户对项目的反馈(点击、收藏或评论)。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本发明的范围被限于这些例子；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。

本发明旨在涵盖落入权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于用户行为分析的搜索引擎精准推荐方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述S1具体包括：

S14，识别用户使用的设备类型，并记录在不同设备上的搜索行为，包括设备特定的搜索查询和点击行为；

S15，评估用户在搜索结果页面的浏览深度和浏览速度，推断用户对内容的兴趣和阅读习惯；

3.根据权利要求2所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述S2具体包括：

S22，浏览深度和速度模式识别：使用长短期记忆网络，分析用户浏览网页的深度和速度，推断用户对内容的关注度和阅读习惯；

4.根据权利要求3所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述机器学习算法基于支持向量机来分类和回归分析，找到一个超平面，使不同类别的数据被最大间隔分开，其中，

决策函数为：；

其中，表示向量/>和/>的内积，/>是拉格朗日乘子，/>是训练样本的类别标签；

目标函数为：；同时满足且/>。

5.根据权利要求3所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述K均值聚类是无监督学习算法，用于将数据点划分为个集群，目标函数为：，其中，/>是第/>个集群中的数据点集合，/>是/>的均值。

6.根据权利要求3所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述强化学习算法基于深度Q网络，深度Q网络结合Q学习的原理和深度神经网络，用于在具有连续状态空间的问题中学习策略，Q学习更新规则为：

其中，是在状态/>下采取动作/>的预期回报，/>是学习率，/>是收到的奖励，/>是折扣因子。

7.根据权利要求3所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述S3中的用户画像具体包括：

用户的设备偏好和在不同设备上的搜索习惯；

用户对各类内容的兴趣级别；

用户的信息消费模式，包括偏好快速浏览或深入阅读；

用户搜索活动的时间模式，包括特定时间段内的活跃度。

8.根据权利要求3所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述S4具体包括：

9.根据权利要求8所述的基于用户行为分析的搜索引擎精准推荐方法，其特征在于，所述S4还包括动态优化，所述动态优化包括：

实时监控用户对推荐内容的点击率和互动情况，定期分析用户反馈数据，包括显式反馈和隐式反馈，以识别推荐内容的优势和不足，根据反馈数据，定期更新推荐算法，确保推荐内容与用户的最新偏好和行为模式保持一致。