CN110737812A

CN110737812A - 一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法

Info

Publication number: CN110737812A
Application number: CN201910891613.1A
Authority: CN
Inventors: 陈岭; 范阿琳
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2019-09-20
Filing date: 2019-09-20
Publication date: 2020-01-31

Abstract

本发明公开了一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法，具体包括以下步骤：1)利用人工标注获取初始的有标注数据；2)同时使用有标注数据和无标注数据来训练基于半监督学习的用户满意度分类器；3)引入一种整合选择策略来挑选出最具代表性和最富信息量的争议数据给标注人员标注，并更新有标注数据和无标注数据；4)重复训练基于半监督学习的用户满意度分类器和挑选争议数据的过程直至耗尽所有人工标注成本；5)利用构建的用户满意度分类器识别给定样本的用户满意度标签。本发明方法能够促进搜索引擎技术的发展，方便人们的生产生活。

Description

一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法

技术领域

本发明涉及互联网信息技术领域，尤其涉及一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法。

背景技术

搜索引擎是用户访问万维网查找和获取资源信息的主要工具之一。随着互联网信息数据规模急速膨胀，用户对于高效便捷获取信息资源的要求越来越高，搜索引擎需要不断地进行算法改进和系统优化来满足用户日益增长的信息需求和高效方便获取信息资源的要求，因此，如何有效评估搜索引擎的质量成为了研究界与产业界关注的焦点。

搜索满意度是基于用户搜索体验来评估搜索引擎质量的重要指标之一。大多数现有的搜索引擎用户满意度评估方法通常将该任务转化为二分类问题，通过有监督学习的方法对搜索引擎日志中的用户行为数据进行建模，进而评估该搜索任务对用户是满意的或不满意的。

然而，这些方法存在的问题是，需要大量的有标注数据作为训练样本，以获得有效的搜索满意度评估模型。如果模型的训练样本数量不足，则会导致训练出的模型出现过拟合的问题。而在实际的应用场景中，由于难以直接采集到用户对当前搜索结果是否满意的信息，搜索引擎日志中仅可获取到大量的无标注用户搜索行为数据。此外，考虑到通过人工标注的方式对所有的无标注数据打标签既费时、费力、成本又高，因此有标注的用户搜索行为数据往往是非常有限的。

为了解决这个问题，研究人员提出通过半监督学习的方式同时利用有标注数据和无标注数据来提高搜索满意度评估方法的性能。

现有的基于半监督学习的搜索满意度评估方法通常使用人工标注的方式来获取部分初始的有标注数据。然而，在执行半监督学习方法之前，这些初始的有标注数据是在没有指导的情况下随机挑选的，由于不同的数据样本对于搜索满意度评估模型的贡献度不同，这种随机挑选的方式不能保证这些数据就是最具标注价值的数据，从而无法充分利用有限的人工标注成本。

发明内容

本发明要解决的问题是如何在少量人工标注成本的情况下更有效地评估搜索引擎用户满意度。

为了解决上述问题，本发明提供了一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法，包括以下步骤：

步骤1，对搜索引擎日志进行标签标注，分为有标注数据和无标注数据，同时将搜索引擎日志划分为行为视图数据和时间视图数据，以搜索引擎日志的标签作为对应的行为视图数据和时间视图数据的标签；

步骤2，采用有标注数据和无标注数据来训练基于半监督学习的用户满意度分类器，所述用户满意度分类器包括基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型；

步骤3，引入整合选择策略挑选出争议数据给标注人员标注，并更新有标注数据和无标注数据，并利用更新后的有标注数据和无标注数据重新训练基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型，直到满足迭代终止条件，获得最终的基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型；

步骤4，利用基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型识别待识别搜索引擎日志对应的用户满意度标签。

与现有技术相比，本发明具有的有益效果为：

本发明在主动学习部分阶段性地使用给定的人工标注成本，半监督学习部分利用无标注数据提高了主动学习部分中所使用的分类器的准确率，同时，引入一种基于局部密度和分类器之间分歧程度的整合选择策略来挑选最具代表性和最富信息量的争议数据给标注人员标注，提高搜索满意度评估方法的性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他附图。

图1为融合半监督学习和主动学习的搜索引擎用户满意度评估方法流程图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

本发明要解决的问题是如何在少量人工标注成本的情况下更有效地评估搜索引擎用户满意度。为了解决该问题，本实施例提供了一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法，如图1所示，具体包括以下步骤：

步骤1，对搜索引擎日志进行标签标注，分为有标注数据和无标注数据，同时将搜索引擎日志划分为行为视图数据和时间视图数据，以搜索引擎日志的标签作为对应的行为视图数据和时间视图数据的标签。

具体地，步骤1具体包括：

步骤1-1，将搜索引擎日志以信息需求为单位进行划分，通过人工标注对随机挑选的q个信息需求赋予标签，将有标签的信息需求所对应的数据作为初始的有标注数据，将无标签的信息需求所对应的数据作为无标注数据；

步骤1-2，从每个信息需求所对应的搜索引擎日志中分别提取出行为视图数据和时间视图数据，行为视图数据是由n个行为组成的有序序列S_A＝＜a₁,a₂,...,a_n＞，时间视图数据是由n-1个停留时间组成的有序序列

信息需求对应的标签作为对应行为视图数据和时间视图数据的标签。

步骤2，采用有标注数据和无标注数据来训练基于半监督学习的用户满意度分类器，所述用户满意度分类器包括基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型。

具体地，步骤2具体包括：

步骤2-1，从有标注数据中读取行为视图数据，并将读取的行为视图数据按照满意度标签分为满意行为视图数据和不满意行为视图数据两部分；

步骤2-2，利用满意行为视图数据训练行为视图满意模型，利用不满意行为视图数据训练行为视图不满意模型，训练好的行为视图满意模型和行为视图不满意模型组成基于行为视图的用户满意度评估模型h_A。

步骤2-2中，使用生成模型来训练基于行为视图的用户满意度评估模型h_A，学习观察值和标签值的联合概率分布，并利用马尔可夫链来对任意两个行为之间的转移进行建模，通过最大似然估计来计算两个行为a_i和a_j之间的转移概率：

其中，

表示类C的行为视图数据中出现a_i转移到a_j的经验次数，

表示类C的行为视图数据中出现a_i的经验次数，α＞0表示平滑参数，通常设置为1，|V|表示行为类型的数量，C_s和C_u分别表示满意的类和不满意的类。

步骤2-3，从无标注数据中读取行为视图数据，利用基于行为视图的用户满意度评估模型h_A对行为视图数据赋予伪标签，该伪标签作为行为视图数据对应的无标注数据的伪标签

步骤2-3中，将行为视图数据S_A作为数据源，利用基于行为视图的用户满意度评估模型h_A生成S_A的概率P(S_A|C)为：

给定行为视图数据S_A，基于行为视图的用户满意度评估模型h_A的似然值P(C|S_A)为：

其中，C_s表示满意的类，C_u表示不满意的类，P(C)表示类C的先验概率，

表示第i-1个行为和第i个行为之间的转移概率，用最大似然估计近似计算得出，P(S_A)表示生成行为视图数据S_A的概率；

取似然值P(C|S_A)最大的类作为S_A的伪标签

即：

行为视图数据S_A的伪标签

即为行为视图数据S_A对应的无标注数据赋予伪标签

步骤2-4，从带有伪标签的无标注数据和有标注数据中读取时间视图数据，并将读取的时间视图数据按照满意度标签分为满意时间视图数据和不满意时间视图数据两部分；

步骤2-5，利用满意时间视图数据训练时间视图满意模型，利用不满意时间视图数据训练时间视图不满意模型，训练好的时间视图满意模型和时间视图不满意模型组成基于时间视图的用户满意度评估模型h_T。

步骤2-5中，使用生成模型来训练基于时间视图的用户满意度评估模型h_T，通过Gamma分布来对连续行为之间的时间间隔进行建模，Gamma分布包含形状参数k和尺度参数θ，其概率密度函数表示为：

其中t表示连续行为之间的时间间隔，Γ(k)表示在k处评估的Gamma函数。

步骤2-6，检查当前的基于行为视图的用户满意度评估模型h_A与前一次迭代获得的基于行为视图的用户满意度评估模型h_A是否相同，如果相同则执行步骤2-7，如果不同则执行步骤2-9；

步骤2-7，检查当前的基于时间视图的用户满意度评估模型h_T与前一次迭代获得的基于时间视图的用户满意度评估模型h_T是否相同，如果相同则执行步骤2-8，如果不同则执行步骤2-9；

步骤2-8，输出基于行为视图的用户满意度评估模型h_A和基于时间视图的用户满意度评估模型h_T；

步骤2-9，从无标注数据中读取时间视图数据，利用基于时间视图的用户满意度评估模型h_T对时间视图数据赋予伪标签，该伪标签作为时间视图数据对应的无标注数据的伪标签

步骤2-9中，对于给定的时间视图数据S_T，基于时间视图的用户满意度评估模型h_T的似然值P(C|S_T)为：

其中，Γ(k_i,θ_i,C)是

的Gamma分布的概率密度函数，

是类C的S_T中第i个时间间隔，m是S_T中出现的行为转移的次数；

取似然值P(C|S_T)最大的类作为S_T的伪标签

即：

时间视图数据S_T的伪标签

即为时间视图数据S_T对应的无标注数据赋予伪标签

步骤2-10，从带有伪标签的无标注数据和有标注数据中读取行为视图数据，并将读取的行为视图数据按照满意度标签分为满意行为视图数据和不满意行为视图数据两部分后，跳转执行步骤2-2。

步骤3，引入整合选择策略挑选出争议数据给标注人员标注，并更新有标注数据和无标注数据，并利用更新后的有标注数据和无标注数据重新训练基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型，直到满足迭代终止条件，获得最终的基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型。

具体地，步骤3具体包括：

步骤3-1，对于同一个无标注数据，读取通过基于行为视图的用户满意度评估模型h_A对无标注数据赋予伪标签

和通过基于时间视图的用户满意度评估模型h_T对无标注数据赋予伪标签

如果伪标签

与伪标签

不同，则将该无标注数据作为争议数据添加到争议数据集Q中。

步骤3-2，利用整合选择策略来衡量争议数据集Q中争议数据的代表性和信息量，使用基于行为视图的用户满意度评估模型h_A与基于时间视图的用户满意度评估模型h_T之间的分歧程度来衡量争议数据的信息量，使用局部密度来衡量争议数据的代表性。

步骤3-2中，给定一个争议数据x，其分歧程度Deg(x)为：

其中，Confidence(h_A(x),C_S)表示x从行为视图满意模型中生成的概率，Confidence(h_T(x),C_S)表示x从时间视图满意模型中生成的概率，Confidence(h_A(x),C_U)表示x从行为视图不满意模型中生成的概率，Confidence(h_T(x),C_U)表示x从时间视图不满意模型中生成的概率；

争议数据x的局部密度用x与其r个最邻近的争议数据的平均距离来表示，平均距离越小，则局部密度越大，从而x就越具有代表性，给定一个争议数据x，局部密度Den(x)为：

其中，distance(x,x_i)是基于每种行为转移出现的次数计算出的x和与其最邻近的第i个争议数据x_i之间的欧几里德距离。

步骤3-3，从争议数据集Q中挑选出l个最具代表性和最富信息量的争议数据给标注人员标注。

具体地，最具代表性和最富信息量的争议数据q_selected为：

步骤3-4，通过人工标注对挑选出的争议数据赋予标签，并将其添加到有标注数据中，同时将争议数据从无标注数据中移除；

步骤3-5，在步骤3-4的基础上，跳转执行步骤2，直到满足迭代终止条件，获得最终的基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型。

本实施例中，迭代终止条件为是否已耗尽所有人工标注成本，及在耗尽所有人工标注成本时，输出最终的基于行为视图的用户满意度评估模型和基于时间视图的用户满意度评估模型。

具体地，步骤4具体包括：

步骤4-1，从用户提供的待识别搜索满意度的样本中分别提取出行为视图数据S_A和时间视图数据S_T；

步骤4-2，利用基于行为视图的用户满意度评估模型h_A来识别所有挑选出的争议数据的标签，并计算被错误识别的争议数据的数量mistakes(h_A)；利用基于时间视图的用户满意度评估模型h_T来识别所有挑选出的争议数据的标签，并计算被错误识别的争议数据的数量mistakes(h_T)；

步骤4-3，基于mistakes(h_A)和mistakes(h_T)来计算样本的最终分类结果，如果mistakes(h_A)＜mistakes(h_T)，则将基于行为视图的用户满意度评估模型h_A对样本的分类结果

作为其最终分类结果；否则，将基于时间视图的用户满意度评估模型h_T对样本的分类结果

作为其最终分类结果。

上述融合半监督学习和主动学习的搜索引擎用户满意度评估方法中，通过引入主动学习以更充分地利用有限的人工标注成本，并结合半监督学习和主动学习的优点来提高搜索满意度评估方法的性能，同时利用整合选择策略来衡量争议数据的代表性和信息量，从而挑选出最具标注价值的数据。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的最优选实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法，包括以下步骤：

2.如权利要求1所述的融合半监督学习和主动学习的搜索引擎用户满意度评估方法，其特征在于，步骤1具体包括：

3.如权利要求1所述的融合半监督学习和主动学习的搜索引擎用户满意度评估方法，其特征在于，步骤2具体包括：

步骤2-2，利用满意行为视图数据训练行为视图满意模型，利用不满意行为视图数据训练行为视图不满意模型，训练好的行为视图满意模型和行为视图不满意模型组成基于行为视图的用户满意度评估模型h_A；

步骤2-5，利用满意时间视图数据训练时间视图满意模型，利用不满意时间视图数据训练时间视图不满意模型，训练好的时间视图满意模型和时间视图不满意模型组成基于时间视图的用户满意度评估模型h_T；

4.如权利要求3所述的融合半监督学习和主动学习的搜索引擎用户满意度评估方法，其特征在于，步骤2-2中，使用生成模型来训练基于行为视图的用户满意度评估模型h_A，学习观察值和标签值的联合概率分布，并利用马尔可夫链来对任意两个行为之间的转移进行建模，通过最大似然估计来计算两个行为a_i和a_j之间的转移概率：

其中，表示类C的行为视图数据中出现a_i转移到a_j的经验次数，