CN111783452B

CN111783452B - 模型训练方法、信息处理方法、装置、设备及存储介质

Info

Publication number: CN111783452B
Application number: CN202010615706.4A
Authority: CN
Inventors: 潘秋桐; 和为; 何伯磊; 刘准; 李雅楠
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2024-04-02
Anticipated expiration: 2040-06-30
Also published as: CN111783452A

Abstract

本申请公开了模型训练方法、信息处理方法、装置、设备及存储介质，涉及人工智能和网络技术领域。其中，模型训练方法的具体实现方案为：获取用于训练分析模型的样本数据，样本数据包含有搜索请求和搜索结果；计算得到表征样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的；将样本特征输入待训练分析模型，得到表征搜索结果的评价信息的打分结果；根据输出结果和参照结果，对待训练分析模型进行训练。本申请实施例能够对搜索结果进行全面客观的评价，从而能够进一步为用户提供更满意的搜索结果。

Description

模型训练方法、信息处理方法、装置、设备及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及人工智能和网络技术领域。

背景技术

随着经济的发展，各大中小企业也在我国以至全球越来越多。在大中小企业发展中都普遍存在这样一个问题，随着公司的逐渐壮大，项目的持续积累，员工的存续迭代，产生了大量含有员工宝贵经验和知识的文档。这些文档若不进行线上的统一管理，则很难做到知识的体系化和规范化，部分知识和经验也可能随着关键员工的离职而损失。所以，大多数企业都引入了企业级Wiki，将企业积累的办公场景下的知识文档集中在一个位置，成为企业内部的“百度”。企业Wiki(Enterprise Wiki，企业百科)指适用于企业或组织内部使用的Wiki，企业Wiki是为企业量身定做的Wiki。

于此同时，引入了一个新的问题：有着海量的知识后，怎样能够快速且精准的找到所需的知识。大多数企业级Wiki在这一用户需求上的能力是很薄弱的，影响甚至拖慢了知识的传递和办公的效率。

发明内容

本公开提供了一种模型训练方法、信息处理方法、装置、设备以及存储介质。

根据本公开的一方面，提供了一种模型训练方法，包括：

获取用于训练分析模型的样本数据，样本数据包含有搜索请求和搜索结果；

计算得到表征样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的；

将样本特征输入待训练分析模型，得到表征搜索结果的评价信息的打分结果；

根据输出结果和参照结果，对待训练分析模型进行训练。

根据本公开的另一方面，提供了一种信息处理方法，包括：

将搜索请求和搜索结果的特征输入分析模型；

获得基于所述搜索请求对所述搜索结果打分的打分结果；

所述分析模型为由本申请任意一实施例的模型训练方法训练得到。

根据本公开的另一方面，提供了一种模型训练装置，包括：

样本数据模块，用于获取用于训练分析模型的样本数据，样本数据包含有搜索请求和搜索结果；

样本特征模块，用于计算得到表征样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的；

打分模块，用于将样本特征输入待训练分析模型，得到表征搜索结果的评价信息的打分结果；

训练模块，用于根据输出结果和参照结果，对待训练分析模型进行训练。

根据本公开的另一方面，提供了一种信息处理装置，包括：

输入模块，用于将搜索请求和搜索结果的特征输入分析模型；

打分模块，用于获得基于所述搜索请求对所述搜索结果打分的打分结果；

所述分析模型为由本申请任意一项实施例提供的模型训练方法训练得到。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本申请任意一项实施例所提供的应用于模型训练装置侧的方法，或者执行本申请任意一项实施例所提供的应用于信息处理装置侧的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本申请任意一项实施例所提供的应用于模型训练装置侧的方法，或者执行本申请任意一项实施例所提供的应用于信息处理装置侧的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上所述的方法。

根据本申请的技术能够基于搜索结果和搜索请求的样本特征，获得打分结果，从而有助于为用户提供综合满意度更高的搜索结果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例的模型训练方法示意图；

图2是根据本申请实施例的模型训练方法中的全量特征图示意图；

图3是根据本申请一实施例的模型训练装置示意图；

图4是根据本申请一具体示例的模型训练装置示意图；

图5是根据本申请实施例的模型训练装置示意图；

图6是根据本申请另一实施例的模型训练装置示意图；

图7是根据本申请另一实施例的信息处理装置示意图；

图8是用来实现本申请实施例的模型训练方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

图1示出了根据本申请一种实施例的模型训练方法流程示意图，如图1所示，本申请一种实施例的模型训练方法包括以下步骤：

步骤101：获取用于训练分析模型的样本数据，样本数据包含有搜索请求和搜索结果；

步骤102：计算得到表征样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的；

步骤103：将样本特征输入待训练分析模型，得到表征搜索结果的评价信息的打分结果；

步骤104：根据打分结果和参照结果，对分析模型进行训练。

在本实施例中，样本数据的搜索请求，可以对应于多个搜索结果。比如，对于一个搜索请求A，获取30条搜索结果。

本实施例中，评价标准可以预设多个，针对每个评价标准，可以计算出多个样本特征。比如，评价标准可以是搜索结果与搜索请求之间的相关性。基于相关性，计算获得多个以相关性为基准的样本特征。

本实施例中，参照结果可以包括人工标注结果。也可以是根据人工标注结果计算得到的结果。

在本申请一种示例中，在获得样本数据时，可在现行wiki服务上收集query(搜索请求)和url(uniform resource locator，统一资源定位系统)对数据。其中，url为请求的搜索结果，与请求相关、标题命中或内容命中的文本，也可以是邮件附件。每个query收集30条结果。

在获得样本数据时，对一个周期(1年)内全部的query搜索pv(page view，页面浏览)进行统计，然后根据统计频次按照头部:腰部:长尾＝2:5:3的比例随机抽取9000条query，其中搜索次数少但是量多为长尾。同时，再抽取长query1000条。其中，长query可以是含3个及以上term(分词)的query。term的定义可以是，对query或域的内容进行分词，得到的结果称为term，如query为“百度云计算”，则其分词后的query term为“百度”，“云计算”两个term。

在具体实现方式中，头部数据、腰部数据和长尾数据可按搜索次数进行的分类，还可按照技术或行政类进行分类，比如，2019年的query总数量为250万，头部搜索pv大于两百次，按照搜索次数区分，还可进行更细粒度的区分。

在一种示例中，共采集10000条query，共30万query_url对数据。

在本实施例中，对样本数据的搜索结果进行标注，在标注时，使用pointwise标注法(一条数据中对应一个结果)，在考虑相关度、时效性、权威度、质量等因素的情况下，将数据标注为3挡：

2，表示相关度上能够很好的满足，且在时效性、权威度、质量等因素上表现良好或无明显问题；

1，表示相关度上差强人意，或在时效性、权威度、质量等因素上有轻微问题；

0，表示相关度上不满足或很难满足，或在时效性、权威度、质量等因素上有明显问题，如时效性极差，质量差等。标注数据可以作为参照结果。

本实施例中，利用训练分析模型的样本数据，对待训练分析模型进行训练，得到排序结果。然后根据排序结果和参照结果，对待训练分析模型进行优化，从而得到优化后的分析模型；如此，便于利用利用分析模型获得相对于预设评价标准而言较为优化的搜索结果。

在本申请另一种实施方式中，将样本特征输入分析模型，得到表征搜索结果的评价信息的打分结果，包括：

基于搜索请求和搜索结果之间的关联关系，对搜索结果进行标注，得到标注数据；

将标注数据和样本特征输入分析模型，得到表征搜索结果的评价信息的打分结果。

本实施例中，标注数据可以用于对打分结果进行评估，计算分析模型的损失函数。

本实施例中，采用标注数据对模型进行分析，从而避免分析模型在学习过程中过拟合的情况。

在本申请另一种实施例中，样本数据是基于搜索频率从全量样本中所选取出的；至少包括一下数据之一：

全量样本中的头部数据；

全量样本中的腰部数据；

全量样本中的尾部数据；

其中，头部数据为全量样本特征图中坐标原点到第一分界点之间的数据；腰部数据为全量样本特征图中第一分界点到第二分界点之间的数据；尾部数据为全量样本特征图中第二分界点远离坐标原点一侧的数据。

本实施例中，全量样本，可以是指全部的样本。全量样本特征图可以如图2所示，为样本和点击量的曲线图。按照第一分界点和第二分界点，划分三个区域，从坐标轴原点到远离坐标轴原点的方向上，依次是头部数据、腰部数据和长尾数据。

本实施例中，选择的头部数据、腰部数据和尾部数据的比例符合设定的比例。

本实施例中，在全量样本特征图中设定比例的头部数据、腰部数据和尾部数据，从而选择的样本数据能够较为平均地反应全量样本的状况。

在一种实施方式中，所述样本数据还包括搜索请求中的分词数量大于设定值的数据。

本实施例中，在样本数据中加入了搜索请求中分词数量大于设定值的数据，从而，使得样本数据的组成类型更为多样化更为全面。

在一种实施方式中，计算多份样本数据中，每一份样本数据的至少一个样本特征，还包括下述步骤中的至少一个：

计算得到表征搜索请求和搜索结果的相关性的相关性特征；

计算得到表征搜索请求中分词之间紧密程度在搜索结果所对应的紧密度特征；

计算得到表征搜索结果的文本质量的质量特征；

计算得到表征搜索结果的权威性的权威性特征；

计算得到表征搜索结果的时效性的时效性特征；

计算得到表征搜索结果的点击率的点击特征。

本实施例中，由于有些标准，对于选择搜索结果而言重要性较高，可以给重要性较高的样本特征赋予较高的权重，使得重要性较高的样本特征数字较大；可以给重要性较低的样本特征赋予较低的权重，使得重要性较低的样本特征数字较小。

办公场景企业级wiki中的文档数据与通用搜索引擎的数据有一定差距。体现在以下几个方面：

文档的相关性，可能更多地由文档的内容来满足，而非标题。比如，标题可能与搜索问题没有任何关联，query为“公积金提取”，召回的搜索结果的标题为“部门手册”；

文档有时效性高低，过期的数据很可能对用户是无收益甚至是负收益的；

文档有权威性高低，官方文档的顺位应该越高；

文档有质量的高低，在相同相关性前提下，质量越高的文档顺位应该越高。

因此，搜索结果的好坏，应当有多种评价标准。在进行模型训练时，应当将多种评价标准均予以考虑。

作为本实施例的一种示例，相关性特征具体可以包括：

(1)ctr：query中的term和对应域的term的重合数占到query term数的比例；分别计算title域的两种分词粒度。域代表文档中的内容块，通常企业级wiki文档分为title和content两个域。分词粒度的定义可以是：分为基本粒度和混排粒度。如“机器学习的学习方法”的基本粒度分词为”机器/学习/的/学习/方法“，混排粒度分词为“机器学习/的/学习/方法”。一般情况下，基本粒度分词保证召回数量(搜索结果)，混排粒度分词保证语义的准确性。

ctr可通过下述公式计算：

其中，query_term为搜索问题中的分词数量。query_term&field_term为搜索答案中的分词与搜索问题中的分词重合的分词数量。field_term_count为搜索答案的分词总量。

(2)cqr：query中的term和对应域的term的重合数占到query term数的比例；分别计算title和content域的两种分词粒度。

其中，query_term_count为问题中的分词总量。

(3)edis_dis_ratio(Edits Distance Ratio，编辑距离比例)：query和title的编辑距离占到query的比例。

(4)similarity：使用GRNN模型计算出来的query和title的相似度。

bm25：常用搜索相关性评分。(仅计算title和content域的混排粒度)

其中，dl为文档d的长度，avgdl为所有文档的平均长度；k₁、b为调节因子；q_i为语素。Q表示query，d表示搜索结果文档。

(6)content_target_tf_avg：content域混排粒度下命中的query term的词频取log10后的值之和。

作为一种示例，紧密度特征可以包括：

(1)offset：先计算query term中每相邻的一对term在对应域的最近间隔距离md，比如，query中两个相邻分词为A和B，则判断文档中A和B之间的距离。然后计算出全部相邻分词的md的平均值avg_md。并按照下面的范围进行6档划分。

(2)tightness：offset(term偏移量，逆序惩罚)对应高级特征，任何一个offset低于2档，则tightness为1，否则为0。

(3)proximity：对应域中能同时命中query中全部term的最大窗体数，即同时包含query中全部term的段落的最大个数。

紧密度特征可以排除散乱命中的情况。散乱命中：指query term虽然在内容中命中，但由于和其他term在页面中关系松散，而无法体现term在query中本身的意义，造成转义或不相关。如：“query为机器/学习”，命中内容为“这个/机器/的/使用/需要/学习”，虽然同时命中“机器”、“学习”两个term，但两个term关系松散，已经发生了转义。

作为一种示例，搜索答案的质量特征可以包括：

content_length：文章长度。

content_chinese_ratio：文章中中文字符所占比例。

tag_count：文章中小标题的个数。

paragraph_count：文章段落数。

img_count：文章中的图片数。

attachment_count：文章中的附件数。

作为一种示例，样本特征还可以包括其他高级特征

authoritative：外部模型提供的文章权威性特征，可通过模型识别获得，影响权威性的因素可以包括文档空间的维护者数量、维护者级别、用户点击量等。

timeliness：时效性，根据文档创建时间与当前时间之差进行衰减。

其中，t_now为当前时间，t_create为创建时间。

quality：外部模型提供的文章质量特征，可以是0-1之间的数字。

url_neisou_click：最近一年内url粒度下的用户点击次数。不管query是什么，只要搜了点了就算。

本实施例中，采用多种标准对样本数据进行计算，从而使训练获得的模型能够根据多种标准筛选搜索结果，从而模型输出的搜索结果的打分为综合评价最好的搜索结果。

在一种实施方式中，将至少一个样本特征输入分析模型，得到样本的打分结果，包括：

根据预设的训练数据和对照数据的比例、样本数据，获得至少一个样本特征中的训练数据；

将训练数据输入分析模型，得到样本打分结果。

本实施例中，在样本数据中，可选择设定比例的数据为训练数据，剩余数据为对照数据。

本实施例将样本数据分为训练数据和对照数据，从而在模型优化阶段，能够使用对照数据对模型进行优化。

在一种实施方式中，根据样本的打分结果和参照结果，对分析模型进行优化，包括：

根据打分结果，获得关于搜索请求的搜索排序结果；

基于预设排序结果和搜索请求的搜索排序结果，得到损失值；

根据损失值，对分析模型进行优化。

在一种示例中，根据样本的打分结果和参照结果，对分析模型进行优化，包括：

根据样本打分结果，获得关于每个样本问题的搜索结果排序；

对每个搜索请求的搜索结果排序，计算归一化折损累计增益值；

根据归一化折损累计增益值，对每个样本问题的搜索结果中的排序进行评价；

根据评价结果，对待训练分析模型进行优化。

训练模型中，使用标注数据的70％数据作为训练数据，30％作为验证数据。

使用lightgbm(快速的,分布式的,高性能的基于决策树算法的梯度提升框)工具的lambdarank(一种经验算法)模型，loss函数和评估指标均为ndcg。模型参数使用网格搜索技术选取最优参数。经多轮迭代后，即可得到目标模型。

在效果评估上，使用主客观结合方式。

在对模型训练效果进行客观评估时，使用NDCG作为评估指标。NDCG(NormalizeDiscounted Cumulative Gain，归一化折损累计增益)是一种对搜索引擎排序进行度量的有效性方。搜索引擎一般采用PI(per item)的方式进行评测，简单地说就是逐条对搜索结果进行分等级的打分。例如，针对一个搜索问题，获得了5个搜索结果。打分的范围分为：Good(好)、Fair(一般)、Bad(差)，然后赋予分值分别为3(好)、2(一般)、1(差)，假定通过逐条打分后，得到5个搜索结果的分值分别为3、2、1、3、2。

在计算NDCG时，首先计算DCG，计算公式如下：

其中，rel为这个排序list，结果i的一个等级得分；i是指结果i的当前位置序号。在搜索引擎中，rel为等级得分，是由人工抽样数据，并且根据一定的规则打出来的等级得分。

获得DCG之后，计算IDCG(Ideal DCG)，即完美序的DCG；计算方式也同DCG，区别在于计算DCG时，排序序列不是由算法得出，而是由人工对序列根据一定的评估准则排出来的最佳序列。

根据DCG和IDCG，计算NDCG，计算公式如下：

在对模型训练效果进行主观评估时，采用gsb评分为主观指标。即准备两份数据，一份为对照组(线上或上个版本模型的结果)，一份为实验组(当前版本模型的结果)，人工评估实验组是否比对照组要good、same、bad(简写gsb)

最终通过NDCG和gsb两个指标，共同评估模型的效果。

本申请实施例还提供一种信息处理方法，包括：

将搜索请求和搜索结果的特征输入分析模型；

获得基于所述搜索请求对所述搜索结果打分的打分结果；

图3是根据本申请另一实施例的模型训练装置示意图，如图3所示，本申请一种实施例的模型训练装置，包括：

样本数据模块100，用于获取用于训练分析模型的样本数据，样本数据包含有搜索请求和搜索结果；

样本特征模块200，用于计算得到表征样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的；

打分模块300，用于将样本特征输入待训练分析模型，得到表征搜索结果的评价信息的打分结果；

训练模块400，用于根据打分结果和参照结果，对待训练分析模型进行训练。

参见图4，在一种实施方式中，打分模块300包括：

标注数据单元310，用于基于搜索请求和搜索结果之间的关联关系，对搜索结果进行标注，得到标注数据；

标注数据输入单元320，用于将标注数据和样本特征输入分析模型，得到表征搜索结果的评价信息的打分结果。

在一种实施方式中，样本数据是基于搜索频率从全量样本中所选取出的；至少包括一下数据之一：

全量样本中的头部数据；

全量样本中的腰部数据；

全量样本中的尾部数据；

在一种实施方式中，样本数据还包括搜索请求中的分词数量大于设定值的数据。

参见图5，在一种实施方式中，样本特征模块200还包括下述单元中的至少一个：

第一特征单元210，用于计算得到表征搜索请求和搜索结果的相关性的相关性特征；

第二特征单元220，用于计算得到表征搜索请求中分词之间紧密程度在搜索结果所对应的紧密度特征；

第三特征单元230，用于计算得到表征搜索结果的文本质量的质量特征；

第四特征单元240，用于计算得到表征搜索结果的权威性的权威性特征；

第五特征单元250，用于计算得到表征搜索结果的时效性的时效性特征；

第六特征单元260，用于计算得到表征搜索结果的点击率的点击特征。

参见图6，在一种实施方式中，训练模块400包括：

排序单元410，用于根据样本打分结果，获得关于每个样本问题的搜索结果排序；

损失值单元420，用于对每个搜索请求的搜索结果排序，计算损失值；

优化单元430，用于根据损失值，对待训练分析模型进行优化。

本申请另一种实施例还提供一种信息处理装置，如图7所示，包括：

输入模块701，用于将搜索请求和搜索结果的特征输入分析模型；

打分模块702，用于获得基于所述搜索请求对所述搜索结果打分的打分结果；

根据本申请的实施例，本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

如图8所示，是根据本申请实施例的编码方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示，该电子设备包括：一个或多个处理器901、存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器901为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的编码方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的编码方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的编码方法对应的程序指令/模块(例如，附图3所示的样本数据模块100、样本特征模块200、打分模块300和训练模块400，附图4所示的标注数据单元310和标注数据注入单元320，附图5中所示的第一特征单元210、第二特征单元220、第三特征单元230、第四特征单元240、第五特征单元250、第六特征单元260，或者附图6所示的排序单元410、损失值单元420和优化单元430)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的编码方法。

存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据视频编码电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器902可选包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至视频编码电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

编码方法的电子设备还可以包括：输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接，图8中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息，以及产生与视频编码电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，利用训练分析模型的样本数据，对待训练分析模型进行训练，得到排序结果。然后根据排序结果和参照结果，对待训练分析模型进行优化，从而得到优化后的分析模型之后，能够利用分析模型获得相对于预设评价标准而言较为优化的搜索结果。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种模型训练方法，包括：

获取用于训练分析模型的样本数据，所述样本数据包含有搜索请求和搜索结果，所述样本数据包括在企业百科Wiki服务上收集的数据；

计算得到表征所述样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，所述样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的，其中，预设评价标准包括多个，赋予所述样本特征的权重与预设评价标准对选择搜索结果的重要性成正比；

将所述样本特征输入待训练分析模型，得到表征所述搜索结果的评价信息的打分结果；

根据所述打分结果和参照结果，对所述待训练分析模型进行训练；

其中，所述根据所述打分结果和参照结果，对所述分析模型进行训练，包括：

根据所述打分结果，获得关于搜索请求的搜索排序结果；

基于预设排序结果和所述搜索请求的搜索排序结果，得到损失值；

根据所述损失值，对所述分析模型进行优化；

其中，采用下述步骤中的至少之一计算得到表征所述样本数据包含的搜索请求和搜索结果之间关联关系的样本特征：

计算得到表征所述搜索请求和搜索结果的相关性的相关性特征；

计算得到表征所述搜索请求中分词之间紧密程度在所述搜索结果所对应的紧密度特征；

计算得到表征所述搜索结果的文本质量的质量特征；

计算得到表征所述搜索结果的权威性的权威性特征；

计算得到表征所述搜索结果的时效性的时效性特征；

计算得到表征所述搜索结果的点击率的点击特征。

2.根据权利要求1所述的方法，其中，所述将所述样本特征输入分析模型，得到表征所述搜索结果的评价信息的打分结果，包括：

将所述标注数据和所述样本特征输入所述分析模型，得到表征所述搜索结果的评价信息的打分结果。

3.根据权利要求1所述的方法，其中，所述样本数据是基于搜索频率从全量样本中所选取出的；至少包括一下数据之一：

所述全量样本中的头部数据；

所述全量样本中的腰部数据；

所述全量样本中的尾部数据；

其中，所述头部数据为所述全量样本特征图中坐标原点到第一分界点之间的数据；所述腰部数据为所述全量样本特征图中第一分界点到第二分界点之间的数据；所述尾部数据为所述全量样本特征图中第二分界点远离所述坐标原点一侧的数据。

4.根据权利要求1或3所述的方法，其中，所述样本数据还包括所述搜索请求中的分词数量大于设定值的数据。

5.一种信息处理方法，包括：

将待评估搜索请求和所述搜索请求所对应的搜索结果输入分析模型；

获得基于所述待评估搜索请求对所述搜索结果进行评估的打分结果；

所述分析模型为由权利要求1-4中任意一项的模型训练方法训练得到。

6.一种模型训练装置，包括：

样本数据模块，用于获取用于训练分析模型的样本数据，所述样本数据包含有搜索请求和搜索结果，所述样本数据包括在企业百科Wiki服务上收集的数据；

样本特征模块，用于计算得到表征所述样本数据包含的搜索请求和搜索结果之间关联关系的样本特征，所述样本特征是基于预设评价标准对搜索请求和搜索结果之间关联关系进行计算后得到的，其中，预设评价标准包括多个，赋予所述样本特征的权重与预设评价标准对选择搜索结果的重要性成正比；

打分模块，用于将所述样本特征输入待训练分析模型，得到表征所述搜索结果的评价信息的打分结果；

训练模块，用于根据所述打分结果和参照结果，对所述分析模型进行训练；

其中，所述训练模块包括：

排序单元，用于根据所述样本打分结果，获得关于搜索请求的搜索排序结果；

损失值单元，用于基于预设排序结果和所述搜索请求的搜索排序结果，得到损失值；

优化单元，用于根据所述损失值，对所述分析模型进行优化；

其中，所述样本特征模块还包括下述单元中的至少一个：

第一特征单元，用于计算得到表征所述搜索请求和搜索结果的相关性的相关性特征；

第二特征单元，用于计算得到表征所述搜索请求中分词之间紧密程度在所述搜索结果所对应的紧密度特征；

第三特征单元，用于计算得到表征所述搜索结果的文本质量的质量特征；

第四特征单元，用于计算得到表征所述搜索结果的权威性的权威性特征；

第五特征单元，用于计算得到表征所述搜索结果的时效性的时效性特征；

第六特征单元，用于计算得到表征所述搜索结果的点击率的点击特征。

7.根据权利要求6所述的装置，其中，所述打分模块包括：

标注数据单元，用于基于搜索请求和搜索结果之间的关联关系，对搜索结果进行标注，得到标注数据；

标注数据输入单元，用于将所述标注数据和所述样本特征输入所述分析模型，得到表征所述搜索结果的评价信息的打分结果。

8.根据权利要求6所述的装置，其中，所述样本数据是基于搜索频率从全量样本中所选取出的；至少包括一下数据之一：

所述全量样本中的头部数据；

所述全量样本中的腰部数据；

所述全量样本中的尾部数据；

9.根据权利要求6或8所述的装置，其中，所述样本数据还包括所述搜索请求中的分词数量大于设定值的数据。

10.一种信息处理装置，包括：

所述分析模型为由权利要求6-9中任意一项模型训练方法训练得到。

11.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法；或者，执行权利要求5所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法；或者，执行权利要求5所述的方法。

13.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-4中任一项所述的方法；或者，执行权利要求5所述的方法。