CN110717008A

CN110717008A - 基于语意识别的搜索结果排序方法及相关装置

Info

Publication number: CN110717008A
Application number: CN201910878030.5A
Authority: CN
Inventors: 钱柏丞
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-09-17
Filing date: 2019-09-17
Publication date: 2020-01-21
Anticipated expiration: 2039-09-17
Also published as: WO2021051587A1; CN110717008B

Abstract

本发明的实施例提供了一种基于语意识别的搜索结果排序方法及相关装置。该基于语意识别的搜索结果排序方法包括：通过基于获取的所述撰写时间确定第一分数、所述撰写者标识确定第二分数、所述历史访问信息确定第三分数、所述用户访问所述搜索结果后的行为操作信息确定第四分数；再基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；根据所述搜索结果的综合评分，对所述搜索结果进行排序。本公开实施例的技术方案可以通过所述搜索结果对应的综合评分进行排序，从而提高用户选择的效率。

Description

基于语意识别的搜索结果排序方法及相关装置

技术领域

本公开涉及数据处理技术领域，具体而言，涉及一种基于语意识别的搜索结果排序方法及相关装置。

背景技术

随着互联网技术的不断发展，网络成为人们认知世界和获取信息的重要途径，现有技术中，人们通过在搜索引擎中输入关键词，然后搜索引擎基于输入的关键词在海量的网络数据中确定人们所需要的候选信息，人们仍需要在确定的海量的候选信息中浏览查找自己实际需要的信息。

虽然现在也有一些搜索引擎引入一些算法对搜索出的结果进行优化排序，如运用DBN(Dynamic Bayesian Network，动态贝叶斯网络)点击模型对搜索结果进行优化，根据历史用户点击次数对搜索结果进行优化等；但现有技术对语意识别的搜索结果排序仍然难以确切的满足用户的需求，如根据历史用户点击次数，因人们会仅仅因为搜索结果排名靠前而点击并访问该搜索结果，而不管该搜索结果是否符合用户的需求，因为现有的搜索引擎仅仅是将搜索结果以搜索结果列表的方式展现给用户，在搜索结果列表中仅仅展现了搜索结果的一部分内容，而并不是全部内容，进而也就进一步导致点击率高的并不是用户所实际需要的；因为用户仍然需要在海量、杂乱的搜索结果中寻找自己所需的搜索结果，这样无疑降低了用户的选择效率，同时也浪费了用户的大量时间。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

公开内容

本公开实施例的目的在于提供一种基于语意识别的搜索结果排序方法及相关装置，进而可以至少在一定程度上克服现有技术中用户选择效率低的问题。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

根据本公开实施例的一个方面，提供了一种基于语意识别的搜索结果排序方法，包括：获取用户输入的问题信息；获取用户输入的问题信息；将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息；在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合；获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表；针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息；基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数；基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；基于所述搜索结果的综合评分，对所述搜索结果进行排序。

在本公开的一实施例中，所述语意识别模型通过以下方式进行训练：预先设置问题信息集合；预先识别出所述问题信息结合中每个问题信息样本对应的语意信息；将所述问题信息样本输入所述语意识别模型，获取由所述语意识别模型输出的所述问题信息样本对应的语意信息，将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对，如不一致则，调整所述语意识别模型的参数，直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。

在本公开的一实施例中，所述获取所述问题信息及所述近似问题信息集合中每个近似问题信息对应的搜索结果列表，包括：提取所述问题信息与所述近似问题信息对应的关键词；基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表；基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。

在本公开的一实施例中，所述基于所述撰写时间确定第一分数，包括：确定所述撰写时间距当前时间的长度；根据以下公式确定第一分数：S₁＝a₁/(b₁+T₁)，其中所述S₁是第一分数，T₁是所述撰写时间距离当前时间的长度，a₁和b₁是预设的常数。

在本公开的一实施例中，所述基于所述撰写者标识确定第二分数，包括：基于所述撰写者标识在预存的用户信息库数据库，确定所述撰写者标识对应的撰写者信息，其中所述撰写者信息包含所述撰写者对应的撰写者等级；根据以下公式确定第二分数：S₂＝a₂·R·D₁，其中S₂是所述第二分数，D₁是所述撰写者等级，a₂是预设的正常数，R是预设的大于1的常数。

在本公开的一实施例中，所述基于所述历史访问信息确定第三分数，包括：提取所述历史访问信息中包含的历史访问次数与历史访问总时长；根据以下公式确定第三分数：S₃＝a₃·C+a₄·P其中S₃是所述第三分数，C是所述历史访问次数，a₃、a₄是预设常数、P是所述历史访问总时长。

在本公开的一实施例中，所述所述基于所述用户访问所述搜索结果后的行为操作信息确定第四分数，包括：提取所述用户访问该搜索结果后的行为操作信息中包含的所述历史用户访问所述搜索结果后输入的新问题信息和所述历史用户所述搜索结果后的访问其他搜索结果的次数；获取所述历史用户访问所述目标搜索结果后输入的新问题信息与所述问题信息间的杰卡德距离；根据以下公式确定所述第四分数：：S4＝a5·{(j₁+j₂+……j_n)÷n}+a6·{(d₁+d₂+……d_n)÷n}，其中s4是所述第四分数，a5、a6是预设常数，j₁是所述第一个历史用户在访问所述问题信息后输入的新问题信息与所述问题信息间的杰卡德距离，n是所述历史用户的总个数，d₁是所述第一个历史用户访问所述目标搜索结果后的访问其他搜索结果的次数。

根据本公开实施例的一个方面，提供了一种基于语意识别的搜索结果排序装置，包括：第一获取单元，用于获取用户输入的问题信息；第二获取单元，用于将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息；第三获取单元，用于在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合；第四获取单元，用于获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表；第五获取单元，用于针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息；第六获取单元，用于基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数；确定单元，用于基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；排序单元，用于基于所述搜索结果的综合评分，对所述搜索结果进行排序。

根据本公开实施例的一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中所述的基于语意识别的搜索结果排序方法。

根据本公开实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的基于语意识别的搜索结果排序方法。

本公开实施例提供的技术方案可以包括以下有益效果：

在本公开的一些实施例所提供的技术方案中，通过获取的用户输入的问题信息与用户输入问题信息语意相同的近似问题信息对应的搜索结果列表中每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问上述搜索结果后的行为操作信息，基于上述撰写时间确定第一分数，基于上述撰写者标识确定第二分数，基于上述历史访问信息确定第三方分数，基于上述历史用户访问上述搜索结果后的行为操作信息确定第四分数，再通过上述第一分数，第二分数，第三分数，第四分数确定上述搜索结果对应的综合评分，然后基于所述搜索结果对应的综合评分对所述搜索结果进行排序。可见，本公开实施例的技术方案可将搜索结果依据其所对应的综合评分进行排序，从而方便用户快速点击查阅，从而提高用户的选择效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本公开实施例的基于语意识别的搜索结果排序方法或基于语意识别的搜索结果排序装置的示例性系统架构的示意图；

图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图；

图3示意性示出了根据本公开的一个实施例的基于语意识别的搜索结果排序方法的流程图；

图4示意性示出了图3中所示的步骤S350的一种实现过程的流程图；

图5示意性示出了根据本公开的一个实施例的基于语意识别的搜索结果排序装置的框图；

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示出了可以应用本公开实施例的基于语意识别的搜索结果排序方法或基于语意识别的搜索结果排序装置的示例性系统架构100的示意图。

如图1所示，系统架构100可以包括终端设备101、102、103中的一种或多种，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线通信链路、无线通信链路等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器。例如服务器105获取用户端发送的问题信息可以是通过终端设备101、102、103获取的也可以是用户直接在服务器中输入的，这些问题信息可以是多个关键词组成的包含完整语意信息的句子，也可以是一个或多个关键词，比如用户输入的问题信息是“怎么吃土豆好吃”，也可以是“土豆吃法”，甚至可以是“土豆”。服务器105在获取到到问题信息后，在预存的数据库中确定与问题信息语意相同的近似问题信息集合，通过获取问题信息与预存的问题信息语意相同的近似问题信息对应的搜索结果列表中每个搜索结果，再获取所述搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息，基于所述撰写时间确定第一分数，基于所述撰写者标识确定第二分数，基于所述历史访问信息确定第三分数，基于所述历史用户访问该搜索结果后的行为操作信息确定第四分数，再基于所述第一分数、第二分数、第三分数、第四分数确定所述搜索结果对应的综合评分，通过所述搜索结果对应的综合评分对所述搜索结果进行排序，从而将符合用户需求的搜索结果排列在前，方便用户选择并点击查阅，从而提高用户的选择效率。

需要说明的是，本公开实施例所提供的基于语意识别的搜索结果排序方法一般由服务器105执行，相应地，语意识别的搜索结果排序装置一般设置于服务器105中。但是，在本公开的其它实施例中，终端也可以与服务器具有相似的功能，从而执行本公开实施例所提供的基于语意识别的搜索结果排序方案。

图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。

需要说明的是，图2示出的电子设备的计算机系统200仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图2所示，计算机系统200包括中央处理单元(CPU)201，其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中，还存储有系统操作所需的各种程序和数据。CPU201、ROM202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。

以下部件连接至I/O接口205：包括键盘、鼠标等的输入部分206；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207；包括硬盘等的存储部分208；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器210上，以便于从其上读出的计算机程序根据需要被安装入存储部分208。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分209从网络上被下载和安装，和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图3至图4所示的各个步骤。

以下对本公开实施例的技术方案的实现细节进行详细阐述：

图3示意性示出了根据本公开的一个实施例的基于语意识别的搜索结果排序方法的流程图，该语意识别的搜索结果排序方法适用于前述实施例中所述的电子设备。参照图3所示，该语意识别的搜索结果排序方法至少包括步骤S310至步骤S380，详细介绍如下：

在步骤S310中，获取用户输入的问题信息。

在本公开的一个实施例中，所述问题信息可以是多个关键词组成的具有完整语意信息的句子还可以仅包含一个或多个关键的文本信息，如问题信息可以是“今年大学排名”、也可以是“大学排名”、还可以是“大学”。

在本公开的一个实施例中获取用户输入的问题信息可以是服务器通过用户终端获取的也可以是用户直接通过输入设备输入服务器的，如用户通过手机在预设的输入框中输入所要查询的问题信息，手机将用户在输入框中输入的所要查询的问题信息发送给服务器，也可以是用户通过键盘设备直接输入服务器。

在步骤S320中，将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息。

在本公开的一实施例中，所述语意识别模型可通过以下方式进行训练：预先设置问题信息集合；预先识别出所述问题信息结合中每个问题信息样本对应的语意信息；将所述问题信息样本输入所述语意识别模型，获取由所述语意识别模型输出的所述问题信息样本对应的语意信息，将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对，如不一致则，调整所述语意识别模型的参数，直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。

在步骤S330中，在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合。

在本公开的一实施例中，预存的数据库中，存储有大量的问题信息及该问题信息对应的语意信息，将所述问题信息对应的语意信息与预存数据库中的语意信息进行比对，如一致，则将与所述问题信息的语意信息相同的预存数据库中的语意信息对应的问题信息确定为所述近似问题信息。

在步骤S340中，获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表。

在本公开的一个实施例中，所述搜索结果列表是指将通过搜索确定出的与用户想要的搜索结果相关的多个搜索结果分别填入预设的列表的列表框中，每个列表框中仅显示该列表框对应的搜索结果的部分内容。还以用户输入的问题信息是“今年大学的排名”为例，则得到的搜索结果列表可为：

在本公开的一实施例中，如图4所示，图3中步骤S340可以包括：

步骤S3401：提取所述问题信息对应的关键词与所述近似问题信息对应的关键词；

步骤S3402：基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表；

步骤S3403：基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。

在本公开的一实施例中，关键词是指特指单个媒体在制作使用索引时，所用到的词汇。如：还以获取的问题信息为：“今年大学的排名”为例，对应的关键词就是“今年”“大学”“排名”。提取问题信息包含的关键词可以通过预先训练好的关键词提取模型的方式提取问题信息包含的关键词，也可以通过对获取的问题信息进行分句，将获取的问题信息分成的句子在预存的模板句式数据库中匹配与所述问题信息分成的句子相应的模板句子，所述模板句子中标明有关键词的位置，基于所述模板句子中标明的关键词的位置确定所述问题信息分成的句子包含的关键词。

在本公开的一实施例中，通过获取语意相同的近似问题对应的搜索结果列表，可以扩大对用户输入问题信息对应搜索结果的范围，从而保证获取的搜索结果中含有用户所需要的搜索结果，同时也避免用户再次输入相同语意但不同文本的问题信息，再次通过搜索引擎获取搜索结果，从而提高用户对搜索结果的满意度。

继续参照图3所示，在步骤S340中，针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息。

在本公开的一实施例中，所述撰写时间是指该搜索结果对应的内容被作者完成后发布到网络数据库中的时间，如作者王三撰写好一篇“怎么做土豆炖牛腩”的文章，随后与2019年5月30日发布到社区网站上，则2019年5月30日就是该“怎么做土豆炖牛腩”的文章对应的撰写时间。

在本公开的一实施例中所述撰写者标识是指用户的注册账户名，该注册账户名对应一个唯一的用户，可以通过该注册账户名，确定一个唯一的撰写者。

在本公开的一实施例中，所述历史访问信息至少包括历史访问次数与历史访问总时长，如一搜索结果现在的而历史访问次数是2次，历史访问总时长是2小时，而后一用户点击并访问了该搜索结果，则在该搜索结果对应原来的历史访问次数上加一，即该搜索结果的历史访问次数现在是3次，该用户点击并访问该搜索结果时记录该用户访问时间，当该用户关闭该搜索结果时则记录该用户离开时间，用用户离开时间减去用户访问时间，即为该用户本次访问该搜索结果的访问时长，如该用户本次访问该搜索结果的访问时长为10分钟，则该搜索结果的历史访问总时长为2小时加上10分钟，即该搜索结果的历史访问总时长变为2小时10分钟。

在本公开的一实施例中，所述历史用户访问该搜索结果后的行为操作信息至少包括所述历史用户访问所述搜索结果后输入的新问题信息和所述历史用户访问该搜索结果后的访问其他搜索结果的次数，如当用户访问该搜索结果后，觉得该搜索结果并不是自己所需要的搜索结果，就会关闭该搜索结果所在的网页或不关闭该搜索结果所在的网页，进而访问其他搜索结果的网页，当用户访问多个搜索结果对应的网页后，仍未发现自己所需的搜索结果，就会在搜索引擎的输入框中重新输入新的与上一次输入的问题信息相近的新问题信息，再次通过搜索引擎检索自己所需的搜索结果。

在步骤S350中，基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数。

在本公开的一实施例中，基于所述撰写时间确定第一分数可以包括：确定所述撰写时间距当前时间的长度；根据以下公式确定第一分数：S₁＝a₁/(b₁+T₁)，其中所述S₁是第一分数，T₁是所述撰写时间距离当前时间的长度，a₁和b₁是预设的常数。如用户获取的一搜索结果对应的撰写时间为2019年5月30日，而用户输入问题信息的时间为2019年6月1日，则该搜索结果对应的撰写时间距离当前时间的长度为2天；由于撰写时间距离当前时间越短，该搜索结果对应的程度可能越重要，但是由于该搜索结果撰写时间相对其他搜索结果撰写时间较晚，因此设置常数a₁和b₁以平衡基于撰写时间获取的第一分数，以免出现因该搜索结果对应的撰写时间距离当前时间的长度极短，进而导致第一分数无限大的情形，其中b₁为预设固定常数，a₁为基于撰写时间距当前时间长度与预设的时间长度对应关系表确定的具有一点变化的预设常数。

在本公开的一实施例中，基于所述撰写者标识确定第二分数可以包括：基于所述撰写者标识在预存的用户信息库数据库，确定所述撰写者标识对应的撰写者信息，其中所述撰写者信息包含所述撰写者对应的撰写者等级；根据以下公式确定第二分数：S₂＝a₂·R·D₁，其中S₂是所述第二分数，D₁是所述撰写者等级，a₂是预设的正常数，R是预设的大于1的常数。如撰写者对应的标识为14238，则可通过该标识“14238”从预存的数据库中提取该标识对应的撰写者信息，经确认该标识“14238”对应的撰写者信息为：王三、男、年龄25岁、编程类文章撰写等级3级……。因撰写者对应的撰写等级越高，则其撰写的搜索结果的采纳可能性也就越大，通过设置正常数a₁与大于1的常数R可以增显撰写者等级对搜索结果对应的综合评分的影响，其中R根据预设的撰写者等级对应的常数数值表确定，该预设的撰写者等级对应的常数数值表可以为，如撰写者等级1～3对应的常数R相同，撰写者等级4～5对应的常数R相同。

在本公开的一实施例中，基于所述历史访问信息确定第三分数可以包括：提取所述历史访问信息中包含的历史访问次数与历史访问总时长；根据以下公式确定第三分数：S₃＝a₃·C+a₄·lnP其中S₃是所述第三分数，C是所述历史访问次数，a₃、a₄是预设常数、P是所述历史访问总时长。

在本公开的一实施例中，基于所述用户访问所述搜索结果后的行为操作信息确定第四分数，可以包括：提取所述用户访问该搜索结果后的行为操作信息中包含的所述历史用户访问所述搜索结果后输入的新问题信息和所述历史用户访问该搜索结果后的访问其他搜索结果的次数；

获取所述历史用户访问所述目标搜索结果后输入的新问题信息与所述问题信息间的杰卡德距离；

根据以下公式确定所述第四分数：S4＝a5·{(j₁+j₂+……j_n)÷n}+a6·{(d₁+d₂+……d_n)÷n}，其中s4是所述第四分数，a5、a6是预设常数，j₁是所述第一个历史用户在访问所述问题信息后输入的新问题信息与所述问题信息间的杰卡德距离，n是所述历史用户的总个数，d₁是所述第一个历史用户访问该搜索结果后访问其他搜索结果的次数。

在步骤S370中，基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分。

在本公开的一实施例中，可以直接将获取的所述第一分数、第二分数、第三分数、第四分数间的和作为所述搜索结果的综合评分，也可通过获取所述第一分数对应的权重、所述第二分数对应的权重、第三分数对应的权重、第四分数对应的权重，将所述第一分数与所述第一分数对应权重的积、所述第二分数与所述第二分数对应的权重的积、所述第三分数与所述第三分数对应权重的积、所述第四分数与所述第四分数对应的权重的积间的和作为所述搜索结果的综合分数。

在步骤S380中，基于所述搜索结果的综合评分，对所述搜索结果进行排序。

在本公开的一实施例中，基于所述搜索结果的综合评分，对所述搜索结果进行排序，可以基于所述搜索结果的综合评分，对所述搜索结果从大到小进行排序，也可以从小到大进行排序。

在本公开的一实施例中，对所述搜索结果进行排序后，还可以包括：将所述排序的搜索结果通过显示设备显示给所述用户。

在本公开的一实施例中，将所述排序的搜索结果通过显示设备显示给所述用户，通过获取所述用户的年龄，基于所述用户的年龄确定所述用户对应的敏感关键词，若针对所述搜索结果中每一搜索结果，若该搜索结果中含有的所述敏感关键词的个数超过预设的阈值，则将该搜索结果判为对所述用户的敏感信息，将所述搜索结果中所述敏感信息中剔除后通过所述显示设备侠士给所述用户。为更好的保证未成年人的网络环境，使其能够更好的通过网络获取适合自己的知识。

以下介绍本公开的装置实施例，可以用于执行本公开上述实施例中的语意识别的搜索结果排序方法。对于本公开装置实施例中未披露的细节，请参照本公开上述的语意识别的搜索结果排序方法的实施例。

图5示意性示出了根据本公开的一个实施例的基于语意识别的搜索结果排序装置的框图。

参照图5所示，根据本公开的一个实施例的基于语意识别的搜索结果排序装置400，包括：第一获取单元410、第二获取单元420、第三获取单元430、第四获取单元440、第五获取单元450、第六获取单元460、确定单元470、排序单元480。

其中，第一获取单元410用于，获取用户输入的问题信息；第二获取单元420用于将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息；第三获取单元430用于，在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合；第四获取单元440用于，获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表；第五获取单元450用于，针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息；第六获取单元460用于，基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数；确定单元470用于，基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；排序单元480用于，基于所述搜索结果的综合评分，对所述搜索结果进行排序。

在本公开的一个实施例中，所述搜索结果排序装置还包括机器学习模型训练单元用于，预先设置问题信息集合；预先识别出所述问题信息结合中每个问题信息样本对应的语意信息；将所述问题信息样本输入所述语意识别模型，获取由所述语意识别模型输出的所述问题信息样本对应的语意信息，将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对，如不一致则，调整所述语意识别模型的参数，直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。

在本公开的一实施例中，所述第四获取单元440还用于，提取所述问题信息对应的关键词与所述近似问题信息对应的关键词；基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表；基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。

在本公开的一实施例中，所述第五获取单元460还用于，确定所述撰写时间距当前时间的长度；根据以下公式确定第一分数：S₁＝a₁/(b₁+T₁)，其中所述S₁是第一分数，T₁是所述撰写时间距离当前时间的长度，a₁和b₁是预设的常数。

在本公开的另一实施例中，所述第五获取单元460还用于，基于所述撰写者标识在预存的用户信息库数据库，确定所述撰写者标识对应的撰写者信息，其中所述撰写者信息包含所述撰写者对应的撰写者等级；根据以下公式确定第二分数：S₂＝a₂·R·D₁，其中S₂是所述第二分数，D₁是所述撰写者等级，a₂是预设的正常数，R是预设的大于1的常数。

在本公开的另一实施例中，所述第五获取单元460还用于，提取所述历史访问信息中包含的历史访问次数与历史访问总时长；根据以下公式确定第三分数：S₃＝a₃·C+a₄·lnP其中S₃是所述第三分数，C是所述历史访问次数，a₃、a₄是预设常数、P是所述历史访问总时长。

在本公开的另一实施例中，所述第五获取单元460还用于，提取所述用户访问该搜索结果后的行为操作信息中包含的所述历史用户访问所述搜索结果后输入的新问题信息和所述历史用户访问该搜索结果后的访问其他搜索结果的次数；获取所述历史用户访问所述目标搜索结果后输入的新问题信息与所述问题信息间的杰卡德距离；根据以下公式确定所述第四分数：：S4＝a5·{(j₁+j₂+……j_n)÷n}+a6·{(d₁+d₂+……d_n)÷n}，其中s4是所述第四分数，a5、a6是预设常数，j₁是所述第一个历史用户在访问所述问题信息后输入的新问题信息与所述问题信息间的杰卡德距离，n是所述历史用户的总个数，d₁是所述第一个历史用户访问该搜索结果后访问其他搜索结果的次数。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种基于语意识别的搜索结果排序方法，其特征在于，包括：

获取用户输入的问题信息；

将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息；

在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合；

获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表；

针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息；

基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数；

基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；

基于所述搜索结果的综合评分，对所述搜索结果进行排序。

2.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述语意识别模型通过以下方式进行训练：

预先设置问题信息集合；

预先识别出所述问题信息结合中每个问题信息样本对应的语意信息；

将所述问题信息样本输入所述语意识别模型，获取由所述语意识别模型输出的所述问题信息样本对应的语意信息，将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对，如不一致则，调整所述语意识别模型的参数，直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。

3.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述获取所述问题信息及所述近似问题信息集合中每个近似问题信息对应的搜索结果列表，包括：

提取所述问题信息对应的关键词与所述近似问题信息对应的关键词；

基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表；

基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。

4.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述基于所述撰写时间确定第一分数，包括：

确定所述撰写时间距当前时间的长度；

根据以下公式确定第一分数：S₁＝a₁/(b₁+T₁)，其中所述S₁是第一分数，T₁是所述撰写时间距离当前时间的长度，a₁和b₁是预设的常数。

5.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述基于所述撰写者标识确定第二分数，包括：

基于所述撰写者标识在预存的用户信息库数据库，确定所述撰写者标识对应的撰写者信息，其中所述撰写者信息包含所述撰写者对应的撰写者等级；

根据以下公式确定第二分数：S₂＝a₂·R·D₁，其中S₂是所述第二分数，D₁是所述撰写者等级，a₂是预设的正常数，R是预设的大于1的常数。

6.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述基于所述历史访问信息确定第三分数，包括：

提取所述历史访问信息中包含的历史访问次数与历史访问总时长；

根据以下公式确定第三分数：S₃＝a₃·C+a₄·lnP其中S₃是所述第三分数，C是所述历史访问次数，a₃、a₄是预设常数、P是所述历史访问总时长。

7.根据权利要求1所述的基于语意识别的搜索结果排序方法，其特征在于，所述基于所述用户访问所述搜索结果后的行为操作信息确定第四分数，包括：

提取所述用户访问该搜索结果后的行为操作信息中包含的所述历史用户访问所述搜索结果后输入的新问题信息和所述历史用户访问该搜索结果后的访问其他搜索结果的次数；

根据以下公式确定所述第四分数：：S4＝a5·{(j₁+j₂+……j_n)÷n}+a6·{(d₁+d₂+……d_n)÷n}，其中s4是所述第四分数，a5、a6是预设常数，j₁是所述第一个历史用户在访问所述问题信息后输入的新问题信息与所述问题信息间的杰卡德距离，n是所述历史用户的总个数，d₁是所述第一个历史用户访问该搜索结果后访问其他搜索结果的次数。

8.一种基于语意识别的搜索结果排序装置，其特征在于，包括：

第一获取单元，用于获取用户输入的问题信息；

第二获取单元，用于将所述问题信息输入预设的语意识别模型，获取由所述语意识别模型输出的所述问题信息对应的语意信息；

第三获取单元，用于在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合；

第四获取单元，用于获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表；

第五获取单元，用于针对所述搜索结果列表中每个搜索结果，获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息；

第六获取单元，用于基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数；

确定单元，用于基于所述第一分数、第二分数、第三分数、第四分数，确定所述搜索结果的综合评分；

排序单元，用于基于所述搜索结果的综合评分，对所述搜索结果进行排序。

9.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语意识别的搜索结果排序方法。

10.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任一项所述的基于语意识别的搜索结果排序方法。