CN110378560A

CN110378560A - 仲裁员数据筛选方法、装置、计算机设备和存储介质

Info

Publication number: CN110378560A
Application number: CN201910515008.4A
Authority: CN
Inventors: 叶素兰; 窦文伟; 毛皎龙; 李方; 柳明辉; 徐国强
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-06-14
Filing date: 2019-06-14
Publication date: 2019-10-25
Anticipated expiration: 2039-06-14
Also published as: CN110378560B

Abstract

本申请涉及数据处理领域，特别涉及数据查询，也即一种仲裁员数据筛选方法、装置、计算机设备和存储介质。方法包括：获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据；对标准仲裁员数据进行初始筛选得到初始仲裁员数据；接收终端发送的排序信息，根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取排序指标；将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据。采用本方法能够提高筛选效率。

Description

仲裁员数据筛选方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种数据筛选方法、装置、计算机设备和存储介质。

背景技术

当有用户涉及仲裁案件时，则需要选择与案件对应的仲裁员，也即需要选择在仲裁案件中对案件进行评判并作出决定的居中裁判者。

传统地，当用户选择仲裁员时，需要人工对不同的仲裁员数据进行筛选，导致选择仲裁员的效率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高效率的仲裁员数据筛选方法、装置、计算机设备和存储介质。

一种仲裁员数据筛选方法，所述方法包括：

获取第一仲裁员基本数据，将所述第一仲裁员基本数据进行标准化处理得到标准仲裁员数据；

对所述标准仲裁员数据进行初始筛选得到初始仲裁员数据；

接收终端发送的排序信息，根据所述排序信息以及所述初始仲裁员数据对应的第二仲裁员基本数据计算排序指标；

将所述排序指标输入至计算模型中得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据。

在一个实施例中，所述根据所述排序信息、以及与所述初始仲裁员数据对应的第二仲裁员基本数据获取计算排序指标，包括：

提取所述排序信息中的排序关键词；

获取所述排序信息中包含的所述排序关键词的第一词频，获取所述第二仲裁员基本数据中包含的所述排序关键词的第二词频；

统计包含有所述排序关键词的所述第二仲裁员基本数据的数量，并获取所述第二仲裁员基本数据的数据总量，根据所述数量以及所述数据总量计算词语评价权重；

将所述第一词频、所述第二词频以及所述词语评价权重作为排序指标。

在一个实施例中，所述根将所述排序指标输入至计算模型中计算得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据，包括：

获取调节因子，根据所述调节因子、数据总量、第一词频、第二词频以及词语评价权重输入至计算模型中，计算排序信息与初始仲裁员数据的第一相关度；

将所述第一相关度进行排序得到筛选的仲裁员数据。

在一个实施例中，所述获取第一仲裁员基本数据，将所述第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，包括：

对所述第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据；

根据分词后的第一仲裁员基本数据提取待识别特征；

根据所述待识别特征对所述分词后的第一仲裁员基本数据添加识别结果标签；

根据所述识别结果标签，将所述分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据。

在一个实施例中，所述将所述排序指标输入至计算模型中得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：

获取用户标识，根据所述用户标识查询用户关联案件；

获取所述用户关联案件的类型，根据所述类型，获取所述筛选的仲裁员数据的案件匹配评分；

根据所述第一相关度以及所述案件匹配评分计算目标得分，根据所述目标得分得到目标仲裁员数据。

当所述第一相关度低于预设值时，则查询所述排序信息对应的所述排序关键词是否存在替换关键词；

当存在替换关键词时，则采用所述替换关键词对所述排序关键词进行替换得到替换信息；

根据所述替换信息获取替换指标，将所述替换指标输入至替换模型中得到所述初始仲裁员数据与所述替换信息的第二相关度；

查询所述第二相关度是否高于预设值，当所述第二相关度高于所述预设值时，则将所述替换关键词以及按照所述第二相关度进行排序的初始仲裁员数据输出。

一种仲裁员数据筛选装置，所述装置包括：

获取模块，用于获取第一仲裁员基本数据，将所述第一仲裁员基本数据进行标准化处理得到标准仲裁员数据；

筛选模块，用于对所述标准仲裁员数据进行初始筛选得到初始仲裁员数据；

第一计算模块，用于接收终端发送的排序信息，根据所述排序信息以及所述初始仲裁员数据对应的第二仲裁员基本数据获取排序指标；

第二计算模块，用于将所述排序指标输入至计算模型中得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据。

在一个实施例中，所述第一计算模块，包括：

提取单元，用于提取所述排序信息中的排序关键词；

获取单元，用于获取所述排序信息中包含的所述排序关键词的第一词频，获取所述第二仲裁员基本数据中包含的所述排序关键词的第二词频；

统计单元，用于统计包含有所述排序关键词的所述第二仲裁员基本数据的数量，并获取所述第二仲裁员基本数据的数据总量，根据所述数量以及所述数据总量计算词语评价权重；将所述第一词频、所述第二词频以及所述词语评价权重作为排序指标。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

上述仲裁员数据筛选方法、装置、计算机设备和存储介质，无需人工对所有的仲裁员数据逐一进行筛选，而是可以先将仲裁员基本数据进行标准化处理得到标准仲裁员数据，进而接收到筛选信息，根据筛选信息，从标准仲裁员数据中提取初始仲裁员数据，接收终端发送的与初始仲裁员数据对应的排序信息，根据排序信息以及与初始仲裁员数据对应的第二仲裁员基本数据获取排序指标，将排序指标输入至计算模型中得到初始仲裁员数据以及排序信息的第一相关度，根据第一相关度得到筛选的仲裁员数据，从而可以提高筛选效率。

附图说明

图1为一个实施例中仲裁员数据筛选方法的应用场景图；

图2为一个实施例中仲裁员数据筛选方法的流程示意图；

图3为一个实施例中排序指标计算步骤的流程示意图；

图4为一个实施例中仲裁员数据筛选装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的仲裁员数据筛选方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。服务器104获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，对标准仲裁员数据进行初始筛选得到初始仲裁员数据，服务器104接收到终端102发送的排序信息，根据排序信息以及初始仲裁员数据对应的第二仲裁员基本数据获取排序指标，服务器104将计算得到的排序指标输入计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对仲裁员数据进行筛选得到筛选的仲裁员数据，将筛选的仲裁员数据发送至终端102进行显示。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种仲裁员数据筛选方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

S202：获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据。

具体地，第一仲裁员基本数据是指预存储在服务器中的未经处理的仲裁员信息，可以是，服务器向不同的网站服务器发送获取仲裁员数据的获取请求，接收与获取请求对应的不同的仲裁员信息作为第一仲裁员基本数据，例如，第一仲裁员基本数据是不同的网站上包含的不同格式或者不同长度的仲裁员简介等。标准仲裁员数据是指服务器对接收到的第一仲裁员基本数据，按照预设的标准化逻辑进行处理得到的处理后的仲裁员信息，标准仲裁员数据可以是按照预设的格式以及预设的长度的处理后的仲裁员信息。

具体地，服务器获取到第一仲裁员基本数据，查询预存储的标准化逻辑，根据标准化逻辑将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，可以是，服务器获取到第一仲裁员基本数据，查询预存储的标准化逻辑，根据标准化逻辑提取第一仲裁员基本数据中的子数据，从而将子数据进行组合得到标准仲裁员数据，使得标准仲裁员数据是统一格式的数据。

S204：对标准仲裁员数据进行初始筛选得到初始仲裁员数据。

具体地，初始仲裁员数据是指根据相应的筛选信息进行筛选得到的仲裁员数据。具体地，终端将接收到的筛选信息发送至服务器，服务器接收到终端发送的筛选信息，则根据筛选信息与标准仲裁员数据进行匹配，将与筛选信息匹配成功的标准仲裁员数据作为初始仲裁员数据。可以是，终端在显示界面上设置相应的选项，用户选择对应的选项生成筛选信息，终端将生成的筛选信息发送至服务器，服务器接收到筛选信息时，则将筛选信息与标准仲裁员数据进行匹配，将匹配成功的标准仲裁员数据作为初始仲裁员数据，其中，终端还可以在显示界面上设置有输入框等，用户可以输入相关字符生成筛选信息。例如，终端接收到的筛选信息为学历为硕士及以上，工作经验为3年以上，则根据筛选信息，与标准仲裁员数据进行匹配，从而将匹配成功的标准仲裁员数据作为初始仲裁员数据。筛选信息是指仲裁员信息中的基本信息，可以是，筛选信息是指仲裁员信息中的学历的范围、工作年限范围等。

S206：接收终端发送的排序信息，根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取排序指标。

具体地，排序信息是指决定初始仲裁员数据输出顺序的信息，可以是，排序信息是相关详细信息，例如可以是详细的仲裁员信息，如具体学校、工作单位、姓氏等，其中，排序信息可以是语句信息，也可以是词语信息。第二仲裁员基本数据是指未经处理的、且与初始仲裁员数据所关联的仲裁员的相关信息，服务器可以根据初始仲裁员数据直接关联查询到第二仲裁员基本数据。排序指标是指计算相关度的所需指标，根据排序指标计算得到相关度，从而将初始仲裁员数据按照相关度进行排序，可以是，排序指标为排序信息出现在第二仲裁员基本数据中的频率，可以是排序信息出现在第二仲裁员基本数据所对应的数据数量等。

具体地，服务器接收从终端发送到排序信息，进而选取到初始仲裁员数据对应的第二仲裁员基本数据，根据排序信息与第二仲裁员基本数据，获取排序指标。例如，用户通过终端输入相应的排序信息，可以是输入详细信息，该详细信息即为排序信息，也即服务器可以根据排序信息对进行筛选的初始仲裁员数据进行排序，后续当需要进行输出时在前的初始仲裁员数据是与排序信息最相关的，终端将该排序信息发送至服务器，服务器接收到排序信息时，选取与初始仲裁员数据对应的第二仲裁员基本数据，根据排序信息与第二仲裁员基本数据获取排序指标，如可以通过计算排序信息在第二仲裁员基本数据中出现的频次，以及计算排序顺序在第二仲裁员基本数据所对应的数据数量等，从而得到排序指标。

S208：将排序指标输入值计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据。。

具体地，第一相关度是指初始仲裁员数据与排序信息对应的相关程度。计算模型是指表现排序指标以及相关之间关系的计算逻辑，可以根据输入的排序指标得到确定的相关度。具体地，服务器获取到排序信息时，根据排序信息与第二仲裁员基本数据计算得到排序指标，服务器根据排序指标，将排序指标输入至计算模型中，得到初始仲裁员数据与排序信息的第一相关度。可以是，服务器根据排序指标，将排序指标输入至计算模型中，通过计算模型根据排序指标得到第一相关度，当服务器得到第一相关度时，则按照第一相关度对初始仲裁员数据进行排序，从而在后续输出时，输出在前的初始仲裁员数据为第一相关度最高的数据，也即是初始仲裁员数据与排序信息最相关的数据，从而可以得到筛选的仲裁员数据。例如，服务器接收到排序信息为具体学校名，则根据学校名计算与第二仲裁员基本数据的排序指标，进而根据排序指标，将排序指标输入至计算模型中，得到第一相关度，根据第一相关度，对初始筛选得到的初始仲裁员进行排序得到最终筛选的仲裁员数据，进而当需要输出时，则将筛选的仲裁员数据按照顺序进行输出。需要说明的是，当服务器未获取到排序信息时，则可以将获取到的初始仲裁员数据作为筛选的仲裁员数据。

本实施例中，服务器获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，对标准仲裁员数据进行初始筛选得到初始仲裁员数据，进而获取排序信息，根据排序信息以及初始仲裁员数据对应的第二仲裁员基本数据计算排序指标，根据排序指标，计算初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据，从而无需在选择仲裁员数据时人工进行筛选，可以提高对筛选效率。

在一个实施例中，请参见图3，提供一排序指标计算步骤的流程示意图，排序指标计算步骤，也即根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取计算排序指标，包括：提取排序信息中的排序关键词；获取排序信息中包含的排序关键词的第一词频，获取第二仲裁员基本数据中包含的排序关键词的第二词频；统计包含有排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重；将第一词频、第二词频以及词语评价权重作为排序指标。

具体地，排序关键词是指对排序信息按照分词逻辑进行分词所得到的关键词。第一词频是指排序关键词在排序信息中出现的次数。第二词频是指排序关键词在第二仲裁员基本数据中出现的次数。词语评价权重是指评价排序关键词在不同的第二仲裁员基本数据中的重要程度的指标。

具体地，当服务器获取到排序信息时，则获取到拆分逻辑，根据拆分逻辑将排序信息进行拆分得到排序关键词，进而服务器将排序关键词逐一与排序信息中包含的词语进行匹配，进而服务器统计匹配成功的次数作为第一词频，也即作为排序信息中包含的排序关键词的第一词频，进而服务器将排序关键词逐一与第二仲裁员基本数据中包含的词语进行匹配，进而服务器统计匹配成功的次数作为第二词频，进而服务器将排序关键词与第二仲裁员基本数据进行匹配，从而统计包含有排序关键词的第二仲裁员基本数据的数量，服务器获取第二仲裁员基本数据的数据总量，根据包含排序关键词的第二仲裁员基本数据的数量以及第二仲裁员基本数据的数据总量，计算词语评价权重，服务器将计算得到的第一词频、第二词频以及词语评价权重作为排序指标。

可以是，服务器获取到分词逻辑，按照分词逻辑将排序信息进行拆分，拆分时可以得到不同的分词序列，进而查询不同的分词序列对应的拆分正确率，将拆分正确率最高的分词序列作为排序关键词，其中，计算拆分正确率可以是当将排序信息拆分成不同的分词序列时，则获取预设的每个分词序列中包含的不同的分词词组的正确率，进而计算不同的分词词组的正确率乘积，从而得出每一个分词序列对应的拆分正确率，将拆分正确率高的分词序列作为排序关键词，当服务器获取到排序关键词时，则分别获取到不同的排序关键词在排序信息中出现的频次作为第一词频，进而分别获取不同的排序关键词在第二仲裁员基本数据中出现的频次作为第二词频，再统计包含有排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重，该第一词频、第二词频以及词语评价权重作为排序指标。需要说明的是，分词序列是指对排序信息进行拆分得到的不同的分词序列，也即得到不同的标准术语。拆分正确率是指经过将排序信息进行拆分得到的分词字段的正确程度，也即将排序信息进行拆分得到的不同的标准术语的正确程度，当拆分正确率越高则表示将排序信息进行拆分得到的分词序列的正确率越高。

例如，服务器获取到排序信息，如排序信息为“毕业于北京大学”，进而服务器获取到分词逻辑，按照分词逻辑将排序信息进行拆分得到不同的分词序列，可以是得到的分词序列为“毕业”、“于”、“北京”、“大学”，还可以得到分词序列为“毕业”、“于”、“北京大学”，进而获取得到的分词序列中的词组的正确率，将获取到的正确率计算正确率乘积，从而得出每个分词序列对应的拆分正确率，将拆分正确率高的分词序列作为排序关键词，如以上获取到的排序关键词为“毕业”、“于”、“北京大学”，则发你别获取“毕业”、“于”、“北京大学”在排序信息中出现的频次作为第一词频，进而分别获取“毕业”、“于”、“北京大学”在第二仲裁员基本数据中出现的频次作为第二词频，再分别统计包含有“毕业”、“于”、“北京大学”的第二仲裁员基本数据的数据数量，并获取第二仲裁员基本数据的数据总量，根据数据数量以及数据总量计算词语评价权重，将计算得到的第一词频、第二词频以及词语评价权重作为评价指标，其中计算词语评价权重可以采用如下公式进行计算：

其中，N表示第二仲裁员基本数据的数据总量，n(qi)表示包含了排序关键词的第二仲裁员基本数据的数据数量，q_i表示不同排序关键词。需要说明的是，当第二仲裁员基本数据为不同文档时，第二仲裁员基本数据的数据总量可以为文档的数量，包含排序关键词的第二仲裁员基本数据的数据数量可以为包含了排序关键词的第二仲裁员基本数据的文档的数量。

本实施例中，在计算排序指标时，可以根据排序关键词，获取排序信息中包含的排序关键词的第一词频，进而获取第二仲裁员基本数据中包含的排序关键词的第二词频，统计包含排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重，将第一词频、第二词频与词语评价权重作为排序指标，计算排序指标简单。

在一个实施例中，将排序指标输入至计算模型中计算得到所述初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据，包括：获取调节因子，根据调节因子、数据总量、第一词频、第二词频以及词语评价权重输入至计算模型中，计算排序信息与初始仲裁员数据的第一相关度；将第一相关度进行排序得到筛选的仲裁员数据。

具体地，调节因子是指预设的调节参数，该调节参数可以根据预设的参数训练模型进行训练得到，其中在采用参数训练模型训练调节参数时可以是将样本排序指标以及样本相关度输入到参数训练模型中进行训练，从而得到调节因子。服务器获取到训练得到调节因子，则根据调节因子、第二仲裁员数据的数据总量、第一词频、第二词频以及词语评价权重，采用计算模型，计算排序信息与第二仲裁员基本数据的相关度，由于第二仲裁员基本数据与初始仲裁员数据是相关联的数据，则计算得到的相关度即为排序信息与初始仲裁员数据的第一相关度，将得到的第一相关度进行排序，可以是，将第一相关度从大到小进行排序，得到筛选的仲裁员数据，需要说明的是，服务器获取到的排序关键词为不同的排序关键词，则可以分别计算不同的排序关键词与初始仲裁员数据的不同的第一子相关度，并将不同的第一子相关度进行求和得到第一相关度。例如，当服务器计算得到排序指标时，则获取到调节因子，进而根据调节因子、排序指标中的数据总量、第一词频、第二词频以及词语评价权重计算排序信息与第二仲裁员基本数据的相关度，该相关度即为第一相关度，其中，计算相应的第一相关度的计算模型可以采用如下公式；

其中，dl为第二基本仲裁员数据的基本长度，也即是第二基本仲裁员数据中包含的词语的数量，avgdl为所有第二基本仲裁员数据的平均长度，也即是第二基本仲裁员数据中包含的词语数量的平均值，k1，k2，b表示调节因子，TF1表示第一词频，TF2表示第二词频，。N表示第二仲裁员基本数据的数据总量，n(qi)表示包含了排序关键词的第二仲裁员基本数据的数据数量，q_i表示不同排序关键词。也即可以根据上述公式，计算出第一个排序关键词的相关度到最后一个排序关键词的相关度，将所有的相关度进行求和即为第一相关度。

本实施例中，当计算第一相关度时，在计算第一相关度时可以获取调节因子，根据调节因子、数据总量、第一词频、第二词频以及词语评价权重计算排序信息与初始仲裁员数据的第一相关度，计算第一相关度简单，进而将得到的第一相关度进行排序得到筛选的仲裁员数据，保证排序在前的初始仲裁员数据为与排序信息最相关的数据，增强适用性，且无需人工选择最相关的仲裁员数据，提高筛选效率。

在一个实施例中，获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，包括：对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据；根据分词后的第一仲裁员基本数据提取待识别特征；根据待识别特征对分词后的第一仲裁员基本数据添加识别结果标签；根据识别结果标签，将分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据。

具体地，识别特征是指可以采用识别模型进行识别的实体数据，可以是，识别特征为在分词后的第一仲裁员基本数据中的实体数据，也即区别于第一仲裁员基本数据中的连词或虚词等的数据。识别结果标签是指将第一仲裁员基本数据采用相关的识别模型进行识别，从而得到的数据类型对应的数据标签，识别结果标签可以是相关实体数据标签，如人名、地名、学校名称或者公司名称等。

具体地，当服务器获取到第一仲裁员基本数据时，则可以对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据，其中对第一仲裁员基本数据进行分词的步骤可以参见上述步骤，也即服务器可以获取到对应的分词逻辑，将第一仲裁员基本数据按照分词逻辑分成不同的第一仲裁员基本数据的分词序列，计算不同分词序列的拆分正确率，将拆分正确率高的分词序列作为分词后的第一仲裁员基本数据，进而将分词得到的分词后的第一仲裁员基本数据与预设的词语过滤库进行匹配，当匹配成功时，则将匹配成功的分词后的第一仲裁员基本数据进行过滤，得到的即为待识别特征，将待识别特征输入到识别模型，识别模型根据输入的识别特征，得到识别特征对应的识别结果标签，该识别特征对应的识别结果标签即为分词后的第一仲裁员基本数据的识别结果标签，进而将分词后的第一仲裁员基本数据对应的识别结果标签，将分词后的第一仲裁员基本数据进行组合，从而得到标准仲裁员数据，也即可以将不同的第一仲裁员基本数据整合为统一格式等的标准仲裁员数据。其中，词语过滤库是指包含有相应的连词或者虚词等非实体数据的词语的数据库。识别模型是指采用样本实体数据进行训练得到的模型，从而识别模型可以对输入的识别特征值添加对应的标签，如添加有人名标签、地名标签、学校名标签、公司名标签等相应的识别结果标签。

本实施例中，服务器可以对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据，根据分词后的第一仲裁员基本数据提取待识别特征，从而保证过滤相关连词等数据，从而提高处理效率，进而服务器根据待识别特征对分词后的第一仲裁员基本数据天剑识别结果标签，根据识别结果标签，将分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据，使得后续输出的仲裁员数据为统一的数据，增强适用性。

在一个实施例中，将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：获取用户标识，根据用户标识查询用户关联案件；获取用户关联案件的类型，根据类型，获取筛选的仲裁员数据的案件匹配评分；根据第一相关度以及案件匹配评分计算目标得分，根据目标得分得到目标仲裁员数据。

具体地，用户标识是指当前用户的基本身份信息。案件匹配评分是指筛选的仲裁员数据与用户关联案件的匹配度的得分，也即可以是，筛选的仲裁员数据对应的仲裁员是否擅长评判对应的类型的用户关联案件的评价指标。具体地，服务器可以对筛选的仲裁员数据进行进一步选取，服务器可以获取到当前的用户标识，进而根据用户标识，查询与用户标识对应的用户详细数据，从而从用户详细数据中提取到用户关联案件，服务器查询用户关联案件的类型，进而服务器查询筛选的仲裁员数据对应的待匹配案件类型，根据用户关联案件的类型以及待匹配案件类型获取筛选的仲裁员数据的案件匹配评分，根据案件匹配得分以及第一相关度计算目标得分，可以是，用户通过终端输入相应的身份信息，可以是对应的登录信息等，服务器接收到用户标识，根据用户标识与预存储的用户信息库中的用户标识进行匹配，当匹配成功时，则查询匹配成功的用户标识所关联的用户详细数据，从用户详细数据中选取到用户关联案件，可以是，根据用户详细数据中包含的相关字段，如字段为“案件”，则查询字段对应的数据作为用户关联案件，进而提取用户关联案件的类型，如劳动纠纷案等，进而服务器查询到筛选的仲裁员数据中包含的办理案件的案件类型，以及该案件类型的数量，根据办理同样类型的案件的案件数量，获取到评分范围，根据评分范围查询到相应案件匹配评分，根据案件匹配评分以及第一相关度计算目标得分，可以是，获取到案件匹配评分对应的第一权重，并获取第一相关度的第二权重，计算案件匹配评分以及第一权重的第一乘积，以及计算第一相关度与第二权重的第二乘积，将第一乘积与第二乘积进行求和，从而得到目标得分，根据目标得分，将筛选的仲裁员数据再次进行排序，可以是将目标得分高的筛选得仲裁员数据排在前，从而得到目标仲裁员数据，进而服务器可以将目标仲裁员数据发送至终端，使得终端将目标仲裁员数据按照顺序进行显示。其中，评分范围是指不同的案件数量对应的范围，根据案件数量落入的范围，关联的得分。

本实施例中，服务器可以获取到用户标识，根据用户标识查询用户关联案件，进而服务器获取用户关联案件的类型，根据类型，获取筛选的仲裁员数据的案件匹配评分，根据第一相关度以及案件匹配评分计算目标得分，根据目标扥分得到目标仲裁员数据，从而可以对筛选的仲裁员数据进一步筛选，使得得到的目标仲裁员数据更加准确。

在一个实施例中，将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：当第一相关度低于预设值时，则查询排序信息对应的排序关键词是否存在替换关键词；当存在替换关键词时，则采用替换关键词对排序关键词进行替换得到替换信息；根据替换信息获取替换指标，将所述替换指标输入至替换模型中得到初始仲裁员数据与替换信息的第二相关度；查询第二相关度是否高于预设值，当第二相关度高于预设值时，则将替换关键词以及按照第二相关度进行排序的初始仲裁员数据输出。

具体地，替换关键词是指与排序关键词关联的词语，如可以是同义词，或者同音词等。替换信息是指将排序关键词采用替换关键词进行替换之后得到的信息。替换指标是指根据替换信息计算相关度时的所需指标，根据排序指标计算得到相关度，从而将初始仲裁员数据按照计算的第二相关度进行排序。替换模型是指计算替换指标与第二相关度的模型，通过替换模型，按照输入的替换指标可以输出确定的第二相关度。具体地，当服务器查询到第一相关度均低于预设值时，则当前接收到的排序信息可能出现输入错误，则查询是否有替换的关键词，从而采用替换关键词按照替换模型得到相应的第二相关度，当服务器根据计算模型计算得到第一相关度时，则获取预设值，并将第一相关度逐一与预设值进行比较，当第一相关度低于预设值时，则获取预存储的替换数据存储库，将排序关键词与替换数据存储库中存储的待匹配关键词进行匹配，当匹配成功时，则获取匹配成功的待匹配关键词关联的替换关键词，进而采用替换关键词对排序关键词进行替换得到替换信息，进而根据得到的替换信息，计算替换信息计算相应的替换指标，如可以计算替换信息在第二仲裁员基本数据中出现的频次，以及计算替换信息对应在第二仲裁员基本数据所对应的数据数量，进而根据得到的替换指标，采用相应的计算逻辑计算第二相关度，该第二相关度则为替换信息与当计算得到第二相关度时，则将第二相关度逐一与预设值进行比较，当第二相关度高于预设值时，则根据第二相关度对初始仲裁员数据进行排序，将排序后的初始仲裁员数据以及相应的替换关键词输出。其中，服务器计算的替换指标可以是，获取替换信息中包含的替换关键词的第三词频，获取第二仲裁员基本数据中包含的替换关键词的第四词频，并统计包含替换关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算替换词权重，第三词频、第四词频以及替换词权重作为替换指标，计算替换词权重可以采用如下公式进行计算：

其中，N表示第二仲裁员基本数据的数据总量，m(p_i)表示包含了替换关键词的第二仲裁员基本数据的数据数量，p_i标识不同替换关键词。

当服务器计算得到替换指标时，则可以将替换指标输入至替换模型中得到第二相关度，也即服务器可以获取到调节因子，并根据调节因子、第三词频、第四词频、替换词权重、数据总量输入至替换模型中，计算得到第二相关度，也即第二相关度对应的替换模型可以采用以下公式：

其中，dl为第二基本仲裁员数据的基本长度，也即是第二基本仲裁员数据中包含的词语的数量，avgdl为所有第二基本仲裁员数据的平均长度，也即是第二基本仲裁员数据中包含的词语数量的平均值，k1，k2，b表示调节因子，TF3表示第三词频，TF4表示第四词频，。N表示第二仲裁员基本数据的数据总量，m(p_i)表示包含了替换关键词的第二仲裁员基本数据的数据数量，p_i标识不同替换关键词。也即可以根据上述公式，计算出第一个替换关键词的相关度到最后一个替换关键词的相关度，将所有的相关度进行求和即为第二相关度。

本实施例中，当根据排序信息计算得到的第一相关度低于预设值时，服务器可以根据查询排序信息包含的排序关键词是否有替换关键词，当存在替换关键词时，则采用替换关键词对排序关键词进行替换得到替换信息，从而根据替换信息计算相应的替换指标，再根据替换指标计算第二相关度，进而比较第二度与预设值，当第二相关度高于预设值时，则将替换信息以及按照第二相关度进行排序的初始仲裁员数据输出，从而避免当接收到错误的排序信息而无法筛选得到相应的初始仲裁员数据，增强适用性，提高筛选效率。

应该理解的是，虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种仲裁员数据筛选装置，包括：获取模块410、筛选模块420、第一计算模块430和第二计算模块440，其中：

获取模块410，用于获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据。

筛选模块420，用于对标准仲裁员数据进行初始筛选得到初始仲裁员数据。

第一计算模块430，用于接收终端发送的排序信息，根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取排序指标。

第二计算模块440，用于将所述排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据。

在一个实施例中，第一计算模块430，包括：

提取单元，用于提取排序信息中的排序关键词。

获取单元，用于获取排序信息中包含的排序关键词的第一词频，获取第二仲裁员基本数据中包含的排序关键词的第二词频。

统计单元，用于统计包含有排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重。将第一词频、第二词频以及词语评价权重作为排序指标。

在一个实施例中，第二计算模块440，包括：

计算单元，用于获取调节因子，根据调节因子、数据总量、第一词频、第二词频以及词语评价权重计算排序信息与初始仲裁员数据的第一相关度。

排序单元，用于将第一相关度进行排序得到筛选的仲裁员数据。

在一个实施例中，获取模块410，包括：

分词单元，用于对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据。

提取单元，用于根据分词后的第一仲裁员基本数据提取待识别特征。

添加单元，用于根据待识别特征对分词后的第一仲裁员基本数据添加识别结果标签。

组合单元，用于根据识别结果标签，将分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据。

在一个实施例中，仲裁员筛选装置400，包括：

第一查询模块，用于获取用户标识，根据用户标识查询用户关联案件。

评分模块，用于获取用户关联案件的类型，根据类型，获取筛选的仲裁员数据的案件匹配评分。

目标得分计算模块，用于根据第一相关度以及案件匹配评分计算目标得分，根据目标得分得到目标仲裁员数据。

在一个实施例中，仲裁员筛选装置400，包括：

第二查询模块，用于当第一相关度低于预设值时，则查询排序信息对应的排序关键词是否存在替换关键词。

替换模块，用于当存在替换关键词时，则采用替换关键词对排序关键词进行替换得到替换信息。

第三计算模块，用于根据替换信息获取替换指标，将所述替换指标输入至替换模型中得到初始仲裁员数据与替换信息的第二相关度。

输出模块，用于查询第二相关度是否高于预设值，当第二相关度高于预设值时，则将替换关键词以及按照第二相关度进行排序的初始仲裁员数据输出。

关于仲裁员数据筛选装置的具体限定可以参见上文中对于仲裁员数据筛选方法的限定，在此不再赘述。上述仲裁员数据筛选装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储仲裁员数据筛选数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种仲裁员数据筛选方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据。对标准仲裁员数据进行初始筛选得到初始仲裁员数据。接收终端发送的排序信息，根据排序信息以及初始仲裁员数据对应的第二仲裁员基本数据获取排序指标。将所述排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据。

在一个实施例中，处理器执行计算机程序时实现根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取计算排序指标，包括：提取排序信息中的排序关键词。获取排序信息中包含的排序关键词的第一词频，获取第二仲裁员基本数据中包含的排序关键词的第二词频。统计包含有排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重。将第一词频、第二词频以及词语评价权重作为排序指标。

在一个实施例中，处理器执行计算机程序时实现将排序指标输入至计算模型中计算得到所述初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据，包括：获取调节因子，根据调节因子、数据总量、第一词频、第二词频以及词语评价权重输入至计算模型中，计算排序信息与初始仲裁员数据的第一相关度。将第一相关度进行排序得到筛选的仲裁员数据。

在一个实施例中，处理器执行计算机程序时实现获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，包括：对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据。根据分词后的第一仲裁员基本数据提取待识别特征。根据待识别特征对分词后的第一仲裁员基本数据添加识别结果标签。根据识别结果标签，将分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据。

在一个实施例中，处理器执行计算机程序时实现将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：获取用户标识，根据用户标识查询用户关联案件。获取用户关联案件的类型，根据类型，获取筛选的仲裁员数据的案件匹配评分。根据第一相关度以及案件匹配评分计算目标得分，根据目标得分得到目标仲裁员数据。

在一个实施例中，处理器执行计算机程序时实现将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：当第一相关度低于预设值时，则查询排序信息对应的排序关键词是否存在替换关键词。当存在替换关键词时，则采用替换关键词对排序关键词进行替换得到替换信息。根据替换信息获取替换指标，将所述替换指标输入至替换模型中得到初始仲裁员数据与替换信息的第二相关度。查询第二相关度是否高于预设值，当第二相关度高于预设值时，则将替换关键词以及按照第二相关度进行排序的初始仲裁员数据输出。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据。对标准仲裁员数据进行初始筛选得到初始仲裁员数据。接收终端发送的排序信息，根据排序信息以及初始仲裁员数据对应的第二仲裁员基本数据获取排序指标。将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据。

在一个实施例中，计算机程序被处理器执行时实现根据排序信息、以及与初始仲裁员数据对应的第二仲裁员基本数据获取计算排序指标，包括：提取排序信息中的排序关键词。获取排序信息中包含的排序关键词的第一词频，获取第二仲裁员基本数据中包含的排序关键词的第二词频。统计包含有排序关键词的第二仲裁员基本数据的数量，并获取第二仲裁员基本数据的数据总量，根据数量以及数据总量计算词语评价权重。将第一词频、第二词频以及词语评价权重作为排序指标。

在一个实施例中，计算机程序被处理器执行时实现将排序指标输入至计算模型中计算得到所述初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据，包括：获取调节因子，根据调节因子、数据总量、第一词频、第二词频以及词语评价权重输入至计算模型中，计算排序信息与初始仲裁员数据的第一相关度。将第一相关度进行排序得到筛选的仲裁员数据。

在一个实施例中，计算机程序被处理器执行时实现获取第一仲裁员基本数据，将第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，包括：对第一仲裁员基本数据进行分词得到分词后的第一仲裁员基本数据。根据分词后的第一仲裁员基本数据提取待识别特征。根据待识别特征对分词后的第一仲裁员基本数据添加识别结果标签。根据识别结果标签，将分词后的第一仲裁员基本数据进行组合得到标准仲裁员数据。

在一个实施例中，计算机程序被处理器执行时实现将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：获取用户标识，根据用户标识查询用户关联案件。获取用户关联案件的类型，根据类型，获取筛选的仲裁员数据的案件匹配评分。根据第一相关度以及案件匹配评分计算目标得分，根据目标得分得到目标仲裁员数据。

在一个实施例中，计算机程序被处理器执行时实现将排序指标输入至计算模型中得到初始仲裁员数据与排序信息的第一相关度，根据第一相关度对初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：当第一相关度低于预设值时，则查询排序信息对应的排序关键词是否存在替换关键词。当存在替换关键词时，则采用替换关键词对排序关键词进行替换得到替换信息。根据替换信息获取替换指标，将替换指标输入至替换模型中得到初始仲裁员数据与替换信息的第二相关度。查询第二相关度是否高于预设值，当第二相关度高于预设值时，则将替换关键词以及按照第二相关度进行排序的初始仲裁员数据输出。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种仲裁员数据筛选方法，所述方法包括：

对所述标准仲裁员数据进行初始筛选得到初始仲裁员数据；

接收终端发送的排序信息，根据所述排序信息、以及与所述初始仲裁员数据对应的第二仲裁员基本数据获取排序指标；

2.根据权利要求1所述的方法，其特征在于，所述根据所述排序信息、以及与所述初始仲裁员数据对应的第二仲裁员基本数据获取计算排序指标，包括：

提取所述排序信息中的排序关键词；

3.根据权利要求1所述的方法，其特征在于，所述将所述排序指标输入至计算模型中计算得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据，包括：

将所述第一相关度进行排序得到筛选的仲裁员数据。

4.根据权利要求1所述的方法，其特征在于，所述获取第一仲裁员基本数据，将所述第一仲裁员基本数据进行标准化处理得到标准仲裁员数据，包括：

根据分词后的第一仲裁员基本数据提取待识别特征；

5.根据权利要求1所述的方法，其特征在于，所述将所述排序指标输入至计算模型中得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：

获取用户标识，根据所述用户标识查询用户关联案件；

6.根据权利要求1所述的方法，其特征在于，所述将所述排序指标输入至计算模型中得到所述初始仲裁员数据与所述排序信息的第一相关度，根据所述第一相关度对所述初始仲裁员数据进行排序得到筛选的仲裁员数据之后，包括：

7.一种仲裁员数据筛选装置，其特征在于，所述装置包括：

第一计算模块，用于接收终端发送的排序信息，根据所述排序信息、以及所述初始仲裁员数据对应的第二仲裁员基本数据获取排序指标；

8.根据权利要求7所述的装置，其特征在于，所述第一计算模块，包括：

提取单元，用于提取所述排序信息中的排序关键词；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。