WO2023226367A1

WO2023226367A1 - 样本标注的校对方法、装置、计算设备集群和存储介质

Info

Publication number: WO2023226367A1
Application number: PCT/CN2022/137635
Authority: WO
Inventors: 瞿晓晔; 王喆锋; 段新宇; 李明磊; 怀宝兴
Original assignee: 华为云计算技术有限公司
Priority date: 2022-05-23
Filing date: 2022-12-08
Publication date: 2023-11-30

Abstract

本申请提供了一种样本标注的校对方法、装置、计算设备集群和存储介质，属于神经网络技术领域。该方法包括：获取目标样本，目标样本为待校对的标注样本，对目标样本进行结构解析，获得目标样本的第一结构解析结果，将第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，若多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果，则输出提示消息，该提示消息用于提示用户检查目标样本的标注结果。采用本申请的方案，能够为用户提示可能标注错误的样本，提升样本标注的准确率。

Description

样本标注的校对方法、装置、计算设备集群和存储介质

本申请要求于2022年05月23日提交的申请号为202210562530.X，发明名称为“一种构词规则辅助的命名实体标注系统”和2022年08月16日提交的申请号为202210986086.4，发明名称为“样本标注的校对方法、装置、计算设备集群和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及神经网络技术领域，特别涉及一种样本标注的校对方法、装置、计算设备集群和存储介质。

背景技术

在神经网络技术领域中，通常会使用到有标注结果的样本训练神经网络模型，样本的标注结果准确性，直接会影响神经网络模型训练的效果。

相关技术中，人工确定需要标注的样本，制定详细的标注规范，然后人工按照标注规范，使用标注系统中的标注工具对样本进行标注，标注工具可以是画笔等。标注系统对样本的标注结果进行记录。

由于人工需要标注大量样本，所以有可能会对样本标注错误，但是标注工具并没有确定错误标注的样本的能力。这样，在使用错误标注样本训练神经网络模型时，会影响神经网络模型的训练效果。

发明内容

本申请提供了一种样本标注的校对方法、装置、计算设备集群和存储介质，能够对错误标注的样本进行提示，提升样本标注的准确率。

第一方面，本申请提供了一种样本标注的校对方法，该方法包括：获取目标样本，其中，该目标样本为待校对的标注样本，对该目标样本进行结构解析，获得该目标样本的第一结构解析结果，将该第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，若该多个已校对的标注样本的结构解析结果中不存在与该第一结构解析结果匹配的目标结构解析结果，则输出提示消息，其中，该提示消息用于提示用户检查该目标样本的标注结果。

本申请所示的方案中，对于待校对的标注样本，能够使用对应的结构解析结果和多个已校对的标注样本的结构解析结果，确定该样本的标注结果是否错误，提示用户再次确认，使得样本的标注结果的准确率比较高，进而使得神经网络模型的训练效果比较好。

在一种示例中，该目标样本为目标命名实体样本，该第一结构解析结果为词内部结构，该对该目标样本进行结构解析，获得该目标样本的第一结构解析结果，包括：使用词内部结构分析模型，对该目标样本进行词内部结构解析，获得该目标样本的词内部结构。

本申请所示的方案中，目标样本为命名实体样本时，结构解析结果为词内部结构，可以使用词内部结构分析模型，准确获得目标样本的词内部结构。

在一种示例中，该将该第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，包括：从该多个已校对的标注样本中，确定与该目标命名实体样本的类别相同的一个或多个命名实体样本，若该第一结构解析结果不存在于该一个或多个命名实体的结构解析结果中，则确定该多个已校对的标注样本的结构解析结果中不存在与该第一结构解析结果匹配的目标结构解析结果，若该第一结构解析结果存在于该一个或多个命名实体的结构解析结果中，则确定该多个已校对的标注样本的结构解析结果中存在与该第一结构解析结果匹配的目标结构解析结果。

本申请所示的方案中，在进行结构解析结果匹配时，可以确定与目标样本的类别相同的一个或多个命名实体样本，在类别相同的命名实体的结构解析结果中进行匹配，能够使得匹配准确率更高。

在一种示例中，在获得该目标样本的第一结构解析结果之后，还包括：生成该第一结构解析结果的确认界面，该确认界面用于向用户显示该第一结构解析结果，接收该用户输入的确认指令，该确认指令用于对该第一结构解析结果进行修改或确认。

本申请所示的方案中，在获得目标样本的第一结构解析结果之后，目标样本的结构解析结果是由模型分析获得的，所以有可能不准确，生成确认界面，供用户确认第一结构解析结果是否准确，用户可以对第一结构解析结果进行确认或者修改，这样能够为用户提供确认和修改第一结构解析结果的方式。

在一种示例中，该方法还包括：基于修改后的第一结构解析结果，更新所述词内部结构分析模型。

本申请所示的方案中，使用用户修改后的第一结构解析结果更新词内部结构分析模型，能够使得词内部结构分析模型后续可以识别出修改后的第一结构解析结果，提升词内部结构分析模型的泛化能力。

在一种示例中，该方法还包括：在接收该用户输入的确认指令之后，将确认后或修改后的该第一结构解析结果添加至该已校对的标注样本的结构解析结果中。

本申请所示的方案中，在第一结构解析结果被确认正确后，被添加至已校对的标注样本的结构解析结果中，能够使得后续第一结构解析结果能够与已校对的标注样本的结构解析结果匹配。

在一种示例中，该输出提示消息之前，还包括：在该目标样本所属的语句中，获取目标短语，其中，该目标短语由该目标样本与该目标样本的相邻位置的词语组成，对该目标短语进行结构解析，获得该目标短语的第二结构解析结果，确定该多个已校对的标注样本的结构解析结果中存在与该第二结构解析结果匹配的结构解析结果。

本申请所示的方案中，在多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果时，能够使用语句中目标样本相邻位置的词语，对目标样本进行扩展，防止由于用户少选择词语导致结构解析结果不匹配。

在一种示例中，该提示消息还用于提示该目标样本对应的正确标注结果。这样，使得用户更快速地确认标注结果。

在一种示例中，该获取目标样本，包括：获取用户标注的目标样本；或者，获取预标注模型标注的目标样本。

本申请所示的方案中，不仅能够对用户标注的样本进行校对，还能够对预标注模型标注的样本进行校对。

第二方面，本申请提供了一种样本标注的校对装置，该装置包括至少一个模块，该至少一个模块用于实现上述第一方面或第一方面中任一种示例所提供的样本标注的校对方法。

在一些实施例中，样本标注的校对装置中的模块通过软件实现，样本标注的校对装置中的模块是程序模块。在另一些实施例中，样本标注的校对装置中的模块通过硬件或固件实现。

第三方面，本申请提供了一种计算设备集群，该计算设备集群包括至少一个计算设备，每个计算设备包括处理器和存储器，该至少一个计算设备的处理器用于执行该至少一个计算设备的存储器中存储的指令，以使得该计算设备集群执行上述第一方面或第一方面中任一种示例所提供的样本标注的校对方法。

第四方面，本申请提供了一种计算机可读存储介质，该计算机可读存储介质包括计算机程序指令，当该计算机程序指令由计算设备集群执行时，该计算设备集群执行上述第一方面或第一方面中任一种示例所提供的样本标注的校对方法。

第五方面，本申请提供了一种包含指令的计算机程序产品，当该指令被计算设备集群运行时，使得所述计算设备集群执行上述第一方面或第一方面中任一种示例所提供的样本标注的校对方法。

附图说明

图1是本申请一个示例性实施例提供的系统架构的示意图；

图2是本申请一个示例性实施例提供的系统架构的示意图；

图3是本申请一个示例性实施例提供的样本标注的校对方法流程示意图；

图4是本申请一个示例性实施例提供的标注界面的示意图；

图5是本申请一个示例性实施例提供的命名实体库的示意图；

图6是本申请一个示例性实施例提供的结构解析结果的匹配过程示意图；

图7是本申请一个示例性实施例提供的样本标注的校对方法流程示意图；

图8是本申请一个示例性实施例提供的确认界面的示意图；

图9是本申请一个示例性实施例提供的多个样本的结构解析结果；

图10是本申请一个示例性实施例提供的样本标注的校对装置的结构示意图；

图11是本申请一个示例性实施例提供的计算设备的结构示意图；

图12是本申请一个示例性实施例提供的计算设备集群的结构示意图；

图13是本申请一个示例性实施例提供的计算设备的连接示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

为了便于对本申请实施例的理解，下面首先介绍所涉及到的名词的概念。

1、命名实体，指人名、组织机构名、职称和地名以及其它所有以名称为标识的实体。更广泛的命名实体还包括数字、日期和地址等。

2、命名实体识别，指将语句中所有符合特定类型的命名实体识别出来，例如，语句为“今天操场上A机构在组织活动”，需要在语句中识别出“A机构”是一个组织机构名。

3、词内部角色，指短语中每个字的语义角色。在中文中，字的词内部角色包括词根(root)、主谓(subject-predicate)、动宾(object，obj)、定中(attribute，att)、状中(adverbial，adv)、动补(complement，cmp)、并列(coordinate，coo)、介宾(preposition-object，pobj)、附加(adjunct，adjct)、碎片(frag)和重叠(repet)等。例如，对于中文中的词语“AB市”中，“A”、“B”和“市”的词内部角色分别为“att”、“frag”和“root”。在其它语种中，短语也有对应的词内部角色。

4、词内部角色序列，指词语的角色组成的序列。例如，词语“AB市”的词内部角色序列为“att frag root”。在词内部角色序列中，相邻的角色之间可以使用空格隔开，也可以使用其它字符隔开。

5、词内部结构，指使用词内部角色序列和root字来表示词语的内部结构。例如，词语“AB市”的词内部结构为内部角色序列“att frag root”以及root字“市”。

下面描述本申请实施例的背景。

在神经网络技术领域中，样本标注对神经网络模型的构建至关重要，样本的标注结果的准确性，直接会影响神经网络模型训练的效果。例如，命名实体识别在关系抽取任务、实体链接、指代消融和知识图谱的神经网络模型构建中发挥了重要作用，命名实体识别准确，可以使得这些任务的神经网络模型的性能更好。

相关技术中，用户(标注人员)使用标注系统中的标注工具对样本进行标注，标注工具可以是画笔等。然而由于用户需要标注大量样本，所以有可能会对样本标注错误。但是标注工具并没有确定错误标注的样本的能力。这样，在使用错误标注样本训练神经网络模型时，会影响神经网络模型的训练效果。例如，语句中包括“江边大道”这个地名实体，但是用户将“江边大”标注为地名实体，漏掉“道”，导致神经网络模型的泛化性较差。再例如，由于标注样本数量大，通常会由多个标注者进行标注，所以有可能会导致对相同命名实体标注不一致。再例如，在标注“A市”地名实体时，有可能会出现一个用户将“A”标注为地名实体，而另一个用户将“A市”标注为地名实体，在使用标注完成的命名实体训练神经网络模型时，使得对神经网络模型训练造成困扰。

本申请实施例中，在样本标注完成后，能够使用样本的结构解析结构分析样本的标注结果是否错误，若标注结果错误，则提示用户检查样本的标注结果，从而能够提升样本标注的准确性。

下面描述本申请实施例的系统架构。

在一种示例中，本申请实施例提供了一种系统架构100。如图1所示，系统架构100包括终端设备101和计算设备102。终端设备101与计算设备102之间通过有线或无线网络连接。其中，终端设备101是用户使用的设备，如台式电脑、笔记本电脑、平板电脑或手机等，终端设备101用于用户与计算设备102进行交互。例如，用户可以使用终端设备101为样本添加标注结果等。计算设备102可以是服务器等，计算设备102用于确定目标样本的结构解析结果，并且将目标样本的结构解析结果与多个已校对的标注样本的结构解析结果进行匹配等，目标样本为标注完成，且未校对的样本。

在另一种示例中，本申请实施例提供了另一种系统架构200。如图2所示，系统架构200包括终端设备101和公有云201。终端设备101与公有云201通过有线或者无线网络连接。终端设备101是用户使用的设备，终端设备101用于用户与公有云201进行交互。公有云201是云计算模式下利用基础资源向用户提供云服务的实体，公有云201也可以认为是一个云环境。公有云201包括云数据中心，云数据中心包括云服务提供商拥有的大量基础资源，该大量基础资源包括计算资源、存储资源和网络资源，云数据中心包括的计算资源可以是计算设备集群，计算设备集群包括至少一个计算设备，计算设备可以是服务器等。在用户使用云服务时，用户可以通过应用程序接口(application program interface，API)或者图形用户界面(graphical user interface，GUI)上传目标样本至公有云201等，公有云201中的计算设备集群接收用户上传的目标样本，确定目标样本的结构解析结果，并且将目标样本的结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，基于匹配结果向终端设备101输出提示消息。

在再一种示例中，本申请实施例还提供了一种系统架构。该系统架构包括终端设备，终端设备是用户使用的设备。终端设备执行本申请实施例中样本标注的校对方法。

下面描述本申请实施例中样本标注的校对方法流程。

图3提供了样本标注的校对方法流程，在图3中以图1所示的系统架构100为例描述该样本标注的校对方法流程。在图3所示的流程中，终端设备为前文中终端设备101，计算设备为前文中计算设备102。

步骤301，获取目标样本。

其中，该目标样本为待校对的标注样本，即为已标注且未校对的标注样本，目标样本为任一待校对的标注样本。在本申请实施例中，目标样本可以是能够基于结构解析结果分析目标样本的标注结果是否准确的样本，例如，目标样本可以是命名实体或者分词样本等。

在本实施例中，用户使用终端设备对目标样本标注完成后，在对目标样本的标注界面中，显示有开始分析选项，用户可以点击开始分析选项，终端设备向计算设备发送分析请求。计算设备接收该分析请求，获取目标样本。例如，参见图4，目标样本为目标命名实体样本，标注界面中显示有语句“Y大学位于A市西北郊”、开始分析选项以及命名实体类别的标识，地名使用实线框标识，组织机构名使用第一种类型的虚线框标识，职称使用第二种类型的虚线框标识，用户在该语句中标注“Y大学”为组织机构名，并在该语句中标注“A市”为地名。图4中仅一种示例，在另一些实现中，命名实体类别的标识使用颜色进行区分，如地名使用红色标识，组织机构名使用绿色标识，在用户标注样本后，样本变为对应的类别的颜色。另外，在语句中进行标注时，标注界面中还可以显示有下一句选项和上一句选项等，下一句选项用于切换至下一个语句进行标注或查看，上一句选项用于切换至上一个语句进行标注或查看。

或者，用户使用终端设备对多个样本标注完成后，在样本标注的标注界面中，显示有开始分析选项，用户可以点击开始分析选项，终端设备向计算设备发送分析请求。计算设备接收该分析请求，获取用户标注的多个样本，多个样本包括目标样本。

或者，用户使用终端设备对目标样本标注完成后，终端设备将目标样本的标注结果提交至计算设备，计算设备获取到目标样本。

或者，标注样本前，训练有预标注模型，预标注模型为对样本进行标注的模型。预标注模型对目标样本标注完成后，计算设备获取标注完成的目标样本。

以上仅为可能的四种可能实现方式，本申请实施例不对获取目标样本的方式进行限定。

步骤302，对该目标样本进行结构解析，获得该目标样本的第一结构解析结果。

在本实施例中，计算设备中存储有结构解析模型，或者，计算设备使用样本与样本的结构解析结果进行训练获得结构解析模型，或者，计算设备从其它设备获取结构解析模型。计算设备使用结构解析模型解析目标样本的结构，获得目标样本的结构解析结果，称为是第一结构解析结果。

需要说明的是，在目标样本的类型不相同时，对应的结构解析模型也不相同。例如，在目标样本为目标命名实体样本时，用于对目标样本进行结构解析的结构解析模型为词内部结构分析模型，在目标样本为目标分词样本时，用于对目标分词样本进行结构解析的结构解析模型为句子结构分析模型。

在一种示例中，目标样本为目标命名实体样本，第一结构解析结果为词内部结构，获得目标样本的第一结构解析结果的过程为：

在样本标注前，训练有词内部结构分析模型，该词内部结构分析模型用于分析词内部结构。将目标样本输入词内部结构分析模型中，词内部结构分析模型的输出即为目标样本的词内部结构，也就是说第一结构解析结果为词内部结构。例如，目标样本为“××地宫”，对“××地宫”进行词内部结构解析后，得到的词内部结构为“att att att root”，root字“宫”。在本申请实施例中一个“×”表示一个字，那么“××地宫”为四个字。再例如，目标样本为“××区”，对“××区”进行词内部结构解析后，得到的词内部结构为“att frag root”，root字“区”。

在一种示例中，目标样本为目标分词样本时，第一结构解析结果为目标分词样本的分词结构，获得目标样本的第一结构解析结果的过程为：

在标注样本前，训练有分词样本的结构解析模型，该结构解析模型用于分析分词样本的结构。将分词样本输入该结构解析模型中，该结构解析模型的输出即为分词样本的第一结构解析结果。例如，分词样本为“我/来到/××/区”，“我/来到/××/区”的第一结构解析结果为“代词动词名词”。

在一种示例中，计算设备在确定第一结构解析结果后，可以向用户展示第一结构解析结果。例如，用户在语句中“××大学要放假了”标注了命名实体“××大学”为组织机构名，如图5所示的结构解析结果示意图，示出了“××大学”的第一结构解析结果，第一结构解析结果为“att att att root”，root字为“学”。

步骤303，将第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配。

其中，已校对的标注样本为标注结果被确认为正确的标注样本。计算设备中存储有已校对的标注样本的结构解析结果，或者从其它设备获取已校对的标注样本的结构解析结果，或者，计算设备中对已校对的标注样本进行结构解析，获得目标结构解析结果，目标结构解析结果被用户确认为正确，此处的用户指示结构解析结果的审核者。

在本实施例中，计算设备判断多个已校对的标注样本的结构解析结果中是否存在与第一结构解析结果匹配的目标结构解析结果。若多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果，则确定第一结构解析结果匹配到结构解析结果，否则确定第一结构解析结果未匹配到结构解析结果。

在一种示例中，命名实体的类别有多种，如人名、组织机构名、职称和地名等。为了快速且准确判断第一结构解析结果与已校对的标注命名实体的结构解析结果是否匹配，可以确定目标样本的类别，为了方便描述，将目标样本的类别称为是目标类别。在多个已校对的命名实体中选取目标类别的命名实体样本，然后将第一结构解析结果与目标类别的命名实体样本的结构解析结果进行匹配。若第一结构解析结果不存在于目标类别的命名实体的结构解析结果中，则第一结构解析结果未匹配到结构解析结果，若第一结构解析结果存在于目标类别的命名实体的结构解析结果中，则确定第一结构解析结果匹配到结构解析结果。这样，仅匹配类别相同的命名实体的结构解析结果，不仅匹配数量比较少，而且匹配结果更准确。

例如，对于已校对的命名实体的结构解析结果，按照命名实体的类别划分为不同的命名实体库。例如，人名、组织机构名、职称和地名分别对应不同的命名实体库，图6示出了地名对应的命名实体库，在命名实体库中包括命名实体对应的词内部结构，如图6所示，词内部结构1为“att frag root”，root字为“区”，词内部结构2为“att root”，root字为“国”，词内部结构3为“att att root”，root字为“湾”等。假设目标样本为地名命名实体，在进行匹配时，使用地名对应的命名实体库进行匹配。

假设目标样本为“××市”，第一结构解析结果为“att frag root”，root字为“市”，地名对应的命名实体库中不存在结构解析结果“att frag root”，root字为“市”，说明第一结构解析结果与地名对应的命名实体库中的结构解析结果不匹配，参见图7。

假设目标样本为“××市”，第一结构解析结果为“att frag root”，root字为“市”，地名对应的命名实体库中存在结构解析结果“att frag root”，root字为“市”，说明地名对应的命名实体库中的结构解析结果中存在与第一结构解析结果匹配的目标结构解析结果，目标结构解析结果为“att frag root”，root字为“市”。

假设目标样本为“××市长”，被标注的类别为地名，第一结构解析结果为“att att att root”，root字为“长”，地名对应的命名实体库中存在词内部角色序列一致(“××地宫”地宫的结构解析结果为“att att att root”，root字“宫”)，但是不存在root字为“长”的结构解析结果，说明第一结构解析结果与地名对应的命名实体库中的结构解析结果不匹配。

在另一种示例中，目标样本为分词样本的情况下，与命名实体样本的匹配方式一致。例如，分词样本为“我/来到/××/区”，“我/来到/××/区”的第一结构解析结果为“代词动词名词”，若已校对的标注样本的结构解析结果中存在“代词动词名词”，则确定第一结构解析结果匹配到结构解析结果，反之则未匹配到结构解析结果。

步骤304，若该多个已校对的标注样本的结构解析结果中不存在与该第一结构解析结果匹配的目标结构解析结果，则输出提示消息，其中，该提示消息用于提示用户检查该目标样本的标注结果。

在本实施例中，在多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果的情况下，说明目标样本的标注结果有可能不准确，计算设备向终端设备发送提示消息。终端设备接收到该提示消息后，可以显示该提示消息的内容，该提示消息用于提示用户检查目标样本的标注结果。本申请实施例不对提示消息的具体内容进行限定。用户可以再次确认目标样本的标注结果是否准确。

在一种示例中，在显示提示消息的界面中显示有查看选项，用户可以点击查看选项，返回标注界面，用户在标注界面中可以对目标样本的标注结果进行修改，在修改完成后进行提交。计算设备接收到用户重新提交的标注结果后，可以再次执行图3中步骤301至步骤303，确定重新提交的标注结果是否错误。

另外，在用户重新提交的标注结果与原来的标注结果相同的情况下，也可以将目标样本发送给另两个用户进行查看，该另两个用户为标注级别比较高的标注者。若该另两个用户确定原来的标注结果正确，则存储原来的标注结果，若该另两个用户均修改了标注结果，且修改后的标注结果一样，可以存储修改后的标注结果。

另外，多个已校对的标注样本的结构解析结果中存在目标结构解析结果，且目标结构解析结果与第一结构解析结果匹配，说明目标样本的标注结果准确，将目标样本的标注结果进行存储。

在一种示例中，为了使得用户更快速地检查目标样本的标注结果，提示消息中还用于指示目标样本对应的正确标注结果，这样，用户在检查目标样本的标注结果时，可以参考提示消息中指示的正确标注结果。

在一种示例中，由于目标样本的第一结构解析结果是通过结构分析模型获得的，所以为了提升输出提示消息的准确性，可以由用户判断第一结构解析结果是否正确，进而确定是否输出提示消息，如图8所示，处理过程参见步骤303和步骤304中输入提示消息之前包括的步骤305至步骤312，该处理过程为可选的处理过程。

步骤305，若多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果，则输出第一结构解析结果的确认消息。

在本实施例中，计算设备向终端设备发送第一结构解析结果的确认消息。终端设备接收第一结构解析结果的确认消息，生成确认消息对应的确认界面。或者，计算设备向终端设备发送确认界面。例如，参见图9所示的该确认界面的示意图，目标样本为“××市”，第一结构解析结果为“att frag root”，root字为“市”，在图9中，还显示“请确认当前的结构解析结果是否正确，若不正确，请修改，若正确请确认”的提示内容、确认选项和修改选项。用户认为第一结构解析结果正确，可以点击确认选项，终端设备会向计算设备发送确认正确消息。用户认为第一结构解析结果不正确，可以点击修改选项，触发终端设备显示修改界面，用户可以对第一结构解析结果进行修改，在修改完成后进行提交，为了方便描述，修改后的第一结构解析结果描述为第三结构解析结果。

另外，结构解析模型在对目标样本进行结构解析时，可以得到多种结构解析结果，其中，第一结构解析结果是概率最高的结构解析结果。在计算设备向终端设备发送第一结构解析结果的确认消息时，还可以携带目标样本的其余结构解析结果，该其余结构解析结果可以携带在该确认消息中，也可以单独发送。在显示第一结构解析结果的确认界面时，可以将多种结构解析结果显示，为用户确认第一结构解析结果提供参考。此处，其余结构解析结果可以与第一结构解析结果均显示在确认界面中，也可以显示在修改界面中。

需要说明的是，图9仅仅是一种可能的确认界面的示意图，凡是可以对第一结构解析结果进行确认的界面，均可应用于本申请实施例中。

步骤306，接收用户输入的确认指令。

在本实施例中，终端设备接收到用户输入的确认指令，向计算设备发送确认指令，若该确认指令指示确认正确，则计算设备接收终端设备发送的确认指令后，可以向终端设备发送提示消息，该提示消息用于提示用户检查目标样本的标注结果。

步骤307，基于第一结构解析结果，更新词内部结构分析模型。

在本实施例中，在用户确认第一结构解析结果正确的情况下，还可以使用第一结构解析结果更新词内部结构分析模型，使得词内部结构分析模型结构解析的准确率更高。

步骤308，将第一结构解析结果添加至该已校对的标注样本的结构解析结果中。

在本实施例中，在用户确认第一结构解析结果正确的情况下，还可以将第一结构解析结果添加至已校对的标注样本的结构解析结果中，使得后续再存在与目标样本类似的样本时，能匹配到对应的结构解析结果。

在一种示例中，在用户确认第一结构解析结果正确的情况下，还可以将第一结构解析结果添加至目标样本对应的类别的命名实体库中，使得后续再存在与目标样本类似的样本时，可以在该命名实体库中能匹配到对应的结构解析结果。例如，目标样本为“××寺”，第一结构解析结果为“att frag root”，root字为“寺”，在地名对应的命名实体库中存在词内部角色序列一致，且root字不一致的结构解析结果，用户确认第一结构解析结果正确，将“att frag root”，root字为“寺”添加至地名对应的命名实体库中。

步骤309，接收用户输入的第三结构解析结果，将第三结构解析结果与多个已校对的标注样本的结构解析结果进行匹配。

在本实施例中，在步骤305中，用户认为第一结构解析结果不正确，对第一结构解析结果进行修改，得到的修改结果为第三结构解析结果。计算设备接收第三结构解析结果，判断多个已校对的标注样本的结构解析结果中是否存在与第三结构解析结果匹配的结构解析结果，若多个已校对的标注样本的结构解析结果中不存在与第三结构解析结果匹配的结构解析结果，则确定第三结构解析结果在已校对的标注样本的结构解析结果中未匹配到结构解析结果，否则确定第三结构解析结果在已校对的标注样本的结构解析结果中匹配到结构解析结果。

在一种示例中，在将第三结构解析结果与多个已校对的标注样本的结构解析结果进行匹配时，可以先确定目标样本的目标类别，确定该目标类别的命名实体对应的结构解析结果，判断第三结构解析结果是否存在于该目标类别的命名实体对应的结构解析结果中。

步骤310，若多个已校对的标注样本的结构解析结果中不存在与第三结构解析结果匹配的结构解析结果，则跳转至步骤304中的输出提示消息。

在本实施例中，若多个已校对的标注样本的结构解析结果中不存在与第三结构解析结果匹配的结构解析结果，则确定目标样本的标注结果有可能错误，计算设备向终端设备输出提示消息，该提示消息用于提示用户检查目标样本的标注结果。

另外，若多个已校对的标注样本的结构解析结果中存在与第三结构解析结果匹配的结构解析结果，则确认第一结构解析结果与多个已校对的标注样本的结构解析结果不匹配可能是由于第一结构解析结果错误，而不是由于目标样本的标注结果错误，所以可以确认目标样本的标注结果正确。

步骤311，基于第三结构解析结果，更新词内部结构分析模型。

在本实施例中，在用户输入第三结构解析结果的情况下，还可以使用第三结构解析结果更新词内部结构分析模型，使得词内部结构分析模型的泛化能力更强。

步骤312，将第三结构解析结果添加至该已校对的标注样本的结构解析结果中。

在本实施例中，在用户输入第三结构解析结果之后，若第三结构解析结果与多个已校对的标注样本的结构解析结果不匹配，则还可以将第三结构解析结果添加至已校对的标注样本的结构解析结果中，使得后续再存在与目标样本类似的样本时，能匹配到对应的结构解析结果。

可选地，在用户输入第三结构解析结果之后，若第三结构解析结果与目标类别的命名实体的结构解析结果不匹配，则还可以将第三结构解析结果添加至目标类别的命名实体库中，使得后续再存在与目标样本类似的样本时，可以在该命名实体库中能匹配到对应的结构解析结果。

需要说明的是，在图8所示的流程中，步骤307和步骤308与步骤304没有先后顺序，并且步骤307和步骤308也没有先后顺序。步骤311和步骤312与步骤304没有先后顺序，并且步骤311和步骤312也没有先后顺序。

在一种示例中，当存在多个用户进行命名实体标注时，对于同一个命名实体，有可能出现不同的用户标注不一致的情况，例如，在语句中存在“××市”，有的用户将“××”标注为地名，有的用户将“××市”标注为地名，“××市”中的“××”标注为地名时，结构解析结果不会存在于地名对应的命名实体库中，此种情况下，在步骤304之前可进行如下处理。

在目标样本所属的语句中，获取目标短语，其中，目标短语由目标样本与目标样本的相邻位置的词语组成，对目标短语进行结构解析，获得目标短语的第二结构解析结果，确定多个已校对的标注样本的结构解析结果中存在与第二结构解析结果匹配的结构解析结果。

在本实施例中，计算设备在目标样本所属的语句中，确定目标样本相邻位置的词语，该词语与目标样本组成目标短语。例如，目标样本为“××”，所属的语句为“我在“××”市定居”，目标短语为“××市”。此处相邻位置的词语可以是目标样本之后的一个字，具体取目标样本之后的字的数目可以根据实际的应用场景设置，本申请实施例不进行限定。

计算设备将目标短语输入至词内部结构解析模型中，获得目标短语的结构解析结果，即第二结构解析结果。计算设备判断多个已校对的标注样本的结构解析结果中是否存在与第二结构解析结果匹配的结构解析结果。若存在，则可以输出提示消息，该提示消息用于提示用户检查目标样本的标注结果。这样，在多个用户标注不一致时，可以挖掘出标注错误的样本，提升标注准确性。此处在判断多个已校对的标注样本的结构解析结果中是否存在与第二结构解析结果匹配的结构解析结果时，若目标短语为第一命名实体样本，可以先确定目标短语的类别，在多个已校对的标注样本中，确定与第一命名实体样本的类别相同的一个或多个命名实体样本，判断第二结构解析结果是否存在于该一个或多个命名实体的结构解析结果中，若存在，则可以输出提示消息。

可选地，该提示消息还用于指示目标样本对应的正确标注结果。这样，用户在检查目标样本的标注结果时，可以参考提示消息中指示的正确标注结果。例如，目标样本为“××”，目标短语为“××市”，提示消息中可以携带“××市”进行提示。

可选地，计算设备确定多个已校对的标注样本的结构解析结果中存在与第二结构解析结果匹配的结构解析结果时，计算设备还可以向终端设备发送第二结构解析结果的确认消息。终端设备接收第二结构解析结果的确认消息，生成第二结构解析结果的确认界面。此处显示第二结构解析结果与前文中图9显示第一结构解析结果一样，不再赘述。

若用户确认第二结构解析结果正确，则计算设备会接收到用户输入的确认正确消息，可以向终端设备发送提示消息，该提示消息用于提示用户检查目标样本的标注结果。若用户确认第二结构解析结果不正确，则输出第一结构解析结果的确认消息(即执行上述步骤305)。

另外，若多个已校对的标注样本的结构解析结果中不存在与第二结构解析结果匹配的结构解析结果，则输出第一结构解析结果的确认消息(即执行上述步骤305)。

另外，在用户确认第二结构解析结果正确后，或者计算设备确定多个已校对的标注样本的结构解析结果中存在与第二结构解析结果匹配的结构解析结果后，计算设备还可以使用第二结构解析结果更新词内部结构分析模型，使得词内部结构分析模型更准确。

需要说明的是，在上述描述中，是以目标样本一个样本为例进行描述，本申请实施例中，也可以同时对多个样本进行结构解析，判断多个样本是否标注错误，为用户挖掘出可能标注错误的样本。例如，用户在一个语句中标注了两个样本，可以同时判断这两个样本是否标注错误。

还需要说明的是，在前文的描述中，是以系统架构100为例进行说明，在以其它系统架构实现样本标注的校对方法时，执行过程与前文中的描述类似，此处不再赘述。

采用本申请所示的方案，对于待校对的标注样本，能够基于样本的结构解析结果，挖掘出可能标注错误的样本，提示用户再次确认，使得样本的标注结果的准确率比较高，进而使得神经网络模型的训练效果比较好。

而且在多个用户进行样本标注时，能够发现标注不一致的情况，可以减少神经网络模型在训练时的混淆，提高神经网络模型的识别能力。

下面描述本申请实施提供的样本标注的校对装置。

图10是本申请实施例提供的样本标注的校对装置的结构图。该装置可以通过软件、硬件或者两者的结合实现成为装置中的部分或者全部。本申请实施例提供的装置可以实现本申请实施例图3和图7所示的流程，该装置包括：交互模块1010、解析模块1020和匹配模块1030，其中：

交互模块1010，用于获取目标样本，其中，所述目标样本为待校对的标注样本，具体可以用于实现步骤301的交互功能以及执行步骤301包含的隐含步骤；

解析模块1020，用于对所述目标样本进行结构解析，获得所述目标样本的第一结构解析结果，具体可以用于实现步骤302的解析功能以及执行步骤302包含的隐含步骤；

匹配模块1030，用于将所述第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，具体可以用于实现步骤303的匹配功能以及执行步骤303包含的隐含步骤；

所述交互模块1010，还用于若所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果，则输出提示消息，其中，所述提示消息用于提示用户检查所述目标样本的标注结果，具体可以用于实现步骤304的交互功能以及执行步骤304包含的隐含步骤。

在一种示例中，所述目标样本为目标命名实体样本，所述第一结构解析结果为词内部结构；

所述解析模块1020，用于：

使用词内部结构分析模型，对所述目标样本进行词内部结构解析，获得所述目标样本的词内部结构。

在一种示例中，所述匹配模块1030，用于：

从所述多个已校对的标注样本中，确定与所述目标命名实体样本的类别相同的一个或多个命名实体样本；

若所述第一结构解析结果不存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果；

若所述第一结构解析结果存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中存在与所述第一结构解析结果匹配的目标结构解析结果。

在一种示例中，所述交互模块1010，还用于：

在获得所述目标样本的第一结构解析结果之后，生成所述第一结构解析结果的确认界面，所述确认界面用于向用户显示所述第一结构解析结果；

接收所述用户输入的确认指令，所述确认指令用于对所述第一结构解析结果进行修改或确认。

在一种示例中，所述解析模块1020，还用于：

基于所述修改后的第一结构解析结果，更新所述词内部结构分析模型。

在一种示例中，所述交互模块1010，还用于：

在接收所述用户输入的确认指令之后，将确认后或修改后的所述第一结构解析结果添加至所述已校对的标注样本的结构解析结果中。

在一种示例中，所述匹配模块1030，还用于：

在输出提示消息之前，在所述目标样本所属的语句中，获取目标短语，其中，所述目标短语由所述目标样本与所述目标样本的相邻位置的词语组成；

对所述目标短语进行结构解析，获得所述目标短语的第二结构解析结果；

确定所述多个已校对的标注样本的结构解析结果中存在与所述第二结构解析结果匹配的结构解析结果。

在一种示例中，所述提示消息还用于提示所述目标样本对应的正确标注结果。

在一种示例中，所述交互模块1010，用于：

获取用户标注的目标样本；或者，

获取预标注模型标注的目标样本。

其中，交互模块1010、解析模块1020和匹配模块1030均可以通过软件实现，或者可以通过硬件实现。示例性的，接下来以解析模块1020为例，介绍解析模块1020的实现方式。类似的，交互模块1010和匹配模块1030的实现方式可以参考解析模块1020的实现方式。

模块作为软件功能单元的一种举例，解析模块1020可以包括运行在计算实例上的代码。其中，计算实例可以包括物理主机(计算设备)、虚拟机或容器中的至少一种。进一步地，上述计算实例可以是一台或者多台。例如，解析模块1020可以包括运行在多个主机/虚拟机/容器上的代码。需要说明的是，用于运行该代码的多个主机/虚拟机/容器可以分布在相同的区域(region)中，也可以分布在不同的region中。进一步地，用于运行该代码的多个主机/虚拟机/容器可以分布在相同的可用区(availability zone，AZ)中，也可以分布在不同的AZ中，每个AZ包括一个数据中心或多个地理位置相近的数据中心。其中，通常一个region可以包括多个AZ。

同样，用于运行该代码的多个主机/虚拟机/容器可以分布在同一个虚拟私有云(virtual private cloud，VPC)中，也可以分布在多个VPC中。其中，通常一个VPC设置在一个region内，同一region内两个VPC之间，以及不同region的VPC之间跨区通信需在每个VPC内设置通信网关，经通信网关实现VPC之间的互连。

模块作为硬件功能单元的一种举例，解析模块1020可以包括至少一个计算设备，如服务器等。或者，解析模块1020也可以是利用专用集成电路(application-specific integrated circuit， ASIC)实现或可编程逻辑器件(programmable logic device，PLD)实现的设备等。其中，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)、现场可编程门阵列(field-programmable gate array，FPGA)和通用阵列逻辑(generic array logic，GAL)或其任意组合实现。

解析模块1020包括的多个计算设备可以分布在相同的region中，也可以分布在不同的region中。解析模块1020包括的多个计算设备可以分布在相同的AZ中，也可以分布在不同的AZ中。同样，解析模块1020包括的多个计算设备可以分布在同一个VPC中，也可以分布在多个VPC中。其中，所述多个计算设备可以是服务器、ASIC、PLD、CPLD、FPGA和GAL等计算设备的任意组合。

需要说明的是，在其他实施例中，交互模块1010可以用于执行样本标注的校对方法中的任意步骤，解析模块1020可以用于执行样本标注的校对方法中的任意步骤，匹配模块1030可以用于执行样本标注的校对方法中的任意步骤。交互模块1010、解析模块1020和匹配模块1030负责实现的步骤可根据需要指定，通过交互模块1010、解析模块1020和匹配模块1030分别实现样本标注的校对方法中不同的步骤来实现样本标注的校对装置的全部功能。

还需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时也可以有另外的划分方式。

下面描述本申请实施例提供的计算设备102。

本申请实施例还提供了一种计算设备102。如图11所示，计算设备102包括：总线1102、处理器1104、存储器1106和通信接口1108。处理器1104、存储器1106和通信接口1108之间通过总线1102通信。计算设备102可以是服务器或终端设备。应理解，本申请不限定计算设备102中的处理器和存储器的个数。

总线1102可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线和控制总线等。为便于表示，图11中仅用一条线表示，但并不表示仅有一根总线或一种类型的总线。总线1104可包括在计算设备102各个部件(例如，存储器1106、处理器1104和通信接口1108)之间传送信息的通路。

处理器1104可以包括中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)、微处理器(micro processor，MP)或者数字信号处理器(digital signal processor，DSP)等处理器中的任意一种或多种。

存储器1106可以包括易失性存储器(volatile memory)，例如，随机存取存储器(random access memory，RAM)。处理器1104还可以包括非易失性存储器(non-volatile memory)，例如，只读存储器(read-only memory，ROM)，快闪存储器，机械硬盘(hard disk drive，HDD)或固态硬盘(solid state drive，SSD)。

存储器1106中存储有可执行的程序代码，处理器1104执行该可执行的程序代码以分别实现后文中交互模块1010、解析模块1020和匹配模块1030的功能，从而实现样本标注的校对方法。也即，存储器1106上存有用于执行样本标注的校对方法的指令。

通信接口1108使用例如但不限于网络接口卡和收发器一类的收发模块，来实现计算设备102与其他设备或通信网络之间的通信。

下面描述本申请实施例提供的计算设备集群。

本申请实施例还提供了一种计算设备集群。该计算设备集群包括至少一个计算设备。该计算设备可以是服务器，例如，该计算设备是中心服务器、边缘服务器，或者是本地数据中心中的本地服务器。在一些实施例中，计算设备也可以是台式机、笔记本电脑或者智能手机等终端设备。

如图12所示，该计算设备集群包括至少一个计算设备102。计算设备集群中的一个或多个计算设备102中的存储器1106中可以存有相同的用于执行样本标注的校对方法的指令。

在一些可能的实现方式中，该计算设备集群中的一个或多个计算设备102的存储器1106中也可以分别存有用于执行样本标注的校对方法的部分指令。换言之，一个或多个计算设备102的组合可以共同执行用于执行样本标注的校对方法的指令。

需要说明的是，计算设备集群中的不同的计算设备102中的存储器1106可以存储不同的指令，分别用于执行后文中样本标注的校对装置的部分功能。也即，不同的计算设备102中的存储器1106存储的指令可以实现交互模块1010、解析模块1020和匹配模块1030中的一个或多个模块的功能。

在一些可能的实现方式中，计算设备集群中的一个或多个计算设备可以通过网络连接。其中，该网络可以是广域网或局域网等等。图13示出了一种可能的实现方式。如图13所示，两个计算设备(第一计算设备102A和第二计算设备102B)之间通过网络进行连接。具体地，通过各个计算设备中的通信接口与该网络进行连接。在这一类可能的实现方式中，第一计算设备102A中的存储器1106中存有执行解析模块1020和匹配模块1030的功能的指令。同时，第二计算设备102B中的存储器1106中存有执行交互模块1010的功能的指令。

图13所示的计算设备集群之间的连接方式可以是考虑到本申请提供的样本标注的校对方法中匹配模块1030需要有解析模块1020的输出结果，因此考虑将执行解析模块1020和匹配模块1030实现的功能交由第一计算设备102A执行，并且考虑到本申请提供的样本标注的校对方法有可能与终端设备101进行交互，因此考虑将执行交互模块1010实现的功能交由第二计算设备102B执行。

应理解，图13中示出的第一计算设备102A的功能也可以由多个计算设备102完成。同样，第二计算设备102B的功能也可以由多个计算设备102完成。

本申请实施例还提供了一种包含指令的计算机程序产品。所述计算机程序产品可以是包含指令的，能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当所述计算机程序产品在至少一个计算设备上运行时，使得至少一个计算设备执行样本标注的校对方法。

本申请实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，数字多功能光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令，所述指令指示计算设备执样本标注的校对方法。

本领域普通技术人员可以意识到，结合本申请中所公开的实施例中描述的各方法步骤和单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请中术语“第一”和“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”和“第二”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语“第一”和“第二”等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如，在不脱离各种示例的范围的情况下，第一结构解析结果可以被称为第二结构解析结果，并且类似地，第二结构解析结果可以被称为第一结构解析结果。第一结构解析结果和第二结构解析结果都可以是结构解析结果，并且在某些情况下，可以是单独且不同的结构解析结果。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的保护范围。

Claims

一种样本标注的校对方法，其特征在于，所述方法包括：

获取目标样本，其中，所述目标样本为待校对的标注样本；

对所述目标样本进行结构解析，获得所述目标样本的第一结构解析结果；

将所述第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配；

若所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果，则输出提示消息，其中，所述提示消息用于提示用户检查所述目标样本的标注结果。
根据权利要求1所述的方法，其特征在于，所述目标样本为目标命名实体样本，所述第一结构解析结果为词内部结构；

所述对所述目标样本进行结构解析，获得所述目标样本的第一结构解析结果，包括：

使用词内部结构分析模型，对所述目标样本进行词内部结构解析，获得所述目标样本的词内部结构。
根据权利要求2所述的方法，其特征在于，所述将所述第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配，包括：

从所述多个已校对的标注样本中，确定与所述目标命名实体样本的类别相同的一个或多个命名实体样本；

若所述第一结构解析结果不存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果；

若所述第一结构解析结果存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中存在与所述第一结构解析结果匹配的目标结构解析结果。
根据权利要求2或3所述的方法，其特征在于，在获得所述目标样本的第一结构解析结果之后，还包括：

生成所述第一结构解析结果的确认界面，所述确认界面用于向用户显示所述第一结构解析结果；

接收所述用户输入的确认指令，所述确认指令用于对所述第一结构解析结果进行修改或确认。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

基于所述修改后的第一结构解析结果，更新所述词内部结构分析模型。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

在接收所述用户输入的确认指令之后，将确认后或修改后的所述第一结构解析结果添加至所述已校对的标注样本的结构解析结果中。
根据权利要求2或3所述的方法，其特征在于，所述输出提示消息之前，还包括：

在所述目标样本所属的语句中，获取目标短语，其中，所述目标短语由所述目标样本与所述目标样本的相邻位置的词语组成；

对所述目标短语进行结构解析，获得所述目标短语的第二结构解析结果；

确定所述多个已校对的标注样本的结构解析结果中存在与所述第二结构解析结果匹配的结构解析结果。
根据权利要求1至7任一项所述的方法，其特征在于，所述提示消息还用于提示所述目标样本对应的正确标注结果。
根据权利要求1至8任一项所述的方法，其特征在于，所述获取目标样本，包括：

获取用户标注的所述目标样本；或者，

获取预标注模型标注的所述目标样本。
一种样本标注的校对装置，其特征在于，所述装置包括：

交互模块，用于获取目标样本，其中，所述目标样本为待校对的标注样本；

解析模块，用于对所述目标样本进行结构解析，获得所述目标样本的第一结构解析结果；

匹配模块，用于将所述第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配；

所述交互模块，还用于若所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果，则输出提示消息，其中，所述提示消息用于提示用户检查所述目标样本的标注结果。
根据权利要求10所述的装置，其特征在于，所述目标样本为目标命名实体样本，所述第一结构解析结果为词内部结构；

所述解析模块，用于：

使用词内部结构分析模型，对所述目标样本进行词内部结构解析，获得所述目标样本的词内部结构。
根据权利要求11所述的装置，其特征在于，所述匹配模块，用于：

从所述多个已校对的标注样本中，确定与所述目标命名实体样本的类别相同的一个或多个命名实体样本；

若所述第一结构解析结果不存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中不存在与所述第一结构解析结果匹配的目标结构解析结果；

若所述第一结构解析结果存在于所述一个或多个命名实体的结构解析结果中，则确定所述多个已校对的标注样本的结构解析结果中存在与所述第一结构解析结果匹配的目标结构解析结果。
根据权利要求11或12所述的装置，其特征在于，所述交互模块，还用于：

在获得所述目标样本的第一结构解析结果之后，生成所述第一结构解析结果的确认界面，所述确认界面用于向用户显示所述第一结构解析结果；

接收所述用户输入的确认指令，所述确认指令用于对所述第一结构解析结果进行修改或确认。
根据权利要求13所述的装置，其特征在于，所述解析模块，还用于：

基于所述修改后的第一结构解析结果，更新所述词内部结构分析模型。
根据权利要求13所述的装置，其特征在于，所述交互模块，还用于：

在接收所述用户输入的确认指令之后，将确认后或修改后的所述第一结构解析结果添加至所述已校对的标注样本的结构解析结果中。
根据权利要求11或12所述的装置，其特征在于，所述匹配模块，还用于：

在输出提示消息之前，在所述目标样本所属的语句中，获取目标短语，其中，所述目标短语由所述目标样本与所述目标样本的相邻位置的词语组成；

对所述目标短语进行结构解析，获得所述目标短语的第二结构解析结果；

确定所述多个已校对的标注样本的结构解析结果中存在与所述第二结构解析结果匹配的结构解析结果。
根据权利要求10至16任一项所述的装置，其特征在于，所述提示消息还用于提示所述目标样本对应的正确标注结果。
根据权利要求10至17任一项所述的装置，其特征在于，所述交互模块，用于：

获取用户标注的所述目标样本；或者，

获取预标注模型标注的所述目标样本。
一种计算设备集群，其特征在于，包括至少一个计算设备，每个计算设备包括处理器和存储器；

所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令，以使得所述计算设备集群执行如权利要求1至9任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括计算机程序指令，当所述计算机程序指令由计算设备集群执行时，所述计算设备集群执行如权利要求1至9任一项所述的方法。
一种包含指令的计算机程序产品，其特征在于，当所述指令被计算设备集群运行时，使得所述计算设备集群执行如权利要求的1至9任一项所述的方法。