CN110298030B

CN110298030B - 语义分析模型准确度的校验方法、装置、存储介质及设备

Info

Publication number: CN110298030B
Application number: CN201910441486.5A
Authority: CN
Inventors: 王丽杰
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-05-24
Filing date: 2019-05-24
Publication date: 2022-06-17
Anticipated expiration: 2039-05-24
Also published as: CN110298030A; WO2020237872A1

Abstract

本申请涉及校验技术领域，尤其涉及一种语义分析模型准确度的校验方法、装置、存储介质及设备。其中，语义分析模型准确度的校验方法，包括：获取项目信息，从所述项目信息中提取关键词，按照词义属性将所述关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集；分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获得语义分析模型的识别准确度。本申请提供的方案通过扩充问题集的问题，以解决语义分析模型验证效率低下的问题。

Description

语义分析模型准确度的校验方法、装置、存储介质及设备

技术领域

本申请涉及校验技术领域，具体而言，本申请涉及一种语义分析模型准确度的校验方法、装置、存储介质及设备。

背景技术

随着人工智能的发展，计算机可以帮助人类做很多工作，计算机能够帮助甚至替代人类“工作”的秘诀在于：模型的建立，训练出的模型能够进行识别、分类等工作，但模型的建立需要大量的训练样本，模型的识别精度及准确度受训练样本数量的直接影响，数据量不足会显著影响模型效果，而且模型建立后，需要用大量的数据对生成的模型进行准确率验证。

尤其是在问答系统研究领域，问答样本数据往往只有数百条到数千条量级，且问题数据的采集及结果的对比均采用手动梳理的方式进行，问题数据的覆盖面窄，验证效率低下。

发明内容

本申请提供了一种语义分析模型准确度的校验方法、装置、计算机可读存储介质及计算机设备，以扩充问题集，解决语义分析模型验证效率低下的问题。

本申请实施例首先提供了一种语义分析模型准确度的校验方法，包括：

获取项目信息，从所述项目信息中提取关键词，按照词义属性将所述关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集；

分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；

根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；

将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度。

在一种实施例中，所述分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句的步骤，包括：

将测试数据集划分为第一测试数据集及第二测试数据集；

依次抽取第一测试数据集中的第一测试关键词、第二测试数据集中的第二测试关键词及期望关键词生成问题语句。

在一种实施例中，所述分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句的步骤之后，还包括：

调用语法规则对所述问题语句进行语句润化处理，以使所述问题语句符合语法规则。

在一种实施例中，所述得到问题语句集的步骤之后，还包括：

对所述问题语句集中的问题语句进行语义分析，剔除其中无意义的问题语句。

在一种实施例中，所述分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集的步骤，包括：

从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；

将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句；

将生成的问题语句集合起来形成问题语句集。

在一种实施例中，若遍历项目信息并未获得问题语句的参考答案，所述获取各个问题语句对应的参考答案的步骤，包括：

将问题语句划归为未解问题语句集合中，为所述未解问题语句集中的问题语句设置统一参考答案。

在一种实施例中，其特征在于，所述将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度的步骤，包括：

若所述参考答案与识别答案一致，则标记为识别正确；

分别统计识别正确的问题语句数量与问题语句集中问题语句的数量，计算识别正确的问题语句在问题语句集中的数量占比，获得语义分析模型的识别准确度。

对应地，本申请实施例还提供了一种语义分析模型准确度的校验装置，包括：

提取关键词模块，用于获取项目信息，从所述项目信息中提取关键词，按照词义属性将所述关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集；

生成问题语句模块，用于分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；

获取参考答案模块，用于根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；

校验模块，用于将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机指令，当所述计算机指令在计算机上运行时，使得计算机可以执行上述任一技术方案所述的语义分析模型准确度的校验方法的步骤。

更进一步地，本申请实施例还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任意一技术方案所述的语义分析模型准确度的校验方法的步骤。

与现有技术相比，本申请提供的方案至少具备如下优点：

本申请实施例提供的语义分析模型准确度的校验方法，提取项目信息中的关键词，对抽取出的关键词进行组合生成大量问题语句，将大量的问题语句作为语义分析模型的测试问题，进行语义分析模型的识别准确度校验，本方案从项目信息中提取的大量关键词，利用关键词的组合生成大批量的问题语句，这些问题语句能够覆盖整个项目信息，覆盖面广且数量丰富，提高语义识别模型校验准确性的同时也提高了校验效率。

本申请实施例提供的语义分析模型准确度的校验方法，基于项目信息进行关键词及对应参考答案的提取，有利于保障生成的问题语句有准确的参考答案，基于生成的问题语句及准确的参考答案进行模型校验，有利于获得准确的模型校验准确度。

本申请附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请一个实施例提供的语义分析模型准确度的校验方法的实施环境图；

图2为本申请一个实施例提供的语义分析模型准确度的校验方法的流程示意图；

图3为本申请一个实施例提供的分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集的流程示意图；

图4为本申请一个实施例提供的分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句的流程示意图；

图5为本申请另一个实施例提供的语义分析模型准确度的校验方法的流程示意图；

图6为本申请一种实施例提供的语义分析模型准确度的校验装置的结构示意图；

图7为本申请一种实施例提供的计算机设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件，但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说，在不脱离本申请的范围的情况下，可以将第一直播视频图像称为第二直播视频图像，且类似地，可将第二直播视频图像称为第一直播视频图像。

图1为一个实施例中提供的语义分析模型准确度的校验方法的实施环境图，在该实施环境中，包括用户终端、服务器端。

本实施例提供的语义分析模型准确度的校验方案，服务器端获取项目信息，从项目信息中提取关键词，按照词义属性将提取出的关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集，分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的准确度。

需要说明的是，用户终端可为智能手机、平板电脑、笔记本电脑、台式计算机等，服务器端可以由具有处理功能的计算机设备来实现，但并不局限于此。服务器端与用户终端可以通过蓝牙、USB(Universal Serial Bus，通用串行总线)或者其他通讯连接方式进行网络连接，本申请在此不做限制。

在一个实施例中，图2为本申请实施例提供的语义分析模型准确度的校验方法的流程示意图，该语义分析模型准确度的校验方法可以应用于上述的服务器端，包括如下步骤：

步骤S210，获取项目信息，从所述项目信息中提取关键词，按照词义属性将所述关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集；

步骤S220，分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；

步骤S230，根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；

步骤S240，将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度。

自然语言处理(Natural Language Processing,NLP)，是计算机科学、人工智能、语言学关注计算机和人类自然语言之间的相互作用的领域，研究人与计算机之间用自然语言进行有效通信的各种理论和方法。语义分析模型应用于自然语言处理领域，能够实现计算机识别人类自然语言。

本申请方案的实施基础是已经获得项目信息，基于该项目信息进行后续处理，该项目信息可以是某个科研项目或研发项目，该项目信息中可以包含文字、图表等形式表示的信息，从这些项目信息中提取关键词，按照关键词的词义属性，将提取出的关键词进行分类，首先将关键词划分为测试关键词和期望关键词，测试关键词，如：A公司、B行业、男女、售价、入职等等，期望关键词，如：数量、比例、日期等。

分别从测试数据集和期望数据集抽取测试关键词和期望关键词，组成问题语句，如：男女比例，抽取的方式多样，可以随机抽取，也可以按照预设规则进行抽取，从项目信息中抽取大量关键词，对关键词进行组合生成多个问题语句，组成问题语句集合，根据提取出来的问题语句解析项目信息，获得各个问题语句的参考答案，并将问题语句对应的参考答案进行关联，依次提取问题语句集中的问题语句作为语义分析模型的输入，获得模型输出的识别答案，对比同一问题的参考答案与识别答案，若识别答案与参考答案一致，则为识别正确，若识别答案与参考答案不一致，则识别错误，根据正确识别的问题占全部问题的比例，获得语义分析模型的识别准确度。

本申请实施例提供的语义分析模型准确度的校验方案，提取项目信息中的关键词，对抽取出的关键词进行组合生成大量问题语句，将大量的问题语句作为语义分析模型的测试问题，进行语义分析模型的识别准确度校验。本方案基于项目信息提取大量关键词，不同关键词的组合能够生成大批量的问题语句，基于整个项目信息的关键词获得的问题语句的覆盖面广，问题语句集的问题数量丰富，有利于提高模型校验准确性的同时也提高了校验效率。

为了更清楚本申请提供的语义分析模型准确度的校验方案及其技术效果，接下来以多个实施例对其具体方案进行详细阐述。

步骤S220的分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集，可以通过如下方式获得，其流程示意图如图3所示，包括如下子步骤：

S310，从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；

S320，将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句；

S330，将生成的问题语句集合起来形成问题语句集。

其中，将抽取出来的测试关键词与期望关键词进行组合生成问题语句，可以通过至少两种方式进行，其一，随机从所述测试数据集中抽取至少一个测试关键词，随机从所述期望数据集中抽取一个期望关键词，将抽取出来的测试关键词和期望关键词进行随机组合，生成问题语句。

其中，测试数据集中可抽取至少一个测试关键词，可以为两个或两个以上的测试关键词，如抽取两个测试关键词：A公司、男女，或抽取三个测试关键词：A公司、男女、近三个月，即使抽取出的期望关键词为同一个，也至少对应两个不同的问题语句。

其二，通过预先设定抽取规则，如按照词义属性，将测试数据集划分为多个测试子集，依次从一个测试子集中抽取一个关键词，组成问题语句，具体如下：

步骤S220的分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，可以通过如下方式获得，其流程示意图如图4所示，包括如下子步骤：

S410，将测试数据集划分为第一测试数据集及第二测试数据集；

S420，依次抽取第一测试数据集中的第一测试关键词、第二测试数据集中的第二测试关键词及期望关键词生成问题语句。

将测试数据集划分为多个数据种类，可以划分为：来源信息，如文件名、公司名或行业名，时间信息，事件信息等等，如项目信息有如下信息：A公司于2018年3月至7月的入职人数为6个，提取其中的关键词：A公司、2018年3月至7月、入职、人数，按照数据种类将测试数据集划分为来源信息集、时间信息集、事件信息集，其中，来源信息关键词为：A公司，时间信息关键词为：2018年3月至7月，事件信息关键词为：入职，期望关键词为：人数。依次提取多个测试数据分类集中的关键词及期望关键词，生成问题语句：A公司2018年3月至7月入职人数？

值得说明的是，可以将测试数据集划分为三个测试数据集甚至更多，可以包含第三测试数据集、第四测试数据集等，划分的测试数据集越多，表明测试数据划分的类别越详细，对应的参考答案越精准，解析项目信息获得参考答案的效率越高。

进一步地，将测试数据集划分为多个测试子集，将测试子集进行随机组合，并将随机组合的测试关键词与期望关键词进行随机组合。从项目相关信息中可以提取到大量关键词，测试数据集包括多个测试子集，不同测试子集之间进行随机组合，采用该种方式能够增大测试数据的组合数量，测试数据集与期望数据集之间进行随机组合，进一步增大了生成的问题语句的数量，按照这种方式生成的问题语句数量很容易达到百万数量级，满足模型训练或模型验证的需求。举例说明本方案：如测试子集有3个，每个测试子集中均设有1个测试关键词，其随机组合方式有

期望数据集中设有3个期望关键词，则问题数据组合有

按照该种组合方式，有限的关键词就能生成大量问题语句，且该种组合方式及问题语句的生成方式能够根据设定程序自动运行，降低问题生成过程中的人工成本及问题生成难度。

综上，本实施例提供的方案基于提取出的大量关键词采用数据集随机组合的方式使得构建的问题语句集合中问题语句数量呈爆炸式增长，获得问题语句的效率高，且容易获得大量的测试样本，满足语义分析模型的识别准确率的验证需求。

进一步地，步骤S220的分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句的步骤之后，还包括：

S221，调用语法规则对所述问题语句进行语句润化处理，以使所述问题语句符合语法规则。

结合上一示例，提取测试关键词和期望关键词组成的问题语句是：A公司2018年3月至7月入职人数？该语句的各关键词之间无连接词，不符合人的语法习惯，因此，需要将该问题语句进行语句润化，调用现有的语法规则，将连接词补入欠缺的位置，润化后的问题语句如：A公司于2018年3月至7月的入职人数是多少？

润化之后的问题语句更加符合人的语法规则，避免问题语句产生歧义，进而导致无法利用该问题语句进行语义分析模型的识别准确性。

进一步地，步骤S220的得到问题语句集的步骤之后，还包括：S222，对所述问题语句集中的问题语句进行语义分析，剔除其中无意义的问题语句。

若问题语句的生成方式是通过对测试数据集与期望数据集的随机组合，可能会出现无意义的问题数据组合，如测试数据集中的测试关键词包括：A公司、2018年3月至7月、入职、男女，期望关键词：人数、比例，任意抽取上述测试数据集与期望数据集组成的问题语句：2018年3月至7月比例，该问题语句由于缺乏必要的定语变得无意义，为了提高问题语句的质量，将该部分无意义的问题语句剔除。

在一种实施例中，在步骤S220的得到问题语句集的步骤之后，首先对问题语句进行润化处理，使问题语句符合语法规则，再对润化后的问题语句进行剔除处理，避免剔除由于不符合语法规则的问题语句，提高问题语句的筛选通过率。

步骤S230的根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联，项目信息可以采用文字、图表等形式表示，解析文字、图表等形式表征的信息，提取其中的关键词及包含至少一个关键词标签的预设参考答案，如：项目信息中有如下文字记录的信息：甲公司2017年的入职人数是6个，提取其中的关键词：甲公司、2017年、入职、人数，预设参考答案为：6个，该预设参考答案的关键词标签为：甲公司、2017年、入职、人数。根据提取出来的问题语句解析项目信息，如：问题语句中的关键词为：甲公司、2017年、入职、人数，根据问题语句的关键词与预设参考答案的关键词标签进行对比，若问题语句的关键词与预设参考答案的关键词标签完全匹配，则该预设参考答案为该问题语句的参考答案，并将问题语句与对应的参考答案进行关联存储，以便后续调取该问题语句的参考答案，将其与问题语句的识别答案进行对比。

若解析项目信息并未获得问题语句对应的参考答案，也可以剔除该部分的问题语句，该种方案能够保证问题语句集中的问题语句都设有参考答案，提高了问题语句的质量，有利于获得准确的语义分析模型的识别准确性。

一种实施例中，若遍历项目信息并未获得问题语句的参考答案，所述获取各个问题语句对应的参考答案的步骤，可以通过如下方式进行，S231，将该问题语句划归到未解问题语句集合中，为所述未解问题语句集中的问题语句设置统一参考答案。如设置的统一参考答案形如“这个问题超纲了”或“这是个好问题”等，为未解问题语句集中的问题语句设置统一答案，能够保证每个问题语句均对应有参考答案，避免影响语义分析模型准确率的评估结果。

优选地，步骤S230的为所述未解问题语句集中的问题语句设置统一参考答案的步骤之前，还包括：对所述问题语句进行润化处理，对润化后的问题语句进行语义分析，保留润化处理后具有实际意义的问题语句。

经过该步骤之后，问题语句集中的问题语句均为符合语法规则且有意义的问题语句，对该部分问题语句进行参考答案的获取，对其中未解的问题语句设置统一参考答案，以便根据该问题语句进行语义分析模型准确度的测试。

值得说明的是，项目信息中对应有参考答案的问题语句可以作为模型识别准确性的测试数据，项目信息中未有对应参考答案的问题语句，也可以作为语义分析模型的测试问题，若语义分析模型对未解问题语句集中的问题语句的识别答案是表征无正确答案的意思，则认为该语义分析模型的识别结果是正确的。

基于上述润化处理及过滤处理，本实施例提供了一种语义分析模型准确度的校验方案，其流程示意图如图5所示，步骤S220得到问题语句集之后，进行步骤S221，调用语法规则对所述问题语句进行语句润化处理，以使所述问题语句符合语法规则，然后，再对润化后的问题语句进行S222，对所述问题语句集中的问题语句进行语义分析，剔除其中无意义的问题语句，获得符合语法规则且有意义的问题语句，接下来进行步骤S230的根据所述问题语句集中的问题语句解析所述项目信息，判断项目信息中是否存储有问题语句对应的参考答案，若遍历项目信息并未获得问题语句对应的参考答案，则进行步骤S231，将该问题语句划归到未解问题语句集合中，为所述未解问题语句集中的问题语句设置统一参考答案。若项目信息中已存储有问题语句对应的参考答案或经过步骤S231设置有统一参考答案，将问题语句与参考答案进行关联，关联之后进行步骤S240，将所述问题语句集中的各个问题语句输入语义分析模型件识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度。

本实施例提供的方案中，问题语句经过润化和过滤，使得问题语句均为符合语法规则且有意义的问题语句，为各问题语句设置参考答案时，为项目信息中并未存储的问题语句设置统一参考答案，以保证每个问题语句均能作为语义分析模型的测试问题，提高问题语句的质量，与剔除该部分问题语句相比，保证问题语句的数量规模，进而有利于获得准确的模型识别准确度，以及获得模型准确度校验的效率。

一种实施例中，将问题语句与参考答案进行关联之后，依次提取问题语句集中的各个问题语句，将所述问题语句输入语义分析模型中，获取输出的识别答案；调取与所述问题语句相关联的参考答案，对比所述参考答案与识别答案。步骤S240的将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度的步骤，包括：

若所述参考答案与识别答案一致，则标记为识别正确；若所述参考答案与识别答案不一致，则标记为识别错误；

统计识别正确的问题语句数量与问题语句集中问题语句的数量，计算所述识别正确的问题语句在问题语句集中的数量占比，获得语义分析模型的识别准确度。

本申请实施例提供的获得语义分析模型的识别准确度的方案，通过对参考答案与识别答案进行一致性判断，其中一致性判断为语义一致，如：识别答案为“6人”，若参考答案为“六人”，则表示参考答案与识别答案一致，若一致，则标记该问题语句为识别正确，统计识别正确的问题语句在问题语句集中的占比，该处问题语句集中的数量是均输入语义识别模型的问题语句的数量，本方案能够简单明了地获取语义分析模型的识别准确度。

以上为本申请提供的语义分析模型准确度的校验方法实施例，针对于该方法，下面阐述与其对应的语义分析模型准确度的校验装置的实施例。

本申请实施例还提供了一种语义分析模型准确度的校验装置，其结构示意图如图6所示，包括：提取关键词模块610、生成问题语句模块620、获取参考答案模块630、校验模块640，具体如下：

提取关键词模块610，用于获取项目信息，从所述项目信息中提取关键词，按照词义属性将所述关键词划分为测试关键词和期望关键词，得到测试数据集和期望数据集；

生成问题语句模块620，用于分别从所述测试数据集和期望数据集中抽取测试关键词和期望关键词合成问题语句，得到问题语句集；

获取参考答案模块630，用于根据所述问题语句集中的问题语句解析所述项目信息，获取各个问题语句对应的参考答案，并将所述问题语句与参考答案进行关联；

校验模块640，用于将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案，将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度。

关于上述实施例中的语义分析模型准确度的校验装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

进一步地，本申请实施例还提供一种计算机可读存储介质，其上存储有计算机指令，该计算机指令被处理器执行时实现上述任意一项所述的语义分析模型准确度的校验方法的步骤。其中，所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory，只读存储器)、RAM(Random AcceSS Memory，随即存储器)、EPROM(EraSable Programmable Read-Only Memory，可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory，电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是，存储介质包括由设备(例如，计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器，磁盘或光盘等。

更进一步地，本申请实施例还提供一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任意一项所述的语义分析模型准确度的校验方法的步骤。

图7是根据一示例性实施例示出的一种用于计算机设备700的框图。例如，计算机设备700可以被提供为一服务器。参照图7，计算机设备700包括处理组件722，其进一步包括一个或多个处理器，以及由存储器732所代表的存储器资源，用于存储可由处理组件722的执行的指令，例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件722被配置为执行指令，以执行上述语义分析模型准确度的校验方法的步骤。

计算机设备700还可以包括一个电源组件726被配置为执行计算机设备700的电源管理，一个有线或无线网络接口750被配置为将计算机设备700连接到网络，和一个输入输出(I/O)接口758。计算机设备700可以操作基于存储在存储器732的操作系统，例如WindowsServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

应该理解的是，在本申请各实施例中的各功能单元可集成在一个处理模块中，也可以各个单元单独物理存在，也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种语义分析模型准确度的校验方法，其特征在于，包括：

从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句；将生成的问题语句集合起来形成问题语句集；

将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案；将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度，包括：若所述参考答案与识别答案一致，则标记为识别正确；分别统计识别正确的问题语句数量与问题语句集中问题语句的数量，计算识别正确的问题语句在问题语句集中的数量占比，获得语义分析模型的识别准确度。

2.根据权利要求1所述的语义分析模型准确度的校验方法，其特征在于，所述从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句的步骤，包括：

将测试数据集划分为第一测试数据集及第二测试数据集；

3.根据权利要求1所述的语义分析模型准确度的校验方法，其特征在于，所述从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句的步骤之后，还包括：

4.根据权利要求1或3所述的语义分析模型准确度的校验方法，其特征在于，所述将生成的问题语句集合起来形成问题语句集的步骤之后，还包括：

5.根据权利要求1所述的语义分析模型准确度的校验方法，其特征在于，若遍历项目信息并未获得问题语句的参考答案，所述获取各个问题语句对应的参考答案的步骤，包括：

6.一种语义分析模型准确度的校验装置，其特征在于，包括：

生成问题语句模块，用于从测试数据集中抽取至少一个测试关键词，从期望数据集中抽取一个期望关键词；将抽取出来的所述测试关键词与期望关键词进行组合，生成问题语句；将生成的问题语句集合起来形成问题语句集；

校验模块，用于将所述问题语句集中的各个问题语句输入语义分析模型进行识别，获取输出的识别答案；将所述问题语句所关联的参考答案与识别答案进行对比，获得语义分析模型的识别准确度，包括：若所述参考答案与识别答案一致，则标记为识别正确；分别统计识别正确的问题语句数量与问题语句集中问题语句的数量，计算识别正确的问题语句在问题语句集中的数量占比，获得语义分析模型的识别准确度。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机指令，当其在计算机上运行时，使得计算机可以执行上述权利要求1至5中任一项所述的语义分析模型准确度的校验方法的步骤。

8.一种计算机设备，其特征在于，所述计算机设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至5中任意一项所述的语义分析模型准确度的校验方法的步骤。