CN110717028A

CN110717028A - 一种剔除干扰问题对的方法及系统

Info

Publication number: CN110717028A
Application number: CN201910995960.9A
Authority: CN
Inventors: 陈晓军; 崔恒斌
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2020-01-21
Anticipated expiration: 2039-10-18
Also published as: CN110717028B

Abstract

本说明书实施例公开了一种剔除干扰问题对的方法及系统。所述方法包括：获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。

Description

一种剔除干扰问题对的方法及系统

技术领域

本说明书实施例涉及数据处理领域，特别涉及一种剔除干扰问题对的方法、系统。

背景技术

随着计算机技术的发展，自动问答系统在生活中越来越普遍，为人们的生活带来了多种便利。例如通过识别用户输入的文字和/或语音问题，自动回复与该问题对应的答案，从而解决用户的疑问和需求。

通常，从线上获取的大量问题对中存在一些干扰问题对。例如，从线上获取保险类的问题对中可能会存在金融类的问题对。在应用这些获取的问题时，干扰问题对可能会产生不利影响。因此，如何有效地剔除干扰问题对成为目前亟需解决的技术问题。

发明内容

本说明书实施例的一个方面提供一种剔除干扰问题对的方法，所述方法包括：获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。

本说明书实施例的另一个方面提供一种训练剔除模型的方法，所述方法包括：获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型。

本说明书实施例的另一方面提供一种剔除干扰问题对的系统，所述系统包括训练模块，用于获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型；剔除模块，用于采用所述目标剔除模型剔除目标问题对中的干扰问题对。

本说明书实施例的一个方面提供一种剔除干扰问题对装置，所述装置包括至少一个存储介质和至少一个处理器，所述至少一个存储介质用于存储计算机指令；所述至少一个处理器用于执行所述计算机指令以实现剔除干扰问题对的方法。

附图说明

本说明书将以示例性实施例的方式进一步描述，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书的一些实施例所示的示例性问题对的示意图；

图2是根据本说明书的一些实施例所示的示例性剔除干扰问题对系统的模块图；

图3是根据本说明书的一些实施例所示的剔除干扰问题对方法的示例性流程图；

图4是根据本说明书的一些实施例所示的获取反馈值方法的示例性流程图；以及

图5是根据本说明书的一些实施例所示的训练匹配模型的示例性流程图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

图1是根据本说明书的一些实施例所示的示例性问题对的示意图。

问题对可以是指由问题以及与该问题相关的文本组成的文本对。在一些实施例中，问题对可以是问题以及对应该问题的回答，其中，回答可以是对问题的解答，也可以是针对问题的另一种提问。例如，“这个医保犹豫期是多久”以及对应其的回答“10天”，该回答属于对问题的解答。又例如，“为什么我支付的钱被扣了”以及对应的回答“是钱少了吗”，该回答属于对问题的另一种提问。在一些实施例中，问题对可以是两个表述相似的问题。例如，“好医保值得信任吗”以及其相似表述“好医保可靠吗”。在一些实施例中，问题对可以是用户在各个行业中产生的问题对，包括但不限于金融行业、保险行业、互联网行业、汽车行业、餐饮行业、电信行业、能源行业、娱乐行业、体育行业、物流行业、医疗行业、安全行业等。

干扰问题对可以是指对于问题对的处理、分析或应用等造成干扰的问题对。在一些实施例中，干扰问题对可以是与目标主题不相关的问题对。例如，目标主题可以是目标行业。若目标行业是保险行业，但出现了属于金融行业、医疗行业等其他行业的问题对，则这些不属于保险行业的问题对为干扰问题对。在一些实施例中，干扰问题对还可以是与其他目标主题不相关的问题对，本实施例不做限制。例如，干扰问题对可以是与目标类别不相关的问题对。

在一些实施例中，可以剔除干扰问题对。问题对应该被剔除还是保留，可以根据问题对是否与目标主题相关决定。如图1所示，若目标主题是保险行业，则可以将非保险行业的问题对剔除，保险行业的问题对保留。例如，问题对“好医保是什么啊”“好医保是一款综合类保险”属于保险行业的问题对，不属于干扰问题对，保留；问题对“为什么我支付宝的钱被扣了”“是钱少了吗”不属于保险行业的问题对(属于金融行业的问题对)，属于干扰问题对，需要剔除。在一些实施例中，还可以基于其他方法进行剔除，本实施例不做限制。

在一些实施例中，可以对问题进行匹配。匹配可以是指问题对中两个句子的内容是否能够相互对应。对于问题回答型问题对，匹配可以是回答是否解决了问题中的疑问，也可以是回答表述的内容是否与问题相似或者一致。例如，问题对“好医保是什么”“好医保是一款综合类保险”，回答给出了“好医保”的定义，问题对属于匹配。又例如，问题对“为什么我支付的钱被扣了”“是钱少了吗”两个句子都说的是用户钱变少的内容，问题对属于匹配。对于相似表述型问题对，匹配可以是两个句子表述的内容是否相似或者一致。例如，“好医保值得信任吗”和“好医保可靠吗”两个句子表述内容一致，问题对属于匹配。在一些是实施例中，可以用数字表示匹配与不匹配。如图1所示，用1表示匹配，0表示不匹配。

在一些实施例中，可以基于问题对中句子的文本相似性确定问题对是否匹配。在一些实施例中，还可以基于其他方法进行，本实施例不做限制。

图2是根据本说明书的一些实施例所示的示例性剔除干扰问题对系统的模块图。

该系统可以用于互联网服务的线上服务平台。在一些实施例中，该系统100可以用于包含智能答复系统的线上服务平台。例如，电商平台、线上咨询平台、公共服务平台等。

如图2所示，该系统可以包括训练模块210和剔除模块220。

训练模块210可以用于对问题对匹配模型的训练。具体的，首先训练模块210获取多个样本对，所述样本对为问题对。其次，训练模块210可以剔除所述多个样本对中的干扰样本对，将未剔除的第二样本对输入初始匹配模型进行训练，获得所述匹配模型。在一些实施例中，训练模块210可以基于规则剔除干扰样本对。在一些实施例中，训练模块210可以基于剔除模型剔除干扰样本对。初始匹配模型是基于目标主题(例如，目标行业)相关的样本对进行的训练，因此，训练得到的匹配模型对目标主题相关的问题对的匹配结果更准确。例如，目标主题是保险行业，则初始匹配模型基于保险行业的样本对训练完成得到匹配模型，该匹配模型对保险行业的问题对匹配更准确。

在一些实施例中，训练模块210可以用于对干扰问题对剔除模型进行训练。具体的，首先训练模块210获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对。其中，初始剔除模型是指还未训练的剔除模型。在一些实施例中，初始剔除模型可以是二分类模型。在一些实施例中，训练模块210可以从数据库、线上平台等获取至少一个问题对。其次，训练模块210可以将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果。其中，匹配模型是已经经过训练的模型。关于训练模块210训练匹配模型的更多细节参见前文。然后，训练模块210可以基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值。其中反馈值是一种衡量匹配模型匹配准确率的指标，例如，F-1分数。F-1分数是综合准确率和召回率的模型综合评价指标。在一些实施例中，训练模块210可以根据问题对第一匹配结果和问题对标记的第二匹配结果是否一致计算反馈值，其中一致代表匹配模型预测正确，不一致代表匹配模型预测错误。统计被预测错误的问题对数量和被预测正确的问题对数量，并将对应的数量带入现有的反馈值(例如，F-1分数)计算公式中确定反馈值。关于计算反馈值的更多细节参见图4及其相关描述。最后，训练模块210可以根据所述反馈值调整所述初始剔除模型，得到目标剔除模型。如图3所述，在一些实施例中，训练模块210可以基于初始剔除模型的第一损失函数和反馈值，调整初始剔除模型的参数，当调整后的中间剔除模型当前的损失函数第二损失函数满足第一预设条件，确定当前中间剔除模型为目标剔除模型。其中，第二损失函数是初始剔除模型调整参数后得到的中间剔除模型的损失函数。

在一些实施例中，训练模块210还可以用于将输入所述匹配模型的所述问题对进行向量表示。

剔除模块220可以用于采用所述目标剔除模型对目标问题对中的干扰问题对进行剔除。

应当理解，图2所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于剔除干扰问题对系统200及其模块的描述，仅为描述方便，并不能把本说明书限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。例如，图2中披露的训练模块210和剔除模块220可以是一个系统中的不同模块，也可以是一个模块实现上述的两个模块的功能。又例如，剔除干扰问题对系统200中各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本说明书的保护范围之内。

图3是根据本说明书的一些实施例所示的剔除干扰问题对方法的示例性流程图。如图3所示，该剔除干扰问题对方法300包括：

步骤302，获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对。具体的，步骤302可以由训练模块210执行。

在一些实施例中，可以从线上平台(例如，网站、应用程序等)获取所述至少一个问题对。例如，可以访问网站或者应用程序的智能答复系统内的问题对数据，获取所述至少一个问题对。在一些实施例中，可以直接从存储了大量问题对数据的存储设备中读取所述至少一个问题对。在一些实施例中，还可以采用其他任意方式获取问题对，本实施例不做限制。

所述初始剔除模型可以是指尚未经过训练的剔除模型。所述剔除模型可以指能够根据数据的特征决定哪些数据需要被保留以及哪些数据需要被剔除的一个或多个的模型、算法、神经网络等。在一些实施例中，所述初始剔除模型可以为二分类模型。例如，逻辑回归(Logistic Regression，LR)、支持向量机模型(Support Vector Machine，SVM)等任何可以进行文本剔除的算法或者模型。

在一些实施例中，所述干扰问题对可以是与目标主题不相关的问题对。例如，目标主题是保险行业，则金融行业、医疗行业等其他行业的问题对为所述干扰问题对。

在一些实施例中，将问题对输入初始剔除模型，该模型输出可以是问题对被剔除的概率。例如，被剔除的概率为0.7。文本对是否被剔除可以由被剔除概率决定，例如，剔除概率高于设定阈值(例如，0.5)则被剔除，低于设定阈值则保留。

步骤304，将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果。具体的，步骤304可以由训练模块210执行。

第一问题对可以是指初始剔除模型剔除干扰问题对后所保留的问题对。

匹配模型可以指确定问题对是否匹配的模型，例如，可以根据问题对的语义相似度确定是否匹配。匹配模型是经过训练的模型。关于所述匹配模型的训练方式可以参见图5以及描述，在此不再赘述。

匹配模型类型可以包括但不限于深度语义匹配模型(Deep Structured SemanticModels，DSSM)、卷积神经网络(Convolutional Neural Networks，CNN)、BERT(Bidirectional Encoder Representations from Transformers)、长短期记忆网络(LongShort-Term Memory,LSTM)、增强序列推断模型(Enhanced Sequential Inference Model,ESIM)等任何可以进行文本匹配的算法或者模型。

第一匹配结果是指通过匹配模型确定的第一问题对是否匹配的结果。在一些实施例中，第一匹配结果包括匹配或者不匹配其中的一种。在一些实施例中，第一匹配结果可以基于匹配模型输出匹配概率确定。例如，可以预设阈值(如0.5、0.6等)确定。具体的，若匹配概率大于或等于预设阈值，则第一匹配结果为匹配；若匹配概率小于所预设阈值，第一匹配结果为不匹配。

作为中文文本处理问题，需要先将文字表示成计算机能够运算的数字或向量的形式，再进行处理。在一些实施例中，可以将输入所述匹配模型的所述第一问题对进行向量表示，将所述第一问题对映射为固定长度的向量，从而便于模型处理。例如，可以通过编码器对所述第一问题对进行向量表示。又例如，可以通过词嵌入(Word Embedding)方法，将所述第一问题对表示为同样长度的向量。词嵌入是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中，每个单词或词组被映射为实数域上的向量。所述词嵌入方法可以包括人工神经网络、对词语同现矩阵降维、概率模型以及单词所在上下文的显式表示等。

步骤306，基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值。具体的，步骤306可以由训练模块210执行。

反馈值可以是一种衡量匹配模型的匹配准确率的指标。反馈值越高，代表匹配模型匹配的结果越准确。

如图2所述，匹配模型是基于某个目标主题(例如，保险行业)的样本对进行训练，因此，相比与不属于该目标主题的问题对，训练得到的匹配模型对属于该目标主题的问题对匹配的结果更准确。在问题对输入匹配模型之前，剔除模型先将不属于目标主题的问题对剔除，匹配模型对保留的属于目标主题的问题对进行匹配。因此，剔除模型剔除得越准确，匹配模型匹配得也会越准确，相应的匹配模型的反馈值也越高。例如，若剔除的结果不准确，未将不属于目标主题的问题对剔除，会负向影响匹配模型的匹配准确率，反馈值较低。又例如，若剔除的结果准确，将不属于目标主题的问题对都剔除了，会正向影响匹配模型的匹配准确率，反馈值较高。因此，反馈值不仅可以代表匹配模型的匹配准确程度，还可以间接反映剔除模型的剔除准确率。关于获取所述反馈值的更多描述可以参见图4以及描述，在此不再赘述。

步骤308，根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。具体的，步骤308可以由训练模块210执行。

在一些实施例中，可以根据反馈值调整初始剔除模型的参数，完成初始剔除模型的训练，得到目标剔除模型。具体的，基于初始剔除模型的第一损失函数和反馈值，调整初始剔除模型的参数，当调整后的中间剔除模型当前的损失函数第二损失函数满足第一预设条件，确定当前中间剔除模型为目标剔除模型。

中间剔除模型可以是指初始剔除模型在训练过程中的模型。具体的，可以是通过反馈值和第一损失函数调整初始剔除模型的参数后得到的模型。

第一损失函数可以是用来评价正在训练的模型得到的预测值和样本(例如，问题对)的真实值之间的差距，其中，预测值是指将样本输入正在训练的模型得到的输出值。若模型是剔除模型，该预测值可以是样本需要剔除的概率，如，目标主题是保险行业，问题对“好医保是什么啊”“好医保是一款综合类保险”的被剔除的预测值为0.1。样本的真实值是指样本正确值，如问题对“好医保是什么啊”“好医保是一款综合类保险”的真实值为0，即保留。在一些实施例中，真实值一般可以作为样本的标签一起输入到模型中进行训练。在一些实施例中，可以人工标记样本代表真实值的标签。在一些实施例中，也可以采用其他方式标记标签，本实施例不做限制。

第一损失函数可以包括但不限于均方误差损失函数、交叉熵损失函数、指数损失函数等。

以交叉熵损失函数为例，单个样本(即单个问题对)的第一损失函数为公式(1)，多个样本的第一损失函数是单个样本损失函数的叠加：

H＝-[qlogp+(1-q)log(1-p)] (1)

其中，H为损失函数值，q是指问题需要剔除的真实值，p是指初始剔除模型确定问题对需要剔除的预测概率。

例如，目标主题是保险行业，若将问题对“好医保是什么啊”“好医保是一款综合类保险”输入初始剔除模型，输出的预测值0.1，该问题对需要剔除的真实值为0，则该样本的第一损失函数H＝-[0log0.1+(1-0)log(1-0.1)]。

模型在训练过程中，会不断调整模型的权重(即，模型每层的两个节点连接的权重)，模型的参数会越来越优化，损失函数值会越来越小，输出的预测值结果会越来越接近真实值。模型训练的目标是最小化损失函数。

利用第一损失函数训练初始剔除模型需要标记样本真实值的标签，会增加人工成本和降低工作效率。如前所述，剔除的结果越准确，匹配的结果也会越准确，匹配模型的匹配准确率可以反向反映剔除模型剔除的准确率。因此，可以将衡量匹配模型匹配准确率的指标用于剔除模型的训练。例如：根据匹配模型的准确度判断剔除的准确性，准确性高的可以奖励，准确性低的可以调整。调整可以是调整剔除模型的激励函数、损失函数或者其他参数，在此不一一列举。或者可以根据匹配模型的准确度直接给出样本数据的标签。

在一些实施例中，可以根据匹配模型的准确度调整剔除模型的损失函数。具体的，可以是基于反馈值和第一损失函数确定第二损失函数，基于该第二损失函数训练模型。其中，第二损失函数为中间剔除模型的损失函数，当中间剔除模型的第二损失函数的值达到收敛或者小于预设阈值时，剔除模型训练完成。

在一些实施例中，可以将反馈值代替第一损失函数中的真实值构成第二损失函数。其中，反馈值是基于多个样本得到的匹配模型匹配准确度的指标。关于反馈值计算的更多细节参见图4及其相关描述。

以交叉熵损失函数为例，单个样本的第二损失函数为公式(2)，多个样本的第一损失函数是单个样本损失函数的叠加：

H＝-[alogp+alog(1-p)] (2)

其中，H为损失函数值，a为反馈值，p是指初始剔除模型确定问题对需要剔除的预测概率。

例如，将多个问题对样本输入初始剔除模型(目标主题为保险行业)，然后基于剔除结果将第一问题对输入匹配模型，且得到反馈值0.4。其中，问题对“好医保是什么啊”“好医保是一款综合类保险”的预测值为0.1，将该问题对的第二损失函数为H＝-[0.4log0.1+(1-0.4)log(1-0.1)]。问题对“为什么我支付宝的钱被扣了”“是钱少了吗”的剔除结果预测值为0.9，则该问题对的第二损失函数为H＝-[0.4log0.9+(1-0.4)log(1-0.9)]。该多个问题对的损失函数为所有样本的损失函数的叠加。

在一些实施例中，在调整初始剔除模型的参数(例如，学习率、迭代次数、批次大小等参数)的过程中，当中间剔除模型当前的第二损失函数满足第一预设条件时，可以确定当前中间剔除模型为目标剔除模型。学习率是指在优化算法中更新网络权重的幅度大小。迭代次数是指整个训练集输入神经网络进行训练的次数。批次大小是每一次训练神经网络送入模型的样本数量。在一些实施例中，第一预设条件可以是第二损失函数值收敛。在一些实施例中，第一预设条件还可以是第二损失函数值小于预设阈值(比如0.1、0.01等)。

步骤310，采用所述目标剔除模型剔除目标问题对中的干扰问题对。具体的，该步骤310由剔除模块220执行。

目标剔除模型可以是指对初始剔除模型训练完成后得到的模型。目标问题对可以是指待剔除的问题对。在一些实施例中，可以将目标问题输入目标剔除模型中，得到输出结果，并根据该输出结果确定目标问题对中需要剔除的问题对和需要保留的问题对。

图4是根据本说明书的一些实施例所示的获取反馈值方法的示例性流程图。如图4所示，该获取反馈值方法400包括：

步骤402，判断所述第一问题对中每一个的所述第一匹配结果和所述第二匹配结果是否一致。具体的，步骤402可以由训练模块210执行。

所述第二匹配结果可以指问题对标定的正确匹配结果。例如，对于问题对“好医保是什么啊”“好医保是一款综合类保险”，标定的第二匹配结果为“匹配”。又例如，对于问题对“这款保险保哪些疾病？”“好医保的责任”，其标定的第二匹配结果为“不匹配”。在一些实施例中，可以通过线下人工方式标记问题对的第二匹配结果。

在一些实施例中，可以判断所述第一问题对中每一个的所述第一匹配结果是否与所述第二匹配结果相一致。例如，若所述第一匹配结果为“匹配”，所述第二匹配结果为“不匹配”，则判断结果为不一致。

步骤404，基于所述判断结果，计算所述匹配模型的准确值。具体的，步骤404可以由训练模块210执行。

准确值可以是衡量匹配模型的匹配准确率的指标。准确值越高，则代表匹配模型匹配地越准确。在一些实施例中，可以通过所述第一匹配结果和所述第二匹配结果的判断结果分别为一致和不一致的数量，计算所述匹配模型的准确值。在一些实施例中，准确值可以是F-1分数。

在一些实施例中，准确值还可以是F-0.5、F-2分数。F-0.5、F-1、F-2分数均是综合准确率和召回率的模型综合评价指标。在一些实施例中，准确值还可以是准确率或召回率。召回率是指将正类预测为正类占所有正真的正类的比例，准确率是指所有预测正确的样本占总的样本的比例。

F分数的计算方式如公式(3)：

其中，β为0.5、1、2等参数。

例如，10个问题对，其中实际真正匹配的7个，真正不匹配的3个，匹配模型确定的真正匹配的5个，不匹配的5个。则准确率＝(5+3)/10(0.8)，召回率＝5/7(≈0.71)，

由公式(3)和召回率、准确率的定义可知，匹配模型的准确值为一个0～1的值。

步骤406，将所述准确值确定为所述反馈值。具体的，步骤406可以由训练模块210执行。

准确地将问题对中的干扰问题对剔除，然后将保留的问题对输入到匹配模型中，可以提高匹配模型匹配的准确程度，问题对的剔除结果会影响问题对的匹配结果。因此，匹配模型的准确值可以间接反映剔除模型的剔除准确性。在一些实施例中，可以将匹配模型的准确值作为反馈值去影响剔除模型的训练。

图5是根据本说明书的一些实施例所示的训练匹配模型的示例性流程图。如图5所示，该训练匹配模型500包括：

步骤502，获取多个样本对，所述样本对为问题对。具体的，步骤502可以由训练模块210执行。

所述多个样本对为用于训练匹配模型的问题对，该问题对需要标记问题对中两个文本的真实匹配结果，即第二匹配结果。

步骤504，剔除所述多个样本对中的干扰样本对，将未剔除的第二样本对输入初始匹配模型进行训练，获得所述匹配模型。具体的，步骤504可以由训练模块210执行。

在一些实施例中，可以通过剔除模型(例如，初始剔除模型)对多个样本对中的干扰样本对进行剔除。关于剔除模型的更多细节参见步骤304，此处不再赘述。在一些实施例中，可以基于规则对多个样本进行剔除。在一些实施例中，还可以通过其他方式对所述样本对进行剔除，本实施例不做限制。

第二样本对是指剔除干扰样本对后保留的问题对。在一些实施例中，根据多个样本对中的干扰样本对的剔除结果，将未剔除的第二样本对输入到初始匹配模型中进行训练，训练完成后获得匹配模型。具体的，通过初始匹配模型的损失函数调整初始匹配模型的参数，直到损失函数值收敛或者小于预设阈值，则训练完成。损失函数包括但不限于交叉熵损失函数、均方误差损失函数等。

在一些实施例中，当所述多个样本对全部被剔除时，可以随机选择部分样本输入初始匹配模型。通过该实施例可以防止所有的样本对都被剔除，确保其中有样本可以保留用于训练匹配模型。例如，可以是当所有的样本对均被剔除后，随机保留预设百分比的样本对(比如40％、50％等)。又例如，可以是当所有的样本对均被剔除后，随机保留预设个数的样本对(比如300个、500个等)。

本说明书实施例例还提供一种装置，其至少包括处理器以及存储器。所述存储器用于存储指令。当所述指令被所述处理器执行时，导致所述装置实现前述的剔除干扰问题对的方法。所述方法可以包括：获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。

本说明书实施例还提供一种计算机可读存储介质。所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机实现前述的剔除干扰问题对的方法。所述方法可以包括：获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。

本说明书实施例可能带来的有益效果包括但不限于：(1)本说明书中的实施例通过采用自动化的方式来剔除干扰问题对，可以提高对干扰问题对剔除的效率；(2)通过剔除干扰问题对，可以保留下优质的问题对，从而可以调高模型针对特定业务的表达能力；(3)通过匹配模型的匹配准确率指标训练剔除模型，省去了人工标注剔除模型训练样本的过程，减少了人工成本。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的处理设备或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种剔除干扰问题对的方法，包括：

获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；

将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；

基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；

根据所述反馈值调整所述初始剔除模型，得到目标剔除模型，采用所述目标剔除模型剔除目标问题对中的干扰问题对。

2.如权利要求1所述的方法，所述基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值包括：

判断所述第一问题对中每一个的所述第一匹配结果和所述第二匹配结果是否一致；

基于所述判断结果，计算所述匹配模型的准确值；

将所述准确值确定为所述反馈值。

3.如权利要求2所述的方法，所述准确值为所述匹配模型的F-1分数，所述F-1分数是综合准确率和召回率的模型综合评价指标。

4.如权利要求1所述的方法，所述根据所述反馈值调整所述初始剔除模型，得到目标剔除模型包括：

基于所述初始剔除模型的第一损失函数和所述反馈值，调整所述初始剔除模型的参数，当调整后的中间剔除模型当前的损失函数第二损失函数满足第一预设条件，确定当前中间剔除模型为所述目标剔除模型。

5.如权利要求1所述的方法，所述匹配模型通过以下训练方式获得：

获取多个样本对，所述样本对为问题对；

剔除所述多个样本对中的干扰样本对，将未剔除的第二样本对输入初始匹配模型进行训练，获得所述匹配模型。

6.如权利要求5所述的方法，还包括：

当所述多个样本对全部被剔除时，随机选择部分所述多个样本输入所述初始匹配模型。

7.如权利要求1所述的方法，将输入所述匹配模型的所述问题对进行向量表示。

8.如权利要求1所述的方法，所述初始剔除模型为二分类模型。

9.一种剔除模型的训练方法，包括：

根据所述反馈值调整所述初始剔除模型，得到目标剔除模型。

10.一种剔除干扰问题对的系统，包括：

训练模块，用于获取至少一个问题对，将所述至少一个问题对输入初始剔除模型，剔除所述至少一个问题对中的干扰问题对；所述干扰问题对是指与目标主题不相关的问题对；将所述至少一个问题对中未剔除的第一问题对输入匹配模型，确定所述第一问题对的第一匹配结果；基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始剔除模型，得到目标剔除模型。

剔除模块，用于采用所述目标剔除模型剔除目标问题对中的干扰问题对。

11.如权利要求10所述的系统，所述训练模块还用于：

基于所述判断结果，计算所述匹配模型的准确值；

将所述准确值确定为所述反馈值。

12.如权利要求11所述的系统，所述准确值为所述匹配模型的F-1分数，所述F-1分数是综合准确率和召回率的模型综合评价指标。

13.如权利要求10所述的系统，所述训练模块还用于：

14.如权利要求10所述的系统，所述训练模块还用于：

获取多个样本对，所述样本对为问题对；

15.如权利要求14所述的系统，所述训练模块还用于：

16.如权利要求10所述的系统，所述训练模块还用于：

将输入所述匹配模型的所述问题对进行向量表示。

17.如权利要求10所述的系统，所述初始剔除模型为二分类模型。

18.一种剔除干扰问题对装置，包括至少一个存储介质和至少一个处理器，所述至少一个存储介质用于存储计算机指令；所述至少一个处理器用于执行所述计算机指令以实现如权利要求1～8任一项所述的方法。