CN111460801A

CN111460801A - 标题生成方法、装置及电子设备

Info

Publication number: CN111460801A
Application number: CN202010237236.2A
Authority: CN
Inventors: 陈奇石; 郑烨翰; 彭卫华; 罗雨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-03-30
Filing date: 2020-03-30
Publication date: 2020-07-28
Anticipated expiration: 2040-03-30
Also published as: CN111460801B

Abstract

本申请提出一种标题生成方法、装置及电子设备，属于知识图谱技术领域。其中，该方法包括：获取目标信息及目标信息的原标题；将目标信息的原标题输入标题生成模型，以生成目标信息的第一候选标题；根据目标信息的原标题和标题模板，生成目标信息的第二候选标题；将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。由此，通过这种标题生成方法，通过决策模型将模板方法与模型生成方法相结合，构建出新的标题生成模型，从而不仅提高了标题生成的准确性，而且提高了标题生成的多样性。

Description

标题生成方法、装置及电子设备

技术领域

本申请涉及计算机技术领域，尤其涉及知识图谱技术领域，提出一种标题生成方法、装置及电子设备。

背景技术

无论对于图文文章还是视频，其标题都是吸引人的关键。但标题过长不利于用户进行信息获取，因此对标题进行改写以缩短标题长度，具有广泛的应用场景。

相关技术中，可以通过标题生成模型对标题进行改写。但是，通过这种方式生成的标题准确性较低。

发明内容

提供了一种用于标题生成方法、装置、电子设备及存储介质。

根据第一方面，提供了一种标题生成方法，包括：获取目标信息及所述目标信息的原标题；将所述目标信息原标题输入标题生成模型，以生成所述目标信息的第一候选标题；根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题；以及将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题。

根据第二方面，提供了一种标题生成装置，包括：第一获取模块，用于获取目标信息及所述目标信息的原标题；第一生成模块，用于将所述目标信息输入标题生成模型，以生成所述目标信息的第一候选标题；第二生成模块，用于根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题；以及第三生成模块，用于将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题。

根据第三方面，提供了一种电子设备，其包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如前所述的标题生成方法。

根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行如前所述的标题生成方法。

根据本申请的技术方案，解决了相关技术中，通过标题生成模型对标题进行改写的方式，准确性较低的问题。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为本申请实施例所提供的一种标题生成方法的流程示意图；

图2为本申请实施例所提供的另一种标题生成方法的流程示意图；

图3为本申请实施例所提供的再一种标题生成方法的流程示意图；

图4为本申请实施例提供的一种标题生成装置的结构示意图；

图5为本申请实施例提供的电子设备的结构示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本申请实施例针对相关技术中，通过标题生成模型对标题进行改写的方式，准确性较低的问题，提出一种标题生成方法。

下面参考附图对本申请提供的标题生成方法、装置、电子设备及存储介质进行详细描述。

图1为本申请实施例所提供的一种标题生成方法的流程示意图。

如图1所示，该标题生成方法，包括以下步骤：

步骤101，获取目标信息及目标信息的原标题。

需要说明的是，网络中具有海量的数据，而数据的标题是吸引用户的关键。由于过长的标题不利用用户进行信息获取，因此可以对过长的标题进行改写以缩短标题。

其中，目标信息，可以包括图文文章、音频、视频等类型的文件。需要说明的是，目标信息可以是从用户上传的文件中获取的，也可以是根据获取到的网络请求获取的。实际使用时，对于目标信息的类型和获取途径，本申请实施例不做限定。

在本申请实施例中，本申请实施例的标题生成方法，可以根据目标信息的内容生成短标题，以及对目标信息的长标题进行改写，生成短标题。因此，可以首先获取目标信息及目标信息的原标题。

步骤102，将目标信息输入标题生成模型，以生成目标信息的第一候选标题。

其中，标题生成模型，是指预先训练的可以根据目标信息，生成短标题的模型。

其中，第一候选标题，是指利用标题生成模型对目标信息进行识别处理，生成的目标信息的短标题。

需要说明的是，由于本申请的目标信息的类型可以包括多种数据类型，而标题生成模型可能不能对任意数据类型的目标信息进行直接处理。因此，在利用标题生成模型对目标信息进行处理之前，可以根据标题生成模型可处理的数据类型，对目标信息的数据类型进行转换，以生成标题识别模型可识别的目标信息。

举例来说，所使用的标题生成模型只可以对文档类型的数据进行处理，若目标信息为视频信息，则可以首先将目标信息转换为文档信息，再利用标题生成模型对转换后的目标信息进行识别处理。

在本申请实施例中，可以预先训练可以生成短标题的标题生成模型，进而在获取到目标信息后，将目标信息作为标题生成模型的输入，以使标题生成模型对目标信息进行识别处理，并输出与目标信息对应的短标题，即目标信息的第一候选标题。

作为一种可能的实现方式，标题识别模型可以利用指针生成网络(Pointer-Generator-Network)模型实现。具体的，可以获取大量样本信息作为训练数据，并通过人工方式确定每个样本信息对应的短标题，之后利用短标题对相应的样本信息进行标注，进而将每个样本信息输入Pointer-Generator-Network模型，以生成每个样本信息对应的预测短标题，最后利用每个样本信息对应的预测短标题与标注短标题之间的差异，确定模型的损失值。之后根据模型的损失值对Pointer-Generator-Network模型的参数进行更新，并利用更新后的Pointer-Generator-Network模型继续上述训练过程，直至更新后的模型的损失值处于预设范围，则完成对Pointer-Generator-Network模型的训练，并将最终生成的Pointer-Generator-Network模型作为标题生成模型。

步骤103，根据目标信息的原标题和标题模板，生成目标信息的第二候选标题。

其中，标题模板，是指包括多个待填词分别对应的词性信息的模板。实际使用时，可以对大量短标题进行统计分析，以生成多个标题模板。

在本申请实施例中，还可以通过模板生成方式确定目标信息的原标题对应的短标题，即目标信息的第二候选标题。具体的，可以首先对目标信息的原标题进行切词处理，以确定原标题中包括的各分词，并利用词性识别工具确定原标题中包括的各分词的词性，进而根据标题模板中各待填词的词性及原标题中各分词的顺序，从原标题中包括的各分词中选取词性与待填词的词性相同的分词，填入各待填词在标题模板中对应的位置，以生成原标题的第二候选标题。

举例来说，目标信息的原标题为“张予曦承认与陈柏融分手，三年情断女方称过程甜蜜”，则对原标题进行切词处理，确定的原标题中包括的各分词为：“张予曦”、“承认”、“与”、“程柏融”、“分手”、“三年”、“情断”、“女方”、“称”、“过程”、“甜蜜”，利用词性识别工具确定的各分词对应的词性分别为“nr”、“v”、“c”、“nr”、“v”、“n”、“v”、“n”、“v”、“n”、“a”，其中，“nr”表示人名，“v”表示动词，“c”表示连接词，“n”表示名词、“a”表示形容词。标题模板为“nr_与_nr_v”，则可以将“张予曦”填充至标题模板中第一个填充词的位置，将“程柏融”填充至标题模板中第二个填充词的位置，将“分手”填充至标题模板中第三个填充词的位置，即生成的目标信息的第二候选标题为“张予曦与陈柏融分手”。

步骤104，将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。

其中，决策模型，是指预先训练的可以对输入模型的数据进行筛选的深度学习模型。

在本申请实施例中，由于利用标题生成模型生成的标题准确度较低，利用标题模板生成的标题形式较为单一，因此，可以利用决策模型对第一候选标题与第二候选标题进行挑选，并根据决策模型的输出，从第一候选标题和第二候选标题中挑选出准确度较高的标题作为目标信息的目标标题。

举例来说，假设决策模型的输出包括“0”和“1”，比如，若决策模型的输出为“1”，则表示第一候选标题的准确度较高，从而可以将第一候选标题确定为目标信息的目标标题；若决策模型的输出为“0”，则表示第二候选标题的准确度较高，从而可以将第二候选标题确定为目标信息的目标标题。

需要说明的是，上述举例仅为示例性的，不能视为对本申请的限制。实际使用时，可以根据实际需要预设决策模型的输出与第一候选标题及第二候选标题的对应关系，本申请实施例对此不做限定。

根据本申请实施例的技术方案，通过将目标信息输入标题生成模型，以生成目标信息的第一候选标题，并根据目标信息的原标题和标题模板，生成目标信息的第二候选标题，进而将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。由此，通过决策模型将模板方法与模型生成方法相结合，构建出新的标题生成模型，从而不仅提高了标题生成的准确性，而且提高了标题生成的多样性。

在本申请一种可能的实现形式中，利用标题模板生成目标信息的第二候选标题时，标题模板通常可以有多个，因此可以首先根据原标题的词性信息与标题模板的词性信息，确定与原标题的词性信息匹配度最高的目标标题模板，以提高生成的第二候选标题的准确性。

下面结合图2，对本申请实施例提供的标题生成方法进行进一步说明。

图2为本申请实施例所提供的另一种标题生成方法的流程示意图。

如图2所示，该标题生成方法，包括以下步骤：

步骤201，获取目标信息及目标信息的原标题。

步骤202，将目标信息输入标题生成模型，以生成目标信息的第一候选标题。

上述步骤201-202的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

步骤203，获取每个标题模板中包括的各待填词的词性。

其中，待填词，是指标题模板中包括的仅具有词性信息，并允许在其对应位置填入与其词性相同的分词的词位。

在本申请实施例中，在标题模板有多个时，可以获取每个标题模板中包括的各待填词的词性信息，以根据每个标题模板中包括的各待填词的词性信息确定目标标题模板。

步骤204，对原标题进行切词处理，以确定原标题中包括的各提取词。

在本申请实施例中，可以对目标信息的原标题进行切词处理，确定原标题中包括的各分词，进而根据原标题中包括的各分词，确定原标题中包括的各提取词。

作为一种可能的实现方式，可以将原标题中包括的各分词均确定为提取词。

作为一种可能的实现方式，还可以利用词性识别工具对各分词的词性进行识别处理，并将词性识别工具识别出词性的分词，确定为原标题中包括的提取词。

举例来说，目标信息的原标题为“张予曦承认与陈柏融分手，三年情断女方称过程甜蜜”，则对原标题进行切词处理，确定的原标题中包括的各分词为：“张予曦”、“承认”、“与”、“程柏融”、“分手”、“三年”、“情断”、“女方”、“称”、“过程”、“甜蜜”，利用词性识别工具确定出“张予曦”对应的词性为“nr”，“程柏融”对应的词性为“nr”，“分手”对应的词性为“v”，从而可以确定原标题中包括的各提取词为：“张予曦”、“程柏融”、“分手”。

步骤205，根据每个标题模板中包括的各待填词的词性、及各提取词的词性，确定目标标题模板。

其中，目标标题模板，是指包括的各待填词的词性与原标题中各提取词的词性之间的匹配度最高的标题模板。

作为一种可能的实现方式，可以根据待填词的词性排列顺序与提取词的词性排列顺序，确定目标标题模板。即在本申请实施例一种可能的实现形式中，上述步骤205，可以包括：

确定原标题中包括的各提取词的词性排列顺序；

根据每个标题模板中包括的各待填词的词性排列顺序、及各提取词的词性排列顺序，从多个标题模板中确定目标标题模板。

在本申请实施例中，可以根据各提取词在原标题中的排列顺序，确定各提取词的词性排列顺序，进而根据每个标题模板中包括的各待填词的词性排列顺序与各提取词的词性排列顺序的匹配度，从多个标题模板中确定目标标题模板。具体的，可以将与提取词的词性相同的待填词的数量最多，且顺序一致的标题模板，确定为目标标题模板。

举例来说，原标题包括的提取词为：“张予曦”、“程柏融”、“分手”，则各提取词对应的词性排列顺序为“nr、nr、v”；标题模板1为“nr_与_nr_v”，即标题模板1包括的各待填词对应的词性排列顺序为“nr、nr、v”；标题模板2为“nr_v_n”，即标题模板2包括的各待填词对应的词性排列顺序为“nr、v、n”；标题模板3为“nr_v_nr”，即标题模板3包括的各待填词对应的词性排列顺序为“nr、v、nr”；因此，标题模板1中包括3个与提取词的词性相同的待填词，且各待填词的词性排序顺序与原标题包括的各提取词对应的词性排列顺序一致；标题模板2中包括2个与提取词的词性相同的待填词；标题模板3中包括3个与提取词的词性相同的待填词，但各待填词的词性排序顺序与原标题包括的各提取词对应的词性排列顺序不一致，因此，可以将标题模板1确定为目标标题模板。

步骤206，根据原标题和目标标题模板，生成目标信息的第二候选标题。

在本申请实施例中，确定出目标标题模板之后，可以根据目标标题模板中包括的每个待填词的词性，将与每个待填词的词性相同的提取词填入目标标题模板中，以生成目标信息的第二候选标题。

具体的，上述步骤206，可以包括：

根据目标标题模板中包括的每个待填词的词性，从多个提取词中确定每个待填词对应的目标提取词；

将目标提取词填入与其对应的待填词在目标标题模板中的对应位置，以生成第二候选标题。

其中，目标提取词，是指原标题包括的与目标标题模板中的待填词的词性相同的提取词。

在本申请实施例中，可以根据目标标题模板中包括的每个待填词的词性，从原标题包括的多个提取词中确定与待填词的词性相同的目标提取词，进而将目标提取词填入与其对应的待填词在目标标题模板中的对应位置，以生成第二候选标题。

举例来说，原标题包括的提取词为：“张予曦”、“程柏融”、“分手”，则各提取词对应的词性分别为“nr、nr、v”，目标标题模板为“nr_与_nr_v”，则可以确定目标标题模板中第一个待填词对应的目标提取词为“张予曦”，目标标题模板中第二个待填词对应的目标提取词为“程柏融”，目标标题模板中第三个待填词对应的目标提取词为“分手”，从而可以将“张予曦”填入第一个待填词在目标标题模板中对应的位置，将“程柏融”填入第二个待填词在目标标题模板中对应的位置，将“分手”填入第三个待填词在目标标题模板中对应的位置，即生成的目标信息的第二候选标题为：“张予曦与陈柏融分手”。

步骤207，将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。

其中，决策模型，可以为二分类模型。比如，决策模型可以为卷积神经网络二分类模型。

在本申请实施例中，决策模型可以通过训练生成。即在本申请实施例一种可能的实现形式中，上述步骤207之前，还可以包括：

将样本信息的第一样本标题和第二样本标题输入初始决策模型，以生成第一预测结果；

将第一预测结果发送至审核平台；

接收审核平台的审核结果；

根据第一样本标题、第二样本标题和审核结果，对决策模型进行更新，以生成决策模型。

在本申请实施例中，可以提前获取大量具有长标题的样本信息，并利用标题生成模型确定样本信息的第一样本标题，以及利用标题模板生成方法，确定样本信息的第二样本标题，之后将第一样本标题与第二样本标题输入初始决策模型，以从第一样本标题与第二样本标题中选取准确度较高的标题作为第一预测结果。进而将第一预测结果发送至审核平台进行人工审核，并接收审核平台的审核结果，以利用第一样本标题、第二样本标题与审核结果生成训练数据，进而利用生成的训练数据对初始决策模型进行训练，以生成决策模型。

举例来说，对于一个样本信息，定义第一样本标题为t_m，第二样本标题为t_t；初始决策模型的输出值为1时，表示第一预测结果为第一样本标题；初始决策模型的输出值为0时，表示第一预测结果为第二样本标题；审核结果为0时，表示不采纳第一预测结果；审核结果为1时，表示采纳第一预测结果，训练数据格式为<(t_m,t_t),m-value>。若初始决策模型的输出值为0，审核结果为1，即第一预测结果为第二样本标题，第一预测结果被采纳，则可以确定m-value的取值与初始决策模型的取值相同，即生成的训练数据为<(t_m,t_t),0>；若审核结果为0，即第一预测结果未被采纳，则可以确定m-value的取值与初始决策模型的取值相反，即生成的训练数据为<(t_m,t_t),1>；同理，在初始决策模型的输出值为1时，可以采用相同的方式确定m-value取值。

在本申请实施例中在生成每个样本信息对应的训练数据之后，可以利用初始决策模型对每个训练数据进行识别处理，以生成每个训练数据对应的第二预测结果，进而根据每个训练数据对应的第二预测结果与m-value值的差异，确定初始决策模型的损失值，并根据损失值对初始决策模型的参数进行更新。之后利用更新后的决策模型继续对每个训练数据进行识别处理，直至更新后的决策模型的损失值处于预设范围，则完成对决策模型的训练过程。

上述步骤207的其他具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

根据本申请实施例的技术方案，通过将目标信息输入标题生成模型，以生成目标信息的第一候选标题，并获取每个标题模板中包括的各待填词的词性，以及对原标题进行切词处理，以确定原标题中包括的各提取词，之后根据每个标题模板中包括的各待填词的词性、及各提取词的词性，确定目标标题模板，进而根据原标题和目标标题模板，生成目标信息的第二候选标题，最后将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。由此，通过根据每个标题模板中包括的各待填词的词性、及各提取词的词性，确定目标标题模板，以通过模板生成方式对原标题进行改写，并通过决策模型将模板方法与模型生成方法相结合，构建出新的标题生成模型，从而不仅提高了标题生成的多样性，而且进一步提高了标题生成的准确性。

在本申请一种可能的实现形式中，由于通过标题模板生成的第二候选标题为文字信息，因此在输入决策模型之前，可以首先对第二候选标题进行编码处理。

下面结合图3，对本申请实施例提供的标题生成方法进行进一步说明。

图3为本申请实施例所提供的再一种标题生成方法的流程示意图。

如图3所示，该标题生成方法，包括以下步骤：

步骤301，获取目标信息及目标信息的原标题。

步骤302，将目标信息的原标题输入标题生成模型，以生成目标信息的第一候选标题。

步骤303，根据目标信息的原标题和标题模板，生成目标信息的第二候选标题。

上述步骤301-303的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

步骤304，对第二候选标题进行BERT编码。

在本申请实施例中，由于决策模型无法直接处理文字信息，因此，可以对第二候选标题进行BERT(Bidirectional Encoder Representation from Transformers，来自变换器的双向编码器表示)编码，以生成第二候选标题对应的向量表示。

步骤305，将第一候选标题对应的隐状态向量与第二候选标题对应的BERT编码，输入决策模型，以生成目标信息的目标标题。

在本申请实施例中，由于第一候选标题是通过标题生成模型生成的，而第一候选标题在标题生成模型中对应的隐状态向量，即为第一候选标题的向量表示；若对第一候选标题或第一候选标题对应的一状态向量进行进一步编码处理，反而会导致第一候选标题的信息丢失。因此，可以将第一候选标题对应的隐状态向量与第二候选标题对应的BERT编码输入决策模型，以使决策模型对第一候选标题对应的隐状态向量与第二候选标题对应的BERT编码进行识别处理，生成目标信息的目标标题。

根据本申请实施例的技术方案，通过将目标信息输入标题生成模型，以生成目标信息的第一候选标题，并根据目标信息的原标题和标题模板，生成目标信息的第二候选标题，之后对第二候选标题进行BERT编码，进而将第一候选标题对应的隐状态向量与第二候选标题对应的BERT编码输入决策模型，以生成目标信息的目标标题。由此，通过决策模型将模板方法与模型生成方法相结合，构建出新的标题生成模型，从而不仅提高了标题生成的多样性，而且进一步提高了标题生成的准确性。

为了实现上述实施例，本申请还提出一种标题生成装置。

图4为本申请实施例提供的一种标题生成装置的结构示意图。

如图4所示，该标题生成装置40，包括：

第一获取模块41，用于获取目标信息及目标信息的原标题；

第一生成模块42，用于将目标信息的原标题输入标题生成模型，以生成目标信息的第一候选标题；

第二生成模块43，用于根据目标信息的原标题和标题模板，生成目标信息的第二候选标题；以及

第三生成模块44，用于将第一候选标题和第二候选标题输入决策模型，以生成目标信息的目标标题。

在实际使用时，本申请实施例提供的标题生成装置，可以被配置在任意电子设备中，以执行前述标题生成方法。

在本申请一种可能的实现形式中，上述标题生成装置40，还包括：

第二获取模块，用于获取每个标题模板中包括的各待填词的词性；

切词模块，用于对原标题进行切词处理，以确定原标题中包括的各提取词；

确定模块，用于根据每个标题模板中包括的各待填词的词性、及各提取词的词性，确定目标标题模板；

相应的，上述第二生成模块43，包括：

第一生成单元，用于根据原标题和目标标题模板，生成目标信息的第二候选标题。

进一步的，在本申请另一种可能的实现形式中，上述生成单元，包括：

确定子单元，用于根据目标标题模板中包括的每个待填词的词性，从多个提取词中确定每个待填词对应的目标提取词；以及

生成子单元，用于将目标提取词填入与其对应的待填词在目标标题模板中的对应位置，以生成第二候选标题。

进一步的，在本申请再一种可能的实现形式中，上述确定模块，包括：

第一确定单元，用于确定原标题中包括的各提取词的词性排列顺序；

第二确定单元，用于根据每个标题模板中包括的各待填词的词性排列顺序、及各提取词的词性排列顺序，从多个标题模板中确定目标标题模板。

进一步的，在本申请又一种可能的实现形式中，上述标题生成装置40，还包括：

编码模块，用于对第二候选标题进行BERT编码；

相应的，上述第三生成模块44，包括：

第二生成单元，用于将第一候选标题对应的隐状态向量与第二候选标题对应的BERT编码，输入决策模型，以生成目标信息的目标标题。

进一步的，在本申请又一种可能的实现形式中，上述决策模型为二分类模型。

进一步的，在本申请另一种可能的实现形式中，上述标题生成装置40，还包括：

第四生成模块，用于将样本信息的第一样本标题和第二样本标题输入初始决策模型，以生成第一预测结果；

发送模块，用于将第一预测结果发送至审核平台；

接收模块，用于接收审核平台的审核结果；

更新模块，用于根据第一样本标题、第二样本标题和审核结果，对决策模型进行更新，以生成决策模型。

需要说明的是，前述对图1、图2、图3所示的标题生成方法实施例的解释说明也适用于该实施例的标题生成装置40，此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图5所示，是根据本申请实施例的标题生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示，该电子设备包括：一个或多个处理器501、存储器502，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个电子设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。

存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的标题生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的标题生成方法。

存储器502作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的标题生成方法对应的程序指令/模块(例如，附图4所示的第一获取模块41、第一生成模块42、第二生成模块43及第三生成模块44)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的标题生成方法。

存储器502可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据标题生成方法的电子设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器502可选包括相对于处理器501远程设置的存储器，这些远程存储器可以通过网络连接至标题生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

标题生成方法的电子设备还可以包括：输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接，图5中以通过总线连接为例。

输入装置503可接收输入的数字或字符信息，以及产生与标题生成方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种标题生成方法，其特征在于，包括：

获取目标信息及所述目标信息的原标题；

将所述目标信息输入标题生成模型，以生成所述目标信息的第一候选标题；

根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题；以及

将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题。

2.如权利要求1所述的方法，其特征在于，所述根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题之前，还包括：

获取每个标题模板中包括的各待填词的词性；

对所述原标题进行切词处理，以确定所述原标题中包括的各提取词；

根据每个标题模板中包括的各待填词的词性、及所述各提取词的词性，确定目标标题模板；

所述根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题，包括：

根据所述原标题和所述目标标题模板，生成所述目标信息的第二候选标题。

3.如权利要求2所述的方法，其特征在于，所述根据所述原标题和所述目标标题模板，生成所述目标信息的第二候选标题，包括：

根据所述目标标题模板中包括的每个待填词的词性，从所述多个提取词中确定每个待填词对应的目标提取词；以及

将所述目标提取词填入与其对应的待填词在所述目标标题模板中的对应位置，以生成所述第二候选标题。

4.如权利要求2所述的方法，其特征在于，所述根据每个标题模板中包括的各待填词的词性、及所述各提取词的词性，确定目标标题模板，包括：

确定所述原标题中包括的各提取词的词性排列顺序；

根据每个标题模板中包括的各待填词的词性排列顺序、及所述各提取词的词性排列顺序，从多个标题模板中确定所述目标标题模板。

5.如权利要求1-4任一所述的方法，其特征在于，所述根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题之后，还包括：

对所述第二候选标题进行来自变换器的双向编码器表示BERT编码；

所述将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题，包括：

将所述第一候选标题对应的隐状态向量与所述第二候选标题对应的BERT编码，输入所述决策模型，以生成所述目标信息的目标标题。

6.如权利要求1-4任一所述的方法，其特征在于，所述决策模型为二分类模型。

7.如权利要求6所述的方法，其特征在于，所述将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题之前，还包括：

将所述第一预测结果发送至审核平台；

接收所述审核平台的审核结果；

根据所述第一样本标题、所述第二样本标题和所述审核结果，对所述决策模型进行更新，以生成所述决策模型。

8.一种标题生成装置，其特征在于，包括：

第一获取模块，用于获取目标信息及所述目标信息的原标题；

第一生成模块，用于将所述目标信息输入标题生成模型，以生成所述目标信息的第一候选标题；

第二生成模块，用于根据所述目标信息的原标题和标题模板，生成所述目标信息的第二候选标题；以及

第三生成模块，用于将所述第一候选标题和所述第二候选标题输入决策模型，以生成所述目标信息的目标标题。

9.如权利要求8所述的装置，其特征在于，还包括：

切词模块，用于对所述原标题进行切词处理，以确定所述原标题中包括的各提取词；

确定模块，用于根据每个标题模板中包括的各待填词的词性、及所述各提取词的词性，确定目标标题模板；

所述第二生成模块，包括：

第一生成单元，用于根据所述原标题和所述目标标题模板，生成所述目标信息的第二候选标题。

10.如权利要求9所述的装置，其特征在于，生成单元，包括：

确定子单元，用于根据所述目标标题模板中包括的每个待填词的词性，从所述多个提取词中确定每个待填词对应的目标提取词；以及

生成子单元，用于将所述目标提取词填入与其对应的待填词在所述目标标题模板中的对应位置，以生成所述第二候选标题。

11.如权利要求9所述的装置，其特征在于，所述确定模块，包括：

第一确定单元，用于确定所述原标题中包括的各提取词的词性排列顺序；

第二确定单元，用于根据每个标题模板中包括的各待填词的词性排列顺序、及所述各提取词的词性排列顺序，从多个标题模板中确定所述目标标题模板。

12.如权利要求8-11任一所述的装置，其特征在于，还包括：

编码模块，用于对所述第二候选标题进行BERT编码；

所述第三生成模块，包括：

第二生成单元，用于将所述第一候选标题对应的隐状态向量与所述第二候选标题对应的BERT编码，输入所述决策模型，以生成所述目标信息的目标标题。

13.如权利要求8-11任一所述的装置，其特征在于，所述决策模型为二分类模型。

14.如权利要求13所述的装置，其特征在于，还包括：

发送模块，用于将所述第一预测结果发送至审核平台；

接收模块，用于接收所述审核平台的审核结果；

更新模块，用于根据所述第一样本标题、所述第二样本标题和所述审核结果，对所述决策模型进行更新，以生成所述决策模型。

15.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。