CN117216271A

CN117216271A - 一种文章文本处理方法、装置以及设备

Info

Publication number: CN117216271A
Application number: CN202311181820.0A
Authority: CN
Inventors: 毕健旗; 黄修添; 钟昊翔; 白冰
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2023-12-12

Abstract

本说明书实施例公开了一种文章文本处理方法、装置以及设备。方案包括：获取自动生成的文章文本；将所述文章文本按句拆分，得到相应的多个句子文本；确定根据大语言模型获得的一个或多个第一检测模型，以及根据命名实体识别模型获得的第二检测模型；利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，其中，针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同；若确定所述句子文本存在质量问题，则利用所述第二检测模型，对存在质量问题的所述句子文本继续检测，以确定所述质量问题出现的具体位置；输出所得到的检测结果。

Description

一种文章文本处理方法、装置以及设备

技术领域

本说明书涉及文本处理技术领域，尤其涉及一种文章文本处理方法、装置以及设备。

背景技术

随着互联网技术的迅速发展和智能终端的使用普及，很多以往的业务都可以依托于智能终端上的应用线上进行，不仅如此，还涌现出了不少新业务。

比如，开放端文章文本自动生成的业务，比如，故事文本自动生成，故事比如是童话故事、网文故事等。需要说明的是，开放端文章文本自动生成，是自然语言生成中非常重要但极具挑战性的任务，这里的开放端是指输入中仅仅包含生成目标输出所需的少量信息，比如，故事生成的标题、简要内容等。相对地，机器翻译、文本摘要这类生成任务则属于非开放端生成。

目前，对于以故事文本自动生成为代表的开放端文章文本自动生成，在实际应用中，所生成的文章文本的质量参差不齐，用这些文章文本作为服务内容对外提供时，可能影响用户体验，进而可能导致无谓的资源浪费，既包括服务上的处理资源浪费，也包括用户的精力金钱资源浪费。

基于此，需要有助于提高开放端文章文本自动生成业务下，所生成的文本的质量，以提高用户体验，避免资源浪费的方案。

发明内容

本说明书一个或多个实施例提供一种文章文本处理方法、装置、设备以及存储介质，用以解决如下技术问题：需要有助于提高开放端文章文本自动生成业务下，所生成的文本的质量，以提高用户体验，避免资源浪费的方案。

为解决上述技术问题，本说明书一个或多个实施例是这样实现的：

本说明书一个或多个实施例提供的一种文章文本处理方法，包括：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

确定根据大语言模型获得的一个或多个第一检测模型，以及根据命名实体识别模型获得的第二检测模型；

利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，其中，针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同；

若确定所述句子文本存在质量问题，则利用所述第二检测模型，对存在质量问题的所述句子文本继续检测，以确定所述质量问题出现的具体位置；

输出所得到的检测结果。

可选地，所述利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，具体包括：

利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本，以确定所述句子文本中是否存在预先定义的质量问题；

利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本，以确定所述文章文本整体是否存在预先定义的质量问题，以及所存在的所述质量问题的细节。

可选地，所述利用所述一个或多个第一检测模型中的至少一个模型分别检测各所述句子文本，具体包括：

利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本是否存在以下至少一种预先定义的质量问题：

不良引导、事实性错误、主人公不一致、用词不当、逻辑不通顺。

可选地，所述利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本，具体包括：

利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本是否存在以下至少一种预先定义的质量问题：

情节重复、故事跑题、逻辑不通顺。

可选地，所述输出所得到的检测结果之前，所述方法还包括：

确定根据大语言模型获得的第三检测模型；

利用所述第三检测模型，检测所述文章文本，以确定所述文章文本是否存在以下至少一种预先定义的质量优点：

情节吸引人、有教育意义。

可选地，所述文章文本为故事文本。

本说明书一个或多个实施例提供的一种文章文本处理装置，包括：

文章文本获取模块，获取自动生成的文章文本；

文章分句处理模块，将所述文章文本按句拆分，得到相应的多个句子文本；

检测模型确定模块，确定根据大语言模型获得的一个或多个第一检测模型，以及根据命名实体识别模型获得的第二检测模型；

多种粒度检测模块，利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，其中，针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同；

问题位置检测模块，若确定所述句子文本存在质量问题，则利用所述第二检测模型，对存在质量问题的所述句子文本继续检测，以确定所述质量问题出现的具体位置；

检测结果输出模块，输出所得到的检测结果。

本说明书一个或多个实施例提供的一种文章文本处理设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。

本说明书一个或多个实施例提供的一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。

本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果：能够对开放端自动生成的文章文本进行不同粒度的划分，包括句子粒度，以及诸如文章整体或段落等更粗的粒度，适应于不同的粒度的特点对应定义了待检测的不同的质量问题，基于大语言模型的至少部分能力，分别针对文章文本的不同粒度进行质量问题检测，若发现存在质量问题，还可以进一步地基于命名实体识别模型的至少部分能力，具体定位质量问题出现的具体位置，从而能够给出可靠、准确、具体且可解释性强的质量检测结果，根据质量检测结果有助于改善开放端自动生成的文章文本的质量，避免为用户提供质量不够好的文章文本，避免了服务商和用户资源浪费；不仅如此，还特别针对开放端自动生成的故事文本的应用场景，提供了不同检测粒度下适合使用的不同的质量问题，从而能够自动生成更适合用户尤其是未成年人观看的优秀的故事文本。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例提供的一种文章文本处理方法的流程示意图；

图2为本说明书一个或多个实施例提供的一种播放自动生成的小故事的播放器界面示意图；

图3为本说明书一个或多个实施例提供的故事文本自动生成的业务场景下进行的一种质量控制方案的流程示意图；

图4为本说明书一个或多个实施例提供的一种实际应用场景下，针对自动生成的文章文本定义故事文本可检测的质量问题和质量优点的示意图；

图5为本说明书一个或多个实施例提供的一种实际应用场景下，在不同粒度下，具体如何在图1的方案中检测这些质量问题的流程示意图；

图6为本说明书一个或多个实施例提供的针对故事文本自动生成的业务场景，基于大语言模型生成第一检测模型的流程示意图；

图7为本说明书一个或多个实施例提供的故事文本自动生成的业务场景下，图1的方法一种实施方案的流程示意图；

图8为本说明书一个或多个实施例提供的一种文章文本处理装置的结构示意图；

图9为本说明书一个或多个实施例提供的一种文章文本处理设备的结构示意图。

具体实施方式

本说明书实施例提供一种文章文本处理方法、装置、设备以及存储介质。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

针对背景技术提出的问题。以开放端故事文本自动生成为例，进一步分析。

故事书籍作为娱乐、教育和智慧启发的一种媒体形式，已经成为世界各国文化的一个重要组成部分。开放端故事文本生成的研究具有重要意义，首先，探索文字内容创作的内在机理能够助力实现掌握语言智能的类人人工智能；其次，开放端长文本生成在娱乐、教育、人机交流等方面也有重要的应用价值。

申请人在实际工作中具体涉及了开放端长童话故事(比如，800～1000字长度)文本自动生成的业务场景，为保证生成的长童话故事的质量、避免人工质量检测产生低效率高成本的问题，亟需基于大模型实现对开放端长童话故事文本生成结果的质量检测。

申请人发现，面对场景复杂的开放端长童话故事文本生成质量检测需求，自己以往尝试过的一些非开放端文本生成质量检测方案适用性并不高，难以得到可靠的不同粒度的检测结果，而且也适用于该场景的较为完整的可检测质量问题体系。为了解决这些问题，申请人不仅提供了针对开放端自动自动生成的文章文本的质量检测方案，还进一步提出了更适用于长童话故事文本生成场景的可检测质量问题体系，以配合该质量检测方案使用。

下面基于这样的总体构思，继续详细说明本申请的方案。

图1为本说明书一个或多个实施例提供的一种文章文本处理方法的流程示意图。该流程比如可以由应用的前端(比如，智能手机、平板电脑等)或后端(比如，应用服务器等)等设备来执行。该流程中涉及的中间结果(比如，分句结果、质量问题是否存在的初步检测结果、质量问题定位信息等)也可以允许人工干预，以提高最终的质量检测结果的准确性。

图1中的流程包括以下步骤：

S102：获取自动生成的文章文本。

在本说明书一个或多个实施例中，可以由当前的执行主体或其他主体预先生成文章文本。比如，可以预先向相应的主体输入提示生成内容目标的短文本，则该主体接收该短文本，之后通过指定的生成模型处理该短文本，按照该生成内容目标，自动生成长度长于甚至远长于该短文本的文章文本。前面提到的开放端文章文本的自动生成一般是符合该例的。

在这种情况下，短文本可以是用户主体提供或机器默认提供的对拟生成的文章文本的内容进行概括性说明的限定词、短语或短句等信息，期望接下来自动生成的文章文本尽量符合这些概括性说明。而所生成的文章文本相比于该短文本则具体得多，单纯以字数为例，比如，短文本可能只有几个、十几个乃至几十个字，而所生成的文章文本可能有几百、上千乃至更多个字。

图2为本说明书一个或多个实施例提供的一种播放自动生成的小故事的播放器界面示意图，图中屏蔽了部分内容，不影响对本申请的方案的理解。在图2的场景下，小故事的故事文本是自动生成的，并且还将自动生成的故事文本进一步转换为音频，以便通过该播放器播放出来。在该页面中，有“小故事名称”和“故事梗概”这两个信息标签，在一种应用场景下，可以支持用户在这两个标签下输入信息，作为提示生成内容目标的短文本，则该播放器所在的应用可以根据“小故事名称”和“故事梗概”中用户输入的提示信息，自动生成故事文本。

例如，用户输入的提示信息比如包括“针对流浪猫和松鼠生成一篇故事”，则生成的故事文本比如包括“一只美丽的流浪猫常常在角落里孤独地待着，他看起来非常寂寞，因为没有主人照顾他，有一天，他在公园里遇到了一只站在滑板上的松鼠非常好奇，他朝着流浪猫跑来跑去，看起来很感兴趣……”。

S104：将所述文章文本按句拆分，得到相应的多个句子文本。

在本说明书一个或多个实施例中，每个句子文本即对应于一个句子，可以只选择文章文本中的一部分句子文本分别进行检测，比如，识别出内容足够复杂或长度足够长的句子文本，进行检测。

S106：确定根据大语言模型获得的一个或多个第一检测模型，以及根据命名实体识别(Named Entity Recognition，NER)模型获得的第二检测模型。

在本说明书一个或多个实施例中，在有多个第一检测模型的情况下，这多个第一检测模型可以采用相同或相似的模型结构，但采用不同的训练样本进行训练，以便分别用于不同类的具体检测对象。大语言模型比如采用ChatGLM-6B、LLaMa-ch、baichuan-7b或其他具有类似能力的模型。

第一检测模型可以直接采用某种大语言模型本身，或者基于大语言模型本身或其原理修改得到的模型。第二检测模型可以直接采用某种命名实体识别模型本身，或者基于命名实体识别模型本身或其原理修改得到的模型。

S108：利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，其中，针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同。

在本说明书一个或多个实施例中，为了提高对不同的质量问题的检测针对性、敏感性和可靠性，预先训练了多个不同的第一检测模型，则用于检测句子文本的第一检测模型，与用于检测文章文本的第一检测模型，不是同一个模型。

本申请尤其提供了更适用于故事文本生成场景的可检测质量问题体系，其中定义了多个质量问题。

比如，定义了不良引导、事实性错误、主人公不一致、情节重复、故事跑题等质量问题。其中，对于童话故事文本生成场景，由于所生成的文本很可能是面向未成年人的，因此，尤其可以关注不良引导这个质量问题。定义质量问题时具体可以包括定义相应的模型分类判定类别标签、判定阈值、训练样本标准等，以便于检测模型针对对应的质量问题进行训练和实际推理。

可以分别预先设置每个质量问题对应的检测粒度，从而，有助于在不同粒度下对于对应的质量问题能够获得相对更高的检测准确性。

在本说明书一个或多个实施例中，划分出两个或更多个粒度。其中一个是句子粒度(称为细粒度)，通过对句子文本的检测来反映，比如相对更适用检测一些细致的、界限较明确、争议性较小的质量问题；其他的是比句子粒度更粗的粒度(称为粗粒度)，比如，文章整体粒度、文章段落粒度等，通过对文章文本的检测来反映，比如相对更适用检测一些有碍于整体体验、界限较灵活、争议性较大的质量问题。

对于故事文本，尤其是童话文本而言，细粒度检测针对的质量问题可能会影响未成年人的客观认知(比如，知识、价值观方面的)、粗粒度检测针对的质量问题可能会影响未成年人对故事文本的兴趣。因此，本申请划分的多粒度，与相应设置的适应于对应粒度的质量问题，尤其能够在开放端故事文本自动生成的业务中发挥优势，更好地适应了该业务相对于其他类型的文本的业务的特点区别。以非开放端的文本翻译业务为例，这种业务基本只关注不同语言之间映射的正确性，而无需考虑兴趣、客观认知等方面的质量要求。

S110：若确定所述句子文本存在质量问题，则利用所述第二检测模型，对存在质量问题的所述句子文本继续检测，以确定所述质量问题出现的具体位置。

在本说明书一个或多个实施例中，利用第一检测模型可以粗判断出文章文本或具体的某个句子文本中存在质量问题，进而可以对存在质量问题的句子文本或文章文本整体继续检测，以确定所述质量问题出现的具体位置。

不过，本申请还有更多的考虑，具体包括：对于属于粗粒度的文章文本整体或段落文本，其内容通常远多于单个句子文本，在这种情况下，若也采用第二检测模型对存在质量问题的这些粗粒度内容也继续检测，那么可能带来两类不利效果：第一类是，检测所耗费的资源明显增加，效率明显降低；第二类是，对于文章文本整体或段落文本存在整体性更强的质量问题而言，反而不适当地定位到过于细碎的局部位置上，而所定位(未必能全部定位出来)出的一个或多个局部位置合起来可能又不足以完整导致该整体性的质量问题的发生，从而所检测得到的质量问题出现的具体位置可能反作用地带来误导，则不利于准确且精确地理解和修正该整体性的质量问题。

基于这样的考虑，通过第一检测模型分别检测各句子文本，若确定句子文本存在预先定义的质量问题，则通过第一检测模型输出对于该句子文本较为简洁的检测结果，并利用第二检测模型，继续检测该句子文本，以确定质量问题在该句子文本中出现的具体位置(比如，某个词)，作为第二检测模型输出的检测结果；以及，通过第一检测模型更粗粒度地对文章文本整体或段落文本进行检测，若确定文章文本整体或段落文本存在预先定义的质量问题，则通过第一检测模型输出对相对更详细的检测结果(可以通过不同的第一检测模型的差异化训练实现)，但是，不利用第二检测模型对该文章文本整体或段落文本继续检测。也即，对于第一检测模型检测出文章文本存在质量问题的情况下，相比于第一检测模型检测出单个句子文本存在质量问题的情况下，能够获得第一检测模型输出的细节内容相对更多(比如，更整体性地描述分析该质量问题在文章文本中对应的较多内容，而不是仅定位至个别词)的检测结果。如此，避免了带来上面的两类不利效果，有助于获得对应的有利效果。

S112：输出所得到的检测结果。

在本说明书一个或多个实施例中，将第一检测模型输出的检测结果和/或第二检测模型输出的检测结果输出。

进一步地，基于检测结果可以控制是否将生成的文章文本对外提供给用户，另外，还可以用于指导用于自动生成文章文本的优化。直观地，本说明书一个或多个实施例提供了故事文本自动生成的业务场景下进行的一种质量控制方案的流程示意图，参见图3。

在图3中，包括两部分流程，左边部分是对自动生成的故事文本是否提供给用户的控制流程，可以在线执行，右边部分是对故事文本自动生成模型是否上线的控制流程，可以离线执行。其中，都使用了上述检测自动生成的文章文本是否存在质量问题的方案。

左边部分的流程，包括以下步骤：获取预先训练过的故事文本生成模型，需要故事文本的用户，根据自己的具体需求提示生成目标(向模型输入少量信息)，以表明需要怎样的故事文本；故事文本生成模型则根据该生成目标，自动生成故事文本；利用图1中的方案，对该故事文本进行质量检测，以检测故事文本质量是否符合要求；若否，则暂时不透出给用户，避免影响用户体验，可以通过故事文本生成模型尝试重新生成故事文本；若是，则将当前的故事文本透出给用户，以便用户使用。

右边部分的流程包括以下步骤：利用训练样本数据集，对故事文本生成模型进行训练和迭代；利用故事文本生成模型自动生成故事文本，用于检测故事文本生成模型当前是否已符合预期；利用图1中的方案，对这些故事文本进行质量检测，以判定故事文本生成模型当前是否已符合预期；若否，则继续对故事文本生成模型进行训练和迭代，以进一步优化模型；若是，则将故事文本生成模型上线更正式地用于业务中。

通过图1的方法，能够对开放端自动生成的文章文本进行不同粒度的划分，包括句子粒度，以及诸如文章整体或段落等更粗的粒度，适应于不同的粒度的特点对应定义了待检测的不同的质量问题，基于大语言模型的至少部分能力，分别针对文章文本的不同粒度进行质量问题检测，若发现存在质量问题，还可以进一步地基于命名实体识别模型的至少部分能力，具体定位质量问题出现的具体位置，从而能够给出可靠、准确、具体且可解释性强的质量检测结果，根据质量检测结果有助于改善开放端自动生成的文章文本的质量，避免为用户提供质量不够好的文章文本，避免了服务商和用户资源浪费；不仅如此，还特别针对开放端自动生成的故事文本的应用场景，提供了不同检测粒度下适合使用的不同的质量问题，从而能够自动生成更适合用户尤其是未成年人观看的优秀的故事文本。

基于图1的方法，本说明书还提供了该方法的一些具体实施方案和扩展方案，下面继续进行说明。

在本说明书一个或多个实施例中，除了检测质量问题以外，还可以反向地检测是否存在质量优点，如此能够更客观完整地评价自动生成的文章文本的质量，而且有助于高效甄选出更优的文章文本，尤其是在用户对质量问题容忍程度较高的情况下，质量优点能够得到用户更多的关注。

基于此，在输出所得到的检测结果之前，还可以确定根据大语言模型获得的第三检测模型，利用第三检测模型，检测文章文本，以确定文章文本是否存在预先定义的质量优点，以及还可以分析质量优点的细节。

对于质量优点和质量问题，更直观地，本说明书一个或多个实施例还提供了一种实际应用场景下，针对自动生成的文章文本定义故事文本可检测的质量问题和质量优点的示意图，参见图4。这些质量问题和质量优点尤其对童话文本自动生成的业务场景的适用性较好。

在图4中，质量优点有两个，在检测质量时作为加分项，分别为：“有教育意义”、“情节吸引人”。质量问题有七个，在检测质量时作为减分项，分别为：划分为1级表示属于不可接受的质量问题的“不良引导”、“事实性错误”；划分为2级表示属于不是完全不可接受的质量问题的“故事跑题”、“主人公不一致”；划分为3级表示属于不是完全不可接受的占比比较高的质量问题的“逻辑不通顺”、“情节重复”；划分为4级相对轻微的质量问题的“用词不当”。

基于示例性定义的这些这些质量问题，本说明书一个或多个实施例还提供了一种实际应用场景下，在不同粒度下，具体如何在图1的方案中检测这些质量问题的流程示意图，参见图5。

S502：利用根据大语言模型获得的一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本是否存在以下至少一种预先定义的质量问题：不良引导、事实性错误、主人公不一致、用词不当、逻辑不通顺。

S504：利用根据大语言模型获得的一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本是否存在以下至少一种预先定义的质量问题：情节重复、故事跑题、逻辑不通顺。

在这里，将童话故事文本的质量检测任务拆分成作为细粒度的句子、作为粗粒度的文章整体/段落，这两大类粒度来处理。对于减分项中的不良引导、事实性错误、主人公不一致、用词不当等质量问题，将按照句子粒度来检测处理，原因在于这四种质量问题偏向于精确的局部存在；对于减分项中的情节重复、故事跑题将按照文章整体/段落粒度来处理，原因在于这两种质量问题偏向于大范围或整体存在。逻辑不通顺由于概念特殊性，既需要细粒度又需要粗粒度的检测处理。

S506：利用根据大语言模型获得的第三检测模型；利用所述第三检测模型，检测所述文章文本，以确定所述文章文本是否存在以下至少一种预先定义的质量优点：情节吸引人、有教育意义。

对于面向未成年人的童话故事而言，尤其要重点检测不良引导这个质量问题，以及清洁吸引人这个质量优点。

需要说明的是，这些质量问题、质量优点的定义和划分，以及所设置的它们分别与不同粒度检测处理之间的对应关系是示例性的。在实际应用中，还可以按照上面分析的思路和原理，对它们重新调整。

在本说明书一个或多个实施例中，为了提高检测效率，以更好地在线应用，通过对大语言模型进行针对性的简化，得到第一检测模型。具体地，本说明书一个或多个实施例提供了针对故事文本自动生成的业务场景，基于大语言模型生成第一检测模型的流程示意图，参见图6。

图6中的流程包括以下步骤：

S602：在确定根据大语言模型获得的第一检测模型之前，利用所述故事样本文本和所述非故事样本文本，在指定的大语言模型中进行推理和训练。

若具体到童话故事样本的场景下，则非故事样本文本具体可以采用非童话故事样本，如此，便于后续训练后对于面向未成年人的故事文本更为敏感，有助于从保护未成年人这个角度进行更精准的质量检测。

S604：根据训练迭代的推理结果，探测所述指定的大语言模型中的参数对所述非故事样本文本相比于对所述故事样本文本的敏感程度差距。

S606：从所述敏感程度差距足够高的参数集合中获取至少部分参数。

需要说明的是，在算力能力较低或对效率要求较高的情况下，也未必要如此精选这部分参数，也可以考虑采用其他的方式更简单地获取指定的大语言模型的至少部分参数，比如，随机选择、或者选择模型训练迭代过程中变化相对小的参数，等等。

S608：通过将所述至少部分参数转换为低精度重新保存，生成对应于所述大语言模型的简化模型，作为第一检测模型。

如此生成的第一检测模型能够提高检测效率，而且又尽量保留了大语言模型对于故事样本文本能够具有的敏感能力。

类似地，也可以先确定上述敏感程度足够低的参数集合，然后从该参数集合之外获取部分参数转换为低精度重新保存。

根据以上说明，本说明书一个或多个实施例还提供了故事文本自动生成的业务场景下，图1的方法一种实施方案的流程示意图，参见图7。

该方案分为可并行执行的两部分，分别为句子粒度质量检测部分、文章整体/段落质量检测部分。比如采用ChatGLM-6B模型作为上述的第一检测模型和第三检测模型，采用NER模型作为上述的第二检测模型。

以童话故事文本为例。在句子粒度质量检测部分中，对于一篇输入的童话故事文本，首先按照句子维度进行拆分，再将拆分好的句子输入至预先针对性训练的一个ChatGLM-6B模型，用于在粗粒度判断当前输入句子是否存在对应的质量问题，对于存在对应质量问题的句子，使用NER模型来进一步确定其问题出现的具体位置，比如，词下标。在文章整体/段落质量检测部分，对于一篇输入的童话故事文本，将其直接输入到预先针对性训练的另一个ChatGLM-6B模型中，可以输出对应的问题更多细节。

以文章整体/段落质量检测部分为例。

假定童话故事自动生成了一篇以“流浪猫在公园里和一只会玩滑板的松鼠成为了朋友”为主题的童话故事文本，此处省略了所生成的童话故事文本的具体内容。

将该童话故事文本输入对应的ChatGLM-6B模型检测后，比如可能输出以下的检测结果：

对于这些细节内容“流浪猫和猫咪”；“流浪猫和滑板松鼠”；“最终，流浪猫和滑板松鼠决定离开宠物店”；“一起搬到了森林里”；“滑板松鼠告诉流浪猫，他住在一个附近的森林里，每天都会来玩滑板。流浪猫很高兴听到这个消息，他决定去森林里看看滑板松鼠。”整体上反映出故事跑题、逻辑不通顺。

以句子粒度质量检测部分为例。

假定将生成的某个故事句子文本“小鱼的父亲开始怀疑小鱼的真实性”，对应的ChatGLM-6B模型检测后，比如可能输出以下的检测结果：

“的真实性”在该句子中用词不当。

通过本申请提供的方案，提供了较为全面的故事(尤其是童话故事)文本质量检测维度，有助于更全面准确具体地评价故事生成的好坏，而且检测结果可解释性高，能够具体地定位问题位置和提供问题细节，所采用的模型也能够支持较长的文本，而且对中文预料的支持性较好，提高了方案的适用性。

基于同样的思路，本说明书一个或多个实施例还提供了上述方法对应的装置和设备，如图8、图9所示。装置和设备能够相应执行上述方法及相关的可选方案。

图8为本说明书一个或多个实施例提供的一种文章文本处理装置的结构示意图，所述装置包括：

文章文本获取模块802，获取自动生成的文章文本；

文章分句处理模块804，将所述文章文本按句拆分，得到相应的多个句子文本；

检测模型确定模块806，确定根据大语言模型获得的一个或多个第一检测模型，以及根据命名实体识别模型获得的第二检测模型；

多种粒度检测模块808，利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，其中，针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同；

问题位置检测模块810，若确定所述句子文本存在质量问题，则利用所述第二检测模型，对存在质量问题的所述句子文本继续检测，以确定所述质量问题出现的具体位置；

检测结果输出模块812，输出所得到的检测结果。

可选地，还包括：

文章文本生成模块814，在所述获取自动生成的文章文本之前，接收用于提示生成内容目标的短文本；

通过指定的生成模型处理所述短文本，自动生成长度远长于所述短文本的文章文本。

可选地，所述检测模型确定模块806，在所述确定根据大语言模型获得的第一检测模型之前，获取指定的大语言模型的至少部分参数；

通过将所述至少部分参数转换为低精度重新保存，生成对应于所述大语言模型的简化模型，作为第一检测模型。

可选地，所述检测模型确定模块806，利用所述故事样本文本和所述非故事样本文本，在指定的大语言模型中进行推理和训练；

根据训练迭代的推理结果，探测所述指定的大语言模型中的参数对所述非故事样本文本相比于对所述故事样本文本的敏感程度差距；

从所述敏感程度差距足够高的参数集合中获取至少部分参数。

可选地，所述多种粒度检测模块808，利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本，以确定所述句子文本中是否存在预先定义的质量问题；

可选地，所述多种粒度检测模块808，在所述利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题之后，对于所述第一检测模型检测出所述文章文本存在质量问题的情况下，相比于所述第一检测模型检测出单个所述句子文本存在质量问题的情况下，获得所述第一检测模型输出的细节内容相对更多的检测结果。

可选地，所述多种粒度检测模块808，利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本是否存在以下至少一种预先定义的质量问题：

可选地，所述多种粒度检测模块808，利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本是否存在以下至少一种预先定义的质量问题：

情节重复、故事跑题、逻辑不通顺。

可选地，在所述输出所得到的检测结果之前，所述检测模型确定模块806，确定根据大语言模型获得的第三检测模型；

所述多种粒度检测模块808，利用所述第三检测模型，检测所述文章文本，以确定所述文章文本是否存在以下至少一种预先定义的质量优点：

情节吸引人、有教育意义。

可选地，所述文章文本为故事文本。

图9为本说明书一个或多个实施例提供的一种文章文本处理设备的结构示意图，所述设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。

基于同样的思路，本说明书一个或多个实施例还提供了一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书实施例可提供为方法、系统、或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本说明书的一个或多个实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种文章文本处理方法，包括：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。

2.如权利要求1所述的方法，所述获取自动生成的文章文本之前，所述方法还包括：

接收用于提示生成内容目标的短文本；

3.如权利要求1所述的方法，所述确定根据大语言模型获得的第一检测模型之前，所述方法还包括：

获取指定的大语言模型的至少部分参数；

4.如权利要求3所述的方法，所述获取指定的大语言模型的至少部分参数，具体包括：

利用所述故事样本文本和所述非故事样本文本，在指定的大语言模型中进行推理和训练；

5.如权利要求1所述的方法，所述利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题，具体包括：

6.如权利要求5所述的方法，所述利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题之后，所述方法还包括：

对于所述第一检测模型检测出所述文章文本存在质量问题的情况下，相比于所述第一检测模型检测出单个所述句子文本存在质量问题的情况下，获得所述第一检测模型输出的细节内容相对更多的检测结果。

7.如权利要求5所述的方法，所述利用所述一个或多个第一检测模型中的至少一个模型分别检测各所述句子文本，具体包括：

8.如权利要求5所述的方法，所述利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本，具体包括：

情节重复、故事跑题、逻辑不通顺。

9.如权利要求5所述的方法，所述输出所得到的检测结果之前，所述方法还包括：

确定根据大语言模型获得的第三检测模型；

情节吸引人、有教育意义。

10.如权利要求1～9任一项所述的方法，所述文章文本为故事文本。

11.一种文章文本处理装置，包括：

文章文本获取模块，获取自动生成的文章文本；

检测结果输出模块，输出所得到的检测结果。

12.如权利要求11所述的装置，还包括：

文章文本生成模块，在所述获取自动生成的文章文本之前，接收用于提示生成内容目标的短文本；

13.如权利要求11所述的装置，所述检测模型确定模块，在所述确定根据大语言模型获得的第一检测模型之前，获取指定的大语言模型的至少部分参数；

14.如权利要求13所述的装置，所述检测模型确定模块，利用所述故事样本文本和所述非故事样本文本，在指定的大语言模型中进行推理和训练；

15.如权利要求11所述的装置，所述多种粒度检测模块，利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本，以确定所述句子文本中是否存在预先定义的质量问题；

16.如权利要求15所述的装置，所述多种粒度检测模块，在所述利用所述第一检测模型检测所述句子文本和所述文章文本，以确定是否存在质量问题之后，对于所述第一检测模型检测出所述文章文本存在质量问题的情况下，相比于所述第一检测模型检测出单个所述句子文本存在质量问题的情况下，获得所述第一检测模型输出的细节内容相对更多的检测结果。

17.如权利要求15所述的装置，所述多种粒度检测模块，利用所述一个或多个第一检测模型中的至少一个模型，分别检测各所述句子文本是否存在以下至少一种预先定义的质量问题：

18.如权利要求15所述的装置，所述多种粒度检测模块，利用所述一个或多个第一检测模型中的至少一个模型，直接检测所述文章文本整体，或者按照段落粒度检测所述文章文本是否存在以下至少一种预先定义的质量问题：

情节重复、故事跑题、逻辑不通顺。

19.如权利要求15所述的装置，在所述输出所得到的检测结果之前，所述检测模型确定模块，确定根据大语言模型获得的第三检测模型；

所述多种粒度检测模块，利用所述第三检测模型，检测所述文章文本，以确定所述文章文本是否存在以下至少一种预先定义的质量优点：

情节吸引人、有教育意义。

20.如权利要求11～19任一项所述的装置，所述文章文本为故事文本。

21.一种文章文本处理设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行：

获取自动生成的文章文本；

将所述文章文本按句拆分，得到相应的多个句子文本；

输出所得到的检测结果。