CN112749553A

CN112749553A - 视频文件的文本信息处理方法、装置和服务器

Info

Publication number: CN112749553A
Application number: CN202010508078.XA
Authority: CN
Inventors: 刘羽佳; 陈小帅
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2021-05-04
Anticipated expiration: 2040-06-05
Also published as: CN112749553B

Abstract

本公开提供了一种视频文件的文本信息处理方法、装置和服务器，涉及互联网技术领域，方法包括：对获取到待处理的视频文件的第一文本信息对应的第一词向量序列进行特征提取，由于该第一词向量序列为第一文本信息分词后得到的第一分词序列对应的词向量序列。因此，对第一词向量进行特征提取后，可以得到第一分词序列中各个分词的语义、各个分词之间的上下文关系，从而提取的第一语义特征向量中可以包括第一文本信息的语义特征和语境特征。根据该第一语义特征向量对第一文本信息进行风格改写，使得可以结合第一文本信息中分词的语义特征和语境特征进行文本改写，防止直接通过关键词填充文本信息模板而出现的语法问题，提高了文本改写的准确性。

Description

视频文件的文本信息处理方法、装置和服务器

技术领域

本公开涉及互联网技术领域，特别涉及一种视频文件的文本信息处理方法、装置和服务器。

背景技术

视频创作者可以在视频应用程序中上传视频文件，并为上传的视频文件添加标题信息，通过添加的标题信息吸引其他用户观看。然而，这些标题信息在发表之前需要进行审核，确定标题信息的风格是否符合标准，当视频文件的标题信息的风格不符合标准，需要将视频文件的标题信息的风格改写成目标风格。

相关技术中，审核人员事先设计多种目标风格的文本信息模板，响应于对标题信息进行改写时，审核人员可以获取实现设计的目标风格的文本信息模板，将标题信息中的关键词添加到文本信息模板中，得到目标风格的文本信息。

上述相关技术中，根据目标风格设计的文本信息模板在设计形式和数量上都具有局限性，会出现大量视频文件共用相同文本信息模板的情况，并且，由于文本信息模板为固定语法的模板，而提取的关键词可能与文本信息模板的语法不匹配。因此，将关键词填充到文本信息模板中，可能会出现语法问题，或不能符合原文本信息的真实意图，从而出现语法或语义上的瑕疵，导致改写的文本信息的语句不通顺。

发明内容

本公开实施例提供了一种视频文件的文本信息处理方法、装置和服务器，用于提高文本改写的通顺度。所述技术方案如下：

一方面，提供一种视频文件的文本信息处理方法，所述方法包括：

获取待处理的视频文件的第一文本信息；

对所述第一文本信息进行分词处理，得到所述第一文本信息对应的第一分词序列；

将所述第一分词序列映射为第一词向量序列；

根据所述第一词向量序列，对所述第一文本信息进行特征提取，得到所述第一文本信息的第一语义特征向量，所述第一语义特征向量包括所述第一文本信息的语义特征和语境特征；

根据所述第一语义特征向量，将所述第一文本信息改写为符合所述第一语义特征向量的目标风格的第二文本信息。

在一种可能的实现方式中，所述根据所述第一语义特征向量，将所述第一文本信息改写为符合所述第一语义特征向量的目标风格的第二文本信息，包括：

通过第一文本改写模型对所述第一文本信息的第一语义特征向量进行解码，得到所述第一语义特征向量对应的第二词向量序列；

将所述第二词向量序列映射为第二分词序列；

根据所述第二分词序列，生成所述第二文本信息。

在另一种可能的实现方式中，所述将所述第二词向量序列映射为第二分词序列，包括：

通过所述第一文本改写模型和所述第一文本信息，确定所述第一文本信息的关键词对应的实体词信息；

将所述实体词信息与所述第一文本信息的第二词向量序列进行信息融合；

对融合后的所述实体词信息与所述第一文本信息的第二词向量序列映射为所述第二分词序列。

在另一种可能的实现方式中，所述方法还包括：

获取第一样本文件，所述第一样本文件包括视频文件的原始文本信息和第一改写文本信息；

将所述第一样本文件输入至第二文本改写模型中，得到所述第一样本文件的视频文件的第二改写文本信息；

根据所述第一改写文本信息和所述第二改写文本信息，调整所述第二文本改写模型的模型参数，直到通过所述第二文本改写模型得到的第三改写文本信息与所述原始文本信息对应的第一改写文本信息匹配为止，得到所述第一文本改写模型。

在另一种可能的实现方式中，所述第一样本文件还包括第一样本文件的第一文本类别标签，所述第一文本类别标签为所述第一样本文件标注的类别标签；

所述方法还包括：

通过所述第二文本改写模型确定所述第一样本文件的第二语义特征向量；

根据所述第二语义特征向量确定所述第一样本文件的第二文件类别标签，所述第二文件类别标签为模型输出的所述第一样本文件的类别标签；所述根据所述第一改写文本信息和所述第二改写文本信息，调整所述第二文本改写模型的模型参数，包括：

根据所述第一文本类别标签、所述第二文本类别标签、所述第一改写文本信息和所述第二改写文本信息，对所述第二文本改写模型的参数进行调整。

在另一种可能的实现方式中，所述方法还包括：

获取原始文本改写模型，以及，获取第二样本文件，所述第二样本文件中包括文本信息对应的第三分词序列；

将所述第三分词序列的部分分词序列输入至所述原始文本改写模型，得到所述第二样本文件的第四分词序列；

根据所述第四分词序列和所述第三分词序列，调整所述原始文本改写模型的模型参数，直到所述第四分词序列包括所述第三分词序列中未输入所述原始文本改写模型的分词序列为止，得到所述第二文本改写模型。

在另一种可能的实现方式中，所述第二文本信息的数量为至少两个；

所述根据所述第一语义特征向量，将所述第一文本信息改写为符合所述第一语义特征向量的目标风格的第二文本信息之后，所述方法还包括：

将所述至少两个第二文本信息发送给视频文件审核平台，所述视频文件审核平台用于根据所述至少两个第二文本信息，确定所述待处理的视频文件的目标文本信息，返回所述目标文本信息；

接收所述视频文件审核平台返回的目标文本信息；

将所述目标文本信息作为所述待处理视频文件的文本信息进行展示。

在另一种可能的实现方式中，所述根据所述第一词向量序列，对所述第一文本信息进行特征提取，得到所述第一文本信息的第一语义特征向量，包括：

通过多层注意力机制，提取所述第一词向量序列的语义特征；以及，通过所述多层注意力机制，确定所述第一词向量序列中词向量的上下文信息；

根据所述上下文信息确定所述第一词向量序列的语境特征；

根据所述语义特征和所述语境特征，确定所述第一文本信息的第一语义特征向量。

另一方面，提供一种视频文件的文本信息处理装置，所述装置包括：

第一获取模块，用于获取待处理的视频文件的第一文本信息；

分词处理模块，用于对所述第一文本信息进行分词处理，得到所述第一文本信息对应的第一分词序列；

映射模块，用于将所述第一分词序列映射为第一词向量序列；

特征提取模块，用于根据所述第一词向量序列，对所述第一文本信息进行特征提取，得到所述第一文本信息的第一语义特征向量，所述第一语义特征向量包括所述第一文本信息的语义特征和语境特征；

改写模块，用于根据所述第一语义特征向量，将所述第一文本信息改写为符合所述第一语义特征向量的目标风格的第二文本信息。

在一种可能的实现方式中，所述改写模块，还用于通过第一文本改写模型对所述第一文本信息的第一语义特征向量进行解码，得到所述第一语义特征向量对应的第二词向量序列；将所述第二词向量序列映射为第二分词序列；根据所述第二分词序列，生成所述第二文本信息。

在另一种可能的实现方式中，所述改写模块，还用于通过所述第一文本改写模型和所述第一文本信息，确定所述第一文本信息的关键词对应的实体词信息；将所述实体词信息与所述第一文本信息的第二词向量序列进行信息融合；对融合后的所述实体词信息与所述第一文本信息的第二词向量序列映射为所述第二分词序列。

在另一种可能的实现方式中，所述装置还包括：

第二获取模块，用于获取第一样本文件，所述第一样本文件包括视频文件的原始文本信息和第一改写文本信息；

第一输入模块，用于将所述第一样本文件输入至第二文本改写模型中，得到所述第一样本文件的视频文件的第二改写文本信息；

参数调整模块，用于根据所述第一改写文本信息和所述第二改写文本信息，调整所述第二文本改写模型的模型参数，直到通过所述第二文本改写模型得到的第三改写文本信息与所述原始文本信息对应的第一改写文本信息匹配为止，得到所述第一文本改写模型。

所述装置还包括：

确定模块，用于通过所述第二文本改写模型确定所述第一样本文件的第二语义特征向量；根据所述第二语义特征向量确定所述第一样本文件的第二文件类别标签，所述第二文件类别标签为模型输出的所述第一样本文件的类别标签；

所述参数调整模块，还用于根据所述第一文本类别标签、所述第二文本类别标签、所述第一改写文本信息和所述第二改写文本信息，对所述第二文本改写模型的参数进行调整。

在另一种可能的实现方式中，所述装置还包括：

第三获取模块，用于获取原始文本改写模型，以及，获取第二样本文件，所述第二样本文件中包括文本信息对应的第三分词序列；

第二输入模块，用于将所述第三分词序列的部分分词序列输入至所述原始文本改写模型，得到所述第二样本文件的第四分词序列；

所述参数调整模块，还用于根据所述第四分词序列和所述第三分词序列，调整所述原始文本改写模型的模型参数，直到所述第四分词序列包括所述第三分词序列中未输入所述原始文本改写模型的分词序列为止，得到所述第二文本改写模型。

所述装置还包括：

发送模块，用于将所述至少两个第二文本信息发送给视频文件审核平台，所述视频文件审核平台用于根据所述至少两个第二文本信息，确定所述待处理的视频文件的目标文本信息，返回所述目标文本信息；

接收模块，用于接收所述视频文件审核平台返回的目标文本信息；

展示模块，用于将所述目标文本信息作为所述待处理视频文件的文本信息进行展示。

在另一种可能的实现方式中，所述特征提取模块，还用于通过多层注意力机制，提取所述第一词向量序列的语义特征；以及，通过所述多层注意力机制，确定所述第一词向量序列中词向量的上下文信息；根据所述上下文信息确定所述第一词向量序列的语境特征；根据所述语义特征和所述语境特征，确定所述第一文本信息的第一语义特征向量。

另一方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如本公开实施例所述的视频文件的文本信息处理方法。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储至少一条程序代码，所述至少一条程序代码有处理器加载并执行，以实现如本公开实施例所述的视频文件的文本信息处理方法。

本公开实施例提供的技术方案带来的有益效果是：

在本公开实施例中，获取到待处理的视频文件的第一文本信息后，对该第一文本信息对应的第一词向量序列进行特征提取，由于该第一词向量序列为第一文本信息分词后得到的第一分词序列对应的词向量序列。因此，对第一词向量进行特征提取后，可以得到第一分词序列中各个分词的语义，以及各个分词之间的上下文关系，从而提取的第一语义特征向量中可以包括第一文本信息的语义特征和语境特征。并且，根据该第一语义特征向量对第一文本信息进行风格改写，使得对第一文本进行改写的过程中，可以结合第一文本信息中分词的语义特征和语境特征进行改写，防止直接通过关键词填充文本信息模板而出现的语法问题，使改写的文本信息语句通顺，语义正确，提高了文本改写的准确性。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本公开实施例提供的一种视频文件的文本信息处理方法的实施环境；

图2是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图3是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图4是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图5是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图6是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图7是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图8是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图9是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图10是根据一示例性实施例提供的一种视频文件的文本信息处理方法流程的示意图；

图11是根据本公开实施例提供的一种视频文件的文本信息处理装置的框图；

图12是根据本公开实施例提供的一种服务器的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

随着人工智能技术研究和进步，人工智能(Artificial Intelligence,AI)技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本公开的实施例涉及人工智能的自然语言处理和机器学习等技术，服务器可以通过自然语言处理，对视频文件的第一文本信息进行语义分析和语境分析，结合视频文件的第一文本信息的语义特征和语境特征，确定视频文件的第一文本信息符合的目标风格，根据该目标风格，对第一文本信息进行改写，得到第二文本信息。另外，服务器可以通过第一文本改写模型，对第一文本信息进行改写，该第一文本改写模型可以通过机器学习的方法进行训练得到。

图1是根据本公开示例性实施例示出的一种视频文件的文本信息处理方法所涉及的实施环境的示意图。参见图1，该实施环境包括服务器101、第一终端102和第二终端103。

第一终端102和第二终端103分别于服务器101通过网络进行数据交互。第一终端102和第二终端103中都可以运行可以播放视频文件的应用程序，该应用程序可以为短视频应用程序、视频播放应用程序或安装了视频播放插件的浏览器等。服务器101为该应用程序对应的服务器101，第一终端102和第二终端103可以基于该应用程序登录该服务器101，从而与服务器101之间进行交互。其中，第一终端102可以将视频文件上传至服务器101中，第一终端102在上传视频文件时，同时上传该视频文件的标题信息。第二终端103可以从服务器101中获取视频文件的播放链接，根据播放链接播放服务器101中的视频文件，接收用户输入的对该视频文件的评论信息和弹幕信息，将该评论信息和弹幕信息发送至服务器101。

需要说明的一点是，第一终端102和第二终端103可以为同一终端，也可以为不同终端，在本公开实施例中，对此不作具体限定。

服务器101接收第一终端102上传的视频文件和该视频文件的标题信息，向第二终端103下发视频文件的播放链接，以及，接收第二终端103上传的针对视频文件的评论信息和弹幕信息。服务器101将接收到的标题信息、评论信息或弹幕信息等作为视频文件的第一文本信息，通过第一文本信息的内容对第一文本信息进行改写，得到视频文件的第二文本信息，将第二文本信息作为视频文件的相关文本信息。响应于服务器101需要再次向其他第二终端103下发视频的播放链接，将这些相关文本信息添加到该播放链接中，相应的，第二终端103根据该播放链接播放视频文件，并显示相关文本信息。

其中，服务器101可以是独立的物理服务器101，也可以是多个物理服务器101构成的服务器101集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器101。第一终端102和第二终端103可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等，但并不局限于此。第一终端102、第二终端103以及服务器101可以通过有线或无线通信方式进行直接或间接地连接，本公开在此不做限制。

在一种可能的实现方式中，该实施环境还包括：视频文件审核平台104。服务器101与该视频文件审核平台104通过网络连接进行数据交互。其中，服务器101可以将视频文件的至少两个第二文本信息发送给视频文件审核平台，视频文件审核平台104接收服务器101发送的视频文件的至少两个第二文本信息，从该至少两个第二文本信息中确定目标文本信息，将该目标文本信息发送给服务器101，服务器101将目标文本信息进行显示。其中，该视频文件审核平台104可以为一种终端，例如，该视频文件审核平台104可以为智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等，在本公开实施例中，对该视频文件审核平台不作具体限定。

图2为根据一示例性实施例提供的一种视频文件的文本信息处理方法流程图，如图2所示，该方法包括以下步骤：

步骤201：获取待处理的视频文件的第一文本信息。

步骤202：对该第一文本信息进行分词处理，得到该第一文本信息对应的第一分词序列。

步骤203：将该第一分词序列映射为第一词向量序列。

步骤204：根据该第一词向量序列，对该第一文本信息进行特征提取，得到该第一文本信息的第一语义特征向量，该第一语义特征向量包括该第一文本信息的语义特征和语境特征。

步骤205：根据该第一语义特征向量，将该第一文本信息改写为符合该第一语义特征向量的目标风格的第二文本信息。

在一种可能的实现方式中，该根据该第一语义特征向量，将该第一文本信息改写为符合该第一语义特征向量的目标风格的第二文本信息，包括：

通过第一文本改写模型对该第一文本信息的第一语义特征向量进行解码，得到该第一语义特征向量对应的第二词向量序列；

将该第二词向量序列映射为第二分词序列；

根据该第二分词序列，生成该第二文本信息。

在另一种可能的实现方式中，该将该第二词向量序列映射为第二分词序列，包括：

通过该第一文本改写模型和该第一文本信息，确定该第一文本信息的关键词对应的实体词信息；

将该实体词信息与该第一文本信息的第二词向量序列进行信息融合；

对融合后的该实体词信息与该第一文本信息的第二词向量序列映射为该第二分词序列。

在另一种可能的实现方式中，该方法还包括：

获取第一样本文件，该第一样本文件包括视频文件的原始文本信息和第一改写文本信息；

将该第一样本文件输入至第二文本改写模型中，得到该第一样本文件的视频文件的第二改写文本信息；

根据该第一改写文本信息和该第二改写文本信息，调整该第二文本改写模型的模型参数，直到通过该第二文本改写模型得到的第三改写文本信息与该原始文本信息对应的第一改写文本信息匹配为止，得到该第一文本改写模型。

在另一种可能的实现方式中，该第一样本文件还包括第一样本文件的第一文本类别标签，该第一文本类别标签为该第一样本文件标注的类别标签；

该方法还包括：

通过该第二文本改写模型确定该第一样本文件的第二语义特征向量；

根据该第二语义特征向量确定该第一样本文件的第二文件类别标签，该第二文件类别标签为模型输出的该第一样本文件的类别标签；该根据该第一改写文本信息和该第二改写文本信息，调整该第二文本改写模型的模型参数，包括：

根据该第一文本类别标签、该第二文本类别标签、该第一改写文本信息和该第二改写文本信息，对该第二文本改写模型的参数进行调整。

在另一种可能的实现方式中，该方法还包括：

获取原始文本改写模型，以及，获取第二样本文件，该第二样本文件中包括文本信息对应的第三分词序列；

将该第三分词序列的部分分词序列输入至该原始文本改写模型，得到该第二样本文件的第四分词序列；

根据该第四分词序列和该第三分词序列，调整该原始文本改写模型的模型参数，直到该第四分词序列包括该第三分词序列中未输入该原始文本改写模型的分词序列为止，得到该第二文本改写模型。

在另一种可能的实现方式中，该第二文本信息的数量为至少两个；

该根据该第一语义特征向量，将该第一文本信息改写为符合该第一语义特征向量的目标风格的第二文本信息之后，该方法还包括：

将该至少两个第二文本信息发送给视频文件审核平台，该视频文件审核平台用于根据该至少两个第二文本信息，确定该待处理的视频文件的目标文本信息，返回该目标文本信息；

接收该视频文件审核平台返回的目标文本信息；

将该目标文本信息作为该待处理视频文件的文本信息进行展示。

在另一种可能的实现方式中，该根据该第一词向量序列，对该第一文本信息进行特征提取，得到该第一文本信息的第一语义特征向量，包括：

通过多层注意力机制，提取该第一词向量序列的语义特征；以及，通过该多层注意力机制，确定该第一词向量序列中词向量的上下文信息；

根据该上下文信息确定该第一词向量序列的语境特征；

根据该语义特征和该语境特征，确定该第一文本信息的第一语义特征向量。

图3为根据一示例性实施例提供的一种视频文件的文本信息处理方法流程图，在本公开实施例中，以对第二文本改写模型进行模型训练，得到第一文本改写模型为例进行说明。如图3所示，该方法包括以下步骤：

步骤301：服务器获取第一样本文件。

其中，该第一样本文件包括视频文件的原始文本信息和第一改写文本信息。该原始文本信息为第一样本文件对应的视频文件的未改写的文本信息，例如，该原始文本信息可以为第一终端向服务器上传视频文件时，为视频文件编辑的原始标题信息，或者，该原始文本信息还可以为第二终端上传的对该视频文件的原始评论信息或原始弹幕信息等；第一改写文本信息为第一样本文件的视频文件经过视频文件审核后，得到的样本改写文本信息。其中，该第一样本文件中包括的第一改写文本信息为根据相同风格改写的文本信息，该相同风格为待训练的第二文本改写模型的目标风格。

在一种可能的实现方式中，服务器可以接收的第三终端上传的视频文件的原始文本信息和第一改写文本信息作为第一样本文件。相应的，在此之前，第三终端接收原始文本信息和对该原始文本信息的第一改写文本信息，将该原始文本信息和第一改写文本信息上传至服务器中。其中，第三终端可以为智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等，在本公开实施例中，对该视频文件审核平台不作具体限定。在本实现方式中，服务器接收第三终端上传的第一样本文件，从而保证服务器在进行模型训练的过程中可以获取足够的第一样本文件，并保证第一样本文件为有效的样本文件，从而保证模型训练得到准确性高的第一文本改写模型。

在另一种可能的实现方式中，服务器可以将之前接收到的第一终端或第二终端上传的视频文件的原始文本信息和视频文件审核后得到的第一改写文本信息作为第一样本文件。相应的，服务器调用事先存储的第一样本文件。在本实现方式中，服务器通过将之前获取的第一终端或第二终端上传的视频文件的原始文本信息和第一改写文本信息作为第一样本文件，从而保证了第一样本文件的数量，从而完成对该第二文本改写模型的训练，得到第一文本改写模型。

需要说明的一点是，第一样本文件中的第一改写文本信息可以为人为改写的文本信息，也可以为通过其他文本改写模型改写的文本信息，在本公开实施例中，对此不作具体限定。

步骤302：服务器将第一样本文件输入至第二文本改写模型中，得到该第一样本文件的视频文件的第二改写文本信息。

其中，该第二文本改写模型可以为任一可以对文本进行改写的模型。例如，该第二文本改写模型可以为序列到序列模型，也即该第二文本改写模型可以为将输入序列转化为输出序列的模型。在本步骤中，服务器将第一样本文件中的原始文本信息输入至第二文本改写模型中，通过第二文本改写模型对原始文本信息进行改写，得到第二改写文本信息。

其中，服务器可以通过以下步骤(A1)-(A8)实现通过第二文本改写模型得到第二改写文本信息的，包括：

(A1)服务器对该原始文本信息进行分词处理，得到该原始文本信息对应的第五分词序列。

其中，该原始文本信息可以由多个词语组成，在本步骤中，服务器对原始文本信息进行分词，得到多个分词。服务器可以通过前向最大匹配算法或双向最大匹配算法对原始文本信息进行分词处理，得到原始文本信息对应的第五分词序列。

需要说明的一点是，服务器可以将原始文本信息中分词得到的所有分词组成该第五分词序列。服务器还可以从原始文本信息中获取具有实际意义的分词，例如，名词、动词等；删除没有实际意义的分词，例如，语气助词等。服务器将获取的具有实际意义的分词组成第五分词序列。

(A2)服务器将该第五分词序列映射为第三词向量序列。

服务器可以获取第五分词序列中每个分词的词语标识，将该词语标识组成该第三词向量序列。其中，服务器可以事先存储分词与词语标识的映射关系，在本步骤中，直接根据已存储的分词与词语标识的映射关系确定第五分词序列中每个分词的词语标识。服务器还可以在需要确定第五分词序列的第三词向量序列时，从其他服务器中获取分词与词语标识的映射关系，根据该映射关系确定第五分词序列的第三词向量序列。

(A3)服务器通过多层注意力机制，提取该第三词向量序列的语义特征；以及，通过该多层注意力机制，确定该第三词向量序列中词向量的上下文信息。

在本步骤中，服务器通过第二文本改写模型的多层注意力机制，对该第三词向量序列进行特征提取，得到第三词向量序列的语义特征和上下文信息。

其中，该第二文本改写模型可以为transformer(一种极其翻译模型)结构的序列到序列模型。该第二文本改写模型包括编码器401和解码器402。参见图4，在本步骤中，服务器通过编码器401中的多层attention(注意力机制)，确定第三词向量序列中不同词向量之间的语义特征和上下文信息。

(A4)服务器根据该上下文信息确定该第三词向量序列的语境特征。

在本步骤中，服务器根据该上下文信息，对所述第三词向量序列的上下文信息进行语境分析，根据该上下文信息确定该第三词向量序列的语境特征。

(A5)服务器根据该语义特征和所述语境特征，确定该原始文本信息的第二语义特征向量。

在本步骤中，服务器根据第三词向量序列的语义特征和该语境特征，对第三词向量序列中词向量进行调整，使得第三词向量序列中的词向量可以携带不同的语义特征和语境特征，从而得到原始文本信息的第二语义特征向量。其中，服务器根据第三词序列向量中的语义特征和语境特征，对该第三词向量序列进行编码，得到该第五分词序列对应的第二语义特征向量。该第二语义特征向量包括该原始文本信息的语义特征和语境特征。

(A6)服务器通过该第二文本改写模型对该原始文本信息的第二语义特征向量进行解码，得到该第二语义特征向量对应的第四词向量序列。

其中，该目标风格为该第二文本改写模型对应的风格。在本步骤中，第二文本改写模型根据该目标风格将该第二语义特征向量进行解码，得到符合该目标风格的第六分词序列。

(A7)服务器将该第四词向量序列映射为第六分词序列。

本步骤与步骤(A2)的过程相似，服务器可以确定组成所述第四词向量序列的词语标识，根据该词语标识确定与该词语标识对应的第六分词序列。其中，服务器可以事先存储分词与词语标识的映射关系，在本步骤中，直接根据已存储的分词与词语标识的映射关系确定第四词向量序列中词语标识对应的分词，将该分词组成第六分词序列。

需要说明的一点是，继续参见图4，该第二文本改写模型还可以结合指针生成网络403(Pointer-Generator-Network)，该指针生成网络403用语从第五分词序列中拷贝原始文本信息的关键词实体，将关键词实体与第二语义特征向量进行融合，对融合后的关键词实体和第二语义特征向量进行解码，得到第六分词序列。该过程可以为：服务器根据该原始文本信息，确定该原始文本信息的关键词对应的实体词信息；将该实体词信息与该原始文本信息的第五词向量序列进行信息融合；对融合后的该实体词信息与该原始文本信息的第五词向量序列映射为该第六分词序列。

在本实现方式中，通过指针生成网络403将原始文本信息中的关键词实体进行拷贝，使得服务器通过第二文本改写模型改写得到的第六分词序列可以融合原始文本信息的信息量，保证了解码得到第六分词序列可以保留原始文本信息的信息量。

(A8)服务器根据该第六分词序列，生成该第二改写文本信息。

在本步骤中，服务器将该第六分词序列中的分词进行排序，根据分词的排序将分词组成第二改写文本信息。其中，服务器可以将第六分词序列生成时的顺序确定为第六分词序列中词向量的顺序；服务器也可以根据第六分词序列中分词的语义对词向量进行重新排序，将排序得到的语义对词向量进行重新排序，根据该排序得到的顺序组成第二改写文本信息。

需要说明的一点是，该第六分词序列中的分词可以都为具有实际意义的分词，导致第六分词序列组成的第二改写文本信息可能缺少一些连接词。因此，服务器还可以根据第六分词序列中的分词向该第六分词序列中添加分词，添加的分词可以为语气助词、连接词等，通过向第六分词序列中添加连接词，使得通过第六分词序列得到的第二文本改写信息语义更连贯。

在本步骤之前，需要设计原始文本改写模型，对该原始文本改写模型进行预训练得到参数较好的第二文本改写模型。该预训练过程可以通过以下步骤(B1)-(B4)实现，包括：

(B1)服务器获取原始文本改写模型。

该原始文本改写模型为开发人员根据需求设计的原始文本改写模型，在本步骤中，服务器可以接收开发人员输入的原始文本改写模型的原始模型参数，根据该原始模型参数构建原始文本改写模型。

(B2)服务器获取第二样本文件，该第二样本文件中包括文本信息对应的第三分词序列。

本步骤中服务器获取第二样本对应的文本信息的过程与步骤301相似，在此不再赘述。另外，服务器对获取到的第二样本的文本信息进行分词处理，得到第三分词序列，该过程与步骤302中的步骤(A1)相似，在此不再赘述。

(B3)服务器将该第三分词序列的部分分词序列输入至该原始文本改写模型，得到该第二样本文件的第四分词序列。

在本步骤中，参见图5，服务器对第三分词序列中的部分分词进行遮挡，将未被遮挡的部分分词序列输入至原始文本改写模型中，输出第二样本文件对应的第四分词序列。

该过程与步骤302中的步骤(A1)-(A8)相似，在此不再赘述。

(B4)服务器根据该第四分词序列和该第三分词序列，调整该原始文本改写模型的模型参数，直到该第四分词序列包括该第三分词序列中未输入该原始文本改写模型的分词序列为止，得到该第二文本改写模型。

在本公开实施例中，该第四分词序列可能为补充完整的分词序列，也可能仍为不完整的分词序列。当该第四分词序列为补充完整的第四分词序列时，服务器可以根据该第四分词序列与第三分词序列的相似情况对该原始文本改写模型的模型参数进行改写。当该第四分词序列为仍未补充完整的分词序列时，服务器可以根据该第四分词序列中仍缺失的分词；第四分词序列中已有的分词和第三分词序列中分词的相似度来调整该原始文本改写模型的模型参数。之后服务器继续将第二样本文件对应的第三分词序列继续输入至参数调整后的原始文本改写模型中，直到该第四分词序列包括该第三分词序列中未输入该原始文本改写模型的分词序列为止，得到该第二文本改写模型。该过程与步骤302中的步骤(A1)-(A8)相似，在此不再赘述。

另外，服务器重复上述步骤(B3)-(B4)，直到参数调整的后的原始文本改写模型输出的第四分词序列中包括第三分词序列中未输入该原始文本改写模型的分词序列，说明原始文本改写模型的预训练完成，得到该第二文本改写模型。

在本实施例中，通过对设计的原始文本改写模型进行预训练，使得得到的第二文本改写模型可以理解词语的语义信息等，从而减小了模型训练对第一样本数据的数量要求，提高了模型训练的效率。

步骤303：服务器根据该第一改写文本信息和该第二改写文本信息，调整该第二文本改写模型的模型参数，直到通过该第二文本改写模型得到的第三改写文本信息与该原始文本信息对应的第一改写文本信息匹配为止，得到该第一文本改写模型。

在本步骤中，服务器根据第一改写文本信息和第二改写文本信息确定该第二文本改写模型的模型参数，该过程与步骤302中步骤(B4)相似，在此不再赘述。服务器将第一样本文件对应的原始文本信息继续输入至参数调整后的第二文本改写模型中，得到第三改写文本信息的过程与步骤302中的步骤(A1)-(A8)相似，在此不再赘述。其中，第三改写文本信息与第一改写文本信息匹配指第三改写文本信息与第一改写文本信息相同或相似，在本公开实施例中，对此不作具体限定。

另外，服务器还可以继续根据该第三改写文本信息和第一改写文本内信息对该第二文本改写模型的模型参数进行调整，该参数调整过程与步骤302中的步骤(B4)相似，在此不再赘述。服务器重复上述步骤303-304，直到参数调整的后的第二文本改写模型输出的第三改写文本信息与第一样本文件的原始文本信息相似，说明第二文本改写模型的训练完成，得到该第一文本改写模型。

需要说明的一点是，服务器对原始文本改写模型进行预训练得到第二文本改写模型；以及，服务器对第二文本改写模型进行模型训练，得到该第一文本改写模型的过程可以也通过服务器自己完成，服务器还可以从其他电子设备中直接获取训练好的第一文本改写模型，在本公开实施例中，对此不作具体限定。另外，其他电子设备对原始文本改写模型进行预训练得到第二文本改写模型；以及，服务器对第二文本改写模型进行模型训练，得到该第一文本改写模型的过程，与服务器对原始文本改写模型进行预训练得到第二文本改写模型；以及，服务器对第二文本改写模型进行模型训练，得到该第一文本改写模型的过程相似，在此不再赘述。

在本公开实施例中，通过获取第一样本文件，该第一样本文件包括视频文件的原始文本信息和第一改写文本信息；将该原始文本信息输入至第二文本改写模型中，得到第二改写文本信息；根据该第一改写文本信息和该第二改写文本信息，调整该第二文本改写模型的模型参数，直到通过该第二文本改写模型得到的第三改写文本信息与该原始文本信息对应的第一改写文本信息匹配，得到该第一文本改写模型，使得服务器可以使用第一文本改写模型对接收到的待处理的视频文件的第一文本信息进行改写，从而防止直接通过关键词填充文本信息模板而出现的语法问题，使改写的文本信息语句通顺，语义正确。

另外，在模型训练的过程中，服务器获取的第一样本文件中还可以包括第一样本文件的第一文本类别标签，相应的，服务器还可以结合该第一文本类别标签对该第二文本改写模型进行模型训练。参见图6，图6为根据一示例性实施例提供的一种视频文件的文本信息处理方法流程图，在本公开实施例中，以结合第一样本文件的第一文本类别标签，对第二文本改写模型进行模型训练为例进行说明。如图6所示，该方法包括以下步骤：

步骤601：服务器获取第一样本文件，该第一样本文件包括视频文件的原始文本信息和第一改写文本信息。

该第一样本文件还包括视频文件的第一文本类别标签，该第一文本类别标签可以为任一文本类别标签，例如，该第一文本类别标签可以为“美食、教学、娱乐”等，在本公开实施例中，对此不作具体限定。

本步骤与步骤301相似，在此不再赘述。

步骤602：服务器将该第一样本文件输入至第二文本改写模型中，得到该第一样本文件的视频文件的第二改写文本信息。

本步骤与步骤302相似，在此不再赘述。

步骤603：服务器通过该第二文本改写模型确定该第一样本文件的第二语义特征向量。

该过程与步骤302中的(A3)-(A5)相似，在此不再赘述。另外，需要说明的一点是，该与步骤302中的(A1)-(A3)相似的过程可以在步骤602中执行，在本步骤中，直接获取编码好的原始文本信息的第二语义特征向量，将该原始文本信息的第二语义特征向量作为第一样本文件的编码结果。

步骤604：服务器根据该第二语义特征向量，确定该第一样本文件的第二文件类别标签。

其中，该第二文件类别标签为模型输出的该第一样本文件的类别标签。在本步骤中，服务器根据该第二语义特征向量，根据该第二语义特征向量确定该第一样本文件的第二文件类别标签。参见图7，服务器通过该第二文本改写模型的编码结果，输出该第一样本文件的第二文件类别标签。

步骤605：服务器根据该第一文本类别标签、该第二文本类别标签、该第一改写文本信息和该第二改写文本信息，对该第二文本改写模型的模型参数进行调整，直到通过该第二文本改写模型得到的第三改写文本信息与该原始文本信息对应的第一改写文本信息匹配，且，第二文本类别标签与第一文件标签匹配为止，得到该第一文本改写模型。

本步骤与步骤303相似，在此不再赘述。

本公开实施例中，该第二文本改写模型可以为包括编码器401和解码器402的transformer结构的序列到序列模型。服务器通过编码器401对该第一样本文件的原始文本信息对应的第五分词序列，确定样本文件的第五分词序列的词向量序列，通过编码器401对该第五分词序列的词向量序列进行编码得到该原始文本信息的第二语义特征向量。相应的，在本步骤中，服务器可以分别对该第二文本改写模型中的编码器401和解码器402的参数进行调整。

相应的，服务器可以根据第一文本类别标签、该第二文本类别标签、该第一改写文本信息和该第二改写文本信息，对该第二文本改写模型的编码器401的模型参数进行调整；服务器根据该第一文本类别标签改写文本信息和该第二改写文本信息，对该第二文本改写模型的解码器402的模型参数进行调整。其中，服务器调整模型参数的过程与步骤303相似，在此不再赘述。

需要说明的一点是，服务器可以先调整编码器401的模型参数，再调整解码器402的模型参数；服务器还可以先调整解码器402的模型参数，再调整编码器401的模型参数；服务器还可以同时调整编码器401和解码器402的模型参数。在本公开实施例中，对服务器调整编码器401和解码器402的模型参数的顺序不作具体限定。

需要说明的一点是，在对原始文本改写模型进行预训练，得到第二文本改写模型的过程中，第二样本文件中也可以包括第二样本文件的第三文本类别标签，从而通过结合了文本类别标签的样本文件对该第三文本类别标签进行模型预训练，该加入第三文本类别标签的预训练过程，与模型训练过程中添加第一文本类别标签进行训练的过程相似，在此不再赘述。

并且，通过结合第一样本文件中的第一文件类别标签对第二文本改写模型进行训练，使得模型训练的过程中，可以结合第一文件类别标签和第二文件类别标签对第二文本改写模型的模型参数进行调整，从而可以加快模型训练的过程。

图8为根据一示例性实施例提供的一种视频文件的文本信息处理方法流程图，在本公开实施例中，以服务器接收到第一终端或第二终端上传的第一文本信息，通过第一文本改写模型对视频文件的文本信息进行文本信息处理为例进行说明。如图8所示，该方法包括以下步骤：

步骤801：服务器获取待处理的视频文件的第一文本信息。

该第一文本信息可以为待处理视频文件的标题信息、评论信息或弹幕信息等。相应的，当该第一文本信息为待处理的视频文件的标题信息时，该服务器可以接收第一终端上传的视频文件和该视频文件对应的标题信息；当该第一文本信息为待处理的视频文件的评论信息或弹幕信息时，该服务器可以接收第二终端上传的待处理的视频文件的文件标识和该视频文件对应的评论信息或弹幕信息。

其中，在一种可能的实现方式中，服务器接收视频文件的第一文本信息，根据该视频文件的文件内容和第一文本信息，确定该第一文本信息是否需要改写，当该第一文本信息为需要改写的文本信息时，确定该第一文本信息的目标风格，根据该目标风格对该第一文本信息进行改写。相应的，服务器可以直接接收第一终端或第二终端上传的第一文本信息。

在另一种可能的实现方式中，服务器接收视频文件审核平台发送的待处理视频的第一文本信息。相应的，第一终端或第二终端将待处理的视频文件的第一文本信息上传给视频文件审核平台，视频文件审核平台对该待处理的视频文件的第一文本信息进行初步审核，将需要进行改写的视频文件的第一文本信息和该第一文本信息对应的目标风格上传至服务器，服务器接收视频文件审核平台上传的待处理的视频文件的第一文本信息和该第一文本信息对应的目标风格。

需要说明的一点是，服务器或视频文件审核平台可以通过目标风格确定模型确定待处理视频文件对应的目标风格；服务器或视频文件审核平台还可以通过人工审核的方式，确定待处理的视频文件对应的目标风格。在本公开实施例中，对此不作具体限定。

需要说明的另一点是，该第一文本信息可以为待处理的视频文件的标题信息、评论信息或弹幕信息等，对于不同的来源的文本信息，服务器的处理过程相同，在此不再赘述。

步骤802：服务器对该第一文本信息进行分词处理，得到该第一文本信息对应的第一分词序列。

本步骤与步骤302中的(A1)相似，在此不再赘述。

步骤803：服务器将该第一分词序列映射为第一词向量序列。

本步骤与步骤302中的(A2)相似，在此不再赘述。

步骤804：服务器根据该第一词向量序列，对该第一文本信息进行特征提取，得到该第一文本信息的第一语义特征向量，该第一语义特征向量包括该第一文本信息的语义特征和语境特征。

本步骤与步骤302中的(A3)-(A5)相似，在此不再赘述。

步骤805：服务器通过第一文本改写模型对该第一文本信息的第一语义特征向量进行解码，得到该第一语义特征向量对应的第二词向量序列。

参见图9，服务器可以通过第一文本改写模型中的编码器401对原始词向量序列进行特征提取，得到第一文本信息的第一语义特征向量，将该第一语义特征向量作为解码器402的输入。该过程与步骤302中的(A6)-(A7)相似，在此不再赘述。

继续参见图9，服务器可以通过第一文本改写模型的解码器402对该第一语义特征向量进行解码，同时，服务器还可以通过该第一文本改写模型中的指针生成网络403将第一文本信息中的关键词对应的实体词信息与该第一语义特征向量进行融合，对融合后的实体词信息与该第一语义特征向量进行解码，得到该第二分词序列。该过程与步骤302中的(A7)相似，在此不再赘述。

步骤806：服务器根据该第二分词序列，生成该第二文本信息。

本步骤与步骤302中的(A8)相似，在此不再赘述。

图10为根据一示例性实施例提供的一种视频文件的文本信息处理方法流程图，在本公开实施例中，以服务器将至少两个第二文本信息发送给视频文件审核平台，通过该视频文件审核平台确定目标文本信息，将目标文本信息返回给服务器，由服务器对该文本信息进行展示为例进行说明。如图10所示，该方法包括以下步骤：

步骤1001：服务器将至少两个第二文本信息发送给视频文件审核平台。

服务器对同一视频文件的第一文本信息进行改写，得到至少两个第二文本信息，将该至少两个第二文本信息发送给视频文件审核平台。视频文件审核平台可以为可以对视频文件进行审核的电子设备，可以为终端也可以为服务器等，在本公开实施例中，对此不做具体限定。

步骤1002：视频文件审核平台接收至少两个第二文本信息。

在本步骤中，视频文件审核平台接收该至少两个第二文本信息。其中，视频文件审核平台可以仅接收该至少两个第二文本信息，视频文件审核平台还可以接收该至少两个第二文本信息对应的视频文件和第一文本信息，以便可以根据该视频文件和第一文本信息，从该至少两个第二文本信息中选择第一文本信息。

步骤1003：视频文件审核平台根据该至少两个第二文本信息，确定该待处理的视频文件的目标文本信息。

视频文件审核平台可以通过深度学习模型从至少两个第二文本信息中选择该视频文件的目标文本信息；视频文件审核平台还可以通过人工审核从该至少两个第二文本信息中选择该视频文件的目标文本信息。

需要说明的一点是，当通过视频文件审核平台从该至少两个第二文本信息中确定该待处理的视频文件的目标文本信息时，该至少两个第二文本信息中可能不存在符合要求的目标文本信息。此时，视频文件审核平台可以接收审核人员输入的文本信息，视频文件审核平台将该审核人员输入的文本信息作为目标文本信息。

在本实施例中，当至少两个第二文本信息中没有标准的目标文本信息时，可以接收审核人员输入的文本信息，将该文本信息作为目标文本信息，从而保证了视频文件可以获取到准确的目标文本信息。

步骤1004：视频文件审核平台返回该目标文本信息。

视频文件审核平台将确定的目标文本信息发送给服务器。

步骤1005：服务器接收该视频文件审核平台返回的目标文本信息。

服务器接收视频文件审核平台发送的目标文本信息。

步骤1006：服务器将该目标文本信息作为该待处理视频文件的文本信息进行展示。

服务器可以将该目标文本信息下发到该待处理视频文件所在的第二终端中，由第二终端对该目标文本信息和视频文件进行展示。相应的，服务器在向第二终端下发该视频文件时，将该目标文本信息添加到该视频文件的相应部位，同时将该目标文本信息对应的第一文本信息删除。

图11是据一示例性实施例提供的一种视频文件的文本信息处理装置的框图。参见图11，装置包括：

第一获取模块1101，用于获取待处理的视频文件的第一文本信息；

分词处理模块1102，用于对该第一文本信息进行分词处理，得到该第一文本信息对应的第一分词序列；

映射模块1103，用于将该第一分词序列映射为第一词向量序列；

特征提取模块1104，用于根据该第一词向量序列，对该第一文本信息进行特征提取，得到该第一文本信息的第一语义特征向量，该第一语义特征向量包括该第一文本信息的语义特征和语境特征；

改写模块1105，用于根据该第一语义特征向量，将该第一文本信息改写为符合该第一语义特征向量的目标风格的第二文本信息。

在一种可能的实现方式中，该改写模块1105，还用于通过第一文本改写模型对该第一文本信息的第一语义特征向量进行解码，得到该第一语义特征向量对应的第二词向量序列；将该第二词向量序列映射为第二分词序列；根据该第二分词序列，生成该第二文本信息。

在另一种可能的实现方式中，该改写模块1105，还用于通过该第一文本改写模型和该第一文本信息，确定该第一文本信息的关键词对应的实体词信息；将该实体词信息与该第一文本信息的第二词向量序列进行信息融合；对融合后的该实体词信息与该第一文本信息的第二词向量序列映射为该第二分词序列。

在另一种可能的实现方式中，该装置还包括：

第二获取模块，用于获取第一样本文件，该第一样本文件包括视频文件的原始文本信息和第一改写文本信息；

第一输入模块，用于将该第一样本文件输入至第二文本改写模型中，得到该第一样本文件的视频文件的第二改写文本信息；

参数调整模块，用于根据该第一改写文本信息和该第二改写文本信息，调整该第二文本改写模型的模型参数，直到通过该第二文本改写模型得到的第三改写文本信息与该原始文本信息对应的第一改写文本信息匹配为止，得到该第一文本改写模型。

该装置还包括：

确定模块，用于通过该第二文本改写模型确定该第一样本文件的第二语义特征向量；根据该第二语义特征向量确定该第一样本文件的第二文件类别标签，该第二文件类别标签为模型输出的该第一样本文件的类别标签；

该参数调整模块，还用于根据该第一文本类别标签、该第二文本类别标签、该第一改写文本信息和该第二改写文本信息，对该第二文本改写模型的参数进行调整。

在另一种可能的实现方式中，该装置还包括：

第三获取模块，用于获取原始文本改写模型，以及，获取第二样本文件，该第二样本文件中包括文本信息对应的第三分词序列；

第二输入模块，用于将该第三分词序列的部分分词序列输入至该原始文本改写模型，得到该第二样本文件的第四分词序列；

该参数调整模块，还用于根据该第四分词序列和该第三分词序列，调整该原始文本改写模型的模型参数，直到该第四分词序列包括该第三分词序列中未输入该原始文本改写模型的分词序列为止，得到该第二文本改写模型。

该装置还包括：

发送模块，用于将该至少两个第二文本信息发送给视频文件审核平台，该视频文件审核平台用于根据该至少两个第二文本信息，确定该待处理的视频文件的目标文本信息，返回该目标文本信息；

接收模块，用于接收该视频文件审核平台返回的目标文本信息；

展示模块，用于将该目标文本信息作为该待处理视频文件的文本信息进行展示。

在另一种可能的实现方式中，该特征提取模块1104，还用于通过多层注意力机制，提取该第一词向量序列的语义特征；以及，通过该多层注意力机制，确定该第一词向量序列中词向量的上下文信息；根据该上下文信息确定该第一词向量序列的语境特征；根据该语义特征和该语境特征，确定该第一文本信息的第一语义特征向量。

需要说明的是：上述实施例提供的视频文件的文本信息处理装置在视频文件的文本信息处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频文件的文本信息处理装置与视频文件的文本信息处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图12是本公开实施例提供的一种服务器的结构示意图，该服务器1200可因配置或性能不同而产生比较大的差异，可以包括处理器(Central Processing Units，CPU)1201和存储器1202，其中，该存储器1202中存储有至少一条程序代码，该至少一条程序代码由该处理器1201加载并执行以实现上述各个方法实施例提供的视频文件的文本信息处理方法。当然，该服务器1200还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，计算机可读存储介质中存储至少一条指令，至少一条指令由服务器加载并执行，以实现上述实施例中视频文件的文本信息处理方法。该计算机可读存储介质可以是存储器。例如，该计算机可读存储介质可以是ROM(Read-Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory，制度光盘)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上该仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种视频文件的文本信息处理方法，其特征在于，所述方法包括：

获取待处理的视频文件的第一文本信息；

将所述第一分词序列映射为第一词向量序列；

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一语义特征向量，将所述第一文本信息改写为符合所述第一语义特征向量的目标风格的第二文本信息，包括：

将所述第二词向量序列映射为第二分词序列；

根据所述第二分词序列，生成所述第二文本信息。

3.根据权利要求2所述的方法，其特征在于，所述将所述第二词向量序列映射为第二分词序列，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述第一样本文件还包括第一样本文件的第一文本类别标签，所述第一文本类别标签为所述第一样本文件标注的类别标签；

所述方法还包括：

根据所述第二语义特征向量确定所述第一样本文件的第二文件类别标签，所述第二文件类别标签为模型输出的所述第一样本文件的类别标签；

所述根据所述第一改写文本信息和所述第二改写文本信息，调整所述第二文本改写模型的模型参数，包括：

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述第二文本信息的数量为至少两个；

接收所述视频文件审核平台返回的目标文本信息；

8.根据权利要求1所述的方法，其特征在于，所述根据所述第一词向量序列，对所述第一文本信息进行特征提取，得到所述第一文本信息的第一语义特征向量，包括：

根据所述上下文信息确定所述第一词向量序列的语境特征；

9.一种视频文件的文本信息处理装置，其特征在于，所述装置包括：

10.一种服务器，其特征在于，所述服务器包括处理器和存储器，所述存储器中存储至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至8任一所述的视频文件的文本信息处理方法。