CN116719914A

CN116719914A - 一种文本提取方法、系统及相关装置

Info

Publication number: CN116719914A
Application number: CN202310492886.5A
Authority: CN
Inventors: 刘聪; 孔常青; 吴苇康; 刘超凡; 熊世富; 戚婷; 郭晓天; 胡国平; 魏思; 王士进; 高建清; 刘权
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2023-04-28
Filing date: 2023-04-28
Publication date: 2023-09-08

Abstract

本申请公开了一种文本提取方法、系统及相关装置，该方法包括：获取待处理文本和提取意图；其中，所述提取意图用于指示至少一种预设提炼需求；基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级特征和段级特征；其中，所述句级特征与所述待处理文本中的语句对应，所述段级特征与所述待处理文本中的段落对应；对所述句级特征和所述段级特征进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本。通过上述方式，本申请能够提高获取目标文本的效率和准确性。

Description

一种文本提取方法、系统及相关装置

技术领域

本申请涉及文本处理技术领域，特别是涉及一种文本提取方法、系统及相关装置。

背景技术

在面对如会议、演讲或课堂等场景的活动之后，为对活动内容进行追溯，用户往往需要对与活动相关的文本中的部分内容进行提取或提炼，以生成与其需求相匹配的目标文本。因此，获得目标文本的准确性和效率往往会直接影响用户的工作或学习效率。

现有目标文本的提取方法，主要是依靠关键词搜索或人工查找的方式。其中，依靠关键词搜索的方式在一定程度上只能快速从活动相关的文本中定位到与用户输入的关键词匹配的原始文本，以作为目标文本，但对于文本量较大的情况，搜索到的目标文本内容较多，仍需用户进行进一步地筛选和概括；人工查找的方式则需要用户依次对活动相关的文本进行浏览，并提取概括出与需求相匹配的目标文本，效率较低。有鉴于此，如何准确且高效地提取出与用户需求匹配的目标文本成为了亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种文本提取方法、系统及相关装置，能够提高获取目标文本的效率和准确性。

为解决上述技术问题，本申请采用的一个技术方案是：提供一种文本提取方法，包括：获取待处理文本和提取意图；其中，所述提取意图用于指示至少一种预设提炼需求；基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级特征和段级特征；其中，所述句级特征与所述待处理文本中的语句对应，所述段级特征与所述待处理文本中的段落对应；对所述句级特征和所述段级特征进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本。

为解决上述技术问题，本申请采用的另一个技术方案是：提供一种文本提取系统，包括：获取模块，用于获取待处理文本和提取意图；其中，所述提取意图用于指示至少一种预设提炼需求；编码模块，用于基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级特征和段级特征；其中，所述句级特征与所述待处理文本中的语句对应，所述段级特征与所述待处理文本中的段落对应；解码模块，用于对所述句级特征和所述段级特征进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本。

为解决上述技术问题，本申请采用的另一个技术方案是：提供一种电子设备，包括：相互耦接的存储器和处理器，所述存储器存储有程序指令，所述处理器调用所述程序指令以执行如上述技术方案中提到的文本提取方法。

为解决上述技术问题，本申请采用的另一个技术方案是：提供一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现如上述技术方案中提到的文本提取方法。

本申请的有益效果是：区别于现有技术的情况，本申请提出的文本提取方法，根据至少一种预设提炼需求得到提取意图后，基于提取意图和待处理文本进行编码，得到对应的句级特征和段级特征。通过对句级特征和段级特征进行解码，得到与提取意图指示的预设提炼需求相匹配的目标文本。该方法可以根据不同的预设提炼需求从待处理文本中准确提取出对应的目标文本，提高了目标文本的获取效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。其中：

图1是本申请文本提取方法一实施方式的流程示意图；

图2是本申请文本提取模型一实施方式的结构示意图；

图3是步骤S102对应另一实施方式的流程示意图；

图4是步骤S103对应另一实施方式的流程示意图；

图5是步骤S302对应一实施方式的流程示意图；

图6为本申请文本提取模型另一实施方式的结构示意图；

图7为步骤S303对应另一实施方式的流程示意图；

图8是本申请提出的文本提取系统一实施方式的结构示意图；

图9是本申请电子设备一实施方式的结构示意图；

图10是本申请计算机可读存储介质一实施方式的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1是本申请文本提取方法一实施方式的流程示意图，该方法包括：

S101：获取待处理文本和提取意图。其中，提取意图用于指示至少一种预设提炼需求。

具体地，步骤S101具体包括：获取与当前场景相关的待处理文本，以及与待处理文本相关的提取意图。其中，上述当前场景可以包括会议场景、教学场景或演讲场景等中的一种。

在一实施方式中，待处理文本包括基于语音数据得到的参考文本，或者待处理文本包括参考文本和基于辅助数据得到的概要文本。其中，辅助数据包括文本内容和图像内容中的至少一种。

在一实施场景中，上述参考文本是基于与当前场景相关的音频数据得到的。

具体地，通过语音识别技术将当前场景下的音频数据转换成文本，以得到上述参考文本。其中，该音频数据可以是对当前场景的音频数据进行实时采集获得的，也可以是获取的用户上传的音频文件。

在另一实施场景中，上述概要文本的获得过程包括：响应于辅助数据包括文本内容和图像内容。将文本内容作为对应的摘要文本。对该图像内容进行识别，以获得对应的识别文本。将得到的识别文本按照既定格式进行排版，以得到上述概要文本。其中，可以通过OCR(Optical Character Recognition，光学字符识别)技术对上述图像内容进行识别，以获得对应的识别文本。

当然，在其他实施场景中，辅助数据也可以只包括文本内容或图像内容。

在一具体实施场景中，上述文本内容可以是获取的用户在参考文本中选择的文本；例如，响应于相关设备上实时显示生成的参考文本，且用户通过下划线或圈选等方式对参考文本中的部分文本进行选择，以期望根据其选择的文本提取出符合其需求的文本，获取用户所选择的文本，以作为文本内容。或者，上述文本内容也可以是获取的用户上传的文本。其中，上述用户上传的文本可以是用户获取的与参考文本或当前场景相关的文本；例如，用户根据当前场景涉及到的信息，通过网络搜索到的相关内容。

在另一具体实施场景中，上述图像内容可以是包含用户手写内容的图片；例如，响应于用户参加会议，并在具备手写功能的电子设备上进行手写以记录会议中的重点信息，通过上述电子设备获取包含用户手写的重点信息的图像，以作为上述图像内容。另外，在会议过程中，也可以将用户下载的图片或PPT，作为上述图像内容。

在又一具体实施场景中，上述图像内容可以是通过电子设备的摄像装置对用户的手写内容进行采集获得的；或者，上述图像内容也可以是对会议中展示的PPT或图像等进行采集得到的。

在又一实施方式中，上述提取意图用于根据用户需求对待处理文本进行提取，以提高提取得到的文本与用户需求的契合度。该提取意图可以为根据用户需求生成的意图文本，也可以是根据包含用户需求的操作指令所生成的意图指令。上述提取意图指示的预设提炼需求由提炼对象和提炼类型组成，其中，提炼对象至少包括待处理文本全文或待处理文本中的指定内容，提炼类型包括提炼摘要、提炼重点句、提炼相关句、提炼纪要、提炼待办事项和其他提炼类型，且其他提炼类型区别于提炼摘要、提炼重点句、提炼相关句、提炼纪要和提炼待办事项，也就是说，提炼类型至少包括提炼摘要、提炼重点句、提炼相关句、提炼纪要和提炼待办事项。

在一具体实施场景中，响应于用户参加会议之后，得到与会议相关的参考文本和摘要文本，为对整个会议内容进行总结以生成会议纪要，则生成意图文本：“根据参考文本和摘要文本对本次会议进行总结”，并将该意图文本作为提取意图。

在另一具体实施方式中，响应于会议过程中会议组织者口头发布多个待办事项，为提取会议中的待办事项，则生成意图文本：“从参考文本和摘要文本中提取待办事项”，并将该意图文本作为提取意图。

在又一具体实施方式中，响应于基于用户的手写内容得到多条概要文本，且用户需要从参考文本中概括出第二条概要文本相关的内容，则生成提取意图：“对本次会议中与第二条概要文本相关的内容进行总结”，并将该意图文本作为提取意图。

在又一具体实施方式中，响应于相关设备具备本申请提出的文本提取方法所对应的功能，且用户在该相关设备上点击“生成会议纪要”的按钮，则将该点击操作作为用户的意图指令，并基于意图指令生成提取意图，以对得到的待识别文本进行处理生成对应的会议纪要。

S102：基于提取意图对待处理文本进行编码，得到待处理文本对应的句级特征和段级特征。其中，句级特征与待处理文本中的语句对应，段级特征与待处理文本中的段落对应。

在一实施方式中，步骤S102包括：基于提取意图对参考文本中每个语句进行编码，得到与参考文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征。

进一步地，基于提取意图对概要文本中每个段落进行编码，得到与参考文本中每个段落所匹配的段落信息和提取意图所指示的预设提炼需求相关的段级特征。

其中，上述提到的句级特征和段级特征可以为向量，或区别于向量的其他形式的特征。

具体地，请参阅图2，图2为本申请文本提取模型一实施方式的结构示意图。将上述提取意图以及参考文本输入预先构建的文本提取模型100中，以使得文本提取模型100中的句级编码器10对提取意图和参考文本中每个语句进行编码，以得到参考文本中每个语句对应的句级特征；以及，使得文本提取模型100中的段级编码器20对提取意图和参考文本中每个语句进行编码，以得到参考文本中每个段落对应的段级特征。

在一实施场景中，上述句级编码器10在获得提取意图和参考文本后，将参考文本中的每个语句与提取意图结合，作为待编码语句，并对该待编码语句进行编码以获得对应的句级特征。

上述段级编码器20在获得提取意图和参考文本后，将参考文本中每个段落与提取意图结合，作为待编码段落，并对该待编码段落进行编码以获得对应的段级特征。

在另一实施场景中，上述句级编码器10在获得提取意图和参考文本后，对提取意图进行编码，以获得对应的提示特征；以及对参考文本中每个语句进行编码，以获得每个语句对应的初始语句特征，通过将提示特征与每个初始语句特征进行融合，以获得参考文本中每个语句对应的句级特征。

上述段级编码器20在获得提取意图和参考文本后，对提取意图进行编码，以获得对应的提示特征，以及对参考文本中每个段落进行编码，以获得对应的初始段落特征，通过将提示特征与每个初始段落特征进行融合，以获得参考文本中每个段落对应的段级特征。

需要说明的是，本实施场景中，为节省计算资源，对同一提取意图进行编码以获得对应的提示特征的步骤可以仅执行一次，具有可以由句级编码器10或段级编码器20执行。

在另一实施方式中，响应于获得概要文本，基于提取意图对概要文本中每个语句进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征。

具体地，在将提取意图以及参考文本输入预先构建的文本提取模型100的同时，将获得的概要文本一并输入至该文本提取模型100，以使得句级编码器10基于该概要文本中的每个语句和提取意图进行编码，得到上述句级特征。其中，具体实施过程可参照获得参考文本中每个语句对应的句级特征的过程，在此不进行详细阐述。

需要说明的是，响应于待处理文本包括参考文本和上述概要文本时，得到与参考文本中每个语句所匹配的语句信息和提取意图所提示的预设提炼需求相关的句级特征、以及得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征的顺序不分先后。另外，针对待处理文本仅包含一句文本，则句级向量和段级向量都是基于待处理文本中所包含的该句文本得到的，且该句级向量和段级向量相同。

S103：对句级特征和段级特征进行解码，得到与提取意图指示的预设提炼需求相匹配的目标文本。

在一实施方式中，步骤S103的实施过程包括：将获得的句级特征和段级特征输入至文本提取模型100中的文本解码器101，该文本解码器101利用集中注意力机制对句级解析特征和段级解析特征进行解析，得到文本解析特征。

进一步地，文本解码器101对得到的文本解析特征进行解码，以获得由多个解码字符组成的目标文本。

本申请提出的文本提取方法，根据至少一种预设提炼需求得到提取意图后，基于提取意图和待处理文本进行编码，得到对应的句级特征和段级特征。通过对句级特征和段级特征进行解码，得到与提取意图指示的预设提炼需求相匹配的目标文本。该方法可以根据不同的预设提炼需求从待处理文本中准确提取出对应的目标文本，提高了目标文本的获取效率。

在另一应用方式中，请结合图2参阅图3，图3为步骤S102对应另一实施方式的流程示意图。响应于参考文本中每个段落匹配有参考人物，步骤S102具体包括：

S201：基于提取意图对参考文本中每个语句，以及参考文本中每个语句所处段落对应的参考人物进行编码，得到与参考文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求，以及参考人物所匹配的人物信息相关的句级特征。

在一实施方式中，步骤S201之前包括：获取与当前场景相关的多个参考人物的声音信息，基于多个声音信息对当前场景相关的语音数据进行划分，以获得上述语音数据中每个参考人物对应的音频片段。

具体地，上述声音信息包括每个参考人物的声纹，通过将语音数据中的音频与声纹进行比对，以确定每个参考人物对应的音频片段。其中，音频片段包括对应参考人物所说的话。

进一步地，对每个参考人物对应的音频片段进行语音识别，以得到每个音频片段对应的转写文本，即得到每个参考人物所说话对应的文本。基于所有转写文本，得到参考文本。

具体地，按照上述语音数据中对应的每个参考人物的说话顺序，将得到的所有转写文本进行排序，得到参考文本。其中，得到的参考文本中每段文本对应有一个参考人物，且每段文本前标注对应的参考人物。

进一步地，步骤S201的具体实施过程包括：将得到的参考文本以及提取意图输入文本提取模型100中的句级编码器10中，以使得句级编码器10在参考文本中每个语句与对应的参考人物进行结合，并基于结合后的语句与提取意图，得到对应的句级特征。

在一实施场景中，句级编码器10将参考文本中每个语句中添加对应的参考人物以及提取意图，并对添加后的语句进行编码得到句级特征。其中，上述添加参考人物的方式包括在每个语句的起始位置标注对应的参考人物。

可选地，在其他实施场景中，针对参考文本中的每个语句，句级编码器10分别对该语句、该语句对应的参考人物以及提取意图进行编码，以分别得到对应的初始语句特征、参考人物特征和提示特征。将该初始语句特征、参考人物特征和提示特征进行融合，得到对应的句级特征。

S202：基于提取意图对参考文本中每个段落，以及参考文本中每个段落对应的参考人物进行编码，得到与参考文本中每个段落所匹配的段落信息和提取意图所指示的预设提炼需求，以及参考人物所匹配的人物信息相关的段级特征。

具体地，将得到的参考文本以及提取意图输入文本提取模型100中的段级编码器20中，以使得段级编码器20将参考文本中每个段落与对应的参考人物进行结合，并基于结合后的段落以及提取意图，得到对应的段级特征。

在一实施场景中，段级编码器20在参考文本中每个段落中添加对应的参考人物以及提取意图，并对添加后的段落进行编码得到段级特征。其中，上述添加参考人物的方式包括在每个段落的起始位置标注对应的参考人物。

可选地，在其他实施场景中，针对参考文本中的每个段落，段级编码器分别对该段落、该段落对应的参考人物以及提取意图进行编码，以分别得到对应的初始段落特征、参考人物特征和提示特征。将该初始段落特征、参考人物特征和提示特征进行融合，得到对应的段级特征。

上述方案，通过结合对应参考人物生成对应的句级特征和段级特征，以使得在提取意图包含参考人物信息时，对指定参考人物对应的文本进行文本提取，以满足用户在更多场景下的文本提取需求，进一步地提高文本提取的准确性。

另外，需要说明的是，在实际应用过程中，上述步骤S201和步骤S202的具体实施过程不分先后。

在又一实施方式中，响应于待处理文本中包括参考文本和概要文本，且概要文本匹配有辅助数据的辅助标识，则步骤S102中基于提取意图对概要文本中每个语句进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征的过程包括：

基于提取意图对概要文本中每个语句，以及概要文本匹配的辅助标识进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求，以及辅助标识所匹配的标识信息相关的句级特征。

在一实施场景中，将概要文本以及提取意图输入至文本提取模型中的句级编码器，以使得句级编码器在概要文本中的每个语句中添加对应的辅助标识和提取意图，并对添加后的各个语句进行编码，得到对应的句级特征。

在一具体实施场景中，响应于概要文本是基于对手写内容和图像内容对应的文本进行概括得到的，将概要文本中与手写内容对应的每个语句的起始位置添加“手写标识”的标注，将与图像内容对应的每个语句的起始位置添加“图像标识”的标注。将添加标注后的语句以及提取意图输入至文本提取模型中的句级编码器，以得到概要文本中每个语句对应的句级特征。

在又一实施方式中，请结合图2参阅图4，图4为步骤S103对应另一实施方式的流程示意图。具体地，步骤S103包括：

S301：获取当前已输出字符对应的字符特征。

具体地，步骤S301的实施过程包括：响应于文本提取模型100输出当前轮次的字符，将输出的该字符输入文本提取模型100中的自注意力网络30中，以获取当前轮次字符对应的字符特征，以助于后续文本提取模型100根据当前轮次输出的字符对应的字符特征，输出下一轮次的字符，提高输出的下一轮次字符的准确性。

S302：基于提取意图所提示的预设提炼需求，对字符特征、句级特征和段级特征进行解析，得到文本解析特征。其中，文本解析特征与已输出字符、句级特征对应的语句所匹配的语句信息，以及段级特征对应的段落所匹配的段落信息相关。

在一实施方式中，请参阅图5，图5为步骤S302对应一实施方式的流程示意图。具体地，步骤S302的实施过程包括：

S3021：基于提取意图所指示的预设提炼需求、已输出字符和句级特征对应的语句所匹配的语句信息，对字符特征和句级特征进行解析，得到句级解析特征。

在一实施方式中，步骤S3021的实施过程包括：响应于自注意力网络30输出当前轮次的字符特征，将自注意力网络30输出的字符特征以及句级编码器10输出的句级特征输入至第一交叉注意力网络40，以对字符特征和句级特征进行解析，得到句级解析特征。该句级解析特征中包含与当前轮次输出字符相关的细节信息，有助于提高文本提取模型100输出下一轮次的字符的准确性。

S3022：基于提取意图所指示的预设提炼需求和段级特征对应的段落所匹配的段落信息，对句级解析特征和段级特征进行解析，得到文本解析特征。

在一实施方式中，步骤S3022的实施过程包括：将第一交叉注意力网络40输出的句级解析特征和段级编码器20输出的段级特征输入至第二交叉注意力网络50，以使得第二交叉注意力网络50对句级解析特征和段级特征进行解析，并输出文本解析特征。

该方式使得文本提取模型100不仅关注待处理文本中每个语句以及当前轮次输出字符的语义信息，还关注同一段落中不同语句之间的关联信息，使得得到的文本解析特征包含更丰富的语义信息，从而进一步提高模型输出下一轮次字符的准确性，以及提高模型最终输出的目标文本与用户预设提炼需求的契合度。

S303：基于文本解析特征，解码得到当前轮次的解码字符。

在一实施方式中，步骤S303的实施过程包括：将第二交叉注意力网络50输出的文本解析特征输入add&Norm层60和Feed Forward层70，以对该文本解析特征进行残差连接和归一化操作后，再进行线性变换，以得到文本解析特征对应的深层特征。其中，上述add&Norm层60和Feed Forward层70的具体结构可参照现有技术中的Transformer网络结构，在此不进行详细说明。

进一步地，将上述深层特征依次输入全连接层80和Softmax层90，以得到各个候选字符对应的候选概率，将最高的候选概率对应的候选字符作为下一轮次的解码字符输出，并将输出的解码字符更新为当前轮次的解码字符。

S304：利用解码字符更新已输出字符，并返回获取当前的已输出字符对应的字符特征的步骤，直至得到与提取意图指示的预设提炼需求相匹配的目标文本。其中，目标文本由最终的已输出字符组成。

在一实施方式中，步骤S304的实施过程包括：响应于经过上述步骤得到当前轮次的解码字符，将当前轮次的解码字符添加至已输出字符的最后，从而对输出字符进行更新。

进一步地，返回至步骤S301，直至文本提取模型输出所有字符，得到由所有输出的字符组成的目标文本。

在另一实施方式中，请参阅图6和图7，图6为本申请文本提取模型另一实施方式的结构示意图，图7为步骤S303对应另一实施方式的流程示意图。在本实施方式中，文本提取模型中还包括预设词库匹配层81。步骤S303包括：

S3031：基于文本解析特征，获得当前轮次的候选字符及其对应的候选概率。

在一实施方式中，步骤S3031的实施过程包括：响应于得到第二交叉注意力网络50输出的文本解析特征，对该文本解析特征进行解析，以获得当前轮次输出的候选字符及其对应的候选概率。其中，具体过程可参照上述对应实施方式。

S3032：响应于获得预设词库，利用每个候选字符和至少部分已输出字符与预设词库进行匹配，确定每个候选字符的加权系数，利用加权系数调整候选概率。其中，从预设词库中匹配到词组的候选字符对应的加权系数，大于从预设词库中未匹配到词组的候选字符对应的加权系数。

在一实施方式中，步骤S3032的实施过程包括：获取与待处理文本相关的预设词库。例如，响应于待处理文本为当前会议场景下得到参考文本和概要文本，则基于当前会议场景的主题，构建预设词库，以用于提高后续得到目标文本的准确性。

进一步地，利用每个候选字符和至少部分已输出字符进行组合，以得到每个候选字符对应的候选词组，将该候选词组输入预设词库匹配层81，以与预设词库中的词组进行匹配，若预设词库中存在与候选词组相同的词组，则赋予该候选词组对应的候选字符第一加权系数；若预设词库中不存在与候选词组相同的词组，则赋予该候选词组对应的候选字符第二加权系数。其中，第一加权系数大于第二加权系数。

进一步地，响应于获取到每个候选字符对应的加权系数，将每个候选字符的候选概率与对应的加权系数相乘，以对该候选字符的候选概率进行调整。

上述方案，通过将生成的候选字符与预设词库中的词组进行比对，从而对于预设词库中词组匹配的候选字符的候选概率调高，以提高后续输出当前轮次的解码字符的准确率。

在一具体实施场景中，第一加权系数的值大于1，第二加权系数的值为1。

在另一实施方式中，根据与预设主题的相关度，对预设词库中的每个词组设置不同的加权系数。响应于每个候选字符和至少部分已输出字符与预设词库的词组匹配，利用将该匹配的词组对应的加权系数对候选字符的候选概率进行调整。其中，预设词库中词组与预设主题的相关度越高，则该词组对应的加权系数越大。

S3033：基于所有候选字符对应的候选概率，确定当前轮次的解码字符。

在一实施方式中，步骤S3033的实施过程包括：响应于获得所有候选字符调整后的候选概率，利用Softmax层90对所有候选概率进行归一化处理，并将归一化处理后得到的最高概率对应的候选字符作为当前轮次的解码字符。

在又一实施方式中，请继续参阅图2或图3，上述任一实施方式中提到的目标文本是利用预先构建的文本提取模型提取得到的，且该文本提取模型是利用多个标注有预设提炼需求的训练文本进行训练得到的。

在一实施场景中，上述文本提取模型的训练方法包括：利用与多种预设提炼需求相匹配的示例文本预训练后，再利用训练文本和多种提取意图训练得到的。该训练文本标注有与多种预设提炼需求对应的提炼文本，该预设提炼需求包括提炼摘要、提炼重点句、提炼相关句、提炼纪要和提炼待办事项等。

其中，文本提取模型包括用于对待处理文本和提取意图进行编码的句级编码器10和段级编码器20，以及用于解码的文本解码器101，且句级编码器10至少包括Transformer网络，段级编码器20至少包括双向长短期记忆网络，文本解码器101至少包括相互级联的第一交叉注意力网络40和第二交叉注意力网络50。

请参阅图8，图8为本申请提出的文本提取系统一实施方式的结构示意图。该文本提取系统包括：获取模块200、编码模块300和解码模块400。

具体而言，获取模块200用于获取待处理文本和提取意图。其中，提取意图用于指示至少一种预设提炼需求。

在一实施场景中，待处理文本包括基于语音数据得到的参考文本，或者待处理文本包括参考文本和基于辅助数据得到的概要文本；其中，辅助数据包括手写内容和图像内容中的至少一种。

另外，在本实施场景汇总，预设提炼需求由提炼对象和提炼类型组成，其中，提炼对象至少包括待处理文本全文或待处理文本中的指定内容，提炼类型至少包括提炼摘要、提炼重点句、提炼相关句、提炼纪要和提炼待办事项。

编码模块300用于基于提取意图对待处理文本进行编码，得到待处理文本对应的句级特征和段级特征；其中，句级特征与待处理文本中的语句对应，段级特征与待处理文本中的段落对应。

在一实施场景中，请继续参阅图8，编码模块300还包括句级编码子模块301和段级编码子模块302。

其中，句级编码子模块301用于基于提取意图对参考文本中每个语句进行编码，得到与参考文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征；以及，响应于获得概要文本，基于提取意图对概要文本中每个语句进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征。

段级编码子模块302用于基于提取意图对参考文本中每个段落进行编码，得到与参考文本中每个段落所匹配的段落信息和提取意图所指示的预设提炼需求相关的段级特征。

在另一实施场景中，参考文本中每个段落匹配有参考人物，句级编码子模块301基于提取意图对参考文本中每个语句进行编码，得到与参考文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征，包括：基于提取意图对参考文本中每个语句，以及参考文本中每个语句所处段落对应的参考人物进行编码，得到与参考文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求，以及参考人物所匹配的人物信息相关的句级特征。

段级编码子模块302基于提取意图对参考文本中每个段落进行编码，得到与参考文本中每个段落所匹配的段落信息和提取意图所指示的预设提炼需求相关的段级特征，包括：基于提取意图对参考文本中每个段落，以及参考文本中每个段落对应的参考人物进行编码，得到与参考文本中每个段落所匹配的段落信息和提取意图所指示的预设提炼需求，以及参考人物所匹配的人物信息相关的段级特征。

在又一实施场景中，响应于概要文本匹配有辅助数据的辅助标识，句级编码子模块301基于提取意图对概要文本中每个语句进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求相关的句级特征，包括：基于提取意图对概要文本中每个语句，以及概要文本匹配的辅助标识进行编码，得到与概要文本中每个语句所匹配的语句信息和提取意图所指示的预设提炼需求，以及辅助标识所匹配的标识信息相关的句级特征。

解码模块400用于对句级特征和段级特征进行解码，得到与提取意图指示的预设提炼需求相匹配的目标文本。

在一实施场景中，解码模块400对句级特征和段级特征进行解码，得到与提取意图指示的预设提炼需求相匹配的目标文本，包括：获取当前的已输出字符对应的字符特征；基于提取意图所指示的预设提炼需求，对字符特征、句级特征和段级特征进行解析，得到文本解析特征；其中，文本解析特征与已输出字符、句级特征对应的语句所匹配的语句信息，以及段级特征对应的段落所匹配的段落信息相关；基于文本解析特征，解码得到当前轮次的解码字符；利用解码字符更新已输出字符，并返回获取当前的已输出字符对应的字符特征的步骤，直至得到与提取意图指示的预设提炼需求相匹配的目标文本；其中，目标文本由最终的已输出字符组成。

其中，解码模块400基于提取意图所指示的预设提炼需求，对字符特征、句级特征和段级特征进行解析，得到文本解析特征，包括：基于提取意图所指示的预设提炼需求、已输出字符和句级特征对应的语句所匹配的语句信息，对字符特征和句级特征进行解析，得到句级解析特征；基于提取意图所指示的预设提炼需求和段级特征对应的段落所匹配的段落信息，对句级解析特征和段级特征进行解析，得到文本解析特征。

在一实施场景中，请继续参阅图8，解码模块400还包括候选词库匹配模块401，该候选词库匹配模块401用于：基于文本解析特征，获得当前轮次的候选字符及其对应的候选概率；响应于获得预设词库，利用每个候选字符和至少部分已输出字符与预设词库进行匹配，确定每个候选字符的加权系数，利用加权系数调整候选概率；其中，从预设词库中匹配到词组的候选字符对应的加权系数，大于从预设词库中未匹配到词组的候选字符对应的加权系数；基于所有候选字符对应的候选概率，确定当前轮次的解码字符。

请参阅图9，图9为本申请电子设备一实施方式的结构示意图。该电子设备包括：相互耦接的存储器500和处理器600，存储器500存储有程序指令，处理器600调用上述程序指令以实现上述任一实施方式中提到的文本提取方法。具体地，电子设备包括但不限于：台式计算机、笔记本电脑、平板电脑、服务器等，在此不做限定。此外，处理器600还可以称为CPU(Center Processing Unit,中央处理单元)。处理器600可能是一种集成电路芯片，具有信号处理能力。处理器600还可以是、通用处理器、数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器600可以由集成电路芯片共同实现。

请参阅图10，图10为本申请计算机可读存储介质一实施方式的结构示意图，该计算机可读存储介质700上存储有能够被处理器运行的程序指令701，程序指令701被处理器执行时实现上述任一实施例中提到的文本提取方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种文本提取方法，其特征在于，所述文本提取方法包括：

获取待处理文本和提取意图；其中，所述提取意图用于指示至少一种预设提炼需求；

基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级特征和段级特征；其中，所述句级特征与所述待处理文本中的语句对应，所述段级特征与所述待处理文本中的段落对应；

对所述句级特征和所述段级特征进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本。

2.根据权利要求1所述的方法，其特征在于，所述待处理文本包括基于语音数据得到的参考文本，或者所述待处理文本包括所述参考文本和基于辅助数据得到的概要文本；其中，所述辅助数据包括文本内容和图像内容中的至少一种。

3.根据权利要求2所述的方法，其特征在于，所述基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级特征和段级特征，包括：

基于所述提取意图对所述参考文本中每个语句进行编码，得到与所述参考文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求相关的句级特征；以及，

响应于获得所述概要文本，基于所述提取意图对所述概要文本中每个语句进行编码，得到与所述概要文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求相关的句级特征；

基于所述提取意图对所述参考文本中每个段落进行编码，得到与所述参考文本中每个段落所匹配的段落信息和所述提取意图所指示的预设提炼需求相关的段级特征。

4.根据权利要求3所述的方法，其特征在于，所述参考文本中每个段落匹配有参考人物；

所述基于所述提取意图对所述参考文本中每个语句进行编码，得到与所述参考文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求相关的句级特征，包括：

基于所述提取意图对所述参考文本中每个语句，以及所述参考文本中每个语句所处段落对应的所述参考人物进行编码，得到与所述参考文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求，以及所述参考人物所匹配的人物信息相关的句级特征；

所述基于所述提取意图对所述参考文本中每个段落进行编码，得到与所述参考文本中每个段落所匹配的段落信息和所述提取意图所指示的预设提炼需求相关的段级特征，包括：

基于所述提取意图对所述参考文本中每个段落，以及所述参考文本中每个段落对应的所述参考人物进行编码，得到与所述参考文本中每个段落所匹配的段落信息和所述提取意图所指示的预设提炼需求，以及所述参考人物所匹配的人物信息相关的段级特征。

5.根据权利要求3所述的方法，其特征在于，所述概要文本匹配有所述辅助数据的辅助标识；

所述基于所述提取意图对所述概要文本中每个语句进行编码，得到与所述概要文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求相关的句级特征，包括：

基于所述提取意图对所述概要文本中每个语句，以及所述概要文本匹配的所述辅助标识进行编码，得到与所述概要文本中每个语句所匹配的语句信息和所述提取意图所指示的预设提炼需求，以及所述辅助标识所匹配的标识信息相关的句级特征。

6.根据权利要求1所述的方法，其特征在于，所述对所述句级特征和所述段级特征进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本，包括：

获取当前的已输出字符对应的字符特征；

基于所述提取意图所指示的预设提炼需求，对所述字符特征、所述句级特征和所述段级特征进行解析，得到文本解析特征；其中，所述文本解析特征与所述已输出字符、所述句级特征对应的语句所匹配的语句信息，以及所述段级特征对应的段落所匹配的段落信息相关；

基于所述文本解析特征，解码得到当前轮次的解码字符；

利用所述解码字符更新所述已输出字符，并返回所述获取当前的已输出字符对应的字符特征的步骤，直至得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本；其中，所述目标文本由最终的所述已输出字符组成。

7.根据权利要求6所述的方法，其特征在于，所述基于所述提取意图所指示的预设提炼需求，对所述字符特征、所述句级特征和所述段级特征进行解析，得到文本解析特征，包括：

基于所述提取意图所指示的预设提炼需求、所述已输出字符和所述句级特征对应的语句所匹配的语句信息，对所述字符特征和所述句级特征进行解析，得到句级解析特征；

基于所述提取意图所指示的预设提炼需求和所述段级特征对应的段落所匹配的段落信息，对所述句级解析特征和所述段级特征进行解析，得到所述文本解析特征。

8.根据权利要求6所述的方法，其特征在于，所述基于所述文本解析特征，解码得到当前轮次的解码字符，包括：

基于所述文本解析特征，获得当前轮次的候选字符及其对应的候选概率；

响应于获得预设词库，利用每个所述候选字符和至少部分所述已输出字符与所述预设词库进行匹配，确定每个所述候选字符的加权系数，利用所述加权系数调整所述候选概率；其中，从所述预设词库中匹配到词组的候选字符对应的加权系数，大于从所述预设词库中未匹配到词组的候选字符对应的加权系数；

基于所有所述候选字符对应的所述候选概率，确定当前轮次的解码字符。

9.根据权利要求1所述的方法，其特征在于，所述预设提炼需求由提炼对象和提炼类型组成，其中，所述提炼对象至少包括待处理文本全文或待处理文本中的指定内容，所述提炼类型至少包括提炼摘要、提炼重点句、提炼相关句、提炼纪要和提炼待办事项。

10.根据权利要求1-9任一项所述的方法，其特征在于，所述目标文本是利用文本提取模型提取得到的，所述文本提取模型是利用与多种所述预设提炼需求相匹配的示例文本预训练后，再利用训练文本和多种所述提取意图训练得到的，所述训练文本标注有与多种所述预设提炼需求对应的提炼文本；

其中，所述文本提取模型包括用于对所述待处理文本和提取意图进行编码的句级编码器和段级编码器，以及用于解码的文本解码器，所述句级编码器至少包括Transformer网络，所述段级编码器至少包括双向长短期记忆网络，所述文本解码器至少包括相互级联的第一交叉注意力网络和第二交叉注意力网络。

11.一种文本提取系统，其特征在于，所述文本提取系统包括：

获取模块，用于获取待处理文本和提取意图；其中，所述提取意图用于指示至少一种预设提炼需求；

编码模块，用于基于所述提取意图对所述待处理文本进行编码，得到所述待处理文本对应的句级向量和段级向量；其中，所述句级向量与所述待处理文本中的语句对应，所述段级向量与所述待处理文本中的段落对应；

解码模块，用于对所述句级向量和所述段级向量进行解码，得到与所述提取意图指示的所述预设提炼需求相匹配的目标文本。

12.一种电子设备，其特征在于，包括：相互耦接的存储器和处理器，所述存储器存储有程序指令，所述处理器调用所述程序指令以执行如权利要求1-10中任一项所述的文本提取方法。

13.一种计算机可读存储介质，其上存储有程序指令，其特征在于，所述程序指令被处理器执行时实现如权利要求1-10中任一项所述的文本提取方法。