CN112733505A - 文档生成方法和装置、电子设备及存储介质 - Google Patents

文档生成方法和装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112733505A
CN112733505A CN202011615127.6A CN202011615127A CN112733505A CN 112733505 A CN112733505 A CN 112733505A CN 202011615127 A CN202011615127 A CN 202011615127A CN 112733505 A CN112733505 A CN 112733505A
Authority
CN
China
Prior art keywords
information
sample
document
final
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011615127.6A
Other languages
English (en)
Other versions
CN112733505B (zh
Inventor
谢智鹏
万根顺
高建清
刘聪
王智国
胡国平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202011615127.6A priority Critical patent/CN112733505B/zh
Publication of CN112733505A publication Critical patent/CN112733505A/zh
Application granted granted Critical
Publication of CN112733505B publication Critical patent/CN112733505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种文档生成方法和装置、电子设备及存储介质。该方法包括:获取原始记录数据;利用识别模型对原始记录数据进行处理,得到最终记录文档,其中,最终记录文档包括原始记录数据对应的文本信息以及文本信息的衍生信息,衍生信息包括对文本信息添加的第一标记和/或从文本信息中提取的用于构成结构化信息的关键信息。通过上述方式,能够实现对原始记录数据的智能整理,提高对原始记录数据的处理效率。

Description

文档生成方法和装置、电子设备及存储介质
技术领域
本申请涉及自然语言处理领域,特别是涉及一种文档生成方法和装置、电子设备及存储介质。
背景技术
在会议、演讲、听报告等等场景中,人们常常需要当场将说话人口述的内容以音频或者文档(原始记录数据)的形式记录下来,以便后续使用。但是,往往当场记录的音频或者文档中有很多冗余的内容,因此需要用户手动对其进一步处理,例如标记、关键信息提取等等,以找出实际需要的内容(最终记录文档)。这种用户处理的方式不仅需要耗费人力成本,而且处理效率不高。
发明内容
本申请提供一种文档生成方法和装置、电子设备及存储介质,能够实现对原始记录数据的智能整理,提高对原始记录数据的处理效率。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种文档生成方法。该方法包括:获取原始记录数据;利用识别模型对原始记录数据进行处理,得到最终记录文档,其中,最终记录文档包括原始记录数据对应的文本信息以及文本信息的衍生信息,衍生信息包括对文本信息添加的第一标记和/或从文本信息中提取的用于构成结构化信息的关键信息。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括处理器、与处理器连接的存储器,其中,存储器存储有程序指令;处理器用于执行存储器存储的程序指令以实现上述方法。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种一种文档生成装置,该装置包括:获取模块,用于获取原始记录数据;处理模块,用于利用识别模型对原始记录数据进行处理,得到最终记录文档,其中,最终记录文档包括原始记录数据对应的文本信息以及文本信息的衍生信息,衍生信息包括对文本信息添加的第一标记和/或从文本信息中提取的用于构成结构化信息的关键信息。
通过上述方式,本申请可以利用识别模型对原始记录数据进行处理,处理的方式可以包括标记、关键信息提取等,以得到原始记录数据对应的文本信息的衍生信息,生成在原始记录数据对应的文本信息的基础上添加了衍生信息的最终记录文档,故实现了对原始记录数据的智能整理,无需用户手动添加文本信息对应的衍生信息,因此能够降低人力成本,并且能够提高对原始记录数据的处理效率。
附图说明
图1是本申请文档生成方法实施例一的流程示意图;
图2是本申请识别模型的一结构示意图;
图3是本申请结构化信息示意图;
图4是本申请文档生成方法实施例二的流程示意图;
图5是图4中S22的具体流程示意图;
图6是图5中S221的具体流程示意图;
图7是本申请识别模型的另一结构示意图;
图8是本申请识别模型的又一结构示意图;
图9是本申请文档生成方法实施例三的流程示意图;
图10是本申请样本最终记录文档示意图;
图11是本申请样本最终记录文档中文本信息及对应的衍生信息示意图;
图12是本申请文档生成装置一实施例的结构示意图;
图13是本申请电子设备一实施例的结构示意图;
图14是本申请存储介质一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,在不冲突的情况下,本文所描述的实施例可以与其它实施例相结合。
图1是本申请文档生成方法实施例一的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例可以包括:
S11:获取原始记录数据。
原始记录数据可以为用户在会议、演讲、听报告等场景中记录的语音或者文档。
S12:利用识别模型对原始记录数据进行处理,得到最终记录文档。
其中,最终记录文档包括原始记录数据对应的文本信息以及文本信息的衍生信息,衍生信息包括对文本信息添加的第一标记和/或从文本信息中提取的用于构成结构化信息的关键信息。
第一标记可以包括删减标记、换行/分段标记等。第一标记的形式可以为下划线、三角形、圆圈、加粗等。文本信息中被添加了删减标记的字符可以被删减,被添加了换行标记的字符处可以开始换行/分段。
在一具体实施方式中,从文本信息中提取的用于构成结构化信息的关键信息,可以为从原文本信息提取的并新添加在原文本信息中的字符。
在另一具体实施方式中,最终记录文档中可以包括对文本信息中的部分字符添加的第二标记。从文本信息中提取的用于构成结构化信息的关键信息,可以为被添加了第二标记的字符。换句话说,最终记录文档中,添加第二标记的字符可以表示为关键信息。
第二标记可以包括结构化信息的一级或多级主题分别对应的内容和/或级别标记。内容标记可以为颜色标记或框标记。颜色标记的形式可以为颜色,框标记的形式可以为框,级别标记的形式可以为编号。例如,一级标题对应的内容标记形式为红色,一级标题对应的级别标记形式为A、B;二级标题对应的内容标记形式为黑框,二级标题对应的级别标记形式为A1、A2、A3,B1、B2、B3。
用关键信息构成的结构化信息可以包括思维导图和知识树状图中的至少一种。
如果原始记录数据为语音,那么在利用识别模型对原始记录数据进行处理之前,需要利用语音识别模型对原始记录数据进行语音识别,以转换为对应的文本信息。另外,还需要将语音或文档对应的文本信息进行编码/格式化,以利用预设的编码规则将文本信息转换为识别模型可以处理的特征向量。
可以将原始记录数据对应的特征向量输入识别模型,以利用识别模型对原始记录数据对应的特征向量进行处理,得到最终记录文档。识别模型输出的最终记录文档可以为多维向量,多维向量可以包括原始记录数据对应的文本信息对应的文本向量和衍生信息对应的衍生向量。
多维向量可以包括多个多维子向量,每个多维子向量对应文本信息/最终记录文档中的一个句子。识别模型可以得到各句子对应的多维子向量,从而将最终记录文档以多维向量的形式输出。各句子对应的多维子向量的维度等于各句子对应的文本向量的维度与衍生向量的维度之和。例如,文本向量为512维的向量,衍生向量为16维的向量,则各句子对应的多维子向量的维度为528。
识别模型可以为用自然语言处理中问答任务相关的模型,例如BERT,XML,RoBERT等。下面结合图2所示的识别模型结构,对本步骤进行详细说明。
如图2所示,识别模型可以包括编码器(Encoder),注意力模块(attention)和解码器(decoder)。编码器可以为transformer、LSTM等。原始记录数据对应的特征向量经过Encoder处理,得到各句子以及各句子之间关系的向量表示,各句子以及各句子之间关系的向量表示经过attention处理,得到各句子对应的权重系数。decoder基于各句子对应的权重系数解码得到最终记录文档。
此外,若关键信息为文本信息中添加了第二标记的字符,则在S12之后,本实施例可以包括:从最终记录文档中,提取添加第二标记的字符,作为关键信息;利用关键信息生成结构化信息。生成的结构化信息示例请参阅图3。
通过本实施例的实施,本申请可以利用识别模型对原始记录数据进行处理,处理的方式可以包括标记、关键信息提取等,以得到原始记录数据对应的文本信息的衍生信息,生成在原始记录数据对应的文本信息的基础上添加了衍生信息的最终记录文档,故实现了对原始记录数据的智能整理,从而无需用户手动添加文本信息对应的衍生信息,因此能够降低人力成本,并且能够提高对原始记录数据的处理效率。
考虑到对原始记录数据的处理具有一定的主观性。换句话说,不同用户对原始记录数据处理的要求可能不同,从而不同用户想要进行标记、想要提取的关键信息可能不相同。因此,在上述实施例一的基础上,还可以进一步根据用户的要求,对识别模型的处理过程适应性调整。具体可以如下:
图4是本申请文档生成方法实施例二的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图4所示的流程顺序为限。本实施例S21是在S11之前可以包括的步骤,S22是对S11的进一步扩展。
如图4所示,本实施例可以包括:
S21:获取历史最终记录文档中经用户修改的衍生信息和/或用户输入的重点字符,作为参考信息。
本实施例的应用场景可以包括离线场景和在线/实时场景。离线场景即为已经形成原始记录数据,且不会在原始记录数据的基础上继续记录(记录完成后再处理)的场景,在线/实时场景即为当前仅形成部分原始记录数据,还会在此基础上继续记录(边记录边处理)的场景。
离线场景下,可以将历史最终记录文档中经用户修改的衍生信息作为参考信息。历史最终记录文档可以是利用识别模型对用户历史的原始记录数据进行处理得到的。用户可以对历史最终记录文档中的衍生信息进行修改,得到历史最终记录文档中经用户修改的衍生信息。
例如,历史最终记录文档中字符“首先”、“其次”、“总之”带有分段标记,用户修改后,历史最终记录文档中字符“第一”、“第二”、“第三”带有分段标记。又如,修改后用户修改后,历史最终记录文档中名词短语(如“规律”)带有第二标记。
在线场景下,可以将历史最终记录文档中经用户修改的衍生信息和/或用户输入的重点字符作为参考信息。用户可以自行对已经完成的部分原始记录数据对应的文本信息中的字符进行标记,经用户自行标记的字符可以被视为用户输入的重点字符。例如,用户将字符“规律”标记,则“规律”为用户输入的重点字符。此外,若已经完成的部分原始记录数据为语音,语音识别模型对已经完成的部分原始记录数据识别得到对应的文本信息,用户将语音识别模型得到的文本信息中的字符“规律”标记后,语音识别模型对后续形成的部分原始记录数据进行识别得到的文本信息中,出现字符“规律”的概率提升。
S22:利用识别模型基于参考信息对原始记录数据进行处理,得到最终记录文档。
参考信息可以影响识别模型对原始记录数据进行处理的过程。
结合参阅图5,S22可以包括以下子步骤:
S221:对参考信息进行编码,得到参考向量。
可以将参考信息特征编码为识别模型能够处理的特征向量,即参考向量。
结合参阅图6,在参考信息包括用户输入的重点字符的情况下,S222可以包括以下子步骤:
S2211:将重点字符存放至关注池中,并在关注池的重点字符存放数量达到预设数量的情况下,删除关注池中存放的部分重点字符。
可以将重点字符存放至识别模型对应的关注池(memory pool)中,关注池相当于一个可以临时存放重点字符的空间,并且其中存放的重点字符数量存在上限,上限值为预设数量。其中,设置上限的目的是为了不影响识别模型的解码效率。
在关注池中存放的重点字符数量达到上限之后,可以删除关注池中存放的部分重点字符。例如,预设数量可以为50,在关注池中存放的重点字符数量达到50之后,删除时间在前或者低频的重点字符,以维持关注池中存放的重点字符数量为50。
S2212:对关注池中存放的重点字符进行编码,得到重点字符参考向量。
可以将关注池中存放的重点字符编码为识别模型能够处理的特征向量,即重点字符参考向量。
S222:将参考向量输入至识别模型,以调整识别模型在识别过程中的预设权重。
其中,预设权重可以包括识别模型的注意力模块对参考向量的注意力权重。
历史最终记录文档中经用户修改的衍生信息对应的特征向量和用户输入的重点字符对应的特征向量(重点字符参考向量)可以作用于注意力模块,以调整注意力模块的注意力权重。或者说,可以提高注意力模块在识别过程中对参考向量的关注度。
预设权重还可以包括识别模型的解码器对重点字符的识别权重,重点字符的所述识别权重越大,则越大概率被解码器输出。也就是说,重点字符参考向量还可以作用于解码器,以调节识别模型的解码器对重点字符的识别权重,减小重点字符识别的误差。
S223:利用调整预设权重之后的识别模型对原始记录数据进行处理,得到最终记录文档。
在参考信息包括历史最终记录文档中经用户修改的衍生信息的情况下,结合图7对S221-S223进行说明。如图7所示,可以将历史最终记录文档中经用户修改的衍生信息进行特征编码,得到对应的特征向量(图未示),其对应的特征向量经过两个区分性的网络模块(图未示),可以得到用户在历史最终记录文档中的衍生信息的基础上作了哪些修改(分段个性化向量和结构个性化向量),分段个性化向量和结构个性化向量作用于attention,以调整attention的注意力权重,从而利用调整预设权重之后的识别模型对原始记录数据进行处理,得到最终记录文档。
例如,用户为历史最终记录文档中字符“第一”、“第二”、“第三”(对应分段个性化向量)添加了分段标记,则意味着用户习惯/更倾向于在字符“第一”、“第二”、“第三”处分段。因此,可以调整注意力模块的注意力权重,以增大输出的最终记录文档中字符“第一”、“第二”、“第三”带有分段标记的概率。
又如,用户为历史最终记录文档中字符“规律”添加了第二标记,则意味着用户习惯将“规律”作为关键信息(对应结构个性化向量)。因此,可以调整注意力模块的注意力权重,以增大输出的最终记录文档中关键信息包括字符“规律”的概率。
在参考信息包括历史最终记录文档中经用户修改的衍生信息和用户输入的重点字符的情况下,结合图8对S221-S223进行说明。如图8所示,在上述图7的基础上,还可以将用户输入的重点字符放入memory pool,并对memory pool中的重点字符进行特征编码,得到重点字符参考向量,重点字符参考向量作用于attention和decoder,以调整attention的注意力权重和decoder的识别权重,从而利用调整预设权重之后的识别模型对原始记录数据进行处理,得到最终记录文档。
为提高识别模型的处理效果,在上述S12中使用识别模型之前,还可以对其进行训练。具体可以如下:
图9是本申请文档生成方法实施例三的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图9所示的流程顺序为限。如图9所示,本实施例可以包括:
S31:获取样本原始记录数据和样本最终记录文档。
其中,样本最终记录文档包括样本原始记录数据对应的样本文本信息以及样本文本信息的样本衍生信息。
样本原始记录数据可以为历史的原始记录数据。其可以为记录的语音或文档。
样本最终记录文档可以为人工或者机器基于样本原始记录数据对应的文本信息的衍生信息或结构化信息,在原始记录数据对应的文本信息的基础上,进行标注得到的。因此,样本最终记录文档可以看作原始记录数据带有的真实标签。样本最终记录文档示例请参阅图10。
样本衍生信息可以包括对样本文本信息添加的样本第一标记和/或从样本文本信息中提取的用于构成样本结构化信息的样本关键信息。结合图11进行举例说明,如图11所示,“我在长江西路和金寨路口吃面条”为样本文本信息,“长江西路”的下划线和“金寨路口”的下划线为样本第一标记,“吃面条”为样本关键信息。
在进入S32之前,可以将样本原始记录数据和样本最终记录文档分别转换成样本第一记录向量和样本第二记录向量。样本第一记录向量和样本第二记录向量可以为识别模型能够处理的特征向量。
其中,可以将样本原始记录数据对应的样本文本信息转换为样本文本向量,作为样本第一记录向量。可以为样本关键信息添加样本第二标记,并按照预设转换规则,将样本第一标记和样本第二标记转换成对应的样本衍生向量,样本文本向量和样本衍生向量,组成样本第二记录向量。
继续结合图11进行说明。“我在长江西路和金寨路口吃面条”对应样本文本向量/样本第一记录向量(512维)。为“吃面条”添加第二样本标记,即为“吃面条”添加底色以及[A]。则样本衍生向量由“长江西路”的下划线和“金寨路口”的下划线对应的向量(4维的标记向量),以及“吃面条”的底色以及[A]对应的向量(12维的结构向量)组成。标记向量和结构向量组成样本衍生向量(16维),样本文本向量和样本衍生向量组成样本第二记录向量(528维)。
预设转换规则示例可以见下表:
格式 符号 编号
无改动 N 0000
编号 L 0001
逗号 C 0010
句号 F 0011
换行 NL 0100
三角形 T 0101
下划线 LL 0110
加粗 B 0111
删除 D 1000
S32:利用识别模型对样本原始记录数据进行处理,得到预测最终记录文档。
S33:基于预设最终记录文档与样本最终记录文档之间的差异,调整识别模型的参数。
可以采用梯度下降法调整识别模型的参数。
本实施例步骤其他详细说明请参见前面的实施例,在此不再重复。
图12是本申请文档生成装置一实施例的结构示意图。如图12所示,该装置可以包括获取模块41和处理模块42。
获取模块41可以用于获取原始记录数据。
处理模块42可以用于利用识别模型对原始记录数据进行处理,得到最终记录文档。其中,最终记录文档包括原始记录数据对应的文本信息以及文本信息的衍生信息,衍生信息包括对文本信息添加的第一标记和/或从文本信息中提取的用于构成结构化信息的关键信息。
本实施例其他详细描述请参见前面的方法实施例,在此不再重复。
通过本实施例的实施,本申请利用获取模块获取原始记录数据,利用处理模块对原始记录数据进行处理,以得到原始记录数据对应的文本信息的衍生信息,进而生成在原始记录数据对应的文本信息的基础上添加了衍生信息的最终记录文档,故实现了对原始记录数据的智能整理,无需用户手动添加文本信息对应的衍生信息,因此能够降低人力成本,并且能够提高对原始记录数据的处理效率。
图13是本申请电子设备一实施例的结构示意图。如图13所示,该电子设备包括处理器51、与处理器51耦接的存储器52。
其中,存储器52存储有用于实现上述任一实施例的方法的程序指令;处理器51用于执行存储器52存储的程序指令以实现上述方法实施例的步骤。其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器51也可以是任何常规的处理器等。
图14是本申请存储介质一实施例的结构示意图。如图14所示,本申请实施例的计算机可读存储介质60存储有程序指令61,该程序指令61被执行时实现本申请上述实施例提供的方法。其中,该程序指令61可以形成程序文件以软件产品的形式存储在上述计算机可读存储介质60中,以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的计算机可读存储介质60包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种文档生成方法,其特征在于,包括:
获取原始记录数据;
利用识别模型对所述原始记录数据进行处理,得到最终记录文档,其中,所述最终记录文档包括所述原始记录数据对应的文本信息以及所述文本信息的衍生信息,所述衍生信息包括对所述文本信息添加的第一标记和/或从所述文本信息中提取的用于构成结构化信息的关键信息。
2.根据权利要求1所述的方法,其特征在于,在所述利用识别模型对所述原始记录数据进行处理,得到最终记录文档之前,所述方法还包括:
获取历史最终记录文档中经用户修改的衍生信息和/或用户输入的重点字符,作为参考信息;
所述利用识别模型对所述原始记录数据进行处理,得到最终记录文档,包括:
利用所述识别模型基于所述参考信息对所述原始记录数据进行处理,得到所述最终记录文档。
3.根据权利要求2所述的方法,其特征在于,所述利用所述识别模型基于所述参考信息对所述原始记录数据进行处理,得到所述最终记录文档,包括:
对所述参考信息进行编码,得到参考向量;
将所述参考向量输入至所述识别模型,以调整所述识别模型在识别过程中的预设权重,其中,所述预设权重包括所述识别模型的注意力模块对所述参考向量的注意力权重;
利用调整所述预设权重之后的所述识别模型对所述原始记录数据进行处理,得到所述最终记录文档。
4.根据权利要求3所述的方法,其特征在于,所述参考信息包括所述用户输入的重点字符;其中,
所述预设权重还包括所述识别模型的解码器对所述重点字符的识别权重,所述重点字符的所述识别权重越大,则越大概率被所述解码器输出;
和/或,所述对所述参考信息进行编码,得到参考向量,包括:
将所述重点字符存放至关注池中,并在所述关注池的重点字符存放数量达到预设数量的情况下,删除所述关注池中存放的部分所述重点字符;
对所述关注池中存放的所述重点字符进行编码,得到重点字符参考向量。
5.根据权利要求1所述的方法,其特征在于,所述结构化信息包括思维导图和知识树状图中的至少一种;
和/或,所述最终记录文档中包括对所述文本信息中的部分字符添加的第二标记,添加所述第二标记的字符表示为所述关键信息;在所述利用识别模型对所述原始记录数据进行处理,得到最终记录文档之后,所述方法还包括:
从所述最终记录文档中,提取添加所述第二标记的字符,作为所述关键信息;
利用所述关键信息生成所述结构化信息。
6.根据权利要求5所述的方法,其特征在于,所述第二标记包括所述结构化信息的一级或多级主题分别对应的内容和/或级别标记,所述内容标记为颜色标记或框标记。
7.根据权利要求1所述的方法,其特征在于,在所述利用识别模型对所述原始记录数据进行处理,得到最终记录文档之前,所述方法还包括以下步骤,对所述识别模型进行训练:
获取样本原始记录数据和样本最终记录文档,其中,所述样本最终记录文档包括所述样本原始记录数据对应的样本文本信息以及所述样本文本信息的样本衍生信息;
利用所述识别模型对样本原始记录数据进行处理,得到预测最终记录文档;
基于所述预设最终记录文档与所述样本最终记录文档之间的差异,调整所述识别模型的参数。
8.根据权利要求7所述的方法,其特征在于,所述样本衍生信息包括对所述样本文本信息添加的样本第一标记和/或从所述样本文本信息中提取的用于构成样本结构化信息的样本关键信息,在所述利用所述识别模型对样本原始记录数据进行处理,得到预测最终记录文档之前,所述方法还包括:
将所述样本原始记录数据对应的样本文本信息转换为样本文本向量,作为所述样本第一记录向量,为所述样本关键信息添加样本第二标记,并按照预设转换规则,将所述样本第一标记和所述样本第二标记转换成对应的样本衍生向量,所述样本文本向量和所述样本衍生向量组成样本第二记录向量。
9.一种文档生成装置,其特征在于,包括:
获取模块,用于获取原始记录数据;
处理模块,用于利用识别模型对所述原始记录数据进行处理,得到最终记录文档,其中,所述最终记录文档包括所述原始记录数据对应的文本信息以及所述文本信息的衍生信息,所述衍生信息包括对所述文本信息添加的第一标记和/或从所述文本信息中提取的用于构成结构化信息的关键信息。
10.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至9任一项所述的文档生成方法。
CN202011615127.6A 2020-12-30 2020-12-30 文档生成方法和装置、电子设备及存储介质 Active CN112733505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011615127.6A CN112733505B (zh) 2020-12-30 2020-12-30 文档生成方法和装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011615127.6A CN112733505B (zh) 2020-12-30 2020-12-30 文档生成方法和装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112733505A true CN112733505A (zh) 2021-04-30
CN112733505B CN112733505B (zh) 2024-04-26

Family

ID=75611144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011615127.6A Active CN112733505B (zh) 2020-12-30 2020-12-30 文档生成方法和装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112733505B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378538A (zh) * 2021-06-29 2021-09-10 远光软件股份有限公司 文档的结构化信息录入方法、电子设备及存储介质
CN113449513A (zh) * 2021-06-17 2021-09-28 上海明略人工智能(集团)有限公司 工作总结自动生成方法、系统、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180061408A1 (en) * 2016-08-24 2018-03-01 Semantic Machines, Inc. Using paraphrase in accepting utterances in an automated assistant
CN109634935A (zh) * 2018-11-07 2019-04-16 重庆海特科技发展有限公司 语音处理方法、存储介质和装置
CN110287785A (zh) * 2019-05-20 2019-09-27 深圳壹账通智能科技有限公司 文本结构化信息提取方法、服务器及存储介质
CN110543475A (zh) * 2019-08-29 2019-12-06 深圳市原点参数科技有限公司 一种基于机器学习的财务报表数据自动识别和分析方法
CN110852108A (zh) * 2019-11-11 2020-02-28 中山大学 用于实体识别和实体消歧的联合训练方法、装置及介质
CN111276149A (zh) * 2020-01-19 2020-06-12 科大讯飞股份有限公司 语音识别方法、装置、设备及可读存储介质
CN112017079A (zh) * 2020-08-26 2020-12-01 深圳市唯德科创信息有限公司 专利文档的元件信息提取方法、处理装置以及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180061408A1 (en) * 2016-08-24 2018-03-01 Semantic Machines, Inc. Using paraphrase in accepting utterances in an automated assistant
CN109634935A (zh) * 2018-11-07 2019-04-16 重庆海特科技发展有限公司 语音处理方法、存储介质和装置
CN110287785A (zh) * 2019-05-20 2019-09-27 深圳壹账通智能科技有限公司 文本结构化信息提取方法、服务器及存储介质
CN110543475A (zh) * 2019-08-29 2019-12-06 深圳市原点参数科技有限公司 一种基于机器学习的财务报表数据自动识别和分析方法
CN110852108A (zh) * 2019-11-11 2020-02-28 中山大学 用于实体识别和实体消歧的联合训练方法、装置及介质
CN111276149A (zh) * 2020-01-19 2020-06-12 科大讯飞股份有限公司 语音识别方法、装置、设备及可读存储介质
CN112017079A (zh) * 2020-08-26 2020-12-01 深圳市唯德科创信息有限公司 专利文档的元件信息提取方法、处理装置以及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LARA J. MARTIN .ETAL: "Utterance classification in speech-to-speech translation for zero-resource languages in the hospital administration domain", IEEE, 11 February 2016 (2016-02-11) *
张柯文;李翔;朱全银;方强强;马甲林;成洁怡;丁行硕;: "一种基于WSD层级记忆网络建模的文档表示方法", 淮阴工学院学报, no. 03, pages 411 - 53 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449513A (zh) * 2021-06-17 2021-09-28 上海明略人工智能(集团)有限公司 工作总结自动生成方法、系统、计算机设备和存储介质
CN113449513B (zh) * 2021-06-17 2024-04-05 上海明略人工智能(集团)有限公司 工作总结自动生成方法、系统、计算机设备和存储介质
CN113378538A (zh) * 2021-06-29 2021-09-10 远光软件股份有限公司 文档的结构化信息录入方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN112733505B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN109146610B (zh) 一种智能保险推荐方法、装置及智能保险机器人设备
CN109388795B (zh) 一种命名实体识别方法、语言识别方法及系统
CN112633003B (zh) 一种地址识别方法、装置、计算机设备及存储介质
CN111046133A (zh) 基于图谱化知识库的问答方法、设备、存储介质及装置
CN110795543A (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN111968649A (zh) 一种字幕纠正方法、字幕显示方法、装置、设备及介质
CN110232439B (zh) 一种基于深度学习网络的意图识别方法
CN112269868A (zh) 一种基于多任务联合训练的机器阅读理解模型的使用方法
CN109949799B (zh) 一种语义解析方法及系统
CN110929015B (zh) 一种多文本分析方法及装置
CN112733505B (zh) 文档生成方法和装置、电子设备及存储介质
CN113268576B (zh) 一种基于深度学习的部门语义信息抽取的方法及装置
CN112036184A (zh) 基于BiLSTM网络模型及CRF模型的实体识别方法、装置、计算机装置及存储介质
CN110222338B (zh) 一种机构名实体识别方法
CN112597300A (zh) 文本聚类方法、装置、终端设备及存储介质
CN113742471A (zh) 一种普法问答系统的向量检索式对话方法
CN111209297B (zh) 数据查询方法、装置、电子设备及存储介质
CN110674243A (zh) 一种基于动态k-均值算法的语料库索引构建方法
CN113887244A (zh) 文本处理方法及装置
CN115687625B (zh) 文本分类方法、装置、设备及介质
CN112632950A (zh) Ppt生成方法、装置、设备及计算机可读存储介质
CN116645961A (zh) 语音识别方法、语音识别装置、电子设备及存储介质
CN114036908A (zh) 一种融入词表知识的中文篇章级事件抽取方法及装置
CN112765937A (zh) 文本正则方法、装置、电子设备及存储介质
CN111681676A (zh) 视频物体识别构建音频方法、系统、装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230530

Address after: 230026 No. 96, Jinzhai Road, Hefei, Anhui

Applicant after: University of Science and Technology of China

Applicant after: IFLYTEK Co.,Ltd.

Address before: 230088 666 Wangjiang West Road, Hefei hi tech Development Zone, Anhui

Applicant before: IFLYTEK Co.,Ltd.

GR01 Patent grant
GR01 Patent grant