CN112528012B

CN112528012B - 生成文档记录的方法、装置、电子设备、及存储介质

Info

Publication number: CN112528012B
Application number: CN202011363347.4A
Authority: CN
Inventors: 卞东海; 郑烨翰; 彭卫华; 罗雨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-11-27
Filing date: 2020-11-27
Publication date: 2023-08-29
Anticipated expiration: 2040-11-27
Also published as: CN112528012A

Abstract

本申请公开了一种生成文档记录的方法、装置、电子设备、存储介质及计算机程序产品，涉及深度学习、知识图谱等人工智能领域。具体实现方案为：接收用于生成文档记录的用户语音信息，语音信息包括与文档记录的内容配置条目有关的信息，其中内容配置条目与文档记录的布置有关；将语音信息转换为文本信息；以及基于内容配置条目，对文本信息进行处理以生成文档记录。通过用户简单的配置与文档记录的布置有关的内容配置条目，基于这些内容配置条目对用户语音信息进行识别，可以自动生成符合预置布置的文档记录。

Description

生成文档记录的方法、装置、电子设备、及存储介质

技术领域

本申请涉及计算机领域，具体而言，涉及计算机应用技术。

背景技术

随着互联网技术的蓬勃发展，各个企业、组织纷纷进行信息化管理，信息化管理是大势所趋。企业管理者为了加强管理通常要求对各种文档记录进行信息化管理。文档记录的一个典型示例是员工的工作汇报，例如周报或者日报。目前文档记录通常需要员工手写或者借助于辅助平台通过员工打字才能完成，整个过程花费时间较多，并且员工填写的工作汇报通常带有主观性，管理者无法准确掌握该员工的工作情况。

发明内容

本公开提供了一种生成文档记录的方法、装置、设备以及存储介质，利用人工智能的方式实现通过语音自动生成文档记录。

根据本公开的第一方面，提供了一种生成文档记录的方法。该方法包括接收用于生成文档记录的用户语音信息，语音信息包括与文档记录的内容配置条目有关的信息，其中内容配置条目与文档记录的布置有关；将语音信息转换为文本信息；以及基于内容配置条目，对文本信息进行处理以生成文档记录。

根据本公开的第二方面，提供了一种生成文档记录的装置。该装置包括语音信息接收模块，用于接收用于生成文档记录的用户语音信息，语音信息包括与所述文档记录的内容配置条目有关的信息，其中内容配置条目与文档记录的布置有关；语音信息转换模块，用于将语音信息转换为文本信息；以及文档记录生成模块，用于基于内容配置条目，对文本信息进行处理以生成文档记录。

根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被所述至少一个处理器执行的指令，指令被所述一个处理器执行，以使至少一个处理器能够执行根据本公开的第一方面的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，计算机指令用于使计算机执行根据本公开的第一方面的方法。

在本公开的第五方面中，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时，执行根据本公开的第一方面的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

结合附图并参考以下详细说明，本公开的上述以及其它目的、特征和优势将变得更加明显。在附图中，相同或相似的附图标注表示相同或相似的元素，其中：

图1示出了本公开的多个实施例的生成文档记录的示例环境的示意图；

图2示出了根据本公开的一些实施例的生成文档记录的方法的流程图；

图3示出了根据本公开的一些实施例的用于对文本信息进行处理以生成文档记录的方法的流程图；

图4示出了根据本公开的一些实施例的用于确定文本信息中包括的内容所属于的一个或多个层级的方法的流程图；

图5示出了根据本公开实施例的生成文档记录的装置的示意性框图；以及

图6示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本申请的实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示例性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在本公开的实施例的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如本文中所使用的，术语“文档”指的是任何格式的包含文本的计算机可读文件，也称为电子文档。文档的示例包括超文本标记语言(HTML)文件(也称为网页)、word文档、演示文档、便携式文档格式(PDF)文档、电子表格文档、纯文本文档，等等。术语“文档记录”指的是针对文档所做出的具有预定格式的文档总结，文档记录的示例包括工作汇报、工作计划、项目执行情况，等等。

如以上提及的，目前文档记录目通常需要员工手写或者借助于辅助平台通过员工打字才能完成，整个过程耗时且通常带有主观性。随着人工智能的不断发展，使得语音识别可以应用于许多场景，人们可以通过语音来实现许多不同的操作。因此，期望一种通过语音进行文档记录自动生成的方法从而可以节省员工的时间，提高工作效率。进一步，期望可以使得生成的文档记录更加客观，从而使得管理者可以准确掌握该员工的工作情况并对其进行管理。

然而，文档记录往往不同于一般的交流，文档记录中可能包含了大量的专业术语、同时夹杂着各类的简称、缩写、英文等，这对语音识别提出了更高的要求。如何准确地将语音转化为文字形式的文档记录成为语音文档记录生成方法中的一大难题。

根据本公开的实施例，提出了一种生成文档记录的方案。在该方案中，可以通过对用户输入的语音进行语音识别，利用人工智能的方式进行文档记录的组织编排，实现了通过语音的方式自动生成文档记录。具体地，通过配置与文档记录的布置有关的内容配置条目，基于内容配置条目来对用户的语音信息进行语音识别并且对识别后的文本信息按照内容配置条目进行分段，从而生成符合与预先配置的文档记录的布置的文档记录。以此方式，可以通过语音来自动生成文档记录，节省了员工的工作时间，并且提高了文档记录的准确性。

以下将参照附图来具体描述本公开的实施例。

图1示出了本公开的多个实施例的生成文档记录的示例环境100的示意图。应当理解，图1所示出的环境100仅仅是示例性的，而不应当构成对本公开所描述的实现的功能和范围的任何限制。在该示例环境100中，计算设备110可以与用户进行交互，计算设备110被配置为基于用户输入的语音信息生成文档记录106。

在一些实施例中，计算设备110可以被配置有与文档记录106的布置有关的内容配置条目102。内容配置条目102定义了所要生成的文档记录106中基本不变的格式，例如文档记录106中所包括的基本信息。以工作报告为例，内容配置条目102可以是周报或日报中所具有的与工作相关的内容，例如一个或多个与文档记录106的布置关联的层级，针对每一层级下的项目名称、起止时间、主要工作内容、项目中常用的专业术语、简称、缩写、英文等词汇、项目所属领域等。内容配置条目102“项目1：语文课；项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”可以作为用户输入的配置信息被提供给计算设备110。内容配置条目102中包括了两个层级，包括两个一级项目：“项目1：语文课”以及“项目2：数学课”；并且一级项目“项目2：数学课”包括两个二级子项目“项目2-1：数学预习课；项目2-2：数学复习课”。应当理解，虽然在图1的示例中给出了内容配置条目102的具体内容，但这仅是为了解释说明的目的。在其他实施例中，内容配置条目102可以具有任何合适的内容。

在用户需要生成文档记录106时，用户可以向计算设备110提供用户语音信息104“我上午上语文课，下午上数学预习课，晚上上数学复习课”。计算设备110然后可以对该用户语音信息104进行语音识别，从而将该用户语音信息104转换为文本信息。进而，计算设备110可以基于内容配置条目102，对文本信息进行处理以生成文档记录106“项目1：上午上语文课；项目2-1：下午上数学预习课；项目2-2：晚上上数学复习课”。

在一些实施例中，计算设备110还可以基于内容配置条目102对该文本信息进行语义处理，将其中生涩难懂或者专业术语转换成容易理解的词语。例如，可以基于内容配置条目102中包括的项目中常用的专业术语、简称、缩写、英文等词汇来将语音识别后的文本信息中的缩写替换成全称。

在一些实施例中，计算设备110可以基于内容配置条目102“项目1：语文课；项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”确定文本信息中包括的内容所属于的一个或多个层级。例如，计算设备110可以使用“项目1：语文课”确定语音信息104“我上午上语文课，下午上数学预习课，晚上上数学复习课”对应的文本信息中包括属于“项目1：语文课”的内容“我上午上语文课”；使用“项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”确定该文本信息中包括属于“项目2-1：数学预习课”的内容“下午上数学预习课”和属于“项目2-2：数学复习课”的内容“晚上上数学复习课”。然后，计算设备110将属于不同层级的内容分别按照所属的不同层级添加到文档记录106中，从而生成文档记录106“项目1：上午上语文课；项目2-1：下午上数学预习课；项目2-2：晚上上数学复习课”。计算设备110通常尽可能确定文本信息中包括的内容所属于的最低层级，例如，如果对于“项目2”，其包括了两个二级子项目“项目2-1”和“项目2-2”，因此针对“项目2”需要确定文本消息中包括的内容所属于的二级层级。

根据本公开的实施例，计算设备110被配置为通过语音生成文档记录106。文档记录106例如可以被提供给其他设备使用或存储、呈现给用户等等。计算设备110也可以在本地存储所生成的文档记录106。

图2示出了根据本公开的一些实施例的生成文档记录的方法200的流程图。为便于讨论，结合图1来描述方法200。方法200可以由计算设备110来实现。

在框210，计算设备110可以接收用于生成文档记录106的用户语音信息104，语音信息104包括与文档记录106的内容配置条目102有关的信息，其中内容配置条目102与文档记录106的布置有关。

在一些实施例中，计算设备110在接收用户语音信息104之前，可以先从用户接收内容配置条目102。内容配置条目102与文档记录106的布置有关，其包括了文档记录106所具有的条目以及与条目有关的内容。在一些实施例中，内容配置条目102可以包括一个或多个与文档记录106的布置关联的层级。例如，最终生成的文档记录106所包括的一个或多个层级。在生成工作报告的应用中，文档记录106包括工作报告，并且针对每一层级，内容配置条目102包括以下一项或多项：项目名称、内容摘要、关键词。在一些实施例中，内容配置条目102可以包括：项目名称、起止时间、项目下的二级子项目的名称、主要工作内容、项目中常用的专业术语、简称、缩写、英文词汇等、项目所述领域(例如，科技、教育、金融等)、个人偏好设置(例如，数字中文书写格式、特定词语替换、英文全部大写等)等。应当理解，内容配置条目102可以包括与文档记录106的布置相关的任何内容。由于内容配置条目102可以在较长时间内保持不变，因此不必每次都进行配置，在进行了一次基本配置之后，可以使用较长时间。

在具有内容配置条目102之后，计算设备110可以接收用于生成文档记录106的用户语音信息104。语音信息104包括与文档记录106的内容配置条目102有关的信息。例如，如图1所示，当内容配置条目102为“项目1：语文课；项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”时，用户语音信息104可以为“我上午上语文课，下午上数学预习课，晚上上数学复习课”。

在框220，计算设备110可以将语音信息104转换为文本信息。在一些实施例中，计算设备110可以对语音信息104进行语音识别以将语音信息104转换为文本信息。

然后，在框230，计算设备110可以基于内容配置条目102，对文本信息进行处理以生成文档记录106。用户语音信息104中通常包括了一些无关词，例如，语气助词、或者包括涉及第一人称的其他词汇(例如，“我认为”)，也有可能存在一些错别字，这些词汇会对文档记录106的生成产生干扰。为了减轻这种影响，在一些实施例中，计算设备110还可以：对文本信息进行无关词删除，或者错别字替换。另外，用户语音信息104中还可能包括了一些相同或相似的内容。在一些实施例中，计算设备110还可以：对文本信息进行冗余处理以删除相同或相似的内容。例如，可以针对每条记录按照标点符号进行分句，使用编辑距离判断下一句和上一句的相似性，如果相似性大于预定阈值(例如，0.9)，则确定上一句与下一句相似，可以删除上一句。可以理解，可以采用不同的语音识别方式以及相似性确定方式。以此方式，通过对文本信息进行预处理，可以减少生成文档记录106所需要的计算量，并且减少文档记录106中的错误。

此外，由于文档记录中可能包含了大量技术术语、同时夹杂着各类的简称、缩写、英文等。在一些实施例中，计算设备110还可以：基于内容配置条目102，对文本信息执行处理，以获得优化的文本信息。例如，计算设备110可以基于内容配置条目102中包括的项目中常用的专业术语、简称、缩写、英文等词汇来将语音识别后的文本信息中的缩写替换成全称或者将英文替换成中文，还可以基于项目所属领域确定多义词在特定领域下的特定含义。进而，计算设备110可以对优化的文本信息进行处理以生成文档记录106。通过这种方式，可以将用户语音信息转换为容易理解的文本信息，从而增加了所生成的文档记录106的可读性。

通过这种方式，用户可以通过简单地配置即可实现通过语音来自动生成文档记录，并且所生成的文档记录可读性较强。

图3示出了根据本公开的一些实施例的用于对文本信息进行处理以生成文档记录的方法300的流程图。为了清楚起见，以下将结合图3具体介绍方法200的框230的内容。

在框310，计算设备110可以针对每条文本信息，基于项目名称、内容摘要或者关键词中的一项或多项确定文本信息中包括的内容所属于的一个或多个层级。在一些实施例中，计算设备110可以针对每条文本信息，使用名称、内容摘要或者关键词中的一项或多项对文本信息中包括的内容进行语义匹配。例如，如图1所示，当内容配置条目102为“项目1：语文课；项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”，用户语音信息104为“我上午上语文课，下午上数学预习课，晚上上数学复习课”时，假设对用户语音信息104进行语音识别后得到的文本信息亦为：我上午上语文课，下午上数学预习课，晚上上数学复习课。计算设备110可以使用“语文课”进行语义匹配，确定文本信息中的内容“我上午上语文课”属于一级层级“项目1”，采用同样的方式可以确定文本信息中的内容“下午上数学预习课”属于一级层级“项目2”下的二级层级“项目2-1”并且“晚上上数学复习课”属于一级层级“项目2”下的二级层级“项目2-2”。在一些实施例中，计算设备110通常尽可能确定文本信息中包括的内容所属于的最低层级，例如，如果对于“项目2”，其包括了两个二级子项目“项目2-1”和“项目2-2”，因此针对“项目2”需要确定文本消息中包括的内容所属于的二级层级。可以理解，可以使用不同的方式来确定文本消息中包括的内容所属于的层级。通过这种方式，可以有效地按照内容配置条目102对文本消息进行划分，使得生成的文档记录106具有较高的精确性。

在一些实施例中，如果基于项目名称、内容摘要或者关键词中的一项或多项无法确定文本信息中包括的内容所属于的一个或多个层级，则计算设备110可以按照标点符号对文本信息进行分割以形成多个语句。然后，针对每个语句，预测该语句所表示的内容分别属于一个或多个层级的概率。例如，可以使用预训练语言模型来预测该语句所表示的内容分别属于一个或多个一级层级的概率。从而计算设备110可以基于概率来将文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类。例如，将具有最大概率的语句聚合归类到相应的一级层级中。可以理解，可以使用不同的方式预测语句所表示的内容分别属于一个或多个一级层级的概率。这样可以使得最大程度地确定文本信息中包括的内容所属于的层级，从而使得所生成的文档记录106更加完整。

在框320，计算设备110可以将所有文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类。为了方便描述，在此仅以用户输入一条用户语音信息102为例，在实际操作中，有可能同一用户输入多条语音信息102，从而生成多条文本信息。计算设备110可以将属于同一层级的所有内容进行聚合归类到相应的层级下。例如，将所有属于一级层级“项目1”的内容聚合归类到一级层级“项目1”下，将所有属于二级层级“项目2-1”的内容聚合归类到二级层级“项目2-1”下。

在框330，计算设备110可以将聚合归类后的属于不同层级的内容分别按照所属的不同层级基于内容配置条目102添加到文档记录106中，从而生成文档记录106。在框320中已经得到了属于不同层级下的所有内容，计算设备110可以将不同层级下的内容基于内容配置条目102添加到文档记录106中的相应层级下。仍以图1为例，基于内容配置条目102可以生成文档记录106“项目1：上午上语文课；项目2-1：下午上数学预习课；项目2-2：晚上上数学复习课”。

图4示出了根据本公开的一些实施例的用于确定文本信息中包括的内容所属于的一个或多个层级的方法400的流程图，其是方法300的框310的一个具体实施例，其中层级至少包括一个或多个一层层级和一个或多个二层层级，二层层级是对应的一层层级的更细划分。

在框410，计算设备110可以针对每条文本信息，基于项目名称、内容摘要或者关键词中的一项或多项确定文本信息中包括的内容(为了方便描述，下文称为“第一内容”)所属于的一个或多个一层层级。当至少包括一个或多个一层层级和一个或多个二层层级时，计算设备110可以先确定文本信息中包括的第一内容所属于的一个或多个一层层级。可以采用与方法300中的框310类似的方法来确定文本信息中包括的第一内容所属于的一个或多个一层层级。例如，如图1所示，针对内容配置条目102“项目1：语文课；项目2：数学课；项目2-1：数学预习课；项目2-2：数学复习课”，一级层级分别为：“项目1”和“项目2”，而“项目2”下还存在两个二层层级：“项目2-1”和“项目2-2”。计算设备110可以先使用一级层级“项目1：语文课”进行语义匹配，确定文本信息中的内容“我上午上语文课”属于一级层级“项目1”。

在框420，计算设备110可以针对每条文本信息中除了第一内容之外的内容(为了方便描述，下文称为“第二内容”)，基于项目名称、内容摘要或者关键词中的一项或多项分别确定第二内容所属于的一个或多个二层层级。可以采用与方法300中的框310类似的方法来确定第二内容所属于的一个或多个二层层级。例如，如图1所示，确定文本信息中的内容“我上午上语文课”属于一级层级“项目1”之后，计算设备110可以使用“项目2-1：数学预习课”确定文本信息中的内容“下午上数学预习课”属于一级层级“项目2”下的二级层级“项目2-1”并且使用“项目2-1：数学复习课”确定“晚上上数学复习课”属于一级层级“项目2”下的二级层级“项目2-2”。

在框430，计算设备110可以将属于一个或多个一层层级的第一内容分别按照相应的一层层级进行聚合归类。这样，可以确定所有属于一层层级下的内容。

在框440，计算设备110可以针对每个聚合归类后的一层层级中的第一内容，基于项目名称、内容摘要或者关键词中的一项或多项分别确定第一内容所属于的一个或多个二层层级。可以采用与方法300中的框310类似的方法来针对每个聚合归类后的一层层级中的第一内容，分别确定第一内容所属于的一个或多个二层层级。如上所述，通过这种方式可以尽可能地确定文本信息中包括的内容所属于的最低层级，使得生成的文档记录106具有较高的精确性。

由此，计算设备110可以获得所有聚合归类后的一层层级中的第一内容以及所有聚合归类后的二层层级中的第二内容。在一些实施例中，计算设备110可以针对每个聚合归类后的二层层级中的第二内容进行冗余处理以删除相同或相似的内容。冗余处理与方法200中的框230的描述类似，在此不再赘述。然后，计算设备110可以针对每个冗余处理后的属于二层层级中的内容(为了方便描述，下文称为“第三内容”)，确定第三内容中包括的语句之间的上下文关系。在一些实施例中，可以对内容进行句子级的相关性计算，确定一个句子是否是另外一个句子的上文或者下文，或者两者没有关系。进而，计算设备110可以基于上下文关系来调整属于二层层级中的第三内容。例如，将属于上下文关系的两句话聚合到一起。以此方式，使得最终形成的聚合归类后的属于不同层级的内容更加完整清楚，进一步提高了文档记录106的可读性和精确性。

在一些实施例中，计算设备110可以将文档记录106通过页面显示给用户。在一些实施例中，在显示过程中，计算设备110还可以提供文本纠错功能。计算设备110可以自动识别并且向用户提示文档记录106中的可能存在错误的地方(例如，错别字、语法错误等)，例如，可以通过高亮或下划线等方式向用户提示。在一些实施例中，计算设备110可以提供文本编辑功能，使得用户可以针对不满意的地方进行编辑。

通过这种方式，可以使得所生成的文档记录106更加贴合用户的本意。

图5示出了根据本公开实施例的生成文档记录的装置500的示意性框图。如图5所示，装置500包括：语音信息接收模块510，用于接收用于生成文档记录的用户语音信息，语音信息包括与文档记录的内容配置条目有关的信息，其中内容配置条目与文档记录的布置有关；语音信息转换模块520，用于将语音信息转换为文本信息；以及文档记录生成模块530，用于基于内容配置条目，对文本信息进行处理以生成文档记录。

在一些实施例中，其中内容配置条目包括一个或多个与文档记录的布置关联的层级。

在一些实施例中，其中文档记录包括工作报告，并且针对每一层级，内容配置条目包括以下一项或多项：项目名称、内容摘要、关键词。

在一些实施例中，其中文档记录生成模块包括：层级确定单元，用于针对每条文本信息，基于项目名称、内容摘要或者关键词中的一项或多项确定文本信息中包括的内容所属于的一个或多个层级；第一聚合归类单元，用于将所有文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类；以及内容添加单元，用于将聚合归类后的属于不同层级的内容分别按照所属的不同层级基于内容配置条目添加到文档记录中，从而生成文档记录。

在一些实施例中，其中层级确定单元还包括：分割单元，用于按照标点符号对文本信息进行分割以形成多个语句；概率预测单元，用于针对每个语句，预测语句所表示的内容分别属于一个或多个层级的概率；以及第二聚合归类单元，用于基于概率来将文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类。

在一些实施例中，其中语音信息转换模块包括：文本信息优化单元，用于基于内容配置条目，对文本信息执行处理，以获得优化的文本信息；其中第一文档记录生成模块还包括：文档记录生成单元，用于对优化的文本信息进行处理以生成文档记录。

在一些实施例中，其中第一文档记录生成模块还包括：无关词删除单元，用于对文本信息进行无关词删除；或者第一冗余处理单元，用于对文本信息进行冗余处理以删除相同或相似的内容。

在一些实施例中，其中层级至少包括一个或多个一层层级和一个或多个二层层级，层级确定单元还被配置为：针对每条文本信息，基于项目名称、内容摘要或者关键词中的一项或多项确定文本信息中包括的第一内容所属于的一个或多个一层层级；以及针对每条文本信息中除了第一内容之外的第二内容，基于项目名称、内容摘要或者关键词中的一项或多项分别确定第二内容所属于的一个或多个二层层级。

在一些实施例中，其中第一聚合归类单元还被配置为：将属于一个或多个一层层级的第一内容分别按照相应的一层层级进行聚合归类；并且层级确定单元还被配置为：针对每个聚合归类后的一层层级中的第一内容，基于项目名称、内容摘要或者关键词中的一项或多项分别确定第一内容所属于的一个或多个二层层级。

在一些实施例中，还包括：冗余处理模块，用于针对每个聚合归类后的二层层级中的第二内容进行冗余处理以删除相同或相似的内容；上下文关系确定模块，用于针对每个冗余处理后的属于二层层级中的第三内容，确定第三内容中包括的语句之间的上下文关系；以及内容调整模块，用于基于上下文关系来调整属于二层层级中的第三内容。

根据本公开的实施例，本公开还提供了一种电子设备和一种可读存储介质。

如图6所示，是根据本公开实施例的生成文档记录的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本公开所提供的图像处理的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本公开所提供的图像处理的方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本公开实施例中的图像处理的方法对应的程序指令/模块(例如，附图5所示的语音信息接收模块510、语音信息转换模块520和文档记录生成模块530)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的图像处理的方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据图像处理的电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至图像处理的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

图像处理的方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与图像处理的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种生成文档记录的方法，包括：

接收用于生成所述文档记录的用户语音信息，所述语音信息包括与所述文档记录的内容配置条目有关的信息，其中所述内容配置条目与所述文档记录的布置有关，其中所述文档记录包括工作报告，所述内容配置条目包括一个或多个与所述文档记录的布置关联的层级并且针对每一层级，所述内容配置条目包括以下一项或多项：项目名称、内容摘要、关键词；

将所述语音信息转换为文本信息；以及

基于所述内容配置条目，对所述文本信息进行处理以生成所述文档记录，包括：

针对每条文本信息，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项确定所述文本信息中包括的内容所属于的一个或多个层级；

将所有文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类；以及

将聚合归类后的属于不同层级的内容分别按照所属的不同层级基于所述内容配置条目添加到所述文档记录中，从而生成所述文档记录。

2.根据权利要求1所述的方法，其中确定所述文本信息中包括的内容所属于的一个或多个层级还包括：

按照标点符号对所述文本信息进行分割以形成多个语句；

针对每个语句，预测所述语句所表示的内容分别属于所述一个或多个层级的概率；以及

基于所述概率来将所述文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类。

3.根据权利要求1或2所述的方法，其中将所述语音信息转换为文本信息包括：

基于所述内容配置条目，对所述文本信息执行处理，以获得优化的文本信息；

其中对所述文本信息进行处理以生成所述文档记录还包括：对所述优化的文本信息进行处理以生成所述文档记录。

4. 根据权利要求1或2所述的方法，其中对所述文本信息进行处理以生成所述文档记录还包括：

对所述文本信息进行无关词删除；或者

对所述文本信息进行冗余处理以删除相同或相似的内容。

5. 根据权利要求1所述的方法，其中所述层级至少包括一个或多个一层层级和一个或多个二层层级，确定所述文本信息中包括的内容所属于的一个或多个层级包括：

针对每条文本信息，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项确定所述文本信息中包括的第一内容所属于的一个或多个一层层级；以及

针对每条文本信息中除了所述第一内容之外的第二内容，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项分别确定所述第二内容所属于的一个或多个二层层级。

6. 根据权利要求5所述的方法，其中确定所述文本信息中包括的内容所属于的一个或多个层级还包括：

将属于所述一个或多个一层层级的所述第一内容分别按照相应的一层层级进行聚合归类；以及

针对每个聚合归类后的一层层级中的第一内容，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项分别确定所述第一内容所属于的一个或多个二层层级。

7.根据权利要求5或6所述的方法，还包括：

针对每个聚合归类后的二层层级中的第二内容进行冗余处理以删除相同或相似的内容；

针对每个冗余处理后的属于所述二层层级中的第三内容，确定所述第三内容中包括的语句之间的上下文关系；以及

基于所述上下文关系来调整属于所述二层层级中的所述第三内容。

8.一种生成文档记录的装置，包括：

语音信息接收模块，用于接收用于生成所述文档记录的用户语音信息，所述语音信息包括与所述文档记录的内容配置条目有关的信息，其中所述内容配置条目与所述文档记录的布置有关，其中所述文档记录包括工作报告，所述内容配置条目包括一个或多个与所述文档记录的布置关联的层级，并且针对每一层级，所述内容配置条目包括以下一项或多项：项目名称、内容摘要、关键词；

语音信息转换模块，用于将所述语音信息转换为文本信息；以及

文档记录生成模块，用于基于所述内容配置条目，对所述文本信息进行处理以生成所述文档记录，

其中所述文档记录生成模块包括：

层级确定单元，用于针对每条文本信息，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项确定所述文本信息中包括的内容所属于的一个或多个层级；

第一聚合归类单元，用于将所有文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类；以及

内容添加单元，用于将聚合归类后的属于不同层级的内容分别按照所属的不同层级基于所述内容配置条目添加到所述文档记录中，从而生成所述文档记录。

9.根据权利要求8所述的装置，其中所述层级确定单元还包括：

分割单元，用于按照标点符号对所述文本信息进行分割以形成多个语句；

概率预测单元，用于针对每个语句，预测所述语句所表示的内容分别属于所述一个或多个层级的概率；以及

第二聚合归类单元，用于基于所述概率来将所述文本信息中属于不同层级的内容分别按照相应的层级进行聚合归类。

10.根据权利要求8或9所述的装置，其中所述语音信息转换模块包括：

文本信息优化单元，用于基于所述内容配置条目，对所述文本信息执行处理，以获得优化的文本信息；

其中所述文档记录生成模块还包括：文档记录生成单元，用于对所述优化的文本信息进行处理以生成所述文档记录。

11. 根据权利要求8或9所述的装置，其中所述文档记录生成模块还包括：

无关词删除单元，用于对所述文本信息进行无关词删除；或者

第一冗余处理单元，用于对所述文本信息进行冗余处理以删除相同或相似的内容。

12. 根据权利要求8所述的装置，其中所述层级至少包括一个或多个一层层级和一个或多个二层层级，所述层级确定单元还被配置为：

13. 根据权利要求12所述的装置，其中：

所述第一聚合归类单元还被配置为：将属于所述一个或多个一层层级的所述第一内容分别按照相应的一层层级进行聚合归类；并且

所述层级确定单元还被配置为：针对每个聚合归类后的一层层级中的第一内容，基于所述项目名称、所述内容摘要或者所述关键词中的一项或多项分别确定所述第一内容所属于的一个或多个二层层级。

14.根据权利要求12或13所述的装置，还包括：

冗余处理模块，用于针对每个聚合归类后的二层层级中的第二内容进行冗余处理以删除相同或相似的内容；

上下文关系确定模块，用于针对每个冗余处理后的属于所述二层层级中的第三内容，确定所述第三内容中包括的语句之间的上下文关系；以及

内容调整模块，用于基于所述上下文关系来调整属于所述二层层级中的所述第三内容。

15. 一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。