CN106409296A

CN106409296A - 基于分核处理技术的语音快速转写校正系统

Info

Publication number: CN106409296A
Application number: CN201610826618.2A
Authority: CN
Inventors: 虞焰兴
Original assignee: Anhui Voice Communication Information Technology Co Ltd
Current assignee: Anhui Voice Communication Information Technology Co Ltd
Priority date: 2016-09-14
Filing date: 2016-09-14
Publication date: 2017-02-15

Abstract

本发明公开了一种基于分核处理技术的语音快速转写校正系统，包括语音采集单元、录音单元、语音识别处理器、录音播放处理器、文档编辑器和微控制器。本发明通过语音采集单元获取语音信息，通过录音单元录制语音信息，通过语音识别处理器将语音转写为文字，通过录音播放处理器播放录音，基于分核处理技术，双核双线程同时工作，实现录音和文字同步处理，并且通过延时模块将录音延时输出，用户先浏览文字，再收听到录音，方便用户理解录音内容，更好的对文字进行修正；使用微控制器对两个处理器单独控制，在不影响将语音转写为文字的情况下，单独控制录音在线播放或暂停，方便用户校正文字，提高语音识别和文字校正的准确性。

Description

基于分核处理技术的语音快速转写校正系统

技术领域

本发明属于语音识别技术领域，涉及一种语音转写校正系统，具体是一种基于分核处理技术的语音快速转写校正系统。

背景技术

目前，电视台字幕都是预先准备好的，然后播音员读出来，观众也是看着文字听声音，印象深刻，但是，预先需要准备文字，耗费时间，采编也比较麻烦，并且在直播采访时无法同步字幕；还有很多会议，都是速录师打字，观众根据文字听声音，但是，都是声音读完了，文字才出来，不能同步，文字也只是一些要点记录，使用语音速记本，也是先有声音，文字才能显示，但是，修改的时候，修改的速度跟不上说话的速度，从而，修改难以持续下去，因而，需要提供一种声音和文字能够同步输出的系统，本案由此产生。

发明内容

本发明的目的在于提供一种使用方便、准确率高的基于分核处理技术的语音快速转写校正系统。

本发明的目的可以通过以下技术方案实现：

基于分核处理技术的语音快速转写校正系统，包括语音采集单元、录音单元、数据存储单元、语音识别处理器、录音播放处理器、文档编辑器、微控制器、输入单元、显示器以及音频播放器；

所述的语音采集单元连接录音单元和语音识别处理器，用于采集用户的语音信息，并输出到录音单元和语音识别处理器；

所述的录音单元连接数据存储单元和录音播放处理器，用于录制用户的语音信息，并进行编码，生成音频文件，将录制的语音信息实时发送到录音播放处理器，将最终生成的音频文件发送到数据存储单元；

所述的输入单元连接微控制器和文档编辑器，用于向微控制器输入控制指令以及向文档编辑器输入文字信息；

所述的微控制器连接语音识别处理器和录音播放处理器，用于根据接收到的控制指令，输出控制信号分别控制语音识别处理器和录音播放处理器；

所述的语音识别处理器连接文档编辑器，用于对接收到的语音信息进行识别，转写为文字信息，发送到文档编辑器；

所述的文档编辑器连接显示器和数据存储单元，用于将接收到的文字信息发送到显示器进行实时显示，同时用户可通过输入单元对文档编辑器内文字信息进行修改，最终生成文档文件输出到数据存储单元；

所述的数据存储单元，用于保存接收到的音频文件和文档文件；

所述的录音播放处理器连接音频播放器，用于对录音单元录制的语音信息进行处理，生成音频流输出到音频播放器进行在线播放，并根据微控制器的控制信号控制录音的播放/暂停。

进一步地，所述的录音播放处理器包括

时钟模块，用于记录录音播放的起始时间以及停止时间；

播放模块，用于对录音单元录制的语音信息进行处理，生成音频流输出；

延时模块，用于将播放模块生成的音频流延迟预设时间后输出；其中，预设时间为500ms。

本发明的有益效果：本发明通过语音采集单元获取语音信息，通过录音单元录制语音信息，通过语音识别处理器将语音转写为文字，通过录音播放处理器播放录音，基于分核处理技术，双核双线程同时工作，实现录音和文字同步处理，并且通过延时模块将录音延时输出，用户先浏览文字，再收听到录音，方便用户理解录音内容，更好的对文字进行修正；使用微控制器对两个处理器单独控制，在不影响将语音转写为文字的情况下，单独控制录音在线播放或暂停，方便用户校正文字，提高语音识别和文字校正的准确性。

附图说明

下面结合附图和具体实施例对本发明作进一步详细描述。

图1是本发明的系统示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示，本发明提供了一种基于分核处理技术的语音快速转写校正系统，包括语音采集单元、录音单元、数据存储单元、语音识别处理器、录音播放处理器、文档编辑器、微控制器(MCU)、输入单元、显示器以及音频播放器。

语音采集单元连接录音单元和语音识别处理器，用于采集用户的语音信息，并输出到录音单元和语音识别处理器；其中，语音采集单元使用高清麦克风采集语音信息。

录音单元连接数据存储单元和录音播放处理器，用于录制用户的语音信息，并进行编码，生成音频文件，将录制的语音信息实时发送到录音播放处理器，将最终生成的音频文件发送到数据存储单元。

输入单元连接微控制器和文档编辑器，用于向微控制器输入控制指令以及向文档编辑器输入文字信息；其中，输入单元可采用鼠标、键盘或触摸屏等。

微控制器连接语音识别处理器和录音播放处理器，用于根据接收到的控制指令，采用分核处理技术，输出控制信号分别控制语音识别处理器和录音播放处理器。

语音识别处理器连接文档编辑器，用于对接收到的语音信息进行识别，转写为文字信息，发送到文档编辑器。

文档编辑器连接显示器和数据存储单元，用于将接收到的文字信息发送到显示器进行实时显示，同时用户可通过输入单元对文档编辑器内文字信息进行修改，最终生成文档文件输出到数据存储单元。

数据存储单元，用于保存接收到的音频文件和文档文件；其中，数据存储单元采用本地硬盘。

录音播放处理器连接音频播放器，用于对录音单元录制的语音信息进行处理，生成音频流输出到音频播放器进行在线播放，并根据微控制器的控制信号控制录音的播放/暂停。

录音播放处理器包括时钟模块、播放模块和延时模块。

时钟模块，用于记录录音播放的起始时间以及停止时间。

播放模块，用于对录音单元录制的语音信息进行处理，生成音频流输出。

本发明工作过程：首先，语音采集单元采集用户语音信息，并发送到录音单元和语音识别处理器，录音单元对语音信息进行录制，并进行编码，生成音频文件存储到数据存储单元，同时将录制的语音信息实时发送到录音播放处理器；

用户通过输入单元输入控制指令，微控制器根据接收到的控制指令分别控制语音识别处理器和录音播放处理器工作，语音识别处理器对接收到的语音信息进行识别，转写为文字信息，发送到文档编辑器，并通过显示器实时显示；录音播放处理器的播放模块对录音单元录制的语音信息进行处理，生成音频流，经延时模块延时500ms后，输出到音频播放器进行在线播放，同时，通过时钟模块记录播放的起始时间。

用户通过显示器查看文字信息，通过音频播放器收听录音，通过输入单元对文档编辑器内的文字进行修正，并生成文本文档保存到数据存储单元。由于录音延迟播放，用户先浏览文字，再收听到录音，方便用户理解录音内容，更好的对文字进行修正。

当用户修正文字编辑器内的文字时，可通过输入单元输入控制指令，微处理器控制录音播放处理器暂停工作，暂停录音的播放，此时时钟模块记录播放的停止时间；当用户需要继续播放录音时，通过输入单元输入控制指令，微处理器控制录音播放处理器工作，播放模块根据时钟模块记录的起始时间和停止时间获取录音的播放时间，从暂停节点开始继续播放，时钟模块再次记录播放的起始时间，实现录音在线播放的播放/暂停，方便用户校正文字。

本发明通过语音采集单元获取语音信息，通过录音单元录制语音信息，通过语音识别处理器将语音转写为文字，通过录音播放处理器播放录音，基于分核处理技术，双核双线程同时工作，实现录音和文字同步处理，并且通过延时模块将录音延时输出，用户先浏览文字，再收听到录音，方便用户理解录音内容，更好的对文字进行修正；使用微控制器对两个处理器单独控制，在不影响将语音转写为文字的情况下，单独控制录音在线播放或暂停，方便用户校正文字，提高语音识别和文字校正的准确性，可广泛用于会议记录、直播字幕制作等方面。

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.基于分核处理技术的语音快速转写校正系统，其特征在于：包括语音采集单元、录音单元、数据存储单元、语音识别处理器、录音播放处理器、文档编辑器、微控制器、输入单元、显示器以及音频播放器；

2.根据权利要求1所述的基于分核处理技术的语音快速转写校正系统，其特征在于：所述的录音播放处理器包括

时钟模块，用于记录录音播放的起始时间以及停止时间；