CN110867185A

CN110867185A - 一种内外网隔离的语音转文字实时输入系统及其方法

Info

Publication number: CN110867185A
Application number: CN201911063900.XA
Authority: CN
Inventors: 吉济全
Original assignee: Jiangsu Tax Soft Software Technology Co Ltd
Current assignee: Jiangsu Tax Soft Software Technology Co Ltd
Priority date: 2019-11-04
Filing date: 2019-11-04
Publication date: 2020-03-06

Abstract

本发明公开了一种内外网隔离的语音转文字实时输入系统及其方法，属于音频处理技术领域，包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器，通过语音采集模块实现了内外网的隔离，是内部网络与外部网络不发送任何的数据交互，并建立同步时钟和分段发送语音数据，解决了内网和外围隔离环境下的将语音转化成文字的技术问题，本发明采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒，使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑，实现了网络安全的文字输入。

Description

一种内外网隔离的语音转文字实时输入系统及其方法

技术领域

本发明属于音频处理技术领域，尤其涉及一种内外网隔离的语音转文字实时输入系统及其方法。

背景技术

目前语音输入已经成熟，但是绝大多数是在线联网的方式进行处理，而很多场景下办公环境是内网，从安全性考虑上也不能通过多网卡的方式连接外网，那么对于内网想利用现有成熟的语音输入方案实现输入或记录就变得很困难，有企业提供了内网离线库的解决方案，但是费用巨大。

目前普遍的方案是外网环境引用语音识别软件，或者采用内网离线包的方式进行内网语音识别。

第一种的缺点是需要外网环境，不适用于内网；第二种就要数十万或者上百万的费用同部署内网离线包。

发明内容

本发明的目的是提供一种内外网隔离的语音转文字实时输入系统及其方法，解决了内网和外围隔离环境下的将语音转化成文字的技术问题。

为实现上述目的，本发明采用如下技术方案：

一种内外网隔离的语音转文字实时输入系统，包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器，内网服务器通过USB总线与语音采集模块通信，语音采集模块通过WiFi无线网络与无线路由器通信，无线路由器通过企业路由器连接互联网，第三方语音处理服务器通过互联网与企业路由器通信；

第三方语音处理服务器用于进行语音转文字的处理；

语音采集模块用于采集音频信息并对音频信息进行数字编码。

优选的，所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器，音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。

优选的，所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路，音频放大器采用LM386放大器；所述主控制器的型号为S3C2410；所述音频解码器的型号为VS1063A；所述网络模块的型号为QCA64x8；所述USB控制器的型号为CH378；所述RAM存储器的型号为IDT70V09；所述FLASH存储器的型号为M25P16；所述蓝牙模块的型号为AC6919A。

一种内外网隔离的语音转文字实时输入方法，包括如下步骤：

步骤1：建立所述一种内外网隔离的语音转文字实时输入系统；

步骤2：语音采集模块通过麦克风采集语音的音频模拟信息，并通过音频解码器将音频模拟信息转换为数字格式的音频数据；

步骤3：主控制器获取音频数据，并根据预定的字节长度对音频数据进行分节，得到多组音频段数据；

步骤4：在主控制器中建立一个同步时钟模块，同步时钟为每一组音频段数据均生成一个同步时钟，并同时产生该同步时钟的同步时钟标识编码；

步骤5：主控制器对音频段数据进行打包，并把该音频段数据对应的同步时钟标识编码加入到数据包中，生成音频段数据包；

步骤6：主控制器在音频段数据包中加入时间戳A，并缓存到RAM存储器中；

步骤7：在RAM储存器中建立数据包列表，音频段数据包按照自身的时间戳A，顺序存储在数据包列表中；

步骤8：主控制器按照时间先后，顺序从数据包列表中获取音频段数据包，并将音频段数据包通过WiFi网络发送到互联网上；

步骤9：第三方语音处理服务器通过互联网获取到音频段数据包，并对音频段数据包中的音频段数据进行解析，生成文字数据；

第三方语音处理服务器对文字数据进行打包，生成文字数据包，并将音频段数据包中的同步时钟标识编码添加到文字数据包中；

第三方语音处理服务器生成时间戳B，并将时间戳B添加到文字数据包，同时将文字数据包发送给语音采集模块；

步骤10：语音采集模块的主控制器获取文字数据包，根据文字数据包中的同步时钟标识编码，在RAM存储器中找出对应的音频数据；

建立文字数据与音频段数据之间的映射列表；

步骤11：对比文字数据包中的时间戳和音频段数据包的时间戳，获得延迟数据；

步骤12：主控制器将文字数据转化成ASCII码的格式；

步骤13：主控制器根据同步时钟标识编码，顺序通过USB总线向内网服务器以ASCII码的格式发送文字数据。

本发明所述的一种内外网隔离的语音转文字实时输入系统及其方法，解决了内网和外围隔离环境下的将语音转化成文字的技术问题，本发明采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒，使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑，实现了网络安全的文字输入。

附图说明

图1是本发明的系统构架图；

图2是本发明的语音采集模块的原理图方框图；

图3是本发明的流程图。

具体实时方式

实时例1：

如图1-图2所示的一种内外网隔离的语音转文字实时输入系统，包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器，内网服务器通过USB总线与语音采集模块通信，语音采集模块通过WiFi无线网络与无线路由器通信，无线路由器通过企业路由器连接互联网，第三方语音处理服务器通过互联网与企业路由器通信；

本发明中，企业路由器为连接外部互联网的路由器，无线路由器是通过该企业路由器连接互联网的。

第三方语音处理服务器用于进行语音转文字的处理；

实时例2：

如图1-图3所示，实时例2所述的一种内外网隔离的语音转文字实时输入方法是在实时例1所示的一种内外网隔离的语音转文字实时输入系统的基础上实现的，包括如下步骤：

本实时例中，预定的字节长度为30个字节。

本实时例中，同步时钟由主控芯片单独产生：在主控芯片中单独利用一个定时器进行同步时钟的产生，同步时钟的最小时间为0.1ms；

时间戳A为主控制器产生的当前本地时间，本实时例中，主控制器产生的当前本地时间与第三方语音处理服务器产生的时间戳会有一定延迟，本实时例将整个延迟作为转换文字延迟，一并发给内网服务器进行参考。

第三方语音处理服务器对语音转化成文字的技术是现有技术，故不详细叙述。

建立文字数据与音频段数据之间的映射列表；

步骤12：主控制器将文字数据转化成ASCII码的格式；

Claims

1.一种内外网隔离的语音转文字实时输入系统，其特征在于：包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器，内网服务器通过USB总线与语音采集模块通信，语音采集模块通过WiFi无线网络与无线路由器通信，无线路由器通过企业路由器连接互联网，第三方语音处理服务器通过互联网与企业路由器通信；

第三方语音处理服务器用于进行语音转文字的处理；

2.如权利要求1所述的一种内外网隔离的语音转文字实时输入系统，其特征在于：所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器，音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。

3.如权利要求2所述的一种内外网隔离的语音转文字实时输入系统，其特征在于：所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路，音频放大器采用LM386放大器；所述主控制器的型号为S3C2410；所述音频解码器的型号为VS1063A；所述网络模块的型号为QCA64x8；所述USB控制器的型号为CH378；所述RAM存储器的型号为IDT70V09；所述FLASH存储器的型号为M25P16；所述蓝牙模块的型号为AC6919A。

4.一种内外网隔离的语音转文字实时输入方法，其特征在于：包括如下步骤：

建立文字数据与音频段数据之间的映射列表；

步骤12：主控制器将文字数据转化成ASCII码的格式；