CN110867185A - 一种内外网隔离的语音转文字实时输入系统及其方法 - Google Patents

一种内外网隔离的语音转文字实时输入系统及其方法 Download PDF

Info

Publication number
CN110867185A
CN110867185A CN201911063900.XA CN201911063900A CN110867185A CN 110867185 A CN110867185 A CN 110867185A CN 201911063900 A CN201911063900 A CN 201911063900A CN 110867185 A CN110867185 A CN 110867185A
Authority
CN
China
Prior art keywords
audio
voice
data packet
network
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911063900.XA
Other languages
English (en)
Inventor
吉济全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Tax Soft Software Technology Co Ltd
Original Assignee
Jiangsu Tax Soft Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Tax Soft Software Technology Co Ltd filed Critical Jiangsu Tax Soft Software Technology Co Ltd
Priority to CN201911063900.XA priority Critical patent/CN110867185A/zh
Publication of CN110867185A publication Critical patent/CN110867185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种内外网隔离的语音转文字实时输入系统及其方法,属于音频处理技术领域,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,通过语音采集模块实现了内外网的隔离,是内部网络与外部网络不发送任何的数据交互,并建立同步时钟和分段发送语音数据,解决了内网和外围隔离环境下的将语音转化成文字的技术问题,本发明采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒,使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑,实现了网络安全的文字输入。

Description

一种内外网隔离的语音转文字实时输入系统及其方法
技术领域
本发明属于音频处理技术领域,尤其涉及一种内外网隔离的语音转文字实时输入系统及其方法。
背景技术
目前语音输入已经成熟,但是绝大多数是在线联网的方式进行处理,而很多场景下办公环境是内网,从安全性考虑上也不能通过多网卡的方式连接外网,那么对于内网想利用现有成熟的语音输入方案实现输入或记录就变得很困难,有企业提供了内网离线库的解决方案,但是费用巨大。
目前普遍的方案是外网环境引用语音识别软件,或者采用内网离线包的方式进行内网语音识别。
第一种的缺点是需要外网环境,不适用于内网;第二种就要数十万或者上百万的费用同部署内网离线包。
发明内容
本发明的目的是提供一种内外网隔离的语音转文字实时输入系统及其方法,解决了内网和外围隔离环境下的将语音转化成文字的技术问题。
为实现上述目的,本发明采用如下技术方案:
一种内外网隔离的语音转文字实时输入系统,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;
第三方语音处理服务器用于进行语音转文字的处理;
语音采集模块用于采集音频信息并对音频信息进行数字编码。
优选的,所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。
优选的,所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。
一种内外网隔离的语音转文字实时输入方法,包括如下步骤:
步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;
步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换为数字格式的音频数据;
步骤3:主控制器获取音频数据,并根据预定的字节长度对音频数据进行分节,得到多组音频段数据;
步骤4:在主控制器中建立一个同步时钟模块,同步时钟为每一组音频段数据均生成一个同步时钟,并同时产生该同步时钟的同步时钟标识编码;
步骤5:主控制器对音频段数据进行打包,并把该音频段数据对应的同步时钟标识编码加入到数据包中,生成音频段数据包;
步骤6:主控制器在音频段数据包中加入时间戳A,并缓存到RAM存储器中;
步骤7:在RAM储存器中建立数据包列表,音频段数据包按照自身的时间戳A,顺序存储在数据包列表中;
步骤8:主控制器按照时间先后,顺序从数据包列表中获取音频段数据包,并将音频段数据包通过WiFi网络发送到互联网上;
步骤9:第三方语音处理服务器通过互联网获取到音频段数据包,并对音频段数据包中的音频段数据进行解析,生成文字数据;
第三方语音处理服务器对文字数据进行打包,生成文字数据包,并将音频段数据包中的同步时钟标识编码添加到文字数据包中;
第三方语音处理服务器生成时间戳B,并将时间戳B添加到文字数据包,同时将文字数据包发送给语音采集模块;
步骤10:语音采集模块的主控制器获取文字数据包,根据文字数据包中的同步时钟标识编码,在RAM存储器中找出对应的音频数据;
建立文字数据与音频段数据之间的映射列表;
步骤11:对比文字数据包中的时间戳和音频段数据包的时间戳,获得延迟数据;
步骤12:主控制器将文字数据转化成ASCII码的格式;
步骤13:主控制器根据同步时钟标识编码,顺序通过USB总线向内网服务器以ASCII码的格式发送文字数据。
本发明所述的一种内外网隔离的语音转文字实时输入系统及其方法,解决了内网和外围隔离环境下的将语音转化成文字的技术问题,本发明采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒,使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑,实现了网络安全的文字输入。
附图说明
图1是本发明的系统构架图;
图2是本发明的语音采集模块的原理图方框图;
图3是本发明的流程图。
具体实时方式
实时例1:
如图1-图2所示的一种内外网隔离的语音转文字实时输入系统,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;
本发明中,企业路由器为连接外部互联网的路由器,无线路由器是通过该企业路由器连接互联网的。
第三方语音处理服务器用于进行语音转文字的处理;
语音采集模块用于采集音频信息并对音频信息进行数字编码。
优选的,所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。
优选的,所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。
实时例2:
如图1-图3所示,实时例2所述的一种内外网隔离的语音转文字实时输入方法是在实时例1所示的一种内外网隔离的语音转文字实时输入系统的基础上实现的,包括如下步骤:
步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;
步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换为数字格式的音频数据;
步骤3:主控制器获取音频数据,并根据预定的字节长度对音频数据进行分节,得到多组音频段数据;
本实时例中,预定的字节长度为30个字节。
步骤4:在主控制器中建立一个同步时钟模块,同步时钟为每一组音频段数据均生成一个同步时钟,并同时产生该同步时钟的同步时钟标识编码;
本实时例中,同步时钟由主控芯片单独产生:在主控芯片中单独利用一个定时器进行同步时钟的产生,同步时钟的最小时间为0.1ms;
步骤5:主控制器对音频段数据进行打包,并把该音频段数据对应的同步时钟标识编码加入到数据包中,生成音频段数据包;
步骤6:主控制器在音频段数据包中加入时间戳A,并缓存到RAM存储器中;
时间戳A为主控制器产生的当前本地时间,本实时例中,主控制器产生的当前本地时间与第三方语音处理服务器产生的时间戳会有一定延迟,本实时例将整个延迟作为转换文字延迟,一并发给内网服务器进行参考。
步骤7:在RAM储存器中建立数据包列表,音频段数据包按照自身的时间戳A,顺序存储在数据包列表中;
步骤8:主控制器按照时间先后,顺序从数据包列表中获取音频段数据包,并将音频段数据包通过WiFi网络发送到互联网上;
步骤9:第三方语音处理服务器通过互联网获取到音频段数据包,并对音频段数据包中的音频段数据进行解析,生成文字数据;
第三方语音处理服务器对语音转化成文字的技术是现有技术,故不详细叙述。
第三方语音处理服务器对文字数据进行打包,生成文字数据包,并将音频段数据包中的同步时钟标识编码添加到文字数据包中;
第三方语音处理服务器生成时间戳B,并将时间戳B添加到文字数据包,同时将文字数据包发送给语音采集模块;
步骤10:语音采集模块的主控制器获取文字数据包,根据文字数据包中的同步时钟标识编码,在RAM存储器中找出对应的音频数据;
建立文字数据与音频段数据之间的映射列表;
步骤11:对比文字数据包中的时间戳和音频段数据包的时间戳,获得延迟数据;
步骤12:主控制器将文字数据转化成ASCII码的格式;
步骤13:主控制器根据同步时钟标识编码,顺序通过USB总线向内网服务器以ASCII码的格式发送文字数据。
本发明所述的一种内外网隔离的语音转文字实时输入系统及其方法,解决了内网和外围隔离环境下的将语音转化成文字的技术问题,本发明采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒,使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑,实现了网络安全的文字输入。

Claims (4)

1.一种内外网隔离的语音转文字实时输入系统,其特征在于:包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;
第三方语音处理服务器用于进行语音转文字的处理;
语音采集模块用于采集音频信息并对音频信息进行数字编码。
2.如权利要求1所述的一种内外网隔离的语音转文字实时输入系统,其特征在于:所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。
3.如权利要求2所述的一种内外网隔离的语音转文字实时输入系统,其特征在于:所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。
4.一种内外网隔离的语音转文字实时输入方法,其特征在于:包括如下步骤:
步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;
步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换为数字格式的音频数据;
步骤3:主控制器获取音频数据,并根据预定的字节长度对音频数据进行分节,得到多组音频段数据;
步骤4:在主控制器中建立一个同步时钟模块,同步时钟为每一组音频段数据均生成一个同步时钟,并同时产生该同步时钟的同步时钟标识编码;
步骤5:主控制器对音频段数据进行打包,并把该音频段数据对应的同步时钟标识编码加入到数据包中,生成音频段数据包;
步骤6:主控制器在音频段数据包中加入时间戳A,并缓存到RAM存储器中;
步骤7:在RAM储存器中建立数据包列表,音频段数据包按照自身的时间戳A,顺序存储在数据包列表中;
步骤8:主控制器按照时间先后,顺序从数据包列表中获取音频段数据包,并将音频段数据包通过WiFi网络发送到互联网上;
步骤9:第三方语音处理服务器通过互联网获取到音频段数据包,并对音频段数据包中的音频段数据进行解析,生成文字数据;
第三方语音处理服务器对文字数据进行打包,生成文字数据包,并将音频段数据包中的同步时钟标识编码添加到文字数据包中;
第三方语音处理服务器生成时间戳B,并将时间戳B添加到文字数据包,同时将文字数据包发送给语音采集模块;
步骤10:语音采集模块的主控制器获取文字数据包,根据文字数据包中的同步时钟标识编码,在RAM存储器中找出对应的音频数据;
建立文字数据与音频段数据之间的映射列表;
步骤11:对比文字数据包中的时间戳和音频段数据包的时间戳,获得延迟数据;
步骤12:主控制器将文字数据转化成ASCII码的格式;
步骤13:主控制器根据同步时钟标识编码,顺序通过USB总线向内网服务器以ASCII码的格式发送文字数据。
CN201911063900.XA 2019-11-04 2019-11-04 一种内外网隔离的语音转文字实时输入系统及其方法 Pending CN110867185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911063900.XA CN110867185A (zh) 2019-11-04 2019-11-04 一种内外网隔离的语音转文字实时输入系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911063900.XA CN110867185A (zh) 2019-11-04 2019-11-04 一种内外网隔离的语音转文字实时输入系统及其方法

Publications (1)

Publication Number Publication Date
CN110867185A true CN110867185A (zh) 2020-03-06

Family

ID=69653089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911063900.XA Pending CN110867185A (zh) 2019-11-04 2019-11-04 一种内外网隔离的语音转文字实时输入系统及其方法

Country Status (1)

Country Link
CN (1) CN110867185A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040179554A1 (en) * 2003-03-12 2004-09-16 Hsi-Kang Tsao Method and system of implementing real-time video-audio interaction by data synchronization
EP2913946A1 (de) * 2014-02-26 2015-09-02 Frequentis AG Sprachübertragung in redundanten Systemen
CN105516094A (zh) * 2015-11-27 2016-04-20 蓝网科技股份有限公司 基于工控机的内外网数据交换方法及装置
CN206713016U (zh) * 2017-05-22 2017-12-05 深圳市迈悦科技有限公司 无线语音交互麦克风系统
CN107731230A (zh) * 2017-11-10 2018-02-23 北京联华博创科技有限公司 一种庭审笔录系统及方法
CN110176235A (zh) * 2019-05-23 2019-08-27 腾讯科技(深圳)有限公司 语音识别文的展示方法、装置、存储介质和计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040179554A1 (en) * 2003-03-12 2004-09-16 Hsi-Kang Tsao Method and system of implementing real-time video-audio interaction by data synchronization
EP2913946A1 (de) * 2014-02-26 2015-09-02 Frequentis AG Sprachübertragung in redundanten Systemen
CN105516094A (zh) * 2015-11-27 2016-04-20 蓝网科技股份有限公司 基于工控机的内外网数据交换方法及装置
CN206713016U (zh) * 2017-05-22 2017-12-05 深圳市迈悦科技有限公司 无线语音交互麦克风系统
CN107731230A (zh) * 2017-11-10 2018-02-23 北京联华博创科技有限公司 一种庭审笔录系统及方法
CN110176235A (zh) * 2019-05-23 2019-08-27 腾讯科技(深圳)有限公司 语音识别文的展示方法、装置、存储介质和计算机设备

Similar Documents

Publication Publication Date Title
CN104320843B (zh) 蓝牙发声装置的音频同步方法
CN108694938A (zh) 用于在可穿戴设备上进行能量高效且低功率分布式自动语音辨识的系统和方法
CN110191024B (zh) 网络流量监控方法和装置
CN109451486B (zh) 基于探测请求帧的WiFi采集系统及WiFi终端探测方法
CN112053692B (zh) 语音识别处理方法、装置及存储介质
CN106452879A (zh) 一种基于pb的scd跨平台解析方法
CN107463706A (zh) 一种基于Hadoop的海量录波数据存储和解析方法及系统
CN114124916A (zh) 数据传输方法、装置、电子设备及存储介质
CN115273869A (zh) 音频数据传输方法、装置、芯片、电子设备及存储介质
CN110867185A (zh) 一种内外网隔离的语音转文字实时输入系统及其方法
CN113381974A (zh) 一种应用于专用通信的现场总线与Modbus-TCP之间的协议转换方法
CN107479988A (zh) 基于dcom的三层关联审计方法
CN113676386B (zh) 一种fc-ae-1553总线协议报文通讯系统
CN111831540A (zh) 一种调试信息的处理方法、处理装置和存储介质
CN103633736B (zh) 从变电子站至主站的在线监测通信方法
CN111931012A (zh) 一种基于故障管理子系统的数据模型自适应方法和装置
CN114328698B (zh) 一种数据转换系统
CN115132213A (zh) 音频数据传输方法、装置、芯片、电子设备及存储介质
CN104408104B (zh) 一种智能变电站网络数据通信方法
KR101952730B1 (ko) 교신 내용을 보팅으로 선별하여 음성인식하는 무선 교신 시스템
CN108650429B (zh) 一种话单排重方法及排重系统
CN111986657A (zh) 音频识别方法和装置、录音终端及服务器、存储介质
CN112053679A (zh) 一种基于移动终端的角色分离会议速记系统及方法
CN115314572B (zh) 一种针对电力通信协议的协议转换方法、系统及设备
CN116346519B (zh) 一种空客系统和摩托系统组呼实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200306

RJ01 Rejection of invention patent application after publication