CN107301867A - 一种语音重启控制系统 - Google Patents
一种语音重启控制系统 Download PDFInfo
- Publication number
- CN107301867A CN107301867A CN201710681330.5A CN201710681330A CN107301867A CN 107301867 A CN107301867 A CN 107301867A CN 201710681330 A CN201710681330 A CN 201710681330A CN 107301867 A CN107301867 A CN 107301867A
- Authority
- CN
- China
- Prior art keywords
- audio
- voice
- module
- data
- control system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 8
- 238000012544 monitoring process Methods 0.000 claims abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 6
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 2
- 210000004556 brain Anatomy 0.000 claims 1
- 230000005611 electricity Effects 0.000 claims 1
- 230000003993 interaction Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 6
- 230000007613 environmental effect Effects 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000007726 management method Methods 0.000 description 13
- 238000005025 nuclear technology Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 206010003694 Atrophy Diseases 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
- H04L65/4038—Arrangements for multi-party communication, e.g. for conferences with floor control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音重启控制系统,涉及语音文字信息技术领域。包括用于采集音频的音频采集模块;用于处理音频数据的处理器;用于监听音频输入模块数据流的参数监听模块;处理器通过计时器与参数监听模块连续采集语音,并将语音转换为音频数据传输至云端服务器转换为文字,通过终端设备实时显示。本发明通过设置参数监听模块实时监控用户语音输入情况,通过处理器控制音频输入、输出,实现了用户音频连续性输入,并通过云端服务器实时转换为文字信息传输至终端设备,通过终端设备实时显示音频文字,在用户在线会议时,避免因环境因素导致会议效果差,增强用户体验,提高了会议效果,提高了工作效率。
Description
技术领域
本发明属于语音文字信息技术领域,特别是涉及一种语音重启控制系统。
背景技术
移动互联网改变着人们获取信息和社交的方式,使得大众时代的消费力量在萎缩分散,小众和社群的力量在崛起,随着渠道、团队、产品纷纷碎片化,使得流量集中的难度越来越高。面对碎片化的环境,社群作为深度垂直的物理单元,其传播的转化率价值远远超过以往任何时代。
广电行业作为新技术、新媒体应用范围最广泛的行业之一,始终在核技术发展的最前沿,时刻关注着核技术发展的方向,尤其是近年来以大数据、云计算、网络核技术为基础的新型媒体核技术的发展。
在线会议现在已成为许多企业在日常会议中的选择,但是在线会议经常因为室外环境因素导致会议效果差,并且与会人员在语音输入时会经常停顿使语音输入断断续续,导致与会人员信息表达不清,会议效率低下,延长会议时间,浪费与会人员时间;现在设计一种语音重启控制系统,通过实时监听用户语音输入情况,实现语音连续性输入,并实时将音频转换为文字,同步显示。
发明内容
本发明的目的在于提供一种语音重启控制系统,通过设置参数监听模块实时监控用户语音输入情况,通过处理器控制音频输入、输出,实现了用户音频连续性输入,并通过云端服务器实时转换为文字信息传输至终端设备,通过终端设备实时显示音频文字,在用户在线会议时,避免因环境因素导致会议效果差,增强用户体验,提高了会议效果,提高了工作效率。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种语音重启控制系统,包括用于采集音频的音频采集模块;所述音频采集模块通过音频输入模块将音频数据输入处理器;用于处理音频数据的处理器;所述处理器嵌入有计时器;所述处理器将采集的音频数据通过通信模块传输至云端服务器;其中,所述云端服务器包括语音服务器、管理服务器和数据服务器;用于监听音频输入模块数据流的参数监听模块;所述参数监听模块包括一声波采集装置;用于音频、文字输出的终端设备;所述处理器通过计时器与参数监听模块连续采集语音,并将语音转换为音频数据传输至云端服务器转换为文字,通过终端设备实时显示。
进一步地,所述音频采集模块采用话筒,实时采集用户的语音信息。
进一步地,所述语音服务器包括语音识别模块和音频转换模块;其中,所述语音识别模块用于识别音频信息;并将识别后的音频信息传输至音频转换模块将音频数据转换为文字数据存储在数据服务器。
进一步地,所述数据服务器用于存储音频数据、转录后的文字数据信息和系统运行记录数据信息,所述处理器直接调用数据服务器中的数据信息。
进一步地,所述管理服务器用于管理系统的数据运行统计,通过管理服务器管理系统的运行,所述处理器与管理服务器进行信息的交互,通过管理服务器对系统进行管理维护。
进一步地,所述参数监听模块监听音频采集模块的数据,通过声波采集装置感应用户语音信息,用户语音输入停顿后,所述音频输入模块停止输入音频;当用户再次说话时,所述声波采集装置感应到信号后,重启音频输入模块。
进一步地,所述计时器用于计算语音输入停顿时间,当停顿时间超过系统设定的阈值时,所述处理器关闭系统。
进一步地,所述终端设备实时同步输出音频与文字数据信息,避免了用进行在线会议时因环境问题错过了其他与会人员的信息。
进一步地,所述通信模块包括有线网络或WIFI无线网络或3G/4G移动网络。
进一步地,所述述终端设备包括电脑或智能平板或手机。
本发明具有以下有益效果:
本发明通过设置参数监听模块实时监控用户语音输入情况,通过处理器控制音频输入、输出,实现了用户音频连续性输入,并通过云端服务器实时转换为文字信息传输至终端设备,通过终端设备实时显示音频文字,在用户在线会议时,避免因环境因素导致会议效果差,增强用户体验,提高了会议效果,提高了工作效率。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种语音重启控制系统,包括用于采集音频的音频采集模块;音频采集模块通过音频输入模块将音频数据输入处理器;用于处理音频数据的处理器;处理器嵌入有计时器;处理器将采集的音频数据通过通信模块传输至云端服务器;其中,云端服务器包括语音服务器、管理服务器和数据服务器;用于监听音频输入模块数据流的参数监听模块;参数监听模块包括一声波采集装置;用于音频、文字输出的终端设备;处理器通过计时器与参数监听模块连续采集语音,并将语音转换为音频数据传输至云端服务器转换为文字,通过终端设备实时显示。
其中,音频采集模块采用话筒,实时采集用户的语音信息。
其中,语音服务器包括语音识别模块和音频转换模块;其中,语音识别模块用于识别音频信息;并将识别后的音频信息传输至音频转换模块将音频数据转换为文字数据存储在数据服务器。
其中,数据服务器用于存储音频数据、转录后的文字数据信息和系统运行记录数据信息,处理器直接调用数据服务器中的数据信息。
其中,管理服务器用于管理系统的数据运行统计,通过管理服务器管理系统的运行,处理器与管理服务器进行信息的交互,通过管理服务器对系统进行管理维护。
其中,参数监听模块监听音频采集模块的数据,通过声波采集装置感应用户语音信息,用户语音输入停顿后,音频输入模块停止输入音频;当用户再次说话时,声波采集装置感应到信号后,重启音频输入模块。
其中,计时器用于计算语音输入停顿时间,当停顿时间超过系统设定的阈值时,处理器关闭系统。
其中,终端设备实时同步输出音频与文字数据信息,避免了用进行在线会议时因环境问题错过了其他与会人员的信息。
其中,通信模块包括有线网络或WIFI无线网络或3G/4G移动网络。
其中,述终端设备包括电脑或智能平板或手机。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种语音重启控制系统,其特征在于:包括
用于采集音频的音频采集模块;所述音频采集模块通过音频输入模块将音频数据输入处理器;
用于处理音频数据的处理器;所述处理器嵌入有计时器;
所述处理器将采集的音频数据通过通信模块传输至云端服务器;
其中,所述云端服务器包括语音服务器、管理服务器和数据服务器;
用于监听音频输入模块数据流的参数监听模块;所述参数监听模块包括一声波采集装置;
用于音频、文字输出的终端设备;
所述处理器通过计时器与参数监听模块连续采集语音,并将语音转换为音频数据传输至云端服务器转换为文字,通过终端设备实时显示。
2.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述音频采集模块采用话筒,实时采集用户的语音信息。
3.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述语音服务器包括语音识别模块和音频转换模块;
其中,所述语音识别模块用于识别音频信息;并将识别后的音频信息传输至音频转换模块将音频数据转换为文字数据存储在数据服务器。
4.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述数据服务器用于存储音频数据、转录后的文字数据信息和系统运行记录数据信息。
5.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述管理服务器用于管理系统的数据运行统计,通过管理服务器管理系统的运行,所述处理器与管理服务器进行信息的交互,通过管理服务器对系统进行管理维护。
6.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述参数监听模块监听音频采集模块的数据,通过声波采集装置感应用户语音信息,用户语音输入停顿后,所述音频输入模块停止输入音频;当用户再次说话时,所述声波采集装置感应到信号后,重启音频输入模块。
7.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述计时器用于计算语音输入停顿时间。
8.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述终端设备实时同步输出音频与文字数据信息。
9.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述通信模块包括有线网络或WIFI无线网络或3G/4G移动网络。
10.根据权利要求1所述的一种语音重启控制系统,其特征在于,所述终端设备包括电脑或智能平板或手机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710681330.5A CN107301867A (zh) | 2017-08-10 | 2017-08-10 | 一种语音重启控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710681330.5A CN107301867A (zh) | 2017-08-10 | 2017-08-10 | 一种语音重启控制系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107301867A true CN107301867A (zh) | 2017-10-27 |
Family
ID=60134520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710681330.5A Pending CN107301867A (zh) | 2017-08-10 | 2017-08-10 | 一种语音重启控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107301867A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107748602A (zh) * | 2017-11-15 | 2018-03-02 | 安徽声讯信息技术有限公司 | 一种基于语音识别的智能语音计算机 |
CN108597518A (zh) * | 2018-03-21 | 2018-09-28 | 安徽咪鼠科技有限公司 | 一种基于语音识别的会议记录智能麦克风系统 |
CN109348164A (zh) * | 2018-11-19 | 2019-02-15 | 国网山东省电力公司信息通信公司 | 一种电视电话会议自助保障控制系统 |
CN111654658A (zh) * | 2020-06-17 | 2020-09-11 | 平安科技(深圳)有限公司 | 音视频通话的处理方法、系统、编解码器及存储装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258550A (zh) * | 2012-02-21 | 2013-08-21 | 爱国者电子科技有限公司 | 声控录音设备 |
CN104702791A (zh) * | 2015-03-13 | 2015-06-10 | 安徽声讯信息技术有限公司 | 长时间录音并同步转写文字的智能手机及其信息处理方法 |
CN104835504A (zh) * | 2015-04-01 | 2015-08-12 | 广东小天才科技有限公司 | 一种消除语音互动过程中录音评测噪声干扰的方法及装置 |
CN105895134A (zh) * | 2016-05-10 | 2016-08-24 | 安徽声讯信息技术有限公司 | 具有远程录音和云端转写控制的记录装置及其实现方法 |
CN106504754A (zh) * | 2016-09-29 | 2017-03-15 | 浙江大学 | 一种根据音频输出的实时字幕生成方法 |
-
2017
- 2017-08-10 CN CN201710681330.5A patent/CN107301867A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258550A (zh) * | 2012-02-21 | 2013-08-21 | 爱国者电子科技有限公司 | 声控录音设备 |
CN104702791A (zh) * | 2015-03-13 | 2015-06-10 | 安徽声讯信息技术有限公司 | 长时间录音并同步转写文字的智能手机及其信息处理方法 |
CN104835504A (zh) * | 2015-04-01 | 2015-08-12 | 广东小天才科技有限公司 | 一种消除语音互动过程中录音评测噪声干扰的方法及装置 |
CN105895134A (zh) * | 2016-05-10 | 2016-08-24 | 安徽声讯信息技术有限公司 | 具有远程录音和云端转写控制的记录装置及其实现方法 |
CN106504754A (zh) * | 2016-09-29 | 2017-03-15 | 浙江大学 | 一种根据音频输出的实时字幕生成方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107748602A (zh) * | 2017-11-15 | 2018-03-02 | 安徽声讯信息技术有限公司 | 一种基于语音识别的智能语音计算机 |
CN108597518A (zh) * | 2018-03-21 | 2018-09-28 | 安徽咪鼠科技有限公司 | 一种基于语音识别的会议记录智能麦克风系统 |
CN109348164A (zh) * | 2018-11-19 | 2019-02-15 | 国网山东省电力公司信息通信公司 | 一种电视电话会议自助保障控制系统 |
CN111654658A (zh) * | 2020-06-17 | 2020-09-11 | 平安科技(深圳)有限公司 | 音视频通话的处理方法、系统、编解码器及存储装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107301867A (zh) | 一种语音重启控制系统 | |
CN103035105B (zh) | 基于物联网、云计算的消防报警远程监控系统 | |
WO2020098421A1 (zh) | 智能设备控制方法、装置和存储介质 | |
CN104340781B (zh) | 基于无线网络的多媒体、电梯远程控制系统及其使用方法 | |
CN204679765U (zh) | 一种基于云技术的智能家居控制装置 | |
CN103826101A (zh) | 一种云视频智能服务系统 | |
CN103489210A (zh) | 一种虚拟人物主动联系系统及其方法 | |
CN103731849A (zh) | 防沉迷手机游戏在线监控系统 | |
CN107145758A (zh) | 一种基于家用机器人的外出陪护服务方法和装置 | |
CN107527618A (zh) | 一种音频文字同步播放系统 | |
CN203275961U (zh) | 校园安防监控系统 | |
CN202475484U (zh) | 物联网协议转换装置 | |
CN107786840A (zh) | 基于智能家居的远程小孩老人的监管系统及其方法 | |
CN203673774U (zh) | 电子桌牌 | |
CN203072071U (zh) | 移动式应急双向音视频传输设备 | |
CN205038502U (zh) | 基于云平台管理的电机端盖生成系统 | |
CN202931561U (zh) | 防沉迷手机游戏在线监控系统 | |
CN101431736A (zh) | 移动终端及其通讯方法 | |
CN106791631A (zh) | 一种新型视频云平台 | |
CN204578705U (zh) | 一种高效家用的新型视频聊天移动终端设备 | |
CN203301531U (zh) | 水利物联网管理系统 | |
CN106790534A (zh) | 一种电力系统消息推送方法、装置及系统 | |
CN206497335U (zh) | 基于嵌入式web的智能家居机器人 | |
CN206077663U (zh) | 一种即时通讯的音响系统 | |
CN109240104A (zh) | 一种语音识别控制智能家居系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171027 |
|
RJ01 | Rejection of invention patent application after publication |