CN107731222B - 一种延长智能语音鼠标语音识别延续时间的方法 - Google Patents
一种延长智能语音鼠标语音识别延续时间的方法 Download PDFInfo
- Publication number
- CN107731222B CN107731222B CN201710947346.6A CN201710947346A CN107731222B CN 107731222 B CN107731222 B CN 107731222B CN 201710947346 A CN201710947346 A CN 201710947346A CN 107731222 B CN107731222 B CN 107731222B
- Authority
- CN
- China
- Prior art keywords
- audio
- server
- mouse
- speech
- mute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0354—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
- G06F3/03543—Mice or pucks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
Abstract
本发明公开了一种延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,寻找静音语音块,若在第59内找到静音语音块,则提示程序重新连接到服务器,若在第59秒内未找到静音语音块,则在第59秒时强制重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
Description
技术领域
本发明属于语音识别技术领域,涉及一种延长语音识别延续时间的方法,具体是一种延长智能语音鼠标语音识别延续时间的方法。
背景技术
智能语音鼠标工作时,需要将采集到的音频数据上传到讯飞语音识别服务器进行语音识别工作。然而,讯飞语音服务器的语音识别延续时间是1分钟,只支持1分钟的连续语音识别时间,超过1分钟就提示超时,无法进行识别,连续的语音识别就断开了,大大影响了智能语音鼠标的工作效果和稳定性。
发明内容
本发明的目的在于提供一种延长智能语音鼠标语音识别延续时间的方法。
本发明的目的可以通过以下技术方案实现:
一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块;
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数;
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号;
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号;
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器。
本发明的有益效果:本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块。
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数。
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;其中,静音音频块为不包含任何声音数据的音频块。
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号。
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号。
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器,避免因语音识别超时而导致连续的语音识别断开。
本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (1)
1.一种延长智能语音鼠标语音识别延续时间的方法,其特征在于,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块;
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数;
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号;
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号;
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710947346.6A CN107731222B (zh) | 2017-10-12 | 2017-10-12 | 一种延长智能语音鼠标语音识别延续时间的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710947346.6A CN107731222B (zh) | 2017-10-12 | 2017-10-12 | 一种延长智能语音鼠标语音识别延续时间的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107731222A CN107731222A (zh) | 2018-02-23 |
CN107731222B true CN107731222B (zh) | 2020-06-30 |
Family
ID=61211213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710947346.6A Active CN107731222B (zh) | 2017-10-12 | 2017-10-12 | 一种延长智能语音鼠标语音识别延续时间的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107731222B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170286049A1 (en) * | 2014-08-27 | 2017-10-05 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing voice commands |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6668244B1 (en) * | 1995-07-21 | 2003-12-23 | Quartet Technology, Inc. | Method and means of voice control of a computer, including its mouse and keyboard |
KR20140058127A (ko) * | 2012-11-06 | 2014-05-14 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9699673B1 (en) * | 2016-02-23 | 2017-07-04 | At&T Intellectual Property I, L.P. | Maintaining active sessions during subscriber management system maintenance activities |
CN106371801A (zh) * | 2016-09-23 | 2017-02-01 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的语音鼠标系统 |
CN206451136U (zh) * | 2016-10-26 | 2017-08-29 | 安徽咪鼠科技有限公司 | 一种基于语音识别技术的无线鼠标控制装置 |
CN107135536A (zh) * | 2017-05-08 | 2017-09-05 | 深圳市沃特沃德股份有限公司 | 网络连接方法及装置 |
-
2017
- 2017-10-12 CN CN201710947346.6A patent/CN107731222B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170286049A1 (en) * | 2014-08-27 | 2017-10-05 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing voice commands |
Non-Patent Citations (1)
Title |
---|
《Hands free interface for Human Computer Interaction》;S.Kasun Chathuranga et al.;《2010 Fifth International Conference on Information and Automation for Sustainability》;20110217;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107731222A (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6489563B2 (ja) | 音量調節方法、システム、デバイス及びプログラム | |
CN104410379B (zh) | 一种音量调节方法 | |
CN106898348B (zh) | 一种出声设备的去混响控制方法和装置 | |
CN106878533B (zh) | 一种移动终端的通信方法和装置 | |
CN104780259B (zh) | 通话语音质量自动调节系统与方法 | |
CN104363510B (zh) | 一种播放终端 | |
CN104020979B (zh) | 一种自适应桌面选择音效的移动终端及方法 | |
CN104484150A (zh) | 一种音频播放的方法、装置及一种终端 | |
CN103024630A (zh) | 一种第一电子设备的音量调节方法及第一电子设备 | |
CN103491488A (zh) | 一种麦克风回音消除方法及装置 | |
CN104991755B (zh) | 一种信息处理方法及电子设备 | |
CN104299622A (zh) | 一种音频处理方法 | |
DE112021004307T5 (de) | Ohrhörerpositionierung und -halterung | |
CN104835520A (zh) | 一种在移动设备上录音的方法及装置 | |
CN103929692B (zh) | 一种音频信息处理方法及电子设备 | |
CN106024035A (zh) | 一种音频处理的方法及终端 | |
CN106095379B (zh) | 一种音量调节方法及装置 | |
CN104754462A (zh) | 音量自动调节装置及方法和耳机 | |
CN105847566A (zh) | 移动终端音频的音量调节方法及装置 | |
CN105227783A (zh) | 闹钟响铃方法及装置 | |
CN103888610A (zh) | 同时通话和录音的方法和通讯终端 | |
CN107731222B (zh) | 一种延长智能语音鼠标语音识别延续时间的方法 | |
CN108337353A (zh) | 通信设备的声音信号处理方法和设备 | |
CN104821796A (zh) | 一种音量控制方法、播放设备、移动终端及系统 | |
CN107168676B (zh) | 一种信息输出方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |