CN107731222B - 一种延长智能语音鼠标语音识别延续时间的方法 - Google Patents

一种延长智能语音鼠标语音识别延续时间的方法 Download PDF

Info

Publication number
CN107731222B
CN107731222B CN201710947346.6A CN201710947346A CN107731222B CN 107731222 B CN107731222 B CN 107731222B CN 201710947346 A CN201710947346 A CN 201710947346A CN 107731222 B CN107731222 B CN 107731222B
Authority
CN
China
Prior art keywords
audio
server
mouse
speech
mute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710947346.6A
Other languages
English (en)
Other versions
CN107731222A (zh
Inventor
冯海洪
朱国冉
许成亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Mimouse Technology Co ltd
Original Assignee
Anhui Mimouse Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Mimouse Technology Co ltd filed Critical Anhui Mimouse Technology Co ltd
Priority to CN201710947346.6A priority Critical patent/CN107731222B/zh
Publication of CN107731222A publication Critical patent/CN107731222A/zh
Application granted granted Critical
Publication of CN107731222B publication Critical patent/CN107731222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03543Mice or pucks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management

Abstract

本发明公开了一种延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,寻找静音语音块,若在第59内找到静音语音块,则提示程序重新连接到服务器,若在第59秒内未找到静音语音块,则在第59秒时强制重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。

Description

一种延长智能语音鼠标语音识别延续时间的方法
技术领域
本发明属于语音识别技术领域,涉及一种延长语音识别延续时间的方法,具体是一种延长智能语音鼠标语音识别延续时间的方法。
背景技术
智能语音鼠标工作时,需要将采集到的音频数据上传到讯飞语音识别服务器进行语音识别工作。然而,讯飞语音服务器的语音识别延续时间是1分钟,只支持1分钟的连续语音识别时间,超过1分钟就提示超时,无法进行识别,连续的语音识别就断开了,大大影响了智能语音鼠标的工作效果和稳定性。
发明内容
本发明的目的在于提供一种延长智能语音鼠标语音识别延续时间的方法。
本发明的目的可以通过以下技术方案实现:
一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块;
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数;
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号;
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号;
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器。
本发明的有益效果:本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块。
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数。
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;其中,静音音频块为不包含任何声音数据的音频块。
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号。
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号。
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器,避免因语音识别超时而导致连续的语音识别断开。
本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.一种延长智能语音鼠标语音识别延续时间的方法,其特征在于,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块;
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数;
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号;
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号;
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器。
CN201710947346.6A 2017-10-12 2017-10-12 一种延长智能语音鼠标语音识别延续时间的方法 Active CN107731222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710947346.6A CN107731222B (zh) 2017-10-12 2017-10-12 一种延长智能语音鼠标语音识别延续时间的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710947346.6A CN107731222B (zh) 2017-10-12 2017-10-12 一种延长智能语音鼠标语音识别延续时间的方法

Publications (2)

Publication Number Publication Date
CN107731222A CN107731222A (zh) 2018-02-23
CN107731222B true CN107731222B (zh) 2020-06-30

Family

ID=61211213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710947346.6A Active CN107731222B (zh) 2017-10-12 2017-10-12 一种延长智能语音鼠标语音识别延续时间的方法

Country Status (1)

Country Link
CN (1) CN107731222B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170286049A1 (en) * 2014-08-27 2017-10-05 Samsung Electronics Co., Ltd. Apparatus and method for recognizing voice commands

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668244B1 (en) * 1995-07-21 2003-12-23 Quartet Technology, Inc. Method and means of voice control of a computer, including its mouse and keyboard
KR20140058127A (ko) * 2012-11-06 2014-05-14 삼성전자주식회사 음성인식장치 및 음성인식방법
US9699673B1 (en) * 2016-02-23 2017-07-04 At&T Intellectual Property I, L.P. Maintaining active sessions during subscriber management system maintenance activities
CN106371801A (zh) * 2016-09-23 2017-02-01 安徽声讯信息技术有限公司 一种基于语音识别技术的语音鼠标系统
CN206451136U (zh) * 2016-10-26 2017-08-29 安徽咪鼠科技有限公司 一种基于语音识别技术的无线鼠标控制装置
CN107135536A (zh) * 2017-05-08 2017-09-05 深圳市沃特沃德股份有限公司 网络连接方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170286049A1 (en) * 2014-08-27 2017-10-05 Samsung Electronics Co., Ltd. Apparatus and method for recognizing voice commands

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《Hands free interface for Human Computer Interaction》;S.Kasun Chathuranga et al.;《2010 Fifth International Conference on Information and Automation for Sustainability》;20110217;全文 *

Also Published As

Publication number Publication date
CN107731222A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
JP6489563B2 (ja) 音量調節方法、システム、デバイス及びプログラム
CN104410379B (zh) 一种音量调节方法
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
CN106878533B (zh) 一种移动终端的通信方法和装置
CN104780259B (zh) 通话语音质量自动调节系统与方法
CN104363510B (zh) 一种播放终端
CN104020979B (zh) 一种自适应桌面选择音效的移动终端及方法
CN104484150A (zh) 一种音频播放的方法、装置及一种终端
CN103024630A (zh) 一种第一电子设备的音量调节方法及第一电子设备
CN103491488A (zh) 一种麦克风回音消除方法及装置
CN104991755B (zh) 一种信息处理方法及电子设备
CN104299622A (zh) 一种音频处理方法
DE112021004307T5 (de) Ohrhörerpositionierung und -halterung
CN104835520A (zh) 一种在移动设备上录音的方法及装置
CN103929692B (zh) 一种音频信息处理方法及电子设备
CN106024035A (zh) 一种音频处理的方法及终端
CN106095379B (zh) 一种音量调节方法及装置
CN104754462A (zh) 音量自动调节装置及方法和耳机
CN105847566A (zh) 移动终端音频的音量调节方法及装置
CN105227783A (zh) 闹钟响铃方法及装置
CN103888610A (zh) 同时通话和录音的方法和通讯终端
CN107731222B (zh) 一种延长智能语音鼠标语音识别延续时间的方法
CN108337353A (zh) 通信设备的声音信号处理方法和设备
CN104821796A (zh) 一种音量控制方法、播放设备、移动终端及系统
CN107168676B (zh) 一种信息输出方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant