CN107818778A - 一种基于智能语音鼠标的交互系统 - Google Patents
一种基于智能语音鼠标的交互系统 Download PDFInfo
- Publication number
- CN107818778A CN107818778A CN201711131751.7A CN201711131751A CN107818778A CN 107818778 A CN107818778 A CN 107818778A CN 201711131751 A CN201711131751 A CN 201711131751A CN 107818778 A CN107818778 A CN 107818778A
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- mouse
- intelligent sound
- sound mouse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 6
- 230000005540 biological transmission Effects 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 3
- 238000013519 translation Methods 0.000 abstract description 3
- 230000009471 action Effects 0.000 abstract description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 43
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0354—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
- G06F3/03543—Mice or pucks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种基于智能语音鼠标的交互系统,涉及语音交互技术领域。本发明包括本地计算机和智能语音鼠标;智能语音鼠标的鼠标USB接口通过USB总线或无线连接本地计算机;智能语音鼠标包括:语音采集模块、语义分析模块、语音播放模块、鼠标USB接口;本地计算机包括:语音唤醒模块、程序控制模块、语音识别模块、语音合成模块、计算机USB接口。本发明通过在智能语音鼠标内设置有语音采集模块、语音分析模块、语音播放模块,鼠标内置麦克风、音箱及声卡,准确的语义分析理解,实现语音采集和播放,实现文字翻译、朗读播放,提高智能语音鼠标交互功能以及智能语音鼠标操作处理速度,便于使用,通过语音打开程序,实现智能语音交互。
Description
技术领域
本发明属于语音交互技术领域,特别是涉及一种基于智能语音鼠标的交互系统。
背景技术
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。现有的计算机语音控制系统通常建立在远程语音服务器的技术基础上,速度慢,并且用户通过语音控制计算机时无法得到反馈,造成极大的不便。
目前,在计算机操作中,常用的鼠标键盘人机交互模式是计算机用户通过双手敲击键盘,移动和点击鼠标来达到人机交互的目的。现有技术中鼠标按其工作原理的不同可以分为两种,一种是机械鼠标,另一种是光电鼠标。但是,这两种物理鼠标都要求计算机用户用手进行操作。一方面,对于手部伤残人士、老年人等人群无法灵活地操作或不方便操作普通的鼠标;另一方面,对于健康人士,存在一些场合不方便操作鼠标但又必须使用电脑的情况,或者长时间使用鼠标会带来肩肘腕等身体部位的疲劳感,不利于身体健康。因此,提供一种基于智能语音鼠标的交互系统,解决上述问题。
发明内容
本发明的目的在于提供一种基于智能语音鼠标的交互系统,通过在本地计算机内设置有语音唤醒模块、程序控制模块、语音识别模块、语音合成模块,在智能语音鼠标内设置有语音采集模块、语音分析模块、语音播放模块,智能语音鼠标的USB接口通过USB连接本地计算机,解决了现有的鼠标功能单一、智能语音鼠标缺乏交互功能以及智能语音鼠标操作缓慢使用不便的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于智能语音鼠标的交互系统,包括本地计算机和智能语音鼠标;所述智能语音鼠标的鼠标USB接口通过USB总线或无线连接本地计算机;
所述智能语音鼠标包括:用于采集用户声音信息的语音采集模块;用于语音分析理解的语义分析模块;用于实时语音播放输出的语音播放模块;以及用于传输语音数据或操作命令的鼠标USB接口;
所述本地计算机包括:用于识别接收到的语音数据并唤醒程序的语音唤醒模块;用于接收语音唤醒模块传输的控制指令或智能语音鼠标传输的操作命令的程序控制模块;用于处理语音信号、匹配语音信号的语音识别模块;用于将文字命令数据合成为语音数据的语音合成模块;以及用于接收智能语音鼠标传输的语音数据或操作命令的计算机USB接口。
进一步地,所述语音采集模块通过USB或无线通讯模块与语音唤醒模块相联;所述语音唤醒模块通过语音数据分析处理及数据传输模块与程序控制模块相联。
进一步地,所述语音识别模块通过信号分析处理及指令输出模块与语音合成模块相联。
本发明具有以下有益效果:
1、本发明通过在本地计算机内设置有语音唤醒模块、程序控制模块、语音识别模块、语音合成模块,语音采集模块采集用户的语音信息,语音唤醒模块接收用户的语音信息,并对用户的声音信息分析处理,唤醒程序,无需手动打开程序,通过语音即可实现程序的应用,实现智能语音交互,提高鼠标的智能性。
2、本发明通过在智能语音鼠标内设置有语音采集模块、语音分析模块、语音播放模块,鼠标内置麦克风、音箱及声卡,准确的语义分析理解,实现语音的采集和播放,实现文字的翻译、朗读播放,提高智能语音鼠标交互功能以及智能语音鼠标操作处理速度,便于使用。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于智能语音鼠标的交互系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于智能语音鼠标的交互系统,包括本地计算机和智能语音鼠标;智能语音鼠标的鼠标USB接口通过USB总线或无线连接本地计算机;
智能语音鼠标包括:语音采集模块、语义分析模块、语音播放模块、鼠标USB接口;
本地计算机包括:语音唤醒模块、程序控制模块、语音识别模块、语音合成模块;
语音采集模块采用高性能麦克风阵列,麦克风阵列安装在智能语音鼠标内并采集用户的声音信息,麦克风阵列将采集到的语音模拟信号转换为电信号传输至语音唤醒模块;当用户说话时,语音唤醒模块识别接收到的语音数据并唤醒程序;程序控制模块接收语音唤醒模块传输的控制指令或智能语音鼠标传输的操作命令;
语音识别模块将程序控制模块输入信号的特征与模板苦衷存储的语音模板进行比较、匹配语音信号,语音识别算法可采用动态时间规模、离散隐马尔科夫模型、连续隐马尔科夫模型、人工神经网络;语音合成模块将文字命令数据合成为语音数据;语义分析模块分析并理解用户的语音信息;语音播放模块用于实时语音播放输出;鼠标USB接口用于传输语音数据或操作命令;计算机USB接口用于接收智能语音鼠标传输的语音数据或操作命令。
其中,语音采集模块通过USB或无线通讯模块与语音唤醒模块相联;语音唤醒模块通过语音数据分析处理及数据传输模块与程序控制模块相联。
其中,语音识别模块通过信号分析处理及指令输出模块与语音合成模块相联。
智能语音鼠标的交互系统对输入的原始语音进行预处理,对麦克风阵列输入的语音信号进行处理,包括预滤波、采样和量化、加窗、端点检测等,过滤噪音,并进行语义分析及特征提取,实现文字的翻译、朗读播放,提高智能语音鼠标交互功能以及智能语音鼠标操作处理速度,便于使用。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (3)
1.一种基于智能语音鼠标的交互系统,其特征在于,包括本地计算机和智能语音鼠标;
所述智能语音鼠标的鼠标USB接口通过USB总线或无线连接本地计算机;
所述智能语音鼠标包括:
用于采集用户声音信息的语音采集模块;
用于语音分析理解的语义分析模块;
用于实时语音播放输出的语音播放模块;
以及用于传输语音数据或操作命令的鼠标USB接口;
所述本地计算机包括:
用于识别接收到的语音数据并唤醒程序的语音唤醒模块;
用于接收语音唤醒模块传输的控制指令或智能语音鼠标传输的操作命令的程序控制模块;
用于处理语音信号、匹配语音信号的语音识别模块;
用于将文字命令数据合成为语音数据的语音合成模块;
以及用于接收智能语音鼠标传输的语音数据或操作命令的计算机USB接口。
2.根据权利要求1所述的一种基于智能语音鼠标的交互系统,其特征在于,所述语音采集模块通过USB或无线通讯模块与语音唤醒模块相联;所述语音唤醒模块通过语音数据分析处理及数据传输模块与程序控制模块相联。
3.根据权利要求1所述的一种基于智能语音鼠标的交互系统,其特征在于,所述语音识别模块通过信号分析处理及指令输出模块与语音合成模块相联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711131751.7A CN107818778A (zh) | 2017-11-15 | 2017-11-15 | 一种基于智能语音鼠标的交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711131751.7A CN107818778A (zh) | 2017-11-15 | 2017-11-15 | 一种基于智能语音鼠标的交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107818778A true CN107818778A (zh) | 2018-03-20 |
Family
ID=61609758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711131751.7A Pending CN107818778A (zh) | 2017-11-15 | 2017-11-15 | 一种基于智能语音鼠标的交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107818778A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509068A (zh) * | 2018-03-21 | 2018-09-07 | 安徽咪鼠科技有限公司 | 一种基于语音识别实现语音转写的智能游戏鼠标 |
CN109683734A (zh) * | 2018-12-29 | 2019-04-26 | 安徽咪鼠科技有限公司 | 一种智能语音鼠标自定义键控制方法 |
CN110674825A (zh) * | 2019-09-27 | 2020-01-10 | 安徽咪鼠科技有限公司 | 应用于智能语音鼠标的文字识别方法、装置、系统和存储介质 |
CN112099655A (zh) * | 2020-10-28 | 2020-12-18 | 深圳市启望科文技术有限公司 | 语音鼠标移动办公的实现方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105553799A (zh) * | 2016-02-29 | 2016-05-04 | 深圳市广佳乐新智能科技有限公司 | 一种基于语音识别的智能家居系统 |
CN106371801A (zh) * | 2016-09-23 | 2017-02-01 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的语音鼠标系统 |
CN106383603A (zh) * | 2016-09-23 | 2017-02-08 | 安徽声讯信息技术有限公司 | 一种基于语音鼠标的语音控制系统 |
CN205943456U (zh) * | 2016-08-24 | 2017-02-08 | 安徽咪鼠科技有限公司 | 一种基于智能语音鼠标的语音采集和预处理装置 |
CN106486122A (zh) * | 2016-12-26 | 2017-03-08 | 旗瀚科技有限公司 | 一种智能语音交互机器人 |
CN107018228A (zh) * | 2016-01-28 | 2017-08-04 | 中兴通讯股份有限公司 | 一种语音控制系统、语音处理方法及终端设备 |
CN114791771A (zh) * | 2022-04-20 | 2022-07-26 | 利辛悟芯信息科技有限公司 | 智能语音鼠标的交互管理系统及管理方法 |
-
2017
- 2017-11-15 CN CN201711131751.7A patent/CN107818778A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107018228A (zh) * | 2016-01-28 | 2017-08-04 | 中兴通讯股份有限公司 | 一种语音控制系统、语音处理方法及终端设备 |
CN105553799A (zh) * | 2016-02-29 | 2016-05-04 | 深圳市广佳乐新智能科技有限公司 | 一种基于语音识别的智能家居系统 |
CN205943456U (zh) * | 2016-08-24 | 2017-02-08 | 安徽咪鼠科技有限公司 | 一种基于智能语音鼠标的语音采集和预处理装置 |
CN106371801A (zh) * | 2016-09-23 | 2017-02-01 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的语音鼠标系统 |
CN106383603A (zh) * | 2016-09-23 | 2017-02-08 | 安徽声讯信息技术有限公司 | 一种基于语音鼠标的语音控制系统 |
CN106486122A (zh) * | 2016-12-26 | 2017-03-08 | 旗瀚科技有限公司 | 一种智能语音交互机器人 |
CN114791771A (zh) * | 2022-04-20 | 2022-07-26 | 利辛悟芯信息科技有限公司 | 智能语音鼠标的交互管理系统及管理方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509068A (zh) * | 2018-03-21 | 2018-09-07 | 安徽咪鼠科技有限公司 | 一种基于语音识别实现语音转写的智能游戏鼠标 |
CN108509068B (zh) * | 2018-03-21 | 2021-05-04 | 安徽咪鼠科技有限公司 | 一种基于语音识别实现语音转写的智能游戏鼠标 |
CN109683734A (zh) * | 2018-12-29 | 2019-04-26 | 安徽咪鼠科技有限公司 | 一种智能语音鼠标自定义键控制方法 |
CN110674825A (zh) * | 2019-09-27 | 2020-01-10 | 安徽咪鼠科技有限公司 | 应用于智能语音鼠标的文字识别方法、装置、系统和存储介质 |
CN112099655A (zh) * | 2020-10-28 | 2020-12-18 | 深圳市启望科文技术有限公司 | 语音鼠标移动办公的实现方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818778A (zh) | 一种基于智能语音鼠标的交互系统 | |
CN104700829B (zh) | 动物声音情绪识别系统及其方法 | |
CN106383603A (zh) | 一种基于语音鼠标的语音控制系统 | |
CN102298694A (zh) | 一种应用于远程信息服务的人机交互识别系统 | |
CN205943456U (zh) | 一种基于智能语音鼠标的语音采集和预处理装置 | |
CN105938399B (zh) | 基于声学的智能设备的文本输入识别方法 | |
CN101923857A (zh) | 一种人机交互的可扩展语音识别方法 | |
CN104123939A (zh) | 基于变电站巡检机器人的语音交互控制方法 | |
CN106371801A (zh) | 一种基于语音识别技术的语音鼠标系统 | |
CN201532762U (zh) | 个人专用同声传译装置 | |
CN107942695A (zh) | 情感智能音响系统 | |
CN112542156A (zh) | 基于声纹识别和语音指令控制的民航维修工卡系统 | |
CN112232127A (zh) | 一种智能演讲训练系统及方法 | |
CN202796043U (zh) | 一种语音识别系统 | |
CN106683676A (zh) | 一种机器人控制用语音识别系统 | |
CN105118356B (zh) | 一种手语语音转换方法及装置 | |
CN102890931A (zh) | 提高语音识别率的方法 | |
CN109259800A (zh) | 超声成像控制系统 | |
CN109243458A (zh) | 一种用于智能机器人的语音识别系统 | |
CN206672635U (zh) | 一种基于图书服务机器人的语音交互装置 | |
CN202584048U (zh) | 一种基于dsp图像定位、语音识别的智能鼠标 | |
CN102760312A (zh) | 一种语音识别的智能门控系统 | |
CN113380418A (zh) | 一种通过对话文本分析识别抑郁症的系统 | |
CN209571226U (zh) | 一种语音识别装置及系统 | |
CN205376116U (zh) | 一种无线定向语音控制自动引导小车遥控装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180320 |