CN108519828A - 一种基于语音识别实现语音转写的智能无线鼠标 - Google Patents

一种基于语音识别实现语音转写的智能无线鼠标 Download PDF

Info

Publication number
CN108519828A
CN108519828A CN201810236515.XA CN201810236515A CN108519828A CN 108519828 A CN108519828 A CN 108519828A CN 201810236515 A CN201810236515 A CN 201810236515A CN 108519828 A CN108519828 A CN 108519828A
Authority
CN
China
Prior art keywords
mouse
speech
wireless
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810236515.XA
Other languages
English (en)
Inventor
冯海洪
朱国冉
许成亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Mic Technology Co Ltd
Original Assignee
Anhui Mic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Mic Technology Co Ltd filed Critical Anhui Mic Technology Co Ltd
Priority to CN201810236515.XA priority Critical patent/CN108519828A/zh
Publication of CN108519828A publication Critical patent/CN108519828A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03543Mice or pucks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Position Input By Displaying (AREA)

Abstract

本发明公开了一种基于语音识别实现语音转写的智能无线鼠标,包括含有核心处理芯片的无线语音鼠标、实现无线接收功能的接收器以及集成语音识别处理能力的鼠标应用程序,通过无线技术、语音技术、音频处理技术等多技术融合,并与鼠标产品结合,可以很快的低成本推广语音技术,并在智能语音鼠标的基础上,进一步去除电线的束缚,实现便携式的无线鼠标,解决了目前的鼠标产品与语音技术集成度低,语音转写的识别范围和效果不好的问题,同时解决有线语音鼠标的不便携问题。

Description

一种基于语音识别实现语音转写的智能无线鼠标
技术领域
本发明属于鼠标技术领域,涉及一种智能无线鼠标,具体是一种基于语音识别实现语音转写的智能无线鼠标。
背景技术
鼠标自60年代中期诞生以来,经历了无数次的变化,这些变化使得它使用起来更舒适、更符合人体工程学、也更方便人们携带。然而它的人机交互方式并没有发生太大的变化,目前主要依靠控制光标移动,配合按键,实现功能操作,基本不具备语音相关的功能,交互体验很差,主要是通过打字输入,速度慢,效率低,对计算机的控制,主要是通过鼠标点击,对文化程度和计算机的操作水平有一定的要求。
现有语音技术有很多,比如语音识别、语音打字,然后它们自成一体,没有合理的融合在一起,更没有将语音技术应用于鼠标的先例,鼠标产品与语音技术集成度低,语音转写的识别范围和效果不好。同时,现有电脑上有一些语音应用方案,然而用户体验不足,使用方式复杂,上手不易。
发明内容
本发明的目的在于提供一种基于语音识别实现语音转写的智能无线鼠标,通过无线技术、语音技术、音频处理技术等多技术融合,并与鼠标产品结合,实现便携式的智能语音无线鼠标。
本发明的目的可以通过以下技术方案实现:
一种基于语音识别实现语音转写的智能无线鼠标,包括含有核心处理芯片的无线语音鼠标、实现无线接收功能的接收器以及集成语音识别处理能力的鼠标应用程序;
所述核心处理芯片作为无线语音鼠标的核心,实现了在同一个芯片上完成麦克风控制、鼠标控制和无线数据发射三大功能的融合;
所述接收器使用红外遥控用专用接收管,对无线语音鼠标输出的红外信号接收和解调,并输出数据流送给单片机进行处理,单片机把该数据转化为符合鼠标规范的数据报告,发送给安装在计算机内的鼠标应用程序;
所述鼠标应用程序对接收到的音频数据进行语音识别,转写为相应的文字信息和计算机操作信号。
进一步地,所述核心处理芯片包括相互通信连接的麦克风控制模块、鼠标控制模块和无线数据发射模块;
所述麦克风控制模块实现麦克风音频信号的数据采集和数据预处理功能,并通过鼠标控制模块将音频信号转化为鼠标控制信号,经无线数据发射模块输出到接收器,或直接将音频信号输出到接收器;
所述鼠标控制模块实现对无线语音鼠标控制信号的采集和处理,并通过无线数据发射模块输出到接收器;
所述无线数据发射模块,利用红外线技术实现,通过检测无线语音鼠标坐标位移和按键动作,经过处理按预设的编码经红外发射电路输出到接收器。
进一步地,所述麦克风控制模块包括数据采集单元和数据预处理单元;
所述数据采集单元,实时采集麦克风的音频信号,并输出到数据预处理单元;
所述数据预处理单元,实现对数据采集单元输出的音频信号进行音频降噪、自动增益功能。
进一步地,所述无线数据发射模块包括数据编码单元、信号调制单元和红外发射电路。
进一步地,所述鼠标应用程序包括离线随意语音转写模块、在线随意语音转写模块以及转换模块;
所述离线随意语音转写模块,采用离线语音识别引擎,对接收到的音频数据进行本地识别,转写为文字信息;
所述在线随意语音转写模块,采用在线语音识别引擎,连接讯飞语音识别服务器,对接收到的音频数据进行在线识别,转写为文字信息;
所述转换模块,根据预设的语法规则,通过讯飞SDK,对接收到的音频文件进行转换,输出计算机操作信号。
本发明的有益效果:本发明提供的智能无线鼠标,通过无线技术、语音技术、音频处理技术等多技术融合,并与鼠标产品结合,可以很快的低成本推广语音技术,并在智能语音鼠标的基础上,进一步去除电线的束缚,实现便携式的无线鼠标,解决了目前的鼠标产品与语音技术集成度低,语音转写的识别范围和效果不好的问题,同时解决有线语音鼠标的不便携问题。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的系统示意图。
图2是本发明核心处理芯片的示意图。
图3是本发明接收器的示意图。
图4是本发明转换模块的逻辑示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于语音识别实现语音转写的智能无线鼠标,包括含有核心处理芯片的无线语音鼠标、实现无线接收功能的接收器以及集成语音识别处理能力的鼠标应用程序。
如图2所示,核心处理芯片作为无线语音鼠标的核心,包括相互通信连接的麦克风控制模块、鼠标控制模块和无线数据发射模块,实现了在同一个芯片上完成麦克风控制、鼠标控制和无线数据发射三大功能的融合。
麦克风控制模块包括数据采集单元和数据预处理单元,实现麦克风音频信号的数据采集和数据预处理功能,并通过鼠标控制模块将音频信号转化为鼠标控制信号,经无线数据发射模块输出到接收器,或直接将音频信号输出到接收器。
数据采集单元,实时采集麦克风的音频信号,并输出到数据预处理单元。
数据预处理单元,实现对数据采集单元输出的音频信号进行音频降噪、自动增益等功能。
鼠标控制模块实现对无线语音鼠标控制信号的采集和处理,并通过无线数据发射模块输出到接收器。
无线数据发射模块,利用红外线技术实现,包括数据编码单元、信号调制单元和红外发射电路,通过检测无线语音鼠标坐标位移和按键动作,经过处理按预设的编码经红外发射电路输出到接收器。
如图3所示,接收器使用红外遥控用专用接收管,对无线语音鼠标输出的红外信号接收和解调,并输出数据流送给单片机进行处理,单片机把该数据转化为符合鼠标规范的数据报告,发送给安装在计算机内的鼠标应用程序。
鼠标应用程序包括离线随意语音转写模块、在线随意语音转写模块以及转换模块,对接收到的音频数据进行语音识别,转写为相应的文字信息和计算机操作信号。
离线随意语音转写模块,采用离线语音识别引擎,对接收到的音频数据进行本地识别,转写为文字信息。
在线随意语音转写模块,采用在线语音识别引擎,连接讯飞语音识别服务器,对接收到的音频数据进行在线识别,转写为文字信息。
如图4所示,转换模块,根据预设的语法规则,通过讯飞SDK,对接收到的音频文件进行转换,输出控制命令、文本编辑、购买商品、观看视频等计算机操作信号,实现无线语音鼠标的语音操作功能。
本发明提供的智能无线鼠标,通过无线技术、语音技术、音频处理技术等多技术融合,并与鼠标产品结合,可以很快的低成本推广语音技术,并在智能语音鼠标的基础上,进一步去除电线的束缚,实现便携式的无线鼠标,解决了目前的鼠标产品与语音技术集成度低,语音转写的识别范围和效果不好的问题,同时解决有线语音鼠标的不便携问题。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (5)

1.一种基于语音识别实现语音转写的智能无线鼠标,其特征在于:包括含有核心处理芯片的无线语音鼠标、实现无线接收功能的接收器以及集成语音识别处理能力的鼠标应用程序;
所述核心处理芯片作为无线语音鼠标的核心,实现了在同一个芯片上完成麦克风控制、鼠标控制和无线数据发射三大功能的融合;
所述接收器使用红外遥控用专用接收管,对无线语音鼠标输出的红外信号接收和解调,并输出数据流送给单片机进行处理,单片机把该数据转化为符合鼠标规范的数据报告,发送给安装在计算机内的鼠标应用程序;
所述鼠标应用程序对接收到的音频数据进行语音识别,转写为相应的文字信息和计算机操作信号。
2.根据权利要求1所述的一种基于语音识别实现语音转写的智能无线鼠标,其特征在于:所述核心处理芯片包括相互通信连接的麦克风控制模块、鼠标控制模块和无线数据发射模块;
所述麦克风控制模块实现麦克风音频信号的数据采集和数据预处理功能,并通过鼠标控制模块将音频信号转化为鼠标控制信号,经无线数据发射模块输出到接收器,或直接将音频信号输出到接收器;
所述鼠标控制模块实现对无线语音鼠标控制信号的采集和处理,并通过无线数据发射模块输出到接收器;
所述无线数据发射模块,利用红外线技术实现,通过检测无线语音鼠标坐标位移和按键动作,经过处理按预设的编码经红外发射电路输出到接收器。
3.根据权利要求2所述的一种基于语音识别实现语音转写的智能无线鼠标,其特征在于:所述麦克风控制模块包括数据采集单元和数据预处理单元;
所述数据采集单元,实时采集麦克风的音频信号,并输出到数据预处理单元;
所述数据预处理单元,实现对数据采集单元输出的音频信号进行音频降噪、自动增益功能。
4.根据权利要求2所述的一种基于语音识别实现语音转写的智能无线鼠标,其特征在于:所述无线数据发射模块包括数据编码单元、信号调制单元和红外发射电路。
5.根据权利要求1所述的一种基于语音识别实现语音转写的智能无线鼠标,其特征在于:所述鼠标应用程序包括离线随意语音转写模块、在线随意语音转写模块以及转换模块;
所述离线随意语音转写模块,采用离线语音识别引擎,对接收到的音频数据进行本地识别,转写为文字信息;
所述在线随意语音转写模块,采用在线语音识别引擎,连接讯飞语音识别服务器,对接收到的音频数据进行在线识别,转写为文字信息;
所述转换模块,根据预设的语法规则,通过讯飞SDK,对接收到的音频文件进行转换,输出计算机操作信号。
CN201810236515.XA 2018-03-21 2018-03-21 一种基于语音识别实现语音转写的智能无线鼠标 Pending CN108519828A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810236515.XA CN108519828A (zh) 2018-03-21 2018-03-21 一种基于语音识别实现语音转写的智能无线鼠标

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810236515.XA CN108519828A (zh) 2018-03-21 2018-03-21 一种基于语音识别实现语音转写的智能无线鼠标

Publications (1)

Publication Number Publication Date
CN108519828A true CN108519828A (zh) 2018-09-11

Family

ID=63433873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810236515.XA Pending CN108519828A (zh) 2018-03-21 2018-03-21 一种基于语音识别实现语音转写的智能无线鼠标

Country Status (1)

Country Link
CN (1) CN108519828A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047484A (zh) * 2019-04-28 2019-07-23 合肥马道信息科技有限公司 一种语音识别交互方法、系统、设备和存储介质
CN110648653A (zh) * 2019-09-27 2020-01-03 安徽咪鼠科技有限公司 基于智能语音鼠标的字幕实现方法、装置、系统和存储介质
CN112992134A (zh) * 2019-12-16 2021-06-18 中国科学院沈阳计算技术研究所有限公司 一种基于离线语音识别的测量系统输入方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2412245Y (zh) * 2000-04-04 2000-12-27 北京金裕兴电子技术有限公司 鼠标器
US20080024448A1 (en) * 2006-07-25 2008-01-31 Yuan-Jung Chang Optical mouse having a light-sheltering device
CN102509444A (zh) * 2011-12-09 2012-06-20 广东长虹电子有限公司 一种数据传输的方法
CN104731549A (zh) * 2015-04-09 2015-06-24 徐敏 一种基于鼠标的语音识别人机交互装置及其方法
CN107272924A (zh) * 2017-06-01 2017-10-20 安徽润华安全技术有限公司 一种有线智能语音输入鼠标

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2412245Y (zh) * 2000-04-04 2000-12-27 北京金裕兴电子技术有限公司 鼠标器
US20080024448A1 (en) * 2006-07-25 2008-01-31 Yuan-Jung Chang Optical mouse having a light-sheltering device
CN102509444A (zh) * 2011-12-09 2012-06-20 广东长虹电子有限公司 一种数据传输的方法
CN104731549A (zh) * 2015-04-09 2015-06-24 徐敏 一种基于鼠标的语音识别人机交互装置及其方法
CN107272924A (zh) * 2017-06-01 2017-10-20 安徽润华安全技术有限公司 一种有线智能语音输入鼠标

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047484A (zh) * 2019-04-28 2019-07-23 合肥马道信息科技有限公司 一种语音识别交互方法、系统、设备和存储介质
CN110648653A (zh) * 2019-09-27 2020-01-03 安徽咪鼠科技有限公司 基于智能语音鼠标的字幕实现方法、装置、系统和存储介质
CN112992134A (zh) * 2019-12-16 2021-06-18 中国科学院沈阳计算技术研究所有限公司 一种基于离线语音识别的测量系统输入方法

Similar Documents

Publication Publication Date Title
CN104049721B (zh) 信息处理方法及电子设备
CN108519828A (zh) 一种基于语音识别实现语音转写的智能无线鼠标
CN103730116B (zh) 在智能手表上实现智能家居设备控制的系统及其方法
CN205943456U (zh) 一种基于智能语音鼠标的语音采集和预处理装置
CN103533391B (zh) 一种声控式交互的双向互动数字电视盒系统的工作方法
CN103313140B (zh) 电视接收终端及其文本信息输入方法与系统、移动终端
CN104410883A (zh) 一种移动可穿戴非接触式交互系统与方法
CN102737489B (zh) 一种遥控器及遥控系统及基于该遥控系统的控制方法
CN105976814A (zh) 头戴设备的控制方法和装置
WO2018230160A1 (ja) 情報処理システム、情報処理方法、およびプログラム
TWI295024B (en) Remote control system capable of controlling an electronic device at different modes and method thereof
WO2018133656A1 (zh) 将语音输入转换成文本输入的方法、装置和语音输入设备
CN108646578B (zh) 一种无介质浮空投影虚拟画面与现实交互方法
CN103607611A (zh) 一种智能电视的语音控制方法及系统
CN103269445B (zh) 智能电视系统控制方法
CN201387607Y (zh) 一种以用户自定义功能操控计算机的红外线控制器
CN105334958A (zh) 手势识别系统及实现方法
CN204350220U (zh) 一种遥控器及控制系统
CN104754261A (zh) 一种投影设备及投影方法
CN109977427A (zh) 一种微型可佩戴的实时翻译装置
CN202856923U (zh) 电视多媒体辅助交互系统
CN202939967U (zh) 智能蓝光播放机
CN104811779A (zh) 智能电视基于触摸板遥控器的手写输入控制方法及系统
CN202331790U (zh) 一种无线键鼠语音聊天多功能遥控器
CN103796057A (zh) 语音控制视频播放器的系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180911