CN112750424A - 一种支持多语种的语音学习方式和控制终端 - Google Patents
一种支持多语种的语音学习方式和控制终端 Download PDFInfo
- Publication number
- CN112750424A CN112750424A CN202110007498.4A CN202110007498A CN112750424A CN 112750424 A CN112750424 A CN 112750424A CN 202110007498 A CN202110007498 A CN 202110007498A CN 112750424 A CN112750424 A CN 112750424A
- Authority
- CN
- China
- Prior art keywords
- unit
- voice
- learning
- infrared
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000013500 data storage Methods 0.000 claims description 2
- 238000012905 input function Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 description 2
- 240000002836 Ipomoea tricolor Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明提供一种支持多语种的语音学习方式和控制终端,包括声音采集单元,学习控制单元,数据处理及存储单元,数据转换单元,红外发射及接收单元,语音播放单元,装置电源单元,外壳,通过各种不同语种的语音学习,使本终端装置适应不同国家语种和不同语音差异,同时本装置还具有语音和红外遥控器码值一起学习然后对应的功能,这样可以兼容家里各种红外遥控器,从而实现语音控制各种带红外控制的家用电器,避免遥控器太多不好管理的情况。
Description
[技术领域]
本发明涉及语音控制技术领域,尤其涉及一种通过学习不同词条和遥控指令,来支持多种语音和语音控制家用电器的控制终端。
[背景技术]
随着社会的发展很多设备配备了语音控制功能,但是由于各地的语言和发音标准都有差异,方案和设备商采集到语音资源有限,导致终端设备到用户手上出现无法语音控制的情况,用户体验感很差。现在用户就会有这样一种需求,通过一种方法和某种终端控制装置,不同国家不同方言的语音能很好效果的控制家里的电器,这个电器可能是大牌很规范红外指令控制的,也可以是小众的很偏的红外指令控制的电器。
[发明内容]
为克服现有技术所存在的问题,本发明提供一种能够实现让更多国家和地区的人能更好的更方便的通过语音控制更多的家里电器的支持多语种的语音学习方式和控制终端。
本发明解决技术问题的方案是提供一种支持多语种的语音学习方式和控制终端,包括声音采集单元,学习控制单元,数据处理及存储单元,数据转换单元,红外发射及接收单元,语音播放单元,装置电源单元,外壳。
优选地,所述声音采集单元和数据处理及存储单元连接,所述学习控制单元和数据处理及存储单元连接,红外发射及接收单元和数据处理及存储单元连接,语音播放单元和数据处理和存储单元连接,装置电源单元和数据处理及存储单元连接,数据转换单元直接包含在数据处理及存储单元上,所有端元均置于外壳里面。
优选地,所述语音采集单元,包含3个麦克风,均匀的以120度角分布在外壳里面,所述结构能在平面上无死角的接收用户发出来的控制语音。
优选地,所述语音采集单元包含一个降噪电路,此电路通过各种算法能有效的去除背景噪音。
优选地,所述语音采集电路包含音频的A/D转换电路,能有效的降麦克风输入进来的模拟音频转换成数字信号。
优选地,所述学习控制单元,包含有一个语音学习触发按键,通过触发这个按键能开始学习录入不同的语音指令。
优选地,所述学习控制单元,包含一个红外遥控学习触发按键,通过触发这个按键和上面的语音学习按键,能够学习其它的红外遥控的按键功能和对应的语音指令。
优选地,所述数据处理及存储单元,包含有能处理数据的CPU电路和对应的FLASH器件和DDR器件,FLASH器件用于提供数据存储空间,DDR用于提供数据比对运行空间。所述单元能支持红外电信号的输入和输入功能。
优选地,所述语音播放单元,包含一个2DB低频喇叭,此单元能用于提醒10米以内的用户,完成了语音指令的学习和控制。
优选地,所述红外及发射控制单元,包含一个12UM规格的收发一体红外发射管,此发射管能够将CPU输入的红外电信号转换成红外光发射传输,距离能到15米以上。同时此发射管能采集其它遥控器的红外信号转换成红外的电信号输出给CPU去处理,学习记忆;所述电源模块,能够直接使用交流电,转换成各单元需要的直流电;所述外壳,圆形类似于飞碟状既符合美观,同时利于多角度的采集音频信号。
与现有技术相比,本发明一种支持多语种的语音学习方式和控制终端通过各种不同语种的语音学习,使本终端装置适应不同国家语种和不同语音差异,同时本装置还具有语音和红外遥控器码值一起学习然后对应的功能,这样可以兼容家里各种红外遥控器,从而实现语音控制各种带红外控制的家用电器,避免遥控器太多不好管理的情况。
[附图说明]
图1是本发明实施例中各功能单元的配置图。
图2是本发明实施例中的多语言的语音学习的方法和操作流程示意图。
[具体实施方式]
为使本发明的目的,技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定此发明。
请参阅图1和图2,本发明一个优选实施例中的终端控制装置包括:音采集单元,学习控制单元,数据处理及存储单元,数据转换单元,红外发射及接收单元,语音播放单元,装置电源单元,外壳。
优选的,音频采集单元包括3个麦克风,在圆形外壳中按120度均匀放置,这样不管本装置如何放置,都能很好的采集到音频信号,避免单一麦口背对着人信号比较差。另外本单元还包括AD转换电路和降噪电路,人的声音通过麦克风输入进来以后通过降噪电路去掉多余的背景音,然后通过AD转换电路,把模拟信号采集成数字信号,数字信号传输给数据处理单元。
学习控制单元,包括2个物理的轻触开关,开关按键产生的信号输入给数据处理单元。这个两个轻触开关分别控制语音学习和红外信号学习。当单独按下语音学习的按键的时候,用于学习采集用户输入的控制指令,这些语音控制指令会有一个说明书给出相应的语句和对应红外功能,这些红外功能主要控制比较规范的红外电器;当同时按下语音学习键和红外学习键的时候,可以同时学习语音指令和其它红外遥控器的按键命令,这样通过识别存储学习过的红外遥控的语音指令。因为任何语言都是通过声音产生不同的模拟波形,而最终模拟波形被AD转换电路采集出来成特定的数字信号,所以这种学习不同语种的方法可以被具体实施。而且采集的不同语音指令能完成对应的红外遥控功能。
数据处理及存储单元,包括CPU控制器和外置的FLASH存储,外置的DDR。录制的语音数据经过CPU的编码处理以后存储在FLASH空间中,红外遥控的码值通过波形学习以后也存储在FLASH空间中,FLASH空间还预置有不同的红外波形文件。当不同的语音指令通过外部AD转换以后到控制器进行数据对比以后,会输出对应红外波形。
红外发射和接收单元,主要包括双向的红外管规格为12UM,这种红外管采集信号比较灵敏同时发射距离比较远,比较适合于这种终端设备。这个单元会把CPU发出来的红外电信号转换成比较好的红外波形型号发射出去给终端电器设备,同时可以用于其它红外遥控器的学习,将红外波形信号转换成对应的电信号输入给CPU进行学习记忆。从而实现红外遥控学习功能。
语音播放单元,主要是有一个喇叭和对应的线材组成,主要功能是当学习语音指令成功以后,会通过CPU播放一段提示语音或嘟嘟的声音,这些都可以预设在CPU的存储单元里面。
装置电源单元,通过电源电源,此终端设备可以不需要其它的辅助电源模块,直接在家里交流电源插头上使用。此单元会将交流电源接入进来,然后把交流电转换成直流电,供以上的其它单元的工作。
外壳单元,此外壳模块是一个圆形类似于飞碟状的,放在家里比较美观,而且圆形的比较利于声音的采集。同时外壳上面麦口和喇叭口都有滤网,滤网可以有效的放置灰尘的进入,而影响电子模块的性能。
所述学习控制单元和数据处理机储存单元连接,通过这个连接实现外部人手控制按键,来触发语音学习功能和红外学习功能。
所述语音采集单元和数据处理及存储单元连接,采集单元所采集到的语音数据,传输给数据处理单元解析并压缩存储。
优选地,所述红外发射和接收单元与数据处理及存储单元连接,当红外信号通过红外接收单元学习拷贝波形到数据处理单元进行对应的红外码值并存储,实现红外遥控的学习功能,同时当对应的语音指令经过数据处理单元比对后转换成对应的红外信号通过红外发射单元发射红外码出去。
优选地,所述语音播放单元与数据处理单元连接,当处理单元能成功识别到采集进来的语音信号后进行对应的播放提醒。
优选地,所述装置电源单元与数据处理单元连接,电源单元通过交流电输入转换成对应的能工作的直流电给数据处理单元和其它单元供电。
优选地,所述外壳将所有的上述单元模块放在里面,实现一定程度的防尘和防水功能。
一种支持多语种的语音学习及控制方法,包括以下步骤:
S1、通过控制单元按语音学习键或同时按语音学习键和红外学习键
S2、单触发语音学习键,实现对应词条上指令语音的各种当地方言的输入,通过降噪处理以后,实现语音的采集,数据处理单元进行数据编码压缩后放在存储单元,和系统已经存在的红外码值对应好。如果同时按下红外学习键,可实现对应语音命令和对应红外码值的学习,同时对应存储。
S3、学习成功后,语音播报单元会做对应的语音提醒;
优选地,所述步骤S1中,通过控制单元的不同按键实现不同方式的学习。
优选地,所述步骤S2还包括:预设好通用红外功能的,通过对应的词条不同语种的人,直接录入相应的语音。没有预设好对应红外功能的,可以把不同的红外遥控器的红外码值和对应的当地语音一起学习到终端设备上。从而实现各种不同红外功能电器的语音控制。
优选地,所述步骤S3还包括:语音播放系统可以通过一段语音,也可以通过嘟嘟等提示音来提醒完成了语音的学习。
通过各种不同语种的语音学习,使本终端装置适应不同国家语种和不同语音差异,同时本装置还具有语音和红外遥控器码值一起学习然后对应的功能,这样可以兼容家里各种红外遥控器,从而实现语音控制各种带红外控制的家用电器,避免遥控器太多不好管理的情况。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。
Claims (10)
1.一种支持多语种的语音学习方式和控制终端,其特征在于:包括声音采集单元,学习控制单元,数据处理及存储单元,数据转换单元,红外发射及接收单元,语音播放单元,装置电源单元,外壳。
2.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述声音采集单元和数据处理及存储单元连接,所述学习控制单元和数据处理及存储单元连接,红外发射及接收单元和数据处理及存储单元连接,语音播放单元和数据处理和存储单元连接,装置电源单元和数据处理及存储单元连接,数据转换单元直接包含在数据处理及存储单元上,所有端元均置于外壳里面。
3.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述语音采集单元,包含3个麦克风,均匀的以120度角分布在外壳里面,所述结构能在平面上无死角的接收用户发出来的控制语音。
4.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述语音采集单元包含一个降噪电路,此电路通过各种算法能有效的去除背景噪音。
5.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述语音采集电路包含音频的A/D转换电路,能有效的降麦克风输入进来的模拟音频转换成数字信号。
6.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述学习控制单元,包含有一个语音学习触发按键,通过触发这个按键能开始学习录入不同的语音指令。
7.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述学习控制单元,包含一个红外遥控学习触发按键,通过触发这个按键和上面的语音学习按键,能够学习其它的红外遥控的按键功能和对应的语音指令。
8.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述数据处理及存储单元,包含有能处理数据的CPU电路和对应的FLASH器件和DDR器件,FLASH器件用于提供数据存储空间,DDR用于提供数据比对运行空间,所述单元能支持红外电信号的输入和输入功能。
9.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述语音播放单元,包含一个2DB低频喇叭,此单元能用于提醒10米以内的用户,完成了语音指令的学习和控制。
10.如权利要求1所述的一种支持多语种的语音学习方式和控制终端,其特征在于:所述红外及发射控制单元,包含一个12UM规格的收发一体红外发射管,此发射管能够将CPU输入的红外电信号转换成红外光发射传输,距离能到15米以上,同时此发射管能采集其它遥控器的红外信号转换成红外的电信号输出给CPU去处理,学习记忆;所述电源模块,能够直接使用交流电,转换成各单元需要的直流电;所述外壳,圆形类似于飞碟状既符合美观,同时利于多角度的采集音频信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110007498.4A CN112750424A (zh) | 2021-01-05 | 2021-01-05 | 一种支持多语种的语音学习方式和控制终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110007498.4A CN112750424A (zh) | 2021-01-05 | 2021-01-05 | 一种支持多语种的语音学习方式和控制终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112750424A true CN112750424A (zh) | 2021-05-04 |
Family
ID=75649896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110007498.4A Pending CN112750424A (zh) | 2021-01-05 | 2021-01-05 | 一种支持多语种的语音学习方式和控制终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112750424A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1655206A (zh) * | 2004-02-13 | 2005-08-17 | 邓清辉 | 一种万能家用电器语音声控和电话远程控制装置 |
CN201177871Y (zh) * | 2007-11-26 | 2009-01-07 | 厉天福 | 一种手持语音遥控装置 |
CN201927172U (zh) * | 2010-12-21 | 2011-08-10 | 上海盛淘智能科技有限公司 | 学习型语音控制红外遥控器 |
CN107331145A (zh) * | 2017-06-27 | 2017-11-07 | 广州市威士丹利智能科技有限公司 | 一种基于多协议的遥控器 |
CN208400307U (zh) * | 2018-06-22 | 2019-01-18 | 西北师范大学 | 一种汉藏双语交互式通用遥控器 |
-
2021
- 2021-01-05 CN CN202110007498.4A patent/CN112750424A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1655206A (zh) * | 2004-02-13 | 2005-08-17 | 邓清辉 | 一种万能家用电器语音声控和电话远程控制装置 |
CN201177871Y (zh) * | 2007-11-26 | 2009-01-07 | 厉天福 | 一种手持语音遥控装置 |
CN201927172U (zh) * | 2010-12-21 | 2011-08-10 | 上海盛淘智能科技有限公司 | 学习型语音控制红外遥控器 |
CN107331145A (zh) * | 2017-06-27 | 2017-11-07 | 广州市威士丹利智能科技有限公司 | 一种基于多协议的遥控器 |
CN208400307U (zh) * | 2018-06-22 | 2019-01-18 | 西北师范大学 | 一种汉藏双语交互式通用遥控器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106154860B (zh) | 一种智能开关及应用该智能开关的智能家居系统 | |
CN100538762C (zh) | 一种按键语音一体化遥控装置 | |
CN108665899A (zh) | 一种语音交互系统及语音交互方法 | |
CN105451110A (zh) | 基于WiFi的家电控制语音耳机 | |
CN109377992A (zh) | 基于无线通信的全空间语音交互物联网控制系统及方法 | |
US20030061033A1 (en) | Remote control system for translating an utterance to a control parameter for use by an electronic device | |
CN108597520A (zh) | 一种智能插排和智能插排的控制方法 | |
CN112837526A (zh) | 通用集成遥控方法、控制装置及通用集成遥控装置 | |
CN104639967A (zh) | 语音启动终端的方法及装置 | |
CN112750424A (zh) | 一种支持多语种的语音学习方式和控制终端 | |
CN209625783U (zh) | 智能音箱以及智能家居系统 | |
JP2973311B1 (ja) | リモコン装置 | |
CN101630945A (zh) | 电子设备及其音量控制系统和方法 | |
CN201017465Y (zh) | 一种按键语音一体化遥控装置 | |
CN213461165U (zh) | 一种离在线二合一语音智能控制pd充电头 | |
CN207603830U (zh) | 一种家用电器智能语音系统 | |
CN108986823A (zh) | 一种语音识别解码器及语音操作系统 | |
CN213635361U (zh) | 一种在线语音智能控制pd充电头 | |
CN212933302U (zh) | 一种语音交互控制器装置 | |
CN105355033B (zh) | 通用遥控器设置代码的方法 | |
CN111373364B (zh) | 一种截取音频文件的耳机及其控制方法 | |
CN208806959U (zh) | 带语音交互功能的无线充电音箱 | |
CN212485705U (zh) | 一种语音控制的空调伴侣智能插座 | |
CN112509558A (zh) | 一种利用声音频谱分析进行控制灯具的方法 | |
CN221008099U (zh) | 一种控制系统以及玩具 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210504 |
|
RJ01 | Rejection of invention patent application after publication |