CN204480661U - 语音控制装置 - Google Patents
语音控制装置 Download PDFInfo
- Publication number
- CN204480661U CN204480661U CN201520152949.3U CN201520152949U CN204480661U CN 204480661 U CN204480661 U CN 204480661U CN 201520152949 U CN201520152949 U CN 201520152949U CN 204480661 U CN204480661 U CN 204480661U
- Authority
- CN
- China
- Prior art keywords
- interface
- microcontroller
- phonetic controller
- universal input
- controller according
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000006073 displacement reaction Methods 0.000 claims description 7
- 238000004804 winding Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000004378 air conditioning Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Abstract
本实用新型提供了一种语音控制装置。该语音控制装置包括:微控制器,设置有音频信号输入接口、控制接口、以及多个通用输入接口;语音输入电路,与音频信号输入接口连接,以拾取语音并转换为电信号向微控制器提供;驱动部件,与控制接口连接;以及部件选择电路,与多个通用输入接口中的至少部分连接,配置成选择性地将多个通用输入接口连通至预定电平,以使微控制器向与预定电平对应的驱动部件发送控制指令,控制指令由微控制器对电信号识别得出。使用本实用新型的技术方案,可以提高硬件电路的通用性,满足不同使用环境的要求。
Description
技术领域
本实用新型涉及电路设计领域,特别涉及一种语音控制装置。
背景技术
现有的语音唤醒技术多是用于手机或车载终端,也可用于家庭内的电器开关,例如电灯、空调等。相比于传统的声控开关,其控制更加精确,不会因为噪音或用户无关的语音触发,而仅会在识别出特定的关键词后才会发出控制信号。
语音唤醒技术需要进行语音识别,现有的语音识别技术一般是基于DNN(深度神经网络,Deep neural network)或者HMM(隐马尔可夫模型,HiddenMarkov Model)模型,需要经过大量的数据训练,而且训练过程耗时长,运算起来极为复杂,有时还需采用高端的GPU计算。因而大部分的语音识别应用的计算均在服务器端处理,或者采用高端CPU或者专用的数字信号处理芯片,导致整个方案成本很高,大大的阻碍了其在嵌入式行业中的应用。
另外,现有技术中的语音唤醒关键词需要在出厂前设置好,后续应用无法更改,而且由于设置的语音唤醒关键词数量有限,扩展性差,仅能满足特定的使用场景。
实用新型内容
本实用新型的一个目的是要提供一种可根据使用需求进行硬件配置、通用性好的语音控制装置。
本实用新型的一个进一步目的是降低语音控制装置的硬件成本。
根据本实用新型的一个方面,提供了一种语音控制装置。该语音控制装置包括:微控制器,设置有音频信号输入接口、控制接口、以及多个通用输入接口;语音输入电路,与音频信号输入接口连接,以拾取语音并转换为电信号向微控制器提供;驱动部件,与控制接口连接;以及部件选择电路,与多个通用输入接口中的至少部分连接,配置成选择性地将多个通用输入接口连通至预定电平,以使微控制器向与预定电平对应的驱动部件发送控制指令,控制指令由所述微控制器对电信号识别得出。
可选地,微控制器还设置有:外接存储器接口;语音控制装置还包括:存储部件,与外接存储器接口连接,以向微控制器提供语音识别模型。
可选地,存储器接口包括:闪存接口和随机存取内存接口;存储部件包括:用于保存音素模型的闪存器件,与闪存接口连接,以及用于语音识别的随机存取内存器件,与随机存取内存接口连接。
可选地,部件选择电路包括:拨码开关,用于按照其被拨动的状态将通用输入接口连通至预定电平。
可选地,部件选择电路包括:排线插针,用于连接跳线,以利用跳线将通用输入接口连通至预定电平。
可选地,以上语音控制装置还包括:电源部件,与微控制器、语音输入电路、以及驱动部件分别连接,以向微控制器、语音输入电路、驱动部件提供各自的工作电压的电源。
可选地,控制接口包括以下任意一种或多种:串口、SPI接口、PWM接口、通用输出接口、I2C、I2S接口。
可选地,微控制器为ARM Cortex-M3芯片。
本实用新型的语音控制装置,通过设置部件选择电路,通过将微控制器的通用输入接口连接至预设电平,使微控制器选择性地执行对应的功能,从而可以提高硬件电路的通用性,满足不同使用环境的要求。
进一步地,本实用新型的语音控制装置,使用低成本的ARM Cortex-M3芯片作为数据核心,可根据需求进行扩展,实施成本低。
根据下文结合附图对本实用新型具体实施例的详细描述,本领域技术人员将会更加明了本实用新型的上述以及其他目的、优点和特征。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本实用新型的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1是根据本实用新型一个实施例的语音控制装置的结构示意框图;
图2是根据本实用新型一个实施例的语音控制装置中的部件选择电路的电路原理图;
图3是根据本实用新型另一实施例的语音控制装置中的部件选择电路的电路原理图;以及
图4是根据本实用新型另一实施例的语音控制装置中的结构示意框图。
具体实施方式
图1是根据本实用新型一个实施例的语音控制装置的结构示意框图。本实施例的语音控制装置一般性地可以包括:微控制器110、语音输入电路120、驱动部件130、部件选择电路140。其中微控制器110可以设置有音频信号输入接口111、控制接口112、以及多个通用输入接口113。
在以上部件中,语音输入电路120与音频信号输入接口111相连接,可以将拾取语音并转换为电信号向微控制器110提供。语音输入电路120可以包括高灵敏度麦克风,使声音引起的振膜振动转换为电压的变化,实现声电转换,并采用运算放大器等器件组成放大滤波电路提高麦克风灵敏度。
微控制器110可以对语音输入电路120提供的电信号进行语音识别,并在识别出关键词与预设的关键词匹配时,确定出该电信号对应的控制指令,相应通过控制接口112向驱动部件130发送该控制指令。
由于在不同的使用场景下,具体的语音关键词不同,需要驱动部件130以及对应的控制接口112均有区别,为了提高电路的通用性,本实施例的语音控制装置增加了部件选择电路140,通过硬件配置的方式选择微控制器110的工作模式并使能微控制器110在工作模式中使用的接口。
部件选择电路140可以选择性地将多个通用输入接口连通至预定电平,以使微控制器110向与预定电平对应的驱动部件130发送控制指令。
部件选择电路140可以使用拨码开关或者排线插针来实现。图2是根据本实用新型一个实施例的语音控制装置中的部件选择电路的电路原理图,在该实施例中使用部件选择电路140包括排线插针,该排线插针用于连接跳线,以利用跳线将通用输入接口连通至预定电平。在图2所示的电路中,排线插针的第一引脚连接微控制器110的通用输入输出引脚(General Purpose InputOutput,简称GPIO)GPIO9,第二引脚连接微控制器110的GPIO8,第三引脚连接微控制器110的GPIO23,第四引脚连接微控制器110的GPIO22,第五引脚连接微控制器110的GPIO25,第六引脚连接微控制器110的GPIO24,第七引脚连接微控制器110的GPIO27,第八引脚连接微控制器110的GPIO26,第九引脚和第十引脚分别接地(GND)。以上微控制器110的各GIPO配置为通用输入口(GPI),可在外部默认上拉,在进行配置时,将对应GPIO的引脚与接地引脚通过跳线连接,从而将GPIO的默认高电平更改为预定的低电平,以便微控制器110识别,使能对应的外设器件(例如激活特定的关键词,或者控制特定的驱动部件)。在实际使用中,排线插针的引脚个数以及用于部件选择的GPIO数量可以需求灵活配置。
图3是根据本实用新型另一实施例的语音控制装置中的部件选择电路的电路原理图,在该实施例中使用部件选择电路140包括拨码开关,该拨码开关,按照其被拨动的状态将通用输入接口连通至预定电平。在图3所示的电路中,拨码开关的第一引脚连接微控制器110的GPIO9,第三引脚连接微控制器110的GPIO23,第五引脚连接微控制器110的GPIO25,第七引脚连接微控制器110的GPIO27,第二引脚、第四引脚、第六引脚、第八引脚分别接地(GND)并通过拨码开关的触点连接第一引脚、第三引脚、第五引脚、第七引脚。以上微控制器110的各GIPO配置为通用输入口(GPI),可在外部默认上拉,在进行配置时,通过拨动拨码开关,使得GPIO的默认高电平更改为预定的低电平,以便微控制器110识别。
图4是根据本实用新型另一实施例的语音控制装置中的结构示意框图,在本实施例中语音控制装置增加设置有存储部件和电源部件160。
其中存储部件可以包括用于保存音素模型的闪存器件(FLASH)151以及用于语音识别的随机存取内存器件(Synchronous Dynamic random accessmemory,简称SDRAM)152,相应地,微控制器110还增加设置有外接存储器接口,该外接存储器接口包括连接闪存器件151的闪存接口114和连接SDRAM152随机存取内存接口115。以上存储器件可以根据实际需要选择配置,在不同的应用场景中,存储部件可根据部件选择电路140的配置进行工作,在一些配置中,FLASH151和SDRAM152可以同时工作,在一些配置中FLASH151和SDRAM152可以择一工作或者均不选择。
电源部件160,与微控制器110、语音输入电路120、以及驱动部件130分别连接,以向微控制器110、语音输入电路120、以及驱动部件12提供各自的工作电压的电源。例如可以提供8.5V、5V、3.3V的电压。
对于不同的驱动部件130,控制接口113可以选择任意一种或多种接口:串口、SPI接口(Serial Peripheral Interface,串行外设接口)、PWM接口(脉波调制,Pulse Wavelength Modulation)、通用输出接口、I2C(Inter-IntegratedCircuit,内置集成电路总线)、I2S(Inter-ICSound,音频设备总线)接口。
微控制器可以选择使用ARM Cortex-M3芯片。ARM Cortex-M3芯片内部集成有模拟数字转换(Analog-to-Digital Converter,简称ADC)模块,自动增益控制功能,节省了音频处理电路的成本,例如ARM Cortex-M3芯片可以选用以下规格的芯片,内置128KB内存,主频达到100MHz,可OTP(OneTime Programmable,一次性编程)方式将代码写入到芯片中,这样的硬件配置能够实现3~4个语音唤醒词。另外可以外挂闪存器件151,把更多的语音唤醒词模型存放在闪存器件151中,该芯片的部分GPIO配置为GPI,以通过使用部件选择电路140进行电平配置,使微处理器110调用不同的唤醒词组合到内存中,提高了通用性,支持了各种不同的应用场景。
进一步地,通过增加SDRAM152增加了内存的容量,不仅可以支持语音唤醒,同时还有剩余的内存支持实现语音识别和语义理解。例如以元趣为唤醒词打开电灯,只需喊出“元趣,打开电灯”即可使驱动电动的驱动部件工作。类似地,“元趣,调到中央五台”的语音可以控制电视换到中央五套,整个应用场景可以更丰富,而且成本很低。
另外,相比于传统的语音唤醒模型采用词模型,需要收集大量的对应唤醒命令词的语音数据才能训练出效果不错的唤醒词模型。在本实施例中可以采用单元更小的音素模型,对应的唤醒词模型可以通过组合这些音素模型来形成,而这些音素模型是通过预先收集好的海量(几千小时量级)语音数据训练得到,因此不需要针对每个唤醒词来收集对应的语音数据。
本实用新型的语音控制装置通过采用低成本、针对性的设计,误识别率降低,同时大大的降低了语音唤醒开关模块的成本,有利于在智能家居中推广。通过音素级的唤醒模型,可以很方便的扩展出各种唤醒词的模型,定制成本低,周期短。通过硬件电路来实现不同的应用场景的选择,解决了通用性问题,简化了配置流程,大大节省了时间和成本。
本实施例的语音控制装置可以应用于电源开关面板中,采取单火线取电转换成工作电压给各部件供电,并自动调节高灵敏度麦克风输入信号的增益,然后对其进行处理之后判断是否需要触发开关,将控制信号传递给驱动部件130,语音控制装置可以利用不同的控制接口112连接不同的驱动各部件120。例如通用输出接口(GPO)可连接继电器,以控制开关闭合;PWM接口可连接电机,以控制电机运行;SPI接口、I2C、I2S可用于连接其他执行部件的控制器。本实施例的语音装置可模块化布置,布置于空调、窗帘、灯光、电视等智能家居设备中,实现智能设备的语音控制。
本实施例的语音控制装置,通过设置部件选择电路,通过将微控制器的通用输入接口连接至预设电平,使微控制器选择性地执行对应的功能,从而可以提高硬件电路的通用性,满足不同使用环境的要求。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本实用新型的多个示例性实施例,但是,在不脱离本实用新型精神和范围的情况下,仍可根据本实用新型公开的内容直接确定或推导出符合本实用新型原理的许多其他变型或修改。因此,本实用新型的范围应被理解和认定为覆盖了所有这些其他变型或修改。
Claims (8)
1.一种语音控制装置,其特征在于包括:
微控制器,设置有音频信号输入接口、控制接口、以及多个通用输入接口;
语音输入电路,与所述音频信号输入接口连接,以拾取语音并转换为电信号向所述微控制器提供;
驱动部件,与所述控制接口连接;以及
部件选择电路,与所述多个通用输入接口中的至少部分连接,配置成选择性地将所述多个通用输入接口连通至预定电平,以使所述微控制器向与所述预定电平对应的驱动部件发送控制指令,所述控制指令由所述微控制器对所述电信号识别得出。
2.根据权利要求1所述的语音控制装置,其特征在于
所述微控制器还设置有:外接存储器接口;
所述语音控制装置还包括:存储部件,与所述外接存储器接口连接,以向所述微控制器提供语音识别模型。
3.根据权利要求2所述的语音控制装置,其特征在于
所述存储器接口包括:闪存接口和随机存取内存接口;
所述存储部件包括:用于保存音素模型的闪存器件,与所述闪存接口连接,以及用于语音识别的随机存取内存器件,与所述随机存取内存接口连接。
4.根据权利要求1所述的语音控制装置,其特征在于所述部件选择电路包括:
拨码开关,用于按照其被拨动的状态将所述通用输入接口连通至所述预定电平。
5.根据权利要求1所述的语音控制装置,其特征在于所述部件选择电路包括:
排线插针,用于连接跳线,以利用所述跳线将所述通用输入接口连通至所述预定电平。
6.根据权利要求1所述的语音控制装置,其特征在于还包括:
电源部件,与所述微控制器、所述语音输入电路、以及所述驱动部件分别连接,以向所述微控制器、所述语音输入电路、所述驱动部件提供各自的工作电压的电源。
7.根据权利要求1至6中任一项所述的语音控制装置,其特征在于
所述控制接口包括以下任意一种或多种:串口、SPI接口、PWM接口、通用输出接口、I2C、I2S接口。
8.根据权利要求1至6中任一项所述的语音控制装置,其特征在于
所述微控制器为ARM Cortex-M3芯片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201520152949.3U CN204480661U (zh) | 2015-03-17 | 2015-03-17 | 语音控制装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201520152949.3U CN204480661U (zh) | 2015-03-17 | 2015-03-17 | 语音控制装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN204480661U true CN204480661U (zh) | 2015-07-15 |
Family
ID=53636439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201520152949.3U Expired - Fee Related CN204480661U (zh) | 2015-03-17 | 2015-03-17 | 语音控制装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN204480661U (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084537A1 (en) * | 2015-11-18 | 2017-05-26 | Zheng Shi | System and method for controlling physical objects placed on an interactive board with voice commands |
CN110412920A (zh) * | 2019-08-06 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种电动窗帘的控制方法 |
CN112799993A (zh) * | 2019-10-28 | 2021-05-14 | 成都鼎桥通信技术有限公司 | 一种i2s通信的实现方法和装置 |
-
2015
- 2015-03-17 CN CN201520152949.3U patent/CN204480661U/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084537A1 (en) * | 2015-11-18 | 2017-05-26 | Zheng Shi | System and method for controlling physical objects placed on an interactive board with voice commands |
CN110412920A (zh) * | 2019-08-06 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种电动窗帘的控制方法 |
CN112799993A (zh) * | 2019-10-28 | 2021-05-14 | 成都鼎桥通信技术有限公司 | 一种i2s通信的实现方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104538030A (zh) | 一种可以通过语音控制家电的控制系统与方法 | |
CN102760432B (zh) | 一种家电用声控遥控器及其控制方法 | |
CN103197571A (zh) | 一种控制方法及装置、系统 | |
CN204480661U (zh) | 语音控制装置 | |
CN203325186U (zh) | 一种控制家电设备的家庭语音盒子装置 | |
CN202713581U (zh) | 一种无线音响适配装置 | |
CN201369095Y (zh) | 可双向通信的智能语音识别遥控器 | |
JP6866046B2 (ja) | クラウドウェイクアップ方法、システム、端末、コンピュータ可読記憶媒体、及びプログラム | |
CN207993475U (zh) | 一种智能语音控制中枢装置、路由器以及语音交互系统 | |
CN213392751U (zh) | 基于神经网络芯片的语音交互智能电风扇及电风扇系统 | |
CN202838948U (zh) | 基于移动通讯终端语音控制空调的通讯装置 | |
CN111001167A (zh) | 一种基于tms320vc5509a的语音控制智能玩具车系统 | |
CN207115051U (zh) | 一种智能家居控制装置 | |
CN209980228U (zh) | 一种基于蓝牙的外置声卡控制系统 | |
CN205003507U (zh) | 远程唤醒式语音点播电路 | |
CN104078042A (zh) | 一种电子设备及一种信息处理的方法 | |
CN207529167U (zh) | 一种立体车库语音播报控制系统 | |
CN202854986U (zh) | 实现语音识别功能的门铃装置 | |
CN213781581U (zh) | 一种语音识别控制系统 | |
CN212460809U (zh) | 一种学习型遥控器电路 | |
CN113129889B (zh) | 语音控制方法及控制装置 | |
CN203588693U (zh) | 语音电路结构 | |
CN104142644A (zh) | 插座的控制方法及控制装置 | |
CN210514990U (zh) | 一种弱电电子设备 | |
CN205229131U (zh) | 一种室内环境监测仪 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150715 |
|
CF01 | Termination of patent right due to non-payment of annual fee |