CN109119074A - 语音识别控制器 - Google Patents

语音识别控制器 Download PDF

Info

Publication number
CN109119074A
CN109119074A CN201710481560.7A CN201710481560A CN109119074A CN 109119074 A CN109119074 A CN 109119074A CN 201710481560 A CN201710481560 A CN 201710481560A CN 109119074 A CN109119074 A CN 109119074A
Authority
CN
China
Prior art keywords
module
voice recognition
speech recognition
voice
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710481560.7A
Other languages
English (en)
Inventor
毕文彬
李旺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Wisdom Construction Electronic Engineering Co Ltd
Original Assignee
Shanghai Wisdom Construction Electronic Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Wisdom Construction Electronic Engineering Co Ltd filed Critical Shanghai Wisdom Construction Electronic Engineering Co Ltd
Priority to CN201710481560.7A priority Critical patent/CN109119074A/zh
Publication of CN109119074A publication Critical patent/CN109119074A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了语音识别控制器,涉及智能控制器技术领域。该语音识别控制器包括语音接收结构,语音识别模块,中央控制器模块和接口模块;接收来自用户的语音生成电信号后,语音识别模块对所述电信号进行处理后,获取语音识别结果,然后中央控制器模块根据存储的关键词与控制信号的映射关系列表,将该语音识别结果转换为对应的控制信号,通过接口模块将控制信号发送至待控制设备或系统。本发明通过获取客户语音,智能识别后发出对应的控制指令,实现智能控制,使电子设备或系统的控制更加灵活和智能。

Description

语音识别控制器
技术领域
本发明涉及一种智能控制器技术领域,尤其涉及一种基于语音识别技术的智能控制器。
背景技术
随着各种智能音频视频系统(多媒体系统)的普及,传统的控制方式已经无法满足现在市场的需要。现有的繁琐的控制方式,在一定程度上阻碍了在日常生活中对智能音频视频系统的大范围推广和普及。
目前,为顺应行业IT化的发展趋势,多数传统的控制方式还聚焦在使用第三方硬件设备上对现有系统进行控制,本身就增加了故障率和维护成本,且因为某些地区基础设施和环境的限制,普通的控制方式也难以被用户使用。
发明内容
本发明的目的在于:克服现有技术的不足,提供了一种语音识别控制器。本发明的语音识别控制器减少了控制过程中的人工手动操作,使电子设备的控制更加灵活。
以下为本发明具体的技术方案:
一种语音识别控制器,包括:语音接收结构,语音识别模块,中央控制器模块和接口模块;所述语音接收结构,用以接收来自用户的语音生成电信号;所述语音识别模块,与语音接收结构电连接,用以接收所述电信号,对所述电信号进行处理后,获取语音识别结果;所述中央控制器模块,与语音识别模块电连接,用以接收前述语音识别结果,根据存储的关键词与控制信号的映射关系列表,将该语音识别结果转换为对应的控制信号;所述接口模块,与中央控制器模块电连接,用以接收所述控制信号,将控制信号发送至与接口模块连接的待控制设备。
进一步,所述中央控制器模块为可编程中央控制器。
进一步,所述接口模块包括232接口、I/O接口、红外接口以及继电器接口中的一种或多种。
进一步,所述语音接收结构为麦克风。
进一步,由于需要7×24小时长时间待机,因此设备内部配置了对应的散热设备,用以调节所述语音识别控制器运转产生的热量,满足长时间待机的散热需求。
进一步,所述与接口模块连接的待控制设备,优选为音频视频系统,比如音频视频导航设备、电视机、游戏机或投影仪等。
进一步,语音识别控制器还包括电源模块,用以向语音识别控制器中用电元件提供电力。
进一步,所述语音识别模块包括如下结构:
频谱转换单元,用于将接收的电信号通过频谱转换后获取语音特征;
特征提取单元,用于将通过频谱转换的语音特征提取出来并发送给语音匹配单元进行匹配;
语音匹配单元,用于将接收的语音特征与关键词列表中预设的关键词进行匹配,将最优匹配的关键词作为语音识别结果。
本发明提供了一种能在不同环境中自动识别人声语音的语音识别控制器。所述语音识别控制器采用可编程中央控制器作为中央控制器模块,可通过C++语言进行编辑,通过语音识别控制器的外部接口推送控制信号(即控制指令),最终实现控制功能。
本发明主要基于软件架构,使用C++语言进行编辑,根据接口类型接入对应相关设备,搭载于硬件内核平台之上。本发明的语音识别控制器,通过获取客户语音,智能识别后发出对应的控制指令,实现智能控制,减少了控制过程中的人工手动操作,使电子设备的控制更加智能、灵活。
附图说明
图1为本发明实施例提供的语音识别控制器的模块结构图。
图2为本发明实施例提供的语音识别控制器的接口示意图。
附图标记说明:
语音识别控制器100;
语音接收结构110,语音识别模块120,中央控制器模块130,接口模块140。
具体实施方式
以下结合附图和具体实施例对本发明提供的语音识别控制器作进一步详细说明。应当注意的是,下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。
需说明的是,本说明书所附图中所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定发明可实施的限定条件,任何结构的修饰、比例关系的改变或大小的调整,在不影响发明所能产生的功效及所能达成的目的下,均应落在发明所揭示的技术内容所能涵盖的范围内。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
实施例
参见图1所示,一种语音识别控制器100,包括:语音接收结构110,语音识别模块120,中央控制器模块130和接口模块140。
所述语音接收结构110,用以接收来自用户的语音生成电信号。具体的,所述语音接收结构为麦克风。作为举例而非限制,所述麦克风可为碳式(carbon)麦克风、水晶(crystal)麦克风、动圈式(moving-coil)麦克风、带式(ribbon)麦克风、电容式(condenser)麦克风和/或半导体(semiconductor)麦克风。
所述语音识别模块120,与语音接收结构110电连接,用以接收所述电信号,对所述电信号进行处理后,获取语音识别结果。具体的,所述语音识别模块120可以包括如下结构:
频谱转换单元,用于将接收的电信号通过频谱转换后获取语音特征;
特征提取单元,用于将通过频谱转换的语音特征提取出来并发送给语音匹配单元进行匹配;
语音匹配单元,用于将接收的语音特征与关键词列表中预设的关键词进行匹配,将最优匹配的关键词作为语音识别结果。
可以理解的是,所述语音识别模块120可以采用市售的语音识别芯片。
所述中央控制器模块130,与语音识别模块120电连接,用以接收前述语音识别结果,根据存储的关键词与控制信号的映射关系列表,将该语音识别结果转换为对应的控制信号。具体的,所述中央控制器模块130为可编程中央控制器,可使用C++语言进行编辑。
中央控制器模块130包括存储器,存储器中存储有关键词列表、控制信号列表(即控制指令列表),以及关键词对控制信号的映射关系列表。用户可以对所述关键词列表、控制信号列表以及映射关系列表进行维护、更新、替换、修改等编辑操作。
所述接口模块140,与中央控制器模块130电连接,用以接收所述控制信号,将控制信号发送至与接口模块140连接的待控制设备。所述连接可以是有线连接,也可以是无线连接。
优选的,参见图1所示,所述接口模块可以包括232接口、I/O接口、红外接口以及继电器接口中的一种或多种。
所述与接口模块连接的待控制设备,优选为音频视频系统,比如音频视频导航设备、电视机、游戏机或投影仪等。
本实施例中,由于需要7×24小时长时间待机,因此设备内部配置了对应的散热设备,用以调节所述语音识别控制器运转产生的热量,满足长时间待机的散热需求。具体的,其可以为散热风扇。
本实施例中,所述语音识别控制器还包括电源模块,电源模块用以向语音识别控制器中用电元件提供电力。具体的,所述电源模块可以采用蓄电池。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (8)

1.一种语音识别控制器,其特征在于包括:语音接收结构,语音识别模块,中央控制器模块和接口模块;
所述语音接收结构,用以接收来自用户的语音生成电信号;
所述语音识别模块,与语音接收结构电连接,用以接收所述电信号,对所述电信号进行处理后,获取语音识别结果;
所述中央控制器模块,与语音识别模块电连接,用以接收前述语音识别结果,根据存储的关键词与控制信号的映射关系列表,将该语音识别结果转换为对应的控制信号;
所述接口模块,与中央控制器模块电连接,用以接收所述控制信号,将控制信号发送至与接口模块连接的待控制设备。
2.根据权利要求1所述的语音识别控制器,其特征在于:所述中央控制器模块为可编程中央控制器。
3.根据权利要求1所述的语音识别控制器,其特征在于:所述接口模块包括232接口、I/O接口、红外接口以及继电器接口中的一种或多种。
4.根据权利要求1所述的语音识别控制器,其特征在于:所述语音接收结构为麦克风。
5.根据权利要求1所述的语音识别控制器,其特征在于:还包括散热模块,用以调节所述语音识别控制器运转产生的热量。
6.根据权利要求1所述的语音识别控制器,其特征在于:所述与接口模块连接的待控制设备为音频视频导航设备、电视机、游戏机或投影仪。
7.根据权利要求1所述的语音识别控制器,其特征在于:还包括电源模块,用以向语音识别控制器中用电元件提供电力。
8.根据权利要求1所述的语音识别控制器,其特征在于:所述语音识别模块包括,
频谱转换单元,用于将接收的电信号通过频谱转换后获取语音特征;
特征提取单元,用于将通过频谱转换的语音特征提取出来并发送给语音匹配单元进行匹配;
语音匹配单元,用于将接收的语音特征与关键词列表中预设的关键词进行匹配,将最优匹配的关键词作为语音识别结果。
CN201710481560.7A 2017-06-22 2017-06-22 语音识别控制器 Pending CN109119074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710481560.7A CN109119074A (zh) 2017-06-22 2017-06-22 语音识别控制器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710481560.7A CN109119074A (zh) 2017-06-22 2017-06-22 语音识别控制器

Publications (1)

Publication Number Publication Date
CN109119074A true CN109119074A (zh) 2019-01-01

Family

ID=64732785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710481560.7A Pending CN109119074A (zh) 2017-06-22 2017-06-22 语音识别控制器

Country Status (1)

Country Link
CN (1) CN109119074A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961788A (zh) * 2019-04-03 2019-07-02 国电联合动力技术有限公司 风电中央监控系统的语音智能助手装置及语音控制系统
CN111231544A (zh) * 2020-01-20 2020-06-05 饶志昌 一种人工智能语音控制笔
CN111710337A (zh) * 2020-06-16 2020-09-25 睿云联(厦门)网络通讯技术有限公司 语音数据的处理方法、装置、计算机可读介质及电子设备
CN112839254A (zh) * 2019-11-04 2021-05-25 海信视像科技股份有限公司 显示设备与内容显示方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961788A (zh) * 2019-04-03 2019-07-02 国电联合动力技术有限公司 风电中央监控系统的语音智能助手装置及语音控制系统
CN112839254A (zh) * 2019-11-04 2021-05-25 海信视像科技股份有限公司 显示设备与内容显示方法
CN111231544A (zh) * 2020-01-20 2020-06-05 饶志昌 一种人工智能语音控制笔
CN111710337A (zh) * 2020-06-16 2020-09-25 睿云联(厦门)网络通讯技术有限公司 语音数据的处理方法、装置、计算机可读介质及电子设备
CN111710337B (zh) * 2020-06-16 2023-07-07 睿云联(厦门)网络通讯技术有限公司 语音数据的处理方法、装置、计算机可读介质及电子设备

Similar Documents

Publication Publication Date Title
CN109119074A (zh) 语音识别控制器
CN105493180B (zh) 用于语音识别的电子装置和方法
CN104954960A (zh) 调整助听器声音的方法、执行该方法的助听器和电子装置
CN203520624U (zh) 一种内置wifi的遥控器扩展设备及遥控系统
CN105118257A (zh) 智能控制系统及方法
CN206353839U (zh) 一种电视语音控制系统
CN105633547A (zh) 天线和包括天线的电子设备
KR102365346B1 (ko) 전자 장치 및 전자 장치의 무선 충전 방법
CN105245993A (zh) 一种耳机音量自动调节方法、系统和智能耳机
CN104601838A (zh) 一种语音、无线控制智能家用电器操作系统
CN109584872A (zh) 一种语音控制系统、控制方法、设备及介质
CN107479854A (zh) 一种投影仪及投影方法
CN101729957A (zh) 电子装置及消除电子装置音量突变的方法
CN206490785U (zh) 同时具有远场和近场语音识别的遥控装置及电视系统
CN113595578B (zh) 一种可拆卸通信模组
CN207939530U (zh) 一种语音控制式智能音箱
CN110971968A (zh) 一种智能机顶盒系统
CN107817687A (zh) 一种分体式智能家居控制系统及控制方法
CN207603830U (zh) 一种家用电器智能语音系统
CN205160676U (zh) 适配移动终端的音视频一体设备
CN109872719A (zh) 一种分级式智能语音系统及其语音处理方法
US20180124493A1 (en) Galvanic linkage for smart sock or other wearable devices
CN108810859A (zh) 一种基于加密功能的蓝牙智能手表语音控制方法及系统
CN105307071B (zh) 耳机设备
US11399205B2 (en) USB-C DMP device and playback method for same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190101

WD01 Invention patent application deemed withdrawn after publication