CN113628617A - 一种基于毫米波雷达的智能语音设备控制方法 - Google Patents
一种基于毫米波雷达的智能语音设备控制方法 Download PDFInfo
- Publication number
- CN113628617A CN113628617A CN202010385741.1A CN202010385741A CN113628617A CN 113628617 A CN113628617 A CN 113628617A CN 202010385741 A CN202010385741 A CN 202010385741A CN 113628617 A CN113628617 A CN 113628617A
- Authority
- CN
- China
- Prior art keywords
- voice
- equipment
- millimeter wave
- intelligent
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 5
- 230000006698 induction Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种基于毫米波雷达的智能语音设备控制方法。本发明利用语音采集模块通过毫米波雷达传感器采集外部语音数据;语音数据经过处理变换后输入至语音识别模块;述语音识别模块采用深度神经网络算法在本地终端对所述语音数据进行识别;语音识别模块将步骤三的识别结果发送给设备控制电路;设备控制电路根据所述识别结果控制所述设备执行操作;设备将执行结果反馈给智能设备功能模块;智能设备功能模块实现所述执行结果。本发明的基于毫米波雷达感应实现的智能语音设备的控制方法,不但可以实现精确捕捉语音信号功能,而且还可以获得良好的人机交互体验感。
Description
技术领域
本发明涉及智能语音识别领域,具体涉及到一种基于毫米波雷达的智能语音设备控制方法。
背景技术
智能语音设备技术在近些年取得了显著的进步,该技术已经进入工业、家电、智能家居等各个领域。一般情况下,智能语音设备需要通过语音唤醒(比如:你好等命令),或者靠某个物理按键从而实现设备的唤醒,使得智能语音设备进入语音识别状态,从而开始进行人机交互。
但是,越来越多的电子设备具有语音采集功能,比如智能音箱、机器人等,通过对采集的语音信号进行语音识别,即可进行实现语音交互等操作。但是在对用户发出的语音信号进行拾取的同时,通常也会拾取到外界噪音,导致获得的语音信号比较混乱,如果噪音干扰较大则无法从从中准确识别获得用户语音。
现有的智能语音设备为了语音采集的准确性,通常是采用6个或8个麦克风阵列,或者MEMS阵列从而来实现全方向语音信息采集,其不但生产成本高,而且设计和生产复杂。同时因为多个麦克风阵列的存在,全方位的声音信息都会被收集。在复杂的信息中筛选出真正有用的语音信息是一个复杂的系统,需要运行复杂的算法从而来提高语音设备识别的准确度,但是这样的智能语音设备系统因延迟响应问题严重,导致了准确度降低,大大影响了人机交互体验。
因此急需一种采集模式解决利用传统麦克风无法采集到的,极其微弱的声学和振动信号的探测,并能将这些信号进行进一步地处理及表示。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于毫米波雷达的智能语音设备控制方法。
本发明的目的可以通过以下技术方案来实现:
一种基于毫米波雷达的智能语音设备控制方法,包括以下步骤:
步骤一利用语音采集模块通过毫米波雷达传感器采集外部语音数据;
步骤二所述语音数据经过处理变换后输入至语音识别模块;
步骤三所述语音识别模块采用深度神经网络算法在本地终端对所述语音数据进行识别;
步骤四所述语音识别模块将步骤三的识别结果发送给设备控制电路;
步骤五所述设备控制电路根据所述识别结果控制所述设备执行操作;
步骤六所述设备将执行结果反馈给智能设备功能模块;
步骤七所述智能设备功能模块实现所述执行结果。
进一步的,所述语音采集模块集成在设备上,包括监测用户对象的毫米波雷达传感器,其中所述毫米波雷达传感器的工作频率为30-300GHz,包括点频毫米波相控振荡器、定向耦合器、环形器、平衡混频器、雷达收发天线、及信号处理器,所述语音采集模块主要由毫米波雷达发射出的点频信号经由雷达天线发射向用户对象,雷达波经被测对象的声波信号进行调制之后反射回毫米波雷达,经同一雷达天线接收,再经语音识别模块对声波信号进行处理、甄选。
进一步的,所述语音识别模块包含有语音识别引擎,语音识别引擎使用DNN算法对所述语音数据进行识别,DNN算法对所述语音数据的识别包括语音预处理、特征提取、发音字典及语音模型四个过程,当对设备说出相应的语音指令时,所述语音识别模块对接收到的语音指令进行识别,所述语音识别模块通过对语音指令的识别对声源进行锁定,声源之外的其他声源则进行过滤剔除,降低了外界其他声源对语音识别的干扰,所述语音识别模块将识别到的语音识别结果通过串口发送给设备的控制芯片,所述控制芯片根据预先设定的程序控制所述设备的各个部分进行协调工作。
有益效果:本发明的基于毫米波雷达感应实现的智能语音设备的控制方法,不但可以实现精确捕捉语音信号功能,而且还可以获得良好的人机交互体验感。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的基于毫米波雷达的智能语音设备控制流程图;
图2是本发明智能语音音箱实例。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面将参考附图并结合实施例来详细说明本发明。
根据图1和图2所示,智能语音音箱设备接通电源后,其内部的语音采集模块开始进入工作状态,其内部的毫米波雷达传感器进入工作状态,智能语音音箱内置的所述传感器是由毫米波雷达发射出的点频信号,进而将该所述点频信号经由部署好的雷达天线发射至用户对象处,用户对象发出相应语音声波信号,雷达波对用户对象的语音声波进行调制措施处理后,将处理过后的语音声波信号反射回毫米波雷达传感器,该所述语音采集模块最后通过同一毫米波雷达天线接收语音信号,继而进行下一步骤;由所述语音采集模块采集接收到的语音信号数据传输送至语音识别模块,其内所述的语音识别引擎对接收到的语音信号数据进行识别处理,该所述语音识别引擎主要是通过其内使用的神经网络算法对采集到的语音数据进行处理分析,该算法的主要过程包括对采集到的语音信号进行预处理,继而通过该算法对语音信号中的某些特征进行提取,接着将提取出的关键语音特征数据与字典中的特征进行比对,模拟。从而构建出对应语音特征的语音模型;最后将该构建出的语音模型信号传递给控制电路,由控制电路控制智能语音音箱设备进行功能实现,从而实现相应功能。
智能语音音箱工作时,语音识别模块识别语音数据,并将语音数据的识别结果发送给智能音箱控制单元,智能音箱控制单元控制智能音箱的屏显等部件的正常运行,智能音箱运行结束后,通过喇叭进行播放,智能语音音箱设置了数条语音指令和唤醒词,语音指令中,包括音频播放、视频播放等,当智能语音音箱开机之后,其各个单元模块启动成功后,用户可以使用唤醒词将语音识别模块唤醒,智能语音音箱被唤醒后,用户可以说出各种语音指令,从而智能语音音箱都能完成识别并按照设定的控制流程做出反馈并执行相应结果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于毫米波雷达的智能语音设备控制方法,其特征在于,包括以下步骤:
步骤一利用语音采集模块通过毫米波雷达传感器采集外部语音数据;
步骤二所述语音数据经过处理变换后输入至语音识别模块;
步骤三所述语音识别模块采用深度神经网络算法在本地终端对所述语音数据进行识别;
步骤四所述语音识别模块将步骤三的识别结果发送给设备控制电路;
步骤五所述设备控制电路根据所述识别结果控制所述设备执行操作;
步骤六所述设备将执行结果反馈给智能设备功能模块;
步骤七所述智能设备功能模块实现所述执行结果。
2.根据权利要求1所述的智能语音设备控制方法,其特征在于,所述语音采集模块集成在设备上,包括监测用户对象的毫米波雷达传感器,其中所述毫米波雷达传感器的工作频率为30-300GHz,包括点频毫米波相控振荡器、定向耦合器、环形器、平衡混频器、雷达收发天线、及信号处理器,所述语音采集模块主要由毫米波雷达发射出的点频信号经由雷达天线发射向用户对象,雷达波经被测对象的声波信号进行调制之后反射回毫米波雷达,经同一雷达天线接收,再经语音识别模块对声波信号进行处理、甄选。
3.根据权利要求1所述的智能语音设备控制方法,其特征在于,所述语音识别模块包含有语音识别引擎,语音识别引擎使用DNN算法对所述语音数据进行识别,DNN算法对所述语音数据的识别包括语音预处理、特征提取、发音字典及语音模型四个过程,当对设备说出相应的语音指令时,所述语音识别模块对接收到的语音指令进行识别,所述语音识别模块通过对语音指令的识别对声源进行锁定,声源之外的其他声源则进行过滤剔除,降低了外界其他声源对语音识别的干扰,所述语音识别模块将识别到的语音识别结果通过串口发送给设备的控制芯片,所述控制芯片根据预先设定的程序控制所述设备的各个部分进行协调工作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010385741.1A CN113628617A (zh) | 2020-05-09 | 2020-05-09 | 一种基于毫米波雷达的智能语音设备控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010385741.1A CN113628617A (zh) | 2020-05-09 | 2020-05-09 | 一种基于毫米波雷达的智能语音设备控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113628617A true CN113628617A (zh) | 2021-11-09 |
Family
ID=78377456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010385741.1A Pending CN113628617A (zh) | 2020-05-09 | 2020-05-09 | 一种基于毫米波雷达的智能语音设备控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113628617A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625861A (zh) * | 2009-08-11 | 2010-01-13 | 中国人民解放军第四军医大学 | 一种不依赖空气传导的语音探测仪 |
CN101625262A (zh) * | 2009-08-11 | 2010-01-13 | 中国人民解放军第四军医大学 | 一种基于毫米波雷达的非空气传导语音探测仪 |
CN106388773A (zh) * | 2016-08-29 | 2017-02-15 | 成都锐新科技有限公司 | 一种毫米波雷达传感器 |
CN107801125A (zh) * | 2017-12-04 | 2018-03-13 | 深圳市易探科技有限公司 | 一种具有微波雷达感应的智能音箱控制系统 |
CN108091327A (zh) * | 2018-02-22 | 2018-05-29 | 成都启英泰伦科技有限公司 | 一种智能语音设备控制方法 |
CN207487664U (zh) * | 2017-09-19 | 2018-06-12 | 洛阳中科龙网创新科技有限公司 | 一种基于雷达模块化控制视觉监测系统 |
WO2018195546A1 (en) * | 2017-04-21 | 2018-10-25 | Tlc Millimeter Wave Products, Inc. | Millimeter wave advanced threat detection system network |
CN110794416A (zh) * | 2019-10-18 | 2020-02-14 | 广东工业大学 | 一种光子毫米波噪声雷达 |
CN110807909A (zh) * | 2019-12-09 | 2020-02-18 | 深圳云端生活科技有限公司 | 一种雷达和语音处理组合控制的方法 |
CN111028866A (zh) * | 2019-12-23 | 2020-04-17 | 北京木牛领航科技有限公司 | 一种智能音乐控制播放装置、方法 |
CN111091831A (zh) * | 2020-01-08 | 2020-05-01 | 上海交通大学 | 无声唇语识别方法及系统 |
-
2020
- 2020-05-09 CN CN202010385741.1A patent/CN113628617A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625861A (zh) * | 2009-08-11 | 2010-01-13 | 中国人民解放军第四军医大学 | 一种不依赖空气传导的语音探测仪 |
CN101625262A (zh) * | 2009-08-11 | 2010-01-13 | 中国人民解放军第四军医大学 | 一种基于毫米波雷达的非空气传导语音探测仪 |
CN106388773A (zh) * | 2016-08-29 | 2017-02-15 | 成都锐新科技有限公司 | 一种毫米波雷达传感器 |
WO2018195546A1 (en) * | 2017-04-21 | 2018-10-25 | Tlc Millimeter Wave Products, Inc. | Millimeter wave advanced threat detection system network |
CN207487664U (zh) * | 2017-09-19 | 2018-06-12 | 洛阳中科龙网创新科技有限公司 | 一种基于雷达模块化控制视觉监测系统 |
CN107801125A (zh) * | 2017-12-04 | 2018-03-13 | 深圳市易探科技有限公司 | 一种具有微波雷达感应的智能音箱控制系统 |
CN108091327A (zh) * | 2018-02-22 | 2018-05-29 | 成都启英泰伦科技有限公司 | 一种智能语音设备控制方法 |
CN110794416A (zh) * | 2019-10-18 | 2020-02-14 | 广东工业大学 | 一种光子毫米波噪声雷达 |
CN110807909A (zh) * | 2019-12-09 | 2020-02-18 | 深圳云端生活科技有限公司 | 一种雷达和语音处理组合控制的方法 |
CN111028866A (zh) * | 2019-12-23 | 2020-04-17 | 北京木牛领航科技有限公司 | 一种智能音乐控制播放装置、方法 |
CN111091831A (zh) * | 2020-01-08 | 2020-05-01 | 上海交通大学 | 无声唇语识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223497B (zh) | 一种终端的就近唤醒方法、装置、计算设备及存储介质 | |
CN106910500B (zh) | 对带麦克风阵列的设备进行语音控制的方法及设备 | |
US11557291B2 (en) | Method for location inference of IoT device, server, and electronic device supporting the same | |
CN109308908B (zh) | 一种语音交互方法及装置 | |
CN109949810A (zh) | 一种语音唤醒方法、装置、设备及介质 | |
US20120106298A1 (en) | Gesture recognition appparatus and method | |
WO2020088153A1 (zh) | 语音处理方法、装置、存储介质和电子设备 | |
US9911417B2 (en) | Internet of things system with voice-controlled functions and method for processing information of the same | |
CN101923857A (zh) | 一种人机交互的可扩展语音识别方法 | |
CN107004426A (zh) | 录取录像对象的声音的方法和移动终端 | |
CN110364156A (zh) | 语音交互方法、系统、终端及可读存储介质 | |
CN206559550U (zh) | 一种内置麦克风阵列的遥控器及电视系统 | |
CN103886861A (zh) | 一种控制电子设备的方法及电子设备 | |
US20220044670A1 (en) | Electronic device for performing voice recognition using microphones selected on basis of operation state, and operation method of same | |
CN105427866A (zh) | 一种语音处理方法、装置及拾音电路 | |
CN111462741A (zh) | 语音数据处理方法、装置及存储介质 | |
CN111323783A (zh) | 场景识别方法、装置、存储介质及电子设备 | |
DE112017006684T5 (de) | Mikrofonanordnung mit authentifizierung | |
CN111145746A (zh) | 一种基于人工智能语音的人机交互方法 | |
CN103426429A (zh) | 语音控制方法和装置 | |
CN208724111U (zh) | 基于电视设备的远场语音控制系统 | |
CN110517702A (zh) | 信号生成的方法、基于人工智能的语音识别方法及装置 | |
CN106409306A (zh) | 一种获取人声的智能系统及基于该系统的获取方法 | |
CN110517682B (zh) | 语音识别方法、装置、设备及存储介质 | |
CN113628617A (zh) | 一种基于毫米波雷达的智能语音设备控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |