CN109979459A - 一种基于非特定人语音识别的四旋翼飞行器控制系统 - Google Patents
一种基于非特定人语音识别的四旋翼飞行器控制系统 Download PDFInfo
- Publication number
- CN109979459A CN109979459A CN201910148700.8A CN201910148700A CN109979459A CN 109979459 A CN109979459 A CN 109979459A CN 201910148700 A CN201910148700 A CN 201910148700A CN 109979459 A CN109979459 A CN 109979459A
- Authority
- CN
- China
- Prior art keywords
- module
- wifi
- serial ports
- unit
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 15
- 238000000034 method Methods 0.000 abstract description 9
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/08—Control of attitude, i.e. control of roll, pitch, or yaw
- G05D1/0808—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明提供了一种基于非特定人语音识别的四旋翼飞行器控制系统,包括语音输入装置、语音识别模块、主控模块、串口转WIFI模块、WIFI接收模块、飞行控制模块、一号电源模块和二号电源模块,语音输入装置、语音识别模块、主控模块、串口转WIFI模块和一号电源模块安装在操纵遥控器上,WIFI接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上。采用语音识别技术,通过非特定人语音来控制四旋翼飞行器,解决了传统遥控飞行器遥控器操作复杂性、普适性差的问题,同时语音识别结合PNSC的语言特征提取方法是的语音的输入对环境质量的要求大大降低,采集得到的语音信号信噪比大大提高,因此语音信号的识别正确率得到了提高。
Description
技术领域
本发明涉及通信、信号处理与嵌入式技术领域,尤其是一种非特定人语音识别的控制系统。
背景技术
随着科学技术的迅速发展和人民生活水平的不断提高,遥控飞行器极大地方便了和丰富了人们的日常生产、生活,越来越受到人们的青睐。其中,四旋翼飞行器采用四个旋翼作为飞行的直接动力源,旋翼对称分布在机体的前后、左右四个方向,四个旋翼处于同一高度平面,且四个旋翼的结构和半径都相同,旋翼1和旋翼3逆时针旋转,旋翼2和旋翼4顺时针旋转(针对X型接线方式,机头右侧为旋翼1,逆时针依次为旋翼2,旋翼3,旋翼4,为表述方便,自己定义旋翼的序号,实际只需满足电机旋转方向与正反桨的配合,使四旋翼产生向上的升力即可),四个电机对称的安装在飞行器的支架端,支架中间空间安放飞行控制计算机和外部设备。与传统的直升机不同,四旋翼飞行器只能通过改变螺旋桨的速度来实现各种动作,传统的由遥控器控制的四旋翼飞行器,由于遥控器必须与飞行器配套使用,且其操作性复杂,仅适用于具有一定的操作能力的人群,存在通用性、普适性差等问题,限制了人们的使用需求。
发明内容
为了克服现有技术的不足,解决现有的四旋翼飞行器控制操作性复杂、普适性差等问题,本发明提出一种基于非特定人语音识别技术的四旋翼飞行器控制系统,降低了操作四旋翼飞行器的难度,具有较强的普适性。
本发明解决其技术问题所采用的技术方案是:
一种基于非特定人语音识别技术的四旋翼飞行器控制系统,包括语音输入装置、语音识别模块、主控模块、串口转WIFI模块、WIFI接收模块、飞行控制模块、一号电源模块和二号电源模块,其中,所述语音输入装置、语音识别模块、主控模块、串口转WIFI模块和一号电源模块安装在操纵遥控器上,WIFI接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上。
所述语音输入装置为麦克风,语音识别模块将识别后的语音输入到主控模块,主控模块将语音信号输入串口转WIFI模块,串口转WIFI模块与四旋翼飞行器上的WIFI接受模块通过TCP/IP协议的网络连接,一号电源模块同时为语音输入装置、语音识别模块、主控模块、串口转WIFI模块供电;四旋翼飞行器的WIFI接收模块接收到语音信号后,将信号输入飞行控制模块,二号电源模块为WIFI接受模块和飞行控制模块供电。
所述语音输入装置将语音信号转化为50毫伏的电压信号,所述语音识别模块包含放大滤波单元、语音识别处理单元和中断信号输出单元,经麦克风转化后的电压信号经过放大滤波单元后,进入语音识别处理单元,通过与语音库进行对比模板进行匹配识别,进行判决,如果匹配成功,语音识别处理单元将会输出判决信号,判决信号进入中断信号输出单元,中断信号输出单元输出触发中断信号进入主控模块,语音识别模块以嵌入式微处理器为核心,采用LD332X系列语音识别芯片和控制电路,设计实现非特定语音控制系统。
所述主控模块接收语音识别模块输出的触发中断信号,中断接收单元开始接收触发中断信号,同时MCU(Micro Controller Unit)单元通过串口输出单元向串口转WIFI模块发送AT指令;
所述串口转WIFI模块的串口接收单元接收到串口输出单元发出的AT指令,通过无线协议单元中的IEEE 802.11n WiFi协议进行转换,然后将AT指令通过AT指令发送单元进行发射。
所述WIFI接收模块包含AT指令接收单元,用于接收串口转WIFI模块发出的AT指令。
所述飞行控制模块,根据飞行控制模块I/O口管角发送的脉冲宽度调制信号,利用姿态控制算法得到四旋翼的四个电机的等效电压,通过改变飞行控制模块管角输出电压波形的占空比,进而改变其等效电压,使得每一个电机的转速不同,进而改变飞行姿态,进而实现对四旋翼飞行器的飞行姿态的控制。
所述一号电源模块和二号电源模块均包含电池单元和电平转换单元。
本发明的有益效果在于由于采用语音识别技术,能够通过非特定人语音来控制四旋翼飞行器,适用性强,解决了传统遥控飞行器遥控器操作复杂性、普适性差的问题,同时语音识别结合PNSC的语言特征提取方法是的语音的输入对环境质量的要求大大降低,采集得到的语音信号信噪比大大提高,因此语音信号的识别正确率得到了提高。
附图说明
图1是为本发明的系统组成原理图;
图2为本发明所述系统的控制流程图;
图3为本发明语音识别原理流程框图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
一种基于非特定人语音识别技术的四旋翼飞行器控制系统,如图1所示,包括语音输入装置(麦克风)、语音识别模块、主控模块、串口转WIFI模块、WIFI接收模块、飞行控制模块、一号电源模块和二号电源模块,其中,所述语音输入装置、语音识别模块、主控模块、串口转WIFI模块和一号电源模块安装在操纵遥控器上,WIFI接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上。
所述语音输入装置为麦克风,语音识别模块将识别后的语音输入到主控模块,主控模块将语音信号输入串口转WIFI模块,串口转WIFI模块与四旋翼飞行器上的WIFI接受模块通过TCP/IP协议的网络连接,一号电源模块同时为语音输入装置、语音识别模块、主控模块、串口转WIFI模块供电;四旋翼飞行器的WIFI接收模块接收到语音信号后,将信号输入飞行控制模块,二号电源模块为WIFI接受模块和飞行控制模块供电。
所述语音输入装置将语音信号转化为50毫伏的电压信号,所述语音识别模块包含放大滤波单元、语音识别处理单元和中断信号输出单元,经麦克风转化后的电压信号经过放大滤波单元后,进入语音识别处理单元,通过与语音库进行对比模板进行匹配识别,进行判决,如果匹配成功,语音识别处理单元将会输出判决信号,判决信号进入中断信号输出单元,中断信号输出单元输出触发中断信号进入主控模块,语音识别模块以嵌入式微处理器为核心,采用LD332X系列语音识别芯片和控制电路,设计实现非特定语音控制系统。
所述主控模块接收语音识别模块输出的触发中断信号,中断接收单元开始接收触发中断信号,同时MCU(Micro Controller Unit)单元通过串口输出单元向串口转WIFI模块发送AT指令;
所述串口转WIFI模块的串口接收单元接收到串口输出单元发出的AT指令,通过无线协议单元中的IEEE 802.11n WiFi协议进行转换,然后将AT指令通过AT指令发送单元进行发射。
所述WIFI接收模块包含AT指令接收单元,用于接收串口转WIFI模块发出的AT指令。
所述飞行控制模块,根据飞行控制模块I/O口管角发送的脉冲宽度调制信号,利用姿态控制算法得到四旋翼的四个电机的等效电压,通过改变飞行控制模块管角输出电压波形的占空比,进而改变其等效电压,使得每一个电机的转速不同,进而改变飞行姿态,进而实现对四旋翼飞行器的飞行姿态的控制。
所述一号电源模块和二号电源模块均包含电池单元和电平转换单元。
所述语音输入装置(麦克风)用于将非特定人语音信号转化为微弱的电信号。
所述语音识别模块,包含放大滤波单元、语音识别处理单元和中断信号输出单元。其中,放大滤波单元用于滤除声音信号的杂波,在进行放大,便于语音识别处理单元的特征参数提取和对比,中断信号输出单元用于触发主控模块的中断响应。
对于放大滤波单元,要求带通频率范围为300HZ-3400HZ,所述的语音识别处理单元,采用LD3320语音识别芯片和相关控制电路,LD3320芯片集成了语音识别处理器和外部电路,包括AD和DA转换器、麦克风、声音输出接口。
所述主控模块,包含中断接收单元、MCU单元和串口输出单元,其中,经多次试验论证,为能够保证控制系统的数据运算能力,要求微处理器主频不低于8MHz,字长不低于8位,内存不少于8KB(保证系统稳定工作的最低要求);同时,要求具有通用I/O接口,外部中断/事件控制器,用于产生中断/事件请求,串口输出单元(9)用于向串口转WIFI模块的输出相应的AT指令。本实施例中,主控模块可选择意法半导体公司STM32单片机。
所述串口转WIFI模块,包含串口接收单元、无线协议单元和AT指令发送单元。无线协议单元(12)采用TCP/IP协议即Internet的协议规范。采用UART接口,内置IEEE802.11协议以及TCP/IP协议,能够实现用户串口到无线网络之间的转换。AT指令发送单元(13)即将串口接收单元(11)接收的数据发送到该网络。
所述WIFI接收模块(14),包含AT指令接收单元(15)。其中,该WIFI接收模块(14)作为AP接入点,而串口转WIFI模块(10)作为客户端。网络参数如:串口配置,格式如下:波特率,数据位,校验位,停止位;网络模式,选择Client、Server或者none;服务器域名或者IP地址等都可以自己设置。
所述飞行控制模块(16),包括飞行控制MCU单元(17),姿态调整单元(18)。其中,经多次试验论证,为能够保证控制系统的数据运算能力,要求飞行控制MCU单元(17)主频不低于16MHz,字长不低于8位,内存不少于64KB,拥有8位以上定时器和6路以上10位模数转换器,具有I2C通信功能;姿态调整单元(18)中,要求陀螺仪具有I2C通信功能,测量角速度范围±2000rad/s之间,输出数字信号频率不低于400Hz;要求加速度计测量范围不低于8g,分辨率不低于10位,具有I2C通信功能。为满足以上技术要求,本实施例中,控制器可选择意法半导体公司STM32单片机,陀螺仪选择L3G4200D三轴陀螺仪,加速度及选择ADXL345三轴加速度计。
所述电源模块(19)、(22),包括电池1单元(20)、电池2单元(23)和电平转换单元(21)、(24)。电池1单元(20)的作用是提供为各个模块的总电源,电平转换单元(21)作用是根据系统中各功能模块的工作电平为它们供电。电池2单元(23)的作用是提供系统总电源并为四旋翼飞行器的电机供电;电平转换单元(24)作用是根据系统中各功能模块的工作电平为它们供电。为保证较长的续航时间和较大的供电电压,要求电池2单元(23)容量不低于2000mAh,本实施例中选择电池2单元(23)容量2000mAh,电压12V;电平转换单元(24)需要能将电池2单元(23)电压转换为3.3V--5V的连续可调电压,本实施例中要求将12V输入电压转换并稳定至5V输出电压,输出电压误差控制在±4%以内,振荡频率误差在±15%以内,可选择LM2596开关电压调节器作为电平转换单元(24)。
所述语音输入装置(麦克风)、语音识别模块、主控模块、串口转WIFI模块、电源模块(19)均作为用户端。所述WIFI接收模块、飞行控制模块、电源模块(22)均安装在四旋翼飞行器上。
语音输入装置与语音识别模块相连,语音识别模块与主控模块相连,主控模块与串口转WIFI模块相连,串口转WIFI模块与四旋翼飞行器上的WIFI模块通过TCP/IP协议的网络连接,四旋翼飞行器的WIFI模块与飞行控制模块相连。电源模块(19)同时与语音输入装置、语音识别模块、主控模块、串口转WIFI模块。电源模块(22)与WIFI模块、飞行控制模块相连。
本发明采用高性能LD3320语音识别芯片和控制电路,实现非特定人语音控制四旋翼飞行控制器。
语音识别技术即语音识别过程,主要包括两个阶段:训练阶段和识别阶段。两个阶段都必须对输入语音进行预处理和特征提取。
(1)训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征参数,最后通过特征参数建模达到建立训练语音的参考模型库的目的。
(2)识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出,从而达到了语音识别的目的。
一种基于非特定人语音识别的四旋翼飞行器控制系统,所述非特定人语音识别控制四旋翼飞行器的具体工作流程包括:
A)语音识别单元将非特定人语音进行识别,并转化成相应的AT指令。
B)串口转WIFI单元将与语音识别相应的AT指令发送出去。
C)飞行控制模块通过WIFI接收模块,接收相应的AT指令,生成控制各个轴的转速的PWM波,调整飞行姿态。
所述基于非特定人语音识别技术的四旋翼飞行器控制系统中进行语音识别的步骤如下:
步骤1将通过MIC录入的语音信号首先经过预处理,所述预处理包括语音信号的采样、反混叠滤波和语音增强;
步骤2:对录入的语音信号提取语音特征,从语音信号波形中提取一组或多组描述语音信号特征的参数,包括语音信号的周期、幅值和初相位,得到语音的特征信息(即语音内容的关键词),将储存在芯片存储器中的关键词数据库(即训练模板)中的数据与对录入的语音信号进行提取的语音内容的关键词,芯片中所存储的关键词数据库中的关键词数据库是事先由训练模式下,人为输入语音信息进行语音信号特征提取之后得到的内容关键词语数据,将关键词语数据保存得到的关键词数据库,词表中每个词对应一个参考模式。
步骤3:经过信号分析后对输入的语音信号与训练模板中事先在训练模板中所储存的语音信号,进行频率,幅值,初相位相比,与训练模板中的语音信号相比,参数越接近,芯片自动根据相似度,对识别结果进行打分,训练模板中存储的语音信号的周期为2S,另一个训练模板中存储的语音信号数据的周期为1S,当输入的语音信号经过特征提取后周期为1.8S,则芯片自动判断,此输入信号与对应周期为2S的语音信号更为接近,根据比例计算得分,同理比较初相位等其他参数,最终总分之和越高,以此类推,找出得分最高的关键词语作为识别结果输出。
根据语音识别芯片的识别结果,即判断是否符合数据库中的关键词,单片机会根据语音芯片的识别结果输出不同状态的逻辑电平信号,即满足数据库中的关键词,单片机输出电平信号,不满足时输出相反逻辑的电平信号,(这里由用户在单片机的程序代码中进行自定义),单片机输出的电平信号来控制部件工作,其电平信号通过外部模块可以驱动无人机工作,进而实现整个系统的语音控制。比如当识别到包含“起飞”关键词语的语音信号,并经过语音芯片判断结果为正确,单片机输出电平信号驱动电机转动,无人机开始起飞,识别控制过程完成。
本系统非特定人语音识别技术的创新点在于抗噪声的语音识别,在语音的特征矢量参数上采用了基于“PNSC”的语音特征提取方法。目前常用的Mel尺度倒谱MFCC系数分析为安静环境中的语音提供了一个很好的语音特征表达,然而训练环境与识别环境的不匹配时,即使用纯净语音训练出的模型去识别带噪声语音时,其性能将急剧下降。谱压缩技术是一种能有效地减少模型训练和应用环境间失配的技术,该技术是用一个固定的压缩因子来压缩语音信号的功率谱,使训练与识别环境更加匹配,最终达到提高识别率的目的。采用同样的压缩因子,可能会过分压缩某些分量而同时轻微压缩另外一些分量。PNSC即一种基于感知的非均匀谱压缩技术,PNSC技术用根据各个频率点或频带特性来生成的不同压缩因子取代同一固定压缩因子压缩各个频率点或频带。本系统采用基于MFCC系数的算法并运用PSNC技术,在各种环境噪声下的识别效果如下表:
表1噪声环境下基于MFCC系数算法的识别率
如图2所示,使用上述系统对四旋翼飞行器进行控制的方法如下:
首先,打开电源模块(19)和四旋翼飞行器上的电源模块(22),等待飞行控制模块上的自检。
当看到串口转WIFI模块(10)上的指示灯黄绿间接闪烁,表明正常工作,等待发送AT指令。
当看到螺旋桨转了一下并且听到“唧唧”声,表明程序初始化成功且电机正常通电;
当看到四旋翼飞行器上的指示灯由红变绿,表明WIFI模块(14)正常工作,等待接收AT指令。
当完成这些准备工作,可以通过语音控制四旋翼飞行器。控制者可以对着麦克风发出命令:“起飞”、“着陆”、“向上”、“向下”“向左”、“向右”、“向前”、“向后”。语音识别模块(2)中的放大滤波单元(3)对该命令的电信号进行放大滤波,语音识别处理单元(4)进行命令匹配,若匹配成功,主控模块(6)向串口转WIFI模块(10),写入AT指令,分别为AT*REF=1,290718208(起飞)、AT*REF=1,290717696(着陆)、AT*PCMD=1,1,0,0,1036831949,0(向上)、AT*PCMD=1,1,0,0,-1110651699,0(向下)、AT*PCMD=1,1,-1110651699,0,0,0(向左)、AT*PCMD=1,1,1036831949,0,0,0(向右)、AT*PCMD=1,1,0,-1110651699,0,0(向前)、AT*PCMD=1,1,0,1036831949,0,0(向后);若匹配不成功,则指令无效。
WIFI接收模块(14)接收到该AT指令,然后传送到飞行控制MCU单元(17),此单元将指令信息转换为一组脉冲调制信号。
姿态调整单元(18)根据脉冲调制信号产生PWM波调制电机转速。“起飞”执行结果即四旋翼飞行器悬停在垂直距离起飞点1m处,然后对于“向上”、“向下”“向左”、“向右”、“向前”、“向后的命令,即有效执行一次,所处位置距离上次位置0.1m。
以四旋翼飞行器执行一次飞行动作为例。
接通电源模块,等待初始化完成;
对着麦克风说“起飞”,四旋翼飞行器启动,悬停在垂直距离起飞点1m左右;
对着麦克风说“向上”,四旋翼飞行器向上飞行0.1m左右;
对着麦克风说“向上”,四旋翼飞行器继续向上飞行0.1m左右;
对着麦克风说“向前”,四旋翼飞行器向前飞行0.1m左右;
对着减小PWM波输出,直至降落地面。
Claims (1)
1.一种基于非特定人语音识别的四旋翼飞行器控制系统,包括语音输入装置、语音识别模块、主控模块、串口转WIFI模块、WIFI接收模块、飞行控制模块、一号电源模块和二号电源模块,其特征在于:
所述语音输入装置、语音识别模块、主控模块、串口转WIFI模块和一号电源模块安装在操纵遥控器上,WIFI接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上;
所述语音输入装置为麦克风,语音识别模块将识别后的语音输入到主控模块,主控模块将语音信号输入串口转WIFI模块,串口转WIFI模块与四旋翼飞行器上的WIFI接受模块通过TCP/IP协议的网络连接,一号电源模块同时为语音输入装置、语音识别模块、主控模块、串口转WIFI模块供电;四旋翼飞行器的WIFI接收模块接收到语音信号后,将信号输入飞行控制模块,二号电源模块为WIFI接受模块和飞行控制模块供电;
所述语音输入装置将语音信号转化为50毫伏的电压信号,所述语音识别模块包含放大滤波单元、语音识别处理单元和中断信号输出单元,经麦克风转化后的电压信号经过放大滤波单元后,进入语音识别处理单元,通过与语音库进行对比模板进行匹配识别,进行判决,如果匹配成功,语音识别处理单元将会输出判决信号,判决信号进入中断信号输出单元,中断信号输出单元输出触发中断信号进入主控模块,语音识别模块以嵌入式微处理器为核心,采用LD332X系列语音识别芯片和控制电路,设计实现非特定语音控制系统;
所述主控模块接收语音识别模块输出的触发中断信号,中断接收单元开始接收触发中断信号,同时MCU单元通过串口输出单元向串口转WIFI模块发送AT指令;
所述串口转WIFI模块的串口接收单元接收到串口输出单元发出的AT指令,通过无线协议单元中的IEEE 802.11n WiFi协议进行转换,然后将AT指令通过AT指令发送单元进行发射;
所述WIFI接收模块包含AT指令接收单元,用于接收串口转WIFI模块发出的AT指令;
所述飞行控制模块,根据飞行控制模块I/O口管角发送的脉冲宽度调制信号,利用姿态控制算法得到四旋翼的四个电机的等效电压,通过改变飞行控制模块管角输出电压波形的占空比,进而改变其等效电压,使得每一个电机的转速不同,进而改变飞行姿态,进而实现对四旋翼飞行器的飞行姿态的控制;
所述一号电源模块和二号电源模块均包含电池单元和电平转换单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910148700.8A CN109979459A (zh) | 2019-02-28 | 2019-02-28 | 一种基于非特定人语音识别的四旋翼飞行器控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910148700.8A CN109979459A (zh) | 2019-02-28 | 2019-02-28 | 一种基于非特定人语音识别的四旋翼飞行器控制系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109979459A true CN109979459A (zh) | 2019-07-05 |
Family
ID=67077517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910148700.8A Pending CN109979459A (zh) | 2019-02-28 | 2019-02-28 | 一种基于非特定人语音识别的四旋翼飞行器控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109979459A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110125503A1 (en) * | 2009-11-24 | 2011-05-26 | Honeywell International Inc. | Methods and systems for utilizing voice commands onboard an aircraft |
CN202217495U (zh) * | 2011-10-09 | 2012-05-09 | 马骏 | 嵌入式语音识别系统 |
CN102799188A (zh) * | 2012-08-09 | 2012-11-28 | 北京理工大学 | 一种基于双音多频信号的四旋翼飞行器控制系统及方法 |
CN104238561A (zh) * | 2013-06-13 | 2014-12-24 | 昊翔电能运动科技(昆山)有限公司 | 遥控系统及其飞行器控制系统 |
CN204619374U (zh) * | 2015-04-14 | 2015-09-09 | 王丽芸 | 利用语音控制的遥控多轴飞行器玩具 |
CN204945801U (zh) * | 2015-08-24 | 2016-01-06 | 深圳市天启航空科技有限公司 | 一种基于语音控制的飞行器控制系统 |
CN105620737A (zh) * | 2016-02-26 | 2016-06-01 | 厦门大学嘉庚学院 | 用于直升型飞行器的语音遥控系统及直升型遥控飞行器 |
CN105679322A (zh) * | 2016-03-29 | 2016-06-15 | 普宙飞行器科技(深圳)有限公司 | 一种基于机载语音操控的无人机系统及控制方法 |
CN205391741U (zh) * | 2016-02-26 | 2016-07-27 | 汕头市亨迪实业有限公司 | 一种语音遥控玩具飞行器 |
CN105818983A (zh) * | 2016-03-18 | 2016-08-03 | 普宙飞行器科技(深圳)有限公司 | 无人机的操控方法及无人机系统 |
CN205837219U (zh) * | 2016-07-20 | 2016-12-28 | 天津津宇凯创航空科技发展有限公司 | 一种多功能航拍飞行器 |
CN108172221A (zh) * | 2016-12-07 | 2018-06-15 | 广州亿航智能技术有限公司 | 基于智能终端的操控飞行器的方法和装置 |
-
2019
- 2019-02-28 CN CN201910148700.8A patent/CN109979459A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110125503A1 (en) * | 2009-11-24 | 2011-05-26 | Honeywell International Inc. | Methods and systems for utilizing voice commands onboard an aircraft |
CN202217495U (zh) * | 2011-10-09 | 2012-05-09 | 马骏 | 嵌入式语音识别系统 |
CN102799188A (zh) * | 2012-08-09 | 2012-11-28 | 北京理工大学 | 一种基于双音多频信号的四旋翼飞行器控制系统及方法 |
CN104238561A (zh) * | 2013-06-13 | 2014-12-24 | 昊翔电能运动科技(昆山)有限公司 | 遥控系统及其飞行器控制系统 |
CN204619374U (zh) * | 2015-04-14 | 2015-09-09 | 王丽芸 | 利用语音控制的遥控多轴飞行器玩具 |
CN204945801U (zh) * | 2015-08-24 | 2016-01-06 | 深圳市天启航空科技有限公司 | 一种基于语音控制的飞行器控制系统 |
CN105620737A (zh) * | 2016-02-26 | 2016-06-01 | 厦门大学嘉庚学院 | 用于直升型飞行器的语音遥控系统及直升型遥控飞行器 |
CN205391741U (zh) * | 2016-02-26 | 2016-07-27 | 汕头市亨迪实业有限公司 | 一种语音遥控玩具飞行器 |
CN105818983A (zh) * | 2016-03-18 | 2016-08-03 | 普宙飞行器科技(深圳)有限公司 | 无人机的操控方法及无人机系统 |
CN105679322A (zh) * | 2016-03-29 | 2016-06-15 | 普宙飞行器科技(深圳)有限公司 | 一种基于机载语音操控的无人机系统及控制方法 |
CN205837219U (zh) * | 2016-07-20 | 2016-12-28 | 天津津宇凯创航空科技发展有限公司 | 一种多功能航拍飞行器 |
CN108172221A (zh) * | 2016-12-07 | 2018-06-15 | 广州亿航智能技术有限公司 | 基于智能终端的操控飞行器的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104570835B (zh) | 飞机驾驶舱语音指令控制系统及其操作方法 | |
CN106985137B (zh) | 用于智能机器人的多模态交互方法及系统 | |
CN108108340A (zh) | 用于智能机器人的对话交互方法及系统 | |
CN109830235B (zh) | 语音控制方法、装置、车载控制设备和车辆 | |
CN203300127U (zh) | 儿童教学监护机器人 | |
CN107220292A (zh) | 智能对话装置、反馈式智能语音控制系统及方法 | |
CN104200805B (zh) | 汽车驾驶员语音助手 | |
CN105919591A (zh) | 一种基于表面肌电信号的手语识别发声系统及方法 | |
CN102233191A (zh) | 一种兼有语音控制功能的航模 | |
CN106847281A (zh) | 基于语音模糊识别技术的智能家居语音控制系统及方法 | |
CN109243462A (zh) | 一种语音唤醒方法及装置 | |
CN105807925A (zh) | 一种基于柔性电子皮肤的唇语识别系统及方法 | |
CN113253750B (zh) | 一种面向扑翼飞行器的多模态控制系统 | |
CN108172221A (zh) | 基于智能终端的操控飞行器的方法和装置 | |
EP3493201B1 (en) | Information processing device, information processing method, and computer program | |
CN112542156A (zh) | 基于声纹识别和语音指令控制的民航维修工卡系统 | |
CN107762948A (zh) | 一种风扇装置送风方法及风扇装置 | |
CN109979459A (zh) | 一种基于非特定人语音识别的四旋翼飞行器控制系统 | |
Hasan et al. | Implementation of speech recognition home control system using Arduino | |
CN208256287U (zh) | 基于语音识别的控制装置和智能家居设备 | |
CN1538340A (zh) | 基于脑电信号的虚拟键盘和机器人控制系统 | |
CN209607230U (zh) | 一种智能双向手语翻译装置 | |
Manssor et al. | Controlling home devices for handicapped people via voice command techniques | |
WO2023102889A1 (zh) | 语音交互的方法和装置 | |
CN210222569U (zh) | 一种无人机控制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190705 |
|
RJ01 | Rejection of invention patent application after publication |