CN111968411A - 一种基于语音识别的无人机蜂群调度系统及方法 - Google Patents
一种基于语音识别的无人机蜂群调度系统及方法 Download PDFInfo
- Publication number
- CN111968411A CN111968411A CN202010835971.3A CN202010835971A CN111968411A CN 111968411 A CN111968411 A CN 111968411A CN 202010835971 A CN202010835971 A CN 202010835971A CN 111968411 A CN111968411 A CN 111968411A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- unmanned aerial
- aerial vehicle
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000005540 biological transmission Effects 0.000 claims abstract description 23
- 230000003321 amplification Effects 0.000 claims abstract description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 17
- 230000000875 corresponding effect Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 claims description 6
- 101150102866 adc1 gene Proteins 0.000 claims description 6
- 239000003381 stabilizer Substances 0.000 claims description 4
- 230000000087 stabilizing effect Effects 0.000 claims description 4
- 101000823089 Equus caballus Alpha-1-antiproteinase 1 Proteins 0.000 claims description 3
- 101000651211 Homo sapiens Transcription factor PU.1 Proteins 0.000 claims description 3
- 102100027654 Transcription factor PU.1 Human genes 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 229910003460 diamond Inorganic materials 0.000 claims description 3
- 239000010432 diamond Substances 0.000 claims description 3
- 238000010845 search algorithm Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000010606 normalization Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000003068 static effect Effects 0.000 description 4
- 238000009432 framing Methods 0.000 description 3
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229910052744 lithium Inorganic materials 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0047—Navigation or guidance aids for a single aircraft
- G08G5/0069—Navigation or guidance aids for a single aircraft specially adapted for an unmanned aircraft
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
- G08C17/02—Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Remote Sensing (AREA)
- Aviation & Aerospace Engineering (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明一种基于语音识别的无人机蜂群调度系统及方法属于无人机蜂群的远程控制领域,是涉及基于语音识别进行操控的无人机控制技术,具体涉及一种基于语音识别的无人机蜂群调度系统及方法,包括如下模块:语音信号采集放大模块,用于语音信号的采集和记录以及对语音信息进行预处理;LCD显示模块,用于显示经过语音识别处理后的控制指令信息、对应的控制指令编码以及传输结果;语音识别算法模块;本发明通过远程控制的方式,将语音信息并转换为指令编码,实现对无人机的远程控制;在特征匹配算法中,采用了改进的动态时间归整,减少识别时间,提高了语音识别准确率,以及降低了因为停顿导致的搜索路径的延时。
Description
技术领域
本发明属于无人机蜂群的远程控制领域,是涉及基于语音识别进行操控的无人机控制技术,具体涉及一种基于语音识别的无人机蜂群调度系统及方法。
背景技术
无人机蜂群技术的实质就是无人机大规模编组飞行,地面信号站对无人机蜂群进行管理控制,将构建统一作战场景、编队控制与调整、根据需要在短时间内将编队协同传达至蜂群网络中,这是目前国内外无人机领域中一个重要的探索方向。据专家介绍,无人机蜂群技术在军事领域的应用价值巨大,一旦技术成熟,将深刻改变现有的战场规则。
在传统中,主要通过利用操作杆实现对无人机的飞行控制,以及一架无人机对应一个操作杆,且需要经过操作培训,存在着操作复杂以及培训时间久等问题,以及对装备的携带上存在着一定的不便。
发明内容
本发明的目的是解决上述现有无人机蜂群协同技术的不足,提供一种基于语音识别的无人机蜂群调度系统及方法,增加了无人机蜂群协同的方便性和一致性。
本发明一种基于语音识别的无人机蜂群调度系统,包括如下模块:
语音信号采集放大模块,用于语音信号的采集和记录以及对语音信息进行预处理;
LCD显示模块,用于显示经过语音识别处理后的控制指令信息、对应的控制指令编码以及传输结果;
语音识别算法模块,用于对预处理后的语音信息进行特征提取,并进行匹配识别,所述语音识别算法模块包括相连的语音接收模块和语音特征提取匹配模块;
无线射频传输模块,用于发送向无人机蜂群发送根据识别后的语音信息得到的控制指令,并向语音识别算法模块传输动作结果;
外置存储模块,用于存储语音模板,该语音模板为经过训练得到的语音特征参数;
无人机蜂群主控调度模块,用于在接受到控制指令后实现无人机蜂群按照控制指令指引完成不同的动作和控制,并通过无线射频传输模块向语音识别算法模块反馈动作结果;
供电模块,用于提供电源;
所述语音信号采集放大模块、LCD显示模块、供电模块及外置存储模块均与语音识别算法模块相连,所述无人机蜂群主控调度模块通过无线射频传输模块与语音识别算法模块相连;
所述语音接收模块与所述语音信号采集放大模块相连,所述语音特征提取匹配模块与语音识别算法模块相连。
优选地,语音信号采集放大模块包括音频采样装置通过偏置电路连接有运算放大器,所述运算放大器与所述语音识别算法模块相连。
优选地,音频采样装置为AT9912麦克风,所述运算放大器为运放MCP601。
优选地,LCD显示模块包括ili9320芯片和LCD显示器,所述LCD显示器通过ili9320芯片与语音识别算法模块相连。
优选地,语音识别算法模块为STM32F407处理器,STM32F407处理器的FSMC接口与ili9320芯片相连,STM32F407处理器的ADC1接口与语音信号采集放大模块的运算放大器相连,STM32F407处理器的SPI1接口与无线射频传输模块相连,STM32F407处理器内还设置有一内部存储器,所述内部存储器与所述外置存储模块相连。
优选地,无线射频传输模块为nRF24L01无线收发器。
优选地,外置存储模块为NANDFLASH存储器。
优选地,供电模块为电源,所述电源通过相连的稳压器和稳压二极管与语音识别算法模块相连。
优选地,无人机蜂群主控调度模块为STM32F3控制器。
一种基于语音识别的无人机蜂群调度方法,利用一种基于语音识别的无人机蜂群调度系统实现,所述方法如下:
指挥员通过音频采样装置采集语音信息,经过运算放大器后,再将语音信息转化为数字信号,并输入至语音识别算法模块中,通过对语音信号进行预加重、分帧加窗和端点检测完语音信息预处理,并通过梅尔频率倒谱系数完成提取该指挥员语音特征的提取,将特征提取结果与外置储存模块中存储的语音模板进行匹配;当所提取的特征与外置储存模块中预储存的语音模板相匹配,则该匹配的语音模板为获得的指挥员语音指令,并在语音识别算法模块中对获得的指挥员语音指令进行对应编号,并将所得到的指令编号发送至无人机蜂群主控调度模块中,无人机蜂群主控调度模块接收到指令编号完成相应的动作;
语音信息的特征提取,在训练阶段将语音特征参数存储于外置存储模块,形成语音特征参数模板库;
当指挥者在输出指令信息时,语音信息经过预处理、特征提取后,将指令信息特征参数与模板库中语音特征参数实现匹配,实现对语音信息的识别;
预先根据制定的语音指令编号规则,在语音识别算法模块中利用代码将经过识别后的语音指令转换对应的指令编号;
整个过程中,LCD显示模块显示获取后的语音信息和指令、显示无人机反馈结果,以及显示指令是否发送接收成功;
其中,将特征提取结果与外置储存模块中预存储的语音模板进行匹配时,由于在匹配路径计算过程中存在许多无用数据,基于DTW的原理上,根据人语语速一定的特性,首先将搜索范围限定为最大斜率和最小斜率分别为2和0.5的菱形范围内,然后在此基础上松弛起点终点,具体为:固定起终点的范围,在对起点赋值,判断是否处于有效范围,如果处于有效范围,则根据欧式距离公式计算误差,选择最小误差,计算累计误差,结合DTW路径搜索算法获得误差最小的路径,即匹配成功。
本发明的有益效果主要体现在:
本发明通过远程控制的方式,将语音信息并转换为指令编码,实现对无人机的远程控制;在特征匹配算法中,采用了改进的动态时间归整,减少识别时间,提高了语音识别准确率,以及降低了因为停顿导致的搜索路径的延时。
本发明还具有如下有益效果:1.显示了语音指令信息和无人机蜂群反馈信息;2、单独的语音模板存储空间,MFCC特征向量可大量存储;3、STM32F407中内置的FPU,使得特征提取算法避免经历浮点定点化处理使其精度降低。
附图说明
图1是本发明语音识别流程图。
图2是本发明的系统流程图。
图3为语音信息采集放大电路。
图4为ili9320芯片与STM32F407处理器连接示意图。
图5为nRF24L01无线收发器连接示意图。
图6为供电模块电压转换电路示意图。
图7为STM32F407处理器内外部连接示意图。
图8为固定起终点搜索路径至松弛起终点搜索路径示意图。
具体实施方式
本发明一种基于语音识别的无人机蜂群调度系统,包括如下模块:
语音信号采集放大模块,用于语音信号的采集和记录以及对语音信息进行预处理;
LCD显示模块,用于显示经过语音识别处理后的控制指令信息、对应的控制指令编码以及传输结果;
语音识别算法模块,用于对预处理后的语音信息进行特征提取,并进行匹配识别,所述语音识别算法模块包括相连的语音接收模块和语音特征提取匹配模块;
无线射频传输模块,用于发送向无人机蜂群发送根据识别后的语音信息得到的控制指令,并向语音识别算法模块传输动作结果;
外置存储模块,用于存储语音模板,该语音模板为经过训练得到的语音特征参数;
无人机蜂群主控调度模块,用于在接受到控制指令后实现无人机蜂群按照控制指令指引完成不同的动作和控制,并通过无线射频传输模块向语音识别算法模块反馈动作结果;
供电模块,用于提供电源;
所述语音信号采集放大模块、LCD显示模块、供电模块及外置存储模块均与语音识别算法模块相连,所述无人机蜂群主控调度模块通过无线射频传输模块与语音识别算法模块相连;
所述语音接收模块与所述语音信号采集放大模块相连,所述语音特征提取匹配模块与语音识别算法模块相连。
语音信号采集放大模块包括音频采样装置通过偏置电路连接有运算放大器,所述运算放大器与所述语音识别算法模块相连。
音频采样装置为AT9912麦克风,所述运算放大器为运放MCP601。使用时,对麦克风添加一个直流偏置电压电路,使得麦克风中的半导体器件MOSFEI工作,达到时而断开时而连通,输出电压通过运放MCP601,实现对电路电压的放大,将放大电压输入至STM32F407处理器的ADC1实现模数转换。该过程放大背时约50被,由最初输出电压50mV,至2.5V。
LCD显示模块包括ili9320芯片和LCD显示器,所述LCD显示器通过ili9320芯片与语音识别算法模块相连,如图4所示。LCD显示器由3.2寸320*240分辨率的LCD组成,将语音识别结果通过ili9320芯片控制LCD画面输出。
语音识别算法模块为STM32F407处理器,STM32F407处理器的FSMC接口与ili9320芯片相连,STM32F407处理器的ADC1接口与语音信号采集放大模块的运算放大器相连,STM32F407处理器的SPI1接口与无线射频传输模块相连,STM32F407处理器内还设置有一内部存储器,所述内部存储器与所述外置存储模块相连。使用时,512KB的FLASH外接256MB的NANDFLASH,内部FLASH中运行代码。
无线射频传输模块为nRF24L01无线收发器,发送端对发送队列TX FIFO中存放的数据以2Mbps的速率发送出去,接收端在规定频段中搜索有效信号,将有效数据存放至接收队列RX FIFO。
外置存储模块为NANDFLASH存储器,用来存放MFCC特征参数组。
供电模块为电源,所述电源通过相连的稳压器和稳压二极管与语音识别算法模块相连。
无人机蜂群主控调度模块为STM32F3控制器。
一种基于语音识别的无人机蜂群调度方法,利用一种基于语音识别的无人机蜂群调度系统实现,所述方法如下:
指挥员通过音频采样装置采集语音信息,经过运算放大器后,再将语音信息转化为数字信号,具体通过STM32F407处理器的ADC1实现,并输入至语音识别算法模块中,通过对语音信号进行预加重、分帧加窗和端点检测完语音信息预处理,并通过梅尔频率倒谱系数完成提取该指挥员语音特征的提取,将特征提取结果与外置储存模块中存储的语音模板进行匹配;当所提取的特征与外置储存模块中预储存的语音模板相匹配,则该匹配的语音模板为获得的指挥员语音指令,并在语音识别算法模块中对获得的指挥员语音指令进行对应编号,并将所得到的指令编号发送至无人机蜂群主控调度模块中,无人机蜂群主控调度模块接收到指令编号完成相应的动作;
语音信息的特征提取,在训练阶段将语音特征参数存储于外置存储模块,形成语音特征参数模板库;
当指挥者在输出指令信息时,语音信息经过预处理、特征提取后,将指令信息特征参数与模板库中语音特征参数实现匹配,实现对语音信息的识别;
预先根据制定的语音指令编号规则,在语音识别算法模块中利用代码将经过识别后的语音指令转换对应的指令编号;
整个过程中,LCD显示模块显示获取后的语音信息和指令、显示无人机反馈结果,以及显示指令是否发送接收成功;
其中,将特征提取结果与外置储存模块中预存储的语音模板进行匹配时,由于在匹配路径计算过程中存在许多无用数据,基于DTW的原理上,根据人语语速一定的特性,首先将搜索范围限定为最大斜率和最小斜率分别为2和0.5的菱形范围内,然后在此基础上松弛起点终点,具体为:固定起终点的范围,在对起点赋值,判断是否处于有效范围,如果处于有效范围,则根据欧式距离公式计算误差,选择最小误差,计算累计误差,结合DTW路径搜索算法获得误差最小的路径,即匹配成功。
供电模块据系统运行需要地面采用5V、3500mA锂电池,其中+3.3V用于对STM32F407、nRF24L01、LCD实现供电,如图6所示,利用稳压器LM1117-3.3以及在输入和输出端增加0.1入 0.1uf+10uf 电容滤波以保证系统稳定性;对于处理器中ADC1供电,利用稳压二极管LM336将5V电压控制在2.5V。
实施例一
图1为一种基于语音识别的无人机蜂群调度系统中语音识别算法流程图。其中包括语音信号采集放大模块、语音识别算法模块,实现对指挥员语音信息的获取和识别。
指挥员所处环境可能存在一定的环境噪音,或者嘈杂声,对于无人机的指令控制存在干扰,因此通过语音信号采集放大模块事先采集指挥员声音信息,如音调、音色等;再通过语音识别算法模块进行语音的预处理消除信号的混叠、高次谐波失真、高频等对语音信号质量的影响以及保证后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,提高语音处理质量。
语音特征提取匹配模块根据提取得到后的有效的语音信号,进行梅尔频率倒谱系数提取该指挥员语音特征信息。梅尔频率倒谱系数提取过程主要经过预加重,分帧,加窗函数,FFT运算,Mel频率滤波器组滤波,取对数能量,离散余弦转换DCT求倒谱。在特征匹配中采用了基于动态时间归整DTW,对搜索路径采用松弛起终点法的改进算法,减少了开始语音输入时算法对一些噪音的处理,所以降低了识别时间。
通过上述过程,完成了对操作语音信息的特征提取,并存放至外置储存模块中,方便本发明使用时根据特征参数完成语音识别。
图2是一种基于语音识别的无人机蜂群调度系统流程图。其中包括语音信号采集放大模块、LCD显示模块、无线射频传输模块、供电模块、语音识别算法模块、外置存储模块、无人机蜂群主控调度模块。
指挥员通过麦克风采集语音信息,在语音识别算法模块中对指挥员的语音信息进行语音识别,将得出的语音指令转化成对应的编号,再将指令编号保存至无线射频传输模块中发送队列TX FIFO,存放完毕后再发送至无人机上的无人机蜂群主控调度模块;无人机中无线射频传输模块将搜索接收到的指令信息存储至接收队列RX FIFO。领头无人机将获取的指令经过无人机蜂群主控调度模块STM32F3做出处理,控制无人机蜂群完成相关动作,同时无人机蜂群主控调度模块STM32F3通过无线射频传输模块将信息结果反馈至语音识别算法模块并通过LCD显示模块显示,其中无人机蜂群主控调度模块STM32F3中预先写入每种指令对应无人机蜂群的动作。整个过程中,LCD显示模块显示获取后的语音信息和指令、显示无人机反馈结果,以及显示指令是否发送接收成功;供电模块主要采用5V、3500mA锂电池。
所述语音指令有静态和动态相结合的形式和固定指令形式,静态为飞机固定动作,主要动作参数:上升、下降、左急转弯盘旋、右急转弯盘旋、S型转弯、眼镜蛇机动、筋斗机动、返航、共计等100种指令,动态为飞机编号,如:001号、002号等,固定指令为预先写好的包含各个飞机动作的作战模式,如作战模式1等。
在指挥调度中采用静态与动态结合以及固定指令规则,动静结合指挥口令格式为:无人机编号+动作指令,如:001号上升;固定指令口令格式为:作战模式+编号,如作战模式1等。通过拆分识别指令,将指令词汇大大的降低,也降低了计算机检索量,同时也可以根据训练内容的不同,加载删除不同的指令。
综上所述,本发明的一种基于语音识别的无人机蜂群调度方法通过语音信息实现了对无人机蜂群的直接控制,解决了传统中操作复杂的特点,同时根据对算法的改进和调度控制的规则的改进,降低了识别的时间和提高了精度。
Claims (10)
1.一种基于语音识别的无人机蜂群调度系统,其特征在于,包括如下模块:
语音信号采集放大模块,用于语音信号的采集和记录以及对语音信息进行预处理;
LCD显示模块,用于显示经过语音识别处理后的控制指令信息、对应的控制指令编码以及传输结果;
语音识别算法模块,用于对预处理后的语音信息进行特征提取,并进行匹配识别,所述语音识别算法模块包括相连的语音接收模块和语音特征提取匹配模块;
无线射频传输模块,用于发送向无人机蜂群发送根据识别后的语音信息得到的控制指令,并向语音识别算法模块传输动作结果;
外置存储模块,用于存储语音模板,该语音模板为经过训练得到的语音特征参数;
无人机蜂群主控调度模块,用于在接受到控制指令后实现无人机蜂群按照控制指令指引完成不同的动作和控制,并通过无线射频传输模块向语音识别算法模块反馈动作结果;
供电模块,用于提供电源;
所述语音信号采集放大模块、LCD显示模块、供电模块及外置存储模块均与语音识别算法模块相连,所述无人机蜂群主控调度模块通过无线射频传输模块与语音识别算法模块相连;
所述语音接收模块与所述语音信号采集放大模块相连,所述语音特征提取匹配模块与语音识别算法模块相连。
2.如权利要求1所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述语音信号采集放大模块包括音频采样装置通过偏置电路连接有运算放大器,所述运算放大器与所述语音识别算法模块相连。
3.如权利要求2所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述音频采样装置为AT9912麦克风,所述 为运放MCP601。
4.如权利要求2所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述LCD显示模块包括ili9320芯片和LCD显示器,所述LCD显示器通过ili9320芯片与语音识别算法模块相连。
5.如权利要求4所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述语音识别算法模块为STM32F407处理器,STM32F407处理器的FSMC接口与ili9320芯片相连,STM32F407处理器的ADC1接口与语音信号采集放大模块的运算放大器相连,STM32F407处理器的SPI1接口与无线射频传输模块相连,STM32F407处理器内还设置有一内部存储器,所述内部存储器与所述外置存储模块相连。
6.如权利要求5所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述无线射频传输模块为nRF24L01无线收发器。
7.如权利要求6所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述外置存储模块为NANDFLASH存储器。
8.如权利要求7所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述供电模块为电源,所述电源通过相连的稳压器和稳压二极管与语音识别算法模块相连。
9.如权利要求8所述一种基于语音识别的无人机蜂群调度系统,其特征在于,所述无人机蜂群主控调度模块为STM32F3控制器。
10.一种基于语音识别的无人机蜂群调度方法,其特征在于,利用如权利要求2-9任意一项所述一种基于语音识别的无人机蜂群调度系统实现,所述方法如下:
指挥员通过音频采样装置采集语音信息,经过运算放大器后,再将语音信息转化为数字信号,并输入至语音识别算法模块中,通过对语音信号进行预加重、分帧加窗和端点检测完语音信息预处理,并通过梅尔频率倒谱系数完成提取该指挥员语音特征的提取,将特征提取结果与外置储存模块中存储的语音模板进行匹配,当所提取的特征与外置储存模块中预储存的语音模板相匹配,则该匹配的语音模板为获得的指挥员语音指令,并在语音识别算法模块中对获得的指挥员语音指令进行对应编号,并将所得到的指令编号发送至无人机蜂群主控调度模块中,无人机蜂群主控调度模块接收到指令编号完成相应的动作;
整个过程中,LCD显示模块显示获取后的语音信息和指令、显示无人机反馈结果,以及显示指令是否发送接收成功;
其中,将特征提取结果与外置储存模块中预存储的语音模板进行匹配时,由于在匹配路径计算过程中存在许多无用数据,基于DTW的原理上,根据人语语速一定的特性,首先将搜索范围限定为最大斜率和最小斜率分别为2和0.5的菱形范围内,然后在此基础上松弛起点终点,具体为:固定起终点的范围,在对起点赋值,判断是否处于有效范围,如果处于有效范围,则根据欧式距离公式计算误差,选择最小误差,计算累计误差,结合DTW路径搜索算法获得误差最小的路径,即匹配成功。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010835971.3A CN111968411A (zh) | 2020-08-19 | 2020-08-19 | 一种基于语音识别的无人机蜂群调度系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010835971.3A CN111968411A (zh) | 2020-08-19 | 2020-08-19 | 一种基于语音识别的无人机蜂群调度系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111968411A true CN111968411A (zh) | 2020-11-20 |
Family
ID=73388558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010835971.3A Pending CN111968411A (zh) | 2020-08-19 | 2020-08-19 | 一种基于语音识别的无人机蜂群调度系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111968411A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113031649A (zh) * | 2021-02-26 | 2021-06-25 | 苏州臻迪智能科技有限公司 | 无人机控制方法、装置和控制设备 |
CN115910024A (zh) * | 2022-12-08 | 2023-04-04 | 广州赛灵力科技有限公司 | 一种语音清洗及合成方法、系统、装置及存储介质 |
-
2020
- 2020-08-19 CN CN202010835971.3A patent/CN111968411A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113031649A (zh) * | 2021-02-26 | 2021-06-25 | 苏州臻迪智能科技有限公司 | 无人机控制方法、装置和控制设备 |
CN115910024A (zh) * | 2022-12-08 | 2023-04-04 | 广州赛灵力科技有限公司 | 一种语音清洗及合成方法、系统、装置及存储介质 |
CN115910024B (zh) * | 2022-12-08 | 2023-08-29 | 广州赛灵力科技有限公司 | 一种语音清洗及合成方法、系统、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11620983B2 (en) | Speech recognition method, device, and computer-readable storage medium | |
US8223589B2 (en) | Gesture recognition apparatus and method | |
CN111968411A (zh) | 一种基于语音识别的无人机蜂群调度系统及方法 | |
US11340281B2 (en) | Method of measuring electromagnetic signal and electronic device therefor | |
CN105679322B (zh) | 一种基于机载语音操控的无人机系统及控制方法 | |
CN101345819B (zh) | 一种用于机顶盒的语音控制系统 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN104570835A (zh) | 飞机驾驶舱语音指令控制系统及其操作方法 | |
CN101923857A (zh) | 一种人机交互的可扩展语音识别方法 | |
CN103914149A (zh) | 一种面向互动电视的手势交互方法和系统 | |
CN111145746A (zh) | 一种基于人工智能语音的人机交互方法 | |
CN112542156A (zh) | 基于声纹识别和语音指令控制的民航维修工卡系统 | |
CN213183114U (zh) | 一种基于语音识别的无人机蜂群调度系统 | |
CN111695763B (zh) | 一种基于语音问答的排产排程系统及方法 | |
CN113259793B (zh) | 智能麦克风及其信号处理方法 | |
CN112420063A (zh) | 一种语音增强方法和装置 | |
CN116129942A (zh) | 语音交互设备和语音交互方法 | |
CN114664303A (zh) | 连续语音指令快速识别控制系统 | |
CN209402679U (zh) | 拾音组件和系统 | |
CN110809796A (zh) | 具有解耦唤醒短语的语音识别系统和方法 | |
CN202939967U (zh) | 智能蓝光播放机 | |
CN208520985U (zh) | 一种基于多麦克风阵列的声源定位系统 | |
CN218585629U (zh) | 一种基于监测样品管理的智能语音调度系统 | |
CN220604328U (zh) | 数字语音信号处理系统 | |
CN212061865U (zh) | 基于自适应语音增强的声纹识别装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |