CN112242138A - 一种无人平台语音控制方法 - Google Patents

一种无人平台语音控制方法 Download PDF

Info

Publication number
CN112242138A
CN112242138A CN202011351838.7A CN202011351838A CN112242138A CN 112242138 A CN112242138 A CN 112242138A CN 202011351838 A CN202011351838 A CN 202011351838A CN 112242138 A CN112242138 A CN 112242138A
Authority
CN
China
Prior art keywords
voice
signal
control
unmanned platform
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011351838.7A
Other languages
English (en)
Inventor
任国全
唐香珺
王怀光
范红波
李晓磊
周景涛
吴定海
曹凤利
韩兰懿
张云强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN202011351838.7A priority Critical patent/CN112242138A/zh
Publication of CN112242138A publication Critical patent/CN112242138A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明公开了一种无人平台语音控制方法,所述方法具体如下:第一步,构建语音识别控制系统,第二步,语音信号采集,通过语音输入模块获得时间和幅度上均为离散的数字语音信号;第三步,信号预处理,SPCE061A控制板将采集的数字语音信号进行预处理,首先进行端点检测,其用来检测输入声音信号中的有效语音成分,屏蔽静音部分和获取语音开始与结束点;接着将完成端点检测后的数据通过预加重处理;第四步,特征提取,第五步,信号识别,本发明的无人平台语音控制方法,通过构建基于语音识别技术的无人平台遥控系统,实现无人平台的语音识别与遥控功能,对于无人平台,能够通过语音命令对其行驶状态进行控制,实现语音识别遥控。

Description

一种无人平台语音控制方法
技术领域
本发明涉及一种无人平台控制系统,具体涉及一种无人平台语音控制方法,属于无人平台控制系统技术领域。
背景技术
在民用领域,无人驾驶车辆作为智能交通系统的重要组成部分,将为人们的出行安全提供便利;在国防安全领域,无人平台能代替人在高危环境下完成各种任务,在保存有生力量、提高作战效能方面具有重要意义,是无人作战系统的重要基础;在无人平台的使用过程中,由于工作环境的复杂性和变化性,目前仍无法完全自主地完成任务,需要操作者通过遥控技术完成无人平台的运动规划。随着科技水平的不断发展,传统的接触式遥控方式在无人平台遥控中逐渐不能满足需求,由此产生了一些非接触式遥控方式越来越多被人们所使用,如手势、语音、眼动及脑电等遥控方式;语言作为人与人之间进行信息沟通的最主要方式,可为人机交互使用时提供其它方式不可替代的直接和便利;语音识别技术是人机交互技术的一种,它让计算机识别并理解人类语音所代表的含义;目前,无人平台的遥控主要以传统接触式遥控为主,其控制方式比较单一。
发明内容
为解决上述问题,本发明提出了一种无人平台语音控制方法,对于无人平台,能够通过语音命令对其行驶状态进行控制,实现语音识别遥控。
本发明的无人平台语音控制方法,通过麦克风进行语音信号采集,经过语音信号数字化和预加重预处理,再经过特定算法提取语音信号的特征参数,训练形成语音模板库,最后选择计算量相对较小并且模板训练算法简单的DTW进行信号识别匹配,从而控制无人平台实现预定的运动轨迹,既可以实现小车的前进、后退、左转、右转等功能,也可以在行走过程中声控改变小车运动状态,并在超出语音控制范围时能够自动停车;同时随着无人平台的实际运行,将实际运行轨迹反馈给语音操控端,通过语音操控使得无人平台能够按理想的轨迹运行;所述方法具体如下:
第一步,构建语音识别控制系统,所述语音识别控制系统包括SPCE061A控制板,及与SPCE061A控制板通信的语音控制电路板;所述SPCE061A控制板包括语音输入模块、按键输入模块和声音输出模块;所述语音控制电路板包括用于驱动电机的方向控制桥路和驱动控制桥路;所述方向控制桥路和驱动控制桥路分别通信连接方向电机和驱动电机;所述方向控制桥路和驱动控制桥路均为全桥驱动,其利用四个IO端口分为两组分别实现两个方向控制电机和驱动电机的正传、反转和停三态运行;
第二步,语音信号采集,通过语音输入模块获得时间和幅度上均为离散的数字语音信号;
第三步,信号预处理,SPCE061A控制板将采集的数字语音信号进行预处理,首先进行端点检测,其用来检测输入声音信号中的有效语音成分,屏蔽静音部分和获取语音开始与结束点;接着将完成端点检测后的数据通过预加重处理,其提升语音成分中的高频分量,还原原始语音信号;
第四步,特征提取,通过梅尔倒谱系数(MFCC)参数进行语音指令识别;并将预处理信号与MFCC参数提取工作放在采样间隔中进行;
第五步,信号识别,通过对上一步获得特征参数进行匹配,计算语音指令与语音模型库中的每一个模型的相似度,从而得到最佳的匹配结果。
进一步地,所述信号识别采用动态时间规整算法(DTW),根据特征参数提取得到的特征向量,将此特征向量组与模型库中已存在的语音特征向量组进行模型匹配,寻找相似度最高的一组。
进一步地,所述语音信号采集具体如下:由麦克风采集语音信号,将声波信号转换为电压信号,并通过信号放大电路将信号放大至合理区域后送入ADC进行采样;从而得到SPCE061A控制板能够处理的数字信号。
进一步地,所述预加重处理通过具有6dBoct地提升高频特性地预加重数字滤波器完成。
本发明与现有技术相比较,本发明的无人平台语音控制方法,通过构建基于语音识别技术的无人平台遥控系统,实现无人平台的语音识别与遥控功能,对于无人平台,能够通过语音命令对其行驶状态进行控制,实现语音识别遥控。
附图说明
图1是本发明的语音控制方法流程示意图。
图2是本发明的语音识别控制系统结构示意图。
图3是本发明的语音识别流程示意图。
图4是本发明的信号预处理的预加重结果示意图。
具体实施方式
实施例1:
如图1至图3所示的无人平台语音控制方法,通过麦克风进行语音信号采集,经过语音信号数字化和预加重预处理,再经过特定算法提取语音信号的特征参数,训练形成语音模板库,最后选择计算量相对较小并且模板训练算法简单的DTW进行信号识别匹配,从而控制无人平台实现预定的运动轨迹,既可以实现小车的前进、后退、左转、右转等功能,也可以在行走过程中声控改变小车运动状态,并在超出语音控制范围时能够自动停车;同时随着无人平台的实际运行,将实际运行轨迹反馈给语音操控端,通过语音操控使得无人平台能够按理想的轨迹运行;所述方法具体如下:
第一步,构建语音识别控制系统,所述语音识别控制系统包括SPCE061A控制板,及与SPCE061A控制板通信的语音控制电路板;所述SPCE061A控制板包括语音输入模块、按键输入模块和声音输出模块;所述语音控制电路板包括用于驱动电机的方向控制桥路和驱动控制桥路;所述方向控制桥路和驱动控制桥路分别通信连接方向电机和驱动电机;所述方向控制桥路和驱动控制桥路均为全桥驱动,其利用四个IO端口分为两组分别实现两个方向控制电机和驱动电机的正传、反转和停三态运行;
第二步,语音信号采集,通过语音输入模块获得时间和幅度上均为离散的数字语音信号;采样之后要对信号进行量化,信号与量化噪声的功率之比为量化信噪比;若用
Figure BDA0002801518930000043
表示输入语音信号序列的方差,2Xmax表示信号的峰值,B表示量化分辨率(量化位长),
Figure BDA0002801518930000042
表示噪声序列的方差,则量化信噪比为:
Figure BDA0002801518930000041
假设语音信号的幅度服从Laplacian分布,此时信号幅度超过4δx的概率很小,只有0.35%,因而可以取Xmax=4δx;此时上式变为SNR=6.02B-7.2,上式表明,量化器中每位字长对SNR贡献为6dB;当B=7位时,SNR=35dB;此时量化后的语音质量能满足一般通信系统的要求;研究表明:要使语音波形的动态变化信噪比达到55dB的信噪比,B应取10位以上;为了在语音信号变化范围内保持35dB的信噪比,常用12位来量化,其中附加的5位用于补偿30dB左右的输入动态范围变化;
第三步,信号预处理,SPCE061A控制板将采集的数字语音信号进行预处理,首先进行端点检测,其用来检测输入声音信号中的有效语音成分,屏蔽静音部分和获取语音开始与结束点;接着将完成端点检测后的数据通过预加重处理,其提升语音成分中的高频分量,还原原始语音信号;由于语音信号的平均功率谱受声门激励和鼻辐射的影响,在800Hz以上的高频时约按6dBoct衰减,为此要在预处理中进行预加重;预加重的目的是提升高频部分,使信号的频谱变得平坦,以便于进行声道参数分析或频谱分析;预加重在防混叠滤波与AD转换之前进行;这样,不仅能够进行预加重,而且可以压缩信号的动态范围,有效地提高信噪比;所以为尽量提高SNR应在AD转换之前进行预加重;同时,预加重也可在AD转换之后进行,用具有6dBoct地提升高频特性地预加重数字滤波器实现;它一般是一阶的,即:
Figure BDA0002801518930000051
式中u值接近于1,本发明中取为0.94;加重的信号在分析处理后,需要进行去加重处理,即加上6dBoct的下降的频率特性来还原成原来的特性;图4所示为对语音信号“0”的预加重处理结果;从下图可以明显的看出,加重后语音信号中高频分量增强。
第四步,特征提取,通过梅尔倒谱系数(MFCC)参数进行语音指令识别;并将预处理信号与MFCC参数提取工作放在采样间隔中进行;
第五步,信号识别,通过对上一步获得特征参数进行匹配,计算语音指令与语音模型库中的每一个模型的相似度,从而得到最佳的匹配结果;语音识别一般分为两个步骤,第一步是系统“学习”或“训练”阶段,这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型,即构建参考模式库,第二是“识别”或“测试”阶段,根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法分析出这种识别方法所需求的语音特征参数,按照一定的准则和测度与参考模式的模型进行比较,通过判决得出结果。
其中,所述信号识别采用动态时间规整算法(DTW),根据特征参数提取得到的特征向量,将此特征向量组与模型库中已存在的语音特征向量组进行模型匹配,寻找相似度最高的一组。所述语音信号采集具体如下:由麦克风采集语音信号,将声波信号转换为电压信号,并通过信号放大电路将信号放大至合理区域后送入ADC进行采样;从而得到SPCE061A控制板能够处理的数字信号。所述预加重处理通过具有6dBoct地提升高频特性地预加重数字滤波器完成。
上述实施例,仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

Claims (4)

1.一种无人平台语音控制方法,其特征在于:所述方法具体如下:
第一步,构建语音识别控制系统,所述语音识别控制系统包括SPCE061A控制板,及与SPCE061A控制板通信的语音控制电路板;所述SPCE061A控制板包括语音输入模块、按键输入模块和声音输出模块;所述语音控制电路板包括用于驱动电机的方向控制桥路和驱动控制桥路;所述方向控制桥路和驱动控制桥路分别通信连接方向电机和驱动电机;所述方向控制桥路和驱动控制桥路均为全桥驱动,其利用四个IO端口分为两组分别实现两个方向控制电机和驱动电机的正传、反转和停三态运行;
第二步,语音信号采集,通过语音输入模块获得时间和幅度上均为离散的数字语音信号;采样之后要对信号进行量化,信号与量化噪声的功率之比为量化信噪比;若用
Figure FDA0002801518920000011
表示输入语音信号序列的方差,2Xmax表示信号的峰值,B表示量化分辨率(量化位长),
Figure FDA0002801518920000012
表示噪声序列的方差,则量化信噪比为:
Figure FDA0002801518920000013
第三步,信号预处理,SPCE061A控制板将采集的数字语音信号进行预处理,首先进行端点检测,其用来检测输入声音信号中的有效语音成分,屏蔽静音部分和获取语音开始与结束点;接着将完成端点检测后的数据通过预加重处理,其提升语音成分中的高频分量,还原原始语音信号;
第四步,特征提取,通过梅尔倒谱系数(MFCC)参数进行语音指令识别;并将预处理信号与MFCC参数提取工作放在采样间隔中进行;
第五步,信号识别,通过对上一步获得特征参数进行匹配,计算语音指令与语音模型库中的每一个模型的相似度,从而得到最佳的匹配结果。
2.根据权利要求1所述的无人平台语音控制方法,其特征在于:所述信号识别采用动态时间规整算法(DTW),根据特征参数提取得到的特征向量,将此特征向量组与模型库中已存在的语音特征向量组进行模型匹配,寻找相似度最高的一组。
3.根据权利要求1所述的无人平台语音控制方法,其特征在于:所述语音信号采集具体如下:由麦克风采集语音信号,将声波信号转换为电压信号,并通过信号放大电路将信号放大至合理区域后送入ADC进行采样;从而得到SPCE061A控制板能够处理的数字信号。
4.根据权利要求1所述的无人平台语音控制方法,其特征在于:所述预加重处理通过具有6dBoct地提升高频特性地预加重数字滤波器完成。
CN202011351838.7A 2020-11-26 2020-11-26 一种无人平台语音控制方法 Pending CN112242138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011351838.7A CN112242138A (zh) 2020-11-26 2020-11-26 一种无人平台语音控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011351838.7A CN112242138A (zh) 2020-11-26 2020-11-26 一种无人平台语音控制方法

Publications (1)

Publication Number Publication Date
CN112242138A true CN112242138A (zh) 2021-01-19

Family

ID=74175402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011351838.7A Pending CN112242138A (zh) 2020-11-26 2020-11-26 一种无人平台语音控制方法

Country Status (1)

Country Link
CN (1) CN112242138A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202124017U (zh) * 2011-06-10 2012-01-25 沈阳君天科技股份有限公司 基于嵌入式系统的语音直接启动汽车与防盗的装置
CN103903612A (zh) * 2014-03-26 2014-07-02 浙江工业大学 一种实时语音识别数字的方法
US20150340027A1 (en) * 2013-03-29 2015-11-26 Boe Technology Group Co., Ltd. Voice recognition system
CN110288988A (zh) * 2019-05-16 2019-09-27 平安科技(深圳)有限公司 目标数据筛选方法、装置及存储介质
CN110341711A (zh) * 2019-07-06 2019-10-18 深圳数翔科技有限公司 一种基于码头环境的行驶轨迹生成系统及方法
CN110466539A (zh) * 2019-08-30 2019-11-19 西北农林科技大学 一种用于山地果园运输的太阳能遥控单轨运输车

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202124017U (zh) * 2011-06-10 2012-01-25 沈阳君天科技股份有限公司 基于嵌入式系统的语音直接启动汽车与防盗的装置
US20150340027A1 (en) * 2013-03-29 2015-11-26 Boe Technology Group Co., Ltd. Voice recognition system
CN103903612A (zh) * 2014-03-26 2014-07-02 浙江工业大学 一种实时语音识别数字的方法
CN110288988A (zh) * 2019-05-16 2019-09-27 平安科技(深圳)有限公司 目标数据筛选方法、装置及存储介质
CN110341711A (zh) * 2019-07-06 2019-10-18 深圳数翔科技有限公司 一种基于码头环境的行驶轨迹生成系统及方法
CN110466539A (zh) * 2019-08-30 2019-11-19 西北农林科技大学 一种用于山地果园运输的太阳能遥控单轨运输车

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
王森等: "《嵌入式非特定人声的车辆运动声控终端设计》", 《单片机与嵌入式系统应用》 *
袁霞: "《音控小车控制系统的研究》", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
银兵: "《基于μ"nSPTM处理器的嵌入式语音控制技术研究》", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Similar Documents

Publication Publication Date Title
CN110992987B (zh) 语音信号中针对通用特定语音的并联特征提取系统及方法
CN102298443B (zh) 结合视频通道的智能家居语音控制系统及其控制方法
US5596679A (en) Method and system for identifying spoken sounds in continuous speech by comparing classifier outputs
CN103065629A (zh) 一种仿人机器人的语音识别系统
CN202110564U (zh) 结合视频通道的智能家居语音控制系统
US5812973A (en) Method and system for recognizing a boundary between contiguous sounds for use with a speech recognition system
CN104008751A (zh) 一种基于bp神经网络的说话人识别方法
CN108461081B (zh) 语音控制的方法、装置、设备和存储介质
CN109961794B (zh) 一种基于模型聚类的提高说话人识别效率的方法
WO2023036017A1 (zh) 一种用于电网调度的语音识别方法及系统
CN103198829A (zh) 一种降低车内噪音提高语音识别率的方法、装置和设备
CN111326178A (zh) 基于卷积神经网络的多模态语音情感识别系统及方法
CN112017658A (zh) 一种基于智能人机交互的操作控制系统
CN112242138A (zh) 一种无人平台语音控制方法
CN117672201A (zh) 一种农机无人驾驶语音识别的控制系统
CN111968411A (zh) 一种基于语音识别的无人机蜂群调度系统及方法
CN110706721A (zh) 基于bp神经网络的电除尘火花放电识别方法
CN113128399B (zh) 用于情感识别的语音图像关键帧提取方法
CN111883178B (zh) 一种基于双通道语音转图像式情感识别方法
CN112053678B (zh) 基于语音识别的开关锁方法及其系统、开关锁主体及共享车辆
CN111312251A (zh) 基于语音识别的远程机械臂控制方法
Fuketa Ultralow power feature extractor using switched-capacitor-based bandpass filter, max operator, and neural network processor for keyword spotting
Kannamal Investigation of Speech recognition system and its performance
CN1235320A (zh) 噪声环境下语音控制指令产生装置
CN115862636B (zh) 一种基于语音识别技术的互联网人机验证方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210119

RJ01 Rejection of invention patent application after publication