CN102298346A

CN102298346A - 一种智能轮椅语音驱动控制器及识别与控制方法

Info

Publication number: CN102298346A
Application number: CN2011101376403A
Authority: CN
Inventors: 曾庆军; 于庆栋; 王仁杰; 周洋; 刘利
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2011-05-26
Filing date: 2011-05-26
Publication date: 2011-12-28

Abstract

本发明公开了一种智能轮椅语音驱动控制器及识别与控制方法，所述控制器包括音频电路模块、语音处理电路模块、MAX232通信模块、DSP处理器、操纵杆电路模块、调速电路模块、电源电路模块、电机驱动电路模块、故障检测电路模块、电压电流检测电路模块、刹车电路模块。语音识别采用基于模糊支持向量机的特定人语音识别方法，提高了识别率并增强了抗噪能力。DSP处理器通过输出PWM波来控制电机协调运转。本发明提出了一种以单片机为语音信息处理器，以DSP为驱动控制器的主从式智能轮椅语音驱动控制方案。本发明的优点是它既可以手动控制，也可以语音自动控制，使用方便。

Description

一种智能轮椅语音驱动控制器及识别与控制方法

技术领域

本发明涉及智能轮椅语音驱动控制器及识别与控制方法，属于智能轮椅的语音识别和电机驱动控制领域。

背景技术

随着社会文明的发展进步，保障和提高老年人以及残障人士等弱势群体的生活质量，已经越来越受到社会各界人士的普遍关注。轮椅作为一种辅助代步工具，无论是高龄老人还是先天或后天肢残、障碍者对其的需求将越来越大。电动轮椅适于下肢残疾和行走不便的年老体弱者使用，是一种比较理想的代步工具。而对于残疾程度比较严重、上肢无法活动的人士来说，智能轮椅为他们的生活提供了极大的便利。

语音识别是人机接口设计的一项重要内容，也是语音信号处理中非常重要的应用技术，正逐步成为信息技术中人机交互的关键技术。目前，语音识别技术已经在诸多领域得到应用。智能机器人作为助老/助残服务机器人系列产品中的一个重要研究领域，将语音识别技术应用于普通轮椅，用语音来控制轮椅的运动为使用者带来了极大地方便。因此研究并开发实用的轮椅语音识别控制系统对于智能机器人的广泛应用具有重要的意义。

用户在实际使用语音命令控制轮椅运动时，由于存在环境噪声的干扰，语音识别的识别率大大折扣，迫切需要采用一种识别率较高、抗干扰较强的语音识别方法。支持向量机(Support Vector Machine，SVM)是一种基于统计学习理论的模式分类器。它通过结构风险最小化准则和核函数的方法，较好的解决了模式分类器复杂性和推广性之间的矛盾。

申请号为“200610118866.8”名称为“智能轮椅”所公开的专利中，主要强调了智能轮椅的总体机械结构，在电动轮椅的基础上，车体装配了多个红外和声纳测距传感器，使轮椅具有防碰撞和防跌落功能，体现了其智能性。申请号为“200520002773.X”名称为“一种嵌入式智能轮椅控制装置”所公开的专利中，装置中安装了8个超声传感器作为环境探测器，通过对超声传感器信息的采集，控制器实时控制轮椅的运行。已经公开的专利中，还没有关于语音控制智能轮椅的论述。

发明内容

本发明的目的是为了解决现有轮椅的控制方式给用户的使用带来诸多不便的问题，提供了一种既可以语音控制又可以手动控制的轮椅控制器，语音模式下，用户只需说出指令即可控制轮椅完成相应的操作，从而极大地方便了用户的使用。

本发明采用的技术方案是：一种智能轮椅语音驱动控制器，所述控制器包括音频电路模块、语音处理电路模块、液晶显示模块、MAX232通信模块、DSP处理器、按键电路模块、操纵杆电路模块、电源电路模块、电机驱动电路模块、故障检测电路模块、电压电流检测电路模块和刹车电路模块；其中音频电路模块与语音处理电路模块双向连接，语音处理电路模块的输出端分和液晶显示模块的输入端连接，语音处理电路模块的输入端分别和按键电路模块和操纵杆电路模块的输出端相连，MAX232通信模块分别和语音处理电路模块、DSP处理器双向相连，DSP处理器的输出端分别连接于电机驱动电路模块和刹车电路模块的输入端，故障检测电路模块、电压电流检测电路模块的输出端分别接DSP处理器的输入端，电源电路模块的电源输出端分别连接于语音处理电路模块、DSP处理器、电机驱动电路模块、刹车电路模块和电机的电源输入端，电机驱动电路模块的输出端连接于故障检测电路模块和电机的输入端，电机的输出端与电压电流检测电路模块的输入端连接，刹车电路模块的输出端与电机的输入端相连。

音频电路模块包括语音采集模块和语音播放模块，语音采集模块为一麦克风，语音播放模块为一喇叭。

语音处理电路模块采用凌阳单片机SPCE061A。

DSP处理器采用数字信号处理器TMS320LF2407A。

电机驱动电路模块包括光耦隔离电路、功率放大电路、H桥式驱动电路。

光耦隔离电路采用光耦隔离器件6N137，功率放大电路采用电机驱动控制芯片IR2130。

电源电路模块为一电平转换电路。

一种智能轮椅语音驱动控制器的语音识别方法如下：

第一步：语音预处理

语音预处理分为采样量化，去噪，预加重和加窗三个部分；

第二步：端点检测

过程如下：

A)、计算每帧平均能量幅度和短时过零率；

B)、先为短时平均能量和短时过零率确定两个门限；在静音段，如果能量或过零率超越了低门限，就开始标记起始点，进入过渡段；

C)、在检测到语音段后，标记开始检测语音终点，如果检测到短时能量或者短时过零率低于闭值，则标记为语音终点；

第三步：特征提取

A)、对各帧信号进行小波包分解，并且计算对应临界频带的结点小波系数的对数能量：

S_{k} = \ln \frac{Σ_{m = 1}^{N_{k}} {[{WPX}_{k, m}]}^{2}}{N_{k}}, k = 1,2, \cdot \cdot \cdot, K, - - - (1)

其中，WPX_k，m为第k个子带的第m个小波系数，k为子带序号，N_k为第k个子带中小波包分解系数的个数，K为所选频带的数目，在本系统的实验中，K＝24；

B)、对S_k进行DCT变换，得到新的特征参数：

c (i) = Σ_{k = 1}^{k} S_{k} \cos [\frac{πi (k - 1 / 2)}{k}], 1 \leq k \leq K, i = 1,2, \cdot \cdot \cdot, p, - - - (2)

其中，p为特征参数的维数；

第四步：模糊支持向量机识别

采取语音样本强制对齐的方法将语音帧数放宽或者压缩使样本长度统一，对齐后的样本利用模糊支持向量机进行识别：

相对于常规支持向量机的训练样本，除了样本的特征与类属标识外，模糊支持向量机训练的每个样本还增加了隶属度一项；训练的语音样本集表示为(x₁，y₁，μ(x₁))，…，(x_n，y_n，μ(x_n))，每个语音样本的特征表示为x_i∈R^d，类标识为y_i∈{+1，-1}，隶属度为0＜μ(x_i)≤1，其中Cy_i标明它所对应的向量x_i属于两类中的哪一类，n为样本个数，d为输入维数；

z＝Ф(x)为将训练样本从原始模式空间R^d映射到高维特征空间Z之间的映射关系Ф；

最优分类面为下面目标函数的最优解：

\min {\frac{1}{2} {| | w | |}^{2} + C (Σ_{i = 1}^{n} μ (x_{i}) ξ_{i})} - - - (3)

约束条件为：y_i[(w^T·z_i)+b]-1+ξ_i≥0，i＝1，…，n (4)

ξ_i≥0，i＝1，…，n

其中，w表示线性分类函数y_i的权系数，惩罚因子C为常数，ξ_i是支持向量机目标函数中的分类误差项，μ(x_i)ξ_i为带权的误差项；

相应的最优分类面的判别函数式为：

f (x) = sgn [Σ_{i = 1}^{l} α_{i}^{*} y_{i} K (x_{i}, x_{j}) + b^{*}] - - - (5)

其中

b^{*} = y_{j} - Σ_{i = 1}^{l} y_{i} α_{i}^{*} K (x_{i}, x_{j}), &ForAll; j &Element; {j | α_{i}^{*} > 0} .

0≤α_i≤μ(x_i)C，i＝1，…，n

其中，α_i是二次规划优化问题所求解的拉格朗日乘子，每一个拉格朗日乘子α_i对应一个训练样本x_i；α_i＞0所对应的训练样本就被称为“支持向量”；

为二次规划所得解；核函数K将高维特征空间中内积运算转化为低维模式空间上的一个简单的函数计算；采用高斯径向基核函数：

其中σ为高斯分布的宽度；

样本的隶属度采用模糊C均值算法来确定。

一种智能轮椅语音驱动控制器的驱动控制方法如下：

音频电路模块用于语音采集和语音播放；语音处理电路模块用于接受外界指令并能进行语音训练、识别和语音信号处理；液晶显示模块用于电池电量、速度档位和故障信息的显示；MAX232通信模块用于语音处理电路模块和DSP处理器的通信；DSP处理器综合处理各模块的信息，能够给出控制信号；按键电路模块用于进行语音模式和手动模式之间的切换以及速度档的给定；操纵杆电路模块用于接受使用者给控制器的方向控制指令；电源电路模块用于给语音处理电路模块、DSP处理器、电机驱动电路模块、刹车电路模块和电机提供电源电平；电机驱动电路模块包括左、右电机驱动模块，其中左、右电机驱动电路模块功能和接法相同，用于将控制信号经过放大转化为驱动信号，驱动电机运转；故障检测电路模块主要用于功率MOSFET、直流电机电枢回路和电机电磁车闸的检测；电压电流检测电路模块包括电机电流检测电路和电机电压检测电路，电机电流检测电路用于检测流过电机的电流，电机电压检测电路用于分别检测电机两端相对于地的电压；刹车电路模块用于紧急情况下的停车，以避免危险事故的发生；

其中，系统运行时，语音处理电路模块采集按键电路模块的模式信息。控制器处于手动模式时，语音处理电路模块经过A/D口接收来自操纵杆电路模块的方向控制指令信息，通过I/O口获取按键电路模块的速度档信息，通过MAX232通信模块传给DSP处理器，DSP处理器综合其采集的电压电流检测模块的信号，经过数字PI调节器的调节，输出相应的PWM控制信号，通过I/O口将信号传送给电机驱动电路模块，电机驱动电路模块驱动相应的电机协调转动，电机带动轮椅运行，实现轮椅前进、后退、左转、右转等功能；控制器处于语音模式时，音频电路模块采集使用者的语音命令，经过语音处理电路模块对接收到的语音命令进行识别处理后，语音处理电路模块将识别结果通过MAX232通信模块送给DSP处理器，DSP处理器综合其采集的电压电流检测模块的信号，经过数字PI调节器的调节，输出相应的PWM控制信号，通过I/O口将信号传送给电机驱动电路模块，电机驱动电路模块驱动相应的电机协调转动，电机带动轮椅运行，实现轮椅前进、后退、左转、右转功能。

本发明的有益效果是：

1、提出了一种以凌阳公司SPCE061A单片机为语音信息处理器，以DSP为驱动控制器的主从式智能轮椅语音驱动控制方案，能够提高控制精度，加快运算速度，从而改善产品性能。

2、设计了一种既可以语音控制又可以手动控制的轮椅控制器，能应用到助老/助残服务机器人行业，一般老年人或残障者可使用手动模式，上肢残疾的患者可以使用语音模式，方便老年人和残疾人使用。

3、使用者可以根据语音提示进行语音训练，操作方便，在一定程度上使系统达到了和用户交互的目的，体现了一定的智能性。

4、提出的基于模糊支持向量机的特定人语音识别方法，通过小波降噪和小波包提取特征参数以及模糊支持向量机的模板匹配算法，解决了噪声环境下识别率低的问题，有效提高了语音识别率。

5、本嵌入式语音识别控制系统与PC机的语音识别控制系统相比，具有体积小、可靠性高、价格低、便携性好等特点。

6、具备故障诊断的功能，能够实时检测轮椅的状态，一旦发生故障，就紧急停车并故障报警，保障使用者的安全。

附图说明

图1是智能轮椅语音驱动控制器硬件体系结构图。

图2是语音处理电路模块与DSP处理器进行串口通信图。

图3是电机驱动电路模块结构框图。

图4是孤立词语音识别过程框图。

图5是小波包分解提取特征参数计算过程图。

图6是语音处理电路模块(61单片机)主程序流程图。

图7是DSP处理器主程序流程图。

具体实施方式

下面将结合附图对本发明做进一步的详细说明。

如图1所示，所述控制器包括音频电路模块1、语音处理电路模块2、液晶显示模块3、MAX232通信模块4、DSP处理器5、按键电路模块6、操纵杆电路模块7、电源电路模块8、电机驱动电路模块9、故障检测电路模块10、电压电流检测电路模块11和刹车电路模块12；其中音频电路模块1与语音处理电路模块2双向连接，语音处理电路模块2的输出端分和液晶显示模块3的输入端连接，语音处理电路模块2的输入端分别和按键电路模块6和操纵杆电路模块7的输出端相连，MAX232通信模块4分别和语音处理电路模块2、DSP处理器5双向相连，DSP处理器5的输出端分别连接于电机驱动电路模块9和刹车电路模块12的输入端，故障检测电路模块10、电压电流检测电路模块11的输出端分别接DSP处理器5的输入端，电源电路模块8的电源输出端分别连接于语音处理电路模块2、DSP处理器5、电机驱动电路模块9、刹车电路模块12和电机13的电源输入端，电机驱动电路模块9的输出端连接于故障检测电路模块10和电机13的输入端，电机13的输出端与电压电流检测电路模块11的输入端连接，刹车电路模块12的输出端与电机13的输入端相连。

其中，语音处理电路模块和DSP处理器通过MAX232通信模块进行通信，语音处理电路模块由其I/O口分别与液晶显示模块、MAX232通信模块和按键电路模块相连，由其A/D转换通道分别与音频电路模块、操纵杆电路模块相连；DSP处理器由其I/O口与刹车电路模块相连，由其A/D转换通道与电压电流检测电路模块相连，由其8路脉宽调制(PWM)通道与电机驱动电路模块相连。语音处理电路模块能够实时获取操纵杆电路模块和按键电路模块或音频电路模块的控制指令信息，通过MAX232通信模块传送给DSP处理器，DSP处理器经过综合处理电压电流检测电路模块传送过来的信息后，通过电机驱动电路模块对轮椅电机进行控制。

进一步的，音频电路模块1用于语音采集和语音播放，包括语音采集模块和语音播放模块，语音采集模块为一麦克风，麦克风的输出端和语音处理电路模块的输入端相连，麦克风采集语音指令，将其转化为模拟电信号输出至语音处理模块；语音播放模块为一喇叭，喇叭的输入端和语音处理电路模块的输出端相连，在语音训练和识别阶段，语音处理模块通过喇叭输出特定的提示音，在一定程度上达到和用户交互的目的，语音播放模块还可以用于故障报警或停机报警。

语音处理电路模块2用于接受外界指令并能进行语音训练、识别和语音信号处理，可以选用Sensory公司的RSC-364及Infineon公司的UniSpeech-SDA80D51，本发明选用凌阳公司推出的十六位单片机SPCE061A，凌阳微处理器SPCE061A集语音训练、识别和语音信号处理于一体。61单片机和DSP处理器通过串口进行通信，具体来讲，61单片机的发送端和接收端分别与所述DSP处理器的接收端和发送端对应连接。61单片机对接收到的语音指令进行识别、处理后，转化为轮椅的控制指令，进而传输至DSP处理器。如图2所示。

液晶显示模块3主要用来向用户指示当前轮椅运行的速度档位、电池电量、轮椅的运行模式以及各种故障报警显示。

MAX232通信模块4用于语音处理电路模块2和DSP处理器5的通信；采用异步串行通信模式，使用RS-232协议进行通讯。

DSP处理器5为主控制器，选用数字信号处理器TMS320LF2407A，用来接收各模块信号，经过综合处理后，实现对轮椅的前进、后退、左转、右转等方向的控制和加速、减速等速度的调节。

按键电路模块6有四个按键S1、S2、S3、S4，按键S1用于语音模式和手动模式的切换，S2为加速档键，S3为减速档键，S4为开关机键。当加速档键S2按下时轮椅的最高速度就会升一级，如果减速档键S3按下时轮椅的最高速度就会降一级，当速度档按至最大或最小时或者控制器处于语音模式时，按键不起作用。另外加减速档键还具有锁存和解锁控制器的功能，长按加速键超过三秒，轮椅就会进入锁存模式，此时轮椅被禁止运行；当轮椅被锁存后，长按减速档键超过三秒，轮椅会被解锁。

操纵杆电路模块7为一操纵杆，用于控制器手动模式下接受使用者指令，控制轮椅运行的方向。每个操纵杆有两路输出信号，分别将其表示为x和y，将x和y的数值放到直角坐标系中，便能将操作杆在平面上运动的方向和幅度清楚的表示出来。DSP处理器对x和y信号进行采样，就能得到此时操作杆的位置和方向，进而控制轮椅向操作杆设定的方向前进。

电源电路模块8为一电平转换电路，其输入端接24v蓄电池，其输出端分别和DSP处理器、电机驱动电路模块、刹车电路模块和电机等相连，分别为其提供所需电压，12V、5V分别通过7812、7805芯片由24V转换得到。

电机驱动电路模块9包括左、右电机驱动模块，其中左、右电机驱动电路模块功能和接法相同，用于将控制信号经过放大转化为驱动信号，电机驱动模块包括光耦隔离电路、功率放大电路、H桥式驱动电路。光耦隔离电路是为了将功率放大电路和控制电路完全分开，防止功率放大电路对控制电路造成干扰，导致控制系统稳定性下降；功率放大电路为了将信号放大，以驱动电机运转；H桥电路用于控制电机的正反转和加减速。如图3所示。

故障检测电路模块10主要用于功率MOSFET的检测、直流电机电枢回路的检测和电机电磁车闸的检测。如果有故障信息则通过喇叭发出警报，方便使用者或相关人员排查。

功率MOSFET的检测：分析H桥的一边桥臂，两只MOSFET交替导通。当下管导通时，上管关断，下管的栅极(G)为高电平，漏极(D)为低电平；下管关断时，上管导通，下管的栅极(G)为低电平，漏极(D)为高电平。即G、D信号逻辑电平总是相反的，否则可以判定桥臂的低压侧MOSFET开路故障。

直流电机电枢回路的检测：直流电机采用H桥式功率MOSFET驱动。检测电枢回路时，开通一个与母线连接的MOSFET，关断其他3个MOSFET，在电机电枢另一端进行A/D采样，若采样电压值与母线电压相同表示电枢回路正常，否则表示电枢绕组短路，控制器进入故障模式，封管并报警。

电磁车闸的检测：电磁车闸的开通关断由来自DSP处理器的控制信号CTRL控制，当CTRL信号为低时，MOSFET关断，经由电阻流过的电流不足以使电磁车闸开通，车刹抱死，TEST信号为高；当CTRL信号为高时，MOSFET开通，电磁车闸通电，车刹松开，此时TEST信号为低。如果DSP处理器的I/O引脚上检测到控制信号CTRL和检测信号TEST同为高电平或低电平，则说明车闸有故障或电缆没连接好。

电压电流检测电路模块11包括电机电流检测电路和电机电压检测电路，电机电流检测电路用于检测流过电机的电流，通过对电机电流采样电阻上的电压进行放大、偏移，最终将电流信号转换成0～3.3V范围内，电流检测结果被直接送往AD采样通道；电机电压检测电路用于分别检测电机两端相对于地的电压，将检测值进行分压后送到DSP处理器AD采样通道中，进行软件差分，从而得到电机两端的电压。软件差分的好处是大大降低了检测信号中的共模干扰，提高了检测精度。

刹车电路模块12为一电磁车闸，用于紧急情况下的停车，以避免危险事故的发生。当轮椅需要运行时，DSP的I/O引脚输出高电平信号，继电器接通24V电源，功率母线和刹车电路都被供电了，随即DSP处理器也会在I/O引脚BREAK上输出高电平信号到IRFR120场效应管，IRFR120场效应管导通，电机刹车通电，车闸松开；当控制器需要刹车时，就给BREAK引脚输出低电平信号关断IRFR120场效应管。

如图4所示，为孤立词语音识别过程框图。

一个完整的特定人孤立词语音识别系统通常包括语音的输入、语音信号的预处理、端点检测、特征提取、训练与识别等几个环节。语音识别的过程可以被看作模式匹配的过程，本专利采用基于模糊支持向量机算法，识别过程如下：

语音信号首先通过预处理阶段的采样量化、小波去噪、预加重和分帧加窗等步骤，将模拟信号转化为数字信号并去除噪音干扰，然后通过端点检测从包含语音的信号中确定出语音的起始点和终止点，接着采用小波包分解的方法提取特征参数，形成特征矢量序列，之后训练形成语音参考模板库。对待识别语音信号按照同样的方法提取特征参数之后，按照模糊支持向量机的识别方法求取待测语音特征参数与语音参考模板库中相应模板之间的失真测度，最匹配的就是识别结果。

其中，在进行模糊支持向量机训练前，采取语音样本强制对齐的方法将语音帧数放宽或者压缩使样本长度统一。

由采集样本的长度分析可知，通过端点检测以后语音长度主要在一定范围以内不会波动太大。适当增加或者减少语音起始的1到2帧对齐语音，对语音的影响也不是很大。经过对样本的语音采样，端点检测和特征提取，可以统计语音样本长度的分布情况。然后根据样本分布最多的语音帧长为标准长度，将其他样本对齐到相同帧数。最后，对齐后的样本利用模糊支持向量机进行识别。

其中，模糊支持向量机中核函数为高斯径向基核函数，采用C均值法确定样本的隶属度。

基于模糊支持向量机的语音识别方法，具体步骤如下：

第一步：语音预处理

语音预处理分为采样量化，去噪，预加重和加窗三个部分。

1)、采样量化

A)、设置语音采样率F＝2f_s

B)、对语音信号进行周期采样，采样频率8kHz。

2)、小波去噪

A)、对观测数据作小波分解变化；

B)、对小波系数W₀d作门限阈值处理；

C)、对处理过的小波系数做逆变换

重构信号。

3)、预加重

A)、采用y(n)＝x(n)-αx(n-1)进行预加重，α为预加重系数，它的值取0.94。

4)、加窗

A)、取帧长N，帧移T，对语音信号划分一些列的语音帧，每一语音帧包含N个语音样本；

B)、对每一语音帧加汉明窗：

ω (n) = \{\begin{matrix} 0.54 - 0.46 \cos (\frac{2 πn}{L - 1}); & 0 \leq n \leq L - 1 \\ 0; & other \end{matrix} - - - (11)

第二步：端点检测

端点检测的目的是从包含语音的信号中确定出语音的起始点和终止点，良好的端点检测方法不仅能使系统的处理时间减到最少(处理帧数最少)，而且能排除噪声等不利因素的干扰，从而保证后续操作的有效性。采用短时平均能量和短时过零率相结合的方法，利用短时能量和短时过零率两个门限来确定语音信号的起点和终点。过程如下：

A)、计算每帧平均能量幅度和短时过零率。

B)、先要求为短时平均能量和短时过零率确定两个门限。在静音段，如果能量或过零率超越了低门限，就应该开始标记起始点，进入过渡段；

C)、在检测到语音段后，标记开始检测语音终点，如果检测到短时能量或者短时过零率低于闭值，则标记为语音终点。

第三步：特征提取

特征提取用于从语音信号波形中提取一组或几组能够描述语音信号特征的参数，参数的选择直接关系着语音识别系统识别率的高低。

小波包分析可以看作是将信号通过一系列不同频带范围的带通滤波器，从而获得信号在各频带内的信息，本专利中采用类似MFCC提取的过程，用小波包分析代替离散傅里叶(FFT)，对小波包分解后每一个频带内的系数求得对数能量，再进行DCT变换，即可得到小波包系数。

A)、对各帧信号进行小波包分解，并且计算对应临界频带的结点小波系数的对数能量。

S_{k} = \ln \frac{Σ_{m = 1}^{N_{k}} {[{WPX}_{k, m}]}^{2}}{N_{k}}, k = 1,2, \cdot \cdot \cdot, K, - - - (12)

其中，WPX_k，m为第k个子带的第m个小波系数，k为子带序号，N_k为第k个子带中小波包分解系数的个数，K为所选频带的数目，在本系统的实验中，K＝24。

B)、对S_k进行DCT变换，得到新的特征参数。

c (i) = Σ_{k = 1}^{k} S_{k} \cos [\frac{πi (k - 1 / 2)}{k}], 1 \leq k \leq K, i = 1,2, \cdot \cdot \cdot, p, - - - (13)

其中，p为特征参数的维数。

小波包分解提取特征参数的计算过程，如图5所示。

第四步：模糊支持向量机识别

支持向量机需要固定长度的向量表示一个样本，而语音发音往往是不定长的。虽然通过前面语音信号的滤波、端点检测去掉了语音的一些噪音干扰，但是相同语音样本还是有差别。采取语音样本强制对齐的方法将语音帧数放宽或者压缩使样本长度统一，对齐后的样本利用模糊支持向量机进行识别。

相对于常规支持向量机的训练样本，除了样本的特征与类属标识外，模糊支持向量机训练的每个样本还增加了隶属度一项。设训练的语音样本集表示为(x₁，y₁，μ(x₁))，…，(x_n，y_n，μ(x_n))，每个语音样本的特征表示为x_i∈R^d，类标识为y_i∈{+1，-1}，隶属度为0＜μ(x_i)≤1，其中Cy_i标明它所对应的向量x_i属于两类中的哪一类，n为样本个数，d为输入维数。

假设z＝Ф(x)为将训练样本从原始模式空间R^d映射到高维特征空间Z之间的映射关系Ф。

最优分类面为下面目标函数的最优解：

\min {\frac{1}{2} {| | w | |}^{2} + C (Σ_{i = 1}^{n} μ (x_{i}) ξ_{i})} - - - (14)

约束条件为：y_i[(w^T·z_i)+b]-1+ξ_i≥0，i＝1，…，n (15)

ξ_i≥0，i＝1，…，n

其中，w表示线性分类函数y_i的权系数，惩罚因子C为常数，ξ_i是支持向量机目标函数中的分类误差项，μ(x_i)ξ_i为带权的误差项。

相应的最优分类面的判别函数式为：

f (x) = sgn [Σ_{i = 1}^{l} α_{i}^{*} y_{i} K (x_{i}, x_{j}) + b^{*}] - - - (16)

其中

b^{*} = y_{j} - Σ_{i = 1}^{l} y_{i} α_{i}^{*} K (x_{i}, x_{j}), &ForAll; j &Element; {j | α_{i}^{*} > 0} .

0≤α_i≤μ(x_i)C，i＝1，…，n

其中α_i是二次规划优化问题所求解的拉格朗日乘子，每一个拉格朗日乘子α_i对应一个训练样本x_i。α_i＞0所对应的训练样本就被称为“支持向量”。

为二次规划所得解。核函数K将高维特征空间中内积运算转化为低维模式空间上的一个简单的函数计算。采用高斯径向基核函数：

其中σ为高斯分布的宽度。

样本的隶属度采用模糊C均值算法来确定：

假设{x_i，i＝1，2，…，n}是n个样本组成的样本集合，C为预定的类别数目，m_i(i＝1，2，…，c)为每个聚类的中心，μ_j(x_i)是第i个样本对第j类的模糊隶属度函数。用隶属度函数定义的聚类损失函数可以写为：

J_{f} = Σ_{j = 1}^{c} Σ_{i = 1}^{n} {[μ_{j} (x_{i})]}^{b} {| | x_{i} - m_{j} | |}^{2} - - - (17)

其中，b＞1是一个可以控制聚类结果模糊程度的常数。对于模糊C均值方法，它要求一个样本对于各个聚类的隶属度之和为1，即：

Σ_{j = 1}^{c} μ_{j} (x_{i}) = 1, i = 1,2, \cdot \cdot \cdot c - - - (18)

在条件式(17)下求解式(18)的极小值，令J_f对m_i和μ_j(x_i)的偏导数为0，可得必要条件：

m_{j} = \frac{Σ_{i = 1}^{n} {[μ_{j} (x_{i})]}^{b} x_{i}}{Σ_{i = 1}^{n} {[μ_{j} (x_{i})]}^{b}} j = 1,2, \cdot \cdot \cdot, c - - - (19)

\begin{matrix} μ_{j} (x_{i}) = \frac{{(1 / {| | x_{i} - m_{j} | |}^{2})}^{1 / (b - 1)}}{Σ_{k = 1}^{c} {(1 / {| | x_{i} - m_{j} | |}^{2})}^{1 / (b - 1)}} & i = 1,2, \cdot \cdot \cdot, n, j = 1,2, \cdot \cdot \cdot c - - - (20) \end{matrix}

用迭代法求解上面两式，当算法收敛时，就得到了各类的聚类中心和各个样本对于各类的隶属度值。

如图6所示，系统上电启动以后，语音处理电路模块(61单片机)完成自身的初始化，包括I/O端口的配置、A/D模块的初始化、液晶显示器的初始化、通用串口通信模块的初始化；然后开始进行故障检测：首先检查操纵杆是否有故障，接着和DSP处理器进行通信，看是否有通信故障发生，有故障则报警并液晶显示。接下来，语音处理电路模块(61单片机)采集按键S1的信号，判断轮椅处于何种模式，如果处于语音模式，则此时操纵杆和速度按键的信号被屏蔽，控制器进入语音训练与识别阶段，如果没有被训练过，则开始语音命令(前进、后退、左转、右转、加速、减速等)的训练，并将训练结果存储到EEPROM中，当所有命令都训练成功时，开始语音指令的识别；如果已经被训练过，则直接进行语音命令的识别，如果识别不成功，则喇叭播放失败提示，如果识别成功，则播放识别成功提示，并以查询方式与DSP进行通信，将识别后的语音命令传送给DSP处理器。当轮椅处于手动模式时，使用者发出的语音命令信息被屏蔽，语音命令不起作用，此时语音处理电路模块(61单片机)开始采集操纵杆和按键S2、S3的信号，并将使用者的方向与速度命令信号通过MAX232模块传递给DSP处理器。

如图7所示，DSP通过中断方式与语音处理电路模块(61单片机)进行通信，DSP处理器读控制状态，并采集电压电流反馈信号，经过数字PI调节器的调节，输出相应的PWM控制信号，通过I/O口将信号传送给电机驱动电路模块，电机驱动电路模块驱动相应的电机协调转动，电机带动轮椅运行，实现轮椅前进、后退、左转、右转等功能。系统运行过程中，同时进行状态检测，如果有故障发生，如电池电量不足、电机电枢回路故障等，则停机报警。无故障，则进入下一个控制周期，并读控制状态。

Claims

1.一种智能轮椅语音驱动控制器，其特征在于，所述控制器包括音频电路模块(1)、语音处理电路模块(2)、液晶显示模块(3)、MAX232通信模块(4)、DSP处理器(5)、按键电路模块(6)、操纵杆电路模块(7)、电源电路模块(8)、电机驱动电路模块(9)、故障检测电路模块(10)、电压电流检测电路模块(11)和刹车电路模块(12)；其中音频电路模块(1)与语音处理电路模块(2)双向连接，语音处理电路模块(2)的输出端分和液晶显示模块(3)的输入端连接，语音处理电路模块(2)的输入端分别和按键电路模块(6)和操纵杆电路模块(7)的输出端相连，MAX232通信模块(4)分别和语音处理电路模块(2)、DSP处理器(5)双向相连，DSP处理器(5)的输出端分别连接于电机驱动电路模块(9)和刹车电路模块(12)的输入端，故障检测电路模块(10)、电压电流检测电路模块(11)的输出端分别接DSP处理器(5)的输入端，电源电路模块(8)的电源输出端分别连接于语音处理电路模块(2)、DSP处理器(5)、电机驱动电路模块(9)、刹车电路模块(12)和电机(13)的电源输入端，电机驱动电路模块(9)的输出端连接于故障检测电路模块(10)和电机(13)的输入端，电机(13)的输出端与电压电流检测电路模块(11)的输入端连接，刹车电路模块(12)的输出端与电机(13)的输入端相连。

2.根据权利要求1所述的一种智能轮椅语音驱动控制器，其特征在于，音频电路模块(1)包括语音采集模块和语音播放模块，语音采集模块为一麦克风，语音播放模块为一喇叭。

3.根据权利要求1所述的一种智能轮椅语音驱动控制器，其特征在于，语音处理电路模块(2)采用凌阳单片机SPCE061A。

4.根据权利要求1所述的一种智能轮椅语音驱动控制器，其特征在于，DSP处理器(5)采用数字信号处理器TMS320LF2407A。

5.根据权利要求1所述的一种智能轮椅语音驱动控制器，其特征在于，电机驱动电路模块(9)包括光耦隔离电路、功率放大电路、H桥式驱动电路。

6.根据权利要求5所述的一种智能轮椅语音驱动控制器，其特征在于，光耦隔离电路采用光耦隔离器件6N137，功率放大电路采用电机驱动控制芯片IR2130。

7.根据权利要求1所述的一种智能轮椅语音驱动控制器，其特征在于，电源电路模块(8)为一电平转换电路。

8.一种基于权利要求1所述的一种智能轮椅语音驱动控制器的语音识别方法，其特征在于，所述方法如下：

第一步：语音预处理

语音预处理分为采样量化，去噪，预加重和加窗三个部分；

第二步：端点检测

过程如下：

A)、计算每帧平均能量幅度和短时过零率；

第三步：特征提取

S_{k} = \ln \frac{Σ_{m = 1}^{N_{k}} {[{WPX}_{k, m}]}^{2}}{N_{k}}, k = 1,2, \cdot \cdot \cdot, K, - - - (1)

B)、对S_k进行DCT变换，得到新的特征参数：

c (i) = Σ_{k = 1}^{k} S_{k} \cos [\frac{πi (k - 1 / 2)}{k}], 1 \leq k \leq K, i = 1,2, \cdot \cdot \cdot, p, - - - (2)

其中，p为特征参数的维数；

第四步：模糊支持向量机识别

最优分类面为下面目标函数的最优解：

\min {\frac{1}{2} {| | w | |}^{2} + C (Σ_{i = 1}^{n} μ (x_{i}) ξ_{i})} - - - (3)

约束条件为：y_i[(w^T·z_i)+b]-1+ξ_i≥0，i＝1，…，n (4)

ξ_i≥0，i＝1，…，n

相应的最优分类面的判别函数式为：

f (x) = sgn [Σ_{i = 1}^{l} α_{i}^{*} y_{i} K (x_{i}, x_{j}) + b^{*}] - - - (5)

其中

b^{*} = y_{j} - Σ_{i = 1}^{l} y_{i} α_{i}^{*} K (x_{i}, x_{j}), &ForAll; j &Element; {j | α_{i}^{*} > 0} .

0≤α_i≤μ(x_i)C，i＝1，…，n

其中σ为高斯分布的宽度；

样本的隶属度采用模糊C均值算法来确定。

9.一种基于权利要求1所述的一种智能轮椅语音驱动控制器的驱动控制方法，其特征在于，所述方法如下：

音频电路模块(1)用于语音采集和语音播放；语音处理电路模块(2)用于接受外界指令并能进行语音训练、识别和语音信号处理；液晶显示模块(3)用于电池电量、速度档位和故障信息的显示；MAX232通信模块(4)用于语音处理电路模块(2)和DSP处理器(5)的通信；DSP处理器(5)综合处理各模块的信息，能够给出控制信号；按键电路模块(6)用于进行语音模式和手动模式之间的切换以及速度档的给定；操纵杆电路模块(7)用于接受使用者给控制器的方向控制指令；电源电路模块(8)用于给语音处理电路模块(2)、DSP处理器(5)、电机驱动电路模块(9)、刹车电路模块(12)和电机(13)提供电源电平；电机驱动电路模块(9)包括左、右电机驱动模块，其中左、右电机驱动电路模块功能和接法相同，用于将控制信号经过放大转化为驱动信号，驱动电机(13)运转；故障检测电路模块(10)主要用于功率MOSFET、直流电机电枢回路和电机电磁车闸的检测；电压电流检测电路模块(11)包括电机电流检测电路和电机电压检测电路，电机电流检测电路用于检测流过电机的电流，电机电压检测电路用于分别检测电机两端相对于地的电压；刹车电路模块(12)用于紧急情况下的停车，以避免危险事故的发生；

其中，系统运行时，语音处理电路模块(2)采集按键电路模块(6)的模式信息。控制器处于手动模式时，语音处理电路模块(2)经过A/D口接收来自操纵杆电路模块(7)的方向控制指令信息，通过I/O口获取按键电路模块(6)的速度档信息，通过MAX232通信模块(4)传给DSP处理器(5)，DSP处理器(5)综合其采集的电压电流检测模块(10)的信号，经过数字PI调节器的调节，输出相应的PWM控制信号，通过I/O口将信号传送给电机驱动电路模块(9)，电机驱动电路模块(9)驱动相应的电机(13)协调转动，电机(13)带动轮椅运行，实现轮椅前进、后退、左转、右转等功能；控制器处于语音模式时，音频电路模块(1)采集使用者的语音命令，经过语音处理电路模块(2)对接收到的语音命令进行识别处理后，语音处理电路模块(2)将识别结果通过MAX232通信模块(4)送给DSP处理器(5)，DSP处理器(5)综合其采集的电压电流检测模块(10)的信号，经过数字PI调节器的调节，输出相应的PWM控制信号，通过I/O口将信号传送给电机驱动电路模块(9)，电机驱动电路模块(9)驱动相应的电机(13)协调转动，电机(13)带动轮椅运行，实现轮椅前进、后退、左转、右转功能。