CN104865973A - 一种语音控制擦窗机器人方法 - Google Patents

一种语音控制擦窗机器人方法 Download PDF

Info

Publication number
CN104865973A
CN104865973A CN201510170081.4A CN201510170081A CN104865973A CN 104865973 A CN104865973 A CN 104865973A CN 201510170081 A CN201510170081 A CN 201510170081A CN 104865973 A CN104865973 A CN 104865973A
Authority
CN
China
Prior art keywords
window
window wiping
wiping robot
voice
cleaning robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510170081.4A
Other languages
English (en)
Inventor
王舒欢
李红利
张荣华
张牧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Polytechnic University
Original Assignee
Tianjin Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Polytechnic University filed Critical Tianjin Polytechnic University
Priority to CN201510170081.4A priority Critical patent/CN104865973A/zh
Publication of CN104865973A publication Critical patent/CN104865973A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开一种语音控制擦窗机器人方法,可广泛用于高楼擦窗,壁面清洗,瓷砖及地板的清理等。采用DTW(Dynamic Time Warping,动态时间规整)语音识别技术,特点是应用动态规划的思想来解决语音信号特征参数序列比较时时长不等的难题,能够在孤立词语音的识别中获得良好的性能。由声音接收传感器接收数字语音命令,经过语音信号处理单元后即可识别,随后语音信号处理单元将其识别结果通过无线通讯模块发送给擦窗机器人的核心控制单元,其核心控制单元将语音识别结果转化为控制信号,并接收擦窗机器人状态测量单元测量的实际擦窗机器人状态,将其数据进行融合后完成对擦窗机器人的控制。运用该技术方法的擦窗机器人可解决擦窗过程中高空作业有危险,人工擦窗太费力,工作程序太繁杂三大难题。

Description

一种语音控制擦窗机器人方法
技术领域
本发明属于智能家居控制领域,涉及到一种利用数字语音命令识别技术完成对擦窗机器人控制的方法,可广泛用于高楼擦窗,壁面清洗,瓷砖及地板的清理等。
背景技术
智能家居是近些年来国内及国际研究的热点,其中的智能擦窗机器人可广泛应用于日常生活,工作,娱乐等场合,但目前的擦窗清洁工作超过50%的用户选择自己动手,只有很少一部分人选择擦窗机器人,对于市场上的擦窗机器人存在着边角擦不干净等问题。本发明设计的擦窗机器人使用语音识别技术让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令技术,这种技术在智能手机、工业现场、飞行器等方面都有着广泛的应用。通过用户声音操控擦窗机器人除了操作方便之外,且能保证安全,防止擦窗“跳楼”的不幸。
发明内容
本发明提出一种语音控制擦窗机器人的方法,目的在于克服上述已有技术的不足,使用语音识别技术由任意的用户声音来操控擦窗机器人,使得擦窗机器人更加灵活、可靠,清洁力度强,用户使用的更放心。
本发明采用的是DTW(Dynamic Time Warping,动态时间规整)语音识别技术,运用动态规划的思想解决语音信号特征参数序列比较时时长不等的难题,且在孤立词语音识别中获得良好的性能。由操作员发出数字语音命令,声音接收传感器接收到该语音命令,经过语音信号处理单元后即可识别,随后语音信号处理单元将其识别结果通过无线通讯模块发送给擦窗机器人的核心控制单元,其核心控制单元将语音识别结果转化为控制信号,并接收擦窗机器人状态测量单元测量的实际擦窗机器人状态,将其数据进行融合后完成对擦窗机器人的控制。通过使用语音识别技术,由用户声音来操控擦窗机器人的实现将使得擦窗机器人更加灵活,方便用户操作。
本发明所采用的动力系统为充电锂电池。电池供电给擦窗机器人电机驱动装置,由此驱动电机转动,电机转速控制擦窗机器人的姿态、运动速度及运动方向。通过语音识别技术由用户声音来操控电机的转速,从而实现语音控制擦窗机器人的运动。
本发明与现有的技术相比具有以下优点:
1、语音控制方法简单易行,可靠性高、安全性强。
2、擦窗机器人更加灵活,清洁力度更强。
3、采用简单而有效的数字语音命令识别来取代复杂的汉语命令识别,其命令识别的实时性好,准确度高。
4、将语音控制与擦窗机器人相结合,为擦窗机器人的发展提供了更广阔的空间,非专业的操作人员也可以方便的操作,大大降低了用户的困扰。
附图说明
图1是语音控制擦窗机器人系统框图;
图2是语音识别系统基本原理框图;
图3是DTW算法原理图;
图4是三种匹配模式对同一个词两次发音的匹配距离示意图;
图5是数字语音命令识别DTW算法流程图;
具体实施方式
下面将结合附图对本发明具体实施方式作进一步的详细描述。
参照图1,本发明的具体实现步骤如下所述:
为了使操作员和擦窗机器人的交互更加简单,使语音识别系统达到实时性更好、准确度更高的水平,操作员采用如下方法和擦窗机器人进行交互。
为控制擦窗机器人可以稳定运动,保证控制的实时性是至关重要的,而语音识别系统可以很好的保证对擦窗机器人的控制指令的实时性,因此使用更简单、实用、可靠的语音识别方法控制擦窗机器人的稳定运动。操作员给擦窗机器人的控制指令包括向左、向右、左旋转、右旋转、向上、向下等。因汉语命令的语音识别比数字复杂得多,且识别准确率并没有数字的高,所以整个过程通过识别0~5的数字来代替“向左”、“向右”、“左旋转”、“右旋转”、“向上”、“向下”等汉语命令的识别。擦窗机器人的控制数字命令和汉语命令对应如下:
0 向左
1 向右
2 左旋转
3 右旋转
4 向上
5 向下
如果操作员说出数字“0”,则擦窗机器人向左,说出数字“1”,则擦窗机器人向右,依次类推。下面详细叙述一下数字语音命令的识别过程。
l、r、lc、rc、u、d分别表示向左、向右、左旋转、右旋转、向上及向下。l、r、lc、rc、u、d的定义如下:
操作员发出数字语音命令,声音接收传感器接收到该语音命令,经过语音信号处理单元后即可识别,随后语音信号处理单元将其识别结果通过无线通讯模块发送给擦窗机器人的核心控制单元,其核心控制单元将语音识别结果转化为控制信号,并接收擦窗机器人状态测量单元测量的实际擦窗机器人状态,将其数据进行融合后完成对擦窗机器人的控制,使擦窗机器人执行相应的运动。
参考图2,图中可以看出语音识别系统和模式识别系统相关性很强,它同样包括预处理、特征提取、模式匹配、参考模式库和训练等基本单元。语音信号的非平稳性特别强,加上外部噪音、呼吸气流、电流等因素的干扰,使得语音信号必须经过前期预处理才能直接用于提取特征。预处理阶段包括滤波、采样、量化、分帧、加窗、端点检测等。经过这些预处理过程就可以用来进行特征参数的提取。训练阶段,将特征参数进行相关的处理后,将会为每个词条得到一个相应的模型,保存为模式库。在识别阶段,语音信号会经过一样的通道得到语音参数,生成相应的测试模板,然后把测试模板与参考模板进行匹配,匹配分数最高的参考模板即为识别结果。
本发明数字语音命令识别采用DTW(Dynamic Time Warping,动态时间规整)语音识别技术,虽然人工神经网络和隐马尔可夫模型在连续且大词汇量语音识别功能上优于DTW,但是它们在训练阶段时需根据大量的语音数据经过反复的计算才能够得到模型参数,而DTW算法的计算量较少、无需前期那样的长期训练。DTW算法是在孤立词语的语音识别中最为简单有效的方法,它既简便又有效,也很容易将算法移植到数字信号处理器、单片机等上面进而实现语音识别,而且也能满足其实时性要求,非常的适合于本发明中对擦窗机器人语音命令的识别。
本发明用DTW语音识别算法对数字0~5共6段参考语音分别进行训练并建立相应的模式库,随后对多段的测试语音进行识别测试。语音信号处理单元可以实现图2中的语音输入、预处理、特征提取、训练、建立模式库、模式识别等模块,最后确定一个比较完整的语音识别系统。
参考图3,DTW语音识别算法的模式识别过程如下:
首先是模式匹配阶段,经过语音识别系统可以建立对数字0~5共6段参考语音的模式库,由于操作者对于同一个词的两次发音不可能完全相同,其中的差异不仅包括音谱偏移、音强大小,还包括发音时音节的长短不一,且两次发音的音节一般都不存在线性对应关系,所以模式匹配方法的语音识别算法必须解决这个关键的问题。下面对DTW算法原理作详细叙述。
无论是在训练、建立模板还是在识别阶段,都先采用端点算法来确定语音的起点和终点。设所选的参考模板有M帧矢量{R(1),R(2),R(3),...R(m),...R(M)},m为训练语音帧的时序标号,m=1为起点语音帧,m=M为终点语音帧,则M表示参考模板总帧数。R(m)表示第m帧的语音特征矢量;测试模板有N帧矢量{T(1),T(2),T(3),...T(n),...T(N)},n为测试语音帧的时序标号,n=1为起点语音帧,n=N为终点语音帧,则N表示测试模板包含的语音帧总数,T(n)表示第n帧的语音特征矢量。我们用d(T(in),R(im))表示T中第in帧特征与R中第im帧特征之间的欧几里得距离。直接匹配是假设测试模板和参考模板长度相等,即in=im;线性时间规整技术是假设说话速度按不同说话单元的发音长度等比例分布的,即明显的,这两种假设都不符合实际的语音发音情况,因此需要一种更加符合实际情况的技术,这里选用非线性时间规整技术。
DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数,用im=Φ(in)表示该规整函数,将测试模板的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:
D = min Φ ( i n ) Σ i n = 1 N d ( T ( i n ) , R ( Φ ( i n ) ) ) - - - ( 1 )
D表示处于最优时间规整情况下两矢量的距离。由于DTW不断地计算两矢量的距离以寻找最优的匹配路径,所以得到的是两矢量匹配时累积距离最小所对应的规整函数,这就保证了它们之间存在最大声学相似性。
DTW算法要求参考模板与测试模板采用相同类型的特征矢量、相同的帧长、相同的窗函数和相同的帧移。同时,规整函数必须满足的约束条件如下:
Φ ( 1 ) = 1 Φ ( N ) = M - - - ( 2 )
Φ(in+1)≥Φ(in)   (3)
Φ(in+1)-Φ(in)≤1   (4)
参考图3,DTW算法把测试模板的各个帧号n=1~N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧m=1~M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点表示测试模式中某一帧与训练模式中某一帧的交汇。DTW算法分两步进行,一是计算两个模式各帧之间的距离,即求出帧匹配距离矩阵,二是在帧匹配距离矩阵中找出一条最佳路径。
搜索最佳路径的过程可以描述如下:搜索从点(1,1)出发,对于局部路径约束如图4右半部分所示,点(in,im)可达到的前一个格点只可能是(in-1,im)、(in-1,im-1)和(in,im-1)。那么点(in,im)一定选择这三个距离中的最小者所对应的点作为其前续格点,D(in,im)表示到点(in,im)的累积距离,这时此路径的累积距离为:
D(in,im)=d(T(in),R(im))+min{D(in-1,im),D(in-1,im-1),D(in,im-1)}  (5)
这样从点(1,1)出发(令D(1,1)=0)搜索,反复递推,直到点(N,M)就可以得到最优路径,而且D(N,M)就是最佳匹配路径所对应的匹配距离。在进行语音识别时,用Dmin(N,M)表示最小匹配距离,将测试模板与所有参考模板进行匹配,得到的最小匹配距离Dmin(N,M)所对应的语音即为识别结果。
参考图4,三种匹配模式对同一个词两次发音的匹配距离(两条曲线间的阴影面积)各不相同,用D1、D2和D3分别表示三种匹配模式的匹配距离,由三幅图比较可得D3<D2<D1,即非线性匹配模式的匹配距离最小。
参考图5,依据上述原理擦窗机器人语音命令识别DTW算法具体操作步骤如下:
初始化N=40,M=35,其中数字0~5的语音模式库已经事先建立好了,每个数字有M帧语音特征矢量{R(1),R(2),R(3),...R(m),...R(M)}。
步骤1:
语音信号处理单元首先完成语音信号的采集及预处理,之后对预处理后的语音信号进行特征提取得到N帧语音特征矢量{T(1),T(2),T(3),...T(n),...T(N)}。
步骤2:
计算采集到的语音模式和模式库中数字0~5每个语音模式各帧之间的欧几里得距离d(T(in),R(im)),最终可得到6个N×M的帧匹配距离矩阵。对于每一个帧匹配距离矩阵初始化in=1,im=1,D(1,1)=0。
步骤3:
in加1,im加1,在满足规整函数Φ的约束条件(2)、(3)和(4)式的前提下,参考图5,按照公式(5)计算D(in,im)。同时记录最小累积距离D(in,im)对应的规整函数im=Φ(in),该规整函数即是图4中的最佳匹配路径。
步骤4:
判断是否已到点(N,M),如果没到点(N,M),返回步骤3;如果到了,记录每个帧匹配距离矩阵对应的最小累积距离D(N,M),和数字0~5对应共6个。
步骤5:
找出6个累积距离中最小的Dmin(N,M)对应的语音模式即为语音识别结果。最后,将该语音模式对应的数字发送给擦窗机器人核心控制单元。
擦窗机器人执行数字语音命令动作步骤如下:
步骤1:
擦窗机器人初始化,完成擦窗机器人各个模块数据的初始工作。
步骤2:
读取语音识别结果,并存储相应的信号值,例如语音识别结果为1,那么就令b=1,其他类似。
步骤3:
根据步骤2中的信号值擦窗机器人执行相应的动作,例如信号b=1,那么就给擦窗机器人核心控制单元后退的控制信号,其他类似。如果所有信号均为0,擦窗机器人不执行动作,返回步骤2。
步骤4:
擦窗机器人执行完动作后返回步骤2读取下一次的语音识别结果,如此不断重复。语音控制擦窗机器人的方法最终能够实现操作者通过语音控制擦窗机器人进行稳定的上下、左右、左旋右旋以及悬停等动作,增加了擦窗机器人的互动性、安全性、可靠性、灵活性及操控性,使操作者和擦窗机器人之间的交互更加友好。
擦窗机器人控制算法具体如下:
当信号u=4时,擦窗机器人收到向上信号,经擦窗机器人核心控制单元处理后发出向上控制指令,将设定的值与前一次的GAS变量值相加赋予GAS变量,实现向上运动;当信号d=5时,擦窗机器人收到向下信号,经擦窗机器人核心控制单元处理后发出向下控制指令,将前一次的GAS变量值与设定的值相减赋予GAS变量,实现向下运动,即实现垂直运动;当GAS变量值为某一固定值时达到擦窗机器人的重力与摩擦力相等时实现机器人的悬停状态。同理实现向左、向右、左旋右旋运动,最终实现了通过声音传感器控制擦窗机器人的目的。

Claims (4)

1.一种语音控制擦窗机器人方法,其特征在于,利用语音命令识别人类语音来控制擦窗机器人的运动。
2.根据权利要求1所述的一种语音控制擦窗机器人方法,其特征在于,擦窗机器人能够随人类语音而产生向上或向下运动、向左或向右等运动。
3.根据权利要求2所述的一种语音控制擦窗机器人方法,其特征在于,采用DTW(Dynamic Time Warping,动态时间规整)语音识别技术将人类语音转换为控制擦窗机器人的运动信号。
4.根据权利要求1所述的一种语音控制擦窗机器人方法,其特征在于,不限定特定的人员声音,语音控制指令由程序设定,通过人类语音来控制擦窗机器人运动。
CN201510170081.4A 2015-04-13 2015-04-13 一种语音控制擦窗机器人方法 Pending CN104865973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510170081.4A CN104865973A (zh) 2015-04-13 2015-04-13 一种语音控制擦窗机器人方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510170081.4A CN104865973A (zh) 2015-04-13 2015-04-13 一种语音控制擦窗机器人方法

Publications (1)

Publication Number Publication Date
CN104865973A true CN104865973A (zh) 2015-08-26

Family

ID=53911872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510170081.4A Pending CN104865973A (zh) 2015-04-13 2015-04-13 一种语音控制擦窗机器人方法

Country Status (1)

Country Link
CN (1) CN104865973A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110265049A (zh) * 2019-05-27 2019-09-20 重庆高开清芯科技产业发展有限公司 一种语音识别方法及语音识别系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2510249Y (zh) * 2001-11-06 2002-09-11 海信集团有限公司 清洁机器人
CN1846949A (zh) * 2005-04-14 2006-10-18 Lg电子株式会社 无线可控的清洗机器人及控制其的远程控制系统
US20070129852A1 (en) * 2005-12-06 2007-06-07 Sin Etke Technology Co., Ltd. On-line voice help system and method for automobile
CN101084817A (zh) * 2007-04-26 2007-12-12 复旦大学 开放智能计算构架的家用多功能小型服务机器人
CN103971682A (zh) * 2014-05-14 2014-08-06 哈尔滨工程大学 一种冰雪机器人的语音控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2510249Y (zh) * 2001-11-06 2002-09-11 海信集团有限公司 清洁机器人
CN1846949A (zh) * 2005-04-14 2006-10-18 Lg电子株式会社 无线可控的清洗机器人及控制其的远程控制系统
US20070129852A1 (en) * 2005-12-06 2007-06-07 Sin Etke Technology Co., Ltd. On-line voice help system and method for automobile
CN101084817A (zh) * 2007-04-26 2007-12-12 复旦大学 开放智能计算构架的家用多功能小型服务机器人
CN103971682A (zh) * 2014-05-14 2014-08-06 哈尔滨工程大学 一种冰雪机器人的语音控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110265049A (zh) * 2019-05-27 2019-09-20 重庆高开清芯科技产业发展有限公司 一种语音识别方法及语音识别系统

Similar Documents

Publication Publication Date Title
CN203300127U (zh) 儿童教学监护机器人
CN106446801B (zh) 基于超声主动探测的微手势识别方法及系统
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
CN105573498B (zh) 一种基于Wi-Fi信号的手势识别方法
CN203092551U (zh) 一种基于Kinect和FPGA的家庭服务机器人
CN108717852B (zh) 一种基于白光通信和类脑认知的智能机器人语义交互系统和方法
Kannan et al. Arduino based voice controlled robot
JP3529049B2 (ja) 学習装置及び学習方法並びにロボット装置
CN101101752B (zh) 基于视觉特征的单音节语言唇读识别系统
CN104866099B (zh) 基于运动传感器提高智能设备手势识别精度的误差补偿方法
CN103413113A (zh) 一种服务机器人智能情感交互的方法
CN102323817A (zh) 一种服务机器人控制平台系统及其多模式智能交互与智能行为的实现方法
Khan et al. Sensepods: A zigbee-based tangible smart home interface
CN105867630A (zh) 机器人的手势识别方法及装置及机器人系统
CN104123939A (zh) 基于变电站巡检机器人的语音交互控制方法
CN102192173A (zh) 一种智能手势控制电风扇
Kaholokula Reusing ambient light to recognize hand gestures
CN205438579U (zh) 智能机器人系统
CN108888204A (zh) 一种扫地机器人呼唤装置及呼唤方法
Wang et al. Wheeled robot control based on gesture recognition using the Kinect sensor
CN107346207B (zh) 一种基于隐马尔科夫模型的动态手势切分识别方法
CN108108015A (zh) 一种基于手机陀螺仪和动态时间规整的动作手势识别方法
CN112232127A (zh) 一种智能演讲训练系统及方法
CN104865973A (zh) 一种语音控制擦窗机器人方法
CN103971682A (zh) 一种冰雪机器人的语音控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150826