CN106601231A - 车辆控制方法和装置 - Google Patents
车辆控制方法和装置 Download PDFInfo
- Publication number
- CN106601231A CN106601231A CN201611201722.9A CN201611201722A CN106601231A CN 106601231 A CN106601231 A CN 106601231A CN 201611201722 A CN201611201722 A CN 201611201722A CN 106601231 A CN106601231 A CN 106601231A
- Authority
- CN
- China
- Prior art keywords
- identified
- voice
- vehicle
- wearable device
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000008451 emotion Effects 0.000 claims abstract description 51
- 230000008569 process Effects 0.000 claims abstract description 39
- 230000002996 emotional effect Effects 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 32
- 230000004048 modification Effects 0.000 claims description 32
- 238000012986 modification Methods 0.000 claims description 32
- 238000013139 quantization Methods 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 26
- 238000002203 pretreatment Methods 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 abstract 1
- 238000005070 sampling Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000010295 mobile communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种车辆控制方法,该方法包括步骤:当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。本发明还公开了一种车辆控制装置。本发明实现了将可穿戴设备替换传统的车载设备,通过可穿戴设备即可控制车辆,简化了通过车载设备控制车辆的操作流程;且可穿戴设备可根据语音识别出该语音对应的语音情感,提高了用户和可穿戴设备之间的交互性。
Description
技术领域
本发明涉及汽车技术领域,尤其涉及一种车辆控制方法和装置。
背景技术
随着汽车保有量的激增,人均出行里程也随之大幅增长,交通状况变得越来越复杂,驾驶员也渐渐地对各种专用车载设备有了一种依赖。各种汽车辅助驾驶设备、专用车载导航设备等车载设备在汽车前装市场和后装市场上也表现得极为活跃。
然而,现有的车载设备存在以下问题:①操作繁琐。专用车载设备在操作上都较为繁琐,复杂的操作给驾驶员带来诸多不便,使得驾驶员在行车过程中无法根据实时的需求进行便利地操作,导致此类产品的在途应用体验较差。实际上,对驾驶员而言,最重要的就是在途应用感受,但是,由于操作的不方便严重阻碍了用户的使用频次和使用体验。②交互性差。目前,车载设备几乎没有与用户进行交互的功能,虽然也有将语音技术植入车载设备的相关产品面市,但是交互过程依旧需要手控操作,且语音识别不能根据用户情感调整用户与车载设备之间的交互。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种车辆控制方法和装置,旨在解决现有的车载设备操作繁琐和交互性差的技术问题。
为实现上述目的,本发明提供一种车辆控制方法,所述车辆控制方法包括步骤:
当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。
优选地,所述在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感的步骤包括:
在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
将所述参数序列与预设情感模型进行对比,根据对比所得的结果确定所述待识别语音对应的语音情感。
优选地,所述根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆的步骤之后,还包括:
当接收到修改所述控制指令的修改指令时,存储所述修改指令;
根据所述修改指令优化所述预设情感模型。
优选地,所述当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音的步骤包括:
当可穿戴设备接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
优选地,所述当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音的步骤之后,还包括:
发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
此外,为实现上述目的,本发明还提供一种车辆控制装置,所述车辆控制装置包括:
预处理模块,用于当接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
特征提取模块,用于在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
生成模块,用于根据所述语义和所述语音情感生成控制指令;
发送模块,用于将所述控制指令发送给所述车辆,以控制所述车辆。
优选地,所述特征提取模块包括:
特征提取单元,用于在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
对比单元,用于将所述参数序列与预设情感模型进行对比;
确定单元,用于根据对比所得的结果确定所述待识别语音对应的语音情感。
优选地,所述车辆控制装置还包括:
存储模块,用于当接收到修改所述控制指令的修改指令时,存储所述修改指令;
优化模块,用于根据所述修改指令优化所述预设情感模型。
优选地,所述预处理模块包括:
采样量化单元,用于当接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
预加重处理单元,用于对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
加窗处理单元,用于对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
优选地,所述发送模块还用于发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
所述车辆控制装置还包括:
建立模块,用于当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
本发明通过当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音,在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感,根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。实现了将可穿戴设备替换传统的车载设备,通过可穿戴设备即可控制车辆,简化了通过车载设备控制车辆的操作流程;且可穿戴设备可根据语音识别出该语音对应的语音情感,提高了用户和可穿戴设备之间的交互性。
附图说明
图1为本发明车辆控制方法第一实施例的流程示意图;
图2为本发明车辆控制方法第二实施例的流程示意图;
图3为本发明车辆控制装置第一实施例的功能模块示意图;
图4为本发明车辆控制装置第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种车辆控制方法。
参照图1,图1为本发明车辆控制方法第一实施例的流程示意图。
在本实施例中,所述车辆控制方法包括:
步骤S10,当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
当可穿戴设备接收到待识别语音时,所述可穿戴设备对所述待识别语音进行预处理,以得到预处理后的所述待识别语音。在本实施例中,所述可穿戴设备包括但不限于智能手环、智能手表和智能首饰。所述待识别语音可为所述可穿戴设备直接获取的,也可为与所述可穿戴设备连接的车辆所发送的待识别语音。
进一步地,步骤S10包括:
步骤a,当可穿戴设备接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
当所述可穿戴设备接收到待识别语音时,所述可穿戴设备对所述待识别语音进行采样和量化,得到采样量化后的所述待识别语音。在采样过程中,所述可穿戴设备按照一定采样频率,每隔一个时间段,测量所述待识别语音的模拟电压值。所述采样频率是将所述待识别语音波形数字化后每秒钟所抽取的声波幅度的样本次数,单位为kHz(千赫兹),采样频率的高低决定了声音失真程度的大小,为保证声音不失真,采样频率应该在40kHz左右。所述时间段可根据具体需要而设置。当对所述待识别语音进行采样后,所述可穿戴设备对所述待识别语音进行分级量化,按照采样过程中所得电压值变化的最大幅度划分成几个区段,把落在某区段的采样到的样品值归成一类,并给出相应的量化值。
步骤b,对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
当得到采样量化后的所述待识别语音时,所述可穿戴设备对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音。所述预加重是通过一个一阶有限激励响应高通滤波器,使所述待识别语音对应的语音信号的频谱变得平坦,不易受到有限字长效应的影响。
步骤c,对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
当得到预加重后的所述待识别语音时,所述可穿戴设备对预加重后的所述待识别语音进行分帧处理,以提取所述待识别语音的短时特性。需要说明的是,在处理语音信号时一般取帧长10至30毫米,而为了避免帧与帧之间的特性变化太大,帧移一般取帧长的三分之一或者二分之一。所述可穿戴设备对预加重后的所述待识别语音进行分帧处理后,对所述待识别语音进行加窗处理,以得到预处理后的所述待识别语音。所述加窗处理是采用汉明窗对每一帧待识别语音进行加窗,以减小吉布斯效应的影响。所述吉布斯效应是将具有不连续点的周期函数(如矩形脉冲)进行傅立叶级数展开后,选取有限项进行合成;当选取的项数越多,在所合成的波形中出现的峰起越靠近原信号的不连续点;当选取的项数很大时,该峰起值趋于一个常数,大约等于总跳变值的9%。
进一步地,所述可穿戴设备还可对预处理后的所述待识别语音进行端点检测,即在所述待识别语音中,区分背景噪声和环境噪声,准确地判断出所述待识别语音的起点和终点。
步骤S20,在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
当得到预处理后的所述待识别语音时,所述可穿戴设备在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感。
进一步地,所述步骤S20包括:
步骤d,在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
进一步地,在所述可穿戴设备对所述待识别语音进行特征提取的过程中,可以通过MFCC(Mel Frequency Cepstrum Coefficient,Mel频率倒谱系数)技术进行特征提取,以确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列。通过MFCC技术进行特征提取的过程为:①将所述待识别语音分解为单位为帧的音频;②对于每一帧音频,计算周期功率谱;③将mel滤波器应用到功率谱中,计算每个滤波器的能量和;④计算能量和的对数值;⑤对每个对数能量进行离散余弦变换;⑥保留离散余弦变换的2-13个系数,其余系数舍去。在本实施例中,除了通过MFCC技术进行特征提取,也还可以通过其它的方法进行特征提取,如线性预测倒谱系数LPCC技术。
步骤e,将所述参数序列与预设情感模型进行对比,根据对比所得的结果确定所述待识别语音对应的语音情感。
当得到所述待识别语音中区分不同情感的参数序列时,所述可穿戴设备将所述参数序列与预设情感模型进行对比,得到对比结果,根据所述对比结果确定所述待识别语音对应的语音情感。需要说明的是,所述预设情感模型为根据人类的在不同情感时说话的语气和语速等因素所建立的,所述预设情感模型包括高兴、郁闷、困、饿和悲伤等情感模型。在将所述参数序列与所述预设情感模型对比过程中,根据所述参数序列与所述预设情感模型之间的相似度来确定所述待识别语音对应的语音情感。可以理解的是,所述参数序列与所述预设情感模型之间的相似度最大所对应的预设情感模型即为所述待识别语音的语音情感。
步骤S30,根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。
当确定所述待识别语音的语义和语音情感时,所述可穿戴设备根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。当所述车辆接收到所述控制指令时,根据所述控制指令执行对应的操作。如当所述待识别语音的语义为听音乐,语音情感为开心时,所述车辆根据所述控制指令播放音乐,且在播放音乐过程中,播放与心情为开心时相关的音乐。需要说明的是,通过所述可穿戴设备,可以控制所述车辆的导航、多媒体服务、以及在所述车辆的显示屏中查看车辆的运行信息等。
进一步地,所述车辆控制方法还包括:
步骤f,当接收到修改所述控制指令的修改指令时,存储所述修改指令;
步骤h,根据所述修改指令优化所述预设情感模型。
当所述车辆根据所述控制指令执行相应操作后,所述车辆接收到用户修改所述控制指令的修改指令时,所述车辆将所述修改指令发送给所述可穿戴设备。当所述可穿戴设备接收到所述修改指令时,所述可穿戴设备存储所述修改指令,并根据所述修改指令优化所述预设情感模型。如当用户删除开心情感模型所播放的音乐时,所述可穿戴设备根据所述修改指令修改开心情感模型所对应的播放歌曲,以使所述开心情感模型更加符合用户需求。
本实施例通过当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音,在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感,根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。实现了将可穿戴设备替换传统的车载设备,通过可穿戴设备即可控制车辆,简化了通过车载设备控制车辆的操作流程;且可穿戴设备可根据语音识别出该语音对应的语音情感,提高了用户和可穿戴设备之间的交互性。
进一步地,提出本发明车辆控制方法第二实施例。
所述车辆控制方法第二实施例与所述车辆控制方法第一实施例的区别在于,参照图2,所述车辆控制方法还包括:
步骤S40,发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
步骤S50,当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
当可穿戴设备要和车辆建立连接时,所述可穿戴设备发送无线连接请求给所述车辆。当所述车辆接收到所述无线连接请求,所述车辆根据所述无线连接请求返回响应消息给所述可穿戴设备,以提示所述可穿戴设备,所述车辆同意建立连接。当所述可穿戴设备接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。需要说明的是,所述可穿戴设备和所述车辆可以通过WIFI、BT网关、蓝牙和GSM(Global System for MobileCommunication,全球移动通信系统)等方式建立连接。具体地,所述可穿戴设备是与所述车辆的车载单元连接,所述车载单元包括但不限于OBD(On-Board Diagnostic,车载诊断系统)或其它可与CAN(Controller Area Network,控制器局域网络)连接的组件。
本实施例通过建立可穿戴设备和车辆之间的无线连接,以使可穿戴设备可代替传统的车辆辅助设备。
本发明进一步提供一种车辆控制装置。
参照图3,图3为本发明车辆控制装置第一实施例的功能模块示意图。
需要强调的是,对本领域的技术人员来说,图3所示模块图仅仅是一个较佳实施例的示例图,本领域的技术人员围绕图3所示的车辆控制装置的模块,可轻易进行新的模块的补充;各模块的名称是自定义名称,仅用于辅助理解该车辆控制装置的各个程序功能块,不用于限定本发明的技术方案,本发明技术方案的核心是,各自定义名称的模块所要达成的功能。可以理解的是,所述车辆控制装置应用于可穿戴设备中。
本实施例提出一种车辆控制装置,所述车辆控制装置包括:
预处理模块10,用于当接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
当可穿戴设备接收到待识别语音时,所述可穿戴设备对所述待识别语音进行预处理,以得到预处理后的所述待识别语音。在本实施例中,所述可穿戴设备包括但不限于智能手环、智能手表和智能首饰。所述待识别语音可为所述可穿戴设备直接获取的,也可为与所述可穿戴设备连接的车辆所发送的待识别语音。
进一步地,所述预处理模块10包括:
采样量化单元,用于当接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
当所述可穿戴设备接收到待识别语音时,所述可穿戴设备对所述待识别语音进行采样和量化,得到采样量化后的所述待识别语音。在采样过程中,所述可穿戴设备按照一定采样频率,每隔一个时间段,测量所述待识别语音的模拟电压值。所述采样频率是将所述待识别语音波形数字化后每秒钟所抽取的声波幅度的样本次数,单位为kHz(千赫兹),采样频率的高低决定了声音失真程度的大小,为保证声音不失真,采样频率应该在40kHz左右。所述时间段可根据具体需要而设置。当对所述待识别语音进行采样后,所述可穿戴设备对所述待识别语音进行分级量化,按照采样过程中所得电压值变化的最大幅度划分成几个区段,把落在某区段的采样到的样品值归成一类,并给出相应的量化值。
预加重处理单元,用于对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
当得到采样量化后的所述待识别语音时,所述可穿戴设备对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音。所述预加重是通过一个一阶有限激励响应高通滤波器,使所述待识别语音对应的语音信号的频谱变得平坦,不易受到有限字长效应的影响。
加窗处理单元,用于对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
当得到预加重后的所述待识别语音时,所述可穿戴设备对预加重后的所述待识别语音进行分帧处理,以提取所述待识别语音的短时特性。需要说明的是,在处理语音信号时一般取帧长10至30毫米,而为了避免帧与帧之间的特性变化太大,帧移一般取帧长的三分之一或者二分之一。所述可穿戴设备对预加重后的所述待识别语音进行分帧处理后,对所述待识别语音进行加窗处理,以得到预处理后的所述待识别语音。所述加窗处理是采用汉明窗对每一帧待识别语音进行加窗,以减小吉布斯效应的影响。所述吉布斯效应是将具有不连续点的周期函数(如矩形脉冲)进行傅立叶级数展开后,选取有限项进行合成;当选取的项数越多,在所合成的波形中出现的峰起越靠近原信号的不连续点;当选取的项数很大时,该峰起值趋于一个常数,大约等于总跳变值的9%。
进一步地,所述可穿戴设备还可对预处理后的所述待识别语音进行端点检测,即在所述待识别语音中,区分背景噪声和环境噪声,准确地判断出所述待识别语音的起点和终点。
特征提取模块20,用于在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
当得到预处理后的所述待识别语音时,所述可穿戴设备在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感。
进一步地,所述特征提取模块20包括:
特征提取单元,用于在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
进一步地,在所述可穿戴设备对所述待识别语音进行特征提取的过程中,可以通过MFCC(Mel Frequency Cepstrum Coefficient,Mel频率倒谱系数)技术进行特征提取,以确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列。通过MFCC技术进行特征提取的过程为:①将所述待识别语音分解为单位为帧的音频;②对于每一帧音频,计算周期功率谱;③将mel滤波器应用到功率谱中,计算每个滤波器的能量和;④计算能量和的对数值;⑤对每个对数能量进行离散余弦变换;⑥保留离散余弦变换的2-13个系数,其余系数舍去。在本实施例中,除了通过MFCC技术进行特征提取,也还可以通过其它的方法进行特征提取,如线性预测倒谱系数LPCC技术。
对比单元,用于将所述参数序列与预设情感模型进行对比;
确定单元,用于根据对比所得的结果确定所述待识别语音对应的语音情感。
当得到所述待识别语音中区分不同情感的参数序列时,所述可穿戴设备将所述参数序列与预设情感模型进行对比,得到对比结果,根据所述对比结果确定所述待识别语音对应的语音情感。需要说明的是,所述预设情感模型为根据人类的在不同情感时说话的语气和语速等因素所建立的,所述预设情感模型包括高兴、郁闷、困、饿和悲伤等情感模型。在将所述参数序列与所述预设情感模型对比过程中,根据所述参数序列与所述预设情感模型之间的相似度来确定所述待识别语音对应的语音情感。可以理解的是,所述参数序列与所述预设情感模型之间的相似度最大所对应的预设情感模型即为所述待识别语音的语音情感。
生成模块30,用于根据所述语义和所述语音情感生成控制指令;
发送模块40,用于将所述控制指令发送给所述车辆,以控制所述车辆。
当确定所述待识别语音的语义和语音情感时,所述可穿戴设备根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。当所述车辆接收到所述控制指令时,根据所述控制指令执行对应的操作。如当所述待识别语音的语义为听音乐,语音情感为开心时,所述车辆根据所述控制指令播放音乐,且在播放音乐过程中,播放与心情为开心时相关的音乐。需要说明的是,通过所述可穿戴设备,可以控制所述车辆的导航、多媒体服务、以及在所述车辆的显示屏中查看车辆的运行信息等。
进一步地,所述车辆控制装置还包括:
存储模块,用于当接收到修改所述控制指令的修改指令时,存储所述修改指令;
优化模块,用于根据所述修改指令优化所述预设情感模型。
当所述车辆根据所述控制指令执行相应操作后,所述车辆接收到用户修改所述控制指令的修改指令时,所述车辆将所述修改指令发送给所述可穿戴设备。当所述可穿戴设备接收到所述修改指令时,所述可穿戴设备存储所述修改指令,并根据所述修改指令优化所述预设情感模型。如当用户删除开心情感模型所播放的音乐时,所述可穿戴设备根据所述修改指令修改开心情感模型所对应的播放歌曲,以使所述开心情感模型更加符合用户需求。
本实施例通过当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音,在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感,根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。实现了将可穿戴设备替换传统的车载设备,通过可穿戴设备即可控制车辆,简化了通过车载设备控制车辆的操作流程;且可穿戴设备可根据语音识别出该语音对应的语音情感,提高了用户和可穿戴设备之间的交互性。
进一步地,提出本发明车辆控制装置第二实施例。
所述车辆控制装置第二实施例与所述车辆控制装置第一实施例的区别在于,参照图4,所述发送模块40还用于发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
所述车辆控制装置还包括:
建立模块50,用于当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
当可穿戴设备要和车辆建立连接时,所述可穿戴设备发送无线连接请求给所述车辆。当所述车辆接收到所述无线连接请求,所述车辆根据所述无线连接请求返回响应消息给所述可穿戴设备,以提示所述可穿戴设备,所述车辆同意建立连接。当所述可穿戴设备接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。需要说明的是,所述可穿戴设备和所述车辆可以通过WIFI、BT网关、蓝牙和GSM(Global System for MobileCommunication,全球移动通信系统)等方式建立连接。具体地,所述可穿戴设备是与所述车辆的车载单元连接,所述车载单元包括但不限于OBD(On-Board Diagnostic,车载诊断系统)或其它可与CAN(Controller Area Network,控制器局域网络)连接的组件。
本实施例通过建立可穿戴设备和车辆之间的无线连接,以使可穿戴设备可代替传统的车辆辅助设备。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种车辆控制方法,其特征在于,所述车辆控制方法包括以下步骤:
当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆。
2.如权利要求1所述的车辆控制方法,其特征在于,所述在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感的步骤包括:
在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
将所述参数序列与预设情感模型进行对比,根据对比所得的结果确定所述待识别语音对应的语音情感。
3.如权利要求2所述的车辆控制方法,其特征在于,所述根据所述语义和所述语音情感生成控制指令,并将所述控制指令发送给所述车辆,以控制所述车辆的步骤之后,还包括:
当接收到修改所述控制指令的修改指令时,存储所述修改指令;
根据所述修改指令优化所述预设情感模型。
4.如权利要求1所述的车辆控制方法,其特征在于,所述当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音的步骤包括:
当可穿戴设备接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
5.如权利要求1至4任一项所述的车辆控制方法,其特征在于,所述当可穿戴设备接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音的步骤之后,还包括:
发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
6.一种车辆控制装置,其特征在于,所述车辆控制装置包括:
预处理模块,用于当接收到待识别语音时,对所述待识别语音进行预处理,得到预处理后的所述待识别语音;
特征提取模块,用于在预处理后的所述待识别语音中进行特征提取,以确定所述待识别语音对应的语义和语音情感;
生成模块,用于根据所述语义和所述语音情感生成控制指令;
发送模块,用于将所述控制指令发送给所述车辆,以控制所述车辆。
7.如权利要求6所述的车辆控制装置,其特征在于,所述特征提取模块包括:
特征提取单元,用于在预处理后的所述待识别语音中进行特征提取,确定所述待识别语音的语义,以及得到所述待识别语音中区分不同情感的参数序列;
对比单元,用于将所述参数序列与预设情感模型进行对比;
确定单元,用于根据对比所得的结果确定所述待识别语音对应的语音情感。
8.如权利要求7所述的车辆控制装置,其特征在于,所述车辆控制装置还包括:
存储模块,用于当接收到修改所述控制指令的修改指令时,存储所述修改指令;
优化模块,用于根据所述修改指令优化所述预设情感模型。
9.如权利要求6所述的车辆控制装置,其特征在于,所述预处理模块包括:
采样量化单元,用于当接收到待识别语音时,对所述待识别语音进行采样量化,得到采样量化后的所述待识别语音;
预加重处理单元,用于对采样量化后的所述待识别语音进行预加重处理,得到预加重后的所述待识别语音;
加窗处理单元,用于对预加重后的所述待识别语音进行加窗处理,得到预处理后的所述待识别语音。
10.如权利要求6至9任一项所述的车辆控制装置,其特征在于,所述发送模块还用于发送无线连接请求给所述车辆,以供所述车辆根据所述无线连接请求返回响应消息;
所述车辆控制装置还包括:
建立模块,用于当接收到所述响应消息时,根据所述响应消息与所述车辆建立无线连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611201722.9A CN106601231A (zh) | 2016-12-22 | 2016-12-22 | 车辆控制方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611201722.9A CN106601231A (zh) | 2016-12-22 | 2016-12-22 | 车辆控制方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106601231A true CN106601231A (zh) | 2017-04-26 |
Family
ID=58603057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611201722.9A Pending CN106601231A (zh) | 2016-12-22 | 2016-12-22 | 车辆控制方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106601231A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109050471A (zh) * | 2018-07-27 | 2018-12-21 | 吉利汽车研究院(宁波)有限公司 | 一种智能穿戴设备 |
CN109410938A (zh) * | 2018-11-28 | 2019-03-01 | 途客电力科技(天津)有限公司 | 车辆控制方法、装置及车载终端 |
CN109712625A (zh) * | 2019-02-18 | 2019-05-03 | 珠海格力电器股份有限公司 | 基于网关的智能设备控制方法、控制系统、智能网关 |
CN110534091A (zh) * | 2019-08-16 | 2019-12-03 | 广州威尔森信息科技有限公司 | 一种基于微服务器及智能语音识别的人车交互方法 |
CN110890089A (zh) * | 2018-08-17 | 2020-03-17 | 珠海格力电器股份有限公司 | 语音识别方法及装置 |
CN115662102A (zh) * | 2022-12-29 | 2023-01-31 | 小米汽车科技有限公司 | 车辆的控制方法、装置、电子设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819805A (zh) * | 2010-01-28 | 2010-09-01 | 深圳市戴文科技有限公司 | 一种播放音频的方法、装置及移动终端 |
CN102157168A (zh) * | 2011-01-13 | 2011-08-17 | 博视联(苏州)信息科技有限公司 | 个性化音乐智能播放装置及其播放方法 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN104252226A (zh) * | 2013-06-28 | 2014-12-31 | 联想(北京)有限公司 | 一种信息处理的方法及电子设备 |
CN105015444A (zh) * | 2014-04-28 | 2015-11-04 | 戴姆勒大中华区投资有限公司 | 车辆的语音控制系统 |
CN105070288A (zh) * | 2015-07-02 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 车载语音指令识别方法和装置 |
CN105321515A (zh) * | 2014-06-17 | 2016-02-10 | 中兴通讯股份有限公司 | 一种移动终端的车载应用控制方法、装置及终端 |
CN105374366A (zh) * | 2015-10-09 | 2016-03-02 | 广东小天才科技有限公司 | 一种穿戴设备识别语义的方法与系统 |
CN105760852A (zh) * | 2016-03-14 | 2016-07-13 | 江苏大学 | 一种融合脸部表情和语音的驾驶员情感实时识别方法 |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
CN106205648A (zh) * | 2016-08-05 | 2016-12-07 | 易晓阳 | 一种语音控制音乐网络播放方法 |
CN106251866A (zh) * | 2016-08-05 | 2016-12-21 | 易晓阳 | 一种语音控制音乐网络播放装置 |
-
2016
- 2016-12-22 CN CN201611201722.9A patent/CN106601231A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819805A (zh) * | 2010-01-28 | 2010-09-01 | 深圳市戴文科技有限公司 | 一种播放音频的方法、装置及移动终端 |
CN102157168A (zh) * | 2011-01-13 | 2011-08-17 | 博视联(苏州)信息科技有限公司 | 个性化音乐智能播放装置及其播放方法 |
CN104252226A (zh) * | 2013-06-28 | 2014-12-31 | 联想(北京)有限公司 | 一种信息处理的方法及电子设备 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN105015444A (zh) * | 2014-04-28 | 2015-11-04 | 戴姆勒大中华区投资有限公司 | 车辆的语音控制系统 |
CN105321515A (zh) * | 2014-06-17 | 2016-02-10 | 中兴通讯股份有限公司 | 一种移动终端的车载应用控制方法、装置及终端 |
CN105070288A (zh) * | 2015-07-02 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 车载语音指令识别方法和装置 |
CN105374366A (zh) * | 2015-10-09 | 2016-03-02 | 广东小天才科技有限公司 | 一种穿戴设备识别语义的方法与系统 |
CN105760852A (zh) * | 2016-03-14 | 2016-07-13 | 江苏大学 | 一种融合脸部表情和语音的驾驶员情感实时识别方法 |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
CN106205648A (zh) * | 2016-08-05 | 2016-12-07 | 易晓阳 | 一种语音控制音乐网络播放方法 |
CN106251866A (zh) * | 2016-08-05 | 2016-12-21 | 易晓阳 | 一种语音控制音乐网络播放装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109050471A (zh) * | 2018-07-27 | 2018-12-21 | 吉利汽车研究院(宁波)有限公司 | 一种智能穿戴设备 |
CN110890089A (zh) * | 2018-08-17 | 2020-03-17 | 珠海格力电器股份有限公司 | 语音识别方法及装置 |
CN109410938A (zh) * | 2018-11-28 | 2019-03-01 | 途客电力科技(天津)有限公司 | 车辆控制方法、装置及车载终端 |
CN109712625A (zh) * | 2019-02-18 | 2019-05-03 | 珠海格力电器股份有限公司 | 基于网关的智能设备控制方法、控制系统、智能网关 |
CN110534091A (zh) * | 2019-08-16 | 2019-12-03 | 广州威尔森信息科技有限公司 | 一种基于微服务器及智能语音识别的人车交互方法 |
CN115662102A (zh) * | 2022-12-29 | 2023-01-31 | 小米汽车科技有限公司 | 车辆的控制方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106601231A (zh) | 车辆控制方法和装置 | |
US10229671B2 (en) | Prioritized content loading for vehicle automatic speech recognition systems | |
CN1750124B (zh) | 带限音频信号的带宽扩展 | |
CN102568478B (zh) | 一种基于语音识别的视频播放控制方法和系统 | |
US10008218B2 (en) | Blind bandwidth extension using K-means and a support vector machine | |
US9418674B2 (en) | Method and system for using vehicle sound information to enhance audio prompting | |
US9263040B2 (en) | Method and system for using sound related vehicle information to enhance speech recognition | |
US8639508B2 (en) | User-specific confidence thresholds for speech recognition | |
WO2017000489A1 (zh) | 车载语音指令识别方法、装置和存储介质 | |
CN110475170A (zh) | 耳机播放状态的控制方法、装置、移动终端及存储介质 | |
US8756062B2 (en) | Male acoustic model adaptation based on language-independent female speech data | |
CN110853618A (zh) | 一种语种识别的方法、模型训练的方法、装置及设备 | |
CN107623614A (zh) | 用于推送信息的方法和装置 | |
CN110853617B (zh) | 一种模型训练的方法、语种识别的方法、装置及设备 | |
US20130185078A1 (en) | Method and system for using sound related vehicle information to enhance spoken dialogue | |
US20090030679A1 (en) | Ambient noise injection for use in speech recognition | |
US8762151B2 (en) | Speech recognition for premature enunciation | |
CN104700843A (zh) | 一种年龄识别的方法及装置 | |
CN101625857A (zh) | 一种自适应的语音端点检测方法 | |
CN110008481B (zh) | 翻译语音生成方法、装置、计算机设备和存储介质 | |
CN102404278A (zh) | 一种基于声纹识别的点歌系统及其应用方法 | |
CA3158930A1 (en) | Arousal model generating method, intelligent terminal arousing method, and corresponding devices | |
CN110663080A (zh) | 通过频谱包络共振峰的频移动态修改语音音色的方法和装置 | |
US20130211832A1 (en) | Speech signal processing responsive to low noise levels | |
CN106558306A (zh) | 用于语音识别的方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170426 |
|
RJ01 | Rejection of invention patent application after publication |