CN114743552A - 基于语义识别和语音定位的儿童安全座椅旋转控制方法 - Google Patents
基于语义识别和语音定位的儿童安全座椅旋转控制方法 Download PDFInfo
- Publication number
- CN114743552A CN114743552A CN202210282068.8A CN202210282068A CN114743552A CN 114743552 A CN114743552 A CN 114743552A CN 202210282068 A CN202210282068 A CN 202210282068A CN 114743552 A CN114743552 A CN 114743552A
- Authority
- CN
- China
- Prior art keywords
- voice
- seat
- user
- communication control
- control module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004891 communication Methods 0.000 claims abstract description 80
- 230000005540 biological transmission Effects 0.000 claims abstract description 52
- 238000013136 deep learning model Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000003993 interaction Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 4
- 108010066057 cabin-1 Proteins 0.000 claims description 11
- 230000033001 locomotion Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60N—SEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
- B60N2/00—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
- B60N2/24—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles
- B60N2/26—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles for children
- B60N2/28—Seats readily mountable on, and dismountable from, existing seats or other parts of the vehicle
- B60N2/2821—Seats readily mountable on, and dismountable from, existing seats or other parts of the vehicle having a seat and a base part
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60N—SEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
- B60N2/00—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
- B60N2/24—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles
- B60N2/26—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles for children
- B60N2/28—Seats readily mountable on, and dismountable from, existing seats or other parts of the vehicle
- B60N2/2869—Seats readily mountable on, and dismountable from, existing seats or other parts of the vehicle rotatable about a vertical axis
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D3/00—Control of position or direction
- G05D3/12—Control of position or direction using feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Aviation & Aerospace Engineering (AREA)
- Mechanical Engineering (AREA)
- Transportation (AREA)
- General Health & Medical Sciences (AREA)
- Child & Adolescent Psychology (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Evolutionary Computation (AREA)
- Seats For Vehicles (AREA)
Abstract
一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,基于语音采集传感器、语音解析模块、通讯控制模块以及传动执行模块实现。首先,将语音采集传感器阵列部署于底座四周收集声音信号。其次,通过内置深度学习模型的语音解析模块对语音信号进行处理,得到语义识别、语音定位的指令,并将指令输出至通讯控制模块。最后,传动执行模块通过接收通讯控制模块命令,带动儿童安全座椅朝着上一过程中语音定位算出的方位旋转。通讯控制模块还能接收如车速传感器等其他传感器信息,当车速超过一定值时通讯控制模块锁定儿童安全座椅的旋转功能。本发明利用语音来作为人机交互的信号源,实现儿童安全座椅旋转控制的目标,在车载环境下十分便捷;设备简单,控制稳定,能够保证安全。
Description
技术领域
本发明属于儿童安全座椅智能控制技术领域,涉及一种基于语义识别和语音定位的儿童安全座椅旋转控制方法。
背景技术
儿童安全座椅是专门为婴幼儿设计开发的汽车安全装置,可以有效保证儿童乘车的安全性。出于安全、便利等需求,实际使用过程中,用户经常需要旋转儿童安全座椅实现不同的朝向,例如上下车时将儿童放入或带离座椅需要朝向车门,再如车辆启动前使儿童朝向正前方或正后方以确保儿童安全等。为解放用户的双手,有必要实现儿童安全座椅的自动旋转。
全自动旋转控制的儿童座椅是智能化浪潮下车载安全设施的重要部分。然而,现有儿童安全座椅在自动旋转控制方面还存在以下几方面不足之处:
(1)不够智能化。控制方法比较传统,主要是通过按钮、APP等,人机交互比较低效,用户还是需要手动操作,在车载环境下还不够智能化和方便。部分使用语音控制的儿童安全座椅仅仅停留在简单的语音启停功能上,不能一步到位,而且准确率很难保证,控制逻辑也比较繁琐。
(2)不够人性化。旋转功能的启动和停止控制方法相对单一,而且使用按钮等控制方法有时无法一次准确找到有利于放置或抱出儿童的位置,无法满足多种工况下的使用需求。
综上,需要开发一种安全、智能、便捷、准确的儿童安全座椅自动旋转控制方法,能够满足车内环境下稳定使用。
发明内容
针对现有技术存在的问题,本发明提出一种基于语义识别和语音定位的儿童安全座椅旋转控制方法。具体目的为:
(1)通过阵列部署的语音采集传感器和内置深度学习模型的语音解析模块实现对用户语音指令的准确语义识别,再接着定位出用户发声的位置;
(2)通过通讯控制模块控制的传动执行模块实现儿童安全座椅的自动旋转,使其朝向用户发声所在方位;
(3)通过联合其他传感器(如车速传感器等)获取汽车速度信息并传送至通讯控制模块,使儿童安全座椅在超过一定车速后激活旋转锁定,此时座椅舱锁定在正向前座或背向前座的特定角度,以保证儿童安全。
为了实现上述发明,本发明提出了如下解决方案:
一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,所述的控制方法基于语音采集传感器、语音解析模块、通讯控制模块以及传动执行模块实现。所述旋转控制方法为:首先,将语音采集传感器阵列部署于底座四周,用于收集声音信号。具体地,实现语义识别至少需要一个语音采集传感器,而实现语音定位至少需要两个语音采集传感器,即本发明至少含有两个语音采集传感器。其次,通过内置深度学习模型的语音解析模块对采集到的语音信号进行处理,得到语义识别、语音定位的指令,并将指令输出至通讯控制模块。具体地,所述的通讯控制模块内置了由特定唤醒词和指令组成的语义词库,语义识别被限制在该词库中。语音解析模块先执行语义识别,识别唤醒词之后进一步解析语音指令,然后接着执行语音定位。如没有识别到唤醒词则保持低功耗待机。最后,传动执行模块通过接收通讯控制模块命令,带动儿童安全座椅朝着上一过程中语音定位算出的方位旋转。具体地,所述的传动执行模块包括供电装置、提供动力的驱动装置(如电机等)、将运动传递到座椅的传动装置(如带传动、链传动、行星轮系传动、齿轮齿条传动、绳索传动等)以及用于确认旋转位置以便于提供反馈的定位装置(如旋转编码器、定位槽、定位指示器等)。通讯控制模块还能接收其他必要的传感器信息,如车速传感器等,当车速超过一定值时通讯控制模块锁定儿童安全座椅的旋转功能,保证安全。详细说明如下:
(1)通讯控制模块内存有特定的语义词库,其内容包括多个唤醒词和语音指令,如“小工小工,请转过来”。其中,“小工小工”是唤醒词,“请转过来”是语音指令。特定的语义词库有助于提高语义识别的精准度,避免误启动、误操作。只有语音解析模块识别到传感器采集的唤醒词并与语义词库比对确认之后,才接着解析语音指令,再对发声的用户进行定位。
另外,通讯控制模块发挥着控制传动执行模块和担当通讯中枢的作用。它不仅接收语音解析模型送来的指令信息,还接收其他必要传感器送来的信息,例如车速传感器送来的车速信息。通讯控制模块对语音解析模块送来的指令信息进行解读,判断应该旋转的角度并控制传动执行模块执行;同时通讯控制模块也能在车速超过一定值之后控制传动执行模块锁定在座椅舱正向前座或背向前座的方位,以保证安全。具体地,锁定效果可以由电机断电自锁等方式实现。
进一步地,通讯控制模块保留了通过必要的数据通讯实现其他形式的用户交互控制的功能,数据通讯形式可以是线束通讯、无线通信,交互形式可以是通过汽车中控、手持移动设备等。
(2)语音解析模块内置了深度学习模型,用于实现更精准的语义识别和语音定位。所述语义识别基于自动语音识别和自然语言理解实现,语音识别是将用户指令转化成文本,自然语言理解是对文本进行语义解析,从而理解用户意图。利用深度学习模型进行语义识别具体为:
①在安静环境下让用户朗读语义词库中的若干内容,利用语音采集传感器采集后将其储存到通讯控制模块中,作为用户声音的特征信息1。所述特征信息1具体为特定的语音片段,包含时间、频率、强度等原始信息。
②利用深度学习模型对用户声音的特征信息1进行处理,得到个性特征信息2。所述个性特征信息2包括方言特征、说话习惯、声音强弱变化、声纹等个性化信息。
③实际使用环境下采集到的用户语音含有大量的噪声,在利用深度学习模型进行处理后,可以与已有的个性特征信息库进行比对,从而判断是哪个用户在使用。之后利用个性特征信息2记录的用户语言习惯作为辅助信息,可以帮助实现快速判断用户意图的目的。
利用深度学习模型进行语音定位主要是基于提前训练好的深度学习神经网络模型实现,具体如下:
①语音定位基于声音到达每一个声音传感器时在频率、强度以及时间数据上的差别实现,深度学习模型可以帮助这一过程更快更准。
②首先采集安静环境下和车载嘈杂环境下的语音指令作为训练数据,构建深度学习模型的训练集。
③然后提取安静环境和车载嘈杂环境下获得声音数据的信号特征,再将其输入到神经网络中进行学习训练,最后获得声源方位的目标输出。
(3)组装儿童安全座椅,所述座椅包括座椅舱、底座、语音采集传感器系列、语音解析模块、通讯控制模块以及传动执行模块系列。座椅舱底部通过连接法兰与传动执行模块连接,旋转运动由此被传递到座椅舱。语音解析模块、通讯控制模块以及传动执行模块系列被容纳在底座内部。底座侧面还设有电源与通讯接口、ISOFIX连接装置。通过电源与通讯接口可以实现对儿童安全座椅的充电、供电以及外部通讯。通过ISOFIX连接装置可以将儿童安全座椅的底座固定在汽车后座上。语音采集传感器系列阵列部署于底座内部某一平面,用于采集用户的声音信号。
(4)定义座椅舱口朝向前座的状态为初始状态,可以理解为座椅舱旋转参考系的零点。用户在某一位置发起语音指令时,语音解析模块对语音采集传感器采集到的语音进行解析。解析过程中,先执行语义识别过程,识别到特定唤醒词之后再进行指令识别和语音定位。即语义识别优先度高于语音定位,若没有侦测到唤醒词则系统始终处于低功耗待机状态。
(5)语音解析模型将解析得到的语义识别和语音定位指令传输至通讯控制模块,后者控制传动执行模块旋转相应角度,进而实现座椅舱从初始状态旋转到朝向用户的目的。具体地:
①通讯控制模块接收到语音指令,结合语音定位的结果计算电机需要旋转的角度,并控制驱动电机执行相应旋转;
②电机的旋转经传动系统传递至与传动系统机械连接的座椅舱上,座椅舱旋转朝向用户方位。
定义此时的座椅舱口朝向用户方位为工作状态1。从初始状态到工作状态1旋转过多少角度可以通过定位装置反馈给通讯控制模块,如电机旋转的角度可以利用与电机配套的旋转编码器记录并回传到通讯控制模块。反馈机制的存在有助于调整控制误差,使控制更精确。
(6)下一时刻用户从另一位置发起语音指令时,语音解析模块按照上述过程重新对采集到的声音数据进行语义识别和语音定位。具体地:
①语音定位得到的用户方位是相对于语音采集传感器位置的,而语音采集传感器被固定部署在底座2上,故座椅舱1现行的朝向与语音定位得到的方位没有相对关系。
②假定座椅舱仍处于初始状态,通讯控制模块可以得到一个从初始状态旋转到现在用户方位所需要的角度。即以初始状态这个定义好的座椅舱旋转系零点为参考。
③提取回传到通讯控制模块的座椅舱从初始状态到工作状态1的旋转角度信息,与步骤②得到的角度做差,即可得到从工作状态1所在的角度旋转到现在用户方位所需要的角度。定义座椅舱朝向现在用户方位的状态为工作状态2。
需要注意的是,下列情况下用户无法使座椅自动旋转:
①行车途中且车速超过一定数值时,儿童安全座椅旋转将被锁定,座椅舱只能处在正面朝向前座或背面朝向前座的两种角度下,定义此时为保护状态。
②用户没有使用唤醒词而是直接说出指令时,语义识别系统侦测不到唤醒词不会启动后续控制。
对比已经公布的座椅旋转装置及控制方法,本发明提出的儿童安全座椅自动旋转控制方法的有益效果如下:
(1)利用语音来作为人机交互的信号源,实现了儿童安全座椅旋转控制的目标,解放了用户的双手,而且操作逻辑符合人们的直觉,用户学习成本低,在车载环境下十分便捷;
(2)既依靠语义识别又利用语音定位,整个控制逻辑围绕语音采集识别展开,设备简单,控制稳定;
(3)通过传感器信息通讯实现了与车轮运动状态等的联动控制,保证安全;
(4)实现儿童座椅旋转的传动装置可以采用带传动、链传动、绳索传动、行星轮系传动等。
附图说明
图1是本发明提出的儿童安全座椅旋转控制方法所应用的安全座椅示意图;
图2是本发明提出的利用四传感器阵列语音定位对座椅进行旋转控制的具体实施例示意图;
图3是本发明给出的传动执行模块采用带传动的具体实施例示意图;
图4是本发明提出的儿童安全座椅自动旋转控制简易流程图;
图5是本发明提出的初始状态下语音定位流程图;
图6是本发明提出的工作状态1下语音定位流程图。
图中:1座椅舱,2底座,21电源与信息交换接口,22ISOFIX连接装置,31语音采集传感器1,32语音采集传感器2,33语音采集传感器3,34语音采集传感器4,4语音解析模块,5通讯控制模块,6传动执行模块,60供电模块,61小带轮,62大带轮,63齿形带,64连接法兰,65驱动电机,66旋转编码器,7声源。
具体实施方式
以下结合具体实施例对本发明作进一步说明。
一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,所述的控制方法基于语音采集传感器3系列、语音解析模快4、通讯控制模块5以及传动执行模块6系列实现。使用之前的调试和准备工作如下:
(1)在语音解析模块4中内置两种深度学习模型,其一负责处理语义识别,其二负责处理语音定位。
(2)在所述通讯控制模块5中内置特定的语义词库供语音解析模块4调用,以便在后续的语义识别中作为比对。
(3)建立通讯控制模块5同其他必要传感器信息之间的通讯,如车速传感器等。当车速超过一定值时通讯控制模块锁定儿童安全座椅的旋转功能,保证安全。
具体使用中,首先,所述语音采集传感器3系列负责收集声音信号。具体地,本发明至少需要两个语音采集传感器,适当增加传感器数量有助于实现更好的交互效果。本实施例采用了四语音采集传感器方案,传感器31、传感器32、传感器33、传感器34如附图所示阵列部署于底座2内部某一平面。其次,语音解析模块4对采集到的语音信号进行处理,得到语义识别、语音定位的指令,并将指令输出至通讯控制模块5。具体地,语音解析模块4先执行语义识别,识别唤醒词之后进一步解析语音指令,并执行语音定位。如没有识别到唤醒词则保持低功耗待机。最后,传动执行模块6系列通过接收通讯控制模块5命令,带动座椅舱1朝着上一过程中语音定位算出的方位旋转。所述的传动执行模块6系列包括供电装置、提供动力的驱动装置、将运动传递到座椅的传动装置以及用于确认旋转位置以便于提供反馈的定位装置。在本具体实施例中,供电装置60为电池,驱动装置为电机65,传动装置为带传动形式,并具体包括小带轮61、齿形带63、大带轮62、连接法兰64等,定位装置为旋转编码器66。
下面对具体实施过程进行详细说明:
(1)组装儿童安全座椅,所述座椅包括座椅舱1、底座2、语音采集传感器3系列、语音解析模块4、通讯控制模块5以及传动执行模块6系列。座椅舱1底部通过连接法兰64与传动执行模块的大带轮62连接。由电池60供电的电机61带动小带轮61旋转,小带轮61的运动经齿形带63被传递到大带轮62,从而再被传递到座椅舱。底座2内部是上述各组件的容器。底座侧面还设有电源与通讯接口21、ISOFIX连接装置22。通过电源与通讯接口21可以实现对儿童安全座椅的充电、供电以及外部通讯。通过ISOFIX连接装置22可以将儿童安全座椅的底座2固定在汽车后座上。语音采集传感器3系列阵列部署于底座2内部某一平面,用于采集用户的声音信号。
(2)定义座椅舱1舱口朝向前座的状态为初始状态,可以理解为座椅舱旋转参考系的零点。用户在某一位置发起语音指令时,语音解析模块4对语音采集传感器3系列采集到的语音进行解析。
(3)语音解析模型4将解析得到的语义识别和语音定位指令传输至通讯控制模块5,后者控制传动执行模块6系列旋转相应角度,进而实现座椅舱1从初始状态旋转到朝向用户的目的。具体地:
①通讯控制模块5接收到语音指令,结合语音定位的结果计算电机65需要旋转的角度,并控制电机65执行相应旋转;
②电机65的旋转经传动系统传递至与传动系统机械连接的座椅舱1上,座椅舱1旋转朝向用户方位。
定义此时的座椅舱口朝向的用户方位为工作状态1。在从初始状态到工作状态1的转变中,电机65旋转的角度可以利用与其配套的旋转编码器66记录并回传到通讯控制模块5。反馈机制的存在有助于调整控制误差,使控制更精确。
(4)下一时刻用户从另一位置发起语音指令时,语音解析模块4按照上述过程重新对采集到的声音数据进行语义识别和语音定位。具体地:
①语音定位得到的用户方位是相对于语音采集传感器3系列的位置的,而语音采集传感器3系列被固定部署在底座2上,故座椅舱1现行的朝向与语音定位得到的方位没有相对关系。
②假定座椅舱1仍处于初始状态,通讯控制模块5可以算出一个从初始状态旋转到现在用户方位所需要的角度。即以初始状态这个定义好的座椅舱旋转系零点为参考。
③提取回传到通讯控制模块5的座椅舱1从初始状态到工作状态1的旋转角度信息,与步骤②得到的角度做差,即可得到从工作状态1所在的角度旋转到现在用户方位所需要的角度。定义座椅舱1朝向现在用户方位的状态为工作状态2。
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (4)
1.一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,其特征在于,所述的控制方法基于语音采集传感器、语音解析模块、通讯控制模块以及传动执行模块实现;首先,将语音采集传感器阵列部署于底座四周,用于收集声音信号,至少含有两个语音采集传感器;其次,通过内置深度学习模型的语音解析模块对采集到的语音信号进行处理,得到语义识别、语音定位的指令,并将指令输出至通讯控制模块;所述的通讯控制模块内置由特定唤醒词和指令组成的语义词库,语义识别被限制在该词库中;语音解析模块先执行语义识别,识别唤醒词之后进一步解析语音指令,再接着执行语音定位;如没有识别到唤醒词则保持低功耗待机;最后,传动执行模块通过接收通讯控制模块命令,带动儿童安全座椅朝着上一过程中语音定位算出的方位旋转;所述的传动执行模块包括供电装置、提供动力的驱动装置、将运动传递到座椅的传动装置以及用于确认旋转位置以便于提供反馈的定位装置;具体步骤如下:
(1)通讯控制模块起着控制传动执行模块和担当通讯中枢的作用;通讯控制模块内存有特定的语义词库,其内容包括多个唤醒词和语音指令;通过通讯控制模块对语音解析模块送来的指令信息进行解读,判断应该旋转的角度并控制传动执行模块执行;只有语音解析模块识别到传感器采集的唤醒词并与语义词库比对确认之后,才进行语音指令解析,再接着对发声的用户进行定位;
(2)语音解析模块内置深度学习模型,用于实现更精准的语义识别和语音定位;所述语义识别基于自动语音识别和自然语言理解实现,语音识别是将用户指令转化成文本,自然语言理解是对文本进行语义解析,从而理解用户意图;利用深度学习模型进行语义识别具体为:
①在安静环境下让用户朗读语义词库中的若干内容,利用语音采集传感器采集后将其储存到通讯控制模块中,作为用户声音的特征信息1;所述特征信息1具体为特定的语音片段,包含时间、频率、强度或其他原始信息;
②利用深度学习模型对用户声音的特征信息1进行处理,得到个性特征信息2;所述个性特征信息2包括方言特征、说话习惯、声音强弱变化、声纹或其他个性化信息;
③实际使用环境下采集到的用户语音含有噪声,在利用深度学习模型进行处理后,可以与已有的个性特征信息库进行比对,从而判断是哪个用户在使用;之后利用个性特征信息2记录的用户语言习惯作为辅助信息,可以帮助实现快速判断用户意图的目的;
(3)组装儿童安全座椅,包括座椅舱、底座、语音采集传感器系列、语音解析模块、通讯控制模块以及传动执行模块系列;座椅舱底部通过连接法兰与传动执行模块连接,旋转运动由此被传递到座椅舱;语音解析模块、通讯控制模块以及传动执行模块系列被容纳在底座内部;底座侧面还设有电源与通讯接口、ISOFIX连接装置;通过电源与通讯接口可以实现对儿童安全座椅的充电、供电以及外部通讯;通过ISOFIX连接装置可以将儿童安全座椅的底座固定在汽车后座上;语音采集传感器系列阵列部署于底座内部某一平面,用于采集用户的声音信号;
(4)定义座椅舱口朝向前座的状态为初始状态,可以理解为座椅舱旋转参考系的零点;用户在某一位置发起语音指令时,语音解析模块对语音采集传感器采集到的语音进行解析;解析过程中,先执行语义识别过程,识别到特定唤醒词之后再进行指令识别和语音定位;即语义识别优先度高于语音定位,若没有侦测到唤醒词则系统始终处于低功耗待机状态;
(5)语音解析模型将解析得到的语义识别和语音定位指令传输至通讯控制模块,后者控制传动执行模块旋转相应角度,进而实现座椅舱从初始状态旋转到朝向用户的目的;具体地:
①通讯控制模块接收到语音指令,结合语音定位的结果计算电机需要旋转的角度,并控制驱动电机执行相应旋转;
②电机的旋转经传动系统传递至与传动系统机械连接的座椅舱上,座椅舱旋转朝向用户方位;
定义此时的座椅舱口朝向用户方位为工作状态1;从初始状态到工作状态1旋转过多少角度可以通过定位装置反馈给通讯控制模块;
(6)下一时刻用户从另一位置发起语音指令时,语音解析模块按照上述过程重新对采集到的声音数据进行语义识别和语音定位;具体地:
①语音定位得到的用户方位是相对于语音采集传感器位置的,而语音采集传感器被固定部署在底座2上,故座椅舱1现行的朝向与语音定位得到的方位没有相对关系;
②假定座椅舱仍处于初始状态,通讯控制模块可以得到一个从初始状态旋转到现在用户方位所需要的角度;即以初始状态这个定义好的座椅舱旋转系零点为参考;
③提取回传到通讯控制模块的座椅舱从初始状态到工作状态1的旋转角度信息,与步骤②得到的角度做差,即可得到从工作状态1所在的角度旋转到现在用户方位所需要的角度;定义座椅舱朝向现在用户方位的状态为工作状态2;
下列情况下用户无法使座椅自动旋转:
①行车途中且车速超过一定数值时,儿童安全座椅旋转将被锁定,座椅舱只能处在正面朝向前座或背面朝向前座的两种角度下,定义此时为保护状态;
②用户没有使用唤醒词而是直接说出指令时,语义识别系统侦测不到唤醒词不会启动后续控制。
2.根据权利要求1所述的一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,其特征在于,通讯控制模块保留了通过必要的数据通讯实现其他形式的用户交互控制的功能,数据通讯形式可以是线束通讯、无线通信,交互形式可以是通过汽车中控、手持移动设备。
3.根据权利要求1所述的一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,其特征在于,所述的通讯控制模块还能接收其他传感器信息,同时通讯控制模块也能在车速超过一定值之后控制传动执行模块锁定在座椅舱正向前座或背向前座的方位,以保证安全。
4.根据权利要求1所述的一种基于语义识别和语音定位的儿童安全座椅旋转控制方法,其特征在于,所述的步骤(2)中,利用深度学习模型进行语音定位主要是基于提前训练好的深度学习神经网络模型实现,具体如下:
①语音定位基于声音到达每一个声音传感器时在频率、强度以及时间数据上的差别实现;
②采集安静环境下和车载嘈杂环境下的语音指令作为训练数据,构建深度学习模型的训练集;
③提取安静环境和车载嘈杂环境下获得声音数据的信号特征,再将其输入到神经网络中进行学习训练,最后获得声源方位的目标输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282068.8A CN114743552A (zh) | 2022-03-22 | 2022-03-22 | 基于语义识别和语音定位的儿童安全座椅旋转控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282068.8A CN114743552A (zh) | 2022-03-22 | 2022-03-22 | 基于语义识别和语音定位的儿童安全座椅旋转控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114743552A true CN114743552A (zh) | 2022-07-12 |
Family
ID=82277069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210282068.8A Pending CN114743552A (zh) | 2022-03-22 | 2022-03-22 | 基于语义识别和语音定位的儿童安全座椅旋转控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114743552A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116160928A (zh) * | 2023-03-02 | 2023-05-26 | 重庆赛力斯新能源汽车设计院有限公司 | 车辆座椅旋转控制方法、设备及介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0472356A1 (en) * | 1990-08-16 | 1992-02-26 | Fujitsu Ten Limited | Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated |
KR100681174B1 (ko) * | 2005-11-08 | 2007-02-09 | 현대자동차주식회사 | 시트벨트 제어시스템 및 그 제어방법 |
CA2544897A1 (en) * | 2006-03-02 | 2007-09-02 | Mattel, Inc. | Repositionable child support device |
KR20090028151A (ko) * | 2007-09-14 | 2009-03-18 | 주식회사 케이티프리텔 | 본인 음성 기반의 tts 서비스 제공 장치와 시스템 및 그방법 |
CN103043003A (zh) * | 2012-12-24 | 2013-04-17 | 朱佩芬 | 车载儿童安全保障系统 |
CN104934033A (zh) * | 2015-04-21 | 2015-09-23 | 深圳市锐曼智能装备有限公司 | 机器人的声源定位、唤醒识别的控制方法及其控制系统 |
KR20170099485A (ko) * | 2016-02-24 | 2017-09-01 | 현대자동차주식회사 | 사운드 수신 장치, 그를 가지는 차량 및 그 제어 방법 |
CN109624803A (zh) * | 2018-12-28 | 2019-04-16 | 麦克英孚(宁波)婴童用品有限公司 | 一种儿童安全座椅、其旋转调节机构及调节方法 |
JP2019073242A (ja) * | 2017-10-19 | 2019-05-16 | 株式会社カーメイト | チャイルドシート |
CN109835221A (zh) * | 2019-02-22 | 2019-06-04 | 麦克英孚(宁波)婴童用品有限公司 | 一种旋转式儿童安全座椅电控系统及其操作方法 |
CN110070868A (zh) * | 2019-04-28 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 车载系统的语音交互方法、装置、汽车和机器可读介质 |
CN111140531A (zh) * | 2020-01-02 | 2020-05-12 | 珠海格力电器股份有限公司 | 风扇及其语音控制方法 |
CN113071389A (zh) * | 2021-04-30 | 2021-07-06 | 东风汽车集团股份有限公司 | 一种儿童安全座椅智能控制系统及方法 |
-
2022
- 2022-03-22 CN CN202210282068.8A patent/CN114743552A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0472356A1 (en) * | 1990-08-16 | 1992-02-26 | Fujitsu Ten Limited | Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated |
KR100681174B1 (ko) * | 2005-11-08 | 2007-02-09 | 현대자동차주식회사 | 시트벨트 제어시스템 및 그 제어방법 |
CA2544897A1 (en) * | 2006-03-02 | 2007-09-02 | Mattel, Inc. | Repositionable child support device |
KR20090028151A (ko) * | 2007-09-14 | 2009-03-18 | 주식회사 케이티프리텔 | 본인 음성 기반의 tts 서비스 제공 장치와 시스템 및 그방법 |
CN103043003A (zh) * | 2012-12-24 | 2013-04-17 | 朱佩芬 | 车载儿童安全保障系统 |
CN104934033A (zh) * | 2015-04-21 | 2015-09-23 | 深圳市锐曼智能装备有限公司 | 机器人的声源定位、唤醒识别的控制方法及其控制系统 |
KR20170099485A (ko) * | 2016-02-24 | 2017-09-01 | 현대자동차주식회사 | 사운드 수신 장치, 그를 가지는 차량 및 그 제어 방법 |
JP2019073242A (ja) * | 2017-10-19 | 2019-05-16 | 株式会社カーメイト | チャイルドシート |
CN109624803A (zh) * | 2018-12-28 | 2019-04-16 | 麦克英孚(宁波)婴童用品有限公司 | 一种儿童安全座椅、其旋转调节机构及调节方法 |
CN109835221A (zh) * | 2019-02-22 | 2019-06-04 | 麦克英孚(宁波)婴童用品有限公司 | 一种旋转式儿童安全座椅电控系统及其操作方法 |
CN110070868A (zh) * | 2019-04-28 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 车载系统的语音交互方法、装置、汽车和机器可读介质 |
CN111140531A (zh) * | 2020-01-02 | 2020-05-12 | 珠海格力电器股份有限公司 | 风扇及其语音控制方法 |
CN113071389A (zh) * | 2021-04-30 | 2021-07-06 | 东风汽车集团股份有限公司 | 一种儿童安全座椅智能控制系统及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116160928A (zh) * | 2023-03-02 | 2023-05-26 | 重庆赛力斯新能源汽车设计院有限公司 | 车辆座椅旋转控制方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106379310B (zh) | 一种语音控制车辆巡航的系统及其方法 | |
US11545146B2 (en) | Techniques for language independent wake-up word detection | |
US20200047687A1 (en) | Exterior speech interface for vehicle | |
CN109767769B (zh) | 一种语音识别方法、装置、存储介质及空调 | |
CN102233191A (zh) | 一种兼有语音控制功能的航模 | |
US10490207B1 (en) | Automated speech recognition using a dynamically adjustable listening timeout | |
US9202465B2 (en) | Speech recognition dependent on text message content | |
CN104986040A (zh) | 一种语音识别汽车车速控制器及其控制方法 | |
JP4899685B2 (ja) | 手動操作システム | |
CN114743552A (zh) | 基于语义识别和语音定位的儿童安全座椅旋转控制方法 | |
DE102008062542A1 (de) | Fahrzeuginterne die Umstände berücksichtigende Spracherkennung | |
CN108382155B (zh) | 一种带提醒功能的空调语音控制装置 | |
CN102324035A (zh) | 口型辅助语音识别术在车载导航中应用的方法及系统 | |
CN110936797A (zh) | 一种汽车天窗控制方法及电子设备 | |
CN109203941A (zh) | 一种具有语音控制功能的天窗控制系统及其控制方法 | |
CN112735408A (zh) | 一种汽车座椅的语音控制系统及控制方法 | |
CN107146603A (zh) | 汽车座椅的语音控制系统及其控制方法 | |
WO2018233300A1 (zh) | 语音识别方法和语音识别装置 | |
CN201240321Y (zh) | 声控汽车后视镜 | |
CN113228167B (zh) | 一种语音控制方法及装置 | |
CN106114518A (zh) | 一种语音输入可控的巡航系统及车辆 | |
CN114194122B (zh) | 一种安全提示系统及汽车 | |
CN210222569U (zh) | 一种无人机控制装置 | |
WO2021024678A1 (ja) | 自動車の加速制御システム、方法、プログラム | |
CN104724157A (zh) | 一种对人眼位置准确定位的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |