CN116039653B - 状态识别方法、装置、车辆及存储介质 - Google Patents
状态识别方法、装置、车辆及存储介质 Download PDFInfo
- Publication number
- CN116039653B CN116039653B CN202310344209.9A CN202310344209A CN116039653B CN 116039653 B CN116039653 B CN 116039653B CN 202310344209 A CN202310344209 A CN 202310344209A CN 116039653 B CN116039653 B CN 116039653B
- Authority
- CN
- China
- Prior art keywords
- target
- vehicle
- state data
- user
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/08—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开涉及自动驾驶技术领域,尤其涉及一种状态识别方法、装置、车辆及存储介质,可以获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态,有效提高对行车过程中车内用户的情绪识别的准确率。
Description
技术领域
本公开涉及自动驾驶技术领域,尤其涉及一种状态识别方法、装置、车辆及存储介质。
背景技术
随着汽车的普及以及汽车智能化的起步,人们的生活愈发的离不开汽车,并且人们对汽车良好体验的需求也逐渐增加,例如希望汽车懂得自己的情感与需求,并在自己需要服务的时候主动提供更智能化、更人性化地服务,因此有必要对车内人员的情绪状态进行识别。另外,在汽车驾驶中,行驶安全最为重要,驾驶员驾驶时的愤怒情绪与交通事故的关系愈发的明显,所以了解驾驶员情绪的变化也有助于避免交通事故的发生。
发明内容
为克服相关技术中存在的问题,本公开提供一种状态识别方法、装置、车辆及存储介质。
根据本公开实施例的第一方面,提供一种状态识别方法,包括:获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态。
可选地,所述行驶状态数据包括所述车辆采集的时间序列行驶状态数据,所述用户状态数据包括所述车辆采集的时间序列用户状态数据;所述根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态包括:
根据预设历史时间段内采集的目标时间序列行驶状态数据和所述预设历史时间段内采集的目标时间序列用户状态数据,通过预先训练得到的目标分类模型确定所述目标情绪状态。
可选地,所述预设历史时间段包括多个历史时刻,所述根据预设历史时间段内采集的目标时间序列行驶状态数据和所述预设历史时间段内采集的目标时间序列用户状态数据,通过预先训练得到的目标分类模型确定所述目标情绪状态包括:
针对每个所述历史时刻,将所述历史时刻采集的时间序列行驶状态数据和所述历史时刻采集的时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量;
根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量;
将所述第一融合向量输入所述目标分类模型,得到所述目标情绪状态。
可选地,所述目标时间序列用户状态数据包括所述预设历史时间段内采集的所述用户的视觉数据和/或音频数据。
可选地,所述方法还包括:
将所述音频数据输入预先训练得到的语音识别模型,得到所述音频数据对应的文本信息;
获取所述文本信息对应的文本向量;
将所述文本向量和所述第一融合向量进行向量拼接后,得到第二融合向量;
所述将所述第一融合向量输入所述目标分类模型,得到所述目标情绪状态包括:
将所述第二融合向量输入所述目标分类模型,得到所述目标情绪状态。
可选地,所述行驶状态数据包括以下数据中的至少一种:
所述车辆的行驶速度;
所述车辆的刹车数据;
所述车辆的油门数据;
所述车辆的车窗状态;
所述车辆的喇叭状态。
可选地,所述方法还包括:
根据所述目标情绪状态控制所述车辆执行预设操作。
可选地,所述预设操作包括:
获取所述目标情绪状态对应的目标多媒体素材;
向所述目标用户推荐所述目标多媒体素材。
根据本公开实施例的第二方面,提供一种状态识别装置,包括:
获取模块,被配置为获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
识别模块,被配置为根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态。
根据本公开实施例的第三方面,提供一种车辆,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的状态识别方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:在识别行车过程中车辆内目标用户的情绪状态时,除了根据车辆内用户的用户状态数据,还考虑了车辆的行驶状态数据,例如,车辆的急加速、减速、一段时间内按喇叭的次数、油门踩踏力度、刹车时的制动力度等行驶状态数据都有助于更好地识别出驾驶员的情绪,相比较于传统的仅基于用户状态数据识别目标用户的情绪状态,可以有效提高对行车过程中驾驶员情绪识别的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种状态识别方法的流程图。
图2是根据图1所示实施例示出的一种状态识别方法的流程图。
图3是根据图2所示实施例示出的一种状态识别方法的流程图。
图4是根据图1所示实施例示出的一种状态识别方法的流程图。
图5是根据一示例性实施例示出的一种状态识别装置框图。
图6是根据图5所示实施例示出的一种状态识别装置的框图。
图7是根据图5所示实施例示出的一种状态识别装置的框图。
图8是根据一示例性实施例示出的一种车辆的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
情绪识别是一个非常有实际价值的任务,在客服质量、公共安全等方面都有重要作用。现有的方案都是利用被检测人说话的文字、说话的声音、面部的表情这三维特征中的一个或者几个联合建模,判断出被检测人的情绪状态。行车过程中对车内人员(如驾驶员)的情绪识别,也有非常重要的意义,一方面识别出驾驶员的愤怒情绪,进行有效的干预,可以提高行车的安全性;另一方面,还可以针对不同的情绪,提供更智能化、更人性化地服务,例如推荐不同的音乐/电台等内容。
若仅依靠说话人的声音、面部表情对行车过程中的车内人员进行情绪识别,识别结果不能准确反应车内人员的真实情绪状态。
为解决上述存在的问题,本公开提供一种状态识别方法、装置、车辆及存储介质,下面结合附图对本公开的具体实施方式进行详细说明。
图1是根据一示例性实施例示出的一种状态识别方法的流程图,如图1所示,该方法可以应用于车辆中,包括以下步骤。
在步骤S11中,获取车辆的行驶状态数据和所述车辆内用户的用户状态数据。
其中,该行驶状态数据可以包括以下数据中的至少一种:车辆的行驶速度、车辆的刹车数据(如制动强度)、车辆的油门数据以及车辆的车窗状态等。该用户状态数据可以包括采集的车内用户的视觉数据和/或音频数据,该车内用户可以包括驾驶员,还可以进一步包括车内除驾驶员以外的其他人员。
一种可能的实现方式中,可以通过车辆上设置的麦克风阵列持续收集音频数据,通过前置摄像头收集车内人员的视觉数据。
还需要说明的是,该行驶状态数据和该用户状态数据均为时间序列数据,即可以持续采集每个预设时刻分别对应的行驶状态数据得到时间序列行驶状态数据,并持续采集每个预设时刻分别对应的用户状态数据,得到时间序列用户状态数据。
在步骤S12中,根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态。
其中,该目标用户可以包括驾驶员,该目标情绪状态可以包括喜、怒、哀、惧、其他等多种情绪中的任一情绪状态;该目标情绪状态还可以包括疲倦、精力充沛、一般等任一情绪状态。
采用上述方法,在识别行车过程中车辆内目标用户的情绪状态时,除了根据车辆内用户的用户状态数据,还考虑了车辆的行驶状态数据,例如,车辆的急加速、减速、一段时间内按喇叭的次数、油门踩踏力度、刹车时的制动力度等行驶状态数据都有助于更好地识别出驾驶员的情绪,相比较于传统的仅基于用户状态数据识别目标用户的情绪状态,可以有效提高对行车过程中驾驶员情绪识别的准确率。
图2是根据图1所示实施例示出的一种状态识别方法的流程图,如图2所示,步骤S12包括以下子步骤:
在步骤S121中,根据预设历史时间段内采集的目标时间序列行驶状态数据和所述预设历史时间段内采集的目标时间序列用户状态数据,通过预先训练得到的目标分类模型确定所述目标情绪状态。
其中,该目标分类模型可以为预先训练得到的全连接神经网络模型。这里的预设历史时间段可以包括多个历史时刻,在本步骤中,可以根据多个历史时刻分别采集的行驶状态数据和用户状态数据,通过该目标分类模型确定该目标情绪状态。
图3是根据图2所示实施例示出的一种状态识别方法的流程图,如图3所示,步骤S121包括以下子步骤:
在步骤S1211中,针对每个所述历史时刻,将所述历史时刻采集的时间序列行驶状态数据和所述历史时刻采集的时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量。
示例地,假设该用户状态数据包括采集的驾驶员的音频数据和图像数据,该预设历史时间段包括50个历史时刻(或者称之为数据采集时刻),即车辆在每个历史时刻均采集车辆对应时刻的行驶状态数据和用户状态数据,这样,针对这50个历史时刻的每个历史时刻,可以将该历史时刻采集的驾驶员的音频数据进行编码得到音频向量表示,将该历史时刻采集的驾驶员的图像数据进行编码,得到视觉数据的向量表示,将该历史时刻采集的行驶状态数据进行编码得到行驶状态数据的向量表示,然后将该历史时刻对应的音频向量表示、视觉数据的向量表示以及行驶状态数据的向量表示进行向量拼接(例如可以是向量元素的首尾拼接)后,得到该历史时刻对应的数据拼接向量,在执行本步骤后,可以得到50个历史时刻分别对应的数据拼接向量,上述示例仅是举例说明,本公开对此不作限定。
在步骤S1212中,根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量。
其中,该编码模型例如可以包括循环神经网络模型、Transformer模型等时间序列模型。该第一融合向量可以理解为根据多个历史时刻分别对应的数据拼接向量预测得到的当前时刻的数据(包括行驶状态数据和用户状态数据)的向量表示,即将一段时间(即预设历史时间段)内各个时刻的数据信息融合至一个向量中进行表示。
举例来说,可以将步骤S1211中得到的50个历史时刻分别对应的数据拼接向量输入该编码模型后,通过该编码模型输出该第一融合向量,该第一融合向量即为根据50个历史时刻分别采集的行驶状态数据和用户状态数据预测得到的当前时刻的数据(包括行驶状态数据和用户状态数据)的向量表示。
需要说明的是,该第一融合向量可以反映驾驶员在该预设时间段内的情绪状态的变化(如是否一直处于愤怒的状态),还可以反映该车辆在该预设历史时间段内车辆行驶状态的变化,例如是否紧急刹车,且紧急刹车的频率较高,是否突然加速,按喇叭的次数也较高等,可以理解的是,该预设时间段内驾驶员在该预设时间段内的情绪状态的变化、以及该车辆在该预设历史时间段内车辆行驶状态的变化均会影响或者反映出驾驶员当前时刻的目标情绪状态,因此,在本步骤中,可以根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,以便后续可以将所述第一融合向量输入所述目标分类模型,得到所述目标情绪状态。
在步骤S1213中,将所述第一融合向量输入所述目标分类模型,得到所述目标情绪状态。
这里的目标分类模型在进行预先训练的过程中,需要综合考虑实际的行车场景中可能出现的各种对驾驶员情绪造成影响的因素,以及驾驶员针对不同的场景可能会有的情绪状态,这样,可以将驾驶员可能出现的情绪状态作为训练标签,将不同情绪状态分别对应的用户状态数据和行驶状态数据作为训练输入样本对模型进行训练,得到该目标分类模型。
上述已经提及,该目标时间序列用户状态数据可以包括所述预设历史时间段内采集的所述用户的视觉数据和/或音频数据,该视觉数据可以包括采集的用户视频画面中的每帧图像数据。
考虑到驾驶员音频数据中的文字信息一定程度上也可以反应出驾驶员的情绪状态,例如,驾驶员音频数据中的用词较悲观,或者较犀利等都能反映出驾驶员当前的情绪状态,因此,在本公开又一种可能的实现方式中,还可以将所述音频数据输入预先训练得到的语音识别模型,得到所述音频数据对应的文本信息;该语音识别模型可以然后获取该文本信息对应的文本向量,之后,可以将该文本向量和该第一融合向量进行向量拼接后,得到第二融合向量,这样,在确定该目标情绪状态时,可以将所述第二融合向量输入所述目标分类模型,得到所述目标情绪状态。
示例地,在一段时间内,从麦克风声音阵列采集的音频数据中检测到车内声音较大甚至有脏话,从前置摄像头采集的用户的视频数据中检测到用户脸色变红,从车辆行驶速度在一段时间内的变化检测到用户突然加速或者突然减速,将这些数据融合后的向量表示输入目标分类模型后,通过模型输出用户的该目标情绪状态为愤怒的状态。上述示例仅是举例说明,本公开对此不作限定。
图4是根据图1所示实施例示出的一种状态识别方法的流程图,如图4所示,该方法还包括以下步骤:
在步骤S13中,根据所述目标情绪状态控制所述车辆执行预设操作。
其中,该预设操作可以包括获取所述目标情绪状态对应的目标多媒体素材;向所述目标用户推荐所述目标多媒体素材。
一种可能的实现方式中,可以预先为不同的情绪状态设置与之对应的多媒体素材,并且不同的情绪状态对应的目标多媒体素材的风格(如欢快、宁静、可爱、动感等)不同,例如,若情绪状态为愤怒,与之对应的目标多媒体素材可以为轻松愉快的音乐、幽默的相声、小品等多媒体数据,若情绪状态为疲惫,与之对应的目标多媒体素材可以为动感的音乐,这里仅是举例说明,本公开对不同情绪状态分别对应的多媒体素材不作具体限定。
举例来说,假设识别到驾驶员的该目标情绪状态为愤怒状态,此时可以通过向目标用户推送欢快的音乐或者幽默的相声等措施,缓解驾驶员的愤怒情绪,从而提高行车的安全性。
采用上述方法,在识别行车过程中车辆内目标用户的情绪状态时,除了根据车辆内用户的用户状态数据,还考虑了车辆的行驶状态数据,例如,车辆的急加速、减速、一段时间内按喇叭的次数、油门踩踏力度、刹车时的制动力度等行驶状态数据都有助于更好地识别出驾驶员的情绪,相比较于传统的仅基于用户状态数据识别目标用户的情绪状态,可以有效提高对行车过程中驾驶员情绪识别的准确率。
图5是根据一示例性实施例示出的一种状态识别装置框图。参照图5,该装置包括:
获取模块501,被配置为获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
状态识别模块502,被配置为根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态。
可选地,所述行驶状态数据包括所述车辆采集的时间序列行驶状态数据,所述用户状态数据包括所述车辆采集的时间序列用户状态数据;所述状态识别模块502,被配置为根据预设历史时间段内采集的目标时间序列行驶状态数据和所述预设历史时间段内采集的目标时间序列用户状态数据,通过预先训练得到的目标分类模型确定所述目标情绪状态。
可选地,所述预设历史时间段包括多个历史时刻,所述状态识别模块502,被配置为针对每个所述历史时刻,将所述历史时刻采集的时间序列行驶状态数据和所述历史时刻采集的时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量;根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量;将所述第一融合向量输入所述目标分类模型,得到所述目标情绪状态。
可选地,所述目标时间序列用户状态数据包括所述预设历史时间段内采集的所述用户的视觉数据和/或音频数据。
可选地,图6是根据图5所示实施例示出的一种状态识别装置的框图,如图6所示,该装置还包括:
文本识别模块503,被配置为将所述音频数据输入预先训练得到的语音识别模型,得到所述音频数据对应的文本信息;获取所述文本信息对应的文本向量;
向量融合模块504,被配置为将所述文本向量和所述第一融合向量进行向量拼接后,得到第二融合向量;
所述状态识别模块502,被配置为将所述第二融合向量输入所述目标分类模型,得到所述目标情绪状态。
可选地,所述行驶状态数据包括以下数据中的至少一种:
所述车辆的行驶速度;
所述车辆的刹车数据;
所述车辆的油门数据;
所述车辆的车窗状态;
所述车辆的喇叭状态。
可选地,图7是根据图5所示实施例示出的一种状态识别装置的框图,如图7所示,该装置还包括:
控制模块505,被配置为根据所述目标情绪状态控制所述车辆执行预设操作。
可选地,所述预设操作包括:
获取所述目标情绪状态对应的目标多媒体素材;
向所述目标用户推荐所述目标多媒体素材。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
采用上述装置,在识别行车过程中车辆内目标用户的情绪状态时,除了根据车辆内用户的用户状态数据,还考虑了车辆的行驶状态数据,例如,车辆的急加速、减速、一段时间内按喇叭的次数、油门踩踏力度、刹车时的制动力度等行驶状态数据都有助于更好地识别出驾驶员的情绪,相比较于传统的仅基于用户状态数据识别目标用户的情绪状态,可以有效提高对行车过程中驾驶员情绪识别的准确率。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的状态识别方法的步骤。
图8是根据一示例性实施例示出的一种车辆的框图。例如,车辆800可以是混合动力车辆,也可以是非混合动力车辆、电动车辆、燃料电池车辆或者其他类型的车辆。车辆800可以是自动驾驶车辆、半自动驾驶车辆或者非自动驾驶车辆。
参照图8,车辆800可包括各种子系统,例如,信息娱乐系统810、感知系统820、决策控制系统830、驱动系统840以及计算平台850。其中,车辆800还可以包括更多或更少的子系统,并且每个子系统都可包括多个部件。另外,车辆800的每个子系统之间和每个部件之间可以通过有线或者无线的方式实现互连。
在一些实施例中,信息娱乐系统810可以包括通信系统,娱乐系统以及导航系统等。
感知系统820可以包括若干种传感器,用于感测车辆800周边的环境的信息。例如,感知系统820可包括全球定位系统(全球定位系统可以是GPS系统,也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit,IMU)、激光雷达、毫米波雷达、超声雷达以及摄像装置。
决策控制系统830可以包括计算系统、整车控制器、转向系统、油门以及制动系统。
驱动系统840可以包括为车辆800提供动力运动的组件。在一个实施例中,驱动系统840可以包括引擎、能量源、传动系统和车轮。引擎可以是内燃机、电动机、空气压缩引擎中的一种或者多种的组合。引擎能够将能量源提供的能量转换成机械能量。
车辆800的部分或所有功能受计算平台850控制。计算平台850可包括至少一个处理器851和存储器852,处理器851可以执行存储在存储器852中的指令853。
处理器851可以是任何常规的处理器,诸如商业可获得的CPU。处理器还可以包括诸如图像处理器(Graphic Process Unit,GPU),现场可编程门阵列(Field ProgrammableGate Array,FPGA)、片上系统(System on Chip,SOC)、专用集成芯片(ApplicationSpecific Integrated Circuit,ASIC)或它们的组合。
存储器852可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
除了指令853以外,存储器852还可存储数据,例如道路地图,路线信息,车辆的位置、方向、速度等数据。存储器852存储的数据可以被计算平台850使用。
在本公开实施例中,处理器851可以执行指令853,以完成上述的状态识别方法的全部或部分步骤。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的状态识别方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (9)
1.一种状态识别方法,其特征在于,包括:
获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态;
所述行驶状态数据包括所述车辆在预设历史时间段内采集的目标时间序列行驶状态数据,所述用户状态数据包括所述车辆在所述预设历史时间段内采集的目标时间序列用户状态数据;所述预设历史时间段包括多个历史时刻;
所述根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态包括:
针对每个所述历史时刻,将所述历史时刻采集的目标时间序列行驶状态数据和所述历史时刻采集的目标时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量;
根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量;
将所述第一融合向量输入目标分类模型,得到所述目标情绪状态。
2.根据权利要求1所述的方法,其特征在于,所述目标时间序列用户状态数据包括所述预设历史时间段内采集的所述用户的视觉数据和/或音频数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述音频数据输入预先训练得到的语音识别模型,得到所述音频数据对应的文本信息;
获取所述文本信息对应的文本向量;
将所述文本向量和所述第一融合向量进行向量拼接后,得到第二融合向量;
所述将所述第一融合向量输入目标分类模型,得到所述目标情绪状态包括:
将所述第二融合向量输入所述目标分类模型,得到所述目标情绪状态。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述行驶状态数据包括以下数据中的至少一种:
所述车辆的行驶速度;
所述车辆的刹车数据;
所述车辆的油门数据;
所述车辆的车窗状态;
所述车辆的喇叭状态。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
根据所述目标情绪状态控制所述车辆执行预设操作。
6.根据权利要求5所述的方法,其特征在于,所述预设操作包括:
获取所述目标情绪状态对应的目标多媒体素材;
向所述目标用户推荐所述目标多媒体素材。
7.一种状态识别装置,其特征在于,包括:
获取模块,被配置为获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
状态识别模块,被配置为根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态;
所述行驶状态数据包括所述车辆在预设历史时间段内采集的目标时间序列行驶状态数据,所述用户状态数据包括所述车辆在所述预设历史时间段内采集的目标时间序列用户状态数据;所述预设历史时间段包括多个历史时刻;
所述状态识别模块,被配置为针对每个所述历史时刻,将所述历史时刻采集的目标时间序列行驶状态数据和所述历史时刻采集的目标时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量;根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量;将所述第一融合向量输入目标分类模型,得到所述目标情绪状态。
8.一种车辆,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取车辆的行驶状态数据和所述车辆内用户的用户状态数据;
根据所述行驶状态数据和所述用户状态数据识别所述车辆内目标用户当前的目标情绪状态;
所述行驶状态数据包括所述车辆在预设历史时间段内采集的目标时间序列行驶状态数据,所述用户状态数据包括所述车辆在所述预设历史时间段内采集的目标时间序列用户状态数据;所述预设历史时间段包括多个历史时刻;
所述处理器还被配置为:
针对每个所述历史时刻,将所述历史时刻采集的目标时间序列行驶状态数据和所述历史时刻采集的目标时间序列用户状态数据进行向量拼接,得到所述历史时刻对应的数据拼接向量;
根据多个所述历史时刻分别对应的所述数据拼接向量,通过预先训练得到的编码模型得到第一融合向量,所述第一融合向量表征将所述目标时间序列行驶状态数据和所述目标时间序列用户状态数据进行数据融合后的特征向量;
将所述第一融合向量输入目标分类模型,得到所述目标情绪状态。
9.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344209.9A CN116039653B (zh) | 2023-03-31 | 2023-03-31 | 状态识别方法、装置、车辆及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344209.9A CN116039653B (zh) | 2023-03-31 | 2023-03-31 | 状态识别方法、装置、车辆及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116039653A CN116039653A (zh) | 2023-05-02 |
CN116039653B true CN116039653B (zh) | 2023-07-04 |
Family
ID=86118660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310344209.9A Active CN116039653B (zh) | 2023-03-31 | 2023-03-31 | 状态识别方法、装置、车辆及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116039653B (zh) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875682A (zh) * | 2018-06-29 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN110262665A (zh) * | 2019-06-26 | 2019-09-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN111737474B (zh) * | 2020-07-17 | 2021-01-12 | 支付宝(杭州)信息技术有限公司 | 业务模型的训练和确定文本分类类别的方法及装置 |
CN112083806B (zh) * | 2020-09-16 | 2021-10-26 | 华南理工大学 | 一种基于多模态识别的自学习情感交互方法 |
CN112466336B (zh) * | 2020-11-19 | 2023-05-05 | 平安科技(深圳)有限公司 | 基于语音的情绪识别方法、装置、设备及存储介质 |
CN114973209A (zh) * | 2021-02-20 | 2022-08-30 | 宝马股份公司 | 识别驾驶员情绪的方法、装置、设备、介质和车辆 |
CN114021524B (zh) * | 2021-09-29 | 2024-02-27 | 苏州浪潮智能科技有限公司 | 一种情感识别方法、装置、设备及可读存储介质 |
CN113946661A (zh) * | 2021-12-21 | 2022-01-18 | 南京云问网络技术有限公司 | 一种融合字形的多视角情感分析方法 |
CN114756667B (zh) * | 2022-04-19 | 2024-07-16 | 平安科技(深圳)有限公司 | 基于人工智能的对话生成方法、装置、设备及存储介质 |
CN114969338A (zh) * | 2022-05-25 | 2022-08-30 | 北京理工大学 | 一种基于异质融合和对称翻译的图文情感分类方法及系统 |
CN115203409A (zh) * | 2022-06-27 | 2022-10-18 | 北京理工大学 | 一种基于门控融合和多任务学习的视频情感分类方法 |
CN115168642A (zh) * | 2022-08-08 | 2022-10-11 | 星河智联汽车科技有限公司 | 一种车载音乐推荐方法、装置、设备、存储介质及车辆 |
-
2023
- 2023-03-31 CN CN202310344209.9A patent/CN116039653B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN116039653A (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11003414B2 (en) | Acoustic control system, apparatus and method | |
CN111402925B (zh) | 语音调节的方法、装置、电子设备、车载系统和可读介质 | |
CN109455180B (zh) | 用于控制无人车的方法和装置 | |
Jafarnejad et al. | Towards a real-time driver identification mechanism based on driving sensing data | |
CN103810995B (zh) | 用于语音系统的调节方法和系统 | |
CN108346430A (zh) | 对话系统、具有对话系统的车辆以及对话处理方法 | |
CN110876047A (zh) | 车外投影方法、装置、设备和存储介质 | |
CN110286745B (zh) | 对话处理系统、具有对话处理系统的车辆及对话处理方法 | |
EP3570276A1 (en) | Dialogue system, and dialogue processing method | |
KR102403355B1 (ko) | 차량, 그와 통신하는 모바일 기기 및 차량의 제어 방법 | |
US20200013396A1 (en) | Dialogue system and dialogue processing method | |
CN114973209A (zh) | 识别驾驶员情绪的方法、装置、设备、介质和车辆 | |
CN111540222A (zh) | 基于无人车的智能交互方法、装置及无人车 | |
CN113799789A (zh) | 融合紧急车辆音频和视觉检测的机器学习模型 | |
CN110503947A (zh) | 对话系统、包括其的车辆和对话处理方法 | |
CN111797755A (zh) | 一种汽车乘员情绪识别方法及电子设备 | |
CN116039653B (zh) | 状态识别方法、装置、车辆及存储介质 | |
CN110826433B (zh) | 试驾用户情绪分析数据处理方法、装置、设备与存储介质 | |
CN110297617B (zh) | 一种主动对话的发起方法和装置 | |
CN112534499B (zh) | 声音对话装置、声音对话系统以及声音对话装置的控制方法 | |
CN116483305A (zh) | 智能网联汽车数字虚拟人应用系统及其使用方法、车辆 | |
CN115859219A (zh) | 多模态交互方法、装置、设备及存储介质 | |
CN110562260A (zh) | 对话系统和对话处理方法 | |
CN115113739A (zh) | 用于生成表情符号的装置、车辆和用于生成表情符号的方法 | |
US11450209B2 (en) | Vehicle and method for controlling thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |