CN113370923B - 一种车辆配置的调整方法、装置、电子设备及存储介质 - Google Patents
一种车辆配置的调整方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113370923B CN113370923B CN202110838263.XA CN202110838263A CN113370923B CN 113370923 B CN113370923 B CN 113370923B CN 202110838263 A CN202110838263 A CN 202110838263A CN 113370923 B CN113370923 B CN 113370923B
- Authority
- CN
- China
- Prior art keywords
- scene category
- feature extraction
- semantic
- determining
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000000605 extraction Methods 0.000 claims description 115
- 238000001228 spectrum Methods 0.000 claims description 62
- 238000004590 computer program Methods 0.000 claims description 23
- 238000013135 deep learning Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000002386 air freshener Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/023—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
- B60R16/0231—Circuits relating to the driving or the functioning of the vehicle
- B60R16/0232—Circuits relating to the driving or the functioning of the vehicle for measuring vehicle parameters and indicating critical, abnormal or dangerous conditions
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Mechanical Engineering (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请适用于车辆技术领域,提供一种车辆配置的调整方法、装置、电子设备及存储介质,方法包括:采集车内的语音信息;根据所述语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据所述车辆配置对车辆进行配置参数的调整。可根据车内的语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据车辆配置自动对车辆进行配置参数的调整,操作简单,能智能的根据场景调节配置参数,提高了智能性和用户体验。
Description
技术领域
本申请属于车辆技术领域,尤其涉及一种车辆配置的调整方法、装置、电子设备及存储介质。
背景技术
随着社会的持续快速发展,汽车保有量不断增加,汽车配套的功能也越来越重要。在开始驾驶前或驾驶过程中,乘员通常都会进行各种个性化设置,例如收听自己爱听的电台或者音乐,开启车内的灯光等。
目前这些个性化设置,需要自己手动进行设置,操作繁琐,智能性低且用户体验不高。
发明内容
本申请实施例提供了一种车辆配置的调整方法、装置、电子设备及存储介质,旨在解决现有对车辆的个性化设置的操作繁琐,智能性低且用户体验不高的问题。
第一方面,本申请实施例提供了一种车辆配置的调整方法,包括:
采集车内的语音信息;
根据所述语音信息,确定对应的目标场景类别;
获取与所述目标场景类别关联的车辆配置;
根据所述车辆配置对车辆进行配置参数的调整。
在一个实施例中,在获取与所述目标场景类别关联的车辆配置之前,还包括:
根据语音特征、场景类别及车辆配置建立关联数据库,所述语音特征包括语义特征、声学特征。
在一个实施例中,所述根据所述语音信息,确定对应的目标场景类别,包括:对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。
在一个实施例中,所述根据所述语音信息,确定对应的目标场景类别,还包括:对所述语音信息进行语义特征提取,得到语义特征提取结果;将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景。
在一个实施例中,所述根据所述语音信息,确定对应的目标场景类别,还包括:对所述语音信息进行语义特征提取,得到语义特征提取结果;
对所述语音信息进行声学特征提取,得到声学特征提取结果;
确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,并作为所述目标场景类别。
在一个实施例中,确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,包括:
根据所述语义特征提取结果,确定与每个场景类别的第一匹配度;
根据所述声学特征提取结果,确定与每个场景类别的第二匹配度;
根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值;
在所述关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为所述目标场景类别。
在一个实施例中,所述语义特征结果包括多个语义关键词,所述声学特性结果包括声学频谱;根据所述语义特征提取结果,确定与每个场景类别的第一匹配度,包括:
根据所述多个语义关键词,在每个场景类别对应存储的语义词中检索出与所述多个语义关键词中任一个语义关键词相同的所有目标语义词,根据检索结果确定所述语义特征结果与每个场景类别之间的相似度,并作为所述第一匹配度;
对应地,根据所述声学特征提取结果,确定与每个场景类别的第二匹配度,包括:
根据所述声学频谱,确定每个场景类别对应存储的多个预设声学频谱与所述声学频谱之间的相似度,将每个场景类别中目标预设声学频谱与所述声学频谱之间的相似度作为第二匹配度;其中,目标预设声学频谱为每个场景类别中各个预设声学频谱与所述声学频谱之间的相似度最高的预设声学频谱。
第二方面,本申请实施例提供了一种车辆配置的调整装置,包括:
采集模块,用于采集车内的语音信息;
确定模块,用于根据所述语音信息,确定对应的目标场景类别;
获取模块,用于获取与所述目标场景类别关联的车辆配置;
调整模块,用于根据所述车辆配置对车辆进行配置参数的调整。
在一个实施例中,所述调整装置还包括:
建立模块,用于根据语音特征、场景类别及车辆配置建立关联数据库,所述语音特征包括语义特征、声学特征。
在一个实施例中,所述确定模块具体用于:对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。
在一个实施例中,所述确定模块具体用于:对所述语音信息进行语义特征提取,得到语义特征提取结果;将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景。
在一个实施例中,所述确定模块还包括:
第一提取单元,用于对所述语音信息进行语义特征提取,得到语义特征提取结果;
第二提取单元,用于对所述语音信息进行声学特征提取,得到声学特征提取结果;
确定单元,用于确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,并作为所述目标场景类别。
在一个实施例中,所述确定单元包括:
第一确定子单元,用于根据所述语义特征提取结果,确定与每个场景类别的第一匹配度;
第二确定子单元,用于根据所述声学特征提取结果,确定与每个场景类别的第二匹配度;
第三确定子单元,用于根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值;
场景确定单元,用于在所述关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为所述目标场景类别。
在一个实施例中,所述语义特征结果包括多个语义关键词,所述声学特性结果包括声学频谱;所述第一确定子单元具体用于:根据所述多个语义关键词,在每个场景类别对应存储的语义词中检索出与所述多个语义关键词中任一个语义关键词相同的所有目标语义词,根据检索结果确定所述语义特征结果与每个场景类别之间的相似度,并作为所述第一匹配度;
对应地,所述第二确定子单元具体用于:根据所述声学频谱,确定每个场景类别对应存储的多个预设声学频谱与所述声学频谱之间的相似度,将每个场景类别中目标预设声学频谱与所述声学频谱之间的相似度作为第二匹配度;其中,目标预设声学频谱为每个场景类别中各个预设声学频谱与所述声学频谱之间的相似度最高的预设声学频谱。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述车辆配置的调整方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现上述车辆配置的调整方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述车辆配置的调整方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例采集车内的语音信息;根据所述语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据所述车辆配置对车辆进行配置参数的调整。可根据车内的语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据车辆配置自动对车辆进行配置参数的调整,操作简单,能智能的根据场景调节配置参数,提高了智能性和用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的车辆配置的调整方法的流程示意图;
图2是本申请实施例二提供的车辆配置的调整方法的流程示意图;
图3是本申请实施例三提供的车辆配置的调整方法的流程示意图;
图4是本申请实施例四提供的车辆配置的调整方法的流程示意图;
图5是本申请实施例四中步骤S404的具体流程示意图;
图6是本申请实施例五提供的车辆配置的调整装置的结构示意图;
图7是本申请实施例六提供的电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统模块结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统模块、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
本申请实施例提供的车辆配置的调整方法,可以应用于电子设备,所述电子设备可以是车载设备;或者与车辆进行通信连接的电子设备,如所述电子设备通过与车辆中的车载诊断系统进行有线或无线连接,从而实现电子设备与车辆的通信连接,如所述电子设备可以是诊断仪、诊断设备、手机、平板电脑、笔记本电脑、上网本、个人数字助理(personaldigital assistant,PDA)等终端,本申请实施例对电子设备的具体类型不作任何限制。
为了说明本申请所述的技术方案,下面通过具体实施例进行说明。
实施例一
请参阅图1,示出了本申请实施例提供的车辆配置的调整方法的示意性流程图,所述方法包括:
步骤S101,采集车内的语音信息。
具体地,可以在车内设置音频采集设备,通过音频采集设备采集车内的语音信息。所述音频采集设备可以是麦克风等类型的音频采集设备。
步骤S102,根据所述语音信息,确定对应的目标场景类别。
具体地,可对语音信息中的语音内容进行特征分析后,得到语义特征提取结果,根据语义特征提取结果确定对应的目标场景类别。
在一个实施例中,在获取与所述目标场景类别关联的车辆配置之前还包括:根据语音特征、场景类别及车辆配置建立关联数据库,所述语音特征包括语义特征、声学特征。
具体地,预先建立包括语音特征、场景类别及车辆配置之间关联关系的关联数据库,所述语音特征包括语义特征,或者所述语音特征包括声学特征,或者所述语音特征包括语义特征和声学特征。基于关联数据库,根据语音信息中的语音特征可确定出对应的目标场景类别,根据目标场景类别可确定出对应的车辆配置。
在一个实施例中,将采集的语音信息转化为文字信息,对文字信息通过语义特征提取算法进行语义特征提取,得到语义特征提取结果,所述语义特征提取结果可包括多个语义关键词的语句信息。根据语义特征提取结果确认与语义特征结果对应的目标场景类别,如根据语义特征结果中包括的多个语义关键词,确定该多个语义关键词关联的目标场景类别。预先建立不同场景与对应多个语义关键词间的关联关系并存储在关联数据库中。基于该关联关系,根据语义特征结果中包括的多个语义关键词,确定该多个语义关键词关联的目标场景类别。所述目标场景类别包括但不限于日常聊天场景、欢乐聊天场景或商务洽谈场景。
步骤S103,获取与所述目标场景类别关联的车辆配置。
具体地,在关联数据库中预先将不同场景类别关联对应的车辆配置,所述车辆配置可以是车内多种执行设备分别对应的工作参数。从而可获取目标场景类别关联的车辆配置。
步骤S104,根据所述车辆配置对车辆进行配置参数的调整。
具体地,根据所述车辆配置对车辆相关配置参数进行调整。如根据车辆中多种执行设备分别对应的配置参数进行调整,可控制对应的执行设备进行工作,从而配置好车内的场景氛围。
在一个实施例中,所述配置参数包括车内氛围灯的第一配置参数,车内多媒体数据的类别以及车载空气净化器的第二配置参数中的一种或多种参数;可根据所述第一配置参数调节所述车内氛围灯,以使所述氛围灯的灯效与所述目标场景类别匹配;播放与所述车内多媒体数据的类别对应的多媒体数据;根据所述第二配置参数控制所述车载空气净化器的工作模式,以使所述车载空气净化器的工作模式与所述目标场景类别匹配。
具体地,每一种场景类别可对应关联的配置参数包括车内氛围灯的第一配置参数,车内多媒体数据的类别以及车载空气净化器的第二配置参数中的一种或多种参数,若关联一种参数,则执行与该一种参数对应的配置操作,若关联多种参数,则分别执行与多种参数对应的配置操作。根据所述配置参数,配置车内场景氛围可以是根据所述第一配置参数调节所述车内氛围灯、播放与所述车内多媒体数据的类别对应的多媒体数据、和/或根据所述第二配置参数控制所述车载空气净化器的工作模式。
如配置参数可以包括车内氛围灯的第一配置参数,车内多媒体数据的类别,以及车载空气净化器的第二配置参数,如第一配置参数可以是氛围灯的类型,车内多媒体数据可以音频数据、电台数据和/或视频数据等,第二配置参数可以是空气净化器的开和关等参数,可使车载空气净化器工作在对应开或关的工作模式下。
在具体应用场景中,根据车内场景设置不同场景对应的车内个性化配置数据库(比如日常聊天场景、欢乐聊天场景或商务洽谈场景,例如欢乐聊天场景应播放欢乐曲调、搞笑段子等类型的多媒体数据,日常聊天场景则播放舒缓类型的乐曲,氛围灯调节成暖色调类型等;商务洽谈场景则氛围灯调节为明亮的色调类型、同时通过开启空气净化器调节释放空气清新剂等)。
本申请实施例采集车内的语音信息;根据所述语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据所述车辆配置对车辆进行配置参数的调整。可根据车内的语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据车辆配置自动对车辆进行配置参数的调整,操作简单,能智能的根据场景调节配置参数,提高了智能性和用户体验。
实施例二
本实施例是对实施例一的进一步说明,与实施例一相同或相似的地方,具体可参见实施例一的相关描述,此处不再赘述。如图2所示,步骤S202可作为步骤S102的一种实现方式,本实施例中的车辆配置的调整方法包括:
步骤S201,采集车内的语音信息。
具体地,步骤S201与上述步骤S101相同或相似的地方,具体可参见上述步骤S101的相关描述,此处不再赘述。
步骤S202,对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。
具体地,预先建立包括语音特征、场景类别及车辆配置之间关联关系的关联数据库,所述语音特征包括语义特征,或者所述语音特征包括声学特征,或者所述语音特征包括语义特征和声学特征。基于关联数据库,根据语音信息中的语音特征可确定出对应的目标场景类别,根据目标场景类别可确定出对应的车辆配置。可将采集的语音信息转化为文字信息,对文字信息通过语义特征提取算法进行语义特征提取,得到语义特征提取结果,所述语义特征提取结果可包括多个语义关键词的语句信息。根据语义特征结果中包括的多个语义关键词,确定该多个语义关键词关联的目标场景类别。预先建立不同场景与对应多个语义关键词间的关联关系并存储在关联数据库中。基于该关联关系,根据语义特征结果中包括的多个语义关键词,确定该多个语义关键词关联的目标场景类别。所述目标场景类别包括但不限于日常聊天场景、欢乐聊天场景或商务洽谈场景。
步骤S203,获取与所述目标场景类别关联的车辆配置。
步骤S204,根据所述车辆配置对车辆进行配置参数的调整。
具体地,步骤S203至步骤S204与上述步骤S103至步骤S104相同或相似的地方,具体可参见上述步骤S103至步骤S104的相关描述,此处不再赘述。
本申请实施例对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。可直接基于关联数据库,根据语音信息中的语音特征可确定出对应的目标场景类别,根据目标场景类别可确定出对应的车辆配置,操作便捷简单,能智能的根据场景调节配置参数,进一步提高了智能性和用户体验。
实施例三
本实施例是对实施例一的进一步说明,与实施例一相同或相似的地方,具体可参见实施例一的相关描述,此处不再赘述。如图3所示,步骤S302至步骤S303可作为步骤S102的一种实现方式,本实施例中的车辆配置的调整方法包括:
步骤S301,采集车内的语音信息。
具体地,步骤S301与上述步骤S101相同或相似的地方,具体可参见上述步骤S101的相关描述,此处不再赘述。
步骤S302,对所述语音信息进行语义特征提取,得到语义特征提取结果。
具体地,将采集的语音信息转化为文字信息,对文字信息通过语义特征提取算法进行语义特征提取,得到语音特征提取结果,所述语义特征提取结果可包括多个语义关键词的语句信息。
步骤S303,将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景。
具体地,可预先基于神经网络模型构建的网络模型,如基于VGG网络、Inception网络或ResNet网络构建所述网络模型。具体可通过比较好部署在车载终端的轻量级神经网络构建。对构建后的深度学习网络模型进行训练,对深度学习网络模型进行训练可以是将大量语句作为训练集,并对语句进行标注场景类别,如场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景,将对每个语句标记好的场景类别作为该语句的期望输出,将训练样本输入至深度学习网络模型进行训练,在训练的过程中根据标记好的期望输出向量不断调整优化所述深度学习网络模型中的参数,直至预设损失函数的输出值大于预设误差值,将此时的深度学习网络模型作为已训练好的网络模型。预设损失函数可以是交叉熵损失函数或者均方误差损失函数等类型的损失函数。将所述语义特征提取结果输入至已训练的深度学习网络模型进行分类,输出分类后的场景类别,并将分类后的场景类别作为目标场景类别。
步骤S304,获取与所述目标场景类别关联的车辆配置。
步骤S305,根据所述车辆配置对车辆进行配置参数的调整。
具体地,步骤S304至步骤S305与上述步骤S103至步骤S104相同或相似的地方,具体可参见上述步骤S103至步骤S104的相关描述,此处不再赘述。
本申请实施例对所述语音信息进行语义特征提取,得到语义特征提取结果;将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景,可直接基于深度学习网络模型确定目标场景类别,能快速智能的确定目标场景类别。
实施例四
本实施例是对实施例一的进一步说明,与实施例一相同或相似的地方,具体可参见实施例一的相关描述,此处不再赘述。如图4所示,步骤S402至步骤S405可作为步骤S102的一种实现方式,本实施例中的车辆配置的调整方法包括:
步骤S401,采集车内的语音信息。
具体地,步骤S401与上述步骤S101相同或相似的地方,具体可参见上述步骤S101的相关描述,此处不再赘述。
步骤S402,对所述语音信息进行语义特征提取,得到语义特征提取结果。
具体地,可将语音信息转化为文字信息,对文字信息通过语音特征提取算法进行语义特征提取,得到语音特征提取结果,所述语义特征提取结果可包括多个语义关键词的语句信息。
步骤S403,对所述语音信息进行声学特征提取,得到声学特征提取结果。
具体地,对所述语音信息进行声学特征提取可以是提取声学频谱,如对所述语音信息转化为对应的声学频谱特征,将转化后的声学频谱特征作为声学特征提取结果。声学特征提取结果可以是声学频谱图或者声学频谱的幅度、基频、过零率等特征。
步骤S404,确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,并作为所述目标场景类别。
在一个实施例中,如图5所示,步骤S404包括步骤S4041至步骤S4044:
步骤S4041,根据所述语义特征提取结果,确定与每个场景类别的第一匹配度。
步骤S4042,根据所述声学特征提取结果,确定与每个场景类别的第二匹配度。
在一个实施例中,所述语义特征结果包括多个语义关键词,所述声学特性结果包括声学频谱;根据所述语义特征提取结果,确定与每个场景类别的第一匹配度,包括:根据所述多个语义关键词,在每个场景类别对应存储的语义词中检索出与所述多个语义关键词中任一个语义关键词相同的所有目标语义词,根据检索结果确定所述语义特征结果与每个场景类别之间的相似度,并作为所述第一匹配度。
具体地,根据语义特征提取结果中包括的多个语义关键词,在每个场景类别对应关联存储的语义词中检索出与该多个语义关键词相同的目标语义关键词,根据检索结果确定语义特征结果与每个场景类别之间的相似度,如语义特征结果包括n个语义关键词,在第一个场景类别关联的关键词中检索出来y个目标语义关键词,语音特征结果与第一个场景类别之间的相似度就是y÷n,该相识度作为第一个场景类别的第一匹配度;第二个场景类别关联的关键字中检索出来k个目标关键词,则语义特征结果与第二个场景类别之间的相似度就是y÷k。该相识度作为第二个场景类别的第一匹配度。
对应地,根据所述声学特征提取结果,确定与每个场景类别的第二匹配度,包括:根据所述声学频谱,确定每个场景类别对应存储的多个预设声学频谱与所述声学频谱之间的相似度,将每个场景类别中目标预设声学频谱与所述声学频谱之间的相似度作为第二匹配度;其中,目标预设声学频谱为每个场景类别中各个预设声学频谱与所述声学频谱之间的相似度最高的预设声学频谱。
具体地,如声学频谱是声学频谱的幅度、基频、过零率等特征,根据声学特征提取结果中包括的幅度、基频、过零率等特征,分别检测每个场景类别对应关联存储的幅度、基频、过零率等特征与声学特征提取结果中包括的幅度、基频、过零率等特征之间的相似度,如每个场景类别对应关联存储的幅度、基频、过零率等特征中的幅度、基频、过零率都有预设的范围值,检测声学特征提取结果中包括的幅度、基频、过零率等特征是否都在对应的预设范围值内,都在对应预设范围之内,则相似度是100%,如声学频谱的特征有I个,声学特征提取结果中包括的特征中有J个都在对应场景设置声学频谱特征的预设范围值内,则相似度是J÷I。
步骤S4043,根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值。
具体地,预设第一匹配度对应的第一权重因子和第二匹配度对应的第二权重因子,将第一匹配度乘以第一权重因子,加上第二匹配度乘以第二预设权重因子,可以确定每个场景类别的总类别匹配度值。
步骤S4044,在所述关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为所述目标场景类别。
具体地,计算出所有场景类别对应的种类别匹配度值,将总类别匹配度值最大的场景类别作为目标场景类别。
步骤S405,获取与所述目标场景类别关联的车辆配置。
步骤S406,根据所述车辆配置对车辆进行配置参数的调整。
具体地,步骤S405至步骤S406与上述步骤S103至步骤S104相同或相似的地方,具体可参见上述步骤S103至步骤S104的相关描述,此处不再赘述。
本申请实施例对所述语音信息进行语义特征提取,得到语义特征提取结果;对所述语音信息进行声学特征提取,得到声学特征提取结果;确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,并作为所述目标场景类别。能根据语音信息中的语义特性提取结果和声学特征提取结合确定场景类别,能更准确的确定出目标场景类别。
实施例五
对应于上文实施例所述的车辆配置的调整方法,图6示出了本申请实施例提供的车辆配置的调整装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。所述车辆配置的调整装置应用于电子设备,所述电子设备与目标车辆进行通信连接,或所述电子设备为目标车辆中的部件,所述车辆配置的调整装置600包括:
采集模块601,用于采集车内的语音信息;
确定模块602,用于根据所述语音信息,确定对应的目标场景类别;
获取模块603,用于获取与所述目标场景类别关联的车辆配置;
调整模块604,用于根据所述车辆配置对车辆进行配置参数的调整。
在一个实施例中,所述调整装置还包括:
建立模块,用于根据语音特征、场景类别及车辆配置建立关联数据库,所述语音特征包括语义特征、声学特征。
在一个实施例中,所述确定模块具体用于:对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。
在一个是实施例中,所述确定模块具体用于:对所述语音信息进行语义特征提取,得到语义特征提取结果;将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景。
在一个实施例中,所述确定模块包括:
第一提取单元,用于对所述语音信息进行语义特征提取,得到语义特征提取结果;
第二提取单元,用于对所述语音信息进行声学特征提取,得到声学特征提取结果;
确定单元,用于确定与所述语义特征提取结果和所述声学特征提取结果匹配度最高的场景类别,并作为所述目标场景类别。
在一个实施例中,所述确定单元包括:
第一确定子单元,用于根据所述语义特征提取结果,确定与每个场景类别的第一匹配度;
第二确定子单元,用于根据所述声学特征提取结果,确定与每个场景类别的第二匹配度;
第三确定子单元,用于根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值;
场景确定单元,用于在所述关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为所述目标场景类别。
在一个实施例中,所述语义特征结果包括多个语义关键词,所述声学特性结果包括声学频谱;所述第一确定子单元具体用于:根据所述多个语义关键词,在每个场景类别对应存储的语义词中检索出与所述多个语义关键词中任一个语义关键词相同的所有目标语义词,根据检索结果确定所述语义特征结果与每个场景类别之间的相似度,并作为所述第一匹配度;
对应地,所述第二确定子单元具体用于:根据所述声学频谱,确定每个场景类别对应存储的多个预设声学频谱与所述声学频谱之间的相似度,将每个场景类别中目标预设声学频谱与所述声学频谱之间的相似度作为第二匹配度;其中,目标预设声学频谱为每个场景类别中各个预设声学频谱与所述声学频谱之间的相似度最高的预设声学频谱。
本申请实施例采集车内的语音信息;根据所述语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据所述车辆配置对车辆进行配置参数的调整。可根据车内的语音信息,确定对应的目标场景类别;获取与所述目标场景类别关联的车辆配置;根据车辆配置自动对车辆进行配置参数的调整,操作简单,能智能的根据场景调节配置参数,提高了智能性和用户体验。
实施例六
如图7所示,本申请实施例还提供一种电子设备的结构示意图。所述电子设备700包括:处理器701、存储器702以及存储在上述存储器702中并可在上述处理器701上运行的计算机程序703。上述处理器701执行上述计算机程序703时实现上述车辆配置的调整方法实施例中的步骤。
示例性的,上述计算机程序703可以被分割成一个或多个单元/模块,上述一个或者多个单元/模块被存储在上述存储器702中,并由上述处理器701执行,以完成本申请。上述一个或多个单元/模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述上述计算机程序703在上述电子设备700中的执行过程。例如,上述计算机程序703可以被分割成采集模块、确定模块、获取模块和调整模块等,各模块具体功能在上述实施例中已有描述,此处不再赘述。
上述电子设备700可包括,但不仅限于,处理器701、存储器702。本领域技术人员可以理解,图7仅仅是电子设备700的示例,并不构成对电子设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如上述电子设备700还可以包括输入输出设备、网络接入设备、总线等。
所称处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器702可以是电子设备700的内部存储单元,例如电子设备700的硬盘或内存。上述存储器702还可以既包括上述电子设备700的内部存储单元也包括外部存储设备。上述存储器702用于存储上述计算机程序以及上述电子设备700所需的其它程序和数据。上述存储器702还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述车辆的控制设备中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种车辆配置的调整方法,其特征在于,
采集车内的语音信息;
对所述语音信息进行语义特征提取,得到语义特征提取结果;
对所述语音信息进行声学特征提取,得到声学特征提取结果;
根据所述语义特征提取结果,确定与每个场景类别的第一匹配度;
根据所述声学特征提取结果,确定与每个场景类别的第二匹配度;
根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值;
在关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为目标场景类别;
获取与所述目标场景类别关联的车辆配置;
根据所述车辆配置对车辆进行配置参数的调整。
2.根据权利要求1所述的调整方法,其特征在于,在获取与所述目标场景类别关联的车辆配置之前,还包括:
根据语音特征、场景类别及车辆配置建立关联数据库,所述语音特征包括语义特征、声学特征。
3.根据权利要求1所述的调整方法,其特征在于,所述根据所述语音信息,确定对应的目标场景类别,包括:
对所述语音信息进行语义特征提取,得到语义特征提取结果,在关联数据库中确定与所述语义特征提取结果对应的目标场景类别。
4.根据权利要求1所述的调整方法,其特征在于,所述根据所述语音信息,确定对应的目标场景类别,还包括:
对所述语音信息进行语义特征提取,得到语义特征提取结果;
将所述语义特征提取结果输入至深度学习网络模型进行场景分类,确定目标场景类别;其中,所述深度学习网络模型用于根据语音特征提取结果进行场景分类,所述目标场景类别包括日常聊天场景、欢乐聊天场景或商务洽谈场景。
5.根据权利要求1所述的调整方法,其特征在于,所述语义特征结果包括多个语义关键词,所述声学特性结果包括声学频谱;
根据所述语义特征提取结果,确定与每个场景类别的第一匹配度,包括:
根据所述多个语义关键词,在每个场景类别对应存储的语义词中检索出与所述多个语义关键词中任一个语义关键词相同的所有目标语义词,根据检索结果确定所述语义特征结果与每个场景类别之间的相似度,并作为所述第一匹配度;
对应地,根据所述声学特征提取结果,确定与每个场景类别的第二匹配度,包括:
根据所述声学频谱,确定每个场景类别对应存储的多个预设声学频谱与所述声学频谱之间的相似度,将每个场景类别中目标预设声学频谱与所述声学频谱之间的相似度作为第二匹配度;其中,目标预设声学频谱为每个场景类别中各个预设声学频谱与所述声学频谱之间的相似度最高的预设声学频谱。
6.一种车辆配置的调整装置,其特征在于,包括:
采集模块,用于采集车内的语音信息;
确定模块,用于对所述语音信息进行语义特征提取,得到语义特征提取结果,并对所述语音信息进行声学特征提取,得到声学特征提取结果,并根据所述语义特征提取结果,确定与每个场景类别的第一匹配度,并根据所述声学特征提取结果,确定与每个场景类别的第二匹配度,并根据所述第一匹配度、第二匹配度及预设权重因子,确定每个场景类别的总类别匹配度值,以及在关联数据库中的所有场景类别中,将总类别匹配度值最大的场景类别作为目标场景类别;
获取模块,用于获取与所述目标场景类别关联的车辆配置;
调整模块,用于根据所述车辆配置对车辆进行配置参数的调整。
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110838263.XA CN113370923B (zh) | 2021-07-23 | 2021-07-23 | 一种车辆配置的调整方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110838263.XA CN113370923B (zh) | 2021-07-23 | 2021-07-23 | 一种车辆配置的调整方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113370923A CN113370923A (zh) | 2021-09-10 |
CN113370923B true CN113370923B (zh) | 2023-11-03 |
Family
ID=77582778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110838263.XA Active CN113370923B (zh) | 2021-07-23 | 2021-07-23 | 一种车辆配置的调整方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113370923B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115209362A (zh) * | 2022-07-22 | 2022-10-18 | 长城汽车股份有限公司 | 车联网订制用车方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017166651A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 语音识别模型训练方法、说话人类型识别方法及装置 |
CN109240641A (zh) * | 2018-09-04 | 2019-01-18 | Oppo广东移动通信有限公司 | 音效调整方法、装置、电子设备以及存储介质 |
CN110979202A (zh) * | 2019-11-08 | 2020-04-10 | 华为技术有限公司 | 改变汽车风格的方法、装置以及系统 |
WO2020119542A1 (zh) * | 2018-12-11 | 2020-06-18 | 阿里巴巴集团控股有限公司 | 一种语音交互方法、装置及系统 |
CN111508482A (zh) * | 2019-01-11 | 2020-08-07 | 阿里巴巴集团控股有限公司 | 语义理解及语音交互方法、装置、设备及存储介质 |
CN112771608A (zh) * | 2018-11-20 | 2021-05-07 | 深圳市欢太科技有限公司 | 语音信息的处理方法、装置、存储介质及电子设备 |
-
2021
- 2021-07-23 CN CN202110838263.XA patent/CN113370923B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017166651A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 语音识别模型训练方法、说话人类型识别方法及装置 |
CN109240641A (zh) * | 2018-09-04 | 2019-01-18 | Oppo广东移动通信有限公司 | 音效调整方法、装置、电子设备以及存储介质 |
CN112771608A (zh) * | 2018-11-20 | 2021-05-07 | 深圳市欢太科技有限公司 | 语音信息的处理方法、装置、存储介质及电子设备 |
WO2020119542A1 (zh) * | 2018-12-11 | 2020-06-18 | 阿里巴巴集团控股有限公司 | 一种语音交互方法、装置及系统 |
CN111508482A (zh) * | 2019-01-11 | 2020-08-07 | 阿里巴巴集团控股有限公司 | 语义理解及语音交互方法、装置、设备及存储介质 |
CN110979202A (zh) * | 2019-11-08 | 2020-04-10 | 华为技术有限公司 | 改变汽车风格的方法、装置以及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113370923A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10229671B2 (en) | Prioritized content loading for vehicle automatic speech recognition systems | |
CN103456301B (zh) | 一种基于环境声音的场景识别方法及装置及移动终端 | |
CN110188235A (zh) | 音乐风格分类方法、装置、计算机设备及存储介质 | |
CN110600059B (zh) | 声学事件检测方法、装置、电子设备及存储介质 | |
DE102017121059A1 (de) | Identifikation und erzeugung von bevorzugten emoji | |
US11676571B2 (en) | Synthesized speech generation | |
CN111462741B (zh) | 语音数据处理方法、装置及存储介质 | |
CN105448289A (zh) | 一种语音合成、删除方法、装置及语音删除合成方法 | |
CN103888604A (zh) | 一种终端应用模式的切换方法及终端 | |
CN110428835B (zh) | 一种语音设备的调节方法、装置、存储介质及语音设备 | |
CN113370923B (zh) | 一种车辆配置的调整方法、装置、电子设备及存储介质 | |
CN106157972A (zh) | 使用局部二进制模式进行声学情境辨识的方法和设备 | |
CN110875036A (zh) | 语音分类方法、装置、设备及计算机可读存储介质 | |
CN110155075A (zh) | 氛围设备控制方法及相关装置 | |
CN111259189A (zh) | 一种音乐分类方法及装置 | |
Yang et al. | Kullback–Leibler divergence frequency warping scale for acoustic scene classification using convolutional neural network | |
CN110931019A (zh) | 公安语音数据采集方法、装置、设备和计算机存储介质 | |
CN111859011A (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN114927122A (zh) | 一种情感语音的合成方法及合成装置 | |
CN114863905A (zh) | 语音类别获取方法、装置、电子设备和存储介质 | |
JP2012168349A (ja) | 音声認識システムおよびこれを用いた検索システム | |
CN113409798A (zh) | 车内含噪语音数据生成方法、装置以及设备 | |
CN109754820B (zh) | 目标音频获取方法及装置、存储介质及终端 | |
CN108172241B (zh) | 一种基于智能终端的音乐推荐方法及音乐推荐系统 | |
CN112133279B (zh) | 车载信息播报方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |