CN115297403A - 一种车内音频场景自适应调整方法及音频系统 - Google Patents
一种车内音频场景自适应调整方法及音频系统 Download PDFInfo
- Publication number
- CN115297403A CN115297403A CN202210715268.8A CN202210715268A CN115297403A CN 115297403 A CN115297403 A CN 115297403A CN 202210715268 A CN202210715268 A CN 202210715268A CN 115297403 A CN115297403 A CN 115297403A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- audio scene
- audio
- user
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 40
- 230000004927 fusion Effects 0.000 claims abstract description 26
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 12
- 238000004891 communication Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本申请提供了一种车内音频场景自适应调整方法及音频系统,该系统包括:获取当前车辆内的车辆信息以及车辆内的所有用户状态信息;根据当前车辆内的车辆信息以及所有用户状态信息进行多模态融合分析处理,得到期望的音频场景;比对期望的音频场景及当前的音频场景,当期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到期望的音频场景。在上述技术方案中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
Description
技术领域
本说明书一个或多个实施例涉及汽车技术领域,尤其涉及一种车内音频场景自适应调整方法及音频系统。
背景技术
随着汽车音响技术的发展,将一个车厢分成多个独立音区成为可能。目前的多音区涉及两个概念:
输入多音区:即每个座位有独立的MIC,分别拾取对应座位的语音,车机系统进行声源定位,以分别拾取出不同座位乘员的语音输入;
输出多音区:通过音频后处理算法的处理,使车厢内不同座位的乘员可以听取到不同的音频内容,互相之间没有干扰,或者干扰很小司乘人员基本上感觉不到。
因多音区音响在当前还是比较新的技术,目前音区转换多为手动设置,这样操作起来比较麻烦,很不智能。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种车内音频场景自适应调整方法及音频系统,提高对用户的体验效果。
第一方面,提供了一种车内音频场景自适应调整方法,该车内音频场景自适应调整方法包括以下步骤:
获取当前车辆内的车辆信息以及车辆内的所有用户状态信息;
根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;
获取车辆内当前的音频场景;
比对所述期望的音频场景及所述当前的音频场景,当所述期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到所述期望的音频场景。
在上述技术方案中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
在一个具体的可实施方案中,所述获取当前车辆内的车辆信息以及车辆内的所有用户状态信息,具体为:通过摄像头、按键、触摸屏或导航模块获取车辆信息;通过每个座位独立的传感器、摄像头、MIC获取每个用户状态信息。通过不同的方式获取车辆信息和用户状态信息。
在一个具体的可实施方案中,所述根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景,具体包括:
根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。
在一个具体的可实施方案中,所述根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域;具体为:
当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。
在一个具体的可实施方案中,所述方法还包括:
在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若相同,则将相同的音频场景合并为一个音频场景。
在一个具体的可实施方案中,所述方法还包括:在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。
在一个具体的可实施方案中,所述方法还包括,在车辆内具有多个音频场景时,根据不同用户的音频场景的优先等级调整不同音频场景对应的音频中音量的大小。
在一个具体的可实施方案中,还包括检测车辆内的用户个数,若用户的个数为一个,则采用全局模式。
第二方面,提供了一种车内音频系统,该系统包括:
车辆信息采集模块,用于获取当前车辆内的车辆信息;
用户状态信息采集模块,用于获取车辆内的所有用户状态信息;
音频模块,用于获取车辆内当前的音频场景;
数据处理模块,用于根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;比对所述期望的音频场景及所述当前的音频场景,当所述期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到所述期望的音频场景。
在上述技术方案中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
在一个具体的可实施方案中,所述车辆信息采集模块包括摄像头、按键、触摸屏或导航模块。
在一个具体的可实施方案中,所述用户状态信息采集模块包括设置在每个座位的独立的传感器、摄像头、MIC。
在一个具体的可实施方案中,所述数据处理模块还具体用于根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。
在一个具体的可实施方案中,所述数据处理模块还具体用于当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。
在一个具体的可实施方案中,所述数据处理模块还具体用于在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。
第三方面,提供了一种汽车,该汽车包括车体以及设置在所述车体内的上述任一项所述的音频系统。
在上述技术方案中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
第四方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现执行第二方面以及第二方面中任意一种可能的设计的方法。
第五方面,提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第二方面以及第二方面中任意一种可能的设计的方法。
第六方面,还提供一种计算机程序产品,包括指令,当其在计算机上运行时,使得计算机执行本申请第二方面以及第二方面中任意一种可能的设计的方法。
另外,第四方面至第六方面中任一种可能设计方式所带来的技术效果可参见方法部分中不同设计方式带来的效果,在此不再赘述。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的车内音频场景自适应调整方法的应用硬件示意图;
图2为本申请实施例提供的车内音频场景自适应调整的流程图;
图3为本申请实施例提供的车内音频场景自适应调整系统的结构框图
图4为本申请实施例提供的音频系统的流程图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本说明书实施例中所述通信的技术载体,例如可以包括近场通信(Near FieldCommunication,NFC)、WIFI、3G、4G、5G、、蓝牙、红外、多媒体消息(Multimedia MessageService,MMS)等。
为方便理解本申请实施例提供的车内音频场景自适应调整方法,首先介绍一下其应用场景。上述调整方法应用于车辆内,用以调整车辆的音频场景。车内乘员(用户)对音频有不同的使用需求,为了尽可能地满足不同用户的需求,独立音区技术被提了出来。然而目前对音区模式的切换一般都是手动设置的方式,很不智能,不能满足场景不断变化的使用需求。为此本申请实施例提供了一种车内音频场景自使用调整方法,下面结合具体的附图以及实施例对其进行详细描述。
本申请实施例中,涉及到的音频场景包含全局模式以及独立音区模式。全局模式:即整个车厢是一个音区,也即目前普通座舱的惯常模式;独立音区模式:则会有多种音区组合模式,比如:每个座位是各自独立的音区,也可能会是某几个座位组合成一个联合音区。
本申请实施例提供的车内音频场景自使用调整方法主要采用实时采集车内音频场景的变化,然后自适应地调整音区模式,以满足乘员的不同需求。下面详细对其进行说明。
为方便理解本申请实施例提供的车内隐僻你使用场景自适应调整方法,首先说明一下其对应的硬件结构。该调整方法基于的硬件结构如图1中所示,其对应的硬件模块包括采集模块10,数据处理模块20以及音频模块30。其中,采集模块10用于采集车辆信息及用户状态信息,并作为本申请方法中的原始数据。该采集模块10可以为车辆内的导航模块、MIC、按键、传感器等不同可获取信息的部件。数据处理模块20用于对采集模块10采集的数据进行处理,通过多模态融合分析,对数据进行处理,从而得到符合车辆内应用的期望的音频场景,并控制音频模块30进行调整。下面结合上述硬件结构,详细说明一下本申请实施例提供的调整方法。
参考图2,图2示出了本申请实施例提供的调整方法的流程图。本申请实施例提供的调整方法包括以下步骤。
步骤001:获取当前车辆内的车辆信息以及车辆内的所有用户状态信息;
在具体获取上述车辆信息和用户状态信息时,通过上述采集模块10获取上述不同的信息。具体的,可通过摄像头、按键、触摸屏或导航模块获取车辆信息;通过每个座位独立的传感器、摄像头、MIC(麦克风)获取每个用户状态信息。在具体获取信息时,上述车辆信息指代为车辆内的音频模块30的状态信息。如通过摄像头、按键、触摸屏获取到用户进行关于音频方面的指令操作,并通过麦克风获取到用户的语音信息,从而可获取到用户关于音频方面对应的信息。
步骤002:根据当前车辆内的车辆信息以及所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;
具体的,在具体进行多模态融合分析处理时,通过摄像头、按键、触控屏等不同的采集模块10获取原始数据。其中,多模态融合指代为多模态机器学习MultiModal MachineLearning(MMML),旨在通过机器学习理解并处理多种模态信息。包括多模态表示学习Multimodal Representation,模态转化Translation,对齐Alignment,多模态融合Multimodal Fusion,协同学习Co-learning等。
多模态融合Multimodal Fusion也称多源信息融合(Multi-source InformationFusion),多传感器融合(Multi-sensor Fusion)。多模态融合是指综合来自两个或多个模态的信息以进行预测的过程。在预测的过程中,单个模态通常不能包含产生精确预测结果所需的全部有效信息,多模态融合过程结合了来自两个或多个模态的信息,实现信息补充,拓宽输入数据所包含信息的覆盖范围,提升预测结果的精度,提高预测模型的鲁棒性。
通过上述的多模态融合分析后,即可得到针对当前状态的预期的音频场景。
步骤003:获取车辆内当前的音频场景;
具体的,通过音频模块30的播放模式,可获取当前的车辆内的音频场景。具体的,音频场景为全局模式,或者独立的分区模式等不同的模式。
步骤004:比对期望的音频场景及当前的音频场景,当期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到期望的音频场景。
具体的,应理解,在进行音频场景切换时,首先需要考虑车辆内的用户的数量。因此在进行音频场景切换时,首先检测车辆内的用户个数,若用户的个数为一个,则采用全局模式。也即若用户的数量为一个时,则无论采集的任何车辆信息和用户状态信息,均采用全局模式。若用户的个数为多个时,再根据需要调整至期望的音频场景。
在具体进行音频场景切换时,可通过上述的当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定每个用户对应的音频场景。该确定的每个用户对应的音频场景即为期望的音频场景。
另外,在确定好期望的音频场景后,需要确定所有用户对应的音频场景是否相同。并根据确定的结构,选择不同的切换方式。示例性的,若相同则将相同的音频场景对应的用户区域划分为统一区域;若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。也即在具体进行音频场景划分时,对不同用户的用户状态进行划分,从而根据用户的当前情况确定采用何种方式的音频场景。
具体的,当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。也即,当单一用户出现单独的需求时,将该用户对应的音频场景进行调整,以使得该用户可获取匹配的场景需求。另外,将其他用户与该用户的场景区分,以保证其他用户的场景需求。
当然,除了上述方式外,还包括在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若相同,则将相同的音频场景合并为一个音频场景。也即,当用户在切换音频场景后,形成多个相同的音频场景时,可将多个音频场景整合为一个音频场景,以获得更好的音频体验。
由此可看出,在本申请进行音频场景切换时,在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。
另外,在车辆内具有多个音频场景时,根据不同用户的音频场景的优先等级调整不同音频场景对应的音频中音量的大小。示例性的,当用户进行导航时,则其他听音乐的音量适当调小,以保证导航信息可清晰的输送到驾驶员。或者在接听电话时,其他用户的音频中的音量降低,以保证用户在接打电话时的清晰度。
在具体调整音频状态时,通过本申请实施例提供的上述方法可看出,本申请实施例提供的调整方法对音频处理可遵循如下策略:
1)一般来说,全局模式音频效果要远比独立音区模式好,为获取更好的音频效果,因此,车辆内默认音区模式为全局模式,也即汽车刚启动时车厢处于全局模式。
2)一旦有乘员通过语音、按键、触摸等主动发起与当前所在音区(组合)不同的新播放请求时(比如:全局模式下接打电话),则转换成该乘员为一音区,播放该乘员的播放请求(比如:打电话);其余为一个音区,继续之前的播放。新的播放(打电话)结束时,则依据配置可以:
A、保持当前的音区模式;
B、恢复到之前的音区(组合)状态。
3)独立音区模式下,可以主动的与其他音区(组合)合并以形成新的更大的音区组合,比如:后左音区加入后右音区形成新的后排音区,以使后排同时听相同的音乐或者观看相同的视频。
4)推荐类播放(比如:导航),音区的改变是临时性的,一旦播放结束,则恢复到之前的音区模式。比如:全局模式下全车播放同一首音乐,这时来了一个导航提示音。当车内只有司机一人时,则继续全局模式播放音乐和导航提示音,与现有车辆处理方式相同。当车内有多人时,则转换成司机一个音区,播放导航音;其余座位一个音区,继续播放当前音乐。导航提示音结束,重新恢复到全局模式。
当乘员下车后,如果乘员所在音区组合没有其他乘员,则与相邻音区组合成一个更大的音区(组合),直至融合成全局模式。
通过上述方法可看出,在本申请实施例提供的调整方法中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
参考图3,本申请实施例还提供了一种车内音频系统,该系统包括:车辆信息采集模块11、用户状态信息采集模块12、音频模块30及数据处理模块20。其中,车辆信息采集模块11、用户状态信息采集模块12、音频模块30为用于获取原始数据,并将原始数据提供给数据处理模块20。数据处理模块20用于对上述数据进行处理,并确定预期的音频场景。以实现提高用户体验的效果。下面分别对其进行说明。
首先说明车辆信息采集模块11,该车辆信息采集模块11用于获取当前车辆内的车辆信息。具体的,车辆信息采集模块11包括摄像头、按键、触摸屏或导航模块。在进行采集信息时,如通过摄像头、按键、触摸屏获取到用户进行关于音频方面的指令操作,从而可获取到用户关于音频方面对应的信息。
用户状态信息采集模块12用于获取车辆内的所有用户状态信息。用户状态信息采集模块12包括设置在每个座位的独立的传感器、摄像头、MIC。可通过该传感器、摄像头、MIC获取用户的声音信息,从而获取用户关于音频方面对应的信息,以提供给数据处理模块20进一步进行处理。
音频模块30用于获取车辆内当前的音频场景。该音频模块30可根据车辆内音频设备的状态信息确定当前的音频场景。示例性的,以车内的扬声器为例,通过不同扬声器的播放情况,即可确定当前车辆内为全局模式,还是独立模式。
数据处理模块20用于根据当前车辆内的车辆信息以及所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;比对期望的音频场景及当前的音频场景,当期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到期望的音频场景。具体可参考步骤004中的详细描述。在进行切换时,可通过音频模块30进行执行切换。数据处理模块20可发出切换指令,控制音频模块30进行执行。
数据处理模块20还具体用于根据当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。具体可参考步骤004中的详细描述。
数据处理模块20还具体用于当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。具体可参考步骤004中的详细描述。
数据处理模块20还具体用于在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。具体可参考步骤004中的详细描述。
通过上述描述可看出,本申请实施例提供的音频系统可通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
本申请实施例还提供了一种汽车,该汽车包括车体以及设置在车体内的上述任一项的音频系统。
在上述技术方案中,通过采用车辆内当前车辆内的音频场景,以及当前车辆内的车辆信息,以及用户状态信息,并基于车辆信息以及用户状态信息通过多模态分析确定期望的音频场景,并将车辆内的音频场景调整为期望的音频场景,实现对车辆内音频场景的自动切换,提高了用户的体验效果。
本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现执行第二方面以及第二方面中任意一种可能的设计的方法。
本申请实施例还提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第二方面以及第二方面中任意一种可能的设计的方法。
本申请实施例还还提供一种计算机程序产品,包括指令,当其在计算机上运行时,使得计算机执行本申请第二方面以及第二方面中任意一种可能的设计的方法。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (17)
1.一种车内音频场景自适应调整方法,其特征在于,包括以下步骤:
获取当前车辆内的车辆信息以及车辆内的所有用户状态信息;
根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;
获取车辆内当前的音频场景;
比对所述期望的音频场景及所述当前的音频场景,当所述期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到所述期望的音频场景。
2.根据权利要求1所述的车内音频场景自适应调整方法,其特征在于,所述获取当前车辆内的车辆信息以及车辆内的所有用户状态信息,具体为:
通过摄像头、按键、触摸屏或导航模块获取车辆信息;
通过每个座位独立的传感器、摄像头、MIC获取每个用户状态信息。
3.根据权利要求2所述的车内音频场景自适应调整方法,其特征在于,所述根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景,具体包括:
根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。
4.根据权利要求3所述的车内音频场景自适应调整方法,其特征在于,所述根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域;具体为:
当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。
5.根据权利要求4所述的车内音频场景自适应调整方法,其特征在于,所述方法还包括:
在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若相同,则将相同的音频场景合并为一个音频场景。
6.根据权利要求5所述的车内音频场景自适应调整方法,其特征在于,所述方法还包括:在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。
7.根据权利要求6所述的车内音频场景自适应调整方法,其特征在于,所述方法还包括,在车辆内具有多个音频场景时,根据不同用户的音频场景的优先等级调整不同音频场景对应的音频中音量的大小。
8.根据权利要求7所述的车内音频场景自适应调整方法,其特征在于,还包括检测车辆内的用户个数,若用户的个数为一个,则采用全局模式。
9.一种车内音频系统,其特征在于,包括:
车辆信息采集模块,用于获取当前车辆内的车辆信息;
用户状态信息采集模块,用于获取车辆内的所有用户状态信息;
音频模块,用于获取车辆内当前的音频场景;
数据处理模块,用于根据所述当前车辆内的车辆信息以及所述所有用户状态信息进行多模态融合分析处理,并得到当前车辆内期望的音频场景;
比对所述期望的音频场景及所述当前的音频场景,当所述期望的音频场景与当前音频场景不同时,则调整音频输出系统的音区模式,以切换到所述期望的音频场景。
10.根据权利要求9所述的车内音频系统,其特征在于,所述车辆信息采集模块包括摄像头、按键、触摸屏或导航模块。
11.根据权利要求10所述的音频系统,其特征在于,所述用户状态信息采集模块包括设置在每个座位的独立的传感器、摄像头、MIC。
12.根据权利要求11所述的音频系统,其特征在于,所述数据处理模块还具体用于根据所述当前车辆内的车辆信息,以及通过每个座位独立的传感器、摄像头、MIC获取的每个用户状态信息,确定所述每个用户对应的音频场景,并确定所有用户对应的音频场景是否相同,若相同则将相同的音频场景对应的用户区域划分为统一区域,若不同,则将任意不相同的音频场景对应的用户区域划分为独立区域。
13.根据权利要求12所述的音频系统,其特征在于,所述数据处理模块还具体用于当其中的一个用户通过语音、按键或触摸屏主动发起新播放请求时,通过多模态融合分析处理得到的期望的音频场景为将该用户所在区域划分为独立区域,并将其他区域划分为统一的区域。
14.根据权利要求13所述的音频系统,其特征在于,所述数据处理模块还具体用于在任意用户对应的音频场景更改时,首先判断更改后的音频场景是否与其他用户所在区域的音频场景相同;若不相同,则将该用户对应的音频场景独立为单独的一个音频场景。
15.一种汽车,其特征在于,包括车体以及设置在所述车体内的如权利要求9~14任一项所述的音频系统。
16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任意一项所述的车内音频场景自适应调整方法。
17.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至8任意一项所述的车内音频场景自适应调整方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210715268.8A CN115297403A (zh) | 2022-06-22 | 2022-06-22 | 一种车内音频场景自适应调整方法及音频系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210715268.8A CN115297403A (zh) | 2022-06-22 | 2022-06-22 | 一种车内音频场景自适应调整方法及音频系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115297403A true CN115297403A (zh) | 2022-11-04 |
Family
ID=83819607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210715268.8A Pending CN115297403A (zh) | 2022-06-22 | 2022-06-22 | 一种车内音频场景自适应调整方法及音频系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115297403A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115878070A (zh) * | 2023-03-01 | 2023-03-31 | 上海励驰半导体有限公司 | 一种车载音频播放方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109040907A (zh) * | 2018-09-11 | 2018-12-18 | 戴姆勒股份公司 | 车内声音分区控制系统 |
CN109218894A (zh) * | 2017-06-29 | 2019-01-15 | 长城汽车股份有限公司 | 车载定向音响系统、控制方法及车辆 |
CN110475180A (zh) * | 2019-08-23 | 2019-11-19 | 科大讯飞(苏州)科技有限公司 | 车载多音区音频处理系统及方法 |
CN111782052A (zh) * | 2020-07-13 | 2020-10-16 | 湖北亿咖通科技有限公司 | 一种车辆内的人机交互方法 |
CN114194128A (zh) * | 2021-12-02 | 2022-03-18 | 广州小鹏汽车科技有限公司 | 车辆的音量控制方法、车辆和存储介质 |
CN114416996A (zh) * | 2022-01-24 | 2022-04-29 | 中国第一汽车股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
-
2022
- 2022-06-22 CN CN202210715268.8A patent/CN115297403A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218894A (zh) * | 2017-06-29 | 2019-01-15 | 长城汽车股份有限公司 | 车载定向音响系统、控制方法及车辆 |
CN109040907A (zh) * | 2018-09-11 | 2018-12-18 | 戴姆勒股份公司 | 车内声音分区控制系统 |
CN110475180A (zh) * | 2019-08-23 | 2019-11-19 | 科大讯飞(苏州)科技有限公司 | 车载多音区音频处理系统及方法 |
CN111782052A (zh) * | 2020-07-13 | 2020-10-16 | 湖北亿咖通科技有限公司 | 一种车辆内的人机交互方法 |
CN114194128A (zh) * | 2021-12-02 | 2022-03-18 | 广州小鹏汽车科技有限公司 | 车辆的音量控制方法、车辆和存储介质 |
CN114416996A (zh) * | 2022-01-24 | 2022-04-29 | 中国第一汽车股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115878070A (zh) * | 2023-03-01 | 2023-03-31 | 上海励驰半导体有限公司 | 一种车载音频播放方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11340862B2 (en) | Media content playback during travel | |
KR101500150B1 (ko) | 차량의 음향 제어 장치 및 방법 | |
US10332495B1 (en) | In vehicle karaoke | |
US10029723B2 (en) | Input system disposed in steering wheel and vehicle including the same | |
US9575971B2 (en) | Intelligent multimedia system | |
CN112911065B (zh) | 终端的播放音频方法、装置、电子设备及存储介质 | |
CN112937432A (zh) | 车辆发声装置的控制方法、装置、设备及存储介质 | |
CN111049982A (zh) | 车载蓝牙电话模式切换方法及系统、存储介质及车载终端 | |
CN115297403A (zh) | 一种车内音频场景自适应调整方法及音频系统 | |
KR20180076830A (ko) | 오디오 장치 및 그 제어방법 | |
US10275211B2 (en) | Social mode sharing of music in a listening room of a vehicle | |
CN112445393A (zh) | 一种数据处理方法、装置、设备和机器可读介质 | |
Gupte et al. | An innovative wireless design for a car infotainment system | |
CN111601286A (zh) | 一种车载终端、信号处理方法及设备 | |
JP4829184B2 (ja) | 車載装置および音声認識方法 | |
CN118560418A (zh) | 车辆发声装置的控制方法及车辆 | |
CN107667342B (zh) | 电子装置和用于控制电子装置的声音的方法 | |
US20200382893A1 (en) | Sound signal processing device, sound adjustment method, and medium | |
CN112954548B (zh) | 一种将终端麦克风及耳麦采集的声音结合的方法及装置 | |
CN117090668A (zh) | 车辆排气声音调节方法、装置及车辆 | |
KR20230099580A (ko) | 영상 통화 중 영역 별로 노이즈를 처리하는 전자 장치 및 이의 동작 방법 | |
CN118636815A (zh) | 一种车内最佳听音位控制方法及相关装置 | |
CN117202031A (zh) | 音频播放方法、音频播放装置、车辆和存储介质 | |
CN117111877A (zh) | 音频焦点的控制方法、装置、设备及存储介质 | |
CN115967896A (zh) | 车辆音频的控制方法、装置、车辆及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |