CN117854520A - 一种混音方法及相关装置 - Google Patents
一种混音方法及相关装置 Download PDFInfo
- Publication number
- CN117854520A CN117854520A CN202211225744.4A CN202211225744A CN117854520A CN 117854520 A CN117854520 A CN 117854520A CN 202211225744 A CN202211225744 A CN 202211225744A CN 117854520 A CN117854520 A CN 117854520A
- Authority
- CN
- China
- Prior art keywords
- audio stream
- mixing
- audio
- value
- streams
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 281
- 238000012545 processing Methods 0.000 claims abstract description 135
- 230000015654 memory Effects 0.000 claims description 67
- 238000005070 sampling Methods 0.000 claims description 44
- 230000011664 signaling Effects 0.000 claims description 24
- 239000012530 fluid Substances 0.000 claims 1
- 239000000523 sample Substances 0.000 claims 1
- 239000003795 chemical substances by application Substances 0.000 description 90
- 238000010586 diagram Methods 0.000 description 35
- 238000004891 communication Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 20
- 230000006399 behavior Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 239000000203 mixture Substances 0.000 description 15
- 238000004590 computer program Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 7
- 239000011521 glass Substances 0.000 description 7
- 230000003190 augmentative effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Stereophonic System (AREA)
Abstract
本申请公开了一种混音方法及相关装置,该方法包括:音宿侧的设备可以从多个音源设备接收多条指示信息,其中,多条指示信息与多个音频流对应,音宿侧的设备根据多条指示信息可以确定这多个音频流的混音权重,这多个音频流的混音权重用于这多个音频流的混音处理。实施本申请,能够实现对来自多个音源设备的多个音频流的混音处理。
Description
技术领域
本申请涉及音频流混音领域,尤其涉及一种混音方法及相关装置。
背景技术
音源设备为产生或发送音频流的设备,音宿设备为接收或使用(例如播放)音频流的设备。当前,一个音宿设备(例如,耳机)一次只能播放一个音源设备的音频流。当音宿设备从多个音源设备接收到多个音频流的情况下,如何处理这多个音频流的播放,是急需解决的问题。
发明内容
本申请公开了一种混音方法及相关装置,能够实现对来自不同音源设备的多个音频流的混音处理。
第一方面,本申请提供了一种混音方法,所述方法应用于第一设备,所述方法包括:从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
第一设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表、眼镜等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等,还可以是上述终端设备、基础设施设备内的部件或芯片等。
这里,音源设备为产生或发送音频流的设备。音源设备例如可以是手机、计算机、平板电脑、穿戴设备、车载设备、虚拟现实设备、增强现实设备等终端。
示例性地,音频流的混音权重可以用(0,1]的浮点数或百分数进行表示。可以理解,混音权重越大,意味着该混音权重对应的音频流在混音处理过程中的响度的输出占比越高,或者该混音权重对应的音频流在混合获得的音频流中的音量越大。
上述方法中,通过至少一个音源设备发送的至少一条指示信息,可以确定该至少一条指示信息对应的至少一个音频流的混音权重,而这至少一个音频流的混音权重可以用于对这至少一个音频流的混音处理,从而实现了对来自不同音源设备的多个音频流的混音处理。
可选地,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述至少一个音源设备的类型;
所述混音权重;
所述至少一个音源设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
示例性地,音频流的类型可以通过标识或者二进制取值等方式来指示。音频流的类型例如为音乐、游戏、语音通话、导航、通知提醒、告警、闹钟或广播。
其中,音源设备的类型例如为私人设备或公共设备。
音源设备所属用户的类型例如可以基于用户的年龄划分为未成年人和成年人,或者可以划分为儿童、青年人和老年人,也可以基于用户的职业等进行划分。
生成音频流的应用的类型例如可以分为生活实用、社交、办公、娱乐、新闻、学习等,也可以一个应用即为一类,在此不作具体限定。
实施上述实现方式,可以从音源设备发送的指示信息中获取音频流的混音权重,或者,根据音源设备发送的指示信息确定音频流的混音权重。
可选地,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应。也就是说,可以针对单独一条音频流指示混音权重。
进一步地,所述第一音频流和所述第二音频流为同一类型的音频流和/或来自同一音源设备和/或由同一个应用生成的音频流。
可以看出,尽管第一音频流和第二音频流为同一类型的音频流,和/或来自同一音源设备和/或由同一个应用生成的音频流,第一音频流和第二音频流可以对应不同的指示信息,用于实现针对第一音频流和第二音频流制定不同的混音策略。
可选地,所述至少一条指示信息包括第一指示信息,所述第一指示信息与第一音频流和第二音频流对应。也就是说,指示信息和音频流可以是一对多的关系,如此,当音源设备待发送的音频流较多时,可以有效减少指示信息的发送次数,减少带宽的消耗,有利于提高音频流的传输效率。
进一步地,所述第一音频流和所述第二音频流为同一类型的音频流和/或来自同一音源设备和/或由同一个应用产生的音频流。
例如,同一音源设备在需要连续发送相同类型和/或由同一应用产生的多个音频流时,该音源设备可以预先仅发送一条指示了音频流的类型和/或应用类型的指示信息,该指示信息与多个音频流对应,而无需发送多条指示信息。
可选地,所述方法还包括:获取多个音频流,所述多个音频流来自多个音源设备,所述多个音频流包括所述至少一个音频流;根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流。
这里,多个音频流也可以包括第一设备自身产生的音频流,即第一设备可以是个音源设备。也就是说,第一设备获取的多个音频流可以是全部来自其他多个音源设备,也可以是部分来自其他音源设备且部分由自身产生。
实施上述实现方式,通过多个音源流和这多个音频流的混音权重确定待播放的目标音频流,实现了对来自多个音源设备的多个音频流的混音处理。
可选地,所述方法还包括:播放所述目标音频流,或者,向目标设备发送所述目标音频流。
可以看出,目标音频流可以由自身播放,也可以发送给目标设备由目标设备播放。
可选地,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:在满足第一预设条件时,确定所述目标音频流为所述第一音频流,其中,所述第一预设条件为下述任一条件:所述第二音频流的混音权重小于或等于第一值且所述第一音频流的混音权重大于所述第一值;或,所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
这里,第一值和第二值为基于经验预设的。
实施上述实现方式,第一音频流的混音权重和第二音频流的混音权重满足第一预设条件时,确定待播放的目标音频流为第一音频流。
可选地,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:在满足第二预设条件时,确定所述目标音频流为所述第二音频流,其中,所述第二预设条件为下述任一条件:所述第一音频流的混音权重小于或等于所述第一值且所述第二音频流的混音权重大于所述第一值;或,所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重,所述第二值大于所述第一值。
实施上述实现方式,第一音频流的混音权重和第二音频流的混音权重满足第二预设条件时,确定待播放的目标音频流为第二音频流。
可选地,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,所述第二值大于所述第一值,对所述第一音频流和所述第二音频流进行混音生成第三音频流;确定所述目标音频流为所述第三音频流。
实施上述实现方式,当第一音频流的混音权重和第二音频流的混音权重均处于区间(第一值,第二值)的范围内时,对第一音频流和第二音频流进行混音,则待播放的目标音频流为第一音频流和第二音频流混音后的音频流。
可选地,所述多个音频流包括第一音频流和第二音频流;所述第一音频流为所述第一设备生成,所述第二音频流来自第一音源设备;或,所述第一音频流来自第一音源设备,所述第二音频流来自第二音源设备。
这里,第一音频流和第二音频流均为单音频流。
示例性地,第一音频流为第一设备生成可以是第一音频流为第一设备的某个应用生成的音频流,也可以是第一音频流为第一设备经混音获得的音频流。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
实施上述实现方式,预先设置了第一值和第二值,且第二值大于第一值,基于音频流的混音权重与第一值、第二值之间的大小关系,可以定义该混音权重对应的音频流是否可以作为混音的来源,以及在可以作为混音的来源时具体为非唯一来源还是唯一来源,通过定义不同的混音行为,可以实现不同的混音处理,达到不同的混音效果。
第二方面,本申请提供了一种混音方法,所述方法应用于第二设备,所述方法包括:发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;发送所述至少一个音频流。
第二设备为可以产生或发送音频流的音源设备。第二设备例如可以是手机、计算机、平板电脑、穿戴设备、车载设备、虚拟现实设备、增强现实设备等终端。
这里,至少一个音频流为第二设备生成。另外,音频流的混音权重可参考第一方面中相应内容的叙述。
上述方法中,第二设备作为音源设备,可以提供至少一条指示信息和至少一条指示信息对应的至少一个音频流,且至少一条指示信息可以用于确定至少一个音频流的混音权重,至少一个音频流的混音权重可以用于对这至少一个音频流的混音处理,从而有利于实现对来自不同音源设备的多个音频流的混音处理。
可选地,所述至少一条指示信息与至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述第二设备的类型;
所述混音权重;
所述第二设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
示例性地,音频流的类型可以通过标识或者二进制取值等方式来指示。音频流的类型例如为音乐、游戏、语音通话、导航、通知提醒、告警、闹钟或广播。
其中,第二设备的类型例如为私人设备或公共设备。
第二设备所属用户的类型例如可以基于用户的年龄划分为未成年人和成年人,或者可以划分为儿童、青年人和老年人,也可以基于用户的职业等进行划分。
生成音频流的应用的类型例如可以分为生活实用、社交、办公、娱乐、新闻、学习等,也可以一个应用即为一类,在此不作具体限定。
实施上述实现方式,第二设备作为音源设备发送指示信息中可以携带音频流的混音权重,也可以携带音频流的类型、音频流的编码格式、第二设备的类型、第二设备所属用户的类型、生成音频流的应用的类型等可以用于确定音频流的混音权重的信息。
可选地,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应。
进一步地,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
可以看出,第二设备发送的指示信息和音频流可以一一对应,例如可以针对单独一条音频流指示混音权重。
例如,当第二设备产生了同一类型和/或由同一应用成的第一音频流和第二音频流时,第一音频流和第二音频流可以对应不同的指示信息。
可选地,所述至少一条指示信息包括第一指示信息,其中,所述第一指示信息与第一音频流和第二音频流对应。
进一步地,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
可以看出,第二设备发送的指示信息和音频流可以一对多。例如,第二设备在需要连续发送相同类型和/或由同一应用产生的多个音频流时,该音源设备可以仅发送一条指示了音频流的类型和/或应用类型的指示信息,该指示信息与多个音频流对应,而无需发送多条指示信息,减少了带宽的消耗,有利于提高音频流的传输效率。
第三方面,本申请提供了一种混音方法,所述方法应用于第一设备,所述方法包括:向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:所述音频流的标识、所述音频流的类型、生成所述音频流的应用的类型、生成所述音频流的音源设备的类型、生成所述音频流的音源设备所属的用户的类型和所述音频流的编码格式;接收所述用户的设置信息;根据所述设置信息配置所述多个音频流的混音权重。
这里,第一设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等。
这里,用户可以是与具有音宿能力的设备和/或具有混音权重配置能力的设备关联的用户,例如使用具有混音权重配置能力的设备的用户,可以是具有混音权重配置能力的设备所属的用户,可以是使用具有音宿能力的设备的用户,也可以是具有音宿能力的设备所属的用户等。其中,音宿能力是指设备可以接收或使用音频流,使用音频流例如可以是播放音频流。
上述方法中,支持用户根据音频流的属性(例如,音频流的类型、产生音频流的音源设备的类型、生成音频流的应用的类型等中的至少一项)对音频流的混音权重进行动态配置,不仅有利于提升用户的听感体验,还满足了多应用场景下的用户需求。
可选地,所述接收所述用户的设置信息,包括:
获取所述用户通过所述第一设备的触摸屏输入的所述设置信息;
获取所述用户通过所述第一设备的按钮输入的所述设置信息;
获取所述用户通过所述第一设备的键盘输入的所述设置信息;
获取所述用户通过语音输入的所述设置信息;或
获取所述用户通过手势输入的所述设置信息。
实施上述实现方式,支持用户通过多种渠道,例如,设备的触摸屏、按钮、键盘以及语音、手势等输入相应的设置信息。
可选地,所述方法还包括:向所述用户指示所述多个音频流的使用场景;所述设置信息用于配置所述多个音频流在所述使用场景下的混音权重。
实施上述实现方式,还可以配置多个音频流在不同使用场景下的混音权重,满足用户在不同使用场景下的混音需求。
可选地,所述使用场景包括第一使用场景和第二使用场景,所述多个音频流在所述第一使用场景下的混音权重不同于所述多个音频流在所述第二使用场景下的混音权重。
实施上述实现方式,在不同的使用场景下,可以使用多个音频流在当前使用场景下的混音权重,满足了用户的多样性需求。
可选地,所述使用场景包括下述场景中的至少一种:游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。
例如,在游戏模式场景下游戏类型的音频流的混音权重高于其他使用场景中游戏类型的音频流的混音权重。又例如,驾驶模式场景下导航类型的音频流的混音权重高于其他使用场景中导航类型的音频流的混音权重。又例如,学习模式场景中学习类应用生成的音频流的混音权重高于其他使用场景中学习类应用生成的音频流的混音权重。
可选地,所述方法还包括:基于所述混音权重,将所述多个音频流混合成被播放的音频流。
可选地,所述多个音频流包括具有高优先级的第一音频流,所述方法还包括通过以下多种方式中的至少一种方式提醒所述用户关注所述第一音频流:
增大所述第一音频流的混音权重;
多次播放所述第一音频流的内容;和
要求所述用户反馈确认。
这里,高优先级的第一音频流可以理解为:第一音频流携带有高优先级的标签,或者,第一音频流的优先级高于预设的优先级阈值,或者,第一音频流的优先级取值为高优先级对应的阈值等,在此不作具体限定。另外,优先级例如可以表示重要度、紧急程度、紧迫程度、与用户的关联程度等。
例如,音频流1和音频流2为第二设备从同一音源设备获取的两个音频流,其中,音频流1和音频流2为同一类型的音频流,例如均为机场广播,音频流1承载了与用户相关的航班内容,而音频流2未承载与用户相关的航班内容,则音频流1具有较高的优先级,在此情况下,可通过上述方式提醒用户重点关注音频流1。
实施上述实现方式,可以通过增大音频流的混音权重、多次播放音频流的内容、要求用户反馈确认等多种方式提醒用户关注具有高优先级的音频流。
可选地,所述增大所述第一音频流的混音权重,包括:在所述第一音频流的播放时间段内,降低所述多个音频流中与所述第一音频流相混合的其它音频流的播放音量;或者在所述第一音频流的播放时间段内,设置所述第一音频流为所述被播放的音频流中的唯一音频流。
实施上述实现方式,通过弱化与第一音频流相混合的其他音频流,或者,设置第一音频流为被播放的唯一音频流,可以使得第一音频流更加突出,用户也较容易关注第一音频流。
可选地,所述多次播放所述第一音频流的内容,包括:在所述被播放的音频流中重复多次混入所述第一音频流,且逐次增大所述第一音频流的混音权重。
实施上述实现方式,通过在被播放的音频流中重复多次混入第一音频流使得第一音频流被反复播放,且第一音频流每次以相较于前一次更大的混音权重被混入,使得第一音频流被逐次播放时第一音频流在被播放的音频流中的音量也越来越高,用户可以及时关注第一音频流。
可选地,所述要求所述用户反馈确认,包括:向所述用户询问是否知晓所述第一音频流承载的内容;接收所述用户的反馈信息,所述反馈信息用于指示所述用户确认知晓所述第一音频流承载的内容。
例如,向用户询问是否知晓第一音频流承载的内容:可以是在显示界面上显示待用户确认的“是否知晓第一音频流承载的内容”的弹框提示信息,同时还可以控制显示界面所在设备振动、播放提示音等。
实施上述实现方式,在有高优先级的第一音频流的情况下,还可以主动寻求用户对第一音频流的确认反馈,以确保用户关注了第一音频流。
可选地,在接收所述反馈信息之前,所述方法还包括:在被播放的音频流中重复混入所述第一音频流;在接收所述反馈信息之后,所述方法还包括:停止在被播放的音频流中混入所述第一音频流。
示例性地,停止在被播放的音频流中混入第一音频流,可以是在接收到用户的反馈信息后,不论是否再次接收到第一音频流,都停止在被播放的音频流中混入第一音频流。
可以看出,在未接收到用户的反馈信息时,通过在被播放的音频流中重复混入第一音频流以实现循环播放第一音频流的循环播放,能有效提醒用户关注第一音频流。
可选地,所述方法还包括:当所述被播放的音频流的音量超过预设音量阈值时,向所述用户提示所述音量过大。
实施上述实现方式,当被播放的音频流的音量过大时,可以提醒用户,以防止听力受损。
可选地,所述配置为在执行所述混音之前的预配置或者在执行所述混音过程中对所述混音权重的调整。
这里,预配置可以是出厂时的配置,也可以是用户的首次配置,还可以是在某使用场景下的第一次配置。
可选地,所述方法还包括:获取所述混音权重的默认设置;所述根据所述设置信息配置所述多个音频流的混音权重包括:根据所述设置信息和所述默认设置配置所述多个音频流的混音权重。
也就是说,音频流的混音权重的配置可以由混音权重的默认设置以及用户的偏好共同决定。例如,音频流的混音权重的默认设置要求类型1的音频流的混音权重应大于或等于第一预设值,而用户输入的设置信息指示了类型1的音频流的混音权重为目标值,且目标值小于第一预设值,假设用户的设置信息的优先级高于混音权重的默认设置的优先级的情况下,则可以确定类型1的音频流的混音权重应为目标值。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
实施上述实现方式,预先设置了第一值和第二值,且第二值大于第一值,基于音频流的混音权重与第一值、第二值之间的大小关系,可以定义该混音权重对应的音频流是否可以作为混音的来源,以及在可以作为混音的来源时具体为非唯一来源还是唯一来源,通过定义不同的混音行为,可以实现不同的混音处理,达到不同的混音效果。
第四方面,本申请提供了一种混音方法,所述方法应用于第一设备,所述方法包括:生成混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重;向第二设备发送所述混音配置信息,所述混音配置信息用于对所述多个音频流的混音处理。
这里,第一设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表等)、车机等具有混音权重配置能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等,还可以是终端设备、基础设施设备内的部件或芯片等。
第二设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表、眼镜等)、车机等具有混音权重配置能力以及音宿能力的终端设备。
上述方法中,通过生成并发送包含了来自多个音源设备的多个音频流的混音权重的混音配置信息,有利于实现对来自不同音源设备的多个音频流的混音处理。
可选地,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
其中,采样深度表示采样点对应的离散信号进行量化的精度,采样深度影响音频流的用户听感。
可选地,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。这里,音源设备的类型、音源设备所属用户的类型、生成音频流的应用的类型、音频流的使用场景等可参考第一方面中相应内容的叙述,在此不再赘述。
可选地,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的方法调用上,所述方法调用的句柄应为所述混音策略控制点的句柄。
可选地,向第二设备发送所述混音配置信息之前,所述方法还包括:获取所述第二设备支持的音频流的多种类型;所述生成混音配置信息,包括:根据所述第二设备支持的音频流的所述多种类型,生成所述混音配置信息,所述多种类型包括所述多个音频流的类型。
实施上述实现方式,混音配置信息中音频流的混音权重与音频流的类型之间存在对应关系,如此,使得混音配置信息的接收端在知晓音频流的类型的情况下,可以通过混音配置信息获取该类型的音频流对应的混音权重。
可选地,所述混音配置信息还基于下述因素中的至少一项生成:
产生音频流的音源设备的类型;
音频流的编码格式;
产生音频流的音源设备所属用户的类型;
生成音频流的应用的类型;和
音频流的使用场景。
也就是说,混音配置信息中音频流的混音权重还与产生音频流的音源设备的类型、产生音频流的音源设备所属用户的类型、生成音频流的应用的类型、音频流的编码格式、音频流的使用场景等音宿中的至少一项有关,充分考虑了应用时的多样性需求。
可选地,所述方法还包括:向所述第二设备发送混音周期,所述混音周期用于指示所述多个音频流中每个音频流被混音时所需的采样点的数量。
可以理解,当参与混音的音频流的数量为多个时,混音周期这个参数才有意义。
这里,多个音频流混音时采用统一的采样率和统一的混音周期,该混音周期可以是第一设备提供给第二设备的。示例性地,混音周期可以是以采样率为单位的时长,也可以是一个预设时长,在此不作具体限定。
示例性地,对于游戏类型的音频流期望时延低,则可以将混音周期设置的小一些;对于音乐类型的音频流期望音质高一些,则可以将混音周期设置的大一些。这里,时延是指音频流从音源端发出至音宿端接收到音频流之间的时间差。
可以看出,混音周期动态可配置,方便进行实时混音和以音频帧或其他时间维度的混音,能够兼顾实时性和音质。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。此技术特征的有益效果可参考第一方面相应特征的技术效果的描述,在此不再赘述。
可选地,所述方法还包括:接收溢出指示信息,所述溢出指示信息用于指示混音后的音频流发生溢出,所述溢出指示信息包括所述混音后的音频流中响度输出占比最大的音频流的类型;根据所述溢出指示信息调整所述混音配置信息中的混音权重。
实施上述实现方式,还可以接收反馈的溢出指示信息,并基于溢出指示信息相应调整多个音频流中至少一个音频流的混音权重,这种反馈机制有利于改善用户的听感体验。
第五方面,本申请提供了一种混音方法,应用于第二设备,所述方法包括:从第一设备接收混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;根据所述混音配置信息进行配置。
这里,第一设备和第二设备可以参考上述第四方面中相应内容的叙述,在此不再赘述。
上述方法中,通过混音配置信息可以实现对来自多个音源设备的多个音频流的混音处理。
可选地,所述第二设备当前播放第一音频流,所述方法还包括:接收第二音频流,所述第二音频流和所述第一音频流来自不同的音源设备;根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流;所述第一音频流的混音权重和所述第二音频流的混音权重从所述混音配置信息中获取;播放所述目标音频流。
实施上述实现方式,可以根据第一音频流的混音权重和所述第二音频流的混音权重确定待播放的目标音频流,实现了对来自不同音源设备的多个音频流的混音处理。
可选地,根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:在满足预设条件时,拒绝所述第二音频流加入所述混音,确定所述目标音频流为所述第一音频流,其中,所述预设条件为下述任一条件;所述第二音频流的混音权重小于或等于第一值且所述第一音频流的混音权重大于所述第一值;或,所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
实施上述实现方式,待加入的第二音频流被拒绝加入混音,则待播放的目标音频流为第一音频流,也就是说,正在播放的音频流仍为第一音频流。
可选地,根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:当所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重时,允许所述第二音频流抢占,确定所述目标音频流为所述第二音频流,其中,所述第二值大于所述第一值。
实施上述实现方式,待加入的第二音频流抢占成功,则待播放的目标音频流为第二音频流,也就是说,正在播放的音频流将由第一音频流切换为第二音频流。
可选地,根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,允许所述第二音频流加入所述混音;对所述第一音频流和所述第二音频流进行混音生成第三音频流;其中,所述第二值大于所述第一值;确定所述目标音频流为所述第三音频流。
实施上述实现方式,待加入的第二音频流允许加入第一音频流进行混音,则待播放的目标音频流为第一音频流和第二音频流混音后的音频流,即第三音频流,也就是说,正在播放的音频流将由第一音频流切换为第三音频流。
下述第五方面的剩余技术特征的有益效果具体可参考上述第四方面中相应内容的叙述。
可选地,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
可选地,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
可选地,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的方法调用上,所述方法调用的句柄应为所述混音策略控制点的句柄。
可选地,所述从第一设备接收混音配置信息之前,所述方法还包括:向所述第一设备发送所述第二设备支持的音频流的多种类型。
第六方面,本申请提供了一种混音方法,应用于第一设备,所述方法包括:从第二设备接收第一消息,所述第一消息包括音频流混音服务的标识;基于所述第一消息向所述第二设备发送第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
这里,第一设备为可以提供混音代理且具有混音处理能力的设备。第一设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表、眼镜等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等,还可以是上述终端设备、基础设施设备内的部件或芯片等。
第二设备为寻找混音代理的具有音宿能力的设备。第二设备例如可以是耳机、音响、带播放器的眼镜或其他播放器等。
上述方法中,第一设备能够为能力有限的第二设备(例如,第二设备仅支持单路的音频流或某种传输模式的音频流)提供混音代理,能够帮助第二设备实现来自多个音源设备的多个音频流的混音处理,间接扩展了第二设备对来自多个设备的多音源的接收能力。
可选地,所述方法还包括:获取多个音频流,所述多个音频流来自多个音源设备;根据所述多个音频流,确定待播放的目标音频流;向所述第二设备发送所述目标音频流。
实施上述实现方式,由第二设备代替第一设备获取多个音频流以及执行混音处理,并将确定的待播放的目标音频流发送给第二设备,实现了为第二设备提供混音代理的功能,还间接扩展了第二设备对来自多个设备的多音源的接收能力。
可选地,所述向所述第二设备发送第二消息之前,所述方法还包括:发送第一请求消息,所述第一请求消息用于请求获取所述第二设备的混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;从所述第二设备接收所述混音配置信息。
实施上述实现方式,第一设备可以基于从第二设备获取的混音配置信息对来自多个音源设备的多个音频流进行混音处理,实现为第二设备提供混音代理的功能。
可选地,所述方法还包括:发送第二请求消息,所述第二请求消息用于请求获取所述第二设备的音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力;从所述第二设备接收所述音宿能力信息;根据所述音宿能力信息,确定开始为所述第二设备提供所述混音代理。
示例性地,第二设备的音宿能力信息包括第二设备支持的编解码器的类型和能力(例如,采样率、采样深度、音频通道数、编码格式等)、支持的传输模式(例如单播、组播、广播中的至少一项)、音频流的类型和服务质量(quality of service,Qos)等中的至少一项。
实施上述实现方式,第一设备可以基于音宿能力信息,判断自身是否可以作为为第二设备提供混音代理的设备。
可选地,所述方法还包括:向所述第二设备发送第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识用于指示所述第一设备结束为所述第二设备提供所述混音代理。
实施上述实现方式,第一设备需要结束混音代理时,可以向第二设备发送第三消息,以告知第二设备自身结束为第二设备提供混音代理。
可选地,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
可选地,所述音频流混音服务的标识的长度为16比特。
第七方面,本申请提供了一种混音方法,所述方法应用于第二设备,所述方法包括:广播第一消息,所述第一消息包括音频流混音服务的标识;从第一设备接收第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
这里,第一设备和第二设备可以参考上述第六方面中相应内容的叙述,在此不再赘述。
上述方法中,第二设备可以通过广播消息寻找可以为自身提供混音代理的设备,当接收到第二消息时,基于第二消息确定第一设备为自身寻找到的为自身提供混音代理的设备,能够代替第二设备实现对多个音源设备的多个音频流的混音处理。
可选地,所述从第一设备接收第二消息之前,所述方法还包括:从所述第一设备接收第一请求消息;基于所述第一请求消息,向所述第一设备发送混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理。
实施上述实现方式,通过向第一设备发送混音配置信息,使得第一设备基于混音配置信息对来自多个音源设备的多个音频流进行混音处理,实现为第二设备提供混音代理的功能。
可选地,所述从第一设备接收第二消息之前,所述方法还包括:从所述第一设备接收第二请求消息;基于所述第二请求消息,向所述第一设备发送音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力。
示例性地,第二设备的音宿能力信息包括第二设备支持的编解码器的类型和能力(例如,采样率、采样深度、音频通道数、编码格式等)、支持的传输模式(例如单播、组播、广播中的至少一项)、音频流的类型和服务质量(quality of service,Qos)等中的至少一项。第二设备的音宿能力信息可用于第一设备判断自身是否可以作为为第二设备提供混音代理的设备。
可选地,所述方法还包括:从所述第一设备接收第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识指示所述第一设备结束为所述第二设备提供所述混音代理。
实施上述实现方式,通过第三消息知晓第一设备结束为第二设备提供混音代理,第二设备恢复自行扫描和/或连接音源设备。
可选地,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
可选地,所述音频流混音服务的标识的长度为16比特。
第八方面,本申请提供了一种用于混音的装置,所述装置为第一设备或包含于所述第一设备中,所述装置包括:接收单元,用于从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;处理单元,用于根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
可选地,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述至少一个音源设备的类型;
所述混音权重;
所述至少一个音源设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
可选地,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,所述第一音频流和所述第二音频流为同一类型的音频流和/或来自同一音源设备和/或由同一个应用生成的音频流。
可选地,所述装置还包括:获取单元,用于获取多个音频流,所述多个音频流来自多个音源设备,所述多个音频流包括所述至少一个音频流;所述处理单元还用于根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流。这里,所述多个音源设备可以包括所述装置,也可以不包括所述装置,在此不作具体限定。
可选地,所述装置还包括:播放单元,用于播放所述目标音频流;或者,发送单元,用于向目标设备发送所述目标音频流。
可选地,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:在满足第一预设条件时,确定所述目标音频流为所述第一音频流,其中,所述第一预设条件为下述任一条件:所述第二音频流的混音权重小于或等于所述第一值且所述第一音频流的混音权重大于所述第一值;或,所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
可选地,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:在满足第二预设条件时,确定所述目标音频流为所述第二音频流,其中,所述第二预设条件为下述任一条件:所述第一音频流的混音权重小于或等于所述第一值且所述第二音频流的混音权重大于所述第一值;或,所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重,所述第二值大于所述第一值。
可选地,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,所述第二值大于所述第一值,对所述第一音频流和所述第二音频流进行混音生成第三音频流;确定所述目标音频流为所述第三音频流。
可选地,所述多个音频流包括第一音频流和第二音频流;所述第一音频流为所述第一设备生成,所述第二音频流来自第一音源设备;或,所述第一音频流来自第一音源设备,所述第二音频流来自第二音源设备。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
第九方面,本申请提供了一种用于混音的装置,所述装置为第二设备或包含于所述第二设备中,所述装置包括:发送单元,用于发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;所述发送单元,还用于发送所述至少一个音频流。
可选地,所述至少一条指示信息与所述第二设备生成的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述第二设备的类型;
所述混音权重;
所述第二设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
可选地,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
可选地,所述至少一条指示信息包括第一指示信息,其中,所述第一指示信息与第一音频流和第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
第十方面,本申请提供了一种用于混音的装置,所述装置为第一设备或包含于所述第一设备中,所述装置包括:显示单元,用于向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:所述音频流的标识、所述音频流的类型、生成所述音频流的应用的类型、生成所述音频流的音源设备的类型、生成所述音频流的音源设备所属的用户的类型和所述音频流的编码格式;接收单元,用于接收所述用户的设置信息;处理单元,用于根据所述设置信息配置所述多个音频流的混音权重。
可选地,所述接收单元具体用于:
获取所述用户通过所述第一设备的触摸屏输入的所述设置信息;
获取所述用户通过所述第一设备的按钮输入的所述设置信息;
获取所述用户通过所述第一设备的键盘输入的所述设置信息;
获取所述用户通过语音输入的所述设置信息;或
获取所述用户通过手势输入的所述设置信息。
可选地,所述显示单元还用于向所述用户指示所述多个音频流的使用场景;所述设置信息用于配置所述多个音频流在所述使用场景下的混音权重。
可选地,所述使用场景包括第一使用场景和第二使用场景,所述多个音频流在所述第一使用场景下的混音权重不同于所述多个音频流在所述第二使用场景下的混音权重。
可选地,所述使用场景包括下述场景中的至少一种:游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。
可选地,所述处理单元还用于:基于所述混音权重,将所述多个音频流混合成被播放的音频流。
可选地,所述多个音频流包括具有高优先级的第一音频流,所述处理单元还用于通过以下多种方式中的至少一种方式提醒所述用户关注所述第一音频流:
增大所述第一音频流的混音权重;
多次播放所述第一音频流的内容;和
要求所述用户反馈确认。
可选地,所述处理单元具体用于:在所述第一音频流的播放时间段内,降低所述多个音频流中与所述第一音频流相混合的其它音频流的播放音量;或者在所述第一音频流的播放时间段内,设置所述第一音频流为所述被播放的音频流中的唯一音频流。
可选地,所述处理单元具体用于:在所述被播放的音频流中重复多次混入所述第一音频流,且逐次增大所述第一音频流的混音权重。
可选地,所述处理单元具体用于:向所述用户询问是否知晓所述第一音频流承载的内容;接收所述用户的反馈信息,所述反馈信息用于指示所述用户确认知晓所述第一音频流承载的内容。
可选地,所述处理单元还用于在接收所述反馈信息之前,在被播放的音频流中重复混入所述第一音频流;在接收所述反馈信息之后,停止在被播放的音频流中混入所述第一音频流。
可选地,所述处理单元还用于:当所述被播放的音频流的音量超过预设音量阈值时,向所述用户提示所述音量过大。
可选地,所述配置为在执行所述混音之前的预配置或者在执行所述混音过程中对所述混音权重的调整。
可选地,所述装置还包括:获取单元,用于获取所述混音权重的默认设置;所述处理单元具体用于:根据所述设置信息和所述默认设置配置所述多个音频流的混音权重。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
第十一方面,本申请提供了一种用于混音的装置,所述装置为第一设备或包含于所述第一设备中,所述装置包括:生成单元,用于生成混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重;发送单元,用于向第二设备发送所述混音配置信息,所述混音配置信息用于对所述多个音频流的混音处理。
可选地,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
可选地,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
可选地,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的装置调用上,所述装置调用的句柄应为所述混音策略控制点的句柄。
可选地,所述装置还包括:获取单元,用于获取所述第二设备支持的音频流的多种类型;所述生成单元具体用于:根据所述第二设备支持的音频流的所述多种类型,生成所述混音配置信息,所述多种类型包括所述多个音频流的类型。
可选地,所述混音配置信息还基于下述因素中的至少一项生成:
产生音频流的音源设备的类型;
音频流的编码格式;
产生音频流的音源设备所属用户的类型;
生成音频流的应用的类型;和
音频流的使用场景。
可选地,所述发送单元还用于向所述第二设备发送混音周期,所述混音周期用于指示所述多个音频流中每个音频流被混音时所需的采样点的数量。
可选地,当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
可选地,所述装置还包括:接收单元,用于接收溢出指示信息,所述溢出指示信息用于指示混音后的音频流发生溢出,所述溢出指示信息包括所述混音后的音频流中响度输出占比最大的音频流的类型;所述处理单元还用于根据所述溢出指示信息调整所述混音配置信息中的混音权重。
第十二方面,本申请提供了一种用于混音的装置,所述装置为第二设备或包含于所述第二设备中,所述装置包括:接收单元,用于从第一设备接收混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;处理单元,用于根据所述混音配置信息进行配置。
可选地,所述第二设备当前播放第一音频流,所述接收单元还用于接收第二音频流,所述第二音频流和所述第一音频流来自不同的音源设备;所述处理单元还用于根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流;所述第一音频流的混音权重和所述第二音频流的混音权重从所述混音配置信息中获取;所述装置还包括:播放单元用于播放所述目标音频流。
可选地,所述处理单元具体用于:在满足预设条件时,拒绝所述第二音频流加入所述混音,确定所述目标音频流为所述第一音频流,其中,所述预设条件为下述任一条件;所述第二音频流的混音权重小于或等于第一值且所述第一音频流的混音权重大于所述第一值;或,所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
可选地,所述处理单元具体用于:当所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重时,允许所述第二音频流抢占,确定所述目标音频流为所述第二音频流,其中,所述第二值大于所述第一值。
可选地,所述处理单元具体用于:当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,允许所述第二音频流加入所述混音;对所述第一音频流和所述第二音频流进行混音生成第三音频流;其中,所述第二值大于所述第一值;确定所述目标音频流为所述第三音频流。
可选地,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
可选地,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
可选地,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的装置调用上,所述装置调用的句柄应为所述混音策略控制点的句柄。
可选地,所述装置还包括:发送单元,用于向所述第一设备发送所述第二设备支持的音频流的多种类型。
第十三方面,本申请提供了一种用于混音的装置,所述装置为第一设备或包含于所述第一设备中,所述装置包括:接收单元,用于从第二设备接收第一消息,所述第一消息包括音频流混音服务的标识;发送单元,用于基于所述第一消息向所述第二设备发送第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
可选地,所述装置还包括:获取单元,用于获取多个音频流,所述多个音频流来自多个音源设备;处理单元,用于根据所述多个音频流,确定待播放的目标音频流;所述发送单元还用于向所述第二设备发送所述目标音频流。这里,所述多个音源设备可以包括所述装置,也可以不包括所述装置,在此不作具体限定。
可选地,所述发送单元还用于发送第一请求消息,所述第一请求消息用于请求获取所述第二设备的混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;所述接收单元还用于从所述第二设备接收所述混音配置信息。
可选地,所述发送单元还用于发送第二请求消息,所述第二请求消息用于请求获取所述第二设备的音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力;所述接收单元还用于从所述第二设备接收所述音宿能力信息;所述装置还包括,处理单元用于:根据所述音宿能力信息,确定开始为所述第二设备提供所述混音代理。
可选地,所述发送单元还用于向所述第二设备发送第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识用于指示所述第一设备结束为所述第二设备提供所述混音代理。
可选地,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
可选地,所述音频流混音服务的标识的长度为16比特。
第十四方面,本申请提供了一种用于混音的装置,所述装置为第二设备或包含于所述第二设备中,所述装置包括:发送单元,用于广播第一消息,所述第一消息包括音频流混音服务的标识;接收单元,用于从第一设备接收第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
可选地,所述接收单元还用于从所述第一设备接收第一请求消息;所述发送单元还用于基于所述第一请求消息,向所述第一设备发送混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理。
可选地,所述接收单元还用于从所述第一设备接收第二请求消息;所述发送单元还用于基于所述第二请求消息,向所述第一设备发送音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力。
可选地,所述接收单元还用于从所述第一设备接收第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识指示所述第一设备结束为所述第二设备提供所述混音代理。
可选地,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
可选地,所述音频流混音服务的标识的长度为16比特。
第十五方面,本申请提供了一种设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第一方面或者第一方面的任一可能的实现方式中的方法。
第十六方面,本申请提供了一种设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第三方面或者第三方面的任一可能的实现方式中的方法。
第十七方面,本申请提供了一种音源设备,所述音源设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第二方面或者第二方面的任一可能的实现方式中的方法。
第十八方面,本申请提供了一种用于混音权重配置的设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第四方面或者第四方面的任一可能的实现方式中的方法。
第十九方面,本申请提供了一种使用音频流的设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第五方面或者第五方面的任一可能的实现方式中的方法。
第二十方面,本申请提供了一种用于提供混音代理的设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第六方面或者第六方面的任一可能的实现方式中的方法。
第二十一方面,本申请提供了一种使用音频流的设备,所述设备包括处理器和存储器,其中,存储器用于存储程序指令;所述处理器调用所述存储器中的程序指令,使得设备执行第七方面或者第七方面的任一可能的实现方式中的方法。
第二十二方面,本申请提供了一种车辆,所述车辆包括第八方面至第十四方面中任一方面所述的装置,或者包括第八方面至第十四方面的任一可能的实现方式中的装置,或者包括第十五方面至第二十一方面中任一方面所述的设备,或者包括第十五方面至第二十一方面的任一可能的实现方式中的设备。
第二十三方面,本申请提供了一种混音系统,所述系统包括第一装置、第二装置和第三装置,其中,第三装置用于实现第二方面或者第二方面的任一可能的实现方式中的方法,第一装置用于实现第四方面或者第四方面的任一可能的实现方式中的方法且第二装置用于实现第五方面或者第五方面的任一可能的实现方式中的方法,或者,第一装置用于实现第六方面或者第六方面的任一可能的实现方式中的方法且第二装置用于实现第七方面或者第七方面的任一可能的实现方式中的方法。
进一步地,第三装置可以是第九方面或者第九方面的任一可能的实现方式中的装置,或者是第十七方面所述的设备;第一装置可以是第十一方面或者第十一方面的任一可能的实现方式中的装置,或者是第十三方面或者第十三方面的任一可能的实现方式中的装置,或者是第十八方面所述的设备,或者是第二十方面所述的设备;第二装置可以是第十二方面或者第十二方面的任一可能的实现方式中的装置,或者是第十四方面或者第十四方面的任一可能的实现方式中的装置,或者是第十九方面所述的设备,或者是第二十一方面所述的设备。
第二十四方面,本申请提供了一种混音系统,所述系统包括第一装置和第二装置,其中,第一装置用于执行第二方面或者第二方面的任一可能的实现方式中的方法,第二装置用于执行第一方面或者第一方面的任一可能的实现方式中的方法,和/或,执行第三方面或者第三方面的任一可能的实现方式中的方法。
进一步地,第一装置可以是第九方面或者第九方面的任一可能的实现方式中的装置,或者是第十七方面所述的设备;第二装置可以是第八方面或者第八方面的任一可能的实现方式中的装置,或者是第十五方面所述的设备,或者是第十方面或者第十方面的任一可能的实现方式中的装置,或者是第十六方面所述的设备。
第二十五方面,本申请提供了一种计算机可读存储介质,包括计算机指令,当所述计算机指令在被处理器运行时,实现上述第一方面或者第一方面的任一可能的实现方式中的方法,或者实现上述第二方面或者第二方面的任一可能的实现方式中的方法,或者实现上述第三方面或者第三方面的任一可能的实现方式中的方法,或者实现上述第四方面或者第四方面的任一可能的实现方式中的方法,或者实现上述第五方面或者第五方面的任一可能的实现方式中的方法,或者实现上述第六方面或者第六方面的任一可能的实现方式中的方法,或者实现上述第七方面或者第七方面的任一可能的实现方式中的方法。
第二十六方面,本申请提供了一种计算机程序产品,当该计算机程序产品被处理器执行时,实现上述第一方面或者第一方面的任一可能的实施例中的所述方法,或者实现上述第二方面或者第二方面的任一可能的实现方式中的方法,或者实现上述第三方面或者第三方面的任一可能的实现方式中的方法,或者实现上述第四方面或者第四方面的任一可能的实现方式中的方法,或者实现上述第五方面或者第五方面的任一可能的实现方式中的方法,或者实现上述第六方面或者第六方面的任一可能的实现方式中的方法,或者实现上述第七方面或者第七方面的任一可能的实现方式中的方法。
示例性地,该计算机程序产品例如可以为一个软件安装包。
附图说明
图1A是本申请实施例提供的一种混音系统的示意图;
图1B是本申请实施例提供的又一种混音系统的示意图;
图1C是本申请实施例提供的又一种混音系统的示意图;
图1D是本申请实施例提供的又一种混音系统的示意图;
图2A是本申请实施例提供的一种混音权重的配置方法的流程图;
图2B是本申请实施例提供的一种用于混音权重设置的显示界面的示意图;
图2C是本申请实施例提供的一种应用场景的示意图;
图3A是本申请实施例提供的一种混音方法的流程图;
图3B是本申请实施例提供的一种音频流的混音权重的划分区间示意图;
图3C是本申请实施例提供的又一种音频流的混音权重的划分区间示意图;
图3D是本申请实施例提供的一种混音行为的示意图;
图3E是本申请实施例提供的一种混音行为的示意图;
图3F是本申请实施例提供的一种应用场景的示意图;
图3G是本申请实施例提供的一种应用场景的示意图;
图4是本申请实施例提供的一种混音权重配置方法的流程图;
图5A是本申请实施例提供的一种基于混音代理的混音方法的流程图;
图5B是本申请实施例提供的一种第一消息中音频流混音服务的标识的承载示意图;
图6A是本申请实施例提供的一种装置的结构示意图;
图6B是本申请实施例提供的一种装置的结构示意图;
图6C是本申请实施例提供的一种装置的结构示意图;
图7A是本申请实施例提供的一种装置的结构示意图;
图7B是本申请实施例提供的一种装置的结构示意图;
图7C是本申请实施例提供的一种装置的结构示意图;
图8是本申请本实施例提供的一种通信设备的结构示意图。
具体实施方式
需要说明的是,本申请中采用诸如“第一”、“第二”的前缀词,仅仅为了区分不同的描述对象,对被描述对象的位置、顺序、优先级、数量或内容等没有任何限定作用。例如,被描述对象为“字段”,则“第一字段”和“第二字段”中“字段”之前的序数词并不限制“字段”之间的位置或顺序,“第一”和“第二”并不限制其修饰的“字段”是否在同一个消息中,也不限制“第一字段”和“第二字段”的先后顺序。再如,被描述对象为“等级”,则“第一等级”和“第二等级”中“等级”之前的序数词并不限制“等级”之间的优先级。再如,被描述对象的数量并不受前缀词的限制,可以是一个或者多个,以“第一设备”为例,其中“设备”的数量可以是一个或者多个。此外,不同前缀词修饰的对象可以相同或不同,例如,被描述对象为“设备”,则“第一设备”和“第二设备”可以是同一个设备、相同类型的设备或者不同类型的设备;再如,被描述对象为“信息”,则“第一信息”和“第二信息”可以是相同内容的信息或者不同内容的信息。总之,本申请实施例中对用于区分描述对象的前缀词的使用不构成对所描述对象的限制,对所描述对象的陈述参见权利要求或实施例中上下文的描述,不应因为使用这种前缀词而构成多余的限制。
需要说明的是,本申请实施例中采用诸如“a1、a2、……和an中的至少一项(或至少一个)”等的描述方式,包括了a1、a2、……和an中任意一个单独存在的情况,也包括了a1、a2、……和an中任意多个的任意组合情况,每种情况可以单独存在。例如,“a、b和c中的至少一项”的描述方式,包括了单独a、单独b、单独c、a和b组合、a和c组合、b和c组合,或abc三者组合的情况。
下面将结合附图,对本申请中的技术方案进行描述。
本申请实施例提供的混音系统可以用于实现对来自多个音源设备的音频流的处理。
在介绍混音系统之前,先介绍实现对来自多个音源设备的音频流的处理所需的三大功能模块。这里,三大功能模块包括:配置模块、混音模块和音宿模块,其中,配置模块用于设置音频流的混音权重,混音模块用于混音处理,即能将来自多个音源设备的多个音频流进行混音处理获得单音频流,音宿模块用于使用(例如,播放)单音频流。
基于三大功能模块部署的位置的不同,其应用的混音系统也不同。在本申请实施例中,混音系统例如为下述多种形式中的任意一种:
第一种:
配置模块、混音模块和音宿模块部署在同一设备上。
参见图1A,图1A是本申请实施例提供的一种混音系统的示意图。在图1A中,该混音系统包括设备一和多个音源设备,且设备一上集成了配置模块、混音模块和音宿模块这三大功能模块。其中,设备一与多个音源设备中的每个音源设备可以通过有线或无线的方式进行通信。音源设备是产生或发送音频流的设备。
在图1A中,由于设备一上部署了上述三大功能模块,故设备一同时具备混音权重配置能力、混音处理能力和音宿能力,其中,音宿能力是指设备可以接收或使用音频流,使用音频流例如可以是播放音频流。在此情况下,设备一例如可以是便携移动设备(例如,手机、平板等)、智能穿戴设备(例如,运动手环、手表等)、虚拟现实设备、增强现实设备、车机等支持用户配置的终端设备。
示例性地,设备一以用户手机为例,多个音源设备以用户手机和车机为例,用户手机可以从自身和车机获取多个音频流,并确定这多个音频流的混音权重,基于这多个音频流的混音权重对这多个音频流进行相应处理获得目标音频流,并播放目标音频流。其中,目标音频流是基于这多个音频流和混音行为获得,有关音频流的混音权重的确定以及混音行为具体可参考下述方法实施例中的相关叙述,在此不再赘述。
第二种:
配置模块部署在一个设备上,混音模块和音宿模块部署在同一设备上。
参见图1B,图1B是本申请实施例提供的另一种混音系统的示意图。在图1B中,该混音系统包括设备二、设备三和多个音源设备,且设备二上集成了混音模块和音宿模块两个功能模块,设备三上集成了配置模块这一功能模块。其中,设备二与多个音源设备中的每个音源设备可以通过有线或无线的方式进行通信,设备二与设备三通过无线或有线的方式进行通信。
在图1B中,设备二上集成了混音模块和音宿模块,故设备二具备混音处理能力和音宿能力。在此情况下,设备二例如可以是耳机、音响、车机等使用音频流的设备,也可以是其他不支持用户配置混音配置信息的便携移动设备(例如,手机、平板等)、智能穿戴设备(例如,带播放器的眼镜、运动手环、手表等)、虚拟现实设备、增强现实设备、或者上述终端(例如使用音频流的设备、便携移动设备、智能穿戴设备等)内的部件、芯片等。
在图1B中,设备三上集成了配置模块,故设备三具备混音权重配置能力。在此情况下,设备三例如可以是手机、平板、车机、掌上电脑、台式机等支持用户配置的终端设备。
示例性地,设备二以耳机为例,设备三以手机为例,多个音源设备以平板和公共广播器为例,手机基于用户的设置信息为具备相应属性的音频流配置混音权重,并生成混音配置信息,将混音配置信息发送给耳机。当耳机从平板和公共广播器接收多个音频流后,可以基于获取的混音配置信息对这多个音频流进行相应处理获得目标音频流以及播放目标音频流。
第三种:
配置模块、混音模块和音宿模块三者分别部署在不同的设备上。
参见图1C,图1C是本申请实施例提供的另一种混音系统的示意图。在图1C中,该混音系统包括设备四、设备五、设备六和多个音源设备,且设备四上集成有混音模块这一功能模块,设备五上集成有音宿模块这一功能模块以及设备六上集成有配置模块这一功能模块。其中,设备四可以分别与设备五、多个音源设备中的每个音源设备通过有线或无线的方式进行通信,设备五与设备六可以通过有线或无线的方式进行通信。
在图1C中,设备四具有混音处理功能,设备五具有音宿能力,设备六具有混音权重配置能力。示例性地,设备四例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等。设备五例如是不具有混音处理能力但可播放音频流的设备,例如耳机、音响、带播放器的眼镜或其他播放器等。设备六可参考图1B中设备三的相关叙述,在此不再赘述。
在图1C中,设备四可以作为设备五的混音代理。当设备四开始为设备五提供混音代理时,设备四可以代替设备五从多个音源设备接收多个音频流,并基于从设备五获取的混音配置信息对这多个音频流进行相应处理获得目标音频流,并将目标音频流发送给设备五,使得设备五播放该目标音频流。可以理解,目标音频流为单音频流。
第四种:
混音模块和配置模块部署在同一设备上,音宿模块部署在另一设备上。
参见图1D,图1D是本申请实施例提供的另一种混音系统的示意图。在图1D中,该混音系统包括设备七、设备八和多个音源设备,且设备七上集成有混音模块和配置模块以及设备八上集成有音宿模块。设备七与多个音源设备中的每个音源设备通过有线或无线的方式进行通信,设备七与设备八通过有线或无线的方式进行通信。这里,设备七具有混音权重配置能力和混音处理能力,设备八具有音宿能力。
需要说明的是,图1A、图1B、图1C和图1D仅为示例性架构图,但不限定图1A、图1B、图1C和图1D中所示的任一混音系统包括的网元的数量,也可以是其他形式。另外,本申请实施例提供的方法可以应用于图1A、图1B、图1C和图1D中任一附图所示的混音系统,当然本申请实施例提供的方法也可以适用其他混音系统,本申请实施例对此不予限制。
为了支持对来自多个音源设备的多个音频流的混音处理,上述混音模块所在的设备(即具有混音处理能力的设备)需要先确定音频流的混音权重,其中,音频流的混音权重用于指示音频流被混音时该音频流的响度的输出占比。在一些可能的实施例中,音频流的响度也可以理解为音频流的音量,即人耳对听到的声音大小强弱的主观感受。
示例性地,混音权重可以用(0,1]的浮点数或百分数进行表示。可以理解,混音权重越大,意味着该混音权重对应的音频流在混音处理过程中的响度的输出占比越高。
一种实现方式中,确定音频流的混音权重可以是:接收音源设备发送的指示信息,其中,指示信息指示该音频流的混音权重;从该指示信息中获取音频流的混音权重。
一种实现方式中,确定音频流的混音权重可以是:从混音配置信息中获取音频流的混音权重,其中,混音配置信息包括来自多个音源设备的多个音频流的混音权重。
这里,音频流的混音权重用于调整该音频流的采样点的采样深度。采样深度表示采样点对应的离散信号进行量化的精度。
其中,这多个音频流的类型不同,和/或这多个音频流的编码格式不同,和/或这多个音频流的使用场景不同,和/或生成这多个音频流的应用的类型不同,和/或这多个音源设备的类型不同,和/或这多个音源设备所属的用户的类型不同。
示例性地,音频流的类型可以通过标识或者二进制取值等方式来指示。音频流的类型例如为音乐、游戏、语音通话、导航、通知提醒、告警、闹钟或广播。
其中,音源设备的类型例如为私人设备或公共设备。
音源设备所属用户的类型例如可以基于用户的年龄划分为未成年人和成年人,或者可以划分为儿童、青年人和老年人,也可以基于用户的职业等进行划分。
生成音频流的应用的类型例如可以分为生活实用、社交、办公、娱乐、新闻、学习等,也可以一个应用即为一类,在此不作具体限定。
使用场景例如可以是游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。例如,游戏模式下游戏类的音频流的优先级最高,驾驶模式下导航类的音频流的优先级最高,学习模式下学习类的音频流的优先级最高等。
在本申请实施例中,混音配置信息可以是上述音宿模块所在的设备(即具有音宿能力的设备)出厂时默认设置的,也可以是上述配置模块所在的设备(即具有混音权重配置能力的设备)基于接收的用户的设置信息生成的。在一些可能的实施例中,当配置模块和音宿模块不部署在同一设备时,混音配置信息还可以是配置模块所在的设备基于音宿模块所在的设备发送的响应消息生成,具体可参考下述图4实施例的叙述。
这里,混音配置信息与上述音宿模块所在的设备对应。换句话说,基于设备自身的音宿能力的不同,设备支持播放的音频流的类型可能不同,故对应的混音配置信息也不同。可以理解,每个具有音宿能力的设备有自身对应的混音配置信息,混音配置信息中包括的多种类型为该具有音宿能力的设备支持的音频流的类型。
在本申请实施例中,混音配置信息可以通过表格、图或者数据结构的方式进行表示。当混音配置信息以表格进行表示时,混音配置信息也可以称作混音配置表或者混音策略表。
示例性地,混音配置信息可以表示为下述表1所示的对应关系表。具体地,表1示出了音频流的类型与混音权重之间的对应关系,以“类型A-X1”这条对应关系为例,可知当音频流的类型为类型A时,音频流的混音权重为X1。在表1中,不同类型的音频流的混音权重可以相同,也可以不同。
表1
音频流的类型 | 混音权重 |
类型A | X1 |
类型B | X2 |
类型C | X3 |
… | … |
需要说明的是,上述表1仅作为一个示例,以体现音频流的类型和混音权重之间的对应关系。在实际应用中,表1中该对应关系的文字内容和存储方式还可以是其他形式,在此不作具体限定。
在一些可能的实施例中,混音配置信息中混音权重的设置除了与如表1所示的音频流的类型有关外,混音权重的设置还可以与下述因素中的至少一项有关:产生音频流的音源设备的类型、音源设备所属用户的类型、生成音频流的应用的类型、音频流的编码格式和使用场景。
示例性地,混音配置信息也可以表示为下述表2所示的对应关系表。具体地,表2示出了音频流的类型、音源设备的类型和混音权重三者之间的对应关系,以“类型A-类型一-X1”这条对应关系为例进行说明,其表示对于来自类型一的音源设备的音频流,若音频流的音频流类型为类型A,则对应的混音权重为X1。可以看出,不同类型的音源设备产生同一类型的音频流时,对应的音频流的混音权重可以不同。
表2
音频流的类型 | 音源设备的类型 | 混音权重 |
类型A | 类型一 | X1 |
类型A | 类型二 | X2 |
类型B | 类型一 | X3 |
… | … |
需要说明的是,表2仅作为一个示例,以体现音频流的类型、音源设备的类型和混音权重三者之间的对应关系。在实际应用中,表2中该对应关系的文字内容和存储方式还可以是其他形式,在此不作具体限定。
参见图2A,图2A是本申请实施例提供的一种混音权重的配置方法的流程图。该方法是通过人机交互的形式实现对音频流的混音权重的配置。该方法应用于具有混音权重配置能力的设备,例如可以是上述图1A中的设备一、或者图1B中的设备三、图1C中的设备六或者图1D中的设备七。该方法包括但不限于以下步骤:
S201:向用户指示多个音频流的属性。
这里,用户可以是与具有音宿能力的设备和/或具有混音权重配置能力的设备关联的用户,例如使用具有混音权重配置能力的设备的用户,可以是具有混音权重配置能力的设备所属的用户,可以是使用具有音宿能力的设备的用户,也可以是具有音宿能力的设备所属的用户等,在此不作具体限定。
其中,多个音频流由多个设备生成。音频流的属性包括下述信息中的至少一项:音频流的标识、音频流的类型、生成音频流的应用的类型、生成音频流的音源设备的类型、生成音频流的音源设备所属的用户的类型和音频流的编码格式。
这里,音频流的标识用于标识该音频流,音频流的标识可以是一个或多个字符的组合,其中,字符可以是数字,字母以及其他符号中的一种或多种,例如一个或多个数字的组合,或者一个或多个数据和字母的组合。音频流的属性中的其他信息可参考上述实施例中相应内容的叙述,在此不再赘述。
S202:接收用户的设置信息。
在本申请实施例中,接收用户的设置信息,包括:
获取用户通过具有混音权重配置能力的设备的触摸屏输入的设置信息;
获取用户通过具有混音权重配置能力的设备的按钮输入的设置信息;
获取用户通过具有混音权重配置能力的设备的键盘输入的设置信息;
获取用户通过语音输入的设置信息;或
获取用户通过手势输入的设置信息。
示例性地,具有混音权重配置能力的设备设置有显示界面,用户可以在该显示界面上通过触摸屏输入这多个音频流的混音权重以生成相应的设置信息。
示例性地,用户可以通过具有混音权重配置能力的设备上的硬件按钮(例如,音量键、电源键等)或者键盘输入相应的音频流的混音权重。
示例性地,用户还可以是语音输入“将类型A的音频流的混音权重设置为X1”或者“将来自类型一的音源设备,类型A的音频流的混音权重设置为X1”或其他语音指令实现输入具备该属性的音频流的混音权重。
示例性地,用户可以通过手势输入这音频流的混音权重,也可以通过手势调整这多个音频流中至少一个音频流的混音权重,例如向上的手势表示将音频流当前的混音权重调大,向下的手势表示将音频流当前的混音权重调小。
在本申请实施例中,通过上述接收的用户的设置信息,可以用于执行混音前对音频流的混音权重的初始化设置(或称为预配置),也可以用于在执行混音的过程中对音频流的混音权重的调整。
下面基于图2B说明以用户通过屏幕输入相应的设置信息。
参见图2B,图2B是本申请实施例提供的一种用于混音权重设置的显示界面的示意图。图2B所示的显示界面为人机交互界面。在图2B中,可以看出,向用户提供的音频流的属性有音频流的类型,该显示界面还显示了多种音频流的类型对应的滑动条和混音权重的设置框,其中,用户可以通过滑动条上的滑动键调整相应类型的音频流的混音权重,并在对应的混音权重的设置框中进行显示。在图2B中,以设置类型C的音频流的混音权重为例,用户将显示界面上类型C对应的滑动条上滑动键从滑动条的最左侧拖动至当前的位置1处这一操作,基于该操作,该显示界面所在的设备接收的用户的设置信息具体为“将类型C的音频流的混音权重设置为20%”,并在类型C对应的混音权重的设置框中显示“20”,依据此方式用户可以通过屏幕输入操作为图2B所示的各类型的音频流的设置混音权重,当用户完成屏幕输入操作后,用户可以点击图2B中的“保存”键。在一些可能的实施例中,用户的屏幕输入操作也可以不是拖动图2B所示的滑动条上的滑动键,例如可以是在音频流的类型对应的混音权重的设置框中直接输入要设置的混音权重。
在图2B中,可以看到音频流的类型的左侧还设置有可用于勾选的方框,此设计是考虑到在为具有音宿能力的设备生成上述混音配置信息时,不同音宿能力的设备支持的音频流的类型不同,在此情况下,用户可以基于具有音宿能力的设备支持的音频流的类型在图2B中对要设置混音权重的音频流的类型进行勾选,例如画“√”,被选中的类型即为具有音宿能力的设备支持的音频流的类型。在一些可能的实施例中,图2B中被勾选的类型也可以是具有混音权重配置能力的设备基于具有音宿能力的设备支持的音频流的类型默认勾选,无需用户勾选。
可以理解,图2B只是一种用于混音权重设置的显示界面的示例,本申请实施例并不限定该显示界面仅为图2B所示形式,还可以是可供用户进行混音权重设置的其他显示界面。例如,该显示界面向用户提供的音频流的属性除了包括图2B所示的音频流的类型外,还可以包括下述信息中的至少一项:音频流的标识、生成音频流的应用的类型、生成音频流的音源设备的类型、生成音频流的音源设备所属的用户的类型和音频流的编码格式,也就是说,混音权重的设置除了与音频流的类型有关外,在一些可能的实施例中,也可以与产生音频流的音源设备的类型、音源设备所属的用户的类型、生成音频流的应用的类型等中的至少一项有关,在此不作具体限定。又例如,在一些可能的实施例中,图2B所示的显示界面还可以向用户提供上述音频流的使用场景。
S203:根据用户的设置信息配置上述多个音频流的混音权重。
例如,在图2B所示界面,当用户点击“保存”键时,则执行S203,即完成将图2B中类型A的音频流的混音权重设置为60%、类型B的音频流的混音权重设置为20%以及类型C的音频流的混音权重设置为20%。
一种实现方式中,根据用户的设置信息配置这多个音频流的混音权重,以生成上述混音配置信息。
示例性地,当具有混音权重配置能力的设备不具有混音处理能力时,还需将生成的混音配置信息发送给其他设备。例如当具有混音权重配置能力的设备为上述图1B中的设备三时,还可以向设备二发送该混音配置信息;当具有混音权重配置能力的设备为图1C中的设备六时,还可以向设备五发送该混音配置信息。
在一些可能的实施例中,还可以向用户指示多个音频流的使用场景,用户的设置信息用于配置这多个音频流在该使用场景下的混音权重。
示例性地,使用场景包括第一使用场景和第二使用场景,这多个音频流在第一使用场景下的混音权重不同于这多个音频流在第二使用场景下的混音权重。这里,使用场景包括下述场景中的至少一种:游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。
例如,在游戏模式场景下游戏类型的音频流的混音权重高于其他使用场景中游戏类型的音频流的混音权重。又例如,驾驶模式场景下导航类型的音频流的混音权重高于其他使用场景中导航类型的音频流的混音权重。又例如,学习模式场景中学习类应用生成的音频流的混音权重高于其他使用场景中由学习类应用生成的音频流的混音权重。
在一些可能的实施例中,具有混音权重配置能力的设备除了可以支持用户设置混音权重外,还支持提醒用户关注重要音频流的功能。
一种实现方式中,基于这多个音频流的混音权重,将这多个音频流混合成被播放的音频流。这里,混合可以理解为混音,混合的过程可以参考下述图3A实施例的叙述。
进一步地,这多个音频流中包括高优先级的第一音频流,可以通过下述多种方式中的至少一种方式提醒用户关注第一音频流:
增大第一音频流的混音权重;
多次播放第一音频流的内容;和
要求用户反馈确认。
这里,高优先级的第一音频流可以理解为:第一音频流携带有高优先级的标签,或者,第一音频流的优先级高于预设的优先级阈值,或者,第一音频流的优先级取值为高优先级对应的阈值等,在此不作具体限定。另外,优先级例如可以表示重要度、紧急程度、紧迫程度、与用户的关联程度等。
示例性地,增大第一音频流的混音权重包括:在第一音频流的播放时间段内,降低所述多个音频流中与第一音频流相混合的其它音频流的播放音量;或者,在第一音频流的播放时间段内,设置第一音频流为被播放的音频流中的唯一音频流。通过弱化与第一音频流相混合的其他音频流,或者,设置第一音频流为被播放的唯一音频流,可以使得第一音频流更加突出,用户也较容易关注第一音频流。
示例性地,多次播放第一音频流的内容包括:在被播放的音频流中重复多次混入第一音频流,且逐次增大第一音频流的混音权重。通过在被播放的音频流中重复多次混入第一音频流使得第一音频流被反复播放,且第一音频流每次以相较于前一次更大的混音权重被混入,使得第一音频流被逐次播放时第一音频流在被播放的音频流中响度的输出占比也越来越高,用户可以及时关注第一音频流。
示例性地,要求用户反馈确认,包括:向用户询问是否知晓第一音频流承载的内容;接收用户的反馈信息,该反馈信息用于指示用户确认知晓第一音频流承载的内容。可以看出,在有高优先级的第一音频流的情况下,还可以主动寻求用户对第一音频流的确认反馈,以确保用户关注了第一音频流。
例如,向用户询问是否知晓第一音频流承载的内容:可以是在显示界面上显示待用户确认的“是否知晓第一音频流承载的内容”的弹框提示信息,同时还可以控制显示界面所在设备振动、播放提示音等。
进一步地,在接收用户的反馈信息之前,可以在被播放的音频流中重复混入第一音频流;在接收用户的反馈信息之后,才停止在被播放的音频流中混入第一音频流。可以看出,在未接收到用户的反馈信息时,通过在被播放的音频流中重复混入第一音频流以实现循环播放第一音频流的循环播放,能有效提醒用户关注第一音频流。
示例性地,在接收用户的反馈信息后停止在被播放的音频流中混入第一音频流,可以是在接收到用户的反馈信息后,不论是否再次接收到第一音频流,都停止在被播放的音频流中混入第一音频流。
一种实现方式中,当被播放的音频流的音量超过预设音量阈值时,向用户提示音量过大。如此,用户可以通过手动操作减小当前被播放的音频流的播放音量,防止听力受损。
参见图2C,图2C是本申请实施例提供的一种应用场景的示意图。在图2C中,公共广播可以产生以及发送音频流,用户手持的手机为上述具有混音权重配置能力的设备,耳机与手机连接且仅用于播放音频流。
示例性地,在图2C中,假设用户在机场候机室候机,待乘坐的航班为ZF1111,用户当前手持手机边听音乐(对应图2C中的音频流2)边看电子书,这时公共广播生成音频流1,且音频流1承载的内容为“请乘坐ZF1111航班的乘客准备办理登机”,可以看出,音频流1即为上述具有高优先级的第一音频流,在此情况下,为了提醒用户关注音频流1,例如手机在对音频流1和当前播放的音频流2进行混音时降低音频流2的播放音量,或者,直接停止播放音频流2仅播放音频流1;又例如手机可以在当前播放的音频流2中多次重复混入音频流1实现音频流1的多次播放,且随着音频流1的混音次数的增加音频流1的混音权重也可以相应递增,则用户可以感受到音频流1被重复播放时音量逐渐增大;又例如,还可以在手机的显示界面上弹出提示框“请确认是否知晓音频流1承载的内容”,在未接收到用户的确认反馈时,可以在当前播放的音频流2中多次混入音频流1实现对音频流1的重复播放,直至接收到用户的确认反馈后才停止在音频流2中重复混入音频流1。在一些可能的实施例中,图2C所示场景也适用于公交车、地铁、高铁等场景中,在此情况下,音频流1可以是用于站点播报的音频流。
示例性地,在图2C中,假设公共广播还生成了音频流3,其中,音频流3承载的内容为“请乘坐ZF1000航班的乘客准备办理登机”,音频流3和音频流2为同一类型的音频流,可以看出音频流3承载的内容用户可以不关注,在此情况下,手机可以拒绝在当前播放的音频流2中混入音频流3,或者,手机可以在当前播放的音频流2中混入音频流3但音频流3的音量较低。
一种实现方式中,还可以获取这多个音频流的混音权重的默认设置,在此情况下,根据用户的设置信息配置这多个音频流的混音权重,包括:根据用户的设置信息和默认设置配置这多个音频流的混音权重。
也就是说,音频流的混音权重的配置可以由混音权重的默认设置以及用户的偏好共同决定。例如,音频流的混音权重的默认设置要求类型1的音频流的混音权重应大于或等于第一预设值,而用户输入的设置信息指示了类型1的音频流的混音权重为目标值,且目标值小于第一预设值,假设用户的设置信息的优先级高于混音权重的默认设置的优先级的情况下,则可以确定类型1的音频流的混音权重应为目标值。
可以看到,实施本申请实施例,支持用户根据音频流的属性(例如,音频流的类型、产生音频流的音源设备的类型、生成音频流的应用的类型等中的至少一项)对音频流的混音权重进行动态配置,不仅有利于提升用户的听感体验,还满足了多应用场景下的用户需求。
参见图3A,图3A是本申请实施例提供的一种混音方法的流程图。该方法可以应用于设备1和至少一个音源设备组成的混音系统,其中,设备1具有混音处理能力,设备1属于音宿侧,至少一个音源设备属于音源侧。示例性地,设备1可以是图1A中的设备一、图1B中的设备二、图1C中的设备四或者图1D中的设备七,设备1也可以是上述设备一、设备二、设备四和设备七中任一设备内的混音模块、部件或芯片。该方法包括但不限于以下步骤:
S301:设备1从至少一个音源设备接收至少一条指示信息,该至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应。
在本申请实施例中,该至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应是指:该至少一条指示信息用于指示下述信息中的至少一项:上述至少一个音频流的类型、上述至少一个音频流的编码格式、上述至少一个音源设备的类型、上述至少一个音源设备所属的用户的类型、生成至少一个音频流的应用的类型和上述至少一个音频流的混音权重。
一种实现方式中,上述至少一条指示信息包括第一指示信息和第二指示信息,上述至少一个音频流包括音频流一和音频流二,其中,第一指示信息与音频流一对应,第二指示信息与音频流二对应。在此情况下,音频流一和音频流二可以满足下述关系中的至少一项:音频流的类型相同;来自同一音源设备;和由同一个应用生成。可以看出,音频流和指示信息可以是一一对应的关系,例如可以针对单独一条音频流指示混音权重。
另一种实现方式中,上述至少一条指示信息包括第一指示信息,上述至少一个音频流包括音频流一和音频流二,其中,第一指示信息与音频流一和音频流二对应,在此情况下,音频流一和音频流二可以满足下述关系中的至少一项:音频流的类型相同;来自同一音源设备;和由同一个应用生成。可以看出,指示信息与音频流可以是一对多的关系。例如,同一音源设备在需要连续发送相同类型的多个音频流时,该音源设备可以预先仅发送一条指示了音频流的类型的指示信息,而无需发送多条指示信息与待发送的多个音频流对应,如此,有利于减少带宽的消耗,有利于提高音频流的传输效率。
以设备1从音源设备1获取指示信息为例进行说明:设备1可以从音源设备1接收至少一条指示信息1,其中,至少一条指示信息1与音源设备1产生的至少一个音频流1对应。这里,至少一条指示信息1与音源设备1产生的至少一个音频流1对应是指:至少一条指示信息1用于指示下述信息中的至少一项:上述至少一个音频流1的类型、上述至少一个音频流1的编码格式、音源设备1的类型、音源设备1所属用户的类型、生成上述至少一个音频流1的应用的类型和上述至少一个音频流1的混音权重。可以理解,指示信息1与音频流1之间的对应关系可以是一对一,也可以是一对多。
例如,若一条指示信息1对应一个音频流1,存在两个音频流1可以为同一类型的音频流和/或由同一个应用生成的音频流。
例如,若一条指示信息1对应多个音频流1,当两个音频流1与一条指示信息1对应时,这两个音频流1可以为同一类型的音频流和/或由同一应用生成的音频流。
S302:设备1根据上述至少一条指示信息确定上述至少一个音频流的混音权重。
一种实现方式中,当上述至少一条指示信息中携带上述至少一个音频流的混音权重时,根据上述至少一条指示信息确定上述至少一个音频流的混音权重,包括:从上述至少一条指示信息中获取上述至少一个音频流的混音权重。
另一种实现方式中,上述至少一条指示信息中未携带上述至少一个音频流的混音权重时,根据上述至少一条指示信息确定上述至少一个音频流的混音权重,包括:根据上述至少一条指示信息和混音配置信息,确定上述至少一个音频流的混音权重。也就是说,音频流的混音权重可以从混音配置信息中获取。混音配置信息的具体内容具体可参考上述实施例中混音配置信息的叙述,在此不再赘述。
这里,混音配置信息可以是设备1本地生成的,也可以是从其他设备获取的。
例如,当设备1为图1A中的设备一或者图1D中的设备七时,混音配置信息可以是本地生成的,例如以上述图2A所示方法生成。
例如,当设备1为图1B中的设备二时,混音配置信息可从图1B中的设备三获取。当设备1为图1C中的设备四时,混音配置信息可从图1C中的设备五获取。
示例性地,假设设备1从音源设备1接收到指示信息1,指示信息1与音源设备1产生的音频流1对应,下面以一些例子说明根据指示信息1和混音配置信息确定音频流1的混音权重的过程:
例子1:若混音配置信息为音频流的类型和音频流的混音权重之间的对应关系的集合,且指示信息1指示了音频流1的类型为类型A,则将混音配置信息中类型A的音频流的混音权重确定为音频流1的混音权重。
例子2:若混音配置信息为音频流的类型、产生音频流的音源设备的类型和音频流的混音权重之间的对应关系的集合,且指示信息1指示了音频流1的类型为类型A以及产生音频流1的音源设备的类型为类型一,则可以将混音配置信息中由类型A和类型一组合对应的音频流的混音权重确定为音频流1的混音权重。
S303:设备1获取多个音频流,并根据这多个音频流和这多个音频流的混音权重确定待播放的目标音频流。
这里,所述多个音频流来自多个音源设备,其中,这多个音源设备包括上述至少一个音源设备,这多个音频流包括上述至少一个音频流。
示例性地,设备1获取的多个音频流可以全部来自上述至少一个音源设备,设备1获取多个音频流是指:设备1从上述至少一个音源设备接收多个音频流。
示例性地,设备1获取的多个音频流中,有一部分来自上述至少一个音源设备,另一部分还可以来自设备1,即设备1可以生成音频流,在此情况下,设备1既具有混音处理能力,设备1又相当于一个音源设备。
在本申请实施例中,这多个音频流包括第一音频流和第二音频流,根据多个音频流和多个音频流的混音权重确定目标音频流包括:根据第一音频流的混音权重、第二音频流的混音权重、第一音频流和第二音频流,确定待播放的目标音频流。
这里,第一音频流和第二音频流来自不同的音源设备包括下述多种情况:
情况1:第一音频流为设备1本地生成,第二音频流来自音源设备1。
情况2:第一音频流来自音源设备1,第二音频流来自音源设备2。
情况3:第一音频流来自音源设备1,第二音频流为设备1本地生成。
进一步地,根据第一音频流的混音权重、第二音频流的混音权重、第一音频流和第二音频流,确定待播放的目标音频流,包括:根据第一音频流的混音权重和第二音频流的混音权重,确定混音行为;根据第一音频流、第二音频流和混音行为,确定目标音频流。
这里,目标音频流为单音频流(或称为单路的音频流)。
这里,本申请实施例提供的混音行为主要有三种:拒绝加入混音、抢占和允许加入混音。示例性地,混音行为可以与混音权重的与一个具体数值或者一段区间对应,例如参见下述图3B或者图3C的相关叙述。
参见图3B,图3B是本申请实施例提供的一种音频流的混音权重的划分区间示意图。在图3B中,定义了三个区间,分别为拒绝区、混音区和独占区,其中,当音频流的混音权重小于或等于第一值时,该混音权重用于指示拒绝将与该混音权重对应的音频流作为混音的来源,也表示该音频流处于拒绝区,即该音频流被拒绝加入混音;当音频流的混音权重∈(第一值,第二值)时,该混音权重用于指示允许将与该混音权重对应的音频流作为混音的非唯一来源,也表示该音频流处于混音区,该音频流可以被允许加入混音;当音频流的混音权重大于或等于第二值时,用于指示允许将与该混音权重对应的音频流作为混音的唯一来源,也表示该音频流处于独占区,该音频流可以抢占,但是否抢占成功取决于该音频流的混音权重是否为独占区内当前音频流的混音权重中的最大值。这里,第一值和第二值可以是基于经验预先设置的,第二值大于第一值。
参见图3C,图3C是本申请实施例提供的又一种音频流的混音权重的划分区间示意图。在图3C中,定义了一个区间,即混音区。其中,当音频流的混音权重为第三值时,用于指示拒绝将与该混音权重对应的音频流作为混音的来源,表示该音频流被拒绝加入混音;当音频流的混音权重∈(第三值,第四值)时,用于指示允许将与该混音权重对应的音频流作为混音的非唯一来源,也表示该音频流处于混音区,该音频流可以被允许加入混音;当音频流的混音权重为第四值时,用于指示允许将与该混音权重对应的音频流作为混音的唯一来源,也表示该音频流可以抢占。这里,第三值和第四值可以是基于经验预先设置的,第三值为混音权重的最小值,第四值为混音权重的最大值。
下面以图3B所示混音权重的划分为例具体说明混音行为以及目标音频流的确定。
一种实现方式中,在满足第一预设条件时,确定目标音频流为第一音频流,其中,第一预设条件为下述任一条件;第二音频流的混音权重小于或等于第一值且第一音频流的混音权重大于第一值;或,第一音频流的混音权重大于或等于第二值且第一音频流的混音权重大于或等于第二音频流的混音权重。在此情况下,说明第二音频流被拒绝加入混音。
示例性地,假设第一音频流为还在播放的音频流,第二音频流为设备1新接收的音频流,若第一音频流已处于独占区(即第一音频流的混音权重大于或等于第二值),且第二音频流也处于独占区(例如第二音频流的混音权重为第二值),由于第二音频流的混音权重小于或等于第一音频流的混音权重,故第二音频流抢占失败。也就是说,处于图3B所示的独占区内的音频流尽管具有抢占能力,但并不一定抢占成功。
一种实现方式中,在满足第二预设条件时,确定目标音频流为第二音频流,其中,第二预设条件为下述任一条件:第一音频流的混音权重小于或等于第一值且第二音频流的混音权重大于第一值;或,第二音频流的混音权重大于或等于第二值且第二音频流的混音权重大于第一音频流的混音权重。在此情况下,说明第一音频流被拒绝加入混音。
示例性地,假设第一音频流为还在播放的音频流,第二音频流为设备1新接收的音频流,若第一音频流已处于独占区(例如第一音频流的混音权重为第二值),且第二音频流也处于独占区(例如第二音频流的混音权重大于第二值),由于第二音频流的混音权重大于第一音频流的混音权重,则第二音频流抢占成功,故拒绝第一音频流加入混音,第二音频流为被播放的唯一音频流。
一种实现方式中,当第二音频流的混音权重大于第一值且小于第二值以及第一音频流的混音权重大于第一值且小于第二值时,对第一音频流和第二音频流进行混音生成第三音频流;确定目标音频流为第三音频流。在此情况下,说明第一音频流和第二音频流均处于混音区,允许加入混音。
示例性地,当第一音频流为设备1基于N个音频流进行混音生成的单音频流时,第一音频流的混音权重为这N个音频流的混音权重中的最大值。
示例性地,混音处理过程可以是:先确定参于混音的音频流的数量以及参于混音的音频流的衰减因子,各音频流按照对应的衰减因子进行响度的衰减,再将衰减后的各音频流进行叠加处理,以生成目标音频流。其中,各音频流的衰减以及叠加等处理均是以统一的采样率进行。另外,各音频流混音时还采用统一的混音周期,其中,混音周期可以是以采样率为单位的时长,也可以是一个预设时长,在此不作具体限定。音频流的衰减因子的计算与参于混音的音频流的混音权重有关。
这里,由于是对第一音频流和第二音频流进行混音,当第一音频流不是经混音处理获得的音频流时,则参于混音的音频流的数量为2;当第一音频流为设备1基于N个音频流进行混音生成的单音频流时,则参于混音的音频流的数量为N+1。
示例性地,当参于混音的音频流的数量为N+1时,根据第一音频流和第二音频流进行混音是指:根据上述N个音频流和第二音频流进行混音。
音频流的衰减因子的计算与参于混音的音频流的混音权重有关。衰减因子的计算例如可以是根据参于混音的音频流的混音权重进行归一化处理。
例如,当第一音频流不是经混音处理获得的音频流时,假设第一音频流的类型为类型A且第一音频流的混音权重为0.8,第二音频流的类型为类型B且第二音频流的混音权重为0.2,则第一音频流的衰减因子为:第二音频流的衰减因子为
在一些可能的实施例中,参于混音的音频流中可能存在同一类型和/或来自同一音源设备和/或由同一应用生成的多个音频流,在此情况下,音频流的衰减因子的计算可以按照上述归一化的方式进行处理,也可以按照均衡的方式进行处理。
例如,假设第一音频流是经过2个音频流进行混音处理获得,即参于混音处理的音频流的数量为3,包括第二音频流和第一音频流对应假设这2个音频流:音频流1’和音频流2’,其中,音频流1’的类型为A且音频流1’的混音权重为0.8,音频流2’的类型为B且音频流2’的混音权重为0.2,第二音频流的类型为A且第二音频流的混音权重为0.8,可以看出,音频流1’和第二音频流为同一类型的音频流,按照均衡的方式处理获得衰减因子可以是:先根据参于混音的音频流的类型进行归一化:确定类型A对应的衰减因子为以及类型B对应的衰减因子为/>进一步地,由于音频流1’的类型和第二音频流的类型均为类型A,同类型的音频流均衡分配该类型对应的衰减因子,故音频流1’的衰减因子与第二音频流的衰减因子相等且为0.4,音频流2’的衰减因子为0.2。
在一些可能的实施例中,对衰减后的各音频流进行叠加时,若检测到叠加后的音频流上的某采样点处的采样深度超过预设采样深度范围,则将该采样点处的采样深度取值为预设采样深度范围的最大值,如此生成第三音频流。其中,采用点处的采样深度为采样点处的离散信号量化后的精度。当设备1为图1B中的设备二时,设备1还可以向图1B中的设备三发送溢出指示信息,以反馈混音处理时发生溢出。
例如,参见图3D所示的混音行为的示意图。基于图3B所示的混音权重的划分示意图,可知在图3D中,第一值取值为0,第二值取值为100,第二值为混音区和独占区的分界点。另外,在图3D中,x表示待加入音频流的混音权重,y表示当前音频流中音频流的最大混音权重,在此情况下,混音行为具体如下:
1、先判断x是否等于0,在x等于0时,拒绝该音频流加入;当x不等于0时,还需进一步比较x与y的大小。
2、x与y的大小比较分为以下三种情况:
1)当x,y均处于区间(0,100)的范围内时,则允许待加入的音频流加入混音获得新的音频流;
2)当x>=100且x>y时,则待加入音频流抢占;
3)当y>=100且x<=y时,则拒绝该音频流加入。
在一些可能的实施例中,当音频流离开(例如播放结束)时,可以基于当前留下的各音频流的混音权重重新混音。
下面基于图3C所示的混音权重的划分简要说明混音行为和目标音频流的确定:
在图3C中,假设第一音频流为当前还在播放的音频流,第二音频流为设备1新接收的音频流,例如第一音频流可以是被设备1(在设备1具有音宿能力的情况下)播放,也可以是由其他设备播放。
一种实现方式中,当第二音频流的混音权重为第三值或者第一音频流的权重为第四值,确定混音行为为拒绝第二音频流加入;在此情况下,目标音频流为第一音频流。
可以理解,当正在播放的第一音频流的混音权重为第四值(即混音权重的最大值)时,在第一音频流播放结束之前,若接收到的其他音频流的混音权重小于第四值,则不被允许混入第一音频流。
一种实现方式中,当第二音频流的混音权重为第四值时,确定混音行为为第二音频流抢占;在此情况下,目标音频流为第二音频流。
一种实现方式中,第一音频流的混音权重大于第三值且小于第四值以及第二音频流的混音权重大于第三值且小于第四值,确定混音行为为允许第二音频流加入混音;在此情况下,根据第一音频流、第二音频流和混音行为确定目标音频流包括:对第一音频流和第二音频流进行混音,生成第三音频流;确定目标音频流为第三音频流。第三音频流的生成过程具体可参考图3B中第三音频流的相关叙述,在此不再赘述。
例如,参见图3E所示的混音行为的示意图。基于图3C所示的混音权重的划分示意图,可知在图3E中,混音区的下限值为混音权重的最小值,混音区的上限值为混音权重的最小值,在此情况下,混音行为具体如下:
当待加入音频流的混音权重为最小值,或者,当前音频流的混音权重为最大值时,则拒绝待加入的音频流加入;当待加入音频流的混音权重不为最小值且当前音频流的混音权重不为最大值时,进一步判断待加入的音频流的混音权重是否为最大值;
进一步地,若待加入的音频流的混音权重为最大值,则待加入音频流抢占;若待加入的音频流的混音权重不为最大值,则允许待加入的音频流加入混音获得新的音频流。
在一些可能的实施例中,当音频流离开(例如播放结束)时,可以基于当前留下的各音频流的混音权重重新混音。
S304:设备1播放目标音频流。
在设备1具有音宿能力的情况下,例如设备1为上述图1A中的设备一或者图1B中的设备二时,设备1可以直接播放目标音频流。
可选地,在一些可能实施例中,在设备1不具有音宿能力的情况下可以不执行S304,而执行下述S305和S306:
S305:设备1向设备2发送目标音频流。
相应地,设备2从设备1接收目标音频流。
在设备1具有音宿能力的情况下,设备1可以向设备2发送目标音频流。
例如,当设备1为上述图1C中的设备四时,设备2可以为图1C中的设备五。
又例如,当设备1为上述图1D中的设备七时,设备2可以为图1D中的设备八。
S306:设备2播放目标音频流。
可以看到,实施本申请实施例,具有混音能力处理的设备可以接收至少一个音源设备发送的至少一个音频流,基于音频流的混音权重可以实现不同场景下至少一个音频流的混音处理,有利于提升用户的听感体验,满足了用户的多样性需求。
下面一些场景说明上述混音方法的应用示例。
例如,参见图3F所示的应用场景,手机为执行混音处理的设备,耳机与用户的手机连接,耳机为播放音频流的设备。用户准备在手机上玩游戏且希望在玩游戏的过程中不受除游戏音以外的音源的打扰,于是用户在手机上选择游戏模式进入游戏中,响应于该操作,手机采用预先设置的游戏模式这一使用场景对应的混音权重,即将游戏类型的音频流的混音权重设置为最高,或者用户也可以在图2B所示的混音权重设置界面将游戏类型的音频流的混音权重设置为最大,则当手机接收到其他音源设备发送的音频流,例如公共广播播放的音乐、其他用户终端的视频播放声音等,都不会被混入当前播放的游戏类型的音频流进行混音处理,如此,实现了游戏的免打扰。当用户结束游戏退出游戏模式时,游戏类型的音频流的混音权重可以恢复为调整前的混音权重。
又例如,参见图3G所示的应用场景,耳机为执行混音处理和播放音频流的设备,公共广播和手机为产生音频流的设备。用户的手机连接耳机播放音乐,耳机可以同时接收公共广播发送的音频流。假设用户需要关注公共广播的音频流承载的内容,耳机当前播放着音乐类型的音乐流1,当耳机接收到公共广播发送的音频流2时,耳机对音频流1和音频流2进行混音处理获得混合后的音频流并播放混合后的音频流,其中,混合后的音频流中音频流2的响度输出占比高于音频流1的响度输出占比,尽可能使得音频流2在混合后的音频流中更加突出,且音频流1能弱化,使用户能听清音频流2。待音频流2播放结束后,音频流1可以恢复为混音前的响度输出占比。
在一些可能的实施例中,混音权重配置能力和音宿能力未集成部署在同一设备上,例如上述图1B中配置模块部署在设备三上且音宿模块部署在设备二上,又例如图1C中配置模块部署在设备六而音宿模块部署在设备五上,又例如图1D中配置模块部署在设备七且音宿模块部署在设备八上。则在图1B或图1C或图1D所示的混音系统中,图1B中的设置二、图1C中的设备四或图1D中的设备七执行图3A实施例所示的混音方法之前,具有混音权重配置能力的设备和具有音宿能力的设备之间可以先完成混音配置信息的设置,具体过程可参考下述图4所示的方法。需要说明的是,图4只是混音配置信息的生成方法的一种示例。
参见图4,图4是本申请实施例提供的一种混音权重配置方法的流程图。该方法可以应用于设备3和设备4组成的混音系统,其中,设备3具有混音权重配置能力,设备4具有音宿能力。
示例性地,设备3和设备4可以满足下述任一情况:
设备3为图1B中的设备三而设备4为图1B中的设备二;
设备3为图1C中的设备六而设备4为图1C中的设备五;
设备3为图1D中的设备七而设备4为图1D中的设备八。
该方法包括但不限于以下步骤:
S401:设备3从设备4获取设备4支持的音频流的多种类型。
一种实现方式中,设备3向设备4发送请求消息1,请求消息1用于请求获取设备4支持的音频流的多种类型,响应于请求消息1,设备4向设备3发送响应消息1,其中,响应消息1指示了设备4支持的音频流的多种类型。
可以理解,由于不同的设备具有不同的音宿能力,故支持播放的音频流的类型也可能不同。设备3在进行混音权重的配置之前,预先从设备4处获取设备4支持的音频流的类型,后续可以更有针对性、更准确地配置相应类型的音频流的混音权重。
S402:设备3根据设备4支持的音频流的多种类型,生成混音配置信息1。
一种实现方式中,混音配置信息1包括上述多种类型中每种类型的音频流的混音权重,其中,每种类型的音频流对应的混音权重用于指示对应类型的音频流被混音时该音频流的响度的输出占比。在此情况下,混音配置信息1的表示可参考上述表1的相关叙述,在此不再赘述。
在一些可能的实施例中,混音配置信息1除了可以基于设备4支持的音频流的多种类型生成外,还可以基于下述因素中的至少一项生成:产生音频流的音源设备的类型、音源设备所属用户的类型、生成音频流的应用的类型、音频流的编码格式和使用场景。这里,音频设备的类型、音源设备所属用户的类型、生成音频流的应用的类型、音频流的编码格式和使用场景可以是配置人员预先基于经验在设备2本地设置的,相关说明可参考上述实施例中相应内容的叙述。在此情况下,混音配置信息1例如可以是上述表2所示形式,也可以是其他形式,在此不作具体限定。
在一些可能的实施例中,设备3配置有显示界面,混音配置信息1也可以是设备3基于设备4支持的音频流的多种类型,以及结合上述图2A所示的方法生成。
可以理解,混音配置信息1与设备4对应,意味着当设备4接收到来自多个音源设备的多个音频流时,可以基于混音配置信息1执行相应的混音处理。
在一些可能的实施例中,混音配置信息1还包括配置数量信息,配置数量信息指示待配置的上述多种类型的数量。
在一些可能的实施例中,设备3还可以向设备4发送混音周期,混音周期用于指示多个音频流被混音时每个音频流所需的采样点的数量。另外,多个音频流被混音时采用统一的采样率和统一的混音周期,混音周期例如可以是设备3提供的。示例性地,混音周期可以是以采样率为单位的时长,也可以是一个预设时长,在此不作具体限定。
在一些可能的实施例中,在设备3不具备混音处理能力的情况下,例如设备3为上述图1B中的设备三或者图1C中的设备六,该方法还包括下述步骤:
S403:设备3向设备4发送混音配置信息1。
相应地,设备4从设备3接收混音配置信息1。
S404:设备4存储混音配置信息1,并根据混音配置信息1进行配置。
例如,设备4根据混音配置信息1中音频流的混音权重在本地进行同步更新。
在一些可能的实施例中,设备4在完成本地配置后,还可以向设备3发送指示本地配置成功的混音配置响应消息。
可以看到,当配置模块和音宿模块不部署在同一设备时,音宿模块所在设备所需的混音配置信息可预先由配置模块所在设备生成,并将生成的混音配置信息发送给音宿模块所在设备,大大方便了后续音宿模块所在设备的混音处理,满足了不同应用场景下的混音需求。
在一些可能的实施例中,在设备4还具有混音处理能力的情况下,设备4可以基于上述获取的混音配置信息1在本地执行混音处理,具体过程可参考下述A11-A15:
A11:接收指示信息,指示信息指示第二音频流的类型,第二音频流与当前播放的第一音频流来自不同的音源设备。
这里,第一音频流为设备4当前在播放的音频流。
示例性地,第二音频流来自音源设备1,第一音频流来自音源设备2。
示例性地,第二音频流来自音源设备1,第一音频流为设备4基于多个音频流进行混音后获得,其中,多个音源流来自多个音源设备,在此情况下,第二音频流与第一音频流来自不同的音源设备是指:这多个音源设备中存在至少一个音源设备与音源设备1不同。
A12:接收第二音频流。
A13:根据指示信息和混音配置信息,确定第二音频流的混音权重。
具体地,指示信息指示了第二音频流的类型,根据混音配置信息获取第二音频流的类型对应的混音权重,并将其作为第二音频流的混音权重。
例如,混音配置信息表示为上述表1所示的对应关系表,表1示出了音频流的类型与混音权重之间的对应关系。假设指示信息指示了第二音频流的类型为类型B,根据表1获得类型B的音频流的混音权重为X2,即第二音频流的混音权重为X2。
一种实现方式中,在混音配置信息还基于下述因素中的至少一项生成时:产生音频流的音源设备的类型;音频流的编码格式;产生音频流的音源设备所属用户的类型;生成音频流的应用的类型;和音频流的使用场景;指示信息还用于指示下述信息中的至少一项:产生第二音频流的设备的类型;第二音频流的编码格式;产生第二音频流的设备所属用户的类型;生成第二音频流的应用的类型;和第二音频流的使用场景。
例如,混音配置信息表示为上述表2所示的对应关系表,表2示出了音频流的类型、音源设备的类型和混音权重三者之间的对应关系。假设指示信息指示了第二音频流的类型为类型A以及产生第二音频流的音源设备的类型为类型一,根据表2获得类型A和类型一组合对应的混音权重为X1,即第二音频流的混音权重为X1。
A14:根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流。
一种实现方式中,在满足预设条件时,拒绝第二音频流加入混音,确定目标音频流为所述第一音频流,其中,预设条件为下述任一条件;第二音频流的混音权重小于或等于第一值且第一音频流的混音权重大于第一值;或,第一音频流的混音权重大于或等于第二值且第一音频流的混音权重大于或等于第二音频流的混音权重,第二值大于所述第一值。
一种实现方式中,当第二音频流的混音权重大于或等于第二值且第二音频流的混音权重大于第一音频流的混音权重时,允许第二音频流抢占,确定目标音频流为第二音频流,其中,第二值大于第一值。
一种实现方式中,当第二音频流的混音权重大于第一值且小于第二值以及第一音频流的混音权重大于第一值且小于第二值时,允许第二音频流加入混音;对第一音频流和第二音频流进行混音生成第三音频流;其中,第二值大于第一值;确定目标音频流为第三音频流。需要说明的是,第三音频流的生成过程具体可参考图3A实施例中S303的相关叙述,在此不再赘述。
上述第一值和第二值可以是预设的,具体可参考上述图3B实施例的相关叙述。
在一些可能的实施例中,目标音频流的确定也可以基于上述图3C实施例的相关叙述实现,在此不再赘述。
A15:播放目标音频流。
可以看到,实施本申请实施例,当音宿模块所在设备具有混音处理能力时,可以基于获取的混音配置信息实现对来自多个音源设备的多个音频流的混音处理以及混音后的音频流的播放,使得用户能够有良好的用户听感体验,满足不同场景下多音源的混音及播放需求。
在一些可能的实施例中,对于上述图1C所示的混音系统,配置模块、音宿模块和混音模块分别部署在不同的设备上,具体地,混音模块部署在设备四上、音宿模块部署在设备五上以及配置模块部署在设备六上。在图1C中,设备五具有音宿能力但不具有混音处理能力,而设备四具有混音处理能力,在此情况下,设备四和设备五之间可以通过下述图5A所示方法实现设备四为设备五提供混音代理服务。
参见图5A,图5A是本申请实施例提供的一种基于混音代理的混音方法的流程图。该方法可以应用于图1C所示的混音系统,该混音系统包括设备四和设备五,其中,设备五具有音宿能力,设备四具有混音处理能力且能够提供混音代理。
示例性地,设备四为用户手机(用于混音处理),设备五为耳机(用于播放音频流),设备六为云端服务器(用于设置混音配置信息)。
示例性地,设备四为家庭路由器(用于混音处理),设备五为耳机(用于播放音频流),设备六为用户手机(用于设置混音配置信息)。
该方法包括但不限于以下步骤:
S501:设备五广播第一消息,第一消息包括音频流混音服务的标识。
其中,第一消息用于设备五为自身寻找提供混音代理的设备。
这里,第一消息为广播的公开信息数据,公开信息数据包括第一字段和第二字段,其中,第一字段用于指示音频流混音服务的标识由标准服务数据信息携带,第二字段用于指示音频流混音服务的标识。
例如,参见图5B,图5B是本申请实施例提供的一种第一消息中音频流混音服务的标识的承载示意图。在图5B中,第一消息的公开信息数据包含至少一个数据子结构,每个数据子结构包括三部分,分别为数据类型指示、数据长度指示和数据内容部分。其中,可以通过一个数据子结构(例如,数据子结构1)来承载音频流混音服务的标识。具体地,在数据子结构1中,数据类型标识指示音频流混音服务的标识由标准服务数据信息携带,数据内容部分用于承载音频流混音服务的标识。
其中,音频流混音服务的标识的长度为16比特。
S502:设备四基于第一消息,接入设备五。
在本申请实施例中,设备四扫描到设备五广播的第一消息后,与设备五建立连接。
S503:设备四向设备五发送第一请求消息。
其中,第一请求消息用于请求获取设备五的混音配置信息,混音配置信息包括来自多个音源设备的多个音频流的混音权重,混音配置信息用于对所述多个音频流的混音处理。这里,混音配置信息的内容具体可参考上述图4中混音配置信息1的叙述。
相应地,设备五从设备四接收第一请求消息。
S504:设备五向设备四发送混音配置信息。
在本申请实施例中,响应于第一请求消息,设备五向设备四发送混音配置信息。其中,设备五的混音配置信息可以是设备五通过上述图4中S401-S404预先获取,在此情况下,设备五相当于图4中的设备4,设备五的混音配置信息也可以是设备五出厂默认设置的,在此不作具体限定。
相应地,设备四从设备五接收混音配置信息,混音配置信息用于设备四对来自多个音源设备的多个音频流的混音处理。
进一步地,设备四根据获取的混音配置信息,例如,基于混音配置信息确定自身支持混音配置信息中的音频流的多种类型时,确定开始为设备五提供混音代理。
S505:设备四向设备五发送第二请求消息。
其中,第二请求消息用于请求获取设备五的音宿能力信息,音宿能力信息用于指示设备五的音宿能力。
相应地,设备五从设备四接收第二请求消息。
这里,设备五的音宿能力信息包括设备五支持的编解码器的类型和能力(例如,采样率、采样深度、音频通道数、编码格式等)、支持的传输模式(例如单播、组播、广播中的至少一项)、音频流的类型和服务质量(quality of service,Qos)等中的至少一项。
S506:设备五向设备四发送音宿能力信息。
在本申请实施例中,响应于第二请求消息,设备五向设备四发送音宿能力信息。
相应地,从设备五接收音宿能力信息。
进一步地,设备四根据获取的混音配置信息和音宿能力信息,确定开始为设备五提供混音代理。
可以理解,当设备四从设备五处获取混音配置信息和音宿能力信息后,确定自身能力与设备五的混音配置信息和音宿能力信息匹配,例如,设备四与设备五两者支持的音频流的类型相同、设备四与和设备五两者支持的编解码器的类型和能力相同、设备四与设备五两者的传输模式匹配等,则设备四确定为设备五提供混音代理服务。
S507:设备四向设备五发送第二消息,第二消息包括第一混音代理标识,第一混音代理标识用于指示设备四开始为设备五提供混音代理。
相应地,设备五接收设备四发送的第二消息,通过第二消息知晓自身已找到提供混音代理的设备,即设备四,在此情况下,设备五停止自动扫描和/或连接音源设备,也就是说,设备五不再直接从多个音源设备接收音频流,只能接收设备四发送的音频流。
这里,设备四在确定开始为设备五提供混音代理时,向设备五发送第二消息。在此之后设备四代替设备五从多个音源设备接收多个音频流,当这多个音频流需要进行混音时由设备四执行混音处理。
S508:设备四从多个音源设备获取多个音频流,并根据这多个音频流确定待播放的目标音频流。设备四确定目标音频流的过程可以参考图3A实施例所示的混音方法,设备四相当于图3A实施例中的设备1,在此不再赘述。
S509:设备四向设备五发送目标音频流。相应地,设备五从设备四接收目标音频流。
S510:设备五播放目标音频流。
在一些可能的实施例中,当设备四需要结束混音代理时,设备四还可以向设备五发送第三消息,其中,第三消息包括第二混音代理标识,第二混音代理标识用于指示设备四结束为设备五提供混音代理。相应地,设备五从设备四接收第三消息,通过第三消息知晓设备四结束为设备五提供混音代理,在此情况下,设备五恢复自行扫描和/或连接音源设备。
可以看到,实施本申请实施例,通过为能力有限的设备(例如,仅支持单路的音频流或某种传输模式的音频流)提供混音代理,能够帮助该设备实现来自多个音源设备的多个音频流的混音处理,间接扩展了设备对来自多个设备的多音源的接收能力。
示例性地,音频流混音服务可以基于服务管理结构标准作下述表3所示的定义:在表3中,服务结构成员包括混音策略、混音策略控制点、混音周期、混音代理和溢出提醒。对每个服务结构成员,定义了该成员的类别、操作指示、权限以及选项。以混音代理这一成员为例,定义了混音代理的类型为属性,操作指示为写入,权限为需加密以及选项为可选。
表3
服务结构成员 | 类别 | 操作指示 | 权限 | 选项 |
混音策略 | 属性 | 读取 | 需加密 | 必选 |
混音策略控制点 | 方法 | 无 | 需加密 | 可选 |
混音周期 | 属性 | 读取和写入 | 需加密 | 可选 |
混音代理 | 属性 | 写入 | 需加密 | 可选 |
溢出提醒 | 事件 | 无 | 无 | 可选 |
其中,音频流混音服务用于配置音宿设备的混音策略(例如可以是上述表1或表2所示的对应关系表)和开启/关闭混音代理。混音策略影响音宿设备的混音行为和混音效果。其中,音宿设备是指可以接收或使用(例如,播放)音频流的设备。
音频流混音服务的服务端应为音宿设备。音频流混音服务的客户端为配置设备或混音代理设备,配置设备负责混音策略的配置,混音周期的配置,以及接收溢出提醒。混音代理设备可替音宿设备接收多路音频流并混音,再以单路音频流的形式传输给音宿设备,混音代理设备访问音频流混音服务中的混音代理属性。示例性地,音宿设备可以是图4中的设备4,配置设备为图4中的设备3。示例性地,音宿设备也可以是图5A中的设备五,混音代理设备为图5A中的设备四。
当音宿设备的混音策略为预置时,无法修改。此时音频流混音服务中应不设置混音策略控制点方法。当含有混音策略控制点时,混音策略可被动态配置。
当音频流混音服务中含有混音代理属性时,服务端应发送广播,在标准服务数据信息中携带音频流混音服务的标识。示例性地,混音代理属性取值第一混音代理标识时,指示开始为服务端提供混音代理;混音代理属性取值第二混音代理标识时,指示结束为服务端提供混音代理。可以理解,第一混音代理标识和第二混音代理标识可以为混音代理属性的两种取值。
溢出提醒用于混音后的音频流发生溢出时对客户端进行通知。溢出提醒可参考上述图3A中的溢出指示信息。
例如,混音策略属性可表示为下述表4所示内容:音频流类型[i]表示第i个音频流类型,权重系数[i]表示第i个音频流类型对应的混音权重,有关音频流类型[i]和权重系数[i]的说明可参考表4内的叙述,在此不再赘述。
表4
例如,混音周期属性可表示为下述表5所示内容:
表5
例如,混音代理属性可表示为下述表6所示内容:
表6
混音策略配置信令为用于调整音频流的混音权重的指令,例如,混音策略配置信令用于调整不同类型的音频流的权重系数(或称为混音权重)。混音策略配置信令承载在混音策略控制点的方法调用上。具体实施上,方法调用的句柄应为混音策略控制点的句柄,混音策略配置信令的内容应放置在方法调用的参数字段中。
例如,混音策略配置信令可表示为下述表7所示内容:操作码和参数这两个字段,其中,参数字段包括配置数量、音频流类型[i]和权重系数[i]。
表7
服务端接收到混音策略配置信令时,还可以向客户端反馈混音策略配置响应。例如,混音策略配置响应可参考表8所示内容:
表8
结果码 | 描述 |
0x00 | 配置成功 |
0x01 | 不支持的音频流类型 |
0x02-0xFE | 预留 |
0xFF | 其他错误 |
示例性地,配置设备先通过读取混音策略属性,获取音宿设备上承载的混音策略。配置设备通过混音策略配置信令配置混音策略中音频流的类型及其对应的混音权重。音宿设备接收到该信令后,按照信令修改相应的项目,并回复配置成功的配置响应。
例如,图4实施例中的混音配置信息1为混音策略配置信令的内容,混音策略配置信令可以承载在混音策略控制点的方法调用上,其中,方法调用的句柄应为混音策略控制点的句柄,混音策略配置信令的内容应放置在方法调用的参数字段中。
参见图6A,图6A是本申请实施例提供的一种装置的结构示意图,装置31包括显示单元310、接收单元311和配置单元312。该装置31可以通过硬件、软件或者软硬件结合的方式来实现。
其中,显示单元310用于向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:音频流的标识、音频流的类型、生成音频流的应用的类型、生成音频流的音源设备的类型、生成音频流的音源设备所属的用户的类型和音频流的编码格式;接收单元311用于接收用户的设置信息;配置单元312用于根据用户的设置信息配置上述多个音频流的混音权重。
该装置31可用于实现图2A实施例所描述的方法。在图2A实施例中,显示单元310可用于执行S201,接收单元311可用于执行S202,配置单元312可用于执行S203。
在一些可能的实施例中,装置31还可以用于执行图4实施描述的设备3侧的方法,在此不再赘述。
参见图6B,图6B是本申请实施例提供的一种装置的结构示意图,装置32包括接收单元320和处理单元321。该装置32可以通过硬件、软件或者软硬件结合的方式来实现。
其中,接收单元320用于从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;处理单元321用于根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
该装置32可用于实现图3A实施例所描述的设备1侧的方法。在图3A实施例中,接收单元320可用于执行S301,处理单元321可用于执行S302。在一些可能的实施例中,接收单元320还可用于执行S303。
可选地,装置32还包括播放单元(图未示),播放单元用于播放目标音频流。播放单元可用于执行图3A中的S304。
可选地,装置32还包括发送单元(图未示),发送单元用于发送目标音频流。发送单元可用于执行图3A中的S305。
在一些可能的实施例中,装置32还可以用于执行图5A实施例描述的设备四侧的方法。在图5A中,接收单元320可用于执行S501、S504和S506,处理单元321可用于执行S502和S508。
参见图6C,图6C是本申请实施例提供的一种装置的结构示意图,装置33包括发送单元330。该装置33可以通过硬件、软件或者软硬件结合的方式来实现。
其中,发送单元330用于发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;以及用于发送所述至少一个音频流。
该装置33可用于实现图3A实施例所描述的音源设备侧的方法。在图3A实施例中,发送单元330可用于执行S301和S303。
参见图7A,图7A是本申请实施例提供的一种装置的结构示意图,装置41包括生成单元410和发送单元411。该装置41可以通过硬件、软件或者软硬件结合的方式来实现。
其中,生成单元410用于生成混音配置信息,混音配置信息包括来自多个音源设备的多个音频流的混音权重;发送单元411用于向第二设备(具有音宿能力的设备)发送混音配置信息,混音配置信息用于对这多个音频流的混音处理。
该装置41可用于实现图4实施例所描述的设备3侧的方法。在图4实施例中,生成单元410可用于执行S401和S402,发送单元411可用于执行S403。
参见图7B,图7B是本申请实施例提供的一种装置的结构示意图,装置42包括接收单元420和处理单元421。该装置42可以通过硬件、软件或者软硬件结合的方式来实现。
其中,接收单元420用于从第一设备(即具有混音权重配置能力的设备)接收混音配置信息,混音配置信息包括来自多个音源设备的多个音频流的混音权重,混音配置信息用于对这多个音频流的混音处理;处理单元421用于根据混音配置信息进行配置。
该装置42可用于实现图4实施例所描述的设备4侧的方法。在图4实施例中,接收单元420可用于执行S403,处理单元421可用于执行S404。
在一些可能的实施例中,装置42还包括发送单元422。在此情况下,发送单元422用于广播第一消息,第一消息包括音频流混音服务的标识;接收单元420用于从第一设备(即能提供混音代理的设备)接收第二消息,第二消息包括第一混音代理标识,第一混音代理标识用于指示该第一设备开始为装置42提供混音代理。
该装置42可用于实现图5A实施例所描述的设备五侧的方法。在图5A实施例中,发送单元422可用于执行S501、S504和S506,接收单元420可用于执行S503、S505、S507和S509。在一些可能的实施例中,装置42还包括播放单元(图未示),播放单元可用于执行S510。
参见图7C,图7C是本申请实施例提供的一种装置的结构示意图,装置43包括接收单元430和发送单元431。该装置43可以通过硬件、软件或者软硬件结合的方式来实现。
其中,接收单元430,用于从第二设备(即具有音宿能力的设备)接收第一消息,第一消息包括音频流混音服务的标识;发送单元431用于基于第一消息向第二设备发送第二消息,第二消息包括第一混音代理标识,第一混音代理标识用于指示装置43开始为第二设备提供混音代理。
该装置43可用于实现图5A实施例所描述的设备四侧的方法。在图5A实施例中,接收单元430可用于执行S501、S504和S506,发送单元431可用于执行S503、S505、S507和S509。在一些可能的实施例中,装置43还包括处理单元(图未示),处理单元可用于执行S502和S508。
应理解,以上装置(例如图6A、图6B、图6C、图7A、图7B或图7C所示的装置)中各单元的划分仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。此外,装置中的单元可以以处理器调用软件的形式实现;例如装置包括处理器,处理器与存储器连接,存储器中存储有指令,处理器调用存储器中存储的指令,以实现以上任一种方法或实现该装置各单元的功能,其中处理器例如为通用处理器,例如中央处理单元(central processing unit,CPU)或微处理器,存储器为装置内的存储器或装置外的存储器。或者,装置中的单元可以以硬件电路的形式实现,可以通过对硬件电路的设计实现部分或全部单元的功能,该硬件电路可以理解为一个或多个处理器;例如,在一种实现中,该硬件电路为专用集成电路(application-specific integrated circuit,ASIC),通过对电路内元件逻辑关系的设计,实现以上部分或全部单元的功能;再如,在另一种实现中,该硬件电路为可以通过可编程逻辑器件(programmable logic device,PLD)实现,以现场可编程门阵列(field programmable gate array,FPGA)为例,其可以包括大量逻辑门电路,通过配置文件来配置逻辑门电路之间的连接关系,从而实现以上部分或全部单元的功能。以上装置的所有单元可以全部通过处理器调用软件的形式实现,或全部通过硬件电路的形式实现,或部分通过处理器调用软件的形式实现,剩余部分通过硬件电路的形式实现。
在本申请实施例中,处理器是一种具有信号的处理能力的电路,在一种实现中,处理器可以是具有指令读取与运行能力的电路,例如中央处理单元(central processingunit,CPU)、微处理器、图形处理器(graphics processing unit,GPU)(可以理解为一种微处理器)、或数字信号处理器(digital singnal processor,DSP)等;在另一种实现中,处理器可以通过硬件电路的逻辑关系实现一定功能,该硬件电路的逻辑关系是固定的或可以重构的,例如处理器为专用集成电路(application-specific integrated circuit,ASIC)或可编程逻辑器件(programmable logic device,PLD)实现的硬件电路,例如FPGA。在可重构的硬件电路中,处理器加载配置文档,实现硬件电路配置的过程,可以理解为处理器加载指令,以实现以上部分或全部单元的功能的过程。此外,还可以是针对人工智能设计的硬件电路,其可以理解为一种ASIC,例如神经网络处理单元(neural network processing unit,NPU)张量处理单元(tensor processing unit,TPU)、深度学习处理单元(deep learningprocessing unit,DPU)等。
可见,以上装置中的各单元可以是被配置成实施以上方法的一个或多个处理器(或处理电路),例如:CPU、GPU、NPU、TPU、DPU、微处理器、DSP、ASIC、FPGA,或这些处理器形式中至少两种的组合。
此外,以上装置中的各单元可以全部或部分可以集成在一起,或者可以独立实现。在一种实现中,这些单元集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。该SOC中可以包括至少一个处理器,用于实现以上任一种方法或实现该装置各单元的功能,该至少一个处理器的种类可以不同,例如包括CPU和FPGA,CPU和人工智能处理器,CPU和GPU等。
参见图8,图8是本申请实施例提供的一种通信设备的结构示意图。如图8所示,通信设备50包括:处理器501、通信接口502、存储器503和总线504。处理器501、存储器503和通信接口502之间通过总线504通信。
应理解,本申请不限定通信设备50中的处理器、存储器的个数。
一种实现方式中,通信设备50可以是产生或发送音频流的音源设备,该设备例如可以是手机、计算机、平板电脑、穿戴设备、车载设备、虚拟现实设备、增强现实设备等终端。
一种实现方式中,通信设备50可以是具有混音权重配置能力的设备,该设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等。
一种实现方式中,通信设备50可以是具有混音处理能力的设备,该设备例如可以是便携移动设备(例如,手机、平板、计算机等)、智能穿戴设备(例如,运动手环、手表等)、车机等具有处理能力的终端设备,也可以是基础设施设备,例如家庭路由器、公共路由器等。
一种实现方式中,通信设备50可以是接收或使用(例如播放)音频流的设备,该设备例如可以是耳机、音响、带播放器的眼镜或其他播放器等。
总线504可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。总线504可包括在通信设备50各个部件(例如,存储器503、处理器501、通信接口502)之间传送信息的通路。
处理器501可参考上述实施例中对处理器的相关描述,在此不再赘述。
存储器503用于提供存储空间,存储空间中可以存储操作系统和计算机程序等数据。存储器503可以是随机存取存储器(random access memory,RAM)、可擦除可编程只读存储器(erasable programmable read only memory,EPROM)、只读存储器(read-onlymemory,ROM),或便携式只读存储器(compact disc read memory,CD-ROM)等中的一种或者多种的组合。存储器503可以单独存在,也可以集成于处理器501内部。
通信接口502可用于为处理器501提供信息输入或输出。或者可替换的,该通信接口502可用于接收外部发送的数据和/或向外部发送数据,可以为包括诸如以太网电缆等的有线链路接口,也可以是无线链路(如Wi-Fi、蓝牙、通用无线传输等)接口。或者可替换的,通信接口502还可以包括与接口耦合的发射器(如射频发射器、天线等),或者接收器等。
在一些可能的实施例中,当通信设备50具有混音权重配置能力时,通信设备50还包括显示器505。显示器505与处理器501通过总线504连接或耦合。显示器505可以用于向用户指示多个音频流的属性。显示器505可以是显示屏,显示屏可以是液晶显示器(liquidcrystal display,LCD)、有机或无机发光二极管(organic light-emitting diode,OLED)、有源矩阵有机发光二极体面板(active matrix/organic light emitting diode,AMOLED)等。显示器505也可以是车机平板、车载显示器或者抬头显示(head up display,HUD)系统等。
该通信设备50中的处理器501用于读取存储器503中存储的计算机程序,用于执行前述的方法,例如图2A、图3A、图4和图5A所描述的方法。
在一种可能的设计方式中,通信设备50可为执行图2A所示方法的执行主体中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
通过显示单元310用于向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:音频流的标识、音频流的类型、生成音频流的应用的类型、生成音频流的音源设备的类型、生成音频流的音源设备所属的用户的类型和音频流的编码格式;
通过接收单元311用于接收用户的设置信息;
根据用户的设置信息配置上述多个音频流的混音权重。
在一种可能的设计方式中,通信设备50可为执行图3A所示设备1侧的方法的执行主体(设备1)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
通过接收单元320用于从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;
根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
在一种可能的设计方式中,通信设备50可为执行图3A所示的音源设备侧的方法的执行主体(音源设备)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
发送单元330用于发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;以及用于发送所述至少一个音频流。
在一种可能的设计方式中,通信设备50可为执行图4所示的设备3侧的方法的执行主体(设备3)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
生成混音配置信息,混音配置信息包括来自多个音源设备的多个音频流的混音权重;
通过发送单元411用于向第二设备发送混音配置信息,混音配置信息用于对所述多个音频流的混音处理。
在一种可能的设计方式中,通信设备50可为执行图4所示的设备3侧的方法的执行主体(设备4)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
通过接收单元420从第一设备接收混音配置信息,混音配置信息包括来自多个音源设备的多个音频流的混音权重,混音配置信息用于对所述多个音频流的混音处理;
通过处理单元421根据混音配置信息进行配置。
在一种可能的设计方式中,通信设备50可为执行图5A所示的设备四侧的方法的执行主体(设备四)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
通过接收单元430,用于从第二设备接收第一消息,第一消息包括音频流混音服务的标识;
通过发送单元431用于基于第一消息向第二设备发送第二消息,第二消息包括第一混音代理标识,第一混音代理标识用于指示第一设备开始为第二设备提供混音代理。
在一种可能的设计方式中,通信设备50可为执行图5A所示的设备五侧的方法的执行主体(设备五)中的一个或多个模块,该处理器501可用于读取存储器中存储的一个或多个计算机程序,用于执行以下操作:
通过发送单元422用于广播第一消息,第一消息包括音频流混音服务的标识;
通过接收单元420用于从第一设备接收第二消息,第二消息包括第一混音代理标识,第一混音代理标识用于指示第一设备开始为第二设备提供混音代理。
在本文上述的实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。另外,在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,各个实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
需要说明的是,本领域普通技术人员可以看到上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(read-only memory,ROM)、随机存储器(random accessmemory,RAM)、可编程只读存储器(programmable read-only memory,PROM)、可擦除可编程只读存储器(erasable programmable read only memory,EPROM)、一次可编程只读存储器(one-time programmable read-only memory,OTPROM)、电子抹除式可复写只读存储(electrically-erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
本申请的技术方案本质上或者说做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机程序产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是个人计算机,服务器,或者网络设备、机器人、单片机、芯片、机器人等)执行本申请各个实施例所述方法的全部或部分步骤。
Claims (131)
1.一种混音方法,其特征在于,所述方法应用于第一设备,所述方法包括:
从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;
根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
2.根据权利要求1所述的方法,其特征在于,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述至少一个音源设备的类型;
所述混音权重;
所述至少一个音源设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
3.根据权利要求1或2所述的方法,其特征在于,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,所述第一音频流和所述第二音频流为同一类型的音频流和/或来自同一音源设备和/或由同一个应用生成的音频流。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
获取多个音频流,所述多个音频流来自多个音源设备,所述多个音频流包括所述至少一个音频流;
根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
播放所述目标音频流,或者,向目标设备发送所述目标音频流。
6.根据权利要求4或5所述的方法,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:
在满足第一预设条件时,确定所述目标音频流为所述第一音频流,其中,所述第一预设条件为下述任一条件:
所述第二音频流的混音权重小于或等于所述第一值且所述第一音频流的混音权重大于所述第一值;或,
所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
7.根据权利要求4或5所述的方法,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:
在满足第二预设条件时,确定所述目标音频流为所述第二音频流,其中,所述第二预设条件为下述任一条件:
所述第一音频流的混音权重小于或等于所述第一值且所述第二音频流的混音权重大于所述第一值;或,
所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重,所述第二值大于所述第一值。
8.根据权利要求4或5所述的方法,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流,包括:
当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,所述第二值大于所述第一值,对所述第一音频流和所述第二音频流进行混音生成第三音频流;确定所述目标音频流为所述第三音频流。
9.根据权利要求4-8任一项所述的方法,其特征在于,
所述多个音频流包括第一音频流和第二音频流;
所述第一音频流为所述第一设备生成,所述第二音频流来自第一音源设备;或,
所述第一音频流来自第一音源设备,所述第二音频流来自第二音源设备。
10.根据权利要求1-9任一项所述的方法,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
11.一种混音方法,其特征在于,所述方法应用于第二设备,所述方法包括:
发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;
发送所述至少一个音频流。
12.根据权利要求11所述的方法,其特征在于,所述至少一条指示信息与所述第二设备生成的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述第二设备的类型;
所述混音权重;
所述第二设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
13.根据权利要求11或12所述的方法,其特征在于,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
14.根据权利要求11或12所述的方法,其特征在于,所述至少一条指示信息包括第一指示信息,其中,所述第一指示信息与第一音频流和第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
15.一种混音方法,其特征在于,所述方法应用于第一设备,所述方法包括:
向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:所述音频流的标识、所述音频流的类型、生成所述音频流的应用的类型、生成所述音频流的音源设备的类型、生成所述音频流的音源设备所属的用户的类型和所述音频流的编码格式;
接收所述用户的设置信息;
根据所述设置信息配置所述多个音频流的混音权重。
16.根据权利要求15所述的方法,其特征在于,所述接收所述用户的设置信息,包括:
获取所述用户通过所述第一设备的触摸屏输入的所述设置信息;
获取所述用户通过所述第一设备的按钮输入的所述设置信息;
获取所述用户通过所述第一设备的键盘输入的所述设置信息;
获取所述用户通过语音输入的所述设置信息;或
获取所述用户通过手势输入的所述设置信息。
17.根据权利要求15或16所述的方法,其特征在于,所述方法还包括:
向所述用户指示所述多个音频流的使用场景;
所述设置信息用于配置所述多个音频流在所述使用场景下的混音权重。
18.根据权利要求17所述的方法,其特征在于,所述使用场景包括第一使用场景和第二使用场景,所述多个音频流在所述第一使用场景下的混音权重不同于所述多个音频流在所述第二使用场景下的混音权重。
19.根据权利要求17或18所述的方法,其特征在于,
所述使用场景包括下述场景中的至少一种:游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。
20.根据权利要求15-19任一项所述的方法,其特征在于,所述方法还包括:
基于所述混音权重,将所述多个音频流混合成被播放的音频流。
21.根据权利要求20所述的方法,其特征在于,所述多个音频流包括具有高优先级的第一音频流,所述方法还包括通过以下多种方式中的至少一种方式提醒所述用户关注所述第一音频流:
增大所述第一音频流的混音权重;
多次播放所述第一音频流的内容;和
要求所述用户反馈确认。
22.根据权利要求21所述的方法,其特征在于,所述增大所述第一音频流的混音权重,包括:
在所述第一音频流的播放时间段内,降低所述多个音频流中与所述第一音频流相混合的其它音频流的播放音量;或者
在所述第一音频流的播放时间段内,设置所述第一音频流为所述被播放的音频流中的唯一音频流。
23.根据权利要求21或22所述的方法,其特征在于,所述多次播放所述第一音频流的内容,包括:
在所述被播放的音频流中重复多次混入所述第一音频流,且逐次增大所述第一音频流的混音权重。
24.根据权利要求21-23任一项所述的方法,其特征在于,所述要求所述用户反馈确认,包括:
向所述用户询问是否知晓所述第一音频流承载的内容;
接收所述用户的反馈信息,所述反馈信息用于指示所述用户确认知晓所述第一音频流承载的内容。
25.根据权利要求24所述的方法,其特征在于,
在接收所述反馈信息之前,所述方法还包括:在被播放的音频流中重复混入所述第一音频流;
在接收所述反馈信息之后,所述方法还包括:停止在被播放的音频流中混入所述第一音频流。
26.根据权利要求20-25任一项所述的方法,其特征在于,所述方法还包括:
当所述被播放的音频流的音量超过预设音量阈值时,向所述用户提示所述音量过大。
27.根据权利要求15-26任一项所述的方法,其特征在于,所述配置为在执行所述混音之前的预配置或者在执行所述混音过程中对所述混音权重的调整。
28.根据权利要求15-27任一项所述的方法,其特征在于,所述方法还包括:
获取所述混音权重的默认设置;
所述根据所述设置信息配置所述多个音频流的混音权重包括:
根据所述设置信息和所述默认设置配置所述多个音频流的混音权重。
29.根据权利要求15-28任一项所述的方法,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
30.一种混音方法,其特征在于,所述方法应用于第一设备,所述方法包括:
生成混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重;
向第二设备发送所述混音配置信息,所述混音配置信息用于对所述多个音频流的混音处理。
31.根据权利要求30所述的方法,其特征在于,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
32.根据权利要求30或31所述的方法,其特征在于,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
33.根据权利要求30-32任一项所述的方法,其特征在于,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的方法调用上,所述方法调用的句柄应为所述混音策略控制点的句柄。
34.根据权利要求30-33任一项所述的方法,其特征在于,向第二设备发送所述混音配置信息之前,所述方法还包括:
获取所述第二设备支持的音频流的多种类型;
所述生成混音配置信息,包括:
根据所述第二设备支持的音频流的所述多种类型,生成所述混音配置信息,所述多种类型包括所述多个音频流的类型。
35.根据权利要求30-34任一项所述的方法,其特征在于,所述混音配置信息还基于下述因素中的至少一项生成:
产生音频流的音源设备的类型;
音频流的编码格式;
产生音频流的音源设备所属用户的类型;
生成音频流的应用的类型;和
音频流的使用场景。
36.根据权利要求30-35任一项所述的方法,其特征在于,所述方法还包括:
向所述第二设备发送混音周期,所述混音周期用于指示所述多个音频流中每个音频流被混音时所需的采样点的数量。
37.根据权利要求30-36任一项所述的方法,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
38.根据权利要求30-37任一项所述的方法,其特征在于,所述方法还包括:
接收溢出指示信息,所述溢出指示信息用于指示混音后的音频流发生溢出,所述溢出指示信息包括所述混音后的音频流中响度输出占比最大的音频流的类型;
根据所述溢出指示信息调整所述混音配置信息中的混音权重。
39.一种混音方法,其特征在于,应用于第二设备,所述方法包括:
从第一设备接收混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;
根据所述混音配置信息进行配置。
40.根据权利要求39所述的方法,其特征在于,所述第二设备当前播放第一音频流,所述方法还包括:
接收第二音频流,所述第二音频流和所述第一音频流来自不同的音源设备;
根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流;所述第一音频流的混音权重和所述第二音频流的混音权重从所述混音配置信息中获取;
播放所述目标音频流。
41.根据权利要求40所述的方法,其特征在于,
根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:
在满足预设条件时,拒绝所述第二音频流加入所述混音,确定所述目标音频流为所述第一音频流,其中,所述预设条件为下述任一条件;
所述第二音频流的混音权重小于或等于第一值且所述第一音频流的混音权重大于所述第一值;或,
所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
42.根据权利要求40所述的方法,其特征在于,
根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:
当所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重时,允许所述第二音频流抢占,确定所述目标音频流为所述第二音频流,其中,所述第二值大于所述第一值。
43.根据权利要求40所述的方法,其特征在于,
根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流,包括:
当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,允许所述第二音频流加入所述混音;对所述第一音频流和所述第二音频流进行混音生成第三音频流;其中,所述第二值大于所述第一值;
确定所述目标音频流为所述第三音频流。
44.根据权利要求39-43任一项所述的方法,其特征在于,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
45.根据权利要求39-44任一项所述的方法,其特征在于,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
46.根据权利要求39-45任一项所述的方法,其特征在于,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的方法调用上,所述方法调用的句柄应为所述混音策略控制点的句柄。
47.根据权利要求39-46任一项所述的方法,其特征在于,所述从第一设备接收混音配置信息之前,所述方法还包括:
向所述第一设备发送所述第二设备支持的音频流的多种类型。
48.一种混音方法,其特征在于,应用于第一设备,所述方法包括:
从第二设备接收第一消息,所述第一消息包括音频流混音服务的标识;
基于所述第一消息向所述第二设备发送第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
49.根据权利要求48所述的方法,其特征在于,所述方法还包括:
获取多个音频流,所述多个音频流来自多个音源设备;
根据所述多个音频流,确定待播放的目标音频流;
向所述第二设备发送所述目标音频流。
50.根据权利要求48或49所述的方法,其特征在于,所述向所述第二设备发送第二消息之前,所述方法还包括:
发送第一请求消息,所述第一请求消息用于请求获取所述第二设备的混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;
从所述第二设备接收所述混音配置信息。
51.根据权利要求48-50任一项所述的方法,其特征在于,所述方法还包括:
发送第二请求消息,所述第二请求消息用于请求获取所述第二设备的音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力;
从所述第二设备接收所述音宿能力信息;
根据所述音宿能力信息,确定开始为所述第二设备提供所述混音代理。
52.根据权利要求48-51任一项所述的方法,其特征在于,所述方法还包括:
向所述第二设备发送第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识用于指示所述第一设备结束为所述第二设备提供所述混音代理。
53.根据权利要求48-52任一项所述的方法,其特征在于,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
54.根据权利要求53所述的方法,其特征在于,所述音频流混音服务的标识的长度为16比特。
55.一种混音方法,其特征在于,所述方法应用于第二设备,所述方法包括:
广播第一消息,所述第一消息包括音频流混音服务的标识;
从第一设备接收第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
56.根据权利要求55所述的方法,其特征在于,所述从第一设备接收第二消息之前,所述方法还包括:
从所述第一设备接收第一请求消息;
基于所述第一请求消息,向所述第一设备发送混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理。
57.根据权利要求55或56所述的方法,其特征在于,所述从第一设备接收第二消息之前,所述方法还包括:
从所述第一设备接收第二请求消息;
基于所述第二请求消息,向所述第一设备发送音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力。
58.根据权利要求55-57任一项所述的方法,其特征在于,所述方法还包括:
从所述第一设备接收第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识指示所述第一设备结束为所述第二设备提供所述混音代理。
59.根据权利要求55-58任一项所述的方法,其特征在于,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
60.根据权利要求59所述的方法,其特征在于,所述音频流混音服务的标识的长度为16比特。
61.一种用于混音的装置,其特征在于,所述装置为第一设备或包含于所述第一设备中,所述装置包括:
接收单元,用于从至少一个音源设备接收至少一条指示信息,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应;
处理单元,用于根据所述至少一条指示信息确定所述至少一个音频流的混音权重。
62.根据权利要求61所述的装置,其特征在于,所述至少一条指示信息与所述至少一个音源设备产生的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述至少一个音源设备的类型;
所述混音权重;
所述至少一个音源设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
63.根据权利要求61或62所述的装置,其特征在于,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,所述第一音频流和所述第二音频流为同一类型的音频流和/或来自同一音源设备和/或由同一个应用生成的音频流。
64.根据权利要求61-63任一项所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取多个音频流,所述多个音频流来自多个音源设备,所述多个音频流包括所述至少一个音频流;
所述处理单元还用于根据所述多个音频流和所述多个音频流的混音权重,确定待播放的目标音频流。
65.根据权利要求64所述的装置,其特征在于,所述装置还包括:
播放单元,用于播放所述目标音频流;或者,
发送单元,用于向目标设备发送所述目标音频流。
66.根据权利要求64或65所述的装置,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:
在满足第一预设条件时,确定所述目标音频流为所述第一音频流,其中,所述第一预设条件为下述任一条件:
所述第二音频流的混音权重小于或等于所述第一值且所述第一音频流的混音权重大于所述第一值;或,
所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
67.根据权利要求64或65所述的装置,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:
在满足第二预设条件时,确定所述目标音频流为所述第二音频流,其中,所述第二预设条件为下述任一条件:
所述第一音频流的混音权重小于或等于所述第一值且所述第二音频流的混音权重大于所述第一值;或,
所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重,所述第二值大于所述第一值。
68.根据权利要求64或65所述的装置,其特征在于,所述多个音频流包括第一音频流和第二音频流,所述处理单元具体用于:
当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,所述第二值大于所述第一值,对所述第一音频流和所述第二音频流进行混音生成第三音频流;确定所述目标音频流为所述第三音频流。
69.根据权利要求64-68任一项所述的装置,其特征在于,
所述多个音频流包括第一音频流和第二音频流;
所述第一音频流为所述第一设备生成,所述第二音频流来自第一音源设备;或,
所述第一音频流来自第一音源设备,所述第二音频流来自第二音源设备。
70.根据权利要求61-69任一项所述的装置,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
71.一种用于混音的装置,其特征在于,所述装置为第二设备或包含于所述第二设备中,所述装置包括:
发送单元,用于发送至少一条指示信息,所述至少一条指示信息与至少一个音频流对应,所述至少一条指示信息用于确定所述至少一个音频流的混音权重;
所述发送单元,还用于发送所述至少一个音频流。
72.根据权利要求71所述的装置,其特征在于,所述至少一条指示信息与所述第二设备生成的至少一个音频流对应,包括:
所述至少一条指示信息用于指示下述信息中的至少一项:
所述至少一个音频流的类型;
所述至少一个音频流的编码格式;
所述第二设备的类型;
所述混音权重;
所述第二设备所属用户的类型;和
生成所述至少一个音频流的应用的类型。
73.根据权利要求71或72所述的装置,其特征在于,所述至少一条指示信息包括第一指示信息和第二指示信息,其中,所述第一指示信息与第一音频流对应,所述第二指示信息与第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
74.根据权利要求71或72所述的装置,其特征在于,所述至少一条指示信息包括第一指示信息,其中,所述第一指示信息与第一音频流和第二音频流对应,其中,所述第一音频流和所述第二音频流为同一类型的音频流和/或由同一应用生成的音频流。
75.一种用于混音的装置,其特征在于,所述装置为第一设备或包含于所述第一设备中,所述装置包括:
显示单元,用于向用户指示多个音频流的属性,所述多个音频流由多个设备生成,所述属性包括下述中的至少一项:所述音频流的标识、所述音频流的类型、生成所述音频流的应用的类型、生成所述音频流的音源设备的类型、生成所述音频流的音源设备所属的用户的类型和所述音频流的编码格式;
接收单元,用于接收所述用户的设置信息;
处理单元,用于根据所述设置信息配置所述多个音频流的混音权重。
76.根据权利要求75所述的装置,其特征在于,所述接收单元具体用于:
获取所述用户通过所述第一设备的触摸屏输入的所述设置信息;
获取所述用户通过所述第一设备的按钮输入的所述设置信息;
获取所述用户通过所述第一设备的键盘输入的所述设置信息;
获取所述用户通过语音输入的所述设置信息;或
获取所述用户通过手势输入的所述设置信息。
77.根据权利要求75或76所述的装置,其特征在于,
所述显示单元还用于向所述用户指示所述多个音频流的使用场景;
所述设置信息用于配置所述多个音频流在所述使用场景下的混音权重。
78.根据权利要求77所述的装置,其特征在于,所述使用场景包括第一使用场景和第二使用场景,所述多个音频流在所述第一使用场景下的混音权重不同于所述多个音频流在所述第二使用场景下的混音权重。
79.根据权利要求77或78所述的装置,其特征在于,
所述使用场景包括下述场景中的至少一种:游戏模式、驾驶模式、扬声器模式、耳机播放模式、休息模式、静音模式、学习模式和省电模式。
80.根据权利要求75-79任一项所述的装置,其特征在于,所述处理单元还用于:
基于所述混音权重,将所述多个音频流混合成被播放的音频流。
81.根据权利要求80所述的装置,其特征在于,所述多个音频流包括具有高优先级的第一音频流,所述处理单元还用于通过以下多种方式中的至少一种方式提醒所述用户关注所述第一音频流:
增大所述第一音频流的混音权重;
多次播放所述第一音频流的内容;和
要求所述用户反馈确认。
82.根据权利要求81所述的装置,其特征在于,所述处理单元具体用于:
在所述第一音频流的播放时间段内,降低所述多个音频流中与所述第一音频流相混合的其它音频流的播放音量;或者
在所述第一音频流的播放时间段内,设置所述第一音频流为所述被播放的音频流中的唯一音频流。
83.根据权利要求81或82所述的装置,其特征在于,所述处理单元具体用于:
在所述被播放的音频流中重复多次混入所述第一音频流,且逐次增大所述第一音频流的混音权重。
84.根据权利要求81-83任一项所述的装置,其特征在于,所述处理单元具体用于:
向所述用户询问是否知晓所述第一音频流承载的内容;
接收所述用户的反馈信息,所述反馈信息用于指示所述用户确认知晓所述第一音频流承载的内容。
85.根据权利要求84所述的装置,其特征在于,所述处理单元还用于
在接收所述反馈信息之前,在被播放的音频流中重复混入所述第一音频流;
在接收所述反馈信息之后,停止在被播放的音频流中混入所述第一音频流。
86.根据权利要求80-85任一项所述的装置,其特征在于,所述处理单元还用于:
当所述被播放的音频流的音量超过预设音量阈值时,向所述用户提示所述音量过大。
87.根据权利要求75-86任一项所述的装置,其特征在于,所述配置为在执行所述混音之前的预配置或者在执行所述混音过程中对所述混音权重的调整。
88.根据权利要求75-87任一项所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取所述混音权重的默认设置;
所述处理单元具体用于:根据所述设置信息和所述默认设置配置所述多个音频流的混音权重。
89.根据权利要求75-88任一项所述的装置,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
90.一种用于混音的装置,其特征在于,所述装置为第一设备或包含于所述第一设备中,所述装置包括:
生成单元,用于生成混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重;
发送单元,用于向第二设备发送所述混音配置信息,所述混音配置信息用于对所述多个音频流的混音处理。
91.根据权利要求90所述的装置,其特征在于,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
92.根据权利要求90或91所述的装置,其特征在于,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
93.根据权利要求90-92任一项所述的装置,其特征在于,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的装置调用上,所述装置调用的句柄应为所述混音策略控制点的句柄。
94.根据权利要求90-93任一项所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取所述第二设备支持的音频流的多种类型;
所述生成单元具体用于:
根据所述第二设备支持的音频流的所述多种类型,生成所述混音配置信息,所述多种类型包括所述多个音频流的类型。
95.根据权利要求90-94任一项所述的装置,其特征在于,所述混音配置信息还基于下述因素中的至少一项生成:
产生音频流的音源设备的类型;
音频流的编码格式;
产生音频流的音源设备所属用户的类型;
生成音频流的应用的类型;和
音频流的使用场景。
96.根据权利要求90-95任一项所述的装置,其特征在于,
所述发送单元还用于向所述第二设备发送混音周期,所述混音周期用于指示所述多个音频流中每个音频流被混音时所需的采样点的数量。
97.根据权利要求90-96任一项所述的装置,其特征在于,
当所述混音权重小于或等于第一值时,所述混音权重用于指示拒绝将与所述混音权重对应的音频流作为所述混音的来源;或,
当所述混音权重大于所述第一值且小于第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的非唯一来源,所述第二值大于所述第一值;或,
当所述混音权重大于或等于所述第二值时,所述混音权重用于指示允许将与所述混音权重对应的音频流作为所述混音的唯一来源。
98.根据权利要求90-97任一项所述的装置,其特征在于,所述装置还包括:
接收单元,用于接收溢出指示信息,所述溢出指示信息用于指示混音后的音频流发生溢出,所述溢出指示信息包括所述混音后的音频流中响度输出占比最大的音频流的类型;
所述处理单元还用于根据所述溢出指示信息调整所述混音配置信息中的混音权重。
99.一种用于混音的装置,其特征在于,所述装置为第二设备或包含于所述第二设备中,所述装置包括:
接收单元,用于从第一设备接收混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;
处理单元,用于根据所述混音配置信息进行配置。
100.根据权利要求99所述的装置,其特征在于,所述第二设备当前播放第一音频流,
所述接收单元还用于接收第二音频流,所述第二音频流和所述第一音频流来自不同的音源设备;
所述处理单元还用于根据所述第一音频流的混音权重、所述第二音频流的混音权重、所述第一音频流和所述第二音频流,确定待播放的目标音频流;所述第一音频流的混音权重和所述第二音频流的混音权重从所述混音配置信息中获取;
所述装置还包括:播放单元用于播放所述目标音频流。
101.根据权利要求100所述的装置,其特征在于,所述处理单元具体用于:
在满足预设条件时,拒绝所述第二音频流加入所述混音,确定所述目标音频流为所述第一音频流,其中,所述预设条件为下述任一条件;
所述第二音频流的混音权重小于或等于第一值且所述第一音频流的混音权重大于所述第一值;或,
所述第一音频流的混音权重大于或等于第二值且所述第一音频流的混音权重大于或等于所述第二音频流的混音权重,所述第二值大于所述第一值。
102.根据权利要求100所述的装置,其特征在于,所述处理单元具体用于:
当所述第二音频流的混音权重大于或等于第二值且所述第二音频流的混音权重大于所述第一音频流的混音权重时,允许所述第二音频流抢占,确定所述目标音频流为所述第二音频流,其中,所述第二值大于所述第一值。
103.根据权利要求100所述的装置,其特征在于,所述处理单元具体用于:
当所述第二音频流的混音权重大于第一值且小于第二值以及所述第一音频流的混音权重大于所述第一值且小于所述第二值时,允许所述第二音频流加入所述混音;对所述第一音频流和所述第二音频流进行混音生成第三音频流;其中,所述第二值大于所述第一值;
确定所述目标音频流为所述第三音频流。
104.根据权利要求99-103任一项所述的装置,其特征在于,所述音频流的混音权重用于调整所述音频流的采样点的采样深度。
105.根据权利要求99-104任一项所述的装置,其特征在于,所述多个音频流的类型不同,和/或所述多个音频流的编码格式不同,和/或所述多个音频流的使用场景不同,和/或生成所述多个音频流的应用的类型不同,和/或所述多个音源设备的类型不同,和/或所述多个音源设备所属的用户的类型不同。
106.根据权利要求99-105任一项所述的装置,其特征在于,所述混音配置信息由混音策略配置信令携带,所述混音策略配置信令承载在混音策略控制点的装置调用上,所述装置调用的句柄应为所述混音策略控制点的句柄。
107.根据权利要求99-106任一项所述的装置,其特征在于,所述装置还包括:
发送单元,用于向所述第一设备发送所述第二设备支持的音频流的多种类型。
108.一种用于混音的装置,其特征在于,所述装置为第一设备或包含于所述第一设备中,所述装置包括:
接收单元,用于从第二设备接收第一消息,所述第一消息包括音频流混音服务的标识;
发送单元,用于基于所述第一消息向所述第二设备发送第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
109.根据权利要求108所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取多个音频流,所述多个音频流来自多个音源设备;
处理单元,用于根据所述多个音频流,确定待播放的目标音频流;
所述发送单元还用于向所述第二设备发送所述目标音频流。
110.根据权利要求108或109所述的装置,其特征在于,
所述发送单元还用于发送第一请求消息,所述第一请求消息用于请求获取所述第二设备的混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理;
所述接收单元还用于从所述第二设备接收所述混音配置信息。
111.根据权利要求108-110任一项所述的装置,其特征在于,
所述发送单元还用于发送第二请求消息,所述第二请求消息用于请求获取所述第二设备的音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力;
所述接收单元还用于从所述第二设备接收所述音宿能力信息;
所述装置还包括,处理单元用于:根据所述音宿能力信息,确定开始为所述第二设备提供所述混音代理。
112.根据权利要求108-111任一项所述的装置,其特征在于,
所述发送单元还用于向所述第二设备发送第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识用于指示所述第一设备结束为所述第二设备提供所述混音代理。
113.根据权利要求108-112任一项所述的装置,其特征在于,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
114.根据权利要求113所述的装置,其特征在于,所述音频流混音服务的标识的长度为16比特。
115.一种用于混音的装置,其特征在于,所述装置为第二设备或包含于所述第二设备中,所述装置包括:
发送单元,用于广播第一消息,所述第一消息包括音频流混音服务的标识;
接收单元,用于从第一设备接收第二消息,所述第二消息包括第一混音代理标识,所述第一混音代理标识用于指示所述第一设备开始为所述第二设备提供混音代理。
116.根据权利要求115所述的装置,其特征在于,
所述接收单元还用于从所述第一设备接收第一请求消息;
所述发送单元还用于基于所述第一请求消息,向所述第一设备发送混音配置信息,所述混音配置信息包括来自多个音源设备的多个音频流的混音权重,所述混音配置信息用于对所述多个音频流的混音处理。
117.根据权利要求115或116所述的装置,其特征在于,
所述接收单元还用于从所述第一设备接收第二请求消息;
所述发送单元还用于基于所述第二请求消息,向所述第一设备发送音宿能力信息,所述音宿能力信息用于指示所述第二设备的音宿能力。
118.根据权利要求115-117任一项所述的装置,其特征在于,
所述接收单元还用于从所述第一设备接收第三消息,所述第三消息包括第二混音代理标识,所述第二混音代理标识指示所述第一设备结束为所述第二设备提供所述混音代理。
119.根据权利要求115-118任一项所述的装置,其特征在于,所述第一消息为广播的公开信息数据,所述公开信息数据包括第一字段和第二字段,所述第一字段用于指示所述音频流混音服务的标识由标准服务数据信息携带,所述第二字段用于指示所述音频流混音服务的标识。
120.根据权利要求119所述的装置,其特征在于,所述音频流混音服务的标识的长度为16比特。
121.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求1-10任一项所述的方法。
122.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求11-14任一项所述的方法。
123.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求15-29任一项所述的方法。
124.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求30-38任一项所述的方法。
125.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求39-47任一项所述的方法。
126.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求48-54任一项所述的方法。
127.一种设备,其特征在于,包括存储器和处理器,所述存储器存储计算机指令,所述处理器运行所述计算机指令以使所述设备实现如权利要求55-60任一项所述的方法。
128.一种车辆,其特征在于,所述车辆包括如权利要求61-120任一项所述的装置,或者包括如权利要求121-127任一项所述的设备。
129.一种混音系统,其特征在于,包括第一装置、第二装置和第三装置,其中,所述第三装置用于执行如权利要求11-14任一项所述的方法,所述第一装置用于执行如权利要求30-38任一项所述的方法且所述第二装置用于执行如权利要求39-47任一项所述的方法,或者,所述第一装置用于执行如权利要求48-54任一项所述的方法且所述第二装置用于执行如权利要求55-60任一项所述的方法。
130.一种混音系统,其特征在于,包括第一装置和第二装置,其中,所述第一装置用于执行如权利要求11-14任一项所述的方法,所述第二装置用于执行如权利要求1-10、15-29中任一项所述的方法。
131.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序指令,当所述程序指令被处理器运行时,实现如权利要求1-10任一项所述的方法,或者实现如权利要求11-14任一项所述的方法,或者实现如权利要求15-29任一项所述的方法,或者实现如权利要求30-38任一项所述的方法,或者实现如权利要求39-47任一项所述的方法,或者实现如权利要求48-54任一项所述的方法,或者实现如权利要求55-60任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211225744.4A CN117854520A (zh) | 2022-10-09 | 2022-10-09 | 一种混音方法及相关装置 |
PCT/CN2023/120476 WO2024078296A1 (zh) | 2022-10-09 | 2023-09-21 | 一种混音方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211225744.4A CN117854520A (zh) | 2022-10-09 | 2022-10-09 | 一种混音方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117854520A true CN117854520A (zh) | 2024-04-09 |
Family
ID=90534955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211225744.4A Pending CN117854520A (zh) | 2022-10-09 | 2022-10-09 | 一种混音方法及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117854520A (zh) |
WO (1) | WO2024078296A1 (zh) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9031262B2 (en) * | 2012-09-04 | 2015-05-12 | Avid Technology, Inc. | Distributed, self-scaling, network-based architecture for sound reinforcement, mixing, and monitoring |
DE102013105375A1 (de) * | 2013-05-24 | 2014-11-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Tonsignalerzeuger, Verfahren und Computerprogramm zum Bereitstellen eines Tonsignals |
CN107333093B (zh) * | 2017-05-24 | 2019-11-08 | 苏州科达科技股份有限公司 | 一种声音处理方法、装置、终端及计算机可读存储介质 |
CN110166794B (zh) * | 2018-04-26 | 2021-11-16 | 腾讯科技(深圳)有限公司 | 一种直播音频处理方法、装置及系统 |
CN109300482A (zh) * | 2018-09-13 | 2019-02-01 | 广州酷狗计算机科技有限公司 | 音频录制方法、装置、存储介质以及终端 |
CN112068794A (zh) * | 2020-07-27 | 2020-12-11 | 湖北亿咖通科技有限公司 | 音频混音控制方法、装置、电子装置和存储介质 |
CN112885329B (zh) * | 2021-02-02 | 2023-10-31 | 广州广哈通信股份有限公司 | 一种提高混音音质的控制方法、装置及存储介质 |
CN113423006B (zh) * | 2021-05-31 | 2022-07-15 | 惠州华阳通用电子有限公司 | 一种基于主副声道的多音频流混音播放方法及系统 |
CN113973103B (zh) * | 2021-10-26 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、电子设备及存储介质 |
CN114566173A (zh) * | 2022-03-09 | 2022-05-31 | 平安普惠企业管理有限公司 | 一种音频混音方法、装置、设备及存储介质 |
-
2022
- 2022-10-09 CN CN202211225744.4A patent/CN117854520A/zh active Pending
-
2023
- 2023-09-21 WO PCT/CN2023/120476 patent/WO2024078296A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024078296A1 (zh) | 2024-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10791440B2 (en) | System and method for provisioning user computing devices based on sensor and state information | |
KR101311087B1 (ko) | 통근 시간 기능을 갖는 통신 장치 및 그 사용 방법 | |
CN109845373B (zh) | 确定直连链路资源的方法、装置、用户设备及基站 | |
KR20200028208A (ko) | IEEE 802.11 표준에 정의된 TWT(target wake time)를 이용하여 무선 매체에 대한 접근을 지원하는 전자 장치 | |
US9652195B2 (en) | Audio output device that utilizes policies to concurrently handle multiple audio streams from different source devices | |
KR20060118015A (ko) | 애드 혹 통신 네트워크에서 통신들을 제어하기 위한 방법들및 시스템들 | |
CN103677727A (zh) | 移动终端和音频控制方法 | |
CN109862475A (zh) | 音频播放设备及方法、存储介质、通信终端 | |
CN110321096A (zh) | 一种多路音频智能控制方法及相关装置和设备 | |
US10104524B2 (en) | Communications via a receiving device network | |
JP2023500146A (ja) | アップリンクリソースの決定方法、指示方法、端末及びネットワーク機器 | |
CN114040373A (zh) | 音频业务处理方法、装置、电子设备及存储介质 | |
US20190182331A1 (en) | Head Unit of Vehicle and Method for Controlling the Same | |
AU2023221819A1 (en) | Session method and apparatus, electronic device, and storage medium | |
CN110602338B (zh) | 音频处理方法、装置、系统、存储介质以及设备 | |
CN108184193B (zh) | 蓝牙播放终端的播放控制方法、蓝牙设备和计算机存储介质 | |
CN117854520A (zh) | 一种混音方法及相关装置 | |
CN106851594B (zh) | 一种广播发送方法、装置及终端 | |
CN109155803B (zh) | 音频数据处理方法、终端设备和存储介质 | |
CN117136352A (zh) | 用于集线器设备与多个端点之间的通信的技术 | |
CN113271385A (zh) | 一种呼叫转移方法 | |
CN107332644A (zh) | 信号帧构造方法、装置、系统及计算机可读存储介质 | |
US20070027691A1 (en) | Spatialized audio enhanced text communication and methods | |
CN108809915B (zh) | 一种会话管理方法及装置 | |
US20240334542A1 (en) | System and method for prioritization of device connections |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |