CN115699570A - 基于背景噪声的音频内容的自适应调制 - Google Patents
基于背景噪声的音频内容的自适应调制 Download PDFInfo
- Publication number
- CN115699570A CN115699570A CN202180040626.3A CN202180040626A CN115699570A CN 115699570 A CN115699570 A CN 115699570A CN 202180040626 A CN202180040626 A CN 202180040626A CN 115699570 A CN115699570 A CN 115699570A
- Authority
- CN
- China
- Prior art keywords
- loudness
- audio content
- modulation
- audio
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title description 51
- 238000000034 method Methods 0.000 claims abstract description 81
- 230000006835 compression Effects 0.000 claims description 73
- 238000007906 compression Methods 0.000 claims description 73
- 238000005070 sampling Methods 0.000 claims description 29
- 230000008859 change Effects 0.000 claims description 18
- 230000007423 decrease Effects 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000007774 longterm Effects 0.000 description 29
- 230000015654 memory Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 16
- 230000003287 optical effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000006854 communication Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 230000003247 decreasing effect Effects 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本文描述了能够基于背景噪声来自适应地调制音频内容的技术。例如,音频内容的响度和背景噪声的响度之间的响度差被确定。将音频内容的响度与上限响度阈值进行比较。基于该响度差和/或该比较来从多个调制中选择调制。使用所选调制来调制后续输出的音频内容。
Description
背景技术
音频内容通常具有响度的变化,其用于为音频内容的收听者提供气氛。随着音频内容的声音质量的提高,收听者可以感知到响度的较大变化。然而,在某些情况下,响度的大范围变化可能不是期望的或不可能。例如,如果收听者处于相当嘈杂的环境中,则收听者可能倾向于牺牲声音质量以便能够将音频内容与噪声区分开来。在另一个示例中,如果收听者正在观看一部电影,而孩子们在相邻房间里睡着了,则收听者可能倾向于保持尽可能低的音量,同时仍然能够听到电影的最安静的部分。
音频内容的响度可以被压缩或归一化以减小响度变化的幅度。传统上,用于响度压缩或归一化的参数在制造时对于设备是固定的,并且设备通常被配置成基于设备的总体音量设置(如果有的话)来改变响度压缩和归一化。在增加响度压缩或归一化与提高声音质量之间经常存在折衷。制造商通常不知道用户将使用设备的环境,因此无法针对这些环境精确调整用于响度压缩或归一化的参数。制造商通常使用广泛的假设来确定用于各种类型的设备的参数。例如,移动电话通常被配置用于相对较嘈杂的环境;然而,笔记本电脑通常被配置用于相对较安静的环境。
发明内容
用户经常观看或收听大量媒体。尽管用户通常想要增大媒体中音频内容的动态范围(例如,音频内容的最安静部分和最响亮部分之间的响度差),但用户可能遇到需要较小动态范围的情况。例如,用户可能有正在相邻房间里睡觉的小孩。在该示例中,用户可能期望音频内容具有相对较低的动态范围,以使得整个音频内容具有基本上相等的响度,并且音频内容的响亮部分和安静部分之间的响度差近似为零。如果用户在上述情况下减小提供音频内容的设备的动态范围,则在其他情况下由该设备提供的音频内容可能听起来沉闷且不令人兴奋,除非用户在这些情况下增大动态范围。可能期望设备在没有用户的手动输入的情况下改变音频内容的动态范围以适应各种情况。
本文描述了尤其用于基于(例如,至少部分地基于)背景噪声来自适应地调制音频内容的各种方法。音频内容可使用动态范围压缩和/或自动增益控制(AGC)来调制。动态范围压缩(也被称为压缩)是音频信号处理操作,该操作提高音频内容中的相对较安静的声音的响度和/或降低音频内容中的相对较响亮的声音的响度,这减小(即,压缩)音频内容的动态范围。向下压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度超过响度阈值而降低该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不超过该响度阈值而不改变该第二子集中的每个声音的响度。向上压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度低于响度阈值而提高该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不低于该响度阈值而不改变该第二子集中的每个声音的响度。AGC是一种闭环反馈技术,尽管输出所基于的输入处的信号幅度变化,但该技术在该输出处保持指定的信号幅度。
在一示例方法中,音频内容的响度和背景噪声的响度之间的响度差被确定。将音频内容的响度与上限响度阈值进行比较。基于该响度差和/或该比较来从多个调制中选择调制。将根据响度差小于阈值差并且音频内容的响度小于上限响度阈值来选择第一调制。将根据响度差大于或等于阈值差并且音频内容的响度小于上限响度阈值来选择第二调制。将根据音频内容的响度大于或等于上限响度阈值来选择第三调制。使用所选调制来调制后续输出的音频内容。
提供本发明内容以便以简化的形式介绍以下在具体实施方式中还描述的概念的选集。本公开内容并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。此外,注意到本发明不限于在具体实施方式和/或本文的其它章节中所述的特定实施例。本文呈现这些实施例仅用于说明性的用途。基于本文包含的示教,附加的实施例对相关领域的技术人员将是显而易见的。
附图说明
本文中所结合的并且形成说明书的一部分的附图解说了本发明的各实施例,并且还与本描述一起用于解释所涉及的原理以及使相关领域的技术人员能够实现和使用所公开的技术。
图1是根据一实施例的示例基于自适应调制的电子设备的框图。
图2是根据一实施例的图1所示的音频流的根据相应调制技术来调制的示例表示的标绘。
图3-6描绘了根据各实施例的用于基于背景噪声来自适应地调制音频内容的示例方法的流程图。
图7是根据一实施例的图1所示的自适应调制器的示例实现的框图。
图8是根据一实施例的示例性移动设备的系统图。
图9描绘其中可实现各实施例的示例计算机。
所公开的技术的特征和优点将通过以下结合附图时所阐述的详细描述而变得更显而易见,在附图中,类似的附图标记在整个说明书中标识对应元素。在附图中,相同的附图标记一般指示等同的、功能上类似的、和/或结构上类似的元素。其中元素第一次出现的附图由对应附图标记中最左侧的(诸)数位来指示。
具体实施方式
I.介绍
用户经常观看或收听大量媒体。尽管用户通常想要增大媒体中音频内容的动态范围(例如,音频内容的最安静部分和最响亮部分之间的响度差),但用户可能遇到需要较小动态范围的情况。例如,如果用户在相当嘈杂的环境中,用户可能希望减小音频内容的动态范围以使得用户能够在噪声之上听见音频内容的较安静的部分。如果用户在上述情况下减小提供音频内容的设备的动态范围,则在其他情况下由该设备提供的音频内容可能听起来沉闷且不令人兴奋,除非用户在这些情况下增大动态范围。可能期望设备在没有用户的手动输入的情况下改变音频内容的动态范围以适应各种情况。
II.示例实施例
本文描述的示例实施例能够基于(例如,至少部分地基于)背景噪声来自适应地调制音频内容。音频内容可使用动态范围压缩来调制。动态范围压缩(也被称为压缩)是音频信号处理操作,该操作提高音频内容中的相对较安静的声音的响度和/或降低音频内容中的相对较响亮的声音的响度,这减小(即,压缩)音频内容的动态范围。向下压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度超过响度阈值而降低该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不超过该响度阈值而不改变该第二子集中的每个声音的响度。向上压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度低于响度阈值而提高该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不低于该响度阈值而不改变该第二子集中的每个声音的响度。
与用于调制音频内容的常规技术相比,本文描述的示例技术具有各种益处。例如,示例技术可以能够基于消费音频内容的情形(例如,环境)来自动适配对音频内容的调制(例如,压缩)。情形可以至少部分地基于在该情形中检测到的背景噪声(例如,背景噪声与音频内容之间的响度差)和/或音频内容的响度有多接近与提供该音频内容的设备相关联的响度阈值来定义。调制可通过提高音频内容中的相对较安静的声音的响度和/或降低音频内容中的相对较响的声音的响度来调整。音频内容中的声音的响度被提高或降低的程度可基于消费该音频内容的情形。
示例技术可提高提供音频内容的设备的音频性能。例如,示例技术可提高(例如,优化)音频内容的声音质量,同时提高音频内容中的较安静声音能够被设备用户听见的可能性。因此,示例技术可改善用户的用户体验。例如,示例技术可以在音频内容的响度接近背景噪声的响度且不接近设备的最大响度时显著减小音频内容的动态范围,在音频内容的响度比背景噪声的响度大得多且不接近设备的最大响度时维持相对较大的动态范围,并且在音频内容的响度接近(例如,处于)设备的最大响度时提高音频内容中的仅仅相对较安静的声音的响度。示例技术可减少设备(或设备的用户)为了提高音频内容的声音质量和/或提高音频内容中的相对较安静的声音的响度以使其变得可被用户听到而消耗的时间和/或资源的量。示例技术可减少由设备的用户执行的步骤数、用户花费的工作量、和/或用户为了实现上述结果所花费的时间量。例如,通过自动化从多个调制中选择要应用于音频内容的调制,示例技术可使用户无需手动执行用以实现基于设备的上下文来提高声音质量和/或提高音频内容中的相对较安静的声音的响度的步骤。
图1是根据一实施例的示例基于自适应调制的电子设备(之后称为“电子设备”)100的框图。电子设备100是处理系统。处理系统的示例是包括能够根据指令集来操纵数据的至少一个处理器的系统。例如,处理系统可以是计算机(例如,台式计算机、膝上型计算机、平板计算机或诸如智能手表或头戴式计算机之类的可穿戴计算机)、个人数字助理、智能电话、蜂窝电话、智能扬声器、家庭影院系统、物联网(IoT)设备等。一般地,电子设备100操作以提供音频内容130供电子设备100的用户消费。
电子设备100包括至少一个麦克风102、自适应调制处理器104、数模转换器(DAC)106、放大器108和扬声器110。麦克风是将声音转换为电信号的变换器。(诸)麦克风102被配置成检测声音形式的音频内容130和背景噪声120,并以电信号的形式将音频内容130与背景噪声120的组合提供给基于自适应调制的自适应调制处理器104以供处理。
自适应调制处理器104可以被实现为数字信号处理器(DSP),但是示例实施例在这方面不受限制。自适应调制处理器104包括回声消除器112、长期水平分析器114、自适应调制器116和动态范围分析器118。回声消除器112被配置成将背景噪声120与音频内容130区分开来。例如,回声消除器112可以将用作扬声器110的输入的音频流128和与扬声器110相关联的传递函数相组合以生成估计的音频信号。根据该示例,回声消除器112可以连续地或周期性地对音频流128进行采样,并将所得到的样本与扬声器110的传递函数组合以生成估计的音频信号。该估计的音频信号是对音频内容130的估计。进一步根据该示例,回声消除器112可以从音频内容130和从(诸)麦克风102接收的背景噪声120的组合中减去估计的音频信号,以标识背景噪声120。回声消除器112将背景噪声120提供给长期水平分析器114以供处理。
长期水平分析器114周期性地对背景噪声120进行采样,以生成对应于相应(例如,连贯)时间段的噪声样本。长期水平分析器114对噪声样本进行时间平均以生成经时间平均的噪声信号122。例如,长期水平分析器114可以在多个分钟(例如,3-5分钟)内对噪声样本进行平均,以生成相对平滑的经时间平均的噪声信号。长期水平分析器114可以将经时间平均的噪声信号122计算为均方根(RMS)噪声信号,但示例实施例的范围在这方面不受限制。当音频内容130对应于公共(即,相同)音频文件或源(例如,相同的歌曲或电影)时,求平均时段可以相对较长。当音频内容130对应于不同音频文件或源时(例如,在电子设备100从一首歌切换至另一首或在目标内容和广告之间切换时)或者当音频内容130相对较安静(例如,静默)时,求平均时段可以相对较短。
被长期水平分析器114用来对背景噪声120进行采样的采样时段可基于各种因素中的任一者。例如,长期水平分析器114可以被配置成当电子设备100的用户正在使用应用时、当用户不说话时或者在音频内容130的相对安静的部分期间(例如,当音频内容的响度小于指定阈值时)进行采样。长期水平分析器114可以监视用户正在使用的软件应用,并在用户从第一软件应用改变到第二软件应用时触发样本。长期水平分析器114可以监视电子设备100正在播放的歌曲,并且当用户从第一歌曲改变到第二歌曲时触发样本。当用户改变(例如,提高或降低)电子设备100的主音量时,长期水平分析器114可以采集样本。长期水平分析器114可以使用电影或歌曲的音频简档(也称为指纹)来确定何时要采集样本。例如,音频简档可以指示音频内容130的响度小于阈值的部分,并且长期水平分析器114可以确定要在音频内容的这些部分期间采集样本。长期水平分析器114可以使用软件应用(例如,服务)的音频简档来确定何时要采集样本。例如,软件应用的音频简档可以指示该软件应用所标定的响度,并且长期水平分析器114可以基于该标定响度来确定何时要采集一个或多个样本。
采样时段可以是任何合适的时间段(例如,1、2、3、4或5分钟)。采样时段可以是可调节的,例如基于经时间平均的噪声信号122的平滑度。例如,如果经时间平均的噪声信号122相对平滑地(例如,缓慢地)改变,则长期水平分析器114可以将采样时段配置成相对较长。如果经时间平均的噪声信号122相对急剧地(例如,快速)改变,则长期水平分析器114可以将采样时段配置成相对较短。长期水平分析器114可实现滞后以限制(例如,防止)不想要的频繁采样。例如,杯子撞击桌子可能会产生很响的噪声。然而,可能不希望记录由于杯子撞击桌子而导致的背景噪声的突然的显著变化。例如,当检测到连续的噪声频谱时,长期水平分析器114调整经时间平均的噪声信号122可能是有益的。因此,每个采样时段可以与先前采样时段的一部分(例如,一半)重叠。
长期水平分析器114在本文中被描述为周期性地对背景噪声120进行采样,以用于说明目的且不旨在是限制性的。将认识到,长期水平分析器114可以连续地对背景噪声120进行采样。
动态范围分析器118确定音频内容130的动态范围和响度。动态范围分析器118可以确定音频内容130的均方根(RMS),并基于音频内容130中的RMS来确定动态范围和响度,但示例实施例的范围在这方面不受限制。。动态分析器118生成动态范围指示符124以指示音频内容130的动态范围。动态分析器118生成响度指示符126以指示音频内容130的响度。动态范围分析器118通过组合音频流128和扬声器110的传递函数来确定音频内容130的动态范围和响度,以生成估计的音频信号,如上文关于回声消除器112所述,然后确定该估计的音频信号的动态范围及响度。例如,动态范围分析器118可以连续地或周期性地对音频流128进行采样,并将所得到的样本与扬声器110的传递函数组合以生成估计的音频信号。可以根据各种标准中的任何标准来测量响度,包括但不限于ITU-R BS.1770标准(例如,ITU-RBS.1770-3或ITU-R BS.1770-4)、ISO 532标准(例如,ISO 532A、ISO 532B、ISO 532-1:2017、ISO 532-2:2017或ISO/AWI 532-3)、DIN 45631标准、ASA/ANSI S3.4标准和NordtestACU112标准。将认识到响度是取决于频率的。
自适应调制器116将如由响度指示符126指示的音频内容130的响度与经时间平均的噪声信号122的响度进行比较。自适应调制器116基于音频内容130的响度与经时间平均的噪声信号122的响度之间的响度差和/或音频内容130响度与上限响度阈值之间的差来选择性地调整音频流128并因此调整基于音频流128的音频内容130的调制(例如,动态范围和/或响度)。自适应调制器116可以被配置成逐渐调整音频流128的调制(例如,当从一种调制技术转换到另一种调制技术时)以减小电子设备100的用户可感知到调整的程度。在一示例实施例中,上限响度阈值基于电子设备100的最大音量设置。例如,上限响度阈值可以等于最大音量设置、小于最大音量设置的固定量或小于最大音量设定的可变量,其中可变量基于背景噪声的响度。在另一示例实施例中,上限响度阈值基于音频内容的最大化数字输出值(例如,“1”)。例如,上限响度阈值可以等于最大化的数字输出值、小于最大化数字输出值的固定量或小于最大化的输出值的可变量,其中可变量基于背景噪声的响度。
如果响度差小于阈值差并且音频内容130的响度小于上限响度阈值,则自适应调制器116根据第一调制技术来调制音频流128的数字表示。如果响度差大于或等于阈值差并且音频内容130的响度小于上限响度阈值,则自适应调制器116根据第二调制技术来调制音频流128的数字表示。如果音频内容的响度大于或等于上限响度阈值,则自适应调制器116根据第三调制技术来调制音频流128的数字表示。
在示例压缩实现中,音频流128包括对应于相应频率的多个音频分量。在该压缩实现中,第一调制技术包括将音频流128压缩(并且因此压缩音频内容130)超过上限阈值压缩量。在该压缩实现中,第二调制技术包括将音频流128压缩小于下限阈值压缩量。下限阈值压缩量小于或等于上限阈值压缩量。在该压缩实现中,第三调制技术包括基于音频流128的第一子集中的每一个音频分量具有小于下限响度阈值的响度来提高该第一子集的响度,并且进一步包括基于音频流128的第二子集中的每一个音频分量具有大于或等于下限响度阈值的响度来将该第二子集的响度降低小于指定阈值量。该示例压缩实现将在下文中参照图2更详细地讨论。
DAC 106将已经由自适应调制器116选择性地调制的音频流128的数字表示转换为音频流128的模拟表示。
放大器108放大音频流128的模拟表示以提供音频流128的经放大表示。
扬声器110是将电信号转换成声音的变换器。扬声器110被配置成基于音频流128的经放大表示来生成音频内容130。
关于用于基于背景噪声120来自适应地调制音频内容130的一些示例技术的附加细节在以下关于图3-6的讨论中提供。
自适应调制处理器104、DAC 106、放大器108、回声消除器112、长期水平分析器114、自适应调制器116和动态范围分析器118中的每一者可以以各种方式实现为促成基于背景噪声120对音频内容130的自适应调制,包括被实现在硬件、软件、固件或其任意组合中。例如,自适应调制处理器104、DAC106、放大器108、回声消除器112、长期水平分析器114、自适应调制器116和动态范围分析器118中的每一者可以被实现为被配置成在一个或多个处理器中执行的计算机程序代码。在另一示例中,自适应调制处理器104、DAC 106、放大器108、回声消除器112、长期水平分析器114、自适应调制器116和动态范围分析器118中的每一者可以至少部分地被实现为硬件逻辑/电路系统。例如,自适应调制处理器104、DAC 106、放大器108、回声消除器112、长期水平分析器114、自适应调制器116和动态范围分析器118中的每一者可以至少部分地在现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SoC)、复杂可编程逻辑器件(CPLD)等中实现。每个SoC可包括集成电路芯片,该集成电路芯片包括以下一个或多个:处理器(如微控制器、微处理器、数字信号处理器(DSP)等等)、存储器、一个或多个通信接口、和/或用于执行其功能的进一步的电路和/或嵌入式固件。
将认识到,电子设备100可以不包括图1所示的一个或多个组件。此外,电子设备100可以包括作为对图1中所示的任一个或多个组件的补充或替代的组件。
图2是根据一实施例的图1所示的音频流128的根据相应调制技术来调制的第一、第二和第三示例表示230a、230b和230c的标绘200。出于非限制性说明目的,第一、第二和第三表示230a、230b和230c中的每一者以立体声格式示出。因此,第一表示230a包括左通道204a和右通道204b;第二表示230b包括左通道206a和右通道206b;第三表示230c包括左通道208a和右通道208b。第一表示202a的左通道204a和右通道204b围绕各自的轴210a和210b被调制。第二表示202b的左通道206a和右通道206b围绕各自的轴212a和212b被调制。第三表示202c的左通道208a和右通道208b围绕各自的轴214a和214b被调制。标绘200被示为包括第一时间段216和第二时间段218。出于讨论的目的,音频流128的原始未调制表示(即,在调制之前)的对应于第一时间段216的部分具有相对较低的响度,而音频流128的原始未调制表示的对应于第二时间段218的部分具有相对较高的响度。现在将讨论音频流128的相应第一、第二和第三表示230a、230b和230c的调制。
音频流128的第一表示230a根据以上参照图1描述的第一调制技术来调制。例如,音频流128的第一表示230a可以源自将音频流128的数字表示压缩超过上限阈值压缩量,如关于压缩实现所描述的。第一调制技术可被配置成达成第一表示230a的目标响度。例如,第一表示230a可以在第一时间段216期间被压缩相对较小的量(例如1dB),而在第二时间段218期间被压缩相对较大的量(例如6dB),以便跨第一和第二时间段216和218实现目标响度。相对较小的量和相对较大的量中的每一者可以大于上限阈值压缩量。因此,在第一时间段216期间第一表示230a的响度和在第二时间段218期间第一表示230的响度可以基本相同。自动增益控制(AGC)可被用来响应于音频流128的数字表示被压缩而提高或降低音频流128的数字表示的响度以实现目标响度。
音频流128的第二表示230b根据以上参照图1描述的第二调制技术来调制。例如,音频流128的第二表示230b可以源自将音频流128的数字表示压缩小于下限阈值压缩量,如关于压缩实现所描述的。第二调制技术可以被配置成尽可能接近地再现音频流128的原始未调制表示的动态范围。例如,第二调制技术可以被配置成使得第二表示230b的动态范围与音频流128的原始未调制表示的动态范围之间的差小于指定阈值。因此,音频流128的第二表示230b的动态范围和音频流128的原始未调制表示的动态范围可以基本相同。在另一示例中,第二调制技术可以被配置成使得第二表示230b的响度与音频流128的原始未调制表示的响度之间的差小于指定阈值。因此,音频流128的第二表示230b的响度和音频流128的原始未调制表示的响度可以基本相同。
音频流128的第三表示230c根据以上参照图1描述的第三调制技术来调制。例如,音频流128的第三表示230c可以源自提高音频流128的数字表示的第一子集的响度(其中每个音频分量具有小于下限响度阈值的响度),并且进一步源自将音频流128的数字化表示的第二子集的响度(其中每个音频分量具有大于或等于下限响度阈值的响度)降低小于指定阈值量,如参照压缩实现描述的。实现第三调制的一种方式是压缩和放大第三表示230c的数字表示(即,压缩和放大第一子集和第二子集两者),使得第一(相对较安静)子集的响度提高,而第二(相对较响亮)子集的响度被降低小于指定阈值量。例如,第二子集的响度可以根本不被降低。以此方式实现第三调制在第二子集的响度由于达到电子设备100的最大能力而被显著消减时可以是有帮助的。实现第三调制的另一方式是放大第一子集而非第二子集。根据实现第三调制的该方式,第二子集可被压缩,只要第二子集的响度被降低小于指定阈值量。第三调制技术可被配置成最大化第三表示230c的响度(例如,跨第一和第二时间段)。
图3-6描绘了根据各实施例的用于基于背景噪声来自适应地调制音频内容的示例方法的流程图300、400、500和600。流程图300、400、500和600可以由例如图1中所示的自适应调制器116执行。出于说明目的,参照图7中所示的自适应调制器700描述了流程图300、400、500和600,自适应调制器700是图1中所示的自适应调制器116的示例实现。自适应调制器700包括确定逻辑732、比较逻辑734、选择逻辑736和调制逻辑738。基于有关流程图300、400、500和600的讨论,进一步的结构及操作实施例对于相关领域的技术人员将是显而易见的。
如图3所示,流程图300的方法在步骤302处开始。在步骤302,确定音频内容的响度和背景噪声的响度之间的响度差。例如,可以由扬声器输出(例如,生成)音频内容,并且可以在扬声器的环境中检测背景噪声。根据该示例,背景噪声可以是在该环境中检测到的音频内容以外的声音。在示例实现中,确定逻辑732确定音频内容的响度与背景噪声的响度之间的响度差。例如,确定逻辑732可以通过分析经时间平均的噪声信号722和响度指示符726来确定响度差。响度指示符726指示音频内容的响度。经时间平均的噪声信号722是背景噪声的经时间平均的表示。因此,经时间平均的噪声信号722的响度表示背景噪声的响度。确定逻辑732可以通过从响度指示符726指示的响度中减去经时间平均的噪声信号722的响度来确定响度差。因此,由响度指示符726指示的响度为负可以指示音频内容的响度小于背景噪声的响度。由响度指示符726指示的响度为零可以指示音频内容的响度和背景噪声的响度相同。由响度指示符726指示的响度为正可以指示音频内容的响度大于背景噪声的响度。确定逻辑732可以生成响度差指示符740以指示响度差。
在步骤304,将音频内容的响度与上限响度阈值进行比较。在示例实现中,比较逻辑734将音频内容的响度与上限响度阈值进行比较。例如,上限响度阈值指示符742可以指示上限响度阈值。比较逻辑734可以比较由响度指示符726指示的响度和由上限响度阈值指示符742指示的上限响度阈值以确定第二响度差。例如,比较逻辑734可以从响度指示符726指示的响度中减去上限响度阈值以确定第二响度差。根据该示例,第二响度差为正指示音频内容的响度大于上限响度阈值。进一步根据该示例,第二响度差为零指示音频内容的响度和上限响度阈值相同。进一步根据该示例,第二响度差为负指示音频内容的响度小于上限响度阈值。比较逻辑734可以生成比较信息744以指示第二响度差。
在步骤306,确定音频内容的响度是否小于上限阈值。如果音频内容的响度小于该上限,则流程继续到步骤308。否则,流程继续至步骤314。在示例实现中,选择逻辑736确定音频内容的响度是否小于上限阈值。例如,选择逻辑736可以分析比较信息744以确定音频内容的响度与上限响度阈值之间的第二响度差。例如,选择逻辑736可以基于第二响度差为负来确定音频内容的响度小于上限阈值。根据该示例,选择逻辑736可以基于第二响度差为正或零来确定音频内容的响度不小于(即,大于或等于)上限响度阈值。
在步骤308,确定音频内容的响度和背景噪声的响度之间的响度差是否小于阈值差。如果响度差小于阈值差,则流程继续到步骤310。否则,流程继续至步骤312。在示例实现中,选择逻辑736确定音频内容的响度与背景噪声的响度之间的响度差是否小于阈值差。例如,选择逻辑736可以分析响度差指示符740以确定响度差。选择逻辑736可以从响度差指示符740指示的响度差中减去阈值差以确定响度差是否小于阈值差。
在步骤310,选择第一调制。在示例实现中,选择逻辑736选择第一调制。选择逻辑736基于音频内容的响度小于上限响度阈值并且还基于音频内容的响度与背景噪声的响度之间的响度差小于阈值差来选择第一调制。选择逻辑736可以生成调制指示符748以指示第一调制被选择。
在步骤312,选择第二调制。在示例实现中,选择逻辑736选择第二调制。选择逻辑736基于音频内容的响度小于上限响度阈值并且还基于音频内容的响度与背景噪声的响度之间的响度差不小于(即,大于或等于)阈值差来选择第二调制。选择逻辑736可以生成调制指示符748以指示第二调制被选择。
在步骤314,选择第三调制。在示例实现中,选择逻辑736选择第三调制。选择逻辑736基于音频内容的响度不小于(即,大于或等于)上限响度阈值来选择第三调制。选择逻辑736可以生成调制指示符748以指示第三调制被选择。
在步骤316,使用所选调制来调制后续输出的音频内容。在示例实现中,调制逻辑738执行调制操作750以使用所选择的调制来调制后续输出的音频内容。例如,调制逻辑738可以分析调制指示符748以确定选择逻辑736选择了哪个调制。根据该示例,如果调制指示符738指示已经选择了第一调制,则调制逻辑738使用第一调制来调制后续输出的音频内容。如果调制指示符738指示已经选择了第二调制,则调制逻辑738使用第二调制来调制后续输出的音频内容。如果调制指示符738指示已经选择了第三调制,则调制逻辑738使用第三调制来调制后续输出的音频内容。调制逻辑738可以分析动态范围指示符724以确定音频内容的动态范围。调制逻辑738可以基于由动态范围指示符724指示的动态范围,使用所选择的调制来调制后续输出的音频内容。调制逻辑738可以在非零时间段上淡入对先前调制的改变以得到所选择的调制。例如,这些改变可以在多个分钟内逐渐应用于先前的调制以实现所选择的调制。
在步骤318,确定是否要中止自适应地调制音频内容。如果要中止对音频内容的自适应调制,则流程图300结束。否则,流程返回到步骤302。例如,自适应调制可继续直到遇到中断。在示例实现中,确定逻辑732确定是否要中止对音频内容的自适应调制。
在示例压缩实现中,音频内容包括对应于相应频率的多个音频分量。根据该实施例,第一调制被配置成将音频内容压缩超过上限阈值压缩量。进一步根据该实施例,第二调制被配置成将音频内容压缩小于下限阈值压缩量。下限阈值压缩量小于或等于高上限值压缩量。进一步根据该实施例,第三调制被配置成基于音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高第一子集的响度并且进一步基于音频分量的第二子集中的每个音频分量具有大于或等于下限响度阈值来降低第二子集的响度。第三调制被配置成将音频分量的第二子集的响度降低小于指定阈值量。
在该实施例的第一方面中,第一调制被配置成在扬声器的通带中的指定频率范围内将音频内容压缩超过上限阈值压缩量。扬声器的通带是扬声器能够再现的可听频谱中的频率范围。在一个示例中,指定频率范围是扬声器的最低谐振频率和扬声器的最高谐振频率之间的频率范围。在另一示例中,指定频率范围是扬声器的频率响应相对于1kHz大于或等于-3dB的频率范围。在另一示例中,指定频率范围是扬声器的频率响应相对于1kHz大于或等于-6dB的频率范围。在又一示例中,指定频率范围从1千赫(kHz)延伸到8kHz。将认识到,指定频率范围之外的频率可以被放大指定量。指定量可以大于或等于3分贝(dB)、10分贝或20分贝。根据该方面,上限阈值压缩量大于或等于1.4。例如,上限阈值压缩量可以大于或等于1.6、2.0、2.2或2.4。进一步根据该方面,第一调制还被配置成响应于音频内容被压缩,使用自动增益控制(AGC)来将音频内容的响度改变为基本上等于指定频率范围内的目标(例如,预定)响度。将认识到,AGC的启动时间和衰减时间中的每一者可以被设置为任何合适的值。
在该实施例的第二方面,音频分量的指定子集中的每个音频分量具有小于指定响度阈值的响度,并且音频分量的规定子集中的每个音频分量具有大于或等于规定响度阈值的响度。指定响度阈值和规定响度阈值可以是相同或不同的。例如,规定响度阈值可大于指定响度阈值。
在示例实现中,第一调制被配置成通过至少部分地基于音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高该指定子集的响度来压缩音频内容。第一调制可以被配置成不通过至少部分地基于音频分量的规定子集中的每一个音频分量具有大于或等于指定响度阈值的响度而降低该规定子集的响度来压缩音频内容。
在另一示例实现中,第一调制被配置成通过至少部分地基于音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低该规定子集的响度来压缩音频内容。第一调制可以被配置成不通过至少部分地基于音频分量的指定子集中的每一个音频分量具有小于规定响度阈值的响度而提高该指定子集的响度来压缩音频内容。
在又一示例实现中,第一调制被配置成通过以下操作来压缩音频内容:至少部分地基于音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高该指定子集的响度并且还至少部分地基于音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低规定子集的响度。
在这些示例实现中的每一者中,第一调制可以被配置成使得音频分量的指定子集的响度与音频分量的规定子集的响度之间的差小于或等于3dB、小于2dB或小于1dB。可以使用对音频分量的指定子集的响度的相对长的时间平均以及对音频分量的规定子集的响度的相对长的时间平均来计算该差。每个相对长的时间平均可以是至少一秒内的时间平均。
在该实施例的第三方面中,第二调制被配置成在扬声器的通带中的指定频率范围内将音频内容压缩小于下限阈值压缩量。例如,第二调制可以被配置成不在指定频率范围内压缩音频内容。在一个示例中,指定频率范围是扬声器的最低谐振频率和扬声器的最高谐振频率之间的频率范围。在另一示例中,指定频率范围是扬声器的频率响应相对于1kHz大于或等于-3dB的频率范围。在另一示例中,指定频率范围是扬声器的频率响应相对于1kHz大于或等于-6dB的频率范围。在又一示例中,指定频率范围从1千赫(kHz)延伸到8kHz。根据该方面,下限阈值压缩量小于或等于1.4。例如,下限阈值压缩量小于或等于1.2、1.0、0.8或0.6。
在该实施例的第四方面,第三调制被配置成至少部分地基于音频分量的第二子集中的每一个音频分量具有大于或等于下限响度阈值的响度而不改变该第二子集的响度。
在某些示例实施例中,可以不执行流程图300的一个或多个步骤302、304、306、308、310、312、314、316和/或318。此外,可以执行作为对步骤302、304、306、308、310、312、314、316和/或318的补充或替代的步骤。例如,在示例实施例中,流程图300的方法进一步包括分析音频内容的音频简档。在示例实现中,选择逻辑736分析该音频简档。音频简档指示音频内容的标识(例如,唯一地标识)该音频内容的一个或多个音频属性。例如,该一个或多个属性可将该音频内容与另一音频内容区分开来。在另一示例中,一个或多个属性可包括音频内容的频率响应到该音频内容的响度响应的预定映射。根据该实施例,在步骤310选择第一调制、在步骤312选择第二调制和/或在步骤314选择第三调制还基于由音频内容的音频简档指示的一个或多个音频属性。例如,关于步骤304和306描述的上限响度阈值和/或关于步骤308描述的阈值差可以至少部分地基于该一个或多个音频属性。
在另一示例实施例中,流程图300的方法还包括分析音频内容的类型。例如,选择逻辑736可以分析音频内容的类型。音频内容的示例类型包括但不限于电影、歌曲和对话。根据该实施例,在步骤310选择第一调制、在步骤312选择第二调制和/或在步骤314选择第三调制还基于音频内容的类型。
在另一示例实施例中,流程图300的方法还包括确定包括扬声器的设备的类型。在示例实现中,选择逻辑736确定设备的类型。例如,设备的类型可指示扬声器的频率响应(例如,传递函数)。根据该实施例,在步骤310选择第一调制、在步骤312选择第二调制和/或在步骤314选择第三调制还基于包括扬声器的设备的类型。
在又一示例实施例中,流程图300的方法进一步包括对音频内容和背景噪声中的每一者的多个频带进行采样。例如,确定逻辑732可以对音频内容和背景噪声中的每一者的频带进行采样。根据该实施例,对于每个频带执行步骤302;304;306;308;310、312或314;316;和318。
在另一示例实施例中,流程图300的方法还包括在对应于相应时间段的多个时间实例处周期性地对音频内容和背景噪声进行采样。例如,选择逻辑736可以在这些时间实例处周期性地对音频内容和背景噪声进行采样。根据该实施例,每个时间段的持续时间是可调的,以使得每个时间段的持续时间随着背景噪声的响度的变化速率减小而增加,并且还使得每个时间周期的持续时间随着背景噪声的响度的变化速率增大而减少。进一步根据该实施例,对于每个时间段执行步骤302;304;306;308;310、312或314;316;和318。
在又一示例实施例中,流程图300的方法还包括分析与音频内容相关联的软件应用的响度简档。例如,选择逻辑736可以分析软件应用的响度简档。该响度简档指示由软件应用为该软件应用处理的音频内容中的相应频率标定的多个响度值。根据该实施例,在步骤310选择第一调制、在步骤312选择第二调制和/或在步骤314选择第三调制还基于由软件应用的响度简档指示的响度设置。
在又一示例实施例中,流程图300的方法还包括在使用与音频内容相关联的软件应用时在多个时间段中周期性地对音频内容和背景噪声进行采样。在示例实现中,选择逻辑736在软件应用在使用时在该多个时间段内周期性地对音频内容和背景噪声进行采样。例如,可以至少部分地基于音频内容的响度在对应于相应时间段的多个时间实例处小于规定响度阈值来在该多个时间实例处执行对音频内容和背景噪声的采样。这些时间实例可能出现在音频内容的相对安静的部分期间,诸如当没有人说话时或在从一首歌到另一首歌的切换期间。根据该实施例,对于每个时间段执行步骤302;304;306;308;310、312或314;316;和318。进一步根据该实施例,流程图300的方法进一步包括
在另一示例实施例中,流程图300的方法包括图4的流程图400中示出的一个或多个步骤。如图4所示,流程图400的方法在步骤402处开始。在步骤402中,分析音频内容的音频简档。音频简档指示音频内容的标识该音频内容的(诸)音频属性。在示例实现中,确定逻辑732分析该音频简档。
在步骤404,至少部分地基于(诸)音频属性来确定要对音频内容和背景噪声进行采样的时间段。在示例实现中,确定逻辑732确定这些时间段。
在步骤406,在使用与音频内容相关联的软件应用时在这些时间段内对音频内容和背景噪声进行采样(例如,周期性地或连续地)。在示例实现中,确定逻辑732在这些时间段内对音频内容和背景噪声进行采样。
在又一示例实施例中,音频内容的响度至少部分地基于该音频内容的音频简档来设置。例如,音频简档可被用于限定音频内容的响度。
根据图4的实施例,对于每个时间段执行流程图300的步骤302;304;306;308;310、312或314;316;和318。
在另一示例实施例中,流程图300的步骤302可以用图5的流程图500中示出的一个或多个步骤来替代。如图5所示,流程图500的方法在步骤502处开始。在步骤502中,检测到包括扬声器的用户设备的用户从与第一软件应用交互切换到与第二软件应用交互。在示例实现中,确定逻辑732检测到用户设备的用户从与第一软件应用交互切换到与第二软件应用交互。
在步骤504,至少部分地基于检测到用户从与第一软件应用交互切换至与第二软件应用交互而对音频内容和背景噪声进行采样。例如,用户从与第一软件应用切换至与第二软件应用交互可触发对音频内容和背景噪声的采样。在示例实现中,确定逻辑732至少部分地基于该检测来对音频内容和背景噪声进行采样。
在步骤506,至少部分地基于音频内容和背景噪声被采样来确定响度差。在示例实现中,确定逻辑732确定该响度差。
在另一示例实施例中,流程图300的步骤302可以用图6的流程图600中示出的一个或多个步骤来替代。如图6所示,流程图600的方法在步骤602处开始。在步骤602,检测到包括扬声器的用户设备的用户将该用户设备上的音量控制从第一音量设置改为第二音量设置。在示例实现中,确定逻辑732检测到用户设备的用户将该用户设备上的音量控制从第一音量设置改为第二音量设置。
在步骤604,至少部分地基于检测到用户改变用户设备上的音量控制而对音频内容和背景噪声进行采样。例如,用户改变用户设备上的音量控制可触发对音频内容和背景噪声的采样。在示例实现中,确定逻辑732至少部分地基于该检测来对音频内容和背景噪声进行采样。
在步骤606,至少部分地基于音频内容和背景噪声被采样来确定响度差。在示例实现中,确定逻辑732确定该响度差。
将领会,自适应调制器700可以不包括确定逻辑732、比较逻辑734、选择逻辑736和/或调制逻辑738中的一个或多个。此外,自适应调制器700可以包括作为对确定逻辑732、比较逻辑734、选择逻辑736和/或调制逻辑738的补充或替代的组件。
图8是示例性移动设备800的系统图,该移动设备包括各种任选的硬件和软件组件,并在802处概括地示出。该移动设备中的任何组件702可与任何其他组件通信,但出于容易例示的目的而未示出所有连接。移动设备800可以是各种计算设备(例如,蜂窝电话、智能电话、手持式计算机、个人数字助理(PDA)等)中的任一者,并且可允许与一个或多个移动通信网络804(诸如蜂窝或卫星网络)或者与局域网或广域网进行无线双向通信。
移动设备800可包括用于执行如信号编码、数据处理、输入/输出处理、电源控制、和/或其他功能等任务的处理器810(例如,信号处理器、微处理器、ASIC、或其他控制和处理逻辑电路系统)。操作系统812可控制对组件802的分配和使用,并支持一个或多个应用814(又称应用程序)。应用814可包括常见移动计算应用(例如,电子邮件应用、日历、联系人管理器、web浏览器、消息接发应用)和任何其他计算应用(例如,文字处理应用、测绘应用、媒体播放器应用)。
移动设备800可包括存储器820。存储器820可包括不可移动存储器822和/或可移动存储器824。不可移动存储器822可包括RAM、ROM、闪存存储器、硬盘、或其他公知的存储器存储技术。可移动存储器824可包括闪存存储器或订户身份模块(SIM)卡(其在GSM通信系统中是公知的)、或者其他公知的存储器存储技术(诸如“智能卡”)。存储器820可存储供运行操作系统812和应用814的数据和/或代码。示例数据可包括要经由一个或多个有线或无线网络被发送至和/或接收自一个或多个网络服务器或其他设备的网页、文本、图像、声音文件、视频数据或者其他数据集。存储器820可存储诸如国际移动订户身份(IMSI)等订户标识符、以及诸如国际移动装备标识符(IMEI)等装备标识符。此类标识符可被传送至网络服务器以标识用户和装备。
移动设备800可支持诸如触摸屏832、麦克风834、相机836、物理键盘838和/或轨迹球840等一个或多个输入设备830,以及诸如扬声器852和显示器854等一个或多个输出设备850。触摸屏(诸如触摸屏832)可按不同方式来检测输入。例如,电容式触摸屏在对象(例如,指尖)使流过表面的电流失真或中断时检测到触摸输入。作为另一示例,触摸屏可使用光学传感器,以在来自光学传感器的波束被中断时检测到触摸输入。对于通过某些触摸屏被检测到的输入来说,与屏幕表面的物理接触并不是必需的。例如,触摸屏832可使用电容感测来支持手指悬停检测,如本领域中众所周知的。其他检测技术可被使用,包括但不限于基于相机的检测和基于超声的检测。为了实现手指悬停,用户的手指通常在触摸屏上方预定间隔距离内,诸如在0.1至0.25英寸之间、或0.25至0.5英寸之间、或0.5至0.75英寸之间、或0.75至1英寸之间、或1至1.5英寸之间,等等。
移动设备800可包括自适应调制处理器892。该自适应调制处理器892被配置成根据本文描述的技术中的任一种或多种技术基于背景噪声来自适应地调制音频内容。
其他可能的输出设备(未示出)可包括压电或其他触觉输出设备。一些设备可供应不止一个输入/输出功能。例如,触摸屏832和显示器854可被组合在单个输入/输出设备中。输入设备830可包括自然用户界面(NUI)。NUI是使得用户能以“自然”方式与设备交互、免受诸如鼠标、键盘、远程控件等输入设备所施加的人工约束的任何界面技术。NUI方法的示例包括依赖于语音识别、触摸和触控笔识别、屏幕上及毗邻屏幕的姿势识别、隔空姿势、头部和眼睛跟踪、话音和语音、视觉、触摸、姿势以及机器智能的那些方法。NUI的其他示例包括使用加速度计/陀螺仪的运动姿势检测、面部识别、3D显示器、头部、眼睛和视线跟踪、沉浸式增强现实和虚拟现实系统(所有这些都提供更自然的界面),以及用于使用电场感测电极来感测脑部活动(EEG及相关方法)的技术。由此,在一特定示例中,操作系统812或应用814可包括作为允许用户经由语音命令来操作移动设备800的语音控制界面的一部分的语音识别软件。此外,移动设备800可包括虑及经由用户的空间姿势进行用户交互(诸如检测和解读姿势以向游戏应用提供输入)的输入设备和软件。
无线调制解调器860可被耦合至(诸)天线(未示出),并且可支持处理器810与外部设备间的双向通信,如本领域中众所周知的。(诸)调制解调器860被一般化地示出,并且可包括用于与移动通信网络804和/或其他基于无线电的调制解调器(例如,蓝牙864和/或Wi-Fi 862)进行通信的蜂窝调制解调器866。(诸)无线调制解调器860的至少一者通常被配置成用于与一个或多个蜂窝网络(诸如,用于在单个蜂窝网络内、蜂窝网络之间、或移动设备与公共交换电话网(PSTN)之间的数据和语音通信的GSM网络)进行通信。
移动设备可进一步包括至少一个输入/输出端口880、电源882、卫星导航系统接收机884(诸如全球定位系统(GPS)接收机)、加速度计886、和/或物理连接器890,该物理连接器可以是USB端口、IEEE 1394(火线)端口、和/或RS-232端口。所解说的组件802并非是必需或者涵盖全部的,因为如本领域技术人员所认识到的,任何组件均可被删除且其他组件可被添加。
虽然为方便呈现起见所公开的方法的一些操作是以特定的顺序次序来描述的,但应当理解,这一描述方法涵盖重新排列,除非本文阐明的具体语言要求特定排序。例如,顺序地描述的操作可在一些情形中被重新排列或被并发地执行。而且,为简洁起见,附图可能没有示出其中所公开的方法可以与其他方法相结合地使用的各种方式。
自适应调制处理器104、回声消除器112、长期水平分析器114、自适应调制器116、动态范围分析器118、DAC 106、放大器108、自适应调制器700、确定逻辑732、比较逻辑734、选择逻辑736、调制逻辑738、流程图300、流程图400、流程图500和/或流程图600中的任一者或多者可以用硬件、软件、固件或其任意组合来实现。
例如,自适应调制处理器104、回声消除器112、长期水平分析器114、自适应调制器116、动态范围分析器118、DAC 106、放大器108、自适应调制器700、确定逻辑732、比较逻辑734、选择逻辑736、调制逻辑738、流程图300、流程图400、流程图500和/或流程图600中的任一者或多者可以至少部分地被实现为被配置成在一个或多个处理器中执行的计算机程序代码。
在另一示例中,自适应调制处理器104、回声消除器112、长期水平分析器114、自适应调制器116、动态范围分析器118、DAC 106、放大器108、自适应调制器700、确定逻辑732、比较逻辑734、选择逻辑736、调制逻辑738、流程图300、流程图400、流程图500和/或流程图600中的任一者或多者可以至少部分地被实现为硬件逻辑/电路系统。此类硬件逻辑/电路系统可包括一个或多个硬件逻辑组件。硬件逻辑组件的示例包括但不限于现场可编程门阵列(FPGA)、专用集成电路(ASIC)、因应用而异的标准产品(ASSP)、片上系统系统(SoC)、复杂可编程逻辑器件(CPLD)等。例如,SoC可包括集成电路芯片,该集成电路芯片包括以下一个或多个:处理器(如微控制器、微处理器、数字信号处理器(DSP)等等)、存储器、一个或多个通信接口、和/或用于执行其功能的其他电路和/或嵌入的固件。
III.一些示例实施例的进一步讨论
(A1)一种示例电子设备(图1,100;图8,800;图8,800)包括扬声器(图1,110)、麦克风(图1,102)和控制器(图1,104;图7,700;图8,892)。该扬声器被配置成输出音频内容(图1,130)。该麦克风被配置成接收背景噪声(图1,120)和该音频内容。该控制器耦合到该扬声器和该麦克风。该控制器被配置成确定(图3,302)该音频内容的响度和该背景噪声的响度之间的响度差。该控制器被进一步配置成将该音频内容的响度与上限响度阈值进行比较(图3,304)。该控制器被进一步配置成基于该响度差和该比较中的至少一者来从多个调制中选择(图3,310、312或314)调制。将根据响度差小于阈值差并且音频内容的响度小于上限响度阈值来选择第一调制。将根据响度差大于或等于阈值差并且音频内容的响度小于上限响度阈值来选择第二调制。将根据音频内容的响度大于或等于上限响度阈值来选择第三调制。该控制器被进一步配置成使用所选调制来调制(图3,316)后续输出的音频内容。
(A2)在A1的电子设备中,其中所述音频内容包括对应于多个相应频率的多个音频分量;其中所述第一调制被配置成将所述音频内容压缩超过上限阈值压缩量;其中所述第二调制被配置成将所述音频内容压缩小于下限阈值压缩量,所述下限阈值压缩量小于或等于所述上限阈值压缩量;并且其中所述第三调制被配置成基于所述音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高所述第一子集的响度并且进一步基于所述音频分量的第二子集中的每个音频分量具有大于或等于所述下限响度阈值来降低所述第二子集的响度。
(A3)在A1-A2中的任一项所述的电子设备中,其中所述第一调制被进一步配置成响应于所述音频内容被压缩,使用自动增益控制来将所述音频内容的响度改为基本上等于所述扬声器的通带中的指定频率范围中的目标响度。
(A4)在A1-A3中的任一项所述的电子设备中,其中所述第一调制被配置成在所述扬声器的通带中的指定频率范围内将所述音频内容压缩大于所述上限阈值压缩量;并且其中所述上限阈值压缩量大于或等于1.4。
(A5)在A1-A4中的任一项所述的电子设备中,其中所述上限阈值压缩量大于或等于2.0。
(A6)在A1-A5中的任一项所述的电子设备中,其中所述第二调制被配置成在所述扬声器的通带中的指定频率范围内将所述音频内容压缩小于所述下限阈值压缩量;并且其中所述下限阈值压缩量小于或等于1.4。
(A5)在A1-A6中的任一项所述的电子设备中,其中所述下限阈值压缩量小于或等于1.2。
(A8)在A1-A7中的任一项所述的电子设备中,其中所述第二调制被配置成不在所述扬声器的通带中的指定频率范围内压缩所述音频内容。
(A9)在A1-A8中的任一项所述的电子设备中,其中所述第三调制被配置成至少部分地基于所述音频分量的第二子集中的每一个音频分量具有大于或等于所述下限响度阈值的响度而不改变所述第二子集的响度。
(A10)在A1-A9中的任一项所述的电子设备中,其中所述第一调制被配置成通过至少部分地基于所述音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高所述指定子集的响度来压缩所述音频内容。
(A11)在A1-A10中的任一项所述的电子设备中,其中所述第一调制被配置成通过至少部分地基于所述音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低所述规定子集的响度来压缩所述音频内容。
(A12)在A1-A11中的任一项所述的电子设备中,其中所述第一调制被配置成通过以下操作来压缩所述音频内容:至少部分地基于所述音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高所述指定子集的响度并且还至少部分地基于所述音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低所述规定子集的响度。
(A13)如A1-A12中的任一项所述的电子设备,其中所述控制器被配置成:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及进一步基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来选择所述调制。
(A14)如A1-A13中的任一项所述的电子设备,其中所述控制器被配置成:分析所述音频内容的类型;以及进一步基于所述音频内容的类型来选择所述调制。
(A15)如A1-A14中的任一项所述的电子设备,其中所述控制器被配置成:确定所述电子设备的类型;以及进一步基于所述电子设备的类型来选择所述调制。
(A16)如A1-A15中的任一项所述的电子设备,其中所述控制器被配置成:在与所述音频内容相关联的软件应用在使用时在多个时间段内周期性地对所述音频内容和所述背景噪声进行采样;以及对于所述多个时间段中的每一个时间段,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(A17)如A1-A16中的任一项所述的电子设备,其中所述控制器被进一步配置成:分析音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及至少部分地基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来确定要对所述音频内容和所述背景噪声进行采样的所述多个时间段。
(A18)如A1-A17中的任一项所述的电子设备,其中所述控制器被配置成:至少部分地基于所述音频内容的响度在对应于所述多个相应时间段的多个时间实例处小于规定响度阈值来在所述多个时间实例处对所述音频内容和所述背景噪声进行采样。
(A18)如A1-A18中的任一项所述的电子设备,其中所述控制器被配置成:对所述音频内容和所述背景噪声中的每一者的多个频带进行采样;以及
对于所述多个频带中的每一个频带,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(A20)如A1-A19中的任一项所述的电子设备,其中所述控制器被配置成:检测到所述电子设备的用户从与第一软件应用交互切换至与第二软件应用交互;基于检测到所述用户从与所述第一软件应用交互切换至与所述第二软件应用交互而对所述音频内容和所述背景噪声进行采样;以及基于所述音频内容和所述背景噪声被采样来确定所述响度差。
(A21)如A1-A20中的任一项所述的电子设备,其中所述控制器被配置成:检测到所述电子设备的用户将所述电子设备上的音量控制从第一音量设置改为第二音量设置;至少部分地基于检测到所述用户改变所述电子设备上的音量控制而对所述音频内容和所述背景噪声进行采样;以及基于所述音频内容和所述背景噪声被采样来确定所述响度差。
(A22)如A1-A21中的任一项所述的电子设备,其中所述控制器被配置成:在对应于多个相应时间段的多个时间实例处周期性地对所述音频内容和所述背景噪声进行采样,其中每个时间段的持续时间是可调的,以使得每个时间段的持续时间随着所述背景噪声的响度的变化速率减小而增加,并且还使得每个时间周期的持续时间随着所述背景噪声的响度的变化速率增大而减少;以及对于所述多个时间段中的每一个时间段,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(A23)如A1-A22中的任一项所述的电子设备,其中所述控制器被配置成:分析与所述音频内容相关联的软件应用的响度简档,所述响度简档指示由所述软件应用为由所述软件应用处理的音频内容中的多个相应频率标定的多个响度值;以及进一步基于由所述软件应用的所述响度简档指示的所述多个响度设置来选择所述调制。
(A24)如A1-A23中的任一项所述的电子设备,其中所述控制器被配置成:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及选择所述调制以设置所述音频内容的响度以使得所述音频内容的响度至少部分地基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性。
(B1)一种方法(图3,300)包括:确定(图3,302)扬声器(图1,110)输出的音频内容(图1,130)的响度与背景噪声(图1,120)的响度之间的响度差;将所述音频内容的响度与上限响度阈值进行比较(图3,304);
基于所述响度差或所述比较中的至少一者来从多个调制中选择(图3,310、312或314)调制,其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及使用所选调制来调制(图3,316)后续输出的音频内容。
(B2)在B1的方法中,其中所述音频内容包括对应于多个相应频率的多个音频分量;其中所述第一调制被配置成将所述音频内容压缩超过上限阈值压缩量;其中所述第二调制被配置成将所述音频内容压缩小于下限阈值压缩量,所述下限阈值压缩量小于或等于所述上限阈值压缩量;并且其中所述第三调制被配置成基于所述音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高所述第一子集的响度并且进一步基于所述音频分量的第二子集中的每个音频分量具有大于或等于所述下限响度阈值来降低所述第二子集的响度。
(B3)在B1-B2中的任一项所述的方法中,其中所述第一调制被进一步配置成响应于所述音频内容被压缩,使用自动增益控制来将所述音频内容的响度改为基本上等于所述扬声器的通带中的指定频率范围中的目标响度。
(B4)在B1-B3中的任一项所述的方法中,其中所述第一调制被配置成在所述扬声器的通带中的指定频率范围内将所述音频内容压缩大于所述上限阈值压缩量;并且其中所述上限阈值压缩量大于或等于1.4。
(B5)在B1-B4中的任一项所述的方法中,其中所述上限阈值压缩量大于或等于2.0。
(B6)在B1-B5中的任一项所述的方法中,其中所述第二调制被配置成在所述扬声器的通带中的指定频率范围内将所述音频内容压缩小于所述下限阈值压缩量;并且其中所述下限阈值压缩量小于或等于1.4。
(B7)在B1-B6中任一项所述的方法中,其中所述下限阈值压缩量小于或等于1.2。
(B8)在B1-B7中的任一项所述的方法中,其中所述第二调制被配置成不在所述扬声器的通带中的指定频率范围内压缩所述音频内容。
(B9)在B1-B8中的任一项所述的方法中,其中所述第三调制被配置成至少部分地基于所述音频分量的第二子集中的每一个音频分量具有大于或等于所述下限响度阈值的响度而不改变所述第二子集的响度。
(B10)在B1-B9中的任一项所述的方法中,其中所述第一调制被配置成通过至少部分地基于所述音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高所述指定子集的响度来压缩所述音频内容。
(B11)在B1-B10中的任一项所述的方法中,其中所述第一调制被配置成通过至少部分地基于所述音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低所述规定子集的响度来压缩所述音频内容。
(B12)在B1-B11中的任一项所述的方法中,其中所述第一调制被配置成通过以下操作来压缩所述音频内容:至少部分地基于所述音频分量的指定子集中的每一个音频分量具有小于指定响度阈值的响度而提高所述指定子集的响度并且还至少部分地基于所述音频分量的规定子集中的每一个音频分量具有大于或等于规定响度阈值的响度而降低所述规定子集的响度。
(B13)在B1-B12中的任一项所述的方法中,进一步包括:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;其中选择所述调制包括进一步基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来选择所述调制。
(B14)在B1-B13中的任一项所述的方法中,进一步包括:分析所述音频内容的类型;其中选择所述调制包括进一步基于所述音频内容的类型来选择所述调制。
(B15)在B1-B14中的任一项所述的方法中,进一步包括:确定包括所述扬声器的设备的类型;其中选择所述调制包括进一步基于包括所述扬声器的所述设备的类型来选择所述调制。
(B16)在B1-B15中的任一项所述的方法中,进一步包括:在与所述音频内容相关联的软件应用在使用时在多个时间段内周期性地对所述音频内容和所述背景噪声进行采样;其中对于所述多个时间段中的每一个时间段执行以下操作:确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(B17)在B1-B16中的任一项所述的方法中,进一步包括:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及至少部分地基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来确定要对所述音频内容和所述背景噪声进行采样的所述多个时间段。
(B18)在B1-B17中的任一项所述的方法中,其中对所述音频内容和所述背景噪声进行采样包括:至少部分地基于所述音频内容的响度在对应于所述多个相应时间段的多个时间实例处小于规定响度阈值来在所述多个时间实例处对所述音频内容和所述背景噪声进行采样。
(B19)在B1-B18中的任一项所述的方法中,进一步包括:对所述音频内容和所述背景噪声中的每一者的多个频带进行采样;其中对于所述多个频带中的每一个频带执行以下操作:确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(B20)在B1-B19中的任一项所述的方法中,进一步包括:检测到包括所述扬声器的用户设备的用户从与第一软件应用交互切换至与第二软件应用交互;以及基于检测到所述用户从与所述第一软件应用交互切换至与所述第二软件应用交互而对所述音频内容和所述背景噪声进行采样;其中确定所述响度差包括基于对所述音频内容和所述背景噪声进行采样来确定所述响度差。
(B21)在B1-B20中的任一项所述的方法中,进一步包括:检测到包括所述扬声器的用户设备的用户将所述用户设备上的音量控制从第一音量设置改为第二音量设置;以及至少部分地基于检测到所述用户改变所述用户设备上的音量控制而对所述音频内容和所述背景噪声进行采样;其中确定所述响度差包括基于对所述音频内容和所述背景噪声进行采样来确定所述响度差。
(B22)在B1-B21中的任一项所述的方法中,进一步包括:在对应于多个相应时间段的多个时间实例处周期性地对所述音频内容和所述背景噪声进行采样;其中每个时间段的持续时间是可调的,以使得每个时间段的持续时间随着所述背景噪声的响度的变化速率减小而增加,并且还使得每个时间周期的持续时间随着所述背景噪声的响度的变化速率增大而减少;并且其中对于所述多个时间段中的每一个时间段执行以下操作:确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
(B23)在B1-B22中的任一项所述的方法中,进一步包括:分析与所述音频内容相关联的软件应用的响度简档,所述响度简档指示由所述软件应用为由所述软件应用处理的音频内容中的多个相应频率标定的多个响度值;其中选择所述调制包括进一步基于由所述软件应用的所述响度简档指示的所述多个响度设置来选择所述调制。
(B24)在B1-B23中的任一项所述的方法中,进一步包括:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;其中选择所述调制包括选择所述调制以设置所述音频内容的响度以使得所述音频内容的响度至少部分地基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性。
(C1)一种计算机程序产品,包括其上记录有用于使基于处理器的系统能够执行操作的指令的计算机可读存储介质,所述操作包括:确定由扬声器输出的音频内容的响度和背景噪声的响度之间的响度差;将所述音频内容的响度与上限响度阈值进行比较;基于所述响度差或所述比较中的至少一者来从多个调制中选择调制,其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及使用所选调制来调制后续输出的音频内容。
IV.示例计算机系统
图9描绘其中可实现各实施例的示例计算机900。图1中所示的电子设备100可以使用计算机900来实现,包括计算机900的一个或多个特征和/或替代特征。计算机900可以是例如常规个人计算机、移动计算机或工作站形式的通用计算设备,或者计算机900可以是专用计算设备。此处所提供的对计算机900的描述只是为了说明,并不是限制性的。实施例也可以在相关领域的技术人员所知的其它类型的计算机系统中实现。
如图9所示,计算机900包括处理单元902、系统存储器904和总线906,总线904将包括系统存储器902在内的各种系统组件耦合到处理单元1002。总线906表示若干类型的总线结构中的任何总线结构中的一个或多个,包括存储器总线或存储器控制器、外围总线、加速图形端口,以及处理器或使用各种总线体系结构中的任一种的局部总线。系统存储器904包括只读存储器(ROM)908和随机存取存储器(RAM)910。基本输入/输出系统912(BIOS)被存储在ROM 908中。
计算机900还具有一个或多个以下驱动器:用于读写硬盘的硬盘驱动器914、用于读或写可移动磁盘918的磁盘驱动器916、以及用于读或写诸如CD ROM、DVD ROM或其他光介质之类的可移动光盘922的光盘驱动器920。硬盘驱动器914、磁盘驱动器916、以及光盘驱动器920分别通过硬盘驱动器接口924、磁盘驱动器接口926、以及光盘驱动器接口928连接至总线906。驱动器及其相关联的计算机可读存储介质为计算机提供了对计算机可读指令、数据结构、程序模块及其他数据的非易失性存储。虽然描述了硬盘、可移动磁盘和可移动光盘,但是其他类型的计算机可读存储介质也可被用来存储数据,诸如闪存卡、数字视频盘、随机存取存储器(RAM)、只读存储器(ROM)等等。
数个程序模块可被存储在硬盘、磁盘、光盘、ROM或RAM上。这些程序包括操作系统930、一个或多个应用程序932、其他程序模块934以及程序数据936。应用程序932或程序模块934可以包括例如用于实现如本文描述的以下各项中的任一者或多者(例如,至少其一部分)的计算机程序逻辑:自适应调制处理器104、回声消除器112、长期水平分析器114、自适应调制器116、动态范围分析器118、DAC 106、放大器108、自适应调制器700、确定逻辑732、比较逻辑734和/或其他逻辑中的任何一个或多个(例如,如本文所述,选择逻辑736、调制逻辑738、流程图300(包括流程图300的任何步骤)、流程图400(包括流程400的任何步骤、流程图500(包括流程500的任意步骤)和/或流程图600(包括流程600的任何步骤)。
用户可通过诸如键盘938和定点设备940等输入设备来将命令和信息输入到计算机900中。其他输入设备(未示出)可包括麦克风、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、触敏屏、相机、加速度计、陀螺仪等等。这些及其他输入设备常常通过耦合至总线906的串行端口接口942来被连接到处理单元902,但是也可通过其他接口(诸如并行端口、游戏端口、或通用串行总线(USB))来进行连接。
显示设备944(例如监视器)也经由接口(诸如视频适配器946)连接至总线906。除了显示设备944之外,计算机900还可包括其他外围输出设备(未示出),诸如扬声器和打印机。
计算机900通过网络接口或适配器950、调制解调器952、或用于通过网络建立通信的其他装置来被连接到网络948(例如,因特网)。调制解调器952(其可以是内置的或外置的)经由串行端口接口942来被连接到总线906。
如本文中所使用的,术语“计算机程序介质”以及“计算机可读存储介质”用于泛指介质(例如非瞬态介质),诸如与硬盘驱动器914相关联的硬盘、可移动磁盘918、可移动光盘922、以及其他介质,诸如闪存卡、数字视频盘、随机存取存储器(RAM)、只读存储器(ROM)等等。计算机可读存储介质不是信号,诸如载波信号或传播信号。例如,计算机可读存储介质可以不包括信号。因此,计算机可读存储介质本身不构成信号。计算机可读存储介质与通信介质相区别且不交叠(不包括通信介质)。通信介质在诸如载波等已调制数据信号中承载计算机可读指令、数据结构、程序模块或其他数据。术语“已调制数据信号”意指以在信号中对信息进行编码的方式来使其一个或多个特性被设置或改变的信号。作为示例而非限制,通信介质包括无线介质(诸如声学、RF、红外和其他无线介质)以及有线介质。各示例实施例也针对这些通信介质。
如上文所指示的,计算机程序和模块(包括应用程序932及其他程序模块934)可被存储在硬盘、磁盘、光盘、ROM或RAM上。此类计算机程序也可经由网络接口950或串行端口接口942来接收。此类计算机程序在由应用执行或加载时使计算机900能够实现本文中所讨论的各实施例的特征。相应地,此类计算机程序表示计算机900的控制器。
示例实施例还涉及包括存储在任何计算机可用介质上的软件(例如计算机可读指令)的计算机程序产品。这样的软件当在一个或多个数据处理设备中执行时致使(诸)数据处理设备如本文中所描述的那样操作。各实施例可采用现在已知或将来知晓的任何计算机可用或计算机可读介质。计算机可读介质的示例包括但不仅限于,诸如RAM、硬盘驱动器、软盘、CD ROM、DVD ROM、zip盘、磁带、磁存储设备、光存储设备、基于MEMS的存储设备、基于纳米技术的存储设备等等之类的存储设备。
将认识到,所公开的技术不限于任何特定计算机或硬件类型。适当的计算机和硬件的特定细节是公知的,并且不需要在本公开中详细阐述。
V.结论
以上详细描述参考解说本发明的示例性实施例的附图。然而,本发明的范围不限于这些实施例,而是由所附权利要求书定义。因而,在附图所示之外的实施例(诸如所解说的实施例的经修改版本)仍可被本发明所涵盖。
本说明书中对“一个实施例”、“一实施例”、“示例实施例”等的述及指示所描述的实施例可包括特定特征、结构或特性,但并非每一实施例都有必要包括该特定特征、结构或特性。此外,这些短语不一定指相同的实施例。此外,当结合实施例描述具体特征、结构或特性时,应当理解在相关领域的技术人员的知识范围内能够结合其他实施例来实现具体特征、结构或特性,无论是否被显式地描述。
诸如“第一”、“第二”、“第三”等描述符用于述及本文中所讨论的一些元素。此类描述符被用来促成示例实施例的讨论,而并不指示所述及元素之必需的顺序,除非在本文中做出了要求此种顺序的肯定声明。
虽然已用结构特征和/或动作专用的语言描述了本主题,但应当理解,所附权利要求书中限定的主题不必限于以上所描述的具体特征或动作。相反,上述特定特征和动作是作为实现权利要求书的示例而公开的,并且其他等价特征和动作旨在处于权利要求书的范围内。
Claims (15)
1.一种电子设备,包括:
被配置成输出音频内容的扬声器;
被配置成接收背景噪声和所述音频内容的麦克风;以及
耦合到所述扬声器和所述麦克风的控制器,所述控制器被配置成:
确定所述音频内容的响度和所述背景噪声的响度之间的响度差;
将所述音频内容的响度与上限响度阈值进行比较;
基于所述响度差或所述比较中的至少一者来从多个调制中选择调制,
其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,
其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且
其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及
使用所选调制来调制后续输出的音频内容。
2.如权利要求1所述的电子设备,其中所述音频内容包括对应于多个相应频率的多个音频分量;
其中所述第一调制被配置成将所述音频内容压缩超过上限阈值压缩量;
其中所述第二调制被配置成将所述音频内容压缩小于下限阈值压缩量,所述下限阈值压缩量小于或等于所述上限阈值压缩量;并且
其中所述第三调制被配置成基于所述音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高所述第一子集的响度并且进一步基于所述音频分量的第二子集中的每个音频分量具有大于或等于所述下限响度阈值来降低所述第二子集的响度。
3.如权利要求2所述的电子设备,其中所述第一调制被进一步配置成响应于所述音频内容被压缩,使用自动增益控制来将所述音频内容的响度改为基本上等于所述扬声器的通带中的指定频率范围中的目标响度。
4.如权利要求2所述的电子设备,其中所述第二调制被配置成不在所述扬声器的通带中的指定频率范围内压缩所述音频内容。
5.如权利要求2所述的电子设备,其中所述第三调制被配置成至少部分地基于所述音频分量的所述第二子集中的每一个音频分量具有大于或等于所述下限响度阈值的响度而不改变所述第二子集的响度。
6.如权利要求1所述的电子设备,其中所述控制器被配置成:
分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及
进一步基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来选择所述调制。
7.如权利要求1所述的电子设备,其中所述控制器被配置成:
分析所述音频内容的类型;以及
进一步基于所述音频内容的类型来选择所述调制。
8.如权利要求1所述的电子设备,其中所述控制器被配置成:
确定所述电子设备的类型;以及
进一步基于所述电子设备的类型来选择所述调制。
9.如权利要求1所述的电子设备,其中所述控制器被配置成:
在与所述音频内容相关联的软件应用在使用时在多个时间段内周期性地对所述音频内容和所述背景噪声进行采样;以及
对于所述多个时间段中的每一个时间段,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
10.如权利要求9所述的电子设备,其中所述控制器被进一步配置成:
分析音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及
至少部分地基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来确定要对所述音频内容和所述背景噪声进行采样的所述多个时间段。
11.如权利要求9所述的电子设备,其中所述控制器被配置成:
至少部分地基于所述音频内容的响度在对应于所述多个相应时间段的多个时间实例处小于规定响度阈值来在所述多个时间实例处对所述音频内容和所述背景噪声进行采样。
12.如权利要求1所述的电子设备,其中所述控制器被配置成:
对所述音频内容和所述背景噪声中的每一者的多个频带进行采样;以及
对于所述多个频带中的每一个频带,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调制后续输出的音频内容。
13.一种方法,包括:
确定由扬声器输出的音频内容的响度和背景噪声的响度之间的响度差;
将所述音频内容的响度与上限响度阈值进行比较;
基于所述响度差或所述比较中的至少一者来从多个调制中选择调制,
其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,
其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且
其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及
使用所选调制来调制后续输出的音频内容。
14.如权利要求13所述的方法,其中所述音频内容包括对应于多个相应频率的多个音频分量;
其中所述第一调制被配置成将所述音频内容压缩超过上限阈值压缩量;
其中所述第二调制被配置成将所述音频内容压缩小于下限阈值压缩量,所述下限阈值压缩量小于或等于所述上限阈值压缩量;并且
其中所述第三调制被配置成基于所述音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高所述第一子集的响度并且进一步基于所述音频分量的第二子集中的每个音频分量具有大于或等于所述下限响度阈值来降低所述第二子集的响度。
15.一种计算机程序产品,包括其上记录有用于使基于处理器的系统能够执行操作的指令的计算机可读存储介质,所述操作包括:
确定由扬声器输出的音频内容的响度和背景噪声的响度之间的响度差;
将所述音频内容的响度与上限响度阈值进行比较;
基于所述响度差或所述比较中的至少一者来从多个调制中选择调制,
其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,
其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且
其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及
使用所选调制来调制后续输出的音频内容。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/892,250 US11288036B2 (en) | 2020-06-03 | 2020-06-03 | Adaptive modulation of audio content based on background noise |
US16/892,250 | 2020-06-03 | ||
PCT/US2021/025692 WO2021247135A1 (en) | 2020-06-03 | 2021-04-05 | Adaptive modulation of audio content based on background noise |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115699570A true CN115699570A (zh) | 2023-02-03 |
Family
ID=75660378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180040626.3A Pending CN115699570A (zh) | 2020-06-03 | 2021-04-05 | 基于背景噪声的音频内容的自适应调制 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11288036B2 (zh) |
EP (1) | EP4162607A1 (zh) |
CN (1) | CN115699570A (zh) |
WO (1) | WO2021247135A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190207A (zh) * | 2021-04-26 | 2021-07-30 | 北京小米移动软件有限公司 | 信息处理方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2809894C (en) | 2001-06-27 | 2017-12-12 | Skky Incorporated | Improved media delivery platform |
US7333618B2 (en) | 2003-09-24 | 2008-02-19 | Harman International Industries, Incorporated | Ambient noise sound level compensation |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
BRPI0518278B1 (pt) | 2004-10-26 | 2018-04-24 | Dolby Laboratories Licensing Corporation | Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio |
KR101137359B1 (ko) | 2006-09-14 | 2012-04-25 | 엘지전자 주식회사 | 다이알로그 증폭 기술 |
US20130136282A1 (en) | 2011-11-30 | 2013-05-30 | David McClain | System and Method for Spectral Personalization of Sound |
US9344793B2 (en) | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Audio apparatus and methods |
EP2838196B1 (en) | 2013-08-12 | 2023-04-26 | Bellevue Investments GmbH & Co. KGaA | System and method for controlled dynamics adaptation for musical content |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
US20150281830A1 (en) | 2014-03-26 | 2015-10-01 | Bose Corporation | Collaboratively Processing Audio between Headset and Source |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
-
2020
- 2020-06-03 US US16/892,250 patent/US11288036B2/en active Active
-
2021
- 2021-04-05 CN CN202180040626.3A patent/CN115699570A/zh active Pending
- 2021-04-05 EP EP21721323.0A patent/EP4162607A1/en active Pending
- 2021-04-05 WO PCT/US2021/025692 patent/WO2021247135A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20210382679A1 (en) | 2021-12-09 |
EP4162607A1 (en) | 2023-04-12 |
US11288036B2 (en) | 2022-03-29 |
WO2021247135A1 (en) | 2021-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102371004B1 (ko) | 오디오 신호 처리 방법 및 이를 지원하는 전자 장치 | |
US11251763B2 (en) | Audio signal adjustment method, storage medium, and terminal | |
US9894441B2 (en) | Method and apparatus for customizing audio signal processing for a user | |
CN107509153B (zh) | 声音播放器件的检测方法、装置、存储介质及终端 | |
US9515627B2 (en) | Devices and methods for audio volume adjustment | |
CN106782613B (zh) | 信号检测方法及装置 | |
CN106791067B (zh) | 一种通话音量调节方法、装置及移动终端 | |
US10461712B1 (en) | Automatic volume leveling | |
CN109817241B (zh) | 音频处理方法、装置及存储介质 | |
US11039246B2 (en) | Volume adjusting method, device, and terminal device | |
CN107526570B (zh) | 音量调节方法、装置、终端设备及存储介质 | |
CN110599989B (zh) | 音频处理方法、装置及存储介质 | |
WO2019033943A1 (zh) | 音量调节方法、装置、移动终端及存储介质 | |
WO2019033942A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
US11934737B2 (en) | Smart background noise estimator | |
WO2019033441A1 (zh) | 音量调节方法、装置、移动终端及存储介质 | |
CN110675848A (zh) | 音频处理方法、装置及存储介质 | |
WO2019033941A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
US11288036B2 (en) | Adaptive modulation of audio content based on background noise | |
CN107506168B (zh) | 音量调节方法、装置、终端设备及存储介质 | |
CN107483734B (zh) | 音量调节方法、装置、终端设备及存储介质 | |
WO2019033939A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
CN113990363A (zh) | 一种音频播放参数调整方法、装置、电子设备和存储介质 | |
CN110022514B (zh) | 音频信号的降噪方法、装置、系统及计算机存储介质 | |
CN110753919B (zh) | 音量调节方法、装置、存储介质及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |