CN107613429A - 音频安装的评估和调整 - Google Patents
音频安装的评估和调整 Download PDFInfo
- Publication number
- CN107613429A CN107613429A CN201610541425.2A CN201610541425A CN107613429A CN 107613429 A CN107613429 A CN 107613429A CN 201610541425 A CN201610541425 A CN 201610541425A CN 107613429 A CN107613429 A CN 107613429A
- Authority
- CN
- China
- Prior art keywords
- equipment
- audio signal
- audio
- environment
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本公开的示例实施例涉及针对音频环境的评估和调整。公开了一种计算机实施的方法。该方法包括获得由位于环境中的设备采集的第一音频信号。该方法还包括分析第一音频信号的特性以确定针对环境的声学性能度量。该方法进一步包括响应于声学性能度量低于阈值,基于第一音频信号的特性提供第一任务以供用户执行。第一任务与对环境的设置的调整有关。还公开了相应的系统和计算机程序产品。
Description
技术领域
本公开的示例实施例总体上涉及音频安装的评估和调整,并且更具体地,涉及用于评估和调整音频设备或音频设备所处的环境的方法和系统。
背景技术
音频设备、特别是便携式音频设备在各种环境中被使用以提供语音通信、诸如在该环境中采集音频和/或呈现从其他设备传达的音频。然而,这样的设备经受大范围的暴露和使用场景。除了音频设备本身的质量之外,音频性能的降级通常会由可能不容易被标识的特定环境中的问题而导致。这样的环境问题的示例包括但不限于设备附近的噪声或振动、设备的不良放置、问题声学反射、特别强的混响、设备附近的不牢固物体或异响的结构等等。
通常,音频通信系统可以具有输入音频处理组件,其负责尽可能移除不想要的噪声并且提高音频质量而不被用户所察觉。然而,旨在于消除问题和提高期望的音频输出的这样的音频处理也可能导致音频输出的某些降级。此外,音频设备可能在许多不同的环境中被使用。尽管设备制造商或工程师尝试设计能够通过音频处理的使用而在大范围的环境中均良好工作的音频设备;这些环境中总是存在某些潜在问题,这些问题对音频输入和/或输出具有危害并且可能无法仅仅通过音频处理而被单独地移除。
发明内容
本公开的示例实施例提出了一种用于音频安装的评估和调整的解决方案。
在一个方面,本公开的示例实施例提供了一种处理音频信号的方法。该方法包括获得由位于环境中的设备采集的第一音频信号。该方法还包括分析第一音频信号的特性以确定针对环境的声学性能度量。该方法进一步包括响应于声学性能度量低于阈值,基于第一音频信号的特性提供第一任务以供用户执行。第一任务与对环境的设置的调整有关。这方面的实施例还进一步提供相应的计算机程序产品。
在另一个方面,本公开的示例实施例提供了一种计算机实施的系统。该系统包括音频收集器,被配置为获得由位于环境中的设备采集的第一音频信号。该系统还包括处理单元,被配置为分析第一音频信号的特性以确定针对环境的声学性能度量。处理单元还被配置为响应于声学性能度量低于阈值,基于第一音频信号的特性提供第一任务以供用户执行。第一任务与对环境的设置的调整有关。
通过下文描述将会理解,根据本公开的示例实施例,针对设备所处环境的声学性能度量被确定以用于指示在这个环境中的音频活动是否能获得高质量,并且用户可以被提供任务用以执行,以便调整环境的设置。通过这个方式,在该环境中的音频活动的质量可以通过用户来提高而不需要设备的过度音频处理并且/或者不需要来自外部技术支持的协助。本公开的示例实施例所带来的其他益处将通过下文描述而清楚。
附图说明
通过参考附图阅读下文的详细描述,本公开的示例实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本公开的若干示例实施例,其中:
图1是根据本公开的一个示例实施例的评估架构的框图;
图2是根据本公开的一个示例实施例的环境和设备评估的过程的流程图;
图3是根据本公开的一个示例实施例的设备评估的过程的流程图;
图4是根据本公开的一个示例实施例的环境评估的过程的流程图;
图5是根据本公开的一个示例实施例的系统的框图;以及
图6是适于实现本公开的示例实施例的示例计算机系统的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例实施例来描述本公开的示例实施例的原理。应当理解,描述这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本公开的示例实施例,而并非以任何方式限制本公开的主题的范围。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等可以指的是不同或相同的对象。以下还可能包括明确或暗含的其他定义。
如以上所讨论的,在音频设备内执行的输入音频处理将导致对期望的音频输出的某些降级并且可能并非对该设备的所有可能的安装环境均是最优的。一些问题可能存在于音频设备被使用的环境中、例如在会议室中并且可能对由该设备采集或呈现的音频的质量具有影响。环境中的某些问题可能对用户而言不可听得见或者不是显而易见的,从而用户可能不能够主动地解决这些问题。通常,针对其中音频质量的降级已经成为问题的情况,克服不可听得见和被掩藏的问题的可能方法是呼叫支持中心或者请求专业技术人员进行现场声学咨询和评价,然而这些可能耗费时间且代价昂贵。此外,可能存在细微降级,其尽管不被认为是问题但是将会对许多用户的体验造成持续和不必要的降级。将期望自动地检测和解决环境中的潜在问题以便实现更号的音频性能和用户体验。
本文中公开的示例实施例提供了一种解决方案,用于评估音频设备所处的环境的声学性能,并且然后在所评估的声学性能指示该设备的音频活动在该环境中不适合时,为用户提供建议以调整环境的设置和/或设备的放置。在这些示例实施例中,在设备被安装的情况中评估声学性能,并且用户可以参与进来作为该过程的一部分以使得该环境更适于音频活动。通过这种方式,可以实现现场环境评估和调整,而不需要来自外部技术支持的协助。此外,通过将关心的用户结合到评估和补救过程中,这个方法能够解决某些不明确性并且避免了用于标识一般问题的原因和补救的复杂或过度的音频处理。因此,本文中公开的一些示例实施例涉及首先评估设备的完整性以便使用该设备作为探测和评估周围音频环境的手段。在一些另外的实施例中,可以评估设备的质量,并且如果必要的话,为用户提供建议用以修改设备的配置。
在一些实施例中,可以以如下方式远程地执行音频设备的环境评估:大量的处理和干扰被集中地执行并且可以使用来自当前设备和其他设备的数据。例如,可以提供具有评估环境和通过通信系统提供用于调整环境的建议的中央系统。需要测试安装环境是否适于音频活动的任何音频设备可以被连接到这个中央系统以获得所提供的服务。图1描绘了这样的用于评估环境的架构100。
如所示出的,音频设备101和102可以通过连接网络120连接至远程评估系统110。音频设备101和102可以被安装在相同或不同的环境中并且由相同或不同的设备操作。例如,在会议开始之前,用户可能想要测试会议室的环境是否适于使用音频设备101和102进行高质量的音频通信。音频设备101和102然后可以连接至远程评估系统110,该远程评估系统110被配置为评估会议室的声学性能是否适于音频采集和呈现。为了评估环境,评估系统110可以要求设备101和/或102通过连接网络120发送采集到的音频信号以供分析。在一些示例实施例中,在设备101或102的正常通信的情况中使用的同一网络可以被操作为连接网络120,以供来自设备安装环境的数据的传送和向用户返回指令/建议。
评估环境110可以被配置为基于环境评估结果来检测环境中对音频质量具有影响的任何问题。在确定(多个)问题时,评估系统110可以提供对应的任务以供用户执行,从而解决问题。该任务可以经由连接网络120被提供给设备101或102,从而用户可以采取特定动作来调整环境的设置和/或设备的放置,从而提升声学性能。通过这种方式,对于本地用户,现场环境评估和任务供应的交互将表现出类似于呼叫这样的专业技术人员的体验,该专业技术人员具有强大的能力来采取远程测量以便检测和建议针对该特定环境的调整。以下将更详细描述环境评估和任务供应。
在一些示例实施例中,历史评估结果和对应的任务可以被存储在针对特定设备、诸如设备101或102的数据库130中。评估系统110可以访问数据库130并且使用存储在数据库130中的信息来促进环境评估和任务供应。这样的数据库还可以包括来自其他类似设备和安装的更广的数据以及支持数据的方面,并且包括形式为专业系统的逻辑,以便促进评估系统110中的评估、建议和补救的过程。
尽管在图1中被图示为移动电话和会议设备,音频设备101和102可以是能够采集和/或呈现音频信号的任何设备。例如,音频设备101或102可以配备有一个或多个麦克风,用以采集环境中的音频。备选地或附加地,音频设备101或102可以配备有一个或多个扬声器,用以呈现从其他设备接收到的或者由设备101或102采集的音频信号。还要注意的是,设备101或102可以被分布在物理空间中,具有麦克风和/或扬声器被宽广地定位,诸如跨越房间放置并且以有线或无线连接与主设备通信的卫星麦克风和/或扬声器。作为远程系统,评估系统110可以是两个或更多设备可访问的、或者可以专用于仅一个设备。
在一些其他示例实施例中,可以在本地执行针对音频设备的环境评估。在这些实施例中,图1中的评估系统110和/或数据库130可以分别被安装为设备101和102中的软件。在这样的情况中,在测试过程中可以省略连接网络120。注意的是,某些网络连接通常与正在被用于通信的设备相关联,尽管这个网络连接可能不是总是包括与中央评估系统110的链路,并且因此分析和测试过程的本地实现的实施例是可想到的。此外,当存在关于设备要能够采集和发送音频或者监听敏感环境的敏感性时,对音频的连接和传送的约束可能导致优选本地评估系统,而不具有对所传送的音频的安全性隐患。
设备101或102由于在环境中的使用和暴露而可能在随着时间在硬件或软件水平上被降级。除了环境评估之外,在一些示例实施例中,评估系统110可以被配置为评估设备101或102的质量。在一个实施例中,设备评估可以首先被执行。在设备的质量满足用于音频活动时,继续评估环境。这在一些实施例中通常是优选的过程,因为设备本身要在环境测试中作为测量设备的形式被利用。在对设备的周围环境做进一步诊断之前,确保设备本身没有严重或受限制的故障可能是重要的。将理解的是,可以采用任何技术来做设备评估。这些技术的一个示例可以在美国专利申请No.14/387,171中找到,该专利通过全文引用而结合于此。在一些实施例中,评估系统110还可以基于设备评估结果确定一些任务,用户可能能够执行这些任务以便提升设备质量和/或校正损害。
现在参照图2,其描绘了根据本文中公开的示例实施例的环境和设备评估的过程200。在一些示例实施例中,过程200可以由图1中的评估系统110(其可以是音频设备101或102的内部或外部系统)实现,用以估计设备101或102的质量以及设备101或102所处的环境的声学性能。
在步骤201中,评估设备以检测该设备是否具有影响音频质量的问题。在设备评估期间检测到的问题可以与在该设备中安装的硬件和/或软件的质量有关。如果检测到问题,可以在步骤202中为用户提供对应的第一任务用以解决该问题。设备评估可以与估计设备的质量有关,这将在以下描述。在用户执行所提供的任务之后、例如在某段时间之后或者在接收到用户的确认输入之后,可以继续设备评估(例如,步骤201和202)、直至在步骤201中没有检测到另外的问题。
如果没有检测到质量问题,过程200行进至步骤203以评估设备所处的环境是否具有影响音频质量的问题。在一些实施例中,过程200可以从步骤203开始而不需要执行步骤201和202中的设备评估。步骤203中的环境评估可以与估计该环境的声学性能有关,这将在以下描述。如果检测到与环境有关的问题,可以在步骤204中为用户提供对应的第二任务用以解决该问题。
在一些实施例中,第二任务可以与对环境的设置的调整有关。环境的设置可以与环境内的物理对象的设置有关,例如窗户、墙、门、桌、电器或其他电子设备、家具或者位于该环境中的其他对象的布置(包括对一部分对象的添加、调整或移除),座位的分布,和/或与在这个环境中提供用于音频活动的恰当布置的过程有关的任何其他方面。
备选地或附加地,第二任务可以与设备在环境中的放置(placement)有关。如本文中所使用的,设备的放置指的是设备在安装环境中的物理部署或重新部署。例如,放置可以包括但不限于设备的位置、设备的定向(包括主设备、它的(多个)麦克风、和/或它的(多个)扬声器)、设备与特定对象和边界、诸如墙或桌子表面的邻近度、卫星和辅助麦克风和/或扬声器的位置和定向、设备周围的松动对象的移除、对设备的基座和在支撑表面上的接触的改善或修改、设备的电缆或附着物的稳固、和/或与提供用于设备的音频活动的恰当放置和安装的过程有关的任何其他方面。
该设备的不同环境设置和/或放置将影响设备操作的方式并且因此影响在采集或呈现活动时的音频质量。有时用户可能不知道该环境中将会导致设备的降级的潜在问题。利用所提供的任务,用户可以主动地采取某些动作来解决问题。
在用户基于任务解决了问题之后,例如在某段时间之后或者在接收到用户的确认输入之后,可以继续环境评估(例如,步骤203和204)、直至检测到该环境适于音频活动。如果在步骤203中没有检测到问题,在步骤205中为用户提供指示,以指示环境和设备适合于音频活动。因此,用户可以期望由该设备在当前环境中提供经改进的采集和呈现的音频质量。
在一些示例实施例中,可以设置各种触发或事件来发起设备评估和/或环境评估。这些触发或事件可以包括但不限于基于事件的触发、基于事件的触发、以及用户输入。例如,评估系统、诸如评估系统110可以在预定时间段中或者在检测到设备中存在正在进行的活动之后执行针对音频设备的设备评估和/或环境评估。在另一个示例中,可以由评估系统100接收用户输入,用以在用户想要故障排查和/或设备修复的任何时候发起设备和/或环境评估。
备选地或附加地,设备和/或环境评估可以基于交互机制而被发起。具体地,评估系统110可以自动地向用户提供针对评估的提示(例如经由音频设备),用以指示需要评估。评估系统110可以在接收到用户的确认之后开始执行(多个)评估。例如,评估系统110可以监测音频设备的正在进行的音频活动并且基于在一段时间检测到的音频的降级来提供该提示。
在一些示例实施例中,可以由系统、例如评估系统110将第一任务和/或第二任务经由音频信号、视觉信号(例如图像、视频、文本显示、灯光)和/或前述的组合提示给用户。用户可以通过该设备或者连接到评估系统的其他用户设备而被通知第一任务和/或第二任务。
将理解的是,步骤201和202中的设备评估可以在该设备被安装在特定环境中之前或之后被执行。还将理解的是,在该设备有能力在设备的使用期间通过自动地调整配置参数来提升音频质量以便克服软件或硬件中的降级的一些情况中,可以省略设备评估。
现在将参照图3和4详细描述用于设备评估和环境评估的一些示例实施例。图3描绘了根据本公开的一个示例实施例的设备评估过程300的流程图。过程300可以由图1中的评估系统110(其可以是音频设备101或102的内部或外部系统)实现,用以估计设备101或102的质量。在一些实施例中,设备评估过程300可以由诸如以上提及的基于时间的触发、基于事件的触发和/或用户输入之类的触发或事件来发起。
在图3示出的实施例中,通过以下来实现设备评估:使用测试信号以便检测该设备的输出换能器与输入换能器之间的路径(例如该设备的麦克风与扬声器之间的路径)中的失真。在步骤301,促使位于环境中的设备的扬声器(或扬声器集合)生成测试信号。存在可以被使用的多种测试信号、诸如最大长度序列(Maximum Length Sequence,MLS)、各种脉冲测试音、指数频率扫掠、或者本领域中已知可用于标识具有线性和非线性组分的频率和信号相应的任何其他测试信号。测试信号可以是该设备已经知道的或者可以由评估系统、例如图1中的评估系统110提供给该设备。可以由扬声器以一个或多个功率水平来播放测试信号。在该设备具有多于一个扬声器的情况中,可以在每个扬声器处单独地或者以某些期望的扬声器组合来同时地产生测试信号。
在步骤302中,通过设备的麦克风收集测试信号以作为音频响应信号。音频响应信号的收集可能稍微在测试信号的生成之后发生,因为该信号的一部分可能被设计为以除了音频输出和收集是同时的一般音频响应测试之外的方式来施加对设备的压力或激励。在该设备配备有多个麦克风的一些示例实施例中,每个麦克风均可以收集音频响应信号。
在步骤303,检测收集到的音频响应信号中的失真以确定设备的质量度量。可以通过将收集到的音频响应信号与已知的测试信号进行比较来检测失真。这里的检测和比较可以包括某些信号处理,包括但不限于去卷积、信号脉冲响应确定、频率响应确定、功率谱、延迟估计、相位估计、非线性失真估计、噪声水平估计、重复的激励中的一致性、互相调制、异常信号活动存在的检测、分类、水平确定、和/或模式匹配。这样的处理可以在直接和经转换的信号的任何适当组合中被执行,可以使用已知的技术和归纳、诸如对直接采集的信号或者经过去卷积和所标识的系统响应和失真产品的傅里叶、小波、子带划分或者时频分析。
在一些示例实施例中,可以在每对麦克风和扬声器处收集到的响应信号与生成的测试信号之间检测失真。该失真可以与失真阈值比较以确定该设备的质量度量。该失真阈值可以从一些参考设备获得并且可以被存储以供使用。在一些示例实施例中,如果在步骤303中检测到的失真超出失真阈值,该设备的质量度量可以被确定为较低值,指示该设备中某些潜在的故障。在其他情况中,该设备的质量度量可以被确定的较高值。
然后,可以在步骤304中将质量度量与质量阈值进行比较。质量阈值可以基于实际需要、例如用户的容忍度来设置。如果质量度量低于该阈值,这意味着该设备中存在一些故障,那么可以在步骤305中为用户提供任务。该任务可以基于失真来确定并且可以指示对设备的配置的修改。如本文中所使用的,设备的配置包括设备内的硬件和/或软件配置的各个方面。设备配置的修改可以包括替换或者修理硬件组件、或者修改硬件组件的参数或由设备使用的信号处理方法的参数。例如,如果检测到高的摩擦和嗡嗡的失真,可以提供认为以要求用户采取特定动作来调整音频采集和呈现、或者用于其他音频处理的参数、替换某些老化组件等等。在一些其他示例中,如果需要来自专业技术人员的设备修改和支持,该任务也可以包括这样的建议。
在一些示例实施例中,设备的配置、诸如组件和音频处理的参数设置可以由评估系统或该设备自动地修改。在这种情况下,步骤305中的任务可以被内部地执行而不需要与用户的交互。在一些示例实施例中,作为备选,在用户已经执行步骤305中提供的任务之后、例如在某个时间段之后或者在接收到用户的确认输入之后,过程300可以返回到步骤301以再次评估该设备评估。
在质量度量超过阈值的情况中,将在设备被安装到环境时立即地或者稍后行进到以下将参照图4描述的环境评估的过程400。在一些其他实施例中,可以在由过程300校验不存在设备内的质量故障之后,由用户输入来发起过程400。备选地,可以在步骤304之后向用户提供指示以指示设备的质量令人满意。
图4描绘了根据本文中公开的一个示例实施例的环境评估的过程400的流程图。过程400可以由图1中的评估系统110(其可以是音频设备101或102的内部或外部系统)实现,用以评估设备101或102所处的环境的声学性能。将理解的是,在一些其他实施例中,可以在没有设备评估过程300的情况下执行过程400。
在步骤401,获取由位于环境中的设备采集的音频信号。可以基于由该设备采集到的任何音频信号来确定环境评估,而仅仅限于如设备评估所用的测试信号。在一些示例实施例中,该设备可以在长时间段内监测和采集音频信号并且使用所有采集到的信号来评估该环境。
在一些示例实施例中,存在采集用于环境评估的音频信号的不同模式,包括被动模式、主动模式和交互模式。对这些模式之中的一个或多个模式的选择可以取决于要被分析的音频信号的特性,这将在以下讨论。在被动模式中,设备可以采集正在进行的音频活动的音频信号。在一些示例实施例中,根据被动模式,环境评估过程可以由以上提及的某些基于时间的触发和/或基于事件的触发而被发起,以便避免对正在进行的活动的干扰。
在主动模式中,可以以与设备评估过程类似的方式,促使该设备由(多个)扬声器主动地生成测试信号并且在设备的(多个)麦克风处采集音频响应。在一个实施例中,诸如基于时间的触发、基于事件的触发和用户输入之间的触发可以被用于触发该设备以生成测试信号。
在交互模式中,要求用户的活动,以便经由设备发出的一个或多个指示,提供某些额外的音频激励或者对音频信号的可听度做出评论。在这个模式中,可以由用户输入和/或基于以上提及的交互机制来触发该评估。在一些示例实施例中,可以利用指示来引导用户执行某个活动。在发出这些指示之前,在一个实施例中,可以首先向用户提供指令以指示用户将设备放置在环境中的期望位置处。
在一个实施例中,取决于指示,用户可以被要求在该设备被促使采集环境中的噪声时保持安静。备选地或附加地,可以提供指示以要求用户制造声音、例如在房间的特定位置处以讲话者的正常语音水平阅读文章。在环境中可能存在多个潜在讲话位置的情况中,可以提供一个或多个指示以引导用户在不同的潜在讲话位置处制造声音。可以由设备采集用户在每个潜在讲话位置处的声音。
采集到的(多个)语音信号可以用于促进环境评估。例如,通过分析(多个)音频讯号的(多个)特性,可以能够确定潜在讲话者与设备的距离、讲话者的位置相对于房间中的设备的角度、设备的定向/放置、和/或设备所处的房间或桌子的大小。将稍后详细讨论音频信号的分析。在一些实施例中,用户也可以被要求在一个特定位置或在所有潜在位置处对它们从设备听到的声音进行评论,评论可以是例如以下方面:是否听得清楚、低沉、大声、柔和或者其他潜在的高级描述符。来自用户的评论可以提高分析结果的准确性。
在步骤402,分析音频信号的特性以确定针对环境的声学性能度量。声学性能度量被用于衡量这个环境在音频活动方面的性能。在一些示例实施例中,为了更准确地确定该升学性能度量,在当前音频信号之前在该环境中由设备采集到的音频信号的特性也可以被获得以用于确定该声学性能度量。在一个实施例中,先前的音频信号的特性可以被存储在评估系统可访问的存储设备中、诸如图1中的数据库130。
采集到的音频信号的特性可以包括从该音频信号可测量的各种特征。在一些示例实施例中,可以检测该音频信号的噪声特性,其可以指示以下各项中的一项或多项:噪声水平、噪声稳定性、以及音频信号中的非期望背景语音的相对水平、或者该环境中的非期望噪声的任何其他方面。备选地或附加地,还可以确定音频信号的声学特性。声学特性可以指示音频信号的音色、音频信号的混响时间、音频信号的回声水平、或者音频信号的异响水平。在一些其他实施例中,还可以从音频信号中检测出在音频信号中检测到的声源的位置到环境中的设备的距离,并且用于确定声学性能度量。
在该设备支持空间音频模式的一些情况中,为了提高在这个环境中的音频活动的空间分集,可以确定声源的位置在环境中的跨度和/或声源在声场中的分离度。在这些情况中,该设备可以包括多个麦克风和扬声器。可以使用在多个麦克风处采集到的音频响应来分析跨度和/或分离度。
在以下,将详细讨论在以下列出的特性中的一些因素的确定和它们对环境的声学性能的影响。
噪声水平
可以在被动模式中进行对噪声的检测,其中在设备的音频活动时间期间采集的音频信号。可以检测音频中没有任何类似语音的活动的片段,并且使用这个片段作为噪声信号。还可以从包含语音的音频信号中提取噪声信号。在一些其他实施例中,可以是交互的,其中可以通知环境中的用户要记录噪声并且要求用户保持安静。在音频设备的许多使用情况中,可以使用来自(多个)麦克风采集的音频信号的频谱信息的观察集合来评估噪声水平。在一些示例中,可以将检测到的噪声信号的幅度测量为噪声水平。噪声水平可以用于指示环境中的潜在噪声源。
噪声稳定性
利用从被动模式或交互模式中采集到的音频信号中检测到的噪声信号,还可以确定噪声信号的稳定性。背景稳定噪声通常具有平滑或受约束的时间变化,但是语音活动检测和间歇突发可能均产生比稳定噪声更高的变化范围。为了更准确地检测噪声稳定性,在一些示例中,,可以使用在一个时间段内对噪声水平的观察集合来确定噪声稳定性。例如,噪声稳定性可以是以dB/min为单位的度量,并且可以表示噪声干扰的频率和严重性的组合。噪声稳定性可以与噪声水平独立地或组合在一起来使用,以便指示环境中的可能的噪声源。
背景语音
背景语音(也被称为“含糊(mumble)”语音)指的是从远离设备的、与其使用无关的音频活动泄露的语音,例如来自相邻房间的语音。这个含糊或背景语音在许多使用情况中也可能是不期望的音频并且可以被认为是噪声。然而,不像离散的脉冲噪声,背景语音具有抑扬顿挫的调制噪声(例如,在3-7Hz处的频谱调制),其可能被错误地标识为期望的语音,导致在设备的音频处理中的增益控制或降级的一些问题。这些问题的一个示例是,安装在参与者保持安静的房间中的设备将继续标识并且追踪这个背景语音,导致对远端用户的一些问题。取决于安装,将不确定背景语音是否是该会议感兴趣的或者是否是可避免的。因此,主房间处于安静并且设备测试不期望的背景语音的水平的过程可用于量化这个影响并且潜在地解决在设备设置时的背景语音追踪问题。在这种情况中,将在背景语音由设备采集之前移除或抑制该背景语音。在一些示例中,可以从采集的语音信号中检测出背景语音并且可以计算背景语音与所期望的语音的正常水平相比较的相对水平。
在一些实施例中,可以在环境中没有语音正在进行中的时间期间以被动模式来采集音频信号。在一些其他实施例中,可以以交互模式要求用户在该环境中保持安静。通过标识在其中包含的语音,在被动模式或交互模式期间采集到的音频信号可以被用于测量背景语音的相对水平。在一些实施例中,高于阈值的相对水平可以指示背景语音的存在。在一些实施例中,可以通过关闭门或者将设备移动远离不期望的语音的源,来解决这样的背景语音(如果被标识出来的话)。
音色
采集到的音频信号的音色(timbre)可以由该信号的频谱轮廓来确定。音色的示例度量是该音频信号在多个适当频带处与参考音频响应的偏差。在一个示例中,1/3倍频带(octave band)可以被用于获得在大约20个频谱点的集合。如果与参考频谱相比、采集到的音频信号的频谱的最高和最低偏差之间存在较高差异,则存在显著的音频质量降级。一般而言,音色的降级可能是由于设备的不恰当放置而导致。
在一些示例实施例中,可以使用在长时间段内采集到的音频信号来以更准确的方式评估音色的水平。一般而言,所期望的长期语音频谱是已知的并且是相对独立于语言的,从而可以标识出主要的音色偏移。该设备可以以被动模式、通过从设备的音频活动中收集音频信号来采集音频信号。还可以促使该设备生成测试信号、例如创建环境中的声音的杂散并且然后在麦克风处收集音频响应。备选地,可以在交互模式中将用户涉及在内并且用户可以被提供指示以制造声音用于由设备的麦克风采集。
混响
可以通过监测在音频信号的脉冲声音之后能量的最大衰减率,来测量音频信号在环境中的混响(reverberation)时间。为了测量混响时间,可以在被动模式、主动模式和交互模式中的任意模式中采集音频信号。在交互模式中,可以要求用户在与设备的一个或多个建议的距离处拍掌,以便提供对环境中的混响的立即测量。混响通常可能发生在封闭空间中、例如在房间中。混响的时间可以与房间大小或者房间的吸音性(sound absorption)有关。如果混响时间高于一个阈值,则可能影响设备的语音可理解性(intelligibility)。
回声
为了测量回声(echo),可以使用测试信号以便测量在直接的回声路径中的信号水平。一般而言,回声路径中的增长可以被认为是设备故障。在一些其他实施例中,与设备的短距离内的声学路径的严密观察可以备选地提供设备周围是否存在任何较大反射对象的指示。较大的回声水平可以对设备的双工性能造成显著影响。
异响
可以通过生成测试信号并且在(多个)麦克风处采集音频响应以确定失真,来测量异响(rattle)水平。可以以在设备评估过程中描述的类似的方式来确定失真。在一些实施例中,异响的水平可以被测量为异响与期望语音的正常水平相比的相对水平。即时的谐波失真的增长可能与异响问题有关。异响可以涉及靠近设备并且由测试信号激励的某些松动或异响对象。由这些对象造成的异响声可以足够显著以由麦克风采集到。如果异响水平达到与环境中的期望语音相近的水平的话,这可能非常成问题。
距离
设备与声源(例如用户)之间的距离也可以对环境的声学性能造成影响。如以上提及的,用户可以被要求在一个或多个潜在讲话位置处制造声音,从而可以基于采集到的音频响应确定设备与在(多个)讲话位置处的讲话者之间的(多个)距离。在一些实施例中,如果存在针对不同声源确定的多个距离,可以计算均值距离。理想的是,讲话者应当保持在麦克风的短距离内以便具有环境中的良好音频采集。在一些示例实施例中,取代要求用户制造声音,可以从设备的音频活动中采集到的音频信号的长时间观察中检测出声源与设备的距离。如果检测出该距离大于阈值(其取决于所使用的麦克风的能力),麦克风可能潜在地不能够以可接受的水平从用户采集到语音。
跨度和分离度
在空间音频模式的情况中,多个用户在环境中的跨度(span)和它们的声音在声场中的分离度将具有显著影响。如提及的,在这种模式中,该设备可以具有多于两个的麦克风和扬声器。一般而言,当这个模式被激活时,可以采集到多个声源并且可以在音频采集和呈现中获得空间分集。为了测量跨度和分离度,可以从设备的音频活动中采集音频信号,或者可以以交互模式来采集音频信号,其中可以要求用户跨多个讲话位置处移动并且制造某些声音。
声源的跨度可以由从音频信号检测到的声源的角度范围(在一些示例中,仅是声源的角度)来表示。可以测量声场中的所有检测到的是恒源的均值角度分离度。跨度和分离度可以被用于指示用户在该环境中关于设备的相对分布。
以上讨论了由采集到的音频信号的特性所指示的一些因素。在一些示例实施例中,可以基于这些因素中的一个或多个因素来确定针对环境的声学性能度量,以使得用户可以从该度量中解译出这个环境的整体性能。在一些示例中,所关注的每个因素可以以线性或非线性的方式被缩放或映射到同一范围内的降级值。用于映射的范围可以被选择为例如0到1的范围、0到10的范围、0到100的范围、或者任何其他适当的范围。针对所关心的每个因素的测量值可以首先被映射到这个范围内的值,并且然后所有因素的映射值可以被加权以获得针对环境的声学性能度量。
每个因素的权值可以被用于表示这个因素可以影响该环境中的音频活动的程度。例如,由于跨度和分离度仅在空间音频模式的情况中具有显著影响,它们中的一者或者两者可以不是声学性能的较强贡献者并且因此可以具有相对低的权值。在一些因素可能要求麦克风处的更多观察以便确定它们在当前时刻的值的一些情况中,声学性能还可以通过向这些因素指派典型值而被生成。这些典型值可以被选择为0.4、0.5、0.6或者在0至1的范围内的任何其他值、或者如果使用不同的范围用于映射的话还可以被选择为其他值。
以下表1中给出了一些因素的映射和权值的详细工作示例。在表1中,测量的因素均被缩放(或映射)至0到1的范围。例如,对于噪声水平的因素,针对这个因素测量的低于40dB的任何水平可以被缩放到0值,而高于70dB的任何水平可以被映射为1的值。对于在40dB与70dB之间的其他水平,它们可以以线性或非线性的方式被映射到高于0但是低于1的值。在表1的示例中,针对噪声水平的权值是10%。其他因素可以以类似的方式被缩放到0至1的范围。将理解的是,表1仅仅被给出为解释说明的目的,而不是对本文中公开的实施例的任何限制。可以对这些因素设置任何其他值的范围和/或其他权值。
表1
在一些示例实施例中,在表1中列出的一些或所有因素和/或其他因素可以被选择用以确定声学性能度量。所选择的因素可以指示对音频质量具有影响的分量并且可以被用于确定整体得分,该整体得分提供了用于追踪安装环境的声学性能的效用。
在一些示例实施例中,声学性能度量可以被确定为与所考虑的因素的值正相关。在一个实施例中,声学性能度量的确定可以有助于减少将多个可测量的因素(音频信号的特性)减少到较小数目的评分维度,这可以促进用户对声学性能的解译。
在一个实施例中,声学性能度量可以被确定为所考虑的因素的值的加权和。这些因素的值可以被加权并且被相加,以获得在预定范围中的值,这样的预定范围可以是在0至1、0至10或0至100的范围或者任何其他适当范围。例如,如果决定将声学性能度量限制在0到10之间的范围,并且使得具有较高值的度量指示较好的声学性能,声学性能度量可以被确定为10减去10与加权和的乘积。在一些示例中,可以通过使用指数值,将加权和构建为指数函数。在这些示例中的声学性能度量可以被表示为如下:
其中S表示声学性能度量,F表示在性能度量的确定中所考虑的因素的数目,Cf表示第f个因素的映射值,Wf表示第f个因素的权值,并且n表示指数值。指数值n可以等于或大于1。在一些实施例中,较高的n值可以使得声学性能度量接近于由最显著的加权降低所导致的特性。在一个示例中,n的值可以被设置为2。在一个示例中,用于这些可测量的因素的缩放和加权的值可以是表1中示出的这些。
将理解的是,声学性能度量可以基于所考虑的加权和而被设置为除了公式(1)中示出的范围之外的任何其他范围。还将理解的是,可以采用其他的加权形式。
在一些其他实施例中,可以基于因素的值,确定多于一个度量用于指示声学性能。例如,可以基于与音频设备采集到的音频信号的噪声特性有关的因素来确定一个度量,这些因素诸如是噪声水平、噪声稳定性和/或背景语音。可以基于音频信号的声学特性和/或任何其他特性确定一个或多个其他度量。
参考回图4,在步骤402中确定的声学性能度量可以在步骤403中与阈值进行比较,以确定该环境是否适合于音频活动。具有较高值的声学性能度量可以指示该环境对于音频活动更有效。针对声学性能度量的阈值可以基于实际需要来确定。在公式(1)的示例中,环境的声学性能可以一般地表征为:在声学性能度量处于0到3的范围内的情况中是效率低的、在度量处于3至7的范围内的情况中是有问题的、并且在度量处于7至10的范围内的情况中是有效的。
如果声学性能度量被确定为超过阈值(例如,在公式(1)的示例中是7的阈值),那么可以在步骤404中为用户提供指示,以指示环境适合于音频活动。否则的话,过程400行进至步骤405。在确定了两个或更多声学性能度量的实施例中,每个度量可以与相应的阈值(同一阈值)进行比较。如果这些度量中的所有或多数度量超过对应的阈值,过程400行进至步骤405。
在步骤405,提供任务以供用户执行,以便提高环境的声学性能。该任务可以包括要由用户执行的一个或多个动作。在一些实施例中,除了整体得分之外,导致主要(或最大)降级的(多个)因素的指示也可以用于确定在该任务中哪个(哪些)动作具有较高优先级。在一些示例中,可以基于表示它们对降级的影响的值、例如在公式(1)的示例中基于Wf*Cf的值,对这些因素进行排序以供分析。
在一些示例实施例中,该任务可以与对环境的设置的调整有关。备选地或附加地,该任务可以与设备的放置有关。该任务可以基于在步骤402的(多个)特性来确定。在一些示例实施例中,音频设备或评估设备可以具有可理解性,以分析低的声学性能度量的原因并且然后确定可能的解决方案作为任务,用以解决问题。
在一些示例实施例中,基于指示诸如噪声水平或噪声稳定性的噪声特性,可以确定低声学性能度量可以由一些噪声源导致。可以使用一个任务来引导用户检查是否存在电子设备或电器被打开、或者窗、门被打开,并且采取适当的做来消除或抑制噪声。对于从噪声水平和/或噪声稳定性检测出振动噪声的情况,任务可以指示用户将设备移动离开某些机械振动噪声源。在一些示例中,如果背景语音的相对水平较高,任务可以建议用户关闭环境中的窗或门、或者提高该环境的墙壁的隔离效果。
在一些示例实施例中,可以播放所提取的噪声信号以使得用户能够标识干扰的特性声音、并且找出噪声源。这个播放设备采集到的声音的方法非常有用。一般而言,输入信号处理进行工作以克服在设备的(多个)麦克风处采集到的音频的缺陷。通过简单地播放一系列测试音频或者如在(多个)麦克风处听到的完全一样的房间采集声、并且潜在地增加放大性以便产生适当的输出水平,用户可以能够快速地听到、标识并且纠正设备附近的噪声源,这些噪声源可能在其他方式中在较大房间李是不可听到的。在设备配备有空间麦克风的一些其他实施例中,可以能够基于由麦克风采集到的音频信号确定出噪声源的主要方向。所确定的方向可以被给出作为对用户的建议。
在一些示例实施例中,如果用户的距离或者多个用户的均值距离较大,(多个)用户可以被建议为离设备更近些、或者使用卫星麦克风和/或扬声器,以便帮助采集语音和/或收听音频播放。备选地或附加地,指示诸如音色、混响时间、回声水平或异响水平的因素的声学特性也可以被用于确定环境中存在的影响性能度量的可能问题。例如,来自音色和不期望的邻近回声的降级可能是由于设备的不良放置导致的,并且因而可以为用户提供任务以将设备移动至另一个适当位置。
较长的混响时间可能是由于较大的房间大小或者墙壁的不良吸引性导致的。在这种情况中,可以向用户推荐声学处理。例如,可以建议用户在房间中使用一些软家具、拉下任何软窗或门装饰、或者打开门以减少混响。异响水平较高通常是由于考虑设备的一些松动或意向物体造成的,可以给出任务用于要求用户检查和调整设备周围的物体。
在一些其他示例实施例中,指示诸如用户的跨度和分离度的声学特性可以用于检测用户关于环境中的设备的相对分布。在一些示例中,低的跨度和低的分离度可能是由于用户远离设备造成的,并且因此可以确定一个任务用以请求用户移动靠近些。如果跨度较高而分离度较低,这可能是房间大并且多个参与者待在疏远的位置处的情况。因此,可以在任务中建议用户使用麦克风和/或扬声器,以帮助采集语音和/或收听音频播放。在跨度较低而分离度较高的一些其他情况中,可以确定设备位于角落或者接近墙壁的位置。然后可以建议用户改变设备的位置或者设备的麦克风和扬声器的定向。
在一些示例实施例中,作为备选,在用户已经指示所提供的任务、例如在某段时间之后或者在接收到用户的确认输入之后,过程400可以返回步骤401以再次评估环境。在一些示例实施例中,从环境评估所确定的多个潜在任务可以被列出给用户、例如以根据检测到的问题的严重性以降序顺序列出。附加地,还可以提供任务和问题之间的对应性。用户然后可以基于所列出的任务,能够尝试采取某些动作来解决在一轮环境评估中的潜在问题。
图5描绘了根据本文中的一个示例实施例的系统500的框图。图1中的评估系统110可以被实现为系统500。如所示出的,系统500包括音频收集器510,该音频收集器510被配置为获得由位于环境中的设备采集的第一音频信号。系统500还包括处理单元520,该处理单元520被配置为分析第一音频信号的特性以确定针对环境的声学性能度量。该处理单元520还被配置为响应于声学性能度量低于阈值,基于第一音频信号的特性提供第一任务以供用户执行,第一任务与对环境的设置的调整有关。
在一些示例实施例中,处理单元520可以进一步被配置为响应于声学性能度量低于阈值,基于第一音频信号的特性提供第二任务以供用户执行,第二任务与对设备的放置的调整有关。
在一些示例实施例中,处理单元520可以进一步被配置为确定指示以用于引导用户在环境中的多个位置处制造声音。音频收集器510可以被配置为收集所述声音作为第一音频信号。
在一些示例实施例中,处理单元520可以进一步被配置为促使第一测试信号由设备的扬声器生成。音频收集器510可以被配置为通过设备的麦克风收集第一测试信号以作为第一音频信号。
在一些示例实施例中,处理单元520可以被配置为分析以下各项中的至少一项:第一音频信号的噪声特性,噪声特性指示以下各项中的至少一项:噪声水平、噪声稳定性、以及第一音频信号中的背景语音的相对水平;第一音频信号的声学特性,声学特性指示以下各项中的至少一项:第一音频信号的音色、第一音频信号的混响、第一音频信号的回声水平、或者第一音频信号的异响水平;以及从第一音频信号中检测到的声源的位置到环境中的设备的距离。
在一些示例实施例中,该设备可以支持空间音频模式。在一些示例实施例中,处理单元520可以被配置为分析以下各项中的至少一项:在第一音频信号中检测到的声源的位置在环境中的跨度;以及在第一音频信号中检测到的声源在声场中的分离度。
在一些示例实施例中,处理单元520可以被配置为促使第二测试信号由设备的扬声器生成,并且音频收集器510可以被配置为通过设备的麦克风收集第二测试信号以作为第二音频信号。处理单元520可以进一步被配置为检测第二音频信号中的失真以确定针对设备的质量度量。在一些示例实施例中,响应于设备的质量度量超过阈值,分析第一音频信号的特征。在一些实施例中,生成这个第二测试信号的设备可以是系统500的附加的或相关的用户设备、诸如移动电话,或者可以是系统500的外围设备。
在一些示例实施例中,处理单元520可以进一步被配置为响应于设备的质量度量低于阈值,提供第三任务以供用户修改设备的配置。
在一些示例实施例中,系统500可以进一步包括特征收集器,被配置为从存储设备获取由设备在第一音频信号之前采集的第三音频信号的特性。处理单元520可以进一步被配置为进一步基于第三音频信号的特性为用户设备提供第一任务。
要理解的是,系统500的各部件可以是硬件模块,也可以是软件单元模块。例如,在一些实施例中,该系统可以部分或者全部利用软件和/或固件来实现,例如被实现为包含在计算机可读介质上的计算机程序产品。备选地或附加地,该系统可以部分或者全部基于硬件来实现,例如被实现为集成电路(IC)、专用集成电路(ASIC)、片上系统(SOC)、现场可编程门阵列(FPGA)等。本公开的主题的范围在此方面不受限制。
图6描绘了适于用来实现本公开的示例实施例的示例计算机系统600的示意性框图。如所描绘的,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。如所需要的,在RAM 603中,还存储有CPU 601执行各种过程等需要的数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的示例实施例,上文参考图2至4描述的过程200至400可以被实现为计算机软件程序。也就是说,本公开的一些示例实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行过程200至400的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
一般而言,本公开的各种示例实施例可以在硬件或专用电路、软件、逻辑,或其任何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本公开的示例实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时,将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或前述的某些组合中实施。
而且,流程图中的各框可以被看作是方法步骤,和/或计算机程序代码的操作生成的操作,和/或理解为执行相关功能的多个耦合的逻辑电路元件。例如,本公开的实施例包括计算机程序产品,该计算机程序产品包括有形地实现在机器可读介质上的计算机程序,该计算机程序包含被配置为实现上文描述方法的程序代码。
在公开的上下文内,机器可读介质可以是包含或存储用于或有关于指令执行系统、装置或设备的程序的任何有形介质。机器可读介质可以是机器可读信号介质或机器可读存储介质。机器可读介质可以包括但不限于电子的、磁的、光学的、电磁的、红外的或半导体系统、装置或设备,或其任意合适的组合。机器可读存储介质的更详细示例将包括带有一根或多根导线的电气连接、便携式计算机磁盘、硬盘、随机存储存取器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、便携式压缩盘只读存储器(CD-ROM)、光存储设备、磁存储设备,或前述的任意合适的组合。
用于实现本公开的方法的计算机程序代码可以用一种或多种编程语言编写。这些计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。程序代码可以被分布在被特定编程的设备,这些设备通常在本文中可以被称为“模块”。这些模块的软件组件部分可以以任何具体计算机语言来编写并且可以是单片集成代码库的一部分,或者可以被开发成多个离散代码部分,诸如通常以面向对象的计算机语言来开发。此外,模块可以跨多个计算机平台、服务器、终端、移动设备等来分布。给定的模块甚至可以被实施为使得所描述的功能由单个处理器和/或计算机硬件平台来执行。
如本申请中所使用的,术语“电路装置”指的是以下的所有:(a)仅硬件电路实现方式(诸如仅模拟电路装置和/或仅数字电路装置的实现方式)以及(b)与电路和软件(和/或固件)的组合,诸如(如果可用的话):(i)与处理器的组合或(ii)处理器/软件(包括数字信号处理器)、软件和存储器的部分,这些部分一起工作以使得装置(诸如移动电话或服务器)执行各种功能,以及(c)电路,诸如微处理器或微处理器的一部分,其需要软件或固件用于操作,即使软件或固件不是物理存在的。此外,本领域技术人员已知的是,通信媒介通常体现计算机可读指令、数据结构、程序模块或模块化数据信号中的其他数据,该数据信号诸如载波或其他传输机制,并且通信媒介包括任何信息传送媒介。
另外,尽管操作以特定顺序被描绘,但这并不应该理解为要求此类操作以示出的特定顺序或以相继顺序完成,或者执行所有图示的操作以获取期望结果。在某些情况下,多任务和并行处理会是有益的。同样地,尽管上述讨论包含了某些特定的实施细节,但这并不应解释为限制本公开的主题或权利要求的范围,而应解释为对可以针对特定实施例的特征的描述。本说明书中在分开的实施例的上下文中描述的某些特征也可以整合实施在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以分离地在多个实施例或在任意合适的子组合中实施。
针对本公开的前述示例实施例的各种修改、改变将在连同附图查看前述描述时对相关技术领域的技术人员变得明显。任何及所有修改将仍落入非限制的和本公开的示例实施例范围。此外,前述说明书和附图存在启发的益处,涉及本公开的这些实施例的技术领域的技术人员将会想到此处阐明的其他实施例。
将会理解,本公开的主题的实施例不限于公开的特定实施例,并且修改和其他实施例都应包含于所附的权利要求范围内。尽管此处使用了特定的术语,但是它们仅在通用和描述的意义上使用,而并不用于限制目的。
Claims (19)
1.一种计算机实施的方法,包括:
获得由位于环境中的设备采集的第一音频信号;
分析所述第一音频信号的特性以确定针对所述环境的声学性能度量;以及
响应于所述声学性能度量低于阈值,基于所述第一音频信号的所述特性提供第一任务以供用户执行,所述第一任务与对所述环境的设置的调整有关。
2.根据权利要求1所述的方法,进一步包括:
响应于所述声学性能度量低于阈值,基于所述第一音频信号的所述特性提供第二任务以供所述用户执行,所述第二任务与对所述设备的放置的调整有关。
3.根据权利要求1至2中任一项所述的方法,其中获得所述第一音频信号包括:
提供指示以用于引导所述用户在所述环境中的多个位置处制造声音;以及
收集所述声音以作为所述第一音频信号。
4.根据权利要求1至2中任一项所述的方法,其中获得所述第一音频信号包括:
促使第一测试信号由所述设备的扬声器生成;以及
通过所述设备的麦克风收集所述第一测试信号以作为所述第一音频信号。
5.根据权利要求1至4中任一项所述的方法,其中分析所述第一音频信号的所述特性包括分析以下各项中的至少一项:
所述第一音频信号的噪声特性,所述噪声特性指示以下各项中的至少一项:噪声水平、噪声稳定性、以及所述第一音频信号中的背景语音的相对水平;
所述第一音频信号的声学特性,所述声学特性指示以下各项中的至少一项:所述第一音频信号的音色、所述第一音频信号的混响、所述第一音频信号的回声水平、或者所述第一音频信号的异响水平;以及
从所述第一音频信号中检测到的声源的位置到所述环境中的所述设备的距离。
6.根据权利要求1至4中任一项所述的方法,其中所述设备支持空间音频模式,并且其中分析所述第一音频信号的所述特性包括分析以下各项中的至少一项:
在所述第一音频信号中检测到的声源的位置在所述环境中的跨度;以及
在所述第一音频信号中检测到的声源在声场中的分离度。
7.根据权利要求1至6中任一项所述的方法,进一步包括:
促使第二测试信号由所述设备的扬声器生成;
通过所述设备的麦克风收集所述第二测试信号以作为第二音频信号;以及
检测所述第二音频信号中的失真以确定针对所述设备的质量度量,
其中分析所述第一音频信号的所述特性包括:
响应于所述设备的所述质量度量超过阈值,分析所述第一音频信号的所述特征。
8.根据权利要求7所述的方法,进一步包括:
响应于所述设备的所述质量度量低于所述阈值,提供第三任务以供所述用户修改所述设备的配置。
9.根据权利要求1至8中任一项所述的方法,其中为所述用户提供所述第一任务包括:
从存储设备获取由所述设备在所述第一音频信号之前采集的第三音频信号的特性;以及
进一步基于所述第三音频信号的所述特性为所述用户设备提供所述第一任务。
10.一种计算机实施的系统,包括:
音频收集器,被配置为获得由位于环境中的设备采集的第一音频信号;以及
处理单元,被配置为:
分析所述第一音频信号的特性以确定针对所述环境的声学性能度量,以及
响应于所述声学性能度量低于阈值,基于所述第一音频信号的所述特性提供第一任务以供用户执行,所述第一任务与对所述环境的设置的调整有关。
11.根据权利要求10所述的系统,其中所述处理单元进一步被配置为响应于所述声学性能度量低于阈值,基于所述第一音频信号的所述特性提供第二任务以供所述用户执行,所述第二任务与对所述设备的放置的调整有关。
12.根据权利要求10至11中任一项所述的系统,其中所述处理单元进一步被配置为确定指示以用于引导所述用户在所述环境中的多个位置处制造声音;并且
其中所述音频收集器被配置为收集所述声音以作为所述第一音频信号。
13.根据权利要求10至11中任一项所述的系统,其中所述处理单元进一步被配置为促使第一测试信号由所述设备的扬声器生成;以及
其中所述音频收集器被配置为通过所述设备的麦克风收集所述第一测试信号以作为所述第一音频信号。
14.根据权利要求10至13中任一项所述的系统,其中所述处理单元被配置为分析以下各项中的至少一项:
所述第一音频信号的噪声特性,所述噪声特性指示以下各项中的至少一项:噪声水平、噪声稳定性、以及所述第一音频信号中的背景语音的相对水平;
所述第一音频信号的声学特性,所述声学特性指示以下各项中的至少一项:所述第一音频信号的音色、所述第一音频信号的混响、所述第一音频信号的回声水平、或者所述第一音频信号的异响水平;以及
从所述第一音频信号中检测到的声源的位置到所述环境中的所述设备的距离。
15.根据权利要求10至13中任一项所述的系统,其中所述设备支持空间音频模式,并且其中所述处理单元被配置为分析以下各项中的至少一项:
在所述第一音频信号中检测到的声源的位置在所述环境中的跨度;以及
在所述第一音频信号中检测到的声源在声场中的分离度。
16.根据权利要求10至15中任一项所述的系统,其中所述处理单元被配置为促使第二测试信号由所述设备的扬声器生成,并且所述音频收集器被配置为通过所述设备的麦克风收集所述第二测试信号以作为第二音频信号;并且
其中所述处理单元进一步被配置为:
检测所述第二音频信号中的失真以确定针对所述设备的质量度量,以及
响应于所述设备的所述质量度量超过阈值,分析所述第一音频信号的所述特征。
17.根据权利要求16所述的系统,其中所述处理单元进一步被配置为响应于所述设备的所述质量度量低于所述阈值,提供第三任务以供所述用户修改所述设备的配置。
18.根据权利要求10至17中任一项所述的系统,进一步包括:
特征收集器,被配置为从存储设备获取由所述设备在所述第一音频信号之前采集的第三音频信号的特性,并且
其中所述处理单元进一步被配置为进一步基于所述第三音频信号的所述特性为所述用户设备提供所述第一任务。
19.一种计算机程序产品,所述计算机程序产品包括被有形地体现在机器可读介质上的计算机程序,所述计算机程序包含程序代码,所述程序代码用于执行根据权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610541425.2A CN107613429A (zh) | 2016-07-12 | 2016-07-12 | 音频安装的评估和调整 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610541425.2A CN107613429A (zh) | 2016-07-12 | 2016-07-12 | 音频安装的评估和调整 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107613429A true CN107613429A (zh) | 2018-01-19 |
Family
ID=61054788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610541425.2A Pending CN107613429A (zh) | 2016-07-12 | 2016-07-12 | 音频安装的评估和调整 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107613429A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900959A (zh) * | 2018-05-30 | 2018-11-27 | 北京百度网讯科技有限公司 | 测试语音交互设备的方法、装置、设备和计算机可读介质 |
CN109599122A (zh) * | 2018-11-23 | 2019-04-09 | 雷欧尼斯(北京)信息技术有限公司 | 音频性能评价系统及方法 |
CN111824879A (zh) * | 2020-07-02 | 2020-10-27 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
CN112133328A (zh) * | 2020-08-03 | 2020-12-25 | 北京百度网讯科技有限公司 | 音频数据的测评信息生成方法和装置 |
CN113543012A (zh) * | 2020-04-17 | 2021-10-22 | 诺基亚技术有限公司 | 提供空间音频信号 |
-
2016
- 2016-07-12 CN CN201610541425.2A patent/CN107613429A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900959A (zh) * | 2018-05-30 | 2018-11-27 | 北京百度网讯科技有限公司 | 测试语音交互设备的方法、装置、设备和计算机可读介质 |
CN109599122A (zh) * | 2018-11-23 | 2019-04-09 | 雷欧尼斯(北京)信息技术有限公司 | 音频性能评价系统及方法 |
CN109599122B (zh) * | 2018-11-23 | 2022-03-15 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式音频性能评价系统及方法 |
CN113543012A (zh) * | 2020-04-17 | 2021-10-22 | 诺基亚技术有限公司 | 提供空间音频信号 |
CN113543012B (zh) * | 2020-04-17 | 2023-05-02 | 诺基亚技术有限公司 | 提供空间音频信号 |
CN111824879A (zh) * | 2020-07-02 | 2020-10-27 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
CN111824879B (zh) * | 2020-07-02 | 2021-03-30 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
CN112133328A (zh) * | 2020-08-03 | 2020-12-25 | 北京百度网讯科技有限公司 | 音频数据的测评信息生成方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6509213B2 (ja) | 聴力プロファイル検査システム及び方法 | |
CN107613429A (zh) | 音频安装的评估和调整 | |
US10665250B2 (en) | Real-time feedback during audio recording, and related devices and systems | |
US10446166B2 (en) | Assessment and adjustment of audio installation | |
US10368154B2 (en) | Systems, devices and methods for executing a digital audiogram | |
US9620141B2 (en) | Speech intelligibility measurement and open space noise masking | |
CN108260068B (zh) | 麦克风密封性测试方法和装置 | |
US20220086579A1 (en) | Multi-voice conferencing device soundbar test system and method | |
Weerathunge et al. | Accuracy of acoustic measures of voice via telepractice videoconferencing platforms | |
US20210306782A1 (en) | Method and system of audio device performance testing | |
CN113534052B (zh) | 骨导设备虚拟声源定位性能测试方法、系统、装置及介质 | |
CN116158092A (zh) | 使用外部刺激评估耳封的系统和方法 | |
Bruns et al. | Automated speech audiometry for integrated Voice over Internet Protocol communication services | |
Awan et al. | The effect of microphone frequency response on spectral and cepstral measures of voice: An examination of low-cost electret headset microphones | |
US11670298B2 (en) | System and method for data augmentation for multi-microphone signal processing | |
Anand et al. | Compromising Speech Privacy under Continuous Masking in Personal Spaces | |
Struck | Objective Measurements of Headphone Active Noise Cancelation Performance | |
Mapp | Some practical aspects of STI measurement and prediction | |
Peruzzi | FE Analysis of Communications Systems for Drive-Thru Restaurants in a Business Dispute Over Specifications and Design Process. | |
Datta et al. | An Auditory Model-Inspired Objective Speech Intelligibility Estimate for Audio Systems | |
Morales et al. | Speech transmission index for the English language verified under reverberant conditions with two binaural listening methods: real-life and headphones | |
Mapp | Systematic & Common Errors in Sound System STI and Intelligibility Measurements | |
Röhrbein et al. | Reducing the temporal resolution of spatial impulse responses with an auditory model | |
van Wijngaarden et al. | Speech intelligibility measurements in practice | |
Johannes | Differential Analysis of Acoustical Smartphone Recording Capabilities-a Contribution towards Smartphone-modulated Perception of Tinnitus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180119 |