CN113810254A - 动态调节音频输出装置的设置的系统、方法和介质 - Google Patents

动态调节音频输出装置的设置的系统、方法和介质 Download PDF

Info

Publication number
CN113810254A
CN113810254A CN202110188506.XA CN202110188506A CN113810254A CN 113810254 A CN113810254 A CN 113810254A CN 202110188506 A CN202110188506 A CN 202110188506A CN 113810254 A CN113810254 A CN 113810254A
Authority
CN
China
Prior art keywords
room
audio output
volume
adjusting
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110188506.XA
Other languages
English (en)
Inventor
M·李
金哲暄
P·邱
M·帕特尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN113810254A publication Critical patent/CN113810254A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2805Home Audio Video Interoperability [HAVI] networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Otolaryngology (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请涉及动态调节音频输出装置的设置的系统、方法和介质。一种计算机实现的方法包括:在第一房间中检测第一音频输出,并且在第二房间中检测第一音频输出的一部分;确定第二房间中的第一音频输出的所述部分是否满足触发要求;以及对于确定所述部分满足触发要求,提供动作以减小第二房间中的第一音频输出的所述部分。

Description

动态调节音频输出装置的设置的系统、方法和介质
技术领域
示例实现方式的各方面涉及与动态地调节音频输出装置的设置以减少相邻空间中的噪声关联的方法、系统和用户体验。
背景技术
在现有技术环境中,声音和语音可从一个房间或区域传递到相邻房间或区域。这种传递可能使房间之一的居住者受到来自另一房间的不想要的噪声打扰。现有技术的方法没有提供估计一个房间中(例如,由人或装置)生成的多少声音传递到另一房间的方式。
根据一个现有技术情况,在住宅中,睡着的孩子可能在一个房间,而父母可能在附近的房间,正在电视上看电影。例如,睡着的孩子可能在客厅中的人旁边的卧室中。客厅中的电视生成的声音可能传递到卧室,并且打扰睡着的孩子。此外,客厅中的电视生成的声音可能传递到另一相邻空间,例如敏感的邻居、人电话会议室或者不希望受电视的噪声打扰的任何人。
在现有技术环境中,该问题难以解决,因为声音音量、频率和节奏可为动态的。在一个时间点测量到另一空间的声音传递可能无法准确地反映另一时间的测量,因为声音的音量、频率和节奏变化。
在上述电视的现有技术环境示例中,声级横跨场景(安静的对话或者喧闹的爆炸或动作)动态地并且常常急剧地改变。基于开始场景设定电影的音量可能由于在喧闹场景期间产生的噪声而太高,或者太低,因此降低看电视的乐趣。
另外,声音传递还可基于环境的改变而变化,例如打开的门、加热通风口、温度、湿度、压力等。例如,当打开通往卧室的门时,来自客厅中的电视的声音传递增加。门关闭时设定音量对于门打开时将太大,而门打开时设定音量可能降低噪声的可能,但是可能降低看电视的乐趣。
试图将声源自动地调节至精确级别以保持声音的传递和可接受级别的现有技术方法也可能遇到挑战。例如,声源可能未知。换言之,需要调节的装置和房间或者精确的减小级别可能需要在相邻空间中多次尝试检查和倾听。
因此,本领域中仍需要动态地且自动地调节特定声源(例如,装置和/或环境),以维持从一个空间到另一空间的声音传递低于特定阈值。
发明内容
根据示例实现方式的一方面,提供了一种计算机实现的方法,该方法包括以下步骤:在第一房间中检测第一音频输出,并且在第二房间中检测第一音频输出的一部分;确定第二房间中的第一音频输出的所述部分是否满足触发要求;以及对于确定所述部分满足触发要求,提供动作以减小第二房间中的第一音频输出的所述部分。
示例实现方式还可包括一种非暂时性计算机可读介质,其具有存储装置和处理器,该处理器能够执行与动态地调节音频输出装置的设置以减少相邻空间中的噪声关联的指令。
附图说明
本公开的实施方式的关于其结构和操作的细节可通过研究附图来部分地搜集,附图中相似的标号表示相似的部分,并且附图中:
图1是示例实现方式的功能框图;
图2是与使用安静房间中的音频流来测量来自源房间的噪声级别关联的示例实现方式的功能框图;
图3是与对于安静房间和源房间二者生成噪声,并且估计来自源房间的音频流的分量,以确定源房间中的动作是否将减少噪声关联的示例实现方式的功能框图;
图4A和图4B是根据本公开的方法的示例实现方式的流程图;
图5是根据本公开的计算环境的示例实现方式的功能框图;以及
图6是根据本公开的示例性操作环境的功能框图。
具体实施方式
以下详细描述提供了本申请的附图和示例实现方式的进一步的细节。为了清晰,附图之间的冗余元件的标号和描述被省略。贯穿说明书使用的术语作为示例提供,并非旨在限制。
示例实现方式的各方面涉及为设置偏好使用智能扬声器、传感器和用户接口。更具体地,示例实现方式包括诸如装置(智能或非智能)和/或环境的特定声源的动态和自动调节,以维持从一个空间到另一空间的声音传递低于阈值。
根据示例实现方式,放置在房间中的带麦克风的智能扬声器估计从一个空间到另一空间的声音传递。生成声音的房间在本文中可被称为“源房间”,要使声音或噪声最小化的房间在本文中可被称为“安静房间”。例如但非限制,源房间可以是客厅或会议室,安静房间可以是卧室或相邻会议室。各个房间可具有可感测在该房间中可听到的声音的带麦克风的智能扬声器。
通过分析源房间和安静房间的音频流,示例实现方式检测安静房间中的多少声音可归因于源房间。该分析可考虑音频流的音量、频率和模式,以识别安静房间中存在多少源声音。
在第一使用情况下,安静房间可能本身没有声音源。因此,安静房间中的智能扬声器所检测的声音完全源自与源房间关联的噪声。如果在安静房间中感测到的与源房间关联的噪声高于音量、频率和/或节奏级别的阈值,则可调用动作以将安静房间中的噪声减少至阈值以下。
然而,安静房间也可能生成一些声音。例如,安静房间可能生成打鼾声、白噪声等。在这种情况下,必须确定安静房间中的音频流的哪些分量来自安静房间本身内,噪声的哪些分量来自源房间。这里,示例实现方式可从安静房间的音频流减去源房间的音频流(可选地,可乘以衰减因子)。
所得的差将是源自源房间的声音的估计。相反,可从源房间执行类似感测,使得所得的差将是源自安静房间的声音的估计。在这两种情况下,如果差导致高于音量、频率和/或节奏级别的阈值的噪声估计,则可调用动作以将噪声减少至阈值以下。
尽管上述示例实现方式针对存在源房间和安静房间的情况,但是本示例实现方式不限于此。例如但非限制,可存在不止一个源房间,使得噪声可来自多个源房间,例如与安静房间相邻的客厅、厨房、洗衣机房等。另选地,可存在多个安静房间(例如,卧室),使得噪声可源自单个源房间并被传输到多个安静房间(例如,彼此相邻的多个卧室)。
图1是示例实现方式的功能框图100。更具体地,示出多个房间。这里,源房间101与安静房间103具有相邻墙壁,并且安静房间13具有与另一源房间105相邻的另一墙壁。各个房间中设置有智能扬声器,智能扬声器具有音频传感器(例如,麦克风),以感测该房间内的音频。此外,如源房间101中所示,一个或更多个连接的装置107(例如电视,但不限于此)设置在房间内。此外,房间内的噪声可能是由连接的装置107,或者由其它源导致的,例如109处所示可能正在说话的一个或更多个人。
房间101、103、105中的每一个中的智能扬声器与Wi-Fi路由器113通信。因此,音频流被传输至Wi-Fi路由器113,Wi-Fi路由器113继而可将信号传输至云服务器或服务器115。另选地,处理器可与可执行本文所描述的操作的Wi-Fi路由器关联。另外,一个或更多个用户可经由诸如仪表板111的用户接口来控制与示例实现方式关联的设置。
Wi-Fi路由器113可将信号传输回到房间101、103、105中的每一个的智能扬声器。例如,Wi-Fi路由器113可将音频流传输到智能扬声器,将音量控制或其它设置传输到连接的装置107,或者将通知传输到与用户109关联的装置。
因此,区域内的智能扬声器或其它装置可检测和估计噪声源。可调用动作以减少噪声,并且与噪声的检测、估计和控制关联的阈值程序可由用户控制。此外,系统可自动地校准。
如上面说明的,示例实现方式可确定安静房间中的声级超过阈值(例如,用户配置的阈值)。因此,可调用一个或更多个动作以将噪声减少至阈值以下。例如但非限制,可为源房间中的用户生成通知。该通知可提供将源自源房间的声音的音量、频率或节奏减小特定量的指示,以将噪声减少至阈值以下。例如但非限制,通知可由智能扬声器,经由移动装置、房间中的显示器或者本领域技术人员将理解的其它方式传送。
除了上述示例动作之外,可调用其它动作。例如但非限制,可将智能扬声器的最大音量或其它声音特性降低至源房间中的特定级别,可按照降低传递的声音特性(例如,低音、高音等)的方式调节音频播放装置的均衡,或者可将最大音量或其它声音特性降低至源房间中的其它智能连接的装置(例如,智能TV、计算机、平板计算机、电话、扬声电话、门铃等)的特定级别。
可调用的另一示例动作包括调节定向扬声器的取向,以避免声音传递到安静房间。该调节可将音频输出直接引导向用户,或者将音频输出朝着不与安静房间相邻的墙壁引导,以防止不必要的传递。
根据此示例实现方式,定向扬声器可按编程方式移动(例如,在连接到服务器的万向接头上)。另选地,可提供动作以针对源房间中的连接的装置(例如,包括洗衣机或搅拌器的电器、门铃等)关闭电源或改变其设置。
动作还可包括安静房间中的活动。例如但非限制,可在安静房间中触发白噪声生成器以提供一定级别的输出、回放白噪声、按一定级别运行风扇或HVAC等。此动作可具有降低或消除安静房间中的用户听到来自安静房间外部的噪声的能力的效果。
在上述示例实现方式中,当连接的装置是噪声源时,系统可按闭环感测和执行动作,直至噪声低于阈值。
动作可手动地、自动地、随机地或者以本领域技术人员将理解的任何其它手段确定。此外,可按串行、并行或其组合执行一个或更多个动作。
除了通过噪声级别的阈值触发之外,示例实现方式还可基于事件来触发。例如,感测房间内的事件可触发一个或更多个动作。可在源房间或安静房间或二者内检测事件,其可暂时改变一个或两个房间中的装置的音量。例如但非限制,在源房间中,用户可能正在看电视,并且接到电话呼叫。示例实现方式可检测到电话呼叫,并且在通话期间自动地减小电视的音量,然后在通话终止之后自动地增大电视的音量。
根据另一示例使用情况,在工作场所,可存在两个相邻的办公室。当作为安静房间的第二办公室中的用户接到电话呼叫时,第一办公室中的用户可能正在听音乐。为了保护第二办公室中的电话交谈的隐私,采取动作以将第一办公室中的音乐的音量暂时增大到略高的级别,以使得第一办公室中的用户无法听到相邻办公室中的语音交谈。另选地,动作可包括在第二办公室中播放混合来自电话呼叫的语音声音的环境音乐,以使得传递到第一办公室的语音更难以检测和辨认。
在上述示例实现方式中,可通过语音模式(例如,单边谈话)或以编程方式检测电话呼叫或视频呼叫。例如但非限制,用户的电话或视频呼叫账户上的API可按编程方式提供必要检测以触发动作。类似地,在面对面交谈或会议的情况下(例如,在会议室中),可类似地检测语音模式以触发动作。
根据示例实现方式,用户可控制阈值。例如,用户可通过将智能扬声器置于诸如“免打扰”的模式来手动地激活系统(例如,利用语音命令或自动地)。类似地,可例如通过web接口向用户提供诸如可访问的仪表板的用户体验。因此,用户可在仪表板中为各个房间配置噪声阈值。
用户还可使用仪表板来连接到可能生成噪声的智能装置(例如,网络上的或与用户关联的那些),指派那些装置放置在哪里,并且指定对装置上可采取的动作的限制。例如但非限制,用户可允许电视的音量减小最大量(例如,50%),或者决不允许将音量降低规定音量的动作,以便避免观看和收听节目或者体验观看和收听节目。
此外,根据示例实现方式,可执行校准。更具体地,校准可估计不同声音传递到相邻空间中的程度如何。声音“测试模式”可由源房间中的电视播放,以覆盖音量、频率和节奏的各种值。同时,安静房间中的智能扬声器可感测那些声音从源衰减或传输的程度如何。
结果,可生成噪声传递墙壁/房间的独特分布,其可用于确定哪些声音可能在安静房间中导致噪声。因此,仅当检测到那些声音时才可触发动作,可调节声源的均衡以使可传输的声音最小化,或者可抢先警告用户避开可能生成那些类型的声音的某些媒体(例如,电视上喧闹的节目)。
图2是与使用安静房间中的音频流来测量来自源房间的噪声级别关联的示例实现方式200的功能框图。更具体地,公开了源房间201和安静房间203。在源房间201中,装置207生成输出,并且麦克风205(例如,智能扬声器)感测装置207的输出。源房间的音频流被识别为209处的A。
对于安静房间203,假设从安静房间本身内没有生成声音,麦克风211(例如,智能扬声器)可感测在安静房间中接收的音频,识别为215处的A’。用户可存在于安静房间中,例如在床213上。
如果A’的值超过阈值(例如,由用户确定的阈值),则可确定采取动作。如本文中所说明的,该动作可按照将215处的A’所表示的安静房间内的声音减小至等于或低于阈值的值的方式来调节209(噪声源)处的A的值。
图3是与使用安静房间中的音频流来测量来自源房间的噪声级别关联的示例实现方式300的功能框图。更具体地,公开了源房间301和安静房间303。在源房间301中,装置307生成输出,并且麦克风305(例如,智能扬声器)感测装置307的输出。源房间的音频流被识别为具有309处的分量A(代表在源房间301中生成的声音)和317处的分量B’(代表来自安静房间303的噪声)。
对于安静房间303,从安静房间本身内生成声音,如319处的B所指示。例如但非限制,收音机上可能正在播放摇篮曲,以帮助安静房间303中的婴儿入睡。麦克风311(例如,智能扬声器)可感测在安静房间中接收的作为来自源房间的噪声的音频,识别为315处的A’。用户可存在于安静房间中,例如在床313上。
通过观察来自各个扬声器的音频流,可生成来自另一空间的声音的估计。然后,可执行减法以确定哪一噪声来自另一空间,哪一噪声来自房间,这继而可用于确定来自另一房间的噪声是否超过阈值。
对于源房间301,在源房间中生成的声音的估计被生成为Aest=S-αQ,其中,S=(A+B’),α表示衰减因子(例如,与第一房间和第二房间之间的声音传递关联的因子,在校准期间确定)。可针对各种房间中的音频输出装置并且基于各种墙壁材料、厚度等生成各种分布。要注意的是,Q=(B+A’)。对于安静房间303,在源房间中生成的声音的估计被生成为Best=Q-αS。此外,值A’est=Q-Best=(B+A’)-Best。
如果A’est的值超过阈值(例如,由用户确定的阈值),则可确定采取动作。如这里所说明的,该动作可按照将315处的A’所表示的安静房间内的声音减小至等于或低于阈值的值的方式来调节309(噪声源)处的A的值。
图4A和图4B是根据本公开的方法的实施方式的流程图。方法400可由计算环境(例如,下述计算环境)中的一个或更多个处理器实现。如图4A所示,方法400可以是多个子过程的组合,包括在401实时检测声音并识别第一房间和第二房间中的声音分量的源、在402确定与触发关联的条件以及在403基于触发调用动作。
更详细地,图4B示出根据示例实现方式的方法400的检测401、确定402和动作403的更多细节。元素405-420表示与检测401关联的附加细节,元素425-445表示与确定402关联的附加细节,元素450表示与动作403关联的附加细节。
在方框405,源房间装置在源房间中生成输出。另选地,输出可能不是由装置生成的源,而是由说话或发出噪声的人生成的源。
在方框410,源房间中的麦克风感测源房间装置的输出。更具体地,实时检测声音,并且识别声音分量的源。
在方框415,安静房间装置在安静房间中生成输出。另选地,输出可能不是由装置生成的源,而是由说话或发出噪声的人生成的源。
在方框420,安静房间中的麦克风感测安静房间装置的输出。更具体地,实时检测声音,并且识别声音分量的源。
在方框425,对于源房间,针对源房间中生成的声音生成估计,减去乘以衰减因子的来自安静房间的声音。
在方框430,对于安静房间,针对安静房间中生成的声音生成估计,减去在源房间中生成的声音。
在方框435,对于安静房间,针对安静房间所接收的源房间中生成的声音生成估计。
在方框440,在安静房间所接收的源房间中生成的噪声级别之间进行比较,以确定该值是否超过阈值(可以是用户确定的阈值)。
在方框445,基于比较结果,确定触发是否已激活。
在方框450,对于激活的触发,调用动作。
图5是根据本公开的计算环境的实施方式的功能框图。计算环境500具有适合用于一些示例实现方式中的示例计算机装置505。计算环境500中的计算装置505可包括一个或更多个处理单元、核或处理器510、存储器515(例如,RAM、ROM等)、内部存储装置520(例如,磁、光学、固态存储装置和/或有机存储装置)和/或I/O接口525,其中任一个可联接在用于通信信息的通信机构或总线530上或嵌入在计算装置505中。例如,环境500可支持与系统100关联的操作。
根据本示例实现方式,与神经活动关联的处理可发生在作为中央处理单元(CPU)的处理器510上。另选地,在不脱离本发明构思的情况下,可由其它处理器代替。例如但非限制,图形处理单元(GPU)和/或神经处理单元(NPU)可代替或与CPU组合使用以执行上述示例实现方式的处理。
计算装置505可在通信上联接到输入/用户接口535和输出装置/接口540。输入/用户接口535和输出装置/接口540中的任一者或两者可以是有线或无线接口并且可为可拆卸的。输入/用户接口535可包括可用于提供输入的任何装置、组件、传感器或接口(物理的或虚拟的)(例如,按钮、触摸屏接口、键盘、指点/光标控制、麦克风、相机、盲文、运动传感器、光学读取器等)。
输出装置/接口540可包括显示器、电视、监视器、打印机、扬声器、盲文等。在一些示例实现方式中,输入/用户接口535(例如,用户接口)和输出装置/接口540可被嵌入或物理联接到计算装置505。在其它示例实现方式中,其它计算装置可用作用于计算装置505的输入/用户接口535和输出装置/接口540或者提供用于计算装置505的输入/用户接口535和输出装置/接口540的功能。
计算装置505的示例可包括(但不限于)高度移动装置(例如,智能电话、车辆和其它机器中的装置、人和动物携带的装置等)、移动装置(例如,平板计算机、笔记本计算机、膝上型计算机、个人计算机、便携式电视、收音机等)以及不是为移动性设计的装置(例如,台式计算机、服务器装置、其它计算机、信息亭、嵌入有和/或联接有一个或更多个处理器的电视、收音机等)。
计算装置505可(例如,经由I/O接口525)在通信上联接到外部存储装置545和网络550以用于与任何数量的联网组件、装置和系统通信,包括相同或不同配置的一个或更多个计算装置。计算装置505或任何连接的计算装置可用作、提供其服务或被称为服务器、客户端、精简服务器、通用机器、专用机器或另一标签。例如但非限制,网络550可包括块链网络和/或云。
I/O接口525可包括(但不限于)使用任何通信或I/O协议或标准(例如,以太网、802.11xs、通用系统总线、WiMAX、调制解调器、蜂窝网络协议等)以用于至少向和/或从计算环境500中的所有连接的组件、装置和网络通信信息的有线和/或无线接口。网络550可以是任何网络或网络组合(例如,互联网、局域网、广域网、电话网络、蜂窝网络、卫星网络等)。
计算装置505可使用计算机可用或计算机可读介质(包括暂时性介质和非暂时性介质)和/或使用其通信。暂时性介质包括传输介质(例如,金属线缆、光纤)、信号、载波等。非暂时性介质包括磁介质(例如,磁盘和磁带)、光学介质(例如,CD ROM、数字视频盘、蓝光盘)、固态介质(例如,RAM、ROM、闪存、固态存储装置)以及其它非易失性存储装置或存储器。
计算装置505可用于在一些示例计算环境中实现技术、方法、应用、处理或计算机可执行指令。计算机可执行指令可从暂时性介质检索,以及被存储在非暂时性介质上并从其检索。可执行指令可源自任何编程、脚本和机器语言(例如,C、C++、C#、Java、VisualBasic、Python、Perl、JavaScript等)中的一个或更多个。
处理器510可在本机或虚拟环境中在任何操作系统(OS)(未示出)下执行。可部署一个或更多个应用,其包括逻辑单元555、应用编程接口(API)单元560、输入单元565、输出单元570、检测单元575、确定单元580、预测单元585以及用于不同单元(例如,编码110和解码器120)彼此通信、与OS通信以及与其它应用(未示出)通信的单元间通信机制595。
对于源房间和安静房间,检测单元575可执行与检测声音并识别声音的源关联的功能。确定单元580可执行与确定声音分量,执行减法,并将安静房间中的来自源房间的声音的声级与阈值进行比较关联的功能。动作单元585可执行与基于触发的动作关联的功能。
例如,除了方法300和方法400之外,检测单元575、确定单元580和动作单元585可实现上面关于上述结构示出的一个或更多个处理。所描述的单元和元件的设计、功能、配置或实现方式可变化,不限于所提供的描述。
在一些示例实现方式中,当通过API单元560接收到信息或执行指令时,可将其通信到一个或更多个其它单元(例如,逻辑单元555、输入单元565、检测单元575、确定单元580和预测单元585)。
在一些情况下,逻辑单元555可被配置为控制单元之间的信息流并引导在上述一些示例实现方式中API单元560、输入单元565、检测单元575、确定单元580和动作单元585所提供的服务。例如,一个或更多个处理或实现方式的流程可由逻辑单元555单独控制或结合API单元560控制。
图6是根据本公开的示例性操作环境的功能框图。环境600可适合于本文所公开的一些示例实现方式。环境600包括装置605-645,并且各个装置经由例如网络660(例如,通过有线和/或无线连接)在通信上连接到至少一个其它装置。一些装置可在通信上连接到一个或更多个存储装置630和645。
一个或更多个装置605-645的示例可分别是图5中描述的计算装置505。装置605-645可包括但不限于如上所述具有监视器和关联的网络摄像机的计算机605(例如,膝上型计算装置)、移动装置610(例如,智能电话或平板计算机)、电视615、与车辆620关联的装置、服务器计算机625、计算装置635-640、存储装置630和645。
在一些实现方式中,装置605-620可被视为与用户关联的用户装置,这些用户可远程地获得用作上述示例实现方式的输入的感测的音频输入。在本示例实现方式中,如上所述,这些用户装置605-620中的一个或更多个可与可感测本示例实现方式所需的信息的一个或更多个传感器(例如,用户的电话中的麦克风)关联。
尽管提供了上述示例实现方式以指示本发明范围,但它们并非旨在限制,在不脱离本发明范围的情况下,可替换或添加其它方法或实现方式。例如但非限制,本示例实现方式可在视频会议软件或系统的环境中采用。根据一个示例实现方式,源房间可与安静房间相邻,安静房间是正在进行视频会议的房间。
当相邻房间中的噪声超过由视频会议软件或系统确定的阈值级别,使得其他远程用户由于来自邻近房间的过多背景噪声而无法听到安静房间中的说话者时,视频会议系统或软件发送信号以触发动作。结果,例如但非限制,触发的动作可为一个或更多个邻近房间提供降低噪声级别的机制,以使得安静房间中的说话者可参与会议。
相反,视频会议室可被表征为源房间,并且邻近房间保持为安静房间。因此,如果视频会议中的说话者说话太大声以至于打扰房间中的人,则可向说话者提供通知以降低他或她的音量,以不打扰一个或更多个房间中的人。在一些示例意图中,用于视频会议的软件系统将视频会议的说话者的位置同时视为源房间安静房间。
根据另一示例实现方式,可在源房间中由电器生成噪声。例如但非限制,洗衣间中的洗衣机或干衣机可能生成噪声。洗衣间中的麦克风或传感器可检测噪声,或者电器是基于其操作知道其噪声级别的智能连接的装置。在这种情况下,洗衣间被视为源房间。对于作为安静房间的相邻房间,如果来自洗衣间的噪声超过阈值,使得安静房间中的人无法享受期望的活动(例如,阅读、看电视、听音乐等),则可触发阈值。
例如,噪声超过规定级别,可触发阈值。另选地,安静房间中的用户可调用手动触发。因此,电器可切换为“安静”模式,暂停操作,自动关闭房间的门,提供白噪声或其它干扰,或者采取如上面说明的动作。在此示例实现方式中,可基于相邻安静房间中正在执行的活动来确定阈值或电器。
另外,如上面说明的,示例实现方式可采用智能扬声器。然而,本示例实现方式不限于此,在不脱离发明范围的情况下,其它装置可取代。例如,但非限制,横跨多个房间采用传感器的智能家庭装置可横跨多个房间集中控制阈值和动作。类似地,对于办公室设置中的相邻房间(例如,会议室),也可采用此方法,其中各个房间被视为源房间和安静房间二者,并且针对相邻房间在两个方向上提供动作。
根据另一示例实现方式,与用户或特定房间关联的日历或调度器可与上述示例实现方式集成。例如但非限制,当会议室被预留时,可采取动作以使得相邻房间中的用户很难听到预留房间中的交谈。此外,可向调度功能提供关于相邻房间的噪声级别的信息,以提供会议时间的推荐以使相邻房间的交叠最小化。
在存在并排会议室噪声的情况下,可向任一个或两个房间中的用户提供他们的声音在相邻房间中可被听到的指示。此外,可采取动作(例如,白噪声、关门、向用户提供通知等),以帮助会议室的用户避免机密信息被透露。
尽管本文所描述的环境与家庭和办公室空间关联,但是本示例限制不限于此。例如但非限制,本示例实现方式可在图书馆设置中采用,其中房间通常期望尽可能安静,并且当可识别和检测源噪声时能够采取动作。类似地,在彼此相邻的书亭或工作间(例如,工作室、小隔间等)中,各个相邻房间可被视为源房间和/或安静房间,以实现上述示例实现方式。
尽管不是必需的,上述示例实现方式可具有各种优点和益处。例如但非限制,现有技术方法可提供用于设定最大音量以及各个扬声器组扬声器的音频回放的同步,或者提供了设定智能扬声器的音频输出音量匹配所接收的输入的音量的方法。然而,这些现有技术方法仅提供用于音量控制或不同应用,而与控制第一空间中的音频以保持第二空间安静无关。
另外,一些现有技术方法可按照使用移动电话优化房间位置中的声音的方式横跨扬声器调节均衡。其它现有技术方法可感测房间的声学环境,并且调节扬声器的输出,优化声音质量,并且可选地利用扬声器阵列改变声音的方向。然而,那些现有技术方法没有控制从第一房间到第二房间的声音传递并且尽可能维持源房间中的音频质量,而仅仅使源房间静音。
此外,现有技术方法可提供定向音频扬声器,包括音频、单波束或多波束音频,以及提供用于仅降低一个方向上的音量,例如当用户可能正在对智能扬声器说话时。然而,现有技术方法没有提供在源房间和安静房间之间确定和提供反馈的方式。
尽管已示出和描述了一些示例实现方式,但是提供这些示例实现方式是为了将本文所描述的主题传达给熟悉本领域的人。应该理解,本文所描述的主题可按照各种形式实现,而不限于所描述的示例实现方式。本文所描述的主题可在没有那些具体定义或描述的事项或者具有未描述的其它或不同元件或事项的情况下实践。熟悉本领域的人将理解,在不脱离本文中所描述的如所附权利要求及其等同物中限定的主题的情况下,可对这些示例性实现方式进行改变。
本公开的某些非限制性实施方式的各方面解决了上面讨论的特征和/或上面未描述的其它特征。然而,非限制性实施方式的各方面不需要解决上述特征,本公开的非限制性实施方式的各方面可不解决上述特征。

Claims (20)

1.一种计算机实现的方法,该方法包括以下步骤:
检测步骤,在第一房间中检测第一音频输出,并且在第二房间中检测所述第一音频输出的一部分;
确定步骤,确定所述第二房间中的所述第一音频输出的所述部分是否满足触发要求;以及
执行步骤,对于确定所述部分满足所述触发要求,提供动作以减小所述第二房间中的所述第一音频输出的所述部分。
2.根据权利要求1所述的方法,其中,提供所述动作的步骤包括下列中的一个或更多个:向所述第一房间中的用户提供将所述第一音频输出的音量、频率或节奏降低一定量的通知;自动地调节所述第一房间中的所述第一音频输出的最大音量、低音或高音中的一个或更多个;调节所述第一房间中的所述第一音频输出的均衡;调节生成所述第一音频输出的定向扬声器的取向;调节所述第一房间中的所述第一音频输出的功率级别或设置;或者在所述第二房间中生成白噪声生成器以提供一定级别的输出,以减小所述第二房间中检测到的所述第一音频输出的一部分。
3.根据权利要求1所述的方法,其中,当所述第一房间中的一个或更多个连接的装置是噪声源时,所述检测步骤、所述确定步骤和所述执行步骤是闭环执行的动作,直至所述第二房间中的所述第一音频输出的所述部分低于阈值。
4.根据权利要求1所述的方法,其中,触发基于所述第二房间中的所述第一音频输出的所述部分的估计超过阈值级别,或者基于感测事件。
5.根据权利要求4所述的方法,其中,所述阈值级别由用户响应于对用户接口的输入来确定。
6.根据权利要求4所述的方法,其中,所述感测事件包括所述第一房间中的电视和所述第二房间中的电话会议中的一个或更多个,并且所述动作包括下列中的一个或更多个:在所述电话会议期间自动地减小电视的音量;以及在所述电话会议已终止之后自动地增大所述电视的音量。
7.根据权利要求1所述的方法,该方法还包括以下步骤:通过在所述第一房间中针对音量、频率和节奏的各种值生成测试模式,并且在所述第二房间中感测从所述第一房间发送的所述测试模式的衰减,执行校准以估计所述第一房间和所述第二房间之间的声音传递。
8.一种包括能够在处理器上执行的指令的非暂时性计算机可读介质,所述指令包括:
检测步骤,在第一房间中检测第一音频输出,并且在第二房间中检测所述第一音频输出的一部分;
确定步骤,确定所述第二房间中的所述第一音频输出的所述部分是否满足触发要求;以及
执行步骤,对于确定所述部分满足所述触发要求,提供动作以减小所述第二房间中的所述第一音频输出的所述部分。
9.根据权利要求8所述的非暂时性计算机可读介质,其中,提供所述动作包括下列中的一个或更多个:向所述第一房间中的用户提供将所述第一音频输出的音量、频率或节奏降低一定量的通知;自动地调节所述第一房间中的所述第一音频输出的最大音量、低音或高音中的一个或更多个;调节所述第一房间中的所述第一音频输出的均衡;调节生成所述第一音频输出的定向扬声器的取向;调节所述第一房间中的所述第一音频输出的功率级别或设置;或者在所述第二房间中生成白噪声生成器以提供一定级别的输出,以减小所述第二房间中检测到的所述第一音频输出的一部分。
10.根据权利要求8所述的非暂时性计算机可读介质,其中,当所述第一房间中的一个或更多个连接的装置是噪声源时,所述检测步骤、所述确定步骤和所述执行步骤是闭环执行的动作,直至所述第二房间中的所述第一音频输出的所述部分低于阈值。
11.根据权利要求8所述的非暂时性计算机可读介质,其中,触发基于所述第二房间中的所述第一音频输出的所述部分的估计超过阈值级别,或者基于感测事件。
12.根据权利要求11所述的非暂时性计算机可读介质,其中,所述阈值级别由用户响应于对用户接口的输入来确定。
13.根据权利要求11所述的非暂时性计算机可读介质,其中,所述感测事件包括所述第一房间中的电视和所述第二房间中的电话会议中的一个或更多个,并且所述动作包括下列中的一个或更多个:在所述电话会议期间自动地减小电视的音量;以及在所述电话会议已终止之后自动地增大所述电视的音量。
14.根据权利要求8所述的非暂时性计算机可读介质,其中,通过在所述第一房间中针对音量、频率和节奏的各种值生成测试模式,并且在所述第二房间中感测从所述第一房间发送的所述测试模式的衰减,执行校准以估计所述第一房间和所述第二房间之间的声音传递。
15.一种系统,该系统包括:
第一传感器,该第一传感器被配置为在第一房间中检测第一音频输出;
第二传感器,该第二传感器被配置为在第二房间中检测所述第一音频输出的一部分;以及
处理器,该处理器确定所述第二房间中的所述第一音频输出的所述部分是否满足触发要求,并且对于所述部分满足所述触发要求,提供动作以减小所述第二房间中的所述第一音频输出的所述部分。
16.根据权利要求15所述的系统,其中,所述动作包括下列中的一个或更多个:向所述第一房间中的用户提供将所述第一音频输出的音量、频率或节奏降低一定量的通知;自动地调节所述第一房间中的所述第一音频输出的最大音量、低音或高音中的一个或更多个;调节所述第一房间中的所述第一音频输出的均衡;调节生成所述第一音频输出的定向扬声器的取向;调节所述第一房间中的所述第一音频输出的功率级别或设置;或者在所述第二房间中生成白噪声生成器以提供一定级别的输出,以减小所述第二房间中检测到的所述第一音频输出的一部分。
17.根据权利要求15所述的系统,其中,触发基于所述第二房间中的所述第一音频输出的所述部分的估计超过阈值级别,或者基于感测事件。
18.根据权利要求17所述的系统,其中,所述阈值级别由用户响应于对用户接口的输入来确定。
19.根据权利要求17所述的系统,其中,所述感测事件包括所述第一房间中的电视和所述第二房间中的电话会议中的一个或更多个,并且所述动作包括下列中的一个或更多个:在所述电话会议期间自动地减小电视的音量;以及在所述电话会议已终止之后自动地增大所述电视的音量。
20.根据权利要求15所述的系统,其中,通过由所述第一房间中的音频输出装置在所述第一房间中针对音量、频率和节奏的各种值生成测试模式,并且所述第二传感器在所述第二房间中感测从所述第一房间发送的所述测试模式的衰减,所述处理器执行校准以估计所述第一房间和所述第二房间之间的声音传递。
CN202110188506.XA 2020-06-16 2021-02-19 动态调节音频输出装置的设置的系统、方法和介质 Pending CN113810254A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/903,149 2020-06-16
US16/903,149 US11405735B2 (en) 2020-06-16 2020-06-16 System and method for dynamically adjusting settings of audio output devices to reduce noise in adjacent spaces

Publications (1)

Publication Number Publication Date
CN113810254A true CN113810254A (zh) 2021-12-17

Family

ID=78826249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110188506.XA Pending CN113810254A (zh) 2020-06-16 2021-02-19 动态调节音频输出装置的设置的系统、方法和介质

Country Status (3)

Country Link
US (1) US11405735B2 (zh)
JP (1) JP2021197727A (zh)
CN (1) CN113810254A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277931A (zh) * 2022-06-27 2022-11-01 北京小米移动软件有限公司 信息提示方法、信息提示装置及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11804113B1 (en) * 2020-08-30 2023-10-31 Apple Inc. Visual indication of audibility

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754546B1 (en) * 1997-10-09 2004-06-22 Interval Research Corporation Electronic audio connection system and methods for providing same
CA2581982C (en) * 2004-09-27 2013-06-18 Nielsen Media Research, Inc. Methods and apparatus for using location information to manage spillover in an audience monitoring system
US9094496B2 (en) * 2010-06-18 2015-07-28 Avaya Inc. System and method for stereophonic acoustic echo cancellation
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US8995687B2 (en) 2012-08-01 2015-03-31 Sonos, Inc. Volume interactions for connected playback devices
US9866964B1 (en) * 2013-02-27 2018-01-09 Amazon Technologies, Inc. Synchronizing audio outputs
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US9445196B2 (en) * 2013-07-24 2016-09-13 Mh Acoustics Llc Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation
WO2020079485A2 (en) * 2018-10-15 2020-04-23 Orcam Technologies Ltd. Hearing aid systems and methods
US11653148B2 (en) * 2019-07-22 2023-05-16 Apple Inc. Modifying and transferring audio between devices

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277931A (zh) * 2022-06-27 2022-11-01 北京小米移动软件有限公司 信息提示方法、信息提示装置及存储介质

Also Published As

Publication number Publication date
JP2021197727A (ja) 2021-12-27
US11405735B2 (en) 2022-08-02
US20210392451A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
US10771742B1 (en) Devices with enhanced audio
JP6397158B1 (ja) 協調的なオーディオ処理
JP6660808B2 (ja) 音声出力制御装置、電子機器、および音声出力制御装置の制御方法
US9620141B2 (en) Speech intelligibility measurement and open space noise masking
JP7275375B2 (ja) オーディオデバイスのコーディネーション
CN113810254A (zh) 动态调节音频输出装置的设置的系统、方法和介质
JP2023542968A (ja) 定位されたフィードバックによる聴力増強及びウェアラブルシステム
US11776555B2 (en) Audio modification using interconnected electronic devices
US9922635B2 (en) Minimizing nuisance audio in an interior space
US11232781B2 (en) Information processing device, information processing method, voice output device, and voice output method
US10812903B2 (en) Remote device configured as automatic controller for audio device
US20180352364A1 (en) Intelligent Dynamic Soundscape Adaptation
WO2020105466A1 (ja) 情報処理装置、及び情報処理方法
Panek et al. Challenges in adopting speech control for assistive robots
JP2018148539A (ja) 情報処理装置およびその制御方法、ならびに制御プログラム
CN109076129A (zh) 将物理共位的设备的麦克风静音
US11900910B2 (en) System and method for automated ambient noise reduction for online meetings
US20230244437A1 (en) Systems and methods to adjust loudness of connected and media source devices based on context
US20230076871A1 (en) Method, hearing system, and computer program for improving a listening experience of a user wearing a hearing device
RU2818982C2 (ru) Управление акустической эхокомпенсацией для распределенных аудиоустройств
US20230229383A1 (en) Hearing augmentation and wearable system with localized feedback
CN109791775A (zh) 耳机控制方法及系统
WO2022186958A9 (en) Systems and methods for noise field mapping using beamforming microphone array
CN117480787A (zh) 用于个性化音频增强的方法和电子装置
Appell et al. Hearing at home

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination