CN102520391B - 认知负荷减少 - Google Patents
认知负荷减少 Download PDFInfo
- Publication number
- CN102520391B CN102520391B CN201110375165.3A CN201110375165A CN102520391B CN 102520391 B CN102520391 B CN 102520391B CN 201110375165 A CN201110375165 A CN 201110375165A CN 102520391 B CN102520391 B CN 102520391B
- Authority
- CN
- China
- Prior art keywords
- sound
- engine
- cognitive load
- environment
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001149 cognitive effect Effects 0.000 title claims abstract description 53
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 230000008859 change Effects 0.000 claims abstract description 17
- 230000007613 environmental effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 36
- 238000010295 mobile communication Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 16
- 238000002955 isolation Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 230000000712 assembly Effects 0.000 description 6
- 238000000429 assembly Methods 0.000 description 6
- 230000019771 cognition Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Stereophonic System (AREA)
Abstract
认知负荷减少系统包括被配置成从相应的一个或多个信号生成器接收一个或多个音频信号的声源位置决定引擎,其中声源位置决定引擎进一步被配置成标识一个或多个音频信号中的至少一个中的两个或更多个分立声源。认知负荷减少系统还包括被配置成评估环境中的环境声音的环境评估引擎。认知负荷减少系统还包括被配置成输出一个或多个音频信号的声音位置引擎,该一个或多个音频信号被配置成使得多个扬声器响应于环境中的其他声音的位置来改变环境中的分立声源中的至少一个的感知位置。
Description
技术领域
本发明涉及语音处理,尤其涉及认知负荷减少。
背景技术
用户可在使用环境中体验许多不同的声音,而这些声音可源自各种源。在存在多个声源的情况下,用户的正在工作的记忆上的负荷(例如,认知负荷)可随着用户试图区分和处理不同的声音而增加。具体地,在用户缺少视觉指示以帮助区分和标识声音的情形中,诸如例如在电话会话期间,这样的认知负荷还可增加。因为增加的认知负荷可导致分心,所以在存在多个声音时减少用户的认知负荷并进而增强用户体验可能是合乎需要的。
发明内容
提供发明内容以便以简化形式介绍将在以下的具体实施方式中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。此外,所要求保护的主题不限于解决在本发明的任一部分中提及的任何或所有缺点的实现。
根据本公开的一个方面,认知负荷减少由一种系统提供,该系统包括被配置成从相应的一个或多个信号生成器接收一个或多个音频信号的声源位置决定引擎,其中声源位置决定引擎还被配置成标识一个或多个音频信号中的至少一个中的两个或更多个分立声源。认知负荷减少系统还包括被配置成评估环境中的环境声音的环境评估引擎。认知负荷减少系统还包括被配置成输出一个或多个音频信号的声音位置引擎,该一个或多个音频信号被配置成使得多个扬声器响应于环境中的其他声音的位置来改变环境中的分立声源中的至少一个的感知位置。
附图说明
图1示出根据本公开的一实施例的示例环境。
图2示出示例认知负荷减少系统。
图3示出认知负荷减少的示例方法的流程图。
图4示出根据本公开的一实施例的改变语音的感知位置的示例。
图5示出根据本公开的一实施例的在车厢内改变感知位置的示例。
图6示意性地示出一非限制性的认知减少系统。
具体实施方式
用户在使用环境中可能体验来自各种源的多个声音,该各种源诸如移动电话、媒体播放器、计算机、其他人等。作为一非限制性示例,图1示出示例环境20,其中用户22体验来自包括移动通信设备24a的各种分立声源24的声音。用户22还体验环境声音,诸如另一个人26的语音。区分并处理来自每个声源24的声音以及环境声音,可能增加用户22的认知负荷,并可能甚至使用户22分心。作为一非限制性示例,这样的环境20可以是车厢。在这样的示例中,用户22可能正在驾驶车辆,而人26可能是该车辆中的乘客。此外,声源24可对应于车辆组件,诸如通知系统、导航系统等,而移动设备24a可以是提供电话对话的音频流的移动电话。由此,减少认知负荷并因而减少司机的分心可能是合乎需要的。
因此,本文公开了涉及认知负荷减少的各实施例,具体地,公开了涉及改变声源的感知位置从而减少用户的认知负荷的各实施例。声源的感知位置可通过调整通过一个或多个扬声器的一个或多个音频流的相对音量、相位、延迟和/或其他属性来改变。应该明白,图1旨在是说明性的,而不是以任何方式进行限制。
现在转向图2,图2示出一示例认知负荷减少系统30。认知负荷减少系统30包括被配置成从相应的一个或多个信号生成器36接收一个或多个音频信号34的声源位置决定引擎32。这样的信号生成器36的示例包括但不限于,移动通信设备36a、通知系统36b、娱乐系统36c、导航系统36d和文本到语音(TTS)系统36e。这样的输入音频流可经由任何合适的机制和/或协议来接收。此外,应该明白,可在同时连接多个电话、TTS、通知系统等。
声源位置决定引擎32可进一步被配置为标识一个或多个音频信号34中的两个或更多个分立声源。在某些实施例中,源隔离引擎38可帮助这种标识。作为示例,对于从移动通信设备36a接收到的音频信号的情况,这样的音频信号是移动通信流(例如,电话会话)。这样的电话会话可以是与单个呼叫者的会话或与多个呼叫者的会话。由此,分立声源可包括移动通信流中的一个或多个分立语音,诸如第一呼叫者、第二呼叫者等。由此,源隔离引擎38可帮助标识流中的每一呼叫者。
可使用任何合适的方法来标识单个音频信号中的两个或更多个分立声源。在某些实施例中,音频信号可包括标识不同声源的元数据和/或其他标识符。在某些实施例中,音频信号可由于信号中存在各种声源而不包括任何信息或提示。在这些实施例中,音频信号可被处理以标识不同的声源。这可经由音调检测和隔离、语音识别算法、信号处理和/或任何其他合适的方法来完成。
声源位置决定引擎32可被配置成在新的流被激活时布置该新的流和内容。此外,在某些实施例中,声源位置决定引擎32可做出各种判断,诸如是否要在空间上移动源、当前流中是否存在语音、将源移动到哪里(例如,基于哪些其他的源是活动的和/或哪个用户应该听到该源等)等。另外,声源位置决定引擎32可被配置成创建用于声音位置引擎42处的信号处理的一组参数。
认知负荷减少系统30还可包括被配置成评估环境中的环境声音的环境评估引擎40。作为示例,环境评估引擎40可包括被配置成跟踪信号生成器36和/或话筒以询问环境的控制器。例如,在有噪声的环境中,用户可能不一定对来自外围源(例如,社交联网应用)的通知感兴趣。由此,认知负荷减少系统30可基于环境的状态来抑制这样的通知。在某些实施例中,除了评估环境的当前状态之外,环境评估引擎40可进一步被配置为评估环境的初始状态。认知负荷减少系统30随后可使用这样的初始环境信息以用于执行各种校准,诸如校准一个或多个扬声器等。
认知负荷减少系统30还包括被配置成输出一个或多个音频信号的声音位置引擎42。具体地,声音位置引擎42按这样的方式来输出音频信号以使得扬声器44响应于环境中的其他声音(例如,其他音频信号的分立声源34、环境声音等)的位置来改变环境中的分立声源中的至少一个的感知位置。
特定声音的感知位置是用户感知到该声音源自的位置。知道特定声音源自空间中的哪里向用户提供了空间线索,该空间线索帮助用户的大脑处理声音。在存在多个声源时,用户可依赖于这样的空间线索来区分和处理不同的声源。因此,操纵听觉源的感知听觉位置可帮助用户的大脑执行源隔离,并因而可减少用户的认知负荷。
扬声器44可通过操纵音频信号的各方面,包括但不限于,信号幅值、信号相位、每频率基础上的信号相位等,来改变感知位置。此外,在某些实施例中,可延迟整个流,和/或可过滤信号来补偿空间响应。作为一非限制性示例,空间源可能在右扬声器中播放声源1ms之后通过左扬声器播放声源。这造成源离右扬声器较近的印象。在有大量扬声器的情况下,可进一步细化布置。
作为另一示例,音频流可被连续地四处移动以创建清晰的空间线索。例如,在车辆场景的情况下,音频流可被布置在汽车座位的位置处以提供流是源自坐在该座位上的人的假象。此外,可利用除了车载扬声器之外的其他扬声器来进一步提升音频体验。例如,可利用耳机来提供特定的用户音频空间隔离。
声音位置引擎42可被配置成输出音频信号以使得扬声器44用任何合适的方式来改变感知位置。例如,声音位置引擎42可被配置成提供用于扬声器延迟的信号处理以及流混合,并随后将信号提供给扬声器44。这样的扬声器可包括静态扬声器44a(例如,环境中的固定位置处的扬声器),和/或非静态扬声器44b,诸如耳机扬声器、无线因特网扬声器等。声音位置引擎42的这种信号处理以及源隔离引擎38执行的源隔离可尤其有用于数字信号处理(DSP)。
应该明白,本文所述的声音分析和感知位置调整可经由硬件和/或软件来执行。在某些实施例中,低水平的信号处理可由硬件专用的实现、DSP实现和/或软件实现来提供。例如,可利用DSP算法以经由扬声器将音频流移动到不同的空间位置。因为输入通常是软件或硬件流,所以硬件可被配置成对这些流进行操作。这与软件解决方案将在操纵之前数字化全部信号的全硬件流相反。
此外,在某些实施例中,执行这样的调整可包括基于每一流的收听者(例如用户)来确定每一扬声器的加权因子。例如,在某些实施例中,可利用固定的扬声器位置来预先计算加权表,该加权表允许这些算法用软件和/或硬件的快速运行时执行。以此方式,音频流的布置可由更复杂的混合器实现,该混合器允许增益调整、相位延迟、过滤等。作为另一示例,系统可允许将车厢的特定响应考虑在内的频率选择性增益。
现在转向图3,图3示出认知负荷减少的示例方法50。在52,方法50包括初始化环境评估引擎。这可包括执行各种校准来确定环境的初始状态。由此,系统可确定例如用户离每一扬声器的距离,从而系统可确定用户如何感知声音。在某些实施例中,这样的初始化可包括例如校准一个或多个扬声器,如54处所指示的。对于环境是车厢的情况,这可包括校准车辆的扬声器来考虑车辆内可能影响例如司机如何感知声音的对象。应该明白,这样的初始化是非限制性的,且在某些实施例中,认知负荷减少系统可为已知位置预先计算这样的参数。
在56,方法50包括从一个或多个信号生成器接收(例如,在声源位置决定引擎处)音频信号。应该明白,这样的信号生成器可以是被配置成提供包括一个或多个流的音频信号的任何合适的信号生成器。合适的信号生成器的非限制性示例包括移动电话、媒体播放器、计算机等。对于环境是车厢的情况,这样的信号生成器可包括一个或多个车辆信号生成器,诸如通知系统、导航系统、娱乐系统等。
在58,方法50可任选地包括标识一个或多个音频信号中的两个或更多个分立声源。对于电话会话的情况,这可包括标识移动通信流中的分立语音,诸如第一呼叫者、第二呼叫者等。
在60,方法50包括评估环境中的环境声音。环境声音实质上可包括环境中的任何其他声音,诸如乘客语音等。
在62,方法50包括改变至少一个分立声源的感知位置。这可包括将音频事件和/或流(例如,电话会话、音乐、通知、文本到语音等)布置在听觉域(例如,环境)中的不同位置处。由此,声源可被用户感知为源自该位置。
应该明白,感知位置可用任何合适的方式来改变例如,可利用声音位置引擎来执行这样的调整并向扬声器输出信号。在某些实施例中,声音位置引擎可通过将信号输出到不同的扬声器位置来改变感知位置。然而在某些实施例中,声音位置引擎可被配置成调整多个扬声器的相对幅值来改变感知位置。此外,在某些实施例中,声音位置引擎可被配置成调整多个扬声器的相对延迟来改变感知位置。
对电话会话的情况,在62处改变声源的感知位置可包括在空间上隔离(例如,经由声音隔离引擎)移动通信流中的每个分立语音的感知位置。此外,在某些实施例中,声源位置决定引擎可被配置成基于移动通信流中的每个分立语音的活动水平来确定分立语音的优先级排定(例如,健谈的呼叫者比不太健谈的呼叫者具有更高的优先级)。由此,声音位置引擎可基于优先级排定在空间上隔离分立语音(例如,将健谈的呼叫者布置在较显著的感知位置处,诸如车厢的乘客座位,而将不太健谈的呼叫者布置在较不显著的感知位置处,诸如车厢的后排座位)。应该明白,基于优先级排定的这种隔离不限于会议呼叫。作为另一示例,当车辆的前座正处于会议呼叫中时,系统可将在车辆中播放的音乐移动到后排座位。在这种情况下,音乐可被移动到后排扬声器,可使用前排扬声器来例如将参与者置于电话呼叫中。
图4示出在会议呼叫中改变语音的感知位置。在该示例中,用户70处于具有六个分立语音74的会议呼叫72中。在该示例中,会话主要由两个语音主导,即语音74b和语音74d。换言之,语音74b和语音74d比其他语音(即语音74a、语音74c、语音74e和语音74f)在会话中具有更多的活动(例如,更健谈)。由此,在时间t0时描绘的情形的空间环境未被隔离以产生对用户70而言最小的认知负荷。这是因为两个主导说话者(语音74b和语音74d)的感知位置彼此很接近,因而用户70可能不具有空间线索来帮助在两个语音之间进行区分。
因此,认知减少系统可对换语音74a的感知位置和语音74b的感知位置,以及对换语音74d和74f的感知位置,并还和语音74e对话。这可以缓慢地完成从而不使用户70(例如在车辆场景中的司机)分心。因而,在稍后的时间t1,两个主导说话者(语音74b和74d)的感知位置更大程度地在空间上彼此分开。以此方式隔离主导声源允许认知减少系统保持听觉域被各个源稀疏地填充,并因而减少了用户70的认知负荷。
在某些实施例中,声音位置引擎可响应于一个或多个音频信号、用户反馈、一个或多个音频信号预先确定的优先级排定等来改变感知位置。此外,如上所述,声音位置引擎可被配置成确定一个或多个扬声器的加权因子以改变环境中的分立声源之一的感知位置。
具体地,对环境是车厢的情况,声源位置决定引擎可被配置成从相应的一个或多个车辆组件接收音频信号,该组件诸如通知系统、通信系统、娱乐系统、导航系统、文本到语音系统等。声音位置引擎随后可输出音频信号,该音频信号被配置成使得车厢内的扬声器将其他车辆组件(例如,一个或多个车辆组件中的不同组件)的感知位置设置在车厢内的不同位置处。
此外,在某些实施例中,声音位置引擎可被配置成响应于来自车辆中的乘客的声音的位置来改变感知位置。此外,在某些实施例中,音频信号的感知位置可基于该音频信号相对于其他音频信号的预先确定的优先级排定来设置。例如,来自通知系统的音频信号可比来自娱乐系统的音频信号具有更高的优先级。
作为另一示例,与通知系统相关联的流可被布置在司机前方,该位置是司机习惯寻找由通知系统提供的其他通知(诸如可视警报)的位置。在某些实施例中,与通知系统相关联的这样的流可被布置在不同的声学点处,从而警告还可具有声学发音的指示。
作为另一示例,电话会话可被布置在车辆的乘客座位,该位置是司机习惯与实体乘客进行交谈的位置。此外,在图3的58处执行的流隔离允许多人电话呼叫上的不同呼叫者被布置在不同的感知位置处。这允许用户通过使用不同感知位置所提供的空间线索来区分语音,从而减少用户的认知负荷。
图5示出在车厢80中改变感知位置的示例。图5描绘了车辆的司机82,其中车厢80还包括后排乘客84。声源的感知位置可经由认知减少系统来改变,从而在空间上隔离司机82的信号,并因而减少音频源对司机造成的分心。
在该示例中,被配置成输出来自各组件的音频信号的车辆扬声器86贯穿车辆的内部放置(例如,在四个角的每个角上)。此外,认知减少系统可放置蜂窝电话会话以具有乘客座位的感知位置88。以此方式,司机82感知到呼叫者位于乘客座位,司机可能习惯在该位置与实体乘客进行交谈。
来自导航系统的导航命令可被放置成具有司机82前方仪表盘中央的感知位置90,通常在该位置显示其他车辆通知(例如,速度限制警告、安全带警告、传入呼叫通知等)。
这种声源组织为每一源创建了在空间上不同的线索,从而帮助司机对每一流的识别。此外,后排乘客84还可具有认知减少系统所提供的增强的音频体验。例如,后排乘客84可收听来自不同感知位置的音乐和TTS,如92和94处分别所指示的。例如,后排乘客84可经由非固定的便携式扬声器(诸如与在92处所指示的汽车后方的声源通信耦合的耳机)来收听音乐,而TTS系统位于乘客前方在94处,靠近乘客正在观看的视频的屏幕。通过隔离TTS系统,后排乘客84可例如经由语音命令作出选择,而TTS响应不会与音乐在空间上混合。此外,后排乘客84不必停止他的音乐来收听TTS通知。此外,这种配置可帮助阻止TTS和来自他的耳机的音乐使司机82分心。
在某些实施例中,以上所描述的方法和过程可与包括一个或多个计算机的认知减少系统关联。特别地,此处描述的方法和过程可被实现为计算机应用、计算机服务、计算机API、计算机库和/或其他计算机程序产品。
图6示意性示出可以执行上面描述的方法和过程中的一个或更多个方法和过程的非限制性认知减少系统30。以简化形式示出认知减少系统30。应当理解,可使用基本上任何计算机架构而不背离本公开的范围。在不同的实施例中,认知减少系统30可采取车辆计算机、服务器计算机、台式计算机、膝上型计算机、平板计算机、家庭娱乐计算机、网络计算设备、移动计算设备、移动通信设备、游戏设备、云服务等的形式。
认知减少系统30包括逻辑子系统100和数据保持子系统102。认知减少系统30可以任选地包括显示子系统104、通信子系统106和/或在图6中未示出的其他组件。认知减少系统30还可以任选地包括用户输入设备,诸如例如键盘、鼠标、游戏控制器、相机、话筒和/或触摸屏等等。
逻辑子系统100可包括被配置为执行一个或多个指令的一个或更多个物理设备。例如,逻辑子系统可被配置为执行一个或多个指令,该一个或多个指令是一个或多个应用程序、服务、程序、例程、库、对象、组件、数据结构、或其它逻辑构造的部分。可实现此类指令以执行任务、实现数据类型、变换一个或多个设备的状态、或以其它方式得到所需结果。
逻辑子系统可包括被配置成执行软件指令的一个或多个处理器。另外或另选地,逻辑子系统可包括被配置成执行硬件或固件指令的一个或多个硬件或固件逻辑机器。逻辑子系统的处理器可以是单核或多核,且在其上执行的程序可被配置为并行或分布式处理。逻辑子系统可以任选地包括遍布两个或多个设备的独立组件,所述设备可远程放置和/或被配置为进行协同处理。该逻辑子系统的一个或多个方面可被虚拟化并由以云计算配置进行配置的可远程访问的联网计算设备执行。
数据保持子系统102可包括一个或更多个物理、非瞬时设备,这些设备被配置成保持数据和/或可由该逻辑子系统执行的指令,以实现此处描述的方法和过程。在实现这样的方法和过程时,可以变换数据保持子系统102的状态(例如,以保持不同数据)。
数据保持子系统102可以包括可移动介质和/或内置设备。数据保持子系统102尤其是可以包括光学存储器设备(例如,CD、DVD、HD-DVD、蓝光盘等)、半导体存储器设备(例如,RAM、EPROM、EEPROM等)和/或磁存储器设备(例如,硬盘驱动器、软盘驱动器、磁带驱动器、MRAM等)。数据保持子系统102可以包括具有以下特性中的一个或更多个特性的设备:易失性、非易失性、动态、静态、读/写、只读、随机存取、顺序存取、位置可寻址、文件可寻址、以及内容可寻址。在某些实施例中,可以将逻辑子系统100和数据保持子系统102集成到一个或更多个常见设备中,如专用集成电路或片上系统。
如上所述,认知负荷减少系统可包括声源位置决定引擎32、源隔离引擎38、环境评估引擎40和声音位置引擎42。这些组件的各方面可经由逻辑子系统100和/或数据保持子系统102来实现。在某些实施例中,这些组件中的一个或多个可用共享硬件、固件和/或软件来实现,而在其他实施例中,每一组件可用分立的硬件、固件和/或软件来实现。
术语“模块”、“程序”和“引擎”可用于描述被实现以执行一个或更多个具体功能的认知减少系统30的一方面。在某些情况下,可以通过执行由数据保持子系统102所保持的指令的逻辑子系统100来实例化这样的模块、程序或引擎。应当理解,可以从同一应用、服务、代码块、对象、库、例程、API、函数等来实例化不同的模块、程序和/或引擎。同样,可以由不同的应用、服务、代码块、对象、例程、API、函数等来实例化同一模块、程序和/或引擎。术语“模块”、“程序”和“引擎”意在涵盖单个或成组的可执行文件、数据文件、库、驱动程序、脚本、数据库记录等。
应当理解,如此处所使用的“服务”可以是跨越多个用户会话可执行的、而且对一个或更多系统组件、程序和/或其他服务可用的应用程序。在一些实现中,服务可以响应于来自客户端的请求而在服务器上运行。
当被包括时,显示子系统104可用于呈现由数据保持子系统102所保持的数据的可视表示。由于此处所描述的方法和过程改变由数据保持子系统保持的数据,并由此变换数据保持子系统的状态,因此同样可以变换显示子系统104的状态以在视觉上表示底层数据的改变。显示子系统104可以包括使用实际上任何类型的技术的一个或多个显示设备。可将此类显示设备与逻辑子系统100和/或数据保持子系统102一起组合在共享封装中,或此类显示设备可以是外围显示设备。
当被包括在内时,通信子系统106可以被配置成将认知减少系统30与一个或更多个其他计算设备通信地耦合。通信子系统106可包括与一个或多个不同的通信协议相兼容的有线和/或无线通信设备。作为非限制性示例,该通信子系统可以被配置成经由无线电话网、无线局域网、有线局域网、无线广域网、有线广域网等进行通信。在某些实施例中,该通信子系统可允许认知减少系统30经由网络(比如因特网)向其他设备发送消息和/或从其他设备接收消息。
应该理解,此处所述的配置和/或方法在本质上是示例性的,且这些具体实施例或示例不是局限性的,因为多个变体是可能。此处所述的具体例程或方法可表示任何数量的处理策略中的一个或更多个。由此,所示出的各个动作可以按所示顺序执行、按其他顺序执行、并行地执行、或者在某些情况下省略。同样,可以改变上述过程的次序。
本发明的主题包括各种过程、系统和配置的所有新颖和非显而易见的组合和子组合、和此处所公开的其他特征、功能、动作、和/或特性、以及其任何和全部等效物。
Claims (10)
1.一种认知负荷减少系统,包括:
声源位置决定引擎,所述声源位置决定引擎被配置成从相应的一个或多个信号生成器接收一个或多个音频信号,所述声源位置决定引擎被配置成标识从所述信号生成器接收的所述一个或多个音频信号中的至少一个中的两个或更多个分立声源;
环境评估引擎,所述环境评估引擎被配置成评估环境中的环境声音;以及
声音位置引擎,所述声音位置引擎被配置成输出一个或多个音频信号,由所述声音位置引擎输出的所述一个或多个音频信号被配置成使得多个扬声器响应于环境中的其他声音的位置来改变环境中的分立声源中的至少一个的感知位置。
2.如权利要求1所述的认知负荷减少系统,其特征在于,所述一个或多个音频信号之一是移动通信流,而所述两个或更多个分立声源是所述移动通信流中的分立语音。
3.如权利要求2所述的认知负荷减少系统,其特征在于,所述声音位置引擎被配置成在空间上隔离所述移动通信流中的每个分立语音的感知位置。
4.如权利要求3所述的认知负荷减少系统,其特征在于,所述声源位置决定引擎被配置成基于所述移动通信流中的每个分立语音的活动水平来确定分立语音的优先级排定,且所述声音位置引擎被配置成基于所述优先级排定来在空间上进行隔离。
5.如权利要求1所述的认知负荷减少系统,其特征在于,所述声音位置引擎被配置成调整所述多个扬声器的相对幅值来改变所述环境中的分立声源之一的感知位置。
6.如权利要求1所述的认知负荷减少系统,其特征在于,所述声音位置引擎被配置成调整所述多个扬声器的相对延迟来改变所述环境中的分立声源之一的感知位置。
7.如权利要求1所述的认知负荷减少系统,其特征在于,所述声音位置引擎被配置成使得所述多个扬声器进一步响应于所述一个或多个音频信号的内容和/或用户反馈以及/或者所述一个或多个音频信号的预先确定的优先级排定、来改变所述环境中的至少一个分立声源的感知位置。
8.如权利要求1所述的认知负荷减少系统,其特征在于,所述声音位置引擎被配置成确定所述多个扬声器中的一个或多个的加权因子以改变所述环境中的分立声源之一的感知位置。
9.如权利要求1所述的认知负荷减少系统,其特征在于,所述环境是车厢,且所述声音位置引擎被配置成使得所述多个扬声器进一步响应于来自所述车厢中的一个或多个乘客的声音的位置来改变所述环境中的至少一个分立声源的感知位置。
10.一种在车厢中为司机对声音排定优先级的方法,所述方法包括:
使用所述车厢中的多个扬声器(44)来将两个或更多个声源(24)中的第一个的感知位置布置在所述车厢中的第一位置处;以及
使用所述多个扬声器(44)来将所述两个或更多个声源(24)中的第二个的感知位置布置在所述车厢中的第二位置处,所述第一位置和所述第二位置在空间上彼此分开且与所述多个扬声器(44)中的任一个分开;
其中所述感知位置是司机感知到声音源自的位置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/942,799 US20120114130A1 (en) | 2010-11-09 | 2010-11-09 | Cognitive load reduction |
US12/942,799 | 2010-11-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102520391A CN102520391A (zh) | 2012-06-27 |
CN102520391B true CN102520391B (zh) | 2014-12-03 |
Family
ID=46019644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110375165.3A Active CN102520391B (zh) | 2010-11-09 | 2011-11-08 | 认知负荷减少 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120114130A1 (zh) |
CN (1) | CN102520391B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9167368B2 (en) * | 2011-12-23 | 2015-10-20 | Blackberry Limited | Event notification on a mobile device using binaural sounds |
EP2839461A4 (en) | 2012-04-19 | 2015-12-16 | Nokia Technologies Oy | AUDIO SCENE APPARATUS |
JP2013235050A (ja) * | 2012-05-07 | 2013-11-21 | Sony Corp | 情報処理装置及び方法、並びにプログラム |
US20130325482A1 (en) * | 2012-05-29 | 2013-12-05 | GM Global Technology Operations LLC | Estimating congnitive-load in human-machine interaction |
US9615171B1 (en) * | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
US9085262B2 (en) | 2012-10-08 | 2015-07-21 | Microsoft Technology Licensing, Llc | Tinting indication of environmental conditions |
CN104010265A (zh) * | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
CN105723459B (zh) * | 2013-11-15 | 2019-11-26 | 华为技术有限公司 | 用于改进声频信号的感知的设备和方法 |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9771082B2 (en) | 2015-08-13 | 2017-09-26 | International Business Machines Corporation | Reducing cognitive demand on a vehicle operator by generating passenger stimulus |
ES2713685T3 (es) * | 2016-04-26 | 2019-05-23 | Nokia Technologies Oy | Métodos, aparatos y programas informáticos relativos a la modificación de una característica asociada a una señal de audio separada |
US20170330565A1 (en) * | 2016-05-13 | 2017-11-16 | Bose Corporation | Handling Responses to Speech Processing |
US10477291B2 (en) * | 2016-07-27 | 2019-11-12 | Bose Corporation | Audio device |
DE102016214394A1 (de) * | 2016-08-03 | 2018-02-08 | Volkswagen Aktiengesellschaft | Verfahren zur Anpassung einer Mensch-Maschine-Schnittstelle in einem Kraftfahrzeug und Kraftfahrzeug |
US10902866B2 (en) | 2016-09-08 | 2021-01-26 | Huawei Technologies Co., Ltd. | Sound signal processing method, terminal, and headset |
JP6579154B2 (ja) * | 2017-05-11 | 2019-09-25 | マツダ株式会社 | 車両用サウンドシステム |
JP6579155B2 (ja) | 2017-05-11 | 2019-09-25 | マツダ株式会社 | 車両用サウンドシステム |
EP3588926B1 (en) * | 2018-06-26 | 2021-07-21 | Nokia Technologies Oy | Apparatuses and associated methods for spatial presentation of audio |
WO2020120754A1 (en) * | 2018-12-14 | 2020-06-18 | Sony Corporation | Audio processing device, audio processing method and computer program thereof |
EP4115415A1 (en) * | 2020-03-06 | 2023-01-11 | Sony Group Corporation | Electronic device, method and computer program |
US11804207B1 (en) | 2022-04-28 | 2023-10-31 | Ford Global Technologies, Llc | Motor vehicle workspace with enhanced privacy |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1223064A (zh) * | 1996-04-30 | 1999-07-14 | Srs实验室公司 | 用于环绕声环境的音频增强系统 |
CN1852623A (zh) * | 2005-04-22 | 2006-10-25 | 索尼株式会社 | 虚拟声音定位处理装置、虚拟声音定位处理方法及记录介质 |
CN1886004A (zh) * | 2005-06-21 | 2006-12-27 | 现代奥途纳特株式会社 | 车辆声音均衡系统及其控制方法 |
CN101150890A (zh) * | 2006-09-22 | 2008-03-26 | 索尼株式会社 | 声音再现系统和声音再现方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6011851A (en) * | 1997-06-23 | 2000-01-04 | Cisco Technology, Inc. | Spatial audio processing method and apparatus for context switching between telephony applications |
AU4200699A (en) * | 1999-05-24 | 2000-12-12 | Go Sensors, Inc. | Orientation dependent radiation source |
US6181996B1 (en) * | 1999-11-18 | 2001-01-30 | International Business Machines Corporation | System for controlling vehicle information user interfaces |
EP1206161A1 (en) * | 2000-11-10 | 2002-05-15 | Sony International (Europe) GmbH | Microphone array with self-adjusting directivity for handsets and hands free kits |
US6804565B2 (en) * | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
US7039199B2 (en) * | 2002-08-26 | 2006-05-02 | Microsoft Corporation | System and process for locating a speaker using 360 degree sound source localization |
US8155342B2 (en) * | 2002-12-11 | 2012-04-10 | Ira Marlowe | Multimedia device integration system |
JP4363276B2 (ja) * | 2004-08-02 | 2009-11-11 | 日産自動車株式会社 | 音場制御装置 |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
US8419545B2 (en) * | 2007-11-28 | 2013-04-16 | Ailive, Inc. | Method and system for controlling movements of objects in a videogame |
US8739390B2 (en) * | 2008-12-16 | 2014-06-03 | Massachusetts Institute Of Technology | Method for microcontact printing of MEMS |
US8190438B1 (en) * | 2009-10-14 | 2012-05-29 | Google Inc. | Targeted audio in multi-dimensional space |
-
2010
- 2010-11-09 US US12/942,799 patent/US20120114130A1/en not_active Abandoned
-
2011
- 2011-11-08 CN CN201110375165.3A patent/CN102520391B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1223064A (zh) * | 1996-04-30 | 1999-07-14 | Srs实验室公司 | 用于环绕声环境的音频增强系统 |
CN1852623A (zh) * | 2005-04-22 | 2006-10-25 | 索尼株式会社 | 虚拟声音定位处理装置、虚拟声音定位处理方法及记录介质 |
CN1886004A (zh) * | 2005-06-21 | 2006-12-27 | 现代奥途纳特株式会社 | 车辆声音均衡系统及其控制方法 |
CN101150890A (zh) * | 2006-09-22 | 2008-03-26 | 索尼株式会社 | 声音再现系统和声音再现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102520391A (zh) | 2012-06-27 |
US20120114130A1 (en) | 2012-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102520391B (zh) | 认知负荷减少 | |
EP3424229B1 (en) | Systems and methods for spatial audio adjustment | |
US9391580B2 (en) | Ambient audio injection | |
CN101176382B (zh) | 创建个人化声音区的系统和方法 | |
US10070242B2 (en) | Devices and methods for conveying audio information in vehicles | |
CN107004423A (zh) | 用于共享声学空间中的增强型交谈式通信的反馈消除 | |
US20140294210A1 (en) | Systems, methods, and apparatus for directing sound in a vehicle | |
US20160127827A1 (en) | Systems and methods for selecting audio filtering schemes | |
CN107004425A (zh) | 共享声学空间中的增强型对话通信 | |
JP7049803B2 (ja) | 車載装置および音声出力方法 | |
EP3392619B1 (en) | Audible prompts in a vehicle navigation system | |
CN109104674B (zh) | 面向听音者的声场重建方法、音频设备、存储介质及装置 | |
US11678114B2 (en) | Sound collection loudspeaker apparatus, method and program for the same | |
US20220095046A1 (en) | Hybrid in-car speaker and headphone based acoustical augmented reality system | |
US11503401B2 (en) | Dual-zone automotive multimedia system | |
US11974103B2 (en) | In-car headphone acoustical augmented reality system | |
WO2020027061A1 (ja) | 会話サポートシステム、その方法、およびプログラム | |
US20230370801A1 (en) | Information processing device, information processing terminal, information processing method, and program | |
WO2022054900A1 (ja) | 情報処理装置、情報処理端末、情報処理方法、およびプログラム | |
CN113066504A (zh) | 音频传输方法、装置及计算机存储介质 | |
CN115297401A (zh) | 用于车辆座舱的方法、装置、设备、存储介质和程序产品 | |
CN115426585A (zh) | 汽车座舱声音报警控制方法及系统 | |
CN117241176A (zh) | 一种音频播放方法、电子设备及存储介质 | |
CN117915237A (zh) | 一种音频输出方法、装置、设备及存储介质 | |
CN116389518A (zh) | 车内多乘员媒体管理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150429 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150429 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |