KR101520162B1

KR101520162B1 - 음질 개선을 위한 사용자 특정 잡음 억제

Info

Publication number: KR101520162B1
Application number: KR1020127030410A
Authority: KR
Inventors: 아람 린달; 바띠스뜨 삐에르 빠끼에
Original assignee: 애플 인크.
Priority date: 2010-06-04
Filing date: 2011-05-18
Publication date: 2015-05-13
Also published as: CN102859592B; US20110300806A1; AU2011261756B2; JP2013527499A; WO2011152993A1; EP2577658B1; US8639516B2; KR20130012073A; US20140142935A1; EP2577658A1; US10446167B2; CN102859592A; AU2011261756A1

Abstract

사용자 특정 잡음 억제를 위한 시스템, 방법, 및 장치가 제공된다. 예를 들어, 전자 장치(10)의 음성 관련 기능이 이용 중일 때, 상기 전자 장치(10)는 사용자 음성을 포함하는 오디오 신호를 수신할 수 있다. 이때 주변음(60)과 같은 잡음 역시 상기 전자 장치(10)에 수신될 수 있기 때문에, 상기 전자 장치(10)는 상기 오디오 신호에서 그러한 잡음을 억제할 수 있다. 특히, 상기 전자 장치(10)는 사용자 특정 잡음 억제 파라미터를 통해서 사용자 음성을 실질적으로 보존하면서 상기 오디오 신호에서 잡음을 억제할 수 있다. 이러한 사용자 특정 잡음 억제 파라미터는 적어도 부분적으로 사용자 잡음 억제 선호도 또는 사용자 음성 프로파일, 또는 이들의 조합을 기초로 할 수 있다.

Description

음질 개선을 위한 사용자 특정 잡음 억제{USER-SPECIFIC NOISE SUPPRESSION FOR VOICE QUALITY IMPROVEMENTS}

본 발명은 일반적으로 잡음 억제 기술에 관한 것으로, 더욱 상세하게는, 사용자 특정 잡음 억제(user-specific noise suppression) 기술에 관한 것이다.

본 단락은 독자에게 이하에서 설명되고 및/또는 청구되는 본 발명의 여러 양태들과 관련될 수 있는 여러 기술 양태들을 소개하기 위한 것이다. 본 설명은 독자에게 배경 정보를 제공하여 본 발명의 여러 양태들을 쉽게 잘 이해하도록 하는데 도움이 될 것으로 생각된다. 따라서, 본 설명은 이런 관점에서 읽어야 하고, 종래 기술을 인정하는 것으로 읽지 않아야 한다는 사실을 이해하여야 한다.

많은 전자 장치들은 사용자의 음성을 녹음 및/또는 전송하는 것을 포함하는 음성 관련 기능(voice-related features)을 이용한다. 예를 들어, 음성 메모(voice note) 녹음 기능은 사용자가 말한 음성 메모를 녹음할 수 있다. 유사하게, 전자 장치의 전화 기능은 사용자의 음성을 다른 전자 장치로 전송할 수 있다. 그러나, 전자 장치가 사용자의 음성을 획득할 때, 이와 동시에 주변음(ambient sounds) 또는 배경 잡음도 획득될 수 있다. 이러한 주변음은 사용자의 음성을 불명확하게 할 수 있고, 어떤 경우에는, 전자 장치의 음성 관련 기능의 적절한 작동을 방해할 수 있다.

음성 관련 기능이 이용 중에 있을 때 주변음의 영향을 줄이기 위하여, 전자 장치는 다양한 잡음 억제 방식을 적용할 수 있다. 장치 제조자는 대부분의 사용자에게 호응을 얻을 것으로 추정된 소정의 기설정된 일반적인 파라미터에 따라 동작하도록 그러한 잡음 억제 방식을 프로그램할 수 있다. 그러나, 소정의 음성은 이러한 일반적인 잡음 억제 파라미터에 덜 적절할 수 있다. 또한, 어떤 사용자들은 더 강인하거나 또는 더 약한 잡음 억제를 선호할 수 있다.

이하에서는 본 명세서에 개시된 특정 실시예들의 요약이 기술된다. 이러한 양태들은 단지 독자에게 이러한 특정 실시예들의 간략한 요약을 제공하기 위해 제시되며 이러한 양태들은 본 발명의 범주를 제한하는 것으로 의도되지 않는다는 점을 이해하여야 한다. 실제로, 본 발명은 이하에서 기술되지 않을 수 있는 여러 양태들을 망라할 수 있다.

본 발명의 실시예들은 사용자 특정 잡음 억제를 위한 시스템, 방법, 및 장치와 관련된다. 예를 들어, 전자 장치의 음성 관련 기능이 이용 중일 때, 상기 전자 장치는 사용자 음성을 포함하는 오디오 신호를 수신할 수 있다. 이때 주변음과 같은 잡음 역시 상기 전자 장치에 의해 수신될 수 있기 때문에, 상기 전자 장치는 상기 오디오 신호에서 잡음을 억제할 수 있다. 특히, 상기 전자 장치는 사용자 특정 잡음 억제 파라미터를 통해서 사용자 음성을 실질적으로 보존하면서 상기 오디오 신호에서 잡음을 억제할 수 있다. 이러한 사용자 특정 잡음 억제 파라미터는 적어도 부분적으로 사용자 잡음 억제 선호도(preference) 또는 사용자 음성 프로파일(profile), 또는 이들의 조합을 기초로 할 수 있다.

본 발명의 여러 양태들은 다음의 상세한 설명을 읽고 도면을 참조하면 더욱 잘 이해될 수 있다.
도 1은 실시예에 따른, 본 명세서에 개시된 기술을 수행할 수 있는 전자 장치의 블록도이다.
도 2는 도 1의 전자 장치의 일 실시예를 나타내는 핸드헬드 장치의 개략도이다.
도 3은 실시예에 따른, 도 1의 전자 장치의 음성 관련 기능이 이용될 수 있는 여러 상황을 나타내는 개략적인 블록도이다.
도 4는 실시예에 따른, 도 1의 전자 장치에서 수행될 수 있는 잡음 억제의 블록도이다.
도 5는 실시예에 따른, 사용자 특정 잡음 억제 파라미터를 나타내는 블록도이다.
도 6은 도 1의 전자 장치에서 사용자 특정 잡음 억제 파라미터를 적용하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 7은 실시예에 따른, 도 2의 핸드헬드 장치가 활성화될 때 음성 훈련 시퀀스(voice training sequence)의 시작에 대한 개략도이다.
도 8은 실시예에 따라서, 도 2의 핸드헬드 장치를 이용하여 음성 훈련 시퀀스의 시작을 선택하기 위한 일련의 화면의 개략도이다.
도 9는 음성 훈련 시퀀스를 통해서 사용자 특정 잡음 억제 파라미터를 결정하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 10 및 도 11은 실시예에 따라서, 음성 훈련을 위한 사용자 음성 샘플을 획득하기 위한 방식의 개략도이다.
도 12는 실시예에 따라서, 음성 훈련 시퀀스 동안 잡음 억제 사용자 선호도를 획득하기 위한 방식을 예시하는 개략도이다.
도 13은 음성 훈련 시퀀스 동안 잡음 억제 사용자 선호도를 획득하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 14는 음성 훈련 시퀀스를 수행하기 위한 다른 방법의 실시예를 설명하는 흐름도이다.
도 15는 신호 대 잡음비(SNR)가 높은 사용자 음성 샘플을 획득하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 16은 사용자 음성 샘플의 분석을 통해서 사용자 특정 잡음 억제 파라미터를 결정하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 17은 실시예에 따라서, 도 16의 방법을 수행하는 동안 고려될 수 있는 사용자 음성 샘플의 특성을 설명하는 요소(factor) 도면이다.
도 18은 실시예에 따라서, 사용자 선택가능한 설정을 통해서 사용자 특정 잡음 파라미터를 획득하기 위해 도 2의 핸드헬드 장치에 표시될 수 있는 일련의 화면을 나타내는 개략도이다.
도 19는 실시예에 따라서, 핸드헬드 장치의 음성 관련 기능이 이용 중인 동안 사용자 특정 잡음 억제 파라미터를 실시간으로 획득하기 위한 도 2의 핸드헬드 장치 상의 화면의 개략도이다.
도 20 및 도 21은 실시예에 따라서, 사용자 특정 잡음 억제 파라미터를 구성할 수 있는 여러 서브 파라미터를 나타내는 개략도이다.
도 22는 검출된 주변음에 기초하여 사용자 특정 파라미터의 소정의 서브 파라미터를 적용하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 23은 전자 장치의 이용 상황에 기초하여 잡음 억제 파라미터의 소정의 서브 파라미터를 적용하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 24는 실시예에 따라서, 도 23의 방법에서 이용될 수 있는 여러 장치 상황 요인들(context factors)을 나타내는 요소 도면이다.
도 25는 사용자 음성 프로파일을 획득하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 26은 사용자 음성 프로파일에 기초하여 잡음 억제를 적용하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 27 내지 도 29는 실시예에 따라서, 사용자 음성 프로파일에 기초하여 오디오 신호의 잡음 억제를 수행하기 위한 방식을 도시하는 플롯들이다.
도 30은 사전에 녹음된 음성을 포함하는 음성 훈련 시퀀스를 통해서 사용자 특정 잡음 억제 파라미터를 획득하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 31은 다른 전자 장치로부터 수신된 오디오에 사용자 특정 잡음 억제 파라미터를 적용하기 위한 방법의 실시예를 설명하는 흐름도이다.
도 32는 실시예에 따라서, 제1 전자 장치의 사용자 특정 잡음 파라미터에 기초하여 다른 전자 장치가 잡음 억제에 관여하게 하기 위한 방법의 실시예를 설명하는 흐름도.
도 33은 실시예에 따라서, 다른 전자 장치와 연관된 사용자 특정 잡음 억제 파라미터에 기초하여 두 전자 장치에 대해 잡음 억제를 수행하는 시스템의 개략적인 블록도이다.

이하, 하나 이상의 구체적인 실시예들에 대해 설명할 것이다. 이러한 실시예들의 간결한 설명을 제공하기 위하여, 본 명세서에서는 실제 구현에 대한 모든 특징들이 설명되지 않는다. 그러한 모든 실제 구현의 개발시에는, 모든 엔지니어링 또는 설계 프로젝트에서와 같이, 개발자의 특정 목표를 성취하기 위해 시스템 관련 및 사업 관련 제약 조건을 따르는 것과 같은 수많은 구현 특정 결정이 이루어져야 하며, 이러한 결정은 구현마다 다를 수 있다는 것을 인식하여야 한다. 더욱이, 이러한 개발의 노력은 복잡하고 시간 소모적일 수 있지만, 그럼에도 불구하고 본 발명의 혜택을 받는 당업자에게는 설계, 제작 및 제조에 있어서의 일상적인 작업이라는 것을 인식하여야 한다.

본 실시예들은 전자 장치의 음성 관련 기능(voice-related feature)과 연관된 오디오 신호에서 잡음을 억제하는 것과 관련된다. 이러한 음성 관련 기능은, 예를 들어, 음성 메모(voice note) 녹음 기능, 비디오 녹화 기능, 전화 기능, 및/또는 음성 명령 기능을 포함할 수 있으며, 이들 각각은 사용자의 음성을 포함하는 오디오 신호를 수반할 수 있다. 그러나, 사용자의 음성 외에, 오디오 신호는 또한 음성 관련 기능이 이용 중인 동안에 존재하는 주변음(ambient sounds)을 포함할 수 있다. 이러한 주변음이 사용자의 음성을 불명확하게 할 수 있기 때문에, 전자 장치는 오디오 신호에 잡음 억제(noise suppression)를 적용하여 사용자의 음성을 보존하면서 주변음을 필터링할 수 있다.

본 실시예에 따른 잡음 억제는 장치의 제조시 프로그램된 일반적인 잡음 억제 파라미터를 이용하지 않고 전자 장치의 사용자에게 고유할 수 있는 사용자 특정 잡음 억제 파라미터(user-specific noise suppression parameters)를 수반할 수 있다. 이러한 사용자 특정 잡음 억제 파라미터는 사용자의 음성 프로파일(profile)에 기초하여, 및/또는 수동으로 선택된 사용자 설정에 기초하여, 음성 훈련(voice training)을 통해서 결정될 수 있다. 잡음 억제가 일반적인 파라미터 대신 사용자 특정 파라미터에 기초하여 수행되면, 잡음이 억제된 신호의 사운드는 사용자에게 더 많은 만족을 줄 수 있다. 이러한 사용자 특정 잡음 억제 파라미터는 모든 음성 관련 기능에 이용될 수 있으며, 자동 이득 조절(AGC) 및/또는 등화(equalization: EQ) 조정과 관련하여 이용될 수 있다.

전술한 바와 같이, 사용자 특정 잡음 억제 파라미터는 음성 훈련 시퀀스(voice training sequence)를 이용하여 결정될 수 있다. 이러한 음성 훈련 시퀀스에서, 전자 장치는 하나 이상의 디스트랙터(distractor)(예를 들어, 종이 구김 소리, 백색 소음, 사람들 이야기 소리 등과 같은 시뮬레이트된 주변음)와 혼합된 사용자의 음성 샘플(voice sample)에 가변 잡음 억제 파라미터를 적용할 수 있다. 그 후, 사용자는 어느 잡음 억제 파라미터가 가장 바람직한 사운드를 만들어내는지를 표시할 수 있다. 사용자의 피드백에 따라, 전자 장치는 전자 장치의 음성 관련 기능이 이용 중일 때 나중의 사용을 위해 사용자 특정 잡음 억제 파라미터를 생성하여 저장할 수 있다.

추가로 또는 대안으로, 사용자 특정 잡음 억제 파라미터는 사용자 음성의 특성에 따라 전자 장치에 의해 자동으로 결정될 수 있다. 다른 사용자들의 음성은 다른 평균 주파수, 다른 주파수 변동성, 및/또는 다른 구별되는 사운드를 포함하여, 각종 다른 특성을 가질 수 있다. 또한, 소정의 잡음 억제 파라미터는 소정의 음성 특성을 갖고 더욱 효과적으로 동작하는 것으로 알려져 있을 수 있다. 따라서, 특정한 본 실시예에 따른 전자 장치는 이러한 사용자 음성 특성에 기초하여 사용자 특정 잡음 억제 파라미터를 결정할 수 있다. 몇몇 실시예에서, 사용자는 예를 들어, 고/중/저 잡음 억제 강도 선택기를 선택하거나 또는 전자 장치 상에 현재 통화 품질을 표시함으로써 잡음 억제 파라미터를 수동으로 설정할 수 있다.

사용자 특정 파라미터가 결정되었으면, 전자 장치는 음성 관련 기능이 이용되는 동안 들을 수 있는 다양한 형태의 주변음을 억제할 수 있다. 특정 실시예에서, 전자 장치는 주변음의 특성을 분석하여 현재 주변음을 억제할 것으로 예상되는 사용자 특정 잡음 억제 파라미터를 적용할 수 있다. 다른 실시예에서, 전자 장치는 전자 장치가 이용 중인 현재 상황(context)에 따라 소정의 사용자 특정 잡음 억제 파라미터를 적용할 수 있다.

특정 실시예에서, 전자 장치는 사용자와 연관된 사용자 음성 프로파일에 기초하여 사용자에게 맞춰진 잡음 억제를 수행할 수 있다. 그 후, 전자 장치는 음성 관련 기능이 이용 중일 때 오디오 신호로부터 주변음을 더욱 효과적으로 분리할 수 있는데 이는 전자 장치가 일반적으로 오디오 신호의 어느 성분이 사용자의 음성에 해당하는지를 예측할 수 있기 때문이다. 예를 들어, 전자 장치는 사용자 음성 프로파일과 연관되지 않는 오디오 신호의 성분을 억제하면서 사용자 음성 프로파일과 연관된 오디오 신호의 성분을 증폭할 수 있다.

사용자 특정 잡음 억제 파라미터는 또한 전자 장치에 의해 수신된 사용자의 음성 이외의 음성을 포함하는 오디오 신호에서 잡음을 억제하는데 이용될 수 있다. 예를 들어, 전자 장치가 전화 또는 채팅(chat) 기능에 이용될 때, 전자 장치는 사용자가 교신하고 있는 사람으로부터의 오디오 신호에 사용자 특정 잡음 억제 파라미터를 적용할 수 있다. 이러한 오디오 신호는 송신 장치에 의해 이미 처리되었기 때문에, 그와 같은 잡음 억제는 비교적 경미할 수 있다. 특정 실시예에서, 전자 장치는 사용자 특정 잡음 억제 파라미터를 송신 장치에 전송할 수 있으므로, 송신 장치는 자신의 잡음 억제 파라미터를 적절히 수정할 수 있다. 동일한 방식으로, 두 전자 장치는 서로의 사용자 특정 잡음 억제 파라미터에 따라 발신(outgoing) 오디오 신호에서 잡음을 억제하도록 체계적으로 기능할 수 있다.

전술한 바를 염두에 두고, 현재 개시된 기술을 수행하기에 적합한 전자 장치에 대한 개괄적인 설명이 이하에서 제공된다. 특히, 도 1은 본 기술과 함께 사용하기에 적합한 전자 장치에 존재할 수 있는 여러 구성 요소들을 도시한 블록도이다. 도 2는 예시된 바와 같이 잡음 억제 능력을 갖는 핸드헬드 전자 장치일 수 있는 적절한 전자 장치의 일 예를 나타낸다.

먼저 도 1을 참조하면, 현재 개시된 기술을 수행하는 전자 장치(10)는 무엇보다도 하나 이상의 프로세서(들)(12), 메모리(14), 비휘발성 저장 장치(16), 디스플레이(18), 잡음 억제(20), 위치 감지 회로(22), 입/출력(I/O) 인터페이스(24), 네트워크 인터페이스(26), 이미지 캡처 회로(28), 가속도계/자력계(30), 및 마이크로폰(32)을 포함할 수 있다. 도 1에 도시된 각종 기능 블록은 하드웨어 소자(회로 포함), 소프트웨어 소자(컴퓨터 판독가능 매체에 저장된 컴퓨터 코드 포함) 또는 하드웨어 및 소프트웨어 소자들의 조합을 포함할 수 있다. 또한 도 1은 단지 특정한 구현의 일 예일 뿐이며 전자 장치(10)에 존재할 수 있는 구성 요소들의 형태를 예시하려는 의도임을 주목하여야 한다.

예를 들면, 전자 장치(10)는 도 2에 도시된 핸드헬드 장치 또는 유사한 장치의 블록도를 나타낼 수 있다. 추가로 또는 대안으로, 전자 장치(10)는 소정의 특성을 갖는 전자 장치들의 시스템을 대표할 수 있다. 예를 들어, 제1 전자 장치는 적어도 마이크로폰(32)을 포함할 수 있으며, 이는 프로세서(들)(12) 및 다른 데이터 처리 회로를 포함하는 제2 전자 장치에 오디오를 제공할 수 있다. 데이터 처리 회로는 전체적으로 또는 부분적으로 소프트웨어, 펌웨어, 하드웨어 또는 이들의 어떤 조합으로 구체화될 수 있음을 주목하여야 한다. 더욱이, 데이터 처리 회로는 단독으로 포함된 처리 모듈일 수 있거나 또는 전자 장치(10) 내 어떤 다른 소자 내에 전체적으로 또는 부분적으로 통합될 수 있다. 데이터 처리 회로는 또한 전자 장치(10) 내에 부분적으로 구현될 수 있으며 장치(10)에 유선 또는 무선으로 연결된 다른 전자 장치 내에 부분적으로 구현될 수 있다. 마지막으로, 데이터 처리 회로는 장치(10)에 유선 또는 무선 연결된 다른 장치 내에 전체적으로 구현될 수 있다. 비제한적인 예로서, 데이터 처리 회로는 장치(10)와 관련하여 헤드셋 내에 구현될 수 있다.

도 1의 전자 장치(10)에서, 프로세서(들)(12) 및/또는 다른 데이터 처리 회로는 메모리(14) 및 비휘발성 메모리(16)와 동작가능하게 연결되어 현재 개시된 기술을 실행하기 위한 여러 알고리즘을 수행할 수 있다. 프로세서(들)(12)에 의해 실행되는 이러한 프로그램 또는 명령들은 명령 또는 루틴을 적어도 일괄로 저장하는 하나 이상의 유형의(tangible) 컴퓨터 판독가능한 매체를 포함하는 어떤 적절한 제품, 이를 테면, 메모리(14) 및 비휘발성 저장 장치(16)에 저장될 수 있다. 또한, 이러한 컴퓨터 프로그램 제품 상에 인코드된 프로그램(예를 들어, 운영 체제)은 프로세서(들)(12)에 의해 실행되어 전자 장치(10)가 본 명세서에 기술된 기능들을 포함하여 각종 기능들을 제공할 수 있게 해주는 명령들을 또한 포함할 수 있다. 디스플레이(18)는 사용자로 하여금 전자 장치(10)의 사용자 인터페이스와 상호 작용할 수 있게 해주는 터치 화면 디스플레이일 수 있다.

잡음 억제(20)는 프로세서(들)(12)와 같은 데이터 처리 회로에 의해 또는 전자 장치(10)에 의해 처리되는 오디오 신호에 대해 소정의 잡음 억제를 전용으로 수행하는 회로에 의해 수행될 수 있다. 예를 들어, 잡음 억제(20)는 외부에서 제공되는 잡음 억제 파라미터에 기초하여 인피니언(Infineon)에 의해 제조된 회로와 같은 기저대역 집적 회로(IC)에 의해 수행될 수 있다. 추가로 또는 대안으로, 잡음 억제(20)는 오디언스(Audience)에 의해 제조된 회로와 같은, 외부에서 제공되는 잡음 억제 파라미터에 기초하여 잡음 억제를 수행하도록 구성된 전화 오디오 강화 집적 회로(IC)에서 수행될 수 있다. 이러한 잡음 억제 IC들은 적어도 부분적으로 소정의 잡음 억제 파라미터에 기초하여 동작할 수 있다. 이러한 잡음 억제 파라미터를 변경하면 잡음 억제(20)의 출력을 변경시킬 수 있다.

위치 감지 회로(22)는 전자 장치(10)의 상대 또는 절대 위치를 결정하기 위한 장치의 역량을 나타낼 수 있다. 예를 들어, 위치 감지 회로(22)는 위성 위치 확인 시스템(GPS) 회로, 로컬 Wi-Fi 네트워크와 같은 근접 무선 네트워크에 기초하여 위치를 추정하기 위한 알고리즘 등을 나타낼 수 있다. I/O 인터페이스(24)는 네트워크 인터페이스(26)와 같이, 전자 장치(10)가 여러 다른 전자 장치와 인터페이스하게 해줄 수 있다. 네트워크 인터페이스(26)는, 예를 들어, 블루투스 네트워크와 같은 개인 영역 네트워크(PAN), 802.11x Wi-Fi 네트워크와 같은 근거리 네트워크(LAN), 및/또는 3G 셀룰러 네트워크와 같은 광역 네트워크(WAN) 용의 인터페이스를 포함할 수 있다. 네트워크 인터페이스(26)를 통해, 전자 장치(10)는 마이크로폰(32)을 포함하는 무선 헤드셋과 인터페이스할 수 있다. 이미지 캡처 회로(28)는 이미지 및/또는 비디오 캡처를 가능하게 할 수 있으며, 가속도계/자력계(30)는 전자 장치(10)의 이동 및/또는 상대적인 방향을 관측할 수 있다.

전화 기능 또는 음성 인식 기능과 같은 전자 장치(10)의 음성 관련 기능과 관련하여 이용될 때, 마이크로폰(32)은 사용자 음성의 오디오 신호를 획득할 수 있다. 비록 사용자 음성 이외에 주변음도 오디오 신호에서 획득될 수 있지만, 잡음 억제(20)는 소정의 사용자 특정 잡음 억제 파라미터에 기초하여 오디오 신호를 처리하여 대부분의 주변음을 배제할 수 있다. 이하에서 더욱 상세히 설명되는 바와 같이, 사용자 특정 잡음 억제 파라미터는 사용자의 음성 프로파일에 기초하여, 및/또는 수동으로 선택된 사용자 설정에 기초하여 음성 훈련을 통해서 결정될 수 있다.

도 2는 전자 장치(10)의 일 실시예를 나타내는 핸드헬드 장치(34)를 도시한다. 핸드헬드 장치(34)는, 예를 들어, 휴대용 전화기, 미디어 플레이어, 개인용 데이터 오거나이져, 핸드헬드 게임 플랫폼, 또는 이들 장치들의 어떤 조합을 대표할 수 있다. 예를 들어, 핸드헬드 장치(34)는 캘리포니아주 쿠퍼티노 소재의 애플사(Apple Inc.)로부터 입수할 수 있는 아이팟(iPod®) 또는 아이폰(iPhone®)의 모델일 수 있다.

핸드헬드 장치(34)는 내부 구성 요소들을 물리적인 손상으로부터 보호하고 이들을 전자기 간섭으로부터 보호하기 위해 인클로저(36)를 포함할 수 있다. 인클로저(36)는 인디케이터 아이콘(38)을 표시할 수 있는 디스플레이(18)를 둘러쌀 수 있다. 인디케이터 아이콘(38)은 무엇보다도 셀룰러 신호 강도, 블루투스 연결, 및/또는 배터리 수명을 표시할 수 있다. I/O 인터페이스(24)는 인클로저(36)를 통해 개방될 수 있으며, 예를 들어, 외부 장치와의 연결을 위해 애플사 소유의 I/O 포트를 포함할 수 있다. 도 2에 나타낸 바와 같이, 핸드헬드 장치(34)의 후면에는 이미지 캡처 회로(28)가 포함될 수 있다.

사용자 입력 구조물(40, 42, 44 및 46)은, 디스플레이(18)와 연합하여, 사용자가 핸드헬드 장치(34)를 제어하게 해줄 수 있다. 예를 들어, 입력 구조물(40)은 핸드헬드 장치(34)를 활성화 또는 비활성화하고, 입력 구조물(42)은 사용자 인터페이스(20)를 홈 화면, 즉 사용자가 구성가능한 애플리케이션 화면으로 내비게이트하고, 및/또는 핸드헬드 장치(34)의 음성 인식 기능을 활성화하고, 입력 구조물(44)은 음량 조절을 제공할 수 있으며, 입력 구조물(46)은 진동 모드와 벨소리 모드 사이를 토글할 수 있다. 마이크로폰(32)은 각종 음성 관련 기능들에 대한 사용자의 음성을 획득할 수 있으며, 스피커(48)는 오디오 재생 및/또는 소정의 전화 기능을 가능하게 할 수 있다. 헤드폰 입력부(50)는 외부 스피커 및/또는 헤드폰과의 연결을 제공할 수 있다.

도 2에서 예시된 바와 같이, 유선 헤드셋(52)은 헤드폰 입력부(50)를 통해 핸드헬드 장치(34)에 연결할 수 있다. 유선 헤드셋(52)은 두 개의 스피커(48) 및 마이크로폰(32)을 포함할 수 있다. 마이크로폰(32)은 핸드헬드 장치(34)에 위치한 마이크로폰(32)과 동일한 방식으로 사용자가 핸드헬드 장치(34)에 말하는 것을 가능하게 할 수 있다. 몇몇 실시예에서, 마이크로폰(32) 근처에 있는 버튼은 마이크로폰(32)을 재개(awaken)할 수 있고 및/또는 핸드헬드 장치(34)의 음성 관련 기능을 활성화시킬 수 있다. 마찬가지로, 무선 헤드셋(54)은 네트워크 인터페이스(26)의 무선 인터페이스(예를 들어, 블루투스 인터페이스)를 통해 핸드헬드 장치(34)에 연결할 수 있다. 유선 헤드셋(52)과 같이, 무선 헤드셋(54)도 스피커(48) 및 마이크로폰(32)을 포함할 수 있다. 또한, 몇몇 실시예에서, 마이크로폰(32) 근처에 있는 버튼은 마이크로폰(32)을 재개할 수 있고 및/또는 핸드헬드 장치(34)의 음성 관련 기능을 활성화시킬 수 있다. 추가로 또는 대안으로, 통합형 스피커(48)가 없을 수 있는 독립형 마이크로폰(32)(미도시됨)은 헤드폰 입력부(50)를 통해 또는 네트워크 인터페이스들(26) 중 하나를 통해 핸드헬드 장치(34)와 인터페이스할 수 있다.

사용자는 여러 주변음을 갖는 각종 상황에서, 음성 인식 기능 또는 전화 기능과 같은 전자 장치(10)의 음성 관련 기능을 이용할 수 있다. 도 3은 핸드헬드 장치(34)로 도시된 전자 장치(10)가 음성 관련 기능을 수행하는 동안 사용자 음성 오디오 신호(58) 및 주변음(60)을 획득할 수 있는 그러한 많은 상황(56)을 예시한다. 예를 들면, 전자 장치(10)의 음성 관련 기능은, 예를 들어, 음성 인식 기능, 음성 메모 녹음 기능, 비디오 녹화 기능, 및/또는 전화 기능을 포함할 수 있다. 음성 관련 기능은 전자 장치(10)에서 프로세서(들)(12) 및/또는 다른 프로세서에 의해 실행되는 소프트웨어로 구현될 수 있으며, 및/또는 특수 하드웨어로 구현될 수 있다.

사용자가 음성 오디오 신호(58)를 말하면, 이는 전자 장치(10)의 마이크로폰(32)에 들어갈 수 있다. 그러나, 거의 동시에, 주변음(60) 역시 마이크로폰(32)에 들어갈 수 있다. 주변음(60)은 전자 장치(10)가 사용 중인 상황(56)에 따라 다를 수 있다. 음성 관련 기능이 이용될 수 있는 각종 상황(56)은 무엇보다도 가정(62)에서, 사무실(64)에서, 체육관(66)에서, 복잡한 거리(68)에서, 자동차(70)에서, 스포츠 경기(72)에서, 식당(74)에서, 그리고 파티(76)에서와 같은 상황을 포함할 수 있다. 인식하여야 하는 바와 같이, 복잡한 거리(68)에서 발생하는 일반적인 주변음(60)은 가정(62)에서 또는 자동차(70)에서 발생하는 일반적인 주변음(60)과는 크게 다를 수 있다.

주변음(60)의 특성은 상황(56)마다 다를 수 있다. 이하에서 더욱 상세히 설명되는 바와 같이, 전자 장치(10)는 적어도 부분적으로 사용자 특정 잡음 억제 파라미터에 기초하여 잡음 억제(20)를 수행하여 주변음(60)을 필터링할 수 있다. 몇몇 실시예에서, 이러한 사용자 특정 잡음 억제 파라미터는 음성 훈련을 통해서 결정될 수 있으며, 여기서 여러 다른 잡음 억제 파라미터들이 사용자 음성 샘플 및 여러 디스트랙터(시뮬레이트된 주변음)를 포함하는 오디오 신호에 대해 테스트될 수 있다. 음성 훈련에 이용되는 디스트랙터는 소정 상황(56)에서 볼 수 있는 주변음(60)을 모방(mimic)하도록 선택될 수 있다. 또한, 각각의 상황(56)은 변하는 전자 장치(10)의 움직임 양 및 주변 광량의 변화에 따라, 및/또는 음성 신호(58) 및 주변음(60)의 여러 음량 레벨에 따라, 소정의 위치 및 시간에 일어날 수 있다. 따라서, 전자 장치(10)는, 예를 들어, 시간, 위치, 움직임, 주변 광, 및/또는 음량 레벨에 따라 결정되는 바와 같이, 소정 상황(56)에 맞추어진 사용자 특정 잡음 억제 파라미터를 이용하여 주변음(60)을 필터링할 수 있다.

도 4는 전자 장치(10)의 음량 관련 기능이 이용 중일 때 전자 장치(10)에 대해 잡음 억제(20)를 수행하는 기술(80)의 개략적인 블록도이다. 도 4의 기술(80)에서, 음성 관련 기능은 사용자와 다른 사람 간의 양방향 통신을 수반하며 전자 장치(10)의 전화 또는 채팅 기능이 이용 중일 때 수행될 수 있다. 그러나, 전자 장치(10)가 양방향 통신이 수행되지 않을 때 전자 장치의 마이크로폰(32) 또는 네트워크 인터페이스(26)를 통해 수신되는 오디오 신호에 대해서도 잡음 억제(20)를 수행할 수 있음을 인식하여야 한다.

잡음 억제 기술(80)에서, 전자 장치(10)의 마이크로폰(32)은 사용자 음성 신호(58) 및 배경에 존재하는 주변음(60)을 획득할 수 있다. 이와 같은 제1 오디오 신호는 코덱(codec)(82)에 의해 인코드된 후에 잡음 억제(20)를 시작할 수 있다. 잡음 억제(20)에서, 송신 잡음 억제(TX NS)(84)가 제1 오디오 신호에 적용될 수 있다. 잡음 억제(20)가 수행되는 방식은, 예를 들어, 프로세서(들)(12), 메모리(14), 또는 비휘발성 저장 장치(16)에 의해 제공되는 소정의 잡음 억제 파라미터(송신 잡음 억제(TX NS) 파라미터(86))로서 예시됨)에 의해 규정될 수 있다. 이하에서 더욱 상세히 설명되는 바와 같이, TX NS 파라미터(86)는 프로세서(들)(12)에 의해 결정되며 전자 장치(10)의 사용자 및/또는 상황(56)에 맞추어진 사용자 특정 잡음 억제 파라미터일 수 있다. 참조 부호 84에서 잡음 억제(20)를 수행한 후에, 결과적인 신호는 네트워크 인터페이스(26)를 통해 업링크(88)로 전달될 수 있다.

네트워크 인터페이스(26)의 다운링크(90)는 다른 장치(예컨대, 다른 전화기)로부터 음성 신호를 수신할 수 있다. 소정의 잡음 수신기 잡음 억제(RX NS)(92)는 잡음 억제(20)에서 이러한 인입(incoming) 신호에 적용될 수 있다. 이러한 잡음 억제(20)가 수행되는 방식은, 예를 들어, 프로세서(들)(12), 메모리(14), 또는 비휘발성 저장 장치(16)에 의해 제공되는 소정의 잡음 억제 파라미터(수신 잡음 억제(RX NS) 파라미터(94)로서 예시됨)에 의해 규정될 수 있다. 인입 오디오 신호는 미리 잡음 억제를 위해 처리된 후에 송신 장치를 떠나기 때문에, RX NS 파라미터(94)는 TX NS 파라미터(86)보다 덜 강한 것으로 선택될 수 있다. 결과적인 잡음 억제된 신호는 코덱(82)에 의해 디코드되어 전자 장치(10)의 수신기 회로 및/또는 스피커(48)로 출력될 수 있다.

TX NS 파라미터(86) 및/또는 RX NS 파라미터(94)는 전자 장치(10)의 사용자에게 특정적일 수 있다. 즉, 도 5의 도면(100)에 도시된 바와 같이, TX NS 파라미터(86) 및 RX NS 파라미터(94)는 전자 장치(10)의 사용자에게 맞추어진 사용자 특정 잡음 억제 파라미터(102)로부터 선택될 수 있다. 이러한 사용자 특정 잡음 억제 파라미터(102)는 이하에서 더욱 상세히 설명하는 바와 같이 사용자 음성 프로파일(106)에 기초하고, 및/또는 사용자 선택가능한 설정(108)에 기초하여, 음성 훈련(104)을 통하는 것과 같은 여러 방식으로 얻을 수 있다.

음성 훈련(104)은 전자 장치(10)가 여러 디스트랙터 또는 시뮬레이트된 배경 잡음과 결합된 여러 잡음 억제 파라미터를 테스트함으로써 사용자 특정 잡음 억제 파라미터(102)를 결정하게 해줄 수 있다. 이러한 음성 훈련(104)을 수행하기 위한 특정 실시예가 도 7 내지 도 14를 참조하여 이하에서 더욱 상세히 설명된다. 추가로 또는 대안으로, 도 15 내지 도 17을 참조하여 이하에서 더욱 상세히 설명되는 바와 같이, 전자 장치(10)는 사용자 음성의 특정 특성을 고려할 수 있는 사용자 음성 프로파일(106)에 기초하여 사용자 특정 잡음 억제 파라미터(102)를 결정할 수 있다. 추가로 또는 대안으로, 도 18 및 19를 참조하여 이하에서 더욱 상세히 설명되는 바와 같이, 사용자는 소정의 사용자 설정(108)을 통해 사용자 특정 잡음 억제 파라미터(102)의 선호도를 표시할 수 있다. 이러한 사용자 선택가능한 설정은, 예를 들어, 잡음 억제 강도(예를 들어, 저/중/고) 선택기 및/또는 사용자의 실시간 음성 품질과 관련되는 사용자 피드백을 제공하는 실시간 사용자 피드백 선택기를 포함할 수 있다.

일반적으로, 전자 장치(10)는 전자 장치의 음성 관련 기능이 이용 중일 때 사용자 특정 잡음 억제 파라미터(102)를 이용할 수 있다(예를 들어, TX NS 파라미터(86) 및 RX NS 파라미터(94)는 사용자 특정 잡음 억제 파라미터(102)에 기초하여 선택될 수 있다). 특정 실시예에서, 전자 장치(10)는 현재 음성 관련 기능을 이용하는 사용자의 식별(identification)에 기초하여 잡음 억제(20) 동안 소정의 사용자 특정 잡음 억제 파라미터(102)를 적용할 수 있다. 이러한 상황은, 예를 들어, 전자 장치(10)가 다른 가족 구성원에 의해 이용될 때 일어날 수 있다. 가족의 각 구성원은 전자 장치(10)의 음성 관련 기능을 종종 이용할 수 있는 사용자를 나타낼 수 있다. 이러한 다중 사용자 조건 하에서, 전자 장치(10)는 그 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)가 존재하는지 여부를 확인할 수 있다.

예를 들어, 도 6은 사용자가 식별되었을 때 소정의 사용자 특정 잡음 억제 파라미터(102)를 적용하기 위한 흐름도(110)를 도시한다. 흐름도(110)는 사용자가 전자 장치(10)의 음성 관련 기능을 이용하고 있을 때 시작할 수 있다(블록 112). 음성 관련 기능을 실행할 때, 전자 장치(10)는 사용자 음성 신호(58) 및 주변음(60)을 포함하는 오디오 신호를 수신할 수 있다. 그 오디오 신호로부터, 전자 장치(10)는 일반적으로 사용자 음성의 소정의 특성을 결정하고 및/또는 사용자 음성 신호(58)로부터 사용자 음성 프로파일을 식별할 수 있다(블록 114). 후술하는 바와 같이, 사용자 음성 프로파일은 사용자의 음성과 연관된 소정의 특성을 식별하는 정보를 나타낼 수 있다.

만일 블록(114)에서 검출된 음성 프로파일이 사용자 특정 잡음 억제 파라미터(102)와 연관된 어떤 알려진 사용자와 일치하지 않으면(블록 116), 전자 장치(10)는 잡음 억제(20)를 위해 소정의 디폴트(default) 잡음 억제 파라미터를 적용할 수 있다(블록 118). 그러나, 만일 블록(114)에서 검출된 음성 프로파일이 전자 장치(10)의 알려진 사용자와 일치하고, 전자 장치(10)가 그 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)를 현재 저장하고 있으면, 전자 장치(10)는 대신에 연관된 사용자 특정 잡음 억제 파라미터(102)를 적용할 수 있다(블록 120).

전술한 바와 같이, 사용자 특정 잡음 억제 파라미터(102)는 음성 훈련 시퀀스(104)에 기초하여 결정될 수 있다. 도 7에 도시된 바와 같이, 이러한 음성 훈련 시퀀스(104)의 시작은 핸드헬드 장치(34)와 같은 전자 장치(10)의 실시예의 활성화 단계(130) 동안 사용자에게 옵션으로 제시될 수 있다. 일반적으로, 이러한 활성화 단계(130)는 핸드헬드 장치(34)가 먼저 셀룰러 네트워크에 가입하거나 또는 먼저 통신 케이블(134)을 통해 컴퓨터 또는 다른 전자 장치(132)에 연결할 때 수행될 수 있다. 이러한 활성화 단계(130) 동안, 핸드헬드 장치(34) 또는 컴퓨터 또는 다른 장치(132)는 음성 훈련을 시작하도록 프롬프트(prompt)(136)를 제공할 수 있다. 프롬프트의 선택시, 사용자는 음성 훈련(104)을 시작할 수 있다.

추가로 또는 대안으로, 음성 훈련 시퀀스(104)는 전자 장치(10)가 음성 훈련 모드에 진입하도록 하는 전자 장치(10)의 설정을 사용자가 선택할 때 시작할 수 있다. 도 8에 도시된 바와 같이, 핸드헬드 장치(34)의 홈 화면(140)은 선택시 핸드헬드 장치(34)가 설정 화면(144)을 표시하도록 하는 사용자 선택가능한 버튼(142)을 포함할 수 있다. 사용자가 설정 화면(144) 상에서 "전화"라고 표시된 사용자 선택가능한 버튼(146)을 선택하면, 핸드헬드 장치(34)는 전화 설정 화면(148)을 표시할 수 있다. 전화 설정 화면(148)은 무엇보다도 "음성 훈련"이라고 표시된 사용자 선택가능한 버튼(150)을 포함할 수 있다. 사용자가 음성 훈련 버튼(150)을 선택하면, 음성 훈련(104) 시퀀스가 시작할 수 있다.

도 9의 흐름도(160)는 음성 훈련(104)을 수행하기 위한 방법의 일 실시예를 나타낸다. 흐름도(160)는 전자 장치(10)가 소정의 디스트랙터(예를 들어, 시뮬레이트된 주변음)가 배경으로 재생(play)하는 동안 사용자가 말하도록 프롬프트할 때 시작할 수 있다(블록 162). 예를 들어, 사용자는 락 음악, 사람들 이야기 소리, 종이 구김 소리 등과 같은 소정의 디스트랙터가 컴퓨터 또는 다른 전자 장치(132)에서 또는 전자 장치(10)의 스피커(48)에서 크게 재생하는 동안 소정의 단어(word) 또는 문구(phrase)를 말하도록 요청받을 수 있다. 이러한 디스트랙터가 재생하고 있는 동안, 전자 장치(10)는 사용자 음성의 샘플을 녹음할 수 있다(블록 164). 몇몇 실시예에서, 블록(162 및 164)은 여러 디스트랙터가 재생되는 동안 반복하여 사용자의 음성 및 하나 이상의 디스트랙터 둘 다를 포함하는 여러 테스트 오디오 신호를 획득할 수 있다.

사용자가 어느 잡음 억제 파라미터를 가장 선호하는지를 결정하기 위해서, 전자 장치(10)는 잡음 억제(20)가 테스트 오디오 신호에 적용되는 동안 소정의 테스트 잡음 억제 파라미터를 교대로 적용한 후에 사용자로부터의 피드백을 요청할 수 있다. 예를 들어, 전자 장치(10)는 본 명세서에서 "A"로 표시된 제1 세트의 테스트 잡음 억제 파라미터를 사용자의 음성 샘플 및 하나 이상의 디스트랙터를 포함하는 테스트 오디오 신호에 적용한 후에, 그 오디오를 스피커(48)를 통해 사용자에게 출력할 수 있다(블록 166). 다음에, 전자 장치(10)는 본 명세서에서 "B"로 표시된 다른 세트의 테스트 잡음 억제 파라미터를 사용자의 음성 샘플에 적용한 후에 그 오디오를 스피커(48)를 통해 사용자에게 출력할 수 있다(블록 168). 다음에, 사용자는 (예를 들어, 전자 장치(10)의 디스플레이(18) 상에 "A" 또는 "B"를 선택함으로써) 전자 장치(10)에 의해 출력되는 두 오디오 신호 중 어느 것을 사용자가 선호하는지를 결정할 수 있다(블록 170).

전자 장치(10)는 블록(166-170)의 동작을 여러 테스트 잡음 억제 파라미터 및 여러 디스트랙터를 이용하여 반복하여, 적절한 세트의 사용자 잡음 억제 선호 데이터가 얻어질 때까지 매번 사용자의 잡음 억제 선호도에 대해 더 많이 학습한다(판단 블록 172). 따라서, 전자 장치(10)는 사용자의 음성뿐만 아니라 소정의 일반적인 주변음을 포함하는 오디오 신호에 실제로 적용되는 여러 잡음 억제 파라미터의 바람직성(desirability)을 테스트할 수 있다. 몇몇 실시예에서, 블록(166-170)의 각 반복으로, 전자 장치(10)는 사용자의 잡음 억제 선호도가 정해질 때까지 소정의 잡음 억제 파라미터를 점차적으로 변경하여(예를 들어, 잡음 억제 강도를 점차적으로 증가 또는 감소시켜) 테스트 잡음 억제 파라미터를 "조정"할 수 있다. 다른 실시예에서, 전자 장치(10)는 블록(166-170)의 각 반복마다 다른 유형의 잡음 억제 파라미터(예를 들어, 한번 반복에서 잡음 억제 강도, 다른 반복에서 소정 주파수의 잡음 억제 등)를 테스트할 수 있다. 어느 경우에서든지, 블록(166-170)은 원하는 횟수의 사용자 선호도가 얻어질 때까지 반복될 수 있다(판단 블록 172).

블록(들)(170)에서 얻은 표시된 사용자 선호도에 기초하여, 전자 장치(10)는 사용자 특정 잡음 억제 파라미터(102)를 생성할 수 있다(블록 174). 예를 들면, 전자 장치(10)는 블록(들)(170)의 사용자 피드백에 기초하여, 블록(166-170)의 반복이 정해졌을 때 선호하는 세트의 사용자 특정 잡음 억제 파라미터(102)에 도달할 수 있다. 다른 예에서, 만일 블록(166-170)의 반복이 각각 특정 세트의 잡음 억제 파라미터를 테스트한다면, 전자 장치(10)는 특정 파라미터에 대한 표시된 선호도에 기초하여 종합 세트의 사용자 특정 잡음 억제 파라미터를 생성할 수 있다. 사용자 특정 잡음 억제 파라미터(102)는 동일한 사용자가 나중에 전자 장치(10)의 음성 관련 기능을 이용할 때 잡음 억제를 위해 전자 장치(10)의 메모리(14) 또는 비휘발성 저장 장치(16)에 저장될 수 있다(블록 176).

도 10 내지 도 13은 전자 장치(10)가 도 9의 흐름도(160)를 실행할 수 있는 구체적인 방식과 관련된다. 특히, 도 10 및 도 11은 도 9의 흐름도(160)의 블록(162 및 164)과 관련되고, 도 12 및 도 13a 및 도 13b는 블록(166-172)과 관련된다. 도 10을 참조하면, 이중(dual) 장치 음성 녹음 시스템(180)은 컴퓨터 또는 다른 전자 장치(132) 및 핸드헬드 장치(34)를 포함한다. 몇몇 실시예에서, 핸드헬드 장치(34)는 통신 케이블(134)을 통해 또는 무선 통신(예를 들어, 802.11x Wi-Fi WLAN 또는 블루투스 PAN)을 통해 컴퓨터 또는 다른 전자 장치(132)에 연결될 수 있다. 시스템(180)의 동작 동안, 컴퓨터 또는 다른 전자 장치(132)는 여러 디스트랙터들(182) 중 하나 이상이 배경으로 재생하는 동안 사용자가 단어 또는 문구를 말하도록 프롬프트할 수 있다. 이러한 디스트랙터(182)는, 예를 들어, 종이 구김 소리(184), 사람들 이야기 소리(186), 백색 소음(188), 락 음악(190), 및/또는 도로 소음(192)을 포함할 수 있다. 디스트랙터(182)는 추가로 또는 대안으로, 예를 들어, 도 3을 참조하여 전술한 바와 같은 여러 상황(56)에서 일반적으로 발생되는 다른 잡음을 포함할 수 있다. 컴퓨터 또는 다른 전자 장치(132)에서 크게 재생하는 이러한 디스트랙터(182)는 사용자가 사용자 음성 샘플(194)을 제공하는 동시에 핸드헬드 장치(34)의 마이크로폰(32)에 의해 픽업될 수 있다. 이러한 방식으로, 핸드헬드 장치(34)는 디스트랙터(182) 및 사용자 음성 샘플(194) 둘 다를 포함하는 테스트 오디오 신호를 획득할 수 있다.

도 11의 단일 장치의 음성 녹음 시스템(200)으로 나타내는 다른 실시예에서, 핸드헬드 장치(34)는 디스트랙터(들)(182)를 출력하고 동시에 사용자 음성 샘플(194)을 녹음할 수 있다. 도 11에 도시된 바와 같이, 핸드헬드 장치(34)는 사용자 음성 샘플(194)을 위해 사용자가 단어 또는 문구를 말하도록 프롬프트할 수 있다. 동시에, 핸드헬드 장치(34)의 스피커(48)는 하나 이상의 디스트랙터(182)를 출력할 수 있다. 그러면, 핸드헬드 장치(34)의 마이크로폰(32)은 컴퓨터 또는 다른 전자 장치(132) 없이 현재 재생하는 디스트랙터(182) 및 사용자 음성 샘플(194) 둘 다를 포함하는 테스트 오디오 신호를 녹음할 수 있다.

블록(166-170)에 대응하여, 도 12는 테스트 오디오 신호에 적용된 잡음 억제 파라미터의 선택에 기초하여 사용자의 잡음 억제 선호도를 결정하기 위한 실시예를 예시한다. 특히, 본 명세서에서 핸드헬드 장치(34)로 나타낸 전자 장치(10)는 사용자 음성 샘플(194) 및 적어도 하나의 디스트랙터(182) 둘 다를 포함하는 테스트 오디오 신호에 제1 세트의 잡음 억제 파라미터("A")를 적용할 수 있다. 핸드헬드 장치(34)는 결과적인 잡음 억제된 오디오 신호를 출력할 수 있다(참조 부호 212). 핸드헬드 장치(34)는 또한 제2 세트의 잡음 억제 파라미터("B")를 테스트 오디오 신호에 적용한 다음 결과적인 잡음 억제된 오디오 신호를 출력할 수 있다(참조 부호 214).

사용자가 두 세트의 잡음 억제 파라미터 "A" 및 "B"를 테스트 오디오 신호에 적용한 결과를 들었을 때, 핸드헬드 장치(34)는 사용자에게, 예를 들어, "A 또는 B 중 어느 것을 선호하세요?"라고 물어볼 수 있다(참조 부호 216). 그러면, 사용자는 출력된 잡음 억제된 신호에 기초하여 잡음 억제 선호도를 표시할 수 있다. 예를 들어, 사용자는 핸드헬드 장치(34)의 화면(218)을 통해 제1 잡음 억제된 오디오 신호("A") 또는 제2 잡음 억제된 오디오 신호("B")를 선택할 수 있다. 몇몇 실시예에서, 사용자는 "A" 또는 "B"를 큰 소리로 말하는 것과 같이, 다른 방식으로 선호도를 표시할 수 있다.

전자 장치(10)는 다양한 방식으로 특정 잡음 억제 파라미터에 대한 사용자 선호도를 결정할 수 있다. 도 13의 흐름도(220)는 도 9의 흐름도(160)의 블록(166-172)을 수행하기 위한 방법의 일 실시예를 나타낸다. 흐름도(220)는 전자 장치(10)가 예시 목적상 "A" 및 "B"로 표시된 한 세트의 잡음 억제 파라미터를 적용할 때 시작할 수 있다. 만일 사용자가 잡음 억제 파라미터 "A"를 선호하면(판단 블록 224), 다음으로 전자 장치(10)는 마찬가지로 설명 목적상 "C" 및 "D"로 표시된 새로운 세트의 잡음 억제 파라미터를 적용할 수 있다(블록 226). 특정 실시예에서, 잡음 억제 파라미터들 "C" 및 "D"는 잡음 억제 파라미터 "A"의 변형일 수 있다. 만일 사용자가 잡음 억제 파라미터 "C"를 선호하면(판단 블록 228), 전자 장치는 잡음 억제 파라미터를 "A" 및 "B"의 조합으로 설정할 수 있다(블록 230). 만일 사용자가 잡음 억제 파라미터 "D"를 선호하면(판단 블록 228), 전자 장치는 사용자 특정 잡음 억제 파라미터를 잡음 억제 파라미터들 "A" 및 "D"의 조합으로 설정할 수 있다(블록 232).

만일 블록(222) 후에 사용자가 잡음 억제 파라미터 "B"를 선호하면(판단 블록 224), 전자 장치(10)는 새로운 잡음 억제 파라미터들 "C" 및 "D"를 적용할 수 있다(블록 234). 특정 실시예에서, 새로운 잡음 억제 파라미터들 "C" 및 "D"는 잡음 억제 파라미터 "B"의 변형일 수 있다. 만일 사용자가 잡음 억제 파라미터 "C"를 선호하면(판단 블록 236), 전자 장치(10)는 사용자 특정 잡음 억제 파라미터를 "B" 및 "C"의 조합으로 설정할 수 있다(블록 238). 그렇지 않고, 만일 사용자가 잡음 억제 파라미터 "D"를 선호하면(판단 블록 236), 전자 장치(10)는 사용자 특정 잡음 억제 파라미터를 "B" 및 "D"의 조합으로 설정할 수 있다(블록 240). 인식하여야 하는 바와 같이, 흐름도(220)는 단지 도 9의 흐름도(160)의 블록(166-172)을 수행하는 단지 한가지 방식으로서 제시된다. 따라서, 더 많은 잡음 억제 파라미터들이 테스트될 수 있고, 이러한 파라미터들이 소정의 디스트랙터와 함께 구체적으로 테스트될 수 있다는 것을 이해하여야 한다(예를 들어, 특정 실시예에서, 흐름도(220)는 각각의 디스트랙터들(182)을 각각 포함하는 테스트 오디오 신호들에 대해 반복할 수 있다).

음성 훈련 시퀀스(104)는 다른 방식으로 수행될 수 있다. 예를 들어, 도 14의 흐름도(250)로 나타낸 일 실시예에서, 사용자 음성 샘플(194)은 먼저 어떤 디스트랙터(182)도 배경으로 재생하지 않고 얻을 수 있다(블록 252). 일반적으로, 이러한 사용자 음성 샘플(194)은 조용한 방과 같이 주변음(60)이 매우 적은 위치에서 얻을 수 있으므로, 사용자 음성 샘플(194)은 비교적 높은 신호 대 잡음비(SNR)를 갖는다. 그 후, 전자 장치(10)는 사용자 음성 샘플(194)을 여러 디스트랙터(182)와 전자적으로 혼합할 수 있다(블록 254). 따라서, 전자 장치(10)는 단일 사용자 음성 샘플(194)을 이용하여 여러 디스트랙터(182)를 갖는 하나 이상의 테스트 오디오 신호를 만들어 낼 수 있다.

그 후, 전자 장치(10)는 사용자 특정 잡음 억제 파라미터(102)를 결정하기 위해 어느 잡음 억제 파라미터를 사용자가 가장 선호하는지를 결정할 수 있다. 도 9의 블록(166-170)과 유사한 방식으로, 전자 장치(10)는 사용자 선호도를 판단하기 위해 블록(254)에서 얻은 테스트 오디오 신호에 소정의 테스트 잡음 억제 파라미터들을 교대로 적용할 수 있다(블록 256-260). 전자 장치(10)는 여러 테스트 잡음 억제 파라미터 및 여러 디스트랙터를 이용하여 블록(256-260)의 동작을 반복하여, 적절한 세트의 사용자 잡음 억제 선호 데이터가 얻어질 때까지(판단 블록 262) 매번 사용자의 잡음 억제 선호도에 대해 더 많이 학습하게 된다. 따라서, 전자 장치(10)는 사용자의 음성뿐만 아니라 소정의 일반적인 주변음을 포함하는 테스트 오디오 신호에 적용되는 여러 잡음 억제 파라미터의 바람직성을 테스트할 수 있다.

도 9의 블록(174)과 같이, 전자 장치(10)는 사용자 특정 잡음 억제 파라미터(102)를 생성할 수 있다(블록 264). 사용자 특정 잡음 억제 파라미터(102)는 동일한 사용자가 나중에 전자 장치(10)의 음성 관련 기능을 이용할 때 잡음 억제를 위해 전자 장치(10)의 메모리(14) 또는 비휘발성 저장 장치(16)에 저장될 수 있다(블록 266).

전술한 바와 같이, 본 발명의 특정 실시예는 배경으로 크게 재생하는 디스트랙터(182)가 없는 사용자 음성 샘플(194)을 획득하는 것을 수반할 수 있다. 몇몇 실시예에서, 전자 장치(10)는 처음에, 사용자가 사용자를 방해하지 않는 조용한 설정에서 전자 장치(10)의 음성 관련 기능을 이용하는 사용자 음성 샘플(194)을 획득할 수 있다. 도 15의 흐름도(270)에 나타낸 바와 같이, 몇몇 실시예에서, 전자 장치(10)는 전자 장치(10)가 처음에 사용자의 음성을 포함하는 오디오의 충분히 높은 신호 대 잡음비(SNR)를 검출할 때 그러한 사용자 음성 샘플(194)을 획득할 수 있다.

도 15의 흐름도(270)는 사용자가 전자 장치(10)의 음성 관련 기능을 이용하고 있을 때 시작할 수 있다(블록 272). 사용자의 신원을 확인하기 위해, 전자 장치(10)는 마이크로폰(32)에 의해 검출된 오디오 신호에 기초하여 사용자의 음성 프로파일을 검출할 수 있다(블록 274). 만일 블록(274)에서 검출된 음성 프로파일이 전자 장치의 알려진 사용자의 음성의 음성 프로파일을 나타낸다면(판단 블록 276), 전자 장치(10)는 그 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)를 적용할 수 있다(블록 278). 만일 사용자의 신원이 알려지지 않았다면(판단 블록 276), 전자 장치(10)는 처음에 디폴트 잡음 억제 파라미터를 적용할 수 있다(블록 280).

전자 장치(10)는 음성 관련 기능이 이용되는 동안 마이크로폰(32)에 의해 수신된 오디오 신호의 현재 신호 대 잡음비(SNR)를 평가할 수 있다(블록 282). 만일 SNR이 충분히 높으면(예를 들어, 미리 정한 임계값 초과), 전자 장치(10)는 마이크로폰(32)에 의해 수신된 오디오로부터 사용자 음성 샘플(194)을 획득할 수 있다(블록 286). 만일 SNR이 충분히 높지 않다면(예를 들어, 임계값 미만)(판단 블록 284), 전자 장치(10)는 디폴트 잡음 억제 파라미터를 계속해서 적용하여(블록 280), 적어도 주기적으로 계속해서 SNR을 재평가할 수 있다. 이러한 방식으로 획득한 사용자 음성 샘플(194)은 도 14를 참조하여 전술한 바와 같이 음성 훈련 시퀀스(104)에서 나중에 이용될 수 있다. 다른 실시예에서, 전자 장치(10)는 이러한 사용자 음성 샘플(194)을 이용하여 사용자 음성 샘플(194) 그 자체에 기초하여 사용자 특정 잡음 억제 파라미터(102)를 결정할 수 있다.

구체적으로, 음성 훈련 시퀀스(104) 외에, 사용자 음성 샘플(194)과 연관된 소정의 특성에 기초하여 사용자 특정 잡음 억제 파라미터(102)가 결정될 수 있다. 예를 들어, 도 16은 이러한 사용자 음성 특성에 기초하여 사용자 특정 잡음 억제 파라미터(102)를 결정하기 위한 흐름도(290)를 나타낸다. 흐름도(290)는 전자 장치(10)가 사용자 음성 샘플(194)을 획득할 때 시작할 수 있다(블록 292). 사용자 음성 샘플은, 예를 들어, 도 15의 흐름도(270)에 따라서 얻어질 수 있거나, 또는 전자 장치(10)는 사용자가 특정 단어 또는 문구를 말하도록 프롬프트할 때 얻어질 수 있다. 다음에, 전자 장치는 사용자 음성 샘플과 연관된 소정의 특성을 분석할 수 있다(블록 294).

사용자 음성 샘플(194)과 연관된 여러 특성에 기초하여, 전자 장치(10)는 사용자 특정 잡음 억제 파라미터(102)를 결정할 수 있다(블록 296). 예를 들어, 도 17의 음성 특징도(300)에 나타낸 바와 같이, 사용자 음성 샘플(194)은 여러 음성 샘플 특성(302)을 포함할 수 있다. 이러한 특성(302)은 무엇보다도 사용자 음성 샘플(194)의 평균 주파수(304), 사용자 음성 샘플(194)의 주파수 변동성(306), 사용자 음성 샘플(194)과 연관된 일반적인 언어음(speech sound)(308), 사용자 음성 샘플(194)의 주파수 범위(310), 사용자 음성 샘플의 주파수의 포먼트(formant) 위치(312), 및/또는 사용자 음성 샘플(194)의 동적 범위(314)를 포함할 수 있다. 이러한 특징들은 여러 사용자가 여러 음성 패턴(speech patterns)을 가질 수 있기 때문에 발생할 수 있다. 즉, 사용자 음성의 고음 또는 저음, 사용자가 말할 때 악센트, 및/또는 혀짧은 소리(lisp) 등은 이들이 특징(302)과 같은 측정 가능한 음성의 특성을 변경할 정도로 고려될 수 있다.

전술한 바와 같이, 사용자 특정 잡음 억제 파라미터(102)는 또한 사용자 설정(108)의 직접적인 선택에 의해 결정될 수 있다. 그러한 한가지 예가 핸드헬드 장치(32)의 사용자 설정 화면 시퀀스(320)로서 도 18에 나타나 있다. 화면 시퀀스(320)는 전자 장치(10)가 설정 버튼(142)을 포함하는 홈 화면(140)을 표시할 때 시작할 수 있다. 설정 버튼(142)을 선택하면 핸드헬드 장치(34)는 설정 화면(144)을 표시할 수 있다. 설정 화면(144) 상에서 "전화"라고 표시된 사용자 선택가능한 버튼(146)을 선택하면 핸드헬드 장치(34)는 전화 설정 화면(148)을 표시할 수 있고, 이는 여러 사용자 선택가능한 버튼들을 포함할 수 있으며, 그 중 하나는 "잡음 억제"라고 표시된 사용자 선택가능한 버튼(322)일 수 있다.

사용자가 사용자 선택가능한 버튼(322)을 선택하면, 핸드헬드 장치(34)는 잡음 억제 선택 화면(324)을 표시할 수 있다. 잡음 억제 선택 화면(324)을 통해, 사용자는 잡음 억제 강도를 선택할 수 있다. 예를 들어, 사용자는 선택 휠(326)을 통해 잡음 억제가 고, 중, 또는 저 강도이어야 하는지를 선택할 수 있다. 고 잡음 억제 강도를 선택하면 결과적으로 수신된 오디오 신호에서 주변음(60)을 더 많이 억제하지만, 아마도 사용자의 음성(58)도 더 많이 억제하는 사용자 특정 잡음 억제 파라미터(102)를 얻을 수 있다. 저 잡음 억제 강도를 선택하면 주변음(60)을 더 많이 허용하지만, 사용자의 음성(58) 역시 수신된 오디오 신호에 더 많이 남게 하는 사용자 특정 잡음 억제 파라미터(102)를 얻을 수 있다.

다른 실시예에서, 사용자는 전자 장치(10)의 음성 관련 기능을 이용하는 동안 사용자 특정 잡음 억제 파라미터(102)를 실시간으로 조정할 수 있다. 예를 들면, 핸드헬드 장치(34)에 표시될 수 있는 도 19의 진행 중인 통화(call-in-process) 화면(330)에서 보는 바와 같이, 사용자는 음성 전화 통화 품질 피드백 척도(332)를 제공할 수 있다. 특정 실시예에서, 피드백은 통화 품질을 표시하는 선택가능한 별(stars)(334)의 개수로 나타낼 수 있다. 만일 사용자에 의해 선택된 별(334)의 개수가 많으면, 사용자는 현재 사용자 특정 잡음 억제 파라미터(102)에 만족하고, 그래서 전자 장치(10)는 잡음 억제 파라미터를 변경할 수 없다고 이해될 수 있다. 반면에, 만일 선택된 별(334)의 개수가 적으면, 전자 장치(10)는 별(334)의 개수가 증가되어 사용자 만족을 표시할 때까지 사용자 특정 잡음 억제 파라미터(102)를 변경할 수 있다. 추가로 또는 대안으로, 진행 중인 통화 화면(330)은 도 18을 참조하여 전술한 바와 같이, 실시간 사용자 선택가능한 잡음 억제 강도 설정을 포함할 수 있다.

특정 실시예에서, 서브 세트의 사용자 특정 잡음 억제 파라미터(102)는 소정의 디스트랙터(182) 및/또는 소정의 상황(60)과 연관된 것으로 결정될 수 있다. 도 20의 파라미터 도면(340)에 예시된 바와 같이, 사용자 특정 잡음 억제 파라미터들(102)은 특정 디스트랙터(182)에 기초하여 서브 세트들로 분할될 수 있다. 예를 들어, 사용자 특정 잡음 억제 파라미터들(102)은 디스트랙터 특정 파라미터들(344-352)을 포함할 수 있으며, 이들은 사용자의 음성(58)도 포함하는 오디오 신호로부터 디스트랙터(182)와 연관된 소정의 주변음(60)을 필터링하도록 선택된 잡음 억제 파라미터들을 나타낼 수 있다. 사용자 특정 잡음 억제 파라미터(102)는 다소간의 디스트랙터 특정 파라미터를 포함할 수 있다는 것을 이해하여야 한다. 예를 들어, 만일 여러 디스트랙터(182)가 음성 훈련(104) 동안 테스트된다면, 사용자 특정 잡음 억제 파라미터(102)는 여러 디스트랙터 특정 파라미터를 포함할 수 있다.

디스트랙터 특정 파라미터(344-352)는 사용자 특정 잡음 억제 파라미터(102)가 결정될 때 결정될 수 있다. 예를 들어, 음성 훈련(104) 동안, 전자 장치(10)는 여러 디스트랙터(182)를 포함하는 테스트 오디오 신호를 이용하여 다수의 잡음 억제 파라미터를 테스트할 수 있다. 각 디스트랙터(182)에 대한 잡음 억제와 관련한 사용자의 선호도에 따라, 전자 장치는 디스트랙터 특정 파라미터(344-352)를 결정할 수 있다. 예를 들면, 전자 장치는 종이 구김 소리 디스트랙터(184)를 포함하는 테스트 오디오 신호에 기초하여 종이 구김 소리에 대한 파라미터(344)를 결정할 수 있다. 후술하는 바와 같이, 파라미터 도면(340)의 디스트랙터 특정 파라미터는 나중에 전자 장치(10)가 소정의 주변음(60)의 존재시 및/또는 소정의 상황(56)에서 사용될 때와 같은 특정한 경우에 재호출될 수 있다.

추가로 또는 대안으로, 사용자 특정 잡음 억제 파라미터(102)의 서브 세트는 전자 장치(10)의 음성 관련 기능이 이용될 수 있는 소정의 상황(56)에 대해 규정될 수 있다. 예를 들어, 도 21에 도시된 파라미터 도면(360)에 나타낸 바와 같이, 사용자 특정 잡음 억제 파라미터(102)는 잡음 억제 파라미터가 가장 잘 사용될 수 있는 상황(56)에 기초하여 서브 세트로 분할될 수 있다. 예를 들어, 사용자 특정 잡음 억제 파라미터(102)는 특정 상황(56)과 연관될 수 있는 소정의 주변음(60)을 필터링하도록 선택된 잡음 억제 파라미터를 나타내는, 상황 특정 파라미터(364-378)를 포함할 수 있다. 사용자 특정 잡음 억제 파라미터(102)는 다소간의 상황 특정 파라미터를 포함할 수 있음을 이해하여야 한다. 예를 들어, 후술하는 바와 같이, 전자 장치(10)는 여러 상황들(56)을 식별할 수 있으며, 그 각각은 예상되는 특정 주변음(60)을 가질 수 있다. 따라서, 사용자 특정 잡음 억제 파라미터(102)는 각각의 식별가능한 상황(56)에서 잡음을 억제하는 여러 상황 특정 파라미터를 포함할 수 있다.

디스트랙터 특정 파라미터(344-352)와 같이, 상황 특정 파라미터(364-378)는 사용자 특정 잡음 억제 파라미터(102)가 결정될 때 결정될 수 있다. 일 예를 제공하기 위해, 음성 훈련(104) 동안, 전자 장치(10)는 여러 디스트랙터(182)를 포함하는 테스트 오디오 신호를 이용하여 다수의 잡음 억제 파라미터를 테스트할 수 있다. 각 디스트랙터(182)에 대한 잡음 억제와 관련한 사용자의 선호도에 따라, 전자 장치(10)는 상황 특정 파라미터(364-378)를 결정할 수 있다.

전자 장치(10)는 상황 특정 파라미터(364-378) 각각의 상황(56) 및 하나 이상의 디스트랙터(182) 간의 관계에 기초하여 상황 특정 파라미터(364-378)를 결정할 수 있다. 구체적으로, 전자 장치(10)에게 식별가능한 각각의 상황(56)은 하나 이상의 특정 디스트랙터(182)와 연관될 수 있다는 것에 주목하여야 한다. 예를 들어, 자동차(70)를 타는 상황(56)은 주로 하나의 디스트랙터(182), 즉, 도로 소음(192)과 연관될 수 있다. 따라서, 자동차를 타는 상황 특정 파라미터(376)는 도로 소음(192)을 포함한 테스트 오디오 신호와 관련한 사용자 선호도에 기초할 수 있다. 유사하게, 스포츠 경기(72)의 상황(56)은 사람들 이야기 소리(186), 백색 소음(188), 및 락 음악(190)과 같은 여러 디스트랙터(182)와 연관될 수 있다. 따라서, 스포츠 경기에 대한 상황 특정 파라미터(368)는 사람들 이야기 소리(186), 백색 소음(188), 및 락 음악(190)을 포함한 테스트 오디오 신호와 관련한 사용자 선호도들의 조합에 기초할 수 있다. 이러한 조합에는 상황(56)의 주변음(60)과 더욱 가깝게 일치할 것으로 예상되는 디스트랙터(182)를 더 비중있게 고려하기 위해 더 많은 가중치가 부여될 수 있다.

전술한 바와 같이, 사용자 특정 잡음 억제 파라미터(102)는 음성 훈련(104)이 있을 때나 없을 때에도 (예를 들어, 도 16 및 17을 참조하여 전술한 바와 같이)사용자 음성 샘플(194)의 특징에 기초하여 결정될 수 있다. 이러한 상황 하에서, 전자 장치(10)는 추가로 또는 대안으로 (예를 들어, 사용자 프롬프트 없이) 디스트랙터 특정 파라미터(344-352) 및/또는 상황 특정 파라미터(364-378)를 자동으로 결정할 수 있다. 이러한 잡음 억제 파라미터(344-352 및/또는 363-378)는 사용자 음성 샘플(194) 및 소정의 디스트랙터(182)에 적용될 때 이러한 잡음 억제 파라미터의 예상되는 성능에 기초하여 결정될 수 있다.

전자 장치(10)의 음성 관련 기능이 이용 중일 때, 전자 장치(10)는 디스트랙터 특정 파라미터(344-352) 및/또는 상황 특정 파라미터(364-378)를 이용하여 잡음 억제(20)를 사용자 및 주변음(60)의 특성 둘 다에 맞출 수가 있다. 구체적으로, 도 22는 평가된 주변음(60)의 특성에 기초하여 디스트랙터 특정 파라미터(344-352)를 선택하여 적용하기 위한 방법의 실시예를 예시한다. 도 23은 전자 장치(10)가 사용되는 식별된 상황(56)에 기초하여 상황 특정 파라미터(364-378)를 선택하여 적용하기 위한 방법의 실시예를 도시한다.

도 22를 참조하면, 디스트랙터 특정 파라미터(344-352)를 선택하여 적용하기 위한 흐름도(380)는 전자 장치(10)의 음성 관련 기능이 이용 중일 때 시작할 수 있다(블록 382). 다음에, 전자 장치(10)는 그의 마이크로폰(32)에 의해 수신된 주변음(60)의 특성을 결정할 수 있다(블록 384). 몇몇 실시예에서, 전자 장치(10)는, 예를 들어, 음량 레벨(예컨대, 사용자의 음성(58)은 일반적으로 주변음(60)보다 클 수 있다) 및/또는 주파수(예컨대, 주변음(60)은 사용자의 음성(58)과 연관된 주파수 범위 밖에서 발생할 수 있다)에 기초하여, 주변음(60)과 사용자의 음성(58) 사이를 구별할 수 있다.

주변음(60)의 특성은 디스트랙터들(182) 중 하나 이상과 유사할 수 있다. 따라서, 몇몇 실시예에서, 전자 장치(10)는 주변음(60)과 가장 가깝게 일치하는 디스트랙터 특정 파라미터들(344-352) 중 하나를 적용할 수 있다(블록 386). 식당(74)에 있는 상황(56)에서, 예를 들어, 마이크로폰(32)에 의해 검출된 주변음(60)은 사람들 이야기 소리(186)와 가장 가깝게 일치할 수 있다. 따라서, 전자 장치(10)는 그러한 주변음(60)이 검출될 때 디스트랙터 특정 파라미터(346)를 적용할 수 있다. 다른 실시예에서, 전자 장치(10)는 주변음(60)과 가장 가깝게 일치하는 디스트랙터 특정 파라미터들(344-352) 중 몇 개를 적용할 수 있다. 이들 몇 개의 디스트랙터 특정 파라미터들(344-352)에는 주변음(60)과 대응하는 디스트랙터(182)의 유사성에 기초하여 가중치가 부여될 수 있다. 예를 들어, 스포츠 경기(72)의 상황(56)에서는 주변음(60)이 사람들 이야기 소리(186), 백색 소음(188), 및 락 음악(190)과 같은 몇 개의 디스트랙터(182)와 유사할 수 있다. 이러한 주변음(60)이 검출되면, 전자 장치(10)는 주변음(60)과의 각각의 유사성에 비례하여 몇 개의 연관된 디스트랙터 특정 파라미터들(346, 348, 및/또는 350)을 적용할 수 있다.

유사한 방식으로, 전자 장치(10)는 전자 장치(10)가 사용되는 식별된 상황(56)에 기초하여 상황 특정 파라미터(364-378)를 선택하여 적용할 수 있다. 도 23을 참조하면, 그렇게 수행하기 위한 흐름도(390)는 전자 장치(10)의 음성 관련 기능이 이용 중일 때 시작할 수 있다(블록 392). 다음에, 전자 장치(10)는 전자 장치(10)가 사용 중인 현재 상황(56)을 결정할 수 있다(블록 394). 구체적으로, 전자 장치(10)는 (도 24를 참조하여 이하에서 더욱 상세히 설명되는) 여러 장치 상황 요인들(context factors)을 고려할 수 있다. 전자 장치(10)가 사용 중인 것으로 결정되는 상황(56)에 기초하여, 전자 장치(10)는 상황 특정 파라미터들(364-378) 중 연관된 하나를 적용할 수 있다(블록 396).

도 24의 장치 상황 요인 도면(400)에 도시된 바와 같이, 전자 장치(10)는 여러 장치 상황 요인들(402)을 고려하여 전자 장치(10)가 사용 중인 현재 상황(56)을 식별할 수 있다. 이러한 장치 상황 요인들(402)은 여러 실시예에서 단독으로 또는 조합하여 고려될 수 있으며, 어떤 경우에는, 장치 상황 요인들(402)에는 가중치가 부여될 수 있다. 즉, 상황(56)을 결정할 때 현재 상황(56)을 정확하게 예측할 가능성이 높은 장치 상황 요인들(402)에는 더 큰 가중치가 부여될 수 있으며, 반면에 현재 상황(56)을 정확하게 예측할 가능성이 낮은 장치 상황 요인들(402)에는 더 작은 가중치가 부여될 수 있다.

예를 들어, 장치 상황 요인들(402) 중 제1 요인(404)은 전자 장치(10)의 마이크로폰(32)에 의해 검출된 주변음(60)의 특성일 수 있다. 주변음(60)의 특성이 상황(56)과 관련 있을 수 있기 때문에, 전자 장치(10)는 적어도 부분적으로 그러한 분석에 기초하여 상황(56)을 결정할 수 있다.

장치 상황 요인들(402) 중 제2 요인(406)은 현재 날짜 또는 시간일 수 있다. 몇몇 실시예에서, 전자 장치(10)는 현재 날짜 및/또는 시간과 전자 장치(10)의 달력 기능을 비교하여 상황을 결정할 수 있다. 예를 들면, 만일 달력 기능이 사용자가 저녁 식사가 예정되어 있다고 나타내면, 제2 요인(406)에는 상황(56)이 식당(74)인 것으로 결정하는 것에 유리하게 가중치가 부여될 수 있다. 다른 예에서, 사용자는 아침 또는 늦은 오후에 출퇴근할 가능성이 있을 수 있기 때문에, 그때 제2 요인(406)에는 상황(56)이 자동차(70)인 것으로 결정하는 것에 유리하게 가중치가 부여될 수 있다.

장치 상황 요인들(402) 중 제3 요인(408)에는 위치 감지 회로(22)에 의해 결정될 수 있는 전자 장치(10)의 현재 위치일 수 있다. 제3 요인(408)을 이용하여, 전자 장치(10)는, 예를 들어, 현재 위치와 전자 장치(10)의 지도 기능에서 알려진 위치(예컨대, 식당(74) 또는 사무실(64)) 또는 전자 장치(10)가 흔히 위치하는(예컨대, 사무실(64) 또는 가정(62)을 나타낼 수 있는) 위치를 비교하여 상황(56)을 결정할 때 그의 현재 위치를 고려할 수 있다.

장치 상황 요인들(402) 중 제4 요인(410)은, 예를 들어, 전자 장치의 이미지 캡처 회로(28)를 통해 전자 장치(10) 주변에서 검출된 주변 광(ambient light)량일 수 있다. 예를 들면, 많은 양의 주변 광은 실외에 위치한 소정의 상황(56)(예컨대, 복잡한 거리(68))과 연관될 수 있다. 이러한 상황 하에서, 요소(410)에는 실외에 위치한 상황(56)에 유리하게 가중치가 부여될 수 있다. 대조적으로, 적은 양의 주변 광량은 실내(예컨대, 가정(62))에 위치한 소정의 상황(56)과 연관될 수 있으며, 여기서 요인(410)에는 이러한 실내 상황(56)에 유리하게 가중치가 부여될 수 있다.

장치 상황 요인들(402) 중 제5 요인(412)은 전자 장치(10)의 검출된 움직임일 수 있다. 이러한 움직임은 가속도계 및/또는 자력계(30)에 기초하여 및/또는 위치 감지 회로(22)에 의해 결정된 시간의 경과에 따른 위치 변화에 기초하여 검출될 수 있다. 움직임은 여러 방식으로 주어진 상황(56)을 제시할 수 있다. 예를 들어, 전자 장치(10)가 매우 빠르게(예컨대, 시간 당 20 마일보다 빠르게) 움직이는 것으로 검출되면, 요인(412)에는 전자 장치(10)가 자동차(70) 또는 유사한 수송 형태 내에 있다는 것에 유리하게 가중치가 부여될 수 있다. 전자 장치(10)가 랜덤하게 이동 중이면, 요인(412)에는 전자 장치(10)의 사용자가 이동(예컨대, 체육관(66) 또는 파티(76)에서)할 수 있는 상황에 유리하게 가중치가 부여될 수 있다. 전자 장치(10)가 대부분 움직이지 않으면, 요인(412)에는 사용자가 일정 시간 동안 한 장소(예컨대, 사무실(64) 또는 식당(74))에 않아 있는 상황(56)에 유리하게 가중치가 부여될 수 있다.

장치 상황 요인들(402) 중 제6 요인(414)에는 다른 장치(예컨대, 블루투스 핸드셋)와의 연결일 수 있다. 예를 들어, 자동차 핸즈프리 전화 시스템과의 블루투스 연결시 제6 요인(414)에는 상황(56)이 자동차(70) 내인 것으로 결정하는 것에 유리하게 가중치가 부여될 수 있다.

몇몇 실시예에서, 전자 장치(10)는 전자 장치(10)의 주어진 사용자와 연관된 사용자 음성 프로파일에 기초하여 사용자 특정 잡음 억제 파라미터(102)를 결정할 수 있다. 결과적인 사용자 특정 잡음 억제 파라미터(102)는 잡음 억제(20)로 하여금 사용자 음성 프로파일과 연관된 것으로 나타나지 않아, 그래서 소음일 가능성이 있다고 이해될 수 있는 주변음(60)을 분리하게끔 할 수 있다. 도 25 내지 도 29는 그러한 기술과 관련된다.

도 25에 도시된 바와 같이, 사용자 음성 프로파일을 획득하기 위한 흐름도(420)는 전자 장치(10)가 음성 샘플을 획득할 때 시작할 수 있다(블록 422). 이러한 음성 샘플은 전술한 방식들 중 어떤 방식으로도 획득될 수 있다. 전자 장치(10)는 도 17를 참조하여 전술한 바와 같은 음성 샘플의 특징들 중 소정 특징을 분석할 수 있다(블록 424). 특정 특징은 정량화되어 사용자의 음성 프로파일로서 저장될 수 있다(블록 426). 결정된 사용자 음성 프로파일은 후술하는 바와 같이 사용자의 음성에 잡음 억제(20)를 맞추는데 이용될 수 있다. 추가로, 도 15를 참조하여 전술한 바와 같이, 사용자 음성 프로파일은 전자 장치(10)로 하여금 특정 사용자가 전자 장치(10)의 음성 관련 기능을 이용 중일 때를 식별하게 할 수 있다.

이러한 음성 프로파일을 이용하면, 전자 장치(10)는 사용자의 음성에 가장 잘 적용할 수 있는 방식으로 잡음 억제(20)를 수행할 수 있다. 일 실시예에서, 도 26의 흐름도(430)에 나타낸 바와 같이, 전자 장치(10)는 사용자의 음성(58)보다 주변음(60)에 해당할 가능성이 더 많은 오디오 신호의 주파수를 억제하며, 반면에 음성 신호(58)에 해당할 가능성이 더 많은 주파수를 강화시킬 수 있다. 흐름도(430)는 사용자가 전자 장치(10)의 음성 관련 기능을 이용 중일 때 시작할 수 있다(블록 432). 전자 장치(10)는 사용자 음성 신호(58) 및 주변음(60) 둘 다를 포함하는 수신된 오디오 신호와 사용자가 현재 전자 장치(10)에 말하는 것과 연관된 사용자 음성 프로파일을 비교할 수 있다(블록 434). 잡음 억제(20)를 사용자의 음성에 맞추기 위해, 전자 장치는 사용자 음성 프로파일과 연관되지 않는 오디오 신호의 주파수를 억제하는 방식으로 그리고 사용자 음성 프로파일과 연관된 오디오 신호의 주파수를 증폭함으로써 잡음 억제(20)를 수행할 수 있다(블록 436).

그와 같이 수행하기 위한 한가지 방식이 도 27 내지 도 29에 도시되어 있으며, 이들 도면은 오디오 신호, 사용자 음성 프로파일, 및 발신 잡음 억제된 신호를 모델링한 플롯들을 나타낸다. 도 27을 참조하면, 플롯(440)은 음성 관련 기능이 이용 중인 동안 전자 장치(10)의 마이크로폰(32)에 수신되고 주파수 영역으로 변환된 오디오 신호를 나타낸다. 세로 좌표(442)는 오디오 신호의 주파수 크기를 나타내고 가로 좌표(444)는 오디오 신호의 여러 이산 주파수 성분을 나타낸다. 오디오 신호를 주파수 영역으로 변환하기 위해 고속 푸리에 변환(FFT)과 같은 어떤 적절한 변환이 이용될 수 있음을 이해하여야 한다. 유사하게, 오디오 신호는 적절한 임의 개수의 이산 주파수 성분들(예컨대, 40, 128, 256 등)로 분할될 수 있다.

대조적으로, 도 28의 플롯(450)은 사용자 음성 프로파일과 연관된 주파수를 모델링한 플롯이다. 세로 좌표(452)는 사용자 음성 파일의 주파수 크기를 나타내고 가로 좌표(454)는 사용자 음성 파일의 이산 주파수 성분을 나타낸다. 도 27의 오디오 신호 플롯(440)과 도 28의 사용자 음성 프로파일 플롯(450)을 비교하면, 모델링된 오디오 신호는 전반적으로 사용자 음성 프로파일과 연관되지 않는 주파수 범위를 포함하는 것을 알 수 있다. 즉, 모델링된 오디오 신호는 사용자의 음성 외에 다른 주변음(60)을 포함할 가능성이 있을 수 있다.

이러한 비교로부터, 전자 장치(10)가 잡음 억제(20)를 실행하면, 전자 장치는 플롯(450)의 사용자 음성 프로파일의 주파수에 대응하는 플롯(440)의 오디오 신호의 주파수는 일반적으로 증폭되고, 반면에 다른 주파수는 일반적으로 억제되도록 하는 사용자 특정 잡음 억제 파라미터(102)를 결정하거나 선택할 수 있다. 이러한 결과적인 잡음 억제된 오디오 신호는 도 29의 플롯(460)으로 모델링된다. 플롯(460)의 세로 좌표(462)는 잡음 억제된 오디오 신호의 주파수 크기를 나타내고 가로 좌표(464)는 잡음 억제된 신호의 이산 주파수 성분을 나타낸다. 플롯(460)의 증폭된 부분(466)은 대체로 사용자 음성 프로파일에 존재하는 주파수에 해당한다. 대조적으로, 플롯(460)의 억제된 부분(468)은 플롯(450)의 사용자 프로파일과 연관되지 않는 잡음 억제된 신호의 주파수에 해당한다. 몇몇 실시예에서, 플롯(450)의 사용자 음성 프로파일과 연관되지 않는 주파수에는 더 많은 양의 잡음 억제가 적용될 수 있으며, 반면에 증폭되거나 증폭되지 않을 수 있는 부분(466)에는 더 적은 양의 잡음 억제가 적용될 수 있다.

전술한 설명은 전반적으로 도 4에 도시된 바와 같이 발신 오디오 신호에 대해 잡음 억제(20)의 TX NS(84)를 수행하기 위한 사용자 특정 잡음 억제 파라미터(102)를 결정하는데 초점을 맞추었다. 그러나, 전술한 바와 같이, 사용자 특정 잡음 억제 파라미터(102)는 다른 장치로부터 인입 오디오 신호에 대해 RX NS(92)를 수행하는 데에도 또한 사용될 수 있다. 다른 장치로부터의 이러한 인입 오디오 신호는 사용자 자신의 음성을 포함하지 않을 것이기 때문에, 특정 실시예에서, 사용자 특성 잡음 억제 파라미터(102)는 몇 개의 디스트랙터(182) 외에 몇 개의 테스트 음성을 수반하는 음성 훈련(104)에 따라 결정될 수 있다.

예를 들어, 도 30의 흐름도(470)에 제시된 바와 같이, 전자 장치(10)는 사전에 녹음된 또는 시뮬레이트된 음성 및 시뮬레이트된 디스트랙터(182)를 수반하는 음성 훈련(104)을 통해서 사용자 특정 잡음 억제 파라미터(102)를 결정할 수 있다. 이와 같은 음성 훈련(104)의 실시예는 여러 다른 음성 및 디스트랙터(182)를 포함하는 테스트 오디오 신호를 수반할 수 있다. 흐름도(470)는 사용자가 음성 훈련(104)을 개시할 때 시작할 수 있다(블록 472). 오직 사용자 자신의 음성에 기초하여 음성 훈련(104)을 수행하는 대신, 전자 장치(10)는 여러 음성을 포함하는 여러 테스트 오디오 신호에 여러 잡음 억제 파라미터를 적용할 수 있으며, 특정 실시예에서 여러 음성 중 하나는 사용자의 음성일 수 있다(블록 474). 그 후, 전자 장치(10)는 여러 테스트 오디오 신호에 대해 테스트된 여러 잡음 억제 파라미터에 대한 사용자의 선호도를 확인할 수 있다. 인식하여야 하는 바와 같이, 블록(474)은 도 9의 블록(166-170)과 유사한 방식으로 실행될 수 있다.

블록(474)에서 사용자로부터의 피드백에 기초하여, 전자 장치(10)는 사용자 특정 잡음 억제 파라미터(102)를 생성할 수 있다(블록 476). 도 30의 흐름도(470)에 따라서 생성된 사용자 특정 파라미터(102)는 (예를 들어, 도 4에 도시된 바와 같이 RX NS 파라미터(94)를 형성하는데 사용된) 수신된 오디오 신호에 적용하기에 매우 적합할 수 있다. 특히, 수신된 오디오 신호는 전자 장치(10)가 "근단(near-end)" 사용자에 의해 "원단(far-end)" 사용자들과 통화하는 전화기로서 사용될 때 여러 음성을 포함할 것이다. 따라서, 도 31의 흐름도(480)에 도시된 바와 같이, 도 30을 참조하여 설명한 바와 같은 기술을 이용하여 결정된 사용자 특정 잡음 억제 파라미터(102)는 수신된 오디오 신호 내의 원단 사용자의 음성의 특성에 따라 원단 사용자로부터 수신된 오디오 신호에 적용될 수 있다.

흐름도(480)는 전화 또는 채팅 기능과 같은 전자 장치(10)의 음성 관련 기능이 이용 중이면서 다른 전자 장치(10)로부터 원단 사용자의 음성을 포함하는 오디오 신호를 수신할 때 시작할 수 있다(블록 482). 다음에, 전자 장치(10)는 오디오 신호 내의 원단 사용자의 음성의 특성을 결정할 수 있다(블록 484). 그와 같이 하는 것은, 예를 들어, 수신된 오디오 신호 내의 원단 사용자의 음성과 음성 훈련(104) 동안(도 30을 참조하여 전술한 바와 같이 실행될 때) 테스트된 소정의 다른 음성과 비교하는 것을 수반할 수 있다. 다음에, 전자 장치(10)는 종단 사용자의 음성과 가장 유사한 다른 음성들 중 하나에 대응하는 사용자 특정 잡음 억제 파라미터(102)를 적용할 수 있다(블록 486).

일반적으로, 제1 전자 장치(10)가 양방향 통신 동안 제2 전자 장치(10)로부터 원단 사용자의 음성을 포함하는 오디오 신호를 수신하면, 이러한 오디오 신호는 이미 제2 전자 장치(10)에서 잡음 억제를 위해 처리되었을 수 있다. 특정 실시예에 따르면, 도 32의 흐름도(490)에 설명된 바와 같이, 제2 전자 장치(10)에서의 그러한 잡음 억제는 제1 전자 장치(10)의 근단 사용자에 맞추어질 수 있다. 흐름도(490)는 제1 전자 장치(10)(예컨대, 도 33의 핸드헬드 장치(34A)가 제2 전자 장치(10)(예컨대, 핸드헬드 장치(34B))로부터 원단 사용자의 음성의 오디오 신호를 수신하거나 또는 수신하려고 할 때 시작할 수 있다(블록 492). 제1 전자 장치(10)는 근단 사용자에 의해 이전에 결정된 사용자 특정 잡음 억제 파라미터(102)를 제2 전자 장치(10)로 전송할 수 있다(블록 494). 그 후, 제2 전자 장치(10)는 그러한 사용자 특정 잡음 억제 파라미터(102)를 발신 오디오 신호 내의 원단 사용자 음성의 잡음 억제를 향해 적용할 수 있다(블록 496). 따라서, 제2 전자 장치(10)로부터 제1 전자 장치(10)로 전송된 원단 사용자 음성을 포함하는 오디오 신호는 제1 전자 장치(10)의 근단 사용자가 선호하는 잡음 억제 특성을 가질 수 있다.

도 32의 전술한 기술은 잡음 억제 능력이 유사한 핸드헬드 장치들(34A 및 34B)을 포함하는 도 33의 시스템(500)으로 예시된 두 전자 장치(10)를 이용하여 체계적으로 이용될 수 있다. 핸드헬드 장치들(34A 및 34B)이 네트워크를 통해 (예컨대, 전화 또는 채팅 기능을 이용하여) 각각 근단 사용자 및 원단 사용자에 의해 상호 통신하는데 사용되면, 핸드헬드 장치들(34A 및 34B)은 그들 각각의 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)를 교환할 수 있다(블록 504 및 506). 즉, 핸드헬드 장치(34B)는 핸드헬드 장치(34A)의 근단 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)를 수신할 수 있다. 마찬가지로, 핸드헬드 장치(34A)는 핸드헬드 장치(34B)의 원단 사용자와 연관된 사용자 특정 잡음 억제 파라미터(102)를 수신할 수 있다. 그 후, 핸드헬드 장치(34A)는 원단 사용자의 사용자 특정 잡음 억제 파라미터(102)에 기초하여 근단 사용자의 오디오 신호에 대해 잡음 억제(20)를 수행할 수 있다. 마찬가지로, 핸드헬드 장치(34B)는 근단 사용자의 사용자 특정 잡음 억제 파라미터(102)에 기초하여 원단 사용자의 오디오 신호에 대해 잡음 억제(20)를 수행할 수 있다. 이러한 방식으로, 핸드헬드 장치들(34A 및 34B)의 각 사용자는 잡음 억제가 그들 각각의 선호도와 일치하는 다른 장치로부터 오디오 신호를 들을 수 있다.

전술한 특정한 실시예들은 예를 들어 제시되었으며, 이러한 실시예들은 여러 변형 및 대안 형태가 가능할 수 있음을 이해하여야 한다. 또한, 특허청구범위는 개시된 특정 형태들로 제한하고자 하는 것은 아니며, 그보다 본 발명의 정신 및 범주 내에 속하는 모든 변형, 등가물, 및 대안을 망라하는 것으로 의도됨을 이해해야 한다.

Claims

전자 장치에서 수행되는 방법으로서,
사용자 음성 샘플 및 적어도 하나의 디스트랙터를 포함하는 테스트 오디오 신호를 결정하는 단계 - 상기 디스트랙터는 특정 상황에 대해서 시뮬레이트된 주변음임 - ;
적어도 부분적으로 제1 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제1 잡음 억제된 오디오 신호를 획득하는 단계;
상기 제1 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하는 단계;
적어도 부분적으로 제2 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제2 잡음 억제된 오디오 신호를 획득하는 단계;
상기 제2 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하는 단계;
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 제1 사용자 선호도 표시를 획득하는 단계; 및
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 잡음 억제 파라미터들 또는 상기 제2 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제1 사용자 특정 잡음 억제 파라미터들을 결정하는 단계 - 상기 제1 사용자 특정 잡음 억제 파라미터들은 상기 전자 장치의 음성 관련 기능이 이용 중일 때 잡음을 억제하도록 구성됨 -
를 포함하는 방법.
제1항에 있어서, 상기 테스트 오디오 신호를 결정하는 단계는 상기 디스트랙터가 상기 스피커를 통해 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하는 단계를 포함하는 방법.
제1항에 있어서, 상기 테스트 오디오 신호를 결정하는 단계는 상기 디스트랙터가 다른 장치 상에서 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하는 단계를 포함하는 방법.
제1항에 있어서, 상기 테스트 오디오 신호를 결정하는 단계는 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하고 상기 사용자 음성 샘플을 상기 디스트랙터와 전자적으로 혼합하는 단계를 포함하는 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
적어도 부분적으로 제3 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제3 잡음 억제된 오디오 신호를 획득하는 단계 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제3 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하는 단계;
적어도 부분적으로 제4 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제4 잡음 억제된 오디오 신호를 획득하는 단계 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제4 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하는 단계;
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 제2 사용자 선호도 표시를 획득하는 단계; 및
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 상기 제2 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 사용자 특정 잡음 억제 파라미터들, 상기 제3 잡음 억제 파라미터들 또는 상기 제4 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제2 사용자 특정 잡음 억제 파라미터들을 결정하는 단계
를 더 포함하는 방법.
제5항에 있어서,
적어도 부분적으로 상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 기초하여 상기 제3 잡음 억제 파라미터들 및 상기 제4 잡음 억제 파라미터들을 결정하는 단계를 더 포함하는 방법.
적어도 하나의 프로세서 및 상기 적어도 하나의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하는 전자 장치로서, 상기 하나 이상의 프로그램은:
사용자 음성 샘플 및 적어도 하나의 디스트랙터를 포함하는 테스트 오디오 신호를 결정하기 위한 명령어 - 상기 디스트랙터는 특정 상황에 대해서 시뮬레이트된 주변음임 - ;
적어도 부분적으로 제1 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제1 잡음 억제된 오디오 신호를 획득하기 위한 명령어;
상기 제1 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하기 위한 명령어;
적어도 부분적으로 제2 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제2 잡음 억제된 오디오 신호를 획득하기 위한 명령어;
상기 제2 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하기 위한 명령어;
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 제1 사용자 선호도 표시를 획득하기 위한 명령어; 및
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 잡음 억제 파라미터들 또는 상기 제2 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제1 사용자 특정 잡음 억제 파라미터들을 결정하기 위한 명령어 - 상기 제1 사용자 특정 잡음 억제 파라미터들은 상기 전자 장치의 음성 관련 기능이 이용 중일 때 잡음을 억제하도록 구성됨 -
를 포함하는 전자 장치.
제7항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 상기 디스트랙터가 상기 스피커를 통해 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하기 위한 명령어들을 포함하는 전자 장치.
제7항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 상기 디스트랙터가 다른 장치 상에서 동안 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하기 위한 명령어들을 포함하는 전자 장치.
제7항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하고 상기 사용자 음성 샘플을 상기 디스트랙터와 전자적으로 혼합하기 위한 명령어들을 포함하는 전자 장치.
제7항 내지 제10항 중 어느 한 항에 있어서,
적어도 부분적으로 제3 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제3 잡음 억제된 오디오 신호를 획득하기 위한 명령어 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제3 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하기 위한 명령어;
적어도 부분적으로 제4 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제4 잡음 억제된 오디오 신호를 획득하기 위한 명령어 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제4 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하기 위한 명령어;
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 제2 사용자 선호도 표시를 획득하기 위한 명령어; 및
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 상기 제2 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 사용자 특정 잡음 억제 파라미터들, 상기 제3 잡음 억제 파라미터들 또는 상기 제4 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제2 사용자 특정 잡음 억제 파라미터들을 결정하기 위한 명령어
를 더 포함하는 전자 장치.
제11항에 있어서,
적어도 부분적으로 상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 기초하여 상기 제3 잡음 억제 파라미터들 및 상기 제4 잡음 억제 파라미터들을 결정하기 위한 명령어들을 더 포함하는 전자 장치.
전자 장치의 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 컴퓨터 판독가능 저장 매체로서, 상기 하나 이상의 프로그램은:
사용자 음성 샘플 및 적어도 하나의 디스트랙터를 포함하는 테스트 오디오 신호를 결정하기 위한 명령어 - 상기 디스트랙터는 특정 상황에 대해서 시뮬레이트된 주변음임 - ;
적어도 부분적으로 제1 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제1 잡음 억제된 오디오 신호를 획득하기 위한 명령어;
상기 제1 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하기 위한 명령어;
적어도 부분적으로 제2 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제2 잡음 억제된 오디오 신호를 획득하기 위한 명령어;
상기 제2 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하기 위한 명령어;
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 제1 사용자 선호도 표시를 획득하기 위한 명령어; 및
상기 제1 잡음 억제된 오디오 신호 또는 상기 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 잡음 억제 파라미터들 또는 상기 제2 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제1 사용자 특정 잡음 억제 파라미터들을 결정하기 위한 명령어 - 상기 제1 사용자 특정 잡음 억제 파라미터들은 상기 전자 장치의 음성 관련 기능이 이용 중일 때 잡음을 억제하도록 구성됨 -
를 포함하는 컴퓨터 판독가능 저장 매체.
제13항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 상기 디스트랙터가 상기 스피커를 통해 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하기 위한 명령어들을 포함하는 컴퓨터 판독가능 저장 매체.
제13항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 상기 디스트랙터가 다른 장치 상에서 크게 재생하는 동안 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하기 위한 명령어들을 포함하는 컴퓨터 판독가능 저장 매체.
제13항에 있어서, 상기 테스트 오디오 신호를 결정하기 위한 명령어는 마이크로폰을 이용하여 상기 사용자 음성 샘플을 녹음하고 상기 사용자 음성 샘플을 상기 디스트랙터와 전자적으로 혼합하기 위한 명령어들을 포함하는 컴퓨터 판독가능 저장 매체.
제13항 내지 제16항 중 어느 한 항에 있어서,
적어도 부분적으로 제3 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제3 잡음 억제된 오디오 신호를 획득하기 위한 명령어 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제3 잡음 억제된 오디오 신호를 스피커로 출력시키도록 하기 위한 명령어;
적어도 부분적으로 제4 잡음 억제 파라미터들에 기초하여 상기 테스트 오디오 신호에 잡음 억제를 적용하여 제4 잡음 억제된 오디오 신호를 획득하기 위한 명령어 - 상기 테스트 오디오 신호에는 상기 제1 사용자 특정 잡음 억제 파라미터들이 적용되어 있음 - ;
상기 제4 잡음 억제된 오디오 신호를 상기 스피커로 출력시키도록 하기 위한 명령어;
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 제2 사용자 선호도 표시를 획득하기 위한 명령어; 및
상기 제3 잡음 억제된 오디오 신호 또는 상기 제4 잡음 억제된 오디오 신호의 상기 제2 사용자 선호도 표시에 따라, 적어도 부분적으로 상기 제1 사용자 특정 잡음 억제 파라미터들, 상기 제3 잡음 억제 파라미터들 또는 상기 제4 잡음 억제 파라미터들, 또는 이들의 조합에 기초하여 제2 사용자 특정 잡음 억제 파라미터들을 결정하기 위한 명령어
를 더 포함하는 컴퓨터 판독가능 저장 매체.
제17항에 있어서,
적어도 부분적으로 상기 제1 잡음 억제된 오디오 신호 또는 제2 잡음 억제된 오디오 신호의 상기 제1 사용자 선호도 표시에 기초하여 상기 제3 잡음 억제 파라미터들 및 상기 제4 잡음 억제 파라미터들을 결정하기 위한 명령어들을 더 포함하는 컴퓨터 판독가능 저장 매체.
삭제
삭제
삭제
삭제
삭제
삭제
삭제