KR20130096625A

KR20130096625A - 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치

Info

Publication number: KR20130096625A
Application number: KR1020120148590A
Authority: KR
Inventors: 젠-포 히시아오; 팅-웨이 선; 한-쉬 통
Original assignee: 에이치티씨 코퍼레이션
Priority date: 2012-02-22
Filing date: 2012-12-18
Publication date: 2013-08-30
Also published as: JP5704470B2; US9064497B2; CN103295581B; EP2631907A1; TW201335931A; CN103295581A; KR101455710B1; JP2013172454A; TWI484483B; US20130218560A1

Abstract

오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치가 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.

Description

오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치{METHOD AND APPARATUS FOR AUDIO INTELLIGIBILITY ENHANCEMENT AND COMPUTING APPARATUS}

기술된 실시예들은 일반적으로 오디오 명료도 향상(audio intelligibility enhancement)에 관한 것으로, 특히, 신호 및 컴퓨팅 장치(computing apparatus)에 있어 오디오 명료도 향상을 위한 방법 및 장치에 관한 것이다.

경험에 있어 전화 통화 동안 오디오의 품질은 모바일 폰 사용자에게 중요하다. 일부 모바일 폰은 출력되는 오디오 신호에 있는 환경적인 노이즈를 감소시킴으로써, 통화 중 출력되는 오디오 신호의 품질을 향상시키기 위해 노이즈 감소를 사용한다. 한편, 입력되는 오디오 신호의 품질은 환경 노이즈로 인해 악화된다. 이 경우에, 모바일 폰 사용자는 모바일 폰의 볼륨을 수동으로 보다 크게 한다. 이러한 접근 방식은 사용자에게 불편함을 주고 볼륨이 전반적으로 커지는 경우, 청취하는 중에 적절한 품질을 얻을 수가 없다.

본 발명의 목적은 재생용 신호에 대한 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치를 제공하는 것에 있다.

일 실시예에 따라서, 오디오 명료도를 향상시키는 방법이 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출(voice activity detection)을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸(adjustable headroom) 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.

또 다른 실시예에 따라서, 오디오 명료도를 향상시키는 장치가 제공된다. 장치는 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.

대안적인 실시예에 따라서, 컴퓨팅 장치가 제공된다. 컴퓨팅 장치는 적어도 하나의 마이크로폰, 컴퓨팅 장치를 제어하는 프로세싱 유닛, 통신 유닛 및 오디오 명료도를 향상시키는 신호 프로세싱 유닛을 포함한다. 오디오 명료도를 향상시키는, 프로세싱 유닛과 통신 유닛이 연결된 신호 프로세싱 유닛은 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출되는 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.

도 1은 실시예에 따른 오디오 명료도를 향상시키는 방법의 순서도;
도 2는 실시예에 따른 컴퓨팅 장치의 블럭도;
도 3a는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도를 향상시키는 시스템의 블럭도;
도 3b는 명료도 향상 유닛의 또 다른 실시예의 블럭도;
도 4는 오디오 명료도 향상 유닛의 동작 실시예의 도면;
도 5는 서로 다른 주파수 대역에 의해 다운링크 음성을 증폭시키는 실시예의 도면;
도 6은 SNR 평가 방식에 의한 노이즈 정보의 실시예의 도면이다.
설명을 목적으로 하는 다음의 상세한 설명에서, 다수의 특정 설명은 개시된 실시예의 전반적인 이해를 제공하기 위해서 개시된다. 그러나, 분명한 바와 같이, 하나 이상의 실시예는 이러한 특정 설명 없이 실행될 수 있다. 다른 예에서, 매우 잘 알려진 구조 및 장치는 도면을 간단하게 하기 위해 개략적으로 도시된다.

컴퓨팅 장치의 재생 신호를 위해 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치의 실시예들이 제공된다. 도 1은 실시예에 따른 컴퓨팅 장치의 오디오 명료도를 향상시키는 방법의 순서도를 도시한다. 이러한 방법의 실시예에 따라서, 다운링크 음성(downlink voice)의 오디오 명료도는 통화 중에 향상될 수 있는데, 통화가 노이즈 환경에 있거나 노이즈 환경에 처하게 될 경우에도 그러하다. 다른 실시예들에서, 방법은 또한 재생 동안, 예를 들면, 오디오 파일, 멀티미디어 파일, 스트림식 오디오 또는 비디오(예를 들면, 컴퓨팅 장치 상의 유투브로부터 비롯된 시청 비디오물)를 재생시킴으로써, 멀티미디어 소스로부터 나오는 동안 오디오가 가능한 사운드의 명료도를 향상시키기 위해서 사용될 수 있는데, 환경 노이즈가 너무 시끄러울 경우에도 그러하다. 나아가, 모바일 장치의 하드웨어 및 사용자의 청취를 위한 보호물은 추가로 오디오 명료도를 향상시키는 것에서 고려될 수 있다.

방법은 컴퓨팅 장치, 예를 들면, 음성 통신 기능(전화 기술, 모바일 통신 VoIP 등)을 가진 컴퓨팅 장치, 예를 들면, 모바일 폰, 스마트 폰, 태블릿 컴퓨터, 노드 북 컴퓨터 등에서 사용될 수 있다. 모바일 장치가 얻어질 수 있는 구조는 도 2에 도시된 대표적인 실시예에 나타나 있으며, 모바일 장치(2)는 신호 프로세싱 유닛(21), 통신 유닛(23), 프로세싱 유닛(25)(예를 들면, 싱글 코어 또는 멀티 코어를 구비함), 적어도 하나의 마이크로폰(M1), 및 적어도 하나의 스피커(SK1)를 포함한다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에서 사용될 수 있고, 상기 신호 프로세싱 유닛은 통신 유닛(23)(하나 이상의 통신 표준, 예를 들면, 2G, 3G, 3.5G, LTE, 4G를 지원함)으로부터 다운링크 음성 신호(SRx)를 수신하고, 업링크 음성 신호(STx)를 통신 유닛(23)으로 출력한다.

다른 예에서, 방법은 멀티미디어 기능을 가진 컴퓨팅 장치, 예를 들면 퍼스널 컴퓨터, 랩탑, 멀티미디어 장치, 게임 장치 등에 사용될 수 있어서, 오디오 명료도를 향상시킬 수 있다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에 사용될 수 있고, 상기 신호 프로세싱 유닛은 프로세싱 유닛(25) 또는 통신 유닛(23)(또는 심지어 멀티미디어 칩 또는 소스)로부터 나온 오디오 신호(SRx)를, 멀티미디어 소스, 즉, 오디오 또는 멀티미디어 데이터, 예를 들면, 컴퓨팅 장치에 저장된 음악 또는 비디오 파일, 또는 원격 장치, 웹사이트 또는 네트워크 클라우드의 장치로부터 나온 스트림식 오디오 또는 비디오(예를 들면, 모바일 장치에서 유투브 시청)를 재생하는 동안에 수신한다. 나아가, 방법은 무선 네트워크 기능(예를 들면, Wi-Fi)을 가진 모바일 장치에 사용될 수도 있어서, IP-기반 음성 통신 또는 스트림식 멀티미디어를 위해 오디오 명료도를 향상시킬 수 있다.

도 1을 참조하면, 단계 S10에서, 환경 노이즈는 예를 들면 음성 구간 검출(VAD)을 실행함으로써, 검출되는 오디오 신호에 따라 검출된다. 예를 들면, 검출되는 오디오 신호는 통화(예를 들면, 텔레폰, 모바일 통신 또는 IP 음성(Voice-over-IP)) 동안 업링크를 위해, 또는 오디오 또는 멀티미디어 데이터 재생 동안 업링크 없이, 적어도 하나의 마이크로폰, 예를 들면 마이크로폰(M1)으로부터 나온 신호이다. 단계 S20에서, 노이즈 정보는 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 획득되며, 상기 제 1 오디오 신호는 오디오 명료도, 예를 들면 다운링크 음성 신호(예를 들면, SRx), 또는 프로세싱 유닛(21) 또는 멀티미디어 칩 또는 소스로부터 나온 오디오 신호 등을 향상시킨다. 단계 S30에서, 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라서 출력되고, 예를 들면 증대(또는 증폭)되어 출력된다. 그 후, 제 2 오디오 신호는 제 1 오디오 신호의 오디오-명료도-향상 버전으로 간주될 수 있다. 일부 실시예에서, 제 2 오디오 신호(디지털 또는 아날로그 형태일 수 있음)는 스피커 또는 헤드셋을 가진 컴퓨팅 장치에 의해 재생될 수 있거나, 다른 목적을 위해, 예를 들면 컴퓨팅 장치에 의해 녹음을 위해, 외부 스피커에 의한 재생을 위해, 또는 컴퓨팅 장치를 통해 무선으로 방송을 위해 출력된다.

대표적인 실시예에서, 제 2 오디오 신호는 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써, 출력된다. 다른 실시예들에서, 노이즈 정보는 제 1 오디오 신호와 관련되어 검출되는 환경 노이즈의 측정 레벨을 나타낸다. 예를 들면, 노이즈 정보, 예를 들면, 신호 대 노이즈 비 또는 노이즈 신호 강도 또는 다른 노이즈 측정은 단계 S30에서 사용되기 위해 판별될 수 있되, 예를 들면, 제 1 오디오 신호를 증폭시키기 위해 판별될 수 있다.

도 1의 방법에 의해 예시화되는 이러한 방식으로, VAD를 사용하여 검출되는 오디오 신호(예를 들면 마이크로폰으로부터 나온 신호)로부터 검출된 환경 노이즈의 어플리케이션은 제 1 오디오 신호에 대해 오디오 명료도를 용이하게 향상시킨다(예를 들면, 다운링크 음성 신호(SRx) 또는 재생용 오디오 신호). 특히, VAD를 사용하여 검출된 환경 노이즈는 단계 S20에서 충분히 정확하게 맞아서, 단계 S30의 예시에서 이후의 판별 및 증폭을 하기 위해 신뢰가능한 노이즈 정보를 제공할 수 있다. 이러한 접근법은 또한 단계 S30의 예에서, 환경 노이즈로서의 음성 또는 사운드의 부정확한 판별 및 부적절하거나 비정상적인 증대 또는 다운링크 음성 신호의 증폭을 방지할 수 있다.

예에서, 단계 S30에서는 증폭된 다운링크 음성 신호를 타깃 레벨(예를 들면, 3dB)보다 크지 않은 신호-대-노이즈(SNR) 비를 유지시키는 것이 실행될 수 있다. 검출된 환경 노이즈가 -15dB의 레벨(Le로 표시)을 가지고, 다운링크 음성 신호가 -30dB의 레벨(Ld로 표시)에 있는 경우, 증폭된 다운링크 음성 신호는 Ld의 신호 레벨에 값 Lg를 더한 것이 될 수 있어서, 타깃 레벨을 달성할 수가 있다.

노이즈 환경에 대하여, 컴퓨팅 장치의 사용자는 노이즈 환경에 처해 통화를 하는 동안, 다운링크 오디오 신호의 형편없는 오디오 명료도에 고통스러워할 수 있는데, 스피커의 볼륨이 커질 경우에도 그러하다. 최악의 경우는, 너무 증폭된 다운링크 음성 신호의 구동은 오디오 구성요소 또는 스피커에 하드웨어 손상을 줄 수 있다. 너무 증폭된 다운링크 음성 신호는 사용자가 청취하는데 있어 불편한 청취 경험을 제공할 수 있거나 심지어 유해할 수도 있다. 이에 대해, 이루 예에서, 값 Lg는 모바일 장치의 신호 품질 또는 하드웨어 보호를 위해, 헤드룸(즉, 최대로 증가할 수 있는 허용가능한 게인) 내에 있도록 고안될 수 있다. 헤드룸은 또한 명목상의 신호 값과 왜곡이 없이 최대 값 간의 차이로 정의될 수도 있다. 예를 들면, 상기의 숫자 예에 이어, 헤드룸은 10dB로 미리 판별될 수 있고, 그 결과 증폭된 다운링크 음성 신호는 -5dB(즉, -15dB + 10dB)의 신호 레벨을 가지도록 증폭될 수 있다.

그러나, 다운링크 음성 신호의 신호 레벨이 크거나 최대 레벨(예를 들면, 0 dB)에 근접한 상황에서, 증폭된 다운링크 음성 신호는 왜곡될 수 있다. 도 4에 도시된 경우에서, 검출된 환경 노이즈의 레벨(Le)이 -2dB이고 다운링크 음성 신호가 시간(t1) 전에 -9dB의 레벨(Ld)에 있는 경우, 증폭된 다운링크 음성 신호는 +1dB(즉, -9dB + 10dB)의 신호 레벨(Lx)을 가질 수 있는 것으로 기대될 수 있으며, 이때 미리 판별된 헤드룸은 10dB이다. 특히, 신호 레벨이 디지털 영역에서 최대 신호 레벨인 0dB를 초과하는 것은 불가능하며, 이 경우에 증폭된 다운링크 음성 신호는 최대 신호 레벨에서 왜곡될 수 있다. 이는 모바일 장치의 하드웨어 또는 스피커에 하드웨어 손상을 줄 수 있거나, 사용자가 청취하는데 있어 불편한 청취 경험을 불러일으키거나, 또는 심지어 유해할 수도 있다.

이에 따라서, 다른 실시예에서, 단계 S30은 조정가능한 헤드룸으로 실행될 수 있다. 예를 들면, 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로 구현될 수도 있다. 추가로, 헤드룸은 신호 왜곡뿐만 아니라 사람이 청취하는데, 또는 하드웨어에 다른 손상을 제공하는 것을 방지하기 위해서 설정될 수 있다.

일부 예시에서, 조정가능한 헤드룸은 제 1 오디오 신호의 신호 레벨에 따라 조정될 수 있고, 그 결과 제 2 오디오 신호의 신호 레벨은 제 1 오디오 신호의 신호 레벨에 선형적으로 또는 비-선형적으로 비례하지만, 그러나 여전하게 클립 레벨(clipping level) 미만, 예를 들면 0 dB 미만에 있다.

일 예에서, 단계 S30에서의 다운링크 음성 신호의 증폭은, 다운링크 음성 신호 레벨(예를 들면, 신호 에너지 레벨)이 특정 임계치 레벨(즉, 최대 레벨에 근접하지 않음) 아래로 내려갈 시에 제 1 값(예를 들면, 10dB)을 가진 헤드룸을 사용하여, 그리고 다운링크 음성 신호 레벨(예를 들면, -9dB)이 특정 임계치 레벨을 초과할 시에, 제 1 값 미만인 제 2 값(예를 들면 5dB)을 가진 헤드룸을 사용하여 판별될 수 있다. 도 4를 참조하여, 헤드룸이 제 1 값 미만인 8dB일 시에, 증폭된 다운링크 음성 신호는 최대 레벨보다 낮은 -1dB인 레벨(Lb라 함)에 있게 되고, 이로써, 하드웨어 보호 및 인간 청취를 위하여, 증폭된 다운링크 음성 신호가 안전하게 되는데, 상기의 예시에서와 같이 노이즈 환경이 있는 곳에서도 그러하다.

또 다른 예에서, 헤드룸은 모바일 장치(2)의 볼륨 제어 레벨(volume control level)에 따라 조정가능할 수 있다. 예를 들면, 신호 프로세싱 유닛(21)은, 볼륨 제어 레벨이 변화될 시에, 볼륨 제어 레벨을 나타내는 볼륨 데이터에 대한 정보를 알아낸다. 신호 프로세싱 유닛(21)은 볼륨 데이터에 따라 서로 다른 값의 헤드룸으로 단계 S30을 실행한다. 예를 들면, 볼륨 제어 레벨이 특정 임계치 레벨(예를 들면, 중앙 레벨 또는 그 이상의 레벨)에 있거나, 그보다 아래에 있는 경우에, 헤드룸은 제 1 값(예를 들면, 10dB)으로 설정될 수 있다. 볼륨 제어 레벨이 최대 레벨에 있거나 근접하거나, 또는 특정 임계치 이상으로 있다는 것을 볼륨 데이터가 나타내는 경우, 헤드룸은 제 1 값 미만인 제 2 값(예를 들면, 5dB)으로 설정될 수 있다. 다른 예에서, 헤드룸은 하나 이상의 조건에 따라 예를 들면 다운링크 음성 신호 레벨 및 볼륨 제어 레벨에 따라 조정될 수 있다.

나아가 다른 예에서, 단계 S30에서 제 1 오디오 신호는 서로 다른 주파수 대역에 대해 증폭될 수도 있다. 예를 들면, 노이즈 스펙트럼은 도 5에 도시된다. 충분한 SNR을 유지시키기 위하여, 하나 이상의 주파수 대역에서의 오디오 신호(예를 들면, 파일 또는 스트림식 비디오 또는 오디오 등의 소스로부터 나온 다운링크 음성 또는 오디오 신호)는 인간 청취를 위한 오디오 명료도를 고려할 시에 증폭된다. 이 예에서, 다운링크 음성 신호의 약 500Hz(B1으로 나타남) 및 3kHz(B2로 나타남)의 주파수 대역은 커져야 한다.

도 3a를 참조하면, 블럭도는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도 향상을 위한 시스템을 도시한다. 컴퓨팅 장치의 적어도 하나의 마이크로폰(M1)으로부터 나온 검출되는 오디오 신호 및 오디오 명료도가 향상되는 제 1 오디오 신호(예를 들면, 모바일 장치의 도 2의 통신 유닛(23)으로부터 나온 다운링크 음성 신호 또는 오디오 재생을 위한 프로세싱 유닛(25)으로부터 나온 신호)에 응답하여, 시스템(3)은 컴퓨팅 장치의 적어도 하나의 스피커(SK1)로 제 2 오디오 신호를 출력한다. 시스템(3)은 환경 노이즈 판별 유닛(30) 및 명료도 향상 유닛(32)을 포함한다. 시스템(3)은 소프트웨어, 회로로 실행될 수 있거나, 신호 프로세싱 유닛 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 환경 노이즈 판별 유닛(30)은 도 1에 도시된 바와 같이 단계 S10의 실시예로 간주될 수 있다. 명료도 향상 유닛(32)은 도 1에 도시된 바와 같이 단계 S20 및 S30의 실시예로 간주될 수 있다.

환경 노이즈 판별 유닛(30)은 예비 프로세싱 모듈(pre-processing module)(301) 및 노이즈 평가 모듈(303)을 포함한다. 예비 프로세싱 모듈(301)은 마이크로폰(M1)으로부터 검출되는 오디오 신호가 오디오 또는 노이즈인지를 판별하기 위해, VAD 모듈(3013)에 의해 나타난 음성 구간 검출(VAD)을 실행한다. 예비 프로세싱 모듈(301)은 노이즈 평가 모듈(303)로 판별 결과를 출력한다. 예비 프로세싱 모듈(301)로부터 오디오 신호 및 판별 결과에 응답하여, 노이즈 평가 모듈(303)은 모바일 장치가 위치되는 곳에서 환경 노이즈를 나타내는 기준 노이즈 신호(SRN)를 출력한다. 즉, 노이즈 평가 모듈(303)은, 검출되는 오디오 신호가 노이즈를 나타낼 시에, 검출된 환경 노이즈를 출력할 수 있다. 이에 대하여, 다양한 균등물 실시예가 이용될 수 있다. 실시예들 중 하나에서, 노이즈 평가 모듈(303)은 예비 프로세싱 모듈(301)로부터 검출되는 오디오 신호를 출력하고, 기준 노이즈 신호(SRN)는 SNR 평가용 정보로 환경 노이즈를 나타낸다. 예를 들면, VAD 모듈(3013)이, 검출되는 오디오 신호가 사용자 음성을 나타낸다고 하는 경우, 노이즈 평가 모듈(303)은 스코어가 낮은 노이즈(lower noise score)와 함께 기준 노이즈 신호(SRN)를 출력한다. 검출되는 오디오 신호가 노이즈를 나타내는 경우, 예를 들면 소리지르는 아이들 소리와 같은 특정 사운드와 유사한 노이즈를 나타내는 경우, 노이즈 평가 모듈(303)은, 기준 노이즈 신호(SRN)의 환경 노이즈가 무시될 수 있는 다음 단계(예를 들면, SNR 평가)를 알리는 노이즈가 큰 스코어로 기준 노이즈 신호(SRN)를 출력한다. 또 다른 실시예에서, 노이즈 평가 모듈(303)은, VAD 모듈(3013)이 음성 구간이 없는 것을 나타낼 시에만, 노이즈 스코어가 특정 임계치보다 낮을 시에만 환경 노이즈를 출력하는 것으로서 실행될 수 있다. 상기와 같이, 노이즈 평가 모듈(303)의 실행은 상기의 예에 한정되는 것이 아니라, 다른 방식으로도 실현될 수 있다.

VAD 모듈(3013)은 환경 노이즈로서 음성 또는 사운드의 부정확한 판별을 방지하기 위함이고, 다음 단계에서 제 1 오디오 신호의 증대 또는 증폭 및 적절한 노이즈 평가를 용이하게 하기 위함이다. 일부 예에서, 에너지 레벨 임계치는 음성 구간 검출용 조건으로서 취할 수 있다. 신호 레벨이 특정 에너지 레벨 임계치를 초과하는 경우, 업링크용 오디오 신호가 음성 구간을 나타낸 것으로 판별된다. 이와 반대로, 신호 레벨이 특정 임계치보다 낮은 경우, 오디오 신호는 환경 노이즈로 간주된다. 다른 예에서, 오디오 수단은 음성 구간을 판별하는 VAD 모듈(3013)의 시간 도멘인 또는 주파수의 검출되는 오디오 신호로부터 추출될 수 있다. 예를 들면, 미리 판별된 오디오 수단, 예를 들면, 사무소 또는 기차 역에서 말하는 소리, 걷는 소리 등은 음성 구간의 판별을 참조하기 위해 저장되어 사용될 수 있다. 일 예에서, VAD 모듈(3013)은 직렬로, 병렬로 음성 구간(예를 들면, 노이즈 스코어; 또는 음성 또는 노이지 표시)을 위한 판별 결과로 검출되는 오디오 신호를 출력하는 것으로 실행될 수 있다.

게다가, 예비 프로세싱 모듈(301)은 VAD 모듈(3013) 전에 디-에코 모듈(de-echo module)(3011)에 의해 나타난 바와 같이 디-에코 프로세싱을 실행할 수도 있고, 그 결과 음성 구간의 판별 결과는 보다 정확해질 수 있다. 예를 들면, 디-에코 모듈(3011)의 디-에코 프로세싱은 시간 도메인에 적합한 필터에 의해 실행될 수 있고, 디-에코 모듈(3011)은 검출되는 오디오 신호의 디-에코된 버전을 VAD 모듈(3013)로 출력할 수 있다.

다른 예에서, 환경 노이즈 판별 유닛(30)은 인간의 말과 노이즈 간을 구별하기 위해 사용될 수 있는 노이즈 스펙트럼 검출 또는 평가를 사용함으로써, 검출되는 오디오 신호에 따라 환경 노이즈를 검출할 수 있다.

명료도 향상 유닛(32)은 신호 대 노이즈 비(SNR) 평가 모듈(321), 게인 계산 모듈(323), 및 증폭 모듈(boosting module)(325)을 포함한다. SNR 평가 모듈(321)은 단계 S20에서 나타난 바와 같이, 노이즈 정보를 획득할 수 있다. 기준 노이즈 신호(SRN) 및 다운링크 음성 신호(SRx)에 응답하여, SNR 평가 모듈(321)은 도 6에 도시된 파선 곡선(N)과 같이 주파수에 대한 노이즈 레벨 등의 노이즈 정보를 출력한다. 게인 계산 모듈(323) 및 증폭 모듈(325)은 단계(S30)에 도시된 바와 같이, 다운링크 음성 신호(SRx)를 증폭하기 위해 사용된다. 노이즈 정보 및 제 1 다운링크 음성 신호(SRx)에 응답하여, 게인 계산 모듈(323)은 제 1 다운링크 음성 신호(SRx)를 증폭하기 위해, 증폭 모듈(325)을 제어하도록 하나 이상의 파라미터를 판별한다. 예를 들면, 게인 계산 모듈(323)은 도 6에 도시된 바와 같이, 일부 주파수 대역에서, Sg로 표기된 제 1 다운링크 음성 신호(SRx)에 대한 신호 레벨이 환경 노이즈(N)에 대한 신호 레벨보다 낮다고 판별한다. 이에 따라서, 게인 계산 모듈(323)은 주파수 대역(W1)의 제 1 다운링크 음성 신호를 증폭하는 것이 필요하다고 판별하고, 판별된 주파수 대역에 대한 제 1 다운링크 음성 신호(SRx)를 증폭하여 오디오 명료도에 대해 충분한 SNR을 유지하기 위해, 증폭 모듈(325)을 제어한다. 하나 이상의 주파수 대역은, 예를 들면, 도 6의 주파수 대역들(W1 및 W2)은 판별된 주파수 대역일 수 있다. 예를 들면, 게인 계산 모듈(323)은 환경 노이즈의 노이즈 레벨을 제 1 다운링크 음성 신호(SRx)의 신호 레벨과 비교하여, 증폭 모듈(325)을 제어하는 판별 결과를 판별하고, 상기 판별 결과는 또한 증폭 모듈(325)에 대한 신호레벨의 증가량을 포함할 수 있다.

나아가, 단계 S30에 대한 상기의 예는 하나 이상의 주파수 대역용 다운링크 음성 신호를 증폭시키는 하나 이상의 레벨을 판별하는 게인 계산 모듈(323)에 적용될 수도 있다. 예를 들면, 게인 계산 모듈(323)의 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로도 구현될 수 있다. 게다가, 헤드룸은 신호 왜곡뿐만 아니라 하드웨어 또는 인가 청취에 대한 다른 손상을 방지하기 위해서도 설정될 수 있다. 일부 예에서, 게인 계산 모듈(323)은 헤드 룸을 조정하는 방법 및 어떻게 조정할지를 판별하기 위해 모바일 장치의 다른 구성요소 또는 프로세싱 유닛으로부터 볼륨 데이터를 획득할 수 있다.

증폭 모듈(325)은 이퀄라이제이션(equalization) 또는 다른 증대 또는 증폭 기술을 사용하여 실행될 수 있다.

일부 실시예들에서, 도 3에 도시된 시스템(3)의 하나 이상의 모듈, 유닛 및 블럭은 소프트웨어 코드, 소프트웨어 모듈, 또는 전용 회로(예를 들면, 칩 또는 칩의 회로 모듈)로 실현될 수 있거나 신호 프로세싱 유닛 또는 프로그램밍이 가능한 칩 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 예를 들면, 시스템(3)은 프로세서(예를 들면, 하나 이상의 코어를 가짐), 예를 들면, 어플리케이션 프로세서 또는 디지털 신호 프로세서(DSP) 또는 어플리케이션 특정 집적 회로(ASIC)를 사용함으로써 실현될 수 있거나, FPGA(field-programmable gate array)에서 실현될 수 있으며, 이때 상기 FPGA는 도 3a의 시스템(3)(또는 도 1의 방법)의 특정 동작을 실행하기 위해 설계된다.

도 3b를 참조하여, 명료도 향상 유닛의 또 다른 실시예가 도시된다. 도 3a와 비교하여, 도 3b에 도시된 명료도 향상 유닛(42)은 재생용 제 1 오디오 신호에 대한 경로 상(예를 들면, SRx로 표기됨)의 예비 프로세싱 모듈(420)을 더 포함한다. 제 1 오디오 신호에 응답하여, 예비 프로세싱 모듈(420)은 다음 단계에서 증폭될, 예비 처리된 제 1 오디오 신호를 출력하되, 제 1 오디오 신호가 원하는 음성 또는 사운드를 나타내는 경우에 출력한다. 예를 들면, 통화 중에 일부 시간 동안 제 1 오디오 신호가 음성이 없거나 또는 노이즈가 없다고 하는 경우, 바람직하지 않아서, 증폭될 필요가 없거나 필터링될 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 상기에서 예로 나타난 바와 같이, VAD 모듈 또는 노이즈 평가 모듈, 또는 이들 둘 다를 포함할 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 하나 이상의 제어 신호 또는 표시 데이터(indication data)를 명료도 향상 유닛(42)의 하나 이상의 다른 모듈에 출력할 수 있어서, 예비 처리된 제 1 오디오 신호가 다음 단계에 의해 증폭될 수 있도록 하는데, 제 1 오디오 신호가 원하는 음성 또는 사우드를 나타낼 경우에 그러하다.

나아가, 다른 실시예들은 프로그램 코드를 저장하는, 기계장치 또는 장치로 판독가능한 정보 저장 매체 또는 하나 또는 다수의 프로그램 모듈을 더 개시한다. 프로그램 코드는 도 1의 오디오 명료도 향상을 위한 방법, 또는 도 3a 또는 3b의 시스템(3)을 구현시키기 위해 실행될 수 있다. 실시예 각각의 판독가능한 정보 저장 매체는 광학 정보 저장 매체, 자기 정보 저장 매체 또는 메모리, 예를 들면 메모리 카드, 펌웨어, 디지털 신호 프로세서 또는 일반적인 프로세서 등과 같은 프로그램밍이 가능한 칩에 매립되어 있거나 전용으로 사용될 수 있는 ROM 또는 RAM을 제한 없이 포함한다.

기술 분야의 통상의 기술자에게 있어서, 다양한 변형 및 변화가 개시된 실시예에서 구현될 수 있음은 명백할 것이다. 의도된 바와 같이, 명세서 및 예시는 단지 예시일뿐, 명세서의 참된 권리 범위는 다음의 청구항 및 이들의 균등물에 의해 나타난다.

Claims

컴퓨팅 장치에서 오디오 명료도를 향상시키는 방법에 있어서,
컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 음성 구간 검출을 실행함으로써, 환경 노이즈를 검출하는 단계;
검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하는 단계; 및
상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 단계를 포함하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 환경 노이즈를 검출하는 단계는:
상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 음성 구간 검출을 실행하는 단계; 및
상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 환경 노이즈를 검출하는 단계는:
상기 검출되는 오디오 신호의 디-에코된 버전을 출력하는 단계; 및
상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하고,
상기 음성 구간 검출은 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 상기 검출되는 오디오 신호의 디-에코된 버전에 따라 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 조정가능한 헤드룸이 상기 제 1 오디오 신호의 신호 레벨에 따라 조정되며, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 클립 레벨 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 조정가능한 헤드룸은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨을 초과할 시에 상기 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 조정가능한 헤드룸은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정되는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 7에 있어서,
상기 조정가능한 헤드룸은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 볼륨 제어 레벨이 임계치 레벨을 초과할 시에 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 오디오 명료도 향상 방법은 상기 제 1 오디오 신호가 상기 제 1 오디오 신호를 예비 처리함으로써 노이즈인지를 판별하는 단계를 더 포함하고,
상기 제 2 오디오 신호를 출력하는 단계에서, 상기 제 2 오디오 신호는 상기 제 1 오디오 신호를 증폭시킴 없이 출력되되, 예비 처리될 시에 상기 제 1 오디오 신호가 노이즈라고 판별된 경우에 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 9에 있어서,
상기 예비 처리는 음성 구간 검출을 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 9에 있어서,
상기 예비 처리는 노이즈 평가를 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
청구항 1에 있어서,
상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법.
컴퓨팅 장치에서 오디오 명료도를 향상시키는 장치에 있어서,
컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 환경 노이즈 판별 유닛은:
상기 검출되는 오디오 신호에 따라 오디오 신호를 출력하며, 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 이난지를 판별하고 상기 판별 결과를 출력하는 음성 구간 검출 모듈을 포함하는 예비 프로세싱 모듈; 및
상기 예비 프로세싱 모듈로부터 나온 상기 판별 결과 및 상기 오디오 신호에 응답하여 기준 노이즈 신호를 출력하는 노이즈 평가 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 18에 있어서,
상기 명료도 향상 유닛은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 13에 있어서,
상기 명료도 향상 유닛은:
기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
증폭 모듈; 및
상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 20에 있어서,
상기 명료도 향상 유닛은:
상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 오디오 명료도 향상 장치.
청구항 20에 있어서,
상기 예비 프로세싱 모듈은, 상기 제 1 오디오 신호가 상기 1 오디오 신호의 노이즈 평가 또는 음성 구간 검출에 따른 노이즈인지를 판별하는 것을 특징으로 하는 오디오 명료도 향상 장치.
적어도 하나의 마이크로폰;
컴퓨팅 장치를 제어하는 프로세싱 유닛;
통신 유닛;
상기 프로세싱 유닛과 상기 통신 유닛에 연결되며, 오디오 명료도를 향상시키기 위한 신호 프로세싱 유닛을 포함하며,
상기 신호 프로세싱 유닛은:
상기 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 26에 있어서,
상기 명료도 향상 유닛, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 명료도 향상 유닛은:
기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
증폭 모듈; 및
상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 28에 있어서,
상기 명료도 향상 유닛은:
상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 통신 유닛은 상기 신호 프로세싱 유닛으로 상기 제 1 오디오 신호를 출력하고, 상기 제 1 오디오 신호는 음성 통신을 위한 다운링크 오디오 신호인 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 프로세싱 유닛은 멀티미디어 소스에 따라 상기 제 1 오디오 신호를 상기 신호 프로세싱 유닛으로 출력하는 것을 특징으로 하는 컴퓨팅 장치.
청구항 23에 있어서,
상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 컴퓨팅 장치.