WO2010151048A2

WO2010151048A2 - 명료도 향상장치와 이를 이용한 음성출력장치

Info

Publication number: WO2010151048A2
Application number: PCT/KR2010/004078
Authority: WO
Inventors: 박성진
Original assignee: 주식회사 더바인코퍼레이션
Priority date: 2009-06-23
Filing date: 2010-06-23
Publication date: 2010-12-29
Also published as: WO2010151048A3; WO2010151048A9

Abstract

본 발명은 명료도 향상장치와 이를 이용한 음성출력장치에 관한 것으로, 입력포락선 검출부를 통해 입력 신호에 대해 음성 프레임의 레벨을 검출하여 컷오프주파수 예측부에 제공하고, 출력포락선 검출부를 통해 출력 신호에 대해 음성 프레임의 레벨을 검출하는 컷오프주파수 예측부에 제공하며, 컷오프주파수 예측부에서 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하며, 쉘빙 필터부가 컷오프주파수 예측부에 의해 산출된 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 한다. 이에 따라 쉘빙 필터부는 입력 신호에 자음성분이 많고 적음에 따라 컷오프 주파수가 동적으로 변동되어, 입력 신호의 자음 신호에 해당하는 고주파 성분이 증폭되는 반면에 저주파 성분을 감쇄시킴으로써, 자음 성분이 선택적으로 강조되게 하여 음성 명료도가 향상되게 한다.

Description

명료도 향상장치와 이를 이용한 음성출력장치

본 발명은 디지털 통신 분야에서 음성 신호의 음질을 향상시키는 방법 및 장치에 관한 것으로, 보다 상세하게는 수신되는 음성 신호의 명료도를 향상시키는 장치 및 이 장치를 이용하는 음성출력장치에 관한 것이다.

디지털 음악 기술이 보편화되면서 좋은 통화음질에 대한 소비자의 기대값 또한 상당히 높아지고 있다. 그러나 음성출력장치의 통화음질은 소형화, 슬림화를 거듭하면서 오히려 예전 수준에 미치지 못하고 있다.

특히, 잡음환경에서 휴대폰의 수신음질을 향상시키기 위한 종래기술은 잡음제거, 등화기 또는 수신음량 자동 조절 정도의 기술로서; 잡음제거 기술은 음성신호의 왜곡에 따른 메탈 잡음(Metalic noise)이 수반되고, 등화기는 청감상의 향상도가 미세하며, 수신음량 증폭은 휴대폰의 슬림화에 따른 문제로 스피커로의 최대음량 초과시 심각한 왜곡을 초래한다.

여기서 등화기 기술은 청취자가 잡음이 심한 지역에 있을 때에 음성의 명료도를 증가시키기 위해 전체적인 신호를 3db~10db 증폭시키는 것이다.

그러나, 더 큰 SNR(Signal to Noise Ratio, 신호 대 잡음비)을 얻기 위해서 전력을 높이는 것은 청취자에게 불안감과 청취 피로도를 주는 원인이 되기도 하고, 또한 대부분의 소형 단말기에서는 음의 찢어지기 바로 전 단계를 최대 볼륨으로 설정하므로, 추가적인 증폭은 음의 찢어짐을 수반한다.

사실, 잡음환경에서 통화 시에 더 큰 SNR을 확보하면, 청취자는 상대방의 말소리를 더 잘 들을 수 있다. 즉, 볼륨을 높이면 더 큰소리로 잘 들을 수 있다.

그러나, 증폭 정도를 일정 수준 이상 높이면 음성출력장치에서 출력되는 음이 찢어지거나 왜곡 현상이 발생하게 되고, 소형의 음성출력장치인 경우에는 음의 찍어짐 현상과 왜곡 현상이 더욱 심해진다.

본 발명이 이루고자 하는 과제는 수신되는 음성 신호에 대한 전체적인 출력이 아닌 음성 명료도만 높여 수신음질을 향상시키는 장치를 제공하는 것이다.

또한 본 발명이 이루고자 하는 다른 과제는 잡음 환경인지 그렇지 않은 환경인지 등의 통화 환경에 따라 수동 또는 자동으로 수신 음량조절을 조절하고 음성 명료도를 향상시키는 음성출력장치를 제공하는 것이다.

또한 본 발명이 이루고자 하는 또 다른 과제는 음성 명료도 향상에 따른 출력 상태인지를 사용자가 육안으로 확인할 수 있게 하는 음성출력장치를 제공하는 것이다.

상기 기술적 과제를 달성하기 위한 제1 특징에 따르면, 본 발명은 입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부; 출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부; 상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부; 상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및 상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치를 제공한다.

상기에서, 컷오프주파수 예측부는 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추거나, 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 한다.

상기 기술적 과제를 달성하기 위한 본 발명의 제2 특징에 따르면, 본 발명은 외부로부터 제1 음성 신호를 입력하여 증폭하는 마이크; 상기 제1 음성 신호의 세기를 측정하고 상기 제1 음성 신호의 신호 세기를 기반으로 잡음 환경인지를 판단하는 잡음환경 판단부; 입력되는 음성 신호를 규정된 형태의 제2 음성 신호로 바꾸어 출력하는 음성 처리부; 상기 잡음환경 판단부의 판단에 의해 잡음 환경인 경우에 음향 출력 레벨을 설정 레벨로 조절하고, 상기 제2 음성 신호를 상기 조절한 설정 레벨로 증폭하여 출력하는 음량 조절부; 상기 음량 조절부를 통해 입력되는 제3 음성 신호에 대해 명료도를 향상시켜 제4 음성 신호로 출력하는 명료도 향상부; 상기 제4 음성 신호 및 상기 음량 조절부에서 출력하는 음성 신호를 외부로 출력하는 소리 출력부; 및 상기 명료도 향상부의 명료도 향상 동작에 연동하여 상기 소리 출력부에 의해 출력되는 상기 제4 음성 신호가 명료도 향상된 음성 신호임을 나타내는 명료도 표시를 출력하는 출력 표시부를 포함하는 명료도 향상장치를 이용한 음성출력장치를 제공한다.

상기에서 명료도 향상부는 본 발명의 실시 예에 따른 명료도 향상장치이다.

상기 설정 레벨은 상기 현재 설정된 음향 출력 레벨보다 한 단계 높은 레벨이거나, 가장 높은 음향 출력 레벨 중 하나인 것을 특징으로 한다.

상기 음량 조절부는 사용자로부터 특정 음향 출력 레벨로의 설정이 입력되는 경우에, 상기 제2 음성 신호를 상기 특정 음향 출력 레벨로 조절하여 출력하는 것을 특징으로 한다.

상기 명료도 표시는 음향 출력 레벨을 나타내는 제1 표시와 차별화된 표시이며, 상기 제1 표시와 함께 화면상에 표시되거나, 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력이다.

본 발명의 실시 예에 따르면, 음성출력장치가 자동으로 사용자의 통화 환경을 파악하여 통화 환경에 맞는 수신 음량 조절 및 음성 명료도를 향상시켜 수신음질이 향상된 상태에서 통화를 할 수 있게 하는 효과가 있다.

또한 본 발명의 실시 예에 따르면, 사용자가 통화 중에 음질 향상 요구를 하더라도 사용자의 음질향상 요구에 맞게 명료도 향상 동작을 하여 사용자의 요구에 부응하는 수신 음질이 향상된 소리를 들을 수 있게 하는 효과가 있다.

또한 본 발명의 실시 예에 따르면, 수신 음질이 향상되어 출력되는 상태를 음성출력장치의 화면상에 표시하여 사용자가 현재 출력되는 소리가 수신 음질이 향상된 소리임을 알 수 있게 하는 효과가 있다.

도 1은 본 발명의 실시 예에 따른 명료도 향상장치의 블록 구성도이다.

도 2는 일반적인 쉘빙 필터의 주파수 특성 그래프이다.

도 3은 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면이다.

도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.

도 5는 본 발명의 실시 예에 따른 음성출력장치의 블록 구성도이다.

도 6은 본 발명의 제1 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.

도 7은 본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

이하에서는 도 1을 참조로 하여 본 발명의 실시 예에 따른 명료도 향상장치를 설명한다.

설명에 앞서, 음성신호에서 자음 부분은 모음에 비해 상대적으로 아주 작은 신호성분을 가지고 있다. 그러나, 이동통신 기기의 네트워크 장비 및 단말기의 오디오 신호처리 과정에서 이 작은 신호성분은 종종 사라지거나 작아지는 경향이 많다. 그 결과 휴대전화로 통화 시 상당히 둔탄한 소리를 느끼거나 상대방이 누구인지 목소리를 듣고서 알기 어려울 때가 많다.

본 발명의 실시 예에 따른 명료도 향상장치는 오디오 신호처리 과정에서 자음 부분의 신호 성분이 사라지거나 작아지지 않게 한다. 즉, 본 발명의 실시 예에 따른 명료도 향상장치는 자음 부분의 신호 성분을 선택적으로 강조하여 음성 명료도를 향상시킨다.

도 1은 본 발명의 실시 예에 따른 명료도 향상장치(100)의 블록 구성도이다. 도 1에 도시된 바와 같이, 본 발명의 실시 예에 따른 명료도 향상장치(100)는 쉘빙 필터부(101), 입력포락선(input envelop) 검출부(102), 출력포락선(output envelop) 검출부(103), 음성 검출기(104)와 컷오프주파수(cutoff frequency) 예측부(105)를 포함한다.

입력포락선 검출부(102)는 현재 입력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨(이하 현재 입력음성신호 레벨이라 함)을 검출하고, 검출한 진폭 레벨을 컷오프주파수 예측부(105)에 제공한다.

출력포락선 검출부(103)는 출력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨을 계산하되, 현재 출력되는 음성 프레임의 바로 이전의 음성 프레임에 대한 포락선 진폭 레벨(이하 이전 출력음성신호 레벨이라 함)을 컷오프주파수 예측부(105)에 제공한다.

음성 검출기(104)는 수신되는 입력 신호의 주파수 대역을 분석하여 입력 신호가 사람에 의해 발생된 음성신호인지를 판단한다. 일반적으로 Voice Activity Detector (VAD) 라고 불리우며, 입력신호가 음성신호가 아닌 경우에 쉘빙 필터부(101)를 거치지 않고 바로 출력 음성으로 by-pass 출력되게 한다. 그리고 음성 검출기(104)는 입력신호가 음성신호인 경우에는 정해진 쉘빙 필터부(101)를 통과하여 특정부분의 음성신호가 강조된다.

컷오프주파수 예측부(105)는 입력포락선 검출부(102)로부터 현재 입력음성신호 레벨을 수신하고, 출력포락선 검출부(103)로부터 이전 출력음성신호 레벨을 수신한다. 그리고 컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨을 비교하여 두 진폭 레벨 간 차이의 크기를 비교하며, 쉘빙 필터부(101)의 특성을 동적으로 변경 가능하도록 하는 컷오프 주파수를 계산한다.

컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 쉘빙 필터부(101)의 컷오프 주파수가 되도록 한다. 즉, 컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 되도록 하기 수학식 4의

를 변경한다.

컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기가 양수(즉, 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 큼)인 경우에 컷오프 주파수를 설정치(

) 만큼 낮춘다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(

)만큼 높여 준다. 이때 변경되는 값 즉, 설정치(

)는 미리 실험적으로 정해 둔 값에 의한다.

쉘빙 필터부(101)는 컷오프주파수 예측부(105)에서 산출한 컷오프 주파수를 수신하고, 수신한 컷오프 주파수에 따라 입력 음성신호를 고주파 통과 필터링하여 출력 음성신호를 출력한다.

이러한 쉘빙 필터부(101)는 오디오 설계에 많이 사용되는 쉘빙 필터(shelving filter)를 근간으로 하며, 일반적인 쉘빙 필터의 전달함수(H(s))는 다음의 수학식 1과 같이 나타내어지고, 주파수 특성은 도 2에 도시된 바와 같다.

수학식 1

여기서

는 전이주파수(transition frequency)를 조정하는 계수이고,

와

는 각각 제로와 고주파수의 게인 값으로 각 프레임의 포락선을 계산 후 얻어지는 상수이다. 여기서

을

에 대해 다시 전개하면 수학식 1은 다음의 수학식 2와 같이 나타낼 수 있다.

수학식 2

그리고 수학식 2를 수학식 1에 대입하면 다음의 수학식 3과 같이 아날로그 전달함수를 얻을 수 있다.

수학식 3

수학식 3을 쌍 일차 변환(Bi-linear transform)으로 디지털 도메인의 응답특성으로 변환하면 다음의 수학식 4와 같다. 여기서, 쌍 일차 변환은

와 같이 정의되어 있다.

수학식 4

수학식 4에서

값은 고주파 통과 필터의 특성을 결정하는 값이다.

이러한 전달함수에 의해 쉘빙 필터부(101)는 도 2에 도시된 그래프와 같이, 일반적인 쉘빙 필터의 주파수 특성을 가진다. 일반적인 쉘빙 필터의 주파수 특성 그래프는 여러 문헌에서 접할 수 있으므로 부연 설명은 생략한다.

이상과 같이 구성된 본 발명의 실시 예에 따른 명료도 향상 장치는 입력 음성신호의 자음 성분으로 추측되는 부분을 선택적으로 강조하여 음성 명료도를 향상시킨다. 아래는 이러한 본 발명의 실시 예에 따른 명료도 향상 장치의 동작을 설명한다.

입력 신호가 수신되면, 음성 검출기(104)는 입력 신호가 음성 신호인지 비음성 신호인지를 판단한다. 이러한 판단으로 입력 신호가 음성 신호인 경우에, 음성 검출기(104)는 입력 신호를 쉘빙 필터부(101)에 제공한다. 이때 쉘빙 필터부(101)에 입력되는 입력 신호는 입력포락선 검출부(102)에도 입력되며, 입력포락선 검출부(102)는 입력 신호에 대한 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.

한편, 쉘빙 필터부(101)에 입력된 입력신호는 쉘빙 필터부(101)에 설정된 필터 전달함수에 따라 신호 처리된 후 출력 신호로서 출력된다. 이때 쉘빙 필터부(101)에서 출력된 출력 신호는 외부로 출력되고, 동시에 출력포락선 검출부(103)에 입력된다. 그러면, 출력포락선 검출부(103)는 입력된 출력 신호에 대하여 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.

여기서, 컷오프주파수 예측부(105)는 입력신호에 대한 포락선 레벨과 출력신호에 대한 포락선 레벨을 입력하지만, 동일한 음성 프레임에 대한 입력신호와 출력신호를 이용하지 않고, 현재 음성프레임의 입력신호와 이전 음성프레임의 출력신호를 이용한다.

즉, 컷오프주파수 예측부(105)는 이전 프레임의 출력신호에 대한 포락선 레벨(즉, 이전 출력음성신호 레벨)(E2)과 현재 프레임의 입력신호에 대한 포락선 레벨(즉, 현재 입력음성신호 레벨)(E1) 간에 포락선 레벨 차이(E1-E2)를 계산한다.

컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨간 차이(E1E2)의 크기가 양수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 크다고 판단하고, 음수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 작다고 판단한다.

컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 양수이면 쉘빙(shelving) 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(

)만큼 낮추어 준다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(

)만큼 높여 준다.

컷오프주파수 예측부(105)는 포락선의 값이 작아지면 음성신호에 자음성분이 많은 것으로 간주하여 특정 고주파 성분을 강조해 준다. 여기서 고주파 성분의 범위는 약 1.5KHz에서 2.5KHz 사이에 속한다.

이 때, 결정되는 컷오프 주파수의 낮음 정도는 현재 음성입력신호 레벨과 이전 출력음성신호 레벨의 차이에 따라 실험적으로 미리 정해진 값, 즉, 설정치(

)만큼 컷오프 주파수가 변화한다.

이와 같이 컷오프 주파수를 동적으로 변경함으로써, 쉘빙 필터부(101)에서 출력하는 출력 음성신호의 자음성분 고주파 성분이 증폭되는 반면에, 저주파 성분은 감쇄된다. 그러므로 평균적인 RMS(Root-Mean-Square) 에너지 정도는 필터링 후에도 변화하지 않고 유지된다.

이때 자음이 모음에 비해 주된 고주파 성분을 포함하고 있기 때문에, 출력 음성신호가 자음인 경우에 발음상의 파워가 증가되고, 이의 결과로 수신 음성신호에 대한 음성 명료도가 향상된다.

본 발명의 실시 예에 따른 명료도 향상장치에 의해 음성 명료도가 향상됨을 보여주는 일 예가 도 3에 도시되어 있다. 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면으로, "five", "six" 그리고 "two"라는 음성 신호를 수신한 경우에 대한 것이다.

도 3에서 (a)는 본 발명에 따른 신호 처리를 하지 않은 상태로 출력되는 출력 음성신호의 주파수 파형도이고, (b)는 본 발명에 따른 신호 처리를 한 상태로 출력되는 출력 음성신호의 주파수 파형도이다.

(a)에 도시된 바와 같이,five, six와 two라는 음성신호가 수신되면 종래에는 원으로 마킹(marking)된 "F", "S", "W"에 해당하는 자음 신호 성분에 대한 증폭이 이루어지지 않고 있다.

이에 반해, (b)에 도시된 바와 같이 본 발명의 실시 예에 따른 명료도 향상장치(100)는 "five", "six"와 "two"라는 음성신호가 수신되면 원으로 마킹(marking)된 "F", "S", "W"에 해당하는 자음 신호 성분에 대해 선택적인 증폭하여 출력한다. 물론, 본 발명의 실시 예에 따른 명료도 향상장치(100)는 "V", "X", "T"에 해당하는 자음 신호 성분 또한 선택적인 증폭하여 출력하고 있음을 알 수 있다.

본 발명의 실시 예에 따른 명료도 향상장치에 의한 음성 명료도가 향상을 보인 다른 예가 도 4에 도시되어 있다. 도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.

도 4의 (a)는 본 발명에 따른 명료도 향상장치에 입력 및 출력되는 음성신호를 보여주는 주파수 파형도로서, input은 회색을 띠는 파형도로서 수신되는 음성신호의 파형이고, processed은 검은색을 띠는 파형도로서 필터링에 의해 증폭된 출력되는 음성신호의 파형이다.

그리고 (b)는 입력 음성신호의 스펙트로그램이며, (c)는 출력 음성신호의 스펙트로그램이다.

(a)에 도시된 입력 음성신호와 출력 음성신호를 통해 알 수 있듯이 "beach exposed to trash"라는 음성신호가 수신되면 명료도 향상장치(100)는 고주파 통과 필터인 쉘빙 필터부(101)의 컷오프 주파수가 변화하면서 자음인 "b", "ch", "k", "p", "zd", "t", "sh"의 신호 성분을 모음에 비해 상대적으로 강조(즉, 증폭)을 하여 출력함을 보여준다.

그리고 (b)와 (c)에 도시된 스펙트로그램에서 알 수 있듯이, 원으로 마킹한 자음 부분은 입력 음성신호에 비해 출력 음성신호에서 고주파 성분에서의 분포가 높음을 알 수 있다.

이하에서는 도 5를 참조로 하여 본 발명의 실시 예에 따른 음성출력장치를 설명한다. 도 5는 본 발명의 실시 예에 따른 음성출력장치의 블록 구성도이다.

본 발명의 실시 예에 따른 음성출력장치(400)는 음성신호를 수신하고 출력하는 장치로서, 휴대폰, 일반전화기, PMP, DMB, MP3, 차량용 핸즈 프리킷(hands-free kit), 블루투스 이어셋(bluetooth ear-set) 등일 수 있다.

이하에서는 음성출력장치(400)가 휴대폰인 경우를 일 예로 하여 설명한다.

이와 같은 본 발명의 실시 예에 따른 음성출력장치(400)는 도 5에 도시된 바와 같이, 수신부(401), 키입력부(402), 마이크(403), 음성 처리부(404), 잡음환경 판단부(405), 음량 조절부(406), 명료도 향상부(407), 소리 출력부(408), 와 출력 표시부(409)를 포함한다.

수신부(401)는 외부로부터 전송되는 음성 신호를 수신한다. 예컨대, 수신부(401)는 안테나 등이다.

키입력부(402)는 복수의 버튼 키(button key)나 터치패드(touch pad) 등으로 이루어지며, 사용자의 조작을 입력한다. 마이크(403)는 사용자의 음성이나 주변 잡음을 입력하여 증폭한다.

음성 처리부(404)는 수신부(401)에 수신된 음성 신호를 복호화하여 아날로그 신호로 출력한다. 예컨대, 음성 처리부(404)는 디코더(decoder)를 포함된 형태이며, 수신된 음성 신호가 디지털 신호인 경우에 D/A(Digital to analog) 컨버터를 더 포함된 형태이다.

잡음환경 판단부(405)는 마이크(403)를 통해 수집되는 주변 잡음의 세기를 측정하고, 음성 처리부(404)로부터 수신되는 아날로그 음성 신호의 세기를 측정하며, 측정한 두 음성 신호를 비교한다. 이때 주변 잡음의 세기는 주변음들 각각의 세기에 대한 평균 세기이다.

잡음환경 판단부(405)는 주변 잡음의 세기가 음성 신호의 세기보다 큰 경우에 잡음 환경이라고 판단한다.

다른 예로, 잡음환경 판단부(405)는 잡음 환경 판단시에 수신된 음성 신호의 세기를 이용하지 않을 수 있다. 이 경우에 잡음환경 판단부(405)는 설정 기준 세기를 이용하는데, 주변 잡음의 세기가 설정 기준 세기보다 큰 경우에 잡음 환경이라고 판단한다.

음량 조절부(406)는 음성 처리부(404) 또는 마이크(403)로부터 수신한 음성 신호를 설정된 출력 음량 레벨로 증폭 또는 감소시켜 소리 출력부(409)로 출력되는데, 이때 음량 조절부(406)에 설정되는 출력 음량 레벨에 대한 조절은 수동식(수동 음량 조절)과 자동식(자동 음량 조절)으로 구분된다.

수동식은 사용자가 키입력부(402)에서 음량 조절 버튼키를 조절하여 특정 음량 출력 레벨을 지정하는 경우에 이루어지는데, 음량 조절부(406)는 사용자가 지정한 특정 음량 출력 레벨로 출력 음량 레벨을 조절한다.

자동식은 잡음환경 판단부(405)에 의해 판단된 주변 잡음 레벨이 설정된 음량 출력 레벨과 차이가 나는 경우에 이루어진다. 이 경우에 음량 조절부(406)는 주변 잡음 레벨과 수신된 음성 신호의 레벨을 비교하여 주변 잡음 레벨이 수신된 음성 신호의 레벨보다 높으면 음량 출력 레벨을 주변 잡음 레벨보다 높게 조절한다. 물론, 음량 조절부(406)는 주변 잡음 레벨을 자체 설정된 음량 출력 레벨과 비교하여 음량 출력 레벨을 조절할 수 있다.

명료도 향상부(407)는 도 1을 참조로 설명한 본 발명의 실시 예에 따른 명료도 향상장치(100)이다. 명료도 향상부(407)는 음량 조절부(406)로부터 입력되는 음성 신호에 대해 명료도를 향상시켜 출력하며, 이때 출력되는 음성 신호는 음량 조절부(406)에 의해 조절된 음량 출력 레벨을 적용받는다.

명료도 향상부(407)로 입력되는 음성 신호는 수신부(401)를 통해 입력되는 아날로그의 음성 신호이거나 마이크(403)를 통해 입력되는 아날로그 음성 신호이다.

명료도 향상부(407)의 명료도 향상 동작은 주변 환경이 잡음 환경이거나, 명료도 향상을 명령하는 버튼키의 입력이 있거나, 음성출력장치(400)가 명료도 향상 모드로 동작하는 경우에 이루어진다.

여기서, 명료도 향상 모드로 동작하는 경우에 명료도 향상부(407)는 마이크(403)로 입력되는 음성 신호가 소리 출력부(408)로 출력되거나, 수신부(401)로 음성 신호가 수신되어 소리 출력부(408)로 출력되는 경우에 무조건적으로 명료도 향상 동작을 수행한다.

명료도 향상부(407)는 소리 출력부(409)에 출력되는 음량 출력 레벨이 최대인 경우에만 동작할 수 있으며, 음량 출력 레벨이 최대가 아니어도 주변 환경이 잡음 환경인 경우에 동작할 수 있으며, 주변 환경이 잡음 환경이 아니어도 사용자의 요청이 있는 경우에 동작할 수 있다.

소리 출력부(408)는 스피커를 포함하고 있으며, 음량 조절부(406)에서 출력한 아날로그 음성 신호를 스피커를 통해 출력한다. 이때 소리 출력부(408)에서 출력되는 음성 신호는 명료도 향상부(407)에 의해 명료도가 향상되었을 수 있고 그렇지 않을 수 있다.

출력 표시부(409)는 음성 신호의 출력 레벨을 표시한다. 출력 표시부(409)는 음량 조절부(406)에 의해 조절된 음량 출력 레벨에 부합하는 음량 출력 레벨 표시를 외부에 나타낸다. 특히, 출력 표시부(409)는 출력되는 음성 신호가 명료도 향상부(407)에 의해 명료도 향상된 출력인 경우에 명료도 향상 표시를 음량 출력 레벨 표시와 함께 외부에 나타낸다.

예컨대, 도 5에 도시된 바와 같이 음성출력장치(400)의 전면 표시창(10)에 음량 출력 레벨 표시가 나타나는 경우에, 명료도 향상 표시는 A와 같이 음량 출력 레벨 표시와 별도로 표시하여 나타낸다.

이와 같이 별도의 표시로 나타냄으로써, 명료도 향상 표시는 사용자가 육안으로 음성출력장치(400)에서 명료도 향상 동작이 이루어지고 있음을 알 수 있게 된다.

한편, 본 발명의 다른 실시 예로서 출력 표시부(408)의 명료도 향상 표시에 연동하는 진동부(미도시) 또는 알람부(미도시) 중 적어도 하나를 더 포함할 수 있다. 진동부는 출력 표시부(409)의 명료도 향상 표시에 연동하여 음성출력장치(400)를 진동시키며, 알람부는 출력 표시부(409)의 명료도 향상 표시에 연동하여 명료도 향상을 알리는 명료도 향상 알림음을 출력한다.

한편, 본 발명의 실시 예에 따른 음성출력장치가 일반전화기인 경우에는 수신부(401)가 안테나 형태가 아닌 케이블 단자에 연결된 형태일 것이다. 그리고 본 발명의 실시 예에 따른 음성출력장치가 PMP, DMB, MP3 등과 같이 휴대용 미디어 재생기인 경우에는 필수적으로 수신부(401)를 구비하지 않아도 되며, 음성 처리부(404)가 저장된 멀티미디어 파일을 재생하여 아날로그 음성 신호를 음량 조절부(406)에 제공하게 될 것이다.

또한 본 발명의 실시 예에 따른 음성출력장치가 핸즈 프리킷 또는 블루투스 이어셋인 경우에는 수신부(401), 음성 처리부(404)를 필요로 하지 않을 것이다.

결국, 본 발명의 실시 예에 따른 음성출력장치는 기본적으로 마이크(403), 잡음환경 판단부(405), 음성 처리부(404), 음량 조절부(406), 명료도 향상부(407), 소리 출력부(408)와 출력 표시부(409)를 구성으로 하게 된다.

이하에서는 도 6을 참조로 하여 본 발명의 제1 실시 예에 따른 수신음 처리 방법의 예를 설명한다. 도 6은 본 발명의 제1 실시 예에 따른 수신음 처리 방법을 보인 순서도이다.

본 발명의 제1 실시 예에 따른 수신음 처리 방법은 잡음 환경인 경우에 음성 명료도 향상 동작이 항상 이루어지는 경우에 대한 것이다.

도 6에 도시된 바와 같이, 음성출력장치는 제1 상황에 따라 제1 음성신호가 소리 출력부(408)를 통해 출력되어야 하는 것임을 판단한다(S601).

이때 제1 조건은 수신부(401)를 통해 수신된 음성 신호(제1 음성 신호에 해당됨)이거나, 사용자의 요구에 의해 자체 저장된 음성 파일의 재생이거나, 특정 모드에 의해 마이크(403)를 통해 입력되는 음성 신호(제1 음성 신호에 해당됨)를 소리 출력부(408)를 통해 출력하는 상황 등이다. 그리고 음성 파일을 재생하는 경우에, 음성 파일을 신호 처리한 아날로그 음성 신호가 제1 음성 신호에 해당된다.

제1 상황에 따라 잡음환경 판단부(405)는 제1 음성신호의 세기를 측정하고(S602), 마이크(403)를 통해 수신된 주변 잡음의 세기를 측정한다(S603).

그리고 잡음환경 판단부(405)는 측정한 제1 음성신호의 세기와 주변 잡음의 세기를 비교하여(S604), 주변 잡음의 세기가 제1 음성신호의 세기보다 크면 잡음 환경이라고 판단하고, 주변 잡음의 세기가 제1 음성신호의 세기 이하이면 잡음 환경이 아니라고 판단한다(S605).

잡음 환경이 아닌 경우에, 음성출력장치(400)는 제1 음성신호에 대한 명료도 향상을 하지 않고 소리 출력부(408)를 통해 출력한다(S606).

반면에 잡음 환경이 경우에, 잡음환경 판단부(405)는 음량 조절부(406)에게 잡음 환경임을 알리며, 음량 조절부(406)는 잡음 환경에 대응한 설정 음량 출력 레벨을 설정하고, 음성 처리부(404)를 통해 수신되는 제1 음성 신호를 설정 음량 출력 레벨로 증폭하여 명료도 향상부(407)에 제공한다(S607).

여기서, 설정 음량 출력 레벨은 최대 음량 출력 레벨이거나 최대 음량 레벨에 근접한 음량 출력 레벨이다. 물론 현재 설정된 음량 조절부(406)의 음량 출력 레벨이 설정 음량 출력 레벨 이상이면, 음량 조절부(406)는 최대 음량 출력 레벨이 되게 하거나, 현재 설정된 음량 출력 레벨을 그대로 유지한다.

명료도 향상부(407)는 잡음환경 판단부(405)로부터 제1 음성 신호를 수신하면, 수신한 제1 음성 신호에 대하여 자음 성분이 선택적으로 강조되도록 하여 명료도를 향상시키고(S608), 이렇게 음성 명료도가 향상된 제1 음성 신호를 소리 출력부(408)를 통해 외부로 출력한다(S609).

소리 출력부(408)를 통해 음성 명료도가 향상된 제1 음성 신호가 출력됨과 동시에, 출력 표시부(409)는 명료도 향상부(407)의 명료도 향상 동작에 연계하여 소리 출력부(408)를 통해 출력되는 제1 음성 신호에 대한 신호 강도 표시와 함께 명료도 향상이 되었음을 알리는 명료도 향상 표시를 화면상에 표시한다(S610).

이하에서는 도 7을 참조로 하여 본 발명의 제2 실시 예에 따른 수신음 처리방법을 설명한다. 도 7은 본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.

본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법은 잡음 환경에 무관하게 음성 명료도 향상 동작이 이루어지는 경우에 대한 것이다.

도 7에 도시된 바와 같이, 음성출력장치(400)는 제1 상황에 따라 제1 음성신호가 소리 출력부(408)를 통해 출력되어야 하는 것임을 판단한다(S701).

제1 상황에 따라 잡음환경 판단부(405)는 제1 음성신호의 세기를 측정하고(S702), 마이크(403)를 통해 수신된 주변 잡음의 세기를 측정한다(S703).

그리고 잡음환경 판단부(405)는 제1 음성신호의 세기와 주변 잡음의 세기를 비교하여(S704), 주변 잡음의 세기가 제1 음성신호의 세기보다 크면 잡음 환경이라고 판단하고, 주변 잡음의 세기가 제1 음성신호의 세기 이하이면 잡음 환경이 아니라고 판단한다(S705).

잡음 환경이 경우에, 잡음환경 판단부(405)는 음량 조절부(406)에게 잡음 환경임을 알리며, 음량 조절부(406)는 잡음 환경에 대응한 설정 음량 출력 레벨을 설정하고, 음성 처리부(404)를 통해 수신되는 제1 음성 신호를 설정 음량 출력 레벨로 증폭하여 명료도 향상부(407)에 제공한다(S706, S707).

명료도 향상부(407)는 잡음환경 판단부(405)로부터 제1 음성 신호를 수신하면, 수신한 제1 음성 신호에 대하여 자음 성분이 선택적으로 강조되도록 하여 명료도를 향상시키고(S707), 이렇게 음성 명료도가 향상된 제1 음성 신호를 소리 출력부(408)를 통해 외부로 출력한다(S708).

소리 출력부(408)를 통해 음성 명료도가 향상된 제1 음성 신호가 출력됨과 동시에, 출력 표시부(409)는 명료도 향상부(407)의 명료도 향상 동작에 연계하여 소리 출력부(408)를 통해 출력되는 제1 음성 신호에 대한 신호 강도 표시와 함께 명료도 향상이 되었음을 알리는 명료도 향상 표시를 화면상에 표시한다(S709).

그리고 상기 판단 과정(S705)에서 잡음 환경이 아닌 경우에는 수신된 제1 음성 신호에 대한 자동 음량 조절(S706 과정)을 하지 않은 상태로 S707, S708 과정 내지 S709 과정을 수행한다.

한편, 전술한 본 발명의 다른 실시 예에 따르면, 잡음 환경이 아닌 경우에는 수신된 음성 신호에 대한 자동 음량 조절 및 명료도 향상을 하지 않게 할 수 음성출력장치(409)의 동작을 설정할 수 있다. 물론 잡음 환경이 아닌 경우에 수신된 음성 신호에 대한 자동 음량 조절 및 명료도 향상을 하지 않게 설정하더라도, 사용자가 명료도 향상을 지시하는 버튼키 입력을 하는 경우에는 수신된 음성 신호에 대한 명료도 향상을 수행하게 된다.

이상에서 설명한 본 발명의 실시 예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.

이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

본 발명의 실시 예에 따르면, 음성출력장치가 자동으로 사용자의 통화 환경을 파악하여 통화 환경에 맞는 수신 음량 조절 및 음성 명료도를 향상시켜 수신음질이 향상된 상태에서 통화를 할 수 있게 하고, 사용자가 통화 중에 음질 향상 요구를 하더라도 사용자의 음질향상 요구에 맞게 명료도 향상 동작을 하여 사용자의 요구에 부응하는 수신 음질이 향상된 소리를 들을 수 있게 한다. 또한 본 발명의 실시 예에 따르면, 수신 음질이 향상되어 출력되는 상태를 음성출력장치의 화면상에 표시하여 사용자가 현재 출력되는 소리가 수신 음질이 향상된 소리임을 알 수 있게 한다.

Claims

입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부;

출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부;

상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부;

상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및

상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치.
제1항에 있어서,

상기 컷오프주파수 예측부는,

상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추는 것을 특징으로 하는 명료도 향상장치.
제2항에 있어서,

상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 하는 명료도 향상장치.
외부로부터 제1 음성 신호를 입력하여 증폭하는 마이크;

상기 제1 음성 신호의 세기를 측정하고 상기 제1 음성 신호의 신호 세기를 기반으로 잡음 환경인지를 판단하는 잡음환경 판단부;

입력되는 음성 신호를 규정된 형태의 제2 음성 신호로 바꾸어 출력하는 음성 처리부;

상기 잡음환경 판단부의 판단에 의해 잡음 환경인 경우에 음향 출력 레벨을 설정 레벨로 조절하고, 상기 제2 음성 신호를 상기 조절한 설정 레벨로 증폭하여 출력하는 음량 조절부;

상기 음량 조절부를 통해 입력되는 제3 음성 신호에 대해 명료도를 향상시켜 제4 음성 신호로 출력하는 명료도 향상부;

상기 제4 음성 신호 및 상기 음량 조절부에서 출력하는 음성 신호를 외부로 출력하는 소리 출력부; 및

상기 명료도 향상부의 명료도 향상 동작에 연동하여 상기 소리 출력부에 의해 출력되는 상기 제4 음성 신호가 명료도 향상된 음성 신호임을 나타내는 명료도 표시를 출력하는 출력 표시부를 포함하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제4항에 있어서,

상기 명료도 향상부는,

입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부,

출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부,

상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부,

상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부와,

상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제5항에 있어서,

상기 컷오프주파수 예측부는,

상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제6항에 있어서,

상기 컷오프주파수 예측부는,

상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제7항에 있어서,

상기 설정 레벨은 상기 현재 설정된 음향 출력 레벨보다 한 단계 높은 레벨인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제7항에 있어서,

상기 설정 레벨은 가장 높은 음향 출력 레벨인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제8항 또는 제9항에 있어서,

상기 음량 조절부는 사용자로부터 특정 음향 출력 레벨로의 설정이 입력되는 경우에, 상기 제2 음성 신호를 상기 특정 음향 출력 레벨로 조절하여 출력하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제10항에 있어서,

상기 명료도 표시는 음향 출력 레벨을 나타내는 제1 표시와 차별화된 표시이며, 상기 제1 표시와 함께 화면상에 표시되는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제10항에 있어서,

상기 명료도 표시는 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
제10항에 있어서,

상기 명료도 표시는 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력 및 음향 출력 레벨을 나타내는 제1 표시와 차별화되어 화면상에 표시되는 표시인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.