KR100976782B1

KR100976782B1 - 음성 신호 처리 장치 및 방법

Info

Publication number: KR100976782B1
Application number: KR1020080069977A
Authority: KR
Inventors: 히로유키 타케이시
Original assignee: 닛뽕빅터 가부시키가이샤
Priority date: 2007-08-31
Filing date: 2008-07-18
Publication date: 2010-08-18
Also published as: CN101378250B; KR20090023080A; JP2009077378A; CN101378250A; JP5062055B2

Abstract

(과제) 악곡의 음악성을 해치는 일 없이, 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있는 음성 신호 처리 장치를 제공한다.

(해결 수단) 대역 분할 필터(2a∼2e)는, 제1 음성 신호를 복수의 주파수 대역으로 분할하여, 복수의 주파수 대역마다의 제2 음성 신호를 출력한다. 음압 레벨 증폭부(3a∼3e)는, 제2 음성 신호를, 저음압 레벨 영역과 고음압 레벨 영역을 제외한 중간 음압 레벨 영역에서, 음압 레벨을 저음압 레벨 영역측으로부터 중간음압 레벨 영역 내의 중간점까지 순차적으로 크게 하고, 중간점으로부터 고음압 레벨 영역측까지 순차적으로 작게 하는 증폭 특성으로 증폭한다. 가산부(5)는, 앰프(4a∼4e)의 출력을 가산하여 제3 음성 신호로 한다.

대역 분할, 음성 신호, 저음압, 고음압

Description

음성 신호 처리 장치 및 방법{SOUND SIGNAL PROCESSING APPARATUS AND METHOD}

본 발명은, 음성 신호를 처리하는 음성 신호 처리 장치 및 방법에 관한 것으로, 특히, 청감적(聽感的)으로 알아듣기 쉬운 재생음을 얻을 수 있는 음성 신호 처리 장치 및 방법에 관한 것이다.

청취자가 음성 신호를 청취할 때, 스피커 또는 헤드폰으로부터 발해지는 재생음이 청감적으로 알아듣기 쉬우면, 청취자는 청취 피로를 느끼기 어렵다. 따라서, 음성 신호를 재생하는 오디오 기기로서는, 청취자가 알아듣기 쉽다고 느끼는 음을 재생하는 것이 바람직하다. 이때, 알아듣기 쉬운 음이었다고 해도, 청취하는 악곡의 음악성을 해치는 일은 바람직하지 않다.

종래의 음성 신호 처리 장치로서는, 예를 들면, 일본특허 제3373103호 공보(특허 문헌 1), 일본공개특허공보 2002-281599호(특허 문헌 2), 일본공개특허공보 2000-22469호(특허 문헌 3)에 기재된 것이 있다. 또한, 특허 문헌 1, 2에는 음성 신호를 대역 분할 필터에 의해 복수의 대역으로 분할하여 신호 처리를 행하는 것이 기재되어 있다. 특허 문헌 3에는 음성 신호의 과도(過渡) 응답 특성을 개선한 음 성 신호 처리 장치가 기재되어 있다.

[특허 문헌 1] 일본특허 3373103호 공보

[특허 문헌 2] 일본공개특허공보 2002-281599호

[특허 문헌 3] 일본공개특허공보 2000-22469호

상기 특허 문헌 1∼3에 기재된 발명은, 청감적으로 알아듣기 쉬움을 어느 정도 개선할 수는 있지만, 악곡의 음악성을 해쳐 버린다는 문제점이 있다. 그래서, 악곡의 음악성을 해치는 일 없이, 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있는 음성 신호 처리 장치 및 방법의 등장이 요망되고 있었다.

본 발명은 이러한 문제점을 감안하여 이루어진 것이며, 악곡의 음악성을 해치는 일 없이, 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있는 음성 신호 처리 장치 및 방법을 제공하는 것을 목적으로 한다.

본 발명은, 전술한 종래의 기술의 과제를 해결하기 위해, 제1 음성 신호를 복수의 주파수 대역으로 분할하여, 상기 복수의 주파수 대역마다의 제2 음성 신호를 출력하는 대역 분할 필터(2a∼2e)와, 상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를, 상기 제2 음성 신호의 최소 음압 레벨에서부터 최대 음압 레벨까지의 범위에 있어서 상기 최소 음압 레벨에서부터 소정의 범위의 저음압 레벨 영역과 상기 최대 음압 레벨에서부터 소정의 범위의 고음압 레벨 영역을 제외한 중간 음압 레벨 영역에서, 음압 레벨을 상기 저음압 레벨 영역측으로부터 상기 중간 음압 레벨 영역 내의 중간점까지 순차적으로 크게 하고, 상기 중간점으로부터 상기 고음압 레벨 영역측까지 순차적으로 작게 하는 증폭 특성으로 증폭하는 음압 레벨 증폭부(3a∼3e)와, 상기 음압 레벨 증폭부에 의해 증폭된 상기 복수의 주파수 대역 각 각의 상기 제2 음성 신호를 가산하여 제3 음성 신호로서 출력하는 가산부(5)를 구비하는 것을 특징으로 하는 음성 신호 처리 장치를 제공한다.

여기서, 상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치를 적어도 일부에서 다르게 하는 것이 바람직하다.

상기 음압 레벨 증폭부는, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치를, 가장 상기 고음압 레벨 영역측에 위치시키는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역 중의 가장 저역(低域)의 주파수 대역에 있어서의 상기 중간점의 위치를, 가장 상기 저음압 레벨 영역측에 위치시키는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 적어도 일부에서 다르게 하는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 작게 하는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 크게 하는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점 의 위치에서의 증폭도를, 상기 제1 음성 신호가 갖는 다이내믹 레인지에 기초하여 산출한 최소 증폭도에서 최대 증폭도까지의 범위로 설정하는 것이 바람직하다.

또한, 상기 제1 음성 신호는 다이내믹 레인지가 다른 복수의 음성 신호 중의 어느 하나의 음성 신호이며, 상기 음압 레벨 증폭부는, 복수의 다이내믹 레인지 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조(組)를 설정하고, 상기 제1 음성 신호가 갖는 다이내믹 레인지에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 구비하는 것이 바람직하다.

상기 제1 음성 신호는 복수 종류 장르의 콘텐츠의 음성 신호 중의 어느 하나의 음성 신호이며, 상기 음압 레벨 증폭부는, 상기 복수 종류 장르의 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고, 상기 제1 음성 신호의 장르에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 구비하는 것이 바람직하다.

상기 음압 레벨 증폭부는, 상기 제3 음성 신호를 청취할 때의 복수의 청취 모드에 대응하여, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고, 상기 복수의 청취 모드를 선택하기 위한 조작부와, 상기 조작부에 의해 선택한 청취 모드에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 구비하는 것이 바람직하다.

그리고 또한, 상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 상기 제2 음성 신호의 음압 레벨이 제1 음압 레벨에서 제2 음압 레벨로 상승한 시점에서 제1 시간의 어택 타임(attack time)을 갖는 과도 응 답 특성을 부여함과 함께, 상기 제2 음성 신호의 음압 레벨이 제3 음압 레벨에서 제4 음압 레벨로 저하한 시점에서 상기 제1 시간보다도 긴 제2 시간의 릴리스 타임(release time)을 갖는 과도 응답 특성을 부여하는 것이 바람직하다.

이때, 상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 높은 주파수 대역일수록 상기 제1 및 제2 시간이 짧은 과도 응답 특성을 부여하는 것이 바람직하다.

상기 최소 가청 한계는, 인간의 표준적인 청력 특성에 기초하는 최소 가청 한계가 좋고, 바람직하게는, 미리 측정한 상기 제3 음성 신호를 청취하는 청취자의 청력 특성에 기초하는 최소 가청 한계이다.

또한, 본 발명은, 전술한 종래의 기술의 과제를 해결하기 위해, 제1 음성 신호를 복수의 주파수 대역으로 분할하여, 상기 복수의 주파수 대역마다의 제2 음성 신호를 출력하고, 상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를, 상기 제2 음성 신호의 최소 음압 레벨에서 최대 음압 레벨까지의 범위에 있어서의 상기 최소 음압 레벨에서 소정의 범위의 저음압 레벨 영역과 상기 최대 음압 레벨에서 소정의 범위의 고음압 레벨 영역을 제외한 중간 음압 레벨 영역에서, 음압 레벨을 상기 저음압 레벨 영역측으로부터 상기 중간 음압 레벨 영역 내의 중간점까지 순차적으로 크게 하고, 상기 중간점으로부터 상기 고음압 레벨 영역측까지 순차적으로 작게 하는 증폭 특성으로 증폭하고, 증폭된 상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를 가산하여 제3 음성 신호로서 출력하는 것을 특징으로 하는 음성 신호 처리 방법을 제공한다.

여기서, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치를 적어도 일부에서 다르게 하는 것이 바람직하다.

최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치를, 가장 상기 고음압 레벨 영역측에 위치시키는 것이 바람직하다.

상기 복수의 주파수 대역 중의 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치를, 가장 상기 저음압 레벨 영역측에 위치시키는 것이 바람직하다.

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 적어도 일부에서 다르게 하는 것이 바람직하다.

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 작게 하는 것이 바람직하다.

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 크게 하는 것이 바람직하다.

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 상기 제1 음성 신호가 갖는 다이내믹 레인지에 기초하여 산출한 최소 증폭도에서 최대 증폭도까지의 범위로 설정하는 것이 바람직하다.

또한, 상기 제1 음성 신호는 다이내믹 레인지가 다른 복수의 음성 신호 중의 어느 하나의 음성 신호이며, 복수의 다이내믹 레인지 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고, 상기 제1 음성 신호가 갖는 다이내믹 레인지에 따라 상기 증폭도의 조를 전환하는 것이 바람직하다.

상기 제1 음성 신호는 복수 종류의 장르의 콘텐츠의 음성 신호 중의 어느 하나의 음성 신호이며, 상기 복수 종류의 장르 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고, 상기 제1 음성 신호의 장르에 따라 상기 증폭도의 조를 전환하는 것이 바람직하다.

상기 제3 음성 신호를 청취할 때의 복수의 청취 모드에 대응하여, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고, 상기 복수의 청취 모드 중 어느 하나를 선택하고, 선택한 청취 모드에 따라 상기 증폭도의 조를 전환하는 것이 바람직하다.

그리고 또한, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 상기 제2 음성 신호의 음압 레벨이 제1 음압 레벨에서 제2 음압 레벨로 상승한 시점에서 제1 시간의 어택 타임을 갖는 과도 응답 특성을 부여함과 함께, 상기 제2 음성 신호의 음압 레벨이 제3 음압 레벨에서 제4 음압 레벨로 저하한 시점에서 상기 제1 시간보다도 긴 제2 시간의 릴리스 타임을 갖는 과도 응답 특성을 부여하는 것이 바람직하다.

여기서, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 높은 주파수 대역일수록 상기 제1 및 제2 시간이 짧은 과도 응답 특성을 부여하는 것이 바람직하다.

본 발명의 음성 신호 처리 장치 및 방법에 의하면, 악곡의 음악성을 해치는 일 없이, 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있다. 청취자는 청취 피로를 느끼기 어렵기 때문에, 악곡의 청취를 충분히 즐길 수 있는 오디오 기기를 제공하는 것이 가능해진다.

(발명을 실시하기 위한 최량의 형태)

이하, 본 발명의 음성 신호 처리 장치 및 방법의 각 실시 형태에 대하여, 첨부 도면을 참조하여 설명한다. 각 실시 형태를 하드웨어 구성의 블록도를 이용하여 설명하지만, 각 실시 형태의 일부를 소프트웨어로서 구성해도 좋다. 소프트웨어로서 구성하는 것이 가능한 부분을 모두 소프트웨어로 구성해도 좋고, 하드웨어와 소프트웨어의 사용 구분은 임의로 좋다.

(제1 실시 형태)

도1 은 본 발명의 음성 신호 처리 장치의 제1 실시 형태를 나타내는 블록도이다. 제1 실시 형태의 음성 신호 처리 장치(100)는 본 발명의 음성 신호 처리 장치의 각 실시 형태에 있어서의 기본적인 구성을 나타내는 것이다. 도1 에 있어서, 입력 단자(1)에 입력된 디지털 음성 신호(제1 음성 신호)는 대역 분할 필터(2a∼ 2e)에 공급된다. 대역 분할 필터(2a∼2e)는 서로의 통과 주파수 대역이 다르다. 인간의 가청 범위를 20Hz∼20kHz라고 하면, 대역 분할 필터(2a)는 예를 들면 20Hz∼200Hz의 저역을 통과시키는 필터이며, 대역 분할 필터(2b)는 예를 들면 200Hz∼600Hz의 중저역을 통과시키는 필터이다. 대역 분할 필터(2c)는 예를 들면 600Hz∼1.8kHz의 중역을 통과시키는 필터이며, 대역 분할 필터(2d)는 예를 들면 1.8kHz∼5.4kHz의 중고역을 통과시키는 필터이다. 대역 분할 필터(2e)는 예를 들면 5.4kHz∼20kHz의 고역을 통과시키는 필터이다.

200Hz∼600Hz의 중저역은 음성의 기본파를 포함하는 대역이며, 600Hz∼1.8kHz의 중역은 포먼트(formant)를 포함하는 대역이며, 1.8kHz∼5.4kHz의 중고역은 자음 성분을 포함하는 대역이다. 대역 분할 필터의 개수, 즉, 음성 신호를 몇 개의 대역으로 분할할 것인지는 임의이며, 도1 에 나타내는 5분할로 한정되는 것은 아니다. 예를 들면 음성 신호를 3개의 대역으로 분할하는 경우는, 20Hz∼200Hz의 저역과, 200Hz∼5.4kHz의 중역과, 5.4kHz∼20kHz의 고역으로 분할하는 것이 바람직하다.

대역 분할 필터(2a∼2e)의 후단에는, 대역 분할 필터(2a∼2e) 각각에 대응하도록 음압 레벨 증폭부(3a∼3e)가 형성되어 있다. 음압 레벨 증폭부(3a∼3e)로서는, 일반적으로 다이내믹 레인지 제어 회로(DRC(Dynamic Range Control) 회로)라고 일컬어지고 있는 회로를 이용할 수 있다. 음압 레벨 증폭부(3a∼3e)는 대역 분할 필터(2a∼2e)로부터 출력된 각각의 음성 신호(제2 음성 신호)의 음압 레벨을 나중에 상세히 설명하는 바와 같이 증폭한다. 음압 레벨 증폭부(3a∼3e)의 내부 구성 은 서로 동일하지만, 음압 레벨을 증폭할 때의 증폭 특성을 음압 레벨 증폭부(3a∼3e) 각각에서 개별로 설정하고 있다. 단, 음압 레벨 증폭부(3a∼3e)에 있어서의 증폭 특성의 모두가 서로 다를 필요는 없고, 일부에서 중복된 증폭 특성이어도 좋다.

음압 레벨 증폭부(3a∼3e)의 후단에는, 음압 레벨 증폭부(3a∼3e) 각각에 대응하도록 앰프(4a∼4e)가 형성되어 있다. 앰프(4a∼4e)는 음압 레벨 증폭부(3a∼3e)로부터 출력된 각각의 음성 신호를 미리 정해진 게인(gain)으로 증폭하여 출력한다. 앰프(4a∼4e)에 있어서의 게인은 기본적으로는 동일한 것으로 좋지만, 소망의 재생음을 얻기 위해 일부의 앰프의 게인을 다르게 해도 좋고, 주파수 대역마다 다른 게인을 설정해도 좋다. 앰프(4a∼4e)는 경우에 따라서는 삭제 가능하다. 앰프(4a∼4e)로부터 출력된 음성 신호는 가산부(5)에 입력되어 가산되고, 출력 단자(6)로부터 출력된다. 가산부(5)로부터 출력된 음성 신호(제3 음성 신호)는, 여기서는 도시하지 않은 스피커 또는 헤드폰에 의해 청취자에게 청취된다.

여기서, 도2 를 이용하여 음압 레벨 증폭부(3a∼3e)의 구체적 구성에 대하여 설명한다. 도2 에 있어서, 대역 분할 필터(2a∼2e) 중 어느 하나로부터 출력된 음성 신호는 레벨 검출부(31) 및 지연부(39)에 입력된다. 음압 레벨 증폭부(3a∼3e)에 입력되는 음성 신호는, 도3 에 나타내는 바와 같이, -100dBFS∼0dBFS의 범위의 음압 레벨을 갖는 것으로 한다. FS란 풀 스케일(full scale)을 의미한다. 레벨 검출부(31)는 입력된 음성 신호가 최소 음압 레벨의 -100dBFS로부터 최대 음압 레벨의 0dBFS까지의 어느 음압 레벨인지를 검출한다. 레벨 검출부(31)에서 검출된 음성 신호의 음압 레벨은 동작 범위 설정부(32) 및 배율 발생부(33)에 입력된다.

도3 에 나타내는 바와 같이, 최소 음압 레벨에서 최대 음압 레벨까지의 범위 중, 최소 음압 레벨에서 소정의 범위(예를 들면 -80dBFS까지)의 저음압 레벨 영역(R1)과, 최대 음압 레벨에서 소정의 범위(예를 들면 -25dBFS까지)의 고음압 레벨 영역(R2)에 있어서는, 음성 신호를 증폭시키지 않는 비증폭 영역으로 하는 것이 바람직하다. 저음압 레벨 영역(R1)과 고음압 레벨 영역(R2)을 비증폭 영역으로 함으로써, 악곡의 음악성을 거의 해치는 일이 없다. 이것은, 저음압 레벨 영역(R1)을 증폭하면 노이즈가 두드러지기 쉽게 되고, 고음압 레벨 영역(R2)을 증폭하면 왜곡이 발생되기 쉽고, 게다가 큰 음압 레벨이기 때문에 청감적으로 두드러지기 쉽기 때문이다. 단, 악곡의 음악성을 해치지 않는 정도로, 저음압 레벨 영역(R1)과 고음압 레벨 영역(R2)에서 입력 신호를 증폭시켜도 좋다.

저음압 레벨 영역(R1)과 고음압 레벨 영역(R2)과의 사이의 중간 음압 레벨 영역(R3)에 있어서는, 파선으로 나타내는 비증폭의 상태를 실선으로 나타내는 특성으로 증폭시킨 상태로 하는 증폭 영역으로 하고 있다. 동작 범위 설정부(32)는, 어느 범위를 비증폭 영역으로 하고, 어느 범위를 증폭 영역으로 할 것인지를 설정하고 있다. 후술하는 바와 같이, 음압 레벨 증폭부(3a∼3e) 각각의 동작 범위 설정부(32)에서 설정하고 있는 비증폭 영역·증폭 영역은 동일하지 않고, 각각의 동작 범위 설정부(32)에서 최적인 비증폭 영역·증폭 영역을 설정하고 있다.

도2 로 되돌아가, 증폭 특성 설정부(34)는, 변곡점 설정부(341)와 증폭도 설정부(342)와 증폭 특성 유지부(343)를 구비하고 있다. 도3 에 나타내는 바와 같 이, 증폭 영역인 중간 음압 레벨 영역(R3)에 있어서는, 저음압 레벨 영역(R1)의 고음압 레벨측의 단부인 점(P1)에서 중간 음압 레벨 영역(R3) 내의 중간점인 변곡점(Pi)까지는 입력 신호의 음압 레벨이 커짐에 따라 증폭도를 순차적으로 크게 하고, 변곡점(Pi)에서 고음압 레벨 영역(R2)의 저음압 레벨측의 단부인 점(P2)까지는 입력 신호의 음압 레벨이 커짐에 따라 증폭도를 순차적으로 작게 하는 특성으로 되어 있다. 도3 에서는, 점(P1)에서 변곡점(Pi)까지 선형으로 증폭도를 크게 하고, 변곡점(Pi)에서 점(P2)까지 선형으로 증폭도를 작게 하는 예를 나타내고 있다. 변곡점 설정부(341)는, 입력 신호의 음압 레벨의 어느 위치를 변곡점(Pi)으로 할 것인지를 설정하는 것이다. 증폭도 설정부(342)는, 변곡점(Pi)의 위치에 있어서의 증폭도(Ga)를 설정하는 것이다.

증폭 특성 유지부(343)에는, 변곡점 설정부(341)로부터의 변곡점 설정 데이터와 증폭도 설정부(342)로부터의 증폭도 설정 데이터가 입력된다. 변곡점 설정 데이터는 변곡점(Pi)의 위치(입력 음압 레벨)를 나타내는 위치 정보이며, 증폭도 설정 데이터는 증폭도(Ga)를 결정하는 정보이다. 본 실시 형태에 있어서는, 증폭도 설정 데이터는, 변곡점(Pi)의 위치에 있어서, 입력 신호의 음압 레벨을 몇 배로 할 것인가라는 배율을 나타내는 데이터이다. 증폭 특성 유지부(343)는, 변곡점(Pi)보다도 저음압 레벨측과 고음압 레벨측의 증폭 특성의 기울기 데이터를 갖고 있다. 증폭 특성 유지부(343)는, 기울기 데이터와 변곡점 설정 데이터와 증폭도 설정 데이터를 이용하여 중간 음압 레벨 영역(R3)에 있어서의 증폭 특성을 얻기 위한 배율 데이터를 계산에 의해 구하여 유지하고 있다.

배율 발생부(33)는, 증폭 특성 유지부(343)에 유지된 배율 데이터를 참조하여, 레벨 검출부(31)로부터 공급된 입력 신호의 음압 레벨에 따른 배율값을 발생한다. 이 배율값은 스위치(35)의 단자(a)에 공급된다. 고정 배율 발생부(36)는 1.0의 고정 배율값을 발생하여 스위치(35)의 단자(b)에 공급한다. 스위치(35)에는 동작 범위 설정부(32)로부터, 어느 범위를 비증폭 영역으로 하고, 어느 범위를 증폭 영역으로 할 것인지를 나타내는 동작 범위 설정 데이터가 입력된다. 스위치(35)는 동작 범위 설정 데이터가 비증폭 영역을 나타내는 경우는 단자(b)를 선택하고, 증폭 영역을 나타내는 경우는 단자(a)를 선택한다. 이에 따라, 스위치(35)로부터는 최소 음압 레벨에서 최대 음압 레벨까지의 범위에서 입력 신호를 어떤 식으로 증폭할 것인지를 결정하는 증폭도를 나타내는 데이터가 발생되게 된다.

본 실시 형태에 있어서는, 바람직한 구성예로서, 스무딩 필터(37; smoothing filter)와 어택 타임·릴리스 타임 설정부(38)를 형성하고 있다. 스무딩 필터(37) 및 어택 타임·릴리스 타임 설정부(38)를 형성하는 것은 필수는 아니지만, 형성하는 것이 바람직하다. 어택 타임·릴리스 타임 설정부(38)는 후술하는 어택 타임과 릴리스 타임을 설정하기 위한 설정 데이터를 유지하고 있다. 스무딩 필터(37)는 스위치(35)로부터 입력되는 증폭도에 대하여 어택 타임 및 릴리스 타임의 설정 데이터에 기초한 스무딩 처리를 행하여 출력한다. 이 스무딩 처리의 구체적인 동작에 대해서는 나중에 상세히 설명한다.

앰프(40)에는, 지연부(39)에 의해 지연된 입력 신호와 스무딩 필터(37)로부터 출력된 스무딩 처리가 행해진 증폭도가 입력된다. 앰프(40)는, 입력된 음성 신 호를 스무딩 필터(37)로부터의 증폭도에 기초하여 증폭하여 출력한다. 지연부(39)는 입력된 입력 신호를, 레벨 검출부(31)에서 스무딩 필터(37)까지의 처리에 필요로 하는 시간만큼 지연시켜 앰프(40)에 공급한다. 또한, 지연부(39)를 형성하는 것이 바람직하지만, 지연부(39)는 반드시 필요하지는 않다. 지연부(39)를 형성하지 않는 구성이어도, 가산부(5)로부터 출력되는 입력 신호의 청감적인 열화는 적다.

이상과 같이 하여, 음압 레벨 증폭부(3a∼3e)는 각각의 주파수 대역의 음성 신호를 음압 레벨 증폭부(3a∼3e) 각각의 증폭 특성에 기초하여 증폭한다.

여기서, 대역 분할 필터(2a∼2e)에 있어서의 저역, 중저역, 중역, 중고역, 고역에 대하여 설명한다. 도4 는 인간의 표준적인 청력 특성(음압 레벨의 가청 범위)을 나타내고 있으며, 최소 가청 한계와 최대 가청 한계와의 사이의 음압 레벨이 음으로서 들리는 범위이다. 도4 로부터 알 수 있는 바와 같이, 최소 가청 한계의 음압 레벨은 음성 신호의 주파수에 따라 다르다. 최소 가청 한계의 음압 레벨이 가장 작은 부분은, 1.8kHz∼5.4kHz의 중고역의 범위에 포함되어 있다. 본 실시 형태는, 주파수 대역에 따라 최소 가청 한계를 나타내는 음압 레벨이 다른 것을 고려하여, 음압 레벨 증폭부(3a∼3e)에 있어서의 증폭 특성을 각각 설정하고 있다.

도5 는, 음압 레벨 증폭부(3a∼3e)에 있어서의 증폭 특성의 매우 적합한 예를 나타내고 있다. 도5(A) 는, 음성 신호에 있어서의 20Hz∼200Hz의 저역 부분의 증폭 특성을 제어하는 음압 레벨 증폭부(3a)로 설정하고 있는 증폭 특성을 나타내고 있다. 도5(A) 에 있어서, 점(P1)은 -80dBFS, 점(P2)은 -25dBFS, 변곡점(Pi)은 -66dBFS에 위치하고 있다. 도5(B) 는, 음성 신호에 있어서의 200Hz∼600Hz의 중저역 부분의 증폭 특성을 제어하는 음압 레벨 증폭부(3b)로 설정하고 있는 증폭 특성을 나타내고 있다. 도5(B) 에 있어서, 점(P1)은 -80dBFS, 점(P2)은 -25dBFS, 변곡점(Pi)은 -63dBFS에 위치하고 있다.

도5(C) 는, 음성 신호에 있어서의 600Hz∼1.8kHz의 중역 부분의 증폭 특성을 제어하는 음압 레벨 증폭부(3c)로 설정하고 있는 증폭 특성을 나타내고 있다. 도5(C) 에 있어서, 점(P1)은 -80dBFS, 점(P2)은 -20dBFS, 변곡점(Pi)은 -60dBFS에 위치하고 있다. 도5(D) 는, 음성 신호에 있어서의 1.8kHz∼5.4kHz의 중고역 부분의 증폭 특성을 제어하는 음압 레벨 증폭부(3d)로 설정하고 있는 증폭 특성을 나타내고 있다. 도5(D) 에 있어서, 점(P1)은 -80dBFS, 점(P2)은 -18dBFS, 변곡점(Pi)은 -57dBFS에 위치하고 있다. 도5(E) 는, 음성 신호에 있어서의 5.4kHz∼20kHz의 고역 부분의 증폭 특성을 제어하는 음압 레벨 증폭부(3e)로 설정하고 있는 증폭 특성을 나타내고 있다. 도5(E) 에 있어서, 점(P1)은 -80dBFS, 점(P2)은 -25dBFS, 변곡점(Pi)은 -63dBFS에 위치하고 있다. 여기서는, 점(P1)을 모두 -80dBFS로 했지만, 주파수 대역마다 다르게 해도 좋다.

도5(A)∼(E) 에 나타내는 바와 같이, 변곡점(Pi)의 위치는 음압 레벨 증폭부(3a∼3e)에 대하여 공통이 아니고, 각각에서 최적인 위치로 설정하고 있다. 음압 레벨 증폭부(3a)에 있어서의 변곡점(Pi)이 가장 저음압 레벨측에 위치하고, 음압 레벨 증폭부(3b, 3e)에 있어서의 변곡점(Pi)이 다음으로 저음압 레벨측에 위치하고 있다. 또한, 여기서는 음압 레벨 증폭부(3b, 3e)에 있어서의 변곡점(Pi)을 공통으로 하고 있지만, 약간 다르게 해도 좋다. 음압 레벨 증폭부(3c)에 있어서의 변곡점(Pi)은 음압 레벨 증폭부(3a, 3b, 3e)에 있어서의 변곡점(Pi)과 비교하여 고음압 레벨측에 위치하고 있다. 음압 레벨 증폭부(3d)에 있어서의 변곡점(Pi)은 가장 고음압 레벨측에 위치하고 있다.

이와 같이, 주파수 대역을 5분할한 본 실시 형태에 있어서는, 최소 가청 한계의 음압 레벨이 가장 작은 부분이 포함되는 중고역에서는, 변곡점(Pi)을 가장 고음압 레벨측에 위치시키는 것이 바람직하다. 또한, 저역에서는 변곡점(Pi)을 가장 저음압 레벨측에 위치시키는 것이 바람직하다. 중저역에서는 변곡점(Pi)을 저역에 있어서의 변곡점(Pi)보다도 고음압 레벨측에 위치시키는 것이 바람직하다. 중역에서는 변곡점(Pi)을 중저역에 있어서의 변곡점(Pi)보다도 고음압 레벨측에, 중고역에 있어서의 변곡점(Pi)보다도 저음압 레벨측에 위치시키는 것이 바람직하다. 고역에서는 변곡점(Pi)을 중역 및 중고역에 있어서의 변곡점(Pi)보다도 저음압 레벨측에 위치시키고, 저역에 있어서의 변곡점(Pi)보다도 고음압 레벨측에 위치시키는 것이 바람직하다. 저역, 중저역, 중역, 중고역, 고역에 있어서의 변곡점(Pi)의 상대적인 위치 관계는, 가장 저음압 레벨측, 저음압 레벨측, 고음압 레벨측, 가장 고음압 레벨측, 저음압 레벨측으로 하는 것이 바람직하다.

또한, 변곡점(Pi)의 위치에 있어서의 증폭도(Ga)는 음압 레벨 증폭부(3a∼3e)에 대하여 공통이 아니고, 각각에서 최적인 증폭도를 설정하고 있다. 음압 레벨 증폭부(3a)에 있어서의 증폭도(Ga)를 가장 크게 하고, 음압 레벨 증폭부(3d)에 있어서의 증폭도(Ga)를 가장 작게 하고 있다. 음압 레벨 증폭부(3b, 3e)에 있어서 의 증폭도(Ga)를 음압 레벨 증폭부(3a)에 있어서의 증폭도(Ga) 다음으로 크게 하고, 음압 레벨 증폭부(3c)에 있어서의 증폭도(Ga)를 음압 레벨 증폭부(3b, 3e)에 있어서의 증폭도(Ga)보다도 작게, 음압 레벨 증폭부(3d)에 있어서의 증폭도(Ga)보다도 크게 하고 있다. 저역, 중저역, 중역, 중고역, 고역에 있어서의 증폭도(Ga)의 상대적인 대소 관계는, 최대, 대(大), 중(中) 정도, 최소, 대(大)로 하는 것이 바람직하다.

다음으로, 도2 의 스무딩 필터(37) 및 어택 타임·릴리스 타임 설정부(38)에 있어서 행해지는 과도 응답 특성의 처리에 대해서 설명한다. 도6(A) 는, 정현파(正弦波) 형상의 입력 음성 신호의 음압 레벨이 크게 변화한 상태를 나타내고 있다. 여기서는 간략화를 위해 파형(波形)을 포락선(包絡線; envelope)으로 나타내고 있다. 도6(A) 에 나타내는 음성 신호는 일 예로서, 음압 레벨이 시각(t1)까지는 -40dBFS이며, 시각(t1)에서 -10dBFS까지 급상승하여 시각(t3)까지 -10dBFS을 유지하고, 시각(t3)에서 -40dBFS까지 급강하하여 그 이후 -40dBFS을 유지하는 파형이다. 도6(B) 는 도6(A) 의 파형의 정(正)방향만을 나타내고 있다.

도2 에 있어서의 스무딩 필터(37)는, 음성 신호에 대하여, 음압 레벨이 제1 레벨로부터 제1 레벨보다 큰 제2 레벨로 변화하는 경우에, 일단 제2 레벨을 넘는 레벨까지 음압 레벨을 상승시킨 후에 제2 레벨까지 감쇠시키는 제1 과도 응답 특성을 부여한다. 또한, 스무딩 필터(37)는, 음압 레벨이 제3 레벨로부터 제3 레벨보다 작은 제4 레벨로 변화하는 경우에, 일단 제4 레벨을 넘는 작은 레벨로 하강시켜 제4 레벨까지 증폭시키는 제2 과도 응답 특성을 부여한다. 도6(D) 는 도6(B) 의 파형에 대하여 제1 및 제2 과도 응답 특성을 부여한 파형을 나타내고 있다.

도6(D) 에 나타내는 바와 같이, 제1 과도 응답 특성에 있어서, 음압 레벨이 제2 레벨(-10dBFS)을 넘어 최대 레벨까지 상승한 상태를 100％로 하고, 제2 레벨까지 감쇠한 상태를 0％로 했을 때, 100％의 시점인 시각(t1)에서 소정의 비율(예를 들면 50％)로 감쇠한 시점인 시각(t2)까지의 시간을 어택 타임이라고 칭하고 있다. 어느 정도 감쇠한 시점을 어택 타임으로 할 것인지는 임의이며, 80％ 감쇠한 시점, 100％ 감쇠한 시점(즉, 0％가 된 시점) 등의 어느 쪽이라도 좋다. 제2 과도 응답 특성에 있어서, 음압 레벨이 제4 레벨(-40dBFS)을 넘어 최소 레벨까지 하강한 상태를 100％로 하고, 제4 레벨까지 증폭한 상태를 0％로 했을 때, 100％의 시점인 시각(t3)에서 소정의 비율(예를 들면 50％)로 증폭한 시점인 시각(t4)까지의 시간을 릴리스 타임이라고 칭하고 있다. 여기서도 어느 정도 감쇠한 시점을 릴리스 타임으로 할 것인지는 임의이며, 80％ 증폭한 시점, 100％ 증폭한 시점(즉, 0％가 된 시점) 등의 어느 쪽이어도 좋다.

도6(D) 로부터 알 수 있는 바와 같이, 제1 과도 응답 특성은 비교적 짧은 시간에 감쇠하는 특성이며, 제2 과도 응답 특성은 비교적 긴 시간에 증폭하는 특성이다. 어택 타임은 예를 들면 수밀리초(ms)로부터 수십 밀리초 정도로 짧게 하고, 릴리스 타임은 100밀리초 이상으로 길게 한다. 도6(C) 는 증폭도의 변화를 나타내고 있다. 도6(B) 의 입력 음성 신호의 파형에 도6(C) 의 증폭도를 곱하면, 도6(D) 에 나타내는 출력 음성 신호의 파형이 된다. 도6(E) 는 정(正) 방향 및 부(負, 마이너스) 방향의 출력 음성 신호를 나타내고 있다. 도2 에 있어서의 어택 타임·릴 리스 타임 설정부(38)는, 어택 타임과 릴리스 타임을 어느 정도로 할 것인지를 설정하고 있다. 본 실시 형태에 있어서는, 스무딩 필터(37) 및 어택 타임·릴리스 타임 설정부(38)를 형성함으로써, 음압 레벨이 변화한 경우에 제1 및 제2 과도 응답 특성을 부여하도록 하고 있기 때문에, 악곡의 음악성을 해치기 어렵게 한다는 효과를 더욱 높일 수 있어, 자연스러운 재생음을 얻는 것이 가능해진다.

본 실시 형태에 있어서는 또한, 음압 레벨 증폭부(3a∼3e)의 어택 타임·릴리스 타임 설정부(38)에서 설정하는 어택 타임 및 릴리스 타임을, 낮은 주파수의 주파수 대역일수록 길게 하고, 높은 주파수의 주파수 대역일수록 짧게 하고 있다. 표 1에, 음압 레벨 증폭부(3a∼3e) 각각에 있어서의 어택 타임 및 릴리스 타임의 설정예를 나타낸다. 어택 타임 및 릴리스 타임을 낮은 주파수의 주파수 대역일수록 길게 하고, 높은 주파수의 주파수 대역일수록 짧게 함으로써, 모든 주파수 대역에서 공통의 값으로 한 경우보다도 더욱 악곡의 음악성을 해치기 어렵게 할 수 있어, 자연스러운 재생음을 얻는 것이 가능해진다.

	주파수 대역	어택 타임	릴리스 타임
음압 레벨 증폭부(3a)	저역	12ms	200ms
음압 레벨 증폭부(3b)	중저역	10ms	175ms
음압 레벨 증폭부(3c)	중역	8ms	150ms
음압 레벨 증폭부(3d)	중고역	6ms	125ms
음압 레벨 증폭부(3e)	고역	4ms	100ms

(제2 실시 형태)

도7 은 본 발명의 음성 신호 처리 장치의 제2 실시 형태를 나타내는 블록도이다. 제2 실시 형태의 음성 신호 처리 장치(200)에 있어서, 제1 실시 형태의 음성 신호 처리 장치(100)와 동일한 부분에는 동일 부호를 부여하여, 그 설명을 적절히 생략하기로 한다. 제2 실시 형태의 음성 신호 처리 장치(200)는, 음압 레벨 증폭부(3a∼3e)에 의해 음성 신호를 증폭할 때의 증폭도를 제한하는 점, 또한 증폭도의 제한값을 음성 신호의 다이내믹 레인지에 따라 설정하는 것을 특징으로 하고 있다. 증폭도란, 전술한 증폭도 설정부(34)에서 설정하는 변곡점(Pi)의 위치에 있어서의 증폭도(Ga)이다.

도7 에 있어서, 미디어 재생부(201)는 일 예로서 공지의 광디스크 재생부이며, CD나 DVD 등의 광디스크를 재생한다. 미디어 재생부(201)에서 재생된 광디스크의 재생 신호는 신호 처리부(202)에 입력된다. 신호 처리부(202)는 입력된 재생 신호에 기초하여 미디어가 어느 광디스크인지를 판별한다. 또한, 광디스크의 판별은 공지의 방법을 채용할 수 있다. 신호 처리부(202)는, 재생 신호에 포함되는 음성 신호를 추출하여 입력 단자(1)로 공급하고, 광디스크의 종별을 나타내는 판별 신호를 제어부(203)에 공급한다. 제어부(203)는, 입력된 판별 신호에 기초하여 음압 레벨 증폭부(3a∼3e)를 제어한다. 음압 레벨 증폭부(3a∼3e)는, 입력된 음성 신호를, 광디스크의 종별(즉, 입력된 음성 신호가 갖는 다이내믹 레인지)에 따라 최적인 증폭도(Ga)로 증폭하도록 증폭도(Ga)를 전환한다.

미디어가 CD와 DVD인 경우를 예로 하면, CD는 약 98dB의 다이내믹 레인지를 갖고, DVD는 이론상 140dB 이상의 다이내믹 레인지를 갖기는 하지만, 실질적으로는 120dB 정도의 다이내믹 레인지이다. 음압 레벨 증폭부(3a∼3e) 각각에 있어서의 증폭도(Ga)의 최소 증폭도는 다이내믹 레인지의 약 6％로 하는 것이 바람직하고, 최대 증폭도는 다이내믹 레인지의 약 20％로 하는 것이 바람직하다. 이것은 발명자에 의한 실험·연구에 의해 얻어진 것이다. 따라서, 표 2 에 나타내는 바와 같이, 미디어가 CD이면 최소 증폭도를 6dB, 최대 증폭도를 20dB로 하고, 음압 레벨 증폭부(3a∼3e) 각각에 있어서의 증폭도(Ga)를 6dB에서부터 20dB의 범위로 설정한다. 또한, 미디어가 DVD이면 최소 증폭도를 8dB, 최대 증폭도를 24dB로 하고, 음압 레벨 증폭부(3a∼3e) 각각에 있어서의 증폭도(Ga)를 8dB에서부터 24dB의 범위로 설정한다.

	산출 방법	CD	DVD
최소 증폭도	다이내믹 레인지의 약 6％	6dB	8dB
최대 증폭도	다이내믹 레인지의 약 20％	20dB	24dB

미디어 재생부(201)가 재생하는 미디어는 광디스크에 한정되는 것은 아니다. 미디어 재생부(201)는 반도체 메모리에 기억된 MP3(MPEG1 Layer 3)나 WMA(Windows Media Audio)와 같은 압축 음성 신호를 재생하는 것이어도 좋다. 윈도우즈(Windows)는 등록 상표이다. 신호의 다이내믹 레인지는 분해능에 의해 결정된다. 예를 들면 분해능이 8비트이면 다이내믹 레인지는 48dB, 분해능이 12비트이면 다이내믹 레인지는 72dB가 된다. 이 경우, 신호 처리부(202)는 분해능을 나타내는 정보를 제어부(203)에 입력하면 된다.

이어서, 표 3을 이용하여, 음압 레벨 증폭부(3a∼3e)에 있어서의 최소 증폭도와 최대 증폭도를 상기와 같이 제한한 경우의 음압 레벨 증폭부(3a∼3e) 각각의 증폭도(Ga)의 구체적인 설정예에 대하여 설명한다. 표 3은 미디어가 CD인 경우에 대한 예를 나타내고 있다.

	주파수 대역	초기값	산출 방법	표준값
음압 레벨 증폭부(3a)	저역	40dB	최대 증폭도로 제한	20dB
음압 레벨 증폭부(3b)	중저역	20dB	6+(20/40)×(20-6)	12dB
음압 레벨 증폭부(3c)	중역	10dB	6+(10/40)×(20-6)	9dB
음압 레벨 증폭부(3d)	중고역	0dB	최소 증폭도로 제한	6dB
음압 레벨 증폭부(3e)	고역	20dB	6+(10/40)×(20-6)	12dB

표 3에 있어서의 초기값은 도4 의 최소 가청 한계에 기초한 값이다. 도4 에 있어서, 검은 동그라미는 각각의 주파수 대역에 있어서의 대표적인 위치를 나타내고 있다. 중고역에 있어서는 최소 가청 한계의 음압 레벨이 가장 낮은 부분을 대표 위치로 하고, 다른 대역에 있어서는 거의 중앙의 주파수 위치를 대표 위치로 하고 있다. 도4 로부터 알 수 있는 바와 같이, 중고역의 대표 위치와 중역의 대표 위치와의 사이에는, 최소 가청 한계의 음압 레벨에 약 10dB의 차이가 있다. 중고역의 대표 위치와 중저역 및 고역의 대표 위치와의 사이에는, 최소 가청 한계의 음압 레벨에 약 20dB의 차이가 있다. 중고역의 대표 위치와 저역의 대표 위치와의 사이에는, 최소 가청 한계의 음압 레벨에 약 40dB의 차이가 있다. 중고역을 기준으로 하고, 중고역과 다른 대역과의 최소 가청 한계의 음압 레벨의 차이를 초기값으로 한다.

표 3에 나타내는 표준값은, 음압 레벨 증폭부(3a∼3e)에 있어서의 최소 증폭도와 최대 증폭도를 상기와 같이 제한하고, 그리고, 주파수 대역마다의 최소 가청 한계의 음압 레벨의 차이를 고려하여 산출한 증폭도(Ga)를 나타내고 있다. 표 3 에 나타내는 바와 같이, 음성 신호의 저역 부분을 제어하는 음압 레벨 증폭부(3a)에 있어서는 초기값이 40dB이지만, 최대 증폭도인 20dB을 넘고 있기 때문에 표준값으로서의 증폭도(Ga)를 최대 증폭도인 20dB로 한다. 음성 신호의 중저역 부분을 제어하는 음압 레벨 증폭부(3b)에 있어서는 초기값이 20dB이지만, 다음의 (1)식에 기초하여 표준값으로서의 증폭도(Ga)를 12dB로 한다. (1)식에 있어서, Ga min은 최소 증폭도, Ga max는 최대 증폭도, G in은 그 대역에 있어서의 초기값, G inmax는 모든 초기값에 있어서의 최대값이다.

Ga min + (G in/G inmax) × (Ga max - Ga min) … (1)

음성 신호의 중역 부분을 제어하는 음압 레벨 증폭부(3c)에 있어서는 초기값이 10dB이지만, (1)식에 기초하여 표준값으로서의 증폭도(Ga)를 9dB로 한다. 음성 신호의 중고역 부분을 제어하는 음압 레벨 증폭부(3d)에 있어서는 초기값이 0dB이지만, 최소 증폭도 미만이기 때문에 표준값으로서의 증폭도(Ga)를 최소 증폭도인 6dB로 한다. 음성 신호의 고역 부분을 제어하는 음압 레벨 증폭부(3e)에 있어서는 초기값이 20dB이지만, (1)식에 기초하여 표준값으로서의 증폭도(Ga)를 12dB로 한다.

이상 설명한 제2 실시 형태에 있어서는, 음성 신호의 다이내믹 레인지를 미디어의 종별이나 분해능에 기초하여 얻도록 했지만, 음성 신호로부터 직접 다이내믹 레인지를 검출하도록 해도 좋다. 도8 은 음성 신호의 파형의 일 예를 나타내고 있다. 도8 에 파선으로 나타내는 바와 같이, 어떤 시점에서 유지한 신호 레벨을 비교적 긴 시정수(時定數)로 0을 향하도록 수렴시킨다. 수렴시켜 가는 단계에서 보다 큰 신호 레벨이 발생한 경우에는 그 신호 레벨을 유지하여 동일하게 수렴시키는 것을 반복한다. 이 처리를 소정의 시간 행함으로써, 최대 신호 레벨과 최소 신호 레벨을 얻을 수 있고, 양자의 차이를 산출함으로써 다이내믹 레인지를 구할 수 있다. 이러한 처리를 행하는 검출 회로를 형성함으로써 음성 신호로부터 직접 다이내믹 레인지를 검출할 수 있다.

또한, 도7 에 있어서, 청취자가 조작부(204)를 조작함으로써, 복수의 다이내믹 레인지에 대응한 복수의 모드를 선택하도록 해도 좋다. 조작부(204)는, 오디오 기기 본체에 형성되어 있어도 좋고, 리모컨 송신기여도 좋다.

도9 는, 제2 실시 형태에 있어서의 음압 레벨 증폭부(3a∼3e)의 구성예를 나타내고 있다. 여기서는 간략화를 위해, 음압 레벨 증폭부(3a∼3e)에 있어서의 배율 발생부(33) 및 증폭 특성 설정부(34) 이외의 도시를 생략하고 있다. 미디어 재생부(201)가 재생하는 광디스크가 CD와 DVD인 경우를 예로 하면, 증폭도 설정부(342)는 CD용의 증폭도(Ga)로서 Ga1, DVD용의 증폭도(Ga)로서 Ga2를 유지하고 있다. 증폭도 설정부(342)에는 제어부(203)로부터의 제어 신호가 입력되고, 증폭도 설정부(342)는 증폭도(Ga)로서 Ga1과 Ga2 중 어느 하나를 출력한다. 음압 레벨 증폭부(3a∼3e)에 설정하는 증폭도(Ga)의 조(組)는 다이내믹 레인지의 종류에 따른 종류만 형성하면 좋다. 또는, 기준이 되는 증폭도(Ga)의 조를 유지해 두고, 다이내믹 레인지의 차이에 따라 다른 증폭도(Ga)의 조를 계산에 의해 구해도 좋다.

(제3 실시 형태)

도10 은 본 발명의 음성 신호 처리 장치의 제3 실시 형태를 나타내는 블록도이다. 제3 실시 형태의 음성 신호 처리 장치(300)에 있어서, 제1 실시 형태의 음성 신호 처리 장치(100)와 동일한 부분에는 동일 부호를 부여하여, 그 설명을 적절히 생략하기로 한다. 제3 실시 형태의 음성 신호 처리 장치(300)는, 제2 실시 형태와 동일하게 음압 레벨 증폭부(3a∼3e)에 따라 음성 신호를 증폭할 때의 증폭도를 제한하고, 또한 증폭도(Ga)를 콘텐츠의 장르에 따라 설정하는 것을 특징으로 하고 있다.

도10 에 나타내는 제3 실시 형태의 음성 신호 처리 장치(300)에 있어서는, 디지털 방송 신호를 수신하는 수신부(301)를 형성한 예를 나타내고 있다. 수신부(301)에서 수신한 디지털 방송 신호의 방송파 신호는 신호 처리부(302)에 입력된다. 신호 처리부(302)는 영상 신호 및 음성 신호를 포함하는 콘텐츠 데이터와, 콘텐츠 데이터에 부가된 부가 데이터를 분리한다. 부가 데이터는 콘텐츠의 장르 데이터를 포함한다. 신호 처리부(302)는, 콘텐츠 데이터 중, 음성 신호를 입력 단자(1)로 공급하고, 장르 데이터를 제어부(303)에 공급한다. 제어부(303)는, 입력된 장르 데이터에 기초하여 음압 레벨 증폭부(3a∼3e)를 제어한다. 음압 레벨 증폭부(3a∼3e)는, 입력된 음성 신호를, 장르 데이터에 따라 최적인 증폭도(Ga)로 증폭하도록 증폭도(Ga)를 전환한다. 또한, 도10 에서는 영상 신호의 처리에 대해서는 도시를 생략하고 있다.

표 4를 이용하여, 콘텐츠의 복수의 장르에 있어서의 음압 레벨 증폭부(3a∼3e) 각각의 증폭도(Ga)의 구체적인 설정예에 대해서 설명한다. 표 4는, 증폭도(Ga)의 표준값을 표 3의 표준값으로 한 경우의 예를 나타내고 있다. 표 4에 나타내는 바와 같이, 각각의 콘텐츠의 장르에서, 표준값의 증폭도(Ga)에 대하여 증감시킨 값으로 함으로써, 각각의 장르에서 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있다.

	주파수 대역	표준값	뉴스	스포츠	영화	다큐멘터리
음압 레벨 증폭부(3a)	저역	20dB	6dB	6dB	6dB	18dB
음압 레벨 증폭부(3b)	중저역	12dB	18dB	6dB	12dB	15dB
음압 레벨 증폭부(3c)	중역	9dB	15dB	6dB	12dB	12dB
음압 레벨 증폭부(3d)	중고역	6dB	12dB	6dB	12dB	9dB
음압 레벨 증폭부(3e)	고역	12dB	6dB	6dB	6dB	15dB

이상에서 설명한 제3 실시 형태에 있어서는, 디지털 방송 신호를 수신하는 수신부(301)를 형성한 예를 나타냈지만, 수신부(301) 대신에 제2 실시 형태와 동일한 미디어 재생부를 형성한 구성이어도 좋다. 또한, 도10 에 있어서, 조작부(304)에 장르를 선택하기 위한 조작 버튼을 형성하고, 청취자가 조작 버튼에 의해 장르를 직접 선택하여, 장르에 대응한 복수의 모드를 선택하도록 해도 좋다. 나아가서는, 제2 실시 형태에 의한 복수의 다이내믹 레인지에 대응한 복수의 모드의 선택과, 장르에 대응한 복수의 모드의 선택을 조합해도 좋다. 즉, 표 4 와 같은 복수의 장르에 대응한 복수의 모드를, 다이내믹 레인지가 다른 복수의 음성 신호마다 준비하는 것이 바람직하다.

(제4 실시 형태)

도11 은 본 발명의 음성 신호 처리 장치의 제4 실시 형태를 나타내는 블록도이다. 제4 실시 형태의 음성 신호 처리 장치(400)에 있어서, 제1 실시 형태의 음성 신호 처리 장치(100)와 동일한 부분에는 동일 부호를 부여하여, 그 설명을 적절히 생략하기로 한다. 제4 실시 형태의 음성 신호 처리 장치(400)는, 제2 실시 형태와 동일하게 음압 레벨 증폭부(3a∼3e)에 따라 음성 신호를 증폭할 때의 증폭도를 제한하고, 또한 증폭도(Ga)를 청취자가 지정하는 청취 모드에 따라 설정하는 것을 특징으로 하고 있다.

도11 에 있어서, 조작부(404)에는, 청취 모드의 예로서, 표준, 릴랙스, BGM, 청력 보정을 선택하기 위한 조작 버튼(4041)이 형성되어 있다. 제어부(403)는, 조작 버튼(4041)으로 선택한 청취 모드에 대응한 증폭도(Ga)로 하도록 음압 레벨 증폭부(3a∼3e)를 제어한다.

표 5를 이용하여, 청취 모드마다의 음압 레벨 증폭부(3a∼3e) 각각의 증폭도(Ga)의 구체적인 설정예에 대하여 설명한다. 표 5는, 증폭도(Ga)의 표준값을 표 3의 표준값으로 한 경우의 예를 나타내고 있다. 표 5에 나타내는 바와 같이, “릴랙스” 및 “BGM”의 청취 모드에서는 표준값의 증폭도(Ga)를 부분적으로 감소시킨 값으로 하고 있다. “릴랙스”는 릴랙스한 기분으로 편안하게 음악을 즐기기 위한 모드이며, “BGM”은 소음량으로 음악을 BGM으로서 청취하기 위한 모드이다. “청력 보정”의 청취 모드는, 개인의 청력 특성에 기초하여 증폭도(Ga)를 보정하기 위한 모드이다. 개인의 청력 특성의 측정 방법에 대해서는 후술한다. 9dB +αa, 9dB +αb, 9dB +αc, 9dB +αd, 9dB +αe에 있어서의 αa, αb, αc, αd, αe를 개인의 청력 특성에 따라 설정함으로써, 알아듣기 힘든 주파수 대역에 있어서의 알아듣기 힘듦을 개선할 수 있다. 알아듣기 힘든 주파수 대역은 사람에 따라 다르기 때문에, 청취자 각각에 맞춰 청감적으로 알아듣기 쉬운 재생음을 얻을 수 있다.

	주파수 대역	표준값	릴랙스	BGM	청력 보정
음압 레벨 증폭부(3a)	저역	20dB	15dB	12dB	9dB +αa
음압 레벨 증폭부(3b)	중저역	12dB	12dB	9dB	9dB +αb
음압 레벨 증폭부(3c)	중역	9dB	9dB	9dB	9dB +αc
음압 레벨 증폭부(3d)	중고역	6dB	6dB	6dB	9dB +αd
음압 레벨 증폭부(3e)	고역	12dB	9dB	12dB	9dB +αe

이상에서 설명한 제1∼제4 실시 형태에 있어서는, 도4 에서 설명한 바와 같이, 증폭도(Ga)를 설정하는 기준으로서 인간의 표준적인 청력 특성의 최소 가청 한계를 이용하고 있다. 음성 신호의 청취자의 청력 특성에 기초한 최소 가청 한계를 이용하면, 각각의 청취자에게 있어서 최적이면서 청감적으로 알아듣기 쉬운 재생음을 얻는 것이 가능해진다. 도12 는, 청취자의 청력 특성을 측정하는 경우의 일 예를 나타내고 있다. 도12 에 있어서, 미디어 재생부(51)는 소정의 미디어를 재생한다. 신호 처리부(52)는 미디어 재생부(51)로부터의 음성 신호를 처리하여 스위치(54)의 단자(a)에 공급한다. 제어부(60)의 제어에 의해 스위치(54)가 단자(a)에 접속되어 있는 경우, 신호 처리부(52)로부터 출력된 음성 신호는 앰프(55)에 의해 증폭되어 스피커(56) 또는 헤드폰(57)으로 공급된다. 이에 따라, 미디어 재생부(51)로부터의 음성 신호는 발음된다. 이상은 통상의 오디오 기기에 있어서의 악곡의 재생이다.

기준 신호 발생부(53)는 청취자의 청력 특성을 측정하기 위한 기준 신호를 발생한다. 예를 들면 기준 신호를 CD 등의 광디스크에 기록하고, 미디어 재생부(51)에 의해 광디스크에 기록된 기준 신호를 재생해도 좋다. 기준 신호 발생부(53)로부터의 기준 신호는 스위치(54)의 단자(b)에 공급된다. 제어부(60)의 제어에 의해 스위치(54)가 단자(b)에 접속되어 있는 경우, 기준 신호는 스피커(56) 또는 헤드폰(57)에 의해 발음된다. 청력 특성을 측정하는 청취자는 스피커(56) 또는 헤드폰(57)에 의해 발음된 기준 신호를 청취한다. 기준 신호는 20Hz∼20kHz의 범위의 선택적인 복수 주파수의 음성 신호를 포함한다. 청취자는 조작부(59)에 의해 선택한 주파수 대역의 음성 신호를 들으면서, 조작부(59)로 음압 레벨(볼륨)을 조정하고, 가청할 수 있는 가장 작은 음압 레벨을 결정한다.

청취자가 조작부(59)에 의해 주파수 대역을 선택하면, 제어부(60)는 기준 신호 발생부(53)에 선택된 주파수 대역의 음성 신호를 발생시킨다. 청취자는 복수의 주파수 대역 각각에서 가청할 수 있는 가장 작은 음압 레벨을 결정한다. 표시부(61)에는, 제어부(60)의 제어에 의해 일련의 청력 특성을 측정할 때의 안내가 되는 화상이 표시된다. 제어부(60)는, 청취자가 입력한 복수의 주파수 대역에 있어서의 가청할 수 있는 가장 작은 음압 레벨을 청취자 개인이 갖는 최소 가청 한계로서, 이 최소 가청 한계의 데이터를 기억부(62)에 기억시킨다.

신호 처리부(52)는, 제1∼제4 실시 형태의 음성 신호 처리 장치(100∼400) 중 어느 하나를 구비하고 있다. 제어부(60)는, 기억부(62)로부터 청취자의 최소 가청 한계의 데이터를 판독하여, 신호 처리부(52)(음성 신호 처리 장치(100∼400)를 제어한다.

본 발명은 이상에서 설명한 각 실시 형태에 한정되는 것은 아니고, 본 발명의 요지를 일탈하지 않는 범위에 있어서 여러 가지 변경이 가능하다.

도1 은 본 발명의 제1 실시 형태를 나타내는 블록도이다.

도2 는 음압 레벨 증폭부(3a∼3e)의 구체적 구성예를 나타내는 블록도이다.

도3 은 음압 레벨 증폭부(3a∼3e)에 있어서의 증폭 특성을 설명하기 위한 도면이다.

도4 는 인간의 표준적인 청력 특성을 나타내는 도면이다.

도5 는 음압 레벨 증폭부(3a∼3e)에 있어서의 증폭 특성의 구체예를 나타내는 도면이다.

도6 은 음압 레벨 증폭부(3a∼3e)에 있어서의 과도 응답 특성의 처리를 설명하기 위한 도면이다.

도7 은 본 발명의 제2 실시 형태를 나타내는 블록도이다.

도8 은 다이내믹 레인지 검출 회로의 동작예를 설명하기 위한 도면이다.

도9 는 제2 실시 형태에 있어서의 음압 레벨 증폭부(3a∼3e)의 구성예를 나타내는 부분 블록도이다.

도10 은 본 발명의 제3 실시 형태를 나타내는 블록도이다.

도11 은 본 발명의 제4 실시 형태를 나타내는 블록도이다.

도12 는 청취자의 청력 특성에 기초한 최소 가청 한계를 측정하기 위한 구성예를 나타내는 블록도이다.

(도면의 주요 부분에 대한 부호의 설명)

2a∼2e : 대역 분할 필터

3a∼3e : 음압 레벨 증폭부

4a∼4e : 앰프

5 : 가산부

100, 200, 300, 400 : 음성 신호 처리 장치

Claims

제1 음성 신호를 복수의 주파수 대역으로 분할하여, 상기 복수의 주파수 대역마다의 제2 음성 신호를 출력하는 대역 분할 필터와,

상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를, 상기 제2 음성 신호의 최소 음압 레벨에서부터 최대 음압 레벨까지의 범위에 있어서 상기 최소 음압 레벨에서부터 소정의 범위의 저음압 레벨 영역과 상기 최대 음압 레벨에서부터 소정의 범위의 고음압 레벨 영역을 제외한 중간 음압 레벨 영역에서, 음압 레벨을 상기 저음압 레벨 영역측으로부터 상기 중간 음압 레벨 영역 내의 중간점까지 순차적으로 크게 하고, 상기 중간점으로부터 상기 고음압 레벨 영역측까지 순차적으로 작게 하는 증폭 특성으로 증폭하는 음압 레벨 증폭부와,

상기 음압 레벨 증폭부에 의해 증폭된 상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를 가산하여 제3 음성 신호로서 출력하는 가산부

를 구비하는 것을 특징으로 하는 음성 신호 처리 장치.
제1항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치를 적어도 일부에서 다르게 하고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제2항에 있어서,

상기 음압 레벨 증폭부는, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치를, 다른 주파수 대역에 있어서의 중간점의 위치에 비해, 상기 고음압 레벨 영역측에 가장 가깝게 위치시키고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제2항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역 중의 가장 저역(低域)의 주파수 대역에 있어서의 상기 중간점의 위치를, 다른 주파수 대역에 있어서의 중간점의 위치에 비해, 상기 저음압 레벨 영역측에 가장 가깝게 위치시키고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제1항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 적어도 일부에서 다르게 하고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제5항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 작게 하고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제5항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 크게 하고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제5항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 상기 제1 음성 신호가 갖는 다이내믹 레인지(dynamic range)에 기초하여 산출한 최소 증폭도에서 최대 증폭도까지의 범위로 설정하고 있는 것을 특징으로 하는 음성 신호 처리 장치.
제8항에 있어서,

상기 제1 음성 신호는 다이내믹 레인지가 다른 복수의 음성 신호 중 어느 하나의 음성 신호이며,

상기 음압 레벨 증폭부는, 복수의 다이내믹 레인지 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조(組)를 설정하고 있으며,

상기 제1 음성 신호가 갖는 다이내믹 레인지에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 더 구비하는 것을 특징으로 하는 음성 신호 처리 장 치.
제5항에 있어서,

상기 제1 음성 신호는 복수 종류의 장르의 콘텐츠의 음성 신호 중의 어느 하나의 음성 신호이며,

상기 음압 레벨 증폭부는, 상기 복수 종류의 장르 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고 있으며,

상기 제1 음성 신호의 장르에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 구비하는 것을 특징으로 하는 음성 신호 처리 장치.
제5항에 있어서,

상기 음압 레벨 증폭부는, 상기 제3 음성 신호를 청취할 때의 복수의 청취 모드에 대응하여, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고 있으며,

상기 복수의 청취 모드를 선택하기 위한 조작부와,

상기 조작부에 의해 선택한 청취 모드에 따라 상기 증폭도의 조를 전환하도록 제어하는 제어부를 더 구비하는 것을 특징으로 하는 음성 신호 처리 장치.
제1항 내지 제11항 중 어느 한 항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 상기 제2 음성 신호의 음압 레벨이 제1 음압 레벨에서 제2 음압 레벨로 상승한 시점에서 제1 시간의 어택 타임을 갖는 과도 응답 특성을 부여함과 함께, 상기 제2 음성 신호의 음압 레벨이 제3 음압 레벨에서 제4 음압 레벨로 저하한 시점에서 상기 제1 시간보다도 긴 제2 시간의 릴리스 타임을 갖는 과도 응답 특성을 부여하는 것을 특징으로 하는 음성 신호 처리 장치.
제12항에 있어서,

상기 음압 레벨 증폭부는, 상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 높은 주파수 대역일수록 상기 제1 및 제2 시간이 짧은 과도 응답 특성을 부여하는 것을 특징으로 하는 음성 신호 처리 장치.
제3항 또는 제6항에 있어서,

상기 최소 가청 한계는, 인간의 표준적인 청력 특성에 기초하는 최소 가청 한계인 것을 특징으로 하는 음성 신호 처리 장치.
제3항 또는 제6항에 있어서,

상기 최소 가청 한계는, 미리 측정한 상기 제3 음성 신호를 청취하는 청취자의 청력 특성에 기초하는 최소 가청 한계인 것을 특징으로 하는 음성 신호 처리 장치.
제1 음성 신호를 복수의 주파수 대역으로 분할하여, 상기 복수의 주파수 대역마다의 제2 음성 신호를 출력하고,

상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를, 상기 제2 음성 신호의 최소 음압 레벨에서부터 최대 음압 레벨까지의 범위에 있어서 상기 최소 음압 레벨에서부터 소정의 범위의 저음압 레벨 영역과 상기 최대 음압 레벨에서부터 소정의 범위의 고음압 레벨 영역을 제외한 중간 음압 레벨 영역에서, 음압 레벨을 상기 저음압 레벨 영역측으로부터 상기 중간 음압 레벨 영역 내의 중간점까지 순차적으로 크게 하고, 상기 중간점으로부터 상기 고음압 레벨 영역측까지 순차적으로 작게 하는 증폭 특성으로 증폭하고,

증폭된 상기 복수의 주파수 대역 각각의 상기 제2 음성 신호를 가산하여 제3 음성 신호로서 출력하는 것을 특징으로 하는 음성 신호 처리 방법.
제16항에 있어서,

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치를 적어도 일부에서 다르게 하는 것을 특징으로 하는 음성 신호 처리 방법.
제17항에 있어서,

최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치를, 다른 주파수 대역에 있어서의 중간점의 위치에 비해, 상기 고음압 레벨 영역측에 가장 가깝게 위치시키는 것을 특징으로 하는 음성 신호 처리 방법.
제17항에 있어서,

상기 복수의 주파수 대역 중의 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치를, 다른 주파수 대역에 있어서의 중간점의 위치에 비해, 상기 저음압 레벨 영역측에 가장 가깝게 위치시키는 것을 특징으로 하는 음성 신호 처리 방법.
제16항에 있어서,

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 적어도 일부에서 다르게 하는 것을 특징으로 하는 음성 신호 처리 방법.
제20항에 있어서,

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 최소 가청 한계의 음압 레벨이 가장 작은 부분을 포함하는 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 작게 하는 것을 특징으로 하는 음성 신호 처리 방법.
제20항에 있어서,

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도 중, 가장 저역의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를 가장 크게 하는 것을 특징으로 하는 음성 신호 처리 방법.
제20항에 있어서,

상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도를, 상기 제1 음성 신호가 갖는 다이내믹 레인지에 기초하여 산출한 최소 증폭도에서 최대 증폭도까지의 범위로 설정하는 것을 특징으로 하는 음성 신호 처리 방법.
제23항에 있어서,

상기 제1 음성 신호는 다이내믹 레인지가 다른 복수의 음성 신호 중의 어느 하나의 음성 신호이며,

복수의 다이내믹 레인지 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고,

상기 제1 음성 신호가 갖는 다이내믹 레인지에 따라 상기 증폭도의 조를 전환하는 것을 특징으로 하는 음성 신호 처리 방법.
제20항에 있어서,

상기 제1 음성 신호는 복수 종류의 장르의 콘텐츠의 음성 신호 중의 어느 하나의 음성 신호이며,

상기 복수 종류의 장르 각각에서 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고,

상기 제1 음성 신호의 장르에 따라 상기 증폭도의 조를 전환하는 것을 특징 으로 하는 음성 신호 처리 방법.
제20항에 있어서,

상기 제3 음성 신호를 청취할 때의 복수의 청취 모드에 대응하여, 상기 복수의 주파수 대역에 있어서의 상기 중간점의 위치에서의 증폭도의 조를 설정하고,

상기 복수의 청취 모드 중 어느 하나를 선택하고,

선택한 청취 모드에 따라 상기 증폭도의 조를 전환하는 것을 특징으로 하는 음성 신호 처리 방법.
제16항 내지 제26항 중 어느 한 항에 있어서,

상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 상기 제2 음성 신호의 음압 레벨이 제1 음압 레벨에서 제2 음압 레벨로 상승한 시점에서 제1 시간의 어택 타임을 갖는 과도 응답 특성을 부여함과 함께, 상기 제2 음성 신호의 음압 레벨이 제3 음압 레벨에서 제4 음압 레벨로 저하한 시점에서 상기 제1 시간보다도 긴 제2 시간의 릴리스 타임을 갖는 과도 응답 특성을 부여하는 것을 특징으로 하는 음성 신호 처리 방법.
제27항에 있어서,

상기 복수의 주파수 대역의 상기 제2 음성 신호에 대하여, 높은 주파수 대역일수록 상기 제1 및 제2 시간이 짧은 과도 응답 특성을 부여하는 것을 특징으로 하 는 음성 신호 처리 방법.
제18항 또는 제21항에 있어서,

상기 최소 가청 한계는, 인간의 표준적인 청력 특성에 기초하는 최소 가청 한계인 것을 특징으로 하는 음성 신호 처리 방법.
제18항 또는 제21항에 있어서,

상기 최소 가청 한계는, 미리 측정한 상기 제3 음성 신호를 청취하는 청취자의 청력 특성에 기초하는 최소 가청 한계인 것을 특징으로 하는 음성 신호 처리 방법.