KR100275057B1 - 오디오 신호 처리 방법 - Google Patents

오디오 신호 처리 방법 Download PDF

Info

Publication number
KR100275057B1
KR100275057B1 KR1019920016982A KR920016982A KR100275057B1 KR 100275057 B1 KR100275057 B1 KR 100275057B1 KR 1019920016982 A KR1019920016982 A KR 1019920016982A KR 920016982 A KR920016982 A KR 920016982A KR 100275057 B1 KR100275057 B1 KR 100275057B1
Authority
KR
South Korea
Prior art keywords
band
block
signal
recorded
audio signal
Prior art date
Application number
KR1019920016982A
Other languages
English (en)
Other versions
KR930007107A (ko
Inventor
교와 즈쯔이
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR930007107A publication Critical patent/KR930007107A/ko
Application granted granted Critical
Publication of KR100275057B1 publication Critical patent/KR100275057B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본 발명은 오디오 신호를 소위 블럭 플로우팅 처리해서 압축하는 오디오 신호 처리 방법에 관한 것이다.
본 발명의 오디오 신호 처리 방법에서 블럭 플로우팅 처리에 관련하는 각 블럭마다의 파라미터를 시간 프레임마다 파라미터를 필요로 하는 대역까지 기록 또는 전송함과 더불어 이 기록 또는 전송되는 파라미터를 필요로 하는 대역까지 기록 또는 전송함과 더불어 이 기록 또는 전송되는 파라미터의 갯수도 기록 또는 전송토록 한 것에 의해서 비트 할당의 조정이 비교적 용이하고 비트 할당의 조정을 행해도 음질을 열하시키는 일이 없다. 즉, 실제로 지각되기 어렵다는 이유로 예컨대 고역의 신호가 기록되지 않은 경우에 그 고역의 파라미터 분리 비트도 저역의 오디오 신호의 양자화 때문에 배당할 수 있고 음질을 향상시킬 수 있다. 또, 고역으로 레벨이 높은 신호가 포함되는 경우도 대역을 좁히는 일 없고 기록할 수 있게 된다.

Description

오디오 신호 처리 방법
제1도는 본 발명 실시예 방법에서의 데이타 기록 또는 전송예(고역의 신호가 기록 또는 전송되지 않는 경우)의 설명도.
제2도는 본 발명의 실시예 방법에서의 데이타 기록 또는 전송예(고역의 신호로 기록 또는 전송되는 경우)의 설명도.
제3도는 엔코더의 개략 구성을 도시하는 블록 회로도.
제4도는 제3도의 구성의 시간/주파수 변환 회로의 구체적 구성을 도시하는 블럭 회로도.
제5도는 디코더측의 구성의 개략 구성을 도시하는 블럭 회로도.
제6도는 제5도의 구성의 주파수/시간 변환 회로의 구체적 구성을 도시하는 블럭 회로도.
제7도는 엔코더에서의 처리의 플로우챠트.
제8도는 디코우더에서의 처리의 플로우챠트.
제9도는 종래 시스템에서의 기록 또는 전송 데이타예(파라미터의 갯수가 일정인 시스템의 경우)의 설명도.
제10도는 종래 시스템에서의 기록 또는 전송 데이타예(스케일 팩터의 갯수가 가변인 시스템의 경우)의 설명도.
* 도면의 주요부분에 대한 부호의 설명
WL : 워드 길이 SF : 스케일 팩터
11 : 시간/주파수 변환 회로 13 : 스케일 팩터 계산 회로
14 : 비트 할당 계산 회로 15 : 스펙틀 신호 양자화 회로
17 : 마스킹 계산 회로 18 : 파라미터 갯수 계산 회로
19 : 데이타 기록 회로
본 발명은 오디오 신호를 소위 블럭 플로우팅 처리해서 압축하는 오디오 신호 처리 방법에 관한 것이다.
종래부터 오디오 신호 처리 방법으로서 오디오 신호를 압축하고 부호화하는 고능율 부호화 기술에는 예컨대 입력 오디오 신호(디지탈 오디오 데이타)를 소정 시간마다(소정 시간 프레임마다)에 주파수축상에서 복수의 블럭으로 분할하고 이 각 블럭마다 소위 블럭 플로우팅 처리를 실시함과 더불어 각 블럭 마다의 데이타를 적응적인 비트 할당으로 양자화하는 것이 있다.
여기에서, 상기 블럭 플로우팅 처리는 기본적으로는 블럭내의 각 워드에 공통인 값을 곱해서 크게 하고 양자화시의 정밀도를 높히는 것인데, 구체적으로는 예컨대 블럭내의 각 워드의 절대값중에서 가장 큰 것(최대 절대값)을 찾아내고 이 최대 절대값이 포화되지 않는 해당 블럭내의 전 워드에 대해서 공통의 플로우팅 계수를 써서 플로우팅 처리를 행하느는 것이 일 예로서 있다. 보다 간이한 것으로는 비트 이동을 이용하는 6dB 단위의 플로우팅도 있다.
그런데, 상기 블럭 플로우팅 처리를 행하는 오디오 신호 처리 방법이 적용되는 시스템의 엔코우더측에선 통상 블럭 플로우팅 처리에 관련하는 파라미터(BF)로서, 예컨대, 플로우팅 계수로서의 스케일 팩터(SF)의 값과, 상기 스케일 팩터(SF)와 소위 마스킹 효과를 고려해서 각 블럭마다 구해지는 허용 가능한 잡음 레벨과의 차이를 나타내는 워드 길이(WL)의 데이타를 양자화된 블럭의 데이타(이하 예컨대 메인 정보라 한다)와 더불어 매체에 기록 또는 전송하는 것이 행해진다.
또한, 상기 마스킹 효과는 인간의 청각 특성에 의해서 어떤 음에 의해 다른 음이 마스크되어 들리지 않게 되는 현상을 말한다. 환언하면 상기 마스킹은 어떤 신호에 의해서 다른 신호가 마스크되어 들리지 않게 되는 현상을 말하는 것이며 이 마스킹 효과에는 시간축상의 신호에 의한 동시각 마스킹 효과가 있다. 이것들의 마스킹 효과에 의해 마스킹되는 부분에 잡음이 있었다고 해도 이 잡음은 들리지 않게 된다. 이 때문에 실제의 오디오 신호에선 이 마스킹되는 범위내의 잡음은 허용 가능한 잡음이 된다.
여기에서 종래의 오디오 신호 처리 방법이 적용되는 시스템의 엔코더측에선 상기 기록 또는 전송되는 파라미터(BF)의 갯수는 모든 시간 프레임에 대해서 고정해두는 것이 일반적이다. 제9도는 종래의 오디오 신호 처리 시스템의 엔코더측에서의 각 시간 프레임내의 데이타의 기록(혹은 전송)의 모양을 도시한 것이다. 이 제9도의 예의 경우, 실제로는 비트가 할당되지 않는 블럭에 대해서도 그 파라미터(BF)의 값을 기록 또는 전송할 필요가 있고 따라서 그 몫만큼 음성 데이타에 대해서 할당되는 비트 수가 적어지며, 특히, 압축율이 높은 경우(비트 레이트가 낮은 경우)에는 상기 엔코더측에 대응하는 디코더측에서 충분한 음질을 확보하기 곤란했었다.
이것에 대해서 제10도에 도시하듯이 실제로 비트가 할당되지 않는 블럭(워드 길이 WL=0의 블럭)에 대해선 상기 스케일 팩터(SF)의 값을 기록 또는 전송치 않고 그 몫만큼 음성 데이타에 많은 비트를 할당하도록 하는 시스템도 제안되어 있다.
이 제10도에선 비트가 할당되어 있지 않는 블럭 (0 비트 할당의 블럭) 4개 몫만큼 기록되어 있는 스케일 팩터(SF)의 갯수가 줄어들고 있다.
단, 이 경우, 상기 워드 길이(WL)의 데이타는 늘 기록 또는 전송할 필요가 있다. 또, 후의 디코더측에서 상기 스케일 팩터(SF)를 읽어 넣을 때 그 블럭의 워드 길이(WL)가 0 인지 아닌지 블럭마다 점검할 필요가 있다.
또한, 엔코더측은 통상, 상기 마스킹을 구하기 위한 계산 등으로 각 블럭의 오디오 신호를 양자화하기 위해서 필요한 비트수를 계산한 후, 그 시간 프레임에 할당된 총 비트수와의 비교를 행하고 각 블럭으로의 비트 할당이 조정을 행하게 이뤄진다.
그런데, 이때, 상술같이 각 블럭의 비트 할당에 의해서 그 블럭의 스케일 팩터(SF)를 기록하는지 어떤지가 변화되면 그것에 따라 상기 메인 정보(음성 데이타)에 할당할 수 있는 비트의 총수도 변화되고 비트 할당의 조정이 매우 복잡해진다.
그래서, 본 발명은 상술같은 실정을 감안하여 제안된 것으로 비트 할당의 조정이 비교적 용이하고 비트 할당의 조정을 행해도 음질을 열화시키는 일이 없는 오디오 신호 처리 방법을 제공하는 것을 목적으로 하는 것이다.
본 발명의 오디오 신호 처리 방법은 상술의 목적을 달성하기 위해서 제안된 것이며 입력 오디오 신호를 소정의 시간 프레임마다 주파수축상에서 복수의 블럭으로 분할하고 각 블럭마다 블럭 플로우팅 처리를 실시하며, 각 블록마다의 데이터를 적응적인 비트 할당으로 양자화하며, 해당 양자화된 오디오 신호를 기록 또는 전송함과 더불어 상기 블럭 플로우팅 처리에 관련하는 파라미터를 기록 또는 전송하는 오디오 신호 처리 방법이며 상기 블럭 플로우팅 처리에 관련하는 각 블럭마다의 파라미터를 상기 시간 플레임마다 해당 파라미터가 필요한 대역까지 기록 또는 전송함과 더불어 해당 기록 또는 전송되는 파라미터의 갯수도 기록 또는 전송토록 한 것이다.
즉, 시간 프레임마다 실제로 기록 또는 전송되는 오디오 신호의 대역으로서 예컨대 실제로 지각되기 어렵다(귀에 들리기 어렵다)는 이유로 고역의 기록 또는 전송을 행하지 않게 한 경우에는 그 시간 프레임의 해당 고역의 블럭의 파라미터(스케일 팩터, 워드 길이의 값)를 기록 또는 전송치 않게 하고 그 몫의 비트를 청감상 중요한 저역의 메인 정보(블럭의 양자화된 데이타) 할당하도록 고 있다. 또, 이 경우는 시간 프레임마다 기록 또는 전송되는 파리미터의 갯수도 기록하게(또는 전송한다) 되어 있다.
본 발명의 오디오 신호 처리 방법에 의하면 각 블럭마다 이 파라미터가 필요한 대역까지 기록 또는 전송을 한다.
즉, 파라미터를 필요로 하지 않는 대역의 파라미터는 기록 또는 전송하지 않고, 그 몫의 비트를 음성 데이타의 부호로 배분토록 하고 있다.
본 발명의 오디오 신호 처리 방법에 의하면 각 블럭 마다의 파라미터를 시간 프레임마다 이 파라미터가 필요한 대역까지 기록 또는 전송한다. 즉, 파라미터를 필요로 하지 않는 대역의 파라미터는 기록 또는 전송하지 않고, 그 몫의 비트를 음성 데이타의 부호에 배당토록 하고 있다.
본 실시예의 오디오 신호 처리 방법은 시계열의 입력 오디오 신호(TS)를 소정의 시간 프레임마다 주파수 축의 신호(스펙틀 신호(SP))로 변환하고 이 스펙틀 신호(SP)를 대역 마다의 블럭으로 분할하고 각 블럭마다 블럭 플로우팅 처리를 실시하고 각 블럭 마다의 데이타를 적응적인 비트 할당으로 양자화하고 그 양자화된 오디오 신호를 기록 또는 전송함과 더불어 상기 블럭 플로우팅 처리에 관련하는 파라미터(BF)로서의 플로우팅 계수(스케일 팩터(SF))와 워드 길이(WL)의 데이타를 기록 또는 전송하는 오디오 신호 처리 방법이며 제1도에 도시하듯이 상기 블럭 플로우팅 처리에 관련하는 각 블럭마다의 파라미터(BF)를 상기 시간 프레임마다 해당 파라미터(BF)가 필요한 대역까지 기록 또는 전송함과 더불어 해당 기록 또는 전송되는 파라미터(BF)의 갯수(N)도 기록 또는 전송토록 한 것이다.
또한, 제1도는 1개의 시간 프레임과 그 1개의 시간 프레임내의 복수의 주파수 대역의 블럭을 도시하고 있다. 또, 제1도의 메인 정보는 양자화된 블럭의 데이타(해당 오디어 신호(TS)를 주파수 분할한 각 블럭마다의 스펙틀 신호(SP)의 양자화된 각 블럭의 데이타)이다.
여기에서 본 발명 실시예의 유효성은 이하같은 사실에 의거하고 있다.
즉, 예컨대, 10KHz 이상의 높은 대역에선 인간이 청각 특성에 의거한 후술하는 소위 최소 가청한이 높고, 또, 저역 신호에 의한 상기 마스킹 효과가 유효하게 작용하므로 양자화 잡음이 그 이하의 대역(예컨대 10KHz 이하)과 비교해서 크게 되었다고 하더라도 음질 열화가 귀에 지각되기 어렵다. 특히, 15KHz 이하의 대역의 신호 성분을 예컨대 삭제해도(0 비트 할당) 청각상, 차이를 알 수 없는 사례가 많다.
따라서, 본 실시예에선 제1도에 도시하듯이 상기 블럭 플로우팅 퍼이에 관련하는 각 블럭마다의 파라미터(BF)인 플로우팅 계수로서의 상기 스케일 팩터(SF) 및 양자화시의 할당 비트수에 대응하는 상기 워드 길이(WL)의 데이타를 상기 시간 프레임마다 해당 파라미터(BF)를 필요로 하는 대역까지(즉, 청감상 중요한 저역만)로서 기록 또는 전송토록 하고 있다. 이것으로 청감상 중요하므로 생략할 수 없는 지역의 부호에 많은 비트를 할당할 수 있게 되는 결과로서 음질이 향상하게 된다.
또한, 상기 최소 가청한에선 잡음 절대 레벨이 이 최소 가청한 이하이면 그 잡음은 들리지 않게 된다. 이 최소 가청한은 코딩이 같아도 예컨대 재생시의 재생 볼륨이 다르므로 다른 것으로 되는데 현실적인 디지탈 시스템에선 예컨대 16 비트 다이나믹 범위로의 음악이 들어가는 방식엔 그다지 다름이 없으므로 예컨대 4KHz 부근의 가장 귀에 들리기 쉬운 주파수 대역의 양자화 잡음이 들리지 않는다면 다른 주파수 대역에선 이 최소 가청 커브의 레벨 이하의 양자화 잡음은 들리지 않는다고 생각된다.
또, 상술같이 하면 상기 파라미터(BF)의 갯수는 시간 프레임마다 변화하는 것으로 되므로 본 실시예에선 파라미터(BF)의 갯수(N)를 시간 프레임마다 기록 또는 전송토록 하고 있다. 이 경우, 해당 갯수(N)의 데이타량은 적다. 예컨대 파라미터(BF)의 갯수가 수십개 정도이면 충분하며 또, 해당 시간 프레임에서 취할 수 있는 대역이 2 종류(블럭이 2 개)이면 1 비트있으면 기록 또는 전송할 수 있게 된다.
상술같이 본 실시예에 있어선 시간 프레임마다 실제로 기록 또는 전송되는 오디오 신호의 대역으로서 예컨대 실제로 지각하기 어렵다(귀에 들리기 어렵다)라는 이유로 고역의 기록 또는 전송이 이뤄지지 않는 경우에 그 시간 프레임의 고역의 블럭의 파라미터(BF)(스케일 팩터(SF), 워드 길이(WL)의 값)분의 비트를 저역의 메인 정보를 위해 배당토록 하고 저역의 파라미터(BF)와 해당 메인 정보를 예컨대 매체에 기록하게(또는 전송한다)하고 있다. 또, 그 시간 프레임마다의 파라미터(BF)의 갯수(N)도 기록하게 (또는 전송)하고 있다.
또한, 저역에서의 신호 레벨이 낮고 고역에서의 신호 레벨이 매우 높은 경우에는 고역의 신호를 삭제하면 그것에 의한 음질 열화의 차이가 지각되기 쉽게 된다. 따라서 이 경우엔 제2도에 도시하듯이 고역의 신호 및 파라미터(BF)도 기록토록 해서 부호화한다.
제3도에는 본 실시예의 오디오 신호 처리 방법이 적용되는 오디오 신호 처리 시스템의 엔코더의 구체적 구성을 도시한다.
또한, 이 제3도에는 시계열의 오디오 신호(파형 데이타)를 밴드 분할 필터로 분할하고 이것을 변경 이산 코사인 변환(MDCT) 처리에 의해 주파수축의 신호로 변환한 스펙틀 신호(스펙틀 데이타)(SP)를 부호화하는 구성을 도시하고 있다.
즉, 이 제3도에 도시하는 엔코더는 입력 단자(1)에 공급되는 시계열의 입력 오디오 신호(디지탈 오디오 데이타)(TS)를 소정의 시간 프레임마다 주파수 축상에서 복수의 블럭으로 분할하고 각 블럭마다 블럭 플로우팅 처리를 실시함과 더불어 각 블럭마다의 데이타를 적응적인 비트 할당으로 부호화하는 것이며 상기 블럭 플로우팅 처리에 관련하는 각 블럭마다의 파라미터(BF)(플로우팅 계수로서의 상기 스케일 팩터(SF) 및, 상기 비트 할당 수에 대응하는 워드 길이(WL)를 상기 시간 프레임마다 해당 파라미터(BF)를 필요로 하는 대역까지 기록함과 더불어 해당 기록되는 파라미터의 갯수도 기록하는 데이타 기록 회로(19)를 갖는 것이다. 이 데이타 기록 회로(19)에 기록된 데이타가 후술하는 디코우더측에 전송된다.
여기에서 본 구체예의 엔코우더에 있어선 상기 시간 프레임을 복수의 주파수 대역으로 분할한 각 블럭의 대역을 가변으로 하여 해당 대역이 좁아지고 있는 경우에는 상술의 실시예와 같이 해서 상기 데이타 기록 회로(19)에 기록하는 파라미터(BF)의 갯수를 줄이고 그 줄인분의 비트를 메인 정보에 대해서(후술하는 오디오 신호(TS)를 주파수 분할한 각 블럭마다의 스펙틀 신호(SP)의 양자화시에) 배당토록 하고 있다.
이같은 것을 행하기 위해서 입력 단자(1)에 공급된 상기 소정의 시간 프레임마다의 시계열의 오디오 신호(파형 데이타)(TS)는 공급된 시계열 신호를 스펙틀 신호로 변환하는 시간/주파수 변환 회로(11)에 의해 스펙틀 신호(SP)로 변환된다. 해당 시간/주파수 변환 회로(11)는 예컨대, 제1도, 제2도에 도시하듯이 상기 오디오 신호(TS)를 소정의 시간 프레임마다 구분함과 더불어 각 시간 프레임을 복수의 주파수 대역으로 분할해서 블럭화하고 이 각 블럭의 대역을 가변으로 하고 있다.
또, 이 시간/주파수 변환 회로(11)에서 블럭의 대역을 가변으로 할 때는 상기 블럭 폭으로서 시간 프레임을 예컨대 인간의 청각 특성을 고려한 대역 분할에 의해 분할해서 얻은 각 대역을 블럭으로 하도록 되어 있다. 또한, 이 임계 밴드는 인간의 청각 특성을 고려해서 분할된 주파수 대역이며, 어떤 순음의 주파수 근처의 같은 세기의 협대역 밴드 잡음에 의해서 해당 순음이 마스크될 때의 그 잡음이 갖는 대역인 것이다. 또, 상기 임계 밴드에서의 분할로선 예컨대 020kHz의 전주파수 대역을 예컨대 25의 임계 밴드로 분할하는 것도 가능하다.
이 시간/주파수 변환 회로(11)부터의 스펙틀 신호(SP)는 스펙틀 신호 양자화 회로(15)에 보내지며 양자화된다. 즉, 해당 스펙틀 신호 양자화 회로(15)는 공급된 각 블럭의 스펙틀 신호(SP)를 블럭 플로우팅 처리에 의해서 정규화(정상화)한 후, 소위 마스킹 효과를 고려한 적응적인 할당 비트수로 양자화한다.
여기에서, 상기 스펙틀 신호 양자화 회로(15)에서 상기 블럭 플로우팅부 처리를 행하기 위한 플로우팅 계수(스케일 팩터(SF))는 스케일 팩터 계산 회로(13)에서 공급된다. 즉, 상기 스케일 팩터 계산 회로(13)에는 상기 스팩틀 신호(SP)가 공급되어 있으며 이 스케일 팩터 계산 회로(13)에서 상기 시간 프레임마다의 복수의 주파수 대역의 블럭마다의 스펙틀 신호(SP)의 예컨대 피크 또는 평균치에 소정의 계수를 승산한 플로우팅 계수(스케일 팩터(SF))가 출력되게 되어 있다.
또, 상기 스펙틀 신호 양자화 회로(15)에서 상기 적응적인 할당 비트수의 양자화를 행하기 위해서 상기 스펙틀 신호(SP)는 마스킹 계산 회로(17)에도 보내지고 있다. 해당 마스킹 계산 회로(17)에선 후술하듯이 하고 인간의 청각 특성에 따른 각 블럭마다의 마스킹 효과에 의한 해당 주목 블럭의 마스킹 정보(MSK1)가 얻어진다. 이 마스킹 계산 회로(17)부터의 마스킹 정보(MSK1)는 비트 할당 계산 회로(14)로 보내지며 해당 비트 할당 계산 회로(14)에서 상기 마스킹 정보(MSKI)에 의거한 각 블럭마다의 비트 할당 정보로서의 워드 길이(WL)의 데이타가 구해진다. 즉, 이 워드 길이(WL)의 정보에 의거해서 상기 스펙틀 신호 양자화 회로(15)에선 공급된 스펙틀 신호(SP)의 블럭마다의 적응적인 양자화를 행하고 있다.
여기에서 상기 마스킹 계산 회로(17) 및 비트 할당 계산 회로(14)에서의 처리는 구체적으로는 이하와 같이 이뤄져 있다.
즉, 상기 마스킹 계산 회로(17)에 보내진 스펙틀 신호 (SP)는 우선 상기 블럭마다 에너지가 산출된다. 이 블러마다의 에너지 산출시에는 예컨대 상기 임계 밴드(임계 대역)마다의 에너지가 예컨대 해당 밴드내에서의 각 진폭값의 총화를 계산하는 것등으로 구해진다. 이 각 밴드 마다의 에너지 대신에 진폭값의 피크값, 평균값 등이 쓰이는 수도 있다. 이 에너지 산출에 의해 구해지는 각 밴드의 총화값의 스펙틀은 일반으로 바아크 스펙틀이라 칭해지고 있다.
다음에 해당 마스킹 계산 회로(17)에선 상기 바아크 스펙틀의 소위 마스킹에 있어서의 영향을 고려하기 때문에 그 바아크 스펙틀에 소정의 무게 붙임 함수를 곱해서 가산하는 컨버루션 처리를 실시한다. 이 컨버루션 처리를 행하는 구성으로선 예컨대 입력 데이타를 차례로 지연시키는 복수의 지연 소자와 이들 지연 소자로부터의 출력에 필터 계수(무게 붙임 함수)를 승산하는 복수의 승산기(예컨대 각 밴드에 대응하는 25개의 승산기)와 각 승산기 출력의 총화를 취하는 총화 가산기로 구성되는 것이다.
상기 컨버루션 처리가 실시된 후, 역 컨버루션 처리를 행하므로서 마스킹 한계값이 얻어진다. 즉, 이 마스킹 한계없이 허용 가능한 잡음 스펙틀이 된다. 여기에서 상기 마스킹 한계값과 상기 바이크 스펙틀과의 감산을 행하므로서 해당 바아크 스펙틀이 상기 마스킹 한계값에 의해서 마스킹되는 레벨이 구해진다. 이 마스킹 레벨이 상기 마스킹 정보(MSKI)로서 비트 할당 계산 회로(14)에 보내진다.
또한, 상기 마스킹 정보(MSKI)를 구할 때에는 예컨대 인간의 청각 특성인 상기 최소 가청한을 도시하는 데이타와 상기 마스킹 한계값을 합성할 수 있다. 이 최소 가청한에 있어선 상술같이 잡음 절대 레벨이 이 최소 가청한 이하이면 그 잡음은 들리지 않게 된다.
상기 비트 할당 계산 회로(14)에는 예컨대 할당 비트수 정보가 미리 기억된 ROM등이 설치되며 상기 마스킹 정보(MSKI)의 마스킹 레벨과 각 밴드의 에너지와의 차이분의 레벨에 따라서 해당 ROM 등으로부터 각 밴드마다의 할당 비트수 정보가 구해진다. 또한, 이 각 밴드마다의 할당 비트수 정보에 의거해서 상기 대별해서 고역, 중역, 저역의 각 블럭마다의 할당 비트수에 대응하는 워드 길이(WL)의 데이타를 구한다.
또, 상기 비트 할당 계산 회로(14)에선 예컨대 등 라우드니스커브의 정보에 의거해서 상기 마스킹 정보(MSKI)에 의거하는 허용 잡음 레벨을 보정하는 것도 가능하다. 여기에서 등 라우드니스커브는 인간의 청각 특성에 관한 특성 곡선이며 예컨대 1kHz 의 순음과 같은 크기로 들리는 각 주파수에서의 음의 음압을 구하고 곡선으로 맺은 것이며, 라우드니스의 등감도 곡석이라고도 불리운다. 또한, 이 등 라우드니스 곡선은 상기 최소 가청한의 커브와 거의 같은 곡선을 그리는 것이다. 따라서, 이 등 라우드니스 곡선에선 예컨대 4kHz 부근에선 1kHz 인 곳에서 부터 유압이 8-10dB 내려가도 1kHz와 같은 크기로 들리며 역으로 50kHz 부근에선 1kHz 에서의 음압보다 약 15dB 높지 않으면 같은 크기로 들리지 않는다. 이때문에 상기 최소 가청 커브의 레벨을 넘어선 잡음(허용 잡음 레벨)은 등 라우드니스 곡선에 따른 커브로 부여되는 주파수 특성을 갖게하는 것이 좋다는 것을 알 수 있다. 이 같은 점에서 상기 등 라우드니스 곡선을 고려해서 상기 허용 잡음 레벨을 보정하는 것은 인간의 청각 특성에 적합되고 있음을 알 수 있다.
또한, 상기 마스킹 계산 회로(17)에선 상기 마스킹 계산을 행하는 것에 의해서 상기 스펙틀 신호 양자회 회로(15)에서 스펙틀 신호(SP)를 양자화하고 데이타 기록 회로(19)에 기록할 때, 기록해야 할 최고의 대역(HB)이 어느 대역이 되는가도 구하고 있다. 즉, 상기 마스킹 효과 등을 고려하므로서 기록하지 않아도 청감상의 음질에 영향이 적은 대역과 기록하지 않으면 청감상 악 영향이 나타나는 대역을 나누고 이 기록해야 할 대역(HB)의 정보를 블럭 플로우팅 처리의 파라미터(BF)의 갯수를 계산하는 파라미터 갯수 계산 회로(18)로 보내고 있다.
해당 파라미터 갯수 계산 회로(18)에선 상기 기록해야 할 대역(HB)의 정보에 의거해서 각 블럭의 각 파라미터(BF)중 해당 기록해야 할 대역(HB) 이하의 대역(즉, 기록해야 할 예컨대 저역)의 파라미터(BF)의 갯수(N)를 산출하고 있다. 또는, 해당 기록해야 할 대역(HB) 이상의 대역(즉 기록하지 않아도 좋은 예컨대 고역)의 파라미터(BF)의 갯수를 산출토록 해도 된다.
해당 갯수(N)의 정보는 상기 비트 할당 계산 회로(14)로 보내진다. 따라서, 해당 비트 할당 계산 회로(14)에선 상술한 것같은 비트 할당 수의 계산 처리와 더불어 상기 갯수(N)의 정보에 의거해서 기록해야 할 대역(HB) 이상의 대역(즉 기록하지 않아도 좋은 예컨대 고역)에 대해선 비트를 할당하지 않고 있다.
즉, 상기 비트 할당 계산 회로(14)에선 상기 갯수(N)가 얻어지면 상기 메인 정보에 할당할 수 있는 비트의 총수가 구해지므로 해당 갯수(N)에 따라서 남는 비트수를 상기 기록해야 할 최고의 대역(HB)까지의 대역의 스펙틀 신호(SP)에 배당토록 하고 있다.
상기 데이타 기록 회로(19)에는 상기 파라미터(BF)의 갯수(N)와 해당 N개의 파라미터(BF)와 양자화된 스펙틀 신호(SP)를 기록한다.
상기 디코더 기록 회로(19)로부터의 코딩된 데이타(CDT)는 출력 단자(2)를 거쳐서 출력된다.
제4도에는 제3도의 엔코더의 시간/주파수 변환 회로(11)의 구체적 구성을 도시한다.
이 제4도의 구성은 예컨대 QMF 필터 등의 밴드 분할 필터와, 변경 이산 코사인 변환(Modified Discrete Cosine Transform : MDCT)을 조합해서 신호를 압축토록 하고 있다. 또한, ICASSP 83, BOSTON, Polyphases Quadradure Filter-A new subband coding technique, joseph H. Rothweiler 에는 등 밴드 폭의 필터분할 수법이 기술되어 있다. 또, 상기 MDCT에 대해선 ICASSP 1987 subband/Transform Coding Vsing Filter Bank Designs Based on Time Domain Aliasing Cancellation. J. P.
Princen, A. B. Bradley, Vniv. of Surrey Royal Melbourne Inst. of Tech. 에 기술되어 있다. 또한, 상기 MDCT 대신에 예컨대 고속 푸리에 변환(FFT). 이산적 코사인 변환(DCT) 등을 행하므로서 시간축을 주파수축으로 변환하는 것도 가능하다.
이 제4도의 구성에선 시계열의 PCM 신호 등의 입력 오디오 신호(TS)를 상술같이 인간의 청각 특성을 고려한 소위 임계 밴드에 의거해서 고역일수록에 대역폭이 넓어지게 주파수 분할하고 있다. 본 구체예에선 상기 임계 대역을 고려하고 대별해서 고역, 중역, 저역의 3개의 대역으로 분할하고 있다.
또한, 이 대역 분할로는 임계 밴드 단위 또는 고역에선 임계 대역(임계 밴드)폭을 다시 세분화한 블럭으로 해도 된다.
즉, 제4도에서 입력 단자(1)에는 예컨대 0 20kHz 의 오디오 PCM 신호인 상기 입력 오디오 신호(TS)가 공급되어 있다.
이 입력 오디오 신호(TS)는 예컨대 소위 QMF 필터 등의 대역 분할 필터(71)에 의해 예컨대 0 10kHz 대역과 10kHz 20kHz 대역(고역)으로 분할되며 0 10kHz 대역의 신호는 마찬가지로 소위 QMF 필터 등의 대역 분할 필터(72)에 의해 예컨대 0 5kHzZ 대역(저역)과 5kHz 10kHz 대역(중역)으로 분할된다. 대역 분할 필터(71)부터의 고역(10kHz 20kHz 대역)의 신호는 직교 변환 회로의 1 예인 MDCT 회로(73)로 보내지며 대역 분할 필터(72)로 부터의 중역(5kHz 10kHz 대역)외 신호는 MDCT 회로(74)에 보내지며 대역 분할 필터(72)로부터의 저역(0~5kHz 대역)의 신호는 MDCT 회로(75)에 전송되며, MDCT 처리로 인해 고역의 신호는 단자(76)을 거쳐 출력되어, 상기 중역의 신호는 단자(77)를 거쳐서 상기 저역의 신호는 단자(78)를 거쳐서 출력된다.
여기에서 각 MDCT 회로(13,14,15)의 블럭 칫수는 구체예엔 고역측만큼 주파수 대역을 넓힘과 더불어 시간 분해능을 높히고(블럭 길이를 짧게 하고) 있다. 즉, 저역측의 0 5kHz 대역의 신호 및 중역의 5kHz 10kHz 대역의 신호에 대해선 1 블럭의 샘플수를 예컨대 256 샘플로 하고, 고역측의 10kHz 20kHz 대역의 신호에 대해선 1 블럭을 상기 저역 및 중역측의 블럭의 각각 1/2의 길이로 하고 블럭화하고 있다. 이같이 해서 각 대역의 직교 변환 블럭 샘플 수와 같게 하고 있다. 또, 각각의 대역을 신호의 시간적 변화가 큰 경우를 상정하고 다시 1/2, 1/4등의 적응적인 블럭 분할이 가능하다.
제5도에는 제3도의 엔코더에 대응하는 디코더의 구성을 도시한다.
즉, 이 제5도에서 입력 단자(51)에는 상기 코딩된 데이타(CDT)가 공급된다. 이 데이타(CDT)는 해당 데이타(CDT)로 부터 양자화 스펙틀 신호를 읽어 넣는다(꺼집어 낸다). 양자화 스펙틀 신호 읽어 넣기 회로(54)와 블럭 플로우팅의 파라미터(BF)의 상기 갯수(N)를 읽어 넣는(꺼집어내는) 파라미터 갯수 읽어 넣기 회로(52)와 상기 블럭 플로우팅의 파라미터(BF)의 데이타를 읽어 넣는다(꺼집어낸다). 파라미터 읽어 넣기 회로(53)에 보내진다. 상기 양자화 스펙틀 신호 읽어 넣기 회로(52)부터의 갯수(N)의 데이타와 상기 파라미터 읽어 넣기 회로(53)부터의 파라미터(BF) 즉, 스케일 팩터(SF) 및 워드 길이(WL)의 데이타는 스펙틀 신호 복원 회로(55)에 보내진다.
해당 스펙틀 신호 복원 회로(55)는 공급된 신호를 써서 복호화 처리를 실시한다. 해당 스펙틀 신호 복원 회로(55)에서 복호화된 스펙틀 신호(RSP)는 주파수/시간 변환 회로(55)에서 시계열의 오디오 신호(RTS)로 되며 출력 단자(57)로부터 출력된다.
제6도에는 상기 제5도의 디코더의 구성의 주파수/시간 변환 회로(56)의 구체적 구성을 도시한다.
이 제6도에서 각 블럭의 상기 스펙틀 신호(RSP)는 각 단자(61,62,63)에 부여되며 IMDCT(역 MDCT) 회로(64,65,66)에서 주파수축상의 신호가 시간축상의 신호로 변환된다. 이들의 부분 대역의 시간축상의 신호는 IQMF(역 QMF) 회로(67, 78)에 의해서 전대역 신호로 복호화되며 단자(69)에서 꺼내어진다.
제7도에는 상기 제3도의 엔코더에서의 신호 처리의 흐름도를 도시한다.
즉, 이 제7도의 흐름도의 단게(S1)에선 상기 시간/주파수 변환 회로(11)에 의해 입력된 시계열 오디오 신호(TS)가 스펙틀 신호(스펙틀 데이타)(SP)로 변환된다. 이 단계 (S1)의 후 단계(S2)로 나아가고 상기 스케일 팩터 계산 회로(13)에 의해서 상기 스케일 팩터(SF)를 구하기 위한 계산이 행해진다. 단계(S3)에선 상기 마스킹 계산 회로(17)에 의해 상기 마스킹 계산 처리가 행해지며 단계(S4)에선 상기 파라미터 갯수 계산 회로(18)에 의해 비트를 할당해야 할 대역의 확정과 블럭 플로우팅 처리의 파라미터(BF)의 갯수(N)의 확정이 이뤄진다. 단계(S5)에선 비트 할당 계산 회로(14)에 의해 비트 할당의 계산과 워드 길이(WL)의 계산이 행해진다. 단계(S6)에선 상기 스펙틀 신호 양자화 회로(15)에 의해서 스펙틀 신호(스펙틀 데이타)의 양자화 처리가 행해진다. 최후로 단계(S7)에선 상기 데이타 기록 회로(19)에 의해서 상기 갯수(N)의 데이타의 기록과 블럭 플로우팅 처리의 파라미터(BF)의 기록(기록해야 할 대역의 파라미터(BF)의 기록)과, 상기 양자화된 스펙틀 신호(스펙틀 데이타)QSP 의 데이타의 기록이 행해진다.
제8도는 상기 제5도에 도시하는 디코더의 구성에서의 처리의 흐름도를 도시한 것이 있다.
즉, 이 제8도의 흐름도에서 단계(S11)에선 상기 파라미터 갯수 읽어 넣기 회로(52)에 의해 최초로 파라미터(BF)의 갯수(N)를 판독하고 다음에 단계(S12)에선 상기 파라미터 읽어 넣기 회로(53)에 의해서 상기 갯수(N)의 수만큼의 파라미터(BF)의 데이타를 판독한다. 이어서, 단계(S13)에선 상기 양자화 스펙틀 신호 읽어 넣기 회로(54)에 의해 상기 파라미터(BF)중의 워드 길이(WL)에 따라서 상기 양자화된 스펙틀 신호(QSP)를 판독한다.
또, 단계(S14)에선 상기 스펙틀 신호 복원 회로(55)에 의해서 상기 스케일 팩터(SF)와 워드 길이(WL)에 의거해서 상기 판독된 양자화된 스펙틀 신호(QSP)가 원래의 스펙틀 신호(SP)의 근사값(상기 스펙틀 신호 RSP)으로서 복원된다. 마지막으로, 단계(S15)에선 주파수/시간 변환 회로(57)에 의해서 상기 스펙틀 신호(RSP)에 상기 MDCT와는 역의 처리(역 MDCT)를 행함과 더불어 대역 합성 필터를 통하므로서 오디오 신호(RTS)가 복원된다.
또한, 상술한 본 발명의 실시예는 시계열의 입력 오디오 신호(TS)를 스펙틀 신호(SP)로 변환한 신호를 부호화하는 시스템에 대해서 설명을 행했는데 본 발명은 이 시계열 서브 밴드로 분할하고 부호화를 실시하는(소위 서브 밴드 코우딩) 시스템에도 적용할 수 있다.
상술같이 본 발명의 오디오 신호 처리 방법에서 블럭 플로우팅 처리에 관련하는 각 블럭마다의 파라미터를 시간 프레임 마다 파라미터를 필요로 하는 대역까지 기록 또는 전송함과 더불어 이 기록 또는 전송되는 파라미터를 필요로 하는 대역까지 기록 또는 전송함과 더불어 이 기록 또는 전송되는 파라미터의 갯수도 기록 또는 전송토록 한 것에 의해서 비트 할당의 조정이 비교적 용이하고 비트 할당의 조정을 행해도 음질을 열하시키는 일이 없다. 즉, 실제로 지각되기 어렵다는 이유로 예컨대 고역의 신호가 기록되지 않는 경우에 그 고역의 파라미터 분리 비트도 저역의 오디오 신호의 양자화 때문에 배당할 수 있고 음질을 향상시킬 수 있다. 또, 고역으로 레벨이 높은 신호가 포함되는 경우도 대역을 좁히는 일 없고 기록할 수 있게 된다. 또한, 이것들의 처리는 간단한 구성으로 실현할 수 있다.

Claims (1)

  1. 입력 오디오 신호를 소정의 시간 프레임마다 주파수 축상에서 복수의 블록으로 분할하는 단계,
    각 블록마다 블록 플로우팅(floating)처리를 실시하는 단계,
    각 블록마다의 데이터를 적응적인 비트 할당으로 양자화하는 단계 및,
    해당 양자화된 오디오 신호와 더불어, 상기 블록 플로우팅 처리에 관련하는 파라미터를 기록 또는 전송하는 단계를 구비하며 ;
    상기 기록 또는 전송하는 단계는 상기 블록 플로우팅 처리에 관련하는 각 블록마다의 파라미터를 상기 시간 프레임마다 해당 파라미터가 필요한 대역까지 기록 또는 전송함과 더불어, 해당 기록 또는 전송되는 파라미터의 개수도 기록 또는 전송하는 것을 특징으로 하는 오디오 신호 처리 방법.
KR1019920016982A 1991-09-30 1992-09-18 오디오 신호 처리 방법 KR100275057B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP27616891A JP3200886B2 (ja) 1991-09-30 1991-09-30 オーディオ信号処理方法
JP91-276168 1991-09-30

Publications (2)

Publication Number Publication Date
KR930007107A KR930007107A (ko) 1993-04-22
KR100275057B1 true KR100275057B1 (ko) 2000-12-15

Family

ID=17565680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019920016982A KR100275057B1 (ko) 1991-09-30 1992-09-18 오디오 신호 처리 방법

Country Status (2)

Country Link
JP (1) JP3200886B2 (ko)
KR (1) KR100275057B1 (ko)

Also Published As

Publication number Publication date
KR930007107A (ko) 1993-04-22
JP3200886B2 (ja) 2001-08-20
JPH0591062A (ja) 1993-04-09

Similar Documents

Publication Publication Date Title
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
USRE36683E (en) Apparatus and method for audio data compression and expansion with reduced block floating overhead
US5664056A (en) Digital encoder with dynamic quantization bit allocation
JP3278900B2 (ja) データ符号化装置及び方法
KR100550504B1 (ko) 디지탈 신호 처리 방법, 디지탈 신호 처리 장치, 디지탈신호 기록 방법, 디지탈 신호 기록 장치, 기록 매체,디지탈 신호 전송 방법, 및 디지탈 신호 전송 장치
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
US5774844A (en) Methods and apparatus for quantizing, encoding and decoding and recording media therefor
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
US6011824A (en) Signal-reproduction method and apparatus
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JPH0846517A (ja) 高能率符号化及び復号化システム
KR100275057B1 (ko) 오디오 신호 처리 방법
KR100225822B1 (ko) 오디오 신호 처리 방법
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3141853B2 (ja) オーディオ信号処理方法
JP3318824B2 (ja) デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH07336231A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
KR100351772B1 (ko) 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법
JP3134384B2 (ja) 符号化装置及び方法
JPH11330973A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
KR100195712B1 (ko) 디지탈 오디오 복호화기의 음질 조절 장치
JPH08167247A (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH11272294A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110915

Year of fee payment: 12

EXPY Expiration of term