KR20050054745A - 오디오 신호를 부호화하는 장치 및 방법 - Google Patents

오디오 신호를 부호화하는 장치 및 방법 Download PDF

Info

Publication number
KR20050054745A
KR20050054745A KR1020030088379A KR20030088379A KR20050054745A KR 20050054745 A KR20050054745 A KR 20050054745A KR 1020030088379 A KR1020030088379 A KR 1020030088379A KR 20030088379 A KR20030088379 A KR 20030088379A KR 20050054745 A KR20050054745 A KR 20050054745A
Authority
KR
South Korea
Prior art keywords
subband
gain
masking threshold
reset
signal
Prior art date
Application number
KR1020030088379A
Other languages
English (en)
Other versions
KR100713452B1 (ko
Inventor
함철배
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030088379A priority Critical patent/KR100713452B1/ko
Publication of KR20050054745A publication Critical patent/KR20050054745A/ko
Application granted granted Critical
Publication of KR100713452B1 publication Critical patent/KR100713452B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Optimization (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송함에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하고, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화한다.

Description

오디오 신호를 부호화하는 장치 및 방법{APPARATUS AND METHOD FOR CODING OF AUDIO SIGNAL}
본 발명은 오디오 부호화에 관한 것으로서, 특히 오디오 부호화의 압축효율을 높이기 위한 장치 및 방법에 관한 것이다.
상기 오디오 신호는 최근 디지털통신기술의 눈부신 신장과 고집적 반도체(VLSI), 그리고 신호처리(DSP)기술의 접목에 따라 종래에는 이질적이고 독립적으로 생성, 처리되어 오던 비디오 데이터, 오디오 데이터 및 기타 데이터들이 정보소스나 매체 등의 구별 없이 매우 다양한 형태로 처리, 이용될 수 있게 되었다. 이와 같은 환경에서 서로 다른 기기간의 원활한 정보전송 및 공유를 위한 디지털 데이터의 국제적 전송규격 표준화의 필요성이 대두되었고, 이러한 필요성에 따라 정지화상의 전송을 위한 제이펙(Joint Picture Experts Group: JPEG) 및 동화상의 전송을 위한 MPEG 등이 표준화되었다.
상기 MPEG 표준화에 따르면 디지털 비디오 데이터와 오디오 데이터를 압축한 후 다중화하여 전송하는 방법 및 압축되어 전송된 비디오 데이터와 오디오 데이터를 디코딩하는 방법 등이 규정되어 있다. 이 규정된 내용에 따르면 디지털 데이터는 이산여현변환(Discrete Cosine Transform), 양자화(Quantization), 스캔(Scan)을 거친 후 최종적으로 가변장부호화(Variable Length Coding)에 의해 더욱 압축된다. 이렇게 압축되어 전송된 데이터는 다시 가변장복호화(Variable Length Decoding), 역양자화, 역이산여현변환 등의 과정을 거친 후 복원된다.
도 1은 오디오 신호를 부호화하는 부호화기의 구성을 도시하고 있다. 이하 상기 도 1을 이용하여 오디오 신호를 부호화하는 부호화기의 구성에 대해 알아본다. 상기 부호화기는 시간/주파수 매핑(Time/Frequency Mapping)부(102), 심리음향부(100), 시간영역 잡음 형상화부(104), 강도(Intensity) 스테레오 처리부(106), 예측부(108), 미드/사이드(Mid/Side: M/S) 스테레오 처리부(110), 양자화부(112), 비트분할 산술부호화부(114) 및 비트스트림 형성부(116)로 이루어진다.
인간의 청각특성 중 디지털 오디오신호의 부호화에 있어서 가장 중요한 현상으로 사용하는 것이 마스킹(masking)효과와 임계대역(critical hand)의 성질이다. 마스킹효과란 어떤 신호(소리)에 의해 다른 신호(소리)가 들리지 않게 되는 현상이다. 예를 들면, 기차역에서 기차가 지나갈 때 낮은 소리로 대화한다면 그 대화는 기차소리에 묻혀 들리지 않게 되는 현상이다. 임계대역은 인간의 가청주파수범위 내에서 어떤 대역별로 신호를 인지하는 현상인데, 여러 가지 특성을 가지고 있다. 이 특성 중 하나가 같은 크기의 잡음(noise)에 대해서 어떤 임계대역 내에 있을 때와 임계대역 범위를 넘어설 때 인간이 인지하는 잡음의 크기가 다르다는 것이다. 이 경우, 임계대역을 벗어날 때의 잡음에 대한 인지가 더 높아진다.
청각특성을 이용하여 부호화 한다는 것은 기본적으로 상기 두 가지의 특성을 이용하여 하나의 임계 대역 내에서 잡음을 얼마나 할당할 수 있는가를 계산한 후, 양자화시 양자화 잡음을 그 만큼 발생시킴으로써 부호화에 의한 정보의 손실을 최소로 하는 것이다.
상기 시간/주파수 맵핑부(102)는 시간영역(time domain)의 입력 오디오 신호를 주파수영역(frequency domain)의 신호로 변환한다. 상기 심리음향부(100)는 상기 시간/주파수 맵핑부(102)에 의해 시간 영역에서 주파수 영역으로 변환된 오디오 신호들을 적당한 대역(scale factor band)의 신호들로 묶고, 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(scale factor band)에서의 마스킹 문턱치(masking threshold)를 계산한다.
상기 시간영역잡음형상화(TNS, Temporal Noise Shaping)부(104)는 변환의 각 윈도우 내에서 양자화 잡음의 시간적인 모양을 제어하기 위해 사용된다. 주파수 데이터의 필터링 과정을 적용함으로써 시간영역 잡음 형상화가 가능하다. 상기 모듈은 부호화기에서 선택적으로 사용가능한 모듈이다. 상기 Intensity 스테레오 처리부(106)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 모듈로서, 두 개의 채널 중 하나의 채널에 대한 scalefactor band에 대한 양자화된 정보만을 부호화하고, 나머지 채널은 scalefactor 만을 전송한다. 상기 모듈은 부호화기에서 반드시 사용해야 하는 모듈은 아니고 여러 가지 사항을 고려해서 각 scalefactor band단위로 사용 여부를 판단할 수 있다.
예측부(108)는 현재 프레임의 주파수 계수의 값들을 예측한다. 이렇게 예측된 값과 실제 주파수 성분의 차를 양자화해서 부호화함으로써 사용되는 비트 발생량을 줄일 수 있다. 하지만 상기 예측부(108)는 프레임 단위로 선택적으로 사용할 수 있다. 즉 예측부(108)를 사용하면 다음 주파수 계수를 예측하는데 복잡도가 높아지기 때문에 사용하지 않을 수 있다. 또한 경우에 따라서는 예측에 의한 차이가 원래 신호보다 더 큰 확률을 가지고 있음으로 인해 예측을 함으로써 실제 발생한 비트 발생량이 예측을 하지 않을 때 보다도 더 커질 수 있는데 이 때는 예측부(108)를 사용하지 않는다.
M/S 스테레오 처리부(110)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 것으로서, 왼쪽 채널 신호와 오른쪽 채널 신호를 각각 더한 신호와 뺀 신호로 변환한 후 이 신호를 처리한다. 상기 M/S 스테레오 처리부(110)도 부호화기에서 반드시 사용해야 하는 것은 아니고 부호화기에서 여러 가지 사항을 고려해서 각 scalefactor band 단위로 사용 여부를 판단할 수 있다.
양자화부(112)는 인간이 들어도 느끼지 못하도록 각 대역의 양자화 잡음의 크기가 마스킹 문턱치(Masking threshold value)보다 작도록 각 대역의 주파수 신호들을 스칼라 양자화한다. 음향심리부(100)에서 계산한 마스킹 문턱치와 각 대역에서 발생하는 잡음(noise)의 비율인 NMR(Noise-to-Mask Ratio)을 이용하여 전대역의 NMR 값이 0dB 이하가 되도록 양자화를 행한다. NMR 값이 0dB 이하라는 것은 양자화잡음에 비해 마스킹값이 높다는 것을 나타내는데, 이것은 양자화잡음을 사람이 들을 수 없다는 의미이다.
비트분할 산술 부호화부(114)는 본 발명의 핵심 모듈로서, MPEG-2 AAC와 같은 기존의 오디오 코덱(codec)은 scalability 를 제공할 수 없기 때문에 AAC의 무손실 부호화부에 대한 대안으로 사용될 수 있다. scalable audio codec을 구현할 수 있도록 양자화부(112)에서 양자화된 주파수 데이터값을 각 계층에 해당하는 비트율에 따라 해당 대역의 부가정보와 오디오 데이터에 대한 양자화 정보를 결합하여 부호화한다. 또한, 이런 scalability 기능 이외에 top layer에서는 AAC와 비슷한 성능을 제공할 수 있게 한다. 상기 비트분할 산술 부호화부(114)의 기능을 좀 더 상세하게 설명하면, 비트율 조절이 가능하도록 기반 계층에 상응하는 대역 제한을 하고, 부가정보(side information)를 부호화한다. 그리고 양자화된 값들에 대한 정보를 최상위 비트부터 최하위비트 순서로, 그리고 낮은 주파수 성분부터 높은 주파수성분의 순서대로 부호화한다. 또한 왼쪽 채널과 오른쪽 채널을 소정의 벡터 단위로 번갈아 가면서 부호화하여 기반계층에 대한 부호화를 한다. 상기 기반 계층에 대한 부호화가 끝나면 그 다음계층에 대한 부가정보와 오디오데이터의 양자화값을 부호화하여 비트스트림이 계층적 구조를 갖도록 한다. 비트스트림 형성부(116)는 부호화기의 각 모듈에서 만들어진 정보들을 모아서 scalable codec 에 적합하도록 만들어진 소정의 syntax에 따라서 비트스트림을 구성한다.
도 2는 마스킹 문턱치를 이용하여 입력신호를 처리하는 과정을 도시하고 있다. 상기 도 2에 의하면 입력신호는 4개의 대역을 나누어지고 있음을 보이고 있다. 상기 4개의 대역은 서브밴드1 내지 서브밴드4로 구성된다. 부호화기는 서브밴드 1내지 서브밴드 4의 이득을 구한다. 상기 도 2는 일예로 서브밴드2와 서브밴드3에 측정한 이득을 나타내고 있다. 상기 각 서브밴드의 이득은 상기 심리음향부로부터 전달된 마스킹 문턱치와 비교한다. 상기 비교 결과 서브밴드 2에서 이득이 상기 마스킹 문턱치보다 높고, 서브밴드3에서의 이득은 상기 마스킹 문턱치보다 작음을 알 수 있다. 상기 마스킹 문턱치를 계산하는 과정에 대해서는 본원 발명과 무관하므로 생략하기로 한다. 상기한 바와 같이 각 서브밴드에서 측정된 이득이 상기 마스킹 문턱치보다 작은 경우 부호화과정에서 제외하므로 압축효율을 높일 수 있다.
도 3은 종래 기술에 의한 문제점을 도시하고 있는 도면이다. 이하 상기 도 3을 이용하여 종래 기술의 문제점에 대해 알아본다. 상기 도 3에 의하면 서브밴드 3에는 두 개의신호성분에 대한 이득을 도시하고 있다. 상기 서브밴드 3의 두 개의 신호성분은 상기 마스킹 문턱치보다 높으므로 부호화 과정을 수행하게 된다. 하지만 상기 두 개의 신호성분에 대해 부호화 과정을 수행하기 위해서는 상기 부호화된 신호성분을 전송하기 위한 비트율이 보장되어야 한다. 상기 두 개의 신호성분을 전송하기 위한 비트율이 보장되지 않을 경우 상기 부호화기는 상기 서브밴드3의 신호성분에 대한 부호화 과정을 수행하지 않게 된다. 상기 서브밴드 3 전체의 신호성분에 대한 부호화 과정을 수행하지 않음으로 인해 부호화된 오디오 신호의 밴드폭은 계속해서 변하게 된다. 상기 밴드폭의 변화는 음질의 열화현상을 초래한다. 따라서 상기한 문제점을 해결하기 위한 방안이 논의된다.
따라서 전술한 종래 기술의 문제점을 해결하기 위한 본 발명의 목적은 저비트율 하에서도 효율적인 데이터 전송을 수행하는 장치 및 방법을 제안함에 있다.
본 발명의 다른 목적은 전송되는 데이터의 밴드폭의 변화를 최소화함으로서 음질의 열화현상을 방지하는 장치 및 방법을 제안함에 있다.
본 발명의 또 다른 목적은 각 밴드의 이득에 따라 부호화하는 마스킹 임계치를 달리 설정함으로서 요율적인 데이터 전송을 수행하는 장치 및 방법을 제안함에 있다.
상기 본 발명의 목적들을 이루기 위해 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 방법에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 과정과, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하는 과정으로 이루어짐을 특징으로 한다.
상기 본 발명의 목적들을 이루기 위해 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 장치에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 심리 음향부, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하는 형성함수 생성부와, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하도록 출력하는 형성부를 포함함을 특징으로 한다.
이하 본 발명이 바람직한 실시예를 첨부한 도면의 참조와 함께 상세히 설명한다. 또한 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
도 4는 본 발명에 따른 오디오 신호를 부호화하는 부호화기의 구성을 도시하고 있다. 이하 상기 도 4를 이용하여 오디오 신호를 부호화하는 부호화기의 구성에 대해 알아본다. 상기 도 4는 상기 도 1과 달리 형성(shaping) 함수 생성부(118)와 형성부(120)가 부가되어 있다. 상기 형성 함수 생성부(118)와 형성부(120)를 제외한 다른 구성에 대해서는 상기 도 1에서 설명한 바와 같다. 이하 상기 형성 함수 생성부(118)와 형성부(120)에 대해 알아본다. 상기 형성 함수 생성부(118)는 전달받은 각 서브밴드의 이득을 고려하여 형성 함수를 생성한다. 상기 형성 함수는 각 서브밴드별로 고정된 하나의 값을 설정하거나, 함수의 형태로 표현할 수 있다. 도 5는 주파수 영역으로 변경된 형성함수의 일예를 도시하고 있다. 상기 도 5에 의하면 상기 서브밴드1은 서브밴드2보다 높은 형성함수를 가지며, 상기 서브밴드2는 서브밴드 3보다 높은 형성함수를 가진다. 상기 서브밴드3은 서브밴드4보다 높은 형성함수 가진다. 상기 생성되는 형성함수는 각 서브밴드의 중요도와 관련된다. 상기 서브밴드에 포함된 신호성분에 대한 중요도에 높을수록 형성 함수의 크기 또한 증가된다. 상기 도 5에 의하면 상기 서브밴드 1에 포함되는 신호성분의 중요도가 가장 크다는 것을 알 수 있다.
하기 〈수학식 1〉은 생성된 형성함수를 이용하여 형성부에서 전달받은 신호를 형성하는 수식을 나타내고 있다.
X_freq'[i]=w(i)*X_freq'[i]
상기 X_freq'[i]는 형성함수에 의해 형성된 신호를 의미하며, 상기 w(i)는 형성함수를 의미한다. 상기 X_freq[i]는 시간/주파수매팽부로부터 출력된 신호를 의미한다. 도 6은 상기 형성함수에 의해 시간/주파수매팽부로부터 출력된 신호가 형성되는 예를 도시하고 있다. 상기 형성함수는 상기 도 5의 형성함수를 사용하였다. 상기 형성신호는 신호는 원신호에 비해 작은 값을 가짐을 알 수 있다. 즉, 상기 도 5에서 서브밴드1에서의 형상함수는 1을 가지며, 서브밴드2 내지 서브밴드4에서의 형상함수는 1보다 작은 값을 갖는다. 하지만 경우에 따라 상기 형상함수는 1보다 큰 값을 가질 수 있음은 자명하다.
이하, 심리음향부(100)에서 마스크 임계치를 생성하는 과정에 대해 알아본다. 상기 심리음향부(100)는 상기 시간/주파수 맵핑부(102)에 의해 시간 영역에서 주파수 영역으로 변환된 오디오 신호들을 적당한 대역(scale factor band)의 신호들로 묶고, 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(scale factor band)에서의 마스킹 문턱치(masking threshold)를 계산한다. 상기 계산된 마스킹 문턱치와 전달받은 각 서브밴드에서의 이득을 이용하여 마스킹 문턱치를 재설정한다. 하기 〈수학식 2〉는 상기 심리음향부에서 마스킹 문턱치를 재설정하는 수식을 나타낸다.
mask'[i]= mask[i]*((max_gain)/(gain(i))
상기 mask'[i]는 재설정된 마스킹 문턱치를 나타내며, 상기 mask[i]는 재설정 이전의 마스킹 문턱치를 의미한다. 상기 "i"는 i번째 서브밴드를 의미하며, 상기 (max_gain)는 전달받은 서브밴드의 이득 중 가장 높은 이득 값을 나타낸다. 상기 gain(i)은 i번째 서브밴드에서의 이득 값을 나타낸다.
상기한 바와 같이 마스킹 문턱치를 재설정함으로서 상기 재설정된 마스킹 문턱치은 이전 값보다 높은 값을 갖게 된다. 상기 재설정된 마스킹 문턱치를 이용하여 상기 전달받은 신호에 대한 부호화 과정을 수행한다.
도 7은 본 발명에 따른 재설정된 마스킹 문턱치를 이용하여 전달받은 신호를 부호화 과정을 나타내고 있다. 상기 도 7은 상기 도 3과 같이 서브밴드 3에 한정하여 부호화할 신호가 전달된 경우를 가정한다. 상기 도 7은 재설정되지 않은 마스킹 문턱치와 재설정된 마스킹 문턱치를 이용하여 부호화 과정을 설명하고 있다. 이하 먼저 일예를 들어 재설정되는 마스킹 문턱치에 대해 설명하기로 한다. 상기 전달받은 신호는 서브밴드 1 내지 서브밴드 4로 구성되는 경우를 가정한다.
이득
서브밴드1 100
서브밴드2 90
서브밴드3 85
서브밴드4 80
상기 〈표 1〉과 같이 각 서브밴드에 따른 이득을 전달받은 경우 상기 심리음향부는 상기 〈수학식 2〉에 하기 〈표 2〉와 같이 마스킹 임계치를 재설정한다.
재설정 이전 마스킹 임계치 재설정 이후 마스킹 임계치
서브밴드1 mask[1] mask[1}*(100/100)
서브밴드2 mask[2] mask[2]*(100/90)
서브밴드3 mask[3] mask[3]*(100/85)
서브밴드4 mask[4] mask[4]*(100/80)
상기 〈표 2〉와 같이 재설정 이후의 마스킹 임계치가 재설정 이전의 마스킹 임계치보다 크게 설정됨을 알 수 있다. 다만 최대 이득을 갖는 서브밴드1에 대한 마스킹 임계치만 동일하게 재설정된다.
상기 도 7에서 보이고 있는 바와 같이 서브밴드3에 있는 두 개의 신호성분은 재설정 이전의 마스킹 임계치보다 높은 값을 가짐을 알 수 있다. 따라서 상기 부호호부는 서브밴드3에 위치한 두 개의 신호성분에 대해 부호화 과정을 수행하여야 한다. 하지만 종래기술에서 설명한 바와 같이 두 개의 신호성분 모두를 전송할 정도의 비트율이 보장되지 않는 경우 상기 부호화부는 상기 서브밴드3에 위치하고 있는 두 개의 신호성분 모두에 대해 부호화 과정을 수행하지 않는다.
하지만 재설정된 마스킹 임계치에 의하면 서브밴드3에 위치하고 있는 두 개의 신호성분 중에서 하나의 신호성분만이 상기 마스킹 임계치보다 큰 값을 가짐을 알 수 있다. 따라서 상기 부호화부는 상기 재설정된 마스킹 임계치보다 큰 값을 갖는 신호성분에 대해서만 부호화 과정을 수행한다. 상기 부호화부는 상기 재설정된 마스킹 임계치보다 작은 값을 갖는 신호성분에 대해서는 부호화 과정을 수행하지 않는다. 상기 재설정된 마스킹 임계치보다 큰 값을 갖는 신호성분에 대해서만 부호화 과정을 수행함으로서 제한된 비트율 하에서도 음성 신호를 전송할 수 있게 된다.
전술한 바와 같이 본 발명은 서브밴드 이득을 이용하여 오디오 부호화에 적용해 압축효율을 높이고, 부호화된 신호의 밴드폭을 일정하게 유지한다. 또한 부호화된 밴드폭을 일정하게 유지함으로서 음질의 열화현상을 최소화한다. 본 발명은 또한 저비트율이 요구되는 오디오 부호화기에 사용함으로서 효율적으로 오디오 신호를 전송할 수 있다.
도 1은 종래 오디오 신호를 부호화하는 부호화기의 구성을 도시한 도면.
도 2는 서브밴드에서 마스킹 임계치에 따라 전달된 음성 신호를 부호화하는 과정을 도시한 도면.
도 3은 하나의 서브밴드에서 마스킹 임계치에 따라 전달된 음성 신호를 부호화하는 과정을 도시한 도면.
도 4는 본 발명에 따른 오디오 신호를 부호화하는 부호화기의 구성을 도시한 도면.
도 5는 본 발명에 따른 생성하는 형성함수를 도시한 도면.
도 6은 본 발명에 따른 생성된 형성함수를 이용하여 음성신호를 재형성하는 과정을 도시한 도면.
도 7은 본 발명에 따른 재설정된 마스킹 임계치에 따라 전달된 음성신호를 부호화하는 과정을 도시한 도면.

Claims (10)

  1. 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 방법에 있어서,
    상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 과정과,
    상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하는 과정으로 이루어짐을 특징으로 하는 상기 방법.
  2. 제 1항에 있어서, 상기 오디오 신호를 재조정하는 과정은 최대 이득을 나타내는 서브밴드의 중요도에 대한 각 서브밴드의 중요도를 나타내는 형성함수를 이용함을 특징으로 하는 상기 방법.
  3. 제 2항에 있어서, 상기 오디오 신호를 재조정하는 과정은 하기 〈수학식 3〉에 의해 결정됨을 특징으로 하는 상기 방법.
    X_freq'[i]=w(i)*X_freq'[i]
    X_freq'[i]: 형성함수에 의해 재조정된 신호
    w(i) : 형성함수
    X_freq[i] : 재조정되기 이전 신호
    i: 서브밴드 지시자
  4. 제 1항에 있어서, 상기 각 서브밴드의 마스킹 문턱치를 재설정하는 과정은, 하기 〈수학식 4〉에 의해 결정함을 특징으로 하는 상기 방법.
    mask'[i]= mask[i]*((max_gain)/(gain(i))
    mask'[i] : 재설정된 마스킹 문턱치
    mask[i] : 재설정 이전의 마스킹 문턱치
    max_gain : 최대 이득
    gain(i) : i번째 서브밴드의 이득
  5. 제 4항에 있어서, 상기 각 서브밴드에 포함되는 오디오 신호들 중 하나의 신호만이 재설정된 마스킹 문턱치를 초과함을 특징으로 하는 상기 방법.
  6. 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 장치에 있어서,
    상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 심리 음향부,
    상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하는 형성함수 생성부와,
    상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하도록 출력하는 형성부를 포함함을 특징으로 하는 상기 장치.
  7. 제 6항에 있어서, 상기 심리 음향부는,
    상기 오디오 신호를 재조정하는 과정은 최대 이득을 나타내는 서브밴드의 중요도에 대한 각 서브밴드의 중요도를 나타내는 형성함수를 이용함을 특징으로 하는 상기 장치.
  8. 제 7항에 있어서, 상기 심리 음향부는,
    상기 오디오 신호를 재조정하는 과정은 하기 〈수학식 5〉에 의해 결정됨을 특징으로 하는 상기 장치.
    X_freq'[i]=w(i)*X_freq'[i]
    X_freq'[i]: 형성함수에 의해 재조정된 신호
    w(i) : 형성함수
    X_freq[i] : 재조정되기 이전 신호
    i: 서브밴드 지시자
  9. 제 6항에 있어서, 상기 형성부는,
    하기 〈수학식 6〉에 의해 상기 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하도록 출력함을 특징으로 하는 상기 장치.
    mask'[i]= mask[i]*((max_gain)/(gain(i))
    mask'[i] : 재설정된 마스킹 문턱치
    mask[i] : 재설정 이전의 마스킹 문턱치
    max_gain : 최대 이득
    gain(i) : i번째 서브밴드의 이득
  10. 제 9항에 있어서, 상기 형성함수 생성부는,
    각 서브밴드에 포함되는 오디오 신호들 중 하나의 신호만이 재설정된 마스킹 문턱치를 초과하도록 형성함수를 생성함을 특징으로 하는 상기 장치.
KR1020030088379A 2003-12-06 2003-12-06 오디오 신호를 부호화하는 장치 및 방법 KR100713452B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030088379A KR100713452B1 (ko) 2003-12-06 2003-12-06 오디오 신호를 부호화하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030088379A KR100713452B1 (ko) 2003-12-06 2003-12-06 오디오 신호를 부호화하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20050054745A true KR20050054745A (ko) 2005-06-10
KR100713452B1 KR100713452B1 (ko) 2007-05-02

Family

ID=37249986

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030088379A KR100713452B1 (ko) 2003-12-06 2003-12-06 오디오 신호를 부호화하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR100713452B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011071322A3 (en) * 2009-12-10 2011-09-29 Samsung Electronics Co., Ltd. Device and method for acoustic communication

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632003A (en) 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US6418404B1 (en) 1998-12-28 2002-07-09 Sony Corporation System and method for effectively implementing fixed masking thresholds in an audio encoder device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011071322A3 (en) * 2009-12-10 2011-09-29 Samsung Electronics Co., Ltd. Device and method for acoustic communication
CN102652337A (zh) * 2009-12-10 2012-08-29 三星电子株式会社 用于声通信的设备和方法
US8521518B2 (en) 2009-12-10 2013-08-27 Samsung Electronics Co., Ltd Device and method for acoustic communication
US9251807B2 (en) 2009-12-10 2016-02-02 Samsung Electronics Co., Ltd. Acoustic communication device and method for filtering an audio signal to attenuate a high frequency section of the audio signal and generating a residual signal and psychoacoustic spectrum mask

Also Published As

Publication number Publication date
KR100713452B1 (ko) 2007-05-02

Similar Documents

Publication Publication Date Title
US7627480B2 (en) Support of a multichannel audio extension
RU2197776C2 (ru) Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты)
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
US6098039A (en) Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
US6122618A (en) Scalable audio coding/decoding method and apparatus
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
CN1758338B (zh) 用于低比特率音频编码应用的高效可标度参数立体声编码
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
CA2284220C (en) Method for signalling a noise substitution during audio signal coding
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
JP3446216B2 (ja) 音声信号処理方法
JPH06149292A (ja) 高能率符号化方法及び装置
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
KR101033256B1 (ko) Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
KR100923297B1 (ko) 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
JP4618873B2 (ja) オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
KR100713452B1 (ko) 오디오 신호를 부호화하는 장치 및 방법
JP3336619B2 (ja) 信号処理装置
JP2002268694A (ja) ステレオ信号の符号化方法及び符号化装置
JP3134363B2 (ja) 量子化方法
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
KR970006827B1 (ko) 오디오신호 부호화장치
KR20080008897A (ko) 오디오 부호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20060331

Effective date: 20070227

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee