KR100746050B1 - 오디오 코덱의 프레임 구성 방법 - Google Patents

오디오 코덱의 프레임 구성 방법 Download PDF

Info

Publication number
KR100746050B1
KR100746050B1 KR1020060051735A KR20060051735A KR100746050B1 KR 100746050 B1 KR100746050 B1 KR 100746050B1 KR 1020060051735 A KR1020060051735 A KR 1020060051735A KR 20060051735 A KR20060051735 A KR 20060051735A KR 100746050 B1 KR100746050 B1 KR 100746050B1
Authority
KR
South Korea
Prior art keywords
subframe
scale factor
information
spectral coefficients
frame
Prior art date
Application number
KR1020060051735A
Other languages
English (en)
Inventor
박성수
우대식
이동학
유재황
오세현
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020060051735A priority Critical patent/KR100746050B1/ko
Application granted granted Critical
Publication of KR100746050B1 publication Critical patent/KR100746050B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 코덱에서 부호화된 오디오 데이터 프레임을 전송망의 패킷 전송 단위에 맞도록 재구성하여 전송할 수 있도록 한 오디오 코덱의 프레임 구성 방법에 관한 것이다.
본 발명은 오디오 코덱의 부호화기에 입력되는 오디오 신호를 프레임 단위로 분할한 후에 트랜스폼을 이용하여 스펙트럼 계수로 변환하는 과정과; 상기 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 할당한 후에 독립적으로 오디오 부호화 처리를 수행하는 과정과; 상기에서 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 과정과; 각 서브프레임마다 스펙트럼 계수들을 고르게 분포시킨 후에 상기 부호화된 주파수 계수 정보와 서브프레임의 무손실 압축 정보를 전송망의 전송 단위로 묶어서 비트스트림에 기록하여 전송하게 하는 과정을 포함하는 오디오 코덱의 프레임 구성 방법을 구현함으로써, 오디오 코덱에서 부호화시 압축 효율을 향상시킬 수 있게 되며, 유선 전송망에 비해 패킷 유실이 잦은 무선 전송망에서 오디오 코덱을 통해 부호화된 오디오 데이터를 전송할 때에 특정 서브프레임에 정보량이 편중되지 않기 때문에 전송 에러에 의한 음질 저하를 최소화할 수 있게 된다.
오디오 코덱, 프레임 구성, 패킷 전송 단위, 무선 전송망, 비트스트림, 양자화

Description

오디오 코덱의 프레임 구성 방법{Method For Formating Frame Of Audio Codec}
도 1은 종래 오디오 코덱의 프레임 구조를 나타낸 도면.
도 2는 본 발명에 따른 부호화 알고리즘이 적용되는 오디오 부호화기를 도시한 도면.
도 3은 본 발명에 따른 오디오 코덱의 프레임 구성 동작을 설명하기 위한 순서도.
도 4는 특정 입력 웨이브 파형에 동일한 에러 패턴을 적용한 경우 본 발명에 따른 오디오 코덱을 통과한 웨이브 파형과 종래의 오디오 코덱을 통과한 웨이브 파형을 예시한 도면.
본 발명은 오디오 코덱에 관한 것으로, 특히 오디오 코덱에서 부호화된 오디오 데이터 프레임을 전송망의 패킷 전송 단위에 맞도록 재구성하여 전송할 수 있도록 한 오디오 코덱의 프레임 구성 방법에 관한 것이다.
일반적으로, 오디오 코덱은 오디오 정보의 저장 또는 전송을 위하여 그 오디오 정보를 부호화/복호화하는 것으로, 부호화기는 입력 오디오 신호를 받아서 일정한 시간 단위인 프레임으로 분할하고, 분할된 프레임을 트랜스폼에 의해 주파수 계수로 변환한 후에 변환된 주파수 계수들을 스케일팩터 밴드 단위로 묶어서 독립적으로 인코딩을 하고 양자화를 거쳐서 부호화하게 된다.
이때, 전술한 부호화기는 양자화 이전에 주파수 계수들이 적당한 범위의 값을 가지도록 만들기 위해서 스케일팩터를 이용하게 되는데, 스케일팩터는 스케일팩터 밴드로 묶인 모든 주파수 계수들에 대해서 동일하게 적용되고, 따라서 하나의 스케일팩터 밴드에서는 하나의 스케일팩터 값이 존재하며, 이후에 양자화를 거쳐서 주파수 계수들을 정수로 표현하게 된다. 그리고, 정수화된 주파수 계수들은 무손실 압축을 거치게 되는데, 무손실 압축을 위한 정보는 스케일팩터 밴드로 묶인 모든 주파수 계수들에 대해서 동일하게 적용되고, 따라서 하나의 스케일팩터 밴드에서는 하나의 무손실 압축 정보가 존재하며, 이렇게 하여 부호화된 주파수 계수 정보, 스케일팩터, 무손실 압축 정보는 최종적으로 저장/전송을 위해서 기록 장치에 이진수 형태로 저장된다.
그리고, 종래의 오디오 코덱에서는 부호화된 주파수 계수 정보, 스케일팩터, 무손실 압축 정보 등이 같은 종류끼리 묶여서 순차적으로 저장되는데, 도 1은 이러한 과정을 거쳐서 이진수 형태로 저장된 오디오 코덱의 비트스트림에서 한 프레임의 구조를 나타낸 도면으로, 프레임 헤더 정보(Header Info)와 부가 정보(Side Info), 서브밴드 샘플(Subband Samples) 및 보조 데이터(Aux Data)를 포함한다.
이러한 오디오 코덱에 있어서, 복호화기는 전술한 정보들을 다시 프레임 단위로 읽어들여 복호화를 수행하게 되는데, 복호화 과정에서 부분적으로 정보를 잃어버리게 되면 해당 프레임은 전체적으로 복호화가 불가능하게 된다.
한편, 전송 단위가 오디오 코덱의 프레임보다 더 작은 전송망, 예컨대 CDMA 전송망과 같은 무선 전송망의 경우 통상적으로 한 패킷이 20msec 길이이므로 오디오 코덱에서 사용하는 프레임보다 짧고, 이러한 경우에 오디오 코덱으로 부호화된 오디오 비트스트림을 전송하기 위해서는 전송망의 패킷 단위로 잘라서 보내게 되는데, 이때, 오디오 코덱에서 복호화 가능한 최소 단위는 프레임이기 때문에 프레임 일부 정보만을 가지고 있는 패킷이 유실되는 경우 프레임 전체가 복호화가 불가능해지는 문제점이 있으며, 이에 따라 낮은 전송 에러율에도 높은 프레임 에러율이 발생하게 되고, 이는 수신단에서의 음질 저하로 이어지는 문제점이 있었다.
본 발명은 전술한 바와 같은 문제점을 해결하기 위한 것으로 그 목적은, 오디오 코덱의 프레임 크기 즉, 서브프레임의 크기를 전송망의 패킷 전송 단위에 맞추어서 독립적으로 조절함으로써 압축 효율을 향상시킬 수 있도록 하는데 있다.
본 발명의 다른 목적은, 오디오 코덱에서 부호화된 오디오 데이터 프레임을 전송망의 패킷 전송 단위에 맞도록 재구성하여 전송하되, 특정 서브프레임에 정보량이 편중되지 않도록 스펙트럼 계수 정보를 각 서브프레임에 가변적으로 고르게 분포시킴으로써 유선 전송망에 비해 패킷 유실이 잦은 무선 전송망에서 오디오 코덱을 통해 부호화된 오디오 데이터를 전송할 때에 전송 에러에 의한 음질 저하를 최소화할 수 있도록 하는데 있다.
상술한 바와 같은 목적을 해결하기 위한 본 발명의 특징은, 오디오 코덱의 부호화기에 입력되는 오디오 신호를 프레임 단위로 분할한 후에 트랜스폼을 이용하여 스펙트럼 계수로 변환하는 과정과; 상기 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 할당한 후에 독립적으로 오디오 부호화 처리를 수행하는 과정과; 상기에서 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 과정과; 각 서브프레임마다 스펙트럼 계수들을 고르게 분포시킨 후에 상기 부호화된 주파수 계수 정보와 서브프레임의 무손실 압축 정보를 전송망의 전송 단위로 묶어서 비트스트림에 기록하여 전송하게 하는 과정을 포함하는 오디오 코덱의 프레임 구성 방법을 구현하는데 있다.
여기서, 상기 오디오 부호화 처리를 수행하는 과정은, 변환된 스펙트럼 계수를 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 균등한 개수의 스케일팩터 밴드를 할당하는 단계와; 상기 각각의 서브프레임에 할당된 스케일팩터 계수들에 대하여 독립적으로 양자화 및 무손실 압축 처리를 수행하는 단계를 포함하는 것을 특징으로 한다.
그리고, 상기 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 과정은, 각각의 서브프레임에 대하여 그 서브프레임 크기가 전송망의 전송 단위를 만족하는지 확인하는 단계와; 상기 서브프레임 크기가 전송망의 전송 단위를 만족하지 않는 경우 해당되는 서브프레임에 할당된 스케일팩터들에서 정보량의 불필요한 부분을 제외시켜 스케일팩터 크기를 줄임으로써 서브프레임 크기를 조절하는 단계와; 상기 크기 조절된 서브프레임에 대하여 다시 오디오 부호화 처리를 수행한 후에 부호화된 서브프레임에 대하여 그 서브프레임 크기가 전송망의 전송 단위를 만족하는지 다시 확인하는 단계를 포함하는 것을 특징으로 한다.
또한, 상기 부호화된 주파수 계수 정보와 서브프레임의 무손실 압축 정보를 비트스트림에 기록하여 전송하는 과정은, 각 서브프레임마다 스펙트럼 계수들을 고르게 분포시키기 위해 각 서브프레임의 스펙트럼 계수 및 부가 압축 정보를 분석하여 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있는지 확인하는 단계와; 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있지 않은 경우 상기 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 양자화 반복 횟수에 반비례하도록 각각의 서브프레임에 스케일팩터 밴드들을 할당한 후에 독립적으로 오디오 부호화 처리를 수행하는 단계와; 상기 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정한 후에 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있는지 확인하는 단계를 반복 수행하는 것을 특징으로 한다.
이때, 상기 양자화 반복 횟수에 반비례하도록 각각의 서브프레임에 스케일팩 터 밴드들을 할당하는 것은, 양자화 반복 횟수가 많은 서브프레임의 경우 스케일팩터 밴드 수를 적게 할당하고, 양자화 반복 횟수가 적은 서브프레임의 경우 스케일팩터 밴드 수를 많게 할당하는 것을 특징으로 한다.
이하, 본 발명에 따른 실시예를 첨부한 도면을 참조하여 상세하게 설명하면 다음과 같다.
본 발명에서는 오디오 코덱의 프레임 크기 즉, 서브프레임의 크기를 전송망의 전송 단위에 맞추어서 독립적으로 조절함으로써 압축 효율을 향상시키고, 동시에 한 서브프레임에 정보량이 편중되지 않도록 스펙트럼 계수 정보를 각 서브프레임에 가변적으로 고르게 분포시킴으로써 음질 저하를 방지하게 되는데, 이를 위한 오디오 코덱의 부호화 알고리즘이 적용되는 오디오 부호화기는 첨부한 도면 도 2와 같은 구성 블록을 가진다.
먼저, 본 발명에 따른 오디오 부호화기의 구성에 대하여 설명하기에 앞서, 오디오 코덱의 프레임 구조에 대하여 설명하면, 이는 프레임 헤더 정보(Header Info)와 부가 정보(Side Info) 및 주파수 계수 정보(Spectral Coefficient Info)를 포함한다. 프레임 헤더 정보는 파일 전체의 설정 정보로서 오디오 코딩된 비트스트림의 프레임 앞부분에 실리는 정보이며, 예를 들어, AAC 프레임 헤더 정보에는 프레임의 샘플링 레이트, 채널 개수, 블럭 타입, 부가적인 인코딩 툴과 같은 정보 등이 포함된다. 부가 정보는 스펙트럼 계수를 복호화하는데 부가적으로 필요한 정보로서 코드북 정보와 스케일팩터(Scalefactor) 계수들이 포함된다. 즉, 스펙트럼 정 보의 복호화를 위해서는 코드화된 스펙트럼 계수와, 이를 복호화 하기 위한 코드북 정보, 그리고 복호화된 스펙트럼 계수를 원래 크기로 복원하기 위해 역양자화에서 사용하는 스케일팩터 계수가 필요하며, 스펙트럼 계수는 스케일팩터 밴드 단위마다 하나의 코드북 정보와 하나의 스케일팩터 계수를 가지며, 스케일팩터 밴드 내의 모든 스펙트럼 계수가 복호화되기 위해서는 해당하는 코드북 정보와 스케일팩터 계수가 모두 필요하다. 주파수 계수 정보는 양자화 과정을 거쳐서 정수화된 값들이 코드북에 의해서 코드워드로 인코딩된 값으로, 인코더에서는 주파수 계수 정보를 부가 정보 뒤에 주파수 계수 인덱스에 맞춰서 차례대로 비트스트림에 싣게 된다.
본 발명에 따른 오디오 코덱의 부호화 알고리즘에 따르면, 오디오 프레임을 분할하는데 있어 비트스트림이 생성되기 이전 단계에서 서브프레임으로 분할하게 되는데, 이때, 전송망의 전송 단위의 크기에 맞춰서 오디오 프레임을 다수 개의 서브프레임으로 분할하고, 한 전송 단위에 한 개의 서브프레임 정보를 실어서 전송한다. 그리고, 전송망에서 임의의 전송 단위가 유실되더라도 다른 전송 단위의 정보를 복호화하는 것에 영향을 주지 않기 위해 각 서브프레임을 동일한 형식을 가지는 독립적인 서브프레임으로 분할한다.
그리고, 본 발명에서 주파수 계수는 스케일팩터 밴드 단위로 분할하되, 심리음향학(Psycho-Acoustics) 모델을 적용하여 스케일팩터 밴드가 분할되고 스케일팩터 값이 결정되면 각 스케일팩터 밴드의 주파수 계수와 해당되는 스케일팩터를 각 서브프레임으로 분할한다.
또한, 본 발명에서 서브프레임의 독립적인 크기 조절은 각 서브프레임이 독 립적으로 복호화 가능하도록 스케일팩터 단위로 분할한 후에 수행하게 되는데, 이때, 스케일팩터 단위로 주파수 계수를 분할하면 어느 한 스케일팩터 밴드 내에 주파수 계수는 해당 스케일팩터 밴드의 스케일팩터 계수에 의해 양자화 단계가 결정되므로, 분할된 서브프레임 내에 속해 있는 스케일팩터들을 조정해서 서브프레임의 크기를 조절한다. 즉, 각 서브프레임 내에 분할된 스케일팩터들의 정보량을 체크하여 정보량이 작은 스케일팩터를 제외시킴으로써 서브프레임의 크기를 조절한다. 이때, 정보량이 작은 스케일팩터를 제외시키는 이유는 정보량이 많은 스케일팩터를 제외시키는 경우 복호화시 부족한 정보량 때문에 음원의 왜곡이 많이 발생하여 전체적인 음질을 저하시키기 때문이다.
그리고, 서브프레임의 독립적인 크기 조절과 관련하여, 현재 프레임의 정보량 분포에 맞게 가변적으로 각 서브프레임의 스케일팩터 밴드를 배분하게 되며, 이렇게 인코더에서 배분한 정보를 디코더에서도 가지고 있어야 복호화가 가능하므로 해당 스케일팩터 밴드의 경계 정보를 부가 정보로서 비트스트림에 추가하여 전송하게 되는데, 이때, 스케일팩터 밴드의 경계 정보는 어느 한 서브프레임이 유실되어 해당 스케일팩터 밴드의 경계 정보를 가질 수 없더라도 다른 서브프레임들은 이에 영향을 받지 않고 자신의 경계를 알 수 있어야 하고, 또한 가장 적은 비트를 차지하는 것이 바람직하므로, 각 서브프레임의 스케일팩터 밴드 경계 시작점의 절대 위치를 정수로 표현하고, 또한 각 서브프레임에 할당된 스케일팩터 밴드의 길이를 정수로 표현한다.
또한, 각 서브프레임에 얼마나 많은 스케일팩터 밴드를 할당할 것인지를 결 정하는데 있어, 이는 음질이 가장 적게 손상되도록 할당해야 하며, 일례로서, 인코더에서 서브프레임의 크기를 만족시키기 위해서 초기 양자화 단계에서 출발해서 스케일 팩터를 조절해서 양자화 단계를 줄여나가는 반복 횟수를 참고하여 스케일팩터 밴드 할당을 결정하게 되는데, 즉, 양자화 반복 횟수가 많을수록 해당 서브프레임에 정보량이 부족함을 의미하므로 양자화 반복 횟수가 많은 서브프레임의 스케일팩터 밴드 수를 줄여서 할당될 정보를 줄이고, 반대로, 양자화 반복 횟수가 적은 서브프레임의 경우 스케일팩터 밴드 수를 늘려서 할당될 정보를 늘이는 과정을 반복함으로써 주파수 계수 정보를 각 서브프레임에 균등하게 분배할 수 있게 된다.
한편, 도 2에 도시한 본 발명에 따른 오디오 부호화기의 구성을 살펴보면, 입력 오디오 데이터는 트랜스폼을 거쳐서 주파수 계수로 구해지고, 그 주파수 계수를 양자화 및 무손실 압축함으로써 부호화된 스펙트럼 계수와 부가 압축 정보를 구하게 되며, 이렇게 구해진 스펙트럼 계수와 부가 압축 정보를 이진수 형태의 비트스트림 형태로 기록함으로써 오디오의 보호화가 완료된다.
본 발명에 따른 오디오 코덱의 프레임 구성 동작에 대하여 첨부한 도면 도 3을 참조하여 상세하게 설명하면 다음과 같다.
먼저, 오디오 코덱의 부호화기에 소정의 오디오 신호가 입력되면, 그 오디오 신호를 일정 시간 단위인 프레임으로 분할한 후, 분할된 프레임을 트랜스폼을 이용하여 주파수 계수 즉, 스펙트럼 계수로 변환하게 된다(스텝 S31).
이렇게 변환된 스펙트럼 계수를 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 균등한 개수의 스케일팩터 밴드를 할당한 후(스텝 S32), 각각의 서브프 레임에 할당된 스케일팩터 계수들에 대하여 독립적으로 오디오 부호화 처리 즉, 양자화 및 무손실 압축 처리를 수행하게 된다(스텝 S33).
그리고, 양자화 및 무손실 압축 처리를 통해 부호화된 각각의 서브프레임에 대하여 그 서브프레임 크기가 전송망의 전송 단위를 만족하는지 확인하게 된다(스텝 S34).
이때, 서브프레임 크기가 전송망의 전송 단위를 만족하지 않는 경우 해당 서브프레임에 할당된 스케일팩터들을 조정해서 즉, 정보량의 불필요한 부분을 제외시켜 스케일팩터 크기를 줄임으로써 서브프레임 크기를 조절하게 되며(스텝 S35), 서브프레임 크기를 조절한 후에는 스텝 S33의 과정으로 귀환하여 해당 서브프레임에 대하여 다시 양자화 및 무손실 압축 처리를 수행한 후, 이렇게 하여 부호화된 서브프레임에 대하여 그 서브프레임의 크기가 전송망의 전송 단위를 만족하는지 다시 확인하게 된다. 이렇게 함으로써 즉, 전송망의 전송 단위를 만족하지 못하는 각 서브프레임에 할당된 스케일팩터 크기를 조정하는 동작을 반복 수행함으로써 각 서브프레임 크기가 전송망의 전송 단위를 만족하도록 조정하게 된다.
이후, 하나의 프레임을 구성하는 각 서브프레임의 크기가 전송망의 전송 단위를 만족하게 되면, 최종적으로 양자화 및 무손실 압축 처리를 통해 부호화된 각 서브프레임의 스펙트럼 계수 및 부가 압축 정보를 분석하여(스텝 S36), 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있는지를 확인하게 된다(스텝 S37).
이때, 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있다면 양자화 및 무손실 압축 처리를 통해 부호화된 주파수 계수 정보와 해당 서브프레임의 무손실 압축 정보를 전송망의 전송 단위로 묶어서 비트스트림에 기록하여 전송하게 된다(스텝 S38).
하지만, 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있지 않다면 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 스케일팩터 밴드를 다시 할당하게 되는데, 이때, 양자화 반복 횟수에 반비례하도록 각각의 서브프레임에 스케일팩터 밴드들을 할당하게 된다. 즉, 양자화 반복 횟수가 많은 서브프레임의 경우 스케일팩터 밴드 수를 적게 할당하고, 양자화 반복 횟수가 적은 서브프레임의 경우 스케일팩터 밴드 수를 많게 할당하게 된다(스텝 S39). 이렇게 하여 각각의 서브프레임에 스케일벡터 밴드를 할당한 후에는 각 서브프레임에 할당된 스케일팩터 계수들에 대하여 독립적으로 오디오 부호화 처리 즉, 양자화 및 무손실 압축 처리를 수행하고, 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 일련의 동작을 반복 수행함으로써 각 서브프레임마다 스펙트럼 계수들이 고르게 분포시키게 된다.
예를 들어, AAC+(Advanced Audio Codec Plus) 오디오 코덱에서 부호화된 오디오 데이터를 CDMA 전송망을 통해 전송하는 경우 CDMA 전송망은 한 패킷당 8.4 kbps에서 20 ms의 길이를 가지며, AAC의 비트스트림을 CDMA 전송망에 올려서 전송하려면 CDMA 전송망의 패킷 전송 단위로 잘라서 전송해야 한다. 즉, AAC 프레임은 한 패킷당 92.88 msec로서 CDMA 전송망의 한 패킷보다 크기 때문에 여러 부분으로 나누어서 전송해야 하는데, 만약에 AAC 비트스트림을 CDMA 패킷 전송 단위로 그대로 잘라서 전송하면 종래기술에서 기재한 바와 같이 패킷이 전송 도중에 유실되었 을 때 여러가지 문제점이 발생하게 된다. 따라서, 본 발명에서는 AAC 프레임을 CDMA 패킷 단위로 독립적으로 복호화가 가능하도록 구성하여 잦은 에러에 대처할 수 있도록 하였다.
반복\패킷 0 1 2 3 4
0 4(8) 1 (8) 1 (7) 2 (7) 3 (7)
1 1(7) 1 (9) 1 (7) 2 (7) 3 (7)
2 4 (8) 1 (9) 1 (7) 3 (7) 2 (6)
3 1 (7) 1 (10) 1 (7) 3 (7) 2 (6)
4 4 (8) 1 (10) 1 (7) 2 (6) 2 (6)
5 4 (7) 1 (11) 1 (7) 2 (6) 1 (6)
6 1 (8) 3 (11) 1 (7) 2 (6) 1 (5)
7 1 (7) 1 (12) 1 (7) 2 (6) 1 (5)
8 4 (7) 1 (11) 1 (8) 1 (6) 1 (5)
9 1 (8) 3 (11) 1 (8) 1 (5) 1 (5)
10 1 (7) 3 (12) 1 (8) 1 (5) 1 (5)
11 1 (7) 1 (11) 1 (9) 1 (5) 1 (5)
표 1은 상술한 오디오 코덱의 프레임 구성 동작을 통해서 각 패킷에 스케일팩터 밴드가 고르게 분배되어가는 모습을 보여주기 위한 것으로, 각 패킷의 양자화 단계 반복 횟수를 보여주고 있으며, 여기서, 괄호 안의 숫자는 각 패킷에 할당된 스케일팩터 밴드의 개수를 나타낸다. 표 1을 살펴보면, 각 패킷의 양자화 단계 반복 횟수는 부호화 알고리즘의 반복에 따라서 고르게 분배되어 가며, 그 전체적인 개수도 줄어들게 됨을 알 수 있다. 이러한 부호화 알고리즘의 반복 과정을 통해 모든 서브프레임은 비슷한 반복 횟수를 가지게 되고, 이는 모든 서브프레임들이 유사한 정도의 정보량을 배분받았음을 의미한다.
그리고, 프레임 구성을 통해서 얻은 각 서브프레임을 CDMA 전송망을 통해 전송하는데 있어, 전송 단위 에러가 발생했을 때의 음질 향상 여부는 CDMA 패킷 에러를 시뮬레이션하여 복호화된 음악을 청취해서 비교할 수 있으며, 또한 첨부한 도면 도 4에 예시한 바와 같이 그 파형을 비교하여 확인할 수도 있는데, 예를 들어, 입력 원본 파일인 CRBT(Color Ring Back Tone) 샘플 웨이브 파일(wav 파일)의 파형이 도 4의 (가)와 같다고 가정(여기서, 샘플의 길이는 500 msec 정도임)할 때, 실측 CDMA 에러 패턴을 동일하게 적용하는 경우 예컨대, 집중된 에러와 분산된 에러의 특성을 동시에 가지도록 에러 패턴 '0 1 1 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 1 1 0 1 1 1 0'을 적용하는 경우 본 발명의 오디오 코덱을 통과한 웨이브 파일의 파형은 도 4의 (나)와 같으며, 종래의 오디오 코덱을 통과한 웨이브 파일의 파형은 도 4의 (다)와 같이 나타난다. 이를 비교하여 보면, 종래의 오디오 코덱은 에러 패턴이 발생했을 때 입력 웨이브 파일의 파형을 정상적으로 재현하지 못하는 반면, 본 발명의 오디오 코덱은 에러 패턴이 발생했을 때 패킷의 1/3 가량이 유실됨에도 불구하고 프레임 재구성으로 인해 입력 웨이브 파일의 파형을 충실히 재현하고 있음을 알 수 있다.
또한, 본 발명에 따른 실시예는 상술한 것으로 한정되지 않고, 본 발명과 관련하여 통상의 지식을 가진자에게 자명한 범위내에서 여러 가지의 대안, 수정 및 변경하여 실시할 수 있다.
이상과 같이, 본 발명은 오디오 코덱에서 부호화된 오디오 데이터 프레임을 전송망의 패킷 전송 단위에 맞도록 재구성하여 전송하되, 오디오 코덱의 프레임 크기 즉, 서브프레임의 크기를 전송망의 패킷 전송 단위에 맞추어서 독립적으로 조절 함으로써 압축 효율을 향상시킬 수 있게 되며, 또한, 특정 서브프레임에 정보량이 편중되지 않도록 스펙트럼 계수 정보를 각 서브프레임에 가변적으로 고르게 분포시킴으로써 유선 전송망에 비해 패킷 유실이 잦은 무선 전송망에서 오디오 코덱을 통해 부호화된 오디오 데이터를 전송할 때에 특정 서브프레임에 정보량이 편중되지 않기 때문에 전송 에러에 의한 음질 저하를 최소화할 수 있게 된다.

Claims (5)

  1. 오디오 코덱의 부호화기에 입력되는 오디오 신호를 프레임 단위로 분할한 후에 트랜스폼을 이용하여 스펙트럼 계수로 변환하는 과정과;
    상기 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 할당한 후에 독립적으로 오디오 부호화 처리를 수행하는 과정과;
    상기에서 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 과정과;
    각 서브프레임마다 스펙트럼 계수들을 고르게 분포시킨 후에 상기 부호화된 주파수 계수 정보와 서브프레임의 무손실 압축 정보를 전송망의 전송 단위로 묶어서 비트스트림에 기록하여 전송하게 하는 과정을 포함하는 것을 특징으로 하는 오디오 코덱의 프레임 구성 방법.
  2. 제 1항에 있어서,
    상기 오디오 부호화 처리를 수행하는 과정은, 변환된 스펙트럼 계수를 스케일팩터 밴드 단위로 분할하여 각각의 서브프레임에 균등한 개수의 스케일팩터 밴드를 할당하는 단계와;
    상기 각각의 서브프레임에 할당된 스케일팩터 계수들에 대하여 독립적으로 양자화 및 무손실 압축 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 오디 오 코덱의 프레임 구성 방법.
  3. 제 1항에 있어서,
    상기 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정하는 과정은, 각각의 서브프레임에 대하여 그 서브프레임 크기가 전송망의 전송 단위를 만족하는지 확인하는 단계와;
    상기 서브프레임 크기가 전송망의 전송 단위를 만족하지 않는 경우 해당되는 서브프레임에 할당된 스케일팩터들에서 정보량의 불필요한 부분을 제외시켜 스케일팩터 크기를 줄임으로써 서브프레임 크기를 조절하는 단계와;
    상기 크기 조절된 서브프레임에 대하여 다시 오디오 부호화 처리를 수행한 후에 부호화된 서브프레임에 대하여 그 서브프레임 크기가 전송망의 전송 단위를 만족하는지 다시 확인하는 단계를 포함하는 것을 특징으로 하는 오디오 코덱의 프레임 구성 방법.
  4. 제 1항에 있어서,
    상기 부호화된 주파수 계수 정보와 서브프레임의 무손실 압축 정보를 비트스트림에 기록하여 전송하는 과정은, 각 서브프레임마다 스펙트럼 계수들을 고르게 분포시키기 위해 각 서브프레임의 스펙트럼 계수 및 부가 압축 정보를 분석하여 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있는지 확인하는 단계와;
    각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있지 않은 경우 상기 스펙트럼 계수들을 스케일팩터 밴드 단위로 분할하여 양자화 반복 횟수에 반비례하도록 각각의 서브프레임에 스케일팩터 밴드들을 할당한 후에 독립적으로 오디오 부호화 처리를 수행하는 단계와;
    상기 부호화된 각각의 서브프레임 크기가 전송망의 전송 단위를 만족하도록 스케일팩터를 조정한 후에 각 서브프레임마다 스펙트럼 계수들이 고르게 분포되어 있는지 확인하는 단계를 반복 수행하는 것을 특징으로 하는 오디오 코덱의 프레임 구성 방법.
  5. 제 4항에 있어서,
    상기 양자화 반복 횟수에 반비례하도록 각각의 서브프레임에 스케일팩터 밴드들을 할당하는 것은, 양자화 반복 횟수가 많은 서브프레임의 경우 스케일팩터 밴드 수를 적게 할당하고, 양자화 반복 횟수가 적은 서브프레임의 경우 스케일팩터 밴드 수를 많게 할당하는 것을 특징으로 하는 오디오 코덱의 프레임 구성 방법.
KR1020060051735A 2006-06-09 2006-06-09 오디오 코덱의 프레임 구성 방법 KR100746050B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060051735A KR100746050B1 (ko) 2006-06-09 2006-06-09 오디오 코덱의 프레임 구성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060051735A KR100746050B1 (ko) 2006-06-09 2006-06-09 오디오 코덱의 프레임 구성 방법

Publications (1)

Publication Number Publication Date
KR100746050B1 true KR100746050B1 (ko) 2007-08-06

Family

ID=38601849

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060051735A KR100746050B1 (ko) 2006-06-09 2006-06-09 오디오 코덱의 프레임 구성 방법

Country Status (1)

Country Link
KR (1) KR100746050B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017039422A3 (ko) * 2015-09-04 2017-04-20 삼성전자 주식회사 음질 향상을 위한 신호 처리방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040104647A (ko) * 2002-04-26 2004-12-10 닛본 덴끼 가부시끼가이샤 오디오 데이터의 부호 변환 전송 방법과 부호 변환 수신방법 및 장치와 시스템 및 프로그램
KR100634733B1 (ko) 2005-11-14 2006-10-16 엠큐브웍스(주) 오디오 비트스트림의 패킷 전송 제어 방법
KR20070031089A (ko) * 2005-09-14 2007-03-19 에스케이 텔레콤주식회사 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법
KR100706968B1 (ko) 2005-10-31 2007-04-12 에스케이 텔레콤주식회사 오디오 데이터 패킷 생성 장치 및 이의 복조 방법
KR20070046313A (ko) * 2005-10-31 2007-05-03 엠큐브웍스(주) 오디오 비트 스트림을 보코더 패킷 단위로 전송하는 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040104647A (ko) * 2002-04-26 2004-12-10 닛본 덴끼 가부시끼가이샤 오디오 데이터의 부호 변환 전송 방법과 부호 변환 수신방법 및 장치와 시스템 및 프로그램
KR20070031089A (ko) * 2005-09-14 2007-03-19 에스케이 텔레콤주식회사 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법
KR100706968B1 (ko) 2005-10-31 2007-04-12 에스케이 텔레콤주식회사 오디오 데이터 패킷 생성 장치 및 이의 복조 방법
KR20070046313A (ko) * 2005-10-31 2007-05-03 엠큐브웍스(주) 오디오 비트 스트림을 보코더 패킷 단위로 전송하는 방법
KR100634733B1 (ko) 2005-11-14 2006-10-16 엠큐브웍스(주) 오디오 비트스트림의 패킷 전송 제어 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017039422A3 (ko) * 2015-09-04 2017-04-20 삼성전자 주식회사 음질 향상을 위한 신호 처리방법 및 장치
US10803877B2 (en) 2015-09-04 2020-10-13 Samsung Electronics Co., Ltd. Signal processing methods and apparatuses for enhancing sound quality
US11380338B2 (en) 2015-09-04 2022-07-05 Samsung Electronics Co., Ltd. Signal processing methods and apparatuses for enhancing sound quality

Similar Documents

Publication Publication Date Title
KR100935961B1 (ko) 부호화 장치 및 복호화 장치
KR101343267B1 (ko) 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치
US7774205B2 (en) Coding of sparse digital media spectral data
KR101330362B1 (ko) 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스
US7539612B2 (en) Coding and decoding scale factor information
JP3926726B2 (ja) 符号化装置および復号化装置
US7333929B1 (en) Modular scalable compressed audio data stream
US11437053B2 (en) Audio decoding device, audio encoding device, audio decoding method, audio encoding method, audio decoding program, and audio encoding program
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
JP2023175750A (ja) オーディオ送信プロセッサ、オーディオ受信プロセッサ、および関連方法ならびにコンピュータプログラム
US5673289A (en) Method for encoding digital audio signals and apparatus thereof
JP4308229B2 (ja) 符号化装置および復号化装置
KR20040086880A (ko) 디지털 데이터의 부호화/복호화 방법 및 장치
KR100746050B1 (ko) 오디오 코덱의 프레임 구성 방법
JP3811110B2 (ja) ディジタル信号符号化方法、復号化方法、これらの装置、プログラム及び記録媒体
JPH0787330A (ja) 画像符号化方法
Yung et al. Unequal error protection for wireless transmission of MPEG audio
JP2523286B2 (ja) 音声符号化及び復号化方法
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP4351684B2 (ja) ディジタル信号復号化方法、装置、プログラム及び記録媒体
JPH0836399A (ja) オーディオ符号化データの処理装置
JPH0470800A (ja) 音声情報圧縮装置
JP2001100796A (ja) オーディオ信号符号化装置
JPH04302531A (ja) ディジタルデータの高能率符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130620

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140619

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150622

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 13