KR20100054749A - 신호의 처리 방법 및 이의 장치 - Google Patents

신호의 처리 방법 및 이의 장치 Download PDF

Info

Publication number
KR20100054749A
KR20100054749A KR1020090109742A KR20090109742A KR20100054749A KR 20100054749 A KR20100054749 A KR 20100054749A KR 1020090109742 A KR1020090109742 A KR 1020090109742A KR 20090109742 A KR20090109742 A KR 20090109742A KR 20100054749 A KR20100054749 A KR 20100054749A
Authority
KR
South Korea
Prior art keywords
window
frame
property
current
property information
Prior art date
Application number
KR1020090109742A
Other languages
English (en)
Inventor
윤성용
이현국
김동수
임재현
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to PCT/KR2009/006714 priority Critical patent/WO2010058931A2/en
Publication of KR20100054749A publication Critical patent/KR20100054749A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 이전 윈도우 프레임에서 이용된 윈도우의 종류를 나타내는 이전 윈도우 프레임의 윈도우 속성을 획득하는 단계; 현재 윈도우 프레임에 이용되는 윈도우 중 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 추출하는 단계; 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우, 상기 제 1 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 않는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 추출하는 단계; 및 상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 및 상기 현재 윈도우 프레임의 윈도우 속성에 기초하여 오디오 신호를 디코딩하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법 및 이의 장치를 개시한다.
본 발명의 신호 처리 방법 및 장치에 따르면, 현재 프레임에 적용되는 현재 윈도우 프레임의 오른쪽 윈도우의 특징 및 MDCT 변환 단위를 나타내는 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용할 뿐만 아니라, 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정함으로써, 윈도우 속성을 나타내기 위하여 할당된 비트수를 감소시킬 수 있다.
Figure P1020090109742
윈도우 프레임, 윈도우 속성, 롱 윈도우, 제 1 윈도우 속성 정보

Description

신호의 처리 방법 및 이의 장치{A METHOD AND APPARATUS FOR PROCESSING A SIGNAL}
본 발명은 제 1 윈도우 속성 정보, 제 2 윈도우 속성 정보 및 이전 프레임의 윈도우 속성을 이용하여 현재 프레임의 윈도우 속성을 결정하여 이용함으로써 이용되는 윈도우 속성을 전송하기 위한 비트수를 감소시킬 수 있는 신호 처리 방법 및 장치에 관한 것이다.
일반적으로, 오디오 또는 음성 신호의 코딩시 9가지 종류의 윈도우 속성 (window sequence)를 이용하여 신호를 코딩할 수 있다.
현재 프레임의 신호 코딩시 이용되는 윈도우 속성은 이전 프레임의 윈도우 속성에 의존적이기 때문에, 실질적으로는 이용가능한 현재 프레임의 윈도우 속성을 표현하기 위하여 할당되는 비트수는 모든 윈도우 속성을 표현하기 위하여 할당되는 비트수보다 적을 수 있다는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 제 1 윈도우 속성 정보, 제 2 윈도우 속성 정보 및 이전 프레임의 윈도우 속성을 이용하여 현재 프레임의 윈도우 속성을 결정함으로써, 더 적은 비트수를 이용하여 표현된 현재 프레임의 윈도우 속성을 이용하는 신호의 처리 방법 및 장치를 제공하는데 그 목적이 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 본 발명의 신호 처리 장치 및 방법은, 현재 프레임에 적용되는 현재 윈도우 프레임의 오른쪽 윈도우의 특징 및 MDCT 변환 단위를 나타내는 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용할 뿐만 아니라, 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정함으로써, 윈도우 속성을 나타내기 위하여 할당된 비트수를 감소시킬 수 있는 효과를 갖는다.
둘째, 본 발명의 신호 처리 장치 및 방법은, 현재 윈도우 프레임의 윈도우 속성을 나타내는 정보들 중에서 가장 많이 이용되는 윈도우 속성에 0(02)을 할당함으로써, 인코더로부터 전송되는 전체 비트수를 크게 감소시킬 수 있게 된다.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 신호 처리 방법은, 이전 윈도우 프레임에서 이용된 윈도우의 종류를 나타내는 이전 윈도우 프레임의 윈도우 속성을 획득하는 단계; 현재 윈도우 프레임에 이용되는 윈도우 중 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 추출하는 단계; 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우, 상기 제 1 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 않는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 추출하는 단계; 및 상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 및 상기 현재 윈도우 프레임의 윈도우 속성에 기초하여 오디오 신호를 디코딩하는 단계를 포함할 수 있다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가 장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 발명에서 코딩이라 함은, 인코딩 및 디코딩을 모두 포함하는 개념으로 이해되어야 한다.
또한, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다. 그리고, 본 명세서에서 신호의 일 예로 스테레오 신호를 설명하나, 이에 한정되지 아니하고, 3 개 이상의 복수 개의 채널을 갖는 복수채널 신호일 수 있다.
음악성분이 강한 오디오 신호와 음성성분이 강한 음성 신호는 서로 다른 특징으로 가지고 있어, 동일한 코딩장치를 이용하여 코딩하는 경우 원음을 복원할 수 없는 문제점을 가지고 있다. 따라서, 각 신호에 적합한 코딩장치를 이용하여 신호를 코딩하여야 한다. 오디오 신호의 경우 코딩시 각 프레임의 샘플들을 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT)을 거쳐 주파수 도메인의 값으로 변환한다. 이 때, 프레임마다 오디오 신호의 특성에 따라 결정된 윈도우를 적용하고, 윈도우가 적용된 오디오 신호에 이산 코사인 변환을 수행하는 방식을 채택한다.
도 1 은 본 발명의 신호 코딩 장치에서 이용되는 윈도우의 적용단위를 나타내는 개념도이다. 도 1을 참조하면, 먼저 오디오 신호는 복수개의 프레임(110)으로 구획될 수 있다. 한편, 오디오 신호에 적용되는 윈도우 프레임(120, 130...)의 길이는 오디오 신호의 현재 프레임의 길이와 이전 프레임의 길이를 더한 것과 같을 수 있다. 예를 들어, 윈도우 프레임 2(140)의 길이는 오디오 신호의 프레임 1(112)의 길이와 프레임 2(113)의 길이를 더한 것과 같고, 윈도우 프레임 3(150)의 길이는 오디오 신호의 프레임 2(113)와 프레임 3(114)의 길이를 더한 것과 같다. 또한, 이후의 변형 이산 코사인 변환은 윈도우가 적용된 오디오 신호의 단위로, 즉, 오디오 신호의 프레임이 1024 샘플로 이루어진 경우 2048 샘플 단위로 수행될 수 있다.
본 명세서에서는 상술한 바와 같이, 일반적인 오디오 신호의 프레임과 윈도우가 적용되는 단위인 윈도우 프레임을 구별하여 지칭하기로 한다.
윈도우 프레임에 적용되는 윈도우 속성(window feature)은 음성 신호에 이용되는 LPD 시퀀스(LPD_sequence)가 있고, 오디오 신호에는 온리 롱 시퀀스(ONLY_LONG_SEQUENCE), 롱 스타트 시퀀스(LONG_START_SEQUENCE), 팔 쇼트 시퀀스(EIGHT_SHORT_SEQUENCE), 롱 스탑 시퀀스(LONG_STOP_SEQUENCE), 스탑 스타트 시퀀스(STOP_START_SEQUENCE), LPD 스타트 시퀀스(LPD_START_SEQUENCE), 스탑 1152 시퀀스(STOP_1152_SEQUENCE) 및 스탑 스타트 1152 시퀀 스(STOP_START_1152_SEQUENCY)를 포함한다.
오디오 신호의 경우 윈도우 프레임에 적용될 수 있는 8 종류의 윈도우 속성이 있으므로, 이들을 표현하기 위하여 윈도우 속성에 3비트(
Figure 112009069872487-PAT00001
)를 할당하여 나타낼 수 있다. 그러나 실제 윈도우 속성은 이전 윈도우 프레임의 윈도우 속성에 의존하므로 이들간의 관계를 반영하면 현재 윈도우 프레임의 윈도우 속성을 나타내기 위하여 필요한 비트수를 감소시킬 수 있을 것이다.
다시 도 1을 참조하면, 현재 윈도우 프레임이 윈도우 프레임 3(150)인 경우, 윈도우 프레임 3(150)의 윈도우 속성은 오디오 신호의 프레임 2(113) 및 프레임 3(114)에 적용될 것이다. 한편, 프레임 2(113)은 이전 윈도우 프레임인 윈도우 프레임 2(140)에도 포함되는 바, 프레임 2(113)에 대응하는 윈도우 속성은 이미 윈도우 프레임 2(140)의 윈도우 속성으로 정해진 바 있다. 따라서, 윈도우 프레임 3(150)의 윈도우 속성 중 왼쪽 윈도우의 모양(프레임 2에 대응하는 윈도우 모양)은 이전 윈도우 프레임과 하기 조건을 만족시키는 모양으로 결정된다.
Figure 112009069872487-PAT00002
Figure 112009069872487-PAT00003
또한, 프레임 3(114)에 대응하는 윈도우 프레임 3(150)의 오른쪽 윈도우의 모양은 프레임 3(114)의 오디오 신호의 특성에 따라 결정되어 윈도우 프레임 3(150)의 윈도우 속성을 상기 8가지 종류 중에서 결정할 수 있다.
이와 같이, 윈도우 프레임의 윈도우 속성은 입력 신호의 특성뿐만 아니라, 이전 윈도우 프레임의 윈도우 속성에 의존하므로, 실질적으로 현재 윈도우 프레임의 윈도우 속성으로 결정될 수 있는 윈도우 속성의 종류는 제한적일 수 있다. 따라서, 본 발명의 일실시예에서는 현재 윈도우 프레임의 윈도우 속성이 제한적일 수 있는 특징을 반영하여 윈도우 속성을 나타내기 위하여 할당되는 비트수를 감소시키는 신호 처리 방법 및 장치를 제공한다.
도 2은 본 발명의 실시예에 따른 신호 인코딩 장치(200)를 나타낸다. 도 2을 참조하면, 신호 인코딩 장치(200)는 수신부(210), 오른쪽 윈도우 형상 결정부(220), 제 1 윈도우 속성 정보 생성부(230), 제 2 윈도우 속성 정보 생성부(240), 윈도우 적용부(250), MDCT부(260) 및 멀티플렉서(270)를 포함한다.
수신부(210)는 이전 윈도우 프레임의 윈도우 속성과 현재 프레임의 입력 신호를 수신할 수 있다. 상술한 바와 같이, 현재 윈도우 프레임은 현재 프레임과 이전 프레임에 적용되는 단위이다. 다시 도 1을 참조하면, 윈도우 프레임 3(150)은 현재 프레임인 프레임 3(114)와 이전 프레임인 프레임 2(113)에 적용될 수 있다. 따라서, 수신부(210)는 현재 프레임이 프레임 3(114)인 경우, 이전 윈도우 프레임인 윈도우 프레임 2(140)의 윈도우 속성과 프레임 3(114)에 해당하는 입력 신호를 수신할 수 있다.
오른쪽 윈도우 형상 결정부(220)는 상기 입력 신호(프레임 3)의 특징에 따라 윈도우 프레임 3(150)의 오른쪽 윈도우의 모양을 결정한다. 예를 들어, 상기 입력 신호의 프레임 길이가 1024 샘플인 롱 프레임인 경우 또는 128 샘플인 쇼트 프레임인 경우에 따라 현재 윈도우 프레임의 오른쪽 윈도우의 모양이 다르게 결정된다.
제 1 윈도우 속성 정보 생성부(230)는 결정된 오른쪽 윈도우의 모양을 기초로 하여 제 1 윈도우 속성 정보(first window feature information)을 생성하는데, 바람직하게는 오른쪽 윈도우의 기울기의 길이를 기초로 한다. 바람직하게는, 상기 입력 신호의 프레임 길이를 참조하여 결정될 수 있고, 상세한 의미는 도 3 을 참조하여 상세히 후술하기로 한다.
제 2 윈도우 속성 정보 생성부(240)는 상기 제 1 윈도우 속성 정보가 오른쪽 윈도우 기울기의 길이가 롱 윈도우 기울기의 길이를 나타내지 아니하는 경우에만 제 2 윈도우 속성 정보(second window feature information)를 생성한다. 상기 제 2 윈도우 속성 정보는 현재 윈도우 프레임의 주파수 변환 단위(MDCT unit)를 나타낼 수 있는데, 이와 관련된 상세한 설명도 도 3을 참조하여 후술하기로 한다.
윈도우 적용부(250)는 상기 결정된 현재 윈도우 프레임의 윈도우 속성을 현재 프레임 및 이전 프레임에 적용할 수 있고, MDCT부(260)는 윈도우 속성이 적용된 윈도우 프레임 단위로 시간 도메인의 신호를 주파수 신호(frequency spectrum)로 변환하며, 변환된 주파수 신호를 디코더단으로 전송할 수 있다.
멀티플렉서(270)는 현재 윈도우 프레임의 윈도우 속성, 제 1 윈도우 속성 정보, 제 2 윈도우 속성 정보 및 주파수 신호로 변환된(MDCT 변환된 신호)를 하나의 비트스트림에 포함시켜 인코딩 장치(200)로부터 출력한다.
한편, 현재 윈도우 프레임의 윈도우 속성(예, 윈도우 프레임 3의 윈도우 속 성)은 현재 프레임(예, 프레임 3)에 시간적으로 뒤에 위치하는 다음 프레임(next frame, 예, 프레임 4)에 적용되는 윈도우 프레임을 결정하는 경우, 이전 윈도우 프레임의 윈도우 속성으로써 필요하다. 따라서, 인코딩 장치(200)는 현재 윈도우 프레임의 프레임 속성을 저장하는 윈도우 속성 저장부(미도시)를 더 포함할 수 있다.
도 3는 도 1 의 제 1 윈도우 속성 정보 생성부 및 제 2 윈도우 속성 정보 생성부의 상세도를 나타내는 것이다. 도 3을 참조하면, 제 1 윈도우 속성 정보 생성부(310)는 결정된 오른쪽 윈도우의 모양을 기초로 하여 제 1 윈도우 속성 정보(first window feature information)을 생성하는데, 바람직하게는 오른쪽 윈도우의 기울기의 길이를 기초로 한다. 더 바람직하게, 상기 제 1 윈도우 속성 정보는 오른쪽 윈도우가 롱 윈도우인 1024 샘플동안 동일한 기울기를 갖는지 여부를 나타내고, 다시 말해, 오른쪽 윈도우의 기울기의 길이가 롱 윈도우의 길이를 나타내는지 여부를 나타내며, 그 의미는 하기 표 1과 같다.
제 1 윈도우 속성 정보(first window feature information) 의미
0 오른쪽 윈도우 기울기의 길이가 롱 윈도우 기울기의 길이를 나타내는 경우
1 오른쪽 윈도우 기울기의 길이가 롱 윈도우 기울기의 길이를 나타내지 않는 경우
제 2 윈도우 속성 정보 생성부(320)는 상기 제 1 윈도우 속성 정보가 오른쪽 윈도우 기울기의 길이가 롱 윈도우 기울기의 길이를 나타내지 아니하는 경우에만 제 2 윈도우 속성 정보(second window feature information)를 생성한다. 상기 제 2 윈도우 속성 정보는 현재 윈도우 프레임의 주파수 변환 단위(MDCT unit)에 기초하여 결정되며, 제 2 윈도우 속성 정보 생성부(320)는 MDCT 단위 길이 결정부(321) 및 제 2 윈도우 속성 정보 결정부(322)를 포함한다.
MDCT 단위 길이 결정부(321)는 시간 단위로 이루어진 현재 윈도우 프레임를 주파수 신호로 변환하기 위하여 변형 이산코사인 변환(MDCT)를 수행할 때, 이용되는 단위의 길이를 결정한다. MDCT 단위 길이 결정부(321)는, 바람직하게는, 변형 이산코사인 변환 단위를 롱 윈도우의 길이인 1024 샘플 또는 1152 샘플 단위인지 결정하거나, 쇼트 윈도우의 길이인 128 샘플 단위인지 결정할 수 있다.
제 2 윈도우 속성 정보 결정부(322)는 MDCT 단위 길이 결정부(321)에서 결정된 변형 이산코사인 변환 단위의 길이에 기초하여 제 2 윈도우 속성 정보(second window feature information determining unit)를 결정하고, 제 2 윈도우 속성 정보의 상세한 의미는 다음 표 2와 같다.
제 2 윈도우 속성 정보(second window feature information) 의미
0 윈도우 프레임의 주파수 변환 단위가 1024 샘플 또는 1152 샘플인 경우
1 윈도우 프레임의 주파수 변환 단위가 128 샘플인 경우
도 4는 본 발명의 일실시예에 따른 신호 처리 디코딩 장치(400)를 나타내는 개략도이다. 신호 처리 디코딩 장치(400)는 디멀티플렉서(410), IMDCT부(420), 제 1 윈도우 속성 정보 추출부(430), 제 2 윈도우 속성 정보 추출부(440), 윈도우 속성 결정부(450) 및 윈도우 적용부(460)를 포함한다.
디멀티플렉서(410)는 도 2의 신호 처리 인코딩 장치(200)의 멀티플렉서(270)에서 출력된 비트스트림을 입력받아, 각각의 신호 또는 정보별로 분류하여 출력한다.
IMDCT부(420)는 디멀티플렉서(410)로부터 출력된 인코딩된 신호(encoded signal)를 입력받아, 역 변형 이산코사인 변환(Inverse Modified Discrete Cosine Transform)을 수행할 수 있으며, 역 변형 이산코사인 변환은 일반적인 IMDCT 변환방법에 따른다.
제 1 윈도우 속성 정보 추출부(430)는 디멀티플렉서(410)로부터 입력된 신호로부터 제 1 윈도우 속성 정보(first window feature information)를 추출할 수 있는데, 상기 제 1 윈도우 속성 정보에 관한 상세한 의미 및 특징은 도 2 및 도 3을 참조하여 상술한 바와 같은 바, 설명을 생략하기로 한다.
제 2 윈도우 속성 정보 추출부(440)도 디멀티플렉서(410)에서 입력된 신호로부터 제 2 윈도우 속성 (second window feature information)를 추출할 수 있는데, 이와 관련된 상세한 의미 및 특징도 도 2 및 도 3을 참조하여 상술한 바와 같은 바, 설명을 생략하기로 한다.
윈도우 속성 결정부(450)는 상기 제 1 윈도우 속성 정보 및 상기 제 2 윈도우 속성 정보를 입력받는다. 또한, 디멀티플렉서(410)는 이전 윈도우 프레임에 적용된 윈도우 속성을 나타내는 이전 윈도우 프레임의 윈도우 속성을 출력할 수 있고, 윈도우 속성 결정부(450)는 상기 이전 윈도우 프레임의 윈도우 속성을 입력받을 수 있다.
따라서, 윈도우 속성 결정부(450)는 제 1 윈도우 속성 정보로부터 현재 윈도우 프레임의 오른쪽 윈도우의 기울기가 롱 기울기의 길이를 나타내는지에 관한 정보를 획득하고, 제 2 윈도우 속성 정보로부터 현재 윈도우 프레임의 MDCT 변환 단위에 관한 정보를 획득함으로써 현재 윈도우 프레임의 (현재 프레임에 대응하는) 오른쪽 윈도우의 형상을 결정할 수 있다. 또한, 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 (이전 프레임에 대응하는) 왼쪽 윈도우의 형상을 결정할 수 있다. 이와 같이, 결정된 현재 윈도우 프레임의 오른쪽 윈도우의 형상 및 왼쪽 윈도우의 형상에 따라 현재 윈도우 프레임의 윈도우 속성을 결정한다.
예를 들어, 다시 도 1을 참조하면 현재 디코딩하고자 하는 현재 프레임이 프레임 3(114)인 경우, 현재 윈도우 프레임은 윈도우 프레임 3(150)이다. 윈도우 프레임 3(150)의 윈도우 속성을 결정하기 위하여, 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용하여 프레임 3(114)에 대응하는 윈도우 프레임 3(150)의 오른쪽 윈도우 형상을 결정할 수 있다. 이 때, 윈도우 프레임 3(150)의 왼쪽 윈도우 형상은 도 1에 나타나는 바와 같이, 윈도우 프레임 2(140)에서 결정된 바 있으므로 이전 윈도우 프레임의 윈도우 속성에 기초하여 결정될 수 있다. 상세하게는, 현재 윈도우 프레임의 왼쪽 윈도우의 형상은 이전 윈도우 프레임의 오른쪽 윈도우의 형상에 의하여 결정될 수 있다. 더욱 상세하게는, 현재 윈도우 프레임의 왼쪽 윈도우 형상은 이전 윈도우 프레임의 오른쪽 윈도우가 롱 윈도우의 길이인지를 나타내는 제 1 윈도우 속성 정보에 의하여 결정될 수 있다.
이전 윈도우 프레임의 윈도우 속성과 현재 윈도우 프레임의 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보에 따른 현재 윈도우 프레임의 윈도우 속성의 결정방법에 따른 상세한 매핑관계는 이하 표 3 내지 표 5 및 도 6에서 후술하기로 한다.
윈도우 적용부(460)는 결정된 현재 윈도우 프레임의 윈도우 속성에 기초하여 현재 윈도우 프레임에 윈도우를 적용할 수 있다. 이후, 윈도우가 적용된 현재 윈도우 프레임에 후처리를 수행하여 현재 프레임을 디코딩할 수 있음은 자명하다.
일반적으로 현재 윈도우 프레임의 윈도우 속성은 0(002), 1(012), 2(102), 3(112)와 같이 4가지 값을 가질 수 있도록 정의되어 2비트를 이용하여 나타낼 수 있다. 그러나, 실질적으로 현재 윈도우 프레임의 윈도우 속성은 이전 윈도우 프레임의 윈도우 속성에 의존하여 3가지 이하의 값을 가질 수 있으므로, 본 발명의 신호 처리 장치 및 방법은, 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용하여 0(002), 2(102), 3(112) 이렇게 3가지 경우로만 표현하였다.
하기 표 3 내지 표 5는 이전 윈도우 프레임의 윈도우 속성과 현재 윈도우 프레임의 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보에 따른 현재 윈도우 프레임의 윈도우 속성의 결정방법에 따른 상세한 매핑관계를 나타내는 것이다.
이전 프레임의 윈도우 속성이 LPD_START_SEQUENCE 인 경우, 다시 말해, 현재 윈도우 프레임의 오른쪽 윈도우의 형상이 LPD 프레임에 적용되는 윈도우 모양인 경우, 다음 프레임(next frame)이 블록 스위칭(block-switching)을 이용하는 오디오 신호가 아닌 음성 신호로 스위칭되므로, 이후에 윈도우 속성의 변화를 고려할 필요가 없게 된다. 따라서, 표 3 은 이전 프레임의 윈도우 속성에서 LPD_START_SEQUENCE 를 생략하였고, 이전 프레임(previous frame)이 음성 코딩 모드를 이용하는 경우 현재 윈도우 프레임의 윈도우 속성은 LPD_SEQUENCE로 표시하였다.
이전 윈도우 프레임의 윈도우 속성
(window feature of previous window frame)
현재 윈도우 프레임의 윈도우 속성
(window feature of current window frame)
ONLY_LONG_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
LONG_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
LONG_STOP_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
EIGHT_SHORT_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
STOP_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
STOP_1152_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
STOP_START_1152_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) Reserve
LPD_SEQUENCE 0(02) STOP_1152_SEQUENCE
2(102) STOP_START_1152_SEQUENCE
3(112) reserve
상기 표 3와 같이, 이전 윈도우 프레임의 윈도우 속성이 STOP_START_1152_SEQUENCE인 경우, 현재 윈도우 프레임의 윈도우 속성은 8개의 쇼트 윈도우(128 샘플)로 구성되는 EIGHT_SHORT_SEQUENCE 또는 현재 윈도우 프레임의 오른쪽 윈도우의 기울기 길이가 롱 윈도우를 나타내는 LONG_STOP_SEQUENCE 중 하나로 결정된다. 또한, 이전 윈도우 프레임의 윈도우 속성이 LPD_SEQUENCE인 경우에는 현재 윈도우 프레임의 윈도우 속성은 오른쪽 윈도우의 기울기 길이가 롱 윈도우임을 나타내는 STOP_1152_SEQUENCE 또는 오른쪽 윈도우의 기울기 길이가 쇼트 윈도우임을 나타내는 STOP_START_1152_SEQUENCE 중 하나(둘 다 왼쪽 윈도우는 LPD 에서 이용되는 롱 윈도우임)로 결정된다. 따라서, 이전 윈도우 프레임의 윈도우 속성이 STOP_START_1152_SEQUENCE 또는 LPD_SEQUENCE 인 경우에는 가능한 현재 윈도우 프레임의 윈도우 속성이 2가지로 제한되므로, 1비트만을 이용하여 현재 윈도우의 윈도우 속성을 전송할 수 있다. 이를 반영한 매핑관계를 하기 표 4에 표시한다.
이전 윈도우 프레임의 윈도우 속성
(window feature of previous window frame)
현재 윈도우 프레임의 윈도우 속성
(window feature of current window frame)
ONLY_LONG_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
LONG_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
LONG_STOP_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
EIGHT_SHORT_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
STOP_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
STOP_1152_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
STOP_START_1152_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
LPD_SEQUENCE 0(02) STOP_1152_SEQUENCE
2(102) STOP_START_1152_SEQUENCE
도 5는 상기 표 4의 매핑관계에 의하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 방법을 나타내는 것이다. 도 5에서 각각의 블록은 윈도우 프레임을 나타내고, 블록 내의 명칭은 윈도우 프레임의 윈도우 속성을 나타낸다. 화살표의 왼쪽에 있는 윈도우 속성은 이전 윈도우 프레임의 윈도우 속성을, 화살표의 오른쪽에 있는 윈도우 속성은 현재 윈도우 프레임의 윈도우 속성을 나타낸다. 또한, 롱 윈도우는 음영이 없는 것으로, 쇼트 윈도우는 빗금 음영, LPD 윈도우는 점(dott) 음영으로 나타내며, 8개의 쇼트 윈도우를 이용하는 블록은 격자 음영으로 나타낸다. 예를 들어, LONG_STOP_SEQUENCE는 윈도우 프레임에서 왼쪽 윈도우는 쇼트 윈도우를 이용하고, 오른쪽 윈도우는 롱 윈도우를 이용하므로, 윈도우 프레임의 왼쪽 절반은 빗금 음영으로 오른쪽 절반은 음영이 없는 블록으로 표시할 수 있다.
또한, 화살표에 기재된 숫자는 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용하여 결정되는 경로를 나타내며, 이는 상기 표 4에 기재된 바와 같다.
도 5에 나타난 바와 같이, 현재 윈도우 프레임의 윈도우 속성은 이전 윈도우 프레임의 윈도우 속성에 의존하고, 최대 3가지 경우 중 하나로 결정될 수 있다. 따라서, 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용하여 현재 프레임의 윈도우 속성을 최대 3가지 경우로만 표한하도록 함으로써 사용되는 비트량을 감소시킬 수 있다. 또한, 가장 빈도가 높은 값에 대하여 1개의 비트만 사용하도록 0(02) 값으로 표현함으로써 전체 비트량을 더 감소시킬 수 있다.
또한, 블록 스위칭에 의하여 윈도우 프레임이 스위칭하는 경우에 있어서, STOP_1152_SEQUENCE 에서 LPD_START_SEQUENCE로 스위칭하는 경우, LONG_STOP_SEQUENCE 에서 LPD_START_SEQUENCE로 스위칭하는 경우, LONG_START_SEQUENCE 에서 STOP_START_SEQUENCE로 스위칭하는 경우, STOP_START_SEQUENCE 에서 STOP_START_SEQUENCE로 스위칭하는 경우는 일정 조건하에서만 가능한 경우에므로 반드시 필요하지 아니한다. 따라서, 이 경우들을 제외하고 코딩하는 것이 가능하므로 이 경우의 매핑관계를 하기 표 5에 나타낸다. 하기 표 5과 같은 매핑관계를 갖는 경우, 경우에 따라 현재 윈도우 프레임의 윈도우 속성을 나타내는 비트수를 1비트만 이용할 수 있어 이용되는 비트량을 크게 감소시킬 수 있다.
이전 윈도우 프레임의 윈도우 속성
(window feature of previous window frame)
현재 윈도우 프레임의 윈도우 속성
(window feature of current window frame)
ONLY_LONG_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
2(102) LONG_START_SEQUENCE
3(112) LPD_START_SEQUENCE
LONG_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
1(12) EIGHT_SHORT_SEQUENCE
LONG_STOP_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
1(12) LONG_START_SEQUENCE
EIGHT_SHORT_SEQUENCE 0(02) LONG_STOP_SEQUENCE
2(102) EIGHT_SHORT_SEQUENCE
3(112) STOP_START_SEQUENCE
STOP_START_SEQUENCE 0(02) LONG_STOP_SEQUENCE
1(12) EIGHT_SHORT_SEQUENCE
STOP_1152_SEQUENCE 0(02) ONLY_LONG_SEQUENCE
1(12) LONG_START_SEQUENCE
STOP_START_1152_SEQUENCE 0(02) LONG_STOP_SEQUENCE
1(12) EIGHT_SHORT_SEQUENCE
LPD_SEQUENCE 0(02) STOP_1152_SEQUENCE
1(12) STOP_START_1152_SEQUENCE
도 6는 도 4의 제 1 윈도우 속성 정보(430), 제 2 윈도우 속성 정보(440) 및 윈도우 속성 결정부(450)의 또다른 실시예를 나타내는 개략도이다.
제 1 윈도우 속성 정보(610)와 제 2 윈도우 속성 정보(620)는 도 4의 제 1 윈도우 속성 정보(430) 및 제 2 윈도우 속성 정보(440)와 동일한 구성 및 기능을 갖는 유닛으로 동일한 방법으로 현재 윈도우 프레임의 제 1 윈도우 속성 정보(first window feature information) 및 제 2 윈도우 속성 정보(second window feature information)을 추출할 수 있다. 상세하게는, 제 2 윈도우 속성 정보 수신부(620)는 제 1 윈도우 속성 정보 수신부(610)에서 수신된 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 아니하는 경우에만 활성화(on)될 수 있고, 만일 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우에는 활성화되지 않는다(off).
윈도우 속성 결정부(630)는 도 4의 윈도우 속성 결정부(450)와 같이 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보 이외에 이전 윈도우 프레임의 윈도우 속성을 입력받을 수 있다. 또한, 현재 프레임의 코딩 모드를 나타내는 현재 프레임의 코딩 모드 정보(coding mode information of current frame) 및 이전 프레임의 코딩 모드를 나타내는 이전 프레임의 코딩 모드 정보(coding mode information of previous frame)를 더 수신할 수 있다. 상기 코딩 모드는 현재 프레임이 오디오 신호를 코딩하는 방식인 오디오 코딩 방식에 의하여 인코딩되었는지 또는 음성 신호를 코딩하는 방식인 음성 코딩 방식에 의하여 인코딩되었는지를 나타내는 것이다.
음성 코딩 방식의 경우 선형 예측을 이용하는 LPC 방식에서는 이용되는 프레임의 길이가 상이해지므로, 윈도우 속성이 오디오 코딩 방식의 경우와 달라질 수 있다. 따라서, 윈도우 속성 결정부(630)는 이전 프레임의 코딩 모드 정보 및 현재 프레임의 코딩 모드 정보를 더 이용함으로써, 현재 윈도우 프레임의 윈도우 속성을 결정할 수 있다.
이후, 결정된 현재 윈도우 프레임의 윈도우 속성을 오디오 신호에 적용하여 디코딩함으로써(미도시) 오디오 신호를 디코딩할 수 있을 것이다.
상기와 같은 신호 처리 방법은 이전 윈도우 프레임의 윈도우 속성 및 이전 프레임의 코딩 모드 정보를 이용할 수 있다. 그러나, 방송과 같이 비트스트림을 중간에서부터 디코딩하는 경우에는 이전 윈도우 프레임의 윈도우 속성을 알 수 없어 현재 윈도우 프레임의 윈도우 속성을 결정하는데 문제가 있을 수 있다. 따라서, 비트스트림의 헤더(header)부분에 이전 프레임의 윈도우 속성과 관련된 정보를 포함시킴으로써 이 문제를 해결할 수 있을 것이다.
도 7은 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 신택스(syntax) 구문이다. 도 7을 참조하면, 비트스트림의 헤더(USACSpecificConfig)부분에 1비트의 이전 윈도우 속성 플래그(last_window_sequence)를 추가하여 이전 윈도우 프레임의 윈도우 속성을 나타낼 수 있다. 상기 이전 윈도우 속성 플래그의 의미는 하기 표 6과 같다.
이전 윈도우 속성 플래그
(last_window_sequence)
의미
0 이전 윈도우 프레임의 윈도우 속성이 롱 윈도우로만 이루어진 경우(ONLY_LONG_SEQUENCE)
1 이전 윈도우 프레임의 윈도우 속성이 쇼트 윈도우로만 이루어진 경우(EIGHT_SHORT_SEQUENCE)
이와 같이, 비트스트림의 헤더에 이전 윈도우 프레임의 윈도우 속성을 나타내는 이전 윈도우 속성 플래그를 포함함으로써, 방송 비트스트림와 같이 비트스트림의 중간부터 디코딩되는 경우에도 현재 윈도우 프레임의 윈도우 속성을 결정할 수 있게 된다.
다시 도 6을 참조하면, 현재 윈도우 프레임의 윈도우 속성을 결정하기 위하여, 이전 프레임의 코딩 모드 정보가 필요할 수 있다. 따라서, 이와 대응하도록 신택스 구문도 수정되어야 한다.
도 8은 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 신택스(syntax) 구문이다. 도 8을 참조하면, 비트스트림의 헤더에 이전 프레임의 코딩 방식을 나타내는 이전 코딩 모드 정보(last_core_mode)를 더 추가할 수 있다. 이전 코딩 모드 정보의 상세한 의미는 하기 표 7과 같다.
이전 코딩 모드 정보
(last_core_mode)
의미
0 이전 프레임이 오디오 코딩 방식을 이용하여 코딩된 경우를 나타냄
1 이전 프레임이 음성 코딩 방식을 이용하여 코딩된 경우를 나타냄
다시 도 8을 참조하면, 이전 프레임의 코딩 방법이 오디오 코딩 모드를 이용하는 경우, 현재 윈도우 프레임의 윈도우 속성을 결정하기 위하여 이전 윈도우 프레임의 윈도우 속성을 필요로 한다. 따라서, 이전 코딩 모드 정보가 0인 경우(last_core_mode==0), 이전 윈도우 속성 플래그(last_window_sequence)를 전송받을 수 있다. 한편, 이전 프레임의 코딩 방법이 음성 코딩 모드를 이용하는 경우에는, 이전 윈도우 프레임의 윈도우 속성이 필요하지 않으므로 이전 윈도우 속성 플래그를 전송받지 아니한다.
본 발명의 일실시예에 따른 신호 처리 장치는 상기와 같은 신택스(syntax) 구문으로 표현됨으로써, 현재 윈도우 프레임의 윈도우 속성을 결정하기 위하여 이전 윈도우 프레임의 윈도우 속성 및 이전 프레임의 코딩 모드 정보를 획득할 수 있다.
도 9는 본 발명의 또다른 실시예에 따른 신호 처리 인코딩 장치의 일 예이고, 도 10은 본 발명의 또다른 실시예에 따른 신호 처리 디코딩 자치의 일 예이다.
도 9를 참조하면, 신호 처리 장치(900)는 복수 채널 인코딩부(910), 밴드 확장 인코딩부(920), 오디오 신호 인코딩부(930), 음성 신호 인코딩부(940) 및 멀티플렉서(950)를 포함한다.
복수 채널 인코딩부(910)는 복수의 채널 신호(두 개 이상의 채널 신호로 이하, 멀티채널 신호라고 지칭함)를 입력받아서, 다운믹스를 수행함으로써 모노 또는 스테레오의 다운믹스 신호를 생성하고, 다운믹스 신호를 멀티채널 신호로 업믹스하기 위하여 필요한 공간 정보(spatial information)를 생성한다. 상기 공간정보는, 채널 레벨 차이 정보, 채널간 상관정보, 채널 예측 계수 및 다운믹스 게인 정보 등을 포함할 수 있다. 만일 신호 인코딩 장치(900)가 모노 신호를 입력받는 경우, 복수 채널 인코딩부(910)는 모노 신호에 대하여 다운믹스하기 않고 바이패스(by-pass)할 수 있음을 물론이다.
밴드 확장 인코딩부(920)는 복수 채널 인코딩부(910)의 출력인 다운믹스 신호에 대역 확장 방식(SBR)을 적용하여, 저주파 대역에 대응하는 스펙트럴 데이터 및, 고주파 대역 확장을 위한 대역확장정보를 생성할 수 있다. 즉, 다운믹스 신호의 일부 대역(예: 고주파 대역)의 스펙트럴 데이터가 제외되고, 이 제외된 데이터를 복원하기 위한 대역확장정보가 생성될 수 있다.
밴드 확장 인코딩부(920)을 통해 생성된 신호는 신호 분류부(미도시)에서 생성된 코딩 모드 정보에 따라서, 오디오 신호 인코딩부(930) 또는 음성 신호 디코딩부(940)에 입력된다.
오디오 신호 인코딩부(930)는 다운믹스 신호의 특정 프레임 또는 특정 세그먼트가 주로 오디오 특성을 갖는 경우, 오디오 코딩 방식(audio coding scheme)에 따라 다운믹스 신호를 인코딩한다. 여기서 오디오 코딩 방식은 AAC (Advanced Audio Coding) 표준 또는 HE-AAC (High Efficiency Advanced Audio Coding) 표준에 따른 것일 수 있으나, 본 발명은 이에 한정되지 아니한다. 한편, 오디오 신호 인코딩부(930)는, MDCT(Modified Discrete Transform) 인코더에 해당할 수 있다.
또한, 오디오 신호 인코딩부(930)가 MDCT 인코더에 해당하는 경우, 윈도우 속성 결정부(931), 윈도우 적용부(932) 및 MDCT부(933)를 포함할 수 있고, 윈도우 속성 결정부(931)는 도 2의 오른쪽 윈도우 형상 결정부(220), 제 1 윈도우 속성 결정부(230) 및 제 2 윈도우 속성 결정부(240)를 포함할 수 있다. 윈도우 속성 결정부(931), 윈도우 적용부(932) 및 MDCT부(933)는 도 2 및 도 3의 오른쪽 윈도우 형상 결정부(220), 제 1 윈도우 속성 생성부(230,310), 제 2 윈도우 속성 생성부(240,320), 윈도우 적용부(250) 및 MDCT부(260)와 그 구성 및 기능이 동일하므로, 상세한 설명은 생략하기로 한다. 한편, 윈도우 속성 결정부(931)는 도 2 및 도 3을 참조하여 설명한 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 생성할 수 있다.
음성 신호 인코딩부(940)는 다운믹스 신호의 특정 프레임 또는 특정 세그먼트가 주로 음성 특성을 갖는 경우, 음성 코딩 방식(speech coding scheme)에 따라서 다운믹스 신호를 인코딩한다. 여기서 음성 코딩 방식은 AMR-WB(Adaptive multi-rate Wide-Band) 표준에 따른 것일 수 있으나, 본 발명은 이에 한정되지 아니한다. 한편, 음성 신호 인코딩부(940)는 선형 예측 부호화(LPC: Linear Prediction Coding) 방식을 더 이용할 수 있다. 하모닉 신호가 시간축 상에서 높은 중복성을 가지는 경우, 과거 신호로부터 현재 신호를 예측하는 선형 예측에 의해 모델링될 수 있는데, 이 경우 선형 예측 부호화 방식을 채택하면 부호화 효율을 높을 수 있다. 한편, 음성 신호 인코딩부(940)는 타임 도메인 인코더에 해당할 수 있다.
멀티플렉서(950)는 공간 정보, 대역확장 정보, 오디오 신호 인코딩부(930) 및 음성 신호 인코딩부(940) 각각에 의해 인코딩된 신호, 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 멀티플렉싱함으로써, 하나 이상의 비트스트림을 생성한다.
도 10을 참조하면, 신호 디코딩 장치(1000)는 디멀티플렉서(1010), 오디오 신호 디코딩부(1020), 음성 신호 디코딩부(1030), 밴드 확장 디코딩부(1040) 및 복수 채널 디코딩부(1050)를 포함하고, 오디오 신호 디코딩부(1020)는 IMDCT부(1021), 윈도우 속성 결정부(1022) 및 윈도우 적용부(1023)를 포함한다.
디멀티플렉서(410)는 신호 비트스트림으로부터 제 1 윈도우 속성 정보, 제 2 윈도우 속성 정보, 양자화된 신호, 코딩 모드 정보, 밴드 확장 정보, 공간 정보 등을 추출한다.
먼저, 코딩 모드 정보에 의하여 입력된 신호가 오디오 코딩 방식으로 디코딩될지 음성 코딩 방식으로 디코딩될지가 판단된다.
만일 오디오 코딩 방식으로 디코딩되는 경우, IMDCT부(1021)는 입력 신호에 역 변형 이산코사인 변환(Inverse Modified Discrete Cosine Transform)을 수행한다.
이후, 윈도우 속성 결정부(1022)는 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보와 이전 윈도우 프레임의 윈도우 속성, 코딩 모드 정보 및 이전 프레임의 코딩 모드 정보(미도시)를 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정한다. 현재 윈도우 프레임의 윈도우 속성을 결정하는 방법은, 도 4 내지 도 8을 참조하여 상술한 바와 같으므로 상세한 설명을 생략하기로 한다.
이밖에, 오디오 신호 디코딩부(1020)는, 오디오 신호(예: 역양자화의 결과인 스펙트럴 계수)가 오디오 특성이 큰 경우, 오디오 코딩 방식으로 오디오 신호를 디코딩한다. 여기서 오디오 코딩 방식은 앞서 설명한 바와 같이, AAC 표준, HE-AAC 표준에 따를 수 있다.
음성 신호 디코딩부(1030)는 상기 오디오 신호가 음성 특성이 큰 경우, 음성 코딩 방식으로 다운믹스 신호를 디코딩한다. 음성 코딩 방식은, 앞서 설명한 바와 같이, AMR-WB 표준에 따를 수 있지만, 본 발명은 이에 한정되지 아니한다.
밴드 확장 디코딩부(1040)는 오디오 신호 디코딩부(1020) 및 음성 신호 디코딩부(1030) 의 출력 신호에 대해서, 대역 확장 디코딩 방식을 수행함으로써, 대역 확장 정보를 기반으로 고주파 대역의 신호를 복원한다.
복수 채널 디코딩부(1050)은 디코딩된 오디오 신호가 다운믹스인 경우, 공간정보를 이용하여 멀티채널 신호(스테레오 신호 포함)의 출력 채널 신호를 생성한다.
도 11은 본 발명의 일실시예에 따른 IMDCT부, 윈도우 속성 결정부 및 윈도우 적용부가 구현된 제품의 개략적인 구성을 보여주는 도면이고, 도 12은 본 발명의 실시예에 따른 IMDCT부, 윈도우 속성 결정부 및 윈도우 적용부가 구현된 제품들의 관계를 보여주는 도면이다.
도11을 참조하면, 유무선 통신부(1110)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(1110)는 유선통신부(1111), 적외선통신부(1112), 블루투스부(1113), 무선랜통신부(1114) 중 하나 이상을 포함할 수 있다.
사용자 인증부는(1120)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부(1121), 홍채인식부(1122), 얼굴인식부(1123), 및 음성인식부(1124) 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(1130)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부(1131), 터치패드부(1132), 리모컨부(1133) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다.
신호 디코딩부(1140)는 IMDCT부(1141), 윈도우 속성 결정부(1142) 및 윈도우 적용부(1143)를 포함하는데, 이들은 도 4를 참조하여 상술한 IMDCT부(420), 윈도우 속성 결정부(430) 및 윈도우 적용부(440)와 그 구성 및 기능이 동일하므로 상세한 설명을 생략하기로 한다.
제어부(1150)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부(1140)와 출력부(1160)의 모든 프로세스를 제어한다. 상술한 바와 같이, 제어부(1150)에 입력부(1130)로부터 사용자 입력을 이용하여 신호를 디코딩한다.
출력부(1160)는 신호 디코딩부(1140)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 신호 출력부(1161) 및 디스플레이부(1162)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 신호 출력부(1161)를 통하여 출력되고, 비디오 신호일 때 출력 신호는 디스플레이부(1162)를 통해 출력된다. 또한, 입력부(1130)에 메타데이터가 입력된 경우에는 이를 디스플레이부(1162)를 통하여 화면에 현시한다.
도 12는 도 11에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서, 도 12a를 참조하면, 제1 단말(1210) 및 제2 단말(1220)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있음을 알 수 있다. 상기 유무선 통신부를 통해서 통신하는 데이터 또는 비트스트림은 본 발명의 도 1 내지 도 3을 참조하여 설명한 본 발명의 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보 등을 포함하는 데이터일 수 있다. 도 12b를 참조하면, 서버(1230) 및 제1 단말(1240) 또한 서로 유무선 통신을 수행할 수 있음을 알 수 있다.
도 13은 본 발명의 일실시예에 따른 IMDCT부(1341), 윈도우 속성 결정부(1342) 및 윈도우 적용부(1343) 를 포함하는 신호 디코딩부(1340)가 구현된 방송신호 디코딩 장치(1300)의 개략적인 구성을 보여주는 도면이다.
도 13을 참조하면, 디멀티플렉서(1320)는 튜너(1310)로부터 TV방송과 관련된 데이터들을 수신한다. 수신된 데이터들은 디멀티플렉서(1320)에서 분리되고, 데이터 디코더(1330)를 통하여 디코딩된다. 한편, 디멀티플렉서(1320)에서 분리된 데이터들은 HDD 와 같은 저장매체(1350)에 저장될 수 있다. 디멀티플렉서(1320)에서 분리된 데이터들은 IMDCT부(1341), 윈도우 속성 결정부(1342), 윈도우 적용부(1343) 및 비디오 디코딩부(1344)를 포함하는 신호 디코딩부(1340)로 입력되어 오디오 신호 및 비디오 신호를 디코딩한다. IMDCT부(1341), 윈도우 속성 결정부(1342) 및 윈도우 적용부(1343)는 도 4의 동일한 명칭의 유닛들과 그 구성 및 기능이 동일하므로 상세한 설명을 생략하기로 한다.
출력부(1370)는 신호 디코딩부(1340)에서 출력된 비디오 신호와 오디오 신호를 출력한다. 상기 오디오 신호는 제 1 윈도우 속성 정보 및 제 2 윈도우 속성 정보를 이용하여 결정된 현재 윈도우 프레임의 윈도우 속성이 적용되어 디코딩된 신호일 수 있다. 또한, 신호 디코딩부(1340)에서 디코딩된 데이터들은 HDD 와 같은 저장매체(1350)에 저장될 수 있다.
한편, 신호 디코딩 장치(1300)는 사용자로부터 정보를 입력받아 수신된 데이터들을 제어할 수 있는 애플리케이션 매니저(1360)를 더 포함할 수 있다. 애플리케이션 매니저(1360)는 유저 인터페이스 매니저(1361) 및 서비스 매니저(1362)를 포함하는데, 유저 인터페이스 매니저(1361)는 사용자로부터 정보를 입력받기 위한 인터페이스(interface)를 제어한다. 예를 들면, 출력부(1370)에 현시되는 텍스트의 글자체, 화면의 밝기, 메뉴 구성 등을 제어할 수 있다. 한편, 서비스 매니저(1362)는 신호 디코딩부(1340) 및 출력부(1370)에서 방송신호를 디코딩하여 출력하는 경우, 수신되는 방송신호를 사용자로부터 입력되는 정보를 이용하여 제어할 수 있다. 예를 들면, 방송채널의 설정, 알람 기능 설정, 성인인증 기능 등을 제공할 수 있다. 애플리케이션 매니저(1360)에서 출력되는 데이터들은 신호 디코딩부(1340)뿐만 아니라, 출력부(1370)로도 전송되어 이용가능하다.
이와 같이, 실제 제품에 본 발명의 일실시예에 따른 신호 처리 장치가 포함됨으로써, 이전 윈도우 프레임의 윈도우 속성에 영향을 받는 현재 윈도우 프레임의 윈도우 속성을 보다 적은 비트수를 이용하여 나타냄으로써, 신호 처리시 코딩 효율을 높일 수 있다.
본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.
도 1은 본 발명의 일실시예에 따른 신호 처리 장치에서 이용되는 프레임과 윈도우 프레임의 관계를 나타내는 것이다.
도 2는 본 발명의 일실시예에 따른 신호 인코딩 장치를 나타내는 개략도이다.
도 3는 도 2 의 제 1 윈도우 속성 정보 생성부 및 제 2 윈도우 속성 정보 생성부의 상세도를 나타내는 것이다.
도 4는 본 발명의 일실시예에 따른 신호 디코딩 장치를 나타내는 개략도이다.
도 5는 본 발명의 일실시예에 따른 현재 프레임의 윈도우 속성 결정방법을 나타내는 것이다.
도 6은 본 발명의 또다른 일실시예에 따른 제 1 윈도우 속성 정보 수신부, 제 2 윈도우 속성 정보 수신부 및 윈도우 속성 결정부를 상세하게 나타내는 것이다.
도 7 및 도 8은 본 발명의 여러 실시예에 따른 신호 디코딩 방법을 나타내는 신택스(syntax) 구문이다.
도 9는 본 발명의 다른 일실시예에 따른 신호 인코딩 장치를 나타내는 개략도이다.
도 10은 본 발명의 또다른 일실시예에 따른 신호 디코딩 장치를 나타내는 개략도이다.
도 11은 본 발명의 또다른 실시예에 따른 IMDCT부, 윈도우 속성 결정부 및 윈도우 적용부가 구현된 제품의 개략적인 구성을 보여주는 것이다.
도 12는 본 발명의 또다른 실시예에 따른 IMDCT부, 윈도우 속성 결정부 및 윈도우 적용부가 구현된 제품들의 관계를 보여주는 것이다.
도 13은 본 발명의 또다른 실시예에 따른 IMDCT부, 윈도우 속성 결정부 및 윈도우 적용부가 구현된 방송신호 디코딩 장치의 개략적인 구성을 보여주는 것이다.

Claims (12)

  1. 이전 윈도우 프레임에서 이용된 윈도우의 종류를 나타내는 이전 윈도우 프레임의 윈도우 속성을 획득하는 단계;
    현재 윈도우 프레임에 이용되는 윈도우 중 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 추출하는 단계;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우, 상기 제 1 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 않는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 추출하는 단계; 및 상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 및
    상기 현재 윈도우 프레임의 윈도우 속성에 기초하여 오디오 신호를 디코딩하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 현재 윈도우 프레임의 윈도우 속성은 상기 현재 프레임의 코딩 모드를 나타내는 현재 프레임의 코딩 모드 정보 및 상기 이전 프레임의 코딩 모드를 나타 내는 이전 프레임의 코딩 모드 정보를 더 이용하여 결정되는 것을 특징으로 하는 신호 처리 방법.
  3. 제 1 항에 있어서,
    상기 이전 프레임의 윈도우 속성은 상기 이전 윈도우 프레임의 상기 제 1 윈도우 속성 정보에 기초하여 결정되는 것을 특징으로 하는 신호 처리 방법.
  4. 제 1 항에 있어서,
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우,
    상기 현재 윈도우 프레임의 윈도우 속성은 왼쪽 및 오른쪽의 윈도우가 모두 롱 윈도우로 구성된 온리 롱 윈도우 또는 왼쪽 윈도우는 쇼트 윈도우로 구성되고 오른쪽 윈도우는 롱 윈도우로 구성된 롱 스탑 윈도우인 것을 특징으로 하는 신호 처리 방법.
  5. 제 1 항에 있어서,
    상기 제 1 윈도우 속성 정보 및 상기 제 2 윈도우 속성 정보는 각각 1비트인 것을 특징으로 하는 신호 처리 방법.
  6. 이전 윈도우 프레임에서 이용된 윈도우의 종류를 나타내는 이전 윈도우 프레임의 윈도우 속성을 획득하는 이전 윈도우 속성 획득부;
    현재 윈도우 프레임에 이용되는 윈도우 중 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 추출하는 제 1 윈도우 속성 정보 추출부;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 않는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 추출하는 제 2 윈도우 속성 정보 추출부; 및
    상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성에 기초하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 윈도우 속성 결정부를 포함하고,
    상기 제 2 윈도우 속성 정보 추출부는, 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우에는 동작하지 아니하는 것을 특징으로 하는 신호 처리 장치.
  7. 제 6 항에 있어서,
    상기 윈도우 속성 결정부는 현재 프레임의 코딩 모드를 나타내는 현재 프레임의 코딩 모드 정보 및 이전 프레임의 코딩 모드를 나타내는 이전 프레임의 코딩 모드 정보를 더 이용하여 상기 현재 윈도우 프레임의 윈도우 속성을 결정하는 신호 처리 장치.
  8. 제 6 항에 있어서,
    상기 이전 윈도우 프레임의 윈도우 속성은 이전 윈도우 프레임의 상기 제 1 윈도우 속성 정보에 기초하여 결정되는 것을 특징으로 하는 신호 처리 장치.
  9. 제 6 항에 있어서,
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우,
    상기 현재 윈도우 프레임의 윈도우 속성은 왼쪽 및 오른쪽의 윈도우가 모두 롱 윈도우로 구성된 온리 롱 윈도우 또는 왼쪽 윈도우는 쇼트 윈도우로 구성되고 오른쪽 윈도우는 롱 윈도우로 구성된 롱 스탑 윈도우인 것을 특징으로 하는 신호 처리 장치.
  10. 제 6 항에 있어서,
    상기 제 1 윈도우 속성 정보 및 상기 제 2 윈도우 속성 정보는 각각 1 비트인 것을 특징으로 하는 신호 처리 장치.
  11. 이전 윈도우 프레임의 윈도우 속성 및 현재 프레임의 입력 신호를 수신하는 단계;
    상기 입력 신호의 특성에 따라 현재 윈도우 프레임의 오른쪽 윈도우 형태를 결정하는 단계;
    상기 오른쪽 윈도우 형태에 기초하여, 상기 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 생성하는 단계;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우, 상기 제 1 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내지 않는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 생성하는 단계; 및 상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 단계; 및
    상기 현재 윈도우 프레임의 윈도우 속성에 기초하여 상기 현재 윈도우 프레임을 주파수 변환하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  12. 이전 윈도우 프레임의 윈도우 속성 및 현재 프레임의 입력 신호를 수신하는 수신부;
    상기 입력 신호의 특성에 따라 상기 현재 윈도우 프레임의 오른쪽 윈도우 형태를 결정하는 오른쪽 윈도우 형태 결정부;
    상기 오른쪽 윈도우 형태에 기초하여, 상기 오른쪽 윈도우의 기울기 길이를 나타내는 제 1 윈도우 속성 정보를 생성하는 제 1 윈도우 속성 정보 생성부;
    상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우, 상기 현재 윈도우 프레임의 주파수 변환 단위를 나타내는 제 2 윈도우 속성 정보를 생성하는 제 2 윈도우 속성 정보 생성부;
    상기 제 1 윈도우 속성 정보, 상기 제 2 윈도우 속성 정보 및 상기 이전 윈 도우 프레임의 윈도우 속성을 이용하여 현재 윈도우 프레임의 윈도우 속성을 결정하는 윈도우 속성 결정부; 및
    상기 윈도우 속성을 이용하여 상기 현재 윈도우 프레임을 주파수 변환하는 주파수 변환부를 포함하고,
    상기 제 2 윈도우 속성 정보 생성부는, 상기 제 1 윈도우 속성 정보가 롱 윈도우의 기울기 길이를 나타내는 경우에는 동작하지 아니하는 것을 특징으로 하는 신호 처리 장치.
KR1020090109742A 2008-11-14 2009-11-13 신호의 처리 방법 및 이의 장치 KR20100054749A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2009/006714 WO2010058931A2 (en) 2008-11-14 2009-11-16 A method and an apparatus for processing a signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11447708P 2008-11-14 2008-11-14
US61/114,477 2008-11-14

Publications (1)

Publication Number Publication Date
KR20100054749A true KR20100054749A (ko) 2010-05-25

Family

ID=42279412

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090109742A KR20100054749A (ko) 2008-11-14 2009-11-13 신호의 처리 방법 및 이의 장치

Country Status (1)

Country Link
KR (1) KR20100054749A (ko)

Similar Documents

Publication Publication Date Title
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
CA2705968C (en) A method and an apparatus for processing a signal
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
JP5266341B2 (ja) オーディオ信号処理方法及び装置
US8060042B2 (en) Method and an apparatus for processing an audio signal
US8364471B2 (en) Apparatus and method for processing a time domain audio signal with a noise filling flag
JP5418930B2 (ja) 音声復号化方法および音声復号化器
KR20120006077A (ko) 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을 위한 시간적 엔벨로프 정형화
US20100114568A1 (en) Apparatus for processing an audio signal and method thereof
WO2009088257A2 (ko) 프레임 타입 식별 방법 및 장치
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
KR102353050B1 (ko) 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스
KR20100054749A (ko) 신호의 처리 방법 및 이의 장치
WO2019244666A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
WO2010058931A2 (en) A method and an apparatus for processing a signal
WO2024051955A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata
KR101259120B1 (ko) 오디오 신호 처리 방법 및 장치
CN113948094A (zh) 音频编解码方法和相关装置及计算机可读存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application