KR101149449B1 - 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 - Google Patents

오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 Download PDF

Info

Publication number
KR101149449B1
KR101149449B1 KR1020070027271A KR20070027271A KR101149449B1 KR 101149449 B1 KR101149449 B1 KR 101149449B1 KR 1020070027271 A KR1020070027271 A KR 1020070027271A KR 20070027271 A KR20070027271 A KR 20070027271A KR 101149449 B1 KR101149449 B1 KR 101149449B1
Authority
KR
South Korea
Prior art keywords
audio
coding scheme
band
time
encoded
Prior art date
Application number
KR1020070027271A
Other languages
English (en)
Other versions
KR20080085562A (ko
Inventor
이남숙
이건형
오재원
이철우
정종훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070027271A priority Critical patent/KR101149449B1/ko
Priority to US11/962,174 priority patent/US8019616B2/en
Priority to CN2008800092190A priority patent/CN101641733B/zh
Priority to EP08704746.0A priority patent/EP2122614A4/en
Priority to PCT/KR2008/000207 priority patent/WO2008114925A1/en
Priority to JP2009554434A priority patent/JP5118158B2/ja
Publication of KR20080085562A publication Critical patent/KR20080085562A/ko
Application granted granted Critical
Publication of KR101149449B1 publication Critical patent/KR101149449B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

오디오 밴드 별로 시간-주파수 방식과 파라메트릭 방식을 혼합하여 사용하는 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의 디코딩 방법 및 장치가 개시된다. 본 발명에 따른 인코딩 방법은, 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계, 각각의 오디오 밴드마다 코딩 방식을 선택하고 선택된 코딩 방식에 따라 인코딩하는 단계, 및 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하며, 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택한다. 오디오 신호를 복수의 밴드로 나누어서 각각의 밴드별로 인코딩된 데이터의 크기가 더 작게 되는 코딩 방식을 선택하여 인코딩함으로써, 전체 오디오 데이터에 대하여 하나의 코딩 방식을 적용하는 것과 비교하여 효율적인 인코딩이 가능한 효과가 있다.

Description

오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의 디코딩 방법 및 장치{Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal}
도 1은 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 오디오 신호 인코딩 방법을 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 오디오 신호 디코딩 장치의 구성을 나타낸 블록도이다.
도 4는 본 발명의 일 실시예에 따른 오디오 신호 디코딩 방법을 나타낸 흐름도이다.
도 5는 정현파 신호의 수와 코딩 방식에 따른 인코딩된 데이터의 크기의 변화를 나타낸 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
1: 입력 오디오 신호
2: 출력 비트 스트림
11: 입력 비트 스트림
12: 출력 오디오 신호
30: 시간-주파수 코딩 방식에서의 인코딩된 데이터의 크기
32: 파라메트릭 코딩 방식에서의 인코딩된 데이터의 크기
A 구간: 파라메트릭 코딩 방식이 더 효율적인 구간
B 구간: 시간-주파수 코딩 방식이 더 효율적인 구간
본 발명은 오디오 신호의 인코딩 및 디코딩에 관한 것으로서, 특히 오디오 신호를 복수의 밴드로 나누어서 각각의 밴드별로 효율적인 코딩 방식을 적용하는 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의 디코딩 방법 및 장치에 관한 것이다.
오디오 신호를 인코딩하는 방식에는 파라메트릭(parametric) 코딩 방식과 시간-주파수(time-frequncy) 코딩 방식이 있다. 그런데, 파라메트릭 코딩 방식은 데이터의 비트 레이트가 낮을 때, 즉 로우 비트 레이트(low bit rate)일 때는 인코딩 효율이 높지만, 비트 레이트가 높아질수록 인코딩 효율이 낮아지는 문제점이 있다. 또한 시간-주파수 코딩 방식은 오디오 신호의 음질이 고음질일 때, 즉 비트레이트가 높을 때는 파라메트릭 코딩 방식에 비하여 효율적이지만, 비트 레이트가 낮을 때는 모든 주파수 인덱스에 대한 정보를 전송하여야 하므로 비효율적이다.
따라서, 파라메트릭 코딩 방식 또는 시간-주파수 코딩 방식만을 적용하는 종 래의 방식을 보완하여 인코딩 효율을 향상시키는 것이 요구된다.
본 발명이 이루고자 하는 기술적 과제는, 오디오 신호를 복수의 밴드로 나누어서 각각의 밴드별로 효율적인 코딩 방식을 적용하는 오디오 신호의 인코딩 방법 및 장치, 그리고 상기 인코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기 인코딩 방법에 의해 생성된 비트 스트림을 오디오 밴드별로 디코딩하는 오디오 신호의 디코딩 방법 및 장치, 그리고 상기 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
상기 기술적 과제를 이루기 위한 오디오 신호의 인코딩 방법은, 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계; 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계; 상기 각각의 오디오 밴드를 각각의 밴드마다 선택된 코딩 방식에 따라 인코딩하는 단계; 및 상기 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하며, 상기 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택하는 단계를 포함하는 것이 바람직하다.
상기 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는, 코딩 방식을 선 택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 구하는 단계; 상기 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식을 선택하는 단계; 및 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식을 선택하는 단계를 포함하는 것이 바람직하다.
상기 기술적 과제를 이루기 위한 오디오 신호의 인코딩 장치는, 입력 오디오 신호를 복수의 오디오 밴드로 나누는 밴드 분할부; 각각의 오디오 밴드마다 코딩 방식을 선택하는 코딩 방식 선택부; 상기 각각의 오디오 밴드를 각각의 밴드마다 선택된 코딩 방식에 따라 인코딩하는 오디오 인코딩부; 및 상기 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 비트 스트림 생성부를 포함하며, 상기 코딩 방식 선택부는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택하는 것이 바람직하다.
상기 코딩 방식 선택부는, 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식을 선택하고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식을 선택하는 것이 바람직하다.
상기 인코딩 방법 및 장치에 있어서, 상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식이고, 상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것이 바람직하다.
상기 기술적 과제를 이루기 위하여, 본 발명의 다른 일 실시예에 의한 오디 오 신호의 인코딩 방법은, 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계; 각각의 오디오 밴드에 포함된 오디오 데이터를 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식을 각각 적용하여 인코딩하는 단계; 상기 각각의 오디오 밴드별로 상기 두 가지 방식으로 인코딩된 데이터 중 크기가 작은 것들을 선택하는 단계; 및 상기 오디오 밴드별로 선택된 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하는 것이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 오디오 신호의 디코딩 방법은, 입력된 비트 스트림으로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리하는 단계; 상기 복수의 오디오 밴드 각각에 대하여, 인코딩 장치에서 오디오 데이터를 인코딩한 코딩 방식에 대한 정보를 추출하는 단계; 상기 추출된 정보에 따른 코딩 방식에 따라서 각각의 오디오 밴드별로 인코딩된 오디오 데이터를 디코딩하는 단계; 및 상기 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 오디오 신호를 생성하는 단계를 포함하며, 상기 코딩 방식은, 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것이 선택된 것이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 오디오 신호의 디코딩 장치는, 입력된 비트 스트림으로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리하는 비트 스트림 분리부; 상기 복수의 오디오 밴드 각각에 대하여, 인코딩 장치에서 오디오 데이터를 인코딩한 코딩 방식에 대한 정보를 추출하는 코딩 방식 추출부; 상기 추출된 정보에 따른 코딩 방식에 따라서 각각의 오디오 밴드별로 인코딩된 오디 오 데이터를 디코딩하는 오디오 디코딩부; 및 상기 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 오디오 신호를 생성하는 오디오 신호 생성부를 포함하며, 상기 코딩 방식은, 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것이 선택된 것이 바람직하다.
상기 오디오 신호의 디코딩 방법 및 장치에 있어서, 상기 코딩 방식은, 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식이 선택되고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식이 선택되는 것이 바람직하다.
상기 디코딩 방법 및 장치에 있어서, 상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식이고, 상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것이 바람직하다.
이하 첨부된 도면들을 참조하여 본 발명에 따른 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의 디코딩 방법 및 장치에 대하여 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치의 구성을 나타낸 블록도이고, 도 2는 본 발명의 일 실시예에 따른 오디오 신호 인코딩 방법을 나타낸 흐름도이다.
도 1을 참조하면, 본 발명에 따른 오디오 신호 인코딩 장치(100)는 밴드 분할부(110), 코딩 방식 선택부(120), 오디오 인코딩부(130) 및 비트 스트림 생성부(140)를 포함하는 것이 바람직하다.
밴드 분할부(110)는 입력 오디오 신호(1)를 복수의 오디오 밴드(Band 0, Band1, ......, Band N-1, Band N)로 나눈다(S100).
코딩 방식 선택부(120)는 각각의 오디오 밴드마다 코딩 방식을 선택한다(S110). 코딩 방식 선택부(120)는 파라메트릭 코딩 방식과 시간-주파수 코딩 방식 중에서 해당 밴드에 대하여 더 효율적인 인코딩이 가능한 것을 선택한다. 효율적인 인코딩이란, 인코딩된 데이터의 크기가 더 작은 것을 의미한다.
코딩 방식을 선택하는 방법의 일 실시예는 다음과 같다.
먼저, 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 구한다. 구한 정현파 신호의 수가 소정 값 이상인 경우에는 시간-주파수 코딩 방식을 선택하고, 구한 정현파 신호의 수가 소정 값보다 작은 경우에는 파라메트릭 코딩 방식을 선택한다. 이에 대하여는 도 5를 참조하여 더 상세히 살펴보기로 한다.
오디오 인코딩부(130)는 각각의 오디오 밴드를 각각의 오디오 밴드마다 선택된 코딩 방식에 따라 인코딩한다(S120).
해당 오디오 밴드에 대하여 파라메트릭 코딩 방식이 선택된 경우, 파라메트릭 코딩 방식으로 해당 오디오 밴드에 포함된 오디오 신호를 인코딩한다. 파라메트릭 코딩 방식의 예로는 정현파 코딩(Sinusoidal Coding: SSC) 방식을 들 수 있다.
해당 오디오 밴드에 대하여 시간-주파수 코딩 방식이 선택된 경우, 시간-주파수 코딩 방식으로 해당 오디오 밴드에 포함된 오디오 신호를 인코딩한다. 시간-주파수 코딩 방식은 시간 영역의 데이터를 주파수 영역의 값으로 변환하여 코딩하 는 방식을 말한다. 시간-주파수 코딩 방식의 예로는 AAC(Advanced Audio Coding) 방식을 들 수 있다.
비트 스트림 생성부(140)는 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림(2)을 생성한다(S130).
도 3은 본 발명의 일 실시예에 따른 오디오 신호 디코딩 장치의 구성을 나타낸 블록도이며, 도 4는 본 발명의 일 실시예에 따른 오디오 신호 디코딩 방법을 나타낸 흐름도이다.
도 3을 참조하면, 본 발명에 따른 오디오 신호 디코딩 장치(200)는 비트 스트림 분리부(210), 코딩 방식 추출부(220), 오디오 디코딩부(230) 및 오디오 신호 생성부(240)를 포함하는 것이 바람직하다.
비트 스트림 분리부(210)는 입력된 비트 스트림(11)로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리한다(S200).
코딩 방식 추출부(220)는 상기 오디오 밴드 각각에 대하여 코딩 방식에 대한 정보를 추출한다(S210). 코딩 방식이란 인코딩 장치 측에서 해당 오디오 밴드의 오디오 데이터를 인코딩한 방식을 의미한다. 상기 살펴본 바와 같이, 인코딩 장치는 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 쪽을 코딩 방식으로 선택한다. 언급한 바와 같이, 일 실시예에 있어서, 인코딩 장치는 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 구하고, 구한 정현파 신호의 수가 소정 값 이상인 경우에는 시간-주파수 코딩 방식을 선택하고, 구한 정현파 신호의 수가 소정 값 보다 작은 경우에는 파라메트릭 코딩 방식을 선택한다.
오디오 디코딩부(230)는 각각의 오디오 밴드에 대하여 추출된 정보에 따른 코딩 방식에 따라서 인코딩된 오디오 데이터를 디코딩한다(S220).
해당 오디오 밴드에 대하여 코딩 방식에 대한 정보가 파라메트릭 코딩 방식임을 나타내는 경우, 해당 오디오 밴드에 대하여 인코딩된 오디오 데이터를 파라메트릭 코딩 방식으로 디코딩한다. 파라메트릭 코딩 방식의 예로는 정현파 코딩(SSC) 방식을 들 수 있다.
해당 오디오 밴드에 대하여 코딩 방식에 대한 정보가 시간-주파수 코딩 방식임을 나타내는 경우, 해당 오디오 밴드에 대하여 인코딩된 오디오 데이터를 시간-주파수 코딩 방식으로 디코딩한다. 시간-주파수 코딩 방식의 예로는 AAC 방식을 들 수 있다.
오디오 신호 생성부(240)는 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 출력 오디오 신호(12)를 생성한다(S230).
이하에서는 도 5를 참조하여, 정현파 신호의 수에 따른 코딩 방식의 선택에 대하여 상세히 살펴보기로 한다. 도 5는 정현파 신호의 수와 코딩 방식에 따른 인코딩된 데이터의 크기의 변화를 나타낸 도면이다.
시간-주파수 코딩 방식에 있어서는, 기본 주파수를 설정하고 그 주파수의 배수가 되는 모든 주파수에 대하여 진폭과 위상 값을 추출하여 인코딩한다. 따라서, 오디오 신호에 포함된 정현파 신호의 수에 무관하게 같은 수의 주파수에 대한 정보가 인코딩되므로 인코딩된 데이터의 크기는 동일하다. 이는 도 5에서 수평 축에 평 행한 직선(30)으로서 나타난다.
반면, 파라메트릭 코딩 방식에 있어서는, 각각의 정현파 신호에 대하여 주파수, 진폭 및 위상 값에 대한 정보를 인코딩한다. 따라서, 정현파 신호의 수가 증가함에 따라 인코딩된 데이터의 크기는 증가하게 된다. 이는 도 5에서 우상향의 직선(32)으로서 나타난다.
따라서, 정현파 신호의 수가 소정 값(도 5의 N)보다 큰 경우(B 구간)는 시간-주파수 코딩 방식이 더 효율적이며, 정현파 신호의 수가 N보다 작은 경우(A 구간)는 파라메트릭 코딩 방식이 더 효율적이다.
상기 소정 값 N을 선택하는 방법에는 여러 가지가 있을 수 있다.
상기 소정 값 N은 파라메트릭 코딩 방식을 적용한 경우의 인코딩된 데이터의 크기와 시간-주파수 코딩 방식을 적용한 경우의 인코딩된 데이터의 크기가 같게 되는 정현파 신호의 수이다. 따라서, 시간-주파수 코딩 방식에서 사용되는 주파수의 수(이를 주파수 인덱스의 수라고 한다)를 상기 소정 값 N으로서 선택하는 것이 가능하다. 시간-주파수 코딩 방식에서는 주파수에 대한 정보를 인코딩하지 않으므로, 상기 소정 값 N은 상기 주파수 인덱스의 수보다 약간 작은 값이 될 것이다.
또 다른 예로는, 미리 소정 값 N을 설정해 두는 것이 아니라, 실제로 해당 오디오 밴드에 대하여 파라메트릭 코딩 방식과 시간-주파수 방식을 각각 적용하여 인코딩한 데이터의 크기를 비교하여 그 크기가 작은 것을 선택하는 방식을 생각할 수도 있을 것이다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖 는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.
본 발명에 따른 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의 디코딩 방법 및 장치에 의하면, 오디오 신호를 복수의 밴드로 나누어서 각각의 밴드별로 인코딩된 데이터의 크기가 더 작게 되는 코딩 방식을 선택하여 인코딩함으로써, 전체 오디오 데이터에 대하여 하나의 코딩 방식을 적용하는 것과 비교하여 효율적인 인코딩이 가능한 효과가 있다. 즉, 오디오 밴드 별로 시간-주파수 방식과 파라메트릭 방식을 혼합하여 사용하는 방식이 제공된다.

Claims (20)

  1. 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계;
    각각의 오디오 밴드마다 코딩 방식을 선택하는 단계;
    상기 각각의 오디오 밴드를 각각의 밴드마다 선택된 코딩 방식에 따라 인코딩하는 단계; 및
    상기 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하며,
    상기 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택하는 단계를 포함하되, 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 기준으로 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식 중 하나의 코딩 방식을 선택하고,
    상기 기준이 되는 정현파 신호의 수는 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  2. 제1항에 있어서,
    상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식인 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  3. 제1항에 있어서,
    상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  4. 제1항에 있어서, 상기 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는,
    코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 구하는 단계;
    상기 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식을 선택하는 단계; 및
    상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식을 선택하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  5. 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계;
    각각의 오디오 밴드에 포함된 오디오 데이터를 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식을 각각 적용하여 인코딩하는 단계;
    상기 각각의 오디오 밴드별로 상기 두 가지 방식으로 인코딩된 데이터 중 크기가 작은 것을 선택하는 단계; 및
    상기 오디오 밴드별로 선택된 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하되, 각각의 오디오 밴드에 포함된 정현파 신호의 수를 기준으로 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식 중 하나의 코딩 방식을 각각의 오디오 밴드에 적용하여 인코딩하고,
    상기 기준이 되는 정현파 신호의 수는 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  6. 입력 오디오 신호를 복수의 오디오 밴드로 나누는 밴드 분할부;
    각각의 오디오 밴드마다 코딩 방식을 선택하는 코딩 방식 선택부;
    상기 각각의 오디오 밴드를 각각의 밴드마다 선택된 코딩 방식에 따라 인코딩하는 오디오 인코딩부; 및
    상기 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 비트 스트림 생성부를 포함하며,
    상기 코딩 방식 선택부는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택하되, 상기 코딩 방식 선택부는, 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식을 선택하고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식을 선택하고,
    상기 소정 값은 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  7. 제6항에 있어서,
    상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식인 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  8. 제6항에 있어서,
    상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  9. 삭제
  10. 입력된 비트 스트림으로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리하는 단계;
    상기 복수의 오디오 밴드 각각에 대하여, 인코딩 장치에서 오디오 데이터를 인코딩한 코딩 방식에 대한 정보를 추출하는 단계;
    상기 추출된 정보에 따른 코딩 방식에 따라서 각각의 오디오 밴드별로 인코딩된 오디오 데이터를 디코딩하는 단계; 및
    상기 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 오디오 신호를 생성하는 단계를 포함하며,
    상기 코딩 방식은, 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것이 선택되고, 상기 코딩 방식은, 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식이 선택되고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식이 선택되고,
    상기 소정 값은 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  11. 제10항에 있어서,
    상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  12. 제10항에 있어서,
    상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것을 특 징으로 하는 오디오 신호의 디코딩 방법.
  13. 삭제
  14. 입력된 비트 스트림으로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리하는 비트 스트림 분리부;
    상기 복수의 오디오 밴드 각각에 대하여, 인코딩 장치에서 오디오 데이터를 인코딩한 코딩 방식에 대한 정보를 추출하는 코딩 방식 추출부;
    상기 추출된 정보에 따른 코딩 방식에 따라서 각각의 오디오 밴드별로 인코딩된 오디오 데이터를 디코딩하는 오디오 디코딩부; 및
    상기 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 오디오 신호를 생성하는 오디오 신호 생성부를 포함하며,
    상기 코딩 방식은, 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것이 선택되고, 상기 코딩 방식은, 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식이 선택되고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식이 선택되고,
    상기 소정 값은 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  15. 제14항에 있어서,
    상기 파라메트릭 코딩 방식은 정현파 코딩(Sinusoidal Coding: SSC) 방식인 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  16. 제14항에 있어서,
    상기 시간-주파수 코딩 방식은 AAC(Advanced Audio Coding) 방식인 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  17. 삭제
  18. 오디오 신호의 인코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 인코딩 방법은,
    입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계;
    각각의 오디오 밴드마다 코딩 방식을 선택하는 단계;
    상기 각각의 오디오 밴드를 각각의 밴드마다 선택된 코딩 방식에 따라 인코딩하는 단계; 및
    상기 오디오 밴드별로 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하며,
    상기 각각의 오디오 밴드마다 코딩 방식을 선택하는 단계는 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것을 선택하는 단계를 포함하되, 코딩 방식을 선택하고자 하는 해당 오디오 밴드에 포함된 정현파 신호의 수를 기준으로 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식 중 하나의 코딩 방식을 선택하고,
    상기 기준이 되는 정현파 신호의 수는 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 기록 매체.
  19. 입력 오디오 신호를 복수의 오디오 밴드로 나누는 단계;
    각각의 오디오 밴드에 포함된 오디오 데이터를 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식을 각각 적용하여 인코딩하는 단계;
    상기 각각의 오디오 밴드별로 상기 두 가지 방식으로 인코딩된 데이터 중 크기가 작은 것을 선택하는 단계; 및
    상기 오디오 밴드별로 선택된 인코딩된 데이터를 모두 포함하는 비트 스트림을 생성하는 단계를 포함하되, 각각의 오디오 밴드에 포함된 정현파 신호의 수를 기준으로 파라메트릭 코딩 방식 및 시간-주파수 코딩 방식 중 하나의 코딩 방식을 각각의 오디오 밴드에 적용하여 인코딩하고,
    상기 기준이 되는 정현파 신호의 수는 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 오디오 신호의 인코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  20. 오디오 신호의 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 디코딩 방법은,
    입력된 비트 스트림으로부터 복수의 오디오 밴드별로 인코딩된 오디오 데이터를 분리하는 단계;
    상기 복수의 오디오 밴드 각각에 대하여, 인코딩 장치에서 오디오 데이터를 인코딩한 코딩 방식에 대한 정보를 추출하는 단계;
    상기 추출된 정보에 따른 코딩 방식에 따라서 각각의 오디오 밴드별로 인코딩된 오디오 데이터를 디코딩하는 단계; 및
    상기 오디오 밴드별로 디코딩된 오디오 데이터를 결합하여 오디오 신호를 생성하는 단계를 포함하며,
    상기 코딩 방식은, 각각의 오디오 밴드별로 파라메트릭 코딩 방식 및 시간-주파수(time-frequency) 코딩 방식 중에서 인코딩된 데이터의 크기가 더 작은 것이 선택되고, 상기 코딩 방식은, 해당 오디오 밴드에 포함된 정현파 신호의 수가 소정 값 이상인 경우 시간-주파수 코딩 방식이 선택되고, 상기 정현파 신호의 수가 소정 값보다 작은 경우 파라메트릭 코딩 방식이 선택되고,
    상기 소정 값은 시간-주파수 코딩 방식에서 인코딩 대상이 되는 주파수의 수인 것을 특징으로 하는 기록 매체.
KR1020070027271A 2007-03-20 2007-03-20 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 KR101149449B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020070027271A KR101149449B1 (ko) 2007-03-20 2007-03-20 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
US11/962,174 US8019616B2 (en) 2007-03-20 2007-12-21 Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal
CN2008800092190A CN101641733B (zh) 2007-03-20 2008-01-14 对音频信号编码和解码的方法和设备
EP08704746.0A EP2122614A4 (en) 2007-03-20 2008-01-14 METHOD AND DEVICE FOR ENCODING AUDIO SIGNAL, AND METHOD AND DEVICE FOR DECODING AUDIO SIGNAL
PCT/KR2008/000207 WO2008114925A1 (en) 2007-03-20 2008-01-14 Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal
JP2009554434A JP5118158B2 (ja) 2007-03-20 2008-01-14 オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070027271A KR101149449B1 (ko) 2007-03-20 2007-03-20 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080085562A KR20080085562A (ko) 2008-09-24
KR101149449B1 true KR101149449B1 (ko) 2012-05-25

Family

ID=39766016

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070027271A KR101149449B1 (ko) 2007-03-20 2007-03-20 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치

Country Status (6)

Country Link
US (1) US8019616B2 (ko)
EP (1) EP2122614A4 (ko)
JP (1) JP5118158B2 (ko)
KR (1) KR101149449B1 (ko)
CN (1) CN101641733B (ko)
WO (1) WO2008114925A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9219956B2 (en) 2008-12-23 2015-12-22 Keyssa, Inc. Contactless audio adapter, and methods
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
UY33236A (es) 2010-02-25 2011-09-30 Novartis Ag Inhibidores dimericos de las iap
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN107424621B (zh) 2014-06-24 2021-10-26 华为技术有限公司 音频编码方法和装置
US9685166B2 (en) * 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
US9602648B2 (en) 2015-04-30 2017-03-21 Keyssa Systems, Inc. Adapter devices for enhancing the functionality of other devices

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123400A (ja) * 1988-11-02 1990-05-10 Nec Corp 高能率音声符号化器
KR100346734B1 (ko) 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US5745250A (en) 1997-03-07 1998-04-28 Xerox Corporation Method of producing tint dots with pairs of holladay halftones
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JP3352401B2 (ja) 1998-08-18 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び複号化方法及び装置
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP3557164B2 (ja) * 2000-09-18 2004-08-25 日本電信電話株式会社 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
WO2003038389A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device and audio data distribution system
KR100949232B1 (ko) * 2002-01-30 2010-03-24 파나소닉 주식회사 인코딩 장치, 디코딩 장치 및 그 방법
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
RU2393552C2 (ru) * 2004-09-17 2010-06-27 Конинклейке Филипс Электроникс Н.В. Комбинированное аудиокодирование, минимизирующее воспринимаемое искажение
US20090138271A1 (en) * 2004-11-01 2009-05-28 Koninklijke Philips Electronics, N.V. Parametric audio coding comprising amplitude envelops

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법

Also Published As

Publication number Publication date
WO2008114925A1 (en) 2008-09-25
JP2010522348A (ja) 2010-07-01
EP2122614A1 (en) 2009-11-25
EP2122614A4 (en) 2013-09-04
CN101641733B (zh) 2013-04-03
US8019616B2 (en) 2011-09-13
CN101641733A (zh) 2010-02-03
JP5118158B2 (ja) 2013-01-16
KR20080085562A (ko) 2008-09-24
US20080235033A1 (en) 2008-09-25

Similar Documents

Publication Publication Date Title
KR101149449B1 (ko) 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
CN101518083B (zh) 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
RU2751150C1 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
JP2022110116A (ja) オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法
US20130159005A1 (en) Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR101291672B1 (ko) 노이즈 신호 부호화 및 복호화 장치 및 방법
CN103620674A (zh) 用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
US20090063163A1 (en) Method and apparatus for encoding/decoding media signal
KR101261524B1 (ko) 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
CN101241736A (zh) 用于解码参数编码音频信号的方法和装置
KR20140075466A (ko) 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
US20080189120A1 (en) Method and apparatus for parametric encoding and parametric decoding
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
KR20080086762A (ko) 오디오 신호의 인코딩 방법 및 장치
KR101425354B1 (ko) 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
KR101425355B1 (ko) 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
CN113192517A (zh) 一种音频编解码方法和音频编解码设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170616

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180508

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190508

Year of fee payment: 8