KR100462615B1 - 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 - Google Patents

적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 Download PDF

Info

Publication number
KR100462615B1
KR100462615B1 KR10-2002-0040402A KR20020040402A KR100462615B1 KR 100462615 B1 KR100462615 B1 KR 100462615B1 KR 20020040402 A KR20020040402 A KR 20020040402A KR 100462615 B1 KR100462615 B1 KR 100462615B1
Authority
KR
South Korea
Prior art keywords
high frequency
channel
frequency component
audio data
signal
Prior art date
Application number
KR10-2002-0040402A
Other languages
English (en)
Other versions
KR20040007815A (ko
Inventor
오윤학
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2002-0040402A priority Critical patent/KR100462615B1/ko
Priority to GB0309407A priority patent/GB2390788B/en
Priority to US10/426,351 priority patent/US7328161B2/en
Priority to NL1023560A priority patent/NL1023560C2/nl
Priority to CNB031409679A priority patent/CN1205755C/zh
Priority to JP2003185828A priority patent/JP3977292B2/ja
Publication of KR20040007815A publication Critical patent/KR20040007815A/ko
Application granted granted Critical
Publication of KR100462615B1 publication Critical patent/KR100462615B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing

Abstract

본 발명은 오디오 후처리(audio post processing)에 있어서 계산량을 줄이는 방법 및 장치에 관한 것으로, 구체적으로는 엠펙-1 레이어 3(MPEG-1 layer 3) 오디오 데이터에서 좌측채널과 우측채널 신호간의 유사성을 나타내는 모드(mode) 정보를 이용하여 두 채널간의 차이가 작은 경우는 한쪽 채널의 고주파수 성분만을 복원하고 이 복원된 고주파수 성분을 다른 채널의 고주파수 성분 복원에 이용하는 제1모드와, 두 채널간의 차이가 큰 경우는 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 앞뒤 프레임의 고주파수 성분들을 보간하여 복원하는 제2모드를 선택하여 적은 계산량으로 고주파수 성분을 복원하는 새로운 오디오 디코딩 방법 및 장치에 관한 것이다. 본 발명에서 개시된 방법을 사용하여 기존의 방법보다 고주파수 성분을 복원하는데 있어 계산량이 절반 이하로 줄어드는 효과가 있다.

Description

적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩 방법 및 장치 {Audio decoding method recovering high frequency with small computation, and apparatus thereof}
본 발명은 오디오 후처리(audio post processing)에 있어서 계산량을 줄이는 방법 및 장치에 관한 것으로, 구체적으로는 엠펙-1 레이어 3(MPEG-1 layer 3) 오디오에 있어서 디코더에서 검출된 스테레오 모드(stereo mode) 정보를 이용하여 두채널간의 차이가 작은 경우는 한쪽 채널의 고주파수 성분만을 복원하고 이 복원된 고주파수 성분을 다른 채널의 고주파수 성분 복원에 이용하는 제1모드와, 두 채널간의 차이가 큰 경우는 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 앞뒤 프레임의 고주파수 성분들을 보간하여 복원하는 제2모드로 나누고 경우에 따라서 상기 모드를 선택하여 고주파수 성분을 복원하는 방법 및 장치에 관한 것이다.
엠펙-1 레이어 3(MPEG-1 layer 3) 오디오 코딩시에 보다 효율적으로 데이터를 압축하기 위해 심리음향모델(psychoacoustic model)을 이용하여 사람이 듣지 못하는 고주파수 성분에는 적은 비트를 할당한다. 이렇게 되면 압축율은 좋아지지만 고주파수 영역은 손실되는데 이러한 고주파 영역의 손실로 인해 음색이 바뀌고 명료도가 저하되며 억눌리거나 무딘 소리가 나게 된다. 따라서, 원음의 음색을 충실히 재생하고 명료도를 높이기 위해서 손실된 고주파수 성분들을 복원하는 후처리 음질 개선 방법이 요구된다.
그러나, 기존의 여러 가지 후처리 음질 개선 방법은 음질 개선 효과에도 불구하고 후처리 방법 수행시 계산량이 과도해지는 문제점이 있다. 가장 잘 알려진 후처리 음질 개선방법인 SBR(SubBand Replication)방법은 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더에서 수행되는 계산량의 2배 가량의 계산량이 요구된다.
한국특허공개공보 2000-75936 에서는 비고주파와 잡음결합을 지닌 주파수 스펙트럼으로부터 고주파 분해능을 얻기 위해 타임 도메인에서 디코딩된 음성신호를 제공하는 후처리방법을 개시하고 있다.
이를 위하여 FFT에 의해 디코딩된 타임 도메인 신호를 주파수 도메인 신호로 변환하는 단계, 교란 주파수 성분을 검출하여 상기 주파수 도메인 신호의 에너지 분포를 분석하는 단계, 상기 교란 주파수 성분에 대한 억압량을 검출하는 단계, 포스트 필터링을 제어하는 단계 및 포스트 필터링된 변환을 역변환하는 단계를 구비한다.
그러나, 선행기술은 음성 및 오디오 디코딩시에 디코딩된 음성의 지각품질을 향상시키기 위한 음성 디코더용 후처리방법에 관한 것으로, 고주파성분의 분해능을 높이기 위한 것이라는 목적은 유사하나, 주파수 스펙트럼을 분석하고, 고주파 해상도 필터링을 사용하여 상기 목적을 실현하는 것으로 본 발명과는 차이가 있다. 그리고 상기 후처리방법 실행시에 계산량이 줄어드는 효과도 얻을 수 없다.
상기한 문제를 해결하기 위해 본 발명에서는, 종래의 후처리 방법에서 요구되는 과도한 계산량을 줄이기 위하여 엠펙-1 레이어 3 오디오 데이터에서 좌측채널과 우측채널 신호간의 유사성을 나타내는 모드(mode) 정보를 이용하여 두 채널간의 차이가 작은 경우는 한쪽 채널의 고주파수 성분만을 복원하고 이 복원된 고주파수 성분을 다른 채널의 고주파수 성분 복원에 이용하는 제1모드와, 두 채널간의 차이가 큰 경우는 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 앞뒤 프레임의 고주파수 성분들을 보간하여 복원하는 제2모드로 나누고 경우에 따라서 상기 모드를 선택하여 고주파수 성분을 복원하는 새로운 오디오 디코딩 방법 및 장치를 제공하는 것을 목적으로 한다.
도 1은 종래의 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더에서 디코딩된 PCM 신호를 후처리하는 장치를 나타낸 도면.
도 2는 본 발명의 후처리 장치 도면.
도 3은 MPEG-1 레이어 3 오디오 스트림의 포맷.
도 4는 본 발명의 후처리 방법 도면.
도 5는 우측 채널의 고주파수 성분 복원을 하는 방법을 나타낸 도면.
도 6은 두 채널간의 차이가 큰 경우(MODE2)의 고주파수를 복원하는 방법을 나타낸 도면.
상기한 목적을 이루기 위하여 본 발명에서는, 오디오 디코딩시 고주파수 성분을 생성하는 방법에 있어서, 제1채널 신호 및 제2채널 신호간의 연관성에 대한 정보를 저장하고 있는 모드정보를 이용하여 고주파수 성분을 생성하는 고주파수 성분생성방법을 제공한다.
상기한 목적을 이루기 위하여 본 발명에서는, 인코딩된 오디오 데이터를 입력받아 디코딩하여 제1채널 및 제2채널의 오디오 신호로 만들어 출력하는 단계; 상기 오디오 데이터에서 제1채널 신호 및 제2채널 신호간의 연관성에 대한 정보를 저장하고 있는 모드정보를 구하는 단계; 상기 구한 모드정보가 상기 제1채널 신호 및 제2채널 신호간에 연관성이 큰 것을 나타내는 조인트 스테레오 모드값이면 상기 제1채널 또는 상기 제2채널중 하나만을 선택하여 고주파수 성분을 생성하고 선택하지 않은 채널의 고주파수 성분은 상기 선택하여 생성한 고주파수 성분에 소정의 보정을 하여 생성하는 단계; 및 상기 선택하여 생성된 한쪽 채널의 고주파수 성분과 선택한 채널의 상기 디코딩된 오디오 신호를 합하여 한쪽 채널로 출력하고, 다른 한쪽 채널로는 보정된 상기 고주파수 성분과 선택되지 않은 디코딩된 오디오 신호와 합쳐 출력하는 단계를 포함하는 고주파수 성분을 복원한 오디오 디코딩 방법을 제공한다.
상기한 목적을 이루기 위하여 본 발명에서는, 인코딩된 오디오 데이터를 입력받아 디코딩하여 오디오 신호로 만들어 출력하는 오디오 디코더; 상기 입력된 인코딩 오디오 데이터를 분석하여 모드 정보값을 찾아내는 모드정보 분석부; 상기 모드 정보값에 따라서 각 채널에 대한 고주파수 성분을 생성하는 고주파수 성분 생성부; 및 상기 디코딩된 오디오 신호에 상기 생성된 고주파수 성분을 합쳐서 출력하는 오디오 합성부를 포함하는 고주파수 성분을 복원한 오디오 디코딩 장치를 제공한다.
상기한 목적을 이루기 위하여 본 발명에서는, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1은 종래의 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더에서 디코딩된 PCM 신호를 후처리하는 장치를 나타낸 도면이다.
엠펙-1 레이어 3(MPEG-1 layer 3)의 형식에 따라 인코딩된 신호가 입력되면(test.mp3), 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더(110)에서 좌측채널(left channel) 신호와 우측채널(right channel) 신호로 분리하여 각각 PCM(Pulse Code Modulation) 신호(test.pcm)로 만든다. 이렇게 만들어진 PCM 신호를 고주파성분 복원부(120)에 입력하면 좌측 및 우측채널에 대한 고주파수 성분을 각각 복원하여 복원된 PCM 오디오 신호(test_app.pcm)를 출력한다.
상술한 바와 같이 기존의 후처리 방법에서는 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더를 통해서 출력된 좌측채널(left channel) 신호와 우측채널(right channel) 신호에 대해 각각 후처리를 하여 고주파수 영역을 복원한다.
그러나, 대부분의 오디오의 경우 좌측채널(left channel) 신호와 우측채널(right channel) 신호는 중복성(redundancy)이 높아서 엠펙-1 레이어 3(MPEG-1 layer 3) 인코딩 알고리즘에서도 조인트 스레레오(joint stereo) 모드를 적용하여 좌측채널(left channel) 신호와 우측채널(right channel) 신호를 독립적으로 각각 인코딩하지 않는다.
따라서, 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 복원된 고주파수 성분들은 서로 유사하고 중복성(redundancy)이 있으므로 좌측채널(left channel) 신호와 우측채널(right channel) 신호에 대해 각각 후처리를 하는 것은 불필요한 계산량을 늘리는 단점이 있다.
도 2는 본 발명의 후처리 장치 도면이다.
엠피3 디코더(210)는 엠펙-1 레이어 3(MPEG-1 layer 3) 오디오 신호를 입력받아 디코딩하여 PCM 신호로 만들어 출력한다. 엠피3(MP3) 오디오 신호에는 모드 정보를 포함하고 있다. 따라서 모드정보 분석부(220)는 입력되는 엠피3(MP3) 오디오에서 모드정보를 분석하여 그 값을 고주파수 성분 생성부(230)에 전달한다.
고주파수 성분 생성부(230)는 상기 모드정보값에 따라서 각 채널에 대한 고주파수 성분을 생성한다. 모드(mode) 정보가 좌측채널(left channel) 신호와 우측채널(right channel) 신호간의 유사성이 큰 조인트 스테레오 모드(joint stereo mode) 값인지, 두 채널간의 유사성이 없고 차이가 큰 스테레오 모드(stereo mode) 값인지에 따라서 고주파수 성분을 만들어 낸다. 고주파수 성분의 생성과정은 종래의 고주파수 성분 생성과정을 따른다.
만일 모드값이 조인트 스테레오 모드(joint stereo mode)(MODE1)이면 좌측채널(left channel) 신호와 우측채널(right channel) 신호가 유사한 경우이므로, 한쪽 채널의 고주파수 성분만 생성하고, 다른 한쪽 채널의 고주파수 성분은 이를 이용하여 만든다. 예를 들어, 좌측채널(left channel)에서 복원한 고주파수 성분들에 두 채널간의 유사도에 따른 보정값을 곱하여 우측채널(right channel)의 고주파수 성분으로 적용한다. 유사성이 서로 크므로 이렇게 하여도 음질의 저하가 거의 없다.
그리고, 만일 모드값이 스테레오 모드(stereo mode)(MODE2)이면 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 차이가 크기 때문에 채널간의 연관성이 없으므로 각각의 채널의 고주파수 성분을 따로따로 생성하여 복원한다. 이 경우 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 좌측채널과 우측채널별로 앞뒤 프레임의 고주파수 성분들을 보간하여 복원한다. 상기 MODE2에 대해서는 도 5를 참조하여 후술한다.
오디오 합성부(240)는 디코딩된 PCM 신호에 복원된 고주파수 성분을 합쳐서 출력한다.
도 3은 MPEG-1 레이어 3 오디오 스트림의 포맷이다.
엠펙-1(MPEG-1) 레이어 3 오디오 스트림 오디오 복호단위(AAU, Audio Access Unit)(300)로 구성되어 있는데, 오디오 복호단위(AAU)(300)는 하나하나 단독으로 복호화될 수 있는 최소단위로서 항상 일정한 샘플수의 데이터를 압축하여 싣고 있다. 오디오 복호단위(AAU)(300)는 헤더(header)(310)와 오류체크(CRC, Cyclic Redundancy Check)(320), 오디오 데이터(audio data)(330) 및 보조 데이터(auxiliary data)(340)로 구성된다.
헤더(header)(310)에는 동기워드(syncword), ID 정보, 계층정보, 보호비트(protection bit)의 유무정보, 비트율 인덱스(bitrate index) 정보, 샘플링 주파수 정보, 패딩비트(padding bit)의 유무 정보, 개별용도 비트, 모드 정보, 모드 확장정보, 저작권(copyright) 정보, 원본인지 복사본인지의 여부 정보 및 엠퍼시스(emphasis) 특성정보가 들어있다.
CRC(320)는 선택사항으로 이것의 유무는 헤더(header)(310)에서 정의되며 길이는 16비트이다.
오디오 데이터(audio data)(330)는 압축된 음성 데이터가 들어가는 부분이다.
보조 데이터(auxiliary data)(340)는 오디오 데이터(330)의 끝이 하나의 오디오 복호단위(AAU)의 끝에 달하지 않은 경우 남은 부분을 말하는 것으로, 엠펙 오디오 이외의 임의의 데이터가 삽입될 수 있다.
본 발명의 후처리방법은 이중에서 모드정보와 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 차(difference) 정보를 이용하여 각 채널간의 연관성여부를 판단하고 이에 따라서 고주파수 성분을 복원한다.
도 4는 본 발명의 후처리 방법 도면이다.
새로운 후처리 방법은 먼저 엠펙-1 레이어 3(MPEG-1 layer 3) 오디오를 디코딩하여 PCM 신호로 만들어 출력한다(410). 그리고 이와 함께 모드(mode) 정보를 얻는다(420). 상기 모드(mode) 정보가 좌측채널(left channel) 신호와 우측채널(right channel) 신호간의 유사성이 큰 조인트 스테레오 모드(joint stereo mode) 값인지, 두 채널간의 유사성이 없고 차이가 큰 스테레오 모드(stereo mode) 값인지 판단한다(430).
만일 상기 판단결과 조인트 스테레오 모드(joint stereo mode)(MODE1)이면 좌측채널(left channel) 신호와 우측채널(right channel) 신호가 유사한 경우이므로, 한쪽 채널의 고주파수 성분만 생성하고, 다른 한쪽 채널의 고주파수 성분은 이를 이용하여 만든다(460). 예를 들어, 좌측채널(left channel)에서 복원한 고주파수 성분들을 우측채널(right channel)의 고주파수 성분으로 그대로 적용하거나 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 차(difference) 정보를 이용하여 약간의 수정값을 곱하여 얻는다(470). 수정값은 예를 들어 일정한 상수일 수도 있다. 유사성이 서로 크므로 이렇게 하여도 음질의 저하가 거의 없다. 마지막으로 디코딩된 PCM 신호에 복원된 고주파수 성분을 합쳐서 출력한다(480).
상기 판단결과 스테레오 모드(stereo mode)(MODE2)이면 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 차이가 크기 때문에 채널간의 연관성이 없으므로 각각의 채널의 고주파수 성분을 따로따로 생성하여 복원한다(440). 이 경우 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 좌측채널과 우측채널별로 앞뒤 프레임의 고주파수 성분들을 보간하여 복원한다. 마지막으로 디코딩된 PCM 신호에 복원된 고주파수 성분을 합쳐서 출력한다(450).
일반적으로 대부분의 오디오의 경우, 조인트 스테레오 모드(joint stereo mode)(MODE1)가 적용된다. 즉, 좌측채널(left channel) 신호와 우측채널(right channel) 신호가 유사하므로 이러한 방식이 적용되는 경우가 많아 계산량이 절반으로 줄어들 수 있다. 128 kbps 이상의 높은 전송율을 가진 오디오 신호의 경우 즉, 좌측채널(left channel) 신호와 우측채널(right channel) 신호의 차이가 커서 각각 코딩해야 하는 경우, 즉 MODE2의 경우에는 오디오 후처리가 채널별로 각각 적용되어야 하고 이러한 경우에도 MODE2를 이용하여 계산량을 줄일 수가 있다.
새로운 후처리 방법은 엠펙-1 레이어 3(MPEG-1 layer 3) 디코더에서 검출된 스테레오 모드(stereo mode) 정보를 이용하여 두 채널(channel)간의 유사성이 큰 조인트 스테레오 모드(joint stereo mode)인 경우인지, 두 채널(channel)간의 차이가 큰 스테레오 모드(stereo mode) 인지에 대해 판단한다.
이렇게 하여 복원된 고주파수 성분들을 좌측채널(left channel) 신호와 우측채널(right channel) 신호에 더해져서 출력된다.
도 5는 우측 채널의 고주파수 성분 복원을 하는 방법을 나타낸 도면이다.
좌측 채널의 고주파수 성분을 만들고, 만일 모드정보가 조인트 스테레오 모드값이면 생성한 좌측 채널의 고주파수 성분을 우측 채널의 고주파수 성분생성에 사용하고, 그렇지 않으면 우측 채널의 고주파수 성분은 좌측 채널의 고주파수 성분과 상관없이 별개로 생성한다.
도 6은 두 채널간의 차이가 큰 경우(MODE2)의 고주파수를 복원하는 방법을나타낸 도면이다.
즉, 도4에서 좌측 및 우측채널의 고주파수 성분을 각각 생성하는 단계(440)를 설명한 도면이다. 이 경우 좌측채널과 우측채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원한다. 즉 시간 t1일 때의 프레임에서 좌측 채널의 고주파수 성분을 복원하고 시간 t2일 때의 프레임에서 우측 채널의 고주파수 성분을 복원한다. t3, t4, t5...일 때도 채널별로 상기 방법을 반복적으로 수행한다.
이때, 시간 t1일 때의 프레임에서 좌측 채널의 고주파수 성분 및 우측 채널의 고주파수 성분을 각각 Lt1, Rt1이라고 하고, 같은 방법으로 시간 t2일 때의 프레임에서 좌측 채널의 고주파수 성분 및 우측 채널의 고주파수 성분을 각각 Lt2, Rt2라고 한다.
그러면, 건너뛴 프레임의 고주파수 성분, 즉 시간 t2에서의 좌측 채널의 고주파수 성분(Lt2)은 앞뒤 프레임, 즉 t1과 t3에서의 좌측 채널의 고주파수 성분들을 보간하여 복원한다. 즉, Lt2= (Lt1+ Lt3)/2 이다. 또한, t3에서의 우측 채널의 고주파수 성분(Rt3)은 t2와 t4에서의 우측 채널의 고주파수 성분들을 보간하여 만든다. 즉, Rt3= (Rt2+ Rt4)/2이다. 마지막으로 디코딩된 PCM 신호에 상기 복원된 고주파수 성분을 합쳐서 출력한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 씨디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명은, 기존의 후처리 방법이 음질 개선 효과에도 불구하고 계산량의 과다로 인해 실제로 제품에 적용되기 힘든 문제점이 있었는데 본 발명을 통하여 고주파수 성분을 복원하는데 있어 계산량이 절반 이하로 줄어드는 효과가 있다.

Claims (11)

  1. 오디오 디코딩시 고주파수 성분을 생성하는 방법에 있어서,
    제1채널 신호 및 제2채널 신호간의 연관성에 대한 정보를 저장하고 있는 모드정보를 이용하여 고주파수 성분을 생성하는 고주파수 성분생성방법.
  2. 제1항에 있어서, 상기 모드정보가 두 채널간의 차이가 큰 것을 나타내는 값인 경우에는
    (a) 제1채널과 제2채널별로 한 프레임씩 건너뛰면서 고주파수 성분을 복원하는 단계; 및
    (b) 건너뛴 프레임의 고주파수 성분은 제1채널과 제2채널별로 앞뒤 프레임의 고주파수 성분들을 보간하여 복원하는 것을 특징으로 하는 고주파수 성분생성방법.
  3. 제1항에 있어서, 상기 모드정보가 두 채널간의 차이가 적은 것을 나타내는 값인 경우에는
    (a) 제1채널의 고주파수 성분을 생성하는 단계; 및
    (b) 제2채널의 고주파수 성분은 상기 제1채널의 고주파수 성분을 그대로 이용하거나 소정의 보정을 하여 생성하는 것을 특징으로 하는 고주파수 성분생성방법.
  4. 제1항에 있어서, 상기 인코딩된 오디오 데이터는
    엠펙-1 레이어3 오디오 데이터인 것을 특징으로 하는 고주파수 성분생성방법.
  5. (a) 인코딩된 오디오 데이터를 입력받아 디코딩하여 제1채널 및 제2채널의 오디오 신호로 만들어 출력하는 단계;
    (b) 상기 오디오 데이터에서 제1채널 신호 및 제2채널 신호간의 연관성에 대한 정보를 저장하고 있는 모드정보를 구하는 단계;
    (c) 상기 구한 모드정보가 상기 제1채널 신호 및 제2채널 신호간에 연관성이 큰 것을 나타내는 조인트 스테레오 모드값이면 상기 제1채널 또는 상기 제2채널중 하나만을 선택하여 고주파수 성분을 생성하고 선택하지 않은 채널의 고주파수 성분은 상기 선택하여 생성한 고주파수 성분에 소정의 보정을 하여 생성하는 단계; 및
    (d) 상기 선택하여 생성된 한쪽 채널의 고주파수 성분과 선택한 채널의 상기 디코딩된 오디오 신호를 합하여 한쪽 채널로 출력하고, 다른 한쪽 채널로는 보정된 상기 고주파수 성분과 선택되지 않은 디코딩된 오디오 신호와 합쳐 출력하는 단계를 포함하는 고주파수 성분을 복원한 오디오 디코딩 방법.
  6. 제5항에 있어서, 상기 인코딩된 오디오 데이터는
    엠펙-1 레이어3 오디오 데이터인 것을 특징으로 하는 고주파수 성분을 복원한 오디오 디코딩 방법.
  7. 제5항에 있어서, 상기 (c) 단계의 다른 한쪽 채널의 고주파수 성분은
    상기 생성한 다른 채널의 고주파수 성분을 동일하게 사용하는 것을 특징으로하는 고주파수 성분을 복원한 오디오 디코딩 방법.
  8. 인코딩된 오디오 데이터를 입력받아 디코딩하여 오디오 신호로 만들어 출력하는 오디오 디코더;
    상기 입력된 인코딩 오디오 데이터를 분석하여 모드 정보값을 찾아내는 모드정보 분석부;
    상기 모드 정보값에 따라서 각 채널에 대한 고주파수 성분을 생성하는 고주파수 성분 생성부; 및
    상기 디코딩된 오디오 신호에 상기 생성된 고주파수 성분을 합쳐서 출력하는 오디오 합성부를 포함하는 고주파수 성분을 복원한 오디오 디코딩 장치.
  9. 제8항에 있어서, 상기 인코딩된 오디오 데이터는
    엠펙-1 레이어3 오디오 데이터인 것을 특징으로 하는 고주파수 성분을 복원한 오디오 디코딩 장치.
  10. 제8항에 있어서, 상기 고주파수 성분 생성부는
    상기 찾아낸 모드 정보값이 상기 제1채널 신호와 상기 제2채널 신호간에 연관성이 없음을 나타내는 스테레오 모드값이면 좌측채널과 우측채널별로 각각 한 프레임씩 건너뛰면서 고주파수 성분을 복원하고 건너뛴 프레임의 고주파수 성분은 좌측채널과 우측채널별로 앞뒤 프레임의 고주파수 성분들을 보간하여 복원함으로써상기 제1채널 신호와 상기 제2채널 신호의 고주파수 성분을 모두 생성하고, 상기 찾아낸 모드 정보값이 조인트 스테레오 모드값이면 한쪽 채널의 고주파수 성분만을 생성하고 다른 한쪽 채널의 고주파수 성분은 상기 생성한 고주파수 성분에 소정의 보정을 하여 생성하는 것을 특징으로 하는 고주파수 성분을 복원한 오디오 디코딩 장치.
  11. 제1항 내지 제7항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR10-2002-0040402A 2002-07-11 2002-07-11 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 KR100462615B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR10-2002-0040402A KR100462615B1 (ko) 2002-07-11 2002-07-11 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
GB0309407A GB2390788B (en) 2002-07-11 2003-04-24 Audio decoding method and apparatus which recover high frequency component with small computation
US10/426,351 US7328161B2 (en) 2002-07-11 2003-04-30 Audio decoding method and apparatus which recover high frequency component with small computation
NL1023560A NL1023560C2 (nl) 2002-07-11 2003-05-28 Audio decodeermethode en inrichting welke hoogfrequente componenten met kleine berekeningen herstellen.
CNB031409679A CN1205755C (zh) 2002-07-11 2003-06-02 以少量计算恢复高频分量的音频解码方法和装置
JP2003185828A JP3977292B2 (ja) 2002-07-11 2003-06-27 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0040402A KR100462615B1 (ko) 2002-07-11 2002-07-11 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치

Publications (2)

Publication Number Publication Date
KR20040007815A KR20040007815A (ko) 2004-01-28
KR100462615B1 true KR100462615B1 (ko) 2004-12-20

Family

ID=29728789

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0040402A KR100462615B1 (ko) 2002-07-11 2002-07-11 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치

Country Status (6)

Country Link
US (1) US7328161B2 (ko)
JP (1) JP3977292B2 (ko)
KR (1) KR100462615B1 (ko)
CN (1) CN1205755C (ko)
GB (1) GB2390788B (ko)
NL (1) NL1023560C2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668927B1 (ko) 2006-01-18 2007-01-12 엘지전자 주식회사 스테레오 오디오 신호의 후처리 장치 및 방법

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
WO2005034089A1 (ja) * 2003-09-30 2005-04-14 Sony Corporation データ再生装置及び方法並びにプログラム
KR100750115B1 (ko) * 2004-10-26 2007-08-21 삼성전자주식회사 오디오 신호 부호화 및 복호화 방법 및 그 장치
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
US7852742B2 (en) * 2006-12-01 2010-12-14 Infineon Technologies Ag Precompensation of crosstalk interference based on feedback error signal
JP4277234B2 (ja) * 2007-03-13 2009-06-10 ソニー株式会社 データ復元装置、データ復元方法及びデータ復元プログラム
US7822418B2 (en) * 2007-05-14 2010-10-26 Infineon Technologies Ag Device playback using radio transmission
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
US8359196B2 (en) * 2007-12-28 2013-01-22 Panasonic Corporation Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
AU2010242814B2 (en) 2009-05-01 2014-07-31 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
JP4922427B2 (ja) * 2010-04-19 2012-04-25 株式会社東芝 信号補正装置
KR101572034B1 (ko) 2011-05-19 2015-11-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 오디오 코딩 방식들의 포렌식 검출
US20150371643A1 (en) * 2012-04-18 2015-12-24 Nokia Corporation Stereo audio signal encoder
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN109688531B (zh) * 2017-10-18 2021-01-26 宏达国际电子股份有限公司 获取高音质音频变换信息的方法、电子装置及记录介质
CN112803828B (zh) * 2020-12-31 2023-09-01 上海艾为电子技术股份有限公司 一种马达控制方法、控制系统和控制芯片

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321561A (ja) * 1996-05-30 1997-12-12 Victor Co Of Japan Ltd ラウドネス回路
JP2002073088A (ja) * 2000-08-25 2002-03-12 Kenwood Corp 周波数間引き装置、周波数間引き方法及び記録媒体
WO2002041301A1 (en) * 2000-11-14 2002-05-23 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6025818B2 (ja) * 1977-11-21 1985-06-20 株式会社日立製作所 Pcm方式録音機
US5526431A (en) * 1992-06-25 1996-06-11 Kabushiki Kaisha Kawai Gakki Seisakusho Sound effect-creating device for creating ensemble effect
JPH0955634A (ja) * 1995-08-11 1997-02-25 Yamaha Corp 高調波付加回路
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100336465B1 (ko) * 2000-05-27 2002-05-15 이경호 휴대용 노래방기기
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
KR20040035749A (ko) 2001-08-31 2004-04-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 사운드 신호의 대역폭 확장 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321561A (ja) * 1996-05-30 1997-12-12 Victor Co Of Japan Ltd ラウドネス回路
JP2002073088A (ja) * 2000-08-25 2002-03-12 Kenwood Corp 周波数間引き装置、周波数間引き方法及び記録媒体
WO2002041301A1 (en) * 2000-11-14 2002-05-23 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668927B1 (ko) 2006-01-18 2007-01-12 엘지전자 주식회사 스테레오 오디오 신호의 후처리 장치 및 방법

Also Published As

Publication number Publication date
JP2004046179A (ja) 2004-02-12
NL1023560A1 (nl) 2004-01-13
GB2390788B (en) 2004-06-30
US20040008615A1 (en) 2004-01-15
KR20040007815A (ko) 2004-01-28
CN1205755C (zh) 2005-06-08
CN1467703A (zh) 2004-01-14
JP3977292B2 (ja) 2007-09-19
GB2390788A (en) 2004-01-14
US7328161B2 (en) 2008-02-05
NL1023560C2 (nl) 2005-10-20

Similar Documents

Publication Publication Date Title
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
JP6013646B2 (ja) オーディオ処理システム
RU2449387C2 (ru) Способ и устройство для обработки сигнала
US8116459B2 (en) Enhanced method for signal shaping in multi-channel audio reconstruction
JP3646938B1 (ja) オーディオ復号化装置およびオーディオ復号化方法
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
US8355921B2 (en) Method, apparatus and computer program product for providing improved audio processing
US20060031075A1 (en) Method and apparatus to recover a high frequency component of audio data
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
US20080208600A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR100763919B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
JP4359499B2 (ja) オーディオ信号の編集
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP2000151414A (ja) ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体
JP2007505346A (ja) 遷移のオーディオ信号成分の符号化
JP2002229598A (ja) ステレオ符号化信号復号化装置及び復号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20141127

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee