KR100608062B1 - 오디오 데이터의 고주파수 복원 방법 및 그 장치 - Google Patents

오디오 데이터의 고주파수 복원 방법 및 그 장치 Download PDF

Info

Publication number
KR100608062B1
KR100608062B1 KR1020040061423A KR20040061423A KR100608062B1 KR 100608062 B1 KR100608062 B1 KR 100608062B1 KR 1020040061423 A KR1020040061423 A KR 1020040061423A KR 20040061423 A KR20040061423 A KR 20040061423A KR 100608062 B1 KR100608062 B1 KR 100608062B1
Authority
KR
South Korea
Prior art keywords
high frequency
filter bank
transient
frequency region
bank value
Prior art date
Application number
KR1020040061423A
Other languages
English (en)
Other versions
KR20060012783A (ko
Inventor
오윤학
이혁재
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040061423A priority Critical patent/KR100608062B1/ko
Priority to US11/125,152 priority patent/US20060031075A1/en
Priority to IT001351A priority patent/ITMI20051351A1/it
Priority to CNA2005100842636A priority patent/CN1734555A/zh
Priority to NL1029619A priority patent/NL1029619C2/nl
Priority to JP2005221617A priority patent/JP2006048043A/ja
Publication of KR20060012783A publication Critical patent/KR20060012783A/ko
Application granted granted Critical
Publication of KR100608062B1 publication Critical patent/KR100608062B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Abstract

디코더내에서 mp3 압축 오디오 신호의 고주파수 복원 방법 및 그 장치가 개시되어 있다. 본 발명은 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정, 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정, 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정, 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함한다.

Description

오디오 데이터의 고주파수 복원 방법 및 그 장치{Method and apparatus for decoding high frequency of audio data}
도 1은 기존의 SBR 방식의 mp3PRO 디코딩 블록도이다.
도 2는 본 발명에 따른 고주파수 복원 방식을 적용한 mp3 디코더의 전체 블록도이다.
도 3a 내지 도 3d는 본 발명에 따른 고주파수 성분을 복원하는 과정을 보이는 그래프이다.
도 4는 본 발명에 따른 오디오 데이터 고주파수 복원 방법을 보이는 흐름도이다.
본 발명은 오디오 압축/복호 시스템에 관한 것이며, 특히 디코더내에서 mp3 압축 오디오 신호의 고주파수 복원 방법 및 그 장치에 관한 것이다.
일반적으로 디지탈 엠펙(MPEG:Moving Picture Experts Group) 오디오로 통칭되고 있는 디지탈 오디오는 고품질,고능률 스테레오 부호화를 위한 국제 표준화기구(ISO/IEC)의 표준방식이다. 상기 엠펙 오디오는 엠펙 비디오와 조합됨으로써 고 능률의 멀티미디어 정보압축을 실현 가능하게 하며, 최근에는 디지탈 티브이(DTV),디브이디(DVD), 디지탈 음악방송(DAB:Digital Audio Broadcasting) 및 엠피-3 플레이어등 다양한 응용 제품이 등장하고 있는 상황이다. mp3오디오는 최근 널리 사용되고 있는 .mp3 확장자를 갖는 방식으로, 엠펙-1 오디오 계층 3의 방식으로 인코딩된 것을 의미한다. 또한, 엠펙 오디오의 압축원리는 인간의 감각특성을 이용해서 감도가 낮은 세부의 정보를 생략하여 부호량을 절감시키는 "지각부호화(Perceptual Coding)" 방법을 이용한다.
그러나 mp3 오디오 데이터는 압축을 많이 할수록 고주파수 영역을 손실하게된다. 이러한 고주파 영역의 손실로 인해 음색이 바뀌고 명료도가 저하되며 억눌리거나 무딘 소리가 나게 된다. 따라서 손실 고주파수 성분들을 복원하기 위해 후처리 음질 개선을 적용한 SBR(SBR(Spectral Band Replication)방식의 mp3PRO 포맷을 이용하고 있다.
도 1은 기존의 SBR 방식의 mp3PRO 디코딩 블록도이다.
도 1을 참조하면, 디코더부(110)는 mp3PRO 비트스트림이 입력되면 시간 차원의 PCM 오디오 데이터와 보조 데이터로 디코딩한다. 이때 PCM 오디오 데이터는 좌측채널 오디오 데이터와 우측채널 오디오 데이터로 분리되고, 보조 데이터는 엔벨로프(envelope) 정보를 포함한다. QMF 분석부(120)는 PCM 오디오 데이터를 32 밴드들의 저주파수 영역의 신호로 변환한다. 고주파수 발생부(130)는 QMF 분석부(120)에서 변환된 저주파수 영역의 성분들과 하모닉(harmonic)한 관계를 가지도록 엔벨로프 정보에 따른 고주파수 성분들을 생성한다. 엔벨로프 조정부(140)는 저주파스 영역의 스펙트럼을 이용하여 엔벨로프 정보에 따라 고주파수 성분들의 에너지를 조정한다. QMF 합성부(150)는 엔벨로프 조정부(140)에서 조정된 고주파수 성분들의 에너지와 QMF 분석부(120)에서 분석된 저주파수 영역의 신호를 합성하여 고주파수 성분이 복원된 시간차원의 오디오 데이터를 출력한다. 채널분리부(160)는 디코더(110)에서 발생하는 보조 데이터에 따라 좌측 채널과 우측 채널을 분리한 오디오 데이터를 출력한다.
결국, 기존에서 디코더부(110)에서 디코딩된 mp3 오디오 데이터는 후처리 장치들 즉, QMF 분석부(120), 고주파발생부(130), 엔벨로프조절부(140), QMF 합성부(150)에 의해 고주파수 성분이 복원된다. 따라서 SBR(Spectral Band Replication)방식은 후처리를 이용함으로써 다음과 같은 두 가지 문제점이 있다.
첫째로, 디코딩된 파일을 주파수 영역으로 변환하고 존재하는 주파수 성분들로부터 고주파 성분들을 추정한다. 추정된 고주파 성분들은 다시 시간 차원으로 변환되고 디코딩 파일에 더해져서 출력된다. 기존의 SBR(Spectral Band Replication)방식의 mp3 디코딩 방법은 시간 차원에서 주파수 차원으로, 주파수 차원에서 시간 차원으로 변환하는 두가지 과정이 필요하게 된다. 따라서 기존의 SBR(Spectral Band Replication)방식의 mp3 디코딩 방법은 차원 변환 과정에서 과도한 계산량이 요구된다.
두 번째로, SBR(Spectral Band Replication)방식의 mp3PRO 디코더는 주파수 차원에서 고주파수 영역을 복원하기 위해 인코더단에서 구한 스펙트럼 엔빌로프(spectrum envelope) 정보를 이용하므로 기존의 mp3 인코더가 그대로 사용되지 않 고 수정된다. 즉, SBR(Spectral Band Replication)방식의 mp3PRO 디코더는 기존의 mp3 파일에 대해 고주파수 성분들을 복원할 수 없다.
본 발명이 이루고자하는 기술적 과제는 mp3 디코딩 과정중에 손실된 고주파수 성분들을 복원함으로써 기존의 오디오 코덱 방식에 의해 손실된 고주파수 성분들로 인해 저하된 원음의 음색을 재생하고 명료도를 높이는 오디오 데이터의 고주파수 복원 방법을 제공하는 데 있다.
본 발명이 이루고자하는 다른 기술적 과제는 오디오 데이터의 고주파수 복원 방법을 적용한 오디오 데이터의 고주파수 복원 장치를 제공하는 데 있다.
상기의 기술적 과제를 해결하기 위하여, 본 발명은 압축 오디오 신호의 고주파수 성분 복원 방법에 있어서,
(a) 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정;
(b) 상기 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정;
(c) 상기 생성된 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정;
(d) 상기 과정에서 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함하는 것을 특징으로 한다.
상기의 다른 기술적 과제를 해결하기 위하여, 본 발명은 압축 오디오 신호의 고주파수 성분 복원 장치에 있어서,
입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출하는 역 양자화부;
상기 역 양자화부 추출된 MDCT 계수로부터 저주파수 영역의 필터 뱅크 값을 생성하는 역 MDCT부;
상기 역 MDCT부에서 사용하는 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 선택하는 웨이트 계수 추출부;
상기 역 DCT부에서 생성된 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원하는 고주파수 영역 생성부;
상기 웨이트 계수 추출부에서 선택된 웨이트 계수를 상기 고주파수영역 생성부에서 복원된 고주파수 영역의 필터 뱅크 값에 곱하는 곱셈부를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조로하여 본 발명의 바람직한 실시예를 설명하기로 한다.
먼저, 본 발명에 따른 mp3 디코더에 입력되는 mp3 비트 스트림은 다음과 같은 과정을 통해 형성된다. 먼저, PCM(Pulse coded Modulation) 형태의 오디오 데이터를 입력한다. 이어서, 입력된 PCM 오디오 데이터를 각 그래뉼(granule) 마다 576개 샘플들로 나눈다. 이어서, 그 샘플들에 대해서 MPEG1 레이어3(MP3)에서 심리 음 향 모델을 적용하여 지각 에너지(perceptual energy)를 구한다. 이어서, 심리음향 모델에서 구해진 지각 에너지와 임계치를 비교하여 윈도우잉을 스위칭하면서 MDCT를 수행한다. MDCT 윈도우 사이즈의 일부 또는 전부는 임계치에 따라 스위칭 될 수 있다. 즉, 지각 에너지의 레벨이 임계치보다 크면 에너지 레벨이 급격하게 증가하는 어택(atack) 상태 신호에 해당하므로 쇼트 윈도우를 선택하고, 임계치보다 적으면 에너지 레벨이 일정한 상태의 신호에 해당하므로 롱 윈도우를 선택하며, 이어서 그 선택된 각 윈도우 범위에 해당하는 오디오 샘플들을 MDCT 처리하여 주파수 도메인상의 데이터로 변환한다. 이때 스타트 윈도우 또는 스톱 윈도우는 롱 윈도우에서 쇼트 윈도우로 스위칭하기 위해 사용된다. 또한 윈도우잉 타입은 MPEG 1 레이어3에서 롱 윈도우, 시작 윈도우, 쇼트 윈도우, 스톱 윈도우등으로 개시되어 있다. 그리고 각 윈도우들은 엘리어싱을 방지하기 위해 서로 오버랩된다. 이어서, MDCT가 수행된 주파수 도메인상의 데이터를 할당된 비트수에 따라 양자화한다. 이어서, 양자화된 데이터를 호프만 코딩(huffman coding)을 이용하여 mp3 비트스트림을 형성한다. 이때 mp3 비트스트림은 프레임 단위로 형성된다. mp3 프레임 포맷은 헤더, 사이드 정보 및 메인 데이터로 이루어진다. 사이드 정보는 스케일 팩터, 윈도우 타입과 같이 메인 데이터를 디코드하기 위한 필요 정보를 포함한다.
도 2는 본 발명에 따른 고주파수 복원 방식을 적용한 mp3 디코더의 전체 블록도이다.
도 2의 mp3 디코더는 역양자화부(210), 사이드 정보 분석부(220), 역MDCT부(230), 고주파 영역 분석부(250), 고주파 영역 생성부(260), 웨이트 계수 추출부 (240), 곱셈부(270), 합산부(280), 역 필터 뱅크부(290)로 구성되며, 웨이트 계수 추출부(240)는 트랜지언트 정보 검출부(242), 웨이트 테이블 선택부(244)를 구비한다.
먼저, 역양자화부(210)는 입력되는 mp3 비트 스트림으로부터 MDCT(Modified DCT) 계수를 추출한다. 이때 역양자화된 MDCT 계수는 고주파수 대역이 손실된 저주파수 대역으로 분포한다.
사이드 정보 분석부(220)는 입력되는 mp3 비트 스트림으로부터 사이드 정보(side information)를 분석하여 윈도우 타입을 추출한다.
역MDCT부(230)는 주파수역양자화부(210)에서 추출된 MDCT 계수로부터 사이드 정보 분석부(220)에서 추출된 윈도우 타입을 이용하여 필터 뱅크값(filter bank value)을 생성한다.
트랜지언트 정보 검출부(242)는 역MDCT부(230)에서 사용하던 윈도우 타입으로부터 현재 프레임의 트랜지언트 정보를 검출한다. 즉, 윈도우 타입이 롱(long)인 경우 현재 프레임은 논-트랜지언트(non-transient) 영역이고, 상기 윈도우 타입이 쇼트(short)인 경우 현재 프레임은 트랜지언트(transient) 영역이고, 상기 윈도우 타입이 스타트(start) 또는 엔드(end)인 경우 현재 프레임이 트랜지션(transition) 영역이다.
웨이트 테이블 선택부(244)는 트랜지언트 정보 검출부(242)에서 검출된 트랜지언트 정보로부터 고주파수 성분들의 웨이트를 조정하기 위한 웨이트 계수를 선택한다. 예컨대, 트랜지언트(transient) 영역에서는 높은 웨이트를 갖는 고주파 성분 (harmonic component), 논-트랜지언트(non-transient) 영역에서는 낮은 웨이트를 갖는 고주파 성분(harmonic component), 트랜지션(transition) 영역에서는 중간 웨이트를 갖는 고주파 성분을 갖는다.
고주파수 영역 분석부(250)는 역MDCT부(230)에서 생성된 필터 뱅크값을 분석하여 손실된 고주파수 영역을 검출한다. 예를 들어 도 3a를 보면, 96kbps의 mp3 파일인 경우 32개의 필터 뱅크값들중 11.025kHz이상의 주파수 성분들이 손실된다.128kbps의 mp3 파일인 경우 15kHz 32개의 필터 뱅크값들중 15kHz이상의 주파수 성분들이 손실된다.
고주파수 영역 생성부(260)는 고주파수 영역 분석부(250)에서 손실된 고주파수 성분들을 복원한다. 도 3b를 참조하여 96kbps의 mp3 파일에 대해서 설명하면, 32개의 필터 뱅크값들중 11.025kHz이상의 주파수 성분들이 손실되므로 "0"값을 가지는 16번째 뱅크 이상의 필터 뱅크값들을 8 - 15번째 필터 뱅크 값들로부터 복원해야한다. 예컨대, 16번째 밴드는 8번째 밴드와 하모닉(harmonic) 관계를 가지므로 8번째의 필터 뱅크값이 복사된다. 마찬가지로 18번째 밴드는 9번째 밴드의 필터 뱅크값이 복사된다. 또한 사람의 인지 특성상 고주파수 영역에서 같은 주파수라고 인지하는 대역폭이 넓어지므로 19번째 밴드는 복원된 18번째 밴드를 복사한다. 이때 음성은 6kHzs이내의 주파수 성분을 갖는다. 음성이 포함된 저주파 성분들로부터 고주파 성분들을 생성할 경우 고주파수 영역에 음성에 해당하는 주파수 성분들이 나타나는 문제점이 있다. 따라서 5.5kHz이내의 저주파수 영역의 1 - 7번째 필터 뱅크값은 고주파수 복원용으로 이용되지 않는다.
곱셈부(270)는 웨이트 테이블 선택부(244)에서 선택된 웨이트 계수를 고주파수 성분들에 곱하여 도 3c 및 도 3d의 그래프와 같은 고주파수 성분들의 크기를 조정한다. 도 3c는 현재 프레임이 트랜지언트 영역인 경우 복원된 고조파 성분들을 보이는 그래프이다. 도 3c를 보면, 트랜지언트 영역에서는 높은 웨이트들을 갖는 고조파 성분들이 생성된다. 도 3d는 현재 프레임이 논-트랜지언트 영역인 경우 복원된 고조파 성분들을 보이는 그래프이다. 도 3d를 보면, 논-트랜지언트 영역에서는 낮은 웨이트들을 갖는 고조파 성분들이 생성된다.
합성부(280)는 역 MDCT부(230)에서 생성된 저주파수 영역의 필터 뱅크 값과 곱셈부(270)에서 생성되는 고주파수 영역의 필터 뱅크 값을 합성한다.
역다상필터뱅크부(290)는 합성부(280)에서 고주파수 성분이 복원된 필터 뱅크 값들을 서브밴드로 통합한 후, 이 통합된 서브밴드를 합성 필터로 통과시켜 PCM(Pulse Coded Modulation)오디오 데이터로 복원한다.
도 4는 본 발명에 따른 오디오 데이터 고주파수 복원 방법을 보이는 흐름도이다.
먼저, 프레임 단위의 mp3 비트스트림을 입력한다(410).
이때 입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출한다(420). 동시에 사이드 정보(side information)를 분석하여 윈도우 타입을 추출한다.
이어서, MDCT 계수를 윈도우 타입에 따라 역 MDCT하여 저주파수 영역의 필터 뱅크 값을 생성한다(430). 이때 윈도우 타입을 근거로 프레임의 트랜지언트 (transient)정보를 추출하고(424), 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 계수 테이블에서 선택한다(426).
이어서, 저주파수영역의 필터 뱅크값을 분석하여 손실된 고주파수 영역을 검출한다(440).
이어서, 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원한다(450).
이어서, 계수 테이블에서 선택된 웨이트 계수를 복원된 고주파수 영역의 필터 뱅크 값에 곱하여 고주파수 성분의 크기를 조정한다(460).
이어서, 역 MDCT를 통해 생성된 저주파수 영역의 필터 뱅크 값과 조정된 고주파수 영역의 필터 뱅크 값을 합성한다(470).
이어서, 고주파수 성분이 복원된 필터 뱅크 값들을 서브밴드로 통합한 후, 이 통합된 서브밴드를 합성 필터로 통과시켜 PCM(Pulse Coded Modulation)오디오 데이터로 복원한다(480).
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상내에서 당업자에 의한 변형이 가능함은 물론이다. 즉, 본 발명은 MP3재생기, 노트북 PC등과 같은 오디오를 재생하는 모든 기기에 오디오 데이터의 고주파수 성분을 복원하는 기술에 적용할 수 있다.
상술한 바와 같이 본 발명에 의하면, 기존의 mp3 인코더에 대한 수정이 전혀 필요없고, mp3 디코딩 과정중에 손실된 고주파수 성분들을 복원함으로써 기존에 사 용하던 차원 변환이 필요하지 않으므로 적은 계산량으로 mp3 음질을 개선할 수 있다.

Claims (8)

  1. 압축 오디오 신호의 고주파수 성분 복원 방법에 있어서,
    (a) 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정;
    (b) 상기 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정;
    (c) 상기 생성된 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정;
    (d) 상기 (b)과정에서 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함하는 오디오 데이터의 고주파수 복원 방법.
  2. 제1항에 있어서, (b) 과정은
    (b-1) 역 MDCT에서 사용되는 윈도우 타입을 참조하여 현재 프레임에 대한 트랜지언트 정보를 추출하는 과정;
    (b-2) 상기 (b-1)과정에서 추출된 트랜지언트 정보에 따라 상기 고주파 성분의 필터 뱅크값의 웨이트를 조정하는 웨이트 계수를 소정의 계수 테이블로부터 선택하는 과정을 구비하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
  3. 제2항에 있어서, 상기 트랜지언트 정보는 트랜지언트 영역 정보, 논-트랜지언트 영역 정보, 트랜지션 영역 정보임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
  4. 제2항에 있어서, 상기 윈도우가 롱(long) 타입인 경우 현재 프레임은 논-트랜지언트(non-transient) 영역이고, 상기 윈도우가 쇼트(short) 타입인 경우 현재 프레임은 트랜지언트(transient) 영역이고, 상기 윈도우가 스타트(start) 또는 엔드(end)타입인 경우 현재 프레임이 트랜지션(transition) 영역임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
  5. 제1항에 있어서, 상기 (c)과정은 상기 트랜지언트 정보에 따라 선택된 웨이트 계수와 고주파 성분들의 필터 뱅크값을 곱하는 것임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
  6. 압축 오디오 신호의 고주파수 성분 복원 장치에 있어서,
    입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출하는 역 양자화부;
    상기 역 양자화부 추출된 MDCT 계수로부터 저주파수 영역의 필터 뱅크 값을 생성하는 역 MDCT부;
    상기 역 MDCT부에서 사용하는 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 선택하는 웨이트 계수 추출부;
    상기 역 DCT부에서 생성된 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원하는 고주파수 영역 생성부;
    상기 웨이트 계수 추출부에서 선택된 웨이트 계수를 상기 고주파수영역 생성부에서 복원된 고주파수 영역의 필터 뱅크 값에 곱하는 곱셈부를 포함하는 오디오 데이터의 고주파수 복원 장치.
  7. 제6항에 있어서, 상기 역 MDCT부에서 생성된 주파수 영역의 필터 뱅크 값과 상기 곱셈부에서 생성되는 고주파수 영역의 필터 뱅크 값을 합성하는 합성부를 더 포함하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 장치.
  8. 제6항에 있어서, 상기 웨이트 계수 추출부는
    상기 역 MDCT에서 사용되는 윈도우 타입으로부터 현재 프레임에 대한 트랜지언트정보를 검출하는 트랜지언트 정보 검출부;
    상기 트랜지언트 정보 검출부에서 검출된 트랜지언트 정보에 상응하는 웨이트를 미리 정해진 계수 테이블로부터 선택하는 웨이트 계수 선택부를 포함하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 장치.
KR1020040061423A 2004-08-04 2004-08-04 오디오 데이터의 고주파수 복원 방법 및 그 장치 KR100608062B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020040061423A KR100608062B1 (ko) 2004-08-04 2004-08-04 오디오 데이터의 고주파수 복원 방법 및 그 장치
US11/125,152 US20060031075A1 (en) 2004-08-04 2005-05-10 Method and apparatus to recover a high frequency component of audio data
IT001351A ITMI20051351A1 (it) 2004-08-04 2005-07-14 Metodo ed apparato per recuperare un componente ad alta frequenza di dati audio
CNA2005100842636A CN1734555A (zh) 2004-08-04 2005-07-15 恢复音频数据的高频分量的方法和设备
NL1029619A NL1029619C2 (nl) 2004-08-04 2005-07-26 Werkwijze en inrichting voor het herstellen van een hoge frequentiecomponent van audiodata.
JP2005221617A JP2006048043A (ja) 2004-08-04 2005-07-29 オーディオデータの高周波数の復元方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040061423A KR100608062B1 (ko) 2004-08-04 2004-08-04 오디오 데이터의 고주파수 복원 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20060012783A KR20060012783A (ko) 2006-02-09
KR100608062B1 true KR100608062B1 (ko) 2006-08-02

Family

ID=36076940

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040061423A KR100608062B1 (ko) 2004-08-04 2004-08-04 오디오 데이터의 고주파수 복원 방법 및 그 장치

Country Status (6)

Country Link
US (1) US20060031075A1 (ko)
JP (1) JP2006048043A (ko)
KR (1) KR100608062B1 (ko)
CN (1) CN1734555A (ko)
IT (1) ITMI20051351A1 (ko)
NL (1) NL1029619C2 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100530377B1 (ko) * 2003-12-30 2005-11-22 삼성전자주식회사 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
CN101326853B (zh) * 2005-12-13 2011-11-23 Nxp股份有限公司 处理音频数据流的装置和方法
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
BR122019024992B1 (pt) 2006-12-12 2021-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR2911227A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
JP5098530B2 (ja) * 2007-09-12 2012-12-12 富士通株式会社 復号化装置、復号化方法および復号化プログラム
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101441896B1 (ko) 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
CN102334159B (zh) * 2009-02-26 2014-05-14 松下电器产业株式会社 编码装置、解码装置及其方法
WO2010111876A1 (zh) * 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP6103324B2 (ja) * 2010-04-13 2017-03-29 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP3975177B1 (en) * 2010-09-16 2022-12-14 Dolby International AB Cross product enhanced subband block based harmonic transposition
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9408010B2 (en) * 2011-05-26 2016-08-02 Koninklijke Philips N.V. Audio system and method therefor
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN104541327B (zh) * 2012-02-23 2018-01-12 杜比国际公司 用于高频音频内容的有效恢复的方法及系统
KR101897455B1 (ko) 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
SG11201505898XA (en) * 2013-01-29 2015-09-29 Fraunhofer Ges Forschung Concept for coding mode switching compensation
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
KR101498113B1 (ko) * 2013-10-23 2015-03-04 광주과학기술원 사운드 신호의 대역폭 확장 장치 및 방법
JP6425097B2 (ja) * 2013-11-29 2018-11-21 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
US10460736B2 (en) * 2014-11-07 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for restoring audio signal
KR101930337B1 (ko) * 2015-12-07 2018-12-19 삼성전자 주식회사 전자기기 및 그 제어방법
KR102648122B1 (ko) * 2017-10-25 2024-03-19 삼성전자주식회사 전자 장치 및 그 제어 방법
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
CN112289343B (zh) * 2020-10-28 2024-03-19 腾讯音乐娱乐科技(深圳)有限公司 音频修复方法、装置及电子设备和计算机可读存储介质
CN113035205B (zh) * 2020-12-28 2022-06-07 阿里巴巴(中国)有限公司 音频丢包补偿处理方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016769A1 (en) 1990-04-12 1991-10-31 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
WO2002052545A1 (en) 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
KR20030062338A (ko) * 2000-11-14 2003-07-23 코딩 테크놀러지스 스웨덴 에이비 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치
KR20030068716A (ko) * 2002-02-16 2003-08-25 삼성전자주식회사 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58145998A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
US5214708A (en) * 1991-12-16 1993-05-25 Mceachern Robert H Speech information extractor
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
JP2976860B2 (ja) * 1995-09-13 1999-11-10 松下電器産業株式会社 再生装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
CA2359771A1 (en) * 2001-10-22 2003-04-22 Dspfactory Ltd. Low-resource real-time audio synthesis system and method
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016769A1 (en) 1990-04-12 1991-10-31 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
KR20030062338A (ko) * 2000-11-14 2003-07-23 코딩 테크놀러지스 스웨덴 에이비 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치
WO2002052545A1 (en) 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
KR20030068716A (ko) * 2002-02-16 2003-08-25 삼성전자주식회사 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템

Also Published As

Publication number Publication date
US20060031075A1 (en) 2006-02-09
ITMI20051351A1 (it) 2006-02-05
JP2006048043A (ja) 2006-02-16
CN1734555A (zh) 2006-02-15
NL1029619C2 (nl) 2006-07-25
NL1029619A1 (nl) 2006-02-07
KR20060012783A (ko) 2006-02-09

Similar Documents

Publication Publication Date Title
KR100608062B1 (ko) 오디오 데이터의 고주파수 복원 방법 및 그 장치
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
US7275031B2 (en) Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
JP6457625B2 (ja) 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP2009515212A (ja) オーディオ圧縮
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
US20040002854A1 (en) Audio coding method and apparatus using harmonic extraction
JP2008519990A (ja) 信号符号化の方法
KR20050027179A (ko) 오디오 데이터 복원 방법 및 그 장치
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
IL296961B1 (en) Harmonic-inverse harmonic exchanger combination for high-frequency reproduction of audio signals
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
KR100433984B1 (ko) 디지털 오디오 부호화/복호화 장치 및 방법
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
KR100902332B1 (ko) 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법
JP2002215192A (ja) オーディオ情報処理装置及び処理方法
JPH1093441A (ja) ディジタル化されたオーディオ信号の符号化方法及び装置
Cavagnolo et al. Introduction to Digital Audio Compression
US9854379B2 (en) Personal audio studio system
JP2001094432A (ja) サブバンド符号化・復号方法
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec
KR970071703A (ko) 복잡도 조절이 가능한 오디오 복호화방법 및 이를 이용한 오디오 복호화기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130627

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140627

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150629

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee