KR20030068716A - 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 - Google Patents

웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 Download PDF

Info

Publication number
KR20030068716A
KR20030068716A KR1020020008305A KR20020008305A KR20030068716A KR 20030068716 A KR20030068716 A KR 20030068716A KR 1020020008305 A KR1020020008305 A KR 1020020008305A KR 20020008305 A KR20020008305 A KR 20020008305A KR 20030068716 A KR20030068716 A KR 20030068716A
Authority
KR
South Korea
Prior art keywords
window
wpt
mdct
threshold
samples
Prior art date
Application number
KR1020020008305A
Other languages
English (en)
Other versions
KR100472442B1 (ko
Inventor
하호진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2002-0008305A priority Critical patent/KR100472442B1/ko
Priority to CN02145837A priority patent/CN1438767A/zh
Priority to US10/367,997 priority patent/US7225123B2/en
Publication of KR20030068716A publication Critical patent/KR20030068716A/ko
Application granted granted Critical
Publication of KR100472442B1 publication Critical patent/KR100472442B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • G10L19/0216Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition

Abstract

본 발명은 MPEG1 레이어3(MP3)에서 WPT(wavelet packet transform)을 이용한 오디오 압축 방법 및 그 시스템이 개시되어 있다. 본 발명은 심리 음향 모델에 기초로 입력되는 오디오 샘플들을 분석하여 지각 에너지를 산출하는 과정, 상기 과정에서 산출된 지각 에너지 레벨과 임계치의 비교에 따라 MDCT 처리 윈도우 및 WPT 처리 윈도우를 선택적으로 결정하는 과정, 상기 과정에서 결정된 윈도우 범위에 해당하는 오디오 샘플들을 MDCT와 WPT로 처리하여 주파수 도메인상의 데이터로 변환하는 과정, 상기 과정에서 처리된 주파수 도메인상의 데이터를 할당된 비트에 따라 양자화하는 과정을 포함한다.

Description

웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그 시스템{Method for compressing audio signal using wavelet packet transform and apparatus thereof}
본 발명은 오디오 압축 시스템에 관한 것이며, 특히 MPEG1 레이어3(MP3)에서 WPT(wavelet packet transform)을 이용한 오디오 압축 방법 및 그 시스템에 관한것이다.
일반적으로 MPEG 표준 방식은 128kbps 정보량을 이용하여 모노럴 오디오 신호 부호화를 바탕으로, 이를 192kbps, 92kbps, 64kbps에서의 부호화와 스테레오 부호화에 적용하기 위해 계층 알고리듬으로 하고 있다. 이중에서 계층 3는 MP3로 알려진 기술로서 MDCT(Modified DCT) 연산을 추가하여 주파수 영역의 해상도를 높여주고, MDCT 연산을 하는 데 있어서 입력 특성을 고려해 처리시 사용되는 윈도우의 크기를 변형시켜 줌으로써 프리-에코 및 엘리어싱에 대한 보상을 해준다.
도 1은 종래의 MP3에서 오디오 압축 방법을 보이는 흐름도이다.
먼저, PCM(Pulse coded Modulation) 형태의 오디오 데이터를 입력한다(110과정).
이어서, 입력된 PCM 오디오 데이터를 각 그래뉼(granule) 마다 576개 샘플들로 나눈다.
이어서, 그 샘플들에 대해서 MPEG1 레이어3(MP3)에서 공지되어 있는 심리 음향 모델을 적용하여 지각 에너지(perceptual energy)를 구한다(120과정).
이어서, 심리음향 모델에서 구해진 지각 에너지와 임계치를 비교하여 윈도우잉을 스위칭하면서 MDCT를 수행한다(130과정). MDCT 윈도우 사이즈의 일부 또는 전부가 임계치에 따라 스위칭 될 수 있다. 즉, 도 2에 도시된 바와 같이 지각 에너지의 레벨이 임계치보다 크면 에너지 레벨이 급격하게 증가하는 어택(atack) 상태 신호에 해당하므로 쇼트 윈도우를 선택하고, 임계치보다 적으면 에너지 레벨이 일정한 상태의 신호에 해당하므로 롱 윈도우를 선택하며, 이어서 그 선택된 각 윈도우범위에 해당하는 오디오 샘플들을 MDCT 처리하여 주파수 도메인상의 데이터로 변환한다. 이때 스타트 윈도우 또는 스톱 윈도우는 롱 윈도우에서 쇼트 윈도우로 스위칭하기 위해 사용된다. 또한 윈도우잉 타입은 MPEG 1 레이어3에서 도 3에 도시된 바와 같은 롱 윈도우, 시작 윈도우, 쇼트 윈도우, 스톱 윈도우등으로 개시되어 있다. 또한 도 2에 도시되어 있는 바와 같이 윈도우들은 엘리어싱을 방지하기 위해 서로 오버랩된다.
이어서, MDCT가 수행된 주파수 도메인상의 데이터를 할당된 비트수에 따라 양자화한다(140과정).
이어서, 양자화된 데이터를 호프만 코딩(huffman coding)을 이용하여 비트스트림을 형성한다(150과정).
따라서 도 1에 도시된 바와 같이 종래의 MP3에서 오디오 신호 압축 방법은 MDCT 윈도우 스위칭 기법을 이용하여 프리-에코 현상을 초래하는 논-스테이셔너리 신호를 압축한다. 그러나 도 1과 같은 종래의 MDCT를 이용한 오디오 압축 방법은 MDCT 기저의 한계로 인해 128kbps보다 낮은 로우 비트 레이트들(예를 들면 64bps, 스테레오)에서 음질 저하를 초래하는 문제점이 있다.
본 발명이 이루고자하는 기술적 과제는 MDCT와 WPT를 적응적으로 사용하여 오디오를 압축함으로써 논-스테이셔너리 신호를 효과적으로 압축하면서 동시에 로우 비트 레이트에서 효과적으로 오디오 신호를 압축할 수 있는 오디오 압축 방법 및 장치를 제공하는 데 있다.
상기의 기술적 과제를 해결하기 위하여, 본 발명의 오디오 압축 방법은,
(a) 심리 음향 모델에 기초로 입력되는 오디오 샘플들을 분석하여 지각 에너지를 산출하는 과정;
(b) 상기 (a)과정에서 산출된 지각 에너지 레벨과 임계치의 비교에 따라 MDCT 처리 윈도우 및 WPT 처리 윈도우를 선택적으로 결정하는 과정;
(c) 상기 (b)과정에서 결정된 윈도우 범위에 해당하는 오디오 샘플들을 MDCT와 WPT로 처리하여 주파수 도메인상의 데이터로 변환하는 과정;
(d) 상기 (c)과정에서 처리된 주파수 도메인상의 데이터를 할당된 비트에 따라 양자화하는 과정을 포함하는 것을 특징으로 한다.
상기의 기술적 과제를 해결하기 위하여, 본 발명의 오디오 압축 장치는,
오디오 압축 장치에 있어서,
입력되는 오디오 샘플들을 다중 위상 뱅크에 의해 대역 분할하는 필터뱅크수단;
심리 음향 모델을 통해 상기 입력되는 오디오 샘플들로 부터 지각 에너지를 분석하는 심리음향모델분석수단;
상기 심리음향 모델수단에서 분석된 지각 에너지와 소정의 임계치를 비교하여 MDCT 및 WPT의 윈도우를 선택하는 TS 선택수단;
상기 상기 필터뱅크수단에서 대역 분할된 샘플들에 대해 상기 TS선택부수단에서 선택된 MDCT 및 WPT의 윈도우에 따라 MDCT 및 WPT를 수행하는 TS처리수단을 포함하는 것을 특징으로 한다.
도 1은 종래의 MP3에서 오디오 압축 방법을 보이는 흐름도이다.
도 2는 종래 주파수 도메인상에서 MDCT 처리 과정을 도시한 것이다.
도 3은 종래 윈도우잉 타입을 도시한 것이다.
도 4는 본 발명에 따른 오디오 신호 압축 시스템의 블록도이다.
도 5는 본 발명에 따른 오디오 신호 압축 방법을 보이는 흐름도이다.
도 6은 본 발명에 따른 MDCT 및 WPT의 윈도윙 타입을 도시한 것이다.
도 7은 MDCT 및 WPT에서 윈도우 스위칭 상태 다이어그램을 도시한 것이다.
도 8은 본 발명에 따른 주파수 도메인상에서 처리되는 WPT 트리 구조도를 도시한 것이다.
이하 첨부된 도면을 참조로하여 본 발명의 바람직한 실시예를 설명하기로 한다.
도 4는 본 발명에 따른 오디오 신호 압축 시스템의 블록도이다.
도 4의 오디오 신호 압축 시스템은 필터뱅크부(410), 청각심리모델부(420), TS선택부(430), TS처리부(440), 양자화부(450), 비트스트림생성부(460)로 구성된다.
먼저, 본 발명에서 이용되는 WPT(wavelet packet transform)는 웨이블렛 기저(basis)에 의하여 신호를 멀티 레벨(multi level)로 분해하는 일종의 서브밴드 필터링이며, 레벨이 증가하면 주파수에 대한 해상도가 높아진다. 또한 어택 부분의 신호 특성이 웨이블렛 기저(wavelet basis)를 분석하기에 용이하다.
도 4를 참조하면, 필터뱅크부(410)는 각 그래뉼 단위로 입력되는 PCM 오디오 샘플들을 다중 위상 뱅크(polyphase bank)를 이용해 32대역으로 대역분할한다.
청각심리모델부(420)는 심리 음향 모델을 이용하여 지각 에너지(perceptual energy)를 구한다. 인간의 청각특성에서는 큰 레벨의 주파수 성분이 작은 레벨의 인접 주파수를 마스크(mask)하는 효과가 있다. 따라서 이러한 인간의 청각특성을 이용하여 지각할 수 있는 에너지 레벨이 구해진다.
TS선택부(430)는 심리음향 모델에서 구해진 지각 에너지와 임계치를 비교하여 MDCT 및 WPT의 윈도우를 선택하는 제어 신호를 발생한다. 즉, TS선택부(430)는 지각 에너지의 레벨이 임계치보다 크면 에너지 레벨이 급격하게 증가하는 어택 상태의 신호(attack state signal)에 해당하여 WPT 윈도우를 선택하고, 임계치보다 적으면 에너지 레벨이 일정한 스테디 상태의 신호(steady state signal)에 해당하여 MDCT 윈도우를 선택한다.
TS 처리부(440)는 필터뱅크부(410)에서 대역분할된 샘플에 대해 TS선택부(430)에서 출력되는 제어 신호에 따라 MDCT 처리용 윈도우 및 WPT 처리용 윈도우를 선택적으로 처리하며, 또한 그 선택된 각 윈도우 범위에 해당하는 샘플들을 MDCT 및 WPT 처리한다.
양자화부(450)는 TS 처리부(440)에서 TS 처리된 주파수 도메인상의 오디오 데이터를 할당된 비트수에 따라 양자화한다.
비트스트림생성부(460)는 양자화부(450)에서 양자화된 오디오 데이터를 비트스트림 형태로 구성한다.
도 5는 본 발명에 따른 오디오 신호 압축 방법을 보이는 흐름도이다.
먼저, 각 그래뉼(granule) 마다 576개 샘플들로 나누어져 입력되는 PCM 오디오 데이터를 필터 뱅크를 통해 32개 대역으로 나눈다(510과정).
이어서, 나누어진 샘플들에 대해서 심리 음향 모델을 적용하여 지각 에너지(perceptual energy)를 구한다(520과정).
이어서, MDCT 처리용 윈도우 및 WPT 처리용 윈도우를 결정하기 위해 심리음향 모델에서 구해진 지각 에너지와 임계치를 비교한다(530과정). 여기서 웨이블렛 특성이 어택 상태 신호와 유사하다는 특성을 이용하여 어택 상태의 신호에 WPT 윈도우를 적용한다.
이어서, 지각 에너지의 레벨이 임계치보다 크면 에너지 레벨이 급격하게 증가하는 어택(attack) 상태의 신호에 해당하여 WPT 윈도우를 선택하고(524과정), 임계치보다 적으면 에너지 레벨이 일정한 스테디 상태의 신호에 해당하여 MDCT 윈도우를 선택한다(526과정).
이어서, 선택된 각 윈도우 범위에 해당하는 데이터를 MDCT 및 WPT처리하여 주파수 도메인상의 오디오 데이터로 변환한다(540과정, 550과정). 이때 WPT는 어택 부분의 주파수 영역의 샘플들을 웨이블렛 필터를 통해 세부적으로 분석하여 처리한다.
이어서, MDCT가 수행된 주파수 도메인상의 데이터를 할당된 비트수에 따라 양자화한다(560과정).
이어서, 양자화된 데이터를 호프만 코딩(huffman coding)을 이용하여 비트스트림을 형성한다(570과정).
도 6은 본 발명에 따른 TS를 위한 윈도우 타입을 도시한 것이다.
도 6을 참조하면, 롱 윈도우(long window) 및 쇼트 윈도우(short window) 및 스톱 윈도우(stop window)는 MDCT를 수행하고, WPT 윈도우는 WPT를 수행한다. 이 MDCT 윈도우 및 WPT 윈도우는 PR(perfect Reconstruction) 조건을 만족하는 형태로 구성된다. 이 PR 조건은 인코딩시의 주파수 도메인 데이터와 디코딩시의 주파수 도메인 데이터를 동일하게 복원해주는 조건이다. 이때 롱 윈도우는 36샘플의 길이를 가지고 있으며 스테디 상태의 신호에 대해 사용된다. 스타트 윈도우는 28샘플의 길이를 가지고 있으며 어택이나 스테디 상태 신호가 시작되는 부분에 사용된다. WPT윈도우는 18샘플의 길이를 가지고 MDCT의 스타트 윈도우와 스톱 윈도우의 조합 형태이며, 어택 상태의 신호에 대해 사용된다. 스톱 윈도우는 28샘플의 길이를 가지고 있으며 어택이나 스테디 상태의 신호가 종료되는 부분에 대해 사용된다.
도 7은 MDCT 및 WPT에서 윈도우 스위칭 상태 다이어그램을 도시한 것이다.
먼저, 에너지 레벨이 임계치보다 큰 신호 부분에서 롱 윈도우 상태를 유지한다. 이어서, 어택 신호가 시작되면 에너지 레벨이 임계치보다 적은 신호 부분이 시작되는 상태이므로 롱 윈도우 상태가 스타트 윈도우 상태로 천이한다. 이어서, 스타트 윈도우 상태는 어택 신호를 처리하는 웨이블렛 패킷 윈도우 상태로 천이한다. 이어서, 웨이블렛 패킷 윈도우 상태가 에너지 레벨이 임계치보다 적은 신호 부분에서 그대로 유지되다가 스테디 신호가 시작되면 에너지 레벨이 임계치보다 큰 신호 부분이 시작되는 상태이므로 스톱 윈도우 상태로 천이한다(도면에 NO ATTACK 부분으로 명시). 이어서, 스톱 윈도우 상태는 스테디 신호를 처리하는 롱 윈도우 상태로 천이한다(도면에 NO ATTACK 부분으로 명시).
도 8은 본 발명에 따른 주파수 도메인상에서 처리되는 WPT 트리 구조도를 도시한 것이다.
먼저, 주파수 영역의 샘플들은 18계수 WPT필터(810)로 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어진다.
이어서, 18계수WPT필터(810)를 통한 저주파 영역(L)의 샘플들은 8계수WPT필터(820)로 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어지며, 18계수WPT필터(810)를 통한 고주파 영역(H)의 샘플들은 10계수WPT필터(830)을 통해저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어진다.
이어서, 8계수WPT필터(820)를 통한 저주파 영역(L)의 샘플들은 4계수WPT필터(840)를 통해 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어지며, 8계수WPT필터(820)를 통한 고주파 영역(H)의 샘플들은 4계수 WPT필터(850)를 통해 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어진다. 그리고 10계수WPT필터(830)를 통한 저주파 영역(L)의 샘플들은 4계수WPT필터(860)를 통해 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어지며, 10계수WPT필터(830)를 통한 고주파 영역(H)의 샘플들은 6계수WPT필터(870)를 통해 저주파 영역(L)의 샘플들과 고주파 영역(H)의 샘플들로 나누어진다.
이어서, 4계수WPT필터들(840, 850, 860) 및 6계수WPT필터들(870)를 통한 고주파 영역(H) 및 저주파 영역(L)의 샘플들은 복수개의 대역들로 나누어진다. 최종적으로 더 세밀하게 나누어진 대역의 샘플들이 WPT 처리에 이용된다.
상술한 바와 같이 본 발명에 의하면, 저비트율에서도 MDCT 윈도우와 WPT윈도를 선택적으로 스위칭하여 오디오 신호를 압축하므로써 논 스테이셔너리(non-stationary) 신호를 효과적으로 처리하고, 또한 저비트율에서도 오디오 데이터를 세밀하게 분석할 수 있는 MDCT를 적용함으로써 저 비트율에서도 CD 퀄리티(compact disc quality)를 유지할 수 있다. 그리고 어택 상태 신호의 특성과 유사한 WPT 윈도우를 이용함으로써 프리-에코를 효율적으로 방지할 수 있다.

Claims (9)

  1. 오디오 압축 방법에 있어서,
    (a) 심리 음향 모델에 기초로 입력되는 오디오 샘플들을 분석하여 지각 에너지를 산출하는 과정;
    (b) 상기 (a)과정에서 산출된 지각 에너지 레벨과 임계치의 비교에 따라 MDCT 처리 윈도우 및 WPT 처리 윈도우를 선택적으로 결정하는 과정;
    (c) 상기 (b)과정에서 결정된 윈도우 범위에 해당하는 오디오 샘플들을 MDCT와 WPT로 처리하여 주파수 도메인상의 데이터로 변환하는 과정;
    (d) 상기 (c)과정에서 처리된 주파수 도메인상의 데이터를 할당된 비트에 따라 양자화하는 과정을 포함하는 오디오 압축 방법.
  2. 제1항에 있어서, (b)과정은 상기 지각 에너지 레벨이 임계치보다 크면 WPT 윈도우를 선택하고, 상기 지각 에너지 레벨이 임계치보다 적으면 MDCT 윈도우를 선택하는 과정임을 특징으로 하는 오디오 압축 방법.
  3. 제1항에 있어서, (b)과정은 어택 상태의 신호에서 WPT 윈도우를 선택하고, 스테디 상태의 신호에서 MDCT 윈도우를 선택하는 과정임을 특징으로 하는 오디오 압축 방법.
  4. 제1항에 있어서, 상기 WPT는 주파수 영역의 데이터를 웨이블렛 필터를 통해계층적으로 분석하는 것을 특징으로 하는 오디오 압축 방법.
  5. 제4항에 있어서, 상기 주파수 영역의 데이터는 웨이블렛 필터를 통해 N 레벨의 고역 주파수 영역 및 저역 주파수 영역으로 분류되는 것을 특징으로 하는 오디오 압축 방법.
  6. 제1항에 있어서, 상기 MDCT 및 WPT의 윈도우는 PR(perfect Reconstruction) 조건을 만족하는 형태로 구성되는 것임을 특징으로 하는 오디오 압축 방법.
  7. 제1항에 있어서, 상기 (b) 과정의 WPT의 윈도우 결정 과정은,
    상기 에너지 레벨이 임계치보다 큰 신호 부분에서 롱 윈도우 상태를 유지하는 과정;
    상기 에너지 레벨이 임계치보다 적은 신호 부분이 시작되면 상기 윈도우 상태가 스타트 윈도우 상태에서 웨이블렛 패킷 윈도우 상태로 천이하는 과정;
    상기 웨이블렛 패킷 윈도우 상태가 에너지 레벨이 임계치보다 적은 신호 부분에서 에너지 레벨이 임계치보다 큰 신호 부분이 시작되면 스톱 윈도우 상태에서 롱 윈도우 상태로 천이하는 과정을 포함하는 것을 특징으로 하는 오디오 압축 방법.
  8. 오디오 압축 장치에 있어서,
    입력되는 오디오 샘플들을 다중 위상 뱅크에 의해 대역 분할하는 필터뱅크수단;
    심리 음향 모델을 통해 상기 입력되는 오디오 샘플들로 부터 지각 에너지를 분석하는 심리음향모델분석수단;
    상기 심리음향 모델수단에서 분석된 지각 에너지와 소정의 임계치를 비교하여 MDCT 및 WPT의 윈도우를 선택하는 TS 선택수단;
    상기 상기 필터뱅크수단에서 대역 분할된 샘플들에 대해 상기 TS선택부수단에서 선택된 MDCT 및 WPT의 윈도우에 따라 MDCT 및 WPT를 수행하는 TS처리수단을 포함하는 오디오 압축 장치.
  9. 제8항에 있어서, 상기 TS 처리 수단은 복수개의 주파수 도메인상의 샘플들을 계층적인 주파수 영역으로 나누는 복수개의 웨이블렛 필터를 구비하는 것을 특징으로 하는 오디오 압축 장치.
KR10-2002-0008305A 2002-02-16 2002-02-16 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 KR100472442B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR10-2002-0008305A KR100472442B1 (ko) 2002-02-16 2002-02-16 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템
CN02145837A CN1438767A (zh) 2002-02-16 2002-10-15 利用小波包变换压缩音频信号的方法和装置
US10/367,997 US7225123B2 (en) 2002-02-16 2003-02-19 Method for compressing audio signal using wavelet packet transform and apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0008305A KR100472442B1 (ko) 2002-02-16 2002-02-16 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템

Publications (2)

Publication Number Publication Date
KR20030068716A true KR20030068716A (ko) 2003-08-25
KR100472442B1 KR100472442B1 (ko) 2005-03-08

Family

ID=27725748

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0008305A KR100472442B1 (ko) 2002-02-16 2002-02-16 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템

Country Status (3)

Country Link
US (1) US7225123B2 (ko)
KR (1) KR100472442B1 (ko)
CN (1) CN1438767A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
KR200453964Y1 (ko) * 2008-08-20 2011-06-09 신유진 위치추적기능 및 위급상황송출기능을 갖는 머리핀
KR20200039878A (ko) * 2018-10-05 2020-04-17 한국전력공사 진공차단기 절연 내력 진단 장치 및 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
CN101241701B (zh) * 2004-09-17 2012-06-27 广州广晟数码技术有限公司 用于对音频信号进行解码的方法和设备
US7698144B2 (en) * 2006-01-11 2010-04-13 Microsoft Corporation Automated audio sub-band comparison
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
AU2013200679B2 (en) * 2008-07-11 2015-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding and decoding audio samples
PL2311032T3 (pl) * 2008-07-11 2016-06-30 Fraunhofer Ges Forschung Koder i dekoder audio do kodowania i dekodowania próbek audio
CN101968382B (zh) * 2010-01-20 2012-05-09 南通大学 一种焦平面探测器读出信号的数字信号处理方法
CN101945431B (zh) * 2010-08-30 2014-08-13 京信通信系统(中国)有限公司 有损数据压缩方法及基于有损数据压缩的数字通信系统
CN102446508B (zh) * 2010-10-11 2013-09-11 华为技术有限公司 语音音频统一编码窗型选择方法及装置
CN102253117B (zh) * 2011-03-31 2014-05-21 浙江大学 一种基于压缩感知的声学信号采集方法
US9704497B2 (en) 2015-07-06 2017-07-11 Apple Inc. Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
CN108092669B (zh) * 2017-12-28 2020-06-16 厦门大学 一种基于离散余弦变换的自适应数据压缩方法及系统
CN109067405B (zh) * 2018-07-27 2022-10-11 深圳市元征科技股份有限公司 一种数据压缩的方法、装置、终端及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JPH08205151A (ja) * 1995-01-26 1996-08-09 Matsushita Graphic Commun Syst Inc 画像圧縮符号化装置及び画像伸長復号化装置
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
JPH09261640A (ja) * 1996-03-22 1997-10-03 Oki Electric Ind Co Ltd 画像符号化装置
JP2001103484A (ja) * 1999-09-29 2001-04-13 Canon Inc 画像処理装置及びその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
KR200453964Y1 (ko) * 2008-08-20 2011-06-09 신유진 위치추적기능 및 위급상황송출기능을 갖는 머리핀
KR20200039878A (ko) * 2018-10-05 2020-04-17 한국전력공사 진공차단기 절연 내력 진단 장치 및 방법

Also Published As

Publication number Publication date
US20040044526A1 (en) 2004-03-04
US7225123B2 (en) 2007-05-29
KR100472442B1 (ko) 2005-03-08
CN1438767A (zh) 2003-08-27

Similar Documents

Publication Publication Date Title
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
KR100472442B1 (ko) 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
JP4786903B2 (ja) 低ビットレートオーディオコーディング
KR102081043B1 (ko) 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP3186292B2 (ja) 高能率符号化方法及び装置
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
EP1080462B1 (en) System and method for entropy encoding quantized transform coefficients of a signal
EP2054882A2 (en) Arbitrary shaping of temporal noise envelope without side-information
US20090132238A1 (en) Efficient method for reusing scale factors to improve the efficiency of an audio encoder
CA2490064A1 (en) Audio coding method and apparatus using harmonic extraction
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JP2004094223A (ja) 多数のサブバンド及び重なり合うウィンドウ関数を用いて処理される音声信号を符号化及び復号化する方法及び装置
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
EP0899892B1 (en) Signal processing apparatus and method, and information recording apparatus
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JPH06242797A (ja) 変換符号化装置のブロックサイズ決定法
JPH08179794A (ja) サブバンド符号化方法及び装置
KR20080008897A (ko) 오디오 부호화 방법
US7617100B1 (en) Method and system for providing an excitation-pattern based audio coding scheme
KR20070037771A (ko) 오디오 부호화 시스템
KR970006827B1 (ko) 오디오신호 부호화장치
Gunjal et al. Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130130

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140128

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150129

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee