KR100657916B1 - 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 - Google Patents

주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 Download PDF

Info

Publication number
KR100657916B1
KR100657916B1 KR1020040099742A KR20040099742A KR100657916B1 KR 100657916 B1 KR100657916 B1 KR 100657916B1 KR 1020040099742 A KR1020040099742 A KR 1020040099742A KR 20040099742 A KR20040099742 A KR 20040099742A KR 100657916 B1 KR100657916 B1 KR 100657916B1
Authority
KR
South Korea
Prior art keywords
subband
similarity
audio signal
subbands
information
Prior art date
Application number
KR1020040099742A
Other languages
English (en)
Other versions
KR20060060928A (ko
Inventor
김중회
김도형
이시화
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040099742A priority Critical patent/KR100657916B1/ko
Priority to US11/280,196 priority patent/US7756715B2/en
Priority to EP05257270A priority patent/EP1667112B1/en
Priority to CN2010102432270A priority patent/CN101908340B/zh
Priority to CN2005101258261A priority patent/CN1784020B/zh
Priority to JP2005348034A priority patent/JP5265853B2/ja
Publication of KR20060060928A publication Critical patent/KR20060060928A/ko
Application granted granted Critical
Publication of KR100657916B1 publication Critical patent/KR100657916B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치 및 방법이 개시된다. 입력 오디오 신호를 부호화하는 부호화부 및 부호화된 입력 오디오 신호를 복호화하는 복호화부를 갖는 이 장치는, 부호화부에 포함되고, 제1 서브 밴드 마다 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 찾아진 제2 서브 밴드에 대한 정보를 생성하는 유사도 분석부 및 복호화부에 포함되고, 유사도 분석부에서 생성된 후 비트 스트림 형태로 전송된 생성된 제2 서브 밴드에 대한 정보를 이용하여, 찾아진 제2 서브 밴드에 대한 데이타를 제1 서브 밴드에 대한 데이타로서 복제하여 제1 서브 밴드를 복호화하는 고주파 성분 복원부를 구비하고, 제1 서브 밴드들은 입력 오디오 신호의 서브 밴드 필터링한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들이고, 제2 서브 밴드들은 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들인 것을 특징으로 한다. 음질을 개선시킬 수 있으며, 특히 트랜지언트 오디오 신호에 대해서도 잡음을 효율적으로 치환시킬 수 있으며 더우기 낮은 비트율에서도 주파수 대역폭을 줄이지 않으면서 고주파 신호를 효율적으로 부호화 및 복호화시킬 수 있으며 안정적이고 자연스러운 음질을 제공할 수 있는 효과를 갖는다.

Description

주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치 및 방법{Apparatus and method for processing audio signal using correlation between bands}
도 1은 본 발명에 의한 오디오 신호 처리 장치의 실시예의 블럭도이다.
도 2는 입력 오디오 신호를 부호화하는 본 발명에 의한 오디오 신호 처리 방법의 실시예를 설명하기 위한 플로우차트이다.
도 3은 부호화된 오디오 신호를 복호화하는 본 발명에 의한 오디오 신호 처리 방법을 설명하기 위한 플로우차트이다.
도 4는 도 1에 도시된 유사도 분석부의 본 발명에 의한 일 실시예의 블럭도이다.
도 5는 도 2에 도시된 제72 단계에 대한 본 발명에 의한 일 실시예를 설명하기 위한 플로우차트이다.
도 6은 도 1에 도시된 유사도 분석부의 본 발명에 의한 다른 실시예의 블럭도이다.
도 7은 도 2에 도시된 제72 단계에 대한 본 발명에 의한 다른 실시예를 설명하기 위한 플로우차트이다.
도 8은 도 1에 도시된 고주파 성분 복원부의 본 발명에 의한 실시예의 블럭도이다.
도 9는 도 3에 도시된 제94 단계에 대한 본 발명에 의한 실시예를 설명하기 위한 플로우차트이다.
도 10a ~ 10e들은 저 주파수 대역과 고 주파수 대역간의 유사도를 설명하기 위한 서브 밴드들의 예시적인 파형도들이다.
본 발명은 엠펙(MPEG:Moving Picture Expert Group)-4 등을 이용한 오디오 신호의 처리 즉, 오디오 신호의 부호화 및 복호화에 관한 것으로서, 특히 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치 및 방법에 관한 것이다.
종래의 오디오 신호 처리 방법들중 하나로서 인식 잡음 치환(PNS:Perceptual Noise Substitution) 방법이 있다. 이러한 종래의 오디오 신호 처리 방법은 MPEG-4 오디오 코딩 툴(tool)로서, 64kbps(bit per second)/스테레오(stereo)와 같이 낮은 비율율에서는 오디오 신호를 효과적으로 처리할 수 있지만, 높은 비트율에서 음질을 저하시키는 문제점을 갖는다. 특히, 이러한 종래의 오디오 신호 처리 방법이 트랜지언트(transient) 오디오 신호를 처리할 경우, 음질을 더욱 저하시키는 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 낮은 비트율에서 조차도 주파수 대역폭을 줄이지 않으면서 오디오 신호를 효율적으로 처리할 수 있는 주파수 대역간 의 유사도를 이용한 오디오 신호 처리 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 낮은 비트율에서 조차도 주파수 대역폭을 줄이지 않으면서 오디오 신호를 효율적으로 처리할 수 있는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법을 제공하는 데 있다.
상기 과제를 이루기 위해, 입력 오디오 신호를 부호화하는 부호화부 및 부호화된 상기 입력 오디오 신호를 복호화하는 복호화부를 갖는 본 발명에 의한 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치는, 상기 부호화부에 포함되고, 제1 서브 밴드 마다 상기 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 상기 찾아진 제2 서브 밴드에 대한 정보를 생성하는 유사도 분석부 및 상기 복호화부에 포함되고, 상기 유사도 분석부에서 생성된 후 비트 스트림 형태로 전송된 상기 생성된 제2 서브 밴드에 대한 정보를 이용하여, 상기 찾아진 제2 서브 밴드에 대한 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하여 상기 제1 서브 밴드를 복호화하는 고주파 성분 복원부로 구성되고, 상기 제1 서브 밴드들은 상기 입력 오디오 신호의 서브 밴드 필터링한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들이고, 상기 제2 서브 밴드들은 상기 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들인 것이 바람직하다.
상기 다른 과제를 이루기 위한 본 발명에 의한 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법은, 입력 오디오 신호를 부호화할 때, 제1 서브 밴드 마다 상기 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 상기 찾아진 제2 서브 밴드에 대한 정보를 생성하는 단계 및 부호화된 상기 입력 오디오 신호를 복호화할 때, 비트 스트림 형태로 전송된 상기 생성된 제2 서브 밴드에 대한 정보를 이용하여, 상기 찾아진 제2 서브 밴드에 대한 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하여 상기 제1 서브 밴드를 복호화하는 단계를 구비하고, 상기 제1 서브 밴드들은 상기 입력 오디오 신호를 서브 밴드 필터링한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들이고, 상기 제2 서브 밴드들은 상기 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들인 것이 바람직하다.
이하, 본 발명에 의한 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치의 구성 및 동작과 그 장치에서 수행되는 오디오 신호 처리 방법을 다음과 같이 설명한다.
도 1은 본 발명에 의한 오디오 신호 처리 장치의 실시예의 블럭도로서, 부호화부(10) 및 복호화부(12)로 구성된다.
도 1에 도시된 부호화부(10)는 입력단자 IN1을 통해 입력한 입력 오디오 신호를 부호화하고, 부호화된 결과를 복호화부(12)로 전송한다. 이 때, 복호화부(12)는 부호화부(10)에서 부호화된 입력 오디오 신호를 복호화하고, 복호화된 결과를 출력단자 OUT1을 통해 출력한다.
도 1에 도시된 부호화부(10)는 부호화를 수행할 때, 제1 서브 밴드(sub band)와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중 에서 찾고, 찾아진 제2 서브 밴드에 대한 정보 예를 들면 제2 서브 밴드의 인덱스(index)에 대한 정보를 생성한다. 부호화부(10)는 이러한 동작을 제1 서브 밴드들 각각에 대해 수행한다. 여기서, 입력 오디오 신호를 서브 밴드 필터링(filtering)한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들을 제1 서브 밴드라고 정의하고, 입력 오디오 신호를 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들을 제2 서브 밴드라고 정의한다.
이 때, 부호화부(10)는 유사한 서브 밴드를 갖지 않은 제1 서브 밴드(들)와 제2 서브 밴드들에 대해서는 일반적인 오디오 부호화 방법에 의해 부호화한다. 이하, 유사한 서브 밴드란, 제1 서브 밴드와 소정값 이상의 유사도를 갖는 제2 서브 밴드를 의미한다. 이 때, 일반적인 오디오 부호화 방법이란, 후술되는 바와 같은 랜덤 잡음 치환(RNS:Random Noise Substitution) 방법이 될 수 있다.
본 발명의 실시예에 의하면, 부호화부(10)는 도 1에 도시된 바와 같이, 서브 밴드 필터 분석부(30), 유사도 분석부(32), 양자화부(34), 출력부(36) 및 양자화 제어부(38)로 구현될 수 있다.
이하, 도 1에 도시된 부호화부(10)의 본 발명에 의한 실시예의 구성 및 동작과 그 부호화부(10)에서 수행되는 오디오 신호 처리 방법을 다음과 같이 설명한다.
도 2는 입력 오디오 신호를 부호화하는 본 발명에 의한 오디오 신호 처리 방법의 실시예를 설명하기 위한 플로우차트로서, 입력 오디오 신호를 서브 밴드 필터링하는 단계(제70 단계), 서브 밴드 필터링한 결과에 포함된 각 제1 서브 밴드마다 가장 유사한 서브 밴드를 찾아 이들에 대한 정보들을 생성하는 단계(제72 단계), 청각의 민감도를 분석한 결과를 이용하여 양자화를 수행하는 단계(제74 및 제76 단계들) 및 무 손실(lossless) 부호화 및 비트 패킹(bit packing)을 수행하는 단계(제78 단계)로 이루어진다.
부호화부(10)의 서브 밴드 필터 분석부(30)는 입력단자 IN1을 통해 입력 오디오 신호를 입력하고, 입력한 입력 오디오 신호를 서브 밴드 필터링하며, 서브 밴드 필터링된 결과를 유사도 분석부(32) 및 양자화 제어부(38)로 각각 출력한다(제70 단계). 이 때, 서브 밴드 필터 분석부(30)는 서브 밴드 필터링한 결과를 양자화부(34)로도 출력할 수 있다.
제70 단계후에, 유사도 분석부(32)는 각 제1 서브 밴드마다 그 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 찾아진 제2 서브 밴드에 대한 정보를 생성하며, 생성된 정보를 양자화부(34)로 출력한다(제72 단계). 예컨대, 유사도 분석부(32)는 제1 서브 밴드 마다 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 가장 유사한 서브 밴드를 갖는 제1 서브 밴드와 그 가장 유사한 서브 밴드에 대한 정보를 매칭시켜 생성한다.
제72 단계후에, 양자화 제어부(38)는 서브 밴드 필터 분석부(30)로부터 입력한 서브 밴드 필터링된 결과로부터 청각의 민감도를 분석하고, 분석한 결과에 따라 스텝 크기(step size) 제어 신호를 생성하며, 생성된 스텝 크기 제어 신호를 양자화부(34)로 출력한다(제74 단계). 이를 위해, 양자화 제어부(38)는 어드레스 발생부(미도시) 및 룩 업 테이블(미도시)로 구현될 수 있다. 여기서, 어드레스 발생부(미도시)는 서브 밴드 필터 분석부(30)로부터 입력한 서브 밴드 필터링된 결과로부 터 청각의 민감도를 반영하여 어드레스를 생성하고, 생성된 어드레스를 룩 업 테이블(미도시)로 출력한다. 룩 업 테이블은 데이타로서 저장한 스텝 크기들중에서 해당하는 스텝 크기를 어드레스 발생부에서 발생된 어드레스에 응답하여 선택하고, 선택된 스텝 크기를 스텝 크기 제어 신호로서 양자화부(34)로 출력한다. 여기서, 룩 업 테이블에 저장된 스텝 크기는 양자화가 적절히 수행될 수 있도록 하는 정보 예를 들면 심리 음향 모델에 입각하여 생성될 수 있다.
본 발명에 의하면, 도 2에 도시된 제72 단계와 제74 단계들은 동시에 수행될 수도 있고, 제74 단계가 제72 단계보다 먼저 수행될 수 있다.
제74 단계후에, 양자화부(34)는 유사도 분석부(32)로부터 입력한 생성된 제2 서브 밴드에 대한 정보와 서브 밴드 필터링된 결과를 양자화하고, 양자화된 결과를 출력부(36)로 출력한다(제76 단계). 이를 위해, 양자화부(34)는 서브 밴드 필터링된 결과를 서브 밴드 필터 분석부(30)로부터 직접 입력할 수도 있고, 유사도 분석부(32)를 통해 입력할 수도 있다. 이 때, 양자화부(34)는 양자화 제어부(38)로부터 입력한 스텝 크기 제어 신호에 응답하여 양자화 스텝 크기를 조절한다.
제76 단계후에, 출력부(36)는 양자화부(34)에서 양자화된 결과를 무 손실 부호화 및 비트 패킹하고, 비트 패킹된 결과를 비트 스트림 형태로 변환하며, 변환된 비트 스트림을 저장한 후 복호화부(12)로 전송한다(제78 단계). 여기서, 무 손실 부호화를 위해 허프만 인코딩(Huffman encoding)이 사용될 수 있다.
본 발명에 의하면, 도 1에 도시된 부호화부(10)는 양자화 제어부(38)를 마련하지 않을 수도 있다. 이 경우, 부호화부(10)는 서브 밴드 필터 분석부(30), 유사 도 분석부(32), 양자화부(34) 및 출력부(36)만으로 구현된다.
한편, 복호화부(12)에서 복호화를 수행할 때, 비트 스트림 형태로 부호화부(10)에서 전송된 생성된 제2 서브 밴드에 대한 정보를 수신하고, 수신된 정보를 이용하여, 찾아진 제2 서브 밴드에 대한 데이타를 제1 서브 밴드에 대한 데이타로서 복제한다.
이 때, 매칭된 가장 유사한 서브 밴드를 갖지 않은 제1 서브 밴드 및 제2 서브 밴드들에 대해서는 일반적인 오디오 복호화 방법에 의해 복호화된다. 이를 위해, 본 발명의 실시예에 의하면, 도 1에 도시된 바와 같이, 복호화부(12)는 입력부(50), 역 양자화부(52), 고주파 성분 복원부(54) 및 서브 밴드 필터 합성부(56)로 구성된다.
이하, 도 1에 도시된 부호화부(10)의 본 발명에 의한 실시예의 구성 및 동작과 그 부호화부(10)에서 수행되는 오디오 신호 처리 방법을 다음과 같이 설명한다.
도 3은 부호화된 오디오 신호를 복호화하는 본 발명에 의한 오디오 신호 처리 방법을 설명하기 위한 플로우차트로서, 비트 언 패킹(bit unpacking)하고 무 손실 복호화를 수행하며 각종 정보를 추출하는 단계(제90 단계), 역 양자화를 수행하는 단계(제92 단계), 데이타를 복제하는 단계(제94 단계) 및 서브 밴드 필터링을 수행하여 입력 오디오 신호를 복원하는 단계(제96 단계)로 이루어진다.
입력부(50)는 부호화부(10)의 출력부(36)로부터 전송된 비트 스트림을 수신하고, 수신된 비트 스트림을 비트 언 패킹하고 무 손실 복호화하여 역 양자화부(52)로 출력하는 한편, 각종 정보를 추출하여 고주파 성분 복원부(54)로 출력한다( 제90 단계). 여기서, 무 손실 복호화의 례로서, 허프만 디코딩(Huffman decoding)이 있다.
제90 단계후에, 역 양자화부(52)는 입력부(50)에서 무손실 복호화된 결과를 입력하여 역 양자화하고, 역 양자화된 결과를 고주파 성분 복원부(54)로 출력한다(제92 단계).
제92 단계후에, 고주파 성분 복원부(54)는 역 양자화된 결과에 포함된 제2 서브 밴드들에 대한 데이타들중에서 입력부(50)에서 추출된 각종 정보에 포함된 생성된 제2 서브 밴드에 대한 정보에 해당하는 데이타를 제1 서브 밴드에 대한 데이타로서 복제하고, 복제된 결과를 서브 밴드 필터 합성부(56)로 출력한다(제94 단계).
제94 단계후에, 서브 필터 합성부(56)는 고주파 성분 복원부(54)로부터 입력한 복제된 데이타를 갖는 제1 서브 밴드 및 역 양자화된 결과를 서브 밴드 필터링하고, 필터링된 결과를 입력 오디오 신호를 복원한 오디오 신호로서 출력단자 OUT1을 통해 출력한다(제96 단계). 제96 단계에서 서브 밴드 필터링되는 역 양자화된 결과란, 역 양자화된 결과에 포함된 데이타들중에서, 복제된 데이타를 갖지 않은 제1 서브 밴드와 제2 서브 밴드에 대한 데이타를 의미한다.
이를 위해, 서브 필터 합성부(56)는 역 양자화된 결과를 고주파 성분 복원부(54)를 통해 입력할 수도 있고, 역 양자화부(52)로부터 직접 입력할 수도 있다.
이하, 도 1에 도시된 유사도 분석부(32)의 본 발명에 의한 실시예들 각각의 구성 및 동작과 각 실시예에서 수행되는 오디오 신호 처리 방법을 첨부한 도면들을 참조하여 다음과 같이 설명한다.
도 4는 도 1에 도시된 유사도 분석부(32)의 본 발명에 의한 일 실시예(32A)의 블럭도로서, 유사도 산출부(110), 서브 밴드 비교 선택부(113) 및 정보 생성부(116)로 구성된다.
도 5는 도 2에 도시된 제72 단계에 대한 본 발명에 의한 일 실시예를 설명하기 위한 플로우차트로서, 각 제1 서브 밴드의 유사도들중 가장 큰 유사도를 구할 때 사용된 제2 서브 밴드를 선택하는 단계(제130 및 제132 단계들) 및 유사도의 유사한 정도에 따라 정보를 생성하는 단계(제134 ~ 제138 단계들) 및 잡음 전력에 대한 정보를 생성하는 단계(제140 단계)로 이루어진다.
도 4에 도시된 유사도 산출부(110)는 고 주파수 대역에 속하는 제1 서브 밴드 마다 제1 서브 밴드와 저 주파수 대역에 속하는 제2 서브 밴드들간의 유사도들을 산출하며, 산출된 제1 서브 밴드 마다의 유사도들을 서브 밴드 비교 선택부(113)로 출력한다(제130 단계). 이를 위해, 먼저 유사도 산출부(110)는 입력단자 IN2를 통해 입력한 서브 밴드 필터링된 결과의 대역에서 기준 주파수를 기준으로 고 주파수 대역과 저 주파수 대역을 구분한다. 본 발명에 의하면, 고 주파수 대역과 저 주파수 대역을 구분짓는, 기준 주파수는 사용자에 의해 변경될 수도 있고, 사전에 설정될 수도 있다.
본 발명에 의하면, 유사도(cor)는 다음 수학식 1과 같이 구해질 수 있다.
Figure 112004056557275-pat00001
여기서, abs()는 ()의 절대값을 의미하고, sb1은 저 주파수 대역에 속하는 제2 서브 밴드의 인덱스로서 0 ~ k-1 중 하나이다. k는 저 주파수 대역에 속하는 제2 서브 밴드들의 개수를 의미하고, sb2는 제1 서브 밴드의 인덱스를 나타낸다. I는 제1 서브 밴드에 속하는 타임 도메인(time domain) 샘플(sample)의 개수를 나타낸다. 이 때, 제1 서브 밴드와 제2 서브 밴드에 속하는 타임 도메인 샘플의 개수는 동일한 것으로 가정되었다. samp[sb1][i]는 sb1 번째 제2 서브 밴드에 있는 i번째 타임 도메인 샘플을 나타내고, samp[sb2][i]는 sb2 번째 제1 서브 밴드에 있는 i번째 타임 도메인 샘플을 나타낸다.
제130 단계후에, 서브 밴드 선택부(112)는 제1 서브 밴드 마다 산출되어 유사도 산출부(110)로부터 입력한 유사도들중에서 소정값 이상인 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하여 정보 생성부(116)로 출력한다(제132 및 제134 단계들). 여기서, '유사도를 산출할 때 사용된 제2 서브 밴드'란, 유사도를 산출하기 위해 제1 서브 밴드와 비교된 제2 서브 밴드를 의미한다.
이를 위해, 서브 밴드 선택부(112)는 제1 서브 밴드 마다 유사도 산출부(110)에서 산출된 유사도들중에서 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴 드를 선택하고, 선택된 제2 서브 밴드를 정보 생성부(116)로 출력하는 한편, 가장 큰 유사도를 비교부(114)로 출력한다(제132 단계). 제132 단계후에, 비교부(114)는 제1 서브 밴드 마다 선택된 제2 서브 밴드를 사용하여 산출한 유사도 즉, 각 제1 서브 밴드에서 가장 큰 유사도를 소정값과 비교하고, 비교된 결과를 정보 생성부(116)로 출력한다(제134 단계). 즉, 비교부(114)는 각 제1 서브 밴드의 가장 큰 유사도가 소정값 이상인가를 판단한다.
정보 생성부(116)는 비교부(114)에서 비교된 결과에 응답하여, 서브 밴드 선택부(112)로부터 입력한 선택된 제2 서브 밴드에 대한 정보, 제1 서브 밴드가 유사한 서브 밴드를 갖는가의 여부에 대한 정보 및 제1 서브 밴드의 잡음 전력에 대한 정보를 생성하고, 생성된 정보를 출력단자 OUT2를 통해 출력한다(제136 ~ 제140 단계들).
예컨대, 비교부(114)로부터 입력한 비교된 결과를 통해, 제1 서브 밴드의 가장 큰 유사도가 소정값 이상이라고 인식되면, 정보 생성부(116)는 서브 밴드 선택부(112)로부터 입력한 선택된 제2 서브 밴드에 대한 정보 즉, 선택된 제2 서브 밴드의 인덱스에 대한 정보와 제1 서브 밴드가 유사한 서브 밴드를 갖는다는 정보를 예를 들면 모드 비트의 형태로서 생성하고, 생성된 정보를 출력단자 OUT2를 통해 출력한다(제136 단계). 그러나, 비교부(114)로부터 입력한 비교된 결과를 통해, 제1 서브 밴드의 가장 큰 유사도가 소정값 이상이 아니라고 판단되면, 정보 생성부(116)는 제1 서브 밴드는 유사한 서브 밴드를 갖지 않는다는 정보를 모드 비트의 형태로서 생성한다(제138 단계). 여기서, 모드 비트란, 제1 서브 밴드가 유사한 서 브 밴드를 갖는가 그렇지 않으면 유사한 서브 밴드를 갖지 못하는가를 나타내는 비트이다. 예를 들어, 제1 서브 밴드가 유사한 서브 밴드를 갖는다면, 유사 잡음 치환(CNS:Correlation Noise Substitution) 모드를 나타내도록 모드 비트를 '1'(또는 '0')로 설정할 수 있고(제136 단계), 제1 서브 밴드가 유사한 서브 밴드를 갖지 않는다면, RNS 모드를 나타내도록 모드 비트를 '0'(또는 '1')으로 설정할 수 있다(제138 단계). 제136 및 제138 단계들은 제1 서브 블럭 마다 수행된다.
도 6은 도 1에 도시된 유사도 분석부(32)의 본 발명에 의한 다른 실시예(32B)의 블럭도로서, 유사도 산출부(110), 서브 밴드 비교 선택부(150) 및 정보 생성부(116)로 구성된다.
도 7은 도 2에 도시된 제72 단계에 대한 본 발명에 의한 다른 실시예를 설명하기 위한 플로우차트로서, 각 제1 서브 밴드의 유사도들중에서 소정값 이상의 유사도가 존재하는가를 판단하는 단계(제130 및 제162 단계들), 존재하는 유사도중 가장 큰 유사도를 구할 때 사용된 제2 서브 밴드를 선택하는 단계(제164 단계) 및 정보를 생성하는 단계들(제136 ~ 제140 단계들)로 이루어진다.
도 4 및 도 6에 도시된 유사도 산출부(110)는 동일한 역할을 수행하므로 이에 대해서는 동일한 참조 부호를 사용하며, 상세한 설명은 생략한다. 게다가, 도 5 및 도 7에 도시된 제130 및 제140 단계들은 동일한 역할을 수행하므로 이들에 대해서는 동일한 참조부호를 사용하며, 이들에 대한 상세한 설명은 생략한다.
제130 단계후에, 서브 밴드 선택부(150)는 제1 서브 밴드 마다 산출되어 유사도 산출부(110)로부터 입력한 유사도들중에서 소정값 이상인 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하여 정보 생성부(116)로 출력한다(제162 및 제164 단계들).
이를 위해, 비교부(152)는 제1 서브 밴드마다 산출된 유사도들과 소정값을 비교하고, 비교된 결과를 서브 밴드 선택부(154) 및 정보 생성부(152)로 각각 출력한다(제162 단계). 즉, 비교부(152)는 각 서브 밴드에서 산출된 유사도들중에서 소정값 이상의 유사도가 존재하는가를 판단한다. 만일, 비교부(152)에서 비교된 결과를 통해 소정값 이상의 유사도가 존재한다고 인식되면, 서브 밴드 선택부(154)는 소정값 이상의 유사도들중에서 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하고, 선택된 제2 서브 밴드를 정보 생성부(152)로 출력한다(제164 단계).
정보 생성부(152)는 서브 밴드 선택부(154)에서 선택된 제2 서브 밴드에 대한 정보를 생성하고, 비교부(152)로부터 입력한 비교된 결과를 이용하여 제1 서브 밴드가 유사한 서브 밴드를 갖는가의 여부에 대한 정보를 생성하며, 생성된 정보들을 출력단자 OUT2를 통해 출력한다(제166 및 제168 단계들). 정보 생성부(152)는 도 4에 도시된 정보 생성부(116)와 마찬가지로 제1 서브 밴드의 잡음 전력에 대한 정보도 생성한다.
예컨대, 비교부(152)로부터 입력한 비교된 결과를 통해, 소정값 이상의 유사도가 존재한다고 인식되면, 정보 생성부(152)는 서브 밴드 선택부(154)로부터 입력한 선택된 제2 서브 밴드에 대한 정보 즉, 선택된 제2 서브 밴드의 인덱스에 대한 정보와 제1 서브 밴드가 유사한 서브 밴드를 갖는다는 정보를 예를 들면 모드 비트의 형태로서 생성하고, 생성된 정보를 출력단자 OUT2를 통해 출력한다(제166 단계 ). 그러나, 비교부(152)로부터 입력한 비교된 결과를 통해, 제1 서브 밴드에서 산출된 유사도들중 소정값 이상의 유사도가 존재하지 않는다고 인식되면, 정보 생성부(116)는 그 제1 서브 밴드가 유사한 서브 밴드를 갖지 않는다는 정보를 모드 비트의 형태로서 생성한다(제168 단계). 제166 및 제168 단계들은 제1 서브 블럭 마다 수행된다.
이하, 도 1에 도시된 고주파 성분 복원부(54)의 본 발명에 의한 실시예의 구성 및 동작과 그 실시예에서 수행되는 오디오 신호 처리 방법을 첨부한 도면들을 참조하여 다음과 같이 설명한다.
도 8은 도 1에 도시된 고주파 성분 복원부(54)의 본 발명에 의한 실시예(54A)의 블럭도로서, 유사 검사부(180), 데이타 복제부(182), 랜덤(random) 잡음 생성부(184) 및 정규화부(186)로 구성된다.
도 9는 도 3에 도시된 제94 단계에 대한 본 발명에 의한 실시예를 설명하기 위한 플로우차트로서, 제1 서브 밴드가 유사한 서브 밴드를 갖는가에 따라 제1 서브 밴드를 다르게 복호화하는 단계(제190 ~ 제194 단계들) 및 복제된 데이타를 정규화하는 단계(제196 단계)로 이루어진다.
유사 검사부(180)는 역 양자화부(52)에서 양자화된 결과의 각 제1 서브 밴드가 유사한 서브 밴드를 갖는가를 검사한다(제190 단계). 이를 위해, 유사 검사부(180)는 입력부(50)로부터 추출된 부가 정보를 입력단자 IN3을 통해 입력하고, 입력한 부가 정보를 통해 각 제1 서브 밴드가 유사한 서브 밴드를 갖는가를 판단한다. 예를 들어, 추출된 부가 정보는 전술한 모드 비트를 포함할 수 있다. 이 경우, 유사 검사부(180)는 모드 비트를 검사하여 모드 비트가 '1'인가 '0'인가를 검사하고, 검사된 결과를 통해 제1 서브 밴드가 유사한 서브 밴드를 갖는가의 여부를 결정할 수 있다.
데이타 복제부(182)는 유사 검사부(180)에서 검사된 결과를 통해 제1 서브 밴드가 유사한 서브 밴드를 갖는다고 인식되면, 선택된 제2 서브 밴드에 대한 정보에 포함된 데이타를 입력단자 IN4를 통해 역 양자화부(52)로부터 입력한 역 양자화된 결과로부터 추출하고, 추출된 데이타를 제1 서브 밴드에 대한 데이타로서 복제한다(제192 단계). 그러나, 랜덤 잡음 생성부(184)는 유사 검사부(180)에서 검사된 결과를 통해 제1 서브 밴드가 유사한 서브 밴드를 갖지 않는다고 인식되면, 제1 서브 밴드에 대한 잡음을 랜덤하게 생성하고, 랜덤하게 생성된 잡음을 정규화부(186)로 출력한다(제194 단계). 여기서, 전술한 RNS 방법이란, 모드 비트를 RNS 모드를 나타내는 비트값으로 설정하는 제138 또는 제168 단계를 수행하는 종래의 일반적인 부호화 방법과, RNS 모드를 나타내는 비트값으로 설정된 모드 비트에 따라 제194 단계를 수행하는 종래의 일반적인 복호화 방법을 의미한다.
도 9에 도시된 제192 및 제194 단계들은 제1 서브 밴드들 각각에 대해 수행된다. 이 때, 제2 서브 밴드들은 종래의 일반적인 복호화 방법에 의해 복호화된다. 즉, 제2 서브 밴드들에 대한 잡음들도 제194 단계에서 랜덤하게 생성된다.
제192 또는 제194 단계후에, 정규화부(186)는 제1 서브 밴드들에 대한 총 잡음 전력 즉, 총 에너지가 부호화부(10)측에서 산출된 제1 서브 밴드들의 총 잡음 전력과 동일하게 유지되도록, 복제된 데이타와 랜덤하게 생성된 잡음을 정규화하 고, 정규화된 결과를 출력단자 OUT3을 통해 서브 밴드 필터 합성부(56)로 출력한다. 이를 위해, 정규화부(186)는 부호화부(10)측에서 산출된 제1 서브 밴드의 총 잡음 전력을 알기 위해서 부호화부(10)에서 생성된 잡음 전력에 대한 정보를 포함하는 부가 정보를 입력부(50)로부터 입력단자 IN5를 통해 입력한다.
여기서, 선택된 제2 서브 밴드에 대한 정보에 포함된 데이타를 제1 서브 밴드에 대한 데이타로서 복제할 경우, 원래의 제1 서브 밴드의 레벨이 변할 수 있다. 따라서, 부호화되기 이전의 원래의 제1 서브 밴드가 갖는 레벨을 복원하기 위해서, 정규화부(186)는 복제된 데이타와 랜덤하게 생성된 잡음을 정규화한다.
전술한 본 발명에 의한 오디오 신호 처리 장치 및 방법은 저 주파수 대역과 고 주파수 대역간의 유사도가 높을 경우 더욱 향상된 성능을 제공할 수 있다.
일반적으로, 저 주파수 대역과 고 주파수 대역간의 유사도는 시간 영역상에서 갑작스러운 변화(attack)가 발생할 경우에 증가하고, 하모닉(harmonic) 성분이 강하면서 서브 밴드 경계(boundary)와 일치할 경우에도 증가한다.
도 10a ~ 10e들은 저 주파수 대역과 고 주파수 대역간의 유사도를 설명하기 위한 서브 밴드들의 예시적인 파형도들로서, 도 10a는 6 ~ 9번째 서브 밴드들에 대한 샘플 크기를 나타내는 도면이고, 도 10b는 10 ~ 13번째 서브 밴드들에 대한 샘플 크기를 나타내는 도면이고, 도 10c는 14 ~ 17번째 서브 밴드들에 대한 샘플 크기를 나타내는 도면이고, 도 10d는 18 ~ 21번째 서브 밴드들에 대한 샘플 크기를 나타내는 도면이고, 도 10e는 22 ~ 25번째 서브 밴드들에 대한 샘플 크기를 나타내는 도면이고, 각 도면에서 횡축은 시간을 나타내고 종축은 샘플의 크기를 나타내 고, 도 10a ~ 10e에 도시된 각 도면에 표시된 1 ~ 16은 시간 영역상의 인덱스를 나타낸다.
만일, 기준 주파수가 도 10b에 도시된 10번째 서브 밴드(10th)일 경우, 고 주파수 대역에서 도 10c에 도시된 14번째 서브 밴드(14th)에 대한 시간 영역상의 인덱스 2의 샘플 크기와 저 주파수 대역에서 도 10a에 도시된 7번째 서브 밴드(7th)에 대한 시간 영역상의 인덱스 2의 샘플 크기는 매우 유사함 즉, 유사도가 매우 높음을 알 수 있다.
이상에서 설명한 바와 같이, 본 발명에 의한 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치 및 방법은 오디오 신호를 부호화 및 복호화할 때 잡음 성분을 효율적으로 치환하기 때문에 음질을 개선시킬 수 있으며, 특히 트랜지언트 오디오 신호에 대해서도 잡음을 효율적으로 치환시킬 수 있으며 더우기 낮은 비트율에서도 주파수 대역폭을 줄이지 않으면서 고주파 신호를 효율적으로 부호화 및 복호화시킬 수 있으며 하모닉 성분이 강한 신호에 대해서는 종래의 RNS 방법보다 안정적인 음질을 제공할 수 있으며 시간적으로 큰 변화를 갖는 오디오 신호를 처리할 경우 자연스러운 음질을 제공할 수 있는 효과를 갖는다.

Claims (18)

  1. 입력 오디오 신호를 부호화하는 부호화부 및 부호화된 상기 입력 오디오 신호를 복호화하는 복호화부를 갖는 오디오 신호 처리 장치에 있어서,
    상기 부호화부에 포함되고, 제1 서브 밴드 마다 상기 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 상기 찾아진 제2 서브 밴드에 대한 정보를 생성하는 유사도 분석부; 및
    상기 복호화부에 포함되고, 상기 유사도 분석부에서 생성된 후 비트 스트림 형태로 전송된 상기 생성된 제2 서브 밴드에 대한 정보를 이용하여, 상기 찾아진 제2 서브 밴드에 대한 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하여 상기 제1 서브 밴드를 복호화하는 고주파 성분 복원부를 구비하고,
    상기 제1 서브 밴드들은 상기 입력 오디오 신호의 서브 밴드 필터링한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들이고, 상기 제2 서브 밴드들은 상기 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들인 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  2. 제1 항에 있어서, 상기 부호화부는
    상기 입력 오디오 신호를 서브 밴드 필터링하고, 상기 서브 밴드 필터링된 결과를 상기 유사도 분석부로 출력하는 서브 밴드 필터 분석부;
    상기 유사도 분석부로부터 입력한 상기 생성된 제2 서브 밴드에 대한 정보와 상기 서브 밴드 필터링된 결과를 양자화하는 양자화부; 및
    상기 양자화된 결과를 무 손실 부호화 및 비트 패킹하여 비트 스트림 형태로 상기 복호화부로 전송하는 출력부를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  3. 제2 항에 있어서, 상기 부호화부는
    상기 서브 밴드 필터 분석부로부터 입력한 상기 서브 밴드 필터링된 결과로부터 분석한 청각의 민감도에 따라 스텝 크기 제어 신호를 생성하고, 생성된 스텝 크기 제어 신호를 상기 양자화부로 출력하는 양자화 제어부를 더 구비하고,
    상기 양자화부는 상기 스텝 크기 제어 신호에 응답하여 양자화 스텝 크기를 조절하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  4. 제2 항에 있어서, 상기 복호화부는
    상기 출력부로부터 전송된 비트 스트림을 수신하여 비트 언 패킹하고 무 손실 복호화하며 각종 정보를 추출하는 입력부;
    상기 무손실 부호화된 결과를 역 양자화하고, 역 양자화된 결과를 상기 고주파 성분 복원부로 출력하는 역 양자화부; 및
    상기 고주파 성분 복원부로부터 입력한 상기 복제된 데이타를 갖는 상기 제1 서브 밴드 및 상기 역 양자화된 결과를 서브 밴드 필터링하고, 필터링된 결과를 상기 입력 오디오 신호를 복원한 오디오 신호로서 출력하는 서브 밴드 필터 합성부를 더 구비하고,
    상기 고주파 성분 복원부는 상기 역 양자화된 결과에 포함된 상기 제2 서브 밴드들에 대한 데이타들중 상기 추출된 각종 정보에 포함된 상기 생성된 제2 서브 밴드에 대한 정보에 해당하는 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  5. 제1 항에 있어서, 상기 유사도 분석부는
    상기 서브 밴드 필터링된 결과의 대역에서 기준 주파수를 기준으로 상기 고 주파수 대역과 상기 저 주파수 대역을 구분하고, 상기 구분된 고 주파수 대역에 속하는 상기 제1 서브 밴드 마다 상기 제1 서브 밴드와 상기 제2 서브 밴드들간의 유사도들을 산출하는 유사도 산출부;
    상기 제1 서브 밴드 마다 산출된 상기 유사도들중 상기 소정값 이상인 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하는 서브 밴드 비교 선택부; 및
    상기 선택된 제2 서브 밴드에 대한 정보, 상기 제1 서브 밴드가 상기 유사한 서브 밴드를 갖는가의 여부에 대한 정보 및 상기 제1 서브 밴드의 잡음 전력에 대한 정보를 생성하는 정보 생성부를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  6. 제5 항에 있어서, 상기 서브 밴드 비교 선택부는
    상기 제1 서브 밴드 마다 산출된 상기 유사도들중에서 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하는 서브 밴드 선택부; 및
    상기 제1 서브 밴드 마다 선택된 상기 제2 서브 밴드를 사용하여 산출한 상기 유사도를 상기 소정값과 비교하는 비교부를 구비하고,
    상기 정보 생성부는 상기 비교부에서 비교된 결과에 응답하여 상기 선택된 제2 서브 밴드에 대한 정보를 생성하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  7. 제5 항에 있어서, 상기 서브 밴드 비교 선택부는
    상기 제1 서브 밴드마다 구해진 상기 유사도들과 상기 소정값을 비교하는 비교부; 및
    상기 비교부에서 비교된 결과에 응답하여, 상기 소정값 이상의 유사도들중에서 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하는 서브 밴드 선택부를 구비하고,
    상기 정보 생성부는 상기 서브 밴드 선택부에서 선택된 제2 서브 밴드에 대한 정보를 생성하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  8. 제5 항에 있어서, 상기 고주파 성분 복원부는
    상기 각 제1 서브 밴드가 상기 유사한 서브 밴드를 갖는가를 검사하는 유사 검사부;
    상기 검사된 결과에 응답하여, 상기 선택된 제2 서브 밴드에 대한 정보에 포 함된 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하는 데이타 복제부;
    상기 검사된 결과에 응답하여, 상기 제1 서브 밴드에 대한 잡음을 랜덤하게 생성하는 랜덤 잡음 생성부; 및
    상기 제1 서브 밴드에 대한 총 잡음 전력을 동일하게 유지시킬 정도로 상기 복제된 데이타와 상기 랜덤하게 생성된 잡음을 정규화하고, 정규화된 결과를 출력하는 정규화부를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  9. 제5 항에 있어서, 상기 기준 주파수는 변경 가능한 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치.
  10. (a) 입력 오디오 신호를 부호화할 때, 제1 서브 밴드 마다 상기 제1 서브 밴드와 소정값 이상의 유사도를 갖는 가장 유사한 서브 밴드를 제2 서브 밴드들중에서 찾고, 상기 찾아진 제2 서브 밴드에 대한 정보를 생성하는 단계; 및
    (b) 부호화된 상기 입력 오디오 신호를 복호화할 때, 비트 스트림 형태로 전송된 상기 생성된 제2 서브 밴드에 대한 정보를 이용하여, 상기 찾아진 제2 서브 밴드에 대한 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하여 상기 제1 서브 밴드를 복호화하는 단계를 구비하고,
    상기 제1 서브 밴드들은 상기 입력 오디오 신호를 서브 밴드 필터링한 결과의 대역에서 고 주파수 대역에 속하는 서브 밴드들이고, 상기 제2 서브 밴드들은 상기 서브 밴드 필터링한 결과의 대역에서 저 주파수 대역에 속하는 서브 밴드들인 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  11. 제10 항에 있어서, 상기 오디오 신호 처리 방법은
    상기 입력 오디오 신호를 서브 밴드 필터링하고, 상기 (a) 단계로 진행하는 단계;
    상기 (a) 단계후에, 상기 생성된 제2 서브 밴드에 대한 정보와 상기 서브 밴드 필터링된 결과를 양자화하는 단계; 및
    상기 양자화된 결과를 무 손실 부호화 및 비트 패킹하여 비트 스트림 형태로 전송하는 단계를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  12. 제11 항에 있어서, 상기 오디오 신호 처리 방법은
    상기 서브 밴드 필터링된 결과로부터 청각의 민감도를 분석하는 단계를 더 구비하고,
    상기 서브 밴드 필터링된 결과를 양자화할 때, 상기 분석한 결과에 따라 양자화 스텝 크기를 조절하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  13. 제11 항에 있어서, 상기 오디오 신호 처리 방법은
    상기 전송된 비트 스트림을 수신하여 비트 언 패킹하고 무 손실 복호화하며 각종 정보를 추출하는 단계;
    상기 무손실 부호화된 결과를 역 양자화하고, 상기 (b) 단계로 진행하는 단계; 및
    상기 (b) 단계후에, 상기 복제된 데이타를 갖는 상기 제1 서브 밴드 및 상기 역 양자화된 결과를 서브 밴드 필터링하고, 필터링된 결과를 상기 입력 오디오 신호를 복원한 오디오 신호로서 결정하는 단계를 더 구비하고,
    상기 (b) 단계는 상기 역 양자화된 결과에 포함된 상기 제2 서브 밴드들에 대한 데이타들중 상기 추출된 각종 정보에 포함된 상기 생성된 제2 서브 밴드에 대한 정보에 해당하는 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  14. 제10 항에 있어서, 상기 (a) 단계는
    (a1) 상기 서브 밴드 필터링된 결과의 대역에서 기준 주파수를 기준으로 상기 고 주파수 대역과 상기 저 주파수 대역을 구분하고, 상기 구분된 고 주파수 대역에 속하는 상기 제1 서브 밴드 마다 상기 제1 서브 밴드와 상기 제2 서브 밴드들간의 유사도들을 구하는 단계;
    (a2) 상기 제1 서브 밴드 마다 구해진 상기 유사도들중 상기 소정값 이상인 가장 큰 유사도를 구할 때 사용된 제2 서브 밴드를 선택하는 단계;
    (a3) 상기 선택된 제2 서브 밴드에 대한 정보 및 상기 제1 서브 밴드가 상기 유사한 서브 밴드를 갖는가의 여부에 대한 정보를 생성하는 단계; 및
    (a4) 상기 제1 서브 밴드의 잡음 전력에 대한 정보를 생성하는 단계를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  15. 제14 항에 있어서, 상기 (a2) 단계는
    상기 제1 서브 밴드 마다 구해진 상기 유사도들중에서 가장 큰 유사도를 구할 때 사용된 제2 서브 밴드를 선택하는 단계; 및
    상기 제1 서브 밴드 마다 선택된 상기 제2 서브 밴드를 사용하여 구한 상기 유사도가 상기 소정값 이상인가를 판단하는 단계를 구비하고,
    상기 유사도가 상기 소정값 이상인 것으로 판단되면, 상기 (a3) 단계에서 상기 선택된 제2 서브 밴드에 대한 정보 및 상기 제1 서브 밴드가 유사한 서브 밴드를 갖는다는 정보를 생성하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  16. 제14 항에 있어서, 상기 (a2) 단계는
    상기 제1 서브 밴드마다 구해진 상기 유사도들중 상기 소정값 이상의 유사도가 존재하는가를 판단하는 단계; 및
    상기 소정값 이상의 유사도가 존재한다고 판단되면, 상기 소정값 이상의 유사도들중에서 가장 큰 유사도를 산출할 때 사용된 제2 서브 밴드를 선택하는 서브 밴드 선택부를 구비하고,
    상기 (a3) 단계에서, 상기 제1 서브 밴드가 유사한 서브 밴드를 갖지 않는다는 정보를 생성하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
  17. 제14 항에 있어서, 상기 유사도는 아래와 같이 구해지는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
    Figure 112004056557275-pat00002
    [여기서, abs()는 ()의 절대값을 의미하고, sb1은 상기 제2 서브 밴드의 인덱스로서 0 ~ k-1중 하나이고, k는 상기 저 주파수 대역에 속하는 상기 제2 서브 밴드들의 개수를 의미하고, sb2는 상기 제1 서브 밴드의 인덱스를 나타내고, I는 상기 제1 또는 제2 서브 밴드에 속하는 타임 도메인 샘플의 개수를 나타내고, samp[sb1][i]는 sb1 번째 제2 서브 밴드에 있는 i번째 타임 도메인 샘플을 나타내고, samp[sb2][i]는 sb2 번째 제1 서브 밴드에 있는 i번째 타임 도메인 샘플을 나타낸다.)
  18. 제14 항에 있어서, 상기 (b) 단계는
    상기 각 제1 서브 밴드가 상기 유사한 서브 밴드를 갖는가를 판단하는 단계;
    상기 각 제1 서브 밴드가 상기 유사한 서브 밴드를 갖는다고 판단되면, 상기 선택된 제2 서브 밴드에 대한 정보에 포함된 데이타를 상기 제1 서브 밴드에 대한 데이타로서 복제하는 단계;
    상기 제1 서브 밴드가 상기 유사한 서브 밴드를 갖지 않는다고 판단되면, 상기 제1 서브 밴드에 대한 잡음을 랜덤하게 생성하는 단계; 및
    상기 복제된 데이타 및 상기 랜덤하게 생성된 잡음을 정규화하여, 상기 제1 서브 밴드에 대한 총 잡음 전력을 동일하게 유지시키는 단계를 구비하는 것을 특징으로 하는 주파수 대역간의 유사도를 이용한 오디오 신호 처리 방법.
KR1020040099742A 2004-12-01 2004-12-01 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 KR100657916B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020040099742A KR100657916B1 (ko) 2004-12-01 2004-12-01 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US11/280,196 US7756715B2 (en) 2004-12-01 2005-11-17 Apparatus, method, and medium for processing audio signal using correlation between bands
EP05257270A EP1667112B1 (en) 2004-12-01 2005-11-25 Apparatus, method and medium for coding an audio signal using correlation between frequency bands
CN2010102432270A CN101908340B (zh) 2004-12-01 2005-11-30 使用频带间的相关来处理音频信号的设备、方法
CN2005101258261A CN1784020B (zh) 2004-12-01 2005-11-30 使用频带间的相关来处理音频信号的设备和方法
JP2005348034A JP5265853B2 (ja) 2004-12-01 2005-12-01 処理装置、処理方法、記録媒体、符号化方法及び復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040099742A KR100657916B1 (ko) 2004-12-01 2004-12-01 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법

Publications (2)

Publication Number Publication Date
KR20060060928A KR20060060928A (ko) 2006-06-07
KR100657916B1 true KR100657916B1 (ko) 2006-12-14

Family

ID=35735271

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040099742A KR100657916B1 (ko) 2004-12-01 2004-12-01 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법

Country Status (5)

Country Link
US (1) US7756715B2 (ko)
EP (1) EP1667112B1 (ko)
JP (1) JP5265853B2 (ko)
KR (1) KR100657916B1 (ko)
CN (2) CN101908340B (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100738077B1 (ko) 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
EP1989703A4 (en) * 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL
KR101418248B1 (ko) * 2007-04-12 2014-07-24 삼성전자주식회사 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP3723090B1 (en) 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CA2827482C (en) * 2011-02-18 2018-01-02 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
CN103548077B (zh) * 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013061530A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
WO2014081736A2 (en) * 2012-11-20 2014-05-30 Dts, Inc. Reconstruction of a high frequency range in low-bitrate audio coding using predictive pattern analysis
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0537395A (ja) * 1991-07-31 1993-02-12 Matsushita Electric Ind Co Ltd 帯域分割符号化方法
JP2000068856A (ja) 1998-08-24 2000-03-03 Hudson Soft Co Ltd 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
EP1233408A1 (en) 1994-08-10 2002-08-21 QUALCOMM Incorporated Method and apparatus for selecting an encoding rate in a variable rate vocoder
KR20040073281A (ko) * 2002-01-30 2004-08-19 마쯔시다덴기산교 가부시키가이샤 인코딩 장치, 디코딩 장치 및 그 방법

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3576941B2 (ja) * 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
ES2268112T3 (es) * 2001-11-14 2007-03-16 Matsushita Electric Industrial Co., Ltd. Codificacion y descodificacion de audio.
JP4272897B2 (ja) * 2002-01-30 2009-06-03 パナソニック株式会社 符号化装置、復号化装置およびその方法
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100524065B1 (ko) 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
JP2007507726A (ja) * 2003-09-29 2007-03-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の符号化
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0537395A (ja) * 1991-07-31 1993-02-12 Matsushita Electric Ind Co Ltd 帯域分割符号化方法
EP1233408A1 (en) 1994-08-10 2002-08-21 QUALCOMM Incorporated Method and apparatus for selecting an encoding rate in a variable rate vocoder
JP2000068856A (ja) 1998-08-24 2000-03-03 Hudson Soft Co Ltd 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
KR20040073281A (ko) * 2002-01-30 2004-08-19 마쯔시다덴기산교 가부시키가이샤 인코딩 장치, 디코딩 장치 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
1020040073281
1020040099742 - 657554

Also Published As

Publication number Publication date
CN1784020A (zh) 2006-06-07
CN1784020B (zh) 2010-11-24
JP2006163396A (ja) 2006-06-22
EP1667112A1 (en) 2006-06-07
CN101908340B (zh) 2012-07-04
US7756715B2 (en) 2010-07-13
CN101908340A (zh) 2010-12-08
EP1667112B1 (en) 2012-01-11
KR20060060928A (ko) 2006-06-07
US20060116871A1 (en) 2006-06-01
JP5265853B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
JP5265853B2 (ja) 処理装置、処理方法、記録媒体、符号化方法及び復号化方法
KR101251813B1 (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
CN1878001B (zh) 对音频数据编码及解码的设备及方法
KR100958144B1 (ko) 오디오 압축
KR101413968B1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
KR101395174B1 (ko) 압축 코딩 및 디코딩 방법, 코더, 디코더, 및 코딩 장치
KR100707177B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
US20080010062A1 (en) Adaptive encoding and decoding methods and apparatuses
US5432884A (en) Method and apparatus for decoding LPC-encoded speech using a median filter modification of LPC filter factors to compensate for transmission errors
WO2003063135A1 (en) Audio coding method and apparatus using harmonic extraction
KR100940531B1 (ko) 광대역 음성 신호 압축 및 복원 장치와 그 방법
JP2005512137A (ja) スペクトルの量子化を検出する方法
KR101381602B1 (ko) 계층적 부호화 및 복호화 방법 및 장치
US11176954B2 (en) Encoding and decoding of multichannel or stereo audio signals
RU2409874C9 (ru) Сжатие звуковых сигналов
KR100685974B1 (ko) 워터마크 삽입/검출을 위한 장치 및 방법
Bießmann et al. Estimating MP3PRO encoder parameters from decoded audio
KR102424897B1 (ko) 상이한 손실 은닉 도구들의 세트를 지원하는 오디오 디코더
Dutta et al. An improved method of speech compression using warped LPC and MLT-SPIHT algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141127

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee