KR101161866B1 - 오디오 코딩 장치 및 그 방법 - Google Patents

오디오 코딩 장치 및 그 방법 Download PDF

Info

Publication number
KR101161866B1
KR101161866B1 KR1020107012417A KR20107012417A KR101161866B1 KR 101161866 B1 KR101161866 B1 KR 101161866B1 KR 1020107012417 A KR1020107012417 A KR 1020107012417A KR 20107012417 A KR20107012417 A KR 20107012417A KR 101161866 B1 KR101161866 B1 KR 101161866B1
Authority
KR
South Korea
Prior art keywords
signal
high frequency
band
audio signal
bound
Prior art date
Application number
KR1020107012417A
Other languages
English (en)
Other versions
KR20100086032A (ko
Inventor
라쎄 라아크소넨
미코 탐미
안드리아나 바실라체
안씨 라모
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20100086032A publication Critical patent/KR20100086032A/ko
Application granted granted Critical
Publication of KR101161866B1 publication Critical patent/KR101161866B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 신호를 부호화하기 위한 장치가 제안된다. 장치는 오디오 신호의 적어도 한 특성을 결정하고; 그 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누어, 고주파 부분으로부터 오디오 신호의 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성한다. 장치는 또한 복수의 고주파 대역 신호들 각각에 대해 고주파 대역 신호를 나타낼 수 있는 저주파 부분의 적어도 일부를 결정한다.

Description

오디오 코딩 장치 및 그 방법{Audio coding apparatus and method thereof}
본 발명은 코딩에 관한 것으로, 특히 배타적이지 않은 것으로서 스피치 또는 오디오 코딩에 관한 것이다.
스피치나 음악 같은 오디오 신호들은 이를테면 그러한 오디오 신호들의 효율적 전송 또는 저장을 수행하기 위해 부호화된다.
오디오 인코더들과 디코더들이 음악 및 배경 잡음 같은 오디오 기반 신호들을 표현하는데 사용된다. 이러한 종류의 코더들은 보통 코딩 프로세스에 대해 스피치 모델을 이용하지 않고, 그보다 스피치를 포함한 모든 종류의 오디오 신호들을 표현하기 위한 프로세스들을 이용한다.
스피치 인코더들 및 디코더들 (코덱들)은 보통 스피치 신호들을 위해 최적화되고, 고정 또는 가변 비트 레이트에서 동작할 수 있다.
오디오 코덱이 가변 비트 레이트들에서 동작하도록 구성될 수도 있다. 낮은 비트 레이트에서, 그러한 오디오 코덱은 순수한 스피치 코덱에 해당하는 코딩 레이트로 스피치 신호들에 대해 작용할 것이다. 높은 비트 레이트에서, 오디오 코덱은 음악, 배경 잡음 및 스피치를 포함하는 임의의 신호를 보다 높은 품질과 성능으로 부호화할 수 있다.
어떤 오디오 코덱들에서는 입력 신호가 제한된 수의 대역들로 나눠진다. 대역 신호들 각각은 양자화될 수 있다. 음향심리학 (psychoacoustics)의 이론으로부터, 스펙트럼의 최상위 주파수들은 낮은 주파수들보다 인지적으로 덜 중요하다는 것이 알려져 있다. 일부 오디오 코덱들에서 이것은 고주파 신호들에 대해 저주파 신호들보다 적은 비트가 할당되는 비트 할당에 의해 반영되고 있다.
더구나 일부 코덱들은 저주파 및 고주파 대역들 간이나 오디오 신호 영역들 간 상관을 이용해 코덱들을 통한 코딩 효율을 향상시키도록 한다.
통상적으로, 스펙트럼의 상위 주파수 대역들은 보통 하위 주파수 대역들과 매우 유사하므로, 일부 코덱들은 보다 낮은 주파수 대역들만을 부호화한 후, 상위의 주파수 대역들을 스케일링된 (scaled) 하위 주파수 대역 사본 (copy)으로서 복제할 수 있다. 따라서 소량의 추가 제어 정보만을 사용함으로써 코덱의 총 비트 레이트의 상당한 절감이 이뤄질 수 있다.
고주파 영역을 부호화하기 위한 그러한 한 코덱은 고주파 영역 (HFR, high frequency region) 코딩이라고 알려져 있다. 고주파 영역 코딩의 한 형태가 스펙트럼 대역 복제 (SBR, spectral-band-relication)인데, 그것은 Coding Technologies에 의해 개발되었다. SBR에서, MPEG-4 (Moving Pictures Expert Group) AAC (Advanced Audio Coding) 같은 기존의 오디오 코더나 MPEG-1 레이어 III (MP3) 코더가 저주파 영역을 부호화한다. 고주파 영역은 그렇게 부호화된 저주파 영역을 이용해 개별적으로 만들어진다.
HFR 코딩에서, 고주파 영역은 저주파 영역을 상위 주파수대로 전치 (transposing)함으로써 얻어진다. 전치 (transposition)는 32 개의 대역을 가진 QMF (Quadrature Mirror Filters) 필터 뱅크에 기반하는 것으로, 어느 대역 샘플들로부터 각각의 고주파 대역 샘플이 구성되는지가 미리 정해지도록 수행된다. 이것은 입력 신호의 특성과는 무관하게 이뤄진다.
고주파 대역들은 추가 정보에 기초해 필터링 된다. 필터링은 합성된 고주파 영역의 특정한 특성을 오리지널 고주파 영역과 비슷하게 만들도록 행해진다. 정현파 (sinusoids)나 잡음 같은 추가 성분들이 고주파 영역에 더해져서 원래의 고주파 영역과의 유사도를 높인다. 최종적으로, 오리지널 고주파 스펙트럼의 포락선 (envelope)을 따르도록 포락선이 조정된다.
PCT 공개 출원 WO 2007/052088에서 고주파 대역을 여러 대역들로 분할 한 후, 부호화된 저주파 대역으로부터 각 고주파 대역과 유사한 한 대역을 선택하는 추가 HFR 코덱이 제안되었다.
구체적으로, 변형 이산 코사인 변환 (MDCT, Modified Discrete Cosine Transform) 도메인에서 작용하는 WO 2007/052088은 오리지널 신호의 고주파 영역을 Nb 개의 대역으로 분할하고, 부호화된 저주파 영역으로터의 최선의 맞춤 상대 (best-fit)가 전치를 위해 사용된다.
Nb 개의 대역들 각각에 대해, 가장 유사한 대역이 검색되고 그 인덱스 (또는 시작 주파수)가 전송되어, 디코더에서 고주파 대역을 생성하기 위해 상기 저주파 대역의 사용이 가능하도록 한다. 이 프로세스에서, 선택된 저주파 대역은 이제 두 스텝으로 스케일링 되어 오리지널 신호의 높은 진폭 피크들에 매치 되고 그 전체 에너지에 매치 된다.
저주파수대의 검색은, 단순히 저주파 영역을 고주파 영역으로 전치하는 이전 방법들에 비하면 일반적으로 오리지널 신호의 고주파수 대역에 대한 개선된 매치를 제공하지만, 스펙트럼 특성이 고주파 영역과 매우 다를 때 그러한 매치는 여전히 준최적의 것일 수 있다. 따라서, 저주파수 영역으로부터 그 대역에 대해 양호한 맞춤 상대 (fit)를 찾는 것이 어렵게 될 수 있다.
본 발명은 현재 제안된 코덱들이 하위 주파수 범위로부터 적절한 대역들을 선택할 수 있는 기능과 관련해 융통성이 부족하다는 생각으로부터 비롯된다.
본 발명의 실시예들은 상술한 문제점 극복을 목적으로 한다.
본 발명의 제1양태에 따라 오디오 신호를 부호화하기 위한 인코더가 제공되고, 상기 인코더는 오디오 신호의 적어도 한 특성을 결정하고; 그 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누어, 고주파 부분으로부터 오디오 신호의 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하고; 복수의 고주파 대역 신호들 각각에 대해 고주파 대역 신호를 나타낼 수 있는 저주파 부분의 적어도 일부를 결정하도록 구성된다.
상기 인코더는, 적어도 복수의 대역 할당치들 (allocations)을 저장하고; 오디오 신호의 적어도 한 특성에 예속된 복수의 대역 할당치들 중 한 대역 할당치를 선택하도록 추가 구성될 수 있고, 상기 인코더는 오디오 신호의 고주파 부분에 대해 상기 선택된 대역 할당치를 적용함으로써 상기 복수의 고주파 대역 신호들을 생성하도록 구성된다.
상기 인코더는, 오디오 신호의 적어도 한 특성에 예속된 대역 할당치를 생성하도록 추가 구성되고, 상기 인코더는 오디오 신호의 고주파 부분에 대해 상기 생성된 대역 할당치를 적용함으로써 복수의 고주파 대역 신호들을 생성하도록 구성된다.
각각의 대역 할당치는 복수의 대역들을 포함할 수 있다.
각각의 대역은 위치 (location) 주파수 및 대역폭; 그리고 시작 주파수 및 종료 주파수 가운데 적어도 하나를 포함할 수 있다.
복수의 대역들 중 적어도 한 대역은 복수의 대역들 중 적어도 한 다른 대역과 적어도 부분적으로 오버랩될 수 있다.
상기 인코더는 상기 생성된 고주파 대역 신호들에 예속된 대역 할당 신호를 생성하도록 추가 구성될 수 있다.
상기 인코더는, 오디오 신호의 저주파 부분에 예속된 저주파 부호화된 신호를 생성하고; 고주파 대역 신호를 나타낼 수 있는 상기 결정된 저주파 부분의 적어도 일부에 예속된 고주파 부호화된 신호를 생성하고; 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 출력하도록 추가 구성될 수 있다.
오디오 신호의 적어도 한 특성은, 오디오 신호의 고주파 부분으로부터만 결정된 특성을 포함할 수 있다.
오디오 신호의 적어도 한 특성은, 오디오 신호 성분들의 에너지; 오디오 신호 성분들의 최고점 (peak) 대 최저점 (valley)의 비; 및 오디오 신호의 대역폭을 포함할 수 있다.
본 발명의 제2양태에 따라 오디오 신호를 부호화하는 방법이 제안되며, 이 방법은, 오디오 신호의 적어도 한 특성 (characteristic)을 결정하는 단계; 그 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누고, 고주파 부분으로부터 오디오 신호의 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하는 단계; 복수의 고주파 대역 신호들 각각에 대해 고주파 대역 신호를 나타낼 수 있는 저주파 부분의 적어도 일부를 결정하는 단계를 포함한다.
상기 방법은, 적어도 복수의 대역 할당치들 (allocations)을 저장하는 단계; 오디오 신호의 적어도 한 특성에 예속된 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계를 더 포함할 수 있고, 상기 복수의 고주파 대역 신호들을 생성하는 단계는, 오디오 신호의 고주파 부분에 대해 상기 선택된 대역 할당치를 적용하는 단계를 포함할 수 있다.
상기 방법은, 오디오 신호의 적어도 한 특성에 예속된 대역 할당치를 생성하는 단계를 더 포함할 수 있고, 상기 복수의 고주파 대역 신호들을 생성하는 단계는 오디오 신호의 고주파 부분에 대해 상기 생성된 대역 할당치를 적용하는 단계를 포함할 수 있다.
각각의 대역 할당치는 복수의 대역들을 포함할 수 있다.
각각의 대역은 위치 (location) 주파수 및 대역폭; 그리고 시작 주파수 및 종료 주파수 가운데 적어도 하나를 포함함이 바람직하다.
복수의 대역들 중 적어도 한 대역은 복수의 대역들 중 적어도 한 다른 대역과 적어도 부분적으로 중복됨이 바람직하다.
상기 방법은, 상기 생성된 고주파 대역 신호들에 예속된 대역 할당 신호를 생성하는 단계를 더 포함할 수 있다.
상기 방법은, 오디오 신호의 저주파 부분에 예속된 저주파 부호화된 신호를 생성하는 단계; 고주파 대역 신호를 나타낼 수 있는 상기 결정된 저주파 부분의 적어도 일부에 예속된 고주파 부호화된 신호를 생성하는 단계; 및 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 출력하는 단계를 더 포함할 수 있다.
오디오 신호의 적어도 한 특성은, 오디오 신호의 고주파 부분으로부터만 결정된 특성을 포함함이 바람직하다.
오디오 신호의 적어도 한 특성은, 오디오 신호 성분들의 에너지; 오디오 신호 성분들의 최고점 (peak) 대 최저점 (valley)의 비; 및 오디오 신호의 대역폭을 포함함이 바람직하다.
본 발명의 제3양태에 따라 오디오 신호를 복호하는 디코더가 제안되고, 이 디코더는, 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하고; 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하고; 합성 고주파 신호를 생성하도록 구성되고, 대역 할당 신호에 예속된 합성 고주파 신호의 적어도 한 부분은 고주파 신호의 적어도 일부에 예속되는 합성 저주파 신호의 적어도 일부로부터 생성된다.
상기 디코더는, 합성 저주파 신호와 합성 고주파 신호를 결합하여 복호된 오디오 신호를 생성하도록 추가 구성될 수 있다.
상기 디코더는, 적어도 복수의 대역 할당치들을 저장하고, 대역 할당 신호에 예속된 복수의 대역 할당치들 중 한 대역 할당치를 선택하도록 추가 구성될 수 있다.
상기 디코더는, 대역 할당 신호에 예속된 대역 할당치를 생성하도록 추가 구성될 수 있다.
각각의 대역 할당치는 복수의 대역들을 포함할 수 있다.
각각의 대역은 위치 주파수 및 대역폭; 그리고 시작 주파수 및 종료 주파수 중 적어도 한 가지를 포함할 수 있다.
본 발명의 제4양태에 따라 오디오 신호를 복호하는 방법이 제안되고, 이 방법은 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하는 단계; 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하고; 합성 고주파 신호를 생성하는 단계로서, 대역 할당 신호에 예속된 합성 고주파 신호의 적어도 한 부분은 고주파 신호의 적어도 일부에 예속되는 합성 저주파 신호의 적어도 일부로부터 생성되는 단계를 포함한다.
상기 방법은, 합성 저주파 신호와 합성 고주파 신호를 결합하여 복호된 오디오 신호를 생성하는 단계를 더 포함할 수 있다.
상기 방법은, 적어도 복수의 대역 할당치들을 저장하는 단계; 및 대역 할당 신호에 예속된 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계를 더 포함할 수 있다.
상기 방법은, 대역 할당 신호에 예속된 대역 할당치를 생성하는 단계를 더 포함할 수 있다.
각각의 대역 할당치는 복수의 대역들을 포함할 수 있다.
각각의 대역은 위치 주파수 및 대역폭; 그리고 시작 주파수 및 종료 주파수 중 적어도 한 가지를 포함할 수 있다.
본 발명의 제5양태에 따라 상술한 것과 같은 인코더를 구비한 장치가 제안된다.
본 발명의 제6양태에 따라 상술한 것과 같은 디코더를 구비한 장치가 제안된다.
본 발명의 제7양태에 따라 상술한 바와 같은 인코더를 구비한 전자 기기가 제안된다.
본 발명의 제8양태에 따라 상술한 바와 같은 디코더를 구비한 전자 기기가 제안된다.
본 발명이 제9양태에 따라 오디오 신호를 부호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되며, 상기 방법은 오디오 신호의 적어도 한 특성 (characteristic)을 결정하는 단계; 그 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누고, 고주파 부분으로부터 오디오 신호의 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하는 단계; 복수의 고주파 대역 신호들 각각에 대해 고주파 대역 신호를 나타낼 수 있는 저주파 부분의 적어도 일부를 결정하는 단계를 포함한다.
본 발명의 제10양태에 따라 오디오 신호를 복호하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되며, 상기 방법은 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하는 단계; 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하고; 합성 고주파 신호를 생성하는 단계로서, 대역 할당 신호에 예속된 합성 고주파 신호의 적어도 한 부분은 고주파 신호의 적어도 일부에 예속되는 합성 저주파 신호의 적어도 일부로부터 생성되는 단계를 포함한다.
본 발명의 제11양태에 따라 오디오 신호를 부호화하는 인코더가 제안되고, 상기 인코더는 오디오 신호의 적어도 한 특성을 결정하기 위한 결정 수단; 그 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누기 위한 필터링 수단과, 고주파 부분으로부터 오디오 신호의 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하기 위한 프로세싱 수단; 및 복수의 고주파 대역 신호들 각각에 대해 고주파 대역 신호를 나타낼 수 있는 저주파 부분의 적어도 일부를 결정하기 위한 추가 결정 수단을 포함한다.
본 발명의 제12양태에 따라 오디오 신호를 복호하는 디코더가 제안되고, 이 디코더는, 저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하기 위한 수신 수단; 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하기 위한 결정 수단; 합성 고주파 신호를 생성하기 위한 프로세싱 수단을 포함하고, 상기 대역 할당 신호에 예속된 합성 고주파 신호의 적어도 한 부분은 고주파 신호의 적어도 일부에 예속되는 합성 저주파 신호의 적어도 일부로부터 생성된다.
본 발명을 더 잘 이해하기 위해 지금부터 예로서 첨부된 도면을 참조할 것이다.
도 1은 본 발명의 실시예들을 이용하는 전자 기기를 개략적으로 도시한 것이다.
도 2는 본 발명의 실시예들을 이용하는 오디오 코덱 시스템을 개략적으로 도시한 것이다.
도 3은 도 2에 도시된 오디오 코덱 시스템의 인코더 부분을 개략적으로 도시한 것이다.
도 4는 도 2에 도시된 오디오 코덱 시스템의 디코더 부분을 개략적으로 도시한 것이다.
도 5는 오디오 신호 스펙트럼의 예를 보인다.
도 6은 본 발명의 실시예들에 사용되는 것 같은 주파수 대역들의 예를 가지고 도 5의 오디오 신호 스펙트럼의 일부를 보인 것이다.
도 7은 본 발명에 따라 도 3에 도시된 것과 같은 오디오 인코더 실시예의 동작을 예시한 흐름도를 보인다.
도 8은 본 발명에 따라 도 3에 도시된 것과 같은 오디오 디코더 실시예의 동작을 예시한 흐름도를 보인다.
이하에서는 계층화되거나 스케일러블한 (scalable) 가변 레이트 오디오 코덱들의 제공을 위해 가능한 코덱 메커니즘들을 상세히 설명할 것이다. 이와 관련해 본 발명의 일 실시예에 따른 코덱을 포함할 수 있는 전형적 전자 기기(10)의 개략적 블록도인 도 1을 우선 참조할 것이다.
전자 기기(10)는 예를 들어, 무선 통신 시스템의 모바일 단말이나 사용자 기기일 수 있다.
전자 기기(10)는 마이크로폰(11)을 구비하는데, 이것은 아날로그-디지털 컨버터(14)를 통해 프로세서(21)와 링크된다. 프로세서(21)는 디지털-아날로그 컨버터(32)를 통해 확성기들(33)과도 링크된다. 프로세서(21)는 트랜시버 (TX/RX)(13)에도, 사용자 인터페이스 (UI)(15)에도, 그리고 메모리(22)에도 링크된다.
프로세서(21)는 다양한 프로그램 코드들을 실행하도록 구성될 수 있다. 구현되는 프로그램 코드들은 오디오 신호의 저주파 대역 및 오디오 신호의 고주파 대역을 부호화하기 위한 오디오 부호화 코드를 포함한다. 구현되는 프로그램 코드들(23)은 오디오 복화화 코드 또한 포함한다. 구현되는 프로그램 코드들(23)은 필요할 때마다 프로세서(21)에 의해 검색되도록 메모리(22) 등에 저장될 수 있다. 메모리(22)는 본 발명에 따라 부호화되었던 데이터와 같은 데이터를 저장하는 섹션(24)을 더 제공할 수 있을 것이다.
부호화 및 복호 코드는 본 발명의 실시예들에 있어 하드웨어나 펌웨어를 통해 구현될 것이다.
사용자 인터페이스(15)는 사용자가 가령 키패드를 통해 전자 기기(10)로 명령들을 입력할 수 있고/있거나 디스플레이 등을 통해 전자 기기(10)로부터 정보를 얻을 수 있게 한다. 트랜시버(13)는 무선 통신 네트워크 등을 통해 다른 전자 기기들과 통신할 수 있게 한다.
다시 한번, 전자 기기(10)의 구조는 여러 방법으로 보완 및 변경될 수 있다는 것을 알아야 한다.
전자 기기(10)의 사용자는 스피치를 입력하기 위해 마이크로폰(11)을 사용할 수 있고, 스피치는 어떤 다른 전자 기기로 전송되거나 메모리(22)의 데이터 섹션(24)에 저장될 것이다. 해당 애플리케이션이 이러한 목적으로 사용자 인터페이스(15)를 통해 사용자에 의해 작동되었을 수 있다. 이 애플리케이션은 프로세서(21)에 의해 구동될 수 있는 것으로, 프로세서(21)로 하여금 메모리(22)에 저장된 부호화 코드를 실행시키게 한다.
아날로그-디지털 변환기(14)는 입력된 아날로그 오디오 신호를 디지털 오디오 신호로 변환하고, 그 디지털 오디오 신호를 프로세서(21)로 제공한다.
그러면 프로세서(21)가 도 2 및 3을 참조해 설명하는 것과 같은 방법으로 그 디지털 오디오 신호를 처리할 수 있다.
그 결과에 따른 비트 스트림이 트랜시버(13)로 주어져서 다른 전자 기기로 전송되게 된다. 이와 달리, 코딩된 데이터는 예를 들어 같은 전자 기기(10)에 의해 나중에 전송되거나 나중에 제공되기 위해 이를테면 메모리(22)의 데이터 섹션(24)에 저장될 수도 있다.
전자 기기(10)는 자신의 트랜시버(13)를 통해 다른 전자 기기로부터 상응하게 부호화된 데이터를 포함하는 비트 스트림을 또한 수신할 수도 있을 것이다. 이 경우, 프로세서(21)는 메모리(22)에 저장된 복호 프로그램 코드를 실행할 수 있다. 프로세서(21)는 수신된 데이터를 복호하고, 그 복호된 데이터를 디지털-아날로그 컨버터(32)로 제공한다. 디지털-아날로그 컨버터(32)는 디지털 복호된 데이터를 아날로그 오디오 데이터로 변환하여 그들을 확성기들(33)을 거쳐 출력시킨다. 복호 프로그램 코드의 실행 역시, 사용자 인터페이스(15)를 통해 사용자가 호출했던 애플리케이션에 의해 시작될 수 있다.
수신된 부호화된 데이터도 확성기들(33)을 통한 즉각적 제공 대신에, 가령 나중에 제공하거나 또 다른 전자 기기로 포워딩할 수 있도록 메모리(22)의 데이터 섹션(24)에 저장될 수 있다.
도 2 내지 4에 도시된 개략적 구조들 및 도 7과 8의 방법의 단계들은, 도 1에 도시된 전자 기기에서 구현된다고 예로써 도시된 완전한 오디오 코덱의 동작 중 일부만을 나타낸 것임을 예상할 수 있을 것이다.
본 발명의 실시예들에 의해 사용되는 오디오 코덱들의 일반적인 동작이 도 2에 도시된다. 일반적인 오디오 부호화/복호 시스템들은 도 2에 개략적으로 도시된 것 같은 인코더 및 디코더로 이뤄진다. 인코더(104), 저장부 또는 미디어 채널(106) 및 디코더(108)를 갖춘 시스템(102)이 도시되어 있다.
인코더(104)는 입력 오디오 신호(110)를 압축하여 미디어 채널(106)을 통해 전송되거나 저장되는 비트 스트림(112)을 생성한다. 비트 스트림(112)은 디코더(108) 안에서 수신될 수 있다. 디코더(108)는 비트 스트림(112)을 압축해제하여 출력 오디오 신호(114)를 생성한다. 비트 스트림(112)의 비트 레이트 및 입력 신호(110) 관련 출력 오디오 신호(114)의 품질이 코딩 시스템(102)의 성능을 규정하는 주요 특징들이다.
도 3은 본 발명의 일 실시예에 따른 인코더(104)를 개략적으로 도시한 것이다. 인코더(104)는 오디오 신호를 수신하도록 구성된 입력부(203)를 구비한다. 입력부(203)는 로 패스 필터(230), 고주파 영역 (HFR) 프로세서(232) 및 신호 에너지 산정기(201)에 연결된다. 로 패스 필터(230)는 신호를 저주파 코더 (코어 코덱(core codec)이라고도 알려져 있음)(231)로 출력한다. 저주파 코더(231) 및 신호 에너지 산정기는 HFR 프로세서(232)로 신호들을 출력하도록 추가 구성된다. 저주파 코더(231), 신호 에너지 산정기(201) 및 HFR 프로세서(232)는 비트스트림 포매터 (formatter)(234) (본 발명의 어떤 실시예들에서 비트스트림 멀티플렉서로도 알려짐)로 신호들을 출력한다. 비트스트림 포매터(234)는 출력(205)을 통해 출력 비트스트림(112)을 출력하도록 구성된다.
이러한 구성요소들의 동작은 코더(104)의 동작을 보이는 흐름도를 참조해 더 상세히 기술될 것이다.
오디오 신호가 코더(104)에 의해 수신된다. 본 발명의 제1실시예에서 오디오 신호는 디지털 방식으로 샘플링된 신호이다. 본 발명의 다른 실시예들에서 오디오 입력은 마이크로폰(6) 등으로부터의 아날로그 오디오 신호일 수 있고, 이것이 아날로그-디지털 (A/D) 변환된다. 본 발명의 또 다른 실시예들에서 오디오 입력은 펄스 코드 변조 디지털 신호에서 진폭 변조 디지털 신호로 변환된다. 오디오 신호의 수신은 도 7의 601 단계에서 보이고 있다.
로 패스 필터(230)는 오디오 신호를 수신하고 입력 신호(110)가 필터링 되는 컷오프 주파수를 규정한다. 6a. 컷오프 주파수(36) 아래에 있는 수신된 오디오 신호 주파수들은 필터를 통과하여 저주파 코더(231)로 전달된다. 본 발명의 어떤 실시예들에서 신호는 저주파 코더(231)의 부호화 효율을 추가로 개선하기 위한 옵션으로서 다운 샘플링된다. 이러한 필터링이 도 7에 보여진다.
저주파 코더(231)는 저주파 (그리고 옵션으로서 다운 샘플링된) 오디오 신호를 수신하고 그 신호에 대해 알맞은 저주파수 코딩을 적용한다. 본 발명의 제1실시예에서, 저주파 코더(231)는 양자화 및 32 개의 저주파 서브 대역들을 가진 허프만 (Huffman) 코딩을 적용한다. 입력 신호(110)는 분석 (analysis) 필터 뱅크 구조를 이용해 서브 대역들로 나눠진다. 각각의 서브 대역은 음향심리학적 모델에 의해 주어진 정보를 활용해 양자화 및 부호화될 수 있다. 양자화 설정 및 코딩 계획은 적용된 음향심리학적 모델에 의해 지시를 받을 수 있다. 양자화되고 부호화된 정보는 비트 스트림(12) 생성을 위해 비트 스트림 포매터(234)로 보내진다.
또, 저주파 코더(231)는 직교 미러 필터들 (QMF, quadrature mirror filters)의 뱅크를 사용해 저주파 콘텐츠를 변환하여 각 서브 대역의 주파수 도메인 실현물들 (realizations)을 도출한다. 이러한 주파수 도메인 실현물들은 HFR 프로세서(232)로 전달된다.
이러한 저주파수 코딩이 도 7의 606 단계에 도시되고 있다.
본 발명의 다른 실시예들에서는 비트스트림 포매터포매터 출력되는 코어 (core) 코딩 출력을 생성하기 위해 다른 저주파 코덱들이 사용될 수 있다. 이러한 저주파 코덱들의 다른 실시예들의 예들에는 비한정적인 예들로서 AAC (advanced audio coding), MP3 (MPEG layer 3), ITU-T EV-VBR (Embedded variable rate) 스피치 코딩 베이스라인 코덱, 및 ITU-T G.729.1가 포함된다.
저주파 코더가 비트스트림 출력의 일부로서 한 주파수 도메인 서브 대역을 효과적으로 출력하지 못할 경우, 저주파 코더(231)는 저주파 디코더 및 주파수 도메인 변환기 (도 3에 도시되지 않음)를 더 포함해, 저주파 신호의 합성 (synthetic) 복제품을 생성하도록 할 수 있고, 그런 다음 저주파 신호의 합성 복제품이 주파수 도메인으로 변환되고, 필요하면, HFR 프로세서(232)로 전송되는 일련의 저주파 서브 대역들로 분할된다.
이것은 가능한 광범위한 코더/디코더들로부터 저주파 코더의 선택을 가능하게 하고, 그로써 본 발명은 출력의 일부로서 주파수 도메인 정보를 생성하는 특정 저주파 또는 코어 코더 알고리즘들에 국한되지 않게 된다.
오디오 신호는 에너지 산정기(201)에 의해서도 수신된다. 본 발명의 제1실시예에서, 에너지 산정기(201)는 로 패스 필터(605)에서 통과되지 않은 주파수 성분들을 통과시키는 하이 패스 필터 (도시되지 않음)를 구비한다.
이제 고주파 오디오 신호가 주파수 도메인으로 변환된다. 고주파 오디오 신호 (신호의 고주파 영역)는 다시 짧은 서브 대역들로 분할될 수 있다. 이 서브 대역들은 대략 500-800 Hz 범위 안에 있다. 바람직한 실시예에서, 서브 대역 대역폭은 750 Hz이다. 본 발명의 다른 실시예에서, 서브 대역들의 대역폭은 사용된 대역폭 할당치에 좌우된다. 본 발명의 제1실시예에서 서브 대역 대역폭은 고정된 폭에 해당한다-달리 말해 각각의 서브 대역은 동일한 폭을 가진다. 본 발명의 다른 실시예들에서 서브 대역 대역폭은 일정하지 않고 각각의 서브 대역이 상이한 대역폭을 가질 수 있다. 본 발명의 일부 실시예들에서 이러한 가변적인 서브 대역 대역폭 할당치는 오디오 신호의 음향심리학적 모델링에 기초해 결정될 수 있다. 이러한 서브 대역들은 다시 본 발명의 다양한 실시예들에서 연속적인 것일 수 있다 (즉, 하나 다음에 하나가 차례로 오게 되어 연속 스펙트럼 실현물을 생성함).
이제 에너지 산정기(201)가 서브 대역들 각각에 대한 서브 대역 에너지를 결정한다.
본 발명의 어떤 실시예들에서, 고주파 영역의 다른, 혹은 추가적 특성들이 결정된다. 다른 특성들에는 비한정적 예들로서 각 서브 대역의 최고점-대-최저점 (peak-to-valley) 에너지 비율 및 신호 대역폭이 포함된다.
그러면 고주파 영역들의 이런 특성들이 에너지 산정기(201)에서 추가 활용된다.
오디오 신호의 이러한 분석이 도 7의 603 단계에서 보인다.
본 발명의 어떤 실시예들에서, 에너지 산정기 안에서의 오디오 신호 분석은 부호화된 저주파 영역의 분석 및 오리지널 고주파 영역의 분석을 포함한다. 그에 따라 본 발명의 추가 실시예들에서 에너지 산정기는, 부호화된 저주파 신호를 수신하고 그들을 짧은 서브 대역들로 분할해 가령 '전체' 스펙트럼 서브 대역 당 에너지 및/또는 각가의 '전체' 스펙트럼 서브 대역의 최고점-대-최저점 에너지 비율을 판단하도록 분석되게 함으로써, 효율적인 총 스펙트럼의 특성들을 판단한다.
본 발명의 또 다른 실시예들에서, 에너지 산정기는 부호화된 저주파 신호를 더 수신하고 (필요한 경우) 이들을 짧은 서브 대역들로 나누어 분석되도록 한다. 인코더로부터의 저주파 도메인 신호 출력이 이제, 가령 저주파 도메인 서브 대역 당 에너지 및/또는 각각의 저주파 도메인 서브 대역의 최고점-대-최저점 에너지 비율을 판단하기 위해, 고주파 도메인 신호와 비슷한 방식으로 분석된다.
에너지 산정기(201)는 판단된 고주파 영역의 특성들을 검증하는 결정 로직을 사용해 고주파 영역을 특정 대역들로 구획할 수 있다. 따라서 짧은 서브 대역 에너지 산정에 기초해, 대역들의 수와 길이가 선택될 수 있다. 따라서, 예를 들면, 에너지 산정 결정 로직(201)은 짧지만 두드러진 에너지 최고점의 위치를 확인할 수 있고, 위치 확인된 에너지 최고점이 하나의 대역 안에 포함되도록 대역 길이를 선택할 수 있다. 대역 할당치 (대역들의 개수, 대역 길이, 양자화를 위한 비트 할당)는 본 발명의 실시예들에서 미리 정해진다.
본 발명의 실시예들에서, 서브 대역들의 경계들 중 일부가 실제 대역들에 있어서와 동일하도록 서브 대역들이 선택된다. 그런 다음 각각의 영역에서 에너지가 어떻게 작용할지가, 가령 서브 대역에서 서브 까지의 에너지 비율들을 산출함으로써 주시될 수 있다. 또한, 본 발명의 실시예들에 따르면 (가능하다면) 가장 중요한 영역을 판단하기 위해 가장 높은 에너지를 가진 서브 대역을 선택하는 것도 가능하다. 따라서, 본 발명의 실시예들은 대역 경계들에서의 그러한 변화들 (위치 및 폭)을 반영할 뿐 아니라 양자화를 위해 충분한 비트들을 할당하는 대역들을 선택한다.
예를 들어 어떤 서브 대역들이나 보다 큰 영역들이 매우 적은 에너지를 가질 때, 본 발명의 실시예들은 가령 그 영역 안에서 양자화를 위해 낮은 비트 할당이 된 넓은 대역들을 이용하는 할당치를 선택할 수 있다.
예를 들어 대역 할당치들이 본 발명의 실시예에서 다음과 같은 경우,
1) 7-8 kHz, 8-10 kHz, 10-12 kHz, 12-14 kHz 및
2) 7-8.5 kHz, 8.5-10 kHz, 10-12 kHz, 12-14 kHz,
그리고 서브 대역들이 500 Hz의 대역폭을 가지고, 50% 정도 오버랩되면, 가령 최초 세 개의 서브 대역들은 7-7.5 kHz, 7.25-7.75 kHz, 그리고 7.5-8 kHz일 수 있다.
이 예에서 서브 대역들은 7-9 kHz 영역에서 상대 에너지 (relative energy) 100, 90, 70, 95, 85, 80, 70을 가지며 9 kHz 밖에서는 그보다 낮은 어떤 에너지들을 가진다. 신호 에너지는 7 kHz부터 약 7.75 kHz에 이르기까지는 하강하고, 그런 다음 7.75 kHz에서 약 8.25 kHz에 이르기까지는 상승한다 (한편 약 8.25 kHz 이후부터는 다시 하강한다).
본 발명의 실시예들에서, 이러한 정보를 이용하여 결정 로직은 이제 7.75-8.25 kHz 사이에 중요한 에너지 최고점이 존재한다고 (그리고 7-7.5 kHz 사이에서는 훨씬 더 큰 에너지 최고점이 존재한다고) 결론 내릴 수 있다. 예로 든 실시예에서, 결정 로직을 간단히 하기 위해 대역 할당치 1)과 2) 둘 모두 같은 비트 할당치를 가지는 경우, 결정 로직은, 대역 할당치 2)를 사용하는 것이 뒤의 HFR 프로세서로 하여금 동일한 대역에서 7.75-8.75 kHz 사이의 최고점을 유지할 수 있게 한다고 판단하도록 구성되고, 그에 따라 두 대역들 간 높은 에너지 최고점/영역 중에서 불연속 점을 강제하지 않는다.
또, 어떤 실시예들에서는 보다 큰 영역의 중요도를 평가하기 위해-가령 오리지널 신호의 대역폭에 대한 평가치를 결정하기 위해, 오버랩되지 않는 서브 대역들의 수가 선택될 수 있다.
어떤 실시예들에서, 에너지 산정 결정 로직(201)은 짧은 서브 대역들이나 서브 대역들의 그룹들 간 에너지 비를 이용해 대역들의 수와 각각의 대역 길이를 선택하도록 한다.
대역 수와 길이를 선택함에 있어 에너지 산정 결정 로직(201)의 유연성 (flexibility)은 대역 선택에 할당된 비트 레이트 및 에너지 산정 결정 로직(201)에 할당된 프로세싱 전력량에 역시 좌우된다.
또 다른 예가 도 5 및 6과 관련해 보여지는데, 여기서 결정 로직은 오디오 신호의 각 프레임에 대해 네 후보 대역 선택사항들 가운데 하나를 선택한다.
도 5와 관련해 통상적 오디오 신호의 단일 프레임에 대한 그 오디오 신호의 주파수 도메인 표현(401)의 예가 도시된다. 이 예에서, 신호의 전체 스펙트럼은 0에서 14 kHz까지 로그 변형된 이산 코사인 변환 값들로서 표현된다. 당업자라면 알 수 있듯이, 주파수 도메인 표현은 여기 기술된 MDCT 값들 이외에 다른 주파수 계수 값들로도 정해질 수 있다. 이 특정 예와 관련해 저주파 영역은 0에서 7 kH까지의 주파수 성분들을 나타내고, 고주파 영역은 7 kHz에서 14 kHz까지의 주파수 성분들을 나타낸다.
도 6에 대해서는, 도 5의 고주파 영역이 네 개의 가능한 대역 선택사항들 (503, 505, 507, 509)와 함께 MDCT 절대값(501)으로 보여지고 있다.
첫째 후보 대역 선택사항(503)은 7 kHz부터 8 kH까지의 주파수 성분들을 나타내는 대역 1, 8 kHz부터 대략 9.75 kH까지의 주파수 성분들을 나타내는 대역 2, 대략 9.75 kHz부터 11.5 kH까지의 주파수 성분들을 나타내는 대역 3, 그리고 11.5 kHz부터 14 kH까지의 주파수 성분들을 나타내는 대역 4의 네 대역들을 포함한다.
둘째 후보 대역 선택사항(505)은 7 kHz부터 8 kH까지의 주파수 성분들을 나타내는 대역 1, 8 kHz부터 대략 10 kH까지의 주파수 성분들을 나타내는 대역 2, 대략 10 kHz부터 12 kH까지의 주파수 성분들을 나타내는 대역 3, 그리고 12 kHz부터 14 kH까지의 주파수 성분들을 나타내는 대역 4의 네 대역들을 포함한다.
셋째 후보 대역 선택사항(507)은 7 kHz부터 8 kH까지의 주파수 성분들을 나타내는 대역 1, 8 kHz부터 9.5 kH까지의 주파수 성분들을 나타내는 대역 2, 9.5 kHz부터 11 kH까지의 주파수 성분들을 나타내는 대역 3, 그리고 11 kHz부터 14 kH까지의 주파수 성분들을 나타내는 대역 4의 네 대역들을 포함한다.
넷째 후보 대역 선택사항(509)은 7 kHz부터 8 kH까지의 주파수 성분들을 나타내는 대역 1, 8 kHz부터 9 kH까지의 주파수 성분들을 나타내는 대역 2, 대략 9 kHz부터 10 kH까지의 주파수 성분들을 나타내는 대역 3, 10 kHz부터 11.5 kH까지의 주파수 성분들을 나타내는 대역 4, 및 11.5 khz부터 14 kHz까지의 주파수 성분들을 나타내는 대역 5의 다섯 대역들을 포함한다.
이 예와 관련해, 에너지 산정 검출 로직(201)은 8 kHz에서 9.5 kHz까지의 주파수 성분들을 나타내는 서브 대역들 안에서 중요한 활동이 있는 반면, 7 kHz에서 8 kHz와 9.5 kHz에서 11 kHz까지의 주파수 성분들을 나타내는 서브 대역들에서는 별로 중요하지 않은 활동이 없다는 것을 검출할 수 있다. 그런 다음 에너지 산정 검출 로직은 셋째 대역 선택사항 후보(507)를 선택할 수 있는데 그것이 중요한 활동 영역을 나타내는 분명한 대역 2를 포함하기 때문이다.
이 실시예는 네 후보 대역 할당치들 중 어느 것이 선택되는지를 부호화하는데 프레임 당 2 비트만을 필요로 한다.
신호 대역폭에 대한 정보가 알려져 있을 때, 미리 정해진 리스트에는, 기존의, 혹은 정해진 바람직한 대역/비트 할당치들을 반영하는, 고주파 영역의 대역 분할에 대해 규정된 대역 할당치들이 포함될 수 있다.
달리 말해, 대역 할당치들 중 하나 이상은 양자화에 대해 다른 비트 할당치를 포함할 수도 있고, 이용가능한 비트들은 이제 에너지가 별로 없는 고주파 영역의 보다 낮은 부분, 즉 10이나 12 kHz 부분을 양자화하는데 주로 사용될 수 있다. 그러나, 고주파 영역 전반에 걸쳐 에너지가 고르게 분포하거나 에너지가 하위 주파수대에서보다 상위 주파수대에서 더 많을 때, 선택된 후보들은 보통 동일한 대역 길이를 가지며 양자화를 위해 이용가능한 비트 레이트는 대역들 사이에서 훨씬 고르게 할당된다.
위의 예들은 에너지 산정 선택 로직이 네 개의 가능한 후보들로부터 하나를 선택할 수 있는 경우를 보이고 있지만, 본 발명의 다른 실시예들에서 에너지 산정 선택 로직(201)은 임의 개의 '고정'되거나 미리 정해진 대역 할당 후보들로부터 한 대역 할당치를 선택할 수 있을 것이다. 미리 정해진 대역 할당 후보들은 리스트로 조직될 수 있다. 또, 상기 예들은 대역 할당 후보 당 네 개나 다섯 개의 대역들만을 보이고 있지만, 각각의 후보는 어떠한 개수의 대역들이든 포함할 수 있고 네 개나 다섯 개의 대역들에만 국한되지는 않을 것이다.
이렇게 미리 정해진 대역 할당 후보들은 본 발명의 어떤 실시예들에서 영구적 할당 후보들일 수 있다, 다시 말해 리스트들이 읽기 전용 메모리 등의 어떤 영구적인거나 반영구적인 메모리 저장부에 저장된다.
본 발명의 일부 실시예들에서 그러한 할당 후보들은 중앙 업데이트 프로세스에 의해, 이를테면 오퍼레이터가 본 발명에 따른 오디오 코덱을 운영하는 통신 기기들로 업데이트 프로세스를 명령함으로써 업데이트 될 수 있다. 다른 실시예들에서, 본 발명에 따른 오디오 코덱을 운영하는 기기들이 후보 대역 할당 리스트 자체의 업데이터를 일으킬 수도 있다. 이렇게 업데이트 가능한 후보 대역 할당치들이 재기록 가능 (re-writable) 메모리 저장부-가령, 전자적으로 프로그래밍 가능한 메모리에 저장될 수 있다.
또, 본 발명의 일부 실시예들에서 에너지 산정 결정 로직(201)은 정해진 스펙트럼 특성에 예속되는 대역 할당치를 생성하도록 (여러 후보 대역 할당치들로부터 하나를 선택하는 것이 아니라) 구성될 수 있다.
일 실시예에서, 결정 로직은 대역 할당치들, 그리고 또 오리지널 신호의 대역폭 및/또는 오리지널 고주파 영역의 하위 및 상위 주파수대에서의 에너지 레벨들 간 차 (difference)에 예속되는 비트 할당치들을 생성할 수 있다.
실제로는, 프레임당 2 내지 4 비트의 선택 비트 할당을 반영하는 4 내지 16 개의 서로 다른 조합들이 일반적으로 선호된다. 3 및 4 비트 선택 할당치의 사용이, 고주파 영역의 하위 부분에서 정밀하게 배치될 수 있는 매우 짧은 대역들을 선택하는데 더 많은 자유를 줄 수 있다. 예를 들어, 4-비트 선택 할당의 경우 도 5 및 6에 도시된 예와 관련해 표시된 것에 대해 추가 12개의 대역들이 사용되어, 인지적으로 보다 중요하고 또 스피치 신호들에서 보다 일반적인 주파수대를 커버 하기 위해 7 및 9.5 kHz 사이의 영역에 있는 12 개의 미리 정해진 오버랩된 위치들 (가령, 200-Hz 스텝으로) 중 하나에 300-Hz 대역을 배치하도록 할 수 있다.
따라서 300 Hz 대역이 어느 한 쪽의 추가 (extra) 대역이거나, 단순히 그러한 보다 짧은 대역을 쉽게 얻기 위해 다른 대역들의 길이들이 조정될 수도 있을 것이다.
에너지 산정 결정 로직(201) 대역 선택이 도 7에서 607 단계에 보인다.
그런 다음 에너지 산정 결정 로직(201)은 HFR 프로세서(232)로 정보를 보내고, HFR 프로세서는 이 선택되거나 생성된 대역 할당치들이 코더(104)에서 사용될 수 있게 한다.
대역 선택에 대한 이러한 표시가 남은 고주파 영역에 대한 제어 동작을 효과적으로 수행시키며 이것이 도 7의 609 단계에 보인다.
HFR 프로세서(232)는 본 발명의 일 실시예에서 HFR 코딩, 전치되고 (transposed) 스케일링 되어 고주파 스펙트럼 값들의 하용가능한 복제본들을 형성할 수 있는 저주파 스펙트럼 값들의 선택을 수행할 수 있다. 따라서 WO 2007/052088에 자세히 기술된 것 같은 방법에 사용될 대역들의 개수와 폭이 위의 프로세서에 의해 선택된다. 그러나, 본 발명이 대역 선택을 포함하는 다른 고주파 영역 코딩 프로세스들에도 적용될 수 있다는 것을 알 수 있을 것이다. HFR 프로세서(232)는 본 발명의 일부 실시예들에서 신호의 재구성을 지원할 수 있는 포락선 (envelope) 프로세싱 역시 수행할 수 있다.
따라서 HFR 프로세서(232)는 비트스트림 포매터(234)로 출력되는 비트스트림 출력을 생성하고, 비트스트림 포매터는 적절한 HFR 디코더로 하여금 저주파 코더 출력으로부터 상기 방식에 의해 선택된 고주파 대역들의 복제본을 재구성할 수 있게 한다.
복제 프로세스를 행할 비트스트림을 도출하는 고주파 영역 코딩 프로세스가 도 7의 611 단계에 보인다.
에너지 산정 결정 로직(201) 출력은 또한 비트스트림 포매터(234)로 전달된다. 이것이 도 7의 613 단계에 보인다.
비트스트림 포매터(234)가 저주파 코더(231) 출력, 고주파 영역 프로세서(232) 출력 및 에너지 산정 결정 로직(201)으로부터의 선택 출력을 수신하고, 비트스트림을 포맷해 비트스트림 출력을 생성한다. 본 발명의 일부 실시예들에서 비트스트림 포매터(234)는 수신된 입력들을 인터리브 (interleave) 할 수 있고, 비트스트림 출력(112)에 삽입될 에러 검출 및 에러 정정 코드들을 생성할 수 있다.
본 발명의 일부 실시예들에서 HFR 프로세서(232)는 저주파 코더(231)로부터의 합성 저주파 도메인 신호 대신 오리지널 저주파 도메인 신호를 수신한다. 이러한 실시예들에서는 저주파 코더(231)가 저주파 도메인 신호를 부호화하고 그런 다음 복호하여 HFR 프로세서(232)를 위한 합성 저주파 도메인 신호를 생성하도록 구성될 필요가 없기 때문에 인코더 장치를 단순화시키는 것이 가능하게 된다.
또한 일부 실시예들에서 에너지 산정 결정 로직은 오리지널 저주파 도메인 신호를 수신하며 그 신호로부터 모은 정보를 이용해 분석을 행하도록 구성된다.
본 발명을 이용하는 실시예들에 의해 알 수 있는 하나의 이점은, 가능할 때마다 한 대역 안에서 중요한 영역들 (가령, 높은 에너지 영역들)을 유지하는 대역 길이들을 할당함으로써, 선택된 저주파 대역과 고주파 대역 사이의 매칭을 한층 향상시키는 것이다.
또, 본 발명의 실시예들은 대역 길이 선택에 사용된 것과 같은 기준을 이용해 가령 대역 제한 특성을 가진 신호들에 대해 적응적 비트 할당을 행한다. 따라서 본 발명의 실시예들은 인지 품질에 영향을 미치는 대역들에 더 많은 비트들을 할당할 수 있다.
본 발명의 실시예들에서 알 수 있는 또 다른 이점은, 단지 그러한 향상을 위해, 애플리케이션들의 성능에 크게 영향을 미치지 않을 프로세스들에 기반하여 이전의 고주파 영역 코딩에 비해 매우 낮은 추가 비트 레이트만이 요구된다는 것이다.
본 발명의 이해를 더 돕기 위해, 본 발명의 실시예들과 관련한 디코더(108)의 동작이 도 4에 개략적으로 도시된 디코더 및 도 8의 디코더 동작을 보인 흐름도와 관련해 보여진다.
디코더는 부호화된 비트스트림(112)이 수신될 입력부(313)를 포함한다. 입력부(313)는 비트스트림 언팩커 (unpacker)(301)에 연결된다.
비트스트림 언패커는 부호화된 비트스트림(112)을 세 개의 독립된 비트스트림들로 다중화해제 (demultiplex)하거나, 분할하거나, 언팩 (unpack)한다. 저주파 부호화된 비트스트림은 저주파 디코더(303)로 보내지고, 스펙트럼 대역 복제 비트스트림은 고주파 재구성기(307) (고주파 영역 디코더라고도 알려짐)로 보내지며, 대역 선택 비트스트림은 대역 선택기(305)로 보내진다.
이러한 언팩 프로세스가 도 8의 701 단계에 보인다.
저주파 디코더(303)는 저주파 부호화된 데이터를 수신하고 저주파 코더(231)에서 수행된 프로세스의 역 프로세스를 수행함으로써 합성 저주파 신호를 생성한다. 이 합성 저주파 신호는 고주파 재구성기(307) 및 재구성 프로세서(309)로 전달된다.
이러한 저주파 디코딩 프로세스는 도 8의 707 단계에 보여진다.
대역 선택기(305)는 대역 선택 비트들을 수신하고 그 대역들을 재생성하거나 대역 선택 비트들에 따라 후보 할당치들의 리스트로부터 한 대역 할당치를 선택한다. 대역 할당 값들, 그 개수, 각 대역의 위치 및 폭이 고주파 재구성기(307)로 전달된다. 본 발명의 일부 실시예들에서 대역 선택기(305)는 고주파 재구성기(307)의 일부일 수 있다.
대역 선택 비트스트림에 예속된 대역들의 선택이 도 8의 703 단계에서 보인다.
고주파 재구성기(307)는, 합성 저주파 신호, 대역 선택사항들 및 고주파 재구성 비트스트림을 수신할 때, 대역 선택 정보에 의해 지시된 대역들에 관한 고주파 재구성 비트스트림에 따라 지시된 대로 그 합성 저주파 신호로부터 저주파 성분들을 복제 및 스케일링함으로써 복제 고주파 성분들을 구성한다. 재구성된 고주파 성분 비트스트림은 재구성 프로세서(309)로 전달된다.
이러한 고주파 복제 구성 또는 고주파 재구성이 도 8의 705 단계에 보인다.
재구성 프로세서(309)는 복호된 저주파 비트스트림과 재구성된 고주파 비트스트림을 수신해, 오리지널 신호를 나타내는 비트스트림을 생성하도록 하고, 디코더 출력부(315)로 출력 오디오 신호(114)를 출력한다.
이러한 신호의 재구성이 도 8의 709 단계에서 보인다.
상술한 본 발명의 실시예들은 수반되는 프로세스들의 이해를 돕기 위해, 독자적인 인코더(104) 및 디코더(108) 장치로 표현된 코덱을 개시하였다. 그러나, 그 장치, 구조 그리고 동작들이 하나로 된 인코더-디코더 장치/구조/동작으로서 구현될 수도 있다는 것을 예상할 수 있을 것이다. 또, 본 발명의 일부 실시예들에서 코더와 디코더는 공통되는 일부 혹은 전체 구성요소들을 공유할 수도 있다.
상기 예들은 전자 기기(610) 안에서의 코덱 내에서 동작하는 발명의 실시예들을 개시하고 있으나, 이하에 기술되는 바와 같이 본 발명이 임의의 가변 레이트/적응적 레이트 오디오 (또는 스피치) 코덱의 일부로서 구현될 수 있다는 것을 알 수 있을 것이다. 그에 따라, 이를테면 본 발명의 실시예들은 고정 혹은 유선 통신 경로들을 통한 오디오 코딩을 구현할 수 있는 오디오 코덱 안에서 구현될 수 있다.
따라서 사용자 기기는 상기 본 발명의 실시예들에 개시된 것 같은 오디오 코덱을 구비할 수 있다.
사용자 기기라는 용어는 모바일 전화기들, 휴대형 데이터 프로세싱 기기들 또는 휴대형 웹 브라우저들 같은 임의의 알맞은 타입의 사용자 무선 기기를 포괄하도록 의도되었음을 알아야 한다.
또, 공공 육상 모바일 네트워크 (PLMN, public land mobile network)의 구성요소들 역시 상술한 것 같은 오디오 코덱들을 구비할 수 있다.
일반적으로, 본 발명의 다양한 실시예들은 하드웨어나 특수 용도의 회로들, 소프트웨어, 로직, 혹은 이들의 임의의 결합형태 안에서 구현될 수 있다. 예를 들어 일부 양태들은 하드웨어 안에서 구현되고, 다른 양태들은 비한정적 예들로서 콘트롤러, 마이크로프로세서 또는 다른 컴퓨팅 기기에 의해 실행될 수 있는 펌웨어나 소프트웨어를 통해 구현될 수 있다. 본 발명의 다양한 양태들이 블록도들, 흐름도들로서, 혹은 어떤 다른 묘사적 표현을 이용해 도시되고 설명되었지만, 여기 개시된 이러한 블록들, 장치, 시스템들, 기술들 또는 방법들은 비한정적 예들로서 하드웨어, 소프트웨어, 펌웨어, 특수 용도의 회로들이나 로직, 범용 하드웨어나 콘트롤러 또는 컴퓨팅 기기들, 아니면 이들의 어떤 결합 형태들 안에서 구현될 수 있다는 것을 잘 알 수 있을 것이다.
본 발명의 실시예들은 프로세서 엔티티 같은 모바일 기기의 데이터 프로세서에 의해서 실행될 수 있는 컴퓨터 소프트웨어나, 하드웨어, 혹은 소프트웨어 및 하드웨어가 결합 된 것에 의해 구현될 수 있다. 또, 이와 관련하여 도면들에서와 같은 로직 흐름의 어떤 블록들은 프로그램 단계들, 상호연결된 로직 회로들, 블록들 및 기능들, 혹은 프로그램 단계들과 로직 회로들 블록들 및 기능들이 결합된 것을 나타낼 수 있다.
메모리는 반도체 기반 메모리 장치들, 마그네틱 메모리 장치들 및 시스템들, 광학 메모리 장치들 및 시스템들, 고정형 메모리 및 탈부착형 메모리 같은 임의의 적절한 데이터 저장 기술을 이용해 구현될 수 있다. 데이터 프로세서들은 로컬 기술 환경에 적합한 어떠한 타입에나 해당할 수 있고, 비한정적 예들로서, 일반 범용 컴퓨터들, 특수 용도의 컴퓨터들, 마이크로프로세서들, DSP들 (digital signal processors) 및 멀티-코어 프로세서 아키텍처에 기반하는 프로세서들 가운데 하나 이상을 포함할 수 있다.
본 발명의 실시예들은 집적 회로 모듈들 같은 다양한 구성소자들 안에서 실시될 수 있다. 집적 회로 설계는 대체로 고도로 자동화된 프로세스이다. 종합적이고 강력한 소프트웨어 툴들이 사용되어 로직 레벨 디자인을 반도체 기판 위에서 에칭 및 형성될 준비가 된 반도체 회로 디자인으로 변환한다.
캘리포니아주 마운틴 뷰의 Synopsys 사와 캘리포니아주 산호세의 Cadence Design에 의해 제공되는 것들 같은 프로그램들은 잘 설정된 디자인 규칙들 및 미리 저장된 디자인 모듈들의 라이브러리들을 사용해 반도체 칩 위에서 자동으로 도선들을 라우팅하고 소자들을 배치한다. 반도체 회로의 설계가 완료되었으면, 규격화된 전자 포맷 (가령, Opus, GDSII 등등)으로 된 그에 따른 디자인이 반도체 제조 시설이나 제조 "공장"으로 보내질 것이다.
상술한 설명은, 전형적이고 비한정적인 예들을 들어 본 발명의 전형적 실시예에 대한 충분하고도 정보가치가 있는 내용을 제공하였다. 그러나, 관련 분야의 기술자들이라면 상술한 설명이 첨부된 도면들과 부가된 청구항들과 함께 읽혀질 때 다양한 변형과 적응 버전들이 가능하다는 것을 명확히 알 수 있을 것이다. 본 발명의 가르침에 대한 그러한 모든 비슷한 변형 버전들 또한 부가된 청구항들에 정의된 본 발명의 범주 안에 포함될 것이다.

Claims (40)

  1. 오디오 신호를 부호화하기 위한 장치에 있어서,
    상기 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누고;
    상기 오디오 신호의 적어도 한 특성을 결정하고;
    상기 고주파 부분으로부터 상기 오디오 신호의 상기 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하고;
    상기 복수의 고주파 대역 신호들 각각에 대해, 상기 고주파 대역 신호를 나타낼 수 있는 상기 저주파 부분의 적어도 일부를 결정하고;
    적어도 복수의 대역 할당치들 (allocations)을 저장하고;
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하도록 구성되고,
    상기 장치는 상기 오디오 신호의 상기 고주파 부분에 대해 상기 선택된 대역 할당치를 적용함으로써 상기 복수의 고주파 대역 신호들을 생성하도록 구성됨을 특징으로 하는 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 대역 할당치를 생성하도록 추가 구성되고,
    상기 장치는 상기 오디오 신호의 고주파 부분에 대해 상기 생성된 대역 할당치를 적용함으로써 상기 복수의 고주파 대역 신호들을 생성하도록 구성됨을 특징으로 하는 장치.
  4. 제1항 또는 제3항에 있어서,
    각각의 대역 할당치는 복수의 대역들을 포함함을 특징으로 하는 장치.
  5. 제4항에 있어서, 각각의 대역은,
    위치 (location) 주파수 및 대역폭; 및
    시작 주파수 및 종료 주파수 가운데 적어도 한 가지를 포함함을 특징으로 하는 장치.
  6. 제4항에 있어서, 상기 복수의 대역들 중 적어도 한 대역은 상기 복수의 대역들 중 적어도 한 다른 대역과 적어도 부분적으로 오버랩됨을 특징으로 하는 장치.
  7. 제1항 또는 제3항에 있어서,
    상기 생성된 복수의 고주파 대역 신호들에 예속된 대역 할당 신호를 생성하도록 추가 구성됨을 특징으로 하는 장치.
  8. 제7항에 있어서,
    상기 오디오 신호의 상기 저주파 부분에 예속된 저주파 부호화된 신호를 생성하고;
    상기 고주파 대역 신호를 나타낼 수 있는 상기 결정된 상기 저주파 부분의 적어도 일부에 예속된 고주파 부호화된 신호를 생성하고;
    상기 저주파 부호화된 신호, 상기 고주파 부호화된 신호 및 상기 대역 할당 신호를 포함하는 부호화된 신호를 출력하도록 추가 구성됨을 특징으로 하는 장치.
  9. 제1항 또는 제3항에 있어서, 상기 오디오 신호의 상기 적어도 한 특성은, 상기 오디오 신호의 상기 고주파 부분으로부터만 결정된 특성을 포함함을 특징으로 하는 장치.
  10. 제1항 또는 제3항에 있어서, 상기 오디오 신호의 상기 적어도 한 특성은,
    상기 오디오 신호의 성분들의 에너지;
    상기 오디오 신호의 성분들의 최고점 (peak) 대 최저점 (valley)의 비; 및
    상기 오디오 신호의 대역폭을 포함함을 특징으로 하는 장치.
  11. 오디오 신호를 부호화하는 방법에 있어서,
    상기 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누는 단계;
    오디오 신호의 적어도 한 특성 (characteristic)을 결정하는 단계;
    상기 고주파 부분으로부터 상기 오디오 신호의 상기 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하는 단계;
    상기 복수의 고주파 대역 신호들 각각에 대해 상기 고주파 대역 신호를 나타낼 수 있는 상기 저주파 부분의 적어도 일부를 결정하는 단계;
    적어도 복수의 대역 할당치들 (allocations)을 저장하는 단계; 및
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계를 포함하고,
    상기 복수의 고주파 대역 신호들을 생성하는 단계는 상기 오디오 신호의 상기 고주파 부분에 대해 상기 선택된 대역 할당치를 적용하는 것을 포함함을 특징으로 하는 부호화 방법.
  12. 삭제
  13. 제11항에 있어서,
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 대역 할당치를 생성하는 단계를 더 포함하고,
    상기 복수의 고주파 대역 신호들을 생성하는 단계는 상기 오디오 신호의 상기 고주파 부분에 대해 상기 생성된 대역 할당치를 적용하는 단계를 포함함을 특징으로 하는 부호화 방법.
  14. 제11항 또는 제13항에 있어서,
    각각의 대역 할당치는 복수의 대역들을 포함함을 특징으로 하는 부호화 방법.
  15. 제14항에 있어서, 각각의 대역은,
    위치 (location) 주파수 및 대역폭; 및
    시작 주파수 및 종료 주파수 가운데 적어도 하나를 포함함을 특징으로 하는 부호화 방법.
  16. 제14항에 있어서,
    상기 복수의 대역들 중 적어도 한 대역은 상기 복수의 대역들 중 적어도 한 다른 대역과 적어도 부분적으로 오버랩됨을 특징으로 하는 부호화 방법.
  17. 제11항 또는 제13항에 있어서,
    상기 생성된 고주파 대역 신호들에 예속된 대역 할당 신호를 생성하는 단계를 더 포함함을 특징으로 하는 부호화 방법.
  18. 제17항에 있어서,
    상기 오디오 신호의 상기 저주파 부분에 예속된 저주파 부호화된 신호를 생성하는 단계;
    상기 고주파 대역 신호를 나타낼 수 있는 상기 결정된 저주파 부분의 적어도 일부에 예속된 고주파 부호화된 신호를 생성하는 단계; 및
    상기 저주파 부호화된 신호, 상기 고주파 부호화된 신호 및 상기 대역 할당 신호를 포함하는 부호화된 신호를 출력하는 단계를 더 포함함을 특징으로 하는 부호화 방법.
  19. 제11항 또는 제13항에 있어서, 상기 오디오 신호의 적어도 한 특성은, 상기 오디오 신호의 상기 고주파 부분으로부터만 결정된 특성을 포함함을 특징으로 하는 부호화 방법.
  20. 제11항 또는 제13항에 있어서, 상기 오디오 신호의 상기 적어도 한 특성은,
    상기 오디오 신호의 성분들의 에너지;
    상기 오디오 신호의 성분들의 최고점 (peak) 대 최저점 (valley)의 비; 및
    상기 오디오 신호의 대역폭을 포함함을 특징으로 하는 부호화 방법.
  21. 오디오 신호를 복호하는 장치에 있어서,
    저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하고;
    상기 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하고;
    합성 고주파 신호를 생성하고, 이때 상기 대역 할당 신호에 예속된 상기 합성 고주파 신호의 적어도 한 부분이 상기 고주파 신호의 적어도 일부에 예속되는 상기 합성 저주파 신호의 적어도 일부로부터 생성되고;
    적어도 복수의 대역 할당치들을 저장하고;
    상기 대역 할당 신호에 예속된, 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하고;
    상기 대역 할당 신호에 예속된 대역 할당치를 생성하도록 구성됨을 특징으로 하는 장치.
  22. 제21항에 있어서,
    상기 합성 저주파 신호와 상기 합성 고주파 신호를 결합하여 복호된 오디오 신호를 생성하도록 추가 구성됨을 특징으로 하는 장치.
  23. 삭제
  24. 삭제
  25. 제21항에 있어서, 각각의 대역 할당치는 복수의 대역들을 포함함을 특징으로 하는 장치.
  26. 재25항에 있어서, 각각의 대역은,
    위치 주파수 및 대역폭; 및
    시작 주파수 및 종료 주파수 중 적어도 한 가지를 포함함을 특징으로 하는 장치.
  27. 오디오 신호를 복호하는 방법에 있어서,
    저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하는 단계;
    상기 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하는 단계;
    합성 고주파 신호를 생성하는 단계로서, 상기 대역 할당 신호에 예속된 상기 합성 고주파 신호의 적어도 한 부분이 상기 고주파 신호의 적어도 일부에 예속되는 상기 합성 저주파 신호의 적어도 일부로부터 생성되는 단계;
    적어도 복수의 대역 할당치들을 저장하는 단계;
    상기 대역 할당 신호에 예속된, 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계; 및
    상기 대역 할당 신호에 예속된 대역 할당치를 생성하는 단계를 포함함을 특징으로 하는 복호 방법.
  28. 제27항에 있어서,
    상기 합성 저주파 신호와 상기 합성 고주파 신호를 결합하여 복호된 오디오 신호를 생성하는 단계를 더 포함함을 특징으로 하는 복호 방법.
  29. 삭제
  30. 삭제
  31. 제27항에 있어서, 각각의 대역 할당치는 복수의 대역들을 포함함을 특징으로 하는 복호 방법.
  32. 제31항에 있어서, 각각의 대역은,
    위치 주파수 및 대역폭; 및
    시작 주파수 및 종료 주파수 중 적어도 한 가지를 포함함을 특징으로 하는 복호 방법.
  33. 제1항 또는 제3항에 따른 장치를 포함함을 특징으로 하는 장치.
  34. 제21항 또는 제22항에 따른 장치를 포함함을 특징으로 하는 장치.
  35. 제1항 또는 제3항에 따른 장치를 포함함을 특징으로 하는 전자 기기.
  36. 제21항 또는 제22항에 따른 장치를 포함함을 특징으로 하는 전자 기기.
  37. 오디오 신호를 부호화하는 방법을 수행하도록 구성된 컴퓨터 판독 가능한 저장매체에 있어서, 상기 방법은,
    상기 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누는 단계;
    상기 오디오 신호의 적어도 한 특성 (characteristic)을 결정하는 단계;
    상기 고주파 부분으로부터 상기 오디오 신호의 상기 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하는 단계;
    상기 복수의 고주파 대역 신호들 각각에 대해 상기 고주파 대역 신호를 나타낼 수 있는 상기 저주파 부분의 적어도 일부를 결정하는 단계;
    적어도 복수의 대역 할당치들 (allocations)을 저장하는 단계; 및
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계; 및
    상기 대역 할당 신호에 예속된 대역 할당치를 생성하는 단계를 포함함을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
  38. 오디오 신호를 복호하는 방법을 수행하도록 구성된 컴퓨터 판독 가능한 저장매체에 있어서, 상기 방법은,
    저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하는 단계;
    상기 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하는 단계;
    합성 고주파 신호를 생성하는 단계로서, 상기 대역 할당 신호에 예속된 합성 고주파 신호의 적어도 한 부분이 상기 고주파 신호의 적어도 일부에 예속되는 상기 합성 저주파 신호의 적어도 일부로부터 생성되는 단계;
    적어도 복수의 대역 할당치들 (allocations)을 저장하는 단계; 및
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 단계; 및
    상기 대역 할당 신호에 예속된 대역 할당치를 생성하는 단계를 포함함을 특징으로 하는 컴퓨터 판독가능한 저장 매체.
  39. 오디오 신호를 부호화하는 인코더에 있어서,
    상기 오디오 신호를 적어도 저주파 부분과 고주파 부분으로 나누기 위한 필터링 수단;
    상기 오디오 신호의 적어도 한 특성을 결정하기 위한 결정 수단;
    상기 고주파 부분으로부터 상기 오디오 신호의 상기 적어도 한 특성에 예속된 복수의 고주파 대역 신호들을 생성하기 위한 프로세싱 수단; 및
    상기 복수의 고주파 대역 신호들 각각에 대해 상기 고주파 대역 신호를 나타낼 수 있는 상기 저주파 부분의 적어도 일부를 결정하기 위한 추가 결정 수단;
    상기 오디오 신호의 상기 적어도 한 특성에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 수단; 및
    상기 오디오 신호의 상기 고주파 부분에 대해 상기 선택된 대역 할당치를 적용함으로써 상기 복수의 고주파 대역 신호들을 생성하는 수단을 포함함을 특징으로 하는 인코더.
  40. 오디오 신호를 복호하는 디코더에 있어서,
    저주파 부호화된 신호, 고주파 부호화된 신호 및 대역 할당 신호를 포함하는 부호화된 신호를 수신하기 위한 수신 수단;
    상기 저주파 부호화된 신호를 복호하여 합성 (synthetic) 저주파 신호를 생성하기 위한 결정 수단;
    합성 고주파 신호를 생성하기 위한 것으로서, 상기 대역 할당 신호에 예속된 상기 합성 고주파 신호의 적어도 한 부분이 상기 고주파 신호의 적어도 일부에 예속되는 상기 합성 저주파 신호의 적어도 일부로부터 생성되도록 하는 프로세싱 수단;
    적어도 복수의 대역 할당치들 (allocations)을 저장하는 수단;
    상기 오디오 신호에 예속된 상기 복수의 대역 할당치들 중 한 대역 할당치를 선택하는 수단; 및
    상기 대역 할당 신호에 예속된 대역 할당치를 생성하는 수단을 포함함을 특징으로 하는 디코더.
KR1020107012417A 2007-11-06 2007-11-06 오디오 코딩 장치 및 그 방법 KR101161866B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2007/061915 WO2009059631A1 (en) 2007-11-06 2007-11-06 Audio coding apparatus and method thereof

Publications (2)

Publication Number Publication Date
KR20100086032A KR20100086032A (ko) 2010-07-29
KR101161866B1 true KR101161866B1 (ko) 2012-07-04

Family

ID=39339886

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107012417A KR101161866B1 (ko) 2007-11-06 2007-11-06 오디오 코딩 장치 및 그 방법

Country Status (6)

Country Link
US (1) US20100274555A1 (ko)
EP (1) EP2220646A1 (ko)
KR (1) KR101161866B1 (ko)
CN (1) CN101896968A (ko)
CA (1) CA2704807A1 (ko)
WO (1) WO2009059631A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
KR101441474B1 (ko) * 2009-02-16 2014-09-17 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
EP2481048B1 (en) 2009-09-25 2017-10-25 Nokia Technologies Oy Audio coding
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012052802A1 (en) * 2010-10-18 2012-04-26 Nokia Corporation An audio encoder/decoder apparatus
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
EP2710588B1 (en) 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
WO2014030928A1 (ko) * 2012-08-21 2014-02-27 엘지전자 주식회사 오디오 신호 부호화 방법 및 오디오 신호 복호화 방법 그리고 이를 이용하는 장치
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
RU2667627C1 (ru) 2013-12-27 2018-09-21 Сони Корпорейшн Устройство и способ декодирования и программа
US9786291B2 (en) * 2014-06-18 2017-10-10 Google Technology Holdings LLC Communicating information between devices using ultra high frequency audio

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040078194A1 (en) * 1997-06-10 2004-04-22 Coding Technologies Sweden Ab Source coding enhancement using spectral-band replication
US20070016412A1 (en) 2005-07-15 2007-01-18 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434246B1 (en) * 1995-10-10 2002-08-13 Gn Resound As Apparatus and methods for combining audio compression and feedback cancellation in a hearing aid
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US20020169603A1 (en) * 2001-05-04 2002-11-14 Texas Instruments Incorporated ADC resolution enhancement through subband coding
KR100648760B1 (ko) * 2001-11-29 2006-11-23 코딩 테크놀러지스 에이비 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR100723753B1 (ko) * 2002-08-01 2007-05-30 마츠시타 덴끼 산교 가부시키가이샤 스펙트럼 대역 복사에 의한 오디오 디코딩 장치 및 오디오디코딩 방법
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
KR100723400B1 (ko) * 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
EP1939862B1 (en) * 2004-05-19 2016-10-05 Panasonic Intellectual Property Corporation of America Encoding device, decoding device, and method thereof
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
AU2006232361B2 (en) * 2005-04-01 2010-12-23 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP2092517B1 (en) * 2006-10-10 2012-07-18 QUALCOMM Incorporated Method and apparatus for encoding and decoding audio signals
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JPWO2008053970A1 (ja) * 2006-11-02 2010-02-25 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
WO2008114080A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation Audio decoding
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
WO2009078681A1 (en) * 2007-12-18 2009-06-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
KR101712101B1 (ko) * 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
US8000968B1 (en) * 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040078194A1 (en) * 1997-06-10 2004-04-22 Coding Technologies Sweden Ab Source coding enhancement using spectral-band replication
US20070016412A1 (en) 2005-07-15 2007-01-18 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression

Also Published As

Publication number Publication date
EP2220646A1 (en) 2010-08-25
KR20100086032A (ko) 2010-07-29
CA2704807A1 (en) 2009-05-14
WO2009059631A1 (en) 2009-05-14
CN101896968A (zh) 2010-11-24
US20100274555A1 (en) 2010-10-28

Similar Documents

Publication Publication Date Title
KR101161866B1 (ko) 오디오 코딩 장치 및 그 방법
KR101238239B1 (ko) 인코더
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US7761290B2 (en) Flexible frequency and time partitioning in perceptual transform coding of audio
JP4043476B2 (ja) スケーラブルエンコーディングのための方法および装置ならびにスケーラブルデコーディングのための方法および装置
US7275036B2 (en) Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
JP5096468B2 (ja) サイド情報なしの時間的ノイズエンベロープの自由な整形
KR101698371B1 (ko) 디지털 오디오 신호들의 개선된 코딩/디코딩
JP5400143B2 (ja) オーバーラッピング変換の2つのブロック変換への因数分解
CN102436819B (zh) 无线音频压缩、解压缩方法及音频编码器和音频解码器
KR102105305B1 (ko) 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
US20080140393A1 (en) Speech coding apparatus and method
CN103329197A (zh) 用于反相声道的改进的立体声参数编码/解码
KR20120061826A (ko) 디지털 오디오 신호들의 계층적 코딩/디코딩을 개선하기 위한 향상 코딩/ 디코딩에서의 비트들의 할당
US9230551B2 (en) Audio encoder or decoder apparatus
US20100250260A1 (en) Encoder
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
CN105745703A (zh) 信号编码方法和装置以及信号解码方法和装置
US20100280830A1 (en) Decoder
KR100765747B1 (ko) 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
WO2009068083A1 (en) An encoder
Ning Analysis and coding of high quality audio signals
CN102568489A (zh) 编码器

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee