KR101238239B1 - 인코더 - Google Patents

인코더 Download PDF

Info

Publication number
KR101238239B1
KR101238239B1 KR1020107012418A KR20107012418A KR101238239B1 KR 101238239 B1 KR101238239 B1 KR 101238239B1 KR 1020107012418 A KR1020107012418 A KR 1020107012418A KR 20107012418 A KR20107012418 A KR 20107012418A KR 101238239 B1 KR101238239 B1 KR 101238239B1
Authority
KR
South Korea
Prior art keywords
single frequency
audio signal
indicator
delete delete
frequency
Prior art date
Application number
KR1020107012418A
Other languages
English (en)
Other versions
KR20100086033A (ko
Inventor
라쎄 라아크소넨
미코 탐미
안드리아나 바실라체
안씨 라모
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20100086033A publication Critical patent/KR20100086033A/ko
Application granted granted Critical
Publication of KR101238239B1 publication Critical patent/KR101238239B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

오디오 신호를 부호화하기 위한 인코더가 제안되고, 인코더는 단일 주파수 성분들의 집합을 정의하고; 단일 주파수 성분들의 집합 중 제1부분 집합으로부터 적어도 한 개의 단일 주파수 성분을 선택하도록 구성된다.

Description

인코더{An encoder}
본 발명은 코딩에 관한 것으로, 특히 배타적이지 않은 것으로서 스피치 또는 오디오 코딩에 관한 것이다.
스피치나 음악 같은 오디오 신호들은 이를테면 그러한 오디오 신호들의 효율적 전송 또는 저장을 수행하기 위해 부호화된다.
오디오 인코더들과 디코더들이 음악 및 배경 잡음 같은 오디오 기반 신호들을 표현하는데 사용된다. 이러한 종류의 코더들은 보통 코딩 프로세스에 대해 스피치 모델을 이용하지 않고, 그보다 스피치를 포함한 모든 종류의 오디오 신호들을 표현하기 위한 프로세스들을 이용한다.
스피치 인코더들 및 디코더들 (코덱들)은 보통 스피치 신호들을 위해 최적화되고, 고정 또는 가변 비트 레이트에서 동작할 수 있다.
오디오 코덱이 가변 비트 레이트들에서 동작하도록 구성될 수도 있다. 낮은 비트 레이트에서, 그러한 오디오 코덱은 순수한 스피치 코덱에 해당하는 코딩 레이트로 스피치 신호들에 대해 작용할 것이다. 높은 비트 레이트에서, 오디오 코덱은 음악, 배경 잡음 및 스피치를 포함하는 임의의 신호를 보다 높은 품질과 성능으로 부호화할 수 있다.
어떤 오디오 코덱들에서는 입력 신호가 제한된 수의 대역들로 나눠진다. 대역 신호들 각각은 양자화될 수 있다. 음향심리학 (psychoacoustics)의 이론으로부터, 스펙트럼의 최상위 주파수들은 낮은 주파수들보다 인지적으로 덜 중요하다는 것이 알려져 있다. 일부 오디오 코덱들에서 이것은 고주파 신호들에 대해 저주파 신호들보다 적은 비트가 할당되는 비트 할당에 의해 반영되고 있다.
더구나 일부 코덱들은 저주파 및 고주파 대역들 간이나 오디오 신호 영역들 간 상관을 이용해 코덱들을 통한 코딩 효율을 향상시키도록 한다.
통상적으로, 스펙트럼의 상위 주파수 대역들은 보통 하위 주파수 대역들과 매우 유사하므로, 일부 코덱들은 보다 낮은 주파수 대역들만을 부호화한 후, 상위의 주파수 대역들을 스케일링된 (scaled) 하위 주파수 대역 사본 (copy)으로서 복제할 수 있다. 따라서 소량의 추가 제어 정보만을 사용함으로써 코덱의 총 비트 레이트의 상당한 절감이 이뤄질 수 있다.
고주파 영역을 부호화하기 위한 그러한 한 코덱은 고주파 영역 (HFR, high frequency region) 코딩이라고 알려져 있다. 고주파 영역 코딩의 한 형태가 스펙트럼 대역 복제 (SBR, spectral-band-relication)인데, 그것은 Coding Technologies에 의해 개발되었다. SBR에서, MPEG-4 (Moving Pictures Expert Group) AAC (Advanced Audio Coding) 같은 기존의 오디오 코더나 MPEG-1 레이어 III (MP3) 코더가 저주파 영역을 부호화한다. 고주파 영역은 그렇게 부호화된 저주파 영역을 이용해 개별적으로 만들어진다.
SBR 코딩에서, 고주파 영역은 저주파 영역을 상위 주파수대로 전치 (transposing)함으로써 얻어진다. 전치 (transposition)는 32 개의 대역을 가진 QMF (Quadrature Mirror Filters) 필터 뱅크에 기반하는 것으로, 어느 대역 샘플들로부터 각각의 고주파 대역 샘플이 구성되는지가 미리 정해지도록 수행된다. 이것은 입력 신호의 특성과는 무관하게 이뤄진다.
상위 주파수 대역들은 추가 정보에 기초해 필터링 된다. 필터링은 합성된 고주파 영역의 특정한 특성을 오리지널 고주파 영역과 비슷하게 만들도록 행해진다. 사인파 (sinusoids)나 잡음 같은 추가 성분들이 고주파 영역에 더해져서 원래의 고주파 영역과의 유사도를 높인다. 최종적으로, 오리지널 고주파 스펙트럼의 포락선 (envelope)을 따르도록 포락선이 조정된다.
그러나 상위 주파수 영역 코딩은 오리지널 고주파 영역과 동일한 복제본을 생성하지는 못한다. 구체적으로 말해, 기존의 상위 주파수 영역 코딩 메커니즘들은 입력 신호가 음질인 (tonal) 경우, 즉 잡음의 스펙트럼과 유사한 스펙트럼을 가지지 않은 경우 상대적으로 불완전하게 수행된다.
본 발명은 현재 제안된 코덱들이, 효율적이고도 정밀한 신호 근사치들을 코딩할 수 있는 기능과 관련해 융통성이 부족하다는 생각에서 비롯된다.
본 발명의 실시예들은 상술한 문제점 극복을 목적으로 한다.
본 발명의 제1양태에 따라 오디오 신호를 부호화하기 위한 인코더가 제공되고, 상기 인코더는 단일 주파수 성분들의 집합을 정의하고; 단일 주파수 성분들의 집합 중 제1부분 집합으로부터 적어도 한 개의 단일 주파수 성분을 선택하도록 구성된다.
상기 인코더는, 상기 선택된 적어도 한 개의 단일 주파수 성분을 나타낼 적어도 한 제1지시자를 생성하도록 추가 구성될 수 있다.
상기 인코더는, 단일 주파수 성분들의 집합의 적어도 제2부분 집합으로부터 적어도 한 개의 추가적 단일 주파수 성분을 선택하도록 추가 구성될 수 있다.
상기 인코더는 상기 선택된 적어도 한 개의 추가적 단일 주파수 성분을 나타낼 적어도 한 제2지시자를 생성하도록 추가 구성될 수 있다.
상기 인코더는 단일 주파수 성분들의 집합을 적어도 단일 주파수 성분들의 제1 및 제2부분 집합들로 분할하도록 추가 구성될 수 있다.
상기 인코더는 단일 주파수 성분들의 집합을, 그 집합 내 단일 주파수 성분의 주파수에 따라 적어도 단일 주파수 성분들의 제1 및 제2부분 집합들로 분할하도록 추가 구성될 수 있다.
상기 인코더는 단일 주파수 성분들의 집합을 그 집합 내 단일 주파수 성분의 인지적 중요도에 따라 적어도 단일 주파수 성분의 제1 및 제2부분 집합들로 분할하도록 추가 구성될 수 있다.
단일 주파수 성분들은 사인파들 (sinusoids)임이 바람직하다.
본 발명의 제2양태에 따라 오디오 신호를 부호화하기 방법이 제공되고, 상기 방법은 단일 주파수 성분들의 집합을 정의하는 단계; 단일 주파수 성분들의 집합 중 제1부분 집합으로부터 적어도 한 개의 단일 주파수 성분을 선택하는 단계를 포함한다.
상기 방법은, 상기 선택된 적어도 한 개의 단일 주파수 성분을 나타낼 적어도 한 제1지시자를 생성하는 단계를 더 포함할 수 있다.
상기 방법은, 단일 주파수 성분들의 적어도 제2부분 집합으로부터 적어도 한 개의 추가적 단일 주파수 성분을 선택하는 단계를 더 포함할 수 있다.
상기 방법은, 상기 선택된 적어도 한 개의 추가적 단일 주파수 성분을 나타낼 적어도 한 제2지시자를 생성하는 단계를 더 포함할 수 있다.
상기 방법은, 단일 주파수 성분들의 집합을 적어도 단일 주파수 성분들의 제1 및 제2부분 집합들로 분할하는 단계를 더 포함할 수 있다.
단일 주파수 성분들의 집합을 적어도 단일 주파수 성분들의 제1 및 제2부분 집합들로 분할하는 단계는 그 집합 내 단일 주파수 성분의 주파수에 종속될 수 있다.
단일 주파수 성분들의 집합을 적어도 단일 주파수 성분들의 제1 및 제2부분 집합들로 분할하는 단계는, 그 집합 내 단일 주파수 성분의 인지적 중요도에 종속될 수 있다.
단일 주파수 성분들은 사인파들 (sinusoids)임이 바람직하다.
본 발명의 제3양태에 따라 오디오 신호를 복호화하는 디코더가 제공되고, 상기 디코더는 단일 주파수 성분들의 집합의 제1부분 집합으로부터 적어도 한 단일 주파수 성분을 나타내는 적어도 한 지시자를 수신하도록 하고; 수신된 상기 지시자에 따라 상기 단일 주파수 성분을 삽입하도록 구성된다.
상기 디코더는, 단일 주파수 성분들의 집합의 적어도 한 추가 부분 집합으로부터 적어도 한 추가 단일 주파수 성분을 나타내는 적어도 한 추가 지시자를 수신하고; 수신된 추가 지시자에 따라 상기 추가 단일 주파수 성분을 삽입하도록 추가 구성될 수 있다.
상기 디코더는 단일 주파수 성분들의 집합의 제1부분 집합으로부터 상기 적어도 한 단일 주파수 성분의 부호 (sign)를 나타내는 부호 지시자를 수신하도록 추가 구성될 수 있다.
본 발명의 제4양태에 따라 오디오 신호를 복호화하기 위한 방법이 제공되고, 상기 방법은, 단일 주파수 성분들의 집합의 제1부분 집합으로부터 적어도 한 단일 주파수 성분을 나타내는 적어도 한 지시자를 수신하는 단계; 및 수신된 상기 지시자에 따라 상기 단일 주파수 성분을 삽입하는 단계를 포함한다.
상기 방법은, 단일 주파수 성분들의 집합의 적어도 한 추가 부분 집합으로부터 적어도 한 추가 단일 주파수 성분을 나타내는 적어도 한 추가 지시자를 수신하는 단계; 및 수신된 추가 지시자에 따라 상기 추가 단일 주파수 성분을 삽입하는 단계를 더 포함할 수 있다.
상기 방법은, 단일 주파수 성분들의 집합의 제1부분 집합으로부터 상기 적어도 한 단일 주파수 성분의 부호 (sign)를 나타내는 부호 지시자를 수신하는 단계를 더 포함할 수 있다.
본 발명의 제5양태에 따라 상술한 인코더를 구비한 장치가 제안된다.
본 발명의 제6양태에 따라 상술한 디코더를 구비한 장치가 제안된다.
본 발명의 제7양태에 따라 상술한 인코더를 구비한 전자 기기가 제안된다.
본 발명의 제8양태에 따라 상술한 디코더를 구비한 전자 기기가 제안된다.
본 발명의 제9양태에 따라 오디오 신호를 부호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되고, 그 방법은 단일 주파수 성분들의 집합을 정의하는 단계; 단일 주파수 성분들의 집합 중 제1부분 집합으로부터 적어도 한 개의 단일 주파수 성분을 선택하는 단계를 포함한다.
본 발명의 제10양태에 따라 오디오 신호를 복호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되고, 그 방법은 단일 주파수 성분들의 집합의 제1부분 집합으로부터 적어도 한 단일 주파수 성분을 나타내는 적어도 한 지시자를 수신하는 단계; 및 수신된 상기 지시자에 따라 상기 단일 주파수 성분을 삽입하는 단계를 포함한다.
본 발명의 제11양태에 따라 오디오 신호를 부호화하는 인코더가 제안되고, 상기 인코더는 단일 주파수 성분들의 집합을 정의하는 수단; 및 단일 주파수 성분들의 집합 중 제1부분 집합으로부터 적어도 한 개의 단일 주파수 성분을 선택하는 선택 수단을 포함한다.
본 발명의 제12양태에 따라 오디오 신호를 복호화하는 디코더가 제공되고, 상기 디코더는 단일 주파수 성분들의 집합의 제1부분 집합으로부터 적어도 한 단일 주파수 성분을 나타내는 적어도 한 지시자를 수신하는 수신 수단; 및 수신된 상기 지시자에 따라 상기 단일 주파수 성분을 삽입하는 삽입 수단을 포함한다.
본 발명의 제13양태에 따라 오디오 신호를 부호화하는 인코더가 제안되고, 상기 인코더는 적어도 두 개의 단일 주파수 성분들을 선택하고; 상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하도록 구성된다.
상기 인코더는 적어도 한 추가 단일 주파수 성분을 선택하도록 추가 구성될 수 있고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성됨이 바람직하고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분, 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨이 바람직하다.
상기 지시자는 상기 적어도 두 개의 단일 주파수 성분들 중 하나의 주파수에 종속되도록 추가 구성됨이 바람직하다.
상기 인코더는 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 결정하도록 추가 구성될 수 있다.
상기 인코더는, 상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 대한 주파수 간격 값들의 리스트를 서치하고; 상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 보다 가깝게 매치하는 리스트 중 하나를 선택하도록 추가 구성될 수 있고, 상기 지시자는 주파수 간격 값들의 리스트 중 선택된 하나에 종속됨이 바람직하다.
상기 인코더는 주파수 간격 값들의 리스트 중 선택된 하나 및 결정된 주파수 간격 값 사이의 차를 결정하도록 추가 구성될 수 있고, 상기 지시자는 상기 차에 추가 종속됨이 바람직하다.
상기 인코더는 주파수 간격 값들의 리스트 중 선택된 하나 및 결정된 주파수 간격 값 사이의 상기 결정된 차에 대한 차이 값들의 추가 리스트를 검색하고; 상기 결정된 차이 값에 보다 가깝게 매치하는 차이 값들의 추가 리스트 중 하나를 선택하도록 추가 구성될 수 있고, 상기 지시자는 상기 차이 값들의 추가 리스트 중 선택된 하나에 종속됨이 바람직하다.
본 발명의 제14양태에 따라 오디오 신호를 부호화하기 위한 방법이 제안되고, 상기 방법은 적어도 두 개의 단일 주파수 성분들을 선택하는 단계; 및 상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하는 단계를 포함한다.
상기 방법은, 적어도 한 추가 단일 주파수 성분을 선택하는 단계를 더 포함할 수 있고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성됨이 바람직하고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분, 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨이 바람직하다.
상기 지시자는 상기 적어도 두 개의 단일 주파수 성분들 중 하나의 주파수에 추가 종속될 수 있다.
상기 방법은, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 결정하는 단계를 더 포함할 수 있다.
상기 방법은, 상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 대한 주파수 간격 값들의 리스트를 서치하는 단계; 및 상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 보다 가깝게 매치하는 리스트 중 하나를 선택하는 단계를 더 포함할 수 있고, 상기 지시자는 주파수 간격 값들의 리스트 중 선택된 하나에 종속됨이 바람직하다.
상기 방법은, 주파수 간격 값들의 리스트 중 선택된 하나 및 결정된 주파수 간격 값 사이의 차를 결정하는 단계를 더 포함할 수 있고, 상기 지시자는 상기 차에 추가 종속됨이 바람직하다.
상기 방법은, 주파수 간격 값들의 리스트 중 선택된 하나 및 결정된 주파수 간격 값 사이의 상기 결정된 차에 대한 차이 값들의 추가 리스트를 검색하는 단계; 및 상기 결정된 차이 값에 보다 가깝게 매치하는 차이 값들의 추가 리스트 중 하나를 선택하는 단계를 더 포함할 수 있고, 상기 지시자는 상기 차이 값들의 추가 리스트 중 선택된 하나에 종속됨이 바람직하다.
본 발명의 제15양태에 따라 오디오 신호를 복호화하기 위한 디코더가 제안되고, 상기 디코더는, 적어도 두 개의 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하고; 상기 수신된 지시자에 종속된 상기 적어도 두 개의 단일 주파수 성분들을 삽입하도록 구성된다.
상기 적어도 한 지시자는 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성됨이 바람직하고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨이 바람직하고, 상기 디코더는 상기 지시자에 종속되는 상기 적어도 한 추가 단일 주파수 성분을 삽입하도록 추가 구성됨이 바람직하다.
본 발명의 제16양태에 따라 오디오 신호를 복호화하기 위한 방법이 제안되고, 상기 방법은, 적어도 두 개의 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하는 단계; 및 상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하는 단계를 포함한다.
상기 적어도 한 지시자는 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성됨이 바람직하고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨이 바람직하고, 상기 방법은 상기 지시자에 의존해 상기 적어도 한 추가 단일 주파수 성분을 삽입하는 단계를 더 포함할 수 있다.
본 발명의 제17양태에 따라 상술한 것과 같은 인코더를 포함하는 장치가 제안된다.
본 발명의 제18양태에 따라 상술한 것과 같은 디코더를 포함하는 장치가 제안된다.
본 발명의 제19양태에 따라 상술한 것과 같은 인코더를 포함하는 전자 기기가 제안된다.
본 발명의 제20양태에 따라 상술한 것과 같은 디코더를 포함하는 전자 기기가 제안된다.
본 발명의 제21양태에 따라, 오디오 신호를 부호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되고, 그 방법은, 적어도 두 개의 단일 주파수 성분들을 선택하는 단계; 및 상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하는 단계를 포함한다.
본 발명의 제22양태에 따라, 오디오 신호를 복호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품이 제안되고, 그 방법은 적어도 두 개의 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하는 단계; 및 상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하는 단계를 포함한다.
본 발명의 제23양태에 따라 오디오 신호를 부호화하기 위한 인코더가 제안되고, 상기 인코더는, 적어도 두 개의 단일 주파수 성분들을 선택하기 위한 선택 수단; 및 상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하도록 하는 지시자 생성 수단을 포함한다.
본 발명의 제24양태에 따라 오디오 신호를 복호화하기 위한 디코더가 제안되고, 상기 디코더는, 적어도 두 개의 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하기 위한 수신 수단; 및 상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하도록 하는 삽입 수단을 포함한다.
본 발명을 더 잘 이해하기 위해 지금부터 예로서 첨부된 도면을 참조할 것이다.
도 1은 본 발명의 실시예들을 이용하는 전자 기기를 개략적으로 도시한 것이다.
도 2는 본 발명의 실시예들을 이용하는 오디오 코덱 시스템을 개략적으로 도시한 것이다.
도 3은 도 2에 도시된 오디오 코덱 시스템의 인코더 부분을 개략적으로 도시한 것이다.
도 4는 도 3에 도시된 인코더의 고주파 영역 인코더 부분의 개략도를 도시한 것이다.
도 5는 오디오 코덱 시스템의 디코더 부분을 개략적으로 도시한 것이다.
도 6은 본 발명의 실시예들에 따라 도 3 및 4에 도시된 오디오 인코더 실시예의 동작을 예시한 흐름도를 보인다.
도 7은 본 발명에 따라 도 5에 도시된 것과 같은 오디오 디코더 실시예의 동작을 예시한 흐름도를 보인다.
도 8은 본 발명의 실시예들에 따른 오디오 신호, 삽입된 사인파 포지션들, 및 사인파 포지션들의 부호화에 대한 스펙트럼 표현의 예들을 보인다.
도 9는 본 발명의 실시예들에 따른 오디오 신호 및 삽입된 사인파 포지션들의 스펙트럼 표현들의 추가 예들을 보인다.
이하에서는 계층화되거나 스케일러블한 (scalable) 가변 레이트 오디오 코덱들의 제공을 위해 가능한 코덱 메커니즘들을 상세히 설명할 것이다. 이와 관련해 본 발명의 일 실시예에 따른 코덱을 포함할 수 있는 전형적 전자 기기(10)의 개략적 블록도인 도 1을 우선 참조할 것이다.
전자 기기(10)는 예를 들어, 무선 통신 시스템의 모바일 단말이나 사용자 기기일 수 있다.
전자 기기(10)는 마이크로폰(11)을 구비하는데, 이것은 아날로그-디지털 컨버터(14)를 통해 프로세서(21)와 링크된다. 프로세서(21)는 디지털-아날로그 컨버터 (DAC)(32)를 통해 확성기들(33)과도 링크된다. 프로세서(21)는 트랜시버 (TX/RX)(13)에도, 사용자 인터페이스 (UI)(15)에도, 그리고 메모리(22)에도 링크된다.
프로세서(21)는 다양한 프로그램 코드들을 실행하도록 구성될 수 있다. 구현되는 프로그램 코드들은 오디오 신호의 저주파 대역 및 오디오 신호의 고주파 대역을 부호화하기 위한 오디오 부호화 코드를 포함한다. 구현되는 프로그램 코드들(23)은 오디오 복화화 코드 또한 포함한다. 구현되는 프로그램 코드들(23)은 필요할 때마다 프로세서(21)에 의해 검색되도록 메모리(22) 등에 저장될 수 있다. 메모리(22)는 본 발명에 따라 부호화되었던 데이터와 같은 데이터를 저장하는 섹션(24)을 더 제공할 수 있을 것이다.
부호화 및 복호화 코드는 본 발명의 실시예들에 있어 하드웨어나 펌웨어를 통해 구현될 것이다.
사용자 인터페이스(15)는 사용자가 가령 키패드를 통해 전자 기기(10)로 명령들을 입력할 수 있고/있거나 디스플레이 등을 통해 전자 기기(10)로부터 정보를 얻을 수 있게 한다. 트랜시버(13)는 무선 통신 네트워크 등을 통해 다른 전자 기기들과 통신할 수 있게 한다.
다시 한번, 전자 기기(10)의 구조는 여러 방법으로 보완 및 변경될 수 있다는 것을 알아야 한다.
전자 기기(10)의 사용자는 스피치를 입력하기 위해 마이크로폰(11)을 사용할 수 있고, 스피치는 어떤 다른 전자 기기로 전송되거나 메모리(22)의 데이터 섹션(24)에 저장될 것이다. 해당 애플리케이션이 이러한 목적으로 사용자 인터페이스(15)를 통해 사용자에 의해 작동되었을 수 있다. 이 애플리케이션은 프로세서(21)에 의해 구동될 수 있는 것으로, 프로세서(21)로 하여금 메모리(22)에 저장된 부호화 코드를 실행시키게 한다.
아날로그-디지털 변환기(14)는 입력된 아날로그 오디오 신호를 디지털 오디오 신호로 변환하고, 그 디지털 오디오 신호를 프로세서(21)로 제공한다.
그러면 프로세서(21)가 도 2 및 3을 참조해 설명하는 것과 같은 방법으로 그 디지털 오디오 신호를 처리할 수 있다.
그 결과에 따른 비트 스트림이 트랜시버(13)로 주어져서 다른 전자 기기로 전송되게 된다. 이와 달리, 코딩된 데이터는 예를 들어 같은 전자 기기(10)에 의해 나중에 전송되거나 나중에 제공되기 위해 이를테면 메모리(22)의 데이터 섹션(24)에 저장될 수도 있다.
전자 기기(10)는 자신의 트랜시버(13)를 통해 다른 전자 기기로부터 상응하게 부호화된 데이터를 포함하는 비트 스트림을 또한 수신할 수도 있을 것이다. 이 경우, 프로세서(21)는 메모리(22)에 저장된 복호화 프로그램 코드를 실행할 수 있다. 프로세서(21)는 수신된 데이터를 복호화하고, 그 복호화된 데이터를 디지털-아날로그 컨버터(32)로 제공한다. 디지털-아날로그 컨버터(32)는 디지털 복호화된 데이터를 아날로그 오디오 데이터로 변환하여 그들을 확성기들(33)을 거쳐 출력시킨다. 복호화 프로그램 코드의 실행 역시, 사용자 인터페이스(15)를 통해 사용자가 호출했던 애플리케이션에 의해 시작될 수 있다.
수신된 부호화된 데이터도 확성기들(33)을 통한 즉각적 제공 대신에, 가령 나중에 제공하거나 또 다른 전자 기기로 포워딩할 수 있도록 메모리(22)의 데이터 섹션(24)에 저장될 수 있다.
도 2 내지 4에 도시된 개략적 구조들 및 도 7과 8의 방법의 단계들은, 도 1에 도시된 전자 기기에서 구현된다고 예로써 도시된 완전한 오디오 코덱의 동작 중 일부만을 나타낸 것임을 예상할 수 있을 것이다.
본 발명의 실시예들에 의해 사용되는 오디오 코덱들의 일반적인 동작이 도 2에 도시된다. 일반적인 오디오 부호화/복호화 시스템들은 도 2에 개략적으로 도시된 것 같은 인코더 및 디코더로 이뤄진다. 인코더(104), 저장부 또는 미디어 채널(106) 및 디코더(108)를 갖춘 시스템(102)이 도시되어 있다.
인코더(104)는 입력 오디오 신호(110)를 압축하여 미디어 채널(106)을 통해 전송되거나 저장되는 비트 스트림(112)을 생성한다. 비트 스트림(112)은 디코더(108) 안에서 수신될 수 있다. 디코더(108)는 비트 스트림(112)을 압축해제하여 출력 오디오 신호(114)를 생성한다. 비트 스트림(112)의 비트 레이트 및 입력 신호(110) 관련 출력 오디오 신호(114)의 품질이 코딩 시스템(102)의 성능을 규정하는 주요 특징들이다.
도 3은 본 발명의 일 실시예에 따른 인코더(104)를 개략적으로 도시한 것이다. 인코더(104)는 오디오 신호를 수신하도록 구성된 입력부(203)를 구비한다. 입력부(203)는 로 패스 필터(230), 하이 패스/밴드 패스 필터(235)에 연결된다. 로 패스 필터(230)는 신호를 저주파 영역 (LFR)코더 (코어 코덱(core codec)이라고도 알려져 있음)(231)로 출력한다. 저주파 영역 코더(231)는 고주파 영역 (HFR) 코더(232)로 신호를 출력하도록 구성된다. 하이 패스/밴드 패스 필터(235)가 HFR 코더(232)에 연결된다. LFR 코더(231), HFR 코더(232)는 비트스트림 포매터 (formatter)(234) (본 발명의 어떤 실시예들에서 비트스트림 멀티플렉서로도 알려짐)로 신호들을 출력하도록 구성된다. 비트스트림 포매터(234)는 출력(205)을 통해 출력 비트스트림(112)을 출력하도록 구성된다.
본 발명의 어떤 실시예들에서, 하이 패스/밴드 패스 필터(235)는 옵션사항이어서, 오디오 신호가 HFR 코더(232)로 바로 건너갈 수도 있다.
이러한 구성요소들의 동작은 코더(104)의 동작을 보이는 도 6의 흐름도를 참조해 더 상세히 기술될 것이다.
오디오 신호가 코더(104)에 의해 수신된다. 본 발명의 제1실시예에서 오디오 신호는 디지털 방식으로 샘플링된 신호이다. 본 발명의 다른 실시예들에서 오디오 입력은 마이크로폰(6) 등으로부터의 아날로그 오디오 신호일 수 있고, 이것이 아날로그-디지털 (A/D) 변환된다. 본 발명의 또 다른 실시예들에서 오디오 입력은 펄스 코드 변조 디지털 신호에서 진폭 변조 디지털 신호로 변환된다. 오디오 신호의 수신은 도 7의 601 단계에서 보이고 있다.
로 패스 필터(230) 및 하이 패스/대역 패스 필터(235)는 오디오 신호를 수신하고 입력 신호(110)가 필터링되는 컷오프 (cut-off) 주파수를 규정한다. 컷오프 주파수 아래에 있는 수신된 오디오 신호 주파수들이 로 패스 필터(230)에 의해 저주파 영역 (LFR) 코더(231)로 보내진다. 컷오프 주파수 위에 있는 수신된 오디오 신호 주파수들은 하이 패스 필터(235)에 의해 고주파 영역(HFR) 코더(232)로 보내진다. 본 발명의 어떤 실시예들에서 신호는 저주파 코더(231)의 부호화 효율을 추가로 개선하기 위한 옵션으로서 다운 샘플링된다.
LFR 코더(231)는 저주파 (그리고 옵션으로서 다운 샘플링된) 오디오 신호를 수신하고 그 신호에 대해 알맞은 저주파수 코딩을 적용한다. 본 발명의 제1실시예에서, 저주파 코더(231)는 양자화 및 32 개의 저주파 서브 대역들을 가진 허프만 (Huffman) 코딩을 적용한다. 입력 신호(110)는 분석 (analysis) 필터 뱅크 구조를 이용해 서브 대역들로 나눠진다. 각각의 서브 대역은 음향심리학적 모델에 의해 주어진 정보를 활용해 양자화 및 부호화될 수 있다. 양자화 설정 및 코딩 계획은 적용된 음향심리학적 모델에 의해 지시될 수 있다. 양자화되고 부호화된 정보는 비트 스트림(12) 생성을 위해 비트 스트림 포매터(234)로 보내진다.
또, LFR 코더(231)는 변형 이산 코사인 변환 (MDCT, modified discrete cosine transform)을 이용해 저주파 콘텐츠를 변환하여 합성 LFR 신호의 주파수 도메인 실현물들 (realizations)을 도출한다. 이러한 주파수 도메인 실현물들은 HFR 프로세서(232)로 전달된다.
이러한 저주파수 코딩이 도 6의 606 단계에 도시되고 있다.
본 발명의 다른 실시예들에서는 비트스트림 포매터(234)로 출력되는 코어 (core) 코딩 출력을 생성하기 위해 다른 저주파 코덱들이 사용될 수 있다. 이러한 저주파 코덱들의 다른 실시예들의 예들에는 비한정적인 예들로서 AAC (advanced audio coding), MP3 (MPEG layer 3), ITU-T EV-VBR (Embedded variable rate) 스피치 코딩 베이스라인 코덱, 및 ITU-T G.729.1가 포함된다.
저주파 영역 코더(231)가 코딩 프로세스의 일부로서 한 주파수 도메인 합성 출력을 효과적으로 출력하지 못할 경우, 저주파 영역 (LFR) 코더(231)는 저주파 디코더 및 주파수 도메인 컨버터 (도 3에 도시되지 않음)를 더 포함해, 저주파 신호의 합성 (synthetic) 복제품을 생성하도록 할 수 있다. 그러면 본 발명의 실시예들이 주파수 도메인 표현으로 전환될 수 있고, 필요시 HFR 코더(232)로 전송되는 일련의 저주파 서브 대역들로 분할된다.
이것은 본 발명의 실시예들에서 가능한 광범위한 코더/디코더들로부터 저주파 영역 코더(231)의 선택을 가능하게 하고, 그로써 본 발명은 출력의 일부로서 주파수 도메인 정보를 생성하는 특정 저주파 또는 코어 코더 알고리즘들에 국한되지 않게 된다.
고주파 영역 (HFR) 코더(232)가 도 4에 보다 상세히 개략적으로 도시된다.
고주파 영역 코더(232)는 하이 패스/밴드 패스 필터(235)로부터 신호를 수신하며, 그 신호는 MDCT/SDFT (modified discrete cosine transfor/shifted discrete Fourier transform) 프로세서(301)로 입력된다.
MDCT/SDFT 변환기(301)로부터의 주파수 도메인 출력은 톤 선택 제어기(303), 고주파 영역 (HFR) 대역 리플리컨트 (replicant) 스케일링 프로세서(307), 및 사인파 주입 선택 (sinusoid injection selection)/인코딩 프로세서(309)로 전달된다.
톤 선택 제어기(303)는 HFR 대역 리플리컨트 선택 프로세서(305), HFR 대역 리플리컨트 스케일링 프로세서(307), 사인파 주입 선택/인코딩 프로세서(309), 및 멀티플렉서(311)를 제어하거나 설정하도록 구성된다. HFR 대역 리플리컨트 선택 프로세서(305)는 또한 LFR 코더(231)로부터 주파수 도메인 형식의 합성 저주파 영역 신호를 수신하다. HFR 대역 리플리컨트 선택 프로세서(305)는 이제부터 설명되는 바와 같이 LFR 코더로부터, 선택된 HFR 대역들을 출력하고 그 선택사항을 HFR 대역 리플리컨트 스케일링 프로세서(307)로 전달할 것이다.
HFR 대역 리플리컨트 스케일링 프로세서(305)는 그 선택사항 및 스케일링 요소들의 부호화된 형태를 멀티플렉서(311)로 전달해 데이터 스트림(112) 안에 삽입되게 한다. 또, HFR 대역 리플리컨트 스케일링 프로세서(307)는 선택되고 스케일링된 HFR 영역의 표현을 사인파 주입 선택/인코딩 프로세서(309)로 전달한다. 사인파 주입 선택/인코딩 프로세서(309)는 출력 데이터 스트림(112)에 산입될 신호를 멀티플렉서로 전달한다.
이제 도 6과 도 4를 참조해 HFR 인코더가 어떻게 작동하는지 상세히 설명할 것이다.
MDCT/SDFT 프로세서(301)는 HP/BP 필터(235)로부터 수신된 고주파 영역 오디오 신호를 신호의 주파수 도메인 표현으로 전환한다.
본 발명의 어떤 실시예들에서, MDCT/SDFT 프로세서는 게다가 고주파 오디오 신호를 짧은 주파수 서브 대역들로 분할한다. 그 주파수 서브 대역들은 대략 500-800 Hz 넓이에 걸칠 수 있다. 본 발명의 어떤 실시예들에서 주파수 서브 대역들은 서로 다른 대역폭들을 가진다. 한 실시예에서, 주파수 서브 대역들은 750 Hz의 대역폭을 가진다. 본 발명의 다른 실시예들에서 주파수 서브 대역들의 대역폭은 상이하든 동일하든, 고주파 영역에 대한 대역 할당에 좌우될 수 있다.
본 발명의 제1실시예에서, 주파수 서브 대역 대역폭은 일정하다, 즉 프레임 별로 달라지지 않는다. 본 발명의 다른 실시예들에서, 주파수 서브 대역 대역폭은 일정하지 않으며 한 주파수 서브 대역은 시간에 따라 달라지는 대역폭을 가질 수 있다.
본 발명의 일부 실시예들에서 이러한 가변적인 서브 대역 대역폭 할당치는 오디오 신호의 음향심리학적 모델링에 기초해 결정될 수 있다. 이러한 주파수 서브 대역들은 다시 본 발명의 다양한 실시예들에서 연속적이거나 (즉, 하나 다음에 하나가 차례로 오게 되어 연속 스펙트럼 실현물을 생성함) 부분적으로 오버랩될 수 있다.
시간 도메인의 주파수 도메인 변환 및 서브 대역 구성 단계가 도 6의 607 단계에 보인다.
톤 선택 제어기(303)는 차례로 HFR 대역 리플리컨트 선택, 스케일링, 사인파 주입 선택 및 인코딩, 그리고 멀티플렉서를 제어해 고주파 영역에 대해 보다 효율적인 인코딩이 수행될 수 있도록 구성될 수 있다.
MDCT/SDFT 프로세서(301)로부터 쉬프트 된 이산 푸리에 변환 출력 (SDFT)이 톤 선택 제어기(303)에서 수신된다.
2N 개의 샘플들 (본 발명의 바람직한 실시예들에 있어 한 프레임이라고 간주될 수 있음)에 대해 정의된 SDFT (shifted discrete Fourier transform)의 예가 식 1에 보인다:
Figure 112010036058186-pct00001
여기서 h(n)은 스케일링 윈도 (scaling window)이고, x(n)은 오리지널 입력 신호이고, u 및 v는 각각 시간 및 주파수 도메인 쉬프트들을 나타낸다.
본 발명의 일 실시예에서 u 및 v는 u=(N+1)/2이고 v=1/2가 되게 선택될 수 있는데 이는 선택된 SDFT 변환의 실수부도 MDCT 변환으로서 사용될 수 있기 때문이다. 따라서 이것은 MDCT 변환기 및 SDFT 변환기가 하나의 시간-주파수 (time to frequency) 도메인 연산 내에서 구현되는 것을 가능하게 하고, 그에 따라 기기의 복잡도를 줄일 수 있다.
톤 선택 제어기(303)는 입력된 고주파 영역 신호가 노멀 (normal)인지 톤 (tonal)인지 여부를 검출하도록 구성될 수 있다. 톤 선택 제어기(303)는 현재와 과거 프레임에 대한 SDFT 출력을 비교함으로써 신호의 특성을 판단할 수 있다.
현재와 과거의 SDFT 프레임들이 각각 Yb(k) 및 Yb1(k)라고 정의될 때, 이 프레임들 간 유사도가 인덱스 S로써 계측될 수 있다. S는 식 2에 규정된다.
Figure 112010036058186-pct00002
NL+1은 고주파수 코딩의 한계 주파수에 해당한다. 파라미터 S가 작을수록, 고주파수 스펙트럼들은 더 유사하다.
톤 선택 제어기는 S 값에 의존해 신호 특성 또는 모드를 할당하는 결정 로직을 포함할 수 있다. 더욱이 신호 특성이나 모드는 이하에서 상세히 설명되는 바와 같이 HFR 코더의 나머지를 제어하는데에도 사용된다.
이하에서는 오디오 신호의 두 가지 특성들인 모드들이 정의된 본 발명의 일 실시예를 보인다. 이 특성들이나 모드들은 노멀 또는 톤이다.
S의 값이 소정 문턱치 Slim 이상이면 톤 선택 제어기(303) 내 결정 로직은 노멀의 특성을 할당하도록 (이것이 HFR 코더의 나머지 부분에, 있을 수 있는 어떤 사인파 삽입과 더불어 노멀 코딩이 사용될 것임을 가리킬 수 있음) 구성될 수 있다.
S의 값이 소정 문턱치 Slim 미만이면 톤 선택 제어기(303) 내 결정 로직은 톤의 특성을 할당하도록 (이것이 HFR 코더의 나머지 부분에, 사인파 삽입만을 이용해 오디오 신호가 코딩될 수 있다는 것을 가리킬 수 있음) 구성될 수 있다. 노멀 코딩 모드의 파라미터드을 양자화하는데 아무 비트도 사용되고 있지 않으므로 더 많은 사인파들이 이 모드에서 추가될 수 있다.
두 가지 동작 모드들이 기술되었지만, 톤 선택 제어기는 둘을 초과하는 가능한 동작 모드들 (할당가능한 특성들)을 가질 수 있으며, 그 모드들 각각은 정해진 문턱 영역을 이용하고 HFR 코더의 나머지 부분에 오디오 신호를 어떻게 코딩할지에 대한 지시자를 제공한다.
톤 선택 제어기(303)는 멀티플렉서로 현 프레임에 할당된 특성이나 모드를 전달하여 어떤 동작 모드가 선택되었는지에 대한 표시를 제공하도록 하고, 그 표시 역시 디코더로 전달될 것이다.
모드들의 개수가 보통 적을 것이기 때문에, 그러한 동작 모드들을 부호화하는데 필요로 되는 비트 수도 마찬가지로 적다.
톤 검출 모드 선택이 도 6의 609 단계에서 보인다.
이하의 예는 톤 선택 제어기(303)가, 현재의 프레임에 톤 특성이 규정되었음을 가리키고, 대역 리플리컨트 선택의 동작 (도 6의 611 단계), 대역 리플리컨트 스케일링 (도 6의 613 단계)의 동작, 및 사인파 주입 및 코딩의 동작 (도 6의 615 단계)이 수행되는 경우를 설명한다.
톤 선택 제어기(303)가 오디오 신호는 톤임을 가리키면, 아무런 대역 리플리컨트 선택이나 대역 리플리컨트 스케일링 동작도 수행되지 않고, 다만 사인파 주입 및 코딩 동작만이 수행된다. 리플리컨트 선택 및 리플리컨트 스케일링 동작들에 예비된 비트 할당치가 추가 사인파들의 선택 및 코딩에 사용될 수 있다.
톤 선택 제어기(303)가 오디오 신호는 노멀임을 가리키면, 대역 리플리컨트 선택 및 대역 리플리컨트 스케일링 동작들이 수행된다. 노멀 모드의 성능은 사인파 주입에 의해 추가로 향상될 수 있다.
HFR 대역 리플리컨트 선택기(305)는 고주파 영역의 주파수 서브 대역들 각각의 스펙트럼 성분들 및 저주파 영역 부호화된 신호의 주파수 도메인 표현을 수신하고, 저주파 영역으로부터 고주파 영역 서브 대역들 각각과 매치되는 부분들을 선택한다.
본 발명의 어떤 실시예들에서 가장 가깝게 매치하는 저주파 영역 서브 대역을 판단하기 위해 서브 대역 에너지가 사용된다.
본 발명의 다른 실시예들에서, 고주파 영역 서브 대역들의 상이하거나 추가적인 특성들이 정해지고, 매치되는 저주파 영역의 부분을 서치하는데 사용된다. 다른 특성들에는 비한정적 예들로서 각 서브 대역의 최고점-대-최저점 에너지 비 (peak-to-valley energy ratio) 및 신호 대역폭이 포함된다.
본 발명의 어떤 실시예들에서, HFR 대역 리플리컨트 선택기(305) 내에서의 오디오 신호의 분석은, 부호화된 저주파 영역의 분석 및 오리지널 고주파 영역의 분석을 포함한다. 따라서 본 발명의 또 다른 실시예들에서 에너지 산정기가 부호화된 저주파 신호를 수신하고 그 신호들을 짧은 서브 대역들로 나누어 가령 '전체' 스펙트럼 서브 대역 당 에너지 및/또는 각각의 '전체' 스펙트럼 서브 대역의 최고점-대-최저점 에너지 비를 판단함으로써 유효 스펙트럼 전체의 특성들을 판단하게 된다.
본 발명의 다른 실시예들에서 에너지 산정기는 부호화된 저주파 신호를 더 수신하고 (필요한 경우) 이들을 짧은 서브 대역들로 나누어 분석되도록 한다. 인코더로부터의 저주파 도메인 신호 출력이 이제, 가령 저주파 도메인 서브 대역 당 에너지 및/또는 각각의 저주파 도메인 서브 대역의 최고점-대-최저점 에너지 비율을 판단하기 위해, 고주파 도메인 신호와 비슷한 방식으로 분석된다.
본 발명의 일 실시예에서 HFR 대역 리플리컨트 선택기(305)는 고주파 스펙트럼 값들의 허용가능한 복제본들을 형성하기 위해 전치될 (transposed) 수 있는 저주파 스펙트럼 값들의 선택을 수행한다. WO 2007/052088에 상세히 개시된 것 같은 방법에 사용될 대역들의 수와 폭은 HFR 대역 리플리컨트 선택기(305)에서 정해지거나 고정될 수 있다.
관련된 LFR 스펙트럼 값들의 선택이 도 6의 611 단계에 보인다.
HFR 대역 리플리컨트 스케일러(307)는 또한 선택된 저주파 스펙트럼 값들을 수신하고, 각각의 고주파 영역 주파수 서브 대역과 선택된 저주파 스펙트럼 값들 사이의 차들을 줄이기 위해 그 값들의 스케일링이 이뤄질 수 있는지를 판단한다.
HFR 대역 리플리컨트 스케일러(307)는 본 발명의 어떤 실시예들에서 디코더로 보내지기 위해 필요한 비트 수를 줄이기 위해 스케일링 팩터들의 양자화 같은 부호화를 수행할 수 있다. 선택된 LFR 스펙트럼 값들의 스케일링 값들을 얻기 위해 사용되는 스케일링 팩터들의 표시가 멀티플렉서(311)로 전달된다. 또한 선택된 LFR 스펙트럼 값들의 스케일링된 값들의 복제본이 사인파 주입 선택/인코딩 기기(309)로 보내진다.
리플리컨트 스케일링이 도 6의 613 단계에 보인다.
사인파 주입 및 코더에 의해 수행되는 사인파 주입 및 코딩의 개념은, 사인파들을 추가함으로써 LFR 신호 성분들을 이용해 HFR의 부호화 충실도를 개선하는 것이다. 적어도 한 사인파의 추가가 부호화의 정밀도를 높일 것이다.
예를 들어,
Figure 112010036058186-pct00003
Figure 112010036058186-pct00004
가 각각 현재 부호화된 고주파 영역 스펙트럼 및 오리지널 고주파 영역 스펙트럼을 나타낼 때, 사인파 주입 및 코더(309)는 식 3에서 얻어진 스펙트럼 인덱스 k1에서 최초의 사인파를 추가할 수 있다.
Figure 112010036058186-pct00005
즉, 그 사인파는 오리지널 고주파 영역 스펙트럼 값과 부호화된 고주파 영역 스펙트럼 값 사이의 최대 차를 가진 인덱스에서 삽입될 수 있다.
또, 사인파 주입 및 코더(309)는 식 4에 따라 삽입된 사인파의 진폭을 판단할 수 있다.
Figure 112010036058186-pct00006
사인파 주입 및 코더(309)는 이제 식 5를 이용해 부호화된 고주파 영역 스펙트럼의 업데이트 결과를 도출한다.
Figure 112010036058186-pct00007
사인파 주입 및 코더(309)는 이제 사인파의 선택 및 스케일링 동작들과 부호화된 고주파 영역의 업데이트 동작을 반복해 원하는 수의 사인파들이 추가될 때까지 추가 사인파들을 추가할 수 있다. 본 발명의 바람직한 실시예에서 바람직한 사인파의 수는 넷이다.
본 발명의 어떤 실시예들에서 상기 동작들은, 사인파 주입 및 코더(309)가 오리지널 고주파 영역 신호와 부호화된 고주파 영역 신호 사이의 전반적인 오차가 코딩 에러 문턱치 밑으로 감소 될 때까지 반복된다.
사인파들을 선택하고 스케일링했을 때 사인파 주입 및 코더(309)는 이제 사인파들의 표시가 비트 효율적 방식에 따라 디코더로 전달될 수 있도록, 선택된 사인파들을 코딩하는 동작을 수행한다.
그에 따라 사인파 주입 및 코더(309)는 선택된 사인파들의 진폭 Ai를 양자화하고 그 양자화된 증폭 값들
Figure 112010036058186-pct00008
을 멀티플렉서로 제출한다.
사인파 주입 및 코더(309)는 또한 선택된 사인파나 사인파들의 위치 및/또는 위치들을 부호화할 수 있다.
본 발명의 제1실시예에서, 선택된 사인파의 위치와 부호 (sign)가 양자화된다. 그러나, 위치와 부호의 양자화가 최적이지 못했다는 것을 알게 되었다.
도 8과 관련해, 정현파 주입 및 코더(309)에서 수행된 본 발명의 실시예들에 따른 위치 및 부호 코딩 동작의 결과가 보여진다.
도 8(a)는 MDCT 계수 값들(801)에 의해 표현된 7000Hz부터 7800Hz까지의 통상적 고주파 영역 서브 대역의 스펙트럼 예를 보인 것이다.
도 8(b)는 선택된 사인파가 입력될 수 있는 가능한 위치들이 인덱스 값을 기준으로 보여지는 경우의 예를 보인다. 32 개의 가능한 인덱스 위치들은 거기에 자리한 0개, 1개 혹은 그 이상의 사인파들을 포함할 수 있다.
도 8(c)는 32 개의 가능한 인덱스 위치들이 적어도 두 개의 트랙들로 나눠지는 본 발명의 일실시예를 보인다. 트랙들은 서로 엇갈려 놓여서 (interlaced), 도 8(c)에 도시된 것 같은 두 트랙들을 가진 경우 각 트랙의 각 인덱스는 다른 트랙의 두 인덱스들 사이에 자리하도록 된다. 둘을 넘는 트랙들을 가진 실시예들에서 각각의 인덱스는 다른 트랙들 각각과 한 인덱스 간격으로 떨어져 있다. 예를 들어, 도 8(c)에서 32 개의 가능한 인덱스 위치들은 트랙 1(803)과 트랙 2(806)로 나눠진다.
다른 실시예들은 엇갈려 놓이는 둘을 초과하는 트랙들을 가질 수 있다. 예를 들어, 세 개의 트랙들이 엇가려 놓이는 경우 그 위치는, pos1(n-1), pos2(n-1), pos3(n-1), pos1(n), pos2(n), pos3(n), pos1(n+1), pos2(n+1), pos3(n+1)이 될 수 있고, 여기서 posk(n)는 k 번째 트랙의 n 번째 위치를 말한다.
또 다른 실시예들은 트랙들을 영역들 안에 정렬하여, 각각 총 N개의 위치들을 가진 2 개의 트랙들에 있어서 트랙들이 pos1(1), pos1(2),...,pos1(N), pos2(1), pos2(2),...,pos3(N) 위치들로 정렬될 수 있다.
본 발명의 또 다른 실시예들에서 트랙들은 서브 대역뿐 아니라 전체 주파수 영역을 커버하도록 구성될 수 있다.
사인파 주입 및 코더(309)는 이하의 예 및 도 9를 참조해 설명될 수 있는 바와 같이 이러한 트랙들 내 인덱스들의 분리를 이용해 위치 부호화를 개선시킨다.
도 9(a)는 7000Hz에서 14000Hz까지의 고주파 영역 신호의 스펙트럼을 보인다. 도 9(b)는 단일 트랙 인덱스 방식에서 선택된 사인파들을 보이는데, 여기서는 비트 인코딩 한계치에 도달 전에 8 개의 사인파들이 부호화될 수 있다. 도 9(c)는 본 발명의 실시예에 따른 두 개의 트랙 인덱스 방식에서 선택된 사인파들을 보이며, 여기서는 비트 인코딩 한계치에 도달하기 전에 10 개의 사인파들이 부호화될 수 있다.
HFR 코딩 비트 할당은 보통 본 발명의 실시예들에 있어서 4 kbits/second (또는 프레임 당 80 개의 비트들)이다 (프레임당 약 20 내지 25 개의 비트들이 MDCT 값들이나 사인파 진폭치들을 양자화하는데 사용될 수 있음).
각 서브 대역에 대한 비트 할당이 식 6과 관련해 기술된다:
Figure 112010036058186-pct00009
여기서 Nsin은 선택된 사인파들의 개수이고 Bind 및 Bsign은 각각 위치 (인덱싱) 및 부호 정보를 위해 필요로 하는 비트 개수이다.
도 10(b)와 10(c)에 도시된 예에서, 네 개의 서브 대역 길이들은 각각 64, 64, 64 그리고 32이다.
사인파 주입 및 코더(309)는 도 9(b)에 도시된 실시예에 따라 서브 대역마다 사인파 당 각각 6, 6, 6 및 5의 비트 개수를 할당한다. 이 비트 개수가 각각의 인덱스를 고유하게 규정하며 그에 따라 서브 대역 내 각각의 사인파를 결정한다. 사인파 주입 및 코더(309)는 이제 사인파의 부호, 즉 사인파가 동상인지 180도 벗어난 상인지 여부를 규정할 추가 비트를 할당할 수 있다. 그에 따라 프레임의 비트 레이트가 식 7과 같이 주어진다:
Figure 112010036058186-pct00010
여기서, Nsb ,I는 i 번째 서브 대역내 사인파들의 개수이다. 도 9(b)에서 알 수 있는 바와 같이, Nsb ,1=3, Nsb ,2=3, Nsb ,3=1, Nsb ,4=1이므로, 8 개의 사인파들에 대해 부호화에 필요로 되는 비트들은 55 bits/frame이다.
서브 대역 당 2 개이 트랙들을 이용하는 개선된 부호화 방법에서 사인파 주입 및 코더(309)는 한 서브 대역 내 각각의 사인파에 대해 보다 적은 잠정 개별 위치들로 인해, 그리고 각 트랙 위의 개별 사인파들의 배열시 그 중복으로 인해, 서브 대역마다 사인파별로 사용되는 비트 개수를 줄이게 된다.
사인파들은 각각의 서브 대역 및 트랙 안에서 선택되어, 디코더가 정확한 위치 인덱스를 식별할 수 있도록 알려진 순서에 따라 부호화된다.
비트 절약은, 트랙 상의 사인파들을 선택 및 전송하는 순서와 무관하다는 사실에 기초한다. 단일 트랙 상에서 사인파 위치가 P 및 R (그리고 본 발명의 실시예들에서 부호들은 반대가 되도록 지정될 것이다)인지, R 및 P 인지 (본 발명의 실시예들에서 그 부호들은 동일한 것으로 지정될 것이다) 여부는 문제가 되지 않는다.
서브 대역 당 2 개의 트랙들을 사용하는 개선된 부호화 방법에서 사인파 주입 및 코더(309)는, 한 서브 대역 내 각 사인파에 있어 보다 적은 가능한 개별 위치들로 인해, 그리고 각 트랙 상에서 개별 사인파들의 배치 시의 중복으로 인해, 서브 대역마다 사인파당 사용되는 비트들의 개수를 줄인다.
도 9(c)에서 알 수 있듯이, 제1 및 제2트랙 둘 모두에서 최초의 두 서브 대역들에 대해 2 개의 사인파들을 부호화하는 것이 가능하다. 서브 대역들 3 및 4는 첫 번째 방법과 동일한 수의 사인파들을 가진다. 서브 대역들 1 및 2에서의 각 트랙 (각각 2 개의 사인파들을 포함)의 비트 레이트는 (5+1)+(5+0)이다. 서브 대역 3에 대해 비트 요건은 (6+1)이고 서브 대역 4에 대한 비트 요건은 (5+1)이다. 따라서 10 개의 사인파들에 필요한 총 비트 레이트는 프레임당 57 비트이다. 따라서 사인파 주입 및 코더(309)는 개선된 방식을 통해 프레임당 단 두 개의 비트들만을 써서 두 개의 추가 사인파들을 추가할 수 있다.
첫 번째 및 두 번째 방법들에서의 사인파당 비트 레이트는 이 예에서 각각 6.875 비트 및 5.7 비트이다.
사인파 주입 및 코더(309)는 서브 대역 길이에 따라 서브 대역 내에서 사용될 트랙들의 수를 선택할 수 있다. 서브 대역 사이즈가 적응적인 경우 (즉, 프레임 별로 변경될 수 있는 경우), 선택된 길이는 성능 개선이 이뤄진 방법을 제공할 것이다.
예를 들어 32라는 서브 대역 길이는 16짜리 두 트랙들로 쉽게 분할될 수 있다. 마찬가지로, 48이라는 길이도 16짜리 세 트랙들로 분할될 수 있다. 64의 길이는 32짜리 2 트랙들이나 16짜리 4 트랙들로 나눠질 수 있다. 그 선택은 가능한 비트 레이트에 따라 결정될 수 있다.
사인파 주입 및 코더(309)는 연속적인 사인파들의 주입을 허용하는 트랙의 구조를 선택할 수 있고 바람직하게는 한 개를 초과하는 사인파가 각 트랙 상에 배치될 수 있다.
따라서, 가령 각 트랙으로부터 두 개의 사인파들이 선택되는 본 발명의 실시예들에서, 트랙들의 배치는, 가능한 사인파 위치들 P 및 P+1 (이것은 인지적으로 중요함)이 둘 모두 선택될 수 있도록 상이한 트랙들 안에 있게 선택될 수 있다.
주파수 서브 대역 길이 (가변적인 경우)는 고주파 영역의 전체 에너지가 프레임별로 그다지 변동되지 않게 선택되어야 한다.
따라서 트랙 인덱스들로 환산하여 삽입된 사인파들의 위치 부호화는 위에서 알 수 있는 바와 같이 어떤 주입된 사인파들을 가리키는데 필요한 코딩 레이트를 개선시킨다.
본 발명의 다른 실시예들에서 사인파 주입 및 코더(309)는 주입된 사인파들의 위치들에 대한 부호화를 더 개선시킬 것이다.
본 발명의 어떤 실시예들에서, 사인파 주입 및 코더(309)는 인지적으로 가장 중요한 사인파들의 위치들 및 진폭들을 결정한 후에 그 사인파들의 부분집합 간 위치의 상대적 차이를 분석한다. 이러한 상대적 위치들은 여기서, 사인파들의 배열이 소수의 비트들 만을 사용해 부호화될 수 있는지를 판단하는데 사용된다. 사인파들의 배열에서 검출된 패턴이 없으면, 앞서 기술한 사인파들의 위치 부호화 방식들 중 하나가, 선택된 사인파들의 위치 부호화에 사용될 수 있다.
앞서 기술되었다시피, 부호화된 고주파 영역은 일련의 주파수 서브 대역들로 나눠질 수 있다. 그런 다음 각각의 주파수 서브 대역이 서치되어, 각각의 주파수 서브 대역 안에서 선택된 사인파들이 삽입될 위치들을 결정하도록 할 수 있다. 선택된 사인파들이, 오리지널 고주파 영역 신호와 비교할 때 부호화된 고주파 영역의 정확도를 향상시킬 것이다.
본 발명의 제1실시예에서, 주파수 서브 대역들의 개수는 6으로 나눠질 수 있다. 본 발명의 다른 실시예들에서 서브 대역들의 개수는 앞서 기술된 바와 같이 가변적일 수 있다.
서브 대역들 각각에 대해 사인파 주입 및 코더(309)는 각 서브 대역 안에서 선택된 사인파들과 그들의 위치를 비교하여 어느 것이 구조상 시작 포인트로 간주될 것인가를 판단한다. 예를 들어 본 발명의 일 실시예에서 사인파 주입 및 코더(309)는 시작 포인트 사인파로서 최저 주파수를 가진 선택된 사인파를 택한다. 본 발명의 다른 실시예들에서 선택된 시작 포인트 사인파는 서브 대역 안에서 정중앙의 (median) 사인파나 더 높은 주파수의 사인파가 된다.
일단 시작 포인트 사인파가 선택되면, 그 서브 대역 내에서 시작 포인트 위치와 다른 선택된 사인파 위치들 사이의 차가 검증된다. 서브 대역 안에서 시작 포인트 위치 및 선택된 나머지 사인파들과의 어떤 관계가 이제 코딩될 것이다.
예를 들어 서브 대역 안에서 제1사인파가 인덱스 5에 위치하고, 두 개의 다른 사인파들이 인덱스 위치 12와 19에 위치하는 경우, 사인파 주입 및 코더(309)는 그 사인파들의 위치를 절대 인덱스 5로서 부호화하고 그런 다음 상대적인 인덱스 7과 거기서 다시 상대 인덱스 7로서 부호화한다. 본 발명의 다른 실시예들에서 사인파 주입 및 코더(309)는 구조(3) 내 절대 인덱스(5), 상대 인덱스(7) 그리고 사인파들의 총 수를 부호화한다.
또한 위에서 제시된 예는, 주파수 서브 대역 당 선택된 사인파들의 수가 늘어날수록 더 효율적일 것이다. 위에서 보인 절대, 상대, 상대 코딩 실시예에 대한 이러한 효율성은 사인파들 간 평균 거리가 더 많은 사인파들이 추가될 수록 감소되고 그에 따라 사인파들 사이의 상대적 거리를 부호화하는데 필요한 평균 비트 수가 감소되어 사인파당 표시 비트들의 필요 개수를 줄일 수 있기 때문이다.
절대, 상대, 총 코딩 실시예에서도 마찬가지로, 선택된 사인파들의 개수가 늘어날수록 사인파당 평균 비트 수가 줄어드는데 이는 각각의 추가 (extra) 사인파는 총 카운트의 증가만을 요하기 때문이다.
총 사인파들의 수가 한정되어 있을 때 선택된 사인파들을 서치하여 상대적 차이를 판단하기 위해 사인파 주입 및 코더(309)가 필요로 될 것이지만, 이러한 복잡도의 증가는 그다지 부담스러운 것이 못된다.
본 발명의 다른 실시예들에서, 사인파 주입 및 코더(309)는 시작 포인트 사인파를 이용하고 서브 대역 안에서 그 시작 포인트와 관련된 사인파들을 서치하여, 소정 후보 구조와 매치하거나 가장 근사하게 매치하는 사인파 구조를 판단한다.
본 발명의 실시예들에 따르면 사인파 구조를 결정하는데 사용되는 기준은 선택가능하거나 가변적일 수 있다. 예를 들어, 사인파 주입 및 코더(309)는 일 실시예에서 단순히 가장 많은 수의 매치하는 사인파들을 가지거나 후보 사인파 매칭의 중요도를 가진 구조 (가령, 한 구조가 '매치하는' N 개의 사인파들을 가지는 한편 다른 한 구조는 '매치하는' N-1개의 후보를 가지는 경우, N-1 후보가 선택될 수 있는데 이는 그 후보 구조가 인지적으로 중요한, 선택된 사인파들에 보다 정확히 매치하기 때문이다)를 선택할 것이다.
또한, 사인파 주입 및 코더(309)는 사인파들 각각의 부호 정보를 포함하고 상술한 바와 같이 사인파 진폭들을 (가령, 진폭을 나타내기 위해 사용되는 비트 수를 줄이기 위한 벡터 양자화를 이용하여) 부호화할 수 있다.
본 발명의 일부 실시예들에서, 사인파 주입 및 코더(309)는 구조들이 같은 수의 '매치하는' 사인파들을 가지는 경우, 고주파 영역의 낮은 주파수대들에서 더 많이 '매치하는' 사인파들을 가지는 매치를 선택할 수 있다.
본 발명의 다른 실시예들에서, 사인파 주입 및 코더(309)는 시작 포인트 사인파의 후보들 및 관련 인덱스를 선택한 후, 소정 사인파 위치 템플릿을 이용하는데 그로부터 사인파 위치/인덱스들로부터의 편차가 검출된다. 검출된 편차들은 본 발명의 일 실시예에서, 작은 위치 편차 코드북이라고도 알려진 소정 편차들의 룩업 테이블을 서치하고 그런 다음 그 편차로부터 관련된 코드를 출력함으로써 부호화될 수 있다.
이 실시예에서 사인파 주입 및 코더(309)가 잠정적 사인파들과 관련해 보다 큰 융통성을 가지지만, 편차들을 서치하는 것은 필요한 서칭 프로세싱을 증대시키게 된다.
본 발명은 최적의 사인파들의 실제 위치들을 보다 정밀하게 가리킬 수 있는 결과를 도출하는 한편, 각각의 사인파와 관련된 비트 레이트 역시 증가시킨다. 따라서, 이러한 추가 실시예가 보다 낮은 비트 레이트들에 사용되는 데 있어 가장 효율적이라고는 할 수 없다. 또, 이 실시예는 훨씬 더 많은 프로세서 자원들을 사용할지도 모르는데 이는 구조 및 오차들이 서치되거나 부호화되어야 하기 때문이다.
앞서 기술된 실시예들과 관련된 다른 실시예들에서, 사인파 주입 및 코더(309)는 사인파 구조나 편차 및 부호화될 사인파 구조나 편차 사이에서 작은 정도의 오차를 감당할 수 있다. 즉, 구조 및 편차 위치들 모두의 서치 및 부호화의 속도를 높이기 위해, 그 구조로부터 한정된 구조들 및/또는 편차들의 부분 집합이 서치된다. 이 실시예는, 부호화의 속도와 사인파당 비트 레이트가 최적화되어야 하고 사인파의 구조 및/또는 편차의 오차가 허용가능하거나 용인될 수 있는 경우에 허용될 수 있다.
그러나, 그러한 실시예들은, 프레임에서 프레임으로 사인파 위치들의 연장된 쉬프트나 변동이 인지될 수 있는 정도의 오차를 만들 수 있다는 것을 고려해야 한다.
상기 예들은 주파수 서브 대역 당 수행된다고 기술하고 있지만, 그 예들은 전체 고주파 영역 신호에 걸쳐 동시에 적용될 수도 있다. 따라서, 고정되거나 가변적인 구조에 대한 상관 코딩 (relational coding), 구조적 코딩 (structural coding), 및 작은 편차 코딩이 전체 고주파 영역 신호인 서브 대역에 대해 수행될 수 있다.
그런 다음 사인파 표시 정보는 멀티플렉서(311)로 전달되어 비트스트림 출력에 포함될 수 있다.
사인파들의 선택 및 부호화 동작이 도 6의 615 단계에 도시된다.
비트스트림 포매터(234)가 저주파 코더(231) 출력, 고주파 영역 프로세서(232) 출력을 수신하고, 그 비트스트림을 포맷해 비트스트림 출력을 생성한다. 본 발명의 일부 실시예들에서 비트스트림 포매터(234)는 수신된 입력들을 인터리브 (interleave) 할 수 있고, 비트스트림 출력(112)에 삽입될 에러 검출 및 에러 정정 코드들을 생성할 수 있다.
HFR 코더(232) 및 LFR 코더(231) 정보를 출력 비트스트림에 멀티플렉싱하는 단계가 도 6의 617 단계에 보여진다.
본 발명의 이해를 더 돕기 위해, 본 발명의 실시예들과 관련한 디코더(108)의 동작이 도 5에 개략적으로 도시된 디코더 및 도 7의 디코더 동작을 보인 흐름도와 관련해 보여진다.
디코더는 부호화된 비트스트림(112)이 수신될 입력부(413)를 포함한다. 입력부(413)는 비트스트림 언팩커 (unpacker)(401)에 연결된다.
비트스트림 언패커는 부호화된 비트스트림(112)을 세 개의 독립된 비트스트림들로 다중화해제 (demultiplex)하거나, 분할하거나, 언팩 (unpack)한다. 저주파 부호화된 비트스트림은 저주파 디코더(403)로 보내지고, 스펙트럼 대역 복제 비트스트림은 고주파 재구성기(407) (고주파 영역 디코더라고도 알려짐)로 보내지며, 제어 데이터가 디코더 제어기(405)로 보내진다.
이러한 언팩 프로세스가 도 7의 701 단계에 보인다.
저주파 영역 디코더(403)는 저주파 부호화된 데이터를 수신하고 저주파 영역 코더(231)에서 수행된 프로세스의 역 프로세스를 수행함으로써 합성 저주파 신호를 생성한다. 이 합성 저주파 신호는 고주파 영역 디코더(407) 및 재구성 디코더(409)로 전달된다.
이러한 저주파 영역 디코딩 프로세스는 도 7의 707 단계에 보여진다.
디코더 제어기(405)는 비트스트림 언패커(401)로부터 제어 정보를 수신한다. 본 발명과 관련해 디코더 제어기(405)는, HFR 대역 리플리컨트 선택 프로세서(305) 및 HFR 대역 리플리컨트 스케일링 프로세서(307)와 관련해 앞서 기술한 바와 같이 HFR 코딩 프로세스에서 스펙트럼 복제가 사용되었는지 여부와 관련한 정보를 수신한다. 이 방법을 이용해 HFR 영역을 재구성함에 있어 HFR 디코더를 구성하는데 필요로 되는 임의의 특정 정보는 이제 HFR 디코더로 보내지고, 그 방법은 이하에서 기술되는 것처럼 705 단계를 포함한다.
또, 디코더 제어기(405)는 HFR 코더 및 HFR 사인파 주입 및 코더(309)에서 선택된 임의의 사인파 선택 및 주입 프로세스들과 관련해 비트스트림 언패커(401)로부터 제어 정보를 수신한다.
HFR 디코더의 설정이 도 7의 703 단계에 보인다.
본 발명의 어떤 실시예들에서 디코더 제어기(405)는 고주파 디코더(407)의 일부일 수 있다.
HFR 디코더(407)는 가령 대역 선택 정보에 의해 표시된 대역들과 관련해 고주파 재구성 비트스트림에 의해 표시된 합성 저주파 신호로부터 저주파 성분들을 복제 및 스케일링함으로써 리플리컨트 HFR 재구성 동작을 수행할 수 있다. 이 동작은 디코더 제어기(405)에 의해 제공되는 정보에 의존해 수행된다.
이 고주파 복제 구성 또는 고주파 재구성이 도 8의 705 단계에서 보인다.
HFR 디코더(407)는 또 디코더 제어기(405)에 의해 제공된 정보에 의존해 HFR 재구성 동작의 정확도를 향상시키기 위한 사인파 선택 및 주입 동작을 수행할 수 있다. 따라서, 본 발명의 실시예에 따르면 디코더 제어기(405)는 HFR 디코더(407)를 제어해 아무 사인파들이나 추가하지 않고, 디코더 제어기(405)에 의해 표시된 비트스트림 포맷에 따른 사인파들을 추가하도록 할 수 있다. 그에 따라 비한정적 예들로서, 제공된 인덱스 및 트랙 정보, 사인파 정렬 구조, 사인파 배열의 상대적 간격, 및 고정되거나 가변되는 사인파들의 배열이나 구조에 따라 사인파들을 삽입하는 단계가 포함된다.
사인파 동작의 주입이 도 7의 709 단계에 보인다.
재구성된 고주파 성분의 비트스트림은 재구성 디코더(409)로 전달된다.
재구성 디코더(409)는 복호화된 저주파 비트스트림과 재구성된 고주파 비트스트림을 수신해, 오리지널 신호를 나타내는 비트스트림을 생성하도록 하고, 디코더 출력부(415)로 출력 오디오 신호(114)를 출력한다.
이러한 신호의 재구성이 도 8의 711 단계에서 보인다.
상술한 본 발명의 실시예들은 수반되는 프로세스들의 이해를 돕기 위해, 독자적인 인코더(104) 및 디코더(108) 장치로 표현된 코덱을 개시하였다. 그러나, 그 장치, 구조 그리고 동작들이 하나로 된 인코더-디코더 장치/구조/동작으로서 구현될 수도 있다는 것을 예상할 수 있을 것이다. 또, 본 발명의 일부 실시예들에서 코더와 디코더는 공통되는 일부 혹은 전체 구성요소들을 공유할 수도 있다.
상기 예들은 전자 기기(10) 안에서의 코덱 내에서 동작하는 발명의 실시예들을 개시하고 있으나, 이하에 기술되는 바와 같이 본 발명이 임의의 가변 레이트/적응적 레이트 오디오 (또는 스피치) 코덱의 일부로서 구현될 수 있다는 것을 알 수 있을 것이다. 그에 따라, 이를테면 본 발명의 실시예들은 고정 혹은 유선 통신 경로들을 통한 오디오 코딩을 구현할 수 있는 오디오 코덱 안에서 구현될 수 있다.
따라서 사용자 기기는 상기 본 발명의 실시예들에 개시된 것 같은 오디오 코덱을 구비할 수 있다.
사용자 기기라는 용어는 모바일 전화기들, 휴대형 데이터 프로세싱 기기들 또는 휴대형 웹 브라우저들 같은 임의의 알맞은 타입의 사용자 무선 기기를 포괄하도록 의도되었음을 알아야 한다.
또, 공공 육상 모바일 네트워크 (PLMN, public land mobile network)의 구성요소들 역시 상술한 것 같은 오디오 코덱들을 구비할 수 있다.
일반적으로, 본 발명의 다양한 실시예들은 하드웨어나 특수 용도의 회로들, 소프트웨어, 로직, 혹은 이들의 임의의 결합형태 안에서 구현될 수 있다. 예를 들어 일부 양태들은 하드웨어 안에서 구현되고, 다른 양태들은 비한정적 예들로서 콘트롤러, 마이크로프로세서 또는 다른 컴퓨팅 기기에 의해 실행될 수 있는 펌웨어나 소프트웨어를 통해 구현될 수 있다. 본 발명의 다양한 양태들이 블록도들, 흐름도들로서, 혹은 어떤 다른 묘사적 표현을 이용해 도시되고 설명되었지만, 여기 개시된 이러한 블록들, 장치, 시스템들, 기술들 또는 방법들은 비한정적 예들로서 하드웨어, 소프트웨어, 펌웨어, 특수 용도의 회로들이나 로직, 범용 하드웨어나 콘트롤러 또는 컴퓨팅 기기들, 아니면 이들의 어떤 결합 형태들 안에서 구현될 수 있다는 것을 잘 알 수 있을 것이다.
본 발명의 실시예들은 프로세서 엔티티 같은 모바일 기기의 데이터 프로세서에 의해서 실행될 수 있는 컴퓨터 소프트웨어나, 하드웨어, 혹은 소프트웨어 및 하드웨어가 결합 된 것에 의해 구현될 수 있다. 또, 이와 관련하여 도면들에서와 같은 로직 흐름의 어떤 블록들은 프로그램 단계들, 상호연결된 로직 회로들, 블록들 및 기능들, 혹은 프로그램 단계들과 로직 회로들 블록들 및 기능들이 결합된 것을 나타낼 수 있다.
메모리는 반도체 기반 메모리 장치들, 마그네틱 메모리 장치들 및 시스템들, 광학 메모리 장치들 및 시스템들, 고정형 메모리 및 탈부착형 메모리 같은 임의의 적절한 데이터 저장 기술을 이용해 구현될 수 있다. 데이터 프로세서들은 로컬 기술 환경에 적합한 어떠한 타입에나 해당할 수 있고, 비한정적 예들로서, 일반 범용 컴퓨터들, 특수 용도의 컴퓨터들, 마이크로프로세서들, DSP들 (digital signal processors) 및 멀티-코어 프로세서 아키텍처에 기반하는 프로세서들 가운데 하나 이상을 포함할 수 있다.
본 발명의 실시예들은 집적 회로 모듈들 같은 다양한 구성소자들 안에서 실시될 수 있다. 집적 회로 설계는 대체로 고도로 자동화된 프로세스이다. 종합적이고 강력한 소프트웨어 툴들이 사용되어 로직 레벨 디자인을 반도체 기판 위에서 에칭 및 형성될 준비가 된 반도체 회로 디자인으로 변환한다.
캘리포니아주 마운틴 뷰의 Synopsys 사와 캘리포니아주 산호세의 Cadence Design에 의해 제공되는 것들 같은 프로그램들은 잘 설정된 디자인 규칙들 및 미리 저장된 디자인 모듈들의 라이브러리들을 사용해 반도체 칩 위에서 자동으로 도선들을 라우팅하고 소자들을 배치한다. 반도체 회로의 설계가 완료되었으면, 규격화된 전자 포맷 (가령, Opus, GDSII 등등)으로 된 그에 따른 디자인이 반도체 제조 시설이나 제조 "공장"으로 보내질 것이다.
상술한 설명은, 전형적이고 비한정적인 예들을 들어 본 발명의 전형적 실시예에 대한 충분하고도 정보가치가 있는 내용을 제공하였다. 그러나, 관련 분야의 기술자들이라면 상술한 설명이 첨부된 도면들과 부가된 청구항들과 함께 읽혀질 때 다양한 변형과 적응 버전들이 가능하다는 것을 명확히 알 수 있을 것이다. 본 발명의 가르침에 대한 그러한 모든 비슷한 변형 버전들 또한 부가된 청구항들에 정의된 본 발명의 범주 안에 포함될 것이다.

Claims (56)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화하는 인코더에 있어서, 상기 인코더는
    적어도 두 개의 상기 단일 주파수 성분들을 선택하고;
    상기 적어도 두 개의 상기 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하도록 구성됨을 특징으로 하는 인코더.
  32. 제31항에 있어서,
    적어도 한 추가 단일 주파수 성분을 선택하도록 추가 구성될 수 있고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성되고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분, 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨을 특징으로 하는 인코더.
  33. 제31항 또는 제32항에 있어서, 상기 지시자는 상기 적어도 두 개의 단일 주파수 성분들 중 하나의 주파수에 종속되도록 추가 구성됨을 특징으로 하는 인코더.
  34. 제31항 또는 제32항에 있어서,
    상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 결정하도록 추가 구성됨을 특징으로 하는 인코더.
  35. 제34항에 있어서,
    상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 대한 주파수 간격 값들의 리스트를 서치하고;
    상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 보다 가깝게 매치하는 리스트 중 하나를 선택하도록 추가 구성되고,
    상기 지시자는 주파수 간격 값들의 리스트 중 선택된 하나에 종속됨을 특징으로 하는 인코더.
  36. 제35항에 있어서,
    상기 주파수 간격 값들의 리스트 중 상기 선택된 하나 및 상기 결정된 주파수 간격 값 사이의 차를 판단하도록 추가 구성될 수 있고,
    상기 지시자는 상기 차에 추가 종속됨을 특징으로 하는 인코더.
  37. 제36항에 있어서,
    상기 주파수 간격 값들의 리스트 중 상기 선택된 하나 및 상기 결정된 주파수 간격 값 사이의 상기 판단된 차에 대한 차이 값들의 추가 리스트를 검색하고;
    상기 차이 값들의 추가 리스트 중 상기 결정된 차이 값에 보다 가깝게 매치하는 하나를 선택하도록 추가 구성되고,
    상기 지시자는 상기 차이 값들의 추가 리스트 중 선택된 하나에 종속됨을 특징으로 하는 인코더.
  38. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화하는 방법에 있어서,
    적어도 두 개의 상기 단일 주파수 성분들을 선택하는 단계;
    상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하는 단계를 포함함을 특징으로 하는 부호화 방법.
  39. 제38항에 있어서,
    적어도 한 추가 단일 주파수 성분을 선택하는 단계를 더 포함하고,
    상기 지시자는 상기 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성되고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분, 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성됨을 특징으로 하는 부호화 방법.
  40. 제38항 또는 제39항에 있어서, 상기 지시자는 상기 적어도 두 개의 단일 주파수 성분들 중 하나의 주파수에 종속되도록 추가 구성됨을 특징으로 하는 부호화 방법.
  41. 제38항 또는 제39항에 있어서,
    상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 결정하는 단계를 더 포함함을 특징으로 하는 부호화 방법.
  42. 제41항에 있어서,
    상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 대한 주파수 간격 값들의 리스트를 서치하는 단계; 및
    상기 결정된 두 개의 단일 주파수 성분들 사이의 주파수 간격에 보다 가깝게 매치하는 리스트 중 하나를 선택하는 단계를 더 포함하고,
    상기 지시자는 주파수 간격 값들의 리스트 중 선택된 하나에 종속됨을 특징으로 하는 부호화 방법.
  43. 제42항에 있어서,
    상기 주파수 간격 값들의 리스트 중 상기 선택된 하나 및 상기 결정된 주파수 간격 값 사이의 차를 판단하는 단계를 더 포함하고,
    상기 지시자는 상기 차에 추가 종속됨을 특징으로 하는 부호화 방법.
  44. 제43항에 있어서,
    상기 주파수 간격 값들의 리스트 중 상기 선택된 하나 및 상기 결정된 주파수 간격 값 사이의 상기 판단된 차에 대한 차이 값들의 추가 리스트를 검색하는 단계; 및
    상기 차이 값들의 추가 리스트 중 상기 결정된 차이 값에 보다 가깝게 매치하는 하나를 선택하는 단계를 더 포함하고,
    상기 지시자는 상기 차이 값들의 추가 리스트 중 선택된 하나에 종속됨을 특징으로 하는 부호화 방법.
  45. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화한 오디오 신호를 복호화하기 위한 디코더에 있어서,
    적어도 두 개의 상기 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하고;
    상기 수신된 지시자에 종속된 상기 적어도 두 개의 단일 주파수 성분들을 삽입하도록 구성됨을 특징으로 하는 디코더.
  46. 제45항에 있어서, 상기 적어도 한 지시자는 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성되고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성되고, 상기 디코더는 상기 지시자에 종속되는 상기 적어도 한 추가 단일 주파수 성분을 삽입하도록 추가 구성됨을 특징으로 하는 디코더.
  47. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화한 오디오 신호를 복호화하기 위한 방법에서,
    적어도 두 개의 상기 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하는 단계; 및
    상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하는 단계를 포함함을 특징으로 하는 복호화 방법.
  48. 제47항에 있어서, 상기 적어도 한 지시자는 적어도 한 추가 단일 주파수 성분을 나타내도록 추가 구성되고, 상기 지시자는 상기 적어도 한 추가 단일 주파수 성분 및 상기 적어도 두 개의 단일 주파수 성분들 중 하나와의 사이의 주파수 간격에 종속되도록 추가 구성되고, 상기 방법은 상기 지시자에 의존해 상기 적어도 한 추가 단일 주파수 성분을 삽입하는 단계를 더 포함함을 특징으로 하는 복호화 방법.
  49. 제31항 또는 제32항에 따른 인코더를 포함함을 특징으로 하는 이동 통신 장치.
  50. 제45항 또는 제46항에 따른 디코더를 포함함을 특징으로 하는 이동 통신 장치.
  51. 제31항 또는 제32항에 따른 인코더를 포함함을 특징으로 하는 전자 기기.
  52. 제45항 또는 제46항에 따른 디코더를 포함함을 특징으로 하는 전자 기기.
  53. 컴퓨터에 의해 실행되어 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품을 저장한 컴퓨터 판독가능 저장매체에 있어서, 상기 부호화 방법은,
    적어도 두 개의 상기 단일 주파수 성분들을 선택하는 단계; 및
    상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하는 단계를 포함함을 특징으로 하는 컴퓨터 판독가능 저장매체.
  54. 컴퓨터에 의해 실행되어 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화한 오디오 신호를 복호화하는 방법을 수행하도록 구성된 컴퓨터 프로그램 제품을 저장한 컴퓨터 판독가능 저장매체에 있어서, 상기 복호화 방법은,
    적어도 두 개의 상기 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하는 단계; 및
    상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하는 단계를 포함함을 특징으로 하는 컴퓨터 판독가능 저장매체.
  55. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화하기 위한 인코더에 있어서,
    적어도 두 개의 상기 단일 주파수 성분들을 선택하기 위한 선택 수단; 및
    상기 적어도 두 개의 단일 주파수 성분들을 나타내도록 구성되고, 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격 (frequency separation)에 종속되도록 구성되는 지시자를 생성하도록 하는 지시자 생성 수단을 포함함을 특징으로 하는 인코더.
  56. 오디오 신호의 저 주파수 영역을 부호화하고, 톤 선택 제어기가 오디오 신호가 톤임을 나타내면 단일 주파수 성분 주입 및 코딩 동작을 실행하고, 상기 톤 선택 제어기가 오디오 신호가 노멀임을 나타내면 대역 리플리컨트 선택, 대역 리플리컨트 스케일링 및 단일 주파수 성분 주입을 실행하여 오디오 신호의 고 주파수 영역을 부호화한 오디오 신호를 복호화하기 위한 디코더에 있어서,
    적어도 두 개의 상기 단일 주파수 성분들을 나타내고 상기 두 개의 단일 주파수 성분들 사이의 주파수 간격을 나타내는 적어도 한 지시자를 수신하기 위한 수신 수단; 및
    상기 수신된 지시자에 의존해 상기 적어도 두 개의 단일 주파수 성분들을 삽입하도록 하는 삽입 수단을 포함함을 특징으로 하는 디코더.
KR1020107012418A 2007-11-06 2007-11-06 인코더 KR101238239B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2007/061917 WO2009059633A1 (en) 2007-11-06 2007-11-06 An encoder

Publications (2)

Publication Number Publication Date
KR20100086033A KR20100086033A (ko) 2010-07-29
KR101238239B1 true KR101238239B1 (ko) 2013-03-04

Family

ID=39530868

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107012418A KR101238239B1 (ko) 2007-11-06 2007-11-06 인코더

Country Status (9)

Country Link
US (1) US9082397B2 (ko)
EP (1) EP2212884B1 (ko)
KR (1) KR101238239B1 (ko)
CN (1) CN101896967A (ko)
BR (1) BRPI0722269A2 (ko)
CA (1) CA2704812C (ko)
RU (1) RU2483368C2 (ko)
TW (1) TWI492224B (ko)
WO (1) WO2009059633A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
WO2009113316A1 (ja) * 2008-03-14 2009-09-17 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
EP2398017B1 (en) * 2009-02-16 2014-04-23 Electronics and Telecommunications Research Institute Encoding/decoding method for audio signals using adaptive sinusoidal coding and apparatus thereof
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8805680B2 (en) * 2009-05-19 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
EP2706529A3 (en) 2009-12-07 2014-04-02 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP2012134848A (ja) * 2010-12-22 2012-07-12 Sony Corp 信号処理装置、及び信号処理方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
DK3998607T3 (da) * 2011-02-18 2024-04-15 Ntt Docomo Inc Taleafkoder
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9436250B1 (en) 2011-12-19 2016-09-06 Altera Corporation Apparatus for improving power consumption of communication circuitry and associated methods
CN102769591B (zh) * 2012-06-21 2015-04-08 天地融科技股份有限公司 音频通信调制方式自适应的方法、系统、装置、电子签名工具
CN105408957B (zh) 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
JP2016038435A (ja) 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3353783B1 (en) 2015-09-25 2019-12-11 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
TWI806210B (zh) * 2021-10-29 2023-06-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印處理裝置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058571B2 (en) * 2002-08-01 2006-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US184363A (en) * 1876-11-14 Improvement in machines for sticking nails in heel-blanks
US277039A (en) * 1883-05-08 Bridge
US65783A (en) * 1867-06-11 Improvement in breech-loading fibs-arms
US5144671A (en) 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
SE504397C2 (sv) 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US6434246B1 (en) 1995-10-10 2002-08-13 Gn Resound As Apparatus and methods for combining audio compression and feedback cancellation in a hearing aid
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
US5825320A (en) 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
JP3328532B2 (ja) 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US20020169603A1 (en) 2001-05-04 2002-11-14 Texas Instruments Incorporated ADC resolution enhancement through subband coding
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
RU2005114916A (ru) * 2002-10-17 2005-10-10 Конинклейке Филипс Электроникс Н.В. (Nl) Синусоидальное кодирование звука с обновлением фазы
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7640156B2 (en) 2003-07-18 2009-12-29 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
KR100723400B1 (ko) 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
KR100707177B1 (ko) 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US20060184363A1 (en) 2005-02-17 2006-08-17 Mccree Alan Noise suppression
US20060224390A1 (en) * 2005-04-01 2006-10-05 Pai Ramadas L System, method, and apparatus for audio decoding accelerator
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
EP1943643B1 (en) * 2005-11-04 2019-10-09 Nokia Technologies Oy Audio compression
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP2458588A3 (en) * 2006-10-10 2012-07-04 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JPWO2008053970A1 (ja) * 2006-11-02 2010-02-25 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
US20100280830A1 (en) * 2007-03-16 2010-11-04 Nokia Corporation Decoder
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
KR20100086000A (ko) 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
KR101712101B1 (ko) * 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
US8000968B1 (en) * 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058571B2 (en) * 2002-08-01 2006-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression

Also Published As

Publication number Publication date
TW200931397A (en) 2009-07-16
BRPI0722269A2 (pt) 2014-04-22
WO2009059633A1 (en) 2009-05-14
CN101896967A (zh) 2010-11-24
TWI492224B (zh) 2015-07-11
RU2483368C2 (ru) 2013-05-27
CA2704812A1 (en) 2009-05-14
RU2010123728A (ru) 2011-12-20
US20100250261A1 (en) 2010-09-30
KR20100086033A (ko) 2010-07-29
US9082397B2 (en) 2015-07-14
EP2212884A1 (en) 2010-08-04
CA2704812C (en) 2016-05-17
EP2212884B1 (en) 2013-01-02

Similar Documents

Publication Publication Date Title
KR101238239B1 (ko) 인코더
KR101161866B1 (ko) 오디오 코딩 장치 및 그 방법
CN1878001B (zh) 对音频数据编码及解码的设备及方法
CA2895916C (en) Frequency segmentation to obtain bands for efficient coding of digital media
KR100958144B1 (ko) 오디오 압축
CA2612474C (en) Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7460990B2 (en) Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN101583994B (zh) 对音频和/或语音信号进行编码和/或解码的方法和设备
KR20100093504A (ko) 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
US9230551B2 (en) Audio encoder or decoder apparatus
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
WO2009059632A1 (en) An encoder
KR20100124678A (ko) 계층형 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
CN102568489B (zh) 编码器

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160119

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170119

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180201

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190129

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200129

Year of fee payment: 8