KR20040060946A - 오디오 코더에서의 사인곡선의 파라미터의 추적 - Google Patents

오디오 코더에서의 사인곡선의 파라미터의 추적 Download PDF

Info

Publication number
KR20040060946A
KR20040060946A KR10-2004-7006049A KR20047006049A KR20040060946A KR 20040060946 A KR20040060946 A KR 20040060946A KR 20047006049 A KR20047006049 A KR 20047006049A KR 20040060946 A KR20040060946 A KR 20040060946A
Authority
KR
South Korea
Prior art keywords
sinusoidal
frequency
segment
trajectory
component
Prior art date
Application number
KR10-2004-7006049A
Other languages
English (en)
Inventor
덴브링커알버터스씨.
게리츠안드리스제이.
슈이저스에릭지.피.
호토제라드에이치.
호페크리스토프에이.비.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20040060946A publication Critical patent/KR20040060946A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

오디오 신호(x)의 코딩이 제공되는데, 연속하는 세그먼트로부터의 적절한 사인곡선으로부터의 사인곡선의 파라미터가 링크되는 사인곡선의 코더(13)의 추적 알고리즘에서 이 신호의 사인곡선 성분의 주파수 변동의 지시자(ai, Plk)가 사용된다. 다항식 근사 또는 워프 인자와 같은 지시자를 적용함으로써, 보다 정확한 궤적이 얻어진다. 과 같은 또한, 더 나은 오디오 품질이 향상된 위상 연속에 의해 얻어질 수 있다.

Description

오디오 코더에서의 사인곡선의 파라미터의 추적{Tracking of sinusoidal parameters in an audio coder}
파라미터 코딩 방식(parameter coding scheme) 특히 사인곡선의 코더(sinusoidal coder)는 PCT 특허 공개 공보 WO 00/79519-A1호(대리인 문서번호 N 017502)와 2001년 4월 18일자 출원된 유럽 특허 출원 제01201404.9호(대리인 문서번호 PHNL010252)에 개시되어 있다. 이 코더에 있어서, 오디오 세그먼트 또는 프레임은 진폭, 주파수 및 위상 파라미터로 표현되는 다수의 사인곡선을 사용하는 사인곡선의 코더에 의해 모델화된다. 한 세그먼트에 대한 사인곡선이 추정되면, 추적 알고리즘(tracking algorithm)이 시작된다. 이 알고리즘은 세그먼트 대 세그먼트에 기초하여(segment-to-segment basis) 사인곡선의 상호 링크를 시도한다. 연속하는 세그먼트로부터의 적절한 사인곡선으로부터의 사인곡선의 파라미터는 이렇게 링크되어 소위 궤적(tracks)을 획득한다. 링크 기준(linking criterion)은 두 후속하는 세그먼트의 주파수에 기초하며, 진폭 및/또는 위상 정보가 사용될 수도 있다. 이 정보는 링크될 사인곡선을 결정하는 비용 함수에서 결합된다. 추적 알고리즘은 따라서 소정의 시간에 시작하여, 다수의 시간 세그먼트를 넘어서는 소정량의 시간 동안 전개하고 그 다음 정지하는 사인곡선의 궤적으로 나타나게 된다.
이들 궤적의 구성은 효율적인 코딩을 가능하게 한다. 예를 들면, 사인곡선의 궤적을 위해, 초기 위상만이 전송되어야 한다. 궤적 내의 다른 사인곡선의 위상은 이 초기 위상과 다른 사인곡선의 주파수로부터 구해진다. 또한, 사인곡선의 진폭과 주파수는 이전의 사인곡선에 대해 다르게 인코딩될 수도 있다. 이와 같이, 추적으로 인해, 사인곡선의 코더의 비트율이 상당히 낮아질 수 있다.
따라서, 추적은 코딩 효율에 대해 중요하다. 그러나, 올바른 궤적이 만들어지는 것이 중요하다. 만약 사인곡선이 올바르지 않게 링크되면, 비트율을 불필요하게 증가시키거나 또는 재구성 품질을 저하시킬 수 있다.
그러나, 10 내지 20㎳ 정도의 세그먼트 길이 내의 사인곡선의 주파수가 비정지 상태일 수 있음이 공지되어 있는데, 이에 의해 사인곡선의 모델이 덜 적합하도록 한다. 피치가 계속적으로 증가하는 고조파 신호(harmonic signal)를 예로 들어보자. 세그먼트 내의 기본 주파수의 예를 들면 평균 주파수를 추정하기 위해 만약 단일의 사인곡선이 사용되면, 이 사인곡선이 샘플링된 신호로부터 감해질 때, 사인곡선의 코더가 고주파수의 고조파로 일치시키기를 시도할 잔여 고조파 주파수(residual harmonic frequency)를 남기게 될 것이다. 이들 "고스트(ghost)" 고조파는 그 후 추적 알고리즘에서 매칭되고 최종 인코딩된 신호에 포함될 것인데, 이 최종 인코딩된 신호는 신호를 인코딩하는데 필요한 비트율보다 더 높은 비트율을 필요로할 뿐만 아니라 디코딩될 때 약간의 왜곡을 포함할 것이다.
R.J. Sluijter 및 A.J.E. Janssen에 의한 PCT 공개공보 제 WO 00/74039호와『"A time warper for speech signals" IEEE Workshop on Speech Coding, Porvoo, Finland, June 20-23, 1999, pp50-152』에는, 오디오 세그먼트의 정지성(stationarity)을 향상시키기 위한 타임 워퍼(time wraper)가 개시되어 있다.
Sluijter 등은 세그먼트에 대한 워프 파라미터(warp parameter)를 얻기 위한 방법을 개시한다. 하기의 수학식 1의 형태의 워프 함수로 세그먼트를 워핑함으로써, 이 세그먼트의 시간 지속을 변경하지 않으면서, 시간 워퍼는 시간과 함께 선형적으로 전개하는 주파수 변동의 일부를 제거한다.
여기서, T는 세그먼트의 지속 시간을 초로 나타내는 것이고, t는 실시간을 나타내고, τ는 워핑된 시간(warped time)을 나타낸다.
Sluijter 등에 의해 제안된 시간 워퍼를 적용함으로써, 주파수의 비정지성의 문제점은 해결될 수 있고, 따라서 사인곡선의 코더는 워핑된 세그먼트 내에서 주파수를 보다 더 신뢰성있게 추정할 수 있다. Sluijter 등은 또한 워프 인자가 디코더 내의 합성 워핑 사인곡선 내에서 사용될 수 있도록 비트스트림 내에서 워프 인자를 전송하는 것을 개시하고 있다.
Sluijter 등에 의해 제안된 개선책의 예로서, 기본 주파수가 급격하게 변하는 경우에 고조파 신호가 사용된다. 도 4는 워핑이 전혀 사용되지 않은 경우의 추적의 결과를 도시한다. 직선은 궤적의 계속을 나타내고, 원은 궤적의 시작 또는 종료를 나타내고, 별 모양은 단일 지점을 나타낸다. 도면에서 알 수 있는 바와 같이, 고주파수(2000-6000㎐)는 큰 부분의 분실 또는 잘못된 것에 대한 것이다. 결과적으로, 잘못된 궤적이 만들어진다. 분석 간격은 32.7㎳이고, 업데이트 간격은 8㎳이다. (통상적으로, 세그먼트 오버랩은 인코딩된 신호의 합성동안 사용되며, 따라서 50%의 오버랩이 사용되는 경우, 16㎳의 세그먼트 길이가 존재한다.) 이러한 긴 분석 기간에서는 주파수가 정지 상태에 있지 않기 때문에, 사인곡선의 코더는 고주파수를 잘 추정할 수 없다.
Sluijter에 따라 시간 워핑된 세그먼트에 대한 추정을 함으로써, 도 5에 도시된 바와 같이, 모든 주파수는 정확하게 추정될 수 있다. 그러나, 도 5에는, 몇 몇 경우에, 부정확한 궤적도 만들어져 있다.
이것은 일단 한 그룹의 주파수가 한 세그먼트에 대해 추정되면, 연속하는 세그먼트 내에서 사인곡선 성분의 주파수 변동을 고려하여 추적 알고리즘이 이들을 다음 세그먼트의 한 그룹의 주파수와 링크를 시도하기 때문이다. 따라서, 도 6a에 도시된 바와 같이, 워핑 인자(a1)가 결정된 경우 세그먼트(k)에 대한 주파수(fk)가 추정된다. (도 6a 및 도 6b에서 워핑 인자(a1, a2)는 주파수의 기울기의 각으로서 도시되지만, 실제에 있어서 주파수 도함수(기울기)는 a/T와 동일하다.) 동시에 워핑 인자(a2)가 결정되는 경우에 세그먼트(k+1)에 대한 주파수(fk+1(1) 및 fk+1(2))가 추정된다. 만약 한 세그먼트로부터의 사인곡선을 다음의 것에 링크함에 있어서 주파수 변동이 고려되지 않으면, 이 예에 있어서, 주파수(δ1)의 차가 δ2보다 적은 것과 같이 fk는 fk+1(2)보다는 fk+1(1)에 링크될 것이다.
본 발명은 이 문제점을 해결하려는 것이다.
본 발명은 오디오 신호 코딩 및 디코딩에 관한 것이다.
도 1은 본 발명에 따른 오디오 코더의 실시예를 도시하는 도면.
도 2는 본 발명에 따른 오디오 플레이어의 실시예를 도시하는 도면.
도 3은 본 발명에 따른 오디오 코더와 오디오 플레이어를 포함하는 시스템을 도시하는 도면.
도 4는 워핑이 전혀 적용되지 않을 때 오디오 코더에 의해 결정되는 궤적을 도시하는 도면.
도 5는 워핑이 주파수 추정에는 사용되지만 추적에는 사용되지 않을 때 오디오 코더에 의해 결정되는 궤적을 도시하는 도면.
도 6a 및 도 6b는 각각 종래 기술의 오디오 코더와 본 발명의 제 1 실시예에 따른 오디오 코더에 의해 결정되는 주파수와 워핑을 도시하는 도면.
도 7은 워프 인자가 주파수 추정과 추적 둘 다에서 사용될 때 본 발명의 제 1 실시예에 따른 오디오 코더에 의해 결정되는 궤적을 도시하는 도면.
도 8은 종래 기술의 오디오 코더와 본 발명의 제 1 실시예에 따른 오디오 코더 둘 다에 대해 8.6초의 실제 스피치 신호로부터 얻어지는 주파수의 차(dF)의 분포를 도시하는 도면.
도 9a 및 도 9b는 본 발명의 제 2 실시예에 따라 형성된 궤적을 도시하는 도면.
본 발명에 따르면, 오디오 신호 인코딩 방법이 제공되는데, 상기 방법은 청구항 1의 단계를 포함한다.
본 발명의 제 1 실시예는 사인곡선의 코더의 추적 알고리즘에 시간 워퍼를 사용하는 방법을 제공한다. 워프 인자를 적용함으로써, 보다 정확한 궤적이 얻어진다. 결과적으로, 사인곡선은 보다 효율적으로 인코딩될 수 있다. 또한, 향상된 위상 연속(improved phase continuation)으로 인해 더 나은 오디오 품질이 얻어질 수 있다.
제 1 실시예에서, 워프 인자를 결정하기 위한 Sluijeter 등에 의해 개시된 방법이 사용된다. 바람직하게는, 수학식 1의 워프 인자가 추적 알고리즘에서 사용된다. 시간과 함께 선형적으로 전개하는 주파수 변동을 워프 인자가 나타내기 때문에, 주파수의 방향을 나타내도록 사용될 수 있다. 따라서, 이 인자는 추적 알고리즘을 향상시킬 수 있다.
본 발명의 제 2 실시예에서, 사인곡선 성분을 링크하는 것은 궤적의 다수의 최종 주파수 파라미터를 근사시키기 위한 다항식을 생성하고 궤적의 주파수 파라미터의 다음 값의 추정치를 생성하기 위해 상기 다항식을 외삽하는(extrapolating)것에 기초한다. 궤적의 후속하는 세그먼트의 사인곡선 성분은 링크되거나 사인곡선 성분의 주파수 파라미터와 추정치 사이의 주파수의 차에 따르지 않는다.
제 2 다항식 근사(polynomial fitting) 실시예가 제 1 워프 인자 기반의 실시예보다 나은 점은 신호 모델링에 대해 어떠한 추정도 하지 않는다는 점, 즉, 모든 궤적 또는 적어도 연속하는 그룹의 궤적이 동일한 방식으로 변한다는 것이 가정되지 않는다는 것이다. 따라서, 오디오 신호가, 하나는 주파수가 감소하고 나머지 하나는 주파수가 증가하는 두 개의 주요 오디오 성분을 포함하면, 이들 둘은 성공적으로 추적될 수 있지만, 이것은 제 1 실시예에서는 거의 발생하지 않는 경우이다.
보다 정확한 궤적을 만듦으로써, 코딩 효율은 증가되고 더 나은 위상 연속이 달성된다.
본 발명의 양호한 실시예인 도 1에 있어서, 인코더는 PCT 공개 공보 제 WO01/69593-A1(대리인 문서번호 PHNL000120)에 설명된 형태의 사인곡선의 코더이다. 이 코더 및 그 대응하는 디코더의 동작은 잘 설명되어 있기 때문에, 본 발명에 관련된 것만 설명한다.
앞선 경우 및 양호한 실시예 둘 다에 있어서, 오디오 코더(1)는 소정의 샘플링 주파수로 입력 오디오 신호를 샘플링하여, 오디오 신호를 디지털적으로 표현(x(t))으로 나타낸다. 그 다음, 코더(1)는 샘플링된 입력 신호를 세 개의 성분, 즉, 과도 신호(transient signal) 성분, 지속 결정(sustained deterministic) 성분, 및 지속 확률(sustained stochastic) 성분으로 분리한다. 오디오 코더(1)는 과도 코더(transient coder; 11), 사인곡선의 코더(13) 및 노이즈 코더(14)를 포함한다. 오디오 코더는 이득 축소 메커니즘(gain compression mechanism; GC; 12)을 선택적으로 포함한다.
과도 코더(11)는 과도 검출기(transient detector; TD; 110), 과도 분석기(TA; 111) 및 과도 합성기(transient synthesizer; TS; 112)를 포함한다. 먼저, 신호(x(t))가 과도 검출기(110)로 들어간다. 이 검출기(110)는 과도 신호 성분이 존재하는지와 그 위치를 추정한다. 이 정보는 과도 분석기(111)로 공급된다. 과도 신호 성분의 위치가 결정되면, 과도 분석기(111)는 과도 신호 성분(의 주요 부분)의 추출을 시도한다. 바람직하게는 추정되는 시작 위치에서 시작하는 신호 세그먼트에 정형 함수(shape function)를 매칭하고, 예를 들면 (적은) 수의 사인곡선 성분을 사용함으로써, 정형 함수 아래의 내용을 결정한다. 이 정보는 과도 코드(CT)에 포함되는데, 과도 코드(CT)를 생성하는 것에 대한 보다 상세한 정보는 WO 01/69593-A1호에서 제공된다.
과도 코드(CT)는 과도 합성기(112)로 제공된다. 합성된 과도 신호 성분은 감산기(16)에서 입력 신호(x(t))로부터 감산되어, 신호(x1)로 나타나게 된다. 이 경우, GC(12)는 생략되고, x1=x2이다.
신호(x2)는 사인곡선의 코더(13)로 제공되어, (결정) 사인곡선 성분을 결정하는 사인곡선의 분석기(SA; 130)에서 분석된다. 따라서, 과도 분석기의 존재가 바람직하지만, 필수적인 것은 아니며 이러한 분석기 없이 본 발명이 구현될 수 있음을 알 수 있을 것이다. 어떠한 경우에 있어서도, 사인곡선의 코딩의 최종 결과는 사인곡선의 코드들(CS)이고, 예시적인 사인곡선의 코드들(CS)의 종래의 생성을 설명하는 보다 상세한 예는 PCT 공개 공보 WO 00/79519-A1(대리인 문서 번호: N017502)에서 제공된다.
그러나, 요약하면, 이러한 사인곡선의 코더는 한 프레임 세그먼트에서 다음 프레임 세그먼트로 링크된 사인곡선 성분의 궤적으로서 입력 신호(x2)를 인코딩한다. 궤적은 초기에는 소정의 세그먼트에서 시작하는 사인곡선에 대한 시작 주파수, 시작 진폭, 및 시작 위상으로 표현된다. 그 후, 궤적은 후속 세그먼트에서 궤적이 종료(사멸)하는 세그먼트까지의 주파수 차, 진폭 차 및, 가능하다면, 위상 차(연속)에 의해 표현된다. 실제에 있어서, 코딩 위상 차에서 거의 이득이 없음이 결정될 것이다. 따라서, 위상 정보는 연속에 대해 전혀 인코딩될 필요 없고, 위상 정보는 연속하는 위상 재구성을 사용하여 재생성될 것이다.
본 발명의 제 1 및 제 2 실시예에 있어서, 한 세그먼트에서 다음 세그먼트로의 궤적의 워핑의 정도는 한 세그먼트에서 다음 세그먼트로 사인곡선을 링크할 때 고려된다. 본 발명의 제 1 실시예에 있어서, 궤적의 생성에서 시간 워프 인자를 포함시키기 위해, 사인곡선의 코더의 추적 알고리즘부에 의해 사용되는 주파수는 수정되어야 한다. 워핑이 적용되지 않으면, 하기의 수학식 2는 프레임 k및 프레임 k+1에서 각각의 주파수에 대해 계산된다:
여기서 e(.)는 임의의 맵핑 함수를 나타내는데, 예를 들면, e(.)는 ERB의 주파수이고, f는 프레임의 주파수를 나타낸다. 따라서, 도 6a의 예에서, δ1및 δ2는 추적 알고리즘 비용 함수에 포함되어, 어느 주파수(fk+1(1) 또는 fk+1(2))가 fk에 링크되는지를 결정하고, 어느 주파수가 링크되는가에 따라 주파수 차의 하나(δ1또는 δ2)가 전송된다. (비용 함수에서 진폭과 위상에 대한 정보도 또한 포함하는 것이 알려져 있지만, 이것은 제 1 실시예의 목적과는 관련이 없다.)
제 1 실시예에서, 워프 인자는 사인곡선의 코더 추적 알고리즘에서 다음과 같이 사용된다. 프레임(k 및 k+1)의 주파수는 하기의 수학식 3에 의해 주파수()로 변환된다:
여기서, ai는 프레임 i의 워프 인자이고, T는 a를 결정하는(예를 들면, 32.7㎳) 세그먼트 크기이고, L은 주파수의 업데이트 간격(예를 들면, 8㎳)이다. 하기의 제 2 실시예로부터 알 수 있는 바와 같이, 본 발명은 상기 수학식 또는 Sluijter 등에 의해 개시된 것과 같은 워프 인자를 결정하기 위한 특정한 방법에 제한되는 것은 아니다. 어느 쪽도 요구되는 업데이트 간격의 균등한 분할이 아니기 때문에, L/2보다는, L1이를 결정하기 위해 사용되고 L2가를 결정하기 이해 사용될 것인데, 여기서 L1+L2=L이다.
이렇게 하여, 주파수()는 시간 워프 인자를 고려한다. 이제, 한 세그먼트로부터 다음 세그먼트로의 주파수 차를 결정할 때, 추적 알고리즘은 수학식 2를 수정한 하기의 수학식 4를 사용한다:
비용 함수가 간격(k, k+1)에 적용되어, 추적 알고리즘이 fk+1(1)보다는 fk+1(2)에 fk를 링크하도록 할 때, 이것은, 예를 들면, 주파수 차(δ3및 δ4), 즉 도 6b를 생성할 것이다. 추적 알고리즘의 나머지 부분은 수정되지 않고 유지될 수 있다.
도 4 및 도 5의 예에 대해, 시간 워프 인자를 갖는 추적 알고리즘을 적용함으로써, 도 7에 도시된 바와 같은 궤적이 얻어지고, 이 경우, 부정확한 링크가 만들어지지 않았음을 알 수 있다.
제 1 실시예에서, 수정된 주파수 차를 한 세그먼트에서 다음 세그먼트로 전송하기 위한 비트율을 절약하기 위해 워프 인자가 또한 사용된다. 수학식 2는 차(Df)(및 사인 비트)를 전송함으로써, 주파수(fk+1)가 주파수(fk)로부터 얻어질 수있다. 그러나, 제 1 실시예에서, 수학식 4에 따른 주파수 차는 워프 인자 및 사인 비트와 함께 전송된다.
도 8은 8.6초의 지속 시간을 갖는 실제 스피치 신호로부터 얻어진 Df의 분포를 도시한다. 점선은 수힉식 2의 Df의 분포이고, 실선은 워프 인자를 포함하는 수학식 4의 Df의 분포이다. 도면에서 알 수 있는 바와 같이, 워프 인자가 사용될 때 분포는 더 첨예하게 된다. 이것은 (도 6a와 비교하여 도 6b에 도시된 바와 같이) 일반적으로 수학식 4의 주파수 차를 사용하는 것이 링크된 궤적 내에서 더 작은 주파수 차를 생성하기 때문이다.
이 보다 잘 정의된 주파수 차 프로파일 내의 주파수 차를 인코딩하기 위해 엔트로피 코딩(entropy coding)을 사용함으로써, 결과적으로 나타나는 신호는 더 적은 비트를 요구하거나 또는 더 높은 품질일 것이다. 이것은 소정의 코딩 양자화 방식(coding quantization scheme)에 대해, 가장 빈번하게 사용되며 따라서 가장 압축된 심볼에서 나타나는 많은 심볼이 존재해야 하거나, 또는 다르게는 보다 집속된 양자화 방식이 동일한 비트율에 대해 더 나은 차를 생성해야만 하기 때문이다.
본 발명의 제 2 실시예에 있어서, 한 세그먼트로부터 다음 세그먼트로의 궤적의 워핑의 정도는 궤적에 기초하여 고려된다. 도 9a 내지 도 9c를 참조하면, 다수의 시간 세그먼트 양단의 사인곡선 성분의 주파수 파라미터(fk-1(1), fk-1(2), fk(1), fk(2) 등)가 도시되어 있다. 시간의 두 세그먼트(k-1 및 k)를 고려하면, 궤적의 형성은 통상적으로 이들 세그먼트의 경계(또는 오버랩)에서 발견되는 두 세트의 사인곡선 성분의 파라미터 사이의 유사성에 기초한다.
한편, 궤적이 지속되면, 시간 세그먼트(k)에 대해 존재할 수 있는 사인곡선 성분의 주파수, 및 바람직하게는, 진폭 및 위상 파라미터를 예측하기 위해서, 제 2 실시예는 시간 세그먼트(k-1)까지 포함하는 궤적의 사인곡선 성분의 주파수, 및 바람직하게는 진폭 및 위상의, 다수의 세그먼트를 따라 잠재적으로 연장하는 전개(evolution)를 사용한다.
가능한 연속의 주파수, 진폭 및 위상의 예측은 시간 세그먼트(k-1)까지 a+bx+cx2+dx3…의 형태의 다항식을 궤적을 따른 파라미터의 세트를 근사시킴으로써 얻어진다. 세그먼트(k-1)의 주파수(fk-1(1))를 갖는 성분을 포함하는 궤적(1)의 경우에 있어서, 이 지점을 통과하는 다항식은 P1k-1로 표현되고, 궤적 2에 대해서도 마찬가지이다. 대응하는 다항식(도시되지 않음)은 성분의 진폭 및 위상이 근사될 것이다. 주파수의 추정과 가능한 다음 성분의 진폭 및 위상 파라미터가 어디에 적용 가능한지는 시간 세그먼트(k)에서 그들 다항식의 값을 계산함으로써 얻어진다. 궤적 1의 경우에 있어서, 주파수 추정치는 E1k-1로 표현되고 궤적 2에 대해서도 마찬가지이다.
이 때 궤적의 형성은 시간 세그먼트(k)에서 실제 추출된 성분의 파라미터와 예측된/추정된 파라미터의 세트 사이의 유사성에 기초하는데 , 이 경우에 있어서 주파수 파라미터는 fk(1)와 fk(2)이다. 이들 주파수 파라미터가 주파수 추정치로부터 오차(T) 내에 있으면, 관련 성분은 추정이 수행되는 궤적에 링크될 후보가 된다.
도 9a의 예에서, 궤적 1 및 궤적 2에 대한 진폭 및/또는 위상 추정이 성분(fk(1) 및 fk(2))에 대한 진폭 및 위상 파라미터와도 일치한다고 가정하면, 이들 성분은 궤적 1 및 궤적 2에 각각 링크될 것이다.
도 9b에 있어서는, 다항식(P1k및 P2k)이 k-1 및 k를 포함하는 것까지의 세그먼트에 대한 주파수 파라미터가 근사되어 추정치(E1k및 E2k)의 세트를 생성한다. 이 경우, 추적 알고리즘은: 이전의 세그먼트에 대한 추정치(E1k및 E2k-1)를 이루기 위해 사용되는 궤적 1 및 궤적 2에 대한 다항식(P1k-1및 P2k-2)의 차수를 확대하거나; 또는 궤적에 대한 다항식의 최대 차수가 이전의 추정치에 대해 도달했으면, 추정치가 기초하고 있는 세그먼트는 그 궤적에 대해 하나만큼 전진된다.
제 2 실시예의 바람직한 양태에 있어서, 주파수 파라미터가 근사된 다항식에 대해 4의 최대 차수가 사용되고, 진폭 파라미터가 근사된 다항식에 대해 3이 사용되며, 위상 파라미터가 근사된 다항식에 대해 2가 사용된다.
도 9c에 있어서는, 주파수 파라미터(fk+1(new))를 갖는 새로운 성분이 세그먼트(k+1)에 대해 존재한다. 제 1 워프 인자 실시예에 있어서, 모든 궤적 또는 적어도 연속하는 그룹의 궤적이 한 세그먼트 내에서 동일한 방식으로 전개한다고 가정된다. 따라서, 예를 들면, 궤적이 한 세그먼트 내에서 시작하는 경우, 그 주변의궤적과 동일한 정도로 워핑될 것이라고 가정된다. 도 9c의 예에 있어서, 새로운 성분은 후속하는 세그먼트(k+2)에서 링크를 발견하지 못할 것이고 단지 이 단일 성분만을 포함하는 새로운 궤적이 너무 짧은 궤적으로 간주되기 때문에, 최종의 비트스트림을 생성함에 있어서는 생략될 것이다.
그러나, 제 2 실시예에서, 다른 궤적은 유효하기만 하다면 소정의 궤적의 이전 이력에만 따른 다른 궤적에 대해 자유롭게 변하도록 허용될 수 있다. 이것은 새로운 궤적이 인접한 가변 궤적의 근처에서 주파수 파라미터로 시작하는 경우에 잠재적인 문제점을 도출할 것으로 생각될 수 있다. 따라서, 실시예에 있어서, fk+1(new)는 fk+2(1)에 링크되는 더 유망한 후보(fk+1(1)) 대신 fk+2(1)에 링크될 것이다.
그러나, 새로운 성분(fk+1(new))의 경우에 있어서, 제 2 실시예에서는, 추적 알고리즘이 진폭 및/또는 위상 예측으로 간주될 수 있다. 이들은, 예를 들면, fk+2(1)가 fk+1(new) 보다는 fk+1(1)과 동위상일 가능성이 높기 때문에, 올바른 링크가 이루어지는 것을 보장한다.
제 2 실시예에 따라 생성된 궤적의 후속하는 주파수 성분 사이의 δ5와 같은 주파수 차가 비트스트림에서 인코딩되면 제 1 실시예의 δ4와 같은 주파수 차만을 전송하는 코딩 이득은 손실될 수 있다.
이것은 디코더가 인코더에서 사용되는 다항식 예측의 형태를 알 필요가 없기때문에 본 발명이 특정한 형태의 다항식에 제한되지 않는다는 이점을 갖는다.
그러나, 제 2 다항식에 기초한 실시예에서 유사한 코딩 이득이 있을 수 있다. 여기서, 인코더는 주파수 차, 예를 들면 δ6, 및 바람직하게는 추정치, 이 경우에 있어서는 E1k+1과 링크된 성분 파라미터, 이 경우에 있어서는 세그먼트(k+2)로부터의 fk+2(1) 사이에서 결정된 진폭 차 및/또는 위상 차를 전송한다. 이 때 디코더는 세그먼트 k+2에 대한 주파수 및 진폭 및/또는 위상 차 파라미터를 사용하기 이전에 시간 세그먼트 즉 k+1(인코더에서와 동일한 동작)까지 이미 수신된 궤적의 다항식 근사를 통해 예측을 행해야 한다. 그러나, 이 경우에 있어서는 워프 인자와 같은 어떠한 여분의 인자도 전송될 필요가 없고, 디코더는 인코더에서 사용되는 다항식의 형태를 알아야만 한다.
따라서, 제 2 실시예의 다항식은 제 1 실시예의 워프 인자를 사용하는 것보다 세그먼트에서 세그먼트로의 성분 파라미터의 워핑을 큰 자유도로 보호한다.
그러나, 어떤 실시예가 사용되는지에 관계없이, 종래 기술에서와 같이, 본 발명의 향상된 사인곡선의 코더로 생성된 사인곡선의 코드들(CS)로부터, 사인곡선의 신호 성분은 사인곡선의 합성기(SS; 131)에 의해 재구성된다. 이 신호는 감산기(17)에서 사인곡선의 코더(13)에 대한 입력(x2)으로부터 감산되어, (큰) 과도 신호 성분과 (주요) 결정 사인곡선 성분이 없는 잔여 신호(x3)를 남기게 된다.
잔여 신호(x3)는 주로 노이즈를 포함하고 양호한 실시예의 노이즈 분석기(14)는, 예를 들면, PCT 공개공보 WO 01/89086-A1(대리인 문서번호 :PHNL000287)에 상술된 바와 같이, 이 노이즈를 나타내는 노이즈 코드(CN)를 생성한다. 또한, 이러한 분석기의 사용은 본 발명의 구현에 필수적인 것은 아니지만, 이러한 사용을 보충하는 것을 알 수 있을 것이다.
최종으로, 멀티플렉서(15)에 있어서, 코드(CT, CS 및 CN)를 포함하는 오디오 스트림(AS)이 구성된다. 오디오 스트림(AS)은 예를 들면 데이터 버스, 안테나 시스템, 저장 매체 등에 제공된다.
도 2는 본 발명에 따른 오디오 플레이어(3)를 도시한다. 도 1에 따른 인코더에 의해 생성된 오디오 스트림(AS')은 데이터 버스, 안테나 시스템, 저장 매체 등으로부터 얻어진다. 이들 코드는 과도 합성기(31), 사인곡선의 합성기(32) 및 노이즈 합성기(33)에 각각 제공된다. 과도 코드(CT)로부터, 과도 신호 성분이 과도 합성기(31)에서 계산된다. 과도 코드가 정형 함수를 나타내는 경우, 정형은 수신된 파라미터에 기초하여 계산된다. 또한, 정형 내용은 사인곡선 성분의 주파수 및 진폭에 기초하여 계산된다. 과도 코드(CT)가 스텝을 나타내면, 어떠한 과도(transient)도 계산되지 않는다. 전체 과도 신호(yT)는 모든 과도의 합이다.
사인곡선의 코드들(CS)은 소정의 세그먼트에 대한 사인곡선의 합으로서 설명된 신호(yS)를 생성하기 위해 사용된다. 제 1 실시예에 따른 인코더가 사용되는 경우, 주파수를 디코딩하기 위해서, 각각의 세그먼트에 대한 워핑 파라미터가 디코더측에서 알려져 있어야 한다. 디코더에 있어서, 사인곡선 궤적의 사인곡선의 위상은 시작 사인곡선의 위상과 중간 사인곡선의 주파수로부터 계산된다. 워프 인자가 디코더에서 사용되지 않으면, 프레임(k)의 위상(φk)은 하기의 수학식 5에 의해 계산된다:
여기서 L은 주파수의 업데이트 간격(초)이고, fk및 fk-1은 각각 프레임(k) 및 프레임(k-1)의 주파수(헤르츠)이다. 워프 인자를 포함함으로써, 위상은 하기의 수학식 6에 의해 계산될 수 있다:
그러나, 다는 함수도 위상에 대한 근사를 제공할 수 있으며 본 발명은 상기 수학식 6에 제한되지 않음을 알 수 있을 것이다. 어떠한 경우에 있어서도, 이러한 함수의 사용은 연속하는 위상이 워프 인자를 포함함으로써 원래의 위상과 더 잘 일치한다는 것을 의미한다.
본 발명의 제 2 실시예에 따른 인코더가 비트스트림을 생성하기 위해 사용되는 경우, δ5와 같은 주파수 차가 비트스트림에서 인코딩되면, 종래 기술의 형태의 디코더는 사인곡선의 코드의 궤적을 생성하기 위해 향상된 링크가 사용되었다는 것을 알 필요가 없을 때 신호를 합성하기 위해 사용될 수 있다.
Sluijter 등에 의해 개시된 것과 같은 인코더가 사인곡선의 파라미터를 더 잘 추정하기 위해 워핑을 사용하고 워프 인자를 비트스트림 내에 포함하면, 이 워프 인자는 원래의 신호를 더 잘 되풀이하기 위해 비트스트림의 사인곡선 성분을 합성하는데 사용될 수 있다.
그러나, 이미 언급된 바와 같이, 제 2 실시예에 따른 인코더가 비트스트림에 δ6과 같은 주파수 차를 포함하면, 디코더는 궤적의 후속하는 사인곡선 성분에 대한 후속하는 주파수 및 진폭 및/또는 위상 파라미터를 결정하기 위해 추적 알고리즘에서 사용되는 다항식을 생성해야 할 필요가 있을 것이다.
동시에, 노이즈 코드(CN)는 노이즈 합성기(NS 33)에 제공되는데, 이것은 주로 필터이며, 노이즈의 스펙트럼을 근사하는 주파수 응답을 갖는다. NS 33은 화이트 노이즈 신호를 노이즈 코드(CN)로 필터링함으로써 재구성된 노이즈(yN)를 생성한다.
전체 신호(y(t))는 사인곡선의 신호(yS)와 노이즈 신호(yN)의 합과 임의의 진폭 분해(amplitude decompression; g)의 곱과 과도 신호(yT)의 합을 포함한다. 오디오 플레이어는 각각의 신호를 합하는 두 개의 가산기(36 및 37)를 포함한다. 전체 신호는, 예컨대 스피커인 출력 유닛(35)에 제공된다.
도 3은 도 1에 도시된 오디오 코더(1)와 도 2에 도시된 오디오 플레이어(3)를 포함하는 본 발명에 따른 오디오 시스템을 도시한다. 이러한 시스템은 재생 및 녹음의 기능을 제공한다. 오디오 스트림(AS)은 무선 접속, 데이터(20) 버스 또는저장 매체일 수 있는 통신 채널(2)을 통해 오디오 코더에서 오디오 플레이어로 제공된다. 통신 채널(2)이 저장 매체인 경우, 저장 매체는 시스템 내에 고정되거나 또는 삭제 가능한 디스크, 메모리 스틱 등일 수도 있다. 통신 채널(2)은 오디오 시스템의 일부이지만, 종종 오디오 시스템의 외부에 있을 수도 있다.
제 1 실시예에서, 세그먼트 당 단지 하나의 워프 인자를 사용하는 것이 설명되었다. 그러나, 프레임 당 여러 워프 인자가 사용될 수 있음을 알 수 있을 것이다. 예를 들면, 매 주파수 또는 주파수 그룹에 대해서 별개의 워프 인자가 결정될 수 있다. 이 때, 적절한 워프 인자는 각각의 주파수에 대해 상기 상술된 수학식에서 사용될 수 있다.
본 발명은 임의의 사인곡선의 오디오 코더에 사용될 수 있다. 이와 같이, 본 발명은 이러한 코더가 사용되는 어떠한 경우에도 적용될 수 있다.
또한, 본 발명은 주파수 궤적의 조합인 대상에도 적용된다. 예를 들면, 몇몇 사인곡선의 코더는 한 세트의 사인곡선 성분 내에서 각각이 한 세트의 고조파를 갖는 하나 이상의 기본 주파수를 식별하도록 배열될 수 있다. 인코딩 이점은 이러한 성분을 기본 주파수에 관련하는 파라미터, 예를 들면, 그와 관련된 고조파의 스펙트럼 정형을 각각 포함하는 고조파 컴플렉스(harmonic complexes)로서 이러한 성분을 전송함으로써 얻어질 수 있다. 따라서, 이러한 컴플렉스를 한 세그먼트에서 다른 세그먼트로 링크할 때, 이러한 컴플렉스의 성분이 본 발명에 따라 어떻게 링크되어야 할지를 결정하기 위해 각각의 세그먼트에 대해 결정된 워프 인자(들) 또는다항식 근사가 이들에 적용될 수 있다.

Claims (27)

  1. 오디오 신호(x)를 인코딩(1)하는 방법에 있어서,
    복수의 연속하는 세그먼트들 각각에 샘플링된 신호값들의 각 세트를 제공하는 단계와;
    상기 복수의 연속하는 세그먼트들 각각에 대한 하나 이상의 사인곡선 성분들(fk,fk+1)을 생성하기 위한 상기 샘플링된 신호값들을 분석하는 단계(130)와;
    상기 복수의 연속하는 세그먼트들 각각 내에 상기 사인곡선 성분들의 주파수 변동의 지시자(ai, Plk)를 제공하는 단계와;
    각각의 지시자들(ai, Plk)이 적용되는 사인곡선 성분들의 주파수들(δ46)의 차에 따라, 복수의 연속하는 세그먼트들 양단의 사인곡선 성분들을 링크하는 단계와;
    상기 복수의 연속하는 세그먼트들 각각에 대한 링크된 사인곡선 성분들의 궤적들을 포함하는 사인곡선의 코드들(CS)을 생성하는 단계; 및
    상기 사인곡선의 코드들(CS)을 포함하는 인코딩된 오디오 스트림(AS)을 생성하는 단계를 포함하는 오디오 신호 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 지시자는 상기 오디오 신호의 각 세그먼트와 관련된 적어도 하나의 워프 인자(warp factor; ai)를 포함하고, 상기 링크 단계는 상기 주파수들의 차를 결정하기 위해 관련된 후속 세그먼트들의 사인곡선 성분들의 주파수 파라미터들에 워프 인자들을 적용하는 단계를 포함하는, 오디오 신호 인코딩 방법.
  3. 제 1 항에 있어서,
    상기 지시자는 다항식(Plk)이고, 상기 링크 단계는:
    세그먼트의 각 궤적에 대해, 궤적의 다수의 최종 주파수 파라미터들을 근사(fit)시키기 위 한 상기 다항식(Plk)을 생성하고 상기 궤적의 주파수 파라미터의 다음 값의 추정치를 생성하도록 상기 다항식을 외삽하며(extrapolating), 상기 사인곡선 성분의 주파수 파라미터와 상기 추정치 사이의 주파수들의 차에 따라 상기 궤적의 후속하는 세그먼트의 사인곡선 성분을 링크하는 단계를 포함하는, 오디오 신호 인코딩 방법.
  4. 제 3 항에 있어서,
    상기 최종 주파수 파라미터들의 최대 수는 5인, 오디오 신호 인코딩 방법.
  5. 제 3 항에 있어서,
    상기 링크 단계는:
    세그먼트의 각 궤적에 대해, 궤적의 다수의 최종 진폭 파라미터들을 근사시키기 위한 제 2 다항식을 생성하고 상기 궤적의 진폭 파라미터의 다음 값의 추정치를 생성하도록 상기 제 2 다항식을 외삽하며(extrapolating), 상기 사인곡선 성분의 주파수 및 진폭 파라미터들과 상기 주파수 및 진폭 추정치들 사이의 주파수들 및 진폭들의 차에 따라 상기 궤적의 후속하는 세그먼트의 사인곡선 성분을 링크하는 단계를 더 포함하는, 오디오 신호 인코딩 방법.
  6. 제 6 항에 있어서,
    상기 최종 진폭 파라미터들의 최대 수는 4인, 오디오 신호 인코딩 방법.
  7. 제 3 항에 있어서,
    상기 링크 단계는:
    세그먼트의 각 궤적에 대해, 궤적의 다수의 최종 위상 파라미터들을 근사시키기 위한 제 2 다항식을 생성하고 상기 궤적의 위상 파라미터의 다음 값의 추정치를 생성하도록 상기 제 2 다항식을 외삽하며, 상기 사인곡선 성분의 주파수 및 위상 파라미터들과 상기 주파수 및 위상 추정치들 사이의 주파수들 및 위상들의 차에 따라 상기 궤적의 후속하는 세그먼트의 사인곡선 성분을 링크하는 단계를 더 포함하는, 오디오 신호 인코딩 방법.
  8. 제 7 항에 있어서,
    상기 최종 위상 파라미터들의 최대 수는 3인, 오디오 신호 인코딩 방법.
  9. 제 1 항에 있어서,
    상기 분석 단계는 상기 하나 이상의 사인곡선 성분들(fk,fk+1)을 생성하기 위해 워프 인자를 사용하는 단계를 포함하는, 오디오 신호 인코딩 방법.
  10. 제 1 항에 있어서,
    각각의 궤적은 궤적의 시작 세그먼트에 사인곡선 성분에 대한 주파수, 진폭 및 위상과, 상기 궤적의 후속하는 연속 세그먼트의 각각의 사인곡선 성분에 대한 주파수 및 진폭의 차를 포함하는, 오디오 신호 인코딩 방법.
  11. 제 10 항에 있어서,
    상기 주파수 차는 각각의 지시자가 적용되는 링크된 사인곡선 성분들의 세그먼트 경계에서 주파수들(δ46)의 차를 포함하는, 오디오 신호 인코딩 방법.
  12. 제 2 항에 있어서,
    상기 사인곡선의 코드는 상기 워프 인자들(ai)을 포함하는, 오디오 신호 인코딩 방법.
  13. 제 1 항에 있어서,
    상기 오디오 신호의 과도 신호 성분의 위치를 추정하는 단계(110)와;
    정형 파라미터들과 위치 파라미터를 갖는 정형 함수를 상기 과도 신호에 매칭하는 단계(111, 112); 및
    상기 오디오 스트림(AS)의 상기 정형 함수를 설명하는 상기 위치 및 정형 파라미터들을 포함하는 단계(15)를 포함하는 오디오 신호 인코딩 방법.
  14. 제 1 항에 있어서,
    노이즈 성분의 타겟 스펙트럼을 근사하는 주파수 응답을 갖는 필터의 필터 파라미터들을 결정함으로써 상기 오디오 신호의 노이즈 성분을 모델링하는 단계(14); 및
    상기 필터 파라미터들을 상기 오디오 스트림(AS)에 포함하는 단계(15)를 더 포함하는 오디오 신호 인코딩 방법.
  15. 제 1 항에 있어서,
    상기 제공 단계는 상기 샘플링된 신호값들을 생성하기 위해 제 1 샘플링 주파수에서 상기 오디오 신호(x)를 샘플링하는 단계를 포함하는, 오디오 신호 인코딩 방법.
  16. 제 1 항에 있어서,
    상기 링크 단계는 세그먼트 경계들에서 사인곡선 성분들의주파수들(δ46)의 차에 따라 사인곡선 성분들을 링크하는, 오디오 신호 인코딩 방법.
  17. 오디오 스트림 디코딩 방법에 있어서,
    복수의 연속하는 세그먼트들 각각에 대한 링크된 사인곡선 성분들의 궤적들을 포함하는 사인곡선의 코드들(CS)을 포함하는 인코딩된 오디오 스트림(AS')을 판독하는 단계; 및
    각각의 지시자들이 적용된 사인곡선 성분들의 주파수들(δ46)의 차에 따라 복수의 연속하는 세그먼트들 양단의 사인곡선 성분들을 재구성하는 것을 포함하는 상기 오디오 신호를 합성하기 위해, 상기 사인곡선의 코드들 및 상기 복수의 연속하는 세그먼트들 각각 내의 상기 사인곡선 성분들의 주파수 변동의 지시자(ai, Plk)를 사용하는 단계를 포함하는 오디오 스트림 디코딩 방법.
  18. 제 17항에 있어서,
    세그먼트의 사인곡선 성분의 주파수, 예를 들면 시작 주파수는 상기 지시자가 적용된 링크된 사인곡선 성분의 주파수와 주파수 차(δ46)로부터 결정되는, 오디오 스트림 디코딩 방법.
  19. 제 17항에 있어서,
    상기 지시자는 각각의 세그먼트에 대해 적어도 하나의 워프 인자(ai)를 포함하는, 오디오 스트림 디코딩 방법.
  20. 제 19 항에 있어서,
    세그먼트의 사인곡선 성분의 위상은 워프 인자가 적용된 링크된 사인곡선 성분의 위상으로부터 결정되는, 오디오 스트림 디코딩 방법.
  21. 제 20 항에 있어서,
    세그먼트 k의 상기 사인곡선 성분의 위상(φk)은 하기의 수학식,
    에 따라 재구성되며, 여기서 L은 세그먼트 크기(초)이고, fi는 세그먼트 I의 사인곡선 성분의 주파수(헤르츠)이며, T는 세그먼트의 지속 시간을 초로 나타내는, 오디오 스트림 디코딩 방법.
  22. 제 17항에 있어서,
    상기 지시자는 다항식(Plk)이고, 상기 사용 단계는:
    궤적의 다수의 최종 주파수 파라미터들을 근사시키기 위한 상기 다항식(Plk)을 생성하고 상기 궤적의 주파수 파라미터의 다음 값의 추정치를 생성하도록 상기 다항식을 외삽함으로써 세그먼트의 각 추적을 합성하고, 상기 사인곡선 성분의 주파수 파라미터와 추정치 사이의 주파수들의 차에 따라 상기 궤적의 후속하는 세그먼트의 사인곡선 성분을 결정하는 단계를 포함하는, 오디오 스트림 디코딩 방법.
  23. 오디오 신호(x)의 복수의 연속하는 세그먼트들 각각에 대한 샘플링된 신호값들의 각 세트를 처리하도록 배열된 오디오 코더(1)에 있어서,
    상기 복수의 연속하는 세그먼트들 각각에 대한 하나 이상의 사인곡선 성분들(fk,fk+1)을 생성하기 위해 상기 샘플링된 신호값들을 분석하는 분석기(130)와;
    상기 복수의 연속하는 세그먼트들 각각 내의 상기 사인곡선 성분들의 주파수 변동의 지시자(ai, Plk)를 결정하는 구성 요소와;
    각각의 지시자들(ai, Plk)이 적용되는 사인곡선 성분들의 주파수들(δ4, δ6)의 차에 따라 복수의 연속하는 세그먼트들 양단의 사인곡선 성분들을 링크하는 링커와;
    상기 복수의 연속하는 세그먼트들 각각에 대한 링크된 사인곡선 성분의 추적을 포함하는 사인곡선 코드들(CS)을 생성하는 구성 요소; 및
    상기 사인곡선 코드들(CS)을 포함하는 인코딩된 오디오 스트림(AS)을생성(15)하는 비트스트림 생성기를 포함하는 오디오 코더.
  24. 복수의 연속하는 세그먼트들 각각에 대한 링크된 사인곡선 성분들의 궤적들을 포함하는 사인곡선 코드들(CS)을 포함하는 인코딩된 오디오 스트림(AS')을 판독하는 수단; 및
    각각의 지시자들이 적용된 사인곡선 성분들의 주파수들(δ46)의 차에 따라 복수의 연속하는 세그먼트들 양단의 사인곡선 성분들을 재구성하는 것을 포함하는 상기 오디오 신호를 합성하기 위해, 상기 사인곡선 코드들 및 복수의 연속하는 세그먼트들 각각 내의 상기 사인곡선 성분들의 주파수 변동의 지시자(ai, Plk)를 사용하도록 배열된 합성기(32)를 포함하는 오디오 플레이어(3).
  25. 제 23 항에서 청구된 오디오 코더(1)와 제 24 항에서 청구된 오디오 플레이어(2)를 포함하는 오디오 시스템.
  26. 오디오 신호의 적어도 하나의 성분을 나타내는 사인곡선의 코드들(CS)을 포함하는 오디오 스트림(AS)에 있어서,
    상기 코드들은 링크된 사인곡선 성분들의 궤적들을 포함하고, 상기 사인곡선 성분들은, 상기 오디오 신호의 복수의 연속하는 세그먼트들 각각 내의 상기 사인곡선 성분들의 주파수 변동의 각 지시자들(ai, Plk)이 적용된 상기 사인곡선 성분들의주파수들(δ4, δ6)의 차에 따라 상기 복수의 연속하는 세그먼트들 양단에 링크되는, 오디오 스트림.
  27. 제 26항에서 청구된 오디오 스트림(AS)이 저장된 저장 매체.
KR10-2004-7006049A 2001-10-26 2002-10-15 오디오 코더에서의 사인곡선의 파라미터의 추적 KR20040060946A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP01204062.2 2001-10-26
EP01204062 2001-10-26
EP02075316 2002-01-25
EP02075316.6 2002-01-25
PCT/IB2002/004255 WO2003036620A1 (en) 2001-10-26 2002-10-15 Tracking of sinusoidal parameters in an audio coder

Publications (1)

Publication Number Publication Date
KR20040060946A true KR20040060946A (ko) 2004-07-06

Family

ID=26077018

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7006049A KR20040060946A (ko) 2001-10-26 2002-10-15 오디오 코더에서의 사인곡선의 파라미터의 추적

Country Status (7)

Country Link
US (1) US7146324B2 (ko)
EP (1) EP1446796A1 (ko)
JP (1) JP2005506582A (ko)
KR (1) KR20040060946A (ko)
CN (1) CN1319043C (ko)
BR (1) BR0206202A (ko)
WO (1) WO2003036620A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004049311A1 (en) * 2002-11-27 2004-06-10 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
KR20060131729A (ko) * 2003-09-09 2006-12-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 과도 오디오 신호 성분들의 인코딩
US8296143B2 (en) 2004-12-27 2012-10-23 P Softhouse Co., Ltd. Audio signal processing apparatus, audio signal processing method, and program for having the method executed by computer
US8315880B2 (en) * 2006-02-24 2012-11-20 France Telecom Method for binary coding of quantization indices of a signal envelope, method for decoding a signal envelope and corresponding coding and decoding modules
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101410229B1 (ko) * 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
KR101425354B1 (ko) * 2007-08-28 2014-08-06 삼성전자주식회사 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
US8015002B2 (en) * 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8326617B2 (en) 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101400484B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
WO2014081736A2 (en) * 2012-11-20 2014-05-30 Dts, Inc. Reconstruction of a high frequency range in low-bitrate audio coding using predictive pattern analysis
EP3345359A4 (en) * 2015-09-02 2019-04-17 Astrapi Corporation POLYNOMIAL DIVISION MULTIPLEXING IN SPIRAL
US11824694B2 (en) 2015-09-02 2023-11-21 Astrapi Corporation Systems, devices, and methods employing instantaneous spectral analysis in the transmission of signals
EP3335216B1 (en) * 2015-10-15 2022-01-26 Huawei Technologies Co., Ltd. Method and apparatus for sinusoidal encoding and decoding
CN109479043B (zh) 2016-05-23 2021-12-14 埃斯莱普有限公司 波形带宽压缩传输数据的方法和系统
CN107122332B (zh) * 2017-05-02 2020-08-21 大连民族大学 一维信号二维谱变换方法、伪双谱及其应用
US10848364B2 (en) 2019-03-06 2020-11-24 Astrapi Corporation Devices, systems, and methods employing polynomial symbol waveforms
US11184201B2 (en) 2019-05-15 2021-11-23 Astrapi Corporation Communication devices, systems, software and methods employing symbol waveform hopping
US10931403B2 (en) 2019-05-15 2021-02-23 Astrapi Corporation Communication devices, systems, software and methods employing symbol waveform hopping

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0998166A1 (fr) * 1998-10-30 2000-05-03 Koninklijke Philips Electronics N.V. Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant
JP2003500708A (ja) * 1999-05-26 2003-01-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号送信システム
JP2003502703A (ja) * 1999-06-18 2003-01-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改善された符号器を有するオーディオ伝送システム
CN1154975C (zh) * 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数

Also Published As

Publication number Publication date
CN1575490A (zh) 2005-02-02
US20030083886A1 (en) 2003-05-01
JP2005506582A (ja) 2005-03-03
EP1446796A1 (en) 2004-08-18
WO2003036620A1 (en) 2003-05-01
CN1319043C (zh) 2007-05-30
BR0206202A (pt) 2004-02-03
US7146324B2 (en) 2006-12-05

Similar Documents

Publication Publication Date Title
US7146324B2 (en) Audio coding based on frequency variations of sinusoidal components
JP2011203752A (ja) オーディオ符号化方法及び装置
KR101058064B1 (ko) 저비트율 오디오 인코딩
US20060015328A1 (en) Sinusoidal audio coding
KR20060083202A (ko) 낮은 비트율 오디오 인코딩
JP4359499B2 (ja) オーディオ信号の編集
EP1203369B1 (en) Sinusoidal coding
MXPA05005601A (es) Codificacion de audio.
US20060009967A1 (en) Sinusoidal audio coding with phase updates
EP1522063B1 (en) Sinusoidal audio coding
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2000267686A (ja) 信号伝送方式及び復号化装置
JP2007505346A (ja) 遷移のオーディオ信号成分の符号化
KR20050017088A (ko) 사인 곡선 오디오 부호화
JPH07261796A (ja) 音声符号化復号化装置
JPH11272296A (ja) 音声符号化/復号化方法
KR20070019650A (ko) 오디오 인코딩

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid