KR20010072035A - 오디오 신호 송신 시스템 - Google Patents

오디오 신호 송신 시스템 Download PDF

Info

Publication number
KR20010072035A
KR20010072035A KR1020017000967A KR20017000967A KR20010072035A KR 20010072035 A KR20010072035 A KR 20010072035A KR 1020017000967 A KR1020017000967 A KR 1020017000967A KR 20017000967 A KR20017000967 A KR 20017000967A KR 20010072035 A KR20010072035 A KR 20010072035A
Authority
KR
South Korea
Prior art keywords
time
audio signal
frequency
signal
predetermined amount
Prior art date
Application number
KR1020017000967A
Other languages
English (en)
Inventor
로베르트 요트. 슬루이터
아우구스투스 요트. 에. 엠. 얀센
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20010072035A publication Critical patent/KR20010072035A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 코딩의 수 개의 타입에서, 하나 이상의 주기적 성분을 갖는 주파수는 인코딩 프로세스에서 결정되고 사용된다. 결정되는, 상기 주기적 성분의 주파수는 항상 일정하지는 않고, 한 개의 분석 구간(interval)에 대해 약간씩 바뀔 수 있다. 상기 주파수의 변화를 바로잡기 위해, 본 발명에 의한 시스템은 상기 분석 주기에 대한 주기적 성분의 주파수의 변화를 결정하는 주파수 변화 결정 수단(8)을 포함한다. 주파수의 상기 변화는 상기 오디오 신호의 복구의 정확성을 증가하도록 상기 디코더로 송신될 수 있다. 또한, 상기 주파수 변화는 더욱 정확한 피치(pitch)의 값을 얻기 위하여 사용될 수만도 있다. 바람직하게, 상기 주파수 변화는, 한 개의 시간 변형된 오디오 신호가 최소 주파수 변화를 갖고 얻어지도록, 시간 변형을 실시하는 한 개의 시간 워퍼(warper)(6)를 사용함으로써 결정된다.

Description

오디오 신호 송신 시스템{AUDIO SIGNAL TRANSMISSION SYSTEM}
상술에 의한 송신 시스템은 미국 특허 제 4,937,873 호로부터 알려져 있다.
그러한 송신 시스템들과 오디오 인코더들은 오디오 신호들이 한정된 송신 용량을 가진 송신 메체로 송신되어야 하거나, 한정된 저장 용량을 가진 저장 매체 상에 저장되어야 하는 응용들(applications)에 사용된다. 상기 응용들의 예로는, 인터넷으로 오디오 신호들을 송신하는 것, 한 이동 전화로부터 한 기지국으로 오디오 신호를 송신하는 것과 그 반대의 경우, 그리고, 솔리드(solid) 상태의 메모리에 또는, CD-ROM 상에 오디오 신호들을 저장하거나, 하드 디스크 드라이브 상에 저장하는 것을 들 수 있다.
적당한 비트 율(rate)로, 우수한 오디오 품질을 얻기 위한 오디오 인코더들의 여러 가지 동작 원리들이 시도되어 왔다. 상기 동작 방법들 중의 하나에서, 송신되는 한 개의 오디오 신호는 길이 10-20 ms를 지닌, 복수의 세그먼트들(segments)로 분할된다. 상기 각각의 세그먼트에서, 상기 오디오 신호는 복수의 사인 곡선들(sinusoids)로써 표시되며, 상기 사인 곡선들은 그 진폭과 주파수에 의해 정의된다. 상기 인코더에서, 상기 사인 곡선들의 진폭 및 주파수들이 결정된다.
상기 송신 수단은 진폭 및 주파수들의 표시(representation)를 상기 수신기로 송신한다. 상기 송신기에 의해 실행된 동작들에는 채널 코딩, 인터리빙(interleaving)과 변조(modulation)가 포함될 수 있다.
상기 수신 수단은 상기 오디오 신호를 표시하는 한 개의 신호를 한 송신 채널로부터 수신하며, 복조(demodulation), 디-인터리빙(de-interleaving) 및 채널 디코딩과 같은 동작들을 수행한다. 상기 디코더는 상기 오디오 신호의 상기 표현을 상기 수신기로부터 얻으며, 상기 인코딩 된 신호로써, 기술된 바와 같은 복수의 사인 곡선들을 생성하고, 이들을 복구된 오디오 신호로 결합시킴으로써, 상기 수신기로부터, 복구된 오디오 신호를 이끌어낸다.
선행 기술의 시스템이 우수한 코딩 품질을 제공함에도 불구하고, 상기 복구된 오디오 신호와 원래의 오디오 신호 사이에는 여전히 가청의(audible) 차이가 존재한다.
본 발명은 한 개의 오디오 신호를 인코딩하는 인코더를 가진 송신기를 포함하는 송신 시스템에 관한 것이며, 상기 인코더는 적어도 한 개의 주기적 성분의 주파수를 결정하는 수단을 포함하며, 상기 송신기는 적어도 한 개의 주기적 성분의 상기 주파수를 표시하는 신호를 수신기로 송신하는 송신 수단을 포함하며, 상기 수신기는 상기 송신기로부터 상기 주파수를 표시하는 신호를 수신하는 수신 수단과, 상기 적어도 한 개의 주기적 성분의 상기 주파수에 근거하여, 복구된(reconstructed) 오디오 신호를 이끌어내는 디코더를 포함한다.
본 발명은 또한 송신기, 수신기, 인코더, 디코더, 기록 시스템, 재생(reproduction) 시스템, 인코딩 방법 및 디코딩 방법, 상기 방법을 실행하는 컴퓨터 프로그램을 포함하는 유형(tangible) 매체, 신호 및 상기 신호를 운반하는 기록 매체에 관한 것이다.
도 1은 본 발명에 의해, 한 개의 오디오 신호를 송신하는 송신 시스템을 도시한 도면.
도 2는 수 개의 파라미터 a의 값에 대해, 시간 변형 함수의 그래프를 도시한 도면.
도 3은 도 1에 의한 송신 시스템에 사용된 변형 결정 수단(8)의 실시예를 도시한 도면.
도 4는 도 1에 의한 시간 워퍼(warper)(6)에 의한 시간 변형이 수반된 이산(discrete) 시간 신호의 그래프를 도시한 도면.
도 5는 도 1에 의한 시간 디-워퍼(de-warper)(26)에 의한 인버스(inverse) 시간 변형이 수반된 이산 시간 신호들의 그래프를 도시한 도면.
본 발명의 목적은, 상기 복구된 오디오 신호의 품질이 훨씬 개선된, 상술한 바에 의한 송신 시스템을 제공하는 것이다.
상기 목적을 이루기 위해, 본 발명에 의한 송신 시스템은 상기 인코더가, 소정의 시간 양에 대해, 적어도 한 개의 주기적 성분의 주파수 변화를 결정하는 주파수 변화 결정 수단을 더 포함하는 것을 특징으로 한다.
또한 상기 적어도 한 개의 주기적 성분의 주파수 변화를 결정함으로써, 상기 복구된 오디오 신호의 품질은 두 가지 면에서 개선될 수 있다. 첫째는, 상기 주파수 변화를 상기 수신기로 송신하는 것이며, 상기 수신기는 상기 주파수 변화를 복구된 오디오 신호를 이끌어내는데 사용할 수 있다. 둘째는, 상기 오디오 신호의 주파수의 보다 정확한 값을 얻기 위하여 상기 주파수 변화를 사용하는 것이다. 예를 들어, 이것은 한 개의 음성(speech) 신호 내의 피치(pitch), 또는 한 개의 오디오 신호에서 한 개의 임의의 주기적 성분이 될 수 있다. 상기 소정의 시간 양에 대해, 상기 주파수 변화를 사용함으로써, 상기 기본(fundamental) 주파수에 대응하는 평균 주파수 값은 더욱 정확하게 결정될 수 있다.
본 발명의 한 가지 실시예는, 상기 송신 수단이 상기 주파수 변화를 표시하는 추가의 신호를 상기 수신기로 송신하도록 배열되며, 상기 수신기는 상기 추가의신호를 수신하도록 배열되며, 상기 디코더는 상기 주파수의 상기 변화에 근거하여, 상기 복구된 오디오 신호 역시 이끌어내도록 배열된다.
상기 수신기로 송신되는 추가의 신호로써 상기 주파수 변화를 표시함으로써, 한 개의 합성 구간 내의 주파수가 (약간)변화하는 사인 곡선들은 상기 복구된 오디오 신호를 생성하는데 사용되는 것이 가능해진다. 이는 실제(actual) 오디오 신호의 특성에 더욱 해당이 되며, 상기 복구된 오디오 신호의 품질이 개선된다.
본 발명의 또 다른 실시예는, 상기 인코더가 시간 변형된 입력 신호를 얻는 시간 변형 수단(time transforming means)을 포함하며, 여기서, 상기 시간 변형 수단은 상기 시간 변형된 입력 신호가 상기 입력 신호 보다 작은 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안, 상기 입력 신호를 시간 압축하며, 상기 소정의 시간 양의 제 2 부분 동안, 상기 입력 신호를 시간 팽창하도록 배열되는 것을 특징으로 한다.
시간 변형된 오디오 신호를 얻기 위해, 시간 워핑(warping)으로도 불리는, 시간 변형을 사용하는 것은, 인코딩 되는 신호의 주파수 변화를 다루는데 효과적인 방법인 것으로 증명이 되었다. 적절한 시간 변형을 사용함으로써, 주파수가 변화하는 신호를, 실질적으로 일정한(constant) 주파수를 지니는, 시간 변형된 신호로 변형하는 것이 가능해졌다.
상기 예로서, 한 개의 세그먼트의 시작 부분에서 저 주파수로 시작하고, 상기 세그먼트의 끝 부분에서 더 높은 주파수로 종결되는 선형 주파수 스위프(sweep)를 가진 오디오 신호를 들 수 있다. 상기 입력 신호를 상기 세그먼트의 제 1 부분에서 시간 압축함으로써, 상기 시간-변형된 신호의 주파수는 원래의 입력 신호의 주파수 보다 높게 될 것이다. 상기 입력 신호를 상기 세그먼트의 제 2 부분에서 시간 팽창함으로써, 상기 시간-변형된 신호인, 입력 신호의 주파수는 원래의 입력 신호의 주파수 보다 낮을 것이다.
결과적으로, 상기 세그먼트의 시작 부분에서 주파수가 증가되고, 상기 세그먼트의 끝 부분에서 주파수가 감소되는, 시간 변형된 입력 신호가 얻어진다. 만약 상기 시간 변형을 적절히 선택한다면, 주파수 변화가 감소된, 변형된 입력 신호를 얻는 것이 가능해진다.
본 발명의 또다른 실시예는, 상기 시간 변형 결정 수단이 복수의 시간 변형된 입력 신호들을 이끌어내도록 배열되고, 각 시간 변형된 입력 신호는 다른 시간 변형에 대응하며, 상기 인코더는 상기 소정의 시간 양에 대해, 최소의 주파수 변화를 갖는, 시간 변형된 입력 신호에 대응하는 시간 변형을 선택하는 결정 수단을 포함하는 것을 특징으로 한다.
최적의 시간 변형을 결정하는 방법은 많은 수의 다른 시간 변형들을 시도하여, 최소의 주파수 변화를 갖는 변형된 오디오 신호가 되게 하는 것을 선택하는 것이다.
본 발명의 또다른 실시예는, 상기 시간 변형 결정 수단이 자기-상관 함수(autocorrelation function) 내에 가장 높은 피크(peak)를 갖는 상기 시간 변형된 입력 신호를 선택함으로써, 상기 소정의 시간 양에 대해 최소의 주파수 변화를 갖는 상기 시간 변형된 입력 신호를 선택하도록 배열되는 특징이 있다.
최소의 주파수 변화를 지니는, 변형된 시간의 신호를 결정하는 유용한 방법은 다른 시간 변형된 입력 신호들의 자기-상관 함수를 계산하는 것이다. 자기-상관 함수에서 가장 높은 피크를 가지는 시간-변형된 오디오 신호는 최소의 주파수 변화를 갖는다. 대안적으로, 상기 시간 변형된 입력 신호의 FFT를 계산하는 것 또한 가능하다. 이어서, FFT 도메인 내에 가장 높은 피크를 만드는 상기 시간 변형된 오디오 신호는 최대 일정 주파수를 가진다.
본 발명에 의한 송신 시스템의 또 다른 실시예는, 상기 시간 변형이 실제 시간과 변형된 시간 사이의 2차(quadratic) 관계로써 한정되는 특징이 있다.
상기 실제 시간과 변형된 시간 사이의 2차 관계는 쉽게 계산될 수 있으며, 시간 세그먼트의 제 1 부분에서 시간 압축을, 그리고 시간 세그먼트의 제 2 부분에서 시간 팽창을 이루어낼 수 있다.
본 발명에 의한 송신 시스템의 또 다른 실시예는, 실제 시간 t와 변형된 시간 τ사이의 관계가로써 정의되며, 여기서, a는 시간 변형을 정의하는 파라미터이고, T는 한 개의 신호 세그먼트의 지속 기간이다.
상기 2차 시간 변형은 오직 한 개의 파라미터를 가지며, 한 개의 신호 세그먼트 동안, 여전히 시간 압축 및 시간 팽창을 얻을 수 있다. 파라미터를 한 개만 갖는 잇점은, 최적의 시간 변형을 송신기로 전송하는데 필요한 비트의 수가 감소된다는 것이다. 게다가, 상기 시간 변형 함수는 상기 입력 신호의 선형 주파수 변화를 완전히 없앨 수 있다.
본 발명은 이제 도면들을 참조하여 설명될 것이다.
도 1에 의한 송신 시스템에서, 송신되는 한 개의 오디오 신호는 송신기(2)에 포함된 오디오 인코더(4)의 한 개의 입력으로 인가된다. 오디오 인코더(4)에서, 상기 입력 오디오 신호는 주파수 변화 결정 수단(8)의 한 개의 입력 및 본 명세서에서 시간 워퍼(6)인 시간 변형 수단의 한 개의 입력으로 인가된다.
상기 주파수 변화 결정 수단(8)의 제 1 출력 신호는 출력 신호 (a)를 운반하며, 시간 워퍼(6)의 제어 입력에 연결된다. 출력 신호 (a)는 상기 입력 신호의 주기적 성분의 주파수 변화를 표시한다. 시간 워퍼(6)는 입력 신호 상에서, 파라미터 a로써 정의된 시간 변형을 실행한다. 파라미터 a는 시간 워퍼(6)의 출력 신호에서 주기적 성분의 주파수가 최소화되도록 선택된다.
주파수 변화 결정 수단(8)의 제 2 출력에서, 오디오 신호 내의 주기적 성분의 평균 주파수를 표시하는 신호 (PITCH)가 존재한다. 음성 코딩에서, 상기 신호 (PITCH)는 음성 신호(speech signal)의 피치를 나타낸다.
시간 워퍼(6)의 출력은 시간 워퍼(6)의 출력 신호를 표시하는 파라미터들을 결정하도록 배열되는 분석기(10)의 한 개의 입력과 연결된다. 첫번째 가능성은, 분석기(10)가 선형 예측 분석기로서, 입력 신호의 복수의 LPC 계수들을 결정하는 것이다. 대안적으로, 분석기(10)가 시간 워퍼(6)의 출력 신호에 존재하는 복수의 사인 모양 성분들의 진폭 및 주파수들을 바로 결정하는 것 또한 가능하다.
신호 (a), 신호 (PITCH) 및 오디오 신호(LPC 계수들 또는 사인 곡선들의 진폭 및 주파수)의 추가 특성을 표시하는 분석기(10)의 출력 신호는 멀티플렉서(12)의 대응하는 입력들에게 인가된다. 멀티플렉서(12)의 출력은 멀티플렉서(12)의 출력 신호를 수신기(16)로 송신하는 송신 수단(14)의 입력에 연결된다.
상기 송신 수단(14)은 채널 인코딩, 한 개의 RF 반송파(carrier) 상에서 송신되는 신호의 인터리빙 및 변조와 같은 동작들을 실행한다. 본 발명이 인코딩 된 오디오 신호를 하드 드라이브나 광 디스크(optical disk)(CD, DVD)와 같은 기록 매체 상에서 기록하는데 사용되는 경우, 상기 변조 단계는 면제될 수 있다. 상기 경우에 있어서, 종종 변조 코드는 기록 매체 상에 기록되는 신호의 스펙트럼을 형성하는데 사용된다.
수신기(16)에서, 송신기(2)로부터 수신된 신호는 먼저 수신 수단(18)에 의해 처리된다. 수신 수단(18)은 복조(demodulation), 디-인터리빙(de-interleaving) 및 채널 디코딩을 실행하도록 배열된다. 수신 수단(18)의 출력 신호는 디코더(20)의 한 개의 입력과 연결된다. 디코더(20)에서, 상기 수신 수단(18)의 출력 신호는 디멀티플렉서(demultiplexer)(22)의 한 개의 입력에 연결된다.
디멀티플렉서는 출력시, 신호 (a, PITCH 및 LPC)를 제공한다. 신호 (PITCH 및 LPC)는 이들 파라미터로부터, 복구된 오디오 신호를 이끌어내는 합성기(24)에서 사용된다. 피치 신호 및 복수의 LPC 파라미터들에 근거하여 복구된 오디오 신호를 도출하는 상기 합성기의 동작은 국제 특허 출원 제 WO99/03095-A1호에 상세히 기술되어 있다.
합성기(24)의 출력은 본 명세서에서 디-워퍼(26)인, 인버스(inverse) 시간 변형 수단의 한 개의 입력으로 연결된다. 디-워퍼(26)는 시간 워퍼(6)에 의한 입력 신호로부터 제거되었던 주파수 변동(variation)을 재도입(reintroduce)한다. 디-워퍼(26)의 출력 시, 상기 복구된 오디오 신호가 이용 가능하다.
시간 워퍼(6)에 사용될 적합한 시간 변형 함수는 다음과 같다:
수학식 1에서, a는 워핑 파라미터이고, T는 음성 세그먼트의 지속 기간이며,t는 실제 시간을 나타내고, τ는 변형된 시간이다. 워핑 파라미터 a의 값은 상기 워핑 함수가 항상 시간 t와 함께 증가하도록 하는 범위를 지닌다. 이는 다음과 같이 된다:
│a│≤1
워핑 함수는 상기 워핑된 오디오 세그먼트의 총 지속 기간이 원래의 오디오 세그먼트의 지속 기간과 같도록 선택된다. 워핑된 세그먼트의 시작 및 종료 값은 원래의 오디오 세그먼트의 시작 및 종료 값과 같다.
시간 압축 또는 시간 팽창이 발생하느냐, 하지 않느냐 하는 것은, 수학식 1을 t에 대해 미분함으로써 결정될 수 있다. 이는 다음과 같이 된다:
시간 압축은 dτ/dt가 1 보다 작을 때 발생하며, 시간 팽창은 dτ/dt가 1 보다 클 때 발생한다. 수학식 3으로부터, a>0일 때, 시간 압축은 t<T/2일 때 발생하고, 시간 팽창은 t>T/2에서 발생한다. a<0일 때, 시간 압축은 t>T/2일 때 발생하며, 시간 팽창은 t<T/2에서 발생한다.
수학식 1에 따른 시간 워핑 함수의 인버스(inverse)는 다음 식에 의해 정의된다:
도 2는 여러 값들 a에 대해 t/T의 함수인 τ/T를 도시한다. 만약 a가 0이라면, τ는 t와 같으며, 시간 워핑은 발생하지 않는다.
다음에서, 수학식 1에 의해 정의된 시간 워퍼의 동작이 분석될 것이다. 만약 신호 s(t)가 유성(voiced) 음성과 같이, 시간 변동 주기성을 가진 신호라면, 이는 다음과 같이 나타낼 수 있다:
수학식 5에서, k는 고조파(harmonic)의 번호이며, xk및 yk는 진폭 인자이며,는 위상각이다. 시간 변형된 신호 s’(τ)는 다음과 같이 나타낼 수 있다:
수학식 5 및 수학식 6이 동일한 물리적 신호들을 나타내므로,과 같다. s(t)의 kth고조파(harmonic)의 순간 각 주파수 ωk(t)는 다음과 같이 주어진다:
s’(τ)의 kth고조파의 순간 각 주파수 Ωk(τ)는 다음과 같다:
=이므로, 시간 t에 대해, 이들의 도함수(derivatives) 역시 동일하다. 연쇄 법칙을 사용하면, 이는 다음과 같이 나타내어진다:
Ωk(τ)와 ωk(t)사이의 관계는 수학식 9를 사용하여 얻을 수 있다:
시간 워퍼의 또 다른 중요 특성은 워핑된 신호들의 kth고조파(harmonic)의 평균 주파수가 원래의 신호의 kth고조파(harmonic)의 평균 주파수와 동일하다는 것이다. 이는 다음 식으로부터 쉽게 유도된다:
상기 시간 워핑 함수는 입력 신호로부터 선형 주파수 변동을 제거할 수 있다는 것을 아래에서 볼 수 있다.
수학식 3을 수학식 10에 대입하면, 다음과 같이 된다:
시간에 대해 선형으로 변화하는 각 주파수 ω(t)를 갖는 사인 모양의 입력 신호를 가진 입력 신호를 가정하자. 상기 신호의 각 주파수는 다음과 같다:
수학식 13을 수학식 12에 대입하면 다음과 같다:
만약 Ω(τ)이 일정해야 한다면, 다음 식이 유효해야 한다:
수학식 15를 수학식 14에 대입하면 다음과 같다:
이것은 지속 기간 T인 세그먼트에 대해, 각 주파수 ω(t)의 평균과 동일한 상수 값에 해당한다.
도 3에 의한 주파수 변화 결정 수단(8)에서, 오디오 신호는 먼저 가중(weighting) 필터(30)으로 인가된다. 상기 가중 필터(30)는 적응 LPC 인버스(inverse) 필터이다. 가중 필터(30)의 출력 신호는 LPC 잔류물(residual)이다. 상기 입력 신호 대신, 예측 잔류물을 사용하는 것에는 기본 주파수(피치)의 주파수의 결정으로, 포르만트(formant) 상호작용을 최소화하는 잇점이 있다.
가중 필터(30)의 출력은 저역 통과 필터(low pass filter)(32)의 입력에 연결된다. 상기 저역 통과 필터는 약 1100 Hz의 컷-오프(cut-off) 주파수를 가진다. 상기 저역 통과 필터(32)의 출력은 복수의 시간 워퍼들(34, 42 및 50)의 입력에 연결된다. 상기 시간 워퍼들(34, 42 및 50)은 수학식 1에 의한 시간 변형을 실시하도록 배열되나, 각각은 파라미터 a의 다른 값을 가진다.
시간 워퍼들(34, 42 및 50)의 출력은 상관자들(correlators)(37), (41) 및 (51)의 입력으로 연결되며, 상기 상관자들 각각은 대응하는 시간 워퍼의 출력 신호의 자기-상관 함수의 추정인, 측정값(measure)을 결정한다.
상기 상관자들(correlators)(37), (41) 및 (51)은 자기-상관 함수가 분석 하에, 신호의 파워(power) 스펙트럼으로부터 인버스 FFT를 계산함으로써 결정될 수 있다는 특성을 이용한다. 파워 스펙트럼의 추정으로서, 고속 푸리에 변환(Fast Fourier Transform)의 절대값 역시 사용될 수 있다. 분석 창(window)에는 남성 목소리의 일부에서 발생할 수 있는 대단히 긴 피치 주기들(최대 25 msec)을 다루기 위해, 64 msec의, 상대적으로 긴 지속 기간이 주어진다. 상기 긴 분석 창의 선택은 시간 워핑 동작으로 인하여 가능해지며, 이는 더욱 고정된(stationary) 시간 변형된 신호를 전달한다.
상기 상관자들(37), (41) 및 (51)의 입력 신호는 푸리에 변환기들(36), (44) 및 (52)에서 푸리에 변환을 하게 된다. 상기 푸리에 변환기들은 입력 신호들의 FFT 절대값을 결정한다. 따라서, 소위 "제로 위상 함수"라 불리는, 고속 푸리에 변환기들(36), (44) 및 (52)의 출력 신호들의 zi(n)은 진폭 스펙트럼의 인버스 FFT를 인버스 고속 푸리에 변환기들(38), (46) 및 (54)을 사용해 계산함으로써 결정된다.
제로 위상 함수들 zi(n)은 정규화기(normalizers)(40), (48) 및 (56)에서, 그 값 zi(0)에 관해 정규화된다(normalized). 상기 정규화기(40), (48) 및 (56)의 출력은 선택 수단(58)의 입력과 연결되며, 상기 선택 수단(58)은 최적 값으로서, n의 비-제로 값에 대해 가장 높은 피크를 갖는 제로 위상 함수에 대응하는 시간 워핑 파라미터를 선택한다. 이것은 다음과 같은 인식에 근거하는데, 즉, 최적으로 워핑된 신호는 가장 일정한 주파수 Ωk(τ)를 보인다. 따라서, 상기 신호는 자기-상관 함수에서 가장 큰 피크를 가진다.
시간 워퍼들과 디워퍼들(dewarpers)은 이제까지 연속 시간 동작들로서 기술되었다. 실제 구현에 있어서, 상기 동작들은 이산 시간 시스템에서 구현되어야 한다. 만약 지속 기간 T인 입력 신호의 세그먼트가 N개의 샘플들로 표시된다면, 상기 워핑된 세그먼트 또한 지속 기간 T를 가지며, 역시 N개의 샘플들로써 표시되어야 한다. 그러나, 시간 워핑된 신호의 샘플링 순간들(instants)은 원래의 입력 신호의 샘플링 순간들과 대응하지 않는다. 이는 도 4에서는 시간 워퍼에 대해, 그리고 도 5에서는 시간 디-워퍼에 대해 도시된다.
도 4에서, 그래프(60)는 입력 신호에 해당하며, 그래프(62)는 워핑된 출력 신호에 해당한다. 도 4에서, 화살표(64)로 나타내었듯이, 그래프(62)에서 샘플링 순간 j=2는 그래프(60)에서 샘플 순간들 i=2와 i=3 사이의 시간에 대응한다. 이것은 시간 압축에 해당한다. 도 4에서 화살표(66)로 나타내었듯이, 그래프(62)에서 샘플링 순간 j=N-1은 그래프(60)에서 샘플 순간들 N-2와 N-1 사이의 시간에 대응한다. 이것은 시간 팽창에 해당한다.
이 문제를 다루기 위해, 샘플 값들은 발생하는 τj의 각각의 값들에 대해 계산되어야 하며, 다음과 같이 주어진다:
이것은 수학식 4를 사용하여 τj로부터 t의 대응 값을 계산함으로써 이루어진다. 상기 t의 값으로부터, 샘플링 격자(grid) 상의, 가장 인접한 값들이 결정된다. 이는 다음의 식에 의해 두 개의 i 값들이 된다:
수학식 18에서,은 그 변수(argument) 보다 작은, 최인접 정수를 표시하며,은 그 변수 보다 큰, 최인접 정수를 표시한다. 마지막으로, τj에 대해, 선형 보간된(interpolated) 샘플 값은 다음 식에 의해 계산된다:
선형 보간 외에도, 다른 유형의 보간, 이를테면, 2차, 3차 보간도 사용될 수 있음이 관찰된다.
도 5에서 그래프(68)는 워핑된 시간-척도를 도시하며, 그래프(70)는 대응하는 워핑되지 않은 시간-척도를 도시한다.
인버스 워핑은 도 5에 도시된 바와 같은 유사한 방법으로 된다. 먼저, 대응하는 샘플들이 결정되어야 하는 ti의 값들을 다음 식으로 찾는다:
이제, 수학식 1을 사용하여, 화살표(72)와 (74)로 표시된 바와 같은, 주어진 ti에 대응하는 τ값의 결정과 함께 계산이 이어진다. 상기 t의 값으로부터, 샘플링 격자 상의 최인접 값들이 결정된다. 이는 다음 식에 의해 두 가지 값의 j가 된다:
마지막으로, ti에 대해 선형 보간된 샘플 값은 다음의 식에 의해 계산된다:
본 발명은 전용 하드웨어를 사용함으로써, 혹은 프로그래밍이 가능한 프로세서 상에서 구동하는 프로그램을 사용함으로써 구현될 수 있음이 관찰된다. 또한, 상기 구현들을 조합하여 사용할 수 있다.

Claims (26)

  1. 한 오디오 신호를 인코딩하는 인코더를 가진 송신기를 포함하는 송신 시스템으로서, 상기 인코더는 상기 오디오 신호의 적어도 한 개의 주기적 성분의 주파수를 결정하는 주파수 결정 수단을 포함하며, 상기 송신기는 상기 주파수를 표시하는 신호를 수신기로 송신하는 송신 수단을 더 포함하며, 상기 수신기는 상기 주파수를 표시하는 신호를 상기 송신기로부터 수신하는 수신 수단 및 상기 주파수에 근거하여 복구된 오디오 신호를 이끌어내는 디코더 한 개를 포함하는, 송신 시스템으로서,
    상기 인코더는, 소정의 시간 양에 대해 상기 오디오 신호의 상기 적어도 한 개의 주기적 성분의 주파수 변화를 결정하는 주파수 변화 결정 수단을 더 포함하는 것을 특징으로 하는 송신 시스템.
  2. 제 1 항에 있어서, 상기 송신 수단은 상기 주파수 변화를 표시하는 추가 신호를 상기 수신기로 송신하도록 배열되며, 상기 수신기는 상기 추가 신호를 수신하도록 배열되며, 상기 디코더는 상기 주파수 변화에 근거하여 상기 복구된 오디오 신호 역시 이끌어내도록 배열되는 것을 특징으로 하는 송신 시스템.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 인코더는 상기 주파수 변화를 사용하여 상기 오디오 신호로부터 기본 주파수를 결정하는 수단을 포함하는 것을 특징으로 하는 송신 시스템.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 인코더는 시간 변형된 오디오 신호를 얻는 시간 변형 수단을 포함하며, 여기서, 상기 시간 변형 수단은 상기 시간 변형된 오디오 신호가 상기 오디오 신호 보다 작은 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안 상기 오디오 신호를 시간 압축하며, 상기 소정의 시간 양의 제 2 부분 동안 상기 오디오 신호를 시간 팽창하도록 배열되는 것을 특징으로 하는 송신 시스템.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 상기 주파수 변화 결정 수단은 복수의 시간 변형된 오디오 신호들을 이끌어내는 시간 변형 결정 수단을 포함하며, 각각은 다른 시간 변형에 대응하며, 상기 시간 변형 결정 수단은 상기 소정의 시간 양에 대해 최소의 주파수 변화를 갖는, 상기 시간 변형된 오디오 신호에 대응하는 상기 시간 변형을 선택하는 선택 수단을 포함하는 것을 특징으로 하는 송신 시스템.
  6. 제 5 항에 있어서, 상기 시간 변형 결정 수단은, 자기-상관(autocorrelation) 함수에서 가장 높은 피크(peak)를 갖는 시간 변형된 오디오 신호를 선택함으로써, 상기 소정의 시간 양에 대해 최소의 주파수 변화를 갖는 시간 변형된 오디오 신호를 선택하도록 배열되는 것을 특징으로 하는 송신 시스템.
  7. 제 4 항 내지 제 6 항 중 어느 한 항에 있어서, 상기 시간 변형은 상기 실제 시간과 상기 변형된 시간 사이의 2차 관계에 의해 정의되는 것을 특징으로 하는 송신 시스템.
  8. 제 7 항에 있어서, 상기 실제 시간 t와 상기 변형된 시간 τ 사이의 관계는
    에 의해 정의되고,
    여기서, a는 상기 시간 변형을 정의하는 파라미터이고, T는 한 개의 신호 세그먼트의 지속 기간인 것을 특징으로 하는 송신 시스템.
  9. 한 개의 오디오 신호를 인코딩하는 인코더를 가지는 송신기로서, 상기 인코더는 상기 오디오 신호의 적어도 한 개의 주기적 성분의 주파수를 결정하는 주파수 결정 수단을 포함하며, 상기 송신기는 상기 주파수를 표시하는 신호를 송신하는 송신 수단도 포함하는 송신기로서,
    상기 인코더는 소정의 시간 양에 대해 상기 오디오 신호의 적어도 한 개의 주기적 성분의 주파수 변화를 결정하는 주파수 변화 결정 수단을 더 포함하는 것을 특징으로 하는, 한 개의 오디오 신호를 인코딩하는 인코더를 가지는 송신기.
  10. 제 9 항에 있어서, 상기 송신 수단은 상기 주파수 변화를 표시하는 추가 신호를 송신하도록 배열되는 것을 특징으로 하는, 한 개의 오디오 신호를 인코딩하는 인코더를 가지는 송신기.
  11. 제 9 항 또는 제 10 항에 있어서, 상기 인코더는 소정의 시간 양에 대해, 상기 기본 주파수의 상기 변화를 이용하여, 상기 오디오 신호로부터 기본 주파수를 결정하는 수단을 포함하는 것을 특징으로 하는, 한 개의 오디오 신호를 인코딩하는 인코더를 가지는 송신기.
  12. 제 9 항 내지 제 11 항 중 어느 한 항에 있어서, 상기 인코더는 시간 변형된 오디오 신호를 얻는 시간 변형 수단을 포함하며, 여기서, 상기 시간 변형 수단은, 상기 시간 변형된 오디오 신호가 상기 오디오 신호 보다 작은 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안 상기 오디오 신호를 시간 압축하며, 상기 소정의 시간 양의 제 2 부분 동안 상기 오디오 신호를 시간 팽창하도록 배열되는 것을 특징으로 하는 한 개의 오디오 신호를 인코딩하는 인코더를 가지는 송신기.
  13. 오디오 신호의 적어도 한 개의 주기적 성분의, 적어도 한 개의 주파수로 한 개의 오디오 신호를 표시하는 인코딩 된 오디오 신호를 수신하는 수신 수단과, 상기 주파수에 근거하여, 복구된 오디오 신호를 이끌어내기 위한 디코더를 포함하는수신기로서,
    상기 수신기는 소정의 시간 양에 대해 상기 오디오 신호의 상기 적어도 한 개의 주기적 성분의 주파수 변화를 표시하는 추가 신호를 수신하도록 배열되며, 상기 디코더는 상기 주파수 변화에 근거하여, 상기 복구된 오디오 신호 역시 이끌어내도록 배열되는 것을 특징으로 하는 수신기.
  14. 제 13 항에 있어서, 상기 디코더는 디코딩 된 신호를 시간 변형함으로써, 상기 복구된 오디오 신호를 얻는 시간 변형 수단을 포함하며, 여기서 상기 시간 변형 수단은 상기 시간 변형되고 디코딩 된 신호가 상기 디코딩 된 신호 보다 큰 주파수 변화를 갖도록, 상기 소정의 시간 양의 제 1 부분 동안 상기 디코딩 된 신호를 시간 팽창하고, 상기 소정의 시간 양의 제 2 부분 동안 상기 디코딩 된 신호를 시간 압축하도록 배열되는 것을 특징으로 하는 수신기.
  15. 오디오 신호의 적어도 한 개의 주기적 성분의 주파수를 결정하며, 상기 주파수를 표시하는 신호를 이끌어내는 수단을 포함하며, 한 개의 오디오 신호를 인코딩하는 인코더로서,
    상기 인코더는 소정의 시간 양에 대해 상기 적어도 한 개의 주기적 성분의 주파수 변화를 표시하는 신호를 결정하는 주파수 변화 결정 수단을 더 포함하는 것을 특징으로 하는, 인코더.
  16. 제 15 항에 있어서, 상기 인코더는 시간 변형된 오디오 신호를 얻는 시간 변형 수단을 포함하며, 여기서, 상기 시간 변형 수단은 상기 시간 변형된 오디오 신호는 상기 오디오 신호 보다 작은 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안 상기 오디오 신호를 시간 압축하며, 상기 소정의 시간 양의 제 2 부분 동안 상기 오디오 신호를 시간 팽창하도록 배열되는 것을 특징으로 하는, 인코더.
  17. 오디오 신호의 적어도 한 개의 주기적 성분의 적어도 한 개의 주파수로 상기 오디오 신호를 표시하는 인코딩 된 오디오 신호로부터, 복구된 오디오 신호를 이끌어내며, 상기 주파수에 근거하여 복구된 오디오 신호를 이끌어내는 디코더로서,
    상기 디코더는 소정의 시간 양에 대해 상기 적어도 한 개의 주기적 성분의 주파수 변화를 표시하는 추가 신호에 또한 근거하여, 상기 복구된 오디오 신호를 이끌어내도록 배열되는 것을 특징으로 하는 디코더.
  18. 제 17 항에 있어서, 상기 디코더는, 한 개의 디코딩 된 신호를 시간 변형함으로써 상기 복구된 오디오 신호를 얻는 시간 변형 수단을 포함하며, 여기서, 상기 시간 변형 수단은, 상기 복구된 오디오 신호가 상기 디코딩 된 신호 보다 큰 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안 상기 디코딩 된 신호를 시간 팽창하고, 상기 소정의 시간 양의 제 2 부분 동안 상기 디코딩 된 신호를 시간 압축하도록 배열되는 것을 특징으로 하는, 디코더.
  19. 적어도 한 개의 주기적 성분의, 한 개의 주파수를 결정하는 것과, 상기 오디오 신호의 적어도 한 개의 주기적 성분의 상기 주파수를 표시하는 신호를 이끌어내는 것을 포함하는, 한 개의 오디오 신호를 인코딩 하는 방법으로서,
    상기 방법은 소정의 시간 양에 대해, 상기 오디오 신호의 상기 적어도 한 개의 주기적 성분의 주파수 변화를 표시하는 신호를 결정하는 것을 더 포함하는 것을 특징으로 하는, 한 개의 오디오 신호를 인코딩 하는 방법.
  20. 제 19 항에 있어서, 상기 방법은 시간 변형된 오디오 신호를 이끌어내는 것을 포함하며, 상기 방법은, 상기 시간 변형된 오디오 신호가 상기 오디오 신호 보다 작은 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안 상기 오디오 신호를 시간 압축하며, 상기 소정의 시간 양의 제 2 부분 동안 상기 오디오 신호를 시간 팽창하는 것을 더 포함하는 것을 특징으로 하는, 한 개의 오디오 신호를 인코딩 하는 방법.
  21. 오디오 신호를 표시하는 한 개의 인코딩 된 오디오 신호로부터, 상기 오디오 신호의 적어도 한 개의 주기적 성분의 적어도 한 개의 주파수를 통해, 복구된 오디오 신호를 이끌어내고, 상기 주파수에 근거하여 복구된 오디오 신호를 이끌어내는 방법으로서,
    상기 방법은, 소정의 시간 양에 대해, 상기 오디오 신호의 상기 적어도 한개의 주기적 성분의 주파수 변화를 표시하는 추가 신호에 또한 근거하여, 상기 복구된 오디오 신호를 이끌어내는 것을 포함하는 것을 특징으로 하는, 복구된 오디오 신호를 이끌어내는 방법.
  22. 제 21 항에 있어서, 상기 방법은 한 개의 디코딩 된 신호를 시간 변형함으로써, 상기 복구된 오디오 신호를 이끌어내는 것을 포함하며, 여기서, 상기 시간 변형은, 상기 시간 변형되고 디코딩 된 신호가 상기 디코딩 된 신호 보다 큰 주파수 변화를 갖는 방식으로, 상기 소정의 시간 양의 제 1 부분 동안, 상기 디코딩 된 신호를 시간 팽창하고, 상기 소정의 시간 양의 제 2 부분 동안 상기 디코딩 된 신호를 시간 압축하는 것을 포함하는 것을 특징으로 하는, 복구된 오디오 신호를 이끌어내는 방법.
  23. 제 19 항 내지 제 22 항 중 어느 한 항에 기재된 방법을 실행하는 컴퓨터 프로그램을 운반하는 저장 매체.
  24. 제 19 항 내지 제 22 항 중 한 항에 기재된 방법을 실행하는 컴퓨터 프로그램을 운반하는 신호.
  25. 오디오 신호의 적어도 한 개의 주기적 성분의, 적어도 한 개의 주파수로 상기 오디오 신호를 표시하는, 인코딩 된 오디오 신호로서,
    상기 인코딩 된 오디오 신호는, 소정의 시간 양에 대해, 상기 적어도 한 개의 주기적 성분의 주파수 변화를 표시하는 추가 신호 성분을 포함하는 것을 특징으로 하는, 인코딩 된 오디오 신호.
  26. 제 23 항에 기재된, 한 개의 인코딩 된 오디오 신호를 운반하는 저장 매체.
KR1020017000967A 1999-05-26 2000-05-08 오디오 신호 송신 시스템 KR20010072035A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99201656 1999-05-26
EP99201656.8 1999-05-26
PCT/EP2000/004219 WO2000074039A1 (en) 1999-05-26 2000-05-08 Audio signal transmission system

Publications (1)

Publication Number Publication Date
KR20010072035A true KR20010072035A (ko) 2001-07-31

Family

ID=8240236

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017000967A KR20010072035A (ko) 1999-05-26 2000-05-08 오디오 신호 송신 시스템

Country Status (7)

Country Link
US (1) US6978241B1 (ko)
EP (1) EP1099215B1 (ko)
JP (1) JP2003500708A (ko)
KR (1) KR20010072035A (ko)
CN (1) CN1227646C (ko)
DE (1) DE60018246T2 (ko)
WO (1) WO2000074039A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1319043C (zh) * 2001-10-26 2007-05-30 皇家飞利浦电子股份有限公司 用于编码和解码音频信号的方法与设备以及包括这样的设备的系统
EP1588263A4 (en) * 2003-01-17 2006-09-27 Thomson Licensing METHOD FOR USING A SYNCHRONOUS SENSING DESIGN IN A FESTRATIVE SENSING MODE
US7567903B1 (en) * 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
KR101400484B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
CN102884572B (zh) * 2010-03-10 2015-06-17 弗兰霍菲尔运输应用研究公司 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法
JP6303340B2 (ja) * 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
JPH0546199A (ja) * 1991-08-21 1993-02-26 Matsushita Electric Ind Co Ltd 音声符号化装置
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
WO1995010760A2 (en) * 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
JPH07219597A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd ピッチ変換装置
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing

Also Published As

Publication number Publication date
CN1227646C (zh) 2005-11-16
EP1099215B1 (en) 2005-02-23
DE60018246T2 (de) 2006-05-04
WO2000074039A1 (en) 2000-12-07
DE60018246D1 (de) 2005-03-31
US6978241B1 (en) 2005-12-20
CN1318188A (zh) 2001-10-17
JP2003500708A (ja) 2003-01-07
EP1099215A1 (en) 2001-05-16

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
EP2102862B1 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
US7516066B2 (en) Audio coding
US7957958B2 (en) Pitch period equalizing apparatus and pitch period equalizing method, and speech coding apparatus, speech decoding apparatus, and speech coding method
KR100452955B1 (ko) 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
JP4912816B2 (ja) 音声コーダの方法とシステム
JPH11224099A (ja) 位相量子化装置及び方法
JP4782006B2 (ja) 低ビットレートオーディオ符号化
KR20010072035A (ko) 오디오 신호 송신 시스템
CA1332982C (en) Coding of acoustic waveforms
NO312428B1 (no) Fremgangsmåte og anordning for syntetisering av tale
JP2007509363A (ja) オーディオ符号化方法及び装置
US6535847B1 (en) Audio signal processing
US6115685A (en) Phase detection apparatus and method, and audio coding apparatus and method
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
KR20220104049A (ko) 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법
KR20050049543A (ko) 위상 갱신을 사용한 사인 오디오 코딩
KR20200083565A (ko) 피치 지연 선택
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2006510938A (ja) 音声符号化における正弦波の選択
JP3749838B2 (ja) 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体
JPH11219199A (ja) 位相検出装置及び方法、並びに音声符号化装置及び方法
EP0987680B1 (en) Audio signal processing
JP4173218B2 (ja) 音声圧縮装置および記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application