KR970017170A - 음성 코딩 방법 - Google Patents

음성 코딩 방법 Download PDF

Info

Publication number
KR970017170A
KR970017170A KR1019960040757A KR19960040757A KR970017170A KR 970017170 A KR970017170 A KR 970017170A KR 1019960040757 A KR1019960040757 A KR 1019960040757A KR 19960040757 A KR19960040757 A KR 19960040757A KR 970017170 A KR970017170 A KR 970017170A
Authority
KR
South Korea
Prior art keywords
frame
sub
residual signal
voice
sample
Prior art date
Application number
KR1019960040757A
Other languages
English (en)
Other versions
KR100444635B1 (ko
Inventor
베스티안 클레인 윌럼
네이엄미 드로르
Original Assignee
스티븐 알. 바쏠로뮤
에이티 앤드 티 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스티븐 알. 바쏠로뮤, 에이티 앤드 티 코포레이션 filed Critical 스티븐 알. 바쏠로뮤
Publication of KR970017170A publication Critical patent/KR970017170A/ko
Application granted granted Critical
Publication of KR100444635B1 publication Critical patent/KR100444635B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음성 코딩 방법과 함께 이용되는 음성 코딩의 개선된 방법에 있어서, 음성은 다수의 임시로 정의된 프레임으로 디지탈화되는데, 각각의 프레임은 다수의 서브-프레임을 갖고, 디지탈화된 음성은 주기 성분과 잔류 신호
로 분할된다. 잔류 신호의 다수의 서브-프레임 각각에 대해, 음성 코딩의 개선된 방법은 이전 프레임의 프레임-프레임 경계에 또는 근처에 발생하는 인지된 피치 지연에 선형 보간을 적용하여 결정된 (가) 잔류 신호의 현재 서브-프레임과, (나) 샘플-샘플(서브-프레임-서브 프레임) 피치 지연에 정합 기준을 인가하여 서브-프레임에 시간 시프트(T)를 선택 및 적용한다.
상기 정합 기준은 다음식을 최소화하여 적용되는데,

Description

음성 코딩 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 실시예를 설명하기 위한 하드웨어 블록 다이어그램,
제2도는 제1도의 하드웨어를 이용하여 실행될 수 있는 동작 스퀀스를 설명하기 위한 소프트웨어 흐름도.

Claims (5)

  1. 각각의 프레임이 지정된 시간 간격 동안 현재의 서브-프레임 존재를 포함하는 다수의 서브-프레임을 갖고, 각각의 프레임이 바로 이전 프레임에 참조한 피치의 변화를 지정하는 피치 지연 값을 가지며, 각각의 서브-프레임이 다수의 샘플을 포함하고, 디지탈화된 음성이 주기 성분과 잔류 신호로 분할되는, 다수의 임시로 정의된 프레임으로 음성이 디지탈화되는 음성 코팅 방법과 함께 이용되는 음성 코팅 방법에 있어서. 가) 상기 잔류 신호의 다수의 서브-프레임 각각에 대해, 이전 프레임의 프레임-프레임 경계에 또는 근처에 발생하는 인지된 피치 지연에 선형 보간을 작용하여 피치 지연 값이 결정되도록, (i) 잔류 신호의 현재 서브-프레임과, (ii) 현재의 서브-프레임의 n 샘플의 각각에 대해 샘플-샘플 피치 지연값에 기초하여 시간 시프트(T)를 결정하는 단계와, 나) 단계 가)에서 결정된 시간 시프트(T)를 잔류 신호의 현재 서브-프레임에 적용하는 단계를 포함하는 것을 특징으로 하는 음성 코팅 방법.
  2. 제1항에 있어서, 상기 시간 시프트(T)는 다음식,으로 정의되는 정합 기준을 이용하여 결정되는데, (r(n-T))는 시간(T)에 의해 시프트된 현재 프레임의 잔류 신호이고, r(n-D(n))은 이전에 발생된 프레임으로부터 지연된 잔류 신호이며, n은 양의 정수이고, r은 잔류 신호의 순간 진폭이며, D(n)은 프레임-프레임 경계에서 또는 근처에서 발생되어 인지된 피지 지연값에 선형 보간을 적용하여 결정된 샘플-샘플 피치 지연을 나타내는 것을 특징으로 하는 음성 코팅 방법.
  3. 제2항에 있어서, 상기 시간 시프트(T)는 정합 기준(ε)을 최소화하기 위해 결정되는데, ε은 잔류 신호의 서브-프레임과 그 잔류 신호의 시간-시프트된 버전 사이의 상관 관계를 나타내는 것을 특징으로 하는 음성 코팅 방법.
  4. 제3항에 있어서, 일반화된 상관 관계 측정(Gopt)이 지정된 임계값과 동일하거나 보다 클 때만 시간 시프트(T)에 의해 잔류 신호의 서브-프레임이 시간 시프트되는데 상기 Gopt는,로 정의되는 것을 특징으로 하는 음성 코팅 방법.
  5. 제4항에 있어서, 상기 잔류 신호의 한 서브-프레임은 가) Gopt가 지정된 제1임계값과 동일하거나 보다 클 때와, 나) 피크-평균 비율이 저장된 제2임계값과 동일하거나 보다 클 때만 시간 시프트(T)에 의해 시간 시프트되는데, 상기 피크-평균 비율은 서브-프레임의 잔류 신호의 평균 에너지에 대한 잔류 신호의 서브-프레임의 한 펄스의 에너지 비율로서 정의되어, 주기의 바람직하지 못한 삽입을 비주기 음성 세그먼트로 제거 또는 감소시키는 것을 특징으로 하는 음성 코딩 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960040757A 1995-09-19 1996-09-19 개량형 음성 코딩 방법 KR100444635B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US530,040 1995-09-19
US08/530,040 US5704003A (en) 1995-09-19 1995-09-19 RCELP coder

Publications (2)

Publication Number Publication Date
KR970017170A true KR970017170A (ko) 1997-04-30
KR100444635B1 KR100444635B1 (ko) 2005-02-02

Family

ID=24112207

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960040757A KR100444635B1 (ko) 1995-09-19 1996-09-19 개량형 음성 코딩 방법

Country Status (6)

Country Link
US (1) US5704003A (ko)
EP (1) EP0764940B1 (ko)
JP (1) JP3359506B2 (ko)
KR (1) KR100444635B1 (ko)
CA (1) CA2183283C (ko)
DE (1) DE69615119T2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100437900B1 (ko) * 1996-12-24 2004-09-04 엘지전자 주식회사 음성코덱의음성데이터복원방법

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3252782B2 (ja) 1998-01-13 2002-02-04 日本電気株式会社 モデム信号対応音声符号化復号化装置
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6113653A (en) * 1998-09-11 2000-09-05 Motorola, Inc. Method and apparatus for coding an information signal using delay contour adjustment
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
US6523002B1 (en) * 1999-09-30 2003-02-18 Conexant Systems, Inc. Speech coding having continuous long term preprocessing without any delay
US6526139B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated noise injection in a voice processing system
US7068644B1 (en) * 2000-02-28 2006-06-27 Sprint Spectrum L.P. Wireless access gateway to packet switched network
US6581030B1 (en) * 2000-04-13 2003-06-17 Conexant Systems, Inc. Target signal reference shifting employed in code-excited linear prediction speech coding
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
GB2400003B (en) * 2003-03-22 2005-03-09 Motorola Inc Pitch estimation within a speech signal
US7808940B2 (en) * 2004-05-10 2010-10-05 Alcatel-Lucent Usa Inc. Peak-to-average power ratio control
US8265929B2 (en) * 2004-12-08 2012-09-11 Electronics And Telecommunications Research Institute Embedded code-excited linear prediction speech coding and decoding apparatus and method
NZ562183A (en) * 2005-04-01 2010-09-30 Qualcomm Inc Systems, methods, and apparatus for highband excitation generation
WO2006116024A2 (en) * 2005-04-22 2006-11-02 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
JP5511372B2 (ja) * 2007-03-02 2014-06-04 パナソニック株式会社 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
WO2008108083A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置および音声符号化方法
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2621965C2 (ru) 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
WO2010084756A1 (ja) * 2009-01-22 2010-07-29 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
CN103329124A (zh) * 2010-11-24 2013-09-25 万梅戈切伦和蒂拉努斯有限公司 用于为现有数字样本编译唯一的样本代码的方法和系统
US9640185B2 (en) * 2013-12-12 2017-05-02 Motorola Solutions, Inc. Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
CN105788601B (zh) * 2014-12-25 2019-08-30 联芯科技有限公司 VoLTE的抖动隐藏方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
NL8902347A (nl) * 1989-09-20 1991-04-16 Nederland Ptt Werkwijze voor het coderen van een binnen een zeker tijdsinterval voorkomend analoog signaal, waarbij dat analoge signaal wordt geconverteerd in besturingscodes die bruikbaar zijn voor het samenstellen van een met dat analoge signaal overeenkomend synthetisch signaal.
DE69129329T2 (de) * 1990-09-14 1998-09-24 Fujitsu Ltd Sprachkodierungsystem
JP3254687B2 (ja) * 1991-02-26 2002-02-12 日本電気株式会社 音声符号化方式
JPH04277800A (ja) * 1991-03-06 1992-10-02 Fujitsu Ltd 音声符号化方式
DE69225293T2 (de) * 1991-10-25 1998-09-10 At & T Corp Verallgemeinerte Analyse-durch-Synthese Methode und Einrichtung zur Sprachkodierung
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
CA2102080C (en) * 1992-12-14 1998-07-28 Willem Bastiaan Kleijn Time shifting for generalized analysis-by-synthesis coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100437900B1 (ko) * 1996-12-24 2004-09-04 엘지전자 주식회사 음성코덱의음성데이터복원방법

Also Published As

Publication number Publication date
US5704003A (en) 1997-12-30
DE69615119D1 (de) 2001-10-18
JP3359506B2 (ja) 2002-12-24
KR100444635B1 (ko) 2005-02-02
EP0764940A2 (en) 1997-03-26
EP0764940A3 (en) 1998-05-13
CA2183283C (en) 2001-02-20
JPH09185398A (ja) 1997-07-15
CA2183283A1 (en) 1997-03-20
DE69615119T2 (de) 2002-04-25
EP0764940B1 (en) 2001-09-12

Similar Documents

Publication Publication Date Title
KR970017170A (ko) 음성 코딩 방법
Rao et al. Determination of instants of significant excitation in speech using Hilbert envelope and group delay function
EP0275416B1 (en) Method for enhancing the quality of coded speech
CN105122356B (zh) 信号解码期间帧丢失的改进型校正
JP3297346B2 (ja) 音声検出装置
US10937432B2 (en) Error concealment unit, audio decoder, and related method and computer program using characteristics of a decoded representation of a properly decoded audio frame
KR950009664A (ko) 실시간 피치 이동을 수행하기 위한 신호 처리 시스템 및 실시간 피치 이동을 수행하기 위한 방법
ATE78641T1 (de) Echokompensation.
DE60024080D1 (de) Kodierung von sprachsegmenten mit signalübergängen durch interpolation von mehrimpulsanregungssignalen
KR960016224A (ko) 신호 처리기에서 잡음 버스트 검출 방법 및 장치
JPH1097294A (ja) 音声符号化装置
KR940023033A (ko) 음성 신호에서 맥동적 간섭 신호를 검출하는 방법 및 장치
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
EP0751492A2 (en) Method and equipment for coding and decoding a sampled speech signal
WO2020169754A1 (en) Methods for phase ecu f0 interpolation split and related controller
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
KR950013033A (ko) 펄스폭 변조 인버터의 전류 검출 방법
SU1524189A1 (ru) Устройство подавлени акустических шумов
JPH0793000A (ja) 音声符号化装置
MXPA96005179A (en) A system and method of processing of voice deanalisis of impulses multip
KR940022369A (ko) 음성합성 시스템의 논-제로 위상 복원 방법
KR970017473A (ko) 디지탈 녹음기의 음성 녹음방법
KR950007542A (ko) 적응적 전처리를 행하는 영상 부호화 장치
KR940018766A (ko) 디지탈적응필터의 오차평균계산방법
JPH0371079A (ja) ソーナー表示処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130726

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140725

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150724

Year of fee payment: 12

EXPY Expiration of term