ATE438911T1 - Verfahren und vorrichtung zur codierung aufeinanderfolgender grundperioden in einem sprachsignal - Google Patents

Verfahren und vorrichtung zur codierung aufeinanderfolgender grundperioden in einem sprachsignal

Info

Publication number
ATE438911T1
ATE438911T1 AT02727961T AT02727961T ATE438911T1 AT E438911 T1 ATE438911 T1 AT E438911T1 AT 02727961 T AT02727961 T AT 02727961T AT 02727961 T AT02727961 T AT 02727961T AT E438911 T1 ATE438911 T1 AT E438911T1
Authority
AT
Austria
Prior art keywords
pitch
loop
closed
search
voice signal
Prior art date
Application number
AT02727961T
Other languages
English (en)
Inventor
Ari Heikkinen
Vesa Ruoppila
Samuli Pietilae
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ATE438911T1 publication Critical patent/ATE438911T1/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Selective Calling Equipment (AREA)
AT02727961T 2001-06-11 2002-06-07 Verfahren und vorrichtung zur codierung aufeinanderfolgender grundperioden in einem sprachsignal ATE438911T1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/878,762 US6584437B2 (en) 2001-06-11 2001-06-11 Method and apparatus for coding successive pitch periods in speech signal
PCT/IB2002/002078 WO2002101718A2 (en) 2001-06-11 2002-06-07 Coding successive pitch periods in speech signal

Publications (1)

Publication Number Publication Date
ATE438911T1 true ATE438911T1 (de) 2009-08-15

Family

ID=25372784

Family Applications (1)

Application Number Title Priority Date Filing Date
AT02727961T ATE438911T1 (de) 2001-06-11 2002-06-07 Verfahren und vorrichtung zur codierung aufeinanderfolgender grundperioden in einem sprachsignal

Country Status (8)

Country Link
US (1) US6584437B2 (de)
EP (1) EP1428202B1 (de)
KR (1) KR100896944B1 (de)
CN (1) CN1262993C (de)
AT (1) ATE438911T1 (de)
AU (1) AU2002258104A1 (de)
DE (1) DE60233238D1 (de)
WO (1) WO2002101718A2 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60232560D1 (de) * 2001-08-31 2009-07-16 Kenwood Hachioji Kk Vorrichtung und Verfahren zur Erzeugung eines Signals mit konstanten Grundfrequenz und Vorrichtung sowie Verfahren zum Synthetisieren von Sprachsignalen unter Verwendung dieser Signals mit konstanten Grundfrequenz.
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
DE60218068T2 (de) * 2001-11-30 2007-11-22 Koninklijke Philips Electronics N.V. Signalkodierung
US7376553B2 (en) * 2003-07-08 2008-05-20 Robert Patel Quinn Fractal harmonic overtone mapping of speech and musical sounds
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
DE602005023503D1 (de) * 2004-10-28 2010-10-21 Panasonic Corp Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür
US8386245B2 (en) * 2006-03-20 2013-02-26 Mindspeed Technologies, Inc. Open-loop pitch track smoothing
US20080097757A1 (en) * 2006-10-24 2008-04-24 Nokia Corporation Audio coding
JP5241509B2 (ja) * 2006-12-15 2013-07-17 パナソニック株式会社 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法
EP2116995A4 (de) * 2007-03-02 2012-04-04 Panasonic Corp Einrichtung zur adaptiven schallquellen-vektorquantisierung und adaptives schallquellenvektorquantisierungsverfahren
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
JP7337966B2 (ja) * 2019-06-29 2023-09-04 華為技術有限公司 ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置
CN112151045B (zh) * 2019-06-29 2024-06-04 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN110390953B (zh) * 2019-07-25 2023-11-17 腾讯科技(深圳)有限公司 啸叫语音信号的检测方法、装置、终端及存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58215822A (ja) 1982-06-10 1983-12-15 Toshiba Corp 音声信号の予測符号化装置
WO1984004989A1 (en) 1983-06-03 1984-12-20 Variable Speech Control Method and apparatus for pitch period controlled voice signal processing
US4704730A (en) * 1984-03-12 1987-11-03 Allophonix, Inc. Multi-state speech encoder and decoder
JPH0632021B2 (ja) 1987-07-15 1994-04-27 シャープ株式会社 日本語音声認識装置
JPH0451200A (ja) 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化方式
JP3226180B2 (ja) * 1992-04-09 2001-11-05 日本電信電話株式会社 音声のピッチ周期符号化法
US5884253A (en) 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
US5388124A (en) * 1992-06-12 1995-02-07 University Of Maryland Precoding scheme for transmitting data using optimally-shaped constellations over intersymbol-interference channels
CA2135629C (en) 1993-03-26 2000-02-08 Ira A. Gerson Multi-segment vector quantizer for a speech coder suitable for use in a radiotelephone
US5504834A (en) * 1993-05-28 1996-04-02 Motrola, Inc. Pitch epoch synchronous linear predictive coding vocoder and method
WO1997017692A1 (en) * 1995-11-07 1997-05-15 Euphonics, Incorporated Parametric signal modeling musical synthesizer
US5799276A (en) 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US5729694A (en) 1996-02-06 1998-03-17 The Regents Of The University Of California Speech coding, reconstruction and recognition using acoustics and electromagnetic waves
US6006175A (en) 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
US6009394A (en) * 1996-09-05 1999-12-28 The Board Of Trustees Of The University Of Illinois System and method for interfacing a 2D or 3D movement space to a high dimensional sound synthesis control space
US6185527B1 (en) 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals

Also Published As

Publication number Publication date
KR100896944B1 (ko) 2009-05-14
US20030004709A1 (en) 2003-01-02
EP1428202B1 (de) 2009-08-05
CN1262993C (zh) 2006-07-05
EP1428202A4 (de) 2005-10-26
WO2002101718A3 (en) 2003-04-10
KR20040028774A (ko) 2004-04-03
US6584437B2 (en) 2003-06-24
DE60233238D1 (de) 2009-09-17
CN1514994A (zh) 2004-07-21
WO2002101718A2 (en) 2002-12-19
EP1428202A2 (de) 2004-06-16
AU2002258104A1 (en) 2002-12-23

Similar Documents

Publication Publication Date Title
ATE438911T1 (de) Verfahren und vorrichtung zur codierung aufeinanderfolgender grundperioden in einem sprachsignal
ATE368279T1 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
ATE391985T1 (de) Verfahren und vorrichtung zur modellierung eines spracherkennungssystems und zur schätzung einer wort-fehlerrate basierend auf einem text
DE69827202D1 (de) Verfahren und Vorrichtung zum Zählen von Wörtern für die Erkennung kontinuierlicher Sprache zur Verwendung bei zuverlässiger Sprachansage-Unterbrechung und frühzeitiger Sprach-Endpunktbestimmung
DE69535709D1 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate bei einem Vokoder mit variabler Rate
ATE362634T1 (de) Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer
EP1557821A3 (de) Segmentbasierte tonale Modellierung für tonale Sprachen
EP1629464A4 (de) Spracherkennungssystem und verfahren auf phonetischer basis
ATE368278T1 (de) Kompensationsverfahren bei rahmenauslöschung in einem sprachkodierer mit veränderlicher datenrate
DE69811921D1 (de) Vorrichtung und verfahren zur unterscheidung von ähnlich klingenden wörtern in der spracherkennung
DE69840115D1 (de) Verfahren zur Spracherkennung mittels Modellierung der Wortdauer
DE69604526D1 (de) Verfahren zur Anpassung des Rauschmaskierungspegels in einem Analyse-durch-Synthese-Sprachkodierer mit einem wahrnehmunggebundenen Kurzzeitfilter
DE60111329D1 (de) Anpassung des phonetischen Kontextes zur Verbesserung der Spracherkennung
ATE355294T1 (de) Verfahren zur herstellung von mercaptooganyl (alkoxysilanen)
ATE538068T1 (de) Verfahren und vorrichtung zur herstellung von ä11cü-kohlenmonoxid bei der markierungssynthese
DE69937854D1 (de) Verfahren und Vorrichtung zur Spracherkennung unter Verwendung von phonetischen Transkriptionen
ATE533146T1 (de) Verfahren und vorrichtung zur suche einer grundfrequenz
DE69025091D1 (de) Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort
ATE265732T1 (de) Vorrichtung und verfahren zur breitbandcodierung von sprachsignalen
ATE366431T1 (de) Verfahren zur regelung eines thermodynamischen prozesses
ATE338330T1 (de) Verfahren und vorrichtung zur zweiphasen- grundfrequenzdetektion
DE60110541D1 (de) Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz
ATE480852T1 (de) Verfahren, vorrichtung zur sprachkodierung in einem mobilen kommunikationsendgerät mittels plp
DE50311212D1 (de) Verfahren zur herstellung von perfluoralkylphosphinen und deren verwendung als perfluoralkylierungsreagenzien
DE69424960T2 (de) Verfahren und Vorrichtung zur Sprachkodierung mit Trellis-kodierter Quantisierung für LPC- Quantisierung

Legal Events

Date Code Title Description
RER Ceased as to paragraph 5 lit. 3 law introducing patent treaties