DE04723803T1 - Sprachsignalkomprimierungseinrichtung - Google Patents

Sprachsignalkomprimierungseinrichtung Download PDF

Info

Publication number
DE04723803T1
DE04723803T1 DE04723803T DE04723803T DE04723803T1 DE 04723803 T1 DE04723803 T1 DE 04723803T1 DE 04723803 T DE04723803 T DE 04723803T DE 04723803 T DE04723803 T DE 04723803T DE 04723803 T1 DE04723803 T1 DE 04723803T1
Authority
DE
Germany
Prior art keywords
signal
compression
phoneme
speech signal
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE04723803T
Other languages
English (en)
Inventor
Yasushi Nagareyama-shi Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Publication of DE04723803T1 publication Critical patent/DE04723803T1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Sprachsignalkompressionsvorrichtung umfassend:
eine Einrichtung zur phonemgerechten Aufteilung, um ein Sprachsignal zu erfassen, das eine zu komprimierende Sprachwellenform angibt, und um das Sprachsignal in Abschnitte aufzuteilen, die Wellenformen individueller Phoneme angeben;
ein Filter zum Filtern des aufgeteilten Sprachsignals zwecks Extraktion eines Tonhöhensignals;
eine Phaseneinstellungseinrichtung zum Trennen des Sprachsignals in Sektionen basierend auf dem durch das Filter extrahierten Tonhöhensignal und zum Einstellen, für jede der Sektionen, der Phase basierend auf dem Korrelationsverhältnis zu dem Tonhöhensignal;
eine Abtasteinrichtung zum Bestimmen, für jede der Sektionen, für welche die Phase durch die Phaseneinstellungseinrichtung eingestellt worden ist, der Abtastlänge basierend auf der Phase und zum Erzeugen eines Abtastsignals durch Ausführen von Abtasten in Übereinstimmung mit der Abtastlänge;
eine Sprachsignalverarbeitungseinrichtung zum Verarbeiten des Abtastsignals zu einem Tonhöhenwellenformsignal basierend auf dem Ergebnis der Einstellungen durch die Phaseneinstellungseinrichtung und dem Wert der Abtastlänge;
eine Subbanddatenerzeugungseinrichtung zum Erzeugen von Subband-Daten, welche die zeitliche...

Claims (9)

  1. Sprachsignalkompressionsvorrichtung umfassend: eine Einrichtung zur phonemgerechten Aufteilung, um ein Sprachsignal zu erfassen, das eine zu komprimierende Sprachwellenform angibt, und um das Sprachsignal in Abschnitte aufzuteilen, die Wellenformen individueller Phoneme angeben; ein Filter zum Filtern des aufgeteilten Sprachsignals zwecks Extraktion eines Tonhöhensignals; eine Phaseneinstellungseinrichtung zum Trennen des Sprachsignals in Sektionen basierend auf dem durch das Filter extrahierten Tonhöhensignal und zum Einstellen, für jede der Sektionen, der Phase basierend auf dem Korrelationsverhältnis zu dem Tonhöhensignal; eine Abtasteinrichtung zum Bestimmen, für jede der Sektionen, für welche die Phase durch die Phaseneinstellungseinrichtung eingestellt worden ist, der Abtastlänge basierend auf der Phase und zum Erzeugen eines Abtastsignals durch Ausführen von Abtasten in Übereinstimmung mit der Abtastlänge; eine Sprachsignalverarbeitungseinrichtung zum Verarbeiten des Abtastsignals zu einem Tonhöhenwellenformsignal basierend auf dem Ergebnis der Einstellungen durch die Phaseneinstellungseinrichtung und dem Wert der Abtastlänge; eine Subbanddatenerzeugungseinrichtung zum Erzeugen von Subband-Daten, welche die zeitliche Veränderung spektraler Verteilung von jedem der Phoneme basierend auf dem Tonhöhenwellenformsignal angeben; eine Einrichtung zur phonemgerechten Kompression, um Datenkompression der Subband-Daten in Übereinstimmung mit einer vorgegebenen Bedingung durchzuführen, die für ein durch die Subband-Daten angegebenes Phonem spezifiziert ist.
  2. Sprachsignalkompressionsvorrichtung nach Anspruch 1, wobei die Einrichtung zur phonemgerechten Kompression gestaltet ist durch: eine Einrichtung zum umschreibbaren Speichern einer Tabelle, die eine Bedingung für Datenkompression spezifiziert, die für Subband-Daten durchzuführen ist, die jedes Phonem angeben; und eine Einrichtung zum Durchführen von Datenkompression von Subband-Daten, die jedes Phonem angeben, in Übereinstimmung mit einer Bedingung, die von der Tabelle spezifiziert ist.
  3. Sprachsignalkompressionsvorrichtung nach Anspruch 1 oder 2, wobei die Einrichtung zur phonemgerechten Kompression Datenkompression von jedes Phonem angebenden Subband-Daten durch nichtlineares Quantisieren der Daten durchführt, so dass die Kompressionsrate zur Erfüllung einer für das Phonem spezifizierten Bedingung erreicht wird.
  4. Sprachsignalkompressionsvorrichtung nach Anspruch 1, 2 oder 3, wobei Priorität für jede spektrale Komponente von Subband-Daten spezifiziert wird; und die Einrichtung zur phonemgerechten Kompression Datenkompression von Subband-Daten durch Quantisieren jeder der spektralen Komponenten der Subband-Daten in einer Weise durchführt, dass eine spektrale Komponente mit einer höheren Priorität mit einer höheren Auflösung quantisiert wird.
  5. Sprachsignalkompressionsvorrichtung nach einem der Ansprüche 1 bis 4, wobei die Einrichtung zur phonemgerechten Kompression Datenkompression von Subband-Daten durch Ändern der Subband-Daten durchführt, so dass spektrale Verteilung nach Löschen einer vorgegebenen spektralen Komponente gezeigt wird.
  6. Sprachsignalkompressionsvorrichtung, umfassend: eine Sprachsignalverarbeitungseinrichtung zum Erfassen eines Sprachsignals, das eine Wellenform einer Sprache angibt, und zum Verarbeiten des Sprachsignals zu einem Tonhöhenwellenformsignal, indem Phasen multipler, durch Trennen des Sprachsignals erhaltener Sektionen im Wesentlichen entzerrt werden, wobei jede der multiplen Sektionen einer Tonhöheneinheit der Sprache entspricht; eine Subbanddatenerzeugungseinrichtung zum Erzeugen von Subband-Daten, die zeitliche Veränderung spektraler Verteilung von jedem der Phoneme basierend auf dem Tonhöhenwellenformsignal angeben; und eine Einrichtung zur phonemgerechten Kompression, um Datenkompression bei jedem der Abschnitte, die individuelle Phoneme der Subband-Daten angeben, in Übereinstimmung mit einer vorgegebenen Bedingung durchzuführen, die für ein durch den Abschnitt angegebenes Phonem spezifiziert ist.
  7. Sprachsignalkompressionsvorrichtung, umfassend: eine Einrichtung zum Erfassen eines Signals, das eine Sprachwellenform oder zeitliche Veränderung spektraler Verteilung von Sprache angibt; und eine Einrichtung zum Durchführen von Datenkompression bei jedem der Abschnitte, die individuelle Phoneme des erfassten Signals angeben, in Übereinstimmung mit einer vorgegebenen Bedingung, die für ein von dem Abschnitt angegebenes Phonem spezifiziert ist.
  8. Sprachsignalkompressionsverfahren, wobei ein Signal, das eine Sprachwellenform oder zeitliche Veränderung spektraler Verteilung von Sprache angibt, erfasst wird; und Datenkompression für jeden der Abschnitte, die individuelle Phoneme des erfassten Signals angeben, in Übereinstimmung mit einer vorgegebenen Bedingung durchgeführt wird, die für ein von dem Abschnitt angegebenes Phonem spezifiziert ist.
  9. Programm, das einen Computer dazu veranlasst, zu funktionieren als: Einrichtung zum Erfassen eines Signals, das eine Sprachwellenform oder zeitliche Veränderung spektraler Verteilung von Sprache angibt; und Einrichtung zum Durchführen von Datenkompression bei jedem der Abschnitte, die individuelle Phoneme des erfassten Signals angeben, in Übereinstimmung mit einer vorgegebenen Bedingung, die für ein von dem Abschnitt angegebenes Phonem spezifiziert ist.
DE04723803T 2003-03-28 2004-03-26 Sprachsignalkomprimierungseinrichtung Pending DE04723803T1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003090045 2003-03-28
JP2003090045A JP4256189B2 (ja) 2003-03-28 2003-03-28 音声信号圧縮装置、音声信号圧縮方法及びプログラム
PCT/JP2004/004304 WO2004088634A1 (ja) 2003-03-28 2004-03-26 音声信号圧縮装置、音声信号圧縮方法及びプログラム

Publications (1)

Publication Number Publication Date
DE04723803T1 true DE04723803T1 (de) 2006-07-13

Family

ID=33127254

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602004015753T Expired - Lifetime DE602004015753D1 (de) 2003-03-28 2004-03-26 Sprachsignalkomprimierungseinrichtung, sprachsignalkomprimierungsverfahren und programm
DE04723803T Pending DE04723803T1 (de) 2003-03-28 2004-03-26 Sprachsignalkomprimierungseinrichtung

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE602004015753T Expired - Lifetime DE602004015753D1 (de) 2003-03-28 2004-03-26 Sprachsignalkomprimierungseinrichtung, sprachsignalkomprimierungsverfahren und programm

Country Status (7)

Country Link
US (1) US7653540B2 (de)
EP (1) EP1610300B1 (de)
JP (1) JP4256189B2 (de)
KR (1) KR101009799B1 (de)
CN (1) CN100570709C (de)
DE (2) DE602004015753D1 (de)
WO (1) WO2004088634A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
US20070011009A1 (en) * 2005-07-08 2007-01-11 Nokia Corporation Supporting a concatenative text-to-speech synthesis
JP4736699B2 (ja) * 2005-10-13 2011-07-27 株式会社ケンウッド 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム
US8694318B2 (en) * 2006-09-19 2014-04-08 At&T Intellectual Property I, L. P. Methods, systems, and products for indexing content
CN108369804A (zh) * 2015-12-07 2018-08-03 雅马哈株式会社 语音交互设备和语音交互方法
CN109817196B (zh) * 2019-01-11 2021-06-08 安克创新科技股份有限公司 一种噪音消除方法、装置、系统、设备及存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3946167A (en) * 1973-11-20 1976-03-23 Ted Bildplatten Aktiengesellschaft Aeg-Telefunken-Teldec High density recording playback element construction
GR58359B (en) * 1977-08-09 1977-10-03 Of Scient And Applied Res Ltd Voice codification system
JPS5667899A (en) * 1979-11-09 1981-06-08 Canon Kk Voice storage system
US4661915A (en) * 1981-08-03 1987-04-28 Texas Instruments Incorporated Allophone vocoder
JPH01244499A (ja) * 1988-03-25 1989-09-28 Toshiba Corp 音声素片ファイル作成装置
JPH03136100A (ja) 1989-10-20 1991-06-10 Canon Inc 音声処理方法及び装置
JP2931059B2 (ja) * 1989-12-22 1999-08-09 沖電気工業株式会社 音声合成方式およびこれに用いる装置
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
JP3233500B2 (ja) * 1993-07-21 2001-11-26 富士重工業株式会社 自動車エンジンの燃料ポンプ制御装置
BE1010336A3 (fr) * 1996-06-10 1998-06-02 Faculte Polytechnique De Mons Procede de synthese de son.
FR2815457B1 (fr) * 2000-10-18 2003-02-14 Thomson Csf Procede de codage de la prosodie pour un codeur de parole a tres bas debit
JP2002244688A (ja) * 2001-02-15 2002-08-30 Sony Computer Entertainment Inc 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム
JP2002251196A (ja) * 2001-02-26 2002-09-06 Kenwood Corp 音素データ処理装置、音素データ処理方法及びプログラム
US7089184B2 (en) * 2001-03-22 2006-08-08 Nurv Center Technologies, Inc. Speech recognition for recognizing speaker-independent, continuous speech
JP4867076B2 (ja) 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
US20040220801A1 (en) 2001-08-31 2004-11-04 Yasushi Sato Pitch waveform signal generating apparatus, pitch waveform signal generation method and program
CA2359771A1 (en) * 2001-10-22 2003-04-22 Dspfactory Ltd. Low-resource real-time audio synthesis system and method

Also Published As

Publication number Publication date
US20060167690A1 (en) 2006-07-27
JP4256189B2 (ja) 2009-04-22
DE602004015753D1 (de) 2008-09-25
WO2004088634A1 (ja) 2004-10-14
EP1610300B1 (de) 2008-08-13
KR101009799B1 (ko) 2011-01-19
JP2004294969A (ja) 2004-10-21
EP1610300A4 (de) 2007-02-21
KR20050107763A (ko) 2005-11-15
EP1610300A1 (de) 2005-12-28
CN1768375A (zh) 2006-05-03
US7653540B2 (en) 2010-01-26
CN100570709C (zh) 2009-12-16

Similar Documents

Publication Publication Date Title
DE02765393T1 (de) Vorrichtung und verfahren zum erzeugen eines tonhöhen-kurvenformsignals und vorrichtung und verfahren zum komprimieren, dekomprimieren und synthetisieren eines sprachsignals damit
DE2953262C2 (de)
DE3687815T2 (de) Verfahren und vorrichtung zur sprachanalyse.
DE69901606T2 (de) Breitbandsprachsynthese von schmalbandigen sprachsignalen
EP1371055B1 (de) Vorrichtung zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen des audiosignals unter verwendung einer autokorrelationsfunktion
DE69032168T2 (de) Dynamisches codebuch zur wirksamen sprachcodierung unter anwendung von algebraischen coden
DE69932786T2 (de) Tonhöhenerkennung
DE68910859T2 (de) Detektion für die Anwesenheit eines Sprachsignals.
DE69620560T2 (de) Kodierverfahren eines Sprach- oder Musiksignals mittels Quantisierung harmonischer Komponenten sowie im Anschluss daran Quantisierung der Residuen
DE69926462T2 (de) Bestimmung des von einer phasenänderung herrührenden rauschanteils für die audiokodierung
DE2820645A1 (de) Vorrichtung und verfahren zur spracherkennung
DE4031638C2 (de)
DE69618408T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
EP1388145B1 (de) Vorrichtung und verfahren zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen
DE04723803T1 (de) Sprachsignalkomprimierungseinrichtung
DE69725945T2 (de) Sprachkodierer mit niedriger Bitrate
DE60222983T2 (de) Serieller Datenzeiger
DE69521622T2 (de) System und verfahren zur sprachverarbeitung mittels multipuls-analyse
DE60018690T2 (de) Verfahren und Vorrichtung zur Stimmhaft-/Stimmlos-Entscheidung
DE03730668T1 (de) Sprachsignalinterpolationseinrichtung
DE102004028694B3 (de) Vorrichtung und Verfahren zum Umsetzen eines Informationssignals in eine Spektraldarstellung mit variabler Auflösung
DE69703233T2 (de) Verfahren und Systeme zur Sprachkodierung
DE69128990T2 (de) Sprecherkennungsvorrichtung
DE69025932T2 (de) Einrichtung und verfahren zum erzeugen von stabilisierten darstellungen von wellen
DE102007054306A1 (de) Verfahren zum Analysieren von Wechselspannungssignalen