FI116598B - Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi - Google Patents

Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi Download PDF

Info

Publication number
FI116598B
FI116598B FI955323A FI955323A FI116598B FI 116598 B FI116598 B FI 116598B FI 955323 A FI955323 A FI 955323A FI 955323 A FI955323 A FI 955323A FI 116598 B FI116598 B FI 116598B
Authority
FI
Finland
Prior art keywords
signal parameters
bit
frame
parameters
bits
Prior art date
Application number
FI955323A
Other languages
English (en)
Swedish (sv)
Other versions
FI955323A0 (fi
FI955323A (fi
Inventor
Joerg-Martin Mueller
Bertram Waechter
Original Assignee
Bosch Gmbh Robert
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6487542&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=FI116598(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Bosch Gmbh Robert filed Critical Bosch Gmbh Robert
Publication of FI955323A0 publication Critical patent/FI955323A0/fi
Publication of FI955323A publication Critical patent/FI955323A/fi
Application granted granted Critical
Publication of FI116598B publication Critical patent/FI116598B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

116598
Menetelmä tietojen, erityisesti koodattujen puhesignaali-parametrien, muokkaamiseksi
Keksintö koskee menetelmää tietojen, erityisesti 5 siirtotarkoituksiin käytettävien koodattujen puhesignaali- parametrien, muokkaamiseksi.
Puhesignaaleja koodattaessa ja koodausta tulkittaessa, erityisesti radiopuhelinkäytöissä, puhesignaalia tunnistetaan ja jaetaan jaksoihin (aikajaksoihin). Jokai-10 selle jaksolle muodostetaan ennakkoarvot eri signaalipara-metreille. Tällaisia signaaliparametrejä ovat esim. puhe-signaalin (ANT Nachrichtentechnische Berichte, Heft 5, marraskuu 1988, sivut 93 - 105) formanttirakenteen (puhe-osan resonanssien) karakterisoinnin lyhyen ajan parametrit 15 sekä pitch-rakenteen (äänen korkeuden) karakterisoinnin pitkän ajan parametrit. Äänikoodattaessa menetelmällä "analyysi synteesin kautta", malli- ja impulssiparametrit kvantisoidaan, koodataan ja siirretään vastaanottimelle. Bitraattien vähentämiseksi käytetään vektorikvantisointia 20 (katso yllä; DE/EP 0 266 620 Tl; EP 504 627 A2; EP 294 020 A2).
Keksinnön tehtävänä on kehittää sanottu menetelmä : siten, että bitraatteja edelleen vähennettäessä lähtötie- tojen tyydyttävä rekonstruointi on mahdollista. Tehtävä j 25 ratkaistaan patenttivaatimuksen 1 vaiheiden mukaisesti.
Muissa patenttivaatimuksissa esitetään edullisia suoritus-
I ( I
;;,' muotoj a.
*· Keksinnön mukainen menetelmä erottuu erityisesti siirtovirheiden vahvan estokyvyn ansiosta. Keksinnön mu- • * i 30 kainen menetelmä mahdollistaa puhekoodekkien rakentamisen, ·,,/ joiden puhelaatu on parempi kuin puhekoodekkien, joiden ; , , kvantisointiportaiden pienennys on kerrannaisia 2:sta.
Koska siirtovirheet yleensä esiintyvät kasautumina, pienennys ei aiheuta virheen korjaukseen huononnusta.
2 116598
Viitaten piirustuksiin kuvataan seuraavassa keksinnön toteutusesimerkki. Kuvio 1 esittää puhekooderin lohko-kaaviota, joka toimii keksinnön menetelmän mukaisesti. Kuvio 2 esittää kahden kehysjakson kehysrakennetta eri 5 signaaliparametreillä.
Kuten kuvio 1 esittää, puhesignaalilähteen Q puhe-signaalit keilataan A/D-muuntimen avulla ja analysoidaan samanlaisten puhesignaaliparametrien suhteen analysointi-yksikössä A. Analysointiyksikkö tuottaa joka kerta sarjan 10 itsessään samanlaisia puhesignaaliparametrejä, esim. yhden sarjan lyhyen ajan parametrejä KP formanttirakenteelle (impulssiparametrit), yhden sarjan pitkän ajan parametrejä LP pitch-rakenteelle ja yhden sarjan suodatinpainotuspara-metrejä FP. Näistä parametrisarjoista saadaan ennakoijissa 15 PRK, PRL, PRF joka kerta tunnetulla tavalla, esim. julkaisun EP 364 647 mukaisesti, ennakkoarvoja, jotka alistetaan vektorikvantisoinnille VQ. Kehyksenmuodostusyksikössä RA kvantisoidut signaaliparametrit kootaan esim. siten, että 4 kpl 5 ms:n kehysjaksoa muodostaa yhden 20 ms kestävän 20 kehyksen. Jokaiseen sanottuun kehysjaksoon johdetaan sa manlaiset signaaliparametrit. Vähintään kahdesta kehysjak-·*·'; sosta (jäljempänä kuvataan aina kahden kehysjakson käsit- : telyä, mutta luonnollisesti voidaan käsitellä myös useam- pia kuin kaksi kehys jaksoa yhdessä) tukahdutetaan bittejä ! 25 bitintukahdusyksikössä Βϋ. Bitintukahdusta ei keksinnön
i > I
j*V mukaisesti suoriteta jokaiselle kehysjaksolle erikseen, ·;; * vaan vähintään kahden lajin kootun samanlaisen kehysjakson * bittien kokonaisluvulle, ts. esim. yhden 20 ms kestävän kehyksen lyhyen ajan ja pitkän ajan parametrien kokonais-i.j · 30 bittiluvulle. Bittitukahduksessa huomioidaan, että kvanti- t I i sointiportaat jakautuvat tasan jokaiselle kehys jaksoi le.
; Tukahdutettavien bittien määrä n jaetaan edullisesti suh- ’!!/ teessä 29_n kehysjaksoille, jolloin m on samanlaisten pa- > » T rametrien lukumäärä ja g on alkuperäisten bittien lukumää- :,:.ί 35 rä. Pienentämättömien bittien kokonaismäärän g bittiero 3 116598 seuraavana olevaan korkeampaan toiseen potenssiin tukahdutetaan täten.
Bittitukahdukseen valitaan mieluiten ne bitit, jotka vastaavat tilastollisesti epätodennäköisimpiä kvanti-5 sointiportaita. Tämä vaatimus voidaan täyttää esim. siten, että vähemmän todennäköisiä kvantisointiportaita tallennetaan muistiin SP, joka ohjaa bitintukahdusyksikköä Βϋ. Koska kvantisointiportaiden todennäköisyys yleensä on suhteellinen, ts. yhtä valittua signaaliparametriä kohti yh-10 destä kehysjaksosta esiintyy seuraavassa kehysjaksossa parametrejä, joiden esiintyminen valittujen signaalipara-metrien yhteydessä on todennäköisempää kuin toisten, toimitaan bitintukahduksen valinnassa kuvion 2 mukaisesti, ts. esitellyssä rakenteessa tukahdutetaan kaikki ne bitit, 15 joiden kentät on merkitty ristillä.
Kuvio 2 esittää 12 x 12 vektorin rakennetta. Kehys-jaksossa SI, kuten myös kehysjaksossa S2, esiintyy 4 bitin kvantisointi samanlaisille amplitudiarvoille. Vektorille jää 7 bittiä. Bitintukahdus tapahtuu seuraavien suhteiden 20 mukaisesti: kun SI S 7 pätee 0 < S2 < 10 ja • kun SI > 7 pätee 0 < S2 < 9.
25 SI ja S2 kuvaavat molempien kehysjaksojen vektorikompo- : nentteja. Esitetyn esimerkin mukaisesti pätee: • · 1 I",’ indeksi = S2 x 12 + SI < 127 • t · • 1 · 1 30 Kuviossa 2 esitetty kaavio voidaan tietysti myös soveltaa * > t toisiin rakenteisiin, kuten esim. toiseen lukumäärään . , kvantisoitavia amplitudiarvoja.
;; 1 Toistaiseksi on kuvattu samanlaisten signaalipara- '·;1 metrien kokoamista kehysjaksoihin. Samanlaiset signaalipa- : 35 rametrit voidaan tietysti myös koota muilla tavoin kehys- jaksojen sijaan. On vain varmistettava, että ne jatkokäsittelyä varten ovat tunnistettavissa yhteenkuuluviksi.
t l I
1 1 » I

Claims (6)

  1. 4 116598
  2. 1. Menetelmä tietojen, erityisesti siirtotarkoituk-siin käytettävien koodattujen puhesignaaliparametrien, 5 muokkaamiseksi seuraavin vaihein: - lähtötiedot analysoidaan samanlaisten signaalipa-rametrien suhteen, - samanlaiset signaaliparametrit kootaan jaksoittain kvantisoidussa muodossa, 10. vähintään kahden kootun signaaliparametrilajin kokonaisbittimäärä pienennetään siten, että kvantisointi-portaat jakautuvat lähes tasan yksittäisille jaksoille ja että pienentämättömien bittien kokonaismäärän bittiero seuraavaan ylempään toiseen potenssiin nähden tukahdute- 15 taan.
  3. 2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että jokainen sellainen bitti tukahdutetaan, joka vastaa statistisesti epätodennäköisimpiä kvantisointiportaita.
  4. 3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että alkuperäisestä bittien koko-naismäärästä g ja annetusta bittien vähennyksestä n synty-.·. ; vät 29~n kvantisointiportaat jaetaan samanlaisesti siten, että jokaiselle jaksolle tulee noin “V 29'n kvantisointipor- » · I ! 25 rasta, jolloin m ilmaisee samanlaisten signaaliparametrien ;"_ * määrän. ·'·* : 4. Patenttivaatimusten 1-3 mukainen menetelmä, *.** tunnettu siitä, että tiedot on järjestetty kehys- rakenteeseen, jolloin aina erilaiset signaaliparametrit *t| | 30 muodostavat kehys jakso ja. : : 5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että aina kaksi erilaisia signaa-‘II.‘ liparametrejä sisältävää kehys jaksoa kootaan yhteen ja asetetaan bittivähennyksen kohteeksi. 5 116598
  5. 6. Patenttivaatimuksen 5 mukainen menetelmä, tunnettu siitä, että puhesignaaliparametrien vek-torikvantisointi 7 bitillä/vektori ja 8 x 12 vektorin rakenne bittitukahduksessa johtaa seuraavien suhteiden va-5 lintaan: jos SI < 7 on 0 < S2 s 10 ja jos SI > 7 on 0 < S2 < 9, 10 jolloin SI ja S2 ilmaisee molempien kehysjaksojen vektori-komponenttej a. • 1 • ♦ • » • · · * i i * I * 1 · * I · * 1 1 » • I · * 1 · » * · 1 » * 1 1 1 6 116598
FI955323A 1993-05-07 1995-11-06 Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi FI116598B (fi)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE4315319 1993-05-07
DE4315319A DE4315319C2 (de) 1993-05-07 1993-05-07 Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern
DE9400433 1994-04-20
PCT/DE1994/000433 WO1994027284A1 (de) 1993-05-07 1994-04-20 Verfahren zur aufbereitung von daten, insbesondere von codierten sprachsignalparametern

Publications (3)

Publication Number Publication Date
FI955323A0 FI955323A0 (fi) 1995-11-06
FI955323A FI955323A (fi) 1995-11-06
FI116598B true FI116598B (fi) 2005-12-30

Family

ID=6487542

Family Applications (1)

Application Number Title Priority Date Filing Date
FI955323A FI116598B (fi) 1993-05-07 1995-11-06 Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi

Country Status (9)

Country Link
US (1) US5794183A (fi)
EP (1) EP0697123B1 (fi)
AU (1) AU679980B2 (fi)
DE (2) DE4315319C2 (fi)
DK (1) DK0697123T3 (fi)
ES (1) ES2136193T3 (fi)
FI (1) FI116598B (fi)
HU (1) HU215620B (fi)
WO (1) WO1994027284A1 (fi)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US7046636B1 (en) 2001-11-26 2006-05-16 Cisco Technology, Inc. System and method for adaptively improving voice quality throughout a communication session
US20070286351A1 (en) * 2006-05-23 2007-12-13 Cisco Technology, Inc. Method and System for Adaptive Media Quality Monitoring
US8248953B2 (en) 2007-07-25 2012-08-21 Cisco Technology, Inc. Detecting and isolating domain specific faults
US7948910B2 (en) * 2008-03-06 2011-05-24 Cisco Technology, Inc. Monitoring quality of a packet flow in packet-based communication networks

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE266620C (fi) *
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3853161T2 (de) * 1988-10-19 1995-08-17 Ibm Vektorquantisierungscodierer.
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding

Also Published As

Publication number Publication date
DE4315319A1 (de) 1994-11-10
AU6502494A (en) 1994-12-12
HUT73532A (en) 1996-08-28
FI955323A0 (fi) 1995-11-06
HU9503181D0 (en) 1995-12-28
DE59408494D1 (de) 1999-08-19
WO1994027284A1 (de) 1994-11-24
DK0697123T3 (da) 1999-12-13
HU215620B (hu) 1999-01-28
EP0697123A1 (de) 1996-02-21
DE4315319C2 (de) 2002-11-14
EP0697123B1 (de) 1999-07-14
US5794183A (en) 1998-08-11
FI955323A (fi) 1995-11-06
ES2136193T3 (es) 1999-11-16
AU679980B2 (en) 1997-07-17

Similar Documents

Publication Publication Date Title
US5537410A (en) Subsequent frame variable data rate indication method
US5073940A (en) Method for protecting multi-pulse coders from fading and random pattern bit errors
US5754734A (en) Method of transmitting voice coding information using cyclic redundancy check bits
FI116500B (fi) Menetelmä ja laite vastaanotetun signaalin datanopeuden määrittämiseksi
EP1061503B1 (en) Error detection and error concealment for encoded speech data
CA2169786C (en) Frame erasure compensation techniques
DE60316396T2 (de) Interoperable Sprachkodierung
EP0116975B1 (en) Speech-adaptive predictive coding system
EP0955586A1 (en) Coding with modulation, error control, weighting, and bit allocation
US20020123887A1 (en) Concealment of frame erasures and method
US6847929B2 (en) Algebraic codebook system and method
BRPI0015070B1 (pt) método para codificar frames de fala, e, codificador de fala para reduzir sensibilidade às condições de erro de frame
Honkanen et al. Enhanced full rate speech codec for IS-136 digital cellular system
EP0375551A2 (en) A speech coding/decoding system
FI116598B (fi) Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi
WO1993005502A1 (en) Error protection for multimode speech coders
US6141781A (en) Process for editing of data, in particular with variable channel bit rate
CA2293165A1 (en) Method for transmitting data in wireless speech channels
AU2541799A (en) Apparatus and method for hybrid excited linear prediction speech encoding
CN1168218C (zh) 产生数据流的设备和方法和读取数据流的设备和方法
CA2373479C (en) Device, method and program for encoding/decoding of speech with function of encoding silent period
EP1032152B1 (en) Unequal error protection for multi-mode vocoders
Vainio et al. GSM EFR based multi-rate codec family
Fussell et al. Providing channel error protection for a 2400 bps linear predictive coded voice system
WO1991005333A1 (en) Error detection/correction scheme for vocoders

Legal Events

Date Code Title Description
GB Transfer or assigment of application

Owner name: ROBERT BOSCH GMBH

FG Patent granted

Ref document number: 116598

Country of ref document: FI

PC Transfer of assignment of patent

Owner name: IPCOM GMBH & CO.KG

Free format text: IPCOM GMBH & CO.KG

MA Patent expired