FI116598B - Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi - Google Patents
Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi Download PDFInfo
- Publication number
- FI116598B FI116598B FI955323A FI955323A FI116598B FI 116598 B FI116598 B FI 116598B FI 955323 A FI955323 A FI 955323A FI 955323 A FI955323 A FI 955323A FI 116598 B FI116598 B FI 116598B
- Authority
- FI
- Finland
- Prior art keywords
- signal parameters
- bit
- frame
- parameters
- bits
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000013139 quantization Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000010426 asphalt Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
116598
Menetelmä tietojen, erityisesti koodattujen puhesignaali-parametrien, muokkaamiseksi
Keksintö koskee menetelmää tietojen, erityisesti 5 siirtotarkoituksiin käytettävien koodattujen puhesignaali- parametrien, muokkaamiseksi.
Puhesignaaleja koodattaessa ja koodausta tulkittaessa, erityisesti radiopuhelinkäytöissä, puhesignaalia tunnistetaan ja jaetaan jaksoihin (aikajaksoihin). Jokai-10 selle jaksolle muodostetaan ennakkoarvot eri signaalipara-metreille. Tällaisia signaaliparametrejä ovat esim. puhe-signaalin (ANT Nachrichtentechnische Berichte, Heft 5, marraskuu 1988, sivut 93 - 105) formanttirakenteen (puhe-osan resonanssien) karakterisoinnin lyhyen ajan parametrit 15 sekä pitch-rakenteen (äänen korkeuden) karakterisoinnin pitkän ajan parametrit. Äänikoodattaessa menetelmällä "analyysi synteesin kautta", malli- ja impulssiparametrit kvantisoidaan, koodataan ja siirretään vastaanottimelle. Bitraattien vähentämiseksi käytetään vektorikvantisointia 20 (katso yllä; DE/EP 0 266 620 Tl; EP 504 627 A2; EP 294 020 A2).
Keksinnön tehtävänä on kehittää sanottu menetelmä : siten, että bitraatteja edelleen vähennettäessä lähtötie- tojen tyydyttävä rekonstruointi on mahdollista. Tehtävä j 25 ratkaistaan patenttivaatimuksen 1 vaiheiden mukaisesti.
Muissa patenttivaatimuksissa esitetään edullisia suoritus-
I ( I
;;,' muotoj a.
*· Keksinnön mukainen menetelmä erottuu erityisesti siirtovirheiden vahvan estokyvyn ansiosta. Keksinnön mu- • * i 30 kainen menetelmä mahdollistaa puhekoodekkien rakentamisen, ·,,/ joiden puhelaatu on parempi kuin puhekoodekkien, joiden ; , , kvantisointiportaiden pienennys on kerrannaisia 2:sta.
Koska siirtovirheet yleensä esiintyvät kasautumina, pienennys ei aiheuta virheen korjaukseen huononnusta.
2 116598
Viitaten piirustuksiin kuvataan seuraavassa keksinnön toteutusesimerkki. Kuvio 1 esittää puhekooderin lohko-kaaviota, joka toimii keksinnön menetelmän mukaisesti. Kuvio 2 esittää kahden kehysjakson kehysrakennetta eri 5 signaaliparametreillä.
Kuten kuvio 1 esittää, puhesignaalilähteen Q puhe-signaalit keilataan A/D-muuntimen avulla ja analysoidaan samanlaisten puhesignaaliparametrien suhteen analysointi-yksikössä A. Analysointiyksikkö tuottaa joka kerta sarjan 10 itsessään samanlaisia puhesignaaliparametrejä, esim. yhden sarjan lyhyen ajan parametrejä KP formanttirakenteelle (impulssiparametrit), yhden sarjan pitkän ajan parametrejä LP pitch-rakenteelle ja yhden sarjan suodatinpainotuspara-metrejä FP. Näistä parametrisarjoista saadaan ennakoijissa 15 PRK, PRL, PRF joka kerta tunnetulla tavalla, esim. julkaisun EP 364 647 mukaisesti, ennakkoarvoja, jotka alistetaan vektorikvantisoinnille VQ. Kehyksenmuodostusyksikössä RA kvantisoidut signaaliparametrit kootaan esim. siten, että 4 kpl 5 ms:n kehysjaksoa muodostaa yhden 20 ms kestävän 20 kehyksen. Jokaiseen sanottuun kehysjaksoon johdetaan sa manlaiset signaaliparametrit. Vähintään kahdesta kehysjak-·*·'; sosta (jäljempänä kuvataan aina kahden kehysjakson käsit- : telyä, mutta luonnollisesti voidaan käsitellä myös useam- pia kuin kaksi kehys jaksoa yhdessä) tukahdutetaan bittejä ! 25 bitintukahdusyksikössä Βϋ. Bitintukahdusta ei keksinnön
i > I
j*V mukaisesti suoriteta jokaiselle kehysjaksolle erikseen, ·;; * vaan vähintään kahden lajin kootun samanlaisen kehysjakson * bittien kokonaisluvulle, ts. esim. yhden 20 ms kestävän kehyksen lyhyen ajan ja pitkän ajan parametrien kokonais-i.j · 30 bittiluvulle. Bittitukahduksessa huomioidaan, että kvanti- t I i sointiportaat jakautuvat tasan jokaiselle kehys jaksoi le.
; Tukahdutettavien bittien määrä n jaetaan edullisesti suh- ’!!/ teessä 29_n kehysjaksoille, jolloin m on samanlaisten pa- > » T rametrien lukumäärä ja g on alkuperäisten bittien lukumää- :,:.ί 35 rä. Pienentämättömien bittien kokonaismäärän g bittiero 3 116598 seuraavana olevaan korkeampaan toiseen potenssiin tukahdutetaan täten.
Bittitukahdukseen valitaan mieluiten ne bitit, jotka vastaavat tilastollisesti epätodennäköisimpiä kvanti-5 sointiportaita. Tämä vaatimus voidaan täyttää esim. siten, että vähemmän todennäköisiä kvantisointiportaita tallennetaan muistiin SP, joka ohjaa bitintukahdusyksikköä Βϋ. Koska kvantisointiportaiden todennäköisyys yleensä on suhteellinen, ts. yhtä valittua signaaliparametriä kohti yh-10 destä kehysjaksosta esiintyy seuraavassa kehysjaksossa parametrejä, joiden esiintyminen valittujen signaalipara-metrien yhteydessä on todennäköisempää kuin toisten, toimitaan bitintukahduksen valinnassa kuvion 2 mukaisesti, ts. esitellyssä rakenteessa tukahdutetaan kaikki ne bitit, 15 joiden kentät on merkitty ristillä.
Kuvio 2 esittää 12 x 12 vektorin rakennetta. Kehys-jaksossa SI, kuten myös kehysjaksossa S2, esiintyy 4 bitin kvantisointi samanlaisille amplitudiarvoille. Vektorille jää 7 bittiä. Bitintukahdus tapahtuu seuraavien suhteiden 20 mukaisesti: kun SI S 7 pätee 0 < S2 < 10 ja • kun SI > 7 pätee 0 < S2 < 9.
25 SI ja S2 kuvaavat molempien kehysjaksojen vektorikompo- : nentteja. Esitetyn esimerkin mukaisesti pätee: • · 1 I",’ indeksi = S2 x 12 + SI < 127 • t · • 1 · 1 30 Kuviossa 2 esitetty kaavio voidaan tietysti myös soveltaa * > t toisiin rakenteisiin, kuten esim. toiseen lukumäärään . , kvantisoitavia amplitudiarvoja.
;; 1 Toistaiseksi on kuvattu samanlaisten signaalipara- '·;1 metrien kokoamista kehysjaksoihin. Samanlaiset signaalipa- : 35 rametrit voidaan tietysti myös koota muilla tavoin kehys- jaksojen sijaan. On vain varmistettava, että ne jatkokäsittelyä varten ovat tunnistettavissa yhteenkuuluviksi.
t l I
1 1 » I
Claims (6)
- 4 116598
- 1. Menetelmä tietojen, erityisesti siirtotarkoituk-siin käytettävien koodattujen puhesignaaliparametrien, 5 muokkaamiseksi seuraavin vaihein: - lähtötiedot analysoidaan samanlaisten signaalipa-rametrien suhteen, - samanlaiset signaaliparametrit kootaan jaksoittain kvantisoidussa muodossa, 10. vähintään kahden kootun signaaliparametrilajin kokonaisbittimäärä pienennetään siten, että kvantisointi-portaat jakautuvat lähes tasan yksittäisille jaksoille ja että pienentämättömien bittien kokonaismäärän bittiero seuraavaan ylempään toiseen potenssiin nähden tukahdute- 15 taan.
- 2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että jokainen sellainen bitti tukahdutetaan, joka vastaa statistisesti epätodennäköisimpiä kvantisointiportaita.
- 3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että alkuperäisestä bittien koko-naismäärästä g ja annetusta bittien vähennyksestä n synty-.·. ; vät 29~n kvantisointiportaat jaetaan samanlaisesti siten, että jokaiselle jaksolle tulee noin “V 29'n kvantisointipor- » · I ! 25 rasta, jolloin m ilmaisee samanlaisten signaaliparametrien ;"_ * määrän. ·'·* : 4. Patenttivaatimusten 1-3 mukainen menetelmä, *.** tunnettu siitä, että tiedot on järjestetty kehys- rakenteeseen, jolloin aina erilaiset signaaliparametrit *t| | 30 muodostavat kehys jakso ja. : : 5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että aina kaksi erilaisia signaa-‘II.‘ liparametrejä sisältävää kehys jaksoa kootaan yhteen ja asetetaan bittivähennyksen kohteeksi. 5 116598
- 6. Patenttivaatimuksen 5 mukainen menetelmä, tunnettu siitä, että puhesignaaliparametrien vek-torikvantisointi 7 bitillä/vektori ja 8 x 12 vektorin rakenne bittitukahduksessa johtaa seuraavien suhteiden va-5 lintaan: jos SI < 7 on 0 < S2 s 10 ja jos SI > 7 on 0 < S2 < 9, 10 jolloin SI ja S2 ilmaisee molempien kehysjaksojen vektori-komponenttej a. • 1 • ♦ • » • · · * i i * I * 1 · * I · * 1 1 » • I · * 1 · » * · 1 » * 1 1 1 6 116598
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4315319 | 1993-05-07 | ||
DE4315319A DE4315319C2 (de) | 1993-05-07 | 1993-05-07 | Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern |
DE9400433 | 1994-04-20 | ||
PCT/DE1994/000433 WO1994027284A1 (de) | 1993-05-07 | 1994-04-20 | Verfahren zur aufbereitung von daten, insbesondere von codierten sprachsignalparametern |
Publications (3)
Publication Number | Publication Date |
---|---|
FI955323A0 FI955323A0 (fi) | 1995-11-06 |
FI955323A FI955323A (fi) | 1995-11-06 |
FI116598B true FI116598B (fi) | 2005-12-30 |
Family
ID=6487542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI955323A FI116598B (fi) | 1993-05-07 | 1995-11-06 | Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi |
Country Status (9)
Country | Link |
---|---|
US (1) | US5794183A (fi) |
EP (1) | EP0697123B1 (fi) |
AU (1) | AU679980B2 (fi) |
DE (2) | DE4315319C2 (fi) |
DK (1) | DK0697123T3 (fi) |
ES (1) | ES2136193T3 (fi) |
FI (1) | FI116598B (fi) |
HU (1) | HU215620B (fi) |
WO (1) | WO1994027284A1 (fi) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7729918B2 (en) * | 2001-03-14 | 2010-06-01 | At&T Intellectual Property Ii, Lp | Trainable sentence planning system |
US7046636B1 (en) | 2001-11-26 | 2006-05-16 | Cisco Technology, Inc. | System and method for adaptively improving voice quality throughout a communication session |
US20070286351A1 (en) * | 2006-05-23 | 2007-12-13 | Cisco Technology, Inc. | Method and System for Adaptive Media Quality Monitoring |
US8248953B2 (en) | 2007-07-25 | 2012-08-21 | Cisco Technology, Inc. | Detecting and isolating domain specific faults |
US7948910B2 (en) * | 2008-03-06 | 2011-05-24 | Cisco Technology, Inc. | Monitoring quality of a packet flow in packet-based communication networks |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE266620C (fi) * | ||||
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
DE3853161T2 (de) * | 1988-10-19 | 1995-08-17 | Ibm | Vektorquantisierungscodierer. |
JPH02272500A (ja) * | 1989-04-13 | 1990-11-07 | Fujitsu Ltd | コード駆動音声符号化方式 |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
-
1993
- 1993-05-07 DE DE4315319A patent/DE4315319C2/de not_active Expired - Lifetime
-
1994
- 1994-04-20 EP EP94912471A patent/EP0697123B1/de not_active Expired - Lifetime
- 1994-04-20 DE DE59408494T patent/DE59408494D1/de not_active Expired - Lifetime
- 1994-04-20 US US08/530,204 patent/US5794183A/en not_active Expired - Lifetime
- 1994-04-20 WO PCT/DE1994/000433 patent/WO1994027284A1/de active IP Right Grant
- 1994-04-20 AU AU65024/94A patent/AU679980B2/en not_active Expired
- 1994-04-20 DK DK94912471T patent/DK0697123T3/da active
- 1994-04-20 ES ES94912471T patent/ES2136193T3/es not_active Expired - Lifetime
- 1994-04-20 HU HU9503181A patent/HU215620B/hu unknown
-
1995
- 1995-11-06 FI FI955323A patent/FI116598B/fi not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE4315319A1 (de) | 1994-11-10 |
AU6502494A (en) | 1994-12-12 |
HUT73532A (en) | 1996-08-28 |
FI955323A0 (fi) | 1995-11-06 |
HU9503181D0 (en) | 1995-12-28 |
DE59408494D1 (de) | 1999-08-19 |
WO1994027284A1 (de) | 1994-11-24 |
DK0697123T3 (da) | 1999-12-13 |
HU215620B (hu) | 1999-01-28 |
EP0697123A1 (de) | 1996-02-21 |
DE4315319C2 (de) | 2002-11-14 |
EP0697123B1 (de) | 1999-07-14 |
US5794183A (en) | 1998-08-11 |
FI955323A (fi) | 1995-11-06 |
ES2136193T3 (es) | 1999-11-16 |
AU679980B2 (en) | 1997-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5537410A (en) | Subsequent frame variable data rate indication method | |
US5073940A (en) | Method for protecting multi-pulse coders from fading and random pattern bit errors | |
US5754734A (en) | Method of transmitting voice coding information using cyclic redundancy check bits | |
FI116500B (fi) | Menetelmä ja laite vastaanotetun signaalin datanopeuden määrittämiseksi | |
EP1061503B1 (en) | Error detection and error concealment for encoded speech data | |
CA2169786C (en) | Frame erasure compensation techniques | |
DE60316396T2 (de) | Interoperable Sprachkodierung | |
EP0116975B1 (en) | Speech-adaptive predictive coding system | |
EP0955586A1 (en) | Coding with modulation, error control, weighting, and bit allocation | |
US20020123887A1 (en) | Concealment of frame erasures and method | |
US6847929B2 (en) | Algebraic codebook system and method | |
BRPI0015070B1 (pt) | método para codificar frames de fala, e, codificador de fala para reduzir sensibilidade às condições de erro de frame | |
Honkanen et al. | Enhanced full rate speech codec for IS-136 digital cellular system | |
EP0375551A2 (en) | A speech coding/decoding system | |
FI116598B (fi) | Menetelmä tietojen, erityisesti koodattujen puhesignaaliparametrien, muokkaamiseksi | |
WO1993005502A1 (en) | Error protection for multimode speech coders | |
US6141781A (en) | Process for editing of data, in particular with variable channel bit rate | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
AU2541799A (en) | Apparatus and method for hybrid excited linear prediction speech encoding | |
CN1168218C (zh) | 产生数据流的设备和方法和读取数据流的设备和方法 | |
CA2373479C (en) | Device, method and program for encoding/decoding of speech with function of encoding silent period | |
EP1032152B1 (en) | Unequal error protection for multi-mode vocoders | |
Vainio et al. | GSM EFR based multi-rate codec family | |
Fussell et al. | Providing channel error protection for a 2400 bps linear predictive coded voice system | |
WO1991005333A1 (en) | Error detection/correction scheme for vocoders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GB | Transfer or assigment of application |
Owner name: ROBERT BOSCH GMBH |
|
FG | Patent granted |
Ref document number: 116598 Country of ref document: FI |
|
PC | Transfer of assignment of patent |
Owner name: IPCOM GMBH & CO.KG Free format text: IPCOM GMBH & CO.KG |
|
MA | Patent expired |