FI119085B - Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa - Google Patents
Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa Download PDFInfo
- Publication number
- FI119085B FI119085B FI20061084A FI20061084A FI119085B FI 119085 B FI119085 B FI 119085B FI 20061084 A FI20061084 A FI 20061084A FI 20061084 A FI20061084 A FI 20061084A FI 119085 B FI119085 B FI 119085B
- Authority
- FI
- Finland
- Prior art keywords
- signal
- threshold
- energy
- snr
- silence
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Description
/ 119085 t
MENETELMÄ JA LAITE KOODAUSNOPEUDEN VALITSEMISEKSI MUUTTUVANOPEUKSISESSA VOKOODERISSA
KEKSINNÖN TAUSTA 5 I. Keksinnön ala
Esillä oleva keksintö liittyy vokoodereihin. Erityisesti esillä oleva keksintö liittyy uuteen ja parannettuun menetelmään puheen koodausnopeuden määrittämiseksi 10 muuttuvanopeuksisessa vokooderissa.
Π. Liittyvän alan kuvaus
Tyypillisesti muuttuvanopeuksinen puheen kompressointijärjestelmä käyttää 15 jotain nopeuden tunnistusalgoritmia ennen kuin koodaus alkaa. Nopeuden määräysalgoritmi osoittaa korkeamman bittinopeuden koodausjäq estetyn audiosignaalin segmenteille, joissa puhe on läsnä ja alemman nopeuden koodausjärjestelyn hiljaisille segmenteille. Tällä tavalla saavutetaan alempi '. ( keskimääräinen bittinopeus ja säilytetään samalla korkea laatutaso palautetussa 20 puheessa. Näin ollen toimiakseen tehokkaammin muuttuvanopeuksinen • · * · . · · ·, puhekooderi vaatii vankan nopeuden määräämisalgoritmin, joka pystyy •...: erottamaan puheen hiljaisuudesta erilaisissa taustakohinaympäristöissä.
• ♦ · • · * ··· ; | : Eräs tällainen muuttuvanopeuksinen puheen kompressointij äij estelmä tai 25 muuttuvanopeuksinen vokooderi esitetään samaan aikaan vireillä olevassa US- • · patenttihakemuksessa sarjanro 07/713,661, jätetty 11.6.1991, nimeltä ··· •...: ’’Muuttuvanopeuksinen vokooderi”, j oka on siirretty esillä olevan keksinnön j' haltijalle, jonka sisältö liitetään tähän viittauksella. Tässä muuttuvanopeuksisen • · · !t§§: vokooderin tietyssä toteutuksessa tulopuhe koodataan käyttäen koodiherätteisen « ·· 30 lineaarisen ennustuksen koodaustekniikoita (Code Excited Linear Predictive ·*·· : * * *: Coding, CELP) yhdellä useista nopeuksista, j otka on määritelty puheaktiviteetin 2 119086 tasolla. PuheaJktiviteetin taso määritetään energiasta tulon audionäytteissä, jotka saattavat sisältää taustakohinaa kuuluvan puheen lisäksi. Jotta vokooderi taijoaa korkealaatuisen äänikoodauksen eri taustakohinatasoilla, vaaditaan mukautuvasti säätävää kynnystekniikkaa, j otta kompensoidaan taustakohinan vaikutus 5 nopeuden päätösalgoritmiin.
Vokoodereita käytetään tyypillisesti kommunikaatiolaitteissa, kuten solukkopuhelimissa tai henkilökohtaisissa kommunikaatiolaitteissa analogisen äänisignaalin digitaalikompression antamiseksi, joka on muunnettu digitaaliseen 10 muotoon lähetystä varten. Matkaviestinympäristössä, jossa solukkopuhelinta tai henkilökohtaista kommunikaatiolaitetta voidaan käyttää, taustakohinan energian suuret tasot tekevät nopeuspäättelyalgoritmille vaikeaksi erottaa pienitehoisia soinnittomia ääniä taustakohinan hiljaisuudesta käyttämällä signaalienergiaan perustuvaa nopeuden määräysalgoritmia. Näin ollen soinnittomat äänet 15 säännöllisesti tulevat koodattua alemmilla bittinopeuksilla ja äänen laatu heikkenee, koska konsonantit, kuten ”s”, ”x”, ”ch”, ”sh”, ”t” jne, menetetään palautetussa puheessa.
!( Vokooderit, j otka perustavat nopeuspäättelyn pelkästään taustakohinan energiaan, t · [ ·, 20 eivät ota huomioon signaalin voimakkuutta suhteessa taustakohinaan asettaessaan • t * • * . · · ·. kynnysarvoj a. Vokooderi, joka perustaa kynnysarvonsa ainoastaan taustakohinaan *Φ··* ....: on taipuvainen kompressoimaan kynnystasot yhteen kun taustakohinan taso • :*: nousee. Jos signaalin taso pysyisi kiinteänä, tämä olisi oikea tapa kynnystasojen • · · : “ *: asettamiseen, kuitenkin jos signaalin taso nousisi taustakohinan tason mukana, 25 niin kynnystasojen kompressointi ei ole optimaalinen ratkaisu.
• · V.: Muuttuvanopeuksisissa vokoodereissa tarvitaan siis vaihtoehtoinen menetelmä *·» \: kynnystasoj en asettamiseksi, joka ottaa huomioon signaalin voimakkuuden.
φ • · · • ·· · • · · •, „! Vilmeinen j älj ellä oleva ongelma tulee esille soitettaessa musiikkia • · · 30 taustakohinaenergiaan perustavan nopeuspäätösvokooderin läpi. Kun ihmiset ΙΦΙ» puhuvat, heidän täytyy pitää hengitystauko, joka sallii kynnystasojen nollautua 3 119085 asianmukaiselle taustakohinatasolle. Kuitenkin lähetettäessä musiikkia vokooderin läpi, kuten esiintyy musiikkia-odottaessa tilanteissa, ei esiinny taukoja ja kynnysarvot jatkavat nousuaan kunnes musiikkia aletaan koodata nopeudella alle täyden nopeuden. Tällaisessa tilanteessa muuttuvanopeuksinen 5 kooderi on sekoittanut musiikin taustakohinaan.
KEKSINNÖN YHTEENVETO
Esillä oleva keksintö on uusija parannettu menetelmä ja laite koodausnopeuden 10 määrittämiseksi muuttuvanopeuksisessa vokooderissa. Esillä olevan keksinnön ensimmäisenä tarkoituksena on tuoda esiin menetelmä, jolla vähennetään todennäköisyyttä koodata pienienergiaista soinnitonta puhetta taustakohinana.
Esillä olevassa keksinnössä tulosignaali suodatetaan suuritaajuiseen komponenttiin ja pienitaajuiseen komponenttiin. Tulosignaalin suodatetut 15 komponentit sitten analysoidaan yksitellen puheen läsnäolon tunnistamiseksi.
Koska soinnittomalla puheella on suuritaajuinen komponentti, sen voimakkuus suhteessa korkeataajuuskaistaan on enemmän erillään taustakohinasta tuolla kaistalla kuin mitä se on verrattuna taustakohinaan koko taajuuskaistalla.
• • · ·
»•M
20 Toinen esillä olevan keksinnön tarkoitus on tuoda esiin välineet, joilla asetetaan * · · • · kynnysarvot, jotka ottavat huomioon signaalienergian samoin kuin taustakohinan ··· • · · · · energian. Esillä olevassa keksinnössä äänen tunnistuskynnysten asettaminen j perustuu tulosignaalin signaali-kohinasuhteen (SNR) estimaattiin.
···
Esimerkkisovellutuksessa signaalienergia estimoidaan maksimisignaalienergiaksi 25 aktiivisen puheen aikoina ja taustakohinan energia estimoidaan minimi • ♦ :. V signaalienergiaksi hilj aisuuden aikoina.
··· • · • · ··· *·* Kolmas esillä olevan keksinnön tarkoitus on tuoda esiin menetelmä ···· • * muuttuvanopeuksisen vokooderin läpi kulkevan musiikin koodaamiseksi.
* ·* 30 Esimerkkisovellutuksessa nopeuden valintalaite tunnistaa lukumääärän peräkkäisiä kehyksiä, joilla kynnysarvot ovat nousseet ja tarkastaa jaksollisuuden 119085 4 tuolla kehysten lukumäärällä. Jos tulosignaali on jaksollinen, tämä indikoisi musiikin läsnäoloa. Jos musiikin läsnäolo tunnistetaan, niin kynnykset asetetaan tasoille siten, että signaali koodataan täydellä nopeudella.
5 PIIRUSTUSTEN LYHYT KUVAUS
Esillä olevan keksinnön piirteet, tarkoitukset ja edut tulevat selvemmiksi seuraavasta yksityiskohtaisesta kuvauksesta yhdessä piirustusten kanssa, j oissa vastaavat viitemerkit identifioivat vastaavasti kauttaaltaan ja joissa; 10 kuvio 1 on lohkokaavio esillä olevasta keksinnöstä.
SUOSITELTUJEN SUORITUSMUOTOJEN YKSITYISKOHTAINEN KUVAUS
15 Viitaten kuvioon 1, tulosignaali S(n) annetaan alikaistan energian laskentaelementtiin 4 ja alikaistan energian laskentaelementtiin 6. Tulosignaali S(n) koostuu audiosignaalista ja taustakohinasta. Tyypillisesti audiosignaali on puhetta, mutta se voi myös olla musiikkia. Esimerkkisovellutuksessa S(n) annetaan 20:n millisekunnin kehyksissä, joissa kussakin on 160 näytettä.
. V. 20 Esimerkkisovellutuksessa tulosignaaliin S(n) kuuluu taajuuskomponentit 0 • · ♦ • · , · · ·. kHz:stä 4 kHz:iin, joka on suunnilleen ihmispuhesignaalin kaistanleveys.
·1 2 3·1 • · : Esimerkkisovellutuksessa 4 kHz tulosignaali S(n) suodatetaan kahteen erilliseen ··· s]1]: alikaistaan. Kaksi erillistä alikaistaa ovat 0 ja 2 kHz:n ja 2 kHz:n ja 4 kHz:n 25 välillä, vastaavasti. Esimerkkisovellutuksessa tulosignaali voidaan jakaa • · V.: alikaistoihin alikaistasuodattimilla, joiden suunnittelu on hyvin tunnettua alalla ja esitetään yksityiskohtaisemmin US-patenttihakemuksessa saijanro 08/189,819, m „1j1 jätetty helmikuun 1.,1994, nimeltä’Taajuusvalinnainen muuntuva suodatus”, ··« :.,. · joka on siirretty tämän keksinnön haltijalle, joka liitetään tähän viittauksella.
·:· 30 ···· M • · 2 • · 3 5 119085
Alikaistan suodattimien impulssivasteita merkitään hiXn):llä alipäästösuodattimelle ja hH(n):llä ylipäästösuodattimelle. Signaalin tuloksena olevien alikaistan komponenttien energia arvojen Rl(0) ja Rh(0) antamiseksi voidaan laskea yksinkertaisesti summaamalla alikaistan suodattimien 5 lähtönäytteiden neliöt kuten on alalla hyvin tunnettua.
Edullisessa sovellutuksessa, kun tulosignaali S(n) annetaan alikaistan energian laskentaelementtiin 4, tulokehyksen alitaajuuskomponentin energia-arvo Rl(0) lasketaan seuraavasti: 10 11,(0) = Rs( 0). ^l(0)+2*^Äs(0 · ÄM(i) (1) /=1 missä L on väliottojen määrä alipäästösuodattimella impulssivasteen on hiXn) kanssa, 15 missä Rs(i) on tulosignaalin S(n) autokorrelaatiofunktio, joka saadaan yhtälöstä: Rs(i) = its(n)-S(n-0, is[0,L-l)\:lle (2) * n=1 ··· ···· • · • · · • · · . · · ·, missä N on näytteiden lukumäärä kehyksessä, • · »·· ....: 20 ja missä Rm, on alipäästösuodattimen hL(n) autokorrelaatiofunktio, j oka saadaan . seuraavasti: • » · ··· »·· t · • · ··· *Μ(0 = Σ>Ι(η)·ω(η-0· 0,L-\\.lk : : : «=o (3) • · ,···. = 0 muutoin • · ··* t
«M
»·*· . * * *. 25 Suurtaajuinen energia Rh(0) lasketaan samalla tavalla alikaistan energian
Ml laskentaelementissä 6.
·§· ···· ·** • · • · M· 6 119085
Alikaistasuodattimien autokorrelaatiofunktion arvot voidaan laskea etuajassa laskentakuormituksen vähentämiseksi. Lisäksi joitain Rs(i):n laskettuja arvoja käytetään muissa laskennoissa tulosignaalin S(n) koodauksessa, mikä edelleen alentaa esillä olevan keksinnön mukaisen koodausnopeuden valintamenetelmien 5 kokonaislaskentakuormitusta. Esimerkiksi LPC-suodattimen väliottoarvojen johtaminen vaatii tulosignaalin autokorrelaatiofunktioiden vakioiden joukon laskentaa.
LPC-suodattimen väliottoarvojen laskenta on alalla hyvin tunnettua ja kuvataan 10 yksityiskohtaisemmin yllä mainitussa US-patenttihakemuksessa sarjanro 08/004,484. Jos koodataan puhetta menetelmällä, joka vaatii kymmenen välioton LPC-suodattimen, vain Rs(i):n arvot i:n arvoilla
11 - L-l on laskettava, niiden lisäksi, joita käytetään signaalin koodaamiseen, koska Rs(i) i:n arvoilla 0-10 käytetään LPC-suodattimen väliottoarvojen 15 laskennassa. Esimerkkisovellutuksessa alikaistan suodattimilla on 17 väliottoa, L
= 17.
Alikaistan energian laskentaelementti 4 antaa Ri,(0):n lasketun arvon alikaistan .;. nopeuden päätöselementtiin 12 ja alikaistan energian laskentaelementti 6 antaa ···· 20 Rn(0):n lasketun arvon alikaistan nopeuden päätöselementtiin 14. Nopeuden • · j"·. päätöselementti 12 vertaa Ri,(0):n arvoa kahteen ennalta määrättyyn ·«« ····· kynnysarvoon Tli/2 ja TLtaysi ja osoittaa ehdotetun koodausnopeuden NOPEUSl : vertailun mukaisesti. Nopeusosoitus suoritetaan seuraavasti: «·· • · • ♦ ··· 25 NOPEUSl = kahdeksasosanopeus Rl(0) < Tli/2 (4) • · '•V NOPEUSl = puolinopeus Tli/2 < Rl(0)< Tmysi (5) NOPEUSl = täysinopeus Rl(0) > TLtäysi (6) ···· • ti * · · · * Alikaistan nopeuden päätöselementti 14 toimii samalla tavalla j a valitsee ..*·* 30 ehdotetun koodausnopeuden NOPEUSh suurtaajuusenergia-arvon Rh(0) ··· :1M: mukaisesti ja perustuen eri joukkoon kynnysarvoja Thi/2 ja THtaysi- Alikaistan 119085 7 nopeuden päätöselementti 12 antaa ehdotetun koodausnopeutensa NOPEUSl koodausnopeuden valintaelementtiin 16 ja alikaistan nopeuden päätöselementti 14 antaa ehdotetun koodausnopeutensa NOPEUSh koodausnopeuden valintaelementtiin 16. Esimerkkisovellutuksessa koodausnopeuden 5 valintaelementti 16 valitsee suuremman kahdesta ehdotetusta nopeudesta ja antaa suuremman nopeuden valittuna KOODAUSNOPEUTENA.
Alikaistan energian laskentaelementti 4 antaa lisäksi alitaajuusenergia-arvon Rl(0) kynnyksen sovituselementille 8, missä kynnysarvot Tli/2 ja Tuaysi seuraavaa 10 tulokehystä varten lasketaan. Vastaavasti alikaistan energian laskentaelementti 6 antaa korkeataajuusenergia-arvon Rh(0), kynnyksen sovituselementille 10, missä kynnysarvot Thi/2 ja TWysi seuraavaa tulokehystä varten lasketaan.
Kynnyksen sovituselementti 8 vastaanottaa alitaajuusenergia-arvon Rl(0) ja 15 määrittää sisältääkö S(n) taustakohinaa vai audiosignaalin. Esimerkinomaisessa toteutuksessa menetelmänä, jolla kynnyksen sovituselementti 8 määrittää onko audiosignaali läsnä, on tutkia normalisoitua autokorrelaatiofunktiota NACF, joka annetaan yhtälöllä: • ·«» ·»·» NACF** max m-γ, (7) , Λ ΙΪ-0 3Β—0 20 ·«· t t • «
«M
missä e(n) on formanttiresiduaalisignaali, j oka seuraa tulosignaalin S(n) • 1 · ' · ’ · 1 suodattamisesta LPC-suodattimella.
··· • · • · ··· • · · • · · t 25 LPC-suodattimen suunnittelu j a signaalin suodattaminen sillä on hyvin tunnettua ··· • · *·”1 alalla j a kuvataan yksityiskohtaisemmin yllä mainitussa U S - patenttihakemuksessa 08/004,484. Tulosignaali S(n) suodatetaan LPC- *·1 · · · · · 1 suodattimella formanttien vuorovaikutuksen poistamiseksi. NACF:ia verrataan 119085 8 kynnysarvoon audiosignaalin läsnäolon määrittämiseksi. Mikäli NACF on suurempi kuin ennalta määrätty kynnysarvo, se osoittaa, että tulokehyksellä on jaksollinen ominaisuus merkkinä audiosignaalin, kuten puheen tai musiikin läsnäolosta. Huomattakoon että kun osia puheesta tai musiikista ei ole jaksollisia 5 ja ilmaisee siten pieniä NACF:n arvoja, taustakohina ei tyypillisesti milloinkaan sisällä mitään jaksollisuutta ja lähes aina ilmaisee pieniä NACF:n arvoja.
Mikäli S(n):n määritetään sisältävän taustakohinaa, NACF:n arvo on pienempi kuin kynnysarvo TH1, niin arvoa Rl(0) käytetään nykyisen 10 taustakohinaestimaatin BGNl päivittämiseen. Esimerkkisovellutuksessa TH1 on 0,35. Ri,(0):a verrataan nykyiseen taustakohinaestimaatin BGNl arvoon. Mikäli Rl(0) on pienempi kuin BGNl, niin taustakohinaestimaatti BGNL asetetaan arvoon Rl(0) riippumatta NACFrn arvosta.
15 Taustakohinaestimaattia BGNl kasvatetaan vain kun NACF on alle kynnysarvon TH1. Jos Rl(0) on suurempi kuin BGNl ja NACF on pienempi kuin TH1, niin taustakohinan teho BGNl asetetaan ai -BGNl, jossa ai suurempi luku kuin 1.
Esimerkkisovellutuksessa ai on yhtä suuri kuin 1.03. BGNl jatkaa kasvamistaan .·, niin kauan kun NACF on pienempi kuin kynnysarvo TH1 ja Rl(0) on suurempi ···· 20 kuin BGNL:n nykyinen arvo, kunnes BGNl saavuttaa ennalta määrätyn • · j***. maksimiarvon BGNmax, jossa vaiheessa taustakohinaestimaatti BGNl asetetaan ··· ***** BGNmax:ään.
» · · • · · ··· M· S..,· Jos audiosignaali tunnistetaan, sillä että NACF ylittää toisen kynnysarvon TH2, 25 silloin signaalienergiaestimaatti Sl päivitetään. Esimerkkisovellutuksessa TH2 \V asetetaan 0.5:ksi. RL(0):n arvoa verrataan nykyiseen alipäästösignaalin ··· • « *···* energiaestimaattiin Sl- Jos Rl(0) on suurempi kuin SLin nykyinen arvo, silloin Sl .,*·* asetetaan yhtä suureksi kuin Rl(0). Jos Rl(0) on pienempi kuin SL:n nykyinen arvo, silloin Sl asetetaan yhtä suureksi kuin a2-SL, jälleen vain jos NACF on 30 suurempi kuin TH2. Esimerkkisovellutuksessa a2 asetetaan 0.96:een.
»·· • · t « ··· 9
1 1908 S
Kynnyksen muunnoselementti 8 laskee seuraavaksi signaali-kohinasuhteen estimaatin alla olevan yhtälön 8 mukaan: sm, =io-log (8) L Lbgnl.
5
Kynnyksen sovituselementti 8 sitten määrittää kvantisoidun signaali-kohinasuhteen indeksin Isnrl alla olevan yhtälön 9-12 mukaisesti: ISML-*™t —L— , 20 <SURl < 55: lie , (9) 5 =0, Sm.Li 20: Ile (10) =7 SNRl 2 55 :Ue.
10 missä nint on funktio, joka pyöristää murtoarvon lähimpään kokonaislukuun.
Kynnyksen sovituselementti 8 seuraavaksi valitsee tai laskee kaksi ·*·*· skaalauskerrointa kn/2 ja ku^, signaali-kohinasuhteen indeksin Isnrl mukaisesti.
• ' · i * * * I 15 Esimerkki skaalausarvon etsintätaulukosta annetaan taulukossa 1 alla: ··· • · taulukko l ··· • · • · ··· !SNRL Kli/2 KLtäysi t · J·8·8 0 7.0 9.0 1 7.0 12.6 ..li* 2 8.0 17.0 ··· 3 8.6 18.5 4 8.9 19.4 C: 5 9.4 20.9 10 1 19085 6 11.0 25.5 7 15.8 39.8 Näitä kahta arvoa käytetään kynnysarvojen laskentaan nopeuden valintaa varten alla olevien yhtälöiden mukaisesti: 5 TLy2=KLm-BGNL, ja (11)
Ta1y« = Kwyst'BGNL (12) niissä Tli/2 on matalataajuisen puolinopeuden kynnysarvo ja
Tuäysi on matalataajuisen täysnopeuden kynnysarvo.
10
Kynnyksen sovituselementti 8 antaa sovitetut kynnysarvot TLi/2 ja Tuaysi nopeuden päätöselementtiin 12. Kynnyksen sovituselementti 10 toimii samalla tavalla ja antaa kynnysarvot Thi/2 ja Tntäysi alikaistan nopeuden päätöselementtiin 14.
15
Audiosignaalin energiaestimaatin alkuarvo S, jossa S voi olla joko Sl tai Sh, asetetaan seuraavasti. Alkusignaalin energiaestimaatti Salku asetetaan -18.0 * · dBm0:aan, missä 3.17 dBmO viittaa täyden siniaallon signaalivoimakkuuteen, ··» joka esimerkkisovellutuksessa on digitaalinen siniaalto amplitudialueella - *:**: 20 8031 :stä 8031 :een. Salku^ käytetään kunnes määrätään, että akustinen signaali ♦ · « M.1 on läsnä.
··· » · # # Menetelmä, jolla akustinen signaali alkuperäisesti tunnistetaan, on verrata NAGF- • · · • · · 1,1 arvoa kynnykseen, kun NACF ylittää kynnyksen ennalta määrätyllä määrällä • 1 • · ‘I1 25 peräkkäisiä kehyksiä, silloin määritetään akustisen signaalin olevan läsnä.
Φ ♦ · ···· Esimerkkisovellutuksessa NACF:n täytyy ylittää kynnys kymmenellä • · ***** peräkkäisellä kehyksellä. Tämän olosuhteen toteuduttua, signaalin ...!1 energiaestimaatti, S, asetetaan maksimisignaalienergiaan kymmenessä ··· • · · · · 1 edeltävässä kehyksessä.
π 119085
Taustakohinaestimaatin BGNl alkuarvo asetetaan alussa BGNmax:ään. Heti kun vastaanotetaan alikaistan kehysenergia, joka on alle BGNmax:n, taustakohinaestimaatti uudelleenasetetaan vastaanotetun alikaistan energiatason 5 arvoon, ja taustakohinan BGNl estimaatin generointi etenee aiemmin kuvatulla tavalla.
Edullisessa sovellutuksessa lievetila käynnistetään kun seurataan saqaa täyden nopeuden kehyksiä ja alemman nopeuden kehys tunnistetaan.
10 Esimerkkisovellutuksessa kun nelj ä perättäistä puhekehystä koodataan täydellä nopeudella seuraten kehystä, jossa KOODAUSNOPEUS on asetettu alle täyden nopeuden nopeuteen ja lasketut signaali-kohinasuhteet ovat alle ennalta määrätyn minimi SNR:n, KOODAUSNOPEUS tälle kehykselle asetetaan täydelle nopeudelle. Esimerkkisovellutuksessa ennalta määrätty minimi SNR on 27.5 15 dB: iä, kuten määritetään yhtälössä 8.
Edullisessa sovellutuksessa lievekehysten lukumäärä on signaali-kohinasuhteen funktio. Esimerkkisovellutuksessa lievekehysten määrä määritetään seuraavasti: • i* 20 #lievekehyksiä = 1 22.5<SNR<27.5 (13) • · · .***. #lievekehyksiä = 2 SNR<22.5 (14) ··· *:··; #lievekehyksiä = 0 SNR>27.5 (15) • « · • · t *·· • « · •,., · Lisäksi esillä oleva keksintö tuo esiin menetelmän, jolla tunnistetaan musiikin 25 läsnäolo, mistä puuttuu, kuten aiemmin kuvattiin, tauot, jotka mahdollistavat • » ♦ · · ' · V taustakohinan mittausten uudelleen asettamisen. Menetelmä musiikin läsnäolon ··· * ·; · * tunnistamiseksi olettaa, että musiikki ei ole läsnä puhelun alussa. Tämä mahdollistaa esillä olevan keksinnön mukaisen koodausnopeuden valintalaitteen "...! asianmukaisesti estimoida ja alustaa taustakohinan energia BGNaiku· Koska t . t) j * 30 musiikilla toisin kuin taustakohinalla on j aksollinen ominaisuus, esillä oleva ··· :; keksintö tutkii NACF :n arvon erottaakseen musiikin taustakohinasta. Esillä 12 1 19085 olevan keksinnön mukainen musiikin tunnistusmenetelmä laskee keskimääräisen NACF:n alla olevan yhtälön mukaisesti: NACF^^^NACFii) (16)
l M
5 missä NACF on määritetty yhtälössä 7, ja missä T on peräkkäisten kehysten määrä, joissa taustakohinan estimoitu arvo on kasvanut alkuperäisestä taustakohinan estimaatista BGNalku· 10 Jos taustakohina BGN on kasvanut ennalta määrätylle määrälle kehyksiä T ja NACFkesk ylittää ennalta määrätyn kynnyksen, niin musiikki tunnistetaan ja taustakohina BGN uudelleenasetaan arvoon BGNaiku· On huomattava, että ollakseen tehokas arvo T on asetettava riittävän alhaiseksi niin, että koodausnopeus ei putoa alle täyden nopeuden. Sen vuoksi T:n arvo tulisi asettaa , 15 akustisen signaalin ja BGNaiku:n funktiona.
Edellä oleva edullisten sovellutusten kuvaus annetaan, jotta ammattimies voisi , käyttää tai valmistaa esillä olevan keksinnön mukaista laitetta. Näiden sovellutusten • ft 9 eri modifikaatiot ovat helposti alan ammattimiehille ilmeisiä ja tässä kuvatut yleiset · t 20 periaatteet ovat sovellettavissa muihin sovellutuksiin käyttämättä keksimiskykyä.
• ·
Ml ,,., j Näin ollen esillä olevaa keksintöä ei ole tarkoitettu raj ata tässä esitettyihin . . 1. sovellutuksiin vaan sille tulee suoda laaj in piiri, j oka on yhdenmukainen tässä ··· • 1 1 1 · esitettyj en periaatteiden j a uusien piirteiden kanssa.
* · · :Y: 25 VAADIMME: • 9 ··· • · • · ··♦ 9 ··· Φ *«·· ··· 30 M • · 9 9 • 99 9 9 999 9 9999
Claims (10)
1. Menetelmä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, tunnettu siitä, että käsittää: 5 asetetaan havaintakynnys perustuen tulosignaalin signaalikohinasuhteen (SNR) arvioon, jossa SNR:n signaalienergia arvioidaan maksimisignaalienergiaksi aktiivisen puheen aikana; ja käytetään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta. 10
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että SNR:n taustako-hinaenergiaksi arvioidaan minimisignaalienergia hiljaisuuden aikana.
3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että havaintakynnysten 15 asettamisvaihe käsittää: määritetään tulosignaalin SNR:n indeksi; käytetään SNR:n indeksiä valitsemaan tai laskemaan ensimmäinen skaalausker-roin ja toinen kerroin; käytetään ensimmäistä skaalauskerrointa ja toista skaalauskerrointa laskemaan ··· •••t 20 matalan taajuuden kynnysarvo ja korkean taajuuden kynnysarvo. · • · · • * · • * e·· • · • ·
4. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että vaihe, jossa käyte- • · tään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali • · · *" vai hiljaisuutta, käsittää: • · φ • * 25 suodatetaan tulosignaali lineaarisen ennustavan koodauksen (LPC) suodattimel- . . la, jotta saadaan formanttijäännössignaali, ja • » · • * .·**. verrataan normalisoitua formanttijäännössignaalin autokorrelaatiofunktiota ha- ·*· * •# vamtakynnyksim. * · · ···· ··· • · • # ·*· *. 30
5. Patenttivaatimusten 2 ja 4 mukainen menetelmä, tunnettu siitä, että formanttijään- ·· **" nössignaalin normalisoidun autokorrelaatiofimktion vertaaminen havaintakynnyksiin *···* käsittää: m 119085 verrataan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota ensimmäiseen kynnykseen; päivitetään taustakohinan energia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on vähemmän kuin ensimmäinen kynnys; 5 verrataan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota toi seen kynnykseen, jossa toinen kynnys on korkeampi kuin ensimmäinen kynnys; päivitetään signaalienergia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on suurempi kuin toinen kynnys; ja käytetään päivitettyä taustakohinan energia-arviota ja päivitettyä signaaliener-10 gia-arviota määrittämään onko tulosignaalissa audiosignaali vai hiljaisuutta.
6. Laite havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, tunnettu siitä, että laite käsittää: välineet asettamaan havaintakynnykset perustaen tulosignaalin signaaliko-15 hinasuhteen (SNR) arvioon, jossa SNR:n signaalienergia arvioidaan maksi- misignaalienergiaksi aktiivisen puheen aikana; ja välineet käyttämään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta. ·:· 20
7. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että SNR:n taustakohinan ener- • · · · • V; gia arvioidaan minimisignaalienergiaksi hiljaisuuden aikana.
• · • · · • · • * • ·· * * 8. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että välineet asettamaan havain- •. i. · takynnykset on lisäksi konfiguroita: ··· • · * * · * * 25 määrittämään tulosignaalin SNR:n indeksi; . . käyttämään SNR:n indeksiä valitsemaan tai laskemaan ensimmäinen skaalaus- * ] · kerroin ja toinen kerroin; • · • · *·* käyttämään ensimmäistä skaalauskerrointa ja toista skaalauskerrointa laskemaan • * * .·.: matalan taajuuden kynnysarvo ja korkean taajuuden kynnysarvo. ·*· • · **:*’ 30
··· ···· 9. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että välineet käyttämään *... * havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, on lisäksi konfiguroita: 15 119085 suodattamaan tulosignaali lineaarisen ennustavan koodauksen (LPC) suodattimena, jotta saadaan formanttijäännössignaali; ja vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota havaintakynnyksiin. 5
10. Patenttivaatimuksen 9 mukainen laite, tunnettu siitä, että välineet vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota havaintakynnyksiin, on lisäksi konfiguroitu: vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota 10 ensimmäiseen kynnykseen; päivittämään taustakohinan energia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on pienempi kuin ensimmäinen kynnys; vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota toiseen kynnykseen, jossa toinen kynnys on korkeampi kuin ensimmäinen kyn-15 nys; päivittämään signaalienergia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on suurempi kuin toinen kynnys; ja käyttämään päivitettyä taustakohinan energia-arviota ja päivitettyä signaaliener-gia-arviota määrittämään onko tulosignaalissa audiosignaali vai hiljaisuutta. 20 ««·« • · • · · • · · • · • · · • 1 • · • · 1 *··1 • · • 1 « • · · • 1 · : 2 3: 25 *·· • · • t » • · · • · • · • « • · · · · · 2 *··· 3 • · • · • · · * **· • · · · • · · • · • · • · · 16 PATENTKRAV 1 1 9085
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28841394 | 1994-08-10 | ||
US08/288,413 US5742734A (en) | 1994-08-10 | 1994-08-10 | Encoding rate selection in a variable rate vocoder |
US9509830 | 1995-08-01 | ||
PCT/US1995/009830 WO1996005592A1 (en) | 1994-08-10 | 1995-08-01 | Method and apparatus for selecting an encoding rate in a variable rate vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
FI20061084A FI20061084A (fi) | 2006-12-07 |
FI119085B true FI119085B (fi) | 2008-07-15 |
Family
ID=23106989
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI961112A FI117993B (fi) | 1994-08-10 | 1996-03-08 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050704A FI122272B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050702A FI122273B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050703A FI123708B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20061084A FI119085B (fi) | 1994-08-10 | 2006-12-07 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI961112A FI117993B (fi) | 1994-08-10 | 1996-03-08 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050704A FI122272B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050702A FI122273B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
FI20050703A FI123708B (fi) | 1994-08-10 | 2005-07-01 | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa |
Country Status (20)
Country | Link |
---|---|
US (1) | US5742734A (fi) |
EP (6) | EP1703493B1 (fi) |
JP (8) | JP3502101B2 (fi) |
KR (3) | KR20040004420A (fi) |
CN (5) | CN1512488A (fi) |
AT (5) | ATE386321T1 (fi) |
AU (1) | AU711401B2 (fi) |
BR (2) | BR9510780B1 (fi) |
CA (3) | CA2171009C (fi) |
DE (5) | DE69535452T2 (fi) |
DK (3) | DK1239465T4 (fi) |
ES (5) | ES2240602T5 (fi) |
FI (5) | FI117993B (fi) |
HK (2) | HK1015185A1 (fi) |
IL (1) | IL114874A (fi) |
MX (1) | MX9600920A (fi) |
PT (3) | PT1233408E (fi) |
TW (1) | TW277189B (fi) |
WO (1) | WO1996005592A1 (fi) |
ZA (1) | ZA956081B (fi) |
Families Citing this family (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6389010B1 (en) | 1995-10-05 | 2002-05-14 | Intermec Ip Corp. | Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones |
US7924783B1 (en) | 1994-05-06 | 2011-04-12 | Broadcom Corporation | Hierarchical communications system |
TW271524B (fi) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6292476B1 (en) * | 1997-04-16 | 2001-09-18 | Qualcomm Inc. | Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels |
JPH09162837A (ja) * | 1995-11-22 | 1997-06-20 | Internatl Business Mach Corp <Ibm> | 圧縮方式を動的に変更する通信方法及び装置 |
JPH09185397A (ja) * | 1995-12-28 | 1997-07-15 | Olympus Optical Co Ltd | 音声情報記録装置 |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US6510208B1 (en) * | 1997-01-20 | 2003-01-21 | Sony Corporation | Telephone apparatus with audio recording function and audio recording method telephone apparatus with audio recording function |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
DE19742944B4 (de) * | 1997-09-29 | 2008-03-27 | Infineon Technologies Ag | Verfahren zum Aufzeichnen eines digitalisierten Audiosignals |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6240386B1 (en) | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6393074B1 (en) | 1998-12-31 | 2002-05-21 | Texas Instruments Incorporated | Decoding system for variable-rate convolutionally-coded data sequence |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
EP1177668A2 (en) * | 1999-05-10 | 2002-02-06 | Nokia Corporation | Header compression |
US7127390B1 (en) | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6745012B1 (en) * | 2000-11-17 | 2004-06-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive data compression in a wireless telecommunications system |
US7120134B2 (en) * | 2001-02-15 | 2006-10-10 | Qualcomm, Incorporated | Reverse link channel architecture for a wireless communication system |
DE60323331D1 (de) * | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US7602722B2 (en) * | 2002-12-04 | 2009-10-13 | Nortel Networks Limited | Mobile assisted fast scheduling for the reverse link |
KR100754439B1 (ko) | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US8417515B2 (en) * | 2004-05-14 | 2013-04-09 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
CN1295678C (zh) * | 2004-05-18 | 2007-01-17 | 中国科学院声学研究所 | 子带自适应谷点降噪系统和方法 |
KR100657916B1 (ko) | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
KR100757858B1 (ko) * | 2005-09-30 | 2007-09-11 | 와이더댄 주식회사 | 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
JP4065314B2 (ja) * | 2006-01-12 | 2008-03-26 | 松下電器産業株式会社 | 対象音分析装置、対象音分析方法および対象音分析プログラム |
EP1989702A4 (en) * | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL |
US8204754B2 (en) * | 2006-02-10 | 2012-06-19 | Telefonaktiebolaget L M Ericsson (Publ) | System and method for an improved voice detector |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
CN100483509C (zh) * | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
CN101217037B (zh) * | 2007-01-05 | 2011-09-14 | 华为技术有限公司 | 对音频信号的编码速率进行源控的方法和系统 |
JPWO2009038170A1 (ja) * | 2007-09-21 | 2011-01-06 | 日本電気株式会社 | 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム |
WO2009038115A1 (ja) * | 2007-09-21 | 2009-03-26 | Nec Corporation | 音声符号化装置、音声符号化方法及びプログラム |
US20090099851A1 (en) * | 2007-10-11 | 2009-04-16 | Broadcom Corporation | Adaptive bit pool allocation in sub-band coding |
US8483854B2 (en) * | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
US8805694B2 (en) * | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
EP2491549A4 (en) | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY |
US9047878B2 (en) * | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
WO2012081166A1 (ja) * | 2010-12-14 | 2012-06-21 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
US8990074B2 (en) | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US8666753B2 (en) * | 2011-12-12 | 2014-03-04 | Motorola Mobility Llc | Apparatus and method for audio encoding |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
CN110265058B (zh) * | 2013-12-19 | 2023-01-17 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
US9564136B2 (en) | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
PL3125242T3 (pl) * | 2014-03-24 | 2018-12-31 | Nippon Telegraph & Telephone | Sposób kodowania, koder, program i nośnik zapisu |
EP3614382B1 (en) * | 2014-07-28 | 2020-10-07 | Nippon Telegraph And Telephone Corporation | Coding of a sound signal |
US9870780B2 (en) * | 2014-07-29 | 2018-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
KR101619293B1 (ko) | 2014-11-12 | 2016-05-11 | 현대오트론 주식회사 | 전원 반도체의 제어 방법 및 제어 장치 |
CN107742521B (zh) | 2016-08-10 | 2021-08-13 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
EP3751567B1 (en) * | 2019-06-10 | 2022-01-26 | Axis AB | A method, a computer program, an encoder and a monitoring device |
CN110992963B (zh) * | 2019-12-10 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 网络通话方法、装置、计算机设备及存储介质 |
CN113611325B (zh) * | 2021-04-26 | 2023-07-04 | 珠海市杰理科技股份有限公司 | 基于清浊音实现的语音信号变速方法、装置和音频设备 |
Family Cites Families (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3633107A (en) * | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (fi) * | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (fi) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
EP0111612B1 (fr) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4672670A (en) * | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
DE3412430A1 (de) * | 1984-04-03 | 1985-10-03 | Nixdorf Computer Ag, 4790 Paderborn | Schalteranordnung |
EP0167364A1 (en) * | 1984-07-06 | 1986-01-08 | AT&T Corp. | Speech-silence detection with subband coding |
FR2577084B1 (fr) * | 1985-02-01 | 1987-03-20 | Trt Telecom Radio Electr | Systeme de bancs de filtres d'analyse et de synthese d'un signal |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
JPS6491200A (en) * | 1987-10-02 | 1989-04-10 | Fujitsu Ltd | Voice analysis system and voice synthesization system |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4897832A (en) † | 1988-01-18 | 1990-01-30 | Oki Electric Industry Co., Ltd. | Digital speech interpolation system and speech detector |
EP0331857B1 (en) * | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
DE3883519T2 (de) * | 1988-03-08 | 1994-03-17 | Ibm | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. |
KR0161258B1 (ko) * | 1988-03-11 | 1999-03-20 | 프레드릭 제이 비스코 | 음성활동 검출 방법 및 장치 |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) * | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
CA1321645C (en) * | 1988-09-28 | 1993-08-24 | Akira Ichikawa | Method and system for voice coding based on vector quantization |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
EP0392126B1 (en) * | 1989-04-11 | 1994-07-20 | International Business Machines Corporation | Fast pitch tracking process for LTP-based speech coders |
JPH0754434B2 (ja) * | 1989-05-08 | 1995-06-07 | 松下電器産業株式会社 | 音声認識装置 |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5307441A (en) † | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP3004664B2 (ja) * | 1989-12-21 | 2000-01-31 | 株式会社東芝 | 可変レート符号化方法 |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
US5103459B1 (en) * | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
JPH04100099A (ja) * | 1990-08-20 | 1992-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出装置 |
JPH04157817A (ja) * | 1990-10-20 | 1992-05-29 | Fujitsu Ltd | 可変レート符号化装置 |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
EP1675100A2 (en) * | 1991-06-11 | 2006-06-28 | QUALCOMM Incorporated | Variable rate vocoder |
DE69217590T2 (de) * | 1991-07-31 | 1997-06-12 | Matsushita Electric Ind Co Ltd | Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals |
JP2705377B2 (ja) * | 1991-07-31 | 1998-01-28 | 松下電器産業株式会社 | 帯域分割符号化方法 |
US5410632A (en) † | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
JP3088838B2 (ja) * | 1992-04-09 | 2000-09-18 | シャープ株式会社 | 音楽検出回路及び該回路を用いた音声信号入力装置 |
JP2976701B2 (ja) * | 1992-06-24 | 1999-11-10 | 日本電気株式会社 | 量子化ビット数割当方法 |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5644596A (en) † | 1994-02-01 | 1997-07-01 | Qualcomm Incorporated | Method and apparatus for frequency selective adaptive filtering |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6134215A (en) | 1996-04-02 | 2000-10-17 | Qualcomm Incorpoated | Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel |
-
1994
- 1994-08-10 US US08/288,413 patent/US5742734A/en not_active Expired - Lifetime
-
1995
- 1995-07-08 TW TW084107075A patent/TW277189B/zh not_active IP Right Cessation
- 1995-07-20 ZA ZA956081A patent/ZA956081B/xx unknown
- 1995-08-01 AT AT06013824T patent/ATE386321T1/de not_active IP Right Cessation
- 1995-08-01 DE DE69535452T patent/DE69535452T2/de not_active Expired - Lifetime
- 1995-08-01 CN CNA2004100016646A patent/CN1512488A/zh active Pending
- 1995-08-01 EP EP06013824A patent/EP1703493B1/en not_active Expired - Lifetime
- 1995-08-01 CA CA002171009A patent/CA2171009C/en not_active Expired - Lifetime
- 1995-08-01 PT PT02009465T patent/PT1233408E/pt unknown
- 1995-08-01 AT AT02009465T patent/ATE285620T1/de active
- 1995-08-01 CN CNA2006101003869A patent/CN1945696A/zh active Pending
- 1995-08-01 ES ES02009467T patent/ES2240602T5/es not_active Expired - Lifetime
- 1995-08-01 DK DK02009467.8T patent/DK1239465T4/da active
- 1995-08-01 ES ES05001938T patent/ES2281854T3/es not_active Expired - Lifetime
- 1995-08-01 CN CNB2004100016631A patent/CN100508028C/zh not_active Expired - Lifetime
- 1995-08-01 ES ES02009465T patent/ES2233739T3/es not_active Expired - Lifetime
- 1995-08-01 BR BRPI9510780-0A patent/BR9510780B1/pt not_active IP Right Cessation
- 1995-08-01 AT AT95929372T patent/ATE235734T1/de active
- 1995-08-01 DK DK95929372T patent/DK0728350T3/da active
- 1995-08-01 DE DE69533881T patent/DE69533881T2/de not_active Expired - Lifetime
- 1995-08-01 CA CA2488918A patent/CA2488918C/en not_active Expired - Lifetime
- 1995-08-01 EP EP02009467A patent/EP1239465B2/en not_active Expired - Lifetime
- 1995-08-01 DE DE69534285T patent/DE69534285T3/de not_active Expired - Lifetime
- 1995-08-01 MX MX9600920A patent/MX9600920A/es unknown
- 1995-08-01 EP EP95929372A patent/EP0728350B1/en not_active Expired - Lifetime
- 1995-08-01 PT PT95929372T patent/PT728350E/pt unknown
- 1995-08-01 KR KR10-2003-7005883A patent/KR20040004420A/ko not_active Application Discontinuation
- 1995-08-01 ES ES06013824T patent/ES2299122T3/es not_active Expired - Lifetime
- 1995-08-01 DE DE69535709T patent/DE69535709T2/de not_active Expired - Lifetime
- 1995-08-01 DE DE69530066T patent/DE69530066T2/de not_active Expired - Lifetime
- 1995-08-01 ES ES95929372T patent/ES2194921T3/es not_active Expired - Lifetime
- 1995-08-01 KR KR10-2003-7005884A patent/KR100455225B1/ko not_active IP Right Cessation
- 1995-08-01 KR KR1019960701839A patent/KR100455826B1/ko not_active IP Right Cessation
- 1995-08-01 AT AT02009467T patent/ATE298124T1/de active
- 1995-08-01 AU AU32751/95A patent/AU711401B2/en not_active Expired
- 1995-08-01 DK DK02009465T patent/DK1233408T3/da active
- 1995-08-01 EP EP04003180A patent/EP1424686A3/en not_active Ceased
- 1995-08-01 AT AT05001938T patent/ATE358871T1/de not_active IP Right Cessation
- 1995-08-01 EP EP05001938A patent/EP1530201B1/en not_active Expired - Lifetime
- 1995-08-01 CN CNB951907174A patent/CN1168071C/zh not_active Expired - Lifetime
- 1995-08-01 EP EP02009465A patent/EP1233408B1/en not_active Expired - Lifetime
- 1995-08-01 PT PT02009467T patent/PT1239465E/pt unknown
- 1995-08-01 CA CA2488921A patent/CA2488921C/en not_active Expired - Lifetime
- 1995-08-01 WO PCT/US1995/009830 patent/WO1996005592A1/en active IP Right Grant
- 1995-08-01 CN CNB2004100016650A patent/CN1320521C/zh not_active Expired - Lifetime
- 1995-08-01 JP JP50740496A patent/JP3502101B2/ja not_active Expired - Lifetime
- 1995-08-01 BR BR9506036A patent/BR9506036A/pt not_active Application Discontinuation
- 1995-08-08 IL IL11487495A patent/IL114874A/xx not_active IP Right Cessation
-
1996
- 1996-03-08 FI FI961112A patent/FI117993B/fi not_active IP Right Cessation
-
1998
- 1998-12-28 HK HK98116184A patent/HK1015185A1/xx not_active IP Right Cessation
-
2003
- 2003-08-21 JP JP2003297412A patent/JP2004004971A/ja not_active Withdrawn
- 2003-08-21 JP JP2003297413A patent/JP3927159B2/ja not_active Expired - Lifetime
-
2005
- 2005-07-01 FI FI20050704A patent/FI122272B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050702A patent/FI122273B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050703A patent/FI123708B/fi not_active IP Right Cessation
- 2005-10-31 HK HK05109679A patent/HK1077911A1/xx not_active IP Right Cessation
-
2006
- 2006-12-07 FI FI20061084A patent/FI119085B/fi not_active IP Right Cessation
-
2007
- 2007-05-31 JP JP2007145738A patent/JP4680958B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145737A patent/JP4680957B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145736A patent/JP2007293355A/ja not_active Withdrawn
- 2007-05-31 JP JP2007145735A patent/JP4680956B2/ja not_active Expired - Lifetime
-
2011
- 2011-04-21 JP JP2011095137A patent/JP4870846B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI119085B (fi) | Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa | |
KR960705306A (ko) | 감소된 비율의 가변 비율 보코딩을 수행하기 위한 방법 및 장치(method and apparatus for performing reduced rate variable rate vocoding) | |
Vahatalo et al. | Voice activity detection for GSM adaptive multi-rate codec | |
WO2006014924A2 (en) | Method and system for improving voice quality of a vocoder | |
KR100263296B1 (ko) | G.729 음성 부호화기를 위한 음성 활성도 측정 방법 | |
JPH0832526A (ja) | 音声検出器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MA | Patent expired |