FI119085B - Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa - Google Patents

Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa Download PDF

Info

Publication number
FI119085B
FI119085B FI20061084A FI20061084A FI119085B FI 119085 B FI119085 B FI 119085B FI 20061084 A FI20061084 A FI 20061084A FI 20061084 A FI20061084 A FI 20061084A FI 119085 B FI119085 B FI 119085B
Authority
FI
Finland
Prior art keywords
signal
threshold
energy
snr
silence
Prior art date
Application number
FI20061084A
Other languages
English (en)
Swedish (sv)
Other versions
FI20061084A (fi
Inventor
William R Gardner
Andrew P Dejaco
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23106989&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=FI119085(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of FI20061084A publication Critical patent/FI20061084A/fi
Application granted granted Critical
Publication of FI119085B publication Critical patent/FI119085B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Description

/ 119085 t
MENETELMÄ JA LAITE KOODAUSNOPEUDEN VALITSEMISEKSI MUUTTUVANOPEUKSISESSA VOKOODERISSA
KEKSINNÖN TAUSTA 5 I. Keksinnön ala
Esillä oleva keksintö liittyy vokoodereihin. Erityisesti esillä oleva keksintö liittyy uuteen ja parannettuun menetelmään puheen koodausnopeuden määrittämiseksi 10 muuttuvanopeuksisessa vokooderissa.
Π. Liittyvän alan kuvaus
Tyypillisesti muuttuvanopeuksinen puheen kompressointijärjestelmä käyttää 15 jotain nopeuden tunnistusalgoritmia ennen kuin koodaus alkaa. Nopeuden määräysalgoritmi osoittaa korkeamman bittinopeuden koodausjäq estetyn audiosignaalin segmenteille, joissa puhe on läsnä ja alemman nopeuden koodausjärjestelyn hiljaisille segmenteille. Tällä tavalla saavutetaan alempi '. ( keskimääräinen bittinopeus ja säilytetään samalla korkea laatutaso palautetussa 20 puheessa. Näin ollen toimiakseen tehokkaammin muuttuvanopeuksinen • · * · . · · ·, puhekooderi vaatii vankan nopeuden määräämisalgoritmin, joka pystyy •...: erottamaan puheen hiljaisuudesta erilaisissa taustakohinaympäristöissä.
• ♦ · • · * ··· ; | : Eräs tällainen muuttuvanopeuksinen puheen kompressointij äij estelmä tai 25 muuttuvanopeuksinen vokooderi esitetään samaan aikaan vireillä olevassa US- • · patenttihakemuksessa sarjanro 07/713,661, jätetty 11.6.1991, nimeltä ··· •...: ’’Muuttuvanopeuksinen vokooderi”, j oka on siirretty esillä olevan keksinnön j' haltijalle, jonka sisältö liitetään tähän viittauksella. Tässä muuttuvanopeuksisen • · · !t§§: vokooderin tietyssä toteutuksessa tulopuhe koodataan käyttäen koodiherätteisen « ·· 30 lineaarisen ennustuksen koodaustekniikoita (Code Excited Linear Predictive ·*·· : * * *: Coding, CELP) yhdellä useista nopeuksista, j otka on määritelty puheaktiviteetin 2 119086 tasolla. PuheaJktiviteetin taso määritetään energiasta tulon audionäytteissä, jotka saattavat sisältää taustakohinaa kuuluvan puheen lisäksi. Jotta vokooderi taijoaa korkealaatuisen äänikoodauksen eri taustakohinatasoilla, vaaditaan mukautuvasti säätävää kynnystekniikkaa, j otta kompensoidaan taustakohinan vaikutus 5 nopeuden päätösalgoritmiin.
Vokoodereita käytetään tyypillisesti kommunikaatiolaitteissa, kuten solukkopuhelimissa tai henkilökohtaisissa kommunikaatiolaitteissa analogisen äänisignaalin digitaalikompression antamiseksi, joka on muunnettu digitaaliseen 10 muotoon lähetystä varten. Matkaviestinympäristössä, jossa solukkopuhelinta tai henkilökohtaista kommunikaatiolaitetta voidaan käyttää, taustakohinan energian suuret tasot tekevät nopeuspäättelyalgoritmille vaikeaksi erottaa pienitehoisia soinnittomia ääniä taustakohinan hiljaisuudesta käyttämällä signaalienergiaan perustuvaa nopeuden määräysalgoritmia. Näin ollen soinnittomat äänet 15 säännöllisesti tulevat koodattua alemmilla bittinopeuksilla ja äänen laatu heikkenee, koska konsonantit, kuten ”s”, ”x”, ”ch”, ”sh”, ”t” jne, menetetään palautetussa puheessa.
!( Vokooderit, j otka perustavat nopeuspäättelyn pelkästään taustakohinan energiaan, t · [ ·, 20 eivät ota huomioon signaalin voimakkuutta suhteessa taustakohinaan asettaessaan • t * • * . · · ·. kynnysarvoj a. Vokooderi, joka perustaa kynnysarvonsa ainoastaan taustakohinaan *Φ··* ....: on taipuvainen kompressoimaan kynnystasot yhteen kun taustakohinan taso • :*: nousee. Jos signaalin taso pysyisi kiinteänä, tämä olisi oikea tapa kynnystasojen • · · : “ *: asettamiseen, kuitenkin jos signaalin taso nousisi taustakohinan tason mukana, 25 niin kynnystasojen kompressointi ei ole optimaalinen ratkaisu.
• · V.: Muuttuvanopeuksisissa vokoodereissa tarvitaan siis vaihtoehtoinen menetelmä *·» \: kynnystasoj en asettamiseksi, joka ottaa huomioon signaalin voimakkuuden.
φ • · · • ·· · • · · •, „! Vilmeinen j älj ellä oleva ongelma tulee esille soitettaessa musiikkia • · · 30 taustakohinaenergiaan perustavan nopeuspäätösvokooderin läpi. Kun ihmiset ΙΦΙ» puhuvat, heidän täytyy pitää hengitystauko, joka sallii kynnystasojen nollautua 3 119085 asianmukaiselle taustakohinatasolle. Kuitenkin lähetettäessä musiikkia vokooderin läpi, kuten esiintyy musiikkia-odottaessa tilanteissa, ei esiinny taukoja ja kynnysarvot jatkavat nousuaan kunnes musiikkia aletaan koodata nopeudella alle täyden nopeuden. Tällaisessa tilanteessa muuttuvanopeuksinen 5 kooderi on sekoittanut musiikin taustakohinaan.
KEKSINNÖN YHTEENVETO
Esillä oleva keksintö on uusija parannettu menetelmä ja laite koodausnopeuden 10 määrittämiseksi muuttuvanopeuksisessa vokooderissa. Esillä olevan keksinnön ensimmäisenä tarkoituksena on tuoda esiin menetelmä, jolla vähennetään todennäköisyyttä koodata pienienergiaista soinnitonta puhetta taustakohinana.
Esillä olevassa keksinnössä tulosignaali suodatetaan suuritaajuiseen komponenttiin ja pienitaajuiseen komponenttiin. Tulosignaalin suodatetut 15 komponentit sitten analysoidaan yksitellen puheen läsnäolon tunnistamiseksi.
Koska soinnittomalla puheella on suuritaajuinen komponentti, sen voimakkuus suhteessa korkeataajuuskaistaan on enemmän erillään taustakohinasta tuolla kaistalla kuin mitä se on verrattuna taustakohinaan koko taajuuskaistalla.
• • · ·
»•M
20 Toinen esillä olevan keksinnön tarkoitus on tuoda esiin välineet, joilla asetetaan * · · • · kynnysarvot, jotka ottavat huomioon signaalienergian samoin kuin taustakohinan ··· • · · · · energian. Esillä olevassa keksinnössä äänen tunnistuskynnysten asettaminen j perustuu tulosignaalin signaali-kohinasuhteen (SNR) estimaattiin.
···
Esimerkkisovellutuksessa signaalienergia estimoidaan maksimisignaalienergiaksi 25 aktiivisen puheen aikoina ja taustakohinan energia estimoidaan minimi • ♦ :. V signaalienergiaksi hilj aisuuden aikoina.
··· • · • · ··· *·* Kolmas esillä olevan keksinnön tarkoitus on tuoda esiin menetelmä ···· • * muuttuvanopeuksisen vokooderin läpi kulkevan musiikin koodaamiseksi.
* ·* 30 Esimerkkisovellutuksessa nopeuden valintalaite tunnistaa lukumääärän peräkkäisiä kehyksiä, joilla kynnysarvot ovat nousseet ja tarkastaa jaksollisuuden 119085 4 tuolla kehysten lukumäärällä. Jos tulosignaali on jaksollinen, tämä indikoisi musiikin läsnäoloa. Jos musiikin läsnäolo tunnistetaan, niin kynnykset asetetaan tasoille siten, että signaali koodataan täydellä nopeudella.
5 PIIRUSTUSTEN LYHYT KUVAUS
Esillä olevan keksinnön piirteet, tarkoitukset ja edut tulevat selvemmiksi seuraavasta yksityiskohtaisesta kuvauksesta yhdessä piirustusten kanssa, j oissa vastaavat viitemerkit identifioivat vastaavasti kauttaaltaan ja joissa; 10 kuvio 1 on lohkokaavio esillä olevasta keksinnöstä.
SUOSITELTUJEN SUORITUSMUOTOJEN YKSITYISKOHTAINEN KUVAUS
15 Viitaten kuvioon 1, tulosignaali S(n) annetaan alikaistan energian laskentaelementtiin 4 ja alikaistan energian laskentaelementtiin 6. Tulosignaali S(n) koostuu audiosignaalista ja taustakohinasta. Tyypillisesti audiosignaali on puhetta, mutta se voi myös olla musiikkia. Esimerkkisovellutuksessa S(n) annetaan 20:n millisekunnin kehyksissä, joissa kussakin on 160 näytettä.
. V. 20 Esimerkkisovellutuksessa tulosignaaliin S(n) kuuluu taajuuskomponentit 0 • · ♦ • · , · · ·. kHz:stä 4 kHz:iin, joka on suunnilleen ihmispuhesignaalin kaistanleveys.
·1 2 3·1 • · : Esimerkkisovellutuksessa 4 kHz tulosignaali S(n) suodatetaan kahteen erilliseen ··· s]1]: alikaistaan. Kaksi erillistä alikaistaa ovat 0 ja 2 kHz:n ja 2 kHz:n ja 4 kHz:n 25 välillä, vastaavasti. Esimerkkisovellutuksessa tulosignaali voidaan jakaa • · V.: alikaistoihin alikaistasuodattimilla, joiden suunnittelu on hyvin tunnettua alalla ja esitetään yksityiskohtaisemmin US-patenttihakemuksessa saijanro 08/189,819, m „1j1 jätetty helmikuun 1.,1994, nimeltä’Taajuusvalinnainen muuntuva suodatus”, ··« :.,. · joka on siirretty tämän keksinnön haltijalle, joka liitetään tähän viittauksella.
·:· 30 ···· M • · 2 • · 3 5 119085
Alikaistan suodattimien impulssivasteita merkitään hiXn):llä alipäästösuodattimelle ja hH(n):llä ylipäästösuodattimelle. Signaalin tuloksena olevien alikaistan komponenttien energia arvojen Rl(0) ja Rh(0) antamiseksi voidaan laskea yksinkertaisesti summaamalla alikaistan suodattimien 5 lähtönäytteiden neliöt kuten on alalla hyvin tunnettua.
Edullisessa sovellutuksessa, kun tulosignaali S(n) annetaan alikaistan energian laskentaelementtiin 4, tulokehyksen alitaajuuskomponentin energia-arvo Rl(0) lasketaan seuraavasti: 10 11,(0) = Rs( 0). ^l(0)+2*^Äs(0 · ÄM(i) (1) /=1 missä L on väliottojen määrä alipäästösuodattimella impulssivasteen on hiXn) kanssa, 15 missä Rs(i) on tulosignaalin S(n) autokorrelaatiofunktio, joka saadaan yhtälöstä: Rs(i) = its(n)-S(n-0, is[0,L-l)\:lle (2) * n=1 ··· ···· • · • · · • · · . · · ·, missä N on näytteiden lukumäärä kehyksessä, • · »·· ....: 20 ja missä Rm, on alipäästösuodattimen hL(n) autokorrelaatiofunktio, j oka saadaan . seuraavasti: • » · ··· »·· t · • · ··· *Μ(0 = Σ>Ι(η)·ω(η-0· 0,L-\\.lk : : : «=o (3) • · ,···. = 0 muutoin • · ··* t
«M
»·*· . * * *. 25 Suurtaajuinen energia Rh(0) lasketaan samalla tavalla alikaistan energian
Ml laskentaelementissä 6.
·§· ···· ·** • · • · M· 6 119085
Alikaistasuodattimien autokorrelaatiofunktion arvot voidaan laskea etuajassa laskentakuormituksen vähentämiseksi. Lisäksi joitain Rs(i):n laskettuja arvoja käytetään muissa laskennoissa tulosignaalin S(n) koodauksessa, mikä edelleen alentaa esillä olevan keksinnön mukaisen koodausnopeuden valintamenetelmien 5 kokonaislaskentakuormitusta. Esimerkiksi LPC-suodattimen väliottoarvojen johtaminen vaatii tulosignaalin autokorrelaatiofunktioiden vakioiden joukon laskentaa.
LPC-suodattimen väliottoarvojen laskenta on alalla hyvin tunnettua ja kuvataan 10 yksityiskohtaisemmin yllä mainitussa US-patenttihakemuksessa sarjanro 08/004,484. Jos koodataan puhetta menetelmällä, joka vaatii kymmenen välioton LPC-suodattimen, vain Rs(i):n arvot i:n arvoilla
11 - L-l on laskettava, niiden lisäksi, joita käytetään signaalin koodaamiseen, koska Rs(i) i:n arvoilla 0-10 käytetään LPC-suodattimen väliottoarvojen 15 laskennassa. Esimerkkisovellutuksessa alikaistan suodattimilla on 17 väliottoa, L
= 17.
Alikaistan energian laskentaelementti 4 antaa Ri,(0):n lasketun arvon alikaistan .;. nopeuden päätöselementtiin 12 ja alikaistan energian laskentaelementti 6 antaa ···· 20 Rn(0):n lasketun arvon alikaistan nopeuden päätöselementtiin 14. Nopeuden • · j"·. päätöselementti 12 vertaa Ri,(0):n arvoa kahteen ennalta määrättyyn ·«« ····· kynnysarvoon Tli/2 ja TLtaysi ja osoittaa ehdotetun koodausnopeuden NOPEUSl : vertailun mukaisesti. Nopeusosoitus suoritetaan seuraavasti: «·· • · • ♦ ··· 25 NOPEUSl = kahdeksasosanopeus Rl(0) < Tli/2 (4) • · '•V NOPEUSl = puolinopeus Tli/2 < Rl(0)< Tmysi (5) NOPEUSl = täysinopeus Rl(0) > TLtäysi (6) ···· • ti * · · · * Alikaistan nopeuden päätöselementti 14 toimii samalla tavalla j a valitsee ..*·* 30 ehdotetun koodausnopeuden NOPEUSh suurtaajuusenergia-arvon Rh(0) ··· :1M: mukaisesti ja perustuen eri joukkoon kynnysarvoja Thi/2 ja THtaysi- Alikaistan 119085 7 nopeuden päätöselementti 12 antaa ehdotetun koodausnopeutensa NOPEUSl koodausnopeuden valintaelementtiin 16 ja alikaistan nopeuden päätöselementti 14 antaa ehdotetun koodausnopeutensa NOPEUSh koodausnopeuden valintaelementtiin 16. Esimerkkisovellutuksessa koodausnopeuden 5 valintaelementti 16 valitsee suuremman kahdesta ehdotetusta nopeudesta ja antaa suuremman nopeuden valittuna KOODAUSNOPEUTENA.
Alikaistan energian laskentaelementti 4 antaa lisäksi alitaajuusenergia-arvon Rl(0) kynnyksen sovituselementille 8, missä kynnysarvot Tli/2 ja Tuaysi seuraavaa 10 tulokehystä varten lasketaan. Vastaavasti alikaistan energian laskentaelementti 6 antaa korkeataajuusenergia-arvon Rh(0), kynnyksen sovituselementille 10, missä kynnysarvot Thi/2 ja TWysi seuraavaa tulokehystä varten lasketaan.
Kynnyksen sovituselementti 8 vastaanottaa alitaajuusenergia-arvon Rl(0) ja 15 määrittää sisältääkö S(n) taustakohinaa vai audiosignaalin. Esimerkinomaisessa toteutuksessa menetelmänä, jolla kynnyksen sovituselementti 8 määrittää onko audiosignaali läsnä, on tutkia normalisoitua autokorrelaatiofunktiota NACF, joka annetaan yhtälöllä: • ·«» ·»·» NACF** max m-γ, (7) , Λ ΙΪ-0 3Β—0 20 ·«· t t • «
«M
missä e(n) on formanttiresiduaalisignaali, j oka seuraa tulosignaalin S(n) • 1 · ' · ’ · 1 suodattamisesta LPC-suodattimella.
··· • · • · ··· • · · • · · t 25 LPC-suodattimen suunnittelu j a signaalin suodattaminen sillä on hyvin tunnettua ··· • · *·”1 alalla j a kuvataan yksityiskohtaisemmin yllä mainitussa U S - patenttihakemuksessa 08/004,484. Tulosignaali S(n) suodatetaan LPC- *·1 · · · · · 1 suodattimella formanttien vuorovaikutuksen poistamiseksi. NACF:ia verrataan 119085 8 kynnysarvoon audiosignaalin läsnäolon määrittämiseksi. Mikäli NACF on suurempi kuin ennalta määrätty kynnysarvo, se osoittaa, että tulokehyksellä on jaksollinen ominaisuus merkkinä audiosignaalin, kuten puheen tai musiikin läsnäolosta. Huomattakoon että kun osia puheesta tai musiikista ei ole jaksollisia 5 ja ilmaisee siten pieniä NACF:n arvoja, taustakohina ei tyypillisesti milloinkaan sisällä mitään jaksollisuutta ja lähes aina ilmaisee pieniä NACF:n arvoja.
Mikäli S(n):n määritetään sisältävän taustakohinaa, NACF:n arvo on pienempi kuin kynnysarvo TH1, niin arvoa Rl(0) käytetään nykyisen 10 taustakohinaestimaatin BGNl päivittämiseen. Esimerkkisovellutuksessa TH1 on 0,35. Ri,(0):a verrataan nykyiseen taustakohinaestimaatin BGNl arvoon. Mikäli Rl(0) on pienempi kuin BGNl, niin taustakohinaestimaatti BGNL asetetaan arvoon Rl(0) riippumatta NACFrn arvosta.
15 Taustakohinaestimaattia BGNl kasvatetaan vain kun NACF on alle kynnysarvon TH1. Jos Rl(0) on suurempi kuin BGNl ja NACF on pienempi kuin TH1, niin taustakohinan teho BGNl asetetaan ai -BGNl, jossa ai suurempi luku kuin 1.
Esimerkkisovellutuksessa ai on yhtä suuri kuin 1.03. BGNl jatkaa kasvamistaan .·, niin kauan kun NACF on pienempi kuin kynnysarvo TH1 ja Rl(0) on suurempi ···· 20 kuin BGNL:n nykyinen arvo, kunnes BGNl saavuttaa ennalta määrätyn • · j***. maksimiarvon BGNmax, jossa vaiheessa taustakohinaestimaatti BGNl asetetaan ··· ***** BGNmax:ään.
» · · • · · ··· M· S..,· Jos audiosignaali tunnistetaan, sillä että NACF ylittää toisen kynnysarvon TH2, 25 silloin signaalienergiaestimaatti Sl päivitetään. Esimerkkisovellutuksessa TH2 \V asetetaan 0.5:ksi. RL(0):n arvoa verrataan nykyiseen alipäästösignaalin ··· • « *···* energiaestimaattiin Sl- Jos Rl(0) on suurempi kuin SLin nykyinen arvo, silloin Sl .,*·* asetetaan yhtä suureksi kuin Rl(0). Jos Rl(0) on pienempi kuin SL:n nykyinen arvo, silloin Sl asetetaan yhtä suureksi kuin a2-SL, jälleen vain jos NACF on 30 suurempi kuin TH2. Esimerkkisovellutuksessa a2 asetetaan 0.96:een.
»·· • · t « ··· 9
1 1908 S
Kynnyksen muunnoselementti 8 laskee seuraavaksi signaali-kohinasuhteen estimaatin alla olevan yhtälön 8 mukaan: sm, =io-log (8) L Lbgnl.
5
Kynnyksen sovituselementti 8 sitten määrittää kvantisoidun signaali-kohinasuhteen indeksin Isnrl alla olevan yhtälön 9-12 mukaisesti: ISML-*™t —L— , 20 <SURl < 55: lie , (9) 5 =0, Sm.Li 20: Ile (10) =7 SNRl 2 55 :Ue.
10 missä nint on funktio, joka pyöristää murtoarvon lähimpään kokonaislukuun.
Kynnyksen sovituselementti 8 seuraavaksi valitsee tai laskee kaksi ·*·*· skaalauskerrointa kn/2 ja ku^, signaali-kohinasuhteen indeksin Isnrl mukaisesti.
• ' · i * * * I 15 Esimerkki skaalausarvon etsintätaulukosta annetaan taulukossa 1 alla: ··· • · taulukko l ··· • · • · ··· !SNRL Kli/2 KLtäysi t · J·8·8 0 7.0 9.0 1 7.0 12.6 ..li* 2 8.0 17.0 ··· 3 8.6 18.5 4 8.9 19.4 C: 5 9.4 20.9 10 1 19085 6 11.0 25.5 7 15.8 39.8 Näitä kahta arvoa käytetään kynnysarvojen laskentaan nopeuden valintaa varten alla olevien yhtälöiden mukaisesti: 5 TLy2=KLm-BGNL, ja (11)
Ta1y« = Kwyst'BGNL (12) niissä Tli/2 on matalataajuisen puolinopeuden kynnysarvo ja
Tuäysi on matalataajuisen täysnopeuden kynnysarvo.
10
Kynnyksen sovituselementti 8 antaa sovitetut kynnysarvot TLi/2 ja Tuaysi nopeuden päätöselementtiin 12. Kynnyksen sovituselementti 10 toimii samalla tavalla ja antaa kynnysarvot Thi/2 ja Tntäysi alikaistan nopeuden päätöselementtiin 14.
15
Audiosignaalin energiaestimaatin alkuarvo S, jossa S voi olla joko Sl tai Sh, asetetaan seuraavasti. Alkusignaalin energiaestimaatti Salku asetetaan -18.0 * · dBm0:aan, missä 3.17 dBmO viittaa täyden siniaallon signaalivoimakkuuteen, ··» joka esimerkkisovellutuksessa on digitaalinen siniaalto amplitudialueella - *:**: 20 8031 :stä 8031 :een. Salku^ käytetään kunnes määrätään, että akustinen signaali ♦ · « M.1 on läsnä.
··· » · # # Menetelmä, jolla akustinen signaali alkuperäisesti tunnistetaan, on verrata NAGF- • · · • · · 1,1 arvoa kynnykseen, kun NACF ylittää kynnyksen ennalta määrätyllä määrällä • 1 • · ‘I1 25 peräkkäisiä kehyksiä, silloin määritetään akustisen signaalin olevan läsnä.
Φ ♦ · ···· Esimerkkisovellutuksessa NACF:n täytyy ylittää kynnys kymmenellä • · ***** peräkkäisellä kehyksellä. Tämän olosuhteen toteuduttua, signaalin ...!1 energiaestimaatti, S, asetetaan maksimisignaalienergiaan kymmenessä ··· • · · · · 1 edeltävässä kehyksessä.
π 119085
Taustakohinaestimaatin BGNl alkuarvo asetetaan alussa BGNmax:ään. Heti kun vastaanotetaan alikaistan kehysenergia, joka on alle BGNmax:n, taustakohinaestimaatti uudelleenasetetaan vastaanotetun alikaistan energiatason 5 arvoon, ja taustakohinan BGNl estimaatin generointi etenee aiemmin kuvatulla tavalla.
Edullisessa sovellutuksessa lievetila käynnistetään kun seurataan saqaa täyden nopeuden kehyksiä ja alemman nopeuden kehys tunnistetaan.
10 Esimerkkisovellutuksessa kun nelj ä perättäistä puhekehystä koodataan täydellä nopeudella seuraten kehystä, jossa KOODAUSNOPEUS on asetettu alle täyden nopeuden nopeuteen ja lasketut signaali-kohinasuhteet ovat alle ennalta määrätyn minimi SNR:n, KOODAUSNOPEUS tälle kehykselle asetetaan täydelle nopeudelle. Esimerkkisovellutuksessa ennalta määrätty minimi SNR on 27.5 15 dB: iä, kuten määritetään yhtälössä 8.
Edullisessa sovellutuksessa lievekehysten lukumäärä on signaali-kohinasuhteen funktio. Esimerkkisovellutuksessa lievekehysten määrä määritetään seuraavasti: • i* 20 #lievekehyksiä = 1 22.5<SNR<27.5 (13) • · · .***. #lievekehyksiä = 2 SNR<22.5 (14) ··· *:··; #lievekehyksiä = 0 SNR>27.5 (15) • « · • · t *·· • « · •,., · Lisäksi esillä oleva keksintö tuo esiin menetelmän, jolla tunnistetaan musiikin 25 läsnäolo, mistä puuttuu, kuten aiemmin kuvattiin, tauot, jotka mahdollistavat • » ♦ · · ' · V taustakohinan mittausten uudelleen asettamisen. Menetelmä musiikin läsnäolon ··· * ·; · * tunnistamiseksi olettaa, että musiikki ei ole läsnä puhelun alussa. Tämä mahdollistaa esillä olevan keksinnön mukaisen koodausnopeuden valintalaitteen "...! asianmukaisesti estimoida ja alustaa taustakohinan energia BGNaiku· Koska t . t) j * 30 musiikilla toisin kuin taustakohinalla on j aksollinen ominaisuus, esillä oleva ··· :; keksintö tutkii NACF :n arvon erottaakseen musiikin taustakohinasta. Esillä 12 1 19085 olevan keksinnön mukainen musiikin tunnistusmenetelmä laskee keskimääräisen NACF:n alla olevan yhtälön mukaisesti: NACF^^^NACFii) (16)
l M
5 missä NACF on määritetty yhtälössä 7, ja missä T on peräkkäisten kehysten määrä, joissa taustakohinan estimoitu arvo on kasvanut alkuperäisestä taustakohinan estimaatista BGNalku· 10 Jos taustakohina BGN on kasvanut ennalta määrätylle määrälle kehyksiä T ja NACFkesk ylittää ennalta määrätyn kynnyksen, niin musiikki tunnistetaan ja taustakohina BGN uudelleenasetaan arvoon BGNaiku· On huomattava, että ollakseen tehokas arvo T on asetettava riittävän alhaiseksi niin, että koodausnopeus ei putoa alle täyden nopeuden. Sen vuoksi T:n arvo tulisi asettaa , 15 akustisen signaalin ja BGNaiku:n funktiona.
Edellä oleva edullisten sovellutusten kuvaus annetaan, jotta ammattimies voisi , käyttää tai valmistaa esillä olevan keksinnön mukaista laitetta. Näiden sovellutusten • ft 9 eri modifikaatiot ovat helposti alan ammattimiehille ilmeisiä ja tässä kuvatut yleiset · t 20 periaatteet ovat sovellettavissa muihin sovellutuksiin käyttämättä keksimiskykyä.
• ·
Ml ,,., j Näin ollen esillä olevaa keksintöä ei ole tarkoitettu raj ata tässä esitettyihin . . 1. sovellutuksiin vaan sille tulee suoda laaj in piiri, j oka on yhdenmukainen tässä ··· • 1 1 1 · esitettyj en periaatteiden j a uusien piirteiden kanssa.
* · · :Y: 25 VAADIMME: • 9 ··· • · • · ··♦ 9 ··· Φ *«·· ··· 30 M • · 9 9 • 99 9 9 999 9 9999

Claims (10)

13 1 19085
1. Menetelmä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, tunnettu siitä, että käsittää: 5 asetetaan havaintakynnys perustuen tulosignaalin signaalikohinasuhteen (SNR) arvioon, jossa SNR:n signaalienergia arvioidaan maksimisignaalienergiaksi aktiivisen puheen aikana; ja käytetään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta. 10
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että SNR:n taustako-hinaenergiaksi arvioidaan minimisignaalienergia hiljaisuuden aikana.
3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että havaintakynnysten 15 asettamisvaihe käsittää: määritetään tulosignaalin SNR:n indeksi; käytetään SNR:n indeksiä valitsemaan tai laskemaan ensimmäinen skaalausker-roin ja toinen kerroin; käytetään ensimmäistä skaalauskerrointa ja toista skaalauskerrointa laskemaan ··· •••t 20 matalan taajuuden kynnysarvo ja korkean taajuuden kynnysarvo. · • · · • * · • * e·· • · • ·
4. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että vaihe, jossa käyte- • · tään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali • · · *" vai hiljaisuutta, käsittää: • · φ • * 25 suodatetaan tulosignaali lineaarisen ennustavan koodauksen (LPC) suodattimel- . . la, jotta saadaan formanttijäännössignaali, ja • » · • * .·**. verrataan normalisoitua formanttijäännössignaalin autokorrelaatiofunktiota ha- ·*· * •# vamtakynnyksim. * · · ···· ··· • · • # ·*· *. 30
5. Patenttivaatimusten 2 ja 4 mukainen menetelmä, tunnettu siitä, että formanttijään- ·· **" nössignaalin normalisoidun autokorrelaatiofimktion vertaaminen havaintakynnyksiin *···* käsittää: m 119085 verrataan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota ensimmäiseen kynnykseen; päivitetään taustakohinan energia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on vähemmän kuin ensimmäinen kynnys; 5 verrataan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota toi seen kynnykseen, jossa toinen kynnys on korkeampi kuin ensimmäinen kynnys; päivitetään signaalienergia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on suurempi kuin toinen kynnys; ja käytetään päivitettyä taustakohinan energia-arviota ja päivitettyä signaaliener-10 gia-arviota määrittämään onko tulosignaalissa audiosignaali vai hiljaisuutta.
6. Laite havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, tunnettu siitä, että laite käsittää: välineet asettamaan havaintakynnykset perustaen tulosignaalin signaaliko-15 hinasuhteen (SNR) arvioon, jossa SNR:n signaalienergia arvioidaan maksi- misignaalienergiaksi aktiivisen puheen aikana; ja välineet käyttämään havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta. ·:· 20
7. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että SNR:n taustakohinan ener- • · · · • V; gia arvioidaan minimisignaalienergiaksi hiljaisuuden aikana.
• · • · · • · • * • ·· * * 8. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että välineet asettamaan havain- •. i. · takynnykset on lisäksi konfiguroita: ··· • · * * · * * 25 määrittämään tulosignaalin SNR:n indeksi; . . käyttämään SNR:n indeksiä valitsemaan tai laskemaan ensimmäinen skaalaus- * ] · kerroin ja toinen kerroin; • · • · *·* käyttämään ensimmäistä skaalauskerrointa ja toista skaalauskerrointa laskemaan • * * .·.: matalan taajuuden kynnysarvo ja korkean taajuuden kynnysarvo. ·*· • · **:*’ 30
··· ···· 9. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että välineet käyttämään *... * havaintakynnyksiä havaitsemaan onko tulosignaalin kehyksessä audiosignaali vai hiljaisuutta, on lisäksi konfiguroita: 15 119085 suodattamaan tulosignaali lineaarisen ennustavan koodauksen (LPC) suodattimena, jotta saadaan formanttijäännössignaali; ja vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota havaintakynnyksiin. 5
10. Patenttivaatimuksen 9 mukainen laite, tunnettu siitä, että välineet vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota havaintakynnyksiin, on lisäksi konfiguroitu: vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota 10 ensimmäiseen kynnykseen; päivittämään taustakohinan energia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on pienempi kuin ensimmäinen kynnys; vertaamaan formanttijäännössignaalin normalisoitua autokorrelaatiofunktiota toiseen kynnykseen, jossa toinen kynnys on korkeampi kuin ensimmäinen kyn-15 nys; päivittämään signaalienergia-arvio, jos formanttijäännössignaalin normalisoitu autokorrelaatiofunktio on suurempi kuin toinen kynnys; ja käyttämään päivitettyä taustakohinan energia-arviota ja päivitettyä signaaliener-gia-arviota määrittämään onko tulosignaalissa audiosignaali vai hiljaisuutta. 20 ««·« • · • · · • · · • · • · · • 1 • · • · 1 *··1 • · • 1 « • · · • 1 · : 2 3: 25 *·· • · • t » • · · • · • · • « • · · · · · 2 *··· 3 • · • · • · · * **· • · · · • · · • · • · • · · 16 PATENTKRAV 1 1 9085
FI20061084A 1994-08-10 2006-12-07 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa FI119085B (fi)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US28841394 1994-08-10
US08/288,413 US5742734A (en) 1994-08-10 1994-08-10 Encoding rate selection in a variable rate vocoder
US9509830 1995-08-01
PCT/US1995/009830 WO1996005592A1 (en) 1994-08-10 1995-08-01 Method and apparatus for selecting an encoding rate in a variable rate vocoder

Publications (2)

Publication Number Publication Date
FI20061084A FI20061084A (fi) 2006-12-07
FI119085B true FI119085B (fi) 2008-07-15

Family

ID=23106989

Family Applications (5)

Application Number Title Priority Date Filing Date
FI961112A FI117993B (fi) 1994-08-10 1996-03-08 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050704A FI122272B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050702A FI122273B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050703A FI123708B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20061084A FI119085B (fi) 1994-08-10 2006-12-07 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa

Family Applications Before (4)

Application Number Title Priority Date Filing Date
FI961112A FI117993B (fi) 1994-08-10 1996-03-08 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050704A FI122272B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050702A FI122273B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
FI20050703A FI123708B (fi) 1994-08-10 2005-07-01 Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa

Country Status (20)

Country Link
US (1) US5742734A (fi)
EP (6) EP1703493B1 (fi)
JP (8) JP3502101B2 (fi)
KR (3) KR20040004420A (fi)
CN (5) CN1512488A (fi)
AT (5) ATE386321T1 (fi)
AU (1) AU711401B2 (fi)
BR (2) BR9510780B1 (fi)
CA (3) CA2171009C (fi)
DE (5) DE69535452T2 (fi)
DK (3) DK1239465T4 (fi)
ES (5) ES2240602T5 (fi)
FI (5) FI117993B (fi)
HK (2) HK1015185A1 (fi)
IL (1) IL114874A (fi)
MX (1) MX9600920A (fi)
PT (3) PT1233408E (fi)
TW (1) TW277189B (fi)
WO (1) WO1996005592A1 (fi)
ZA (1) ZA956081B (fi)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389010B1 (en) 1995-10-05 2002-05-14 Intermec Ip Corp. Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones
US7924783B1 (en) 1994-05-06 2011-04-12 Broadcom Corporation Hierarchical communications system
TW271524B (fi) 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6292476B1 (en) * 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
JPH09162837A (ja) * 1995-11-22 1997-06-20 Internatl Business Mach Corp <Ibm> 圧縮方式を動的に変更する通信方法及び装置
JPH09185397A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6510208B1 (en) * 1997-01-20 2003-01-21 Sony Corporation Telephone apparatus with audio recording function and audio recording method telephone apparatus with audio recording function
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
DE19742944B4 (de) * 1997-09-29 2008-03-27 Infineon Technologies Ag Verfahren zum Aufzeichnen eines digitalisierten Audiosignals
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6463407B2 (en) * 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
EP1177668A2 (en) * 1999-05-10 2002-02-06 Nokia Corporation Header compression
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
US6745012B1 (en) * 2000-11-17 2004-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive data compression in a wireless telecommunications system
US7120134B2 (en) * 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
KR100754439B1 (ko) 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
CN1295678C (zh) * 2004-05-18 2007-01-17 中国科学院声学研究所 子带自适应谷点降噪系统和方法
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
KR100757858B1 (ko) * 2005-09-30 2007-09-11 와이더댄 주식회사 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP4065314B2 (ja) * 2006-01-12 2008-03-26 松下電器産業株式会社 対象音分析装置、対象音分析方法および対象音分析プログラム
EP1989702A4 (en) * 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL
US8204754B2 (en) * 2006-02-10 2012-06-19 Telefonaktiebolaget L M Ericsson (Publ) System and method for an improved voice detector
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
CN100483509C (zh) * 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
CN101217037B (zh) * 2007-01-05 2011-09-14 华为技术有限公司 对音频信号的编码速率进行源控的方法和系统
JPWO2009038170A1 (ja) * 2007-09-21 2011-01-06 日本電気株式会社 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム
WO2009038115A1 (ja) * 2007-09-21 2009-03-26 Nec Corporation 音声符号化装置、音声符号化方法及びプログラム
US20090099851A1 (en) * 2007-10-11 2009-04-16 Broadcom Corporation Adaptive bit pool allocation in sub-band coding
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
US8805694B2 (en) * 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
EP2491549A4 (en) 2009-10-19 2013-10-30 Ericsson Telefon Ab L M DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY
US9047878B2 (en) * 2010-11-24 2015-06-02 JVC Kenwood Corporation Speech determination apparatus and speech determination method
WO2012081166A1 (ja) * 2010-12-14 2012-06-21 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8990074B2 (en) 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
CN110265058B (zh) * 2013-12-19 2023-01-17 瑞典爱立信有限公司 估计音频信号中的背景噪声
US9564136B2 (en) 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
PL3125242T3 (pl) * 2014-03-24 2018-12-31 Nippon Telegraph & Telephone Sposób kodowania, koder, program i nośnik zapisu
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
US9870780B2 (en) * 2014-07-29 2018-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
KR101619293B1 (ko) 2014-11-12 2016-05-11 현대오트론 주식회사 전원 반도체의 제어 방법 및 제어 장치
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
CN110992963B (zh) * 2019-12-10 2023-09-29 腾讯科技(深圳)有限公司 网络通话方法、装置、计算机设备及存储介质
CN113611325B (zh) * 2021-04-26 2023-07-04 珠海市杰理科技股份有限公司 基于清浊音实现的语音信号变速方法、装置和音频设备

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (fi) * 1973-06-15 1975-02-25
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (fi) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
DE3412430A1 (de) * 1984-04-03 1985-10-03 Nixdorf Computer Ag, 4790 Paderborn Schalteranordnung
EP0167364A1 (en) * 1984-07-06 1986-01-08 AT&T Corp. Speech-silence detection with subband coding
FR2577084B1 (fr) * 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
JPS6491200A (en) * 1987-10-02 1989-04-10 Fujitsu Ltd Voice analysis system and voice synthesization system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4897832A (en) 1988-01-18 1990-01-30 Oki Electric Industry Co., Ltd. Digital speech interpolation system and speech detector
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
KR0161258B1 (ko) * 1988-03-11 1999-03-20 프레드릭 제이 비스코 음성활동 검출 방법 및 장치
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
CA1321645C (en) * 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
EP0392126B1 (en) * 1989-04-11 1994-07-20 International Business Machines Corporation Fast pitch tracking process for LTP-based speech coders
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JP3004664B2 (ja) * 1989-12-21 2000-01-31 株式会社東芝 可変レート符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
JPH04100099A (ja) * 1990-08-20 1992-04-02 Nippon Telegr & Teleph Corp <Ntt> 音声検出装置
JPH04157817A (ja) * 1990-10-20 1992-05-29 Fujitsu Ltd 可変レート符号化装置
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
EP1675100A2 (en) * 1991-06-11 2006-06-28 QUALCOMM Incorporated Variable rate vocoder
DE69217590T2 (de) * 1991-07-31 1997-06-12 Matsushita Electric Ind Co Ltd Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals
JP2705377B2 (ja) * 1991-07-31 1998-01-28 松下電器産業株式会社 帯域分割符号化方法
US5410632A (en) 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
JP3088838B2 (ja) * 1992-04-09 2000-09-18 シャープ株式会社 音楽検出回路及び該回路を用いた音声信号入力装置
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5644596A (en) 1994-02-01 1997-07-01 Qualcomm Incorporated Method and apparatus for frequency selective adaptive filtering
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6134215A (en) 1996-04-02 2000-10-17 Qualcomm Incorpoated Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel

Also Published As

Publication number Publication date
US5742734A (en) 1998-04-21
KR100455826B1 (ko) 2005-04-06
DK1233408T3 (da) 2005-01-24
CN100508028C (zh) 2009-07-01
DE69534285D1 (de) 2005-07-21
BR9510780B1 (pt) 2011-05-31
EP1530201A2 (en) 2005-05-11
JP2004046228A (ja) 2004-02-12
CN1168071C (zh) 2004-09-22
WO1996005592A1 (en) 1996-02-22
CA2171009C (en) 2006-04-11
ES2299122T3 (es) 2008-05-16
ES2233739T3 (es) 2005-06-16
FI20061084A (fi) 2006-12-07
JP2011209733A (ja) 2011-10-20
CN1320521C (zh) 2007-06-06
FI122273B (fi) 2011-11-15
EP1239465B2 (en) 2010-02-17
JP2007293355A (ja) 2007-11-08
EP0728350A1 (en) 1996-08-28
CN1945696A (zh) 2007-04-11
ES2281854T3 (es) 2007-10-01
EP1703493B1 (en) 2008-02-13
CN1512487A (zh) 2004-07-14
IL114874A (en) 1999-03-12
DE69535709T2 (de) 2009-02-12
EP1703493A3 (en) 2007-02-14
HK1015185A1 (en) 1999-10-08
MX9600920A (es) 1997-06-28
KR960705305A (ko) 1996-10-09
DE69534285T2 (de) 2006-03-23
AU3275195A (en) 1996-03-07
EP1239465A3 (en) 2002-09-18
DE69535452D1 (de) 2007-05-16
PT1233408E (pt) 2005-05-31
KR20040004420A (ko) 2004-01-13
CA2488918C (en) 2011-02-01
KR20040004421A (ko) 2004-01-13
FI20050704A (fi) 2005-07-01
DE69533881T2 (de) 2006-01-12
JP2007304604A (ja) 2007-11-22
EP1233408B1 (en) 2004-12-22
EP1233408A1 (en) 2002-08-21
JP4680956B2 (ja) 2011-05-11
PT1239465E (pt) 2005-09-30
CA2488921C (en) 2010-09-14
EP0728350B1 (en) 2003-03-26
EP1424686A3 (en) 2006-03-22
CN1131473A (zh) 1996-09-18
JP4870846B2 (ja) 2012-02-08
PT728350E (pt) 2003-07-31
EP1239465B1 (en) 2005-06-15
ATE235734T1 (de) 2003-04-15
TW277189B (fi) 1996-06-01
CA2488921A1 (en) 1996-02-22
DE69535709D1 (de) 2008-03-27
DE69533881D1 (de) 2005-01-27
ES2194921T3 (es) 2003-12-01
FI20050703A (fi) 2005-07-01
FI117993B (fi) 2007-05-15
ZA956081B (en) 1996-03-15
FI961112A (fi) 1996-04-12
EP1424686A2 (en) 2004-06-02
ES2240602T5 (es) 2010-06-04
JP2007304606A (ja) 2007-11-22
DK0728350T3 (da) 2003-06-30
JP3502101B2 (ja) 2004-03-02
AU711401B2 (en) 1999-10-14
DE69535452T2 (de) 2007-12-13
DE69534285T3 (de) 2010-09-09
HK1077911A1 (en) 2006-02-24
CA2171009A1 (en) 1996-02-22
ATE298124T1 (de) 2005-07-15
EP1239465A2 (en) 2002-09-11
IL114874A0 (en) 1995-12-08
DK1239465T4 (da) 2010-05-31
ATE386321T1 (de) 2008-03-15
ATE285620T1 (de) 2005-01-15
EP1530201B1 (en) 2007-04-04
DK1239465T3 (da) 2005-08-29
JP4680957B2 (ja) 2011-05-11
JPH09504124A (ja) 1997-04-22
CN1512488A (zh) 2004-07-14
DE69530066D1 (de) 2003-04-30
JP2004004971A (ja) 2004-01-08
JP4680958B2 (ja) 2011-05-11
JP3927159B2 (ja) 2007-06-06
JP2007304605A (ja) 2007-11-22
DE69530066T2 (de) 2004-01-29
FI123708B (fi) 2013-09-30
KR100455225B1 (ko) 2004-11-06
BR9506036A (pt) 1997-10-07
ATE358871T1 (de) 2007-04-15
FI122272B (fi) 2011-11-15
CA2488918A1 (en) 1996-02-22
CN1512489A (zh) 2004-07-14
ES2240602T3 (es) 2005-10-16
FI961112A0 (fi) 1996-03-08
EP1530201A3 (en) 2005-08-10
FI20050702A (fi) 2005-07-01
EP1703493A2 (en) 2006-09-20

Similar Documents

Publication Publication Date Title
FI119085B (fi) Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
KR960705306A (ko) 감소된 비율의 가변 비율 보코딩을 수행하기 위한 방법 및 장치(method and apparatus for performing reduced rate variable rate vocoding)
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
WO2006014924A2 (en) Method and system for improving voice quality of a vocoder
KR100263296B1 (ko) G.729 음성 부호화기를 위한 음성 활성도 측정 방법
JPH0832526A (ja) 音声検出器

Legal Events

Date Code Title Description
MA Patent expired