SE501305C2 - Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler - Google Patents

Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler

Info

Publication number
SE501305C2
SE501305C2 SE9301798A SE9301798A SE501305C2 SE 501305 C2 SE501305 C2 SE 501305C2 SE 9301798 A SE9301798 A SE 9301798A SE 9301798 A SE9301798 A SE 9301798A SE 501305 C2 SE501305 C2 SE 501305C2
Authority
SE
Sweden
Prior art keywords
stationary
signal
background sound
buffer
energy
Prior art date
Application number
SE9301798A
Other languages
English (en)
Other versions
SE9301798L (sv
SE9301798D0 (sv
Inventor
Karl Torbjoern Wigren
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9301798A priority Critical patent/SE501305C2/sv
Publication of SE9301798D0 publication Critical patent/SE9301798D0/sv
Priority to NZ266908A priority patent/NZ266908A/en
Priority to NZ286953A priority patent/NZ286953A/en
Priority to CN94190318A priority patent/CN1046366C/zh
Priority to RU95107694A priority patent/RU2127912C1/ru
Priority to PCT/SE1994/000443 priority patent/WO1994028542A1/en
Priority to DK94917227T priority patent/DK0653091T3/da
Priority to CA002139628A priority patent/CA2139628A1/en
Priority to SG1996000608A priority patent/SG46977A1/en
Priority to TW083104232A priority patent/TW324123B/zh
Priority to JP7500526A priority patent/JPH07509792A/ja
Priority to AU69016/94A priority patent/AU670383B2/en
Priority to KR1019950700299A priority patent/KR100220377B1/ko
Priority to DE69421498T priority patent/DE69421498T2/de
Priority to ES94917227T priority patent/ES2141234T3/es
Priority to EP94917227A priority patent/EP0653091B1/en
Priority to US08/248,714 priority patent/US5579432A/en
Publication of SE9301798L publication Critical patent/SE9301798L/sv
Publication of SE501305C2 publication Critical patent/SE501305C2/sv
Priority to FI950311A priority patent/FI950311A0/sv
Priority to AU48112/96A priority patent/AU681551B2/en
Priority to CN97101022A priority patent/CN1218945A/zh
Priority to HK98115224A priority patent/HK1013881A1/xx
Priority to GR990403198T priority patent/GR3032107T3/el

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Complex Calculations (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Circuits Of Receivers In General (AREA)

Description

15 20 25 30 501 305 2 de för talsignaler. En lyssnare på den andra sidan av kommunika- tionslänken kan lätt bli irriterad av att välkända bakgrundsljud ej kan identifieras, eftersom de har "felbehandlats" av kodaren.
Enligt svenska patentansökan 93 00290-5, vilken härmed införlivas genom hänvisning, löses detta problem genom detektering av förekomsten av bakgrundsljud i signalen som mottagits av kodaren och modifiering av beräkningen av filterparametrarna i enlighet med en viss sàkallad "anti-swirling"-algoritm om signalen domineras av bakgrundsljud.
Man har dock funnit att olika bakgrundsljud ej har samma statistiska karaktär. En typ av'bakgrundsljud, t.ex. bilbrus, kan karaktäriseras såsom varande stationärt. En annan typ, t.ex. bakgrundsprat, kan karaktäriseras såsom varande icke stationärt.
Experiment har visat att den nämnda anti-swirling-algoritmen fungerar bra för stationärt men ej för icke stationärt bak- grundsljud. Det vore därför önskvärt att diskriminera mellan stationärt och icke stationärt bakgrundsljud, så att anti- swirling-algoritmen kan förbigàs om bakgrundsljudet är icke- stationärt.
SUMERING AV UPPFINNINGEN Ett syftemál för uppfinningen är ett förfarande för detektering och kodning och/eller avkodning av stationära bakgrundsljud i en digital rambaserad talkodare och/eller avkodare inkluderande en signalkälla ansluten till ett filter, varvid filtret definieras av en uppsättning filterparametrar för varje ram, i och för reproducering av den signal som skall kodas och/eller avkodas.
I enlighet med uppfinningen innefattar ett sådant förfarande: (a) detektering av huruvida signalen som leds till koda- ren/avkodaren representerar primärt tal eller bakgrunds- ljud; 10 15 20 25 (b) (O) 501 305 s om signalen som leds till kodaren/avkodaren represente- rar primärt bakgrundsljud, detektering av huruvida detta bakgrundsljud är stationärt; och om signalen är stationär, begränsning av tidsvariationen mellan pà varandra följande ramar och/eller domänen av åtminstone vissa filterparametrar i uppsättningen.
Ytterligare ett syftemàl för uppfinningen är en anordning för kodning och/eller avkodning av stationärt bakgrundsljud i en digital rambaserad talkodare och/eller avkodare inkluderande en signalkälla ansluten till ett filter, varvid filtret definieras av en uppsättning filterparametrar för varje ram, i och för reproducering av den signal som skall kodas och/eller avkodas.
Enligt uppfinningen innefattar denna anordning: (a) (b) (c) organ för detektering av huruvida signalen som leds till kodaren/avkodaren representerar primärt tal eller bakgrundsljudï organ för detektering av, 1 det fall att signalen som leds till kodaren/avkodaren representerar primärt bakgrundsljud, huruvida bakgrundsljudet är stationärt; och organ för begränsning av tidsvariationen mellan på varandra följande ramar och/eller domänen av åtminstone vissa filterparametrar i uppsättningen i det fall att signalen som leds till kodaren/avkodaren representerar stationärt bakgrundsljud.
KORT BESKRIVNING AV RITNINGARNA Uppfinningen samt ytterligare syften och fördelar som uppnås med denna förstås bäst genom hänvisning till nedanstående beskrivning och de bifogade ritningarna, i vilka: 10 15 20 25 30 501 305 4 Figur 1 är ett blockschema av en talkodare försedd med organ för utförande av förfarandet i enlighet med föreliggande uppfinning; Figur 2 är ett blockschema av en talavkodare försedd med organ för utförande av förfarandet i enlighet med föreliggande uppfinning; Figur 3 är ett blockschema av en signaldiskriminator som kan användas i talkodaren enligt fig. 1; och Figur 4 är ett blockschema av en föredragen signaldiskriminator som kan användas i talkodaren enligt fig. 1.
DETALJERAD BESKRIVNING AV FÖREDRAGNA UTFÖRINGSFORMER Uppfinningen kommer att beskrivas under hänvisning till detekte- ring av stationaritet av signaler som representerar bakgrundsljud i ett mobilradiosystem.
Pá en ingàngsledning 10 matas en insignal s(n) i talkodaren i fig. 1 till en filterestimator 12, som estimerar filterparamet- rarna i enlighet med standardiserade procedurer (Levinson-Burnin- algoritmen, Burg-algoritmen, Cholesky-dekomposition (Rabiner, kapitel 8, Prentice-Hall, 1978), Schur-algoritmen (Strobach: "New Forms of Schafer: "Digital Processing of Speech Signals“, Levinson and Schur Algorithms", IEEE SP Magazine, januari 1991, sid. 12-36), Fixed Point Computation of Partial Correlation Coefficients", Le Roux-Gueguen-algoritmen (Le Roux, Gueguen: “A IEEE Transactions of Acoustics, Speech and Signal Processing", vol. ASSP-26, nr. 3, sid. 257-259, 1977), den såkallade FLAT- algoritmen som beskrivs i amerikanska patentet 4 544 919 i namnet Motorola Inc.). Filterestimatorn 12 utmatar filterparametrar för varje ram. Dessa filterparametrar leds till en excitationsanaly- sator 14, vilken även mottager insignalen. på ledningen 10.
Excitationsanalysatorn 14 bestämmer bästa käll- eller excita- tionsparametrar i enlighet med standardprocedurer. Exempel pà 10 15 20 25 30 501 305 5 sådana procedurer är VSELP (Gerson, Jasiuk: "Vector Sum Excited Linear Prediction (VSELP)", i Atal et al, red., "Advances in Speech Coding", Kluwer Academic Publishers, 1991, sid. 69-79), TBPE (Salami, “Binary Pulse Excitation: A Novel Approach to Low Complexity CELP Coding", sid. 145-156 i föregående referens), stokastisk handbok (Campbell et al: "The DoD4.8 KBPS Standard (Proposed Federal Standard 1016)", sid. 121-134 i föregående referens), ACELP (Adoul, Lamblin: "A Comparison of Some Algebraic Structures for CELP Coding of Speech", Proc. International Conference on Acoustics, Speech and Signal Processing 1987, sid. 1953-1956). Dessa excitationsparametrar, filterparametrarna och insignalen på ledningen 10 matas till en taldetektor 16. Denna detektor 16 bestämmer huruvida insignalen primärt består av tal eller bakgrundsljud. En möjlig detektor utgöres t.ex. av den röstaktivitetsdetektor som definieras i GSM-systemet (Voice Activity Detection, GSM-recommendation 06.32, ETSI/PT 12). En lämplig detektor beskrivs i EP,A,335 521 (BRITISH TELECOM PLC).
Taldetektorn 16 alstrar en utsignal S/B indikerande huruvida kodar-insignalen primärt innehåller tal eller ej. Denna utsignal tillsammans med filterparametrarna matas till en parametermodifi- erare 18 via en signaldiskriminator 24.
I enlighet med ovanstående svenska patentansökan modifierar parametermodifieraren 18 de bestämda filterparametrarna i det fall att ingen talsignal förekommer i insignalen till kodaren. Om en talsignal förekommer passerar filterparametrarna genom parametermodifieraren 18 utan förändring. De eventuellt ändrade filterparametrarna och. excitationsparametrarna matas till en kanalkodare 20, vilken alstrar den bitström som sänds över kanalen på ledningen 22.
Parametermodifieringen i parametermodifieraren 18 kan utföras på flera sätt.
En möjlig modifiering är en bandbreddsexpansion av filtret. Detta innebär att filtrets poler flyttas mot origo i komplexa planet. 10 15 20 25 501 305 6 Antag att det ursprungliga filtret H(z)=l/A(z) är givet av uttrycket A(z) = 1 + šïamzm m=l Om polerna flyttas med en faktor r, O 5 r 5 1, definieras den bandbreddsexpanderade versionen av A(z/r), eller: H Aug) = 1 + E (amrm)z'”' m' 1 En annan möjlig modifiering är lågpassfiltrering av filterpara- metrarna i. tidsdomänen. Det vill säga, snabba variationer av filterparametrarna från ram till ram dämpas genom làgpass- filtrering av åtminstone vissa filterparametrar. Ett specialfall av denna metod är medelvärdesbildning av filterparametrarna över flera ramar, t.ex. 4-5 ramar.
Parametermodifieraren 18 kan även använda en kombination av dessa två metoder, t.ex. utföra en bandbreddsexpansion följd av en Det är även möjligt att börja med làgpass- filtrering och sedan addera bandbreddsexpansionen. lågpassfiltrering.
I ovanstående beskrivning har signaldiskriminatorn 24 ignorerats.
Man har dock funnit att det ej är tillräckligt att uppdela signaler i signaler representerande tal och bakgrundsljud, eftersom bakgrundsljud ej alltid behöver ha samma statistiska karaktär, såsom förklarats ovan. Sålunda uppdelas signaler representerande bakgrundsljud i stationära och icke stationära signaler i signaldiskriminatorn 24, vilket kommer att förklaras ytterligare under hänvisning till fig. 3 och 4. Utsignalen på ledningen 26 från signaldiskriminatorn 24 indikerar därför huruvida ramen som skall kodas innehåller stationärt bakgrunds- ljud, varvid parametermodifieraren 18 utför ovanstående parame- termodifiering, eller tal/icke stationärt bakgrundsljud, varvid ingen modifiering utföres. 10 15 20 25 30 501 305 7 I ovanstående förklaring har det antagits att parametermodifie- ringen utföres i kodaren i sändaren. Det inses dock att en liknande procedur även kan utföras i avkodaren i mottagaren.
Detta illustreras av utföringsformen som visas i fig. 2.
I fig. 2 mottages en bitström från kanalen på ingångsledningen 30. Denna bitström avkodas av kanalavkodaren 32. Kanalavkodaren 32 utmatar filterparametrar och excitationsparametrar. I detta fall antages att dessa parametrar ej har modifierats i kodaren i sändaren. Filter- och excitationsparametrarna matas till en taldetektor 34, vilken analyserar dessa parametrar för faststäl- lande av huruvida den signal som skulle reproduceras av dessa parametrar innehåller en talsignal eller ej. Utsignalen S/B från taldetektorn 34 leds via signaldiskriminatorn 24' till en parametermodifierare 36, vilken också mottager filterparametrar- na.
I enlighet med ovanstående svenska patentansökan utför parameter- modifieraren 36 en modifiering liknande modifieringen som utföres av parametermodifieraren 18 i fig. 2 i det fall att taldetektorn 34 har fastställt att ingen talsignal förekommer i den mottagna signalen. Om en talsignal förekommer sker ingen modifiering. De eventuellt modifierade filterparametrarna och excitationsparamet- rarna matas till en talavkodare 38, vilken alstrar en syntetisk utsignal pà ledningen 40. Talavkodaren138 använder~excitationspa- rametrarna för att generera de ovan nämnda källsignalerna och de eventuellt modifierade filterparametrarna för att definiera filtret i källa-filter-modellen.
Såsom vid kodaren i fig. 1 diskriminerar signaldiskriminatorn 24' mellan stationära och icke stationära bakgrundslj ud. Endast ramar innehållande stationärt bakgrundsljud kommer därför att aktivera parametermodifieraren 36. I detta fall har dock signaldiskrimina- torn 24' ej tillgång till själva talsignalen s(n), utan endast till de excitationsparametrar som definierar denna signal. 10 15 20 25 501 305 8 Diskrimineringsprocessen kommer att beskrivas ytterligare under hänvisning till fig. 3 och 4.
Fig. 3 visar ett blockschema av signaldiskriminatorn 24 i fig. 1.
Diskriminatorn 24 mottager insignalen s(n) och utsignalen S/B från taldetektorn 16. Signalen S/B matas till en omkopplare SW.
Om taldetektorn 16 har fastställt att signalen s(n) primärt innehåller tal, intager omkopplaren SW det övre läget, i vilket fall signalen S/B direkt matas till diskriminatorns 24 utgång.
Om signalen s(n) primärt innehåller bakgrundsljud befinner sig omkopplaren SW i sitt nedre läge, och matas signalerna S/B och s(n) båda till ett kalkylatororgan 50, som estimerar energin E(T¿) i varje ram. Här kan T, beteckna tidslängden för ram i. I en fördragen utföringsform innehåller dock Tisampel från två på varandra följande ramar och betecknar E(T1) den totala energin för dessa ramar. I denna föredragna utföringsform skiftas nästa fönster T,d en talram, så att det innehåller en ny ram och en ram från det föregående fönstret T,. Fönstren överlappar därför en ram. Energin kan t.ex. estimeras i enlighet med formeln: .E(I}) = 2: s(n)2 :,e13 där s(n) = S(tn).
Energiestimaten E(T,) lagras i en buffert 52. Denna buffert kan t.ex. innehålla 100-200 energiestimat från 100-200 ramar. När ett nytt estimat når bufferten 52 stryks det äldsta estimatet från bufferten. Bufferten 52 innehåller därför alltid de N senaste energiestimaten, där N är buffertstorleken.
Därefter matas energiestimaten från bufferten 52 till ett kalkylatororgan 54, som beräknar en testvariabel V, i enlighet med formeln: 10 15 20 25 501 305 max E(T¿) V = T1GT T min E(Ti) :ger där T är den ackumulerade tidsperioden för alla (eventuellt överlappande) tidsfönster Ti. T har normalt fix längd, t.ex. 100- 200 talramar eller 2-4 sekunder. Uttryckt i ord är V., det största energiestimatet i tidsperioden T dividerat med det minsta energiestimatet inom samma tidsperiod. Denna testvariabel V., utgör ett estimat på energivariationen inom de sista N ramarna.
Detta estimat används senare för bestämning av signalens stationaritet. Om signalen är stationär kommer dess energi att variera mycket litet från ram till ram, vilket innebär att test- variabeln V, kommer att vara nära l. För en icke stationär signal kommer energin att variera avsevärt från ram till ram, vilket innebär att estimatet kommer att vara väsentligt större än 1.
Testvariabeln V., matas till en komparator 56, i vilken den jämförs med en stationaritetsgräns y. Om V., överskrider 'y indikeras en icke stationär signal på utgångsledningen 26. Detta indikerar att filterparametrarna ej bör modifieras. Ett lämpligt värde på 'y har visat sig vara 2-5, i synnerhet 3-4.
Av ovanstående beskrivning framgår att för detektering av huruvida en ram innehåller tal är det endast nödvändigt att beakta denna särskilda ram, vilket utföres i taldetektorn 16. Om det konstaterats att ramen ej innehåller tal blir det däremot nödvändigt att ackumulera energiestimat från ramar som omger ramen ifråga för utförande av en stationaritetsdiskriminering.
Sålunda erfordras en buffert med N lagringspositioner, där N > 2 och vanligen av storleksordningen 100-200. Denna buffert kan också lagra ett ramnummer för varje energiestimat.
När testvariabeln V, har testats och ett beslut har gjorts i komparatorn 56 produceras nästa energiestimat i kalkylatororganet 50 och skiftas detta in i bufferten 52, varefter en ny testvaria- 10 15 20 25 30 501 305 10 bel V, beräknas och jämförs med y i komparatorn 56. Pá detta sätt skiftas tidsfönstret T en ram framåt i tiden.
I ovanstående beskrivning har det antagits att när taldetektorn 16 har detekterat en ram innehållande bakgrundsljud, så kommer den att fortsätta att detektera bakgrundsljud i de följande ramarna för ackumulering av tillräckligt många energiestimat i bufferten 52 för bildande av en testvariabel VT. Det finns dock situationer i vilka taldetektorn 16 skulle kunna detektera ett fåtal ramar innehållande bakgrundsljud och sedan några ramar innehållande tal, följt avjramar innehållande nytt bakgrundsljud.
Av detta skäl lagrar bufferten 52 energivärden i "effektiv tid", vilket innebär att energivärdena endast beräknas och lagras för ramar innehållande bakgrundsljud. Detta är även skälet till att varje energiestimat bör lagras med sitt motsvarande ramnununer, eftersom detta ger en mekanism för fastställande av att ett energivärde är alltför gammalt för att vara relevant om inget bakgrundsljud har förekommit under lång tid.
En annan situation som kan inträffa är då det förekommer en kort period av bakgrundsljud, vilket resulterar i några få beräknade energivärden, och det ej förekommer några ytterligare bak- grundsljud under en mycket lång tidsperiod. I detta fall kan bufferten 52 ej innehålla tillräckligt många energivärden för en giltig testvariabelberäkning inom en rimlig tidsperiod. Lösningen för sådana fall är att inställa en “time out"-gräns, efter vilken det beslutas att dessa ramar innehållande bakgrundsljud bör betraktas som tal, eftersom det ej finns tillräckligt underlag för ett stationaritetsbeslut.
I vissa situationer när det har konstaterats att en viss ram innehåller icke stationärt bakgrundsljud är det vidare att föredraga att sänka stationaritetsgränsen y från t.ex. 3,5 till 3,3 för att förhindra beslut för senare ramar att hoppa fram och tillbaka mellan "stationär" och "icke stationär". Om sålunda en icke stationär ram har påträffats kommer det att vara lättare för de påföljande ramarna att klassificeras såsom icke stationära. 10 15 20 25 30 501 305 ll När en stationär ram såsmáningom påträffas höjs stationaritets- gränsen y igen. Denna teknik kallas "hysteresis".
En annan föredragen teknik är "hangover". Hangover innebär att ett visst beslut av signaldiskriminatorn 24 måste kvarstå under åtminstone ett visst antal ramar, t.ex. 5 ramar, för att bli slutgiltigt. Företrädesvis kombineras "hysteresis" och "hango- ver".
Av ovanstående beskrivning framgår att utföringsformen enligt fig. 3 erfordrar en buffert 52 av ansenlig storlek, 100-200 minnespositioner i typfallet (ZOO-400 om ramnumret också lagras).
Eftersom denna buffert vanligen förekommer i en signalprocessor, där minnesresurserna är mycket knappa, vore det önskvärt att reducera buffertstorleken. Fig. 4 visar därför en föredragen utföringsform av signaldiskriminatorn 24, i vilken användningen av bufferten har modifierats genom en buffertkontroller 58 som styr en buffert 52'.
Syftet med buffertkontrollern 58 är att styra bufferten 52' på sådant sätt att onödiga energiestimat E(T,) ej lagras. Denna strategi baseras på observationen att endast de mest extrema energiestimaten i själva verket är relevanta för beräkning av VT.
Därför bör det vara en god approximation att lagra endast några stora och några små energiestimat i bufferten 52'. Bufferten 52' är därför uppdelad i två buffertar, MAXBUF och MINBUF. Eftersom gamla energiestimat bör försvinna från buffertarna efter en viss tid är det även nödvändigt att lagra ramnumren för motsvarande energivärden i MAXBUF och MINBUF. En möjlig algoritm för lagring av värden i bufferten 52' och som utföres av buffertkontrollern 58 beskrivs i detalj i Pascal-programmet i bifogade appendix.
Utföringsformen i fig. 4 är suboptimal jämfört med utförings- formen enligt fig. 3. Skälet är t.ex. att stora ramenergier ej har möjlighet att nå in i MAXBUF när större, men äldre ramenergi- er redan finns där. I detta fall förloras just denna ramenergi trots att den skulle kunna ha effekt senare när de tidigare stora 10 15 20 25 501 305 12 (men gamla) ramenergierna har skiftats ut. Vad som beräknas i praktiken är ej V, utan V', definierat enligt: max E(TQ _ rfimumr T-_ min E(TQ nammw- Ur praktisk synpunkt är dock denna utföringsform "tillräckligt bra" och medger en drastisk reduktion i den erforderliga buffertstorleken från 100-200 energiestimat till approximativt 10 estimat (5 för MAXBUF och 5 för MINBUF). lagrade Såsom nämnts i samband med beskrivningen av fig. 2 ovan har signaldiskriminatorn 24' ej tillgång till signalen s(n). Eftersom antingen filter- eller excitationsparametrarna vanligen in- nehåller en parameter som representerar ramenergin kan energi- estimaten erhållas ur denna parameter. I enlighet med t.ex. den amerikanska standarden IS-54 representeras ramenergin sålunda av en excitationsparameter r(0). (Det skulle givetvis även vara möjligt att använda r(0) i signaldiskriminatorn 24 i fig. 1 såsom ett energiestimat.) En annan strategi vore att flytta signaldi- skriminatorn 24' och. parametermodifierarenm 36 till höger' om talavkodaren 38 i fig. 2. På detta sätt skulle signaldiskrimina- torn 24' ha tillgång till signalen 40, vilken representerar den avkodade signalen, dvs. den har samma form som signalen s(n) i fig. l. Denna strategi skulle dock erfordra ytterligare en talavkodare efter parametermodifieraren 36 för att reproducera den modifierade signalen.
I ovanstående beskrivning av signaldiskriminatorn 24, 24' har det antagits att stationaritetsbesluten är baserade på energiberäk- ningar. Energin är dock endast ett av statistiska moment av olika ordning som kan användas för stationaritetsdetektering. Det ligger därför inom uppfinningens ram att använda andra statistis- ka moment än momentet av andra ordningen (vilket svarar mot signalens energi eller varians). Det är även möjligt att testa 10 15 501 305 13 flera statistiska moment av olika ordning med avseende pà stationaritet och att basera ett slutligt stationaritetsbeslut pà resultaten från dessa tester.
Vidare är den definierade testvariabeln V, ej den enda möjliga testvariabeln. En annan testvariabel skulle exempelvis kunna J där uttrycket är ett estimat pá energiförändringshas- tigheten från ram till ram. T.ex. kan Kalman-filter pàläggas för beräkning av estimaten i formeln, t.ex. i enlighet med en linjär trendmodell (se A. Gelb, "Applied optimal estimation“, MIT Press, 1988). Den tidigare definierade testvariabeln V, har dock det önskvärda särdraget att den är skalfaktoroberoende, vilket gör signaldiskriminatorn okänslig för bakgrundsljudnivàn. definieras såsom: _ damp Vf ' än _az_> Fackmannen inser att olika modifieringar och förändringar kan företagas vid föreliggande uppfinning utan avvikelse från uppfinningens grundtanke och ram, vilken definieras av de bifogade patentkraven. 10 15 20 25 30 501 305 PROCEDURE FLstatDet( VAR VAR VAR VAR VAR VAR VAR VAR LABEL BEGIN ZFLacf ZFLsp ZFLnrMinFrames ZFLnrFrames ZFLmaxThresh ZFLminThresh ZFLpowOld ZFLnrSaved ZFLmaxBuf ZFLmaxTime ZFLminBuf ZFLminTime ZFLprelNoStat i maximum,minimum powNow,testVar oldNoStat replaceNr statEnd; II CO OO OO IC 14 APPENDIX realAcfVectorType; Boolean; Integer; Integer; Real; Real; Real; Integer; realStatBufType; integerStatBufType; realStatBufType; integerStatBufType; Boolean); oldNoStat := ZFLprelNoStat; ZFLpre1NoStat := ZFLsp; { In { In { In { In { In { In ( In/Out { In/Out { In/Out { In/Out { In/Out { In/Out { In/Out Integer; Real; Real; Boolean; Integer; IF Nor zFLsp AND (zFLacf[0] > 0) THEN BEGIN { If not speech } ZFLprelNoStat := True; ZFLnrSaved := ZFLnrSaved + 1; \-HHJ\~J\~J¥«J\~J\~J\JMH*~JHJHJHJ 10 15 20 25 30 501 305 15 powNow := ZFLacf[O] + ZFLpow0ld; ZFLpowOld := ZFLacf[O]; IF ZFLnrSaved < 2 THEN GOTO statEnd; IF ZFLnrSaved > ZFLnrFrames THEN ZFLnrSaved := ZFLnrFrames; { Check if there is an old element in max buffer } FOR i := 1 TO statBufferLength DO BEGIN ZFLmaxTime[i] := ZFhmaxTime[i] + 1; IF ZFLmaxTime[i] > ZFLnrFrameS THEN BEGIN ZFLmaxBuf[i] := powNow; ZFLmaxTime[i] := 1; END; END; { Check if there is an old element in min buffer } FOR i := 1 TO statBufferLength DO BEGIN ZFLminTime[i] := ZFLminTime[i] + 1; IF ZFLminTime[i] > ZFLnrFrames THEN BEGIN ZFLminBuf[i] := powNow: ZFLminTime[i] := 1; END; END; maximum := - 1E38; minimum := -maximum: replaceNr := 0: { Check if an element in max buffer is to be substituted, find maximum } FOR i := 1 TO StatBufferLength DO BEGIN IF powNow >= ZFLmaxBuf[i] THEN replaceNr := i; 10 15 20 25 501 305 16 IF ZFLmaxBuf[i] >= maximum THEN maximum := ZFLmaxBuf[i]: END; IF replaceNr > 0 THEN BEGIN ZFLmaxTime[replaceNr] := 1; ZFLmaxBuf[replaceNr] := powNow; IF ZFLmaxBuf[replaceNr] >= maximum THEN maximum := ZFLmaxBuf[replaceNr]; END; replaceNr := 0; { Check if an element in min buffer is to be substituted, find minimum } FOR i := 1 TO statBufferLength DO BEGIN IF powNow <= ZFLminBuf[i] THEN replaceNr := i; IF ZFLminBuf[i] <= minimum THEN minimum := ZFLminBuf[i]; END; IF replaceNr > O THEN BEGIN ZFLminTime[replaceNr] := 1; ZFLminBuf[replaceNr] := powNow; IF ZFLminBuf[replaceNr] >= minimum THEN minimum := ZFLminBuf[replaceNr]; END; IF ZFLnrSaved >= ZFLnrMinFrames THEN BEGIN 10 15 20 25 501 305 17 IF minimum > 1 THEN BEGIN { Calculate test variable } testvar := maximum/minimum; { If test Variable is greater than maxThresh, decide speech If test Variable is less than minThresh, decide babble If test Variable is between, keep previous decision } ZFLprelNoStat := oldNoStat; IF testvar > ZFLmaxThresh THEN ZFLprelNoStat := True; IF testVar < ZFLminThresh THEN ZFLprelNoStat := False; END; END; END; statEnd: END; PROCEDURE FLhangHandler( ZFLmaxFrames : Integer; { In } ZFLhangFrames : Integer; { In } ZFLvad : Boolean; { In } VAR ZFLe1apsedFrames : Integer; { In/Out } VAR ZFLspHangover : Integer; { In/Out ) VAR ZFLvad0ld : Boolean; { In/Out } VAR ZFLsp : Boolean); { Out } 10 15 20 501 305 18 BEGIN { Delays change of decision from speech to no speech hangFrames number of frames However, this is not done if speech has lasted less than maxFrames frames } ZFLsp := ZFLvad; IF ( ZFLelapsedFrames < ZFLmaxFrames ) THEN ZFLelapsedFrames := ZFLelapsedFrames + 1; IF ZFLvadOld AND NOT ZFLvad THEN ZFLspHangOver := 1; IF (ZFLspHangOver < ZFLhangFrames) AND NOT ZFLvad THEN BEGIN ZFLspHangOver := ZFLspHang0ver + 1; ZFLsp := True; END; IF NOT ZFLvad AND ( ZFLelapsedFrames < ZFLmaxFrames ) THEN ZFLsp := False; IF NOT ZFLsp AND ( ZFLspHangOver > ZFLhangFrames-1 ) THEN ZFLelapsedFrames := O; ZFLvadOld := ZFLvad; END;

Claims (15)

10 15 20 *25 501 305 19 PATENTKRAV
1. Förfarande för detektering och kodning och/eller avkodning av stationärt bakgrundsljud i en digital rambaserad talkodare och/eller avkodare innehållande en signalkälla ansluten till ett filter, varvid filtret definieras av en uppsättning filterpara- metrar för varje ram, i och för reproducering av den signal som skall kodas och/eller avkodas, vilket förfarande innefattar stegen: (a) detektering av huruvida signalen som leds till koda- ren/avkodaren primärt representerar tal e1ler~bakgrunds- ljud; (b) när signalen som leds till kodaren/avkodaren primärt representerar bakgrundsljud, detektering av huruvida bakgrundsljudet är stationärt; och (c) när signalen är stationär, begränsning av tidsvariatio- nen mellan på varandra följande ramar och/eller domänen av åtminstone vissa filterparametrar i uppsättningen.
2. Förfarande enligt krav 1, k ä n n e t e c k n a't av att stationaritetsdetekteringen innefattar stegen: (bl) estimering av ett av de statistiska momenten för bak- grundsljudet i vart och ett av N tidssubfönster Ti, där N>2, av ett tidsfönster T med förutbestämd längd; (b2) estimering av variationen av de i steg (bl) erhållna estimaten sàsom ett mått pà bakgrundsljudets stationari- tet; och (b3) bestämning av huruvida den i steg (b3) erhållna var- iationen överskrider en förutbestämd stationaritetsgräns YO 10 15 20 501 305 20
3. Förfarande enligt krav 2, k ä n n e t e c k n a t av estimering av energin E(T1) av bakgrundsljudet i varje tidssub- fönster Ti i steg (bl).
4. Förfarande enligt krav 3, k ä n n e t e c k n a t av att den estimerade variationen bildas i enlighet med formeln: max.E(IQ _ :gr T min Bug) ger
5. Förfarande enligt krav 3, k ä n n e t e c k n a t av att den estimerade variationen bildas i enlighet med formeln: max E(TQ ïé_= nanm? min E(TQ qaamwr där MAXBUF är en buffert innehållande endast de största senaste energiestimaten och MINBUF är en buffert innehållande endast de minsta senaste energiestimaten.
6. Förfarande enligt krav 4 eller 5, k ä n n e t e c k n a t av överlappande tidssubfönster'T¿som kollektivt täcker tidsfönstret T.
7. Förfarande enligt krav 6, k ä n n e t e c k n a t av tidssubfönster T, med samma längd.
8. Förfarande enligt krav 7, k ä n n e t e c k n a t av att varje tidssubfönster Ti består av två pà varandra följande talramar.
9. Anordning för kodning och/eller avkodning av stationärt bakgrundsljud i en digital rambaserad talkodare och/eller -avkodare inkluderande en signalkälla ansluten till ett filter, varvid filtret definieras av en uppsättning filterparametrar för 10 15 20 25 5-91 305 21 varje ram, i och för reproducering av den signal som skall kodas och/eller avkodas, k ä n n e t e c k n a d av: (a) organ (16, 34) för detektering av huruvida signalen som leds till kodaren/avkodaren primärt representerar tal eller bakgrundsljud; (b) organ (24, 24') för detektering, i det fall att signalen som leds till kodaren/avkodaren primärt representerar bakgrundsljud, huruvida bakgrundsljudet är stationärt; och (c) organ (18, 36) för begränsning av tidsvariationen.mellan pà varandra följande ramar och/eller domänen av åtmins- tone vissa filterparametrar i uppsättningen i det fall att signalen som leds till kodaren/avkodaren represente- rar stationärt bakgrundsljud.
10. Anordning enligt krav 9, k ä n n e t e c k n a d av att stationaritetsdetekteringsorganet innefattar: (bl) organ (50) för estimering av' ett av' de statistiska momenten för bakgrundsljudet i vart och ett av N tids- subfönster TU där N>2, av ett tidsfönster T av förutbe- stämd längd; (b2) organ (54) för estimering av variationen av estimaten såsom ett mått på bakgrundsljudets stationaritet: och (b3) organ (56) för bestämning av huruvida den estimerade variationen överskrider en förutbestämd stationaritets- gräns y.
11. Anordning enligt krav 10, k ä n n e t e c k n a d av organ (50) för estimering av energin E(Ti) av bakgrundsljudet i varje tidssubfönster T, 10 501 305 22
12. Anordning enligt krav ll, k ä n n e t e c k n a d av att den estimerade variationen bildas i enlighet med formeln max E'( Ti) T min E( Ti) ner
13. Anordning enligt krav 11, k ä n n e t e c k n a d av organ (58) för styrning av en första buffert MAXBUF och en andra buffert MINBUF för lagring av endast de senaste stora resp. små energiestimaten.
14. Anordning enligt krav 13, k ä n n e t e c k n a d av att varje buffert MINBUF, MAXBUF förutom energiestimaten lagrar markeringar som identifierar det tidssubfönster T, som svarar mot varje energiestimat i varje buffert.
15. Anordning enligt krav 14, k ä n n e t e c k n a d av att den estimerade variationen bildas i enlighet med formeln: max E(Ti) = zyemxaur T min E(T¿) :gel-unnar
SE9301798A 1993-05-26 1993-05-26 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler SE501305C2 (sv)

Priority Applications (22)

Application Number Priority Date Filing Date Title
SE9301798A SE501305C2 (sv) 1993-05-26 1993-05-26 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
EP94917227A EP0653091B1 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
JP7500526A JPH07509792A (ja) 1993-05-26 1994-05-11 定常信号と非定常信号との識別
KR1019950700299A KR100220377B1 (ko) 1993-05-26 1994-05-11 정상신호와 비정상신호 판별방법 및 장치
CN94190318A CN1046366C (zh) 1993-05-26 1994-05-11 静态和非静态信号的鉴别
RU95107694A RU2127912C1 (ru) 1993-05-26 1994-05-11 Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
PCT/SE1994/000443 WO1994028542A1 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
DK94917227T DK0653091T3 (da) 1993-05-26 1994-05-11 Diskrimination imellem stationære og ikke-stationære signaler
CA002139628A CA2139628A1 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
SG1996000608A SG46977A1 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
TW083104232A TW324123B (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
NZ266908A NZ266908A (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals in mobile radio
AU69016/94A AU670383B2 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals
NZ286953A NZ286953A (en) 1993-05-26 1994-05-11 Speech encoder/decoder: discriminating between speech and background sound
DE69421498T DE69421498T2 (de) 1993-05-26 1994-05-11 Unterscheidung zwischen stationären und nicht-stationären signalen
ES94917227T ES2141234T3 (es) 1993-05-26 1994-05-11 Discriminacion entre señales estacionarias y no estacionarias.
US08/248,714 US5579432A (en) 1993-05-26 1994-05-25 Discriminating between stationary and non-stationary signals
FI950311A FI950311A0 (sv) 1993-05-26 1995-01-24 Diskriminering mellan stationära och icke stationära signaler
AU48112/96A AU681551B2 (en) 1993-05-26 1996-03-14 Discriminating between stationary and non-stationary signals
CN97101022A CN1218945A (zh) 1993-05-26 1997-01-06 静态和非静态信号的鉴别
HK98115224A HK1013881A1 (en) 1993-05-26 1998-12-23 Discriminating between stationary and non-stationary signals
GR990403198T GR3032107T3 (en) 1993-05-26 1999-12-13 Discriminating between stationary and non-stationary signals.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9301798A SE501305C2 (sv) 1993-05-26 1993-05-26 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler

Publications (3)

Publication Number Publication Date
SE9301798D0 SE9301798D0 (sv) 1993-05-26
SE9301798L SE9301798L (sv) 1994-11-27
SE501305C2 true SE501305C2 (sv) 1995-01-09

Family

ID=20390059

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9301798A SE501305C2 (sv) 1993-05-26 1993-05-26 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler

Country Status (19)

Country Link
US (1) US5579432A (sv)
EP (1) EP0653091B1 (sv)
JP (1) JPH07509792A (sv)
KR (1) KR100220377B1 (sv)
CN (2) CN1046366C (sv)
AU (2) AU670383B2 (sv)
CA (1) CA2139628A1 (sv)
DE (1) DE69421498T2 (sv)
DK (1) DK0653091T3 (sv)
ES (1) ES2141234T3 (sv)
FI (1) FI950311A0 (sv)
GR (1) GR3032107T3 (sv)
HK (1) HK1013881A1 (sv)
NZ (1) NZ266908A (sv)
RU (1) RU2127912C1 (sv)
SE (1) SE501305C2 (sv)
SG (1) SG46977A1 (sv)
TW (1) TW324123B (sv)
WO (1) WO1994028542A1 (sv)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2317084B (en) * 1995-04-28 2000-01-19 Northern Telecom Ltd Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
AUPO170196A0 (en) * 1996-08-16 1996-09-12 University Of Alberta A finite-dimensional filter
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
DE10026872A1 (de) 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
US7254532B2 (en) 2000-04-28 2007-08-07 Deutsche Telekom Ag Method for making a voice activity decision
JP3812887B2 (ja) * 2001-12-21 2006-08-23 富士通株式会社 信号処理システムおよび方法
CA2420129A1 (en) * 2003-02-17 2004-08-17 Catena Networks, Canada, Inc. A method for robustly detecting voice activity
KR101462293B1 (ko) 2007-03-05 2014-11-14 텔레폰악티에볼라겟엘엠에릭슨(펍) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
RU2469419C2 (ru) 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и устройство для управления сглаживанием стационарного фонового шума
CN101308651B (zh) * 2007-05-17 2011-05-04 展讯通信(上海)有限公司 音频暂态信号的检测方法
CN101546556B (zh) * 2008-03-28 2011-03-23 展讯通信(上海)有限公司 用于音频内容识别的分类系统
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CA2929800C (en) * 2010-12-29 2017-12-19 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
US10218327B2 (en) * 2011-01-10 2019-02-26 Zhinian Jing Dynamic enhancement of audio (DAE) in headset systems
US10325588B2 (en) 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
PT89978B (pt) * 1988-03-11 1995-03-01 British Telecomm Aparelho detector da actividade vocal e aparelho telefonico movel que o contem
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
EP0538536A1 (en) * 1991-10-25 1993-04-28 International Business Machines Corporation Method for detecting voice presence on a communication line
SE470577B (sv) * 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise

Also Published As

Publication number Publication date
CN1046366C (zh) 1999-11-10
US5579432A (en) 1996-11-26
DE69421498D1 (de) 1999-12-09
ES2141234T3 (es) 2000-03-16
FI950311A (sv) 1995-01-24
AU681551B2 (en) 1997-08-28
FI950311A0 (sv) 1995-01-24
DE69421498T2 (de) 2000-07-13
EP0653091B1 (en) 1999-11-03
AU670383B2 (en) 1996-07-11
WO1994028542A1 (en) 1994-12-08
HK1013881A1 (en) 1999-09-10
NZ266908A (en) 1997-03-24
SG46977A1 (en) 1998-03-20
DK0653091T3 (da) 2000-01-03
RU2127912C1 (ru) 1999-03-20
SE9301798L (sv) 1994-11-27
TW324123B (en) 1998-01-01
AU6901694A (en) 1994-12-20
CA2139628A1 (en) 1994-12-08
JPH07509792A (ja) 1995-10-26
KR100220377B1 (ko) 1999-09-15
AU4811296A (en) 1996-05-23
KR950702732A (ko) 1995-07-29
CN1110070A (zh) 1995-10-11
GR3032107T3 (en) 2000-03-31
SE9301798D0 (sv) 1993-05-26
CN1218945A (zh) 1999-06-09
EP0653091A1 (en) 1995-05-17

Similar Documents

Publication Publication Date Title
CA2575632C (en) Speech end-pointer
KR100330478B1 (ko) 노이즈 상태 음성 검출 시스템
EP0548054B1 (en) Voice activity detector
Moattar et al. A simple but efficient real-time voice activity detection algorithm
EP0677202B1 (en) Discriminating between stationary and non-stationary signals
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US5826230A (en) Speech detection device
SE501305C2 (sv) Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US20020010576A1 (en) A method and device for estimating the pitch of a speech signal using a binary signal
JP4102745B2 (ja) 音声区間検出装置および方法
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
JPH04100099A (ja) 音声検出装置
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
US20240013803A1 (en) Method enabling the detection of the speech signal activity regions
NZ286953A (en) Speech encoder/decoder: discriminating between speech and background sound
EP1143414A1 (en) Estimating the pitch of a speech signal using previous estimates
KR19990056313A (ko) 음성인식시스템에서의 음성구간 검출방법

Legal Events

Date Code Title Description
NUG Patent has lapsed