ES2869141T3 - Estimación de ruido de fondo en señales de audio - Google Patents

Estimación de ruido de fondo en señales de audio Download PDF

Info

Publication number
ES2869141T3
ES2869141T3 ES19179575T ES19179575T ES2869141T3 ES 2869141 T3 ES2869141 T3 ES 2869141T3 ES 19179575 T ES19179575 T ES 19179575T ES 19179575 T ES19179575 T ES 19179575T ES 2869141 T3 ES2869141 T3 ES 2869141T3
Authority
ES
Spain
Prior art keywords
signal
line
tim
tio
tra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19179575T
Other languages
English (en)
Inventor
Martin Sehlstedt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2869141T3 publication Critical patent/ES2869141T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Un método para actualizar una estimación de ruido de fondo de una señal de audio, comprendiendo el método: obtener (201) al menos un parámetro asociado con un segmento de la señal de audio de entrada con base en: una primera ganancia de predicción lineal calculada como un cociente entre una energía de señal residual de una primera predicción lineal y una energía de señal residual de una segunda predicción lineal para el segmento de la señal de audio, siendo la segunda predicción lineal de un orden superior que la primera predicción lineal; y una segunda ganancia de predicción lineal calculada como un cociente entre la energía de señal residual de la segunda predicción lineal y una energía de señal residual de una tercera predicción lineal para el segmento de la señal de audio, siendo la tercera predicción lineal de un orden superior que la segunda predicción lineal; determinar (202) si el segmento de la señal de audio comprende una pausa basada, al menos, en el al menos un parámetro; y: si se determina que el segmento de la señal de audio comprende una pausa: actualizar (203) una estimación de ruido de fondo con base en el segmento de la señal de audio.

Description

DESCRIPCIÓ N
E stim ac ión de ru ido de fo n d o en se ñ a le s de aud io
C am po técnico
Las re a liza c io n e s de la p re se n te inve n c ió n se re fie ren al p ro ce sa m ie n to de se ñ a le s de a ud io , y en p a rtic u la r a la e s tim a c ió n de ru ido de fo n d o , p. e j., p a ra a p o ya r u n a d e c is ió n de a c tiv id a d de son ido .
A ntecedentes
En los s is te m a s de c o m u n ica c ió n q ue u tilizan tra n s m is ió n d is c o n tin u a (D TX ) es im p o rta n te e n c o n tra r un e q u ilib rio e n tre la e fic ie n c ia y no re d u c ir la ca lid a d . En d ich o s s is te m a s se u tiliza un d e te c to r de a c tiv id a d p a ra in d ic a r señ a le s a c tivas , p. e j., h ab la o m ú sica , q ue d eb en c o d ifica rse a c tiva m e n te , y s e g m e n to s con se ñ a le s de fo n d o q u e p ueden re e m p la za rse con ru ido de co n fo rt g e n e ra d o en el lado d e l re cep to r. S i e l d e te c to r de a c tiv id a d es d e m a s ia d o e fic ie n te p a ra d e te c ta r la fa lta de a c tiv id a d , in tro d u c irá re co rte s en la se ñ a l a c tiva , q u e luego se p e rc ib e n co m o u n a d eg ra d a c ió n s u b je tiva de la ca lid a d cu a n d o e l se g m e n to a c tivo re co rta d o se re e m p la za con ru ido de co n fo rt. A l m ism o tie m p o , la e fic ie n c ia de la D TX se re du ce si e l d e te c to r de a c tiv id a d no es lo s u fic ie n te m e n te e fic ie n te y c la s if ica s e g m e n to s de ru ido de fo n d o co m o a c tivo s y luego co d ific a a c tiva m e n te el ru ido de fo n d o en lu g a r de in g re sa r a un m o do D TX con ru ido de co n fo rt. En la m a yo ría de los caso s, e l p ro b le m a del re co rte se c o n s id e ra peor.
La F ig ura 1 m u e s tra un d ia g ra m a de b lo q u e s de d e sc rip c ió n g e n e ra l de un d e te c to r de a c tiv id a d de son ido g e n e ra liza d o , S A D o d e te c to r de a c tiv id a d de voz , V A D , q ue to m a u na señ a l de a ud io co m o e n tra d a y p ro d u ce una d e c is ió n de a c tiv id a d com o sa lid a . La se ñ a l de e n tra d a se d iv id e en tra m a s de d a tos , es d e c ir, s e g m e n to s de la seña l de a ud io de p. e j., 5 -30 m s, d e p e n d ie n d o de la im p le m e n ta c ió n , y se p ro d u ce u n a d e c is ió n de a c tiv id a d p o r tra m a co m o sa lida .
U na d e c is ió n p rim a ria , "p rim ", la to m a e l d e te c to r p rim a rio ilu s tra d o en la fig u ra 1. La d e c is ió n p rim a ria es b á s ica m e n te u n a c o m p a ra c ió n de las ca ra c te rís tic a s de u na tra m a a c tu a l con ca ra c te rís tic a s de fon do , q u e se e s tim a n a p a rtir de tra m a s de e n tra d a a n te rio re s . U na d ife re n c ia e n tre las ca ra c te rís tic a s de la tra m a a c tu a l y las ca ra c te rís tic a s de fondo , q ue es m a yo r q u e un u m bra l, p ro vo ca u n a d e c is ió n p rim a ria a ctiva . El b lo q u e de su m a de e sp e ra se u tiliza p ara e x te n d e r la d e c is ió n p rim a ria b a sa d a en d e c is io n e s p rim a ria s p a sa d a s p a ra fo rm a r la d e c is ió n fina l, " in d ica d o r". La razón p a ra u tiliz a r la e sp e ra es p rin c ip a lm e n te re d u c ir/e lim in a r e l r iesgo de re co rte en e l m e d io y la p a rte fin a l (en ing lés b a cke n d ) de la rá fag a de a c tiv id a d . C om o se ind ica en la fig u ra , un c o n tro la d o r de o p e ra c ió n p ue de a ju s ta r el u m b ra l(e s ) p a ra el d e te c to r p rim a rio y p a ra la e x te n s ió n de la su m a de e sp e ra seg ún las ca ra c te rís tic a s de la se ñ a l de e n tra d a . El b lo q u e de e s tim a d o r de fo n d o se u tiliza p a ra e s tim a r e l ru ido de fo n d o en la señ a l de e n tra d a . El ru ido de fo n d o ta m b ié n p u e d e d e n o m in a rse "e l fo n d o " o "la ca ra c te rís tic a de fo n d o " en la p re se n te m e m oria .
La e s tim a c ió n de la ca ra c te rís tic a de fo n d o p u e d e h ace rse seg ún d o s p rin c ip io s b á s ica m e n te d ife re n te s , ya sea u tiliza n d o la d e c is ió n p rim a ria , es d ec ir, con la d e c is ió n o con la re tro a lim e n ta c ió n de la m é trica de d e c is ió n , q ue se ind ica m e d ia n te u na líne a de p u n to s y g u io n e s en la fig u ra 1, o u tiliza n d o a lg u n a s o tra s ca ra c te rís tic a s de la señ a l de e n tra da , es dec ir, s in re tro a lim e n ta c ió n de d e c is ió n . T a m b ié n es p o s ib le u tiliz a r c o m b in a c io n e s de las d os e s tra te g ia s .
Un e je m p lo de un có d e c q ue u tiliza re tro a lim e n ta c ió n de d e c is io n e s p a ra la e s tim a c ió n de fo n d o es A M R -N B (en ing lés, A d a p tive M u lti-R a te N a rro w b a n d ) y e je m p lo s de có d e cs d o n d e no se u tiliza re tro a lim e n ta c ió n de d e c is io n e s son E V R C (en ing lés, E nh a nced V a ria b le R ate C o D e C) y G .718.
H a y v a r ia s ca ra c te rís tic a s de señ a l d ife re n te s o ca ra c te rís tic a s q u e se p ue de n u tilizar, p e ro u na c a ra c te rís tic a com ú n u tiliza d a en V A D s son las ca ra c te rís tic a s de fre cu e n c ia de la señ a l de e n tra d a . Un tip o de ca ra c te rís tic a s de fre cu e n c ia co m ú n m e n te u tiliza d o es la e n e rg ía de tra m a de su b -b a n d a , d e b id o a su b a ja c o m p le jid a d y fu n c io n a m ie n to fia b le en S N R ba ja . P o r lo tan to , se su p o n e q u e la señ a l de e n tra d a se d iv id e en d ife re n te s su b -b a n d a s de fre cu e n c ia y e l n ive l de fo n d o se e s tim a p a ra c a d a u n a de las su b -b a n d a s . De e s ta fo rm a , u n a de las ca ra c te rís tic a s d e l ru ido de fo n d o es el v e c to r con los v a lo re s de e n e rg ía p a ra ca d a su b -b a n d a . E stos son v a lo re s q u e ca ra c te r iza n e l ru ido de fo n d o en la señ a l de e n tra d a en e l d o m in io de la fre cu e n c ia .
P ara lo g ra r e l se g u im ie n to de l ru ido de fo n d o , la a c tu a liza c ió n rea l de la e s tim a c ió n de ru ido de fo n d o se p u e d e re a liza r de al m enos tre s fo rm a s d ife re n te s . U na fo rm a es u tiliz a r un p ro ce so A u to R eg re s ivo , A R , p o r in te rva lo de fre cu e n c ia p a ra m a n e ja r la a c tu a liza c ió n . E jem p lo s de d ich o s có d e cs son A M R -N B y G .718. B á s ica m e n te , p a ra e s te tip o de a c tu a liza c ió n , e l ta m a ñ o de l p aso de la a c tu a liza c ió n es p ro p o rc io n a l a la d ife re n c ia o b s e rva d a e n tre la e n tra d a actua l y la e s tim a c ió n de fo n d o actua l. O tra fo rm a es u tiliz a r la e sca la m u ltip lica tiva de u n a e s tim a c ió n a c tu a l con la re s tr icc ió n de q ue la e s tim a c ió n n un ca p ue de s e r m a yo r q u e la e n tra d a a c tu a l o m e n o r q ue un v a lo r m ín im o. Esto s ig n ifica q u e la e s tim a c ió n se in c re m e n ta en c a d a tra m a h as ta q ue se a m ás a lta q u e la e n tra d a a ctu a l. En e sa s itu a c ió n , la e n tra d a a c tu a l se u tiliz a co m o e s tim a c ió n . E V R C es un e je m p lo de un có d e c q ue u tiliza e s ta té c n ica p a ra a c tu a liz a r la e s tim a c ió n de fo n d o p a ra la fu n c ió n V A D . T e n g a en cu e n ta q u e E V R C u tiliza d ife re n te s e s tim a c io n e s de fo n d o p ara V A D y p a ra su p re s ió n de ru ido . D ebe se ñ a la rse q ue un V A D p u e d e u tiliza rse en o tro s co n te x to s d is tin to s a la DTX. P o r e je m p lo , en có d e cs de ta s a va r ia b le , co m o E V R C , e l V A D p u e d e u tiliza rse co m o p a rte de u n a fu n c ió n de d e te rm in a c ió n de tasa .
U na te rce ra fo rm a es u tiliz a r u n a té c n ica d e n o m in a d a m ín im a d o n d e la e s tim a c ió n es el v a lo r m ín im o d u ra n te una v e n ta n a de tie m p o d e s liza n te de tra m a s a n te rio re s . B á s ica m e n te , e s to d a u n a e s tim a c ió n m ín im a q ue se esca la , u tiliz a n d o un fa c to r de co m p e n s a c ió n , p a ra o b te n e r u n a e s tim a c ió n m e d ia a p ro x im a d a d e l ru ido e s ta c io n a rio .
En ca so s de S N R a lta , d o n d e e l n ive l de señ a l de la se ñ a l a c tiva es m u ch o m ás a lto q u e la señ a l de fo n d o , p u e d e se r b a s ta n te fá c il to m a r u na d e c is ió n sob re si u n a se ñ a l de a ud io de e n tra d a e s tá a c tiva o ina c tiva . S in e m b a rg o , es m uy d ifíc il se p a ra r se ñ a le s a c tiva s y no a c tiva s en c a so s de S N R ba ja , y en p a rtic u la r cu a n d o e l fo n d o no es e s ta c io n a rio o inc lu so s im ila r a la señ a l a c tiva en sus ca ra c te rís tica s .
El re n d im ie n to d e l V A D d e p e n d e de la c a p a c id a d de l e s tim a d o r de ru ido de fo n d o p a ra ra s tre a r las ca ra c te rís tic a s del fo n d o , en p a rtic u la r cu a n d o se tra ta de fo n d o s no e s ta c io n a rio s . C on un m e jo r se g u im ie n to , es p os ib le h a ce r q ue el V A D se a m ás e fic ie n te sin a u m e n ta r e l r iesgo de q ue se p ro d u zca n co rte s de l hab la.
Si b ien la co rre la c ió n es u na c a ra c te r ís tic a im p o rta n te q u e se u tiliza p a ra d e te c ta r el hab la , p rin c ip a lm e n te la parte so n o ra d e l hab la , ta m b ié n hay se ñ a le s de ru ido q ue m u es tra n u n a a lta co rre la c ió n . En e s to s caso s, e l ru ido con c o rre la c ió n e v ita rá la a c tu a liza c ió n de las e s tim a c io n e s de ru ido de fo n d o . El re su lta d o es u n a a lta a c tiv id a d , ya q ue ta n to e l h ab la co m o e l ru ido de fo n d o se co d ifica n co m o co n te n id o a ctivo . Si b ien p a ra S N R a lta s (a p ro x im a d a m e n te > 20 d B ) se ría p o s ib le re d u c ir e l p ro b le m a u tiliza n d o la d e te cc ió n de p a u sa b a sa d a en e n e rg ía , e s to no es fia b le p ara el in te rva lo de S N R de 20dB h as ta 10dB o p o s ib le m e n te 5dB . Es en e s te in te rva lo d o n d e la so lu c ió n d e sc rita en la p re se n te m e m o ria m a rca la d ife re n c ia .
M. Je lin e k y R. S a la m i "N o ise re d u c tio n m e th od fo r w id e b a n d sp e ech co d in g " 2004, 12a c o n fe re n c ia E u ro p e a de p ro ce sa m ie n to de se ñ a le s , p. 1959 -1962 , e n se ñ a n un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o d o n d e la p re se n c ia de p au sa s , d u ra n te las c u a le s se e s tim a d ich o ru ido , se d e te rm in a con b ase en e l c o c ie n te e n tre un re s idu o de u na p re d icc ió n linea l de 2° o rde n y un re s idu o de u na p re d icc ió n linea l de 16° o rden .
Com pendio
S e ría d e s e a b le lo g ra r u n a e s tim a c ió n m e jo ra d a d e l ru ido de fo n d o en las se ñ a le s de aud io . "M e jo ra d o " p u e d e im p lica r a q u í to m a r u na d e c is ió n m ás c o rre c ta con re sp e c to a si u n a señ a l de a ud io co m p re n d e h ab la o m ú s ica a c tiva o no, y a s í e s tim a r m ás a m e nu do , p. e j., a c tu a liza n d o u na e s tim a c ió n a n te rio r, e l ru ido de fo n d o en s e g m e n to s de la señ a l de a ud io q ue en re a lid ad e s tá n lib res de co n te n id o a ctivo , co m o h a b la y /o m ú sica . En la p re se n te m e m o ria , se p ro p o rc io n a un m é to do m e jo rad o p a ra g e n e ra r u na e s tim a c ió n de ru ido de fo n d o , q ue p ue de p e rm itir , p. e j., a un d e te c to r de a c tiv id a d de son ido to m a r d e c is io n e s m ás a de cu ad as .
P ara la e s tim a c ió n de ru ido de fo n d o en se ñ a le s de a ud io , es im p o rta n te p o d e r e n c o n tra r c a ra c te rís tic a s f ia b le s p ara id e n tif ic a r las ca ra c te rís tic a s de u na señ a l de ru ido de fo n d o ta m b ié n cu a n d o u na señ a l de e n tra d a co m p re n d e u na m e zc la d e s c o n o c id a de se ñ a le s a c tiva s y de fon do , d o n d e las se ñ a le s a c tiva s p ue de n c o m p re n d e r h ab la y /o m úsica .
El in v e n to r se ha d a d o cu e n ta de q u e las ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra d ife re n te s ó rd e n e s de m o d e lo s de p re d icc ió n linea l se p ue de n u tiliz a r p a ra d e te c ta r p a u sa s en las se ñ a le s de a ud io . Estas e n e rg ía s re s id u a le s se p ue de n e x tra e r, p. e j., a p a rtir de un a n á lis is de p re d icc ió n linea l, q ue es co m ú n en los có d ecs de hab la . Las ca ra c te rís tic a s se p u e d e n f iltra r y c o m b in a r p a ra c re a r un c o n ju n to de ca ra c te rís tic a s o p a rá m e tro s que se p ue de n u sa r p a ra d e te c ta r ru ido de fo n d o , lo q ue h ace q ue la so lu c ió n se a a d e cu a d a p a ra su uso en la e s tim a c ió n de ru ido . La so lu c ió n d e s c rita en la p re se n te m e m o ria es p a rtic u la rm e n te e fic ie n te p a ra las co n d ic io n e s en las q ue una S N R e s tá en el in te rva lo de 10 a 20 dB.
O tra c a ra c te rís tic a p ro p o rc io n a d a en la p re se n te m e m o ria es u n a m e d id a de p ro x im id a d e sp e c tra l al fo n d o , q u e p ue de re a liza rse p. e j., u tiliz a n d o las e n e rg ía s de su b -b a n d a del d o m in io de la fre cu e n c ia q u e se u tilizan , p. e j., en un S A D de su b -b a n d a . La m e d id a de p ro x im id a d e sp e c tra l ta m b ié n p u e d e u tiliza rse p a ra to m a r u na d e c is ió n de si u na seña l de a ud io co m p re n d e u n a p a u sa o no.
S eg ú n un p rim e r a sp ec to , se p ro p o rc io n a un m é to do p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na seña l de a ud io . El m é to do co m p re n d e o b te n e r al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la se ñ a l de a ud io , com o u na tra m a o p a rte de u n a tra m a , con b ase en u na p rim e ra g a n a n c ia de p re d icc ió n linea l, c a lc u la d a co m o un co c ie n te e n tre u na e n e rg ía de señ a l re s idu a l de u na p rim e ra p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a se g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de aud io , en d o n d e la s e g u n d a p re d icc ió n linea l es de un o rde n s u p e rio r a la p rim e ra p re d icc ió n line a l; y, u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de señ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u na te rce ra p re d icc ió n linea l para e l se g m e n to de la señ a l de a ud io , en d o n d e la te rce ra p re d icc ió n line a l es de un o rd e n s u p e r io r a la s e g u n d a p red icc ió n linea l. El m é to d o co m p re n d e a d e m á s d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p a u sa b asad a , al m e no s, en e l al m e no s un p a rá m e tro ; y, a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o b a sa d a en el se g m e n to de la señ a l de a ud io si se d e te rm in a q u e el se g m e n to de la señ a l de a ud io co m p re n d e u na pausa .
S eg ú n un se g u n d o a sp ec to , se p ro p o rc io n a un a p a ra to p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u n a seña l de a ud io . El a p a ra to se co n fig u ra p a ra o b te n e r al m e no s un p a rá m e tro b a sa d o en u n a p rim e ra g a n a n c ia de p red icc ió n linea l, ca lc u la d a co m o un c o c ie n te e n tre u n a e n e rg ía de señ a l re s idu a l de u n a p rim e ra p re d icc ió n linea l y u n a e n e rg ía de se ñ a l re s idu a l de u na s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , en d o n d e la se g u n d a p re d icc ió n linea l es de un o rde n s u p e r io r a la p rim e ra p re d icc ió n line a l; y, u na s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de señ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de seña l re s id u a l de u n a te rce ra p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , en d o n d e la te rce ra p re d icc ió n linea l es de un o rde n s u p e r io r a la s e g u n d a p re d icc ió n linea l. El a p a ra to se co n fig u ra a d e m á s p a ra d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa b asad a , al m enos, en e l al m e no s un p a rá m e tro ; y, a c tu a liz a r u na e s tim a c ió n de ru ido de fo n d o b a sa d a en el se g m e n to de la se ñ a l de a ud io si se d e te rm in a q ue e l se g m e n to de la seña l de a ud io co m p re n d e u n a pausa .
S eg ú n un te rc e r a sp ec to , se p ro p o rc io n a un có d e c de a ud io , q ue co m p re n d e e l a p a ra to seg ún e l se g u n d o a sp ec to .
S eg ú n un cu a rto a sp e c to , se p ro p o rc io n a un d is p o s itivo de co m u n ica c ió n , q ue co m p re n d e e l a p a ra to según e l se g u n d o a sp ec to .
Breve descripción de los dibujos
L o s o b je to s , ca ra c te rís tic a s y ve n ta ja s a n te rio re s , y o tro s de la te c n o lo g ía d e sc rita en la p re se n te m e m o ria serán e v id e n te s a p a rtir de la s ig u ie n te d e sc rip c ió n m ás p a rtic u la r de las re a liza c io n e s co m o se ilus tra en los d ib u jo s a d ju n tos . Los d ib u jo s no son n e ce sa ria m e n te a e sca la , s ino q ue se h ace h in ca p ié en ilu s tra r los p rin c ip io s de la te c n o lo g ía d e s c rita en la p re se n te m e m oria .
La F ig u ra 1 es un d ia g ra m a de b lo q u e s q u e ilus tra un d e te c to r de a c tiv id a d y u na lóg ica de d e te rm in a c ió n de e sp e ra .
La F igura 2 es un d ia g ra m a de f lu jo q u e ilus tra un m é to do p ara la e s tim a c ió n de ru ido de fo n d o , seg ún u n a re a liza c ió n de e je m p lo .
La F ig ura 3 es un d ia g ra m a de b lo q u e s q ue ilus tra el c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra la p re d icc ió n linea l de o rde n 0 y 2 seg ún u na re a liza c ió n de e je m p lo .
La F ig ura 4 es un d ia g ra m a de b lo q u e s q ue ilus tra el c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra la p re d icc ió n linea l de o rde n 2 y 16 según u na re a liza c ió n de e je m p lo .
La F igura 5 es un d ia g ra m a de b lo q u e s q u e ilu s tra e l c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con u na m e d id a de p ro x im id a d e sp e c tra l seg ún u na re a liza c ió n de e je m p lo .
La F igura 6 es un d ia g ra m a de b lo q u e s q u e ilus tra un e s tim a d o r de fo n d o de la e n e rg ía de su b -b a n d a .
La F ig u ra 7 es un d ia g ra m a de f lu jo q u e ilus tra u n a lóg ica de d e c is ió n de a c tu a liza c ió n d e l fo n d o de la so lu c ió n d e sc rita en e l A n e xo A.
Las F ig uras 8 -10 son d ia g ra m a s q u e ilus tra n el co m p o rta m ie n to de d ife re n te s p a rá m e tro s p re se n ta d o s en la p re se n te m e m o ria cu a n d o se ca lcu la n p a ra u na señ a l de a ud io q ue co m p re n d e d o s rá fag as de hab la.
Las F ig u ras 11a-11c y 12-13 son d ia g ra m a s de b lo q u e s q ue ilus tra n d ife re n te s im p le m e n ta c io n e s de un e s tim a d o r de ru ido de fo n d o seg ún re a liza c io n e s de e je m p lo .
Las F ig uras A 2 -A 9 en las p á g in a s de fig u ra s m a rca d a s co m o "A n e xo A " e s tá n a so c ia d a s con e l A n e xo A, y se m e n c io n a n en d ich o A n e xo A con el n ú m e ro q u e s igu e a la le tra "A", es d e c ir, 2 -9.
D escripción detallada
La so lu c ió n d e sc rita en la p re se n te m e m o ria se re fie re a la e s tim a c ió n de ru ido de fo n d o en se ñ a le s de a ud io . En el d e te c to r de a c tiv id a d g e n e ra liz a d a ilu s tra d o en la fig u ra 1, la fu n c ió n de e s tim a r e l ru ido de fo n d o la re a liza el b lo q ue d e n o m in a d o "e s tim a d o r de fo n d o ". A lg u n a s re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m o ria p ue de n ve rse en re lac ió n con s o lu c io n e s d e s c rita s p re v ia m e n te en W O 2011 /049514 , W O 2011 /049515 , y ta m b ié n en el A n e xo A (A p é n d ice A). La so lu c ió n d e sc rita en la p re se n te m e m o ria se co m p a ra rá con im p le m e n ta c io n e s de e s ta s so lu c io n e s d e s c rita s p re v ia m e n te . A u n q u e las so lu c io n e s d e s c rita s en W O 2011 /049514 , W O 2011 /049515 y en e l A n e xo A son b u e n a s so lu c io n e s , la so lu c ió n p re s e n ta d a en la p re se n te m e m o ria to d a v ía tie n e ve n ta ja s en re lac ió n con e stas so lu c io n e s . P o r e je m p lo , la so lu c ió n p re s e n ta d a en la p re se n te m e m o ria es aún m ás a d e cu a d a en su se g u im ie n to de l ru ido de fondo .
El re n d im ie n to de un V A D d e p e n d e de la ca p a c id a d d e l e s tim a d o r de ru ido de fo n d o p a ra ra s tre a r las ca ra c te rís tica s d e l fo n d o , en p a rtic u la r cu a n d o se tra ta de fo n d o s no e s ta c io n a rio s . C on un m e jo r se g u im ie n to , es p o s ib le h a c e r que el V A D sea m ás e fic ie n te sin a u m e n ta r e l r iesgo de q ue se p ro d u zca n co rte s de l hab la.
Un p ro b le m a con los m é to d o s de e s tim a c ió n de ru ido a c tu a le s es q ue p a ra lo g ra r un b uen se g u im ie n to d e l ru ido de fo n d o en u n a S N R ba ja , se n e ce s ita un d e te c to r de p a u sa fiab le . P ara u na e n tra d a de so lo hab la , es p o s ib le u tiliz a r la ve lo c id a d s ilá b ica o e l h echo de q u e u n a p e rso n a no p u e d e h a b la r to d o e l t ie m p o p a ra e n c o n tra r p a u sa s en e l hab la. D ich as s o lu c io n e s p o d rían im p lica r q u e d e sp u é s de un tie m p o su fic ie n te sin re a liz a r a c tu a liza c io n e s d e l fo n d o , los re q u is ito s p a ra la d e te cc ió n de p a u sa s sean "re la ja d o s ", de m o do q ue sea m ás p ro b a b le d e te c ta r u na p a u sa en el hab la . Esto p e rm ite re s p o n d e r a c a m b io s a b ru p to s en las c a ra c te rís tic a s o el n ive l de l ru ido . A lg u n o s e je m p lo s de d ich a s lóg icas de re cu p e ra c ió n de ru ido son : 1) C om o las e xp re s io n e s d e l h ab la co n tie n e n se g m e n to s con a lta co rre la c ió n , n o rm a lm e n te es se g u ro a s u m ir q u e h ay u n a p a u sa en e l h ab la d e sp u é s de un n úm e ro s u fic ie n te de tra m a s s in c o rre la c ió n . 2) C u a n d o la R e la c ió n S eñ a l a R uido, S N R > 0, la e n e rg ía de l h ab la es m a yo r q u e e l ru ido de fon do , p o r lo q ue si la e n e rg ía de la tra m a e s tá c e rca de la e n e rg ía m ín im a d u ra n te un tie m p o m ás la rgo , p. e j., 1 -5 seg un do s , ta m b ié n es se g u ro a su m ir q ue u no e s tá en u n a p a u sa d e l hab la . Si b ien las té c n ica s a n te r io re s fu n c io n a n b ien con la e n tra d a de so lo hab la , no son s u fic ie n te s cu a n d o la m ú s ica se c o n s id e ra u n a e n tra d a a ctiva . En la m ú s ica p ue de h ab e r se g m e n to s la rgos con b a ja co rre la c ió n q ue to d a v ía son m ú sica . A d e m á s, las d in á m ica s de la e n e rg ía en la m ú sica ta m b ié n p ue de d e s e n c a d e n a r la d e te cc ió n de fa lsa s p au sa s , lo q u e p ue de re s u lta r en a c tu a liza c io n e s no d e se a d a s , e rró n e a s de la e s tim a c ió n de ru ido de fondo .
Ide a lm e n te , se n e ce s ita ría u na fu n c ió n in ve rsa de un d e te c to r de a c tiv id a d , o lo q ue se lla m a ría un "d e te c to r de o cu rre n c ia de p a u sa s ", p a ra c o n tro la r la e s tim a c ió n de ru ido . Esto a se g u ra ría q u e la a c tu a liza c ió n de las ca ra c te rís tica s d e l ru ido de fo n d o se re a liza so lo cu a n d o no h ay se ñ a l a c tiva en la tra m a a c tua l. S in e m b a rg o , co m o se ind icó a n te r io rm e n te , no es u na ta re a fá c il d e te rm in a r si un se g m e n to de la se ñ a l de a ud io co m p re n d e u n a señ a l a c tiva o no.
T ra d ic io n a lm e n te , cu a n d o se sa b ía q ue la señ a l a c tiva e ra u n a se ñ a l de hab la , e l d e te c to r de a c tiv id a d se llam ab a D e te c to r de A c tiv id a d de V o z (V A D ). El té rm in o V A D p a ra d e te c to re s de a c tiv id a d se u tiliza ta m b ié n a m e n u d o cu a n d o la señ a l de e n tra d a p ue de c o m p re n d e r m ú sica . S in e m b a rg o , en los có d e cs m o de rn os , ta m b ié n es com ú n re fe rirse al d e te c to r de a c tiv id a d co m o D e te c to r de A c tiv id a d de S on id o (S A D ) cu a n d o ta m b ié n se d e b e d e te c ta r m ú s ica co m o u na se ñ a l activa .
El e s tim a d o r de fo n d o ilu s tra d o en la fig u ra 1 u tiliza la re tro a lim e n ta c ió n d e l d e te c to r p rim a rio y /o d e l b lo q u e de e sp e ra p a ra lo ca liza r se g m e n to s de la señ a l de a ud io ina c tivo s . A l d e s a rro lla r la te c n o lo g ía d e sc rita en la p re se n te m e m oria , ha s ido un d e se o e lim in a r, o al m e no s re du c ir, la d e p e n d e n c ia de d ich a re tro a lim e n ta c ió n . P o r lo ta n to , p a ra la e s tim a c ió n de fo n d o d e sc rita en la p re se n te m e m oria , e l in ve n to r ha id e n tifica d o co m o im p o rta n te p o d e r e n c o n tra r c a ra c te rís tic a s f ia b le s p a ra id e n tif ic a r las ca ra c te rís tic a s de las se ñ a le s de fo n d o cu a n d o so lo e s tá d isp o n ib le u n a seña l de e n tra d a con u na m e zc la d e s c o n o c id a de señ a l a c tiva y de fo n d o . El in ve n to r se ha d a d o c u e n ta a d e m á s de q u e no se p u e d e s u p o n e r q ue la se ñ a l de e n tra d a co m ie n ce con un se g m e n to de ru ido , o inc lu so q u e la señ a l de e n tra d a sea h a b la m e zc la d a con ru ido , ya q u e p u e d e s e r q u e la señ a l a c tiva se a m úsica .
U n a sp e c to es q ue a u n q u e la tra m a a c tua l p ue de te n e r e l m ism o n ive l de e n e rg ía q u e la e s tim a c ió n de ru ido actua l, las ca ra c te rís tic a s de fre cu e n c ia p ue de n s e r m uy d ife re n te s , lo q u e hace q u e no se a d e s e a b le re a liz a r u na a c tu a liza c ió n de la e s tim a c ió n de ru ido u tiliza n d o la tra m a a ctu a l. La fu n c ió n de p ro x im id a d in tro d u c id a , re la tiva a la a c tu a liza c ió n de l ru ido de fo n d o , se p ue de u tiliz a r p a ra e v ita r a c tu a liza c io n e s en e s to s caso s.
A d e m á s, d u ra n te la in ic ia liza c ió n es d e s e a b le p e rm itir q ue la e s tim a c ió n de ru ido c o m ie n ce lo a n tes p o s ib le e v ita n d o d e c is io n e s inco rrec tas , ya q ue e s to p o d ría re su lta r en un re corte d e l S A D si la a c tu a liza c ió n d e l ru ido de fo n d o se re a liza u tiliz a n d o co n te n id o a ctivo . El uso de u n a ve rs ió n e sp e c ífica de in ic ia liza c ió n de la c a ra c te r ís tic a de p ro x im id a d d u ra n te la in ic ia liza c ió n p ue de re so lve r, al m e no s en p arte , e s te p rob lem a .
La so lu c ió n d e s c rita en la p re se n te m e m o ria se re fie re a un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o , en p a rtic u la r a un m é to do p a ra d e te c ta r p a u sa s en u n a señ a l de a ud io q u e fu n c io n a b ie n en s itu a c io n e s de S N R d ifíc ile s . La so lu c ió n se d e s c rib irá a c o n tin u a c ió n con re fe re n c ia a las fig u ra s 2-5.
En el ca m p o de la c o d ifica c ió n de l hab la, es co m ú n u tiliz a r la lla m a d a p re d icc ió n linea l p a ra a n a liz a r la fo rm a e sp e c tra l de u na se ñ a l de e n tra d a . El a n á lis is se re a liza típ ic a m e n te d o s v e ce s p o r tra m a , y p a ra m e jo ra r la p re c is ió n te m p o ra l los re su lta d o s son luego in te rp o la d o s de m a n e ra q u e se g e n e re un f iltro p a ra ca d a b lo q ue de 5 m s de la señ a l de e n tra da .
La p re d icc ió n linea l es u na o p e ra c ió n m a te m á tica , d o n d e los va lo re s fu tu ro s de u n a señ a l de tie m p o d isc re to se e s tim a n co m o u n a fu n c ió n linea l de m u e s tra s a n te rio res . En el p ro ce sa m ie n to de se ñ a le s d ig ita le s , la p re d icc ió n lineal a m e n u d o se d e n o m in a co d ifica c ió n p re d ic tiva linea l (L P C ) y p ue de a s í v e rse co m o un su b co n ju n to de la te o ría de filtro s . En la p re d icc ió n linea l en un c o d if ic a d o r de hab la , se a p lica un f iltro de p re d icc ió n linea l A (z ) a u na señ a l de h ab la de e n tra d a . A (z ) es un f iltro to d o ce ro q u e cu a n d o se a p lica a la señ a l de e n tra d a e lim in a la re d u n d a n c ia q u e se p u e d e m o d e la r u sa n d o el f iltro A (z ) de la se ñ a l de e n tra d a . P o r lo ta n to , la señ a l de sa lid a de l f iltro tie n e m e n o r e n e rg ía q ue la se ñ a l de e n tra d a cu a n d o el f iltro log ra m o d e la r a lgún a sp e c to o a sp e c to s de la señ a l de e n tra d a . E sta se ñ a l de sa lid a se d e n o m in a "e l re s idu o", "la e n e rg ía re s id u a l" o "la señ a l re s idu a l". D ich os filtro s de p re d icc ió n linea l, d e n o m in a d o s a lte rn a tiv a m e n te co m o filtro s re s id u a le s , p ue de n s e r de d ife re n te o rde n de m o de lo con d ife re n te n úm ero de co e fic ie n te s de filtro . P o r e je m p lo , p a ra m o d e la r co rre c ta m e n te e l hab la , p u e d e s e r n ece sa rio un f iltro de p red icc ió n linea l de o rde n de m o de lo 16. A sí, en un c o d if ic a d o r de hab la , se p ue de u tiliz a r un f iltro de p re d icc ió n linea l A (z ) de o rde n de m o d e lo 16.
El in ve n to r se ha d ad o c u e n ta de q u e las ca ra c te rís tic a s re la c io n a d a s con la p re d icc ió n linea l p ue de n u tiliza rse p ara d e te c ta r p a u sa s en se ñ a le s de a ud io en un in te rva lo de S N R de 20 dB a 10 dB o p o s ib le m e n te 5 dB . Según re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m oria , se u tiliza u n a re lac ión e n tre e n e rg ía s re s id u a le s p ara d ife re n te s ó rd e n e s de m o de lo p a ra u n a señ a l de a ud io p a ra d e te c ta r p a u sa s en la señ a l de a ud io . La re lac ió n u tiliz a d a es el c o c ie n te e n tre la e n e rg ía re s idu a l de un m o d e lo de o rde n in fe rio r y un o rd e n de m o de lo su p e rio r. El co c ie n te e n tre e n e rg ía s re s id u a le s p ue de d e n o m in a rse "g a n a n c ia de p re d icc ió n linea l", ya q u e es un in d ica d o r de la can tida d de e n e rg ía de la señ a l q ue e l f iltro de p re d icc ió n linea l ha p o d id o m o de la r, o e lim in a r, e n tre un o rde n de m o de lo y o tro o rd e n de m ode lo .
La e n e rg ía re s idu a l d e p e n d e rá de l o rd e n de m o de lo M de l filtro de p re d icc ió n linea l A (z). U na fo rm a com ú n de ca lc u la r los co e fic ie n te s de f iltro p a ra un f iltro de p re d icc ió n linea l es e l a lg o ritm o de L e v in so n -D u rb in . Este a lg o ritm o es re cu rs ivo y, en el p ro ce so de c re a c ió n de un f iltro de p re d icc ió n A (z ) de o rde n M, ta m b ié n , co m o "su b p ro d u c to ", p ro d u c irá las e n e rg ía s re s id u a le s de los ó rd e n e s de m o de lo in fe rio re s . Este h echo p u e d e u tiliza rse según las re a liza c io n e s de la inve nc ión .
La F ig ura 2 m u e s tra un m é to d o g e n e ra l de e je m p lo p a ra la e s tim a c ió n de ru ido de fo n d o en u na señ a l de a ud io . El m é to d o p ue de re a liza rse m e d ia n te un e s tim a d o r de ru ido de fo n d o . El m é to do co m p re n d e o b te n e r 201 al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la señ a l de a ud io , co m o u n a tra m a o p a rte de u n a tra m a , con b ase en una p rim e ra g a n a n c ia de p re d icc ió n linea l, ca lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u n a p re d icc ió n linea l de o rde n 0 y u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y, una se g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de 2° o rde n y u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la se ñ a l de aud io .
El m é to do co m p re n d e a d e m á s d e te rm in a r 202 si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p au sa , es dec ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m ú sica , b asad a , al m e no s, en el al m e no s un p a rá m e tro o b te n id o ; y, a c tu a liz a r 203 u n a e s tim a c ió n de ru ido de fo n d o con b ase en e l se g m e n to de la señ a l de a u d io cu a n d o e l seg m en to de la se ñ a l de a ud io co m p re n d e u n a p au sa . Es d ec ir, e l m é to do co m p re n d e la a c tu a liza c ió n de u n a e s tim a c ió n de ru ido de fo n d o cu a n d o se d e te c ta u n a p a u sa en el se g m e n to de la señ a l de a ud io b asad a , al m e no s, en el al m enos un p a rá m e tro o b te n id o .
Las g a n a n c ia s de p re d icc ió n linea l p o d rían d e sc rib irse co m o u n a p rim e ra g a n a n c ia de p re d icc ió n linea l re la c io n a d a con el p aso de la p re d icc ió n linea l de o rde n 0 al 2° o rde n p a ra el se g m e n to de la se ñ a l de a ud io ; y u n a se g u n d a g a n a n c ia de p re d icc ió n linea l re la c io n a d a con el p aso de la p re d icc ió n linea l de 2° o rde n al 16° o rd e n p a ra e l seg m en to de la señ a l de a ud io . A d e m á s, la o b te n c ió n de l al m e no s un p a rá m e tro p o d ría d e sc rib irse a lte rn a tiv a m e n te com o d e te rm in a r, ca lcu la r, d e r iv a r o c rear. Las e n e rg ía s re s id u a le s re la c io n a d a s con p re d icc io n e s line a le s de m o d e lo de o rd e n 0, 2 y 16 p ue de n o b te n e rse , re c ib irse o re cu p e ra rse de, es d ec ir, p ro p o rc io n a d a s de a lg u n a m a n e ra por, una p a rte de l c o d if ic a d o r d o n d e la p re d icc ió n linea l se re a liza co m o p a rte de un p ro ce so de co d ifica c ió n re gu la r. De este m odo , la co m p le jid a d co m p u ta c io n a l de la so lu c ió n d e s c rita en la p re se n te m e m o ria p ue de re du c irse , en co m p a ra c ió n con cu a n d o las e n e rg ía s re s id u a le s n ece s ita n d e riv a rs e e sp e c ia lm e n te p a ra la e s tim a c ió n de ru ido de fon do .
El al m e no s un p a rá m e tro o b te n id o con b ase en las c a ra c te rís tica s de la p re d icc ió n linea l p u e d e p ro p o rc io n a r un a n á lis is in d e p e n d ie n te de l n ive l de la señ a l de e n tra d a q ue m e jo ra la d e c is ió n de re a liz a r u n a a c tu a liza c ió n d e l ru ido de fo n d o o no. La so lu c ió n es p a rtic u la rm e n te útil en e l in te rva lo S N R de 10 a 20 dB , d o n d e los S A D b a sa d o s en e n e rg ía tie n e n un re n d im ie n to lim itad o d e b id o al in te rva lo d in á m ico n orm a l de las se ñ a le s de hab la.
En la p re se n te m e m oria , e n tre o tras , las v a r ia b le s E (0), ..., E (m ), ..., E (M ) re p re se n ta n las e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o d e lo de 0 a M de los M+1 filtro s A m (z). T e n g a en cu e n ta q u e E (0) es so lo la e n e rg ía de e n tra d a . Un a n á lis is de la señ a l de a ud io seg ún la so lu c ió n d e sc rita en la p re se n te m e m o ria p ro p o rc io n a v a r ia s c a ra c te rís tic a s o p a rá m e tro s n u e vo s a n a liza n d o la g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u n a p re d icc ió n linea l de o rde n 0 y u na se ñ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n , y la g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u na p re d icc ió n line a l de 2° o rd e n y u n a seña l re s id u a l de u n a p re d icc ió n linea l de 16° o rde n . Es d ec ir, la g a n a n c ia de p re d icc ió n linea l p a ra p a s a r de la p re d icc ió n line a l de o rde n 0 a la de 2° o rde n es la m ism a q ue la "e n e rg ía re s idu a l" E(0) (p a ra un o rde n de m o d e lo 0) d iv id id a p o r la e n e rg ía re s idu a l E(2) (p a ra un 2° o rde n de m o de lo ). En co n se cu e n c ia , la g a n a n c ia de p re d icc ió n linea l p a ra p a sa r de la p re d icc ió n linea l de 2° o rde n a la p re d icc ió n linea l de 16° o rde n es la m ism a q u e la e n e rg ía re s idu a l E(2) (para un 2° o rde n de m o d e lo ) d iv id id a p o r la e n e rg ía re s idu a l E (16) (p a ra un 16° o rde n de m o de lo ). Los e je m p lo s de p a rá m e tro s y la d e te rm in a c ió n de p a rá m e tro s con b ase en las g a n a n c ia s de p re d icc ió n se d e sc rib irá n con m ás d e ta lle m á s a de lan te . El al m e no s un p a rá m e tro o b te n id o según la re a liza c ió n g e n e ra l d e s c rita a n te r io rm e n te p u e d e fo rm a r p a rte de un c rite r io de d e c is ió n u tiliz a d o p a ra e v a lu a r si a c tu a liz a r o no la e s tim a c ió n de ru ido de fon do .
P ara m e jo ra r la e s ta b ilid a d a la rgo p lazo de al m e no s un p a rá m e tro o ca ra c te rís tica , se p u e d e c a lc u la r u na ve rs ió n lim ita d a de la g a n a n c ia de p re d icc io n e s . Es d ec ir, la o b te n c ió n d e l al m e no s un p a rá m e tro p u e d e c o m p re n d e r lim ita r las g a n a n c ia s de p re d icc ió n linea l, re la c io n a d a s con p a s a r de la p re d icc ió n linea l de o rde n 0 al 2° o rde n y de 2° o rden al 16° o rde n , p a ra to m a r va lo re s en un in te rva lo p re d e fin id o . P o r e je m p lo , las g a n a n c ia s de p re d icc ió n linea l p ueden lim ita rse p a ra to m a r v a lo re s e n tre 0 y 8, co m o se ilus tra , p. e j., en la Eq. 1 y la Eq. 6 a co n tin u a c ió n .
La o b te n c ió n de l al m e no s un p a rá m e tro p ue de c o m p re n d e r a d e m á s la c re a c ió n de al m e no s u na e s tim a c ió n a largo p la zo de c a d a u na de la p rim e ra y de la s e g u n d a g a n a n c ia de p re d icc ió n linea l, p. e j., m e d ia n te filtra d o de paso bajo . D icha , al m e no s una , e s tim a c ió n a la rgo p la zo se b a s a ría e n to n ce s , a de m ás, en las co rre sp o n d ie n te s g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con al m e no s un se g m e n to de la señ a l de a ud io p re ce d e n te . S e p o d ría c re a r m ás de una e s tim a c ió n a la rgo p lazo, d o n d e p. e j., u n a p rim e ra y u na s e g u n d a e s tim a c ió n a la rgo p la zo re la c io n a d a s con una g a n a n c ia de p re d icc ió n linea l re a cc io n a n de m a n e ra d ife re n te a los c a m b io s en la se ñ a l de a ud io . P o r e je m p lo , u na p rim e ra e s tim a c ió n a la rgo p la zo p ue de re a cc io n a r m ás rá p id a m e n te a los c a m b io s q ue u n a s e g u n d a e s tim a c ió n a la rgo p la zo . D ich a p rim e ra e s tim a c ió n a la rgo p la zo p ue de d e n o m in a rse , a lte rn a tiva m e n te , co m o u n a e s tim a c ió n a co rto p lazo.
La o b te n c ió n de l al m e no s un p a rá m e tro p u e d e c o m p re n d e r a d e m á s d e te rm in a r u na d ife re n c ia , co m o la d ife re n c ia a b so lu ta G d _ 0 _ 2 (Eq. 3) d e sc rita a c o n tin u a c ió n , e n tre u n a de las g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con el se g m e n to de la señ a l de aud io , y u n a e s tim a c ió n a la rgo p la zo de d ich a g a n a n c ia de p re d icc ió n linea l. A lte rn a tiva m e n te o a d e m á s , se p o d ría d e te rm in a r u n a d ife re n c ia e n tre d os e s tim a c io n e s a la rgo p lazo, co m o en la Eq. 9 a co n tin u a c ió n . El té rm in o d e te rm in a r p o d ría ca m b ia rse , a lte rn a tiva m e n te , p o r ca lcu la r, c re a r o d eriva r.
La o b te n c ió n d e l al m e no s un p a rá m e tro p uede , co m o se ind icó a n te r io rm e n te , c o m p re n d e r e l f iltra d o de paso b a jo de las g a n a n c ia s de p re d icc ió n linea l, d e riva n d o a s í las e s tim a c io n e s a la rgo p la zo , de las c u a le s a lg u n a s p ueden d e n o m in a rse , a lte rn a tiva m e n te , e s tim a c io n e s a co rto p lazo, d e p e n d ie n d o de cu á n to s s e g m e n to s se to m e n en co n s id e ra c ió n en la e s tim a c ió n . Los co e fic ie n te s de f iltro de al m e no s un f iltro de p aso b a jo p ue de n d e p e n d e r de u na re lac ió n e n tre u na g a n a n c ia de p re d icc ió n linea l re lac io na da , p. e j., so la m e n te , con el se g m e n to de la señ a l de aud io a c tu a l y un p ro m e d io , d e n o ta d o p. e j., p ro m e d io a la rgo p lazo , o e s tim a c ió n a la rgo p la zo , de u n a g a n a n c ia de p re d icc ió n co rre sp o n d ie n te o b te n id a con b a se en u na p lu ra lida d de s e g m e n to s de la se ñ a l de a ud io p re ce d e n te . Esto se p u e d e re a liz a r p a ra c re a r, p. e j., a de m ás, e s tim a c io n e s a la rgo p la zo de las g a n a n c ia s de p re d icc ió n . El f iltra d o de p a so b a jo p u e d e re a liza rse en d o s o m ás p asos , d o n d e c a d a p aso p ue de re s u lta r en un p a rá m e tro , o e s tim a c ió n , q ue se u tiliz a p a ra to m a r u na d e c is ió n con re sp e c to a la p re se n c ia de u na p a u sa en e l se g m e n to de la señ a l de a ud io . P or e je m p lo , d ife re n te s e s tim a c io n e s a la rgo p lazo (co m o G 1 _ 0 _ 2 (E q .2 ) y G a d _ 0 _ 2 (E q .4), y /o , G 1 _ 2 _ 16 (E q .7), G 2 _ 2 _ 16 (E q .8 ) y G a d _ 2 _ 16 (E q .10 ) d e s c rita s a co n tin u a c ió n ) q ue re fle jan c a m b io s en la señ a l de a ud io de d ife re n te s m aneras, p ue de n a n a liza rse o c o m p a ra rse p a ra d e te c ta r u n a p a u sa en un se g m e n to de la señ a l de a ud io actua l.
La d e te rm in a c ió n 202 de si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa o no p u e d e b a sa rse a d e m á s en u n a m e d id a de p ro x im id a d e sp e c tra l a so c ia d a con e l se g m e n to de la señ a l de a ud io . La m e d id a de p ro x im id a d e sp e c tra l in d ica rá q u é tan c e rca e s tá e l n ive l de e n e rg ía "p o r b a n d a de fre cu e n c ia " d e l se g m e n to de la se ñ a l de a ud io a c tu a lm e n te p ro ce sa d o al n ive l de e n e rg ía "p o r b a n d a de fre cu e n c ia " de la e s tim a c ió n de ru ido de fo n d o a ctu a l, p. ej., un v a lo r in ic ia l o u na e s tim a c ió n q u e es e l re su lta d o de u n a a c tu a liza c ió n p re v ia re a liza d a a n tes de l a n á lis is del se g m e n to de la se ñ a l de a ud io a ctu a l. Un e je m p lo de la d e te rm in a c ió n o d e riva c ió n de u n a m e d id a de p ro x im id a d e sp e c tra l se d a a c o n tin u a c ió n en las e cu a c io n e s E q.12 y E q.13. La m e d id a de p ro x im id a d e sp e c tra l se p ue de u tiliz a r p a ra e v ita r a c tu a liza c io n e s de ru ido b a sa d a s en tra m a s de b a ja e n e rg ía con u n a g ran d ife re n c ia en las c a ra c te rís tica s de fre cu e n c ia , en co m p a ra c ió n con la e s tim a c ió n de fo n d o a c tua l. P o r e je m p lo , la e n e rg ía p ro m e d io en las b a n d a s de fre cu e n c ia p o d ría s e r ig u a lm e n te b a ja p a ra el se g m e n to de la señ a l a c tu a l y la e s tim a c ió n de ru ido de fo n d o actua l, p e ro la m e d id a de p ro x im id a d e sp e c tra l re ve la ría si la e n e rg ía se d is trib u ye de m a n e ra d ife re n te en las b a n d a s de fre cu e n c ia . D icha d ife re n c ia en la d is tr ib u c ió n de e n e rg ía p o d ría s u g e rir q ue el se g m e n to de la se ñ a l a ctu a l, p. ej., tra m a , p ue de s e r co n te n id o a c tivo de b a jo n ive l y u na a c tu a liza c ió n de la e s tim a c ió n de ru ido de fo n d o b a s a d a en la tra m a p od ría , p. e j., e v ita r la d e te cc ió n de tra m a s fu tu ra s con co n te n id o s im ila r. C om o la S N R de su b -b a n d a es m ás se n s ib le a los a u m e n to s de e n e rg ía , e l uso de co n te n id o a ctivo , inc lu so de b a jo n ive l, p ue de re s u lta r en u na g ran a c tu a liza c ió n de la e s tim a c ió n de l fo n d o si e se in te rva lo de fre cu e n c ia p a rtic u la r no e x is te en el ru ido de fo n d o , com o la p a rte de a lta fre cu e n c ia d e l h ab la c o m p a ra d a con el ru ido de l co ch e de b a ja fre cu e n c ia . D espu és de u na a c tu a liza c ió n de e s te tipo , se rá m ás d ifíc il d e te c ta r e l hab la.
C om o ya se sug irió a n te rio rm e n te , la m e d id a de p ro x im id a d e sp e c tra l p ue de d e riva rse , o b te n e rs e o ca lcu la rse con b a se en las e n e rg ía s p a ra un c o n ju n to de b a n d a s de fre cu e n c ia , o su b -b a n d a s ind ica d a s a lte rn a tiva m e n te , de l se g m e n to de la señ a l de a ud io a c tu a lm e n te a n a liza d o y a las e s tim a c io n e s de ru ido de fo n d o a c tu a le s co rre sp o n d ie n te s al c o n ju n to de b a n d a s de fre cu e n c ia . Esto ta m b ié n se e je m p lific a rá y d e s c rib irá con m ás d e ta lle m ás a de la n te , y se ilus tra en la fig u ra 5.
C om o se ind icó a n te r io rm e n te , la m e d id a de p ro x im id a d e sp e c tra l p ue de d e riva rse , o b te n e rse o ca lcu la rse co m p a ra n d o un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia a c tu a l de l se g m e n to de la señ a l de a ud io a c tu a lm e n te p ro ce sa d o con un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia de u na e s tim a c ió n de ru ido de fo n d o a ctu a l. S in e m b a rg o , p a ra e m p e za r, es d ec ir, d u ra n te un p rim e r p e río d o o un p rim e r n úm e ro de tra m a s al c o m ie n zo d e l a n á lis is de una señ a l de a ud io , p u e d e q u e no h aya u n a e s tim a c ió n fia b le d e l ru ido de fo n d o , p. e j., ya q ue aún no se h a b rá rea lizado u na a c tu a liza c ió n fia b le de u na e s tim a c ió n de ru ido de fo n d o . P o r lo tan to , p ue de a p lica rse un p e río d o de in ic ia liza c ión p a ra d e te rm in a r e l v a lo r de p ro x im id a d e sp e c tra l. D uran te d ich o p e río d o de in ic ia liza c ió n , los n ive les de e n e rg ía p o r b a n d a de fre cu e n c ia de l se g m e n to de la señ a l de a ud io a c tu a l se c o m p a ra rá n en ca m b io con u n a e s tim a c ió n de fon do in ic ia l, q ue p u e d e s e r p. e j., un v a lo r co n s ta n te q u e se p ue de co n fig u ra r. En los e je m p lo s m ás a ba jo , e s ta e s tim a c ió n de ru ido de fo n d o in ic ia l se e s ta b le ce en e l v a lo r de e je m p lo E m in= 0 ,0035. D e spu és d e l p e río d o de in ic ia liza c ió n , el p ro ce d im ie n to p ue de c a m b ia r al fu n c io n a m ie n to n o rm a l, y c o m p a ra r e l n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia a c tu a l d e l se g m e n to de la señ a l de a u d io a c tu a lm e n te p ro ce sa d o con un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia de u na e s tim a c ió n de ru ido de fo n d o a c tu a l. La d u ra c ió n de l p e río d o de in ic ia liza c ió n p u e d e co n fig u ra rse , p. e j., con base en s im u la c io n e s o p ru e b a s q u e ind ican e l t ie m p o q ue ta rd a a n tes de q ue , p. e j., se p ro p o rc io n e u n a e s tim a c ió n fia b le y /o sa tis fa c to ria de l ru ido de fon do . En un e je m p lo u tiliz a d o a c o n tin u a c ió n , la c o m p a ra c ió n con u n a e s tim a c ió n de ru ido de fo n d o in ic ia l (en lu g a r de con u n a e s tim a c ió n "rea l" d e riv a d a con b ase en la señ a l de a ud io a c tu a l) se re a liza d u ra n te las p rim e ra s 150 tra m a s .
El a l m e no s un p a rá m e tro p u e d e se r el p a rá m e tro e je m p lifica d o en el c ó d ig o m ás a ba jo , d e n o ta d o N E W _ P O S _ B G , y /o uno o m á s de la p lu ra lid a d de p a rá m e tro s d e sc rito s m ás a ba jo , lo que lle va a la fo rm a c ió n d e un c rite r io de d e c is ió n o d e un c o m p o n e n te en un c rite r io de d e c is ió n p a ra la d e te cc ió n de pau sa . En o tra s p a la b ra s , el al m e no s un p a rá m e tro , o ca ra c te rís tica , o b te n id o 201 con b ase en las g a n a n c ia s de p re d icc ió n linea l p u e d e se r uno o m ás de los p a rá m e tro s d e sc rito s a co n tin u a c ió n , p u e d e c o m p re n d e r uno o m ás de los p a rá m e tro s d e sc rito s a c o n tin u a c ió n y /o b a sa rse en uno o m ás d e los p a rá m e tro s d e sc rito s a co n tin u a c ió n .
C a ra c te rís tica s o p a rá m e tro s re la c io n a d o s con las e n e rg ía s re s id u a le s E (0) y E(2)
La F ig u ra 3 m u e s tra un d ia g ra m a de b lo q u e s g e n e ra l d e la d e riva c ió n de c a ra c te rís tic a s o p a rá m e tro s re la c io n a d o s con E(0) y E(2), seg ún una re a liza c ió n de e je m p lo . C o m o p u e d e v e rse en la fig u ra 3, la g a n a n c ia de p re d icc ió n se c a lc u la p rim e ro co m o E (0 )/E (2 ). U na v e rs ió n lim ita d a de la g a n a n c ia d e p re d icc io n e s se c a lc u la co m o
G _0_2= m ax(0 ,m in (8 ,E (0 )/E (2 ))) (Eq 1) d o n d e E(0) re p re se n ta la e n e rg ía de la señ a l d e e n tra d a y E (2) es la e n e rg ía re s idu a l d e sp u é s de u n a p re d icc ió n linea l de 2° o rde n . La e xp re s ió n en la e cu a c ió n 1 lim ita la g a n a n c ia de p re d icc ió n a un in te rva lo e n tre 0 y 8. La g a n a n c ia de p re d icc ió n d e b e se r m a yo r que ce ro p a ra ca so s n o rm a le s , p e ro p u e de n o cu rr ir a n o m a lía s , p. e j., p a ra v a lo re s ce rca n o s a ce ro y, p o r lo tan to , una lim itac ió n "m a yo r q u e c e ro " (0 <) p ue de se r útil. La razón p a ra lim ita r la g a n a n c ia de p re d icc ió n a un m á x im o d e 8 es que , p a ra el p ro p ó s ito de la so lu c ió n d e s c rita en la p re se n te m e m oria , es su fic ie n te s a b e r que la g a n a n c ia d e p re d icc ió n es a p ro x im a d a m e n te 8 o m a yo r q u e 8, lo q u e in d ica una g a n a n c ia de p red icc ió n linea l s ig n ifica tiva . D ebe se ñ a la rse q u e cu a n d o no h ay d ife re n c ia e n tre la e n e rg ía re s idu a l e n tre d o s ó rd e n e s de m ode lo d ife re n te s , la g a n a n c ia d e p re d icc ió n linea l s e rá 1, lo q u e in d ica q u e el filtro de un o rd e n de m o de lo su p e rio r no tien e m ás é x ito en m o d e la r la señ a l d e a u d io q ue el filtro de un o rd e n d e m o de lo in fe rio r. A d e m á s , si la g a n a n c ia de p re d icc ió n G _ 0 _2 a d o p ta se v a lo re s d e m a s ia d o g ra n d e s en las s ig u ie n te s e xp re s io n e s , p o d ría p o n e r en rie sgo la e s ta b ilid a d de los p a rá m e tro s d e riva d o s . D ebe se ñ a la rse que 8 es so lo un v a lo r d e e je m p lo , que se ha s e le cc io n a d o p a ra una re a liza c ió n e sp e c ífica . El p a rá m e tro G _ 0 _2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p sP _ 0 _ 2 , o gi_p_ 0 _ 2 . Luego , la g a n a n c ia de p re d icc ió n lim ita d a se f iltra en d os p a so s p a ra c re a r e s tim a c io n e s a la rgo p lazo d e e s ta g an an c ia . El p rim e r filtra d o d e paso b a jo y p o r tan to , la d e riva c ió n de u n a p rim e ra c a ra c te r ís tic a o p a rá m e tro a la rgo p la zo se re a liza com o :
Figure imgf000008_0001
D onde el s e g u n d o "G 1 _ 0 _ 2 " en la e xp re s ió n d e b e lee rse co m o el v a lo r de un se g m e n to de la señ a l de a u d io a n te rio r. E ste p a rá m e tro n o rm a lm e n te s e rá 0 u 8, d e p e n d ie n d o de l tipo de ru ido d e fo n d o en la e n tra d a u n a v e z que h aya un se g m e n to d e e n tra d a so lo d e fon do . El p a rá m e tro G 1 _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 0 _ 2 _ lp o gi_p_ 0_2 . Luego se p u e d e c re a r o c a lc u la r o tra c a ra c te r ís tic a o p a rá m e tro u tiliza n d o la d ife re n c ia e n tre la p rim e ra c a ra c te r ís tic a a la rgo p la zo G 1 _ 0 _ 2 y la g a n a n c ia de p re d icc ió n lim ita d a tra m a a tra m a G _ 0 _2 , seg ún :
G d_0_2 = a bs(G 1_ 0_2 -G _ 0_2 ) (Eq. 3)
E sto d a rá una in d ica c ió n de la g a n a n c ia de p re d icc ió n de la tra m a a c tu a l en c o m p a ra c ió n con la e s tim a c ió n a largo p la zo de la g a n a n c ia d e p re d icc ió n . El p a rá m e tro G d _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 0 _ 2 _ a d o gad_ 0_2 . En la fig u ra 3, e s ta d ife re n c ia se u tiliza p a ra c re a r u na se g u n d a e s tim a c ió n o c a ra c te r ís tic a a la rgo p lazo G a d _ 0 _ 2. E sto se hace u tiliza n d o un filtro q ue a p lic a d ife re n te s co e fic ie n te s de filtro d e p e n d ie n d o de si la d ife re n c ia a la rgo p la zo es m a yo r o m e n o r q u e la d ife re n c ia p ro m e d io e s tim a d a a c tu a lm e n te seg ún :
Figure imgf000008_0002
d on de , si G d _ 0 _ 2 < G a d _ 0 _ 2 e n to n ce s a = 0,1, s ino a = 0,2
D onde el se g u n d o "G a d _ 0 _ 2 " en la e xp re s ió n d e b e lee rse co m o el v a lo r d e un se g m e n to de la señ a l d e a ud io a n te rio r. El p a rá m e tro G a d _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., G lp _ 0_ 2 , e p sP _ 0 _ 2 _ a d _ lp o gad_0_2. P a ra e v ita r que el f iltra d o e n m a sca re d ife re n c ia s de tra m a a lta s o ca s io n a le s , se p u e d e d e riv a r o tro p a rá m e tro , q u e no se m u e s tra en la figu ra . Es d ec ir, la se g u n d a c a ra c te rís tic a a la rgo p lazo G a d _ 0 _ 2 p u e d e co m b in a rse con la d ife re n c ia de tra m a p a ra e v ita r d ich o e n m a sca ra m ie n to . E ste p a rá m e tro p u e d e d e riva rse to m a n d o el m á x im o de la ve rs ió n de tra m a G d _ 0 _ 2 y de la ve rs ió n a la rgo p la zo G a d _ 0 _ 2 d e la c a ra c te r ís tic a de g a n a n c ia de p re d icc ió n , com o :
G m ax_0_2 = m ax(G ad _0_2 ,G d_0_2 ) (Eq. 5) El p a rá m e tro G m a x_ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p s P _ 0 _ 2 _ a d _ lp _ m a x o gmax_ 0 _ 2 .
C a ra c te rís tica s o p a rá m e tro s re la c io n a d o s con las e n e rg ía s re s id u a le s E (2) y E (16)
La F ig u ra 4 m u e s tra un d ia g ra m a de b lo q u e s g e n e ra l de la d e riva c ió n de las ca ra c te rís tic a s o p a rá m e tro s re la c io n a d o s con E(2) y E (16), seg ún u n a re a liza c ió n de e je m p lo . C om o p u e d e v e rse en la f ig u ra 4, la g a n a n c ia de p re d icc ió n se c a lc u la p rim e ro co m o E (2 )/E (16 ). Las c a ra c te rís tic a s o p a rá m e tro s c re a d o s u tiliza n d o la d ife re n c ia o re lac ió n e n tre la e n e rg ía re s idu a l de 2° o rde n y la e n e rg ía re s idu a l d e 16° se d e riva n de fo rm a lig e ra m e n te d ife re n te a las d e sc rita s a n te r io rm e n te en re lac ió n con la re lac ió n e n tre las e n e rg ía s re s id u a le s d e o rde n 0 y 2°.
A qu í, ta m b ié n , una g a n a n c ia de p re d icc ió n lim ita d a se ca lc u la co m o
G _ 2_16 = m a x(0 ,m in (8 ,E (2 )/E (16))) (Eq. 6) d o n d e E(2) re p re se n ta la e n e rg ía re s idu a l d e sp u é s de u n a p re d icc ió n linea l de 2° o rde n y E (16) re p re se n ta la e n e rg ía re s idu a l d e sp u é s de una p re d icc ió n linea l de 16° o rde n . A lte rn a tiva m e n te , e l p a rá m e tro G _ 2 _ 16 p o d ría ind ica rse , p. ej., e p sP _ 2 _ 16 o gi_p_ 2 _ 16 . E s ta g a n a n c ia de p re d icc ió n lim ita d a se u tiliza lue g o p a ra c re a r d o s e s tim a c io n e s a largo p la zo d e e s ta g a n a n c ia : u n a d o n d e el co e fic ie n te de filtro d ifie re si la e s tim a c ió n a la rgo p la zo se a u m e n ta o no, com o se m u e s tra en:
G 1 _2_16=(1 -a) G 1 _ 2 _ 16 a G _ 2 _ 16 (Eq. 7) d onde , si G _ 2 _ 16 > G 1 _ 2 _ 16 e n to n ce s a = 0,2 , s ino a = 0 ,03.
El p a rá m e tro G 1 _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p s P _ 2 _ 16 _ lp o g¿p_2_16.
La se g u n d a e s tim a c ió n a la rgo p la zo u tiliz a un co e fic ie n te d e filtro co n s ta n te seg ún :
G 2 _ 2 _ 16 = ¿ (1 -b ) G 2 _ 2 _ 16 b G _ 2 _ 16. d o n d e t>= 0 ,G 2 (E q . 8 ) El p a rá m e tro G 2 _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p sP _ 2 _ 16 _ lp 2 o g p _ 0_2.
P a ra la m a yo ría d e los tip o s de se ñ a le s d e fon do , ta n to G 1 _ 2 _ 16 co m o G 2 _ 2 _ 16 e s ta rán c e rca d e 0, p e ro te n d rá n d ife re n te s re sp u e s ta s al c o n te n id o d o n d e se n ece s ite la p re d icc ió n linea l de 16° o rde n , que n o rm a lm e n te es p a ra hab la y o tro co n te n id o a ctivo . La p rim e ra e s tim a c ió n a la rgo p lazo , G 1 _ 2 _ 16 , g e n e ra lm e n te se rá m ás a lta que la s e g u n d a e s tim a c ió n a la rgo p la zo G 2 _ 2 _ 16. E s ta d ife re n c ia e n tre las c a ra c te rís tic a s a la rgo p la zo se m ide seg ún :
G d _ 2 _ 16 = G 1 _ 2 _ 16 - G 2 _ 2 _ 16 ( Eq. 9)
El p a rá m e tro G d _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , e p s P _ 2 _ 16 _ d lp o gad_2_16.
G d _ 2 _ 16 p u e d e lue g o u tiliza rse co m o e n tra d a p a ra un filtro que c re a una te rce ra c a ra c te r ís tic a a la rgo p lazo seg ún :
Figure imgf000009_0001
d on de , si G d _ 2 _ 16 < G a d _ 2 _ 16 e n to n ce s c = 0 ,02 , s ino c = 0 ,05.
E ste filtro a p lica d ife re n te s co e fic ie n te s de filtro d e p e n d ie n d o de si la te rce ra señ a l d e la rgo p la zo d e b e in c re m e n ta rse o no. El p a rá m e tro G a d _ 2 _ 16 p u e d e ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 2 _ 16 _ d lp _ lp 2 o g ad_2_16. T a m b ié n aquí, la señ a l a la rgo p la zo G a d _ 2 _ 16 p u e d e co m b in a rse con la señ a l de e n tra d a de filtro G d _ 2 _ 16 p a ra e v ita r que el f iltra d o e n m a sca re e n tra d a s a lta s o ca s io n a le s p a ra la tra m a a c tu a l. El p a rá m e tro fina l es e n to n ce s el m á x im o de la tra m a o se g m e n to y de la ve rs ió n a la rgo p la zo d e la ca ra c te rís tic a
G m ax_2_16 = m ax(G ad _2_16, G d _ 2 _ 16) (Eq. 11)
El p a rá m e tro G m a x_ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p s P _ 2 _ 16 _ d lp _ m a x o gmax_ 0 _ 2 .
M e d id a de p ro x im id a d /d ife re n c ia e sp ec tra l
U na c a ra c te r ís tic a d e p ro x im id a d e sp e c tra l u tiliza el a n á lis is d e fre cu e n c ia de la tra m a o se g m e n to de e n tra d a actua l d o n d e se c a lc u la la e n e rg ía de s u b -b a n d a y se co m p a ra con la e s tim a c ió n de fo n d o de su b -b a n d a . Se p u e d e u tiliza r un p a rá m e tro o ca ra c te rís tic a d e p ro x im id a d e sp e c tra l en c o m b in a c ió n con un p a rá m e tro re la c io n a d o con las g a n a n c ia s d e p re d icc ió n linea l d e sc rita s a n te r io rm e n te , p. e j., p a ra a se g u ra r q u e el se g m e n to o la tra m a a c tu a l e s tá re la tiva m e n te ce rca , o a l m e n o s no d e m a s ia d o le jos, de una e s tim a c ió n de fo n d o p rev ia .
La F ig u ra 5 m u e s tra un d ia g ra m a d e b lo q u e s de l cá lcu lo de una m e d id a de p ro x im id a d o d ife re n c ia e sp e c tra l. D uran te el p e río d o de in ic ia liza c ió n , p. e j., las 150 p rim e ra s tra m as , la co m p a ra c ió n se re a liza con u n a co n s ta n te c o rre sp o n d ie n te a la e s tim a c ió n d e fo n d o in ic ia l. D e sp u é s de la in ic ia liza c ió n , p a sa al fu n c io n a m ie n to n o rm a l y se co m p a ra con la e s tim a c ió n d e fon do . T e n g a en c u e n ta q u e m ie n tra s e l a n á lis is e sp e c tra l p ro d u ce e n e rg ía s de s u b ­ b a n d a p a ra 20 su b -b a n d a s , el cá lcu lo de n o n s ta B a q u í so lo u sa s u b -b a n d a s i = 2, ... 16, y a que es p r in c ip a lm e n te en e s ta s b a n d a s d o n d e se u b ica la e n e rg ía de l hab la . A q u í n o n s ta B re fle ja la no e s ta c io n a lid a d .
A sí, d u ra n te la in ic ia liza c ió n , n o n s ta B se c a lc u la u tiliza n d o una Em in , q u e a q u í se e s ta b le ce a Em in = 0 ,0035 com o :
nonstaB = sum (abs(log (E cb (i)+1 )-lo g (E m in 1 ))) (Eq. 12)
d o n d e la su m a se hace so b re i = 2, ... 16.
E sto se hace p a ra re d u c ir el e fe c to de los e rro re s de d e c is ió n en la e s tim a c ió n de ru ido d e fo n d o d u ra n te la in ic ia liza c ió n . D e sp u é s de l p e río d o de in ic ia liza c ió n , el cá lcu lo se re a liza u tiliza n d o la e s tim a c ió n d e ru ido de fon do a c tu a l de la su b -b a n d a re spe ctiva , se g ú n :
nonstaB = sum (abs(log (E cb (i)+1 )-lo g (N cb (i)+ 1 ))) (Eq. 13)
d o n d e la su m a se hace so b re i = 2 ...16.
La a d ic ió n de la co n s ta n te 1 a c a d a e n e rg ía d e su b -b a n d a a n te s d e l lo g a ritm o re du ce la s e n s ib ilid a d de la d ife re n c ia e sp e c tra l p a ra tra m a s de b a ja e ne rg ía . El p a rá m e tro n on s ta B p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., n o n _ s ta B o n o n s ta tB .
Un d ia g ra m a de b lo q u e s q u e ilu s tra una re a liza c ió n de e je m p lo de un e s tim a d o r de fo n d o se m u e s tra en la fig u ra 6. La re a liza c ió n en la fig u ra 6 co m p re n d e un b lo q u e p a ra el E n tra m a d o de E n tra d a 601, q ue d iv id e la se ñ a l d e a ud io de e n tra d a en tra m a s o se g m e n to s de lon g itu d a d e cu a d a , p. e j., 5 -30 m s. La re a liza c ió n co m p re n d e a d e m á s un b lo q u e p a ra la E x tracc ión de C a ra c te rís tica s 602 q u e c a lc u la las ca ra c te rís tica s , ta m b ié n d e n o ta d a s p a rá m e tro s en la p rese n te m e m oria , p a ra c a d a tra m a o se g m e n to de la señ a l de en tra da . L a re a liza c ió n co m p re n d e a d e m á s un b lo q ue p a ra la L ó g ica d e D ec is ión de A c tu a liza c ió n 603 , p a ra d e te rm in a r si u n a e s tim a c ió n de fo n d o p u e d e a c tu a liza rse o no con b a se en la se ñ a l en la tra m a a c tu a l, es d ec ir, si el se g m e n to de se ñ a l e s tá lib re de co n te n id o a c tivo co m o h a b la y m ú sica . La re a liza c ió n co m p re n d e a d e m á s un A c tu a liz a d o r de F ondo 604 , p a ra a c tu a liza r la e s tim a c ió n de ru ido de fo n d o c u a n d o la ló g ica de d e c is ió n de a c tu a liza c ió n in d ica q u e es a d e cu a d o h ace rlo . En la re a liza c ió n ilus tra da , se p u e d e d e riv a r u n a e s tim a c ió n de ru ido de fo n d o p o r su b -b a n d a , es d ec ir, p a ra va r ia s b a n d a s de fre cu e n c ia .
La so lu c ió n d e s c r ita en la p re se n te m e m o ria p u e d e u tiliza r p a ra m e jo ra r u na so lu c ió n a n te r io r p a ra la e s tim a c ió n de ru ido d e fon do , d e sc rita en el A n e xo A d e la p re se n te m e m oria , y ta m b ié n en el d o cu m e n to W O 2011 /049514. A c o n tin u a c ió n , la so lu c ió n d e s c rita en la p re se n te m e m o ria se d e s c rib irá en el co n te x to de e s ta so lu c ió n d e sc rita a n te r io rm e n te . S e d a rá n e je m p lo s de có d ig o de u n a im p le m e n ta c ió n d e có d ig o d e u n a re a liza c ió n de un e s tim a d o r de ru ido de fondo .
A co n tin u a c ió n , se d e sc rib e n los d e ta lle s de im p le m e n ta c ió n re a le s p a ra u n a re a liza c ió n de la in ve n c ió n en un c o d ific a d o r b a sa d o en G .718. E s ta im p le m e n ta c ió n u tiliza m u ch a s de las c a ra c te rís tic a s e n e rg é tica s d e sc rita s en la so lu c ió n en el A n e xo A y en W O 2011 /049514. P a ra o b te n e r m ás d e ta lle s que los q ue se p re se n ta n a co n tin u a c ió n , c o n su lte e l A n e xo A y W O 2011 /049514.
Las s ig u ie n te s c a ra c te rís tic a s e n e rg é tica s se d e fin e n en W O 2011 /049514 :
Ecot;
Ecot 1 lp;
Etot v h;
total Noise
ai gn dyn lp
Las s ig u ie n te s c a ra c te rís tic a s de co rre la c ió n se d e fin e n en W O 2011 /049514 :
aEn;
har:n_cor_cnt
act_pred
cor est
Las s ig u ie n te s c a ra c te rís tic a s se d e fin ie ro n en la so lu c ió n p ro p o rc io n a d a en el A n e xo A:
Etüt_v_h;
lt_cor_ea3 = 0.Olf *cor_eat - 0 . 'lt_cor_eaP;
lt_tr._track = G.G3Í' (Idot - “otalNoiae < _Q] - Q.97f*lt tn track:;
lt_Tn_clist = G.G3f* (Eoot - ootalNoiae) - 0 .97f 'lt_tn_diat;
lt_Ellp_diat = G.03Í* {Rtot - Et ot l l p) - G.97f *lt_Ellp_diat;
harm_cou_cnt
low_tn_tr ack_cnt
La ló g ica d e a c tu a liza c ió n de ru ido de la so lu c ió n p ro p o rc io n a d a en el A n e xo A se m u e s tra en la fig u ra 7. Las m e jo ras , re la c io n a d a s con la so lu c ió n d e s c r ita en la p re se n te m em oria , de l e s tim a d o r d e ru ido de l A n e xo A e stán re la c io n a d a s p rin c ip a lm e n te con la p a rte 701 d o n d e se ca lcu la n las c a ra c te rís tica s ; con la p a rte 702, d o n d e las d e c is io n e s d e p a u sa se to m a n con base en d ife re n te s p a rá m e tro s ; y a d e m á s con la p a rte 703 , d o n d e se to m a n d ife re n te s a cc io n e s en base de si se d e te c ta u n a p a u sa o no. A d e m á s, las m e jo ra s p u e d e n te n e r un e fe c to sob re la a c tu a liza c ió n 704 de la e s tim a c ió n de ru ido de fon do , q u e p od ría , p. e j., a c tu a liza rse cu a n d o se d e te c te u na p a u sa con base en las n uevas c a ra c te rís tica s , la cua l no h a b ría s ido d e te c ta d a a n tes de in tro d u c ir la so lu c ió n d e sc rita en la p re se n te m e m oria . E n la im p le m e n ta c ió n de e je m p lo d e sc rita aquí, las n u e va s ca ra c te rís tic a s in tro d u c id a s en la p re se n te m e m o ria se ca lcu la n co m o s igue, c o m e n za n d o con n on _s taB , q ue se d e te rm in a u tiliza n d o las e n e rg ía s de su b -b a n d a de la tra m a a c tu a l e n r[i], q u e co rre sp o n d e a Ecb(i) a rrib a y en la fig u ra 6, y la e s tim a c ió n de ru ido de fo n d o a c tu a l bckr[i], q u e co rre sp o n d e a N cb (i) a rrib a y en la fig u ra 6. La p rim e ra p a rte de la p rim e ra se cc ió n de c ó d ig o a c o n tin u a c ió n e s tá re la c io n a d a con un p ro ce d im ie n to in ic ia l e sp e c ia l p a ra las p rim e ra s 150 tra m a s de u na señ a l de a ud io , a n tes de q ue se h aya d e riva d o u na e s tim a c ió n de fo n d o a de cu a d a .
P calcular característica no estacionaria relativa al fondo (característica de proximidad espectral non_staB 7 rf(ini fíame <150)
{
P Curante inic. no incluir actualizaciones 7
i f ( i> = 2 & 8 : < = 16)
{
non SüB ♦= (lt{>3l)fó¡)S(los(efirj¡] ■ 1-CT> -log(E MIN 1.01});
}
>
dse
(
P Después de inic. comparar con estimación de fondo *1
L f ( ¡ > = 2 ¿ ¿ !< ^ 16)
{
non staB = (froat]ifabs(log(enr[¡J I.OfJ -iog(bcStr[¡] i,0í)};
}
í
if (non staB >= 126)
{
non staB = 32767.0/256.01:
}
Las se cc io n e s de c ó d ig o a c o n tin u a c ió n m u es tra n có m o se ca lcu la n las n u e va s c a ra c te rís tica s p a ra las e n e rg ía s re s id u a le s de la p re d icc ió n linea l, es dec ir, p a ra la g a n a n c ia de p re d icc ió n linea l. A q u í las e n e rg ía s re s id u a le s se d e n o m in a n e p sP [m ] (cf. E (m ) u tiliz a d o a n te rio rm e n te ).
■ Eficiencia (Je predtCCf&C» lineal Óe orden 062
■(Ja ganancia de predicción im e a líu e va dei modelo deorden 0 a i2 * dei filtro
se predicción Irreal)
*----------------------------------- ------------------ --------- --------- .7
epsP..Ü_2 - max(0 . miíi(S. ep>sP[0I / ep5Pf2]^);
epsP.O_2_lp = 0.15 f ' epsP_0.2 (VCif-0.15f]- s t-^e psP .O .Í lp;
cpsP 0..2 = {¡lD at)fabs{ep5P.0_2-epsP 0 2 :p j;
if (cpsP 0 2 ad < epsP 0 2 ñ i Jp)
i
cpsP 0 2 ad lp = G , i f ’ epsP 0 2 a d * ( 1.0 f - 0.11)’ ep&P D 2 ad Ipt
J
etee
Figure imgf000012_0001
ip:
'Eficiencia de predicción lineal fie orden 2 a 1 f
'i ganancia de predicción K nee lo i» v a d e ! modelo de o ríe n 2 * al 16* dei f t r o
de predicción linea I!
’ -------------------------------------------------------------------------7
cpsP 2.16 = m a x(0. epsP¡2| / epsP(l6]j)L
if {epsP 2 16- > cpsP 2 16 Ip)
f
epsPJMG \p = O.Zf * é¡p íP_.2..16 + {t.Of^O.21} * epsP 2. I 6jp ¡
}
else
{
epsP_2_16_lp = 0.03f * epsP_2_16 (1.0f-0.03f) * epsP_2_16_lp;
}
epsP_2_16_lp2 = 0.02f * epsP_2_16 (1.0f-0.02f) * epsP_2_16Jp2;
epsP_2_16_dlp = epsP_2_16_lp-epsP_2_16_lp2;
if (epsP_2_16_dlp < epsP_2_16_dlp_lp2 )
{
epsP_2_16_dlp_lp2 = 0.02f * epsP_2_16_dlp (1.0f-0.02f) * epsP_2_16_dlp_lp2;
}
else
{
epsP_2_16_dlp_lp2 = 0.05f * epsP_2_16_dlp (1.0f-0.05f) * epsP_2_16_dlp_lp2;
}
epsP_2_16_dlp_max = max(epsP_2_16_dlp,epsP_2_16_dlp_lp2);
El c ó d ig o a co n tin u a c ió n ilu s tra la c re a c ió n de m é tricas , u m b ra le s e in d ica d o re s co m b in a d o s u tiliza d o s p a ra la d ec is ió n de a c tu a liza c ió n real, es d ec ir, la d e te rm in a c ió n de si a c tu a liza r la e s tim a c ió n de ru ido de fo n d o o no. A l m e n o s a lg u n o s de los p a rá m e tro s re la c io n a d o s con las g a n a n c ia s d e p re d icc ió n linea l y /o con la p ro x im id a d e sp e c tra l se ind ican en neg rita .
comb_ahc_epsP = max(max(act_pred,lt_haco_ev),epsP_2_16_dlp);
comb_hcm_epsP = max(max(lt_haco_ev,epsP_2_16_dlp_max),epsP_0_2_ad_lp_max);
haco_ev_max = max(st_harm_cor_cnt==0,>lt_haco_ev);
Etot_l_lp_thr = st->Etot_l_lp (1.5f 1,5f * (Etot_lp<50.0f))*Etot_v_h2;
enr_bgd = Etot < Etot_IJp_thr;
cns_bgd = (epsP_0_2 > 7.95f) && (non_sta< 1e3f);
lp_bgd = epsP_2_16_dlp_max < 0.10f;
ns_mask = non_sta < 1e5f;
lt_haco_mask = lt_haco_ev < 0.5f;
bg_haco_mask = haco_ev_max < 0.4f;
SD_1 = ( (epsP_0_2_ad > 0.5f) && (epsP_0_2 > 7.95f));
bg_bgd3 = enr_bgd || ( ( cns_bgd || lp_bgd ) && ns_mask && lt_haco_mask && SD_1==0);
PD_1 = (epsP_2_16_d Ip_max < 0.1 Of);
PD_2 = (epsP_0_2_ad_lp_max < 0.1 Of);
PD_3 = (comb_ahc_epsP < 0.85f);
PD_4 = comb_ahc_epsP < 0.15f;
PD_5 = comb_hcm_epsP < 0.30Í;
BG_1 = ( (SD_1==0) || (Etot < Etot_l_lp_thr)) && bg_haco_mask && (act_pred < 0.85f) && (E to tjp < 50.Of);
PAU = (a e n --0 > j|( (E to t-= 5 5 .0 f ) !.SD 1^=0) && f i PO.3 S&{PD 1 | | P Ü 2 ) ) | | (P D .4 ||F D 5 ) ) ) :
NEW POS BG = (PAJ | &G .1>S bg.bgdS:
i* Detector de silencie origina! funciona en !a m ayó la de los casos */
aE_bgd - aErt = 0;
Cuando la dinámica de señal es alta y la energía está cerca a la estimación de fondo
s d i bgd = (st->sign dyn ip > 15) && ;E b t- s(->Etot i í p ) < 2'st->Elot cor cn l > 20;
! ’ condiciones de m¡c. caen de forma regular act_pred y/c lt_naca_ev V
tn in i = in i.fra m e < 150 && hanm.oo=r.cn t> 5 £ £
( (st->acl_pntíd c D.59f &&. st->lt_baK)_ev <Q.23í) ||
5t->act pned < Q,38í j|
st->n_h&co_ev < 0.1 Sí ||
ron- staB * 50,Of |[
y*
r La energía cerca de la estimación de fondo .sirve como máscara para otros detectores de fondo jgr
üg_bgd2 - Etol < E to 'J J p J h í || ln_¡n ;
C om o es im p o rta n te no h a ce r u na a c tu a liza c ió n d e la e s tim a c ió n de ru ido de fo n d o cu a n d o u n a tra m a o seg m e n to a c tu a l co m p re n d e co n te n id o a ctivo , se e va lú a n va r ia s c o n d ic io n e s p a ra d e c id ir si se d e b e re a liz a r u na a c tu a liza c ió n . El paso d e d e c is ió n p rin c ip a l en la ló g ica de a c tu a liza c ió n de ru ido es si se d eb e re a liza r u na a c tu a liza c ió n o no, y esto se fo rm a m e d ia n te la e va lu a c ió n de u na e xp re s ió n lóg ica , q ue se s u b ra ya a co n tin u a c ió n . El n ue vo p a rá m e tro N E W _ P O S _ B G (n ue vo en re la c ió n con la so lu c ió n en el A n e xo A y en W O 2011 /049514 ) es un d e te c to r de p a u sa y se o b tie n e con b ase en las g a n a n c ia s de p re d icc ió n linea l q ue va n d e l m o de lo de o rde n 0 a l 2°, y de l 2° al 16° de un filtro de p re d icc ió n linea l, y tn _ in i se o b tie n e con b ase en las ca ra c te rís tic a s re la c io n a d a s con la p ro x im id a d e sp e c tra l. A co n tin u a c ió n , se m u e s tra u na ló g ica de d e c is ió n q ue u tiliza las n u e va s c a ra c te rís tica s , seg ún la re a liza c ió n de e je m p lo .
updt_step=O.Of;
if ( ( bq bqd2 && ( aE bqd II sd1 bqd II It tn track >0.90f II NEW POS BG m i
tn ¡ni )
{
if( ( ( act_pred < 0.85f) &&
aE_bgd &&
( lt_Ellp_dist < 10 || sd1_bgd) && lt_tn_dist<40 &&
( ( Etot- totalNoise) < 10.Oí) ) ||
( st->first_noise_updt == 0 && st->harm_cor_cnt > 80 && aE_bgd && st->lt_aEn_zero > 0.5 f) || ( tn_ in i && ( aE_bgd || non_staB < 10.0 || st->harm_cor_cnt > 80) )
)
{
updt_step=1.0f;
st->first_noise_updt = 1;
for( i=0; i< NB_BANDS; i+ )
{
st->bclír|i] ■ tmpNf]:
í
)
e fse if ( ( ( 5L->3d_pred< O.BOf) Á & ( aE_bgd || PAU ] && s t H U i m j W ^ O.IOT) ||
( ( st->3c(jxed < 0l7W ) $ £ ( aE_bgd || non staB < i7.Df st*>H_haoo_ev< 0.15Í)|| ( £t->harm_cor_cnt > SO SS slo lo ta i Noise > 5.0Í&& Etat < m3x(1.0f,Et&t_l_lp * l . s r st-:>Etot_Y_h2)) || ( $t->ham _cof_onl > 50 si’> lír íL io isc_ u p íit > 30 S.4 aE_bgd S& sM t_a£rt_ íe íO *Q -5f) || in jfln
)
{
updl_step=Q.if;
if(!aE_bgd£S
s1»bann_DQr_cnt < 50 &&
(« t^a C L F D d > 0 u 6 f||
( !tn ir iS A É:c-t l rp - st->toíalNo¡S0 < lO.Of rton s la B > 8.0 f ) ) }
{
updt s1ep=0.0lí;
>
(f (updt, slep > 0.C1)
(
s1->firsl_r»¡se_updl = 1;
fort i=0; i-= MB BAÑOS; i**-)
í
st->bd(f[i| = s(->bc3ir[¡] updt slep *(tmpN[i^st-*bckí[¡|);
}
I
}
else ¡f (aE_bgd || s¡-?h3rm cof_cnt ? 100)
í
Figure imgf000014_0001
}
I
else
í
/ 'S ie n música ta já r te lo para bajar adición a Imente V
if [ $t'?low_!n_iíaci¡._cfli > 300 S i swJLhaco.ev *0.9f && Mo¡a; > ü.Ofl
í
updt_si)ep=-0.0?f:
tort r=0: i< N B B A Ñ O S E * }
f
Figure imgf000015_0001
st->bckít=| = O.SS('5i->bcftíti]:
}
)
)
í
3En_z»fl> = 0.2f ' ( s t ^ É n = ^ i ) ( l4.2f)*st->tt_aEii zero.
C om o se ind icó a n te rio rm e n te , las ca ra c te rís tic a s de la p re d icc ió n linea l p ro p o rc io n a n un a n á lis is in d e p e n d ie n te del n ive l de la se ñ a l de e n tra d a q ue m e jo ra la d e c is ió n de a c tu a liza c ió n d e l ru ido de fo n d o , lo cu a l es p a rticu la rm e n te útil en el in te rva lo S N R de 10 a 20dB , d o n d e los S A D b a sa d o s en la e n e rg ía tie n e n un re n d im ie n to lim itad o d e b id o al in te rva lo d in á m ico norm a l de la se ñ a le s de l h a b la .
Las ca ra c te rís tic a s de p ro x im id a d del fo n d o ta m b ié n m e jo ran la e s tim a c ió n de ru ido de fo n d o , ya q ue p ue de n u tiliza rse ta n to p a ra la in ic ia liza c ió n co m o p a ra e l fu n c io n a m ie n to n orm a l. D u ran te la in ic ia liza c ió n , p u e d e p e rm itir u na rá p ida in ic ia liza c ió n d e l ru ido de fo n d o (n ive l m ás b a jo ) con co n te n id o p rin c ip a lm e n te de b a ja fre cu e n c ia , co m ú n p a ra e l ru ido d e l coch e . A d e m á s, las fu n c io n e s p u e d e n u tiliza rse p a ra e v ita r a c tu a liza c io n e s de ru ido u tiliz a n d o tra m a s de ba ja e n e rg ía con u na g ran d ife re n c ia en las c a ra c te rís tic a s de fre cu e n c ia en c o m p a ra c ió n con la e s tim a c ió n de fo n d o actua l, lo q u e su g ie re q u e la tra m a a c tu a l p u e d e s e r co n te n id o a c tivo de b a jo n ive l y u n a a c tu a liza c ió n p o d ría e v ita r la d e te cc ió n de fu tu ra s tra m a s con co n te n id o s im ila r.
Las F ig uras 8 -10 m u es tra n có m o se co m p o rta n los p a rá m e tro s o m é trica s re sp e c tivo s p a ra e l h ab la en s e g u n d o p lano con u na S N R de ru ido de co ch e de 10 dB . En las fig u ra s 8 -10 , los p u n to s , "•", re p re se n ta n c a d a uno la e n e rg ía de la tra m a . P ara las fig u ra s 8 y 9a-c , la e n e rg ía se ha d iv id id o p o r 10 p a ra q ue se a m ás c o m p a ra b le p a ra las c a ra c te rís tica s b a sa d a s en G _ 0 _ 2 y G _ 2 _16. Los d ia g ra m a s co rre sp o n d e n a u na señ a l de a ud io q u e co m p re n d e d o s e xp re s io n e s , d o n d e la p o s ic ió n a p ro x im a d a p a ra la p rim e ra e xp re s ió n e s tá en las tra m a s 1310 - 1420 y p a ra la s e g u n d a e xp re s ió n , en las tra m a s 1500 - 1610.
La F ig u ra 8 m u e s tra la e n e rg ía de la tra m a (/10 ) (pun to , "•") y las ca ra c te rís tic a s G _ 0 _2 (c írcu lo , "o ") y G m a x_ 0 _ 2 (m ás, "+ "), p a ra e l h ab la con S N R de 10dB con ru ido de co ch e . T e n g a en cu e n ta q u e G _ 0 _2 es 8 d u ra n te el ru ido de coch e , ya q u e e x is te c ie rta co rre la c ió n en la señ a l q ue p ue de m o d e la rse u tiliza n d o p re d icc ió n linea l con e l o rd e n de m o de lo 2. D uran te las e xp re s io n e s , la c a ra c te r ís tic a G m a x_ 0 _ 2 se v u e lve s u p e r io r a 1,5 (en e s te ca so ) y d e sp u é s de la rá fa g a de vo z cae a 0. En u n a im p le m e n ta c ió n e sp e c ífica de u n a ló g ica de d e c is ió n , e l G m a x_ 0 _ 2 d e b e e s ta r p o r d e b a jo de 0,1 p a ra p e rm itir a c tu a liza c io n e s de ru ido u tiliza n d o e s ta fu n c ió n .
La F ig u ra 9a m u e s tra la e n e rg ía de la tra m a (/10 ) (p un to , "•") y las ca ra c te rís tic a s G _ 2 _ 16 (c írcu lo , "o"), G 1 _ 2 _ 16 (c ruz , "x"), G 2 _ 2 _ 16 (m ás, "+ "). La F ig u ra 9b m u e s tra la e n e rg ía de la tra m a (/10) (pun to , "•") y las ca ra c te rís tica s G _ 2 _ 16 (c írcu lo , "o"), G d _ 2_16 (c ruz , "x") y G a d _ 2 _ 16 (m ás, "+ "). La F ig ura 9c m u e s tra la e n e rg ía de la tra m a (/10) (p un to , "•") y las c a ra c te rís tica s G _ 2 _ 16 (c írcu lo , "o ") y G m a x_ 2 _ 16 (m ás, "+ "). Los d ia g ra m a s q u e se m u es tra n en las fig u ra s 9 a-c ta m b ié n se re fie ren al h ab la con S N R de 10dB con ru ido de coch e . Las c a ra c te rís tic a s se m u es tra n en tre s d ia g ra m a s p a ra fa c ilita r la v isu a liz a c ió n de ca d a p a rá m e tro . T e n g a en c u e n ta q u e G _ 2 _ 16 (c írcu lo , "o ") e s tá ju s to p o r e n c im a de 1 d u ra n te e l ru ido de co ch e (es d ec ir, e xp re s io n e s e x te rn a s ), lo q u e in d ica q u e la g a n a n c ia de l o rden de m o de lo s u p e r io r es b a ja p a ra e s te tip o de ru ido . D uran te las e xp re s io n e s , la ca ra c te rís tic a G m a x_ 2 _ 16 (m ás, "+" en la fig u ra 9c) a u m e n ta y lue g o c o m ie n z a a c a e r de n ue vo a 0. En u na im p le m e n ta c ió n e sp e c ífica de u n a ló g ica de d e c is ió n , la c a ra c te r ís tic a G m a x_ 2 _ 16 ta m b ié n tie n e q ue se r in fe rio r a 0,1 p a ra p e rm itir a c tu a liz a c io n e s de ru ido . En e s ta m u e s tra de señ a l de a ud io en p a rticu la r, e s to no o cu rre .
La F ig u ra 10 m u e s tra la e n e rg ía de la tra m a (p un to ,
Figure imgf000015_0002
(no d iv id id a p o r 10 e s ta v e z ) y la c a ra c te r ís tic a n on sta B (m ás, "+ ") p a ra e l h ab la con S N R de 10dB con ru ido de co ch e . La ca ra c te rís tic a n on sta B e s tá en e l in te rva lo de 0 a 10 d u ra n te los se g m e n to s de so lo ru ido , y p a ra las e xp re s io n e s , se v u e lve m u ch o m ás g ra n d e (ya q ue las c a ra c te rís tica s de fre cu e n c ia son d ife re n te s p a ra el hab la ). D ebe se ñ a la rse que , s in e m b a rg o , inc lu so d u ra n te las e xp re s io n e s hay tra m a s en las q u e la c a ra c te r ís tic a n o n s ta B ca e en el in te rva lo de 0 a 10. P ara e s ta s tra m a s p o d ría e x is t ir la p os ib ilid a d de re a liz a r a c tu a liza c io n e s de l ru ido de fo n d o y a s í ra s tre a r m e jo r el ru ido de fon do .
La so lu c ió n d e s c rita en la p re se n te m e m o ria ta m b ié n se re fie re a un e s tim a d o r de ru ido de fo n d o im p le m e n ta d o en h a rd w a re y /o so ftw a re .
E s tim a d o r de ru ido de fo n d o , f ig u ra s 11 a -11 c
U na re a liza c ió n de e je m p lo de un e s tim a d o r de ru ido de fo n d o se ilus tra de m a n e ra g e n e ra l en la fig u ra 11a. P or e s tim a d o r de ru ido de fo n d o se h ace re fe re n c ia a un m ó du lo o e n tid a d c o n fig u ra d a p a ra e s tim a r e l ru ido de fo n d o en se ñ a le s de a ud io q ue c o m p re n d e n , p. e j., h ab la y /o m ú sica . El c o d if ic a d o r 1100 se co n fig u ra p a ra re a liza r al m enos un m é to d o co rre sp o n d ie n te a los m é to d o s d e s c rito s a n te r io rm e n te con re fe ren c ia , p. e j., a las fig u ra s 2 y 7. El c o d if ic a d o r 1100 e s tá a so c ia d o con las m ism a s ca ra c te rís tic a s té cn ica s , o b je to s y ve n ta ja s q ue las re a liza c io n e s del m é to do d e sc rita s a n te r io rm e n te . El e s tim a d o r de ru ido de fo n d o se d e s c rib irá b re ve m e n te p a ra e v ita r re p e tic io n e s inn e ce sa ria s .
El e s tim a d o r de ru ido de fo n d o p u e d e im p le m e n ta rse y /o d e s c rib irse co m o s igu e :
El e s tim a d o r de ru ido de fo n d o 1100 se co n fig u ra p a ra e s tim a r un ru ido de fo n d o de u na señ a l de aud io . El e s tim a d o r de ru ido de fo n d o 1100 co m p re n d e un c ircu ito de p ro ce sa m ie n to , o m e d io de p ro ce sa m ie n to 1101 y u n a in te rfaz de co m u n ica c ió n 1102. El c ircu ito de p ro c e sa m ie n to 1101 se c o n fig u ra p a ra h a c e r q u e e l c o d if ic a d o r 1100 o b te n g a , p. e j., d e te rm in e o ca lcu le , al m e no s un p a rá m e tro , p. e j., N E W _ P O S _ B G , con base en u n a p rim e ra g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u na p re d icc ió n linea l de o rde n 0 y u na señal re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y u na s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n y u n a señ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la se ñ a l de aud io.
El c ircu ito de p ro ce sa m ie n to 1101 se co n fig u ra a d e m á s p a ra h a c e r q u e e l e s tim a d o r de ru ido de fo n d o d e te rm in e si el se g m e n to de la se ñ a l de a ud io co m p re n d e u n a p ausa , es d ec ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m úsica , con b ase en el al m e no s un p a rá m e tro . El c ircu ito de p ro ce sa m ie n to 1101 se c o n fig u ra a d e m á s p a ra h a ce r q u e el e s tim a d o r de ru ido de fo n d o a c tu a lice u n a e s tim a c ió n de ru ido de fo n d o con base en e l se g m e n to de la se ñ a l de a ud io cu a n d o el se g m e n to de la señ a l de a ud io co m p re n d e u na pausa .
La in te rfaz de co m u n ica c ió n 1102, q ue ta m b ié n p ue de ind ica rse , p. e j., in te rfaz de E n tra d a /sa lid a (I/O ), inc lu ye una in te rfaz p a ra e n v ia r d a to s y re c ib ir d a to s de o tra s e n tid a d e s o m ó du los . P o r e je m p lo , las se ñ a le s re s idu a le s re la c io n a d a s con los ó rd e n e s d e l m o d e lo de p re d icc ió n linea l 0, 2 y 16 p ue de n o b te n e rse , p. e j., re c ib irse , a tra vé s de la in te rfaz de I/O, de un c o d if ic a d o r de señ a l de a ud io q ue re a liza co d ifica c ió n p re d ic tiva linea l.
El c ircu ito de p ro ce sa m ie n to 1101 p od ría , co m o se ilus tra en la fig u ra 11b, c o m p re n d e r m e d io s de p ro ce sa m ie n to , co m o un p ro c e sa d o r 1103, p. e j., u n a C P U y u na m e m o ria 1104 p a ra a lm a c e n a r o re te n e r in s tru cc io n e s . La m e m o ria c o m p re n d e ría e n to n ce s in s tru cc io n e s , p. e j., en fo rm a de un p ro g ra m a in fo rm á tico 1105, q u e cu a n d o es e je cu ta d o p o r los m e d io s de p ro ce sa m ie n to 1103 hace q ue e l c o d if ic a d o r 1100 re a lice las a cc io n e s d e sc rita s a n te rio rm e n te .
U na im p le m e n ta c ió n a lte rn a tiva de l c ircu ito de p ro ce sa m ie n to 1101 se m u e s tra en la fig u ra 11c. El c ircu ito de p ro ce sa m ie n to a q u í co m p re n d e u n a u n id ad de o b te n c ió n o d e te rm in a c ió n o m ó d u lo 1106, co n fig u ra d o p a ra h a c e r que el e s tim a d o r de ru ido de fo n d o 1100 o b te n g a , p. e j., d e te rm in e o ca lcu le , al m e no s un p a rá m e tro , p. e j., N E W _ P O S _ B g , con b ase en u n a p rim e ra g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de o rde n 0 y u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na se ñ a l re s idu a l de una p re d icc ió n linea l de 2° o rde n y u n a señ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la señal de a ud io . El c ircu ito de p ro ce sa m ie n to co m p re n d e a d e m á s u na u n id ad o m ó du lo de d e te rm in a c ió n 1107, co n fig u ra d a p a ra h a ce r q ue el e s tim a d o r de ru ido de fo n d o 1100 d e te rm in e si el se g m e n to de la señ a l de a ud io co m p re n d e u na p au sa , es d e c ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m ú sica , con b ase en el al m enos un p a rá m e tro . El c ircu ito de p ro ce sa m ie n to 1101 co m p re n d e a d e m á s u n a u n id ad o m ó d u lo de a c tu a liza c ió n o e s tim a c ió n 1110, co n fig u ra d a p a ra h a ce r q u e e l e s tim a d o r de ru ido de fo n d o a c tu a lice u na e s tim a c ió n de ru ido de fo n d o con b ase en e l se g m e n to de la señ a l de a ud io cu a n d o el se g m e n to de la se ñ a l de a ud io co m p re n d e u na pausa .
El c ircu ito de p ro ce sa m ie n to 1101 p o d ría c o m p re n d e r m ás u n id a d e s , co m o u na u n id ad o m ó d u lo de f iltro co n fig u ra d a p a ra h a c e r q u e el e s tim a d o r de ru ido de fo n d o f iltre en p a so b a jo las g a n a n c ia s de p re d icc ió n linea l, c re a n d o a s í una o m ás e s tim a c io n e s a la rgo p lazo de las g a n a n c ia s de p re d icc ió n linea l. De lo co n tra r io , se p u e d e n re a liza r a cc io n e s co m o e l f iltra d o de p aso ba jo , p. e j., p o r la u n id ad o m ó du lo de d e te rm in a c ió n 1107.
Las re a liza c io n e s de un e s tim a d o r de ru ido de fo n d o d e sc rita s a n te r io rm e n te p o d rían co n fig u ra rs e p a ra las d ife re n te s re a liza c io n e s de l m é to d o d e sc rita s en la p re se n te m e m oria , co m o la lim ita c ió n y e l f iltra d o de p a so b a jo de las g a n a n c ia s de p re d icc ió n linea l; d e te rm in a r u n a d ife re n c ia e n tre las g a n a n c ia s de p red icc ió n linea l y las e s tim a c io n e s a la rgo p la zo y e n tre las e s tim a c io n e s a la rgo p la zo ; y /o o b te n e r y u tiliz a r u na m e d id a de p ro x im id a d e sp e c tra l, e tc.
S e p u e d e s u p o n e r q u e el e s tim a d o r de ru ido de fo n d o 1100 co m p re n d e u n a fu n c io n a lid a d a d ic io n a l, p a ra lle va r a cabo la e s tim a c ió n de ru ido de fon do , co m o p. e j., la fu n c io n a lid a d e je m p lific a d a en el A p é n d ice A.
La F ig ura 12 ilus tra un e s tim a d o r de fo n d o 1200 seg ún u n a re a liza c ió n de e je m p lo . El e s tim a d o r de fo n d o 1200 co m p re n d e u n a u n id ad de e n tra d a , p. e j., p a ra re c ib ir e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o de lo 0, 2 y 16. El e s tim a d o r de fo n d o co m p re n d e a d e m á s un p ro c e sa d o r y u n a m e m oria , co n te n ie n d o d ich a m e m o ria in s tru cc io n e s e je c u ta b le s p o r d ich o p ro ce sa d o r, p o r lo q ue d ich o e s tim a d o r de fo n d o e s o p e ra tivo p a ra : re a liz a r un m é to do según u na re a liza c ió n d e s c rita en la p re se n te m e m oria .
En co n se cu e n c ia , e l e s tim a d o r de fo n d o p u e d e c o m p re n d e r, co m o se ilus tra en la fig u ra 13, u n a u n id ad de e n tra d a /sa lid a 1301, u n a c a lc u la d o ra 1302 p a ra c a lc u la r los d o s p rim e ro s co n ju n to s de ca ra c te rís tic a s a p a rt ir de las e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o de lo 0, 2 y 16 y un a n a liza d o r de fre cu e n c ia 1303 p a ra el c á lcu lo de la c a ra c te r ís tic a de p ro x im id a d e sp e c tra l.
Un e s tim a d o r de ru ido de fo n d o co m o los d e sc rito s a n te r io rm e n te p u e d e e s ta r inc lu ido , p. e j., en un V A D o S A D , en un c o d if ic a d o r y /o en un d e s co d ifica d o r, es d ec ir, un cód ec , y /o en un d isp o s itivo , co m o un d isp o s itivo de c o m u n ica c ió n . El d isp o s itivo de c o m u n ica c ió n p u e d e s e r un e q u ip o de u su a rio (U E ) en la fo rm a de un te lé fo n o m óvil, cá m a ra de v id e o , g ra b a d o ra de son ido , ta b le ta , o rd e n a d o r de so b re m e sa , o rd e n a d o r p ortá til, d e c o d if ica d o r de T V o se rv id o r d o m é s tic o / p a sa re la d o m é s tica / p u n to de a cce so d o m é s tico / rú te r d o m é stico . En a lg u n a s re a liza c io n e s , el d isp o s itivo de c o m u n ica c ió n p u e d e s e r un d isp o s itivo de red de co m u n ic a c io n e s a d a p ta d o p a ra c o d if ic a r y /o tra n s c o d ific a r se ñ a le s de a ud io . E jem p lo s de d ich o s d isp o s itivo s de red de c o m u n ic a c io n e s son se rv id o re s , com o se rv id o re s de co n te n id o m u ltim e d ia , se rv id o re s de a p lica c io n e s , rú te rs , p a sa re la s y e s ta c io n e s b ase de rad io . El d isp o s itivo de co m u n ica c ió n ta m b ié n p u e d e a d a p ta rse p a ra co lo ca rse en, es d ec ir, e m p o tra rse en, u n a e m b a rca c ió n , co m o un barco , un dron vo la d o r, un a v ión y un v e h ícu lo de ca rre te ra , co m o un coch e , a u to b ú s o ca m ió n . Un d isp o s itivo in te g ra d o de e s te tipo p e rte n e c e ría típ ic a m e n te a u na u n id ad te le m á tic a de l ve h ícu lo o a un s is te m a de in fo rm a c ió n y e n tre te n im ie n to de l v e h ícu lo .
Los p asos , fu n c io n e s , p ro ce d im ie n to s , m ó du los , u n id a d e s y /o b lo q u e s d e sc rito s en la p re se n te m e m o ria pueden im p le m e n ta rse en h a rd w are u tiliza n d o c u a lq u ie r te c n o lo g ía co n ve n c io n a l, co m o c ircu ito s d is c re to s o te c n o lo g ía de c ircu ito s in te g ra d o s , in c lu ye n d o ta n to c ircu ito s e le c tró n ic o s de p ro p ó s ito g e n e ra l co m o los c ircu ito s e sp e c ífico s de a p licac ión .
Los e je m p lo s p a rticu la re s inc lu ye n u no o m ás p ro ce sa d o re s de señ a l d ig ita l co n fig u ra d o s a d e cu a d a m e n te y o tros c ircu ito s e le c tró n ico s co n o c id o s , p. e j., p u e rta s lóg icas d is c re ta s in te rco n e c ta d a s p a ra re a liza r u na fu n c ió n e sp e c ia liza d a , o C ircu ito s In te g ra d o s E sp e c ífico s de A p lica c ió n (A S IC s).
A lte rn a tiva m e n te , al m e no s a lg u n o s de los p asos , fu n c io n e s , p ro ce d im ie n to s , m ó du los , u n id a d e s y /o b lo q u e s d e sc rito s a n te r io rm e n te p u e d e n im p le m e n ta rse en so ftw a re co m o un p ro g ra m a in fo rm á tico p a ra su e je cu c ió n m e d ia n te c ircu ito s de p ro ce sa m ie n to a d e cu a d o s q u e inc lu ye n u na o m á s u n id a d e s de p ro ce sa m ie n to . El so ftw a re p o d ría s e r tra n sp o rta d o p o r u na p o rta do ra , co m o u n a señ a l e le c tró n ica , u n a se ñ a l ó p tica , u n a se ñ a l de rad io , o un m e d io de a lm a ce n a m ie n to leg ib le p o r o rd e n a d o r a n tes y /o d u ra n te la u tiliza c ió n d e l p ro g ra m a in fo rm á tico en los n od os de la red.
El d ia g ra m a o d ia g ra m a s de flu jo p re se n ta d o s en la p re se n te m e m o ria p ue de n co n s id e ra rse co m o un d ia g ra m a o d ia g ra m a s de flu jo in fo rm á tico , cu a n d o lo re a liza n uno o m ás p ro ce sa d o re s . Un a p a ra to co rre sp o n d ie n te p uede d e fin irse co m o un g ru p o de m ó d u lo s de fu n c ió n , d on de c a d a paso re a liza d o p o r e l p ro c e sa d o r co rre sp o n d e a un m ó d u lo de fu n c ió n . En e s te caso , los m ó d u lo s de fu n c ió n se im p le m e n ta n co m o un p ro g ra m a in fo rm á tico q u e se e je c u ta en e l p roce sa d o r.
E je m p lo s d e l c ircu ito de p ro ce sa m ie n to inc lu ye n , p e ro no se lim itan a, u no o m ás m ic ro p ro ce sa d o re s , u no o m ás P ro ce sa d o re s de S e ñ a le s D ig ita les , D S P s, u n a o m ás U n id a d e s C e n tra le s de P ro ce sa m ie n to , C P U s, y /o c u a lq u ie r c irc u ito lóg ico p ro g ra m a b le a d e cu a d o , co m o u no o m ás M a trice s de P ue rtas P ro g ra m a b le s de C am p o , F P G A s, o uno o m ás C o n tro la d o re s L óg ico s P ro g ra m a b le s , P LC s. Es d ec ir, las u n id a d e s o m ó d u lo s en las d isp o s ic io n e s en los d ife re n te s n od os d e sc rito s a n te r io rm e n te p od rían im p le m e n ta rse m e d ia n te u n a co m b in a c ió n de c ircu ito s a n a ló g ico s y d ig ita le s , y /o u no o m ás p ro ce sa d o re s co n fig u ra d o s con so ftw a re y /o firm w a re , p. e j., a lm a ce n a d o en u n a m e m oria . U no o m ás de e s to s p ro ce sa d o re s , a s í co m o e l o tro h a rd w are d ig ita l, p ue de n inc lu irse en un so lo c ircu ito in te g rad o e sp e c ífico de a p lica c ió n , A S IC , o v a r io s p ro ce sa d o re s y d is tin to h a rd w a re d ig ita l p ue de n d is tr ib u irse e n tre va rios c o m p o n e n te s se p a ra d o s , ya se a e m p a q u e ta d o s in d iv id u a lm e n te o e n s a m b la d o s en un s is te m a en ch ip , SoC .
T a m b ié n d e b e e n te n d e rse q u e p u e d e s e r p o s ib le re u tiliza r las ca p a c id a d e s g e n e ra le s de p ro ce sa m ie n to de c u a lq u ie r d is p o s itivo o u n id ad co n v e n c io n a l en la q ue se im p le m e n te la te c n o lo g ía p rop u e s ta . T a m b ié n es p o s ib le re u tiliza r so ftw a re e x is te n te , p. e j., re p ro g ra m a n d o e l so ftw a re e x is te n te o a g re g a n d o n u e vo s co m p o n e n te s de so ftw a re .
Las re a liza c io n e s d e sc rita s a n te r io rm e n te se dan s im p le m e n te co m o e je m p lo s , y d e b e e n te n d e rse q ue la te cn o lo g ía p ro p u e s ta no se lim ita a las m ism as . Los e xp e rto s en la té c n ica e n te n d e rá n q u e se p ue de n re a liza r d ive rsa s m o d ifica c io n e s , co m b in a c io n e s y c a m b io s a las re a liza c io n e s sin a p a rta rse d e l p re se n te a lca n ce . En p a rticu la r, las d ife re n te s so lu c io n e s de p ie zas en las d ife re n te s re a liza c io n e s p ue de n co m b in a rse en o tra s co n fig u ra c io n e s , d onde se a té c n ica m e n te p os ib le .
C u a n d o se u tiliza la p a la b ra "co m p re n d e " o "q u e co m p re n d e ", se in te rp re ta rá co m o no lim ita tivo , es d ec ir, q ue s ig n ifica "co n s ta al m e no s de".
T a m b ié n d e b e se ñ a la rse q u e en a lg u n a s im p le m e n ta c io n e s a lte rn a tiva s , las fu n c io n e s /a c to s a n o ta d o s en los b lo q ue s p ue de n o c u rr ir fu e ra d e l o rde n a n o ta d o en los d ia g ra m a s de flu jo . P o r e je m p lo , d os b lo q u e s m o s tra d o s en suce s ió n p ue de n de h echo e je cu ta rse su s ta n c ia lm e n te al m ism o tie m p o o los b lo q u e s p u e d e n a v e ce s e je c u ta rs e en o rde n inve rso , d e p e n d ie n d o de la fu n c io n a lid a d /a c to s invo lu c ra d o s . A d e m á s, la fu n c io n a lid a d de un b lo q u e d a d o de los d ia g ra m a s de flu jo y /o de los d ia g ra m a s de b lo q u e s p u e d e se p a ra rse en m ú ltip le s b lo q u e s y /o la fu n c io n a lid a d de dos o m ás b lo q u e s de los d ia g ra m a s de flu jo y /o de los d ia g ra m a s de b lo q u e s p ue de in te g ra rse , al m e no s p a rc ia lm e n te . F in a lm e n te , se p ue de n a g re g a r/in se rta r o tro s b lo q u e s e n tre los b lo q u e s q u e se ilus tra n , y /o se p ue de n o m itir b lo q u e s /o p e ra c io n e s sin a p a rta rse d e l a lca n ce de los c o n ce p to s inve n tivos .
D ebe e n te n d e rs e q ue la e le cc ió n de las u n id a d e s de in te ra cc ió n , a s í co m o la d e n o m in a c ió n de las u n id a d e s d e n tro de e s ta d e sc rip c ió n son so lo p a ra fin e s ilus tra tivo s , y los n od os a d e cu a d o s p a ra e je c u ta r cu a lq u ie ra de los m é to do s d e sc rito s a n te r io rm e n te p ue de n co n fig u ra rs e en u n a p lu ra lid a d de fo rm a s a lte rn a tiva s en p a ra p o d e r e je c u ta r las a cc io n e s de l p ro ce d im ie n to sug e rid a s .
T a m b ié n d e b e te n e rs e en c u e n ta q u e las u n id a d e s d e sc rita s en e s ta d e sc rip c ió n d eb en s e r c o n s id e ra d a s co m o e n tid a d e s lóg icas y no n e ce sa ria m e n te co m o e n tid a d e s fís ica s sep a rad as .
La re fe re n c ia a un e le m e n to en s in g u la r no p re te n d e s ig n ific a r "u n o y so lo uno " a m e no s q u e se ind iq ue e xp líc ita m e n te , s ino m ás b ien "uno o m ás". A d e m á s, no es n e ce sa rio q ue un d isp o s itivo o m é to do a b o rd e to d o s y ca d a u no de los p ro b le m a s q ue se b u scan re s o lv e r m e d ia n te la te c n o lo g ía d e sc rita en la p re se n te m e m oria , p a ra q ue q u e d e a b a rca d o p o r la p rese n te .
En a lg u n o s ca so s en la p re se n te m em oria , se o m ite n d e sc rip c io n e s d e ta lla d a s de d isp o s itivo s , c ircu ito s y m é to do s b ien co n o c id o s p a ra no o sc u re c e r la d e sc rip c ió n de la te c n o lo g ía d e s c rita con d e ta lle s in n e ce sa rio s . T o d a s las d e c la ra c io n e s en la p re se n te m e m o ria q u e rec itan p rinc ip ios , a sp e c to s y re a liza c io n e s de la te c n o lo g ía d e sc rita , a sí co m o e je m p lo s e sp e c ífico s de la m ism a, p re te n d e n a b a rc a r sus e q u iva le n te s ta n to e s tru c tu ra le s co m o fu n c io n a le s . A d e m á s, se p re te n d e q u e d ich o s e q u iva le n te s inc luyan ta n to los e q u iva le n te s c o n o c id o s a c tu a lm e n te co m o los e q u iva le n te s d e sa rro lla d o s en e l fu tu ro , p. e j., c u a lq u ie r e le m e n to d e sa rro lla d o q ue re a lice la m ism a fun c ión , in d e p e n d ie n te m e n te de la e s tru c tu ra .
A nexo A
Las re fe re n c ia s a las fig u ra s en e l te x to a c o n tin u a c ió n son re fe re n c ia s a las fig u ra s A 2 -A 9 , de m a n e ra q u e la "fig u ra 2" a co n tin u a c ió n co rre sp o n d e a la fig u ra A 2 en los d ib u jos .
La F ig u ra 2 es un d ia g ra m a de flu jo q u e ilus tra u n a re a liza c ió n de e je m p lo de un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o según la te c n o lo g ía p ro p u e s ta en la p re se n te m e m oria . El m é to d o e s tá d e s tin a d o a s e r re a liza d o p o r un e s tim a d o r de ru ido de fo n d o , q u e p u e d e s e r p a rte de un S A D . El e s tim a d o r de ru ido de fo n d o , y el S A D , p ue de n a d e m á s e s ta r co m p re n d id o s en un c o d if ic a d o r de a ud io , q ue a su ve z p u e d e e s ta r co m p re n d id o en un d isp o s itivo in a lá m b rico o en un nodo de red. P ara el e s tim a d o r de ru ido de fo n d o d e sc rito , a ju s ta r la e s tim a c ió n de ru ido h ac ia a ba jo , no e s tá re s tr ing ido . P ara c a d a tra m a se ca lc u la u n a p o s ib le n u e va e s tim a c ió n de ru ido de sub -b an da , in d e p e n d ie n te m e n te de si la tra m a es de fo n d o o de c o n te n id o a ctivo , si e l n uevo v a lo r es m e n o r q u e e l a c tu a l se u tiliza d ire c ta m e n te , ya q ue lo m ás p ro b a b le es q ue se tra te de u n a tra m a de fo n d o . La s ig u ie n te lóg ica de e s tim a c ió n de ru ido es un se g u n d o p aso d o n d e se d e c id e si p u e d e a u m e n ta rse la e s tim a c ió n de ru ido de su b -b a n d a y, de s e r así, cu á n to , e l a u m e n to se b a sa en la p o s ib le n ue va e s tim a c ió n de ru ido de s u b -b a n d a c a lc u la d a p re v ia m e n te . B á s ica m e n te , e s ta lóg ica fo rm a la d e c is ió n de q u e la tra m a a c tu a l es u na tra m a de fo n d o y, si no e s tá seg u ra , p uede p e rm itir un a u m e n to m e n o r en c o m p a ra c ió n con la q ue se e s tim ó o rig in a lm e n te .
El m é to d o ilu s tra d o en la fig u ra 2 c o m p re n d e : cu a n d o un n ive l de e n e rg ía de un se g m e n to de la señ a l de a ud io es m ás q ue un u m bra l m ás a lto 202:1 q u e un n ive l m ín im o de e n e rg ía a la rgo p lazo , lt_m in , o cu a n d o el n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m e n o r q ue un u m bra l m á s a lto 202 :2 q ue lt_m in , p e ro no se d e te c ta n in g u n a p au sa 204:1 en el se g m e n to de la señ a l de a ud io :
re d u c ir 206 u n a e s tim a c ió n de ru ido de fo n d o a c tu a l cu a n d o se d e te rm in a q u e el se g m e n to de la se ñ a l de a ud io 203 :2 co m p re n d e m ú s ica y la e s tim a c ió n de ru ido de fo n d o a c tu a l e xce d e un v a lo r m ín im o 205 :1 , d e n o ta d o "T " en la fig u ra 2, y e je m p lific a d o a d e m á s , p. e j., co m o 2 *E _ M IN en e l có d ig o a co n tin u a c ió n .
A l re a liz a r lo a n te r io r y p ro p o rc io n a r la e s tim a c ió n de ru ido de fo n d o a un S A D , e l S A D e s tá h a b ilita d o p a ra re a liza r u n a d e te cc ió n de a c tiv id a d de so n id o m ás a de cu a d a . A d e m á s, se h a b ilita la re cu p e ra c ió n de a c tu a liza c io n e s de la e s tim a c ió n de ru ido de fo n d o e rró n e a s .
El n ive l de e n e rg ía de l se g m e n to de la se ñ a l de a ud io u tiliz a d o en el m é to do d e sc rito a n te r io rm e n te se p uede d e n o m in a r a lte rn a tiva m e n te , p. e j., co m o la e n e rg ía de la tra m a a ctu a l, Etot, o co m o la e n e rg ía d e l se g m e n to de seña l, o tra m a , q u e se p u e d e c a lc u la r su m a n d o las e n e rg ía s de s u b -b a n d a p a ra el se g m e n to de señ a l actua l.
La o tra c a ra c te rís tic a de e n e rg ía u tiliz a d a en e l m é to d o a n te rio r, es d ec ir, e l n ive l m ín im o de e n e rg ía a la rgo p lazo, lt_m in , es u na e s tim a c ió n , q ue se d e te rm in a so b re u n a p lu ra lid a d de s e g m e n to s o tra m a s de la señ a l de a ud io p re ce d e n te . lt_m in p o d ría a lte rn a tiv a m e n te d e n o ta rse , p. e j. E tot_l_lp. U na fo rm a b á s ica de d e r iv a r It_m in se ría u tiliz a r el v a lo r m ín im o d e l h is to ria l e n e rg é tic o de la tra m a a c tu a l sob re c ie rto n úm e ro de tra m a s p asa d a s . Si e l v a lo r c a lcu la d o co m o : "e n e rg ía de la tra m a a c tu a l - e s tim a c ió n m ín im a a la rgo p la zo " e s tá p o r d e b a jo de un v a lo r de u m bra l, d e n o ta d o p. e j., T H R 1, se d ice en la p re se n te m e m o ria q u e la e n e rg ía de la tra m a a c tu a l e s tá p ró x im a a la e n e rg ía m ín im a a la rgo p lazo, o ce rca de la e n e rg ía m ín im a a la rgo p la zo . Es d e c ir, cu a n d o (E to t - lt_m in ) < T H R 1, se p ue de d e te rm in a r 202 q ue la e n e rg ía de la tra m a a ctu a l, Etot, e s tá c e rca de la e n e rg ía m ín im a a la rgo p la zo lt_m in . El ca so en el q ue (E to t - lt_m in ) = THR1 p ue de re fe rirse a cu a lq u ie ra de las d e c is io n e s , 202:1 o 202 :2 , d e p e n d ie n d o de la im p le m e n ta c ió n . La n u m e ra c ió n 202:1 en la fig u ra 2 ind ica la d e c is ió n de q u e la e n e rg ía de la tra m a a c tu a l no e s tá c e rca de lt_m in , m ie n tra s q ue 202 :2 ind ica la d e c is ió n de q ue la e n e rg ía de la tra m a a c tu a l e s tá c e rca de lt_m in . O tra n u m e ra c ió n en la fig u ra 2 en la fo rm a de X X X :Y ind ica las d e c is io n e s co rre sp o n d ie n te s . La fu n c ió n lt_m in se d e sc rib irá con m ás d e ta lle a co n tin u a c ió n .
S e p ue de s u p o n e r q ue el v a lo r m ín im o, q u e d eb e s u p e ra r la e s tim a c ió n de ru ido de fo n d o a c tu a l, p a ra re d u c irlo es ce ro o un v a lo r p o s itivo p eq u e ñ o . P o r e je m p lo , co m o se e je m p lific a rá en el c ó d ig o a c o n tin u a c ió n , u na e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fon do , q ue p u e d e d e n o m in a rse "to ta lN o ise " y d e te rm in a rse , p. e j., co m o 10 * lo g 10 £ b a ck r[¡], se p u e d e re q u e rir q u e e xc e d a un v a lo r m ín im o de ce ro p ara q u e la re du cc ió n sea cu e s tio n a d a . A lte rn a tiva m e n te , o a d e m á s , ca d a e n tra d a en un v e c to r b a ck r[i] q ue co m p re n d e las e s tim a c io n e s de fo n d o de su b -b a n d a p uede co m p a ra rs e con un v a lo r m ín im o, E _M IN , p a ra q ue se re a lice la re d u cc ió n . En e l e je m p lo de c ó d ig o a co n tin u a c ió n , E _M IN es un v a lo r p o s itivo p eq ue ño .
D ebe se ñ a la rse q u e seg ún u na re a liza c ió n p re fe rid a de la so lu c ió n s u g e rid a en la p re se n te m e m o ria , la d e c is ió n de si e l n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m ás q u e un u m bra l m ás a lto q ue lt_m in se b asa ú n ica m e n te en la in fo rm a c ió n d e riv a d a de la señ a l de a ud io de e n tra d a , es d ec ir, no se b a sa en la re tro a lim e n ta c ió n de u n a d ec is ió n d e l d e te c to r de a c tiv id a d de son ido .
La d e te rm in a c ió n 204 de si u na tra m a a c tu a l co m p re n d e u na p a u sa o no p u e d e re a liza rse de d ife re n te s fo rm a s con b ase en u no o m ás c rite r io s . Un c rite r io de p a u sa ta m b ié n p u e d e d e n o m in a rse d e te c to r de p ausa . Se p od ría a p lic a r un so lo d e te c to r de p au sa , o u n a c o m b in a c ió n de d ife re n te s d e te c to re s de p au sa . C on u n a co m b in a c ió n de d e te c to re s de p au sa , ca d a uno p u e d e u tiliza rse p ara d e te c ta r p a u sa s en d ife re n te s c o n d ic io n e s . Un in d ic a d o r de q ue u na tra m a a c tu a l p ue de c o m p re n d e r u na p au sa , o ina c tiv id ad , es q u e u na c a ra c te rís tica de co rre la c ió n p a ra la tra m a es b a ja y q u e v a r ia s tra m a s p re ce d e n te s ta m b ié n han te n id o ca ra c te rís tic a s de b a ja co rre la c ió n . Si la e n e rg ía a c tu a l se a ce rca a la e n e rg ía m ín im a a la rgo p la zo y se d e te c ta u na p au sa , e l ru ido de fo n d o p u e d e a c tu a liza rse seg ún la e n tra d a a c tu a l, co m o se ilus tra en la fig u ra 2. S e p ue de c o n s id e ra r q u e se d e te c ta una p au sa cu a n d o , a d e m á s de q u e e l n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m e n o r q u e un u m bra l m ás a lto q ue lt_m in : se ha d e te rm in a d o q ue un n úm e ro p re d e fin id o de se g m e n to s c o n s e c u tiv o s de la señ a l de a ud io p re ce d e n te s no co m p re n d e n u na se ñ a l a c tiva y /o u n a d in á m ica de la se ñ a l de a ud io su p e ra un u m bra l. Esto ta m b ié n se ilus tra en el e je m p lo de có d ig o m ás aba jo .
La re du cc ió n 206 de la e s tim a c ió n de ru ido de fo n d o p e rm ite m a n e ja r s itu a c io n e s en las q ue la e s tim a c ió n de ru ido de fo n d o se ha v u e lto "d e m a s ia d o a lta ", es d ec ir, en re lac ió n con un v e rd a d e ro ru ido de fo n d o . Esto ta m b ié n p od ría e xp re sa rse , p. e j., co m o q u e la e s tim a c ió n de ru ido de fo n d o se d e sv ía de l ru ido de fo n d o real. U na e s tim a c ió n de ru ido de fo n d o d e m a s ia d o a lta p u e d e lle va r a d e c is io n e s in a d e cu a d a s p o r p a rte de l S A D , d o n d e se d e te rm in a q ue el se g m e n to de la señ a l a c tu a l e s tá in a c tivo a p e s a r de q u e co m p re n d e h ab la o m ú s ica a ctiva . U na razón p o r la q ue la e s tim a c ió n de ru ido de fo n d o se v u e lve d e m a s ia d o a lta es, p. e j., a c tu a liza c io n e s de ru ido de fo n d o e rró n e a s o no d e se a d a s en m ú sica , d o n d e la e s tim a c ió n de ru ido ha co n fu n d id o la m ú s ica con el fo n d o y ha p e rm itid o a u m e n ta r la e s tim a c ió n de ru ido . El m é to do d e sc rito p e rm ite a ju s ta r d ich a e s tim a c ió n de ru ido de fo n d o a c tu a liz a d a e rró n e a m e n te , p. e j., cu a n d o se d e te rm in a q ue u na tra m a s ig u ie n te de la señ a l de e n tra d a co m p re n d e m ú sica . Este a ju s te se rea liza m e d ia n te u na re du cc ió n fo rza d a de la e s tim a c ió n de ru ido de fo n d o , d o n d e la e s tim a c ió n d e l ru ido se reduce , inc lu so si la e n e rg ía de l se g m e n to de la señ a l de e n tra d a a c tu a l es m a yo r q u e la e s tim a c ió n de ru ido de fo n d o a c tu a l, p. e j., en u na su b -b a n d a . D ebe se ñ a la rse q ue la lóg ica d e sc rita a n te r io rm e n te p ara la e s tim a c ió n de ru ido de fo n d o se u tiliza p a ra c o n tro la r e l a u m e n to de e n e rg ía de la s u b -b a n d a de fo n d o . S ie m p re se p e rm ite re d u c ir la e n e rg ía de la su b -b a n d a cu a n d o la e n e rg ía de la su b -b a n d a de la tra m a a c tu a l es m e n o r q ue la e s tim a c ió n de ru ido de fo n d o . E sta fu n c ió n no se m u e s tra e xp líc ita m e n te en la fig u ra 2. D ich a d ism in u c ió n g e n e ra lm e n te tie n e un a ju s te fijo p a ra el ta m a ñ o de l paso. S in e m b a rg o , la e s tim a c ió n de ru ido de fo n d o so lo d e b e ría p e rm itirse s e r a u m e n ta d a en a so c ia c ió n con la lóg ica de d e c is ió n seg ún el m é to do d e sc rito a n te r io rm e n te . C u a n d o se d e te c ta una p au sa , las ca ra c te rís tic a s de e n e rg ía y de co rre la c ió n ta m b ié n p ue de n u tiliza rse p a ra d e c id ir 207 q u é tan g ra n d e d eb e s e r e l ta m a ñ o d e l p aso de a ju s te p a ra el a u m e n to de la e s tim a c ió n de fo n d o a n tes de q u e se re a lice la a c tu a liza c ió n d e l ru ido de fo n d o real.
C o m o se m e nc ion ó a n te r io rm e n te , a lg u n o s se g m e n to s de m ú s ica p ue de n s e r d ifíc ile s de se p a ra r d e l ru ido de fon do , d e b id o a q u e son m uy p a re c id o s al ru ido . A sí, la lóg ica de a c tu a liza c ió n de ru ido p uede , a cc id e n ta lm e n te , p e rm itir e s tim a c io n e s de e n e rg ía de s u b -b a n d a a u m e n ta d a s , a p e s a r de q u e la se ñ a l de e n tra d a e ra u na señ a l a ctiva . Esto p u e d e c a u s a r p ro b le m a s ya q ue la e s tim a c ió n de ru ido p u e d e lle g a r a s e r m ás a lta de lo q u e d e b e ría ser.
En los e s tim a d o re s de ru ido de fo n d o de la té c n ica a n te rio r, las e s tim a c io n e s de e n e rg ía de s u b -b a n d a so lo p od ían re d u c irse cu a n d o una e n e rg ía de su b -b a n d a de e n tra d a e s ta b a p o r d e b a jo de u na e s tim a c ió n de ru ido a c tu a l. S in e m b a rg o , d ad o q ue a lg u n o s s e g m e n to s de m ú s ica p u e d e n s e r d ifíc ile s de se p a ra r de l ru ido de fo n d o , d e b id o a que son m u y p a re c id o s al ru ido , los in ve n to re s se han d a d o cu e n ta de q ue se n eces ita u na e s tra te g ia de re cup e rac ión p a ra la m ú sica . En las re a liza c io n e s d e sc rita s en la p re se n te m e m oria , d ich a re cu p e ra c ió n p u e d e re a liza rse m e d ia n te u n a re du cc ió n fo rza d a de la e s tim a c ió n de l ru ido cu a n d o la se ñ a l de e n tra d a v u e lve a te n e r c a ra c te rís tic a s s im ila re s a la m ú sica . Es d ec ir, cu a n d o la e n e rg ía y la lóg ica de p a u sa d e sc rita s a n te r io rm e n te e v ita n , 202 :1 , 204 :1 , q u e la e s tim a c ió n de ru ido aum e n te , se p ru e b a 203 si se s o s p e c h a q u e la e n tra d a es m ú s ica y, de s e r así, 203 :2 , las e n e rg ía s de b a n d a se re du cen 206 en u n a p e q u e ñ a ca n tid a d en ca d a tra m a h asta q ue las e s tim a c io n e s de ru ido a lca n za n un n ive l m ás b a jo de 205 :2.
Un e s tim a d o r de fo n d o co m o los d e sc rito s a n te r io rm e n te p ue de e s ta r co m p re n d id o o im p le m e n ta d o en un V A D o S A D y /o en un c o d if ic a d o r y /o en un d e co d ifica d o r, en d o n d e el c o d if ic a d o r y /o d e c o d if ica d o r p ue de n im p le m e n ta rse en un d isp o s itivo de u su a rio , com o un te lé fo n o m óvil, un o rd e n a d o r p ortá til, u n a ta b le ta , e tc . El e s tim a d o r de fo n d o p od ría a d e m á s e s ta r c o m p re n d id o en un nodo de red, co m o u n a p a sa re la de m e d io s , p. e j., co m o p a rte de un cód ec .
La F ig u ra 5 es un d ia g ra m a de b lo q u e s q ue ilus tra e sq u e m á tic a m e n te u n a im p le m e n ta c ió n de un e s tim a d o r de fon do seg ún u na re a liza c ió n de e je m p lo . Un b lo q u e de e n tra m a d o de e n tra d a 51 d iv id e p rim e ro la señ a l de e n tra d a en tra m a s de lon g itu d a d e cu a d a , p. e j., 5 -30 m s. P ara ca d a tra m a , un e x tra c to r de ca ra c te rís tic a s 52 ca lc u la al m e no s las s ig u ie n te s ca ra c te rís tic a s a p a rtir de la e n tra d a : 1) El e x tra c to r de ca ra c te rís tic a s a n a liza la tra m a en el d o m in io de la fre cu e n c ia y se ca lc u la la e n e rg ía p a ra un c o n ju n to de su b -b a n d a s . Las su b -b a n d a s son las m ism as su b -b a n d a s que se u tiliz a rá n p a ra la e s tim a c ió n de fo n d o . 2) El e x tra c to r de ca ra c te rís tic a s a n a liza a d e m á s la tra m a en e l d o m in io del tie m p o y ca lc u la u na co rre la c ió n ind icad a , p. e j., co r_ e s t y /o lt_ co r_ e s t, q u e se u tiliza p a ra d e te rm in a r si la tra m a co m p re n d e co n te n id o a c tivo o no. 3) El e x tra c to r de ca ra c te rís tic a s u tiliza a d e m á s la e n e rg ía to ta l de la tra m a actua l, p. e j., d e n o ta d a Etot, p a ra a c tu a liz a r las ca ra c te rís tic a s de l h is to ria l e n e rg é tico de las tra m a s de e n tra d a a c tu a le s y a n te rio re s , co m o la e n e rg ía m ín im a a la rgo p la zo , lt_m in . Las ca ra c te rís tic a s de co rre la c ió n y de e n e rg ía son luego a lim e n ta d a s al b lo q u e de L ó g ica de D ec is ión de A c tu a liza c ió n 53.
A qu í, u n a lóg ica de d e c is ió n según la so lu c ió n d e sc rita en la p re se n te m e m o ria se im p le m e n ta en el b lo q u e de L óg ica de D ec is ión de A c tu a liza c ió n 53, d o n d e las ca ra c te rís tic a s de co rre la c ió n y de e n e rg ía se u tilizan p a ra fo rm a r d e c is io n e s sob re si la e n e rg ía de la tra m a a c tu a l e s tá c e rca de u na e n e rg ía m ín im a a la rgo p la zo o no; sob re si la tra m a a c tu a l es p a rte de u n a p a u sa (seña l no a c tiva ) o no; y so b re si la tra m a a c tu a l es p arte de la m ú s ica o no. La so lu c ió n seg ún las re a liza c io n e s d e sc rita s en la p re se n te m e m o ria im p lica có m o se u tilizan e s ta s ca ra c te rís tic a s y d e c is io n e s p a ra a c tu a liz a r la e s tim a c ió n de ru ido de fo n d o de u n a m a n e ra robusta .
A co n tin u a c ió n , se d e sc rib irá n a lg u n o s d e ta lle s de im p le m e n ta c ió n de las re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m oria . Los d e ta lle s de im p le m e n ta c ió n a c o n tin u a c ió n se to m a n de u na re a liza c ió n en un c o d ific a d o r b a sa d o en G .718. E sta re a liza c ió n u tiliza a lg u n a s de las ca ra c te rís tic a s d e sc rita s en W O 2011 /049514 y en W O 2011 /049515.
Las s ig u ie n te s ca ra c te rís tic a s se d e fin e n en e l G .718 m o d ifica d o d e sc rito en W O 2011 /09514
E tot; La e n e rg ía to ta l p a ra la tra m a de e n tra d a a c tu a l
E tot_l R a s tre a la e n vo lve n te de m ín im a e n e rg ía
E tot_l_lp; U na ve rs ió n s u a v iza d a de la e n vo lv e n te de e n e rg ía m ín im a E tot_l
to ta lN o ise ; La e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fo n d o
b c k r [ i] ; El v e c to r con las e s tim a c io n e s de fo n d o de su b -b a n d a
tm p N [i]; U na p o te n c ia l n u e va e s tim a c ió n de fo n d o c a lc u la d a p re v ia m e n te
a E n ; Un d e te c to r de fo n d o q ue u tiliza m ú ltip le s ca ra c te rís tic a s (un co n ta d o r)
h a rm _ co r_ cn t C u e n ta las tra m a s d e sd e la ú ltim a tra m a con co rre la c ió n o e ve n to a rm ó n ico
a c t_ p re d U na p re d icc ió n de la a c tiv id a d de las ca ra c te rís tic a s de la tra m a de e n tra d a ú n ica m e n te co r[i] V e c to r con e s tim a c io n e s de co rre la c ió n para , i = 0 fin a l de la tra m a a ctu a l, i = 1 in ic io de la tra m a a ctu a l, i = 2 fin a l de la tra m a a n te r io r
Las s ig u ie n te s ca ra c te rís tic a s se d e fin e n en e l G .718 m o d ifica d o d e sc rito en W O 2011 /09515
E to t_h R a s tre a la e n vo lve n te de m á x im a e n e rg ía
s ig n _ d yn _ lp ; U na d in á m ica de se ñ a l de e n tra d a su a v iza d a
T a m b ié n la c a ra c te rís tic a E to t_ v_ h se d e fin ió en W O 2011 /049514 , p e ro en e s ta re a liza c ió n se ha m o d ifica d o y a h o ra se im p le m e n ta co m o s igu e :
Figure imgf000021_0001
E to t_ v m id e la va ria c ió n d e e n e rg ía a b s o lu ta e n tre tra m as , es d ec ir, el v a lo r a b so lu to de la va r ia c ió n de e n e rg ía in s ta n tá n e a e n tre tra m a s . En el e je m p lo a n te rio r, se d e te rm in a que la va ria c ió n de e n e rg ía e n tre d os tra m a s es "b a ja " cu a n d o la d ife re n c ia e n tre la e n e rg ía de la tra m a a c tu a l y de la ú ltim a es m e n o r d e 7 u n id ad es . E sto se u tiliza co m o un in d ica d o r de q u e la tra m a a c tu a l (y la tra m a a n te rio r) p u e d e n se r p a rte d e una pau sa , es d ec ir, co m p re n d e n so lo ru ido de fo n d o . S in e m b a rg o , d ic h a v a r ia n z a tan b a ja p o d ría e n co n tra rse a lte rn a tiva m e n te , p. e j., en m e d io d e una rá fa g a de voz . L a v a r ia b le E to t_ la s t es e l n ive l de e n e rg ía de la tra m a a n te rio r.
Los p asos a n te rio re s d e sc rito s en el c ó d ig o p u e de n re a liza rse co m o p a rte de los p asos de "c a lcu la r /a c tu a liza r la c o rre la c ió n y la e n e rg ía " en el d ia g ra m a de flu jo en la fig u ra 2, es d ec ir, co m o p a rte de las a cc io n e s 201. En la im p le m e n ta c ió n de W O 2011 /049514 , se u tilizó un in d ica d o r V A D p a ra d e te rm in a r si el se g m e n to de la señ a l de a u d io ac tu a l c o m p re n d ía ru ido de fo n d o o no. Los in ve n to re s se han d a d o c u e n ta de que la d e p e n d e n c ia de la in fo rm a c ió n de re tro a lim e n ta c ió n p ue de se r p ro b le m á tica . En la so lu c ió n d e s c rita en la p re se n te m e m oria , la d e c is ió n de a c tu a liz a r o no la e s tim a c ió n d e ru ido d e fo n d o no d e p e n d e de una d e c is ió n de l V A D (o S A D ).
A d e m á s, en la so lu c ió n d e s c rita en la p re se n te m e m oria , las s ig u ie n te s ca ra c te rís tica s , q u e no fo rm a n p a rte de la im p le m e n ta c ió n de W O 2011 /049514 , p u e de n ca lc u la rs e /a c tu a liz a rs e co m o p a rte de los m ism o s p asos, es d ec ir, los p a so s de c a lc u la r/a c tu a liz a r la c o rre la c ió n y la e n e rg ía ilu s tra d o s en la fig u ra 2. E stas ca ra c te rís tic a s ta m b ié n se u tilizan en la ló g ica de d e c is ió n de si a c tu a liz a r la e s tim a c ió n de fon do o no.
P a ra lo g ra r u na e s tim a c ió n de ru ido de fo n d o m á s a d e cu a d a , se d e fin e n v a r ia s c a ra c te rís tic a s a co n tin u a c ió n . Por e je m p lo , se d e fin e n las n u e va s ca ra c te rís tic a s re la c io n a d a s con la co rre la c ió n c o r_ e s t e lt_ co r_ e s t. La ca ra c te rís tic a c o r_ e s t es u n a e s tim a c ió n de la co rre la c ió n en la tra m a a ctua l, y c o r_ e s t ta m b ié n se u tiliz a p a ra p ro d u c ir lt_co r_e s t, q u e es u n a e s tim a c ió n su a v iz a d a a la rgo p la zo d e la co rre la c ió n .
Figure imgf000021_0002
C om o se d e fin ió a n te r io rm e n te , co r[i] es un v e c to r que c o m p re n d e e s tim a c io n e s de co rre la c ió n , y co r[0 ] re p re se n ta el fin a l d e la tra m a a c tua l, co r[1 ] re p re s e n ta e l in ic io de la tra m a a c tu a l y co r[2 ] re p re s e n ta el fin a l d e una tra m a a n te rio r.
A d e m á s, se c a lc u la u n a n u e va ca ra c te rís tica , lt_ tn _ tra ck , que p ro p o rc io n a una e s tim a c ió n a la rgo p la zo de la fre cu e n c ia con la q u e las e s tim a c io n e s de fo n d o se a ce rcan a la e n e rg ía d e la tra m a ac tu a l. C u a n d o la e n e rg ía de la tra m a ac tu a l e s tá lo s u fic ie n te m e n te c e rca de la e s tim a c ió n d e fo n d o a ctua l, e sto se re g is tra m e d ia n te u na co n d ic ió n q u e in d ica (1 /0) si el fo n d o e s tá c e rca o no. E s ta señ a l se u tiliza p a ra fo rm a r la m e d id a a la rgo p la zo lt_ tn _ tra ck .
Figure imgf000021_0003
En e ste e je m p lo , se a ñ a d e 0 ,03 cu a n d o la e n e rg ía d e la tra m a ac tu a l e s tá c e rca de la e s tim a c ió n de ru ido de fo n d o y, de lo co n tra rio , el ún ico té rm in o re s ta n te es 0 ,97 v e ce s el v a lo r a n te rio r. En e ste e je m p lo , "ce rca " se d e fin e co m o que la d ife re n c ia e n tre la e n e rg ía de la tra m a ac tu a l, E tot, y la e s tim a c ió n de ru ido de fo n d o , to ta lN o ise , es m e n o r de 10 u n id ad es . T a m b ié n son p o s ib le s o tra s d e fin ic io n e s de "ce rca".
A d e m á s, la d is ta n c ia e n tre la e s tim a c ió n de fon do a c tua l, E tot, y la e n e rg ía d e la tra m a a ctua l, to ta lN o ise , se u tiliza p a ra d e te rm in a r u n a ca ra c te rís tica , lt_ tn _d is t, q u e p ro p o rc io n a u n a e s tim a c ió n a la rgo p la zo de e s ta d is ta n c ia . Se c re a u n a c a ra c te r ís tic a s im ila r, lt_E llp _ d is t, p a ra la d is ta n c ia e n tre la e n e rg ía m ín im a a la rgo p la zo E to t_ l_ lp y la e n e rg ía de la tra m a a c tu a l, Etot.
st->lt_tn_dist = 0.03 f (Etot - st->totalNoise) 0.97f* st->lt_tn_dist;
st->lt_Ellp_dist = 0.03 f (Etot - st->Etot_l_lp) 0.97f*st->lt_Ellp_dist;
La c a ra c te rís tic a h a rm _ co r_ cn t, p re s e n ta d a a n te r io rm e n te , se u tiliza p a ra c o n ta r el n ú m e ro de tra m a s d e sd e la ú ltim a tra m a q u e tie n e u n a co rre la c ió n o un e ve n to a rm ó n ico , es d ec ir, d e sd e u na tra m a que cu m p le c ie rto s c rite r io s re la c io n a d o s con la a c tiv ida d . Es d ec ir, c u a n d o la c o n d ic ió n h a rm _ c o r_ c n t == 0, e sto im p lica q u e la tra m a a c tu a l m uy p ro b a b le m e n te se a una tra m a activa , y a q u e m u e s tra co rre la c ió n o un e ve n to a rm ó n ico . E s to se u tiliza p a ra fo rm a r una e s tim a c ió n s u a v iz a d a a la rgo p lazo , lt_ h a co _ e v , de la fre cu e n c ia con la q ue o cu rre n d ich o s e ve n to s . En e ste caso , la a c tu a liza c ió n no es s im é tr ica , es d ec ir, se u tilizan d ife re n te s c o n s ta n te s d e tie m p o si la e s tim a c ió n se in c re m e n ta o se reduce , com o p u e d e ve rse a co n tin u a c ió n .
¡f (5t->hanm j» r_ o n t — 0) r cu a n do p ro ba b I e m e nte a divo *i
{
s l-> ll haco ev - Q.03Í Ü .97 f 's M t haco ev: i* in c re m e n ta r e tim ac ión de largo plazo
}
efse
{
£ t-^ t_haco_ ev = 0.99 f’ s t-^ lt h a c o .e y - /* reduc ir e s tim a c ió n de largo plazo V
}
U n v a lo r b a jo d e la c a ra c te rís tic a lt_ tn _ tra ck , p re s e n ta d a a n te rio rm e n te , in d ica q ue la e n e rg ía d e la tra m a de e n tra d a no h a e s ta do c e rca de la e n e rg ía de fo n d o p a ra a lg u n a s tra m a s . E sto se d e b e a q u e lt_ tn _ tra ck se re du ce p a ra c a d a tra m a en la q u e la e n e rg ía de la tra m a a c tu a l no e s tá a ce rc a d e la e s tim a c ió n de la e n e rg ía de fon do . lt_ tn _ tra ck se in c re m e n ta so lo c u a n d o la e n e rg ía de la tra m a a c tu a l e s tá c e rca d e la e s tim a c ió n de la e n e rg ía d e fo n d o co m o se m u e s tra a rrib a . P a ra o b te n e r una m e jo r e s tim a c ió n de cu á n to tie m p o h a d u ra d o e s te "s in s e g u im ie n to ", es d ec ir, la e n e rg ía de la tra m a e s ta n d o le jo s de la e s tim a c ió n de fon do , se fo rm a un co n ta d o r, lo w _ tn _ tra ck_ cn t, p a ra el n úm ero de tra m a s con e s ta a u s e n c ia de se g u im ie n to com o :
it (st-^U_tn_trac k<ü.Q5l) t* cu a n d o lt_tn_tra ck e stá t>aj o */
{
st->law_tn_traclí_cnt++; i* añ a d ir 1 al c o n ta d o r* /
}
elae
{
s t - >lo w _ ln _ tfa c k _ c n L = 0 ; f* re e s tb le ce r el c o n ta d o r* /
}
En el e je m p lo a n te rio r, "b a jo " se d e fin e p o r d e b a jo d e l v a lo r 0 ,05. E s to d eb e ve rse co m o un v a lo r d e e je m p lo , que p o d ría s e le cc io n a rse de m a n e ra d ife re n te .
P a ra el p aso "F o rm a r d e c is io n e s de p a u sa y m ú s ica " ilu s tra d o en la fig u ra 2, se u tilizan las s ig u ie n te s tre s e xp re s io n e s de có d ig o p a ra fo rm a r la d e te cc ió n de p au sa , ta m b ié n d e n o ta d a d e te cc ió n de fon do . En o tra s re a liza c io n e s e im p le m e n ta c io n e s , ta m b ié n se p o d ría n a ñ a d ir o tro s c rite r io s p a ra la d e te cc ió n de p au sa s . La d e c is ió n de m ú s ica real se fo rm a en el có d ig o u tiliza n d o ca ra c te rís tic a s de co rre la c ió n y de e ne rg ía .
1: b g _ b g d = E to t < E to t_ l_ lp 0.6 f * s t-> E to t_ v_ h ;
b g _ b g d se c o n v e rtirá en "1 " o "ve rd a d e ro " c u a n d o E to t e sté c e rca d e la e s tim a c ió n de ru ido de fon do . b g _ b g d s irve co m o u n a m á sca ra p a ra o tro s d e te c to re s de fondo . Es d ec ir, si b g _ b g d no es "ve rd a d e ro ", los d e te c to re s de fo n d o 2 y 3 a co n tin u a c ió n no n e ce s ita n s e r e va lu a d o s . E to t_ v_ h es u na e s tim a c ió n d e la v a r ia n za d e l ru ido , q ue p o d ría d e n o m in a rse a lte rn a tiva m e n te Nvar. E to t_ v_ h se d e riv a de la e n e rg ía to ta l d e e n tra d a (en el d o m in io log a rítm ico ) u tiliz a n d o E to t_v, q u e m ide la va r ia c ió n d e e n e rg ía a b so lu ta e n tre tra m a s . T e n g a en c u e n ta q ue la ca ra c te rís tic a E to t_ v_ h se lim ita a a u m e n ta r so lo un m á x im o de un p e q u e ñ o v a lo r co n s ta n te , p. e j., 0 ,2 p o r c a d a tra m a . E to t_ l_ lp es u n a ve rs ió n s u a v iz a d a d e la e n vo lve n te de m ín im a e n e rg ía E tot_ l.
2: a E _ b g d = s t-> a E n == 0;
C u a n d o aEn es ce ro , a E _ b gd se co n v ie rte en "1 " o "ve rd a d e ro ". aEn es un c o n ta d o r q u e se in c re m e n ta cu a n d o se d e te rm in a q ue u n a se ñ a l a c tiva e s tá p re se n te en u na tra m a a ctu a l, y d ism in u ye cu a n d o se d e te rm in a q ue la tra m a a c tu a l no co m p re n d e u na señ a l a ctiva . aEn no p ue de in c re m e n ta rse m ás de un c ie rto núm e ro , p. e j., 6, y no p uede re d u c irse a m e no s de ce ro . D e spu és de v a r ia s tra m a s co n se cu tiva s , p. e j., 6, s in u n a señ a l a c tiva , aEn se rá igua l a cero .
3: sd 1 _ b g d = (s t-> s ig n _ d yn _ lp > 15) & & (E to t - s t-> E to t_ l_ lp ) < s t-> E to t_ v_ h & & s t-> h a rm _ c o r_ cn t > 20;
A qu í, sd 1 _ b g d se rá "1" o "ve rd a d e ro " cu a n d o se cu m p la n tre s co n d ic io n e s d ife re n te s : La d in á m ica de la señal, s ig n _ d yn _ lp es a lta , en e s te e je m p lo m ás de 15; La e n e rg ía de la tra m a a c tu a l e s tá c e rca de la e s tim a c ió n de fon do ; y: H an p a sa d o c ie rto n ú m e ro de tra m a s sin co rre la c ió n o e ve n to s a rm ó n ico s , en e s te e je m p lo 20 tra m as .
La fu n c ió n de b g_ bg d es s e r un in d ic a d o r p a ra d e te c ta r q ue la e n e rg ía de la tra m a a c tu a l e s tá c e rca de la e n e rg ía m ín im a a la rgo p la zo . Los d o s ú ltim o s , a E _ b gd y sd 1 _ b g d re p re se n ta n u n a d e te cc ió n de p a u sa o de fo n d o en d ife re n te s co n d ic io n e s . a E _ b gd es e l d e te c to r m ás g e n e ra l de los d os, m ie n tra s q u e sd 1 _ b g d d e te c ta p rin c ip a lm e n te p a u sa s de l h ab la en S N R a lta . U na n ue va lóg ica de d e c is ió n seg ún u na re a liza c ió n de la te c n o lo g ía d e s c rita en la p re se n te m e m oria , se c o n s tru ye co m o s igu e en el có d ig o a c o n tin u a c ió n . La ló g ica de d e c is ió n co m p re n d e la c o n d ic ió n de e n m a sc a ra m ie n to b g_ bg d y los d o s d e te c to re s de p a u sa a E _ b gd y sd1 _ b g d . T a m b ié n p o d ría h a b e r un te rc e r d e te c to r de p au sa , q u e e va lú a las e s ta d ís tica s a la rgo p la zo de q u é tan b ien e l to ta lN o ise ra s trea la e s tim a c ió n de e n e rg ía m ín im a. Las co n d ic io n e s e va lu a d a s si la p rim e ra líne a es v e rd a d e ra es la lóg ica de d e c is ió n sob re q ué tan g ra n d e d e b e s e r e l ta m a ñ o d e l paso , u p d t_ s te p y la a c tu a liza c ió n de la e s tim a c ió n de ru ido real es la a s ig n a c ió n de v a lo r a "s t-> b c k r [i] = -". T e n g a en c u e n ta q ue tm p N [i] es un p o te n c ia lm e n te n ue vo n ive l de ru ido ca lc u la d o p re v ia m e n te según la so lu c ió n d e sc rita en W O 2011 /049514. La lóg ica de d e c is ió n a co n tin u a c ió n s igu e la p a rte 209 de la fig u ra 2, q u e se ind ica en p arte en re lac ió n con e l c ó d ig o a co n tin u a c ió n .
¡f{bg bgtS&S, (aE bgdllsdl bg<Jllst->lt tn tfack >0.9Df)) r s i 202 :2 y 204 :2 ) */
í
Í8 t->adjxe(i < 0.S5Í II ( aE..bgd M si->IL..haoo_ev < G.05Í)) S&
(s t-> ll_E llp _dist < 10 II sd1 .b g d ) && s l-> lt..tn . _di&¡<40 &&
{ (Etot - s t*^!o t3 lN o ise ) < 150 f l l s t^ l t fisco ev < 0.1 O f ) ) rffl'i
t
st->first noise uptfteil;
fon( i=0: i< NB BAN DS; i+ }
{
s t-^b ck fl'] = tm pN |i} rm*i
)
}
eise if<aE bgd&&5i->lt haco ev<Q.i5f]
{
updt_step=0,1f:
ií (si->act pred > Q.85f)
í
upd! s*ep=0.01f m rt
í
if (updt_step > G.Of)
s t-> firs i_ rio ¡se_upd i = 1;
forf i=0; ¡< m BANDS; h -t J
{
St-> bckrfi] = st->bckft¡] -i- updt_step * (tmpN[i]-$t->bCkr|¡]): fTOffV
}}}
e lse
(5t-> lirst_no¡se updt} =1:
}
else
I* Si en m ú s ic a b a ja r b ck r p a ra b a ja r a d ic io n a lm e n te *f f * s l 203 :2 y 205 :1 * /
if ( s t-> iow _tn_track co t > 300 &S st->lt h a c o .e i/ > 0 j9 f &S s t-> total Noise > 0.01)
{
For ( i=0; i< NB B A N D S ;i++)
{
Figure imgf000024_0001
f * St>bdtff]; n o s v
Else
(st->first_noise_Lipdt) = 1;
}
El se g m e n to de c ó d ig o en el ú ltim o b lo q u e de có d ig o q u e c o m ie n z a co n "/ * S i en m ú s ica ... * / c o n tie n e la re du cc ió n fo rza d a de la e s tim a c ió n de fo n d o q u e se u tiliz a si se s o sp e ch a q ue la e n tra d a a c tu a l es m ú sica . Esto se d e c id e com o u na fu n c ió n : p e río d o la rgo de ru ido de fo n d o de se g u im ie n to d e fic ie n te en c o m p a ra c ió n con la e s tim a c ió n de e n e rg ía m ín im a, Y, o cu rre n c ia s fre cu e n te s de e ve n to s a rm ó n ico s o de co rre la c ió n , Y, la ú ltim a co n d ic ió n "to ta lN o ise > 0 " es u na ve r ifica c ió n de q u e la e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fo n d o es m a yo r q ue ce ro , lo q u e im p lica q u e p u e d e co n s id e ra rse u n a re du cc ió n de la e s tim a c ió n de fo n d o . A d e m á s, se d e te rm in a si "b ckr[i] > 2 * E _M IN ", d o n d e E _M IN es un p eq u e ñ o v a lo r p os itivo . Esto es u n a v e r ifica c ió n de ca d a e n tra d a en un v e c to r q ue co m p re n d e las e s tim a c io n e s de fo n d o de la su b -b a n d a , de m o do q ue u n a e n tra d a d e b e su p e ra r E _M IN p a ra s e r re d u c id a (en e l e je m p lo s ie n d o m u ltip lica d a p o r 0 ,98). E s tas c o m p ro b a c io n e s se re a liza n p a ra e v ita r re d u c ir las e s tim a c io n e s de fo n d o a va lo re s d e m a s ia d o p eq u e ñ o s.
Las re a liza c io n e s m e jo ran la e s tim a c ió n de ru ido de fon do , lo q u e p e rm ite un re n d im ie n to m e jo ra d o de l S A D /V A D p ara lo g ra r u n a so lu c ió n D T X de a lta e fic ie n c ia y e v ita r la d e g ra d a c ió n en la ca lid a d de l h a b la o de la m ú s ica ca u s a d a p o r el recorte .
C on la e lim in a c ió n de la re tro a lim e n ta c ió n de d e c is io n e s d e s c rita en W O 2011 /09514 de E to t_ v_ h , h ay u n a m e jo r se p a ra c ió n e n tre la e s tim a c ió n de ru ido y e l S A D . Esto tie n e ve n ta ja s , co m o q ue la e s tim a c ió n de ru ido no se ca m b ia s i/cu a n d o se c a m b ia la fu n c ió n /a ju s te d e l SAD . Es d ec ir, la d e te rm in a c ió n de u n a e s tim a c ió n de ru ido de fo n d o se v u e lve in d e p e n d ie n te de la fu n c ió n d e l S A D . A d e m á s, e l a ju s te de la ló g ica de e s tim a c ió n de ru ido se v u e lve m ás fác il ya q ue u no no se ve a fe c ta d o p o r los e fe c to s se cu n d a rio s de l S A D cu a n d o se ca m b ia n las e s tim a c io n e s de fon do .

Claims (14)

R EIV IN D IC A C IO N ES
1. Un m é to do p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na se ñ a l de a ud io , c o m p re n d ie n d o e l m é to do : o b te n e r (201 ) al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la se ñ a l de a ud io de e n tra d a con b ase en: u n a p rim e ra g a n a n c ia de p red icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a e n e rg ía de se ñ a l re s idu a l de una p rim e ra p re d icc ió n linea l y u na e n e rg ía de se ñ a l re s idu a l de u n a s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , s ie n d o la se g u n d a p re d icc ió n linea l de un o rde n s u p e r io r q ue la p rim e ra p re d icc ió n lin e a l; y u n a se g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de se ñ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a te rce ra p re d icc ió n linea l p a ra el se g m e n to de la seña l de a ud io , s ien do la te rce ra p red icc ió n linea l de un o rde n s u p e r io r q u e la s e g u n d a p re d icc ió n linea l;
d e te rm in a r (202 ) si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p a u sa b asad a , al m e no s, en el al m enos un p a rá m e tro ; y:
si se d e te rm in a q ue e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p au sa :
a c tu a liz a r (203 ) u na e s tim a c ió n de ru ido de fo n d o con b a se en el se g m e n to de la señ a l de aud io .
2. El m é to d o seg ún la re iv in d ica c ió n 1, en d o n d e la o b te n c ió n de l al m e no s un p a rá m e tro co m p re n d e :
lim ita r las g a n a n c ia s de p re d icc ió n linea l p rim e ra y se g u n d a p a ra q u e a d o p te n va lo re s en un in te rva lo p re d e fin id o .
3. El m é to d o seg ún la re iv in d ica c ió n 1 ó 2, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
c re a r al m e no s u n a e s tim a c ió n a la rgo p la zo de ca d a u n a de las g a n a n c ia s de p re d icc ió n linea l p rim e ra y seg u n d a , en d o n d e la e s tim a c ió n a la rgo p la zo se b asa a d e m á s en las g a n a n c ia s de p re d icc ió n linea l c o rre sp o n d ie n te s a so c ia d a s con al m e no s un se g m e n to de la se ñ a l de a ud io p re ce d e n te .
4. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 3, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
d e te rm in a r u n a d ife re n c ia e n tre u n a de las g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con el se g m e n to de la señ a l de a ud io y u n a e s tim a c ió n a la rgo p la zo de d ic h a g a n a n c ia de p re d icc ió n lineal.
5. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 4, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
d e te rm in a r u n a d ife re n c ia e n tre d o s e s tim a c io n e s a la rgo p la zo a so c ia d a s con u na de las g a n a n c ia s de p red icc ió n linea l.
6. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 5, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e e l f iltra d o de p aso b a jo de las g a n a n c ia s de p re d icc ió n linea l p rim e ra y seg un da .
7. El m é to d o seg ún la re iv in d ica c ió n 6, en d o n d e los co e fic ie n te s de f iltro de al m e no s un filtro de paso b a jo d e p e n d e n de u na re lac ió n e n tre u na g a n a n c ia de p re d icc ió n linea l a so c ia d a con el se g m e n to de la se ñ a l de a ud io y un p ro m e d io de u na g a n a n c ia de p re d icc ió n linea l co rre sp o n d ie n te o b te n id a con b ase en u n a p lu ra lida d se g m e n to s de la se ñ a l de a ud io p re ce d e n te .
8. El m é to do seg ún cu a lq u ie ra de las re iv in d ica c io n e s p re ce d e n te s , en d o n d e la d e te rm in a c ió n de si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa se b a sa a d e m á s en u n a m e d id a de p ro x im id a d e sp e c tra l a so c ia d a con el se g m e n to de la señ a l de aud io .
9. El m é to do según la re iv in d ica c ió n 8, q u e co m p re n d e a d e m á s o b te n e r la m e d id a de p ro x im id a d e sp e c tra l con base en las e n e rg ía s p a ra un c o n ju n to de b a n d a s de fre cu e n c ia de l se g m e n to de la se ñ a l de a ud io y e s tim a c io n e s de ru ido de fo n d o co rre sp o n d ie n te s al c o n ju n to de b a n d a s de fre cu e n c ia .
10. El m é to do según la re iv in d ica c ió n 9, en d on de , d u ra n te un p e río d o de in ic ia liza c ió n , un v a lo r in ic ia l, Emin se u tiliza co m o las e s tim a c io n e s de ru ido de fo n d o con b ase en el cu a l se o b tie n e la m e d id a de p ro x im id a d e sp ec tra l.
11. Un a p a ra to (1100 ), p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na señ a l de a u d io q u e co m p re n d e una p lu ra lid a d de se g m e n to s de la se ñ a l de a ud io , e s ta n d o c o n fig u ra d o e l a p a ra to para :
o b te n e r al m enos un p a rá m e tro con b ase en:
u na p rim e ra g a n a n c ia de p re d icc ió n linea l c a lcu la d a co m o un c o c ie n te e n tre u n a e n e rg ía de señ a l re s idu a l de una p rim e ra p re d icc ió n linea l y u na e n e rg ía de se ñ a l re s idu a l de u n a s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , s ie n d o la se g u n d a p re d icc ió n linea l de un o rde n s u p e r io r q ue la p rim e ra p re d icc ió n line a l; y u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a com o un c o c ie n te e n tre la e n e rg ía de señ a l re s id u a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a te rce ra p re d icc ió n linea l p a ra e l se g m e n to de la seña l de a ud io , s ien do la te rce ra p red icc ió n linea l de un o rde n s u p e r io r q u e la s e g u n d a p re d icc ió n linea l;
d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p au sa , b a sa d a , al m e no s, en e l al m e no s un p a rá m e tro ; y
si se d e te rm in a q ue e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa :
a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o con b ase en el se g m e n to de la señ a l de a u d io .
12. El a p a ra to seg ún la re iv in d ica c ió n 11, en d o n d e el a p a ra to se c o n fig u ra a d e m á s p a ra re a liza r e l m é to d o seg ún u na cu a lq u ie ra de las re iv in d ica c io n e s 2 a 10.
13. Un có d e c de a ud io q u e co m p re n d e e l a p a ra to seg ún la re iv in d ica c ió n 11 ó 12.
14. Un d isp o s itivo de c o m u n ica c ió n q u e co m p re n d e el a p a ra to seg ún la re iv in d ica c ió n 11 ó 12.
ES19179575T 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio Active ES2869141T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201462030121P 2014-07-29 2014-07-29

Publications (1)

Publication Number Publication Date
ES2869141T3 true ES2869141T3 (es) 2021-10-25

Family

ID=53682771

Family Applications (3)

Application Number Title Priority Date Filing Date
ES15739357.0T Active ES2664348T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio
ES17202308T Active ES2758517T3 (es) 2014-07-29 2015-07-01 Estimación del ruido de fondo en las señales de audio
ES19179575T Active ES2869141T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES15739357.0T Active ES2664348T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio
ES17202308T Active ES2758517T3 (es) 2014-07-29 2015-07-01 Estimación del ruido de fondo en las señales de audio

Country Status (19)

Country Link
US (5) US9870780B2 (es)
EP (3) EP3582221B1 (es)
JP (3) JP6208377B2 (es)
KR (3) KR101895391B1 (es)
CN (3) CN112927725A (es)
BR (1) BR112017001643B1 (es)
CA (1) CA2956531C (es)
DK (1) DK3582221T3 (es)
ES (3) ES2664348T3 (es)
HU (1) HUE037050T2 (es)
MX (3) MX2021010373A (es)
MY (1) MY178131A (es)
NZ (1) NZ728080A (es)
PH (1) PH12017500031A1 (es)
PL (2) PL3582221T3 (es)
PT (1) PT3309784T (es)
RU (3) RU2713852C2 (es)
WO (1) WO2016018186A1 (es)
ZA (2) ZA201708141B (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2941782T3 (es) 2013-12-19 2023-05-25 Ericsson Telefon Ab L M Estimación de ruido de fondo en señales de audio
CN105261375B (zh) * 2014-07-18 2018-08-31 中兴通讯股份有限公司 激活音检测的方法及装置
ES2664348T3 (es) * 2014-07-29 2018-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Estimación de ruido de fondo en señales de audio
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105897455A (zh) * 2015-11-16 2016-08-24 乐视云计算有限公司 用于检测功能管理配置服务器运营的方法、合法客户端、cdn节点及系统
DE102018206689A1 (de) * 2018-04-30 2019-10-31 Sivantos Pte. Ltd. Verfahren zur Rauschunterdrückung in einem Audiosignal
US10991379B2 (en) * 2018-06-22 2021-04-27 Babblelabs Llc Data driven audio enhancement
CN110110437B (zh) * 2019-05-07 2023-08-29 中汽研(天津)汽车工程研究院有限公司 一种基于相关区间不确定性理论的汽车高频噪声预测方法
CN111863016B (zh) * 2020-06-15 2022-09-02 云南国土资源职业学院 一种天文时序信号的噪声估计方法

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297213A (en) * 1992-04-06 1994-03-22 Holden Thomas W System and method for reducing noise
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JP3685812B2 (ja) * 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
FR2715784B1 (fr) * 1994-02-02 1996-03-29 Jacques Prado Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application.
FR2720850B1 (fr) * 1994-06-03 1996-08-14 Matra Communication Procédé de codage de parole à prédiction linéaire.
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP2001236085A (ja) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置
DE10026904A1 (de) * 2000-04-28 2002-01-03 Deutsche Telekom Ag Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal
US7254532B2 (en) * 2000-04-28 2007-08-07 Deutsche Telekom Ag Method for making a voice activity decision
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002258897A (ja) * 2001-02-27 2002-09-11 Fujitsu Ltd 雑音抑圧装置
KR100399057B1 (ko) * 2001-08-07 2003-09-26 한국전자통신연구원 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
FR2833103B1 (fr) * 2001-12-05 2004-07-09 France Telecom Systeme de detection de parole dans le bruit
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7065486B1 (en) * 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7454010B1 (en) 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
JP4551817B2 (ja) * 2005-05-20 2010-09-29 Okiセミコンダクタ株式会社 ノイズレベル推定方法及びその装置
US20070078645A1 (en) * 2005-09-30 2007-04-05 Nokia Corporation Filterbank-based processing of speech signals
RU2317595C1 (ru) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Способ обнаружения пауз в речевых сигналах и устройство его реализующее
RU2417459C2 (ru) * 2006-11-15 2011-04-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
PL2118889T3 (pl) * 2007-03-05 2013-03-29 Ericsson Telefon Ab L M Sposób i sterownik do wygładzania stacjonarnego szumu tła
CA2690433C (en) * 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
KR101230183B1 (ko) * 2008-07-14 2013-02-15 광운대학교 산학협력단 오디오 신호의 상태결정 장치
JP5513138B2 (ja) * 2009-01-28 2014-06-04 矢崎総業株式会社 基板
US8244523B1 (en) * 2009-04-08 2012-08-14 Rockwell Collins, Inc. Systems and methods for noise reduction
US8886528B2 (en) * 2009-06-04 2014-11-11 Panasonic Corporation Audio signal processing device and method
DE102009034238A1 (de) 2009-07-22 2011-02-17 Daimler Ag Statorsegment und Stator eines Hybrid- oder Elektrofahrzeuges
DE102009034235A1 (de) 2009-07-22 2011-02-17 Daimler Ag Stator eines Hybrid- oder Elektrofahrzeuges, Statorträger
CN102667927B (zh) * 2009-10-19 2013-05-08 瑞典爱立信有限公司 语音活动检测的方法和背景估计器
CA2778343A1 (en) * 2009-10-19 2011-04-28 Martin Sehlstedt Method and voice activity detector for a speech encoder
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
JP5969513B2 (ja) * 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
AP2015008251A0 (en) * 2012-09-11 2015-02-28 Telefonaktiebogalet Lm Ericsson Publ Generation of comfort noise
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
CN106409313B (zh) * 2013-08-06 2021-04-20 华为技术有限公司 一种音频信号分类方法和装置
CN103440871B (zh) * 2013-08-21 2016-04-13 大连理工大学 一种语音中瞬态噪声抑制的方法
ES2664348T3 (es) * 2014-07-29 2018-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Estimación de ruido de fondo en señales de audio
US11114104B2 (en) * 2019-06-18 2021-09-07 International Business Machines Corporation Preventing adversarial audio attacks on digital assistants
KR20230103130A (ko) * 2021-12-31 2023-07-07 에스케이하이닉스 주식회사 메모리 컨트롤러 및 그 동작 방법

Also Published As

Publication number Publication date
RU2017106163A3 (es) 2018-08-28
CN112927725A (zh) 2021-06-08
PL3309784T3 (pl) 2020-02-28
BR112017001643B1 (pt) 2021-01-12
US10347265B2 (en) 2019-07-09
RU2665916C2 (ru) 2018-09-04
RU2713852C2 (ru) 2020-02-07
US11114105B2 (en) 2021-09-07
EP3582221B1 (en) 2021-02-24
MX2019005799A (es) 2019-08-12
CA2956531A1 (en) 2016-02-04
ES2664348T3 (es) 2018-04-19
EP3175458B1 (en) 2017-12-27
RU2020100879A (ru) 2021-07-14
US11636865B2 (en) 2023-04-25
US20170069331A1 (en) 2017-03-09
ZA201708141B (en) 2019-09-25
RU2760346C2 (ru) 2021-11-24
EP3175458A1 (en) 2017-06-07
KR101895391B1 (ko) 2018-09-07
MX2017000805A (es) 2017-05-04
WO2016018186A1 (en) 2016-02-04
PH12017500031A1 (en) 2017-05-15
US20190267017A1 (en) 2019-08-29
NZ743390A (en) 2021-03-26
CN106575511B (zh) 2021-02-23
ZA201903140B (en) 2020-09-30
JP2020024435A (ja) 2020-02-13
MX2021010373A (es) 2023-01-18
JP2018041083A (ja) 2018-03-15
DK3582221T3 (da) 2021-04-19
PT3309784T (pt) 2019-11-21
JP6208377B2 (ja) 2017-10-04
KR20170026545A (ko) 2017-03-08
KR102012325B1 (ko) 2019-08-20
KR20180100452A (ko) 2018-09-10
CN112927724A (zh) 2021-06-08
EP3582221A1 (en) 2019-12-18
US20180158465A1 (en) 2018-06-07
RU2018129139A3 (es) 2019-12-20
BR112017001643A2 (pt) 2018-01-30
EP3309784A1 (en) 2018-04-18
PL3582221T3 (pl) 2021-07-26
ES2758517T3 (es) 2020-05-05
CN112927724B (zh) 2024-03-22
CN106575511A (zh) 2017-04-19
MX365694B (es) 2019-06-11
KR102267986B1 (ko) 2021-06-22
JP2017515138A (ja) 2017-06-08
US20210366496A1 (en) 2021-11-25
US9870780B2 (en) 2018-01-16
JP6788086B2 (ja) 2020-11-18
RU2018129139A (ru) 2019-03-14
NZ728080A (en) 2018-08-31
EP3309784B1 (en) 2019-09-04
HUE037050T2 (hu) 2018-08-28
KR20190097321A (ko) 2019-08-20
RU2017106163A (ru) 2018-08-28
JP6600337B2 (ja) 2019-10-30
MY178131A (en) 2020-10-05
RU2020100879A3 (es) 2021-10-13
CA2956531C (en) 2020-03-24
US20230215447A1 (en) 2023-07-06

Similar Documents

Publication Publication Date Title
ES2869141T3 (es) Estimación de ruido de fondo en señales de audio
ES2277861T3 (es) Supresion de ruido.
ES2900516T3 (es) Aparato, método y programa informático para proporcionar parámetros ajustados
TW200703240A (en) Systems, methods, and apparatus for quantization of spectral envelope representation
MY150373A (en) Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
US20160293174A1 (en) Audio bandwidth selection
JP2018528464A5 (es)
US20040243404A1 (en) Method and apparatus for improving voice quality of encoded speech signals in a network
US9852738B2 (en) Method and apparatus for processing lost frame
ES2756023T3 (es) Método y dispositivo para decodificar un flujo de bits de voz y audio
US8577672B2 (en) Audible errors detection and prevention for speech decoding, audible errors concealing
EP3281195B1 (en) Gain parameter estimation based on energy saturation and signal scaling
Han et al. Improved AMR wideband error concealment for mobile communications
BR112017021355B1 (pt) Método e aparelho para gerar um parâmetro de quadro de ganho para produzir um fluxo de bits e memória legível por computador
CN112752199A (zh) 一种基于alsa框架的声卡左右声道独立控制装置及方法
Bronk et al. IVS and PSAP hardware prototypes for the eCall system
Hoskote et al. A57 LUNG INJURY, REPAIR, AND FIBROSIS: THE PLOT THICKENS FOR THREE'S COMPANY: Buffered Hypercapnia Improves Wound Closure In Alveolar Type 1 Epithelial Cell Monolayers
JPH09297600A (ja) 音声復号装置