ES2869141T3 - Estimación de ruido de fondo en señales de audio - Google Patents
Estimación de ruido de fondo en señales de audio Download PDFInfo
- Publication number
- ES2869141T3 ES2869141T3 ES19179575T ES19179575T ES2869141T3 ES 2869141 T3 ES2869141 T3 ES 2869141T3 ES 19179575 T ES19179575 T ES 19179575T ES 19179575 T ES19179575 T ES 19179575T ES 2869141 T3 ES2869141 T3 ES 2869141T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- line
- tim
- tio
- tra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 241001319955 Unda Species 0.000 claims 1
- 241001378740 Mugil liza Species 0.000 description 21
- 230000006870 function Effects 0.000 description 18
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 15
- 150000002500 ions Chemical class 0.000 description 14
- 235000015107 ale Nutrition 0.000 description 8
- 101150014198 epsP gene Proteins 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000035935 pregnancy Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- OWZREIFADZCYQD-NSHGMRRFSA-N deltamethrin Chemical compound CC1(C)[C@@H](C=C(Br)Br)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 OWZREIFADZCYQD-NSHGMRRFSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 101150034533 ATIC gene Proteins 0.000 description 3
- 241001367079 Una Species 0.000 description 3
- YVPYQUNUQOZFHG-UHFFFAOYSA-N amidotrizoic acid Chemical compound CC(=O)NC1=C(I)C(NC(C)=O)=C(I)C(C(O)=O)=C1I YVPYQUNUQOZFHG-UHFFFAOYSA-N 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- 241000543381 Cliftonia monophylla Species 0.000 description 2
- 101000973623 Homo sapiens Neuronal growth regulator 1 Proteins 0.000 description 2
- 102100022223 Neuronal growth regulator 1 Human genes 0.000 description 2
- 241001674048 Phthiraptera Species 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- PSGAAPLEWMOORI-PEINSRQWSA-N medroxyprogesterone acetate Chemical compound C([C@@]12C)CC(=O)C=C1[C@@H](C)C[C@@H]1[C@@H]2CC[C@]2(C)[C@@](OC(C)=O)(C(C)=O)CC[C@H]21 PSGAAPLEWMOORI-PEINSRQWSA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- JBFLYOLJRKJYNV-MASIZSFYSA-N (1z)-1-[(3,4-diethoxyphenyl)methylidene]-6,7-diethoxy-3,4-dihydro-2h-isoquinoline;hydron;chloride Chemical compound Cl.C1=C(OCC)C(OCC)=CC=C1\C=C/1C2=CC(OCC)=C(OCC)C=C2CCN\1 JBFLYOLJRKJYNV-MASIZSFYSA-N 0.000 description 1
- WYUYEJNGHIOFOC-VVTVMFAVSA-N 2-[(z)-1-(4-methylphenyl)-3-pyrrolidin-1-ylprop-1-enyl]pyridine;hydrochloride Chemical compound Cl.C1=CC(C)=CC=C1C(\C=1N=CC=CC=1)=C\CN1CCCC1 WYUYEJNGHIOFOC-VVTVMFAVSA-N 0.000 description 1
- NYPYHUZRZVSYKL-UHFFFAOYSA-N 2-azaniumyl-3-(4-hydroxy-3,5-diiodophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC(I)=C(O)C(I)=C1 NYPYHUZRZVSYKL-UHFFFAOYSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241001651044 Andoa Species 0.000 description 1
- 101100404567 Drosophila melanogaster nesd gene Proteins 0.000 description 1
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- 101100345589 Mus musculus Mical1 gene Proteins 0.000 description 1
- XKLMZUWKNUAPSZ-UHFFFAOYSA-N N-(2,6-dimethylphenyl)-2-{4-[2-hydroxy-3-(2-methoxyphenoxy)propyl]piperazin-1-yl}acetamide Chemical compound COC1=CC=CC=C1OCC(O)CN1CCN(CC(=O)NC=2C(=CC=CC=2C)C)CC1 XKLMZUWKNUAPSZ-UHFFFAOYSA-N 0.000 description 1
- 241001538234 Nala Species 0.000 description 1
- 241000275031 Nica Species 0.000 description 1
- OOMXGFUBBBFWHR-UHFFFAOYSA-N O.SS Chemical compound O.SS OOMXGFUBBBFWHR-UHFFFAOYSA-N 0.000 description 1
- 241000231814 Omus Species 0.000 description 1
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 1
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 1
- 101150057388 Reln gene Proteins 0.000 description 1
- 101150064053 Rffl gene Proteins 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 101100355940 Xenopus laevis rcor1 gene Proteins 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000332 continued effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- FFYZMBQLAYDJIG-UHFFFAOYSA-N dibenzofuran-2-amine Chemical compound C1=CC=C2C3=CC(N)=CC=C3OC2=C1 FFYZMBQLAYDJIG-UHFFFAOYSA-N 0.000 description 1
- NYPJDWWKZLNGGM-RPWUZVMVSA-N esfenvalerate Chemical compound C=1C([C@@H](C#N)OC(=O)[C@@H](C(C)C)C=2C=CC(Cl)=CC=2)=CC=CC=1OC1=CC=CC=C1 NYPJDWWKZLNGGM-RPWUZVMVSA-N 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- LKACJLUUJRMGFK-UHFFFAOYSA-N methylsulfonal Chemical compound CCS(=O)(=O)C(C)(CC)S(=O)(=O)CC LKACJLUUJRMGFK-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- GLDOVTGHNKAZLK-UHFFFAOYSA-N octadecan-1-ol Chemical compound CCCCCCCCCCCCCCCCCCO GLDOVTGHNKAZLK-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- IZUPBVBPLAPZRR-UHFFFAOYSA-N pentachlorophenol Chemical compound OC1=C(Cl)C(Cl)=C(Cl)C(Cl)=C1Cl IZUPBVBPLAPZRR-UHFFFAOYSA-N 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001020 rhythmical effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Un método para actualizar una estimación de ruido de fondo de una señal de audio, comprendiendo el método: obtener (201) al menos un parámetro asociado con un segmento de la señal de audio de entrada con base en: una primera ganancia de predicción lineal calculada como un cociente entre una energía de señal residual de una primera predicción lineal y una energía de señal residual de una segunda predicción lineal para el segmento de la señal de audio, siendo la segunda predicción lineal de un orden superior que la primera predicción lineal; y una segunda ganancia de predicción lineal calculada como un cociente entre la energía de señal residual de la segunda predicción lineal y una energía de señal residual de una tercera predicción lineal para el segmento de la señal de audio, siendo la tercera predicción lineal de un orden superior que la segunda predicción lineal; determinar (202) si el segmento de la señal de audio comprende una pausa basada, al menos, en el al menos un parámetro; y: si se determina que el segmento de la señal de audio comprende una pausa: actualizar (203) una estimación de ruido de fondo con base en el segmento de la señal de audio.
Description
DESCRIPCIÓ N
E stim ac ión de ru ido de fo n d o en se ñ a le s de aud io
C am po técnico
Las re a liza c io n e s de la p re se n te inve n c ió n se re fie ren al p ro ce sa m ie n to de se ñ a le s de a ud io , y en p a rtic u la r a la e s tim a c ió n de ru ido de fo n d o , p. e j., p a ra a p o ya r u n a d e c is ió n de a c tiv id a d de son ido .
A ntecedentes
En los s is te m a s de c o m u n ica c ió n q ue u tilizan tra n s m is ió n d is c o n tin u a (D TX ) es im p o rta n te e n c o n tra r un e q u ilib rio e n tre la e fic ie n c ia y no re d u c ir la ca lid a d . En d ich o s s is te m a s se u tiliza un d e te c to r de a c tiv id a d p a ra in d ic a r señ a le s a c tivas , p. e j., h ab la o m ú sica , q ue d eb en c o d ifica rse a c tiva m e n te , y s e g m e n to s con se ñ a le s de fo n d o q u e p ueden re e m p la za rse con ru ido de co n fo rt g e n e ra d o en el lado d e l re cep to r. S i e l d e te c to r de a c tiv id a d es d e m a s ia d o e fic ie n te p a ra d e te c ta r la fa lta de a c tiv id a d , in tro d u c irá re co rte s en la se ñ a l a c tiva , q u e luego se p e rc ib e n co m o u n a d eg ra d a c ió n s u b je tiva de la ca lid a d cu a n d o e l se g m e n to a c tivo re co rta d o se re e m p la za con ru ido de co n fo rt. A l m ism o tie m p o , la e fic ie n c ia de la D TX se re du ce si e l d e te c to r de a c tiv id a d no es lo s u fic ie n te m e n te e fic ie n te y c la s if ica s e g m e n to s de ru ido de fo n d o co m o a c tivo s y luego co d ific a a c tiva m e n te el ru ido de fo n d o en lu g a r de in g re sa r a un m o do D TX con ru ido de co n fo rt. En la m a yo ría de los caso s, e l p ro b le m a del re co rte se c o n s id e ra peor.
La F ig ura 1 m u e s tra un d ia g ra m a de b lo q u e s de d e sc rip c ió n g e n e ra l de un d e te c to r de a c tiv id a d de son ido g e n e ra liza d o , S A D o d e te c to r de a c tiv id a d de voz , V A D , q ue to m a u na señ a l de a ud io co m o e n tra d a y p ro d u ce una d e c is ió n de a c tiv id a d com o sa lid a . La se ñ a l de e n tra d a se d iv id e en tra m a s de d a tos , es d e c ir, s e g m e n to s de la seña l de a ud io de p. e j., 5 -30 m s, d e p e n d ie n d o de la im p le m e n ta c ió n , y se p ro d u ce u n a d e c is ió n de a c tiv id a d p o r tra m a co m o sa lida .
U na d e c is ió n p rim a ria , "p rim ", la to m a e l d e te c to r p rim a rio ilu s tra d o en la fig u ra 1. La d e c is ió n p rim a ria es b á s ica m e n te u n a c o m p a ra c ió n de las ca ra c te rís tic a s de u na tra m a a c tu a l con ca ra c te rís tic a s de fon do , q u e se e s tim a n a p a rtir de tra m a s de e n tra d a a n te rio re s . U na d ife re n c ia e n tre las ca ra c te rís tic a s de la tra m a a c tu a l y las ca ra c te rís tic a s de fondo , q ue es m a yo r q u e un u m bra l, p ro vo ca u n a d e c is ió n p rim a ria a ctiva . El b lo q u e de su m a de e sp e ra se u tiliza p ara e x te n d e r la d e c is ió n p rim a ria b a sa d a en d e c is io n e s p rim a ria s p a sa d a s p a ra fo rm a r la d e c is ió n fina l, " in d ica d o r". La razón p a ra u tiliz a r la e sp e ra es p rin c ip a lm e n te re d u c ir/e lim in a r e l r iesgo de re co rte en e l m e d io y la p a rte fin a l (en ing lés b a cke n d ) de la rá fag a de a c tiv id a d . C om o se ind ica en la fig u ra , un c o n tro la d o r de o p e ra c ió n p ue de a ju s ta r el u m b ra l(e s ) p a ra el d e te c to r p rim a rio y p a ra la e x te n s ió n de la su m a de e sp e ra seg ún las ca ra c te rís tic a s de la se ñ a l de e n tra d a . El b lo q u e de e s tim a d o r de fo n d o se u tiliza p a ra e s tim a r e l ru ido de fo n d o en la señ a l de e n tra d a . El ru ido de fo n d o ta m b ié n p u e d e d e n o m in a rse "e l fo n d o " o "la ca ra c te rís tic a de fo n d o " en la p re se n te m e m oria .
La e s tim a c ió n de la ca ra c te rís tic a de fo n d o p u e d e h ace rse seg ún d o s p rin c ip io s b á s ica m e n te d ife re n te s , ya sea u tiliza n d o la d e c is ió n p rim a ria , es d ec ir, con la d e c is ió n o con la re tro a lim e n ta c ió n de la m é trica de d e c is ió n , q ue se ind ica m e d ia n te u na líne a de p u n to s y g u io n e s en la fig u ra 1, o u tiliza n d o a lg u n a s o tra s ca ra c te rís tic a s de la señ a l de e n tra da , es dec ir, s in re tro a lim e n ta c ió n de d e c is ió n . T a m b ié n es p o s ib le u tiliz a r c o m b in a c io n e s de las d os e s tra te g ia s .
Un e je m p lo de un có d e c q ue u tiliza re tro a lim e n ta c ió n de d e c is io n e s p a ra la e s tim a c ió n de fo n d o es A M R -N B (en ing lés, A d a p tive M u lti-R a te N a rro w b a n d ) y e je m p lo s de có d e cs d o n d e no se u tiliza re tro a lim e n ta c ió n de d e c is io n e s son E V R C (en ing lés, E nh a nced V a ria b le R ate C o D e C) y G .718.
H a y v a r ia s ca ra c te rís tic a s de señ a l d ife re n te s o ca ra c te rís tic a s q u e se p ue de n u tilizar, p e ro u na c a ra c te rís tic a com ú n u tiliza d a en V A D s son las ca ra c te rís tic a s de fre cu e n c ia de la señ a l de e n tra d a . Un tip o de ca ra c te rís tic a s de fre cu e n c ia co m ú n m e n te u tiliza d o es la e n e rg ía de tra m a de su b -b a n d a , d e b id o a su b a ja c o m p le jid a d y fu n c io n a m ie n to fia b le en S N R ba ja . P o r lo tan to , se su p o n e q u e la señ a l de e n tra d a se d iv id e en d ife re n te s su b -b a n d a s de fre cu e n c ia y e l n ive l de fo n d o se e s tim a p a ra c a d a u n a de las su b -b a n d a s . De e s ta fo rm a , u n a de las ca ra c te rís tic a s d e l ru ido de fo n d o es el v e c to r con los v a lo re s de e n e rg ía p a ra ca d a su b -b a n d a . E stos son v a lo re s q u e ca ra c te r iza n e l ru ido de fo n d o en la señ a l de e n tra d a en e l d o m in io de la fre cu e n c ia .
P ara lo g ra r e l se g u im ie n to de l ru ido de fo n d o , la a c tu a liza c ió n rea l de la e s tim a c ió n de ru ido de fo n d o se p u e d e re a liza r de al m enos tre s fo rm a s d ife re n te s . U na fo rm a es u tiliz a r un p ro ce so A u to R eg re s ivo , A R , p o r in te rva lo de fre cu e n c ia p a ra m a n e ja r la a c tu a liza c ió n . E jem p lo s de d ich o s có d e cs son A M R -N B y G .718. B á s ica m e n te , p a ra e s te tip o de a c tu a liza c ió n , e l ta m a ñ o de l p aso de la a c tu a liza c ió n es p ro p o rc io n a l a la d ife re n c ia o b s e rva d a e n tre la e n tra d a actua l y la e s tim a c ió n de fo n d o actua l. O tra fo rm a es u tiliz a r la e sca la m u ltip lica tiva de u n a e s tim a c ió n a c tu a l con la re s tr icc ió n de q ue la e s tim a c ió n n un ca p ue de s e r m a yo r q u e la e n tra d a a c tu a l o m e n o r q ue un v a lo r m ín im o. Esto s ig n ifica q u e la e s tim a c ió n se in c re m e n ta en c a d a tra m a h as ta q ue se a m ás a lta q u e la e n tra d a a ctu a l. En e sa s itu a c ió n , la e n tra d a a c tu a l se u tiliz a co m o e s tim a c ió n . E V R C es un e je m p lo de un có d e c q ue u tiliza e s ta té c n ica p a ra a c tu a liz a r la e s tim a c ió n de fo n d o p a ra la fu n c ió n V A D . T e n g a en cu e n ta q u e E V R C u tiliza d ife re n te s e s tim a c io n e s de fo n d o p ara V A D y p a ra su p re s ió n de ru ido . D ebe se ñ a la rse q ue un V A D p u e d e u tiliza rse en o tro s co n te x to s d is tin to s a la DTX. P o r e je m p lo , en có d e cs de ta s a va r ia b le , co m o E V R C , e l V A D p u e d e u tiliza rse co m o p a rte de u n a fu n c ió n de d e te rm in a c ió n de tasa .
U na te rce ra fo rm a es u tiliz a r u n a té c n ica d e n o m in a d a m ín im a d o n d e la e s tim a c ió n es el v a lo r m ín im o d u ra n te una v e n ta n a de tie m p o d e s liza n te de tra m a s a n te rio re s . B á s ica m e n te , e s to d a u n a e s tim a c ió n m ín im a q ue se esca la , u tiliz a n d o un fa c to r de co m p e n s a c ió n , p a ra o b te n e r u n a e s tim a c ió n m e d ia a p ro x im a d a d e l ru ido e s ta c io n a rio .
En ca so s de S N R a lta , d o n d e e l n ive l de señ a l de la se ñ a l a c tiva es m u ch o m ás a lto q u e la señ a l de fo n d o , p u e d e se r b a s ta n te fá c il to m a r u na d e c is ió n sob re si u n a se ñ a l de a ud io de e n tra d a e s tá a c tiva o ina c tiva . S in e m b a rg o , es m uy d ifíc il se p a ra r se ñ a le s a c tiva s y no a c tiva s en c a so s de S N R ba ja , y en p a rtic u la r cu a n d o e l fo n d o no es e s ta c io n a rio o inc lu so s im ila r a la señ a l a c tiva en sus ca ra c te rís tica s .
El re n d im ie n to d e l V A D d e p e n d e de la c a p a c id a d de l e s tim a d o r de ru ido de fo n d o p a ra ra s tre a r las ca ra c te rís tic a s del fo n d o , en p a rtic u la r cu a n d o se tra ta de fo n d o s no e s ta c io n a rio s . C on un m e jo r se g u im ie n to , es p os ib le h a ce r q ue el V A D se a m ás e fic ie n te sin a u m e n ta r e l r iesgo de q ue se p ro d u zca n co rte s de l hab la.
Si b ien la co rre la c ió n es u na c a ra c te r ís tic a im p o rta n te q u e se u tiliza p a ra d e te c ta r el hab la , p rin c ip a lm e n te la parte so n o ra d e l hab la , ta m b ié n hay se ñ a le s de ru ido q ue m u es tra n u n a a lta co rre la c ió n . En e s to s caso s, e l ru ido con c o rre la c ió n e v ita rá la a c tu a liza c ió n de las e s tim a c io n e s de ru ido de fo n d o . El re su lta d o es u n a a lta a c tiv id a d , ya q ue ta n to e l h ab la co m o e l ru ido de fo n d o se co d ifica n co m o co n te n id o a ctivo . Si b ien p a ra S N R a lta s (a p ro x im a d a m e n te > 20 d B ) se ría p o s ib le re d u c ir e l p ro b le m a u tiliza n d o la d e te cc ió n de p a u sa b a sa d a en e n e rg ía , e s to no es fia b le p ara el in te rva lo de S N R de 20dB h as ta 10dB o p o s ib le m e n te 5dB . Es en e s te in te rva lo d o n d e la so lu c ió n d e sc rita en la p re se n te m e m o ria m a rca la d ife re n c ia .
M. Je lin e k y R. S a la m i "N o ise re d u c tio n m e th od fo r w id e b a n d sp e ech co d in g " 2004, 12a c o n fe re n c ia E u ro p e a de p ro ce sa m ie n to de se ñ a le s , p. 1959 -1962 , e n se ñ a n un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o d o n d e la p re se n c ia de p au sa s , d u ra n te las c u a le s se e s tim a d ich o ru ido , se d e te rm in a con b ase en e l c o c ie n te e n tre un re s idu o de u na p re d icc ió n linea l de 2° o rde n y un re s idu o de u na p re d icc ió n linea l de 16° o rden .
Com pendio
S e ría d e s e a b le lo g ra r u n a e s tim a c ió n m e jo ra d a d e l ru ido de fo n d o en las se ñ a le s de aud io . "M e jo ra d o " p u e d e im p lica r a q u í to m a r u na d e c is ió n m ás c o rre c ta con re sp e c to a si u n a señ a l de a ud io co m p re n d e h ab la o m ú s ica a c tiva o no, y a s í e s tim a r m ás a m e nu do , p. e j., a c tu a liza n d o u na e s tim a c ió n a n te rio r, e l ru ido de fo n d o en s e g m e n to s de la señ a l de a ud io q ue en re a lid ad e s tá n lib res de co n te n id o a ctivo , co m o h a b la y /o m ú sica . En la p re se n te m e m o ria , se p ro p o rc io n a un m é to do m e jo rad o p a ra g e n e ra r u na e s tim a c ió n de ru ido de fo n d o , q ue p ue de p e rm itir , p. e j., a un d e te c to r de a c tiv id a d de son ido to m a r d e c is io n e s m ás a de cu ad as .
P ara la e s tim a c ió n de ru ido de fo n d o en se ñ a le s de a ud io , es im p o rta n te p o d e r e n c o n tra r c a ra c te rís tic a s f ia b le s p ara id e n tif ic a r las ca ra c te rís tic a s de u na señ a l de ru ido de fo n d o ta m b ié n cu a n d o u na señ a l de e n tra d a co m p re n d e u na m e zc la d e s c o n o c id a de se ñ a le s a c tiva s y de fon do , d o n d e las se ñ a le s a c tiva s p ue de n c o m p re n d e r h ab la y /o m úsica .
El in v e n to r se ha d a d o cu e n ta de q u e las ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra d ife re n te s ó rd e n e s de m o d e lo s de p re d icc ió n linea l se p ue de n u tiliz a r p a ra d e te c ta r p a u sa s en las se ñ a le s de a ud io . Estas e n e rg ía s re s id u a le s se p ue de n e x tra e r, p. e j., a p a rtir de un a n á lis is de p re d icc ió n linea l, q ue es co m ú n en los có d ecs de hab la . Las ca ra c te rís tic a s se p u e d e n f iltra r y c o m b in a r p a ra c re a r un c o n ju n to de ca ra c te rís tic a s o p a rá m e tro s que se p ue de n u sa r p a ra d e te c ta r ru ido de fo n d o , lo q ue h ace q ue la so lu c ió n se a a d e cu a d a p a ra su uso en la e s tim a c ió n de ru ido . La so lu c ió n d e s c rita en la p re se n te m e m o ria es p a rtic u la rm e n te e fic ie n te p a ra las co n d ic io n e s en las q ue una S N R e s tá en el in te rva lo de 10 a 20 dB.
O tra c a ra c te rís tic a p ro p o rc io n a d a en la p re se n te m e m o ria es u n a m e d id a de p ro x im id a d e sp e c tra l al fo n d o , q u e p ue de re a liza rse p. e j., u tiliz a n d o las e n e rg ía s de su b -b a n d a del d o m in io de la fre cu e n c ia q u e se u tilizan , p. e j., en un S A D de su b -b a n d a . La m e d id a de p ro x im id a d e sp e c tra l ta m b ié n p u e d e u tiliza rse p a ra to m a r u na d e c is ió n de si u na seña l de a ud io co m p re n d e u n a p a u sa o no.
S eg ú n un p rim e r a sp ec to , se p ro p o rc io n a un m é to do p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na seña l de a ud io . El m é to do co m p re n d e o b te n e r al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la se ñ a l de a ud io , com o u na tra m a o p a rte de u n a tra m a , con b ase en u na p rim e ra g a n a n c ia de p re d icc ió n linea l, c a lc u la d a co m o un co c ie n te e n tre u na e n e rg ía de señ a l re s idu a l de u na p rim e ra p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a se g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de aud io , en d o n d e la s e g u n d a p re d icc ió n linea l es de un o rde n s u p e rio r a la p rim e ra p re d icc ió n line a l; y, u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de señ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u na te rce ra p re d icc ió n linea l para e l se g m e n to de la señ a l de a ud io , en d o n d e la te rce ra p re d icc ió n line a l es de un o rd e n s u p e r io r a la s e g u n d a p red icc ió n linea l. El m é to d o co m p re n d e a d e m á s d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p a u sa b asad a , al m e no s, en e l al m e no s un p a rá m e tro ; y, a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o b a sa d a en el se g m e n to de la señ a l de a ud io si se d e te rm in a q u e el se g m e n to de la señ a l de a ud io co m p re n d e u na pausa .
S eg ú n un se g u n d o a sp ec to , se p ro p o rc io n a un a p a ra to p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u n a seña l de a ud io . El a p a ra to se co n fig u ra p a ra o b te n e r al m e no s un p a rá m e tro b a sa d o en u n a p rim e ra g a n a n c ia de p red icc ió n linea l, ca lc u la d a co m o un c o c ie n te e n tre u n a e n e rg ía de señ a l re s idu a l de u n a p rim e ra p re d icc ió n linea l y u n a e n e rg ía de se ñ a l re s idu a l de u na s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , en d o n d e la se g u n d a
p re d icc ió n linea l es de un o rde n s u p e r io r a la p rim e ra p re d icc ió n line a l; y, u na s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de señ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de seña l re s id u a l de u n a te rce ra p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , en d o n d e la te rce ra p re d icc ió n linea l es de un o rde n s u p e r io r a la s e g u n d a p re d icc ió n linea l. El a p a ra to se co n fig u ra a d e m á s p a ra d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa b asad a , al m enos, en e l al m e no s un p a rá m e tro ; y, a c tu a liz a r u na e s tim a c ió n de ru ido de fo n d o b a sa d a en el se g m e n to de la se ñ a l de a ud io si se d e te rm in a q ue e l se g m e n to de la seña l de a ud io co m p re n d e u n a pausa .
S eg ú n un te rc e r a sp ec to , se p ro p o rc io n a un có d e c de a ud io , q ue co m p re n d e e l a p a ra to seg ún e l se g u n d o a sp ec to .
S eg ú n un cu a rto a sp e c to , se p ro p o rc io n a un d is p o s itivo de co m u n ica c ió n , q ue co m p re n d e e l a p a ra to según e l se g u n d o a sp ec to .
Breve descripción de los dibujos
L o s o b je to s , ca ra c te rís tic a s y ve n ta ja s a n te rio re s , y o tro s de la te c n o lo g ía d e sc rita en la p re se n te m e m o ria serán e v id e n te s a p a rtir de la s ig u ie n te d e sc rip c ió n m ás p a rtic u la r de las re a liza c io n e s co m o se ilus tra en los d ib u jo s a d ju n tos . Los d ib u jo s no son n e ce sa ria m e n te a e sca la , s ino q ue se h ace h in ca p ié en ilu s tra r los p rin c ip io s de la te c n o lo g ía d e s c rita en la p re se n te m e m oria .
La F ig u ra 1 es un d ia g ra m a de b lo q u e s q u e ilus tra un d e te c to r de a c tiv id a d y u na lóg ica de d e te rm in a c ió n de e sp e ra .
La F igura 2 es un d ia g ra m a de f lu jo q u e ilus tra un m é to do p ara la e s tim a c ió n de ru ido de fo n d o , seg ún u n a re a liza c ió n de e je m p lo .
La F ig ura 3 es un d ia g ra m a de b lo q u e s q ue ilus tra el c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra la p re d icc ió n linea l de o rde n 0 y 2 seg ún u na re a liza c ió n de e je m p lo .
La F ig ura 4 es un d ia g ra m a de b lo q u e s q ue ilus tra el c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con las e n e rg ía s re s id u a le s p a ra la p re d icc ió n linea l de o rde n 2 y 16 según u na re a liza c ió n de e je m p lo .
La F igura 5 es un d ia g ra m a de b lo q u e s q u e ilu s tra e l c á lcu lo de ca ra c te rís tic a s re la c io n a d a s con u na m e d id a de p ro x im id a d e sp e c tra l seg ún u na re a liza c ió n de e je m p lo .
La F igura 6 es un d ia g ra m a de b lo q u e s q u e ilus tra un e s tim a d o r de fo n d o de la e n e rg ía de su b -b a n d a .
La F ig u ra 7 es un d ia g ra m a de f lu jo q u e ilus tra u n a lóg ica de d e c is ió n de a c tu a liza c ió n d e l fo n d o de la so lu c ió n d e sc rita en e l A n e xo A.
Las F ig uras 8 -10 son d ia g ra m a s q u e ilus tra n el co m p o rta m ie n to de d ife re n te s p a rá m e tro s p re se n ta d o s en la p re se n te m e m o ria cu a n d o se ca lcu la n p a ra u na señ a l de a ud io q ue co m p re n d e d o s rá fag as de hab la.
Las F ig u ras 11a-11c y 12-13 son d ia g ra m a s de b lo q u e s q ue ilus tra n d ife re n te s im p le m e n ta c io n e s de un e s tim a d o r de ru ido de fo n d o seg ún re a liza c io n e s de e je m p lo .
Las F ig uras A 2 -A 9 en las p á g in a s de fig u ra s m a rca d a s co m o "A n e xo A " e s tá n a so c ia d a s con e l A n e xo A, y se m e n c io n a n en d ich o A n e xo A con el n ú m e ro q u e s igu e a la le tra "A", es d e c ir, 2 -9.
D escripción detallada
La so lu c ió n d e sc rita en la p re se n te m e m o ria se re fie re a la e s tim a c ió n de ru ido de fo n d o en se ñ a le s de a ud io . En el d e te c to r de a c tiv id a d g e n e ra liz a d a ilu s tra d o en la fig u ra 1, la fu n c ió n de e s tim a r e l ru ido de fo n d o la re a liza el b lo q ue d e n o m in a d o "e s tim a d o r de fo n d o ". A lg u n a s re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m o ria p ue de n ve rse en re lac ió n con s o lu c io n e s d e s c rita s p re v ia m e n te en W O 2011 /049514 , W O 2011 /049515 , y ta m b ié n en el A n e xo A (A p é n d ice A). La so lu c ió n d e sc rita en la p re se n te m e m o ria se co m p a ra rá con im p le m e n ta c io n e s de e s ta s so lu c io n e s d e s c rita s p re v ia m e n te . A u n q u e las so lu c io n e s d e s c rita s en W O 2011 /049514 , W O 2011 /049515 y en e l A n e xo A son b u e n a s so lu c io n e s , la so lu c ió n p re s e n ta d a en la p re se n te m e m o ria to d a v ía tie n e ve n ta ja s en re lac ió n con e stas so lu c io n e s . P o r e je m p lo , la so lu c ió n p re s e n ta d a en la p re se n te m e m o ria es aún m ás a d e cu a d a en su se g u im ie n to de l ru ido de fondo .
El re n d im ie n to de un V A D d e p e n d e de la ca p a c id a d d e l e s tim a d o r de ru ido de fo n d o p a ra ra s tre a r las ca ra c te rís tica s d e l fo n d o , en p a rtic u la r cu a n d o se tra ta de fo n d o s no e s ta c io n a rio s . C on un m e jo r se g u im ie n to , es p o s ib le h a c e r que el V A D sea m ás e fic ie n te sin a u m e n ta r e l r iesgo de q ue se p ro d u zca n co rte s de l hab la.
Un p ro b le m a con los m é to d o s de e s tim a c ió n de ru ido a c tu a le s es q ue p a ra lo g ra r un b uen se g u im ie n to d e l ru ido de fo n d o en u n a S N R ba ja , se n e ce s ita un d e te c to r de p a u sa fiab le . P ara u na e n tra d a de so lo hab la , es p o s ib le u tiliz a r la ve lo c id a d s ilá b ica o e l h echo de q u e u n a p e rso n a no p u e d e h a b la r to d o e l t ie m p o p a ra e n c o n tra r p a u sa s en e l hab la. D ich as s o lu c io n e s p o d rían im p lica r q u e d e sp u é s de un tie m p o su fic ie n te sin re a liz a r a c tu a liza c io n e s d e l fo n d o , los re q u is ito s p a ra la d e te cc ió n de p a u sa s sean "re la ja d o s ", de m o do q ue sea m ás p ro b a b le d e te c ta r u na p a u sa en el
hab la . Esto p e rm ite re s p o n d e r a c a m b io s a b ru p to s en las c a ra c te rís tic a s o el n ive l de l ru ido . A lg u n o s e je m p lo s de d ich a s lóg icas de re cu p e ra c ió n de ru ido son : 1) C om o las e xp re s io n e s d e l h ab la co n tie n e n se g m e n to s con a lta co rre la c ió n , n o rm a lm e n te es se g u ro a s u m ir q u e h ay u n a p a u sa en e l h ab la d e sp u é s de un n úm e ro s u fic ie n te de tra m a s s in c o rre la c ió n . 2) C u a n d o la R e la c ió n S eñ a l a R uido, S N R > 0, la e n e rg ía de l h ab la es m a yo r q u e e l ru ido de fon do , p o r lo q ue si la e n e rg ía de la tra m a e s tá c e rca de la e n e rg ía m ín im a d u ra n te un tie m p o m ás la rgo , p. e j., 1 -5 seg un do s , ta m b ié n es se g u ro a su m ir q ue u no e s tá en u n a p a u sa d e l hab la . Si b ien las té c n ica s a n te r io re s fu n c io n a n b ien con la e n tra d a de so lo hab la , no son s u fic ie n te s cu a n d o la m ú s ica se c o n s id e ra u n a e n tra d a a ctiva . En la m ú s ica p ue de h ab e r se g m e n to s la rgos con b a ja co rre la c ió n q ue to d a v ía son m ú sica . A d e m á s, las d in á m ica s de la e n e rg ía en la m ú sica ta m b ié n p ue de d e s e n c a d e n a r la d e te cc ió n de fa lsa s p au sa s , lo q u e p ue de re s u lta r en a c tu a liza c io n e s no d e se a d a s , e rró n e a s de la e s tim a c ió n de ru ido de fondo .
Ide a lm e n te , se n e ce s ita ría u na fu n c ió n in ve rsa de un d e te c to r de a c tiv id a d , o lo q ue se lla m a ría un "d e te c to r de o cu rre n c ia de p a u sa s ", p a ra c o n tro la r la e s tim a c ió n de ru ido . Esto a se g u ra ría q u e la a c tu a liza c ió n de las ca ra c te rís tica s d e l ru ido de fo n d o se re a liza so lo cu a n d o no h ay se ñ a l a c tiva en la tra m a a c tua l. S in e m b a rg o , co m o se ind icó a n te r io rm e n te , no es u na ta re a fá c il d e te rm in a r si un se g m e n to de la se ñ a l de a ud io co m p re n d e u n a señ a l a c tiva o no.
T ra d ic io n a lm e n te , cu a n d o se sa b ía q ue la señ a l a c tiva e ra u n a se ñ a l de hab la , e l d e te c to r de a c tiv id a d se llam ab a D e te c to r de A c tiv id a d de V o z (V A D ). El té rm in o V A D p a ra d e te c to re s de a c tiv id a d se u tiliza ta m b ié n a m e n u d o cu a n d o la señ a l de e n tra d a p ue de c o m p re n d e r m ú sica . S in e m b a rg o , en los có d e cs m o de rn os , ta m b ié n es com ú n re fe rirse al d e te c to r de a c tiv id a d co m o D e te c to r de A c tiv id a d de S on id o (S A D ) cu a n d o ta m b ié n se d e b e d e te c ta r m ú s ica co m o u na se ñ a l activa .
El e s tim a d o r de fo n d o ilu s tra d o en la fig u ra 1 u tiliza la re tro a lim e n ta c ió n d e l d e te c to r p rim a rio y /o d e l b lo q u e de e sp e ra p a ra lo ca liza r se g m e n to s de la señ a l de a ud io ina c tivo s . A l d e s a rro lla r la te c n o lo g ía d e sc rita en la p re se n te m e m oria , ha s ido un d e se o e lim in a r, o al m e no s re du c ir, la d e p e n d e n c ia de d ich a re tro a lim e n ta c ió n . P o r lo ta n to , p a ra la e s tim a c ió n de fo n d o d e sc rita en la p re se n te m e m oria , e l in ve n to r ha id e n tifica d o co m o im p o rta n te p o d e r e n c o n tra r c a ra c te rís tic a s f ia b le s p a ra id e n tif ic a r las ca ra c te rís tic a s de las se ñ a le s de fo n d o cu a n d o so lo e s tá d isp o n ib le u n a seña l de e n tra d a con u na m e zc la d e s c o n o c id a de señ a l a c tiva y de fo n d o . El in ve n to r se ha d a d o c u e n ta a d e m á s de q u e no se p u e d e s u p o n e r q ue la se ñ a l de e n tra d a co m ie n ce con un se g m e n to de ru ido , o inc lu so q u e la señ a l de e n tra d a sea h a b la m e zc la d a con ru ido , ya q u e p u e d e s e r q u e la señ a l a c tiva se a m úsica .
U n a sp e c to es q ue a u n q u e la tra m a a c tua l p ue de te n e r e l m ism o n ive l de e n e rg ía q u e la e s tim a c ió n de ru ido actua l, las ca ra c te rís tic a s de fre cu e n c ia p ue de n s e r m uy d ife re n te s , lo q u e hace q u e no se a d e s e a b le re a liz a r u na a c tu a liza c ió n de la e s tim a c ió n de ru ido u tiliza n d o la tra m a a ctu a l. La fu n c ió n de p ro x im id a d in tro d u c id a , re la tiva a la a c tu a liza c ió n de l ru ido de fo n d o , se p ue de u tiliz a r p a ra e v ita r a c tu a liza c io n e s en e s to s caso s.
A d e m á s, d u ra n te la in ic ia liza c ió n es d e s e a b le p e rm itir q ue la e s tim a c ió n de ru ido c o m ie n ce lo a n tes p o s ib le e v ita n d o d e c is io n e s inco rrec tas , ya q ue e s to p o d ría re su lta r en un re corte d e l S A D si la a c tu a liza c ió n d e l ru ido de fo n d o se re a liza u tiliz a n d o co n te n id o a ctivo . El uso de u n a ve rs ió n e sp e c ífica de in ic ia liza c ió n de la c a ra c te r ís tic a de p ro x im id a d d u ra n te la in ic ia liza c ió n p ue de re so lve r, al m e no s en p arte , e s te p rob lem a .
La so lu c ió n d e s c rita en la p re se n te m e m o ria se re fie re a un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o , en p a rtic u la r a un m é to do p a ra d e te c ta r p a u sa s en u n a señ a l de a ud io q u e fu n c io n a b ie n en s itu a c io n e s de S N R d ifíc ile s . La so lu c ió n se d e s c rib irá a c o n tin u a c ió n con re fe re n c ia a las fig u ra s 2-5.
En el ca m p o de la c o d ifica c ió n de l hab la, es co m ú n u tiliz a r la lla m a d a p re d icc ió n linea l p a ra a n a liz a r la fo rm a e sp e c tra l de u na se ñ a l de e n tra d a . El a n á lis is se re a liza típ ic a m e n te d o s v e ce s p o r tra m a , y p a ra m e jo ra r la p re c is ió n te m p o ra l los re su lta d o s son luego in te rp o la d o s de m a n e ra q u e se g e n e re un f iltro p a ra ca d a b lo q ue de 5 m s de la señ a l de e n tra da .
La p re d icc ió n linea l es u na o p e ra c ió n m a te m á tica , d o n d e los va lo re s fu tu ro s de u n a señ a l de tie m p o d isc re to se e s tim a n co m o u n a fu n c ió n linea l de m u e s tra s a n te rio res . En el p ro ce sa m ie n to de se ñ a le s d ig ita le s , la p re d icc ió n lineal a m e n u d o se d e n o m in a co d ifica c ió n p re d ic tiva linea l (L P C ) y p ue de a s í v e rse co m o un su b co n ju n to de la te o ría de filtro s . En la p re d icc ió n linea l en un c o d if ic a d o r de hab la , se a p lica un f iltro de p re d icc ió n linea l A (z ) a u na señ a l de h ab la de e n tra d a . A (z ) es un f iltro to d o ce ro q u e cu a n d o se a p lica a la señ a l de e n tra d a e lim in a la re d u n d a n c ia q u e se p u e d e m o d e la r u sa n d o el f iltro A (z ) de la se ñ a l de e n tra d a . P o r lo ta n to , la señ a l de sa lid a de l f iltro tie n e m e n o r e n e rg ía q ue la se ñ a l de e n tra d a cu a n d o el f iltro log ra m o d e la r a lgún a sp e c to o a sp e c to s de la señ a l de e n tra d a . E sta se ñ a l de sa lid a se d e n o m in a "e l re s idu o", "la e n e rg ía re s id u a l" o "la señ a l re s idu a l". D ich os filtro s de p re d icc ió n linea l, d e n o m in a d o s a lte rn a tiv a m e n te co m o filtro s re s id u a le s , p ue de n s e r de d ife re n te o rde n de m o de lo con d ife re n te n úm ero de co e fic ie n te s de filtro . P o r e je m p lo , p a ra m o d e la r co rre c ta m e n te e l hab la , p u e d e s e r n ece sa rio un f iltro de p red icc ió n linea l de o rde n de m o de lo 16. A sí, en un c o d if ic a d o r de hab la , se p ue de u tiliz a r un f iltro de p re d icc ió n linea l A (z ) de o rde n de m o d e lo 16.
El in ve n to r se ha d ad o c u e n ta de q u e las ca ra c te rís tic a s re la c io n a d a s con la p re d icc ió n linea l p ue de n u tiliza rse p ara d e te c ta r p a u sa s en se ñ a le s de a ud io en un in te rva lo de S N R de 20 dB a 10 dB o p o s ib le m e n te 5 dB . Según re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m oria , se u tiliza u n a re lac ión e n tre e n e rg ía s re s id u a le s p ara d ife re n te s ó rd e n e s de m o de lo p a ra u n a señ a l de a ud io p a ra d e te c ta r p a u sa s en la señ a l de a ud io . La re lac ió n u tiliz a d a
es el c o c ie n te e n tre la e n e rg ía re s idu a l de un m o d e lo de o rde n in fe rio r y un o rd e n de m o de lo su p e rio r. El co c ie n te e n tre e n e rg ía s re s id u a le s p ue de d e n o m in a rse "g a n a n c ia de p re d icc ió n linea l", ya q u e es un in d ica d o r de la can tida d de e n e rg ía de la señ a l q ue e l f iltro de p re d icc ió n linea l ha p o d id o m o de la r, o e lim in a r, e n tre un o rde n de m o de lo y o tro o rd e n de m ode lo .
La e n e rg ía re s idu a l d e p e n d e rá de l o rd e n de m o de lo M de l filtro de p re d icc ió n linea l A (z). U na fo rm a com ú n de ca lc u la r los co e fic ie n te s de f iltro p a ra un f iltro de p re d icc ió n linea l es e l a lg o ritm o de L e v in so n -D u rb in . Este a lg o ritm o es re cu rs ivo y, en el p ro ce so de c re a c ió n de un f iltro de p re d icc ió n A (z ) de o rde n M, ta m b ié n , co m o "su b p ro d u c to ", p ro d u c irá las e n e rg ía s re s id u a le s de los ó rd e n e s de m o de lo in fe rio re s . Este h echo p u e d e u tiliza rse según las re a liza c io n e s de la inve nc ión .
La F ig ura 2 m u e s tra un m é to d o g e n e ra l de e je m p lo p a ra la e s tim a c ió n de ru ido de fo n d o en u na señ a l de a ud io . El m é to d o p ue de re a liza rse m e d ia n te un e s tim a d o r de ru ido de fo n d o . El m é to do co m p re n d e o b te n e r 201 al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la señ a l de a ud io , co m o u n a tra m a o p a rte de u n a tra m a , con b ase en una p rim e ra g a n a n c ia de p re d icc ió n linea l, ca lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u n a p re d icc ió n linea l de o rde n 0 y u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y, una se g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de 2° o rde n y u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la se ñ a l de aud io .
El m é to do co m p re n d e a d e m á s d e te rm in a r 202 si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p au sa , es dec ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m ú sica , b asad a , al m e no s, en el al m e no s un p a rá m e tro o b te n id o ; y, a c tu a liz a r 203 u n a e s tim a c ió n de ru ido de fo n d o con b ase en e l se g m e n to de la señ a l de a u d io cu a n d o e l seg m en to de la se ñ a l de a ud io co m p re n d e u n a p au sa . Es d ec ir, e l m é to do co m p re n d e la a c tu a liza c ió n de u n a e s tim a c ió n de ru ido de fo n d o cu a n d o se d e te c ta u n a p a u sa en el se g m e n to de la señ a l de a ud io b asad a , al m e no s, en el al m enos un p a rá m e tro o b te n id o .
Las g a n a n c ia s de p re d icc ió n linea l p o d rían d e sc rib irse co m o u n a p rim e ra g a n a n c ia de p re d icc ió n linea l re la c io n a d a con el p aso de la p re d icc ió n linea l de o rde n 0 al 2° o rde n p a ra el se g m e n to de la se ñ a l de a ud io ; y u n a se g u n d a g a n a n c ia de p re d icc ió n linea l re la c io n a d a con el p aso de la p re d icc ió n linea l de 2° o rde n al 16° o rd e n p a ra e l seg m en to de la señ a l de a ud io . A d e m á s, la o b te n c ió n de l al m e no s un p a rá m e tro p o d ría d e sc rib irse a lte rn a tiv a m e n te com o d e te rm in a r, ca lcu la r, d e r iv a r o c rear. Las e n e rg ía s re s id u a le s re la c io n a d a s con p re d icc io n e s line a le s de m o d e lo de o rd e n 0, 2 y 16 p ue de n o b te n e rse , re c ib irse o re cu p e ra rse de, es d ec ir, p ro p o rc io n a d a s de a lg u n a m a n e ra por, una p a rte de l c o d if ic a d o r d o n d e la p re d icc ió n linea l se re a liza co m o p a rte de un p ro ce so de co d ifica c ió n re gu la r. De este m odo , la co m p le jid a d co m p u ta c io n a l de la so lu c ió n d e s c rita en la p re se n te m e m o ria p ue de re du c irse , en co m p a ra c ió n con cu a n d o las e n e rg ía s re s id u a le s n ece s ita n d e riv a rs e e sp e c ia lm e n te p a ra la e s tim a c ió n de ru ido de fon do .
El al m e no s un p a rá m e tro o b te n id o con b ase en las c a ra c te rís tica s de la p re d icc ió n linea l p u e d e p ro p o rc io n a r un a n á lis is in d e p e n d ie n te de l n ive l de la señ a l de e n tra d a q ue m e jo ra la d e c is ió n de re a liz a r u n a a c tu a liza c ió n d e l ru ido de fo n d o o no. La so lu c ió n es p a rtic u la rm e n te útil en e l in te rva lo S N R de 10 a 20 dB , d o n d e los S A D b a sa d o s en e n e rg ía tie n e n un re n d im ie n to lim itad o d e b id o al in te rva lo d in á m ico n orm a l de las se ñ a le s de hab la.
En la p re se n te m e m oria , e n tre o tras , las v a r ia b le s E (0), ..., E (m ), ..., E (M ) re p re se n ta n las e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o d e lo de 0 a M de los M+1 filtro s A m (z). T e n g a en cu e n ta q u e E (0) es so lo la e n e rg ía de e n tra d a . Un a n á lis is de la señ a l de a ud io seg ún la so lu c ió n d e sc rita en la p re se n te m e m o ria p ro p o rc io n a v a r ia s c a ra c te rís tic a s o p a rá m e tro s n u e vo s a n a liza n d o la g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u n a p re d icc ió n linea l de o rde n 0 y u na se ñ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n , y la g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u na p re d icc ió n line a l de 2° o rd e n y u n a seña l re s id u a l de u n a p re d icc ió n linea l de 16° o rde n . Es d ec ir, la g a n a n c ia de p re d icc ió n linea l p a ra p a s a r de la p re d icc ió n line a l de o rde n 0 a la de 2° o rde n es la m ism a q ue la "e n e rg ía re s idu a l" E(0) (p a ra un o rde n de m o d e lo 0) d iv id id a p o r la e n e rg ía re s idu a l E(2) (p a ra un 2° o rde n de m o de lo ). En co n se cu e n c ia , la g a n a n c ia de p re d icc ió n linea l p a ra p a sa r de la p re d icc ió n linea l de 2° o rde n a la p re d icc ió n linea l de 16° o rde n es la m ism a q u e la e n e rg ía re s idu a l E(2) (para un 2° o rde n de m o d e lo ) d iv id id a p o r la e n e rg ía re s idu a l E (16) (p a ra un 16° o rde n de m o de lo ). Los e je m p lo s de p a rá m e tro s y la d e te rm in a c ió n de p a rá m e tro s con b ase en las g a n a n c ia s de p re d icc ió n se d e sc rib irá n con m ás d e ta lle m á s a de lan te . El al m e no s un p a rá m e tro o b te n id o según la re a liza c ió n g e n e ra l d e s c rita a n te r io rm e n te p u e d e fo rm a r p a rte de un c rite r io de d e c is ió n u tiliz a d o p a ra e v a lu a r si a c tu a liz a r o no la e s tim a c ió n de ru ido de fon do .
P ara m e jo ra r la e s ta b ilid a d a la rgo p lazo de al m e no s un p a rá m e tro o ca ra c te rís tica , se p u e d e c a lc u la r u na ve rs ió n lim ita d a de la g a n a n c ia de p re d icc io n e s . Es d ec ir, la o b te n c ió n d e l al m e no s un p a rá m e tro p u e d e c o m p re n d e r lim ita r las g a n a n c ia s de p re d icc ió n linea l, re la c io n a d a s con p a s a r de la p re d icc ió n linea l de o rde n 0 al 2° o rde n y de 2° o rden al 16° o rde n , p a ra to m a r va lo re s en un in te rva lo p re d e fin id o . P o r e je m p lo , las g a n a n c ia s de p re d icc ió n linea l p ueden lim ita rse p a ra to m a r v a lo re s e n tre 0 y 8, co m o se ilus tra , p. e j., en la Eq. 1 y la Eq. 6 a co n tin u a c ió n .
La o b te n c ió n de l al m e no s un p a rá m e tro p ue de c o m p re n d e r a d e m á s la c re a c ió n de al m e no s u na e s tim a c ió n a largo p la zo de c a d a u na de la p rim e ra y de la s e g u n d a g a n a n c ia de p re d icc ió n linea l, p. e j., m e d ia n te filtra d o de paso bajo . D icha , al m e no s una , e s tim a c ió n a la rgo p la zo se b a s a ría e n to n ce s , a de m ás, en las co rre sp o n d ie n te s g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con al m e no s un se g m e n to de la señ a l de a ud io p re ce d e n te . S e p o d ría c re a r m ás de una e s tim a c ió n a la rgo p lazo, d o n d e p. e j., u n a p rim e ra y u na s e g u n d a e s tim a c ió n a la rgo p la zo re la c io n a d a s con una
g a n a n c ia de p re d icc ió n linea l re a cc io n a n de m a n e ra d ife re n te a los c a m b io s en la se ñ a l de a ud io . P o r e je m p lo , u na p rim e ra e s tim a c ió n a la rgo p la zo p ue de re a cc io n a r m ás rá p id a m e n te a los c a m b io s q ue u n a s e g u n d a e s tim a c ió n a la rgo p la zo . D ich a p rim e ra e s tim a c ió n a la rgo p la zo p ue de d e n o m in a rse , a lte rn a tiva m e n te , co m o u n a e s tim a c ió n a co rto p lazo.
La o b te n c ió n de l al m e no s un p a rá m e tro p u e d e c o m p re n d e r a d e m á s d e te rm in a r u na d ife re n c ia , co m o la d ife re n c ia a b so lu ta G d _ 0 _ 2 (Eq. 3) d e sc rita a c o n tin u a c ió n , e n tre u n a de las g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con el se g m e n to de la señ a l de aud io , y u n a e s tim a c ió n a la rgo p la zo de d ich a g a n a n c ia de p re d icc ió n linea l. A lte rn a tiva m e n te o a d e m á s , se p o d ría d e te rm in a r u n a d ife re n c ia e n tre d os e s tim a c io n e s a la rgo p lazo, co m o en la Eq. 9 a co n tin u a c ió n . El té rm in o d e te rm in a r p o d ría ca m b ia rse , a lte rn a tiva m e n te , p o r ca lcu la r, c re a r o d eriva r.
La o b te n c ió n d e l al m e no s un p a rá m e tro p uede , co m o se ind icó a n te r io rm e n te , c o m p re n d e r e l f iltra d o de paso b a jo de las g a n a n c ia s de p re d icc ió n linea l, d e riva n d o a s í las e s tim a c io n e s a la rgo p la zo , de las c u a le s a lg u n a s p ueden d e n o m in a rse , a lte rn a tiva m e n te , e s tim a c io n e s a co rto p lazo, d e p e n d ie n d o de cu á n to s s e g m e n to s se to m e n en co n s id e ra c ió n en la e s tim a c ió n . Los co e fic ie n te s de f iltro de al m e no s un f iltro de p aso b a jo p ue de n d e p e n d e r de u na re lac ió n e n tre u na g a n a n c ia de p re d icc ió n linea l re lac io na da , p. e j., so la m e n te , con el se g m e n to de la señ a l de aud io a c tu a l y un p ro m e d io , d e n o ta d o p. e j., p ro m e d io a la rgo p lazo , o e s tim a c ió n a la rgo p la zo , de u n a g a n a n c ia de p re d icc ió n co rre sp o n d ie n te o b te n id a con b a se en u na p lu ra lida d de s e g m e n to s de la se ñ a l de a ud io p re ce d e n te . Esto se p u e d e re a liz a r p a ra c re a r, p. e j., a de m ás, e s tim a c io n e s a la rgo p la zo de las g a n a n c ia s de p re d icc ió n . El f iltra d o de p a so b a jo p u e d e re a liza rse en d o s o m ás p asos , d o n d e c a d a p aso p ue de re s u lta r en un p a rá m e tro , o e s tim a c ió n , q ue se u tiliz a p a ra to m a r u na d e c is ió n con re sp e c to a la p re se n c ia de u na p a u sa en e l se g m e n to de la señ a l de a ud io . P or e je m p lo , d ife re n te s e s tim a c io n e s a la rgo p lazo (co m o G 1 _ 0 _ 2 (E q .2 ) y G a d _ 0 _ 2 (E q .4), y /o , G 1 _ 2 _ 16 (E q .7), G 2 _ 2 _ 16 (E q .8 ) y G a d _ 2 _ 16 (E q .10 ) d e s c rita s a co n tin u a c ió n ) q ue re fle jan c a m b io s en la señ a l de a ud io de d ife re n te s m aneras, p ue de n a n a liza rse o c o m p a ra rse p a ra d e te c ta r u n a p a u sa en un se g m e n to de la señ a l de a ud io actua l.
La d e te rm in a c ió n 202 de si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa o no p u e d e b a sa rse a d e m á s en u n a m e d id a de p ro x im id a d e sp e c tra l a so c ia d a con e l se g m e n to de la señ a l de a ud io . La m e d id a de p ro x im id a d e sp e c tra l in d ica rá q u é tan c e rca e s tá e l n ive l de e n e rg ía "p o r b a n d a de fre cu e n c ia " d e l se g m e n to de la se ñ a l de a ud io a c tu a lm e n te p ro ce sa d o al n ive l de e n e rg ía "p o r b a n d a de fre cu e n c ia " de la e s tim a c ió n de ru ido de fo n d o a ctu a l, p. ej., un v a lo r in ic ia l o u na e s tim a c ió n q u e es e l re su lta d o de u n a a c tu a liza c ió n p re v ia re a liza d a a n tes de l a n á lis is del se g m e n to de la se ñ a l de a ud io a ctu a l. Un e je m p lo de la d e te rm in a c ió n o d e riva c ió n de u n a m e d id a de p ro x im id a d e sp e c tra l se d a a c o n tin u a c ió n en las e cu a c io n e s E q.12 y E q.13. La m e d id a de p ro x im id a d e sp e c tra l se p ue de u tiliz a r p a ra e v ita r a c tu a liza c io n e s de ru ido b a sa d a s en tra m a s de b a ja e n e rg ía con u n a g ran d ife re n c ia en las c a ra c te rís tica s de fre cu e n c ia , en co m p a ra c ió n con la e s tim a c ió n de fo n d o a c tua l. P o r e je m p lo , la e n e rg ía p ro m e d io en las b a n d a s de fre cu e n c ia p o d ría s e r ig u a lm e n te b a ja p a ra el se g m e n to de la señ a l a c tu a l y la e s tim a c ió n de ru ido de fo n d o actua l, p e ro la m e d id a de p ro x im id a d e sp e c tra l re ve la ría si la e n e rg ía se d is trib u ye de m a n e ra d ife re n te en las b a n d a s de fre cu e n c ia . D icha d ife re n c ia en la d is tr ib u c ió n de e n e rg ía p o d ría s u g e rir q ue el se g m e n to de la se ñ a l a ctu a l, p. ej., tra m a , p ue de s e r co n te n id o a c tivo de b a jo n ive l y u na a c tu a liza c ió n de la e s tim a c ió n de ru ido de fo n d o b a s a d a en la tra m a p od ría , p. e j., e v ita r la d e te cc ió n de tra m a s fu tu ra s con co n te n id o s im ila r. C om o la S N R de su b -b a n d a es m ás se n s ib le a los a u m e n to s de e n e rg ía , e l uso de co n te n id o a ctivo , inc lu so de b a jo n ive l, p ue de re s u lta r en u na g ran a c tu a liza c ió n de la e s tim a c ió n de l fo n d o si e se in te rva lo de fre cu e n c ia p a rtic u la r no e x is te en el ru ido de fo n d o , com o la p a rte de a lta fre cu e n c ia d e l h ab la c o m p a ra d a con el ru ido de l co ch e de b a ja fre cu e n c ia . D espu és de u na a c tu a liza c ió n de e s te tipo , se rá m ás d ifíc il d e te c ta r e l hab la.
C om o ya se sug irió a n te rio rm e n te , la m e d id a de p ro x im id a d e sp e c tra l p ue de d e riva rse , o b te n e rs e o ca lcu la rse con b a se en las e n e rg ía s p a ra un c o n ju n to de b a n d a s de fre cu e n c ia , o su b -b a n d a s ind ica d a s a lte rn a tiva m e n te , de l se g m e n to de la señ a l de a ud io a c tu a lm e n te a n a liza d o y a las e s tim a c io n e s de ru ido de fo n d o a c tu a le s co rre sp o n d ie n te s al c o n ju n to de b a n d a s de fre cu e n c ia . Esto ta m b ié n se e je m p lific a rá y d e s c rib irá con m ás d e ta lle m ás a de la n te , y se ilus tra en la fig u ra 5.
C om o se ind icó a n te r io rm e n te , la m e d id a de p ro x im id a d e sp e c tra l p ue de d e riva rse , o b te n e rse o ca lcu la rse co m p a ra n d o un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia a c tu a l de l se g m e n to de la señ a l de a ud io a c tu a lm e n te p ro ce sa d o con un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia de u na e s tim a c ió n de ru ido de fo n d o a ctu a l. S in e m b a rg o , p a ra e m p e za r, es d ec ir, d u ra n te un p rim e r p e río d o o un p rim e r n úm e ro de tra m a s al c o m ie n zo d e l a n á lis is de una señ a l de a ud io , p u e d e q u e no h aya u n a e s tim a c ió n fia b le d e l ru ido de fo n d o , p. e j., ya q ue aún no se h a b rá rea lizado u na a c tu a liza c ió n fia b le de u na e s tim a c ió n de ru ido de fo n d o . P o r lo tan to , p ue de a p lica rse un p e río d o de in ic ia liza c ión p a ra d e te rm in a r e l v a lo r de p ro x im id a d e sp e c tra l. D uran te d ich o p e río d o de in ic ia liza c ió n , los n ive les de e n e rg ía p o r b a n d a de fre cu e n c ia de l se g m e n to de la señ a l de a ud io a c tu a l se c o m p a ra rá n en ca m b io con u n a e s tim a c ió n de fon do in ic ia l, q ue p u e d e s e r p. e j., un v a lo r co n s ta n te q u e se p ue de co n fig u ra r. En los e je m p lo s m ás a ba jo , e s ta e s tim a c ió n de ru ido de fo n d o in ic ia l se e s ta b le ce en e l v a lo r de e je m p lo E m in= 0 ,0035. D e spu és d e l p e río d o de in ic ia liza c ió n , el p ro ce d im ie n to p ue de c a m b ia r al fu n c io n a m ie n to n o rm a l, y c o m p a ra r e l n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia a c tu a l d e l se g m e n to de la señ a l de a u d io a c tu a lm e n te p ro ce sa d o con un n ive l de e n e rg ía p o r b a n d a de fre cu e n c ia de u na e s tim a c ió n de ru ido de fo n d o a c tu a l. La d u ra c ió n de l p e río d o de in ic ia liza c ió n p u e d e co n fig u ra rse , p. e j., con base en s im u la c io n e s o p ru e b a s q u e ind ican e l t ie m p o q ue ta rd a a n tes de q ue , p. e j., se p ro p o rc io n e u n a e s tim a c ió n fia b le y /o sa tis fa c to ria de l ru ido de fon do . En un e je m p lo u tiliz a d o a c o n tin u a c ió n , la c o m p a ra c ió n con u n a e s tim a c ió n de ru ido de fo n d o in ic ia l (en lu g a r de con u n a e s tim a c ió n "rea l" d e riv a d a con b ase en la señ a l de a ud io a c tu a l) se re a liza d u ra n te las p rim e ra s 150 tra m a s .
El a l m e no s un p a rá m e tro p u e d e se r el p a rá m e tro e je m p lifica d o en el c ó d ig o m ás a ba jo , d e n o ta d o N E W _ P O S _ B G , y /o uno o m á s de la p lu ra lid a d de p a rá m e tro s d e sc rito s m ás a ba jo , lo que lle va a la fo rm a c ió n d e un c rite r io de d e c is ió n o d e un c o m p o n e n te en un c rite r io de d e c is ió n p a ra la d e te cc ió n de pau sa . En o tra s p a la b ra s , el al m e no s un p a rá m e tro , o ca ra c te rís tica , o b te n id o 201 con b ase en las g a n a n c ia s de p re d icc ió n linea l p u e d e se r uno o m ás de los p a rá m e tro s d e sc rito s a co n tin u a c ió n , p u e d e c o m p re n d e r uno o m ás de los p a rá m e tro s d e sc rito s a c o n tin u a c ió n y /o b a sa rse en uno o m ás d e los p a rá m e tro s d e sc rito s a co n tin u a c ió n .
C a ra c te rís tica s o p a rá m e tro s re la c io n a d o s con las e n e rg ía s re s id u a le s E (0) y E(2)
La F ig u ra 3 m u e s tra un d ia g ra m a de b lo q u e s g e n e ra l d e la d e riva c ió n de c a ra c te rís tic a s o p a rá m e tro s re la c io n a d o s con E(0) y E(2), seg ún una re a liza c ió n de e je m p lo . C o m o p u e d e v e rse en la fig u ra 3, la g a n a n c ia de p re d icc ió n se c a lc u la p rim e ro co m o E (0 )/E (2 ). U na v e rs ió n lim ita d a de la g a n a n c ia d e p re d icc io n e s se c a lc u la co m o
G _0_2= m ax(0 ,m in (8 ,E (0 )/E (2 ))) (Eq 1) d o n d e E(0) re p re se n ta la e n e rg ía de la señ a l d e e n tra d a y E (2) es la e n e rg ía re s idu a l d e sp u é s de u n a p re d icc ió n linea l de 2° o rde n . La e xp re s ió n en la e cu a c ió n 1 lim ita la g a n a n c ia de p re d icc ió n a un in te rva lo e n tre 0 y 8. La g a n a n c ia de p re d icc ió n d e b e se r m a yo r que ce ro p a ra ca so s n o rm a le s , p e ro p u e de n o cu rr ir a n o m a lía s , p. e j., p a ra v a lo re s ce rca n o s a ce ro y, p o r lo tan to , una lim itac ió n "m a yo r q u e c e ro " (0 <) p ue de se r útil. La razón p a ra lim ita r la g a n a n c ia de p re d icc ió n a un m á x im o d e 8 es que , p a ra el p ro p ó s ito de la so lu c ió n d e s c rita en la p re se n te m e m oria , es su fic ie n te s a b e r que la g a n a n c ia d e p re d icc ió n es a p ro x im a d a m e n te 8 o m a yo r q u e 8, lo q u e in d ica una g a n a n c ia de p red icc ió n linea l s ig n ifica tiva . D ebe se ñ a la rse q u e cu a n d o no h ay d ife re n c ia e n tre la e n e rg ía re s idu a l e n tre d o s ó rd e n e s de m ode lo d ife re n te s , la g a n a n c ia d e p re d icc ió n linea l s e rá 1, lo q u e in d ica q u e el filtro de un o rd e n de m o de lo su p e rio r no tien e m ás é x ito en m o d e la r la señ a l d e a u d io q ue el filtro de un o rd e n d e m o de lo in fe rio r. A d e m á s , si la g a n a n c ia de p re d icc ió n G _ 0 _2 a d o p ta se v a lo re s d e m a s ia d o g ra n d e s en las s ig u ie n te s e xp re s io n e s , p o d ría p o n e r en rie sgo la e s ta b ilid a d de los p a rá m e tro s d e riva d o s . D ebe se ñ a la rse que 8 es so lo un v a lo r d e e je m p lo , que se ha s e le cc io n a d o p a ra una re a liza c ió n e sp e c ífica . El p a rá m e tro G _ 0 _2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p sP _ 0 _ 2 , o gi_p_ 0 _ 2 . Luego , la g a n a n c ia de p re d icc ió n lim ita d a se f iltra en d os p a so s p a ra c re a r e s tim a c io n e s a la rgo p lazo d e e s ta g an an c ia . El p rim e r filtra d o d e paso b a jo y p o r tan to , la d e riva c ió n de u n a p rim e ra c a ra c te r ís tic a o p a rá m e tro a la rgo p la zo se re a liza com o :
D onde el s e g u n d o "G 1 _ 0 _ 2 " en la e xp re s ió n d e b e lee rse co m o el v a lo r de un se g m e n to de la señ a l de a u d io a n te rio r. E ste p a rá m e tro n o rm a lm e n te s e rá 0 u 8, d e p e n d ie n d o de l tipo de ru ido d e fo n d o en la e n tra d a u n a v e z que h aya un se g m e n to d e e n tra d a so lo d e fon do . El p a rá m e tro G 1 _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 0 _ 2 _ lp o gi_p_ 0_2 . Luego se p u e d e c re a r o c a lc u la r o tra c a ra c te r ís tic a o p a rá m e tro u tiliza n d o la d ife re n c ia e n tre la p rim e ra c a ra c te r ís tic a a la rgo p la zo G 1 _ 0 _ 2 y la g a n a n c ia de p re d icc ió n lim ita d a tra m a a tra m a G _ 0 _2 , seg ún :
G d_0_2 = a bs(G 1_ 0_2 -G _ 0_2 ) (Eq. 3)
E sto d a rá una in d ica c ió n de la g a n a n c ia de p re d icc ió n de la tra m a a c tu a l en c o m p a ra c ió n con la e s tim a c ió n a largo p la zo de la g a n a n c ia d e p re d icc ió n . El p a rá m e tro G d _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 0 _ 2 _ a d o gad_ 0_2 . En la fig u ra 3, e s ta d ife re n c ia se u tiliza p a ra c re a r u na se g u n d a e s tim a c ió n o c a ra c te r ís tic a a la rgo p lazo G a d _ 0 _ 2. E sto se hace u tiliza n d o un filtro q ue a p lic a d ife re n te s co e fic ie n te s de filtro d e p e n d ie n d o de si la d ife re n c ia a la rgo p la zo es m a yo r o m e n o r q u e la d ife re n c ia p ro m e d io e s tim a d a a c tu a lm e n te seg ún :
d on de , si G d _ 0 _ 2 < G a d _ 0 _ 2 e n to n ce s a = 0,1, s ino a = 0,2
D onde el se g u n d o "G a d _ 0 _ 2 " en la e xp re s ió n d e b e lee rse co m o el v a lo r d e un se g m e n to de la señ a l d e a ud io a n te rio r. El p a rá m e tro G a d _ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., G lp _ 0_ 2 , e p sP _ 0 _ 2 _ a d _ lp o gad_0_2. P a ra e v ita r que el f iltra d o e n m a sca re d ife re n c ia s de tra m a a lta s o ca s io n a le s , se p u e d e d e riv a r o tro p a rá m e tro , q u e no se m u e s tra en la figu ra . Es d ec ir, la se g u n d a c a ra c te rís tic a a la rgo p lazo G a d _ 0 _ 2 p u e d e co m b in a rse con la d ife re n c ia de tra m a p a ra e v ita r d ich o e n m a sca ra m ie n to . E ste p a rá m e tro p u e d e d e riva rse to m a n d o el m á x im o de la ve rs ió n de tra m a G d _ 0 _ 2 y de la ve rs ió n a la rgo p la zo G a d _ 0 _ 2 d e la c a ra c te r ís tic a de g a n a n c ia de p re d icc ió n , com o :
G m ax_0_2 = m ax(G ad _0_2 ,G d_0_2 ) (Eq. 5) El p a rá m e tro G m a x_ 0 _ 2 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p s P _ 0 _ 2 _ a d _ lp _ m a x o gmax_ 0 _ 2 .
C a ra c te rís tica s o p a rá m e tro s re la c io n a d o s con las e n e rg ía s re s id u a le s E (2) y E (16)
La F ig u ra 4 m u e s tra un d ia g ra m a de b lo q u e s g e n e ra l de la d e riva c ió n de las ca ra c te rís tic a s o p a rá m e tro s re la c io n a d o s con E(2) y E (16), seg ún u n a re a liza c ió n de e je m p lo . C om o p u e d e v e rse en la f ig u ra 4, la g a n a n c ia de p re d icc ió n se c a lc u la p rim e ro co m o E (2 )/E (16 ). Las c a ra c te rís tic a s o p a rá m e tro s c re a d o s u tiliza n d o la d ife re n c ia o re lac ió n e n tre la
e n e rg ía re s idu a l de 2° o rde n y la e n e rg ía re s idu a l d e 16° se d e riva n de fo rm a lig e ra m e n te d ife re n te a las d e sc rita s a n te r io rm e n te en re lac ió n con la re lac ió n e n tre las e n e rg ía s re s id u a le s d e o rde n 0 y 2°.
A qu í, ta m b ié n , una g a n a n c ia de p re d icc ió n lim ita d a se ca lc u la co m o
G _ 2_16 = m a x(0 ,m in (8 ,E (2 )/E (16))) (Eq. 6) d o n d e E(2) re p re se n ta la e n e rg ía re s idu a l d e sp u é s de u n a p re d icc ió n linea l de 2° o rde n y E (16) re p re se n ta la e n e rg ía re s idu a l d e sp u é s de una p re d icc ió n linea l de 16° o rde n . A lte rn a tiva m e n te , e l p a rá m e tro G _ 2 _ 16 p o d ría ind ica rse , p. ej., e p sP _ 2 _ 16 o gi_p_ 2 _ 16 . E s ta g a n a n c ia de p re d icc ió n lim ita d a se u tiliza lue g o p a ra c re a r d o s e s tim a c io n e s a largo p la zo d e e s ta g a n a n c ia : u n a d o n d e el co e fic ie n te de filtro d ifie re si la e s tim a c ió n a la rgo p la zo se a u m e n ta o no, com o se m u e s tra en:
G 1 _2_16=(1 -a) G 1 _ 2 _ 16 a G _ 2 _ 16 (Eq. 7) d onde , si G _ 2 _ 16 > G 1 _ 2 _ 16 e n to n ce s a = 0,2 , s ino a = 0 ,03.
El p a rá m e tro G 1 _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p s P _ 2 _ 16 _ lp o g¿p_2_16.
La se g u n d a e s tim a c ió n a la rgo p la zo u tiliz a un co e fic ie n te d e filtro co n s ta n te seg ún :
G 2 _ 2 _ 16 = ¿ (1 -b ) G 2 _ 2 _ 16 b G _ 2 _ 16. d o n d e t>= 0 ,G 2 (E q . 8 ) El p a rá m e tro G 2 _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. ej., e p sP _ 2 _ 16 _ lp 2 o g p _ 0_2.
P a ra la m a yo ría d e los tip o s de se ñ a le s d e fon do , ta n to G 1 _ 2 _ 16 co m o G 2 _ 2 _ 16 e s ta rán c e rca d e 0, p e ro te n d rá n d ife re n te s re sp u e s ta s al c o n te n id o d o n d e se n ece s ite la p re d icc ió n linea l de 16° o rde n , que n o rm a lm e n te es p a ra hab la y o tro co n te n id o a ctivo . La p rim e ra e s tim a c ió n a la rgo p lazo , G 1 _ 2 _ 16 , g e n e ra lm e n te se rá m ás a lta que la s e g u n d a e s tim a c ió n a la rgo p la zo G 2 _ 2 _ 16. E s ta d ife re n c ia e n tre las c a ra c te rís tic a s a la rgo p la zo se m ide seg ún :
G d _ 2 _ 16 = G 1 _ 2 _ 16 - G 2 _ 2 _ 16 ( Eq. 9)
El p a rá m e tro G d _ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , e p s P _ 2 _ 16 _ d lp o gad_2_16.
G d _ 2 _ 16 p u e d e lue g o u tiliza rse co m o e n tra d a p a ra un filtro que c re a una te rce ra c a ra c te r ís tic a a la rgo p lazo seg ún :
d on de , si G d _ 2 _ 16 < G a d _ 2 _ 16 e n to n ce s c = 0 ,02 , s ino c = 0 ,05.
E ste filtro a p lica d ife re n te s co e fic ie n te s de filtro d e p e n d ie n d o de si la te rce ra señ a l d e la rgo p la zo d e b e in c re m e n ta rse o no. El p a rá m e tro G a d _ 2 _ 16 p u e d e ind ica rse , a lte rn a tiva m e n te , p. e j., e p sP _ 2 _ 16 _ d lp _ lp 2 o g ad_2_16. T a m b ié n aquí, la señ a l a la rgo p la zo G a d _ 2 _ 16 p u e d e co m b in a rse con la señ a l de e n tra d a de filtro G d _ 2 _ 16 p a ra e v ita r que el f iltra d o e n m a sca re e n tra d a s a lta s o ca s io n a le s p a ra la tra m a a c tu a l. El p a rá m e tro fina l es e n to n ce s el m á x im o de la tra m a o se g m e n to y de la ve rs ió n a la rgo p la zo d e la ca ra c te rís tic a
G m ax_2_16 = m ax(G ad _2_16, G d _ 2 _ 16) (Eq. 11)
El p a rá m e tro G m a x_ 2 _ 16 p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., e p s P _ 2 _ 16 _ d lp _ m a x o gmax_ 0 _ 2 .
M e d id a de p ro x im id a d /d ife re n c ia e sp ec tra l
U na c a ra c te r ís tic a d e p ro x im id a d e sp e c tra l u tiliza el a n á lis is d e fre cu e n c ia de la tra m a o se g m e n to de e n tra d a actua l d o n d e se c a lc u la la e n e rg ía de s u b -b a n d a y se co m p a ra con la e s tim a c ió n de fo n d o de su b -b a n d a . Se p u e d e u tiliza r un p a rá m e tro o ca ra c te rís tic a d e p ro x im id a d e sp e c tra l en c o m b in a c ió n con un p a rá m e tro re la c io n a d o con las g a n a n c ia s d e p re d icc ió n linea l d e sc rita s a n te r io rm e n te , p. e j., p a ra a se g u ra r q u e el se g m e n to o la tra m a a c tu a l e s tá re la tiva m e n te ce rca , o a l m e n o s no d e m a s ia d o le jos, de una e s tim a c ió n de fo n d o p rev ia .
La F ig u ra 5 m u e s tra un d ia g ra m a d e b lo q u e s de l cá lcu lo de una m e d id a de p ro x im id a d o d ife re n c ia e sp e c tra l. D uran te el p e río d o de in ic ia liza c ió n , p. e j., las 150 p rim e ra s tra m as , la co m p a ra c ió n se re a liza con u n a co n s ta n te c o rre sp o n d ie n te a la e s tim a c ió n d e fo n d o in ic ia l. D e sp u é s de la in ic ia liza c ió n , p a sa al fu n c io n a m ie n to n o rm a l y se co m p a ra con la e s tim a c ió n d e fon do . T e n g a en c u e n ta q u e m ie n tra s e l a n á lis is e sp e c tra l p ro d u ce e n e rg ía s de s u b b a n d a p a ra 20 su b -b a n d a s , el cá lcu lo de n o n s ta B a q u í so lo u sa s u b -b a n d a s i = 2, ... 16, y a que es p r in c ip a lm e n te en e s ta s b a n d a s d o n d e se u b ica la e n e rg ía de l hab la . A q u í n o n s ta B re fle ja la no e s ta c io n a lid a d .
A sí, d u ra n te la in ic ia liza c ió n , n o n s ta B se c a lc u la u tiliza n d o una Em in , q u e a q u í se e s ta b le ce a Em in = 0 ,0035 com o :
nonstaB = sum (abs(log (E cb (i)+1 )-lo g (E m in 1 ))) (Eq. 12)
d o n d e la su m a se hace so b re i = 2, ... 16.
E sto se hace p a ra re d u c ir el e fe c to de los e rro re s de d e c is ió n en la e s tim a c ió n de ru ido d e fo n d o d u ra n te la in ic ia liza c ió n . D e sp u é s de l p e río d o de in ic ia liza c ió n , el cá lcu lo se re a liza u tiliza n d o la e s tim a c ió n d e ru ido de fon do a c tu a l de la su b -b a n d a re spe ctiva , se g ú n :
nonstaB = sum (abs(log (E cb (i)+1 )-lo g (N cb (i)+ 1 ))) (Eq. 13)
d o n d e la su m a se hace so b re i = 2 ...16.
La a d ic ió n de la co n s ta n te 1 a c a d a e n e rg ía d e su b -b a n d a a n te s d e l lo g a ritm o re du ce la s e n s ib ilid a d de la d ife re n c ia e sp e c tra l p a ra tra m a s de b a ja e ne rg ía . El p a rá m e tro n on s ta B p o d ría ind ica rse , a lte rn a tiva m e n te , p. e j., n o n _ s ta B o n o n s ta tB .
Un d ia g ra m a de b lo q u e s q u e ilu s tra una re a liza c ió n de e je m p lo de un e s tim a d o r de fo n d o se m u e s tra en la fig u ra 6. La re a liza c ió n en la fig u ra 6 co m p re n d e un b lo q u e p a ra el E n tra m a d o de E n tra d a 601, q ue d iv id e la se ñ a l d e a ud io de e n tra d a en tra m a s o se g m e n to s de lon g itu d a d e cu a d a , p. e j., 5 -30 m s. La re a liza c ió n co m p re n d e a d e m á s un b lo q u e p a ra la E x tracc ión de C a ra c te rís tica s 602 q u e c a lc u la las ca ra c te rís tica s , ta m b ié n d e n o ta d a s p a rá m e tro s en la p rese n te m e m oria , p a ra c a d a tra m a o se g m e n to de la señ a l de en tra da . L a re a liza c ió n co m p re n d e a d e m á s un b lo q ue p a ra la L ó g ica d e D ec is ión de A c tu a liza c ió n 603 , p a ra d e te rm in a r si u n a e s tim a c ió n de fo n d o p u e d e a c tu a liza rse o no con b a se en la se ñ a l en la tra m a a c tu a l, es d ec ir, si el se g m e n to de se ñ a l e s tá lib re de co n te n id o a c tivo co m o h a b la y m ú sica . La re a liza c ió n co m p re n d e a d e m á s un A c tu a liz a d o r de F ondo 604 , p a ra a c tu a liza r la e s tim a c ió n de ru ido de fo n d o c u a n d o la ló g ica de d e c is ió n de a c tu a liza c ió n in d ica q u e es a d e cu a d o h ace rlo . En la re a liza c ió n ilus tra da , se p u e d e d e riv a r u n a e s tim a c ió n de ru ido de fo n d o p o r su b -b a n d a , es d ec ir, p a ra va r ia s b a n d a s de fre cu e n c ia .
La so lu c ió n d e s c r ita en la p re se n te m e m o ria p u e d e u tiliza r p a ra m e jo ra r u na so lu c ió n a n te r io r p a ra la e s tim a c ió n de ru ido d e fon do , d e sc rita en el A n e xo A d e la p re se n te m e m oria , y ta m b ié n en el d o cu m e n to W O 2011 /049514. A c o n tin u a c ió n , la so lu c ió n d e s c rita en la p re se n te m e m o ria se d e s c rib irá en el co n te x to de e s ta so lu c ió n d e sc rita a n te r io rm e n te . S e d a rá n e je m p lo s de có d ig o de u n a im p le m e n ta c ió n d e có d ig o d e u n a re a liza c ió n de un e s tim a d o r de ru ido de fondo .
A co n tin u a c ió n , se d e sc rib e n los d e ta lle s de im p le m e n ta c ió n re a le s p a ra u n a re a liza c ió n de la in ve n c ió n en un c o d ific a d o r b a sa d o en G .718. E s ta im p le m e n ta c ió n u tiliza m u ch a s de las c a ra c te rís tic a s e n e rg é tica s d e sc rita s en la so lu c ió n en el A n e xo A y en W O 2011 /049514. P a ra o b te n e r m ás d e ta lle s que los q ue se p re se n ta n a co n tin u a c ió n , c o n su lte e l A n e xo A y W O 2011 /049514.
Las s ig u ie n te s c a ra c te rís tic a s e n e rg é tica s se d e fin e n en W O 2011 /049514 :
Ecot;
Ecot 1 lp;
Etot v h;
total Noise
ai gn dyn lp
Las s ig u ie n te s c a ra c te rís tic a s de co rre la c ió n se d e fin e n en W O 2011 /049514 :
aEn;
har:n_cor_cnt
act_pred
cor est
Las s ig u ie n te s c a ra c te rís tic a s se d e fin ie ro n en la so lu c ió n p ro p o rc io n a d a en el A n e xo A:
Etüt_v_h;
lt_cor_ea3 = 0.Olf *cor_eat - 0 . 'lt_cor_eaP;
lt_tr._track = G.G3Í' (Idot - “otalNoiae < _Q] - Q.97f*lt tn track:;
lt_Tn_clist = G.G3f* (Eoot - ootalNoiae) - 0 .97f 'lt_tn_diat;
lt_Ellp_diat = G.03Í* {Rtot - Et ot l l p) - G.97f *lt_Ellp_diat;
harm_cou_cnt
low_tn_tr ack_cnt
La ló g ica d e a c tu a liza c ió n de ru ido de la so lu c ió n p ro p o rc io n a d a en el A n e xo A se m u e s tra en la fig u ra 7. Las m e jo ras , re la c io n a d a s con la so lu c ió n d e s c r ita en la p re se n te m em oria , de l e s tim a d o r d e ru ido de l A n e xo A e stán re la c io n a d a s p rin c ip a lm e n te con la p a rte 701 d o n d e se ca lcu la n las c a ra c te rís tica s ; con la p a rte 702, d o n d e las d e c is io n e s d e p a u sa se to m a n con base en d ife re n te s p a rá m e tro s ; y a d e m á s con la p a rte 703 , d o n d e se to m a n d ife re n te s a cc io n e s en base
de si se d e te c ta u n a p a u sa o no. A d e m á s, las m e jo ra s p u e d e n te n e r un e fe c to sob re la a c tu a liza c ió n 704 de la e s tim a c ió n de ru ido de fon do , q u e p od ría , p. e j., a c tu a liza rse cu a n d o se d e te c te u na p a u sa con base en las n uevas c a ra c te rís tica s , la cua l no h a b ría s ido d e te c ta d a a n tes de in tro d u c ir la so lu c ió n d e sc rita en la p re se n te m e m oria . E n la im p le m e n ta c ió n de e je m p lo d e sc rita aquí, las n u e va s ca ra c te rís tic a s in tro d u c id a s en la p re se n te m e m o ria se ca lcu la n co m o s igue, c o m e n za n d o con n on _s taB , q ue se d e te rm in a u tiliza n d o las e n e rg ía s de su b -b a n d a de la tra m a a c tu a l e n r[i], q u e co rre sp o n d e a Ecb(i) a rrib a y en la fig u ra 6, y la e s tim a c ió n de ru ido de fo n d o a c tu a l bckr[i], q u e co rre sp o n d e a N cb (i) a rrib a y en la fig u ra 6. La p rim e ra p a rte de la p rim e ra se cc ió n de c ó d ig o a c o n tin u a c ió n e s tá re la c io n a d a con un p ro ce d im ie n to in ic ia l e sp e c ia l p a ra las p rim e ra s 150 tra m a s de u na señ a l de a ud io , a n tes de q ue se h aya d e riva d o u na e s tim a c ió n de fo n d o a de cu a d a .
P calcular característica no estacionaria relativa al fondo (característica de proximidad espectral non_staB 7 rf(ini fíame <150)
{
P Curante inic. no incluir actualizaciones 7
i f ( i> = 2 & 8 : < = 16)
{
non SüB ♦= (lt{>3l)fó¡)S(los(efirj¡] ■ 1-CT> -log(E MIN 1.01});
}
>
dse
(
P Después de inic. comparar con estimación de fondo *1
L f ( ¡ > = 2 ¿ ¿ !< ^ 16)
{
non staB = (froat]ifabs(log(enr[¡J I.OfJ -iog(bcStr[¡] i,0í)};
}
í
if (non staB >= 126)
{
non staB = 32767.0/256.01:
}
Las se cc io n e s de c ó d ig o a c o n tin u a c ió n m u es tra n có m o se ca lcu la n las n u e va s c a ra c te rís tica s p a ra las e n e rg ía s re s id u a le s de la p re d icc ió n linea l, es dec ir, p a ra la g a n a n c ia de p re d icc ió n linea l. A q u í las e n e rg ía s re s id u a le s se d e n o m in a n e p sP [m ] (cf. E (m ) u tiliz a d o a n te rio rm e n te ).
■ Eficiencia (Je predtCCf&C» lineal Óe orden 062
■(Ja ganancia de predicción im e a líu e va dei modelo deorden 0 a i2 * dei filtro
se predicción Irreal)
*----------------------------------- ------------------ --------- --------- .7
epsP..Ü_2 - max(0 . miíi(S. ep>sP[0I / ep5Pf2]^);
epsP.O_2_lp = 0.15 f ' epsP_0.2 (VCif-0.15f]- s t-^e psP .O .Í lp;
cpsP 0..2 aó = {¡lD at)fabs{ep5P.0_2-epsP 0 2 :p j;
if (cpsP 0 2 ad < epsP 0 2 ñ i Jp)
i
cpsP 0 2 ad lp = G , i f ’ epsP 0 2 a d * ( 1.0 f - 0.11)’ ep&P D 2 ad Ipt
J
etee
'Eficiencia de predicción lineal fie orden 2 a 1 f
'i ganancia de predicción K nee lo i» v a d e ! modelo de o ríe n 2 * al 16* dei f t r o
de predicción linea I!
’ -------------------------------------------------------------------------7
cpsP 2.16 = m a x(0. epsP¡2| / epsP(l6]j)L
if {epsP 2 16- > cpsP 2 16 Ip)
f
epsPJMG \p = O.Zf * é¡p íP_.2..16 + {t.Of^O.21} * epsP 2. I 6jp ¡
}
else
{
epsP_2_16_lp = 0.03f * epsP_2_16 (1.0f-0.03f) * epsP_2_16_lp;
}
epsP_2_16_lp2 = 0.02f * epsP_2_16 (1.0f-0.02f) * epsP_2_16Jp2;
epsP_2_16_dlp = epsP_2_16_lp-epsP_2_16_lp2;
if (epsP_2_16_dlp < epsP_2_16_dlp_lp2 )
{
epsP_2_16_dlp_lp2 = 0.02f * epsP_2_16_dlp (1.0f-0.02f) * epsP_2_16_dlp_lp2;
}
else
{
epsP_2_16_dlp_lp2 = 0.05f * epsP_2_16_dlp (1.0f-0.05f) * epsP_2_16_dlp_lp2;
}
epsP_2_16_dlp_max = max(epsP_2_16_dlp,epsP_2_16_dlp_lp2);
El c ó d ig o a co n tin u a c ió n ilu s tra la c re a c ió n de m é tricas , u m b ra le s e in d ica d o re s co m b in a d o s u tiliza d o s p a ra la d ec is ió n de a c tu a liza c ió n real, es d ec ir, la d e te rm in a c ió n de si a c tu a liza r la e s tim a c ió n de ru ido de fo n d o o no. A l m e n o s a lg u n o s de los p a rá m e tro s re la c io n a d o s con las g a n a n c ia s d e p re d icc ió n linea l y /o con la p ro x im id a d e sp e c tra l se ind ican en neg rita .
comb_ahc_epsP = max(max(act_pred,lt_haco_ev),epsP_2_16_dlp);
comb_hcm_epsP = max(max(lt_haco_ev,epsP_2_16_dlp_max),epsP_0_2_ad_lp_max);
haco_ev_max = max(st_harm_cor_cnt==0,>lt_haco_ev);
Etot_l_lp_thr = st->Etot_l_lp (1.5f 1,5f * (Etot_lp<50.0f))*Etot_v_h2;
enr_bgd = Etot < Etot_IJp_thr;
cns_bgd = (epsP_0_2 > 7.95f) && (non_sta< 1e3f);
lp_bgd = epsP_2_16_dlp_max < 0.10f;
ns_mask = non_sta < 1e5f;
lt_haco_mask = lt_haco_ev < 0.5f;
bg_haco_mask = haco_ev_max < 0.4f;
SD_1 = ( (epsP_0_2_ad > 0.5f) && (epsP_0_2 > 7.95f));
bg_bgd3 = enr_bgd || ( ( cns_bgd || lp_bgd ) && ns_mask && lt_haco_mask && SD_1==0);
PD_1 = (epsP_2_16_d Ip_max < 0.1 Of);
PD_2 = (epsP_0_2_ad_lp_max < 0.1 Of);
PD_3 = (comb_ahc_epsP < 0.85f);
PD_4 = comb_ahc_epsP < 0.15f;
PD_5 = comb_hcm_epsP < 0.30Í;
BG_1 = ( (SD_1==0) || (Etot < Etot_l_lp_thr)) && bg_haco_mask && (act_pred < 0.85f) && (E to tjp < 50.Of);
PAU = (a e n --0 > j|( (E to t-= 5 5 .0 f ) !.SD 1^=0) && f i PO.3 S&{PD 1 | | P Ü 2 ) ) | | (P D .4 ||F D 5 ) ) ) :
NEW POS BG = (PAJ | &G .1>S bg.bgdS:
i* Detector de silencie origina! funciona en !a m ayó la de los casos */
aE_bgd - aErt = 0;
Cuando la dinámica de señal es alta y la energía está cerca a la estimación de fondo
s d i bgd = (st->sign dyn ip > 15) && ;E b t- s(->Etot i í p ) < 2'st->Elot cor cn l > 20;
! ’ condiciones de m¡c. caen de forma regular act_pred y/c lt_naca_ev V
tn in i = in i.fra m e < 150 && hanm.oo=r.cn t> 5 £ £
( (st->acl_pntíd c D.59f &&. st->lt_baK)_ev <Q.23í) ||
5t->act pned < Q,38í j|
st->n_h&co_ev < 0.1 Sí ||
ron- staB * 50,Of |[
y*
r La energía cerca de la estimación de fondo .sirve como máscara para otros detectores de fondo jgr
üg_bgd2 - Etol < E to 'J J p J h í || ln_¡n ;
C om o es im p o rta n te no h a ce r u na a c tu a liza c ió n d e la e s tim a c ió n de ru ido de fo n d o cu a n d o u n a tra m a o seg m e n to a c tu a l co m p re n d e co n te n id o a ctivo , se e va lú a n va r ia s c o n d ic io n e s p a ra d e c id ir si se d e b e re a liz a r u na a c tu a liza c ió n . El paso d e d e c is ió n p rin c ip a l en la ló g ica de a c tu a liza c ió n de ru ido es si se d eb e re a liza r u na a c tu a liza c ió n o no, y esto se fo rm a m e d ia n te la e va lu a c ió n de u na e xp re s ió n lóg ica , q ue se s u b ra ya a co n tin u a c ió n . El n ue vo p a rá m e tro N E W _ P O S _ B G (n ue vo en re la c ió n con la so lu c ió n en el A n e xo A y en W O 2011 /049514 ) es un d e te c to r de p a u sa y se o b tie n e con b ase en las g a n a n c ia s de p re d icc ió n linea l q ue va n d e l m o de lo de o rde n 0 a l 2°, y de l 2° al 16° de un filtro de p re d icc ió n linea l, y tn _ in i se o b tie n e con b ase en las ca ra c te rís tic a s re la c io n a d a s con la p ro x im id a d e sp e c tra l. A co n tin u a c ió n , se m u e s tra u na ló g ica de d e c is ió n q ue u tiliza las n u e va s c a ra c te rís tica s , seg ún la re a liza c ió n de e je m p lo .
updt_step=O.Of;
if ( ( bq bqd2 && ( aE bqd II sd1 bqd II It tn track >0.90f II NEW POS BG m i
tn ¡ni )
{
if( ( ( act_pred < 0.85f) &&
aE_bgd &&
( lt_Ellp_dist < 10 || sd1_bgd) && lt_tn_dist<40 &&
( ( Etot- totalNoise) < 10.Oí) ) ||
( st->first_noise_updt == 0 && st->harm_cor_cnt > 80 && aE_bgd && st->lt_aEn_zero > 0.5 f) || ( tn_ in i && ( aE_bgd || non_staB < 10.0 || st->harm_cor_cnt > 80) )
)
{
updt_step=1.0f;
st->first_noise_updt = 1;
for( i=0; i< NB_BANDS; i+ )
{
st->bclír|i] ■ tmpNf]:
í
)
e fse if ( ( ( 5L->3d_pred< O.BOf) Á & ( aE_bgd || PAU ] && s t H U i m j W ^ O.IOT) ||
( ( st->3c(jxed < 0l7W ) $ £ ( aE_bgd || non staB < i7.Df st*>H_haoo_ev< 0.15Í)|| ( £t->harm_cor_cnt > SO SS slo lo ta i Noise > 5.0Í&& Etat < m3x(1.0f,Et&t_l_lp * l . s r st-:>Etot_Y_h2)) || ( $t->ham _cof_onl > 50 si’> lír íL io isc_ u p íit > 30 S.4 aE_bgd S& sM t_a£rt_ íe íO *Q -5f) || in jfln
)
{
updl_step=Q.if;
if(!aE_bgd£S
s1»bann_DQr_cnt < 50 &&
(« t^a C L F D d > 0 u 6 f||
( !tn ir iS A É:c-t l rp - st->toíalNo¡S0 < lO.Of rton s la B > 8.0 f ) ) }
{
updt s1ep=0.0lí;
>
(f (updt, slep > 0.C1)
(
s1->firsl_r»¡se_updl = 1;
fort i=0; i-= MB BAÑOS; i**-)
í
st->bd(f[i| = s(->bc3ir[¡] updt slep *(tmpN[i^st-*bckí[¡|);
}
I
}
else ¡f (aE_bgd || s¡-?h3rm cof_cnt ? 100)
í
}
I
else
í
/ 'S ie n música ta já r te lo para bajar adición a Imente V
if [ $t'?low_!n_iíaci¡._cfli > 300 S i swJLhaco.ev *0.9f && Mo¡a; > ü.Ofl
í
updt_si)ep=-0.0?f:
tort r=0: i< N B B A Ñ O S E * }
f
st->bckít=| = O.SS('5i->bcftíti]:
}
)
)
í
3En_z»fl> = 0.2f ' ( s t ^ É n = ^ i ) ( l4.2f)*st->tt_aEii zero.
C om o se ind icó a n te rio rm e n te , las ca ra c te rís tic a s de la p re d icc ió n linea l p ro p o rc io n a n un a n á lis is in d e p e n d ie n te del n ive l de la se ñ a l de e n tra d a q ue m e jo ra la d e c is ió n de a c tu a liza c ió n d e l ru ido de fo n d o , lo cu a l es p a rticu la rm e n te útil en el in te rva lo S N R de 10 a 20dB , d o n d e los S A D b a sa d o s en la e n e rg ía tie n e n un re n d im ie n to lim itad o d e b id o al in te rva lo d in á m ico norm a l de la se ñ a le s de l h a b la .
Las ca ra c te rís tic a s de p ro x im id a d del fo n d o ta m b ié n m e jo ran la e s tim a c ió n de ru ido de fo n d o , ya q ue p ue de n u tiliza rse ta n to p a ra la in ic ia liza c ió n co m o p a ra e l fu n c io n a m ie n to n orm a l. D u ran te la in ic ia liza c ió n , p u e d e p e rm itir u na rá p ida in ic ia liza c ió n d e l ru ido de fo n d o (n ive l m ás b a jo ) con co n te n id o p rin c ip a lm e n te de b a ja fre cu e n c ia , co m ú n p a ra e l ru ido d e l coch e . A d e m á s, las fu n c io n e s p u e d e n u tiliza rse p a ra e v ita r a c tu a liza c io n e s de ru ido u tiliz a n d o tra m a s de ba ja e n e rg ía con u na g ran d ife re n c ia en las c a ra c te rís tic a s de fre cu e n c ia en c o m p a ra c ió n con la e s tim a c ió n de fo n d o actua l, lo q u e su g ie re q u e la tra m a a c tu a l p u e d e s e r co n te n id o a c tivo de b a jo n ive l y u n a a c tu a liza c ió n p o d ría e v ita r la d e te cc ió n de fu tu ra s tra m a s con co n te n id o s im ila r.
Las F ig uras 8 -10 m u es tra n có m o se co m p o rta n los p a rá m e tro s o m é trica s re sp e c tivo s p a ra e l h ab la en s e g u n d o p lano con u na S N R de ru ido de co ch e de 10 dB . En las fig u ra s 8 -10 , los p u n to s , "•", re p re se n ta n c a d a uno la e n e rg ía de la tra m a . P ara las fig u ra s 8 y 9a-c , la e n e rg ía se ha d iv id id o p o r 10 p a ra q ue se a m ás c o m p a ra b le p a ra las c a ra c te rís tica s b a sa d a s en G _ 0 _ 2 y G _ 2 _16. Los d ia g ra m a s co rre sp o n d e n a u na señ a l de a ud io q u e co m p re n d e d o s e xp re s io n e s , d o n d e la p o s ic ió n a p ro x im a d a p a ra la p rim e ra e xp re s ió n e s tá en las tra m a s 1310 - 1420 y p a ra la s e g u n d a e xp re s ió n , en las tra m a s 1500 - 1610.
La F ig u ra 8 m u e s tra la e n e rg ía de la tra m a (/10 ) (pun to , "•") y las ca ra c te rís tic a s G _ 0 _2 (c írcu lo , "o ") y G m a x_ 0 _ 2 (m ás, "+ "), p a ra e l h ab la con S N R de 10dB con ru ido de co ch e . T e n g a en cu e n ta q u e G _ 0 _2 es 8 d u ra n te el ru ido de coch e , ya q u e e x is te c ie rta co rre la c ió n en la señ a l q ue p ue de m o d e la rse u tiliza n d o p re d icc ió n linea l con e l o rd e n de m o de lo 2. D uran te las e xp re s io n e s , la c a ra c te r ís tic a G m a x_ 0 _ 2 se v u e lve s u p e r io r a 1,5 (en e s te ca so ) y d e sp u é s de la rá fa g a de vo z cae a 0. En u n a im p le m e n ta c ió n e sp e c ífica de u n a ló g ica de d e c is ió n , e l G m a x_ 0 _ 2 d e b e e s ta r p o r d e b a jo de 0,1 p a ra p e rm itir a c tu a liza c io n e s de ru ido u tiliza n d o e s ta fu n c ió n .
La F ig u ra 9a m u e s tra la e n e rg ía de la tra m a (/10 ) (p un to , "•") y las ca ra c te rís tic a s G _ 2 _ 16 (c írcu lo , "o"), G 1 _ 2 _ 16 (c ruz , "x"), G 2 _ 2 _ 16 (m ás, "+ "). La F ig u ra 9b m u e s tra la e n e rg ía de la tra m a (/10) (pun to , "•") y las ca ra c te rís tica s G _ 2 _ 16 (c írcu lo , "o"), G d _ 2_16 (c ruz , "x") y G a d _ 2 _ 16 (m ás, "+ "). La F ig ura 9c m u e s tra la e n e rg ía de la tra m a (/10) (p un to , "•") y las c a ra c te rís tica s G _ 2 _ 16 (c írcu lo , "o ") y G m a x_ 2 _ 16 (m ás, "+ "). Los d ia g ra m a s q u e se m u es tra n en las fig u ra s 9 a-c ta m b ié n se re fie ren al h ab la con S N R de 10dB con ru ido de coch e . Las c a ra c te rís tic a s se m u es tra n en tre s d ia g ra m a s p a ra fa c ilita r la v isu a liz a c ió n de ca d a p a rá m e tro . T e n g a en c u e n ta q u e G _ 2 _ 16 (c írcu lo , "o ") e s tá ju s to p o r e n c im a de 1 d u ra n te e l ru ido de co ch e (es d ec ir, e xp re s io n e s e x te rn a s ), lo q u e in d ica q u e la g a n a n c ia de l o rden de m o de lo s u p e r io r es b a ja p a ra e s te tip o de ru ido . D uran te las e xp re s io n e s , la ca ra c te rís tic a G m a x_ 2 _ 16 (m ás, "+" en la fig u ra 9c) a u m e n ta y lue g o c o m ie n z a a c a e r de n ue vo a 0. En u na im p le m e n ta c ió n e sp e c ífica de u n a ló g ica de d e c is ió n , la c a ra c te r ís tic a G m a x_ 2 _ 16 ta m b ié n tie n e q ue se r in fe rio r a 0,1 p a ra p e rm itir a c tu a liz a c io n e s de ru ido . En e s ta m u e s tra de señ a l de a ud io en p a rticu la r, e s to no o cu rre .
La F ig u ra 10 m u e s tra la e n e rg ía de la tra m a (p un to , (no d iv id id a p o r 10 e s ta v e z ) y la c a ra c te r ís tic a n on sta B (m ás, "+ ") p a ra e l h ab la con S N R de 10dB con ru ido de co ch e . La ca ra c te rís tic a n on sta B e s tá en e l in te rva lo de 0 a 10 d u ra n te los se g m e n to s de so lo ru ido , y p a ra las e xp re s io n e s , se v u e lve m u ch o m ás g ra n d e (ya q ue las c a ra c te rís tica s de fre cu e n c ia son d ife re n te s p a ra el hab la ). D ebe se ñ a la rse que , s in e m b a rg o , inc lu so d u ra n te las e xp re s io n e s hay tra m a s en las q u e la c a ra c te r ís tic a n o n s ta B ca e en el in te rva lo de 0 a 10. P ara e s ta s tra m a s p o d ría e x is t ir la p os ib ilid a d de re a liz a r a c tu a liza c io n e s de l ru ido de fo n d o y a s í ra s tre a r m e jo r el ru ido de fon do .
La so lu c ió n d e s c rita en la p re se n te m e m o ria ta m b ié n se re fie re a un e s tim a d o r de ru ido de fo n d o im p le m e n ta d o en h a rd w a re y /o so ftw a re .
E s tim a d o r de ru ido de fo n d o , f ig u ra s 11 a -11 c
U na re a liza c ió n de e je m p lo de un e s tim a d o r de ru ido de fo n d o se ilus tra de m a n e ra g e n e ra l en la fig u ra 11a. P or e s tim a d o r de ru ido de fo n d o se h ace re fe re n c ia a un m ó du lo o e n tid a d c o n fig u ra d a p a ra e s tim a r e l ru ido de fo n d o en se ñ a le s de a ud io q ue c o m p re n d e n , p. e j., h ab la y /o m ú sica . El c o d if ic a d o r 1100 se co n fig u ra p a ra re a liza r al m enos un m é to d o co rre sp o n d ie n te a los m é to d o s d e s c rito s a n te r io rm e n te con re fe ren c ia , p. e j., a las fig u ra s 2 y 7. El c o d if ic a d o r 1100 e s tá a so c ia d o con las m ism a s ca ra c te rís tic a s té cn ica s , o b je to s y ve n ta ja s q ue las re a liza c io n e s del m é to do d e sc rita s a n te r io rm e n te . El e s tim a d o r de ru ido de fo n d o se d e s c rib irá b re ve m e n te p a ra e v ita r re p e tic io n e s inn e ce sa ria s .
El e s tim a d o r de ru ido de fo n d o p u e d e im p le m e n ta rse y /o d e s c rib irse co m o s igu e :
El e s tim a d o r de ru ido de fo n d o 1100 se co n fig u ra p a ra e s tim a r un ru ido de fo n d o de u na señ a l de aud io . El e s tim a d o r de ru ido de fo n d o 1100 co m p re n d e un c ircu ito de p ro ce sa m ie n to , o m e d io de p ro ce sa m ie n to 1101 y u n a in te rfaz de co m u n ica c ió n 1102. El c ircu ito de p ro c e sa m ie n to 1101 se c o n fig u ra p a ra h a c e r q u e e l c o d if ic a d o r 1100 o b te n g a , p. e j., d e te rm in e o ca lcu le , al m e no s un p a rá m e tro , p. e j., N E W _ P O S _ B G , con base en u n a p rim e ra g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na señ a l re s idu a l de u na p re d icc ió n linea l de o rde n 0 y u na señal re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y u na s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n y u n a señ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la se ñ a l de aud io.
El c ircu ito de p ro ce sa m ie n to 1101 se co n fig u ra a d e m á s p a ra h a c e r q u e e l e s tim a d o r de ru ido de fo n d o d e te rm in e si el se g m e n to de la se ñ a l de a ud io co m p re n d e u n a p ausa , es d ec ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m úsica , con b ase en el al m e no s un p a rá m e tro . El c ircu ito de p ro ce sa m ie n to 1101 se c o n fig u ra a d e m á s p a ra h a ce r q u e el e s tim a d o r de ru ido de fo n d o a c tu a lice u n a e s tim a c ió n de ru ido de fo n d o con base en e l se g m e n to de la se ñ a l de a ud io cu a n d o el se g m e n to de la señ a l de a ud io co m p re n d e u na pausa .
La in te rfaz de co m u n ica c ió n 1102, q ue ta m b ié n p ue de ind ica rse , p. e j., in te rfaz de E n tra d a /sa lid a (I/O ), inc lu ye una in te rfaz p a ra e n v ia r d a to s y re c ib ir d a to s de o tra s e n tid a d e s o m ó du los . P o r e je m p lo , las se ñ a le s re s idu a le s re la c io n a d a s con los ó rd e n e s d e l m o d e lo de p re d icc ió n linea l 0, 2 y 16 p ue de n o b te n e rse , p. e j., re c ib irse , a tra vé s de la in te rfaz de I/O, de un c o d if ic a d o r de señ a l de a ud io q ue re a liza co d ifica c ió n p re d ic tiva linea l.
El c ircu ito de p ro ce sa m ie n to 1101 p od ría , co m o se ilus tra en la fig u ra 11b, c o m p re n d e r m e d io s de p ro ce sa m ie n to , co m o un p ro c e sa d o r 1103, p. e j., u n a C P U y u na m e m o ria 1104 p a ra a lm a c e n a r o re te n e r in s tru cc io n e s . La m e m o ria c o m p re n d e ría e n to n ce s in s tru cc io n e s , p. e j., en fo rm a de un p ro g ra m a in fo rm á tico 1105, q u e cu a n d o es e je cu ta d o p o r los m e d io s de p ro ce sa m ie n to 1103 hace q ue e l c o d if ic a d o r 1100 re a lice las a cc io n e s d e sc rita s a n te rio rm e n te .
U na im p le m e n ta c ió n a lte rn a tiva de l c ircu ito de p ro ce sa m ie n to 1101 se m u e s tra en la fig u ra 11c. El c ircu ito de p ro ce sa m ie n to a q u í co m p re n d e u n a u n id ad de o b te n c ió n o d e te rm in a c ió n o m ó d u lo 1106, co n fig u ra d o p a ra h a c e r que el e s tim a d o r de ru ido de fo n d o 1100 o b te n g a , p. e j., d e te rm in e o ca lcu le , al m e no s un p a rá m e tro , p. e j., N E W _ P O S _ B g , con b ase en u n a p rim e ra g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a se ñ a l re s idu a l de u na p re d icc ió n linea l de o rde n 0 y u n a señ a l re s idu a l de u n a p re d icc ió n linea l de 2° o rde n p a ra e l se g m e n to de la señ a l de a ud io ; y u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u na se ñ a l re s idu a l de una p re d icc ió n linea l de 2° o rde n y u n a señ a l re s idu a l de u na p re d icc ió n linea l de 16° o rde n p a ra e l se g m e n to de la señal de a ud io . El c ircu ito de p ro ce sa m ie n to co m p re n d e a d e m á s u na u n id ad o m ó du lo de d e te rm in a c ió n 1107, co n fig u ra d a p a ra h a ce r q ue el e s tim a d o r de ru ido de fo n d o 1100 d e te rm in e si el se g m e n to de la señ a l de a ud io co m p re n d e u na p au sa , es d e c ir, e s tá lib re de co n te n id o a c tivo co m o h ab la y m ú sica , con b ase en el al m enos un p a rá m e tro . El c ircu ito de p ro ce sa m ie n to 1101 co m p re n d e a d e m á s u n a u n id ad o m ó d u lo de a c tu a liza c ió n o e s tim a c ió n 1110, co n fig u ra d a p a ra h a ce r q u e e l e s tim a d o r de ru ido de fo n d o a c tu a lice u na e s tim a c ió n de ru ido de fo n d o con b ase en e l se g m e n to de la señ a l de a ud io cu a n d o el se g m e n to de la se ñ a l de a ud io co m p re n d e u na pausa .
El c ircu ito de p ro ce sa m ie n to 1101 p o d ría c o m p re n d e r m ás u n id a d e s , co m o u na u n id ad o m ó d u lo de f iltro co n fig u ra d a p a ra h a c e r q u e el e s tim a d o r de ru ido de fo n d o f iltre en p a so b a jo las g a n a n c ia s de p re d icc ió n linea l, c re a n d o a s í una o m ás e s tim a c io n e s a la rgo p lazo de las g a n a n c ia s de p re d icc ió n linea l. De lo co n tra r io , se p u e d e n re a liza r a cc io n e s co m o e l f iltra d o de p aso ba jo , p. e j., p o r la u n id ad o m ó du lo de d e te rm in a c ió n 1107.
Las re a liza c io n e s de un e s tim a d o r de ru ido de fo n d o d e sc rita s a n te r io rm e n te p o d rían co n fig u ra rs e p a ra las d ife re n te s re a liza c io n e s de l m é to d o d e sc rita s en la p re se n te m e m oria , co m o la lim ita c ió n y e l f iltra d o de p a so b a jo de las g a n a n c ia s de p re d icc ió n linea l; d e te rm in a r u n a d ife re n c ia e n tre las g a n a n c ia s de p red icc ió n linea l y las e s tim a c io n e s a la rgo p la zo y e n tre las e s tim a c io n e s a la rgo p la zo ; y /o o b te n e r y u tiliz a r u na m e d id a de p ro x im id a d e sp e c tra l, e tc.
S e p u e d e s u p o n e r q u e el e s tim a d o r de ru ido de fo n d o 1100 co m p re n d e u n a fu n c io n a lid a d a d ic io n a l, p a ra lle va r a cabo la e s tim a c ió n de ru ido de fon do , co m o p. e j., la fu n c io n a lid a d e je m p lific a d a en el A p é n d ice A.
La F ig ura 12 ilus tra un e s tim a d o r de fo n d o 1200 seg ún u n a re a liza c ió n de e je m p lo . El e s tim a d o r de fo n d o 1200 co m p re n d e u n a u n id ad de e n tra d a , p. e j., p a ra re c ib ir e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o de lo 0, 2 y 16. El e s tim a d o r de fo n d o co m p re n d e a d e m á s un p ro c e sa d o r y u n a m e m oria , co n te n ie n d o d ich a m e m o ria in s tru cc io n e s e je c u ta b le s p o r d ich o p ro ce sa d o r, p o r lo q ue d ich o e s tim a d o r de fo n d o e s o p e ra tivo p a ra : re a liz a r un m é to do según u na re a liza c ió n d e s c rita en la p re se n te m e m oria .
En co n se cu e n c ia , e l e s tim a d o r de fo n d o p u e d e c o m p re n d e r, co m o se ilus tra en la fig u ra 13, u n a u n id ad de e n tra d a /sa lid a 1301, u n a c a lc u la d o ra 1302 p a ra c a lc u la r los d o s p rim e ro s co n ju n to s de ca ra c te rís tic a s a p a rt ir de las e n e rg ía s re s id u a le s p a ra los ó rd e n e s de m o de lo 0, 2 y 16 y un a n a liza d o r de fre cu e n c ia 1303 p a ra el c á lcu lo de la c a ra c te r ís tic a de p ro x im id a d e sp e c tra l.
Un e s tim a d o r de ru ido de fo n d o co m o los d e sc rito s a n te r io rm e n te p u e d e e s ta r inc lu ido , p. e j., en un V A D o S A D , en un c o d if ic a d o r y /o en un d e s co d ifica d o r, es d ec ir, un cód ec , y /o en un d isp o s itivo , co m o un d isp o s itivo de c o m u n ica c ió n . El d isp o s itivo de c o m u n ica c ió n p u e d e s e r un e q u ip o de u su a rio (U E ) en la fo rm a de un te lé fo n o m óvil, cá m a ra de v id e o , g ra b a d o ra de son ido , ta b le ta , o rd e n a d o r de so b re m e sa , o rd e n a d o r p ortá til, d e c o d if ica d o r de T V o se rv id o r d o m é s tic o / p a sa re la d o m é s tica / p u n to de a cce so d o m é s tico / rú te r d o m é stico . En a lg u n a s re a liza c io n e s , el d isp o s itivo de c o m u n ica c ió n p u e d e s e r un d isp o s itivo de red de co m u n ic a c io n e s a d a p ta d o p a ra c o d if ic a r y /o tra n s c o d ific a r se ñ a le s de a ud io . E jem p lo s de d ich o s d isp o s itivo s de red de c o m u n ic a c io n e s son se rv id o re s , com o se rv id o re s de co n te n id o m u ltim e d ia , se rv id o re s de a p lica c io n e s , rú te rs , p a sa re la s y e s ta c io n e s b ase de rad io . El d isp o s itivo de co m u n ica c ió n ta m b ié n p u e d e a d a p ta rse p a ra co lo ca rse en, es d ec ir, e m p o tra rse en, u n a e m b a rca c ió n , co m o un barco , un dron vo la d o r, un a v ión y un v e h ícu lo de ca rre te ra , co m o un coch e , a u to b ú s o ca m ió n . Un d isp o s itivo in te g ra d o de e s te tipo p e rte n e c e ría típ ic a m e n te a u na u n id ad te le m á tic a de l ve h ícu lo o a un s is te m a de in fo rm a c ió n y e n tre te n im ie n to de l v e h ícu lo .
Los p asos , fu n c io n e s , p ro ce d im ie n to s , m ó du los , u n id a d e s y /o b lo q u e s d e sc rito s en la p re se n te m e m o ria pueden im p le m e n ta rse en h a rd w are u tiliza n d o c u a lq u ie r te c n o lo g ía co n ve n c io n a l, co m o c ircu ito s d is c re to s o te c n o lo g ía de c ircu ito s in te g ra d o s , in c lu ye n d o ta n to c ircu ito s e le c tró n ic o s de p ro p ó s ito g e n e ra l co m o los c ircu ito s e sp e c ífico s de a p licac ión .
Los e je m p lo s p a rticu la re s inc lu ye n u no o m ás p ro ce sa d o re s de señ a l d ig ita l co n fig u ra d o s a d e cu a d a m e n te y o tros c ircu ito s e le c tró n ico s co n o c id o s , p. e j., p u e rta s lóg icas d is c re ta s in te rco n e c ta d a s p a ra re a liza r u na fu n c ió n e sp e c ia liza d a , o C ircu ito s In te g ra d o s E sp e c ífico s de A p lica c ió n (A S IC s).
A lte rn a tiva m e n te , al m e no s a lg u n o s de los p asos , fu n c io n e s , p ro ce d im ie n to s , m ó du los , u n id a d e s y /o b lo q u e s d e sc rito s a n te r io rm e n te p u e d e n im p le m e n ta rse en so ftw a re co m o un p ro g ra m a in fo rm á tico p a ra su e je cu c ió n m e d ia n te c ircu ito s de p ro ce sa m ie n to a d e cu a d o s q u e inc lu ye n u na o m á s u n id a d e s de p ro ce sa m ie n to . El so ftw a re p o d ría s e r tra n sp o rta d o p o r u na p o rta do ra , co m o u n a señ a l e le c tró n ica , u n a se ñ a l ó p tica , u n a se ñ a l de rad io , o un m e d io de a lm a ce n a m ie n to leg ib le p o r o rd e n a d o r a n tes y /o d u ra n te la u tiliza c ió n d e l p ro g ra m a in fo rm á tico en los n od os de la red.
El d ia g ra m a o d ia g ra m a s de flu jo p re se n ta d o s en la p re se n te m e m o ria p ue de n co n s id e ra rse co m o un d ia g ra m a o d ia g ra m a s de flu jo in fo rm á tico , cu a n d o lo re a liza n uno o m ás p ro ce sa d o re s . Un a p a ra to co rre sp o n d ie n te p uede d e fin irse co m o un g ru p o de m ó d u lo s de fu n c ió n , d on de c a d a paso re a liza d o p o r e l p ro c e sa d o r co rre sp o n d e a un m ó d u lo de fu n c ió n . En e s te caso , los m ó d u lo s de fu n c ió n se im p le m e n ta n co m o un p ro g ra m a in fo rm á tico q u e se e je c u ta en e l p roce sa d o r.
E je m p lo s d e l c ircu ito de p ro ce sa m ie n to inc lu ye n , p e ro no se lim itan a, u no o m ás m ic ro p ro ce sa d o re s , u no o m ás P ro ce sa d o re s de S e ñ a le s D ig ita les , D S P s, u n a o m ás U n id a d e s C e n tra le s de P ro ce sa m ie n to , C P U s, y /o c u a lq u ie r c irc u ito lóg ico p ro g ra m a b le a d e cu a d o , co m o u no o m ás M a trice s de P ue rtas P ro g ra m a b le s de C am p o , F P G A s, o uno o m ás C o n tro la d o re s L óg ico s P ro g ra m a b le s , P LC s. Es d ec ir, las u n id a d e s o m ó d u lo s en las d isp o s ic io n e s en los d ife re n te s n od os d e sc rito s a n te r io rm e n te p od rían im p le m e n ta rse m e d ia n te u n a co m b in a c ió n de c ircu ito s a n a ló g ico s y d ig ita le s , y /o u no o m ás p ro ce sa d o re s co n fig u ra d o s con so ftw a re y /o firm w a re , p. e j., a lm a ce n a d o en u n a m e m oria . U no o m ás de e s to s p ro ce sa d o re s , a s í co m o e l o tro h a rd w are d ig ita l, p ue de n inc lu irse en un so lo c ircu ito in te g rad o e sp e c ífico de a p lica c ió n , A S IC , o v a r io s p ro ce sa d o re s y d is tin to h a rd w a re d ig ita l p ue de n d is tr ib u irse e n tre va rios c o m p o n e n te s se p a ra d o s , ya se a e m p a q u e ta d o s in d iv id u a lm e n te o e n s a m b la d o s en un s is te m a en ch ip , SoC .
T a m b ié n d e b e e n te n d e rse q u e p u e d e s e r p o s ib le re u tiliza r las ca p a c id a d e s g e n e ra le s de p ro ce sa m ie n to de c u a lq u ie r d is p o s itivo o u n id ad co n v e n c io n a l en la q ue se im p le m e n te la te c n o lo g ía p rop u e s ta . T a m b ié n es p o s ib le re u tiliza r so ftw a re e x is te n te , p. e j., re p ro g ra m a n d o e l so ftw a re e x is te n te o a g re g a n d o n u e vo s co m p o n e n te s de so ftw a re .
Las re a liza c io n e s d e sc rita s a n te r io rm e n te se dan s im p le m e n te co m o e je m p lo s , y d e b e e n te n d e rse q ue la te cn o lo g ía p ro p u e s ta no se lim ita a las m ism as . Los e xp e rto s en la té c n ica e n te n d e rá n q u e se p ue de n re a liza r d ive rsa s m o d ifica c io n e s , co m b in a c io n e s y c a m b io s a las re a liza c io n e s sin a p a rta rse d e l p re se n te a lca n ce . En p a rticu la r, las d ife re n te s so lu c io n e s de p ie zas en las d ife re n te s re a liza c io n e s p ue de n co m b in a rse en o tra s co n fig u ra c io n e s , d onde se a té c n ica m e n te p os ib le .
C u a n d o se u tiliza la p a la b ra "co m p re n d e " o "q u e co m p re n d e ", se in te rp re ta rá co m o no lim ita tivo , es d ec ir, q ue s ig n ifica "co n s ta al m e no s de".
T a m b ié n d e b e se ñ a la rse q u e en a lg u n a s im p le m e n ta c io n e s a lte rn a tiva s , las fu n c io n e s /a c to s a n o ta d o s en los b lo q ue s p ue de n o c u rr ir fu e ra d e l o rde n a n o ta d o en los d ia g ra m a s de flu jo . P o r e je m p lo , d os b lo q u e s m o s tra d o s en suce s ió n p ue de n de h echo e je cu ta rse su s ta n c ia lm e n te al m ism o tie m p o o los b lo q u e s p u e d e n a v e ce s e je c u ta rs e en o rde n inve rso , d e p e n d ie n d o de la fu n c io n a lid a d /a c to s invo lu c ra d o s . A d e m á s, la fu n c io n a lid a d de un b lo q u e d a d o de los d ia g ra m a s de flu jo y /o de los d ia g ra m a s de b lo q u e s p u e d e se p a ra rse en m ú ltip le s b lo q u e s y /o la fu n c io n a lid a d de dos o m ás b lo q u e s de los d ia g ra m a s de flu jo y /o de los d ia g ra m a s de b lo q u e s p ue de in te g ra rse , al m e no s p a rc ia lm e n te . F in a lm e n te , se p ue de n a g re g a r/in se rta r o tro s b lo q u e s e n tre los b lo q u e s q u e se ilus tra n , y /o se p ue de n o m itir b lo q u e s /o p e ra c io n e s sin a p a rta rse d e l a lca n ce de los c o n ce p to s inve n tivos .
D ebe e n te n d e rs e q ue la e le cc ió n de las u n id a d e s de in te ra cc ió n , a s í co m o la d e n o m in a c ió n de las u n id a d e s d e n tro de e s ta d e sc rip c ió n son so lo p a ra fin e s ilus tra tivo s , y los n od os a d e cu a d o s p a ra e je c u ta r cu a lq u ie ra de los m é to do s d e sc rito s a n te r io rm e n te p ue de n co n fig u ra rs e en u n a p lu ra lid a d de fo rm a s a lte rn a tiva s en p a ra p o d e r e je c u ta r las a cc io n e s de l p ro ce d im ie n to sug e rid a s .
T a m b ié n d e b e te n e rs e en c u e n ta q u e las u n id a d e s d e sc rita s en e s ta d e sc rip c ió n d eb en s e r c o n s id e ra d a s co m o e n tid a d e s lóg icas y no n e ce sa ria m e n te co m o e n tid a d e s fís ica s sep a rad as .
La re fe re n c ia a un e le m e n to en s in g u la r no p re te n d e s ig n ific a r "u n o y so lo uno " a m e no s q u e se ind iq ue e xp líc ita m e n te , s ino m ás b ien "uno o m ás". A d e m á s, no es n e ce sa rio q ue un d isp o s itivo o m é to do a b o rd e to d o s y ca d a u no de los p ro b le m a s q ue se b u scan re s o lv e r m e d ia n te la te c n o lo g ía d e sc rita en la p re se n te m e m oria , p a ra q ue q u e d e a b a rca d o p o r la p rese n te .
En a lg u n o s ca so s en la p re se n te m em oria , se o m ite n d e sc rip c io n e s d e ta lla d a s de d isp o s itivo s , c ircu ito s y m é to do s b ien co n o c id o s p a ra no o sc u re c e r la d e sc rip c ió n de la te c n o lo g ía d e s c rita con d e ta lle s in n e ce sa rio s . T o d a s las d e c la ra c io n e s en la p re se n te m e m o ria q u e rec itan p rinc ip ios , a sp e c to s y re a liza c io n e s de la te c n o lo g ía d e sc rita , a sí co m o e je m p lo s e sp e c ífico s de la m ism a, p re te n d e n a b a rc a r sus e q u iva le n te s ta n to e s tru c tu ra le s co m o fu n c io n a le s . A d e m á s, se p re te n d e q u e d ich o s e q u iva le n te s inc luyan ta n to los e q u iva le n te s c o n o c id o s a c tu a lm e n te co m o los e q u iva le n te s d e sa rro lla d o s en e l fu tu ro , p. e j., c u a lq u ie r e le m e n to d e sa rro lla d o q ue re a lice la m ism a fun c ión , in d e p e n d ie n te m e n te de la e s tru c tu ra .
A nexo A
Las re fe re n c ia s a las fig u ra s en e l te x to a c o n tin u a c ió n son re fe re n c ia s a las fig u ra s A 2 -A 9 , de m a n e ra q u e la "fig u ra 2" a co n tin u a c ió n co rre sp o n d e a la fig u ra A 2 en los d ib u jos .
La F ig u ra 2 es un d ia g ra m a de flu jo q u e ilus tra u n a re a liza c ió n de e je m p lo de un m é to do p a ra la e s tim a c ió n de ru ido de fo n d o según la te c n o lo g ía p ro p u e s ta en la p re se n te m e m oria . El m é to d o e s tá d e s tin a d o a s e r re a liza d o p o r un e s tim a d o r de ru ido de fo n d o , q u e p u e d e s e r p a rte de un S A D . El e s tim a d o r de ru ido de fo n d o , y el S A D , p ue de n a d e m á s e s ta r co m p re n d id o s en un c o d if ic a d o r de a ud io , q ue a su ve z p u e d e e s ta r co m p re n d id o en un d isp o s itivo in a lá m b rico o en un nodo de red. P ara el e s tim a d o r de ru ido de fo n d o d e sc rito , a ju s ta r la e s tim a c ió n de ru ido h ac ia a ba jo , no e s tá re s tr ing ido . P ara c a d a tra m a se ca lc u la u n a p o s ib le n u e va e s tim a c ió n de ru ido de sub -b an da , in d e p e n d ie n te m e n te de si la tra m a es de fo n d o o de c o n te n id o a ctivo , si e l n uevo v a lo r es m e n o r q u e e l a c tu a l se u tiliza d ire c ta m e n te , ya q ue lo m ás p ro b a b le es q ue se tra te de u n a tra m a de fo n d o . La s ig u ie n te lóg ica de e s tim a c ió n de ru ido es un se g u n d o p aso d o n d e se d e c id e si p u e d e a u m e n ta rse la e s tim a c ió n de ru ido de su b -b a n d a y, de s e r así, cu á n to , e l a u m e n to se b a sa en la p o s ib le n ue va e s tim a c ió n de ru ido de s u b -b a n d a c a lc u la d a p re v ia m e n te . B á s ica m e n te , e s ta lóg ica fo rm a la d e c is ió n de q u e la tra m a a c tu a l es u na tra m a de fo n d o y, si no e s tá seg u ra , p uede p e rm itir un a u m e n to m e n o r en c o m p a ra c ió n con la q ue se e s tim ó o rig in a lm e n te .
El m é to d o ilu s tra d o en la fig u ra 2 c o m p re n d e : cu a n d o un n ive l de e n e rg ía de un se g m e n to de la señ a l de a ud io es m ás q ue un u m bra l m ás a lto 202:1 q u e un n ive l m ín im o de e n e rg ía a la rgo p lazo , lt_m in , o cu a n d o el n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m e n o r q ue un u m bra l m á s a lto 202 :2 q ue lt_m in , p e ro no se d e te c ta n in g u n a p au sa 204:1 en el se g m e n to de la señ a l de a ud io :
re d u c ir 206 u n a e s tim a c ió n de ru ido de fo n d o a c tu a l cu a n d o se d e te rm in a q u e el se g m e n to de la se ñ a l de a ud io 203 :2 co m p re n d e m ú s ica y la e s tim a c ió n de ru ido de fo n d o a c tu a l e xce d e un v a lo r m ín im o 205 :1 , d e n o ta d o "T " en la fig u ra 2, y e je m p lific a d o a d e m á s , p. e j., co m o 2 *E _ M IN en e l có d ig o a co n tin u a c ió n .
A l re a liz a r lo a n te r io r y p ro p o rc io n a r la e s tim a c ió n de ru ido de fo n d o a un S A D , e l S A D e s tá h a b ilita d o p a ra re a liza r u n a d e te cc ió n de a c tiv id a d de so n id o m ás a de cu a d a . A d e m á s, se h a b ilita la re cu p e ra c ió n de a c tu a liza c io n e s de la e s tim a c ió n de ru ido de fo n d o e rró n e a s .
El n ive l de e n e rg ía de l se g m e n to de la se ñ a l de a ud io u tiliz a d o en el m é to do d e sc rito a n te r io rm e n te se p uede d e n o m in a r a lte rn a tiva m e n te , p. e j., co m o la e n e rg ía de la tra m a a ctu a l, Etot, o co m o la e n e rg ía d e l se g m e n to de seña l, o tra m a , q u e se p u e d e c a lc u la r su m a n d o las e n e rg ía s de s u b -b a n d a p a ra el se g m e n to de señ a l actua l.
La o tra c a ra c te rís tic a de e n e rg ía u tiliz a d a en e l m é to d o a n te rio r, es d ec ir, e l n ive l m ín im o de e n e rg ía a la rgo p lazo, lt_m in , es u na e s tim a c ió n , q ue se d e te rm in a so b re u n a p lu ra lid a d de s e g m e n to s o tra m a s de la señ a l de a ud io
p re ce d e n te . lt_m in p o d ría a lte rn a tiv a m e n te d e n o ta rse , p. e j. E tot_l_lp. U na fo rm a b á s ica de d e r iv a r It_m in se ría u tiliz a r el v a lo r m ín im o d e l h is to ria l e n e rg é tic o de la tra m a a c tu a l sob re c ie rto n úm e ro de tra m a s p asa d a s . Si e l v a lo r c a lcu la d o co m o : "e n e rg ía de la tra m a a c tu a l - e s tim a c ió n m ín im a a la rgo p la zo " e s tá p o r d e b a jo de un v a lo r de u m bra l, d e n o ta d o p. e j., T H R 1, se d ice en la p re se n te m e m o ria q u e la e n e rg ía de la tra m a a c tu a l e s tá p ró x im a a la e n e rg ía m ín im a a la rgo p lazo, o ce rca de la e n e rg ía m ín im a a la rgo p la zo . Es d e c ir, cu a n d o (E to t - lt_m in ) < T H R 1, se p ue de d e te rm in a r 202 q ue la e n e rg ía de la tra m a a ctu a l, Etot, e s tá c e rca de la e n e rg ía m ín im a a la rgo p la zo lt_m in . El ca so en el q ue (E to t - lt_m in ) = THR1 p ue de re fe rirse a cu a lq u ie ra de las d e c is io n e s , 202:1 o 202 :2 , d e p e n d ie n d o de la im p le m e n ta c ió n . La n u m e ra c ió n 202:1 en la fig u ra 2 ind ica la d e c is ió n de q u e la e n e rg ía de la tra m a a c tu a l no e s tá c e rca de lt_m in , m ie n tra s q ue 202 :2 ind ica la d e c is ió n de q ue la e n e rg ía de la tra m a a c tu a l e s tá c e rca de lt_m in . O tra n u m e ra c ió n en la fig u ra 2 en la fo rm a de X X X :Y ind ica las d e c is io n e s co rre sp o n d ie n te s . La fu n c ió n lt_m in se d e sc rib irá con m ás d e ta lle a co n tin u a c ió n .
S e p ue de s u p o n e r q ue el v a lo r m ín im o, q u e d eb e s u p e ra r la e s tim a c ió n de ru ido de fo n d o a c tu a l, p a ra re d u c irlo es ce ro o un v a lo r p o s itivo p eq u e ñ o . P o r e je m p lo , co m o se e je m p lific a rá en el c ó d ig o a c o n tin u a c ió n , u na e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fon do , q ue p u e d e d e n o m in a rse "to ta lN o ise " y d e te rm in a rse , p. e j., co m o 10 * lo g 10 £ b a ck r[¡], se p u e d e re q u e rir q u e e xc e d a un v a lo r m ín im o de ce ro p ara q u e la re du cc ió n sea cu e s tio n a d a . A lte rn a tiva m e n te , o a d e m á s , ca d a e n tra d a en un v e c to r b a ck r[i] q ue co m p re n d e las e s tim a c io n e s de fo n d o de su b -b a n d a p uede co m p a ra rs e con un v a lo r m ín im o, E _M IN , p a ra q ue se re a lice la re d u cc ió n . En e l e je m p lo de c ó d ig o a co n tin u a c ió n , E _M IN es un v a lo r p o s itivo p eq ue ño .
D ebe se ñ a la rse q u e seg ún u na re a liza c ió n p re fe rid a de la so lu c ió n s u g e rid a en la p re se n te m e m o ria , la d e c is ió n de si e l n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m ás q u e un u m bra l m ás a lto q ue lt_m in se b asa ú n ica m e n te en la in fo rm a c ió n d e riv a d a de la señ a l de a ud io de e n tra d a , es d ec ir, no se b a sa en la re tro a lim e n ta c ió n de u n a d ec is ió n d e l d e te c to r de a c tiv id a d de son ido .
La d e te rm in a c ió n 204 de si u na tra m a a c tu a l co m p re n d e u na p a u sa o no p u e d e re a liza rse de d ife re n te s fo rm a s con b ase en u no o m ás c rite r io s . Un c rite r io de p a u sa ta m b ié n p u e d e d e n o m in a rse d e te c to r de p ausa . Se p od ría a p lic a r un so lo d e te c to r de p au sa , o u n a c o m b in a c ió n de d ife re n te s d e te c to re s de p au sa . C on u n a co m b in a c ió n de d e te c to re s de p au sa , ca d a uno p u e d e u tiliza rse p ara d e te c ta r p a u sa s en d ife re n te s c o n d ic io n e s . Un in d ic a d o r de q ue u na tra m a a c tu a l p ue de c o m p re n d e r u na p au sa , o ina c tiv id ad , es q u e u na c a ra c te rís tica de co rre la c ió n p a ra la tra m a es b a ja y q u e v a r ia s tra m a s p re ce d e n te s ta m b ié n han te n id o ca ra c te rís tic a s de b a ja co rre la c ió n . Si la e n e rg ía a c tu a l se a ce rca a la e n e rg ía m ín im a a la rgo p la zo y se d e te c ta u na p au sa , e l ru ido de fo n d o p u e d e a c tu a liza rse seg ún la e n tra d a a c tu a l, co m o se ilus tra en la fig u ra 2. S e p ue de c o n s id e ra r q u e se d e te c ta una p au sa cu a n d o , a d e m á s de q u e e l n ive l de e n e rg ía de l se g m e n to de la señ a l de a ud io es m e n o r q u e un u m bra l m ás a lto q ue lt_m in : se ha d e te rm in a d o q ue un n úm e ro p re d e fin id o de se g m e n to s c o n s e c u tiv o s de la señ a l de a ud io p re ce d e n te s no co m p re n d e n u na se ñ a l a c tiva y /o u n a d in á m ica de la se ñ a l de a ud io su p e ra un u m bra l. Esto ta m b ié n se ilus tra en el e je m p lo de có d ig o m ás aba jo .
La re du cc ió n 206 de la e s tim a c ió n de ru ido de fo n d o p e rm ite m a n e ja r s itu a c io n e s en las q ue la e s tim a c ió n de ru ido de fo n d o se ha v u e lto "d e m a s ia d o a lta ", es d ec ir, en re lac ió n con un v e rd a d e ro ru ido de fo n d o . Esto ta m b ié n p od ría e xp re sa rse , p. e j., co m o q u e la e s tim a c ió n de ru ido de fo n d o se d e sv ía de l ru ido de fo n d o real. U na e s tim a c ió n de ru ido de fo n d o d e m a s ia d o a lta p u e d e lle va r a d e c is io n e s in a d e cu a d a s p o r p a rte de l S A D , d o n d e se d e te rm in a q ue el se g m e n to de la señ a l a c tu a l e s tá in a c tivo a p e s a r de q u e co m p re n d e h ab la o m ú s ica a ctiva . U na razón p o r la q ue la e s tim a c ió n de ru ido de fo n d o se v u e lve d e m a s ia d o a lta es, p. e j., a c tu a liza c io n e s de ru ido de fo n d o e rró n e a s o no d e se a d a s en m ú sica , d o n d e la e s tim a c ió n de ru ido ha co n fu n d id o la m ú s ica con el fo n d o y ha p e rm itid o a u m e n ta r la e s tim a c ió n de ru ido . El m é to do d e sc rito p e rm ite a ju s ta r d ich a e s tim a c ió n de ru ido de fo n d o a c tu a liz a d a e rró n e a m e n te , p. e j., cu a n d o se d e te rm in a q ue u na tra m a s ig u ie n te de la señ a l de e n tra d a co m p re n d e m ú sica . Este a ju s te se rea liza m e d ia n te u na re du cc ió n fo rza d a de la e s tim a c ió n de ru ido de fo n d o , d o n d e la e s tim a c ió n d e l ru ido se reduce , inc lu so si la e n e rg ía de l se g m e n to de la señ a l de e n tra d a a c tu a l es m a yo r q u e la e s tim a c ió n de ru ido de fo n d o a c tu a l, p. e j., en u na su b -b a n d a . D ebe se ñ a la rse q ue la lóg ica d e sc rita a n te r io rm e n te p ara la e s tim a c ió n de ru ido de fo n d o se u tiliza p a ra c o n tro la r e l a u m e n to de e n e rg ía de la s u b -b a n d a de fo n d o . S ie m p re se p e rm ite re d u c ir la e n e rg ía de la su b -b a n d a cu a n d o la e n e rg ía de la su b -b a n d a de la tra m a a c tu a l es m e n o r q ue la e s tim a c ió n de ru ido de fo n d o . E sta fu n c ió n no se m u e s tra e xp líc ita m e n te en la fig u ra 2. D ich a d ism in u c ió n g e n e ra lm e n te tie n e un a ju s te fijo p a ra el ta m a ñ o de l paso. S in e m b a rg o , la e s tim a c ió n de ru ido de fo n d o so lo d e b e ría p e rm itirse s e r a u m e n ta d a en a so c ia c ió n con la lóg ica de d e c is ió n seg ún el m é to do d e sc rito a n te r io rm e n te . C u a n d o se d e te c ta una p au sa , las ca ra c te rís tic a s de e n e rg ía y de co rre la c ió n ta m b ié n p ue de n u tiliza rse p a ra d e c id ir 207 q u é tan g ra n d e d eb e s e r e l ta m a ñ o d e l p aso de a ju s te p a ra el a u m e n to de la e s tim a c ió n de fo n d o a n tes de q u e se re a lice la a c tu a liza c ió n d e l ru ido de fo n d o real.
C o m o se m e nc ion ó a n te r io rm e n te , a lg u n o s se g m e n to s de m ú s ica p ue de n s e r d ifíc ile s de se p a ra r d e l ru ido de fon do , d e b id o a q u e son m uy p a re c id o s al ru ido . A sí, la lóg ica de a c tu a liza c ió n de ru ido p uede , a cc id e n ta lm e n te , p e rm itir e s tim a c io n e s de e n e rg ía de s u b -b a n d a a u m e n ta d a s , a p e s a r de q u e la se ñ a l de e n tra d a e ra u na señ a l a ctiva . Esto p u e d e c a u s a r p ro b le m a s ya q ue la e s tim a c ió n de ru ido p u e d e lle g a r a s e r m ás a lta de lo q u e d e b e ría ser.
En los e s tim a d o re s de ru ido de fo n d o de la té c n ica a n te rio r, las e s tim a c io n e s de e n e rg ía de s u b -b a n d a so lo p od ían re d u c irse cu a n d o una e n e rg ía de su b -b a n d a de e n tra d a e s ta b a p o r d e b a jo de u na e s tim a c ió n de ru ido a c tu a l. S in e m b a rg o , d ad o q ue a lg u n o s s e g m e n to s de m ú s ica p u e d e n s e r d ifíc ile s de se p a ra r de l ru ido de fo n d o , d e b id o a que son m u y p a re c id o s al ru ido , los in ve n to re s se han d a d o cu e n ta de q ue se n eces ita u na e s tra te g ia de re cup e rac ión p a ra la m ú sica . En las re a liza c io n e s d e sc rita s en la p re se n te m e m oria , d ich a re cu p e ra c ió n p u e d e re a liza rse m e d ia n te
u n a re du cc ió n fo rza d a de la e s tim a c ió n de l ru ido cu a n d o la se ñ a l de e n tra d a v u e lve a te n e r c a ra c te rís tic a s s im ila re s a la m ú sica . Es d ec ir, cu a n d o la e n e rg ía y la lóg ica de p a u sa d e sc rita s a n te r io rm e n te e v ita n , 202 :1 , 204 :1 , q u e la e s tim a c ió n de ru ido aum e n te , se p ru e b a 203 si se s o s p e c h a q u e la e n tra d a es m ú s ica y, de s e r así, 203 :2 , las e n e rg ía s de b a n d a se re du cen 206 en u n a p e q u e ñ a ca n tid a d en ca d a tra m a h asta q ue las e s tim a c io n e s de ru ido a lca n za n un n ive l m ás b a jo de 205 :2.
Un e s tim a d o r de fo n d o co m o los d e sc rito s a n te r io rm e n te p ue de e s ta r co m p re n d id o o im p le m e n ta d o en un V A D o S A D y /o en un c o d if ic a d o r y /o en un d e co d ifica d o r, en d o n d e el c o d if ic a d o r y /o d e c o d if ica d o r p ue de n im p le m e n ta rse en un d isp o s itivo de u su a rio , com o un te lé fo n o m óvil, un o rd e n a d o r p ortá til, u n a ta b le ta , e tc . El e s tim a d o r de fo n d o p od ría a d e m á s e s ta r c o m p re n d id o en un nodo de red, co m o u n a p a sa re la de m e d io s , p. e j., co m o p a rte de un cód ec .
La F ig u ra 5 es un d ia g ra m a de b lo q u e s q ue ilus tra e sq u e m á tic a m e n te u n a im p le m e n ta c ió n de un e s tim a d o r de fon do seg ún u na re a liza c ió n de e je m p lo . Un b lo q u e de e n tra m a d o de e n tra d a 51 d iv id e p rim e ro la señ a l de e n tra d a en tra m a s de lon g itu d a d e cu a d a , p. e j., 5 -30 m s. P ara ca d a tra m a , un e x tra c to r de ca ra c te rís tic a s 52 ca lc u la al m e no s las s ig u ie n te s ca ra c te rís tic a s a p a rtir de la e n tra d a : 1) El e x tra c to r de ca ra c te rís tic a s a n a liza la tra m a en el d o m in io de la fre cu e n c ia y se ca lc u la la e n e rg ía p a ra un c o n ju n to de su b -b a n d a s . Las su b -b a n d a s son las m ism as su b -b a n d a s que se u tiliz a rá n p a ra la e s tim a c ió n de fo n d o . 2) El e x tra c to r de ca ra c te rís tic a s a n a liza a d e m á s la tra m a en e l d o m in io del tie m p o y ca lc u la u na co rre la c ió n ind icad a , p. e j., co r_ e s t y /o lt_ co r_ e s t, q u e se u tiliza p a ra d e te rm in a r si la tra m a co m p re n d e co n te n id o a c tivo o no. 3) El e x tra c to r de ca ra c te rís tic a s u tiliza a d e m á s la e n e rg ía to ta l de la tra m a actua l, p. e j., d e n o ta d a Etot, p a ra a c tu a liz a r las ca ra c te rís tic a s de l h is to ria l e n e rg é tico de las tra m a s de e n tra d a a c tu a le s y a n te rio re s , co m o la e n e rg ía m ín im a a la rgo p la zo , lt_m in . Las ca ra c te rís tic a s de co rre la c ió n y de e n e rg ía son luego a lim e n ta d a s al b lo q u e de L ó g ica de D ec is ión de A c tu a liza c ió n 53.
A qu í, u n a lóg ica de d e c is ió n según la so lu c ió n d e sc rita en la p re se n te m e m o ria se im p le m e n ta en el b lo q u e de L óg ica de D ec is ión de A c tu a liza c ió n 53, d o n d e las ca ra c te rís tic a s de co rre la c ió n y de e n e rg ía se u tilizan p a ra fo rm a r d e c is io n e s sob re si la e n e rg ía de la tra m a a c tu a l e s tá c e rca de u na e n e rg ía m ín im a a la rgo p la zo o no; sob re si la tra m a a c tu a l es p a rte de u n a p a u sa (seña l no a c tiva ) o no; y so b re si la tra m a a c tu a l es p arte de la m ú s ica o no. La so lu c ió n seg ún las re a liza c io n e s d e sc rita s en la p re se n te m e m o ria im p lica có m o se u tilizan e s ta s ca ra c te rís tic a s y d e c is io n e s p a ra a c tu a liz a r la e s tim a c ió n de ru ido de fo n d o de u n a m a n e ra robusta .
A co n tin u a c ió n , se d e sc rib irá n a lg u n o s d e ta lle s de im p le m e n ta c ió n de las re a liza c io n e s de la so lu c ió n d e s c rita en la p re se n te m e m oria . Los d e ta lle s de im p le m e n ta c ió n a c o n tin u a c ió n se to m a n de u na re a liza c ió n en un c o d ific a d o r b a sa d o en G .718. E sta re a liza c ió n u tiliza a lg u n a s de las ca ra c te rís tic a s d e sc rita s en W O 2011 /049514 y en W O 2011 /049515.
Las s ig u ie n te s ca ra c te rís tic a s se d e fin e n en e l G .718 m o d ifica d o d e sc rito en W O 2011 /09514
E tot; La e n e rg ía to ta l p a ra la tra m a de e n tra d a a c tu a l
E tot_l R a s tre a la e n vo lve n te de m ín im a e n e rg ía
E tot_l_lp; U na ve rs ió n s u a v iza d a de la e n vo lv e n te de e n e rg ía m ín im a E tot_l
to ta lN o ise ; La e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fo n d o
b c k r [ i] ; El v e c to r con las e s tim a c io n e s de fo n d o de su b -b a n d a
tm p N [i]; U na p o te n c ia l n u e va e s tim a c ió n de fo n d o c a lc u la d a p re v ia m e n te
a E n ; Un d e te c to r de fo n d o q ue u tiliza m ú ltip le s ca ra c te rís tic a s (un co n ta d o r)
h a rm _ co r_ cn t C u e n ta las tra m a s d e sd e la ú ltim a tra m a con co rre la c ió n o e ve n to a rm ó n ico
a c t_ p re d U na p re d icc ió n de la a c tiv id a d de las ca ra c te rís tic a s de la tra m a de e n tra d a ú n ica m e n te co r[i] V e c to r con e s tim a c io n e s de co rre la c ió n para , i = 0 fin a l de la tra m a a ctu a l, i = 1 in ic io de la tra m a a ctu a l, i = 2 fin a l de la tra m a a n te r io r
Las s ig u ie n te s ca ra c te rís tic a s se d e fin e n en e l G .718 m o d ifica d o d e sc rito en W O 2011 /09515
E to t_h R a s tre a la e n vo lve n te de m á x im a e n e rg ía
s ig n _ d yn _ lp ; U na d in á m ica de se ñ a l de e n tra d a su a v iza d a
T a m b ié n la c a ra c te rís tic a E to t_ v_ h se d e fin ió en W O 2011 /049514 , p e ro en e s ta re a liza c ió n se ha m o d ifica d o y a h o ra se im p le m e n ta co m o s igu e :
E to t_ v m id e la va ria c ió n d e e n e rg ía a b s o lu ta e n tre tra m as , es d ec ir, el v a lo r a b so lu to de la va r ia c ió n de e n e rg ía in s ta n tá n e a e n tre tra m a s . En el e je m p lo a n te rio r, se d e te rm in a que la va ria c ió n de e n e rg ía e n tre d os tra m a s es "b a ja " cu a n d o la d ife re n c ia e n tre la e n e rg ía de la tra m a a c tu a l y de la ú ltim a es m e n o r d e 7 u n id ad es . E sto se u tiliza co m o un in d ica d o r de q u e la tra m a a c tu a l (y la tra m a a n te rio r) p u e d e n se r p a rte d e una pau sa , es d ec ir, co m p re n d e n so lo ru ido de fo n d o . S in e m b a rg o , d ic h a v a r ia n z a tan b a ja p o d ría e n co n tra rse a lte rn a tiva m e n te , p. e j., en m e d io d e una rá fa g a de voz . L a v a r ia b le E to t_ la s t es e l n ive l de e n e rg ía de la tra m a a n te rio r.
Los p asos a n te rio re s d e sc rito s en el c ó d ig o p u e de n re a liza rse co m o p a rte de los p asos de "c a lcu la r /a c tu a liza r la c o rre la c ió n y la e n e rg ía " en el d ia g ra m a de flu jo en la fig u ra 2, es d ec ir, co m o p a rte de las a cc io n e s 201. En la im p le m e n ta c ió n de W O 2011 /049514 , se u tilizó un in d ica d o r V A D p a ra d e te rm in a r si el se g m e n to de la señ a l de a u d io ac tu a l c o m p re n d ía ru ido de fo n d o o no. Los in ve n to re s se han d a d o c u e n ta de que la d e p e n d e n c ia de la in fo rm a c ió n de re tro a lim e n ta c ió n p ue de se r p ro b le m á tica . En la so lu c ió n d e s c rita en la p re se n te m e m oria , la d e c is ió n de a c tu a liz a r o no la e s tim a c ió n d e ru ido d e fo n d o no d e p e n d e de una d e c is ió n de l V A D (o S A D ).
A d e m á s, en la so lu c ió n d e s c rita en la p re se n te m e m oria , las s ig u ie n te s ca ra c te rís tica s , q u e no fo rm a n p a rte de la im p le m e n ta c ió n de W O 2011 /049514 , p u e de n ca lc u la rs e /a c tu a liz a rs e co m o p a rte de los m ism o s p asos, es d ec ir, los p a so s de c a lc u la r/a c tu a liz a r la c o rre la c ió n y la e n e rg ía ilu s tra d o s en la fig u ra 2. E stas ca ra c te rís tic a s ta m b ié n se u tilizan en la ló g ica de d e c is ió n de si a c tu a liz a r la e s tim a c ió n de fon do o no.
P a ra lo g ra r u na e s tim a c ió n de ru ido de fo n d o m á s a d e cu a d a , se d e fin e n v a r ia s c a ra c te rís tic a s a co n tin u a c ió n . Por e je m p lo , se d e fin e n las n u e va s ca ra c te rís tic a s re la c io n a d a s con la co rre la c ió n c o r_ e s t e lt_ co r_ e s t. La ca ra c te rís tic a c o r_ e s t es u n a e s tim a c ió n de la co rre la c ió n en la tra m a a ctua l, y c o r_ e s t ta m b ié n se u tiliz a p a ra p ro d u c ir lt_co r_e s t, q u e es u n a e s tim a c ió n su a v iz a d a a la rgo p la zo d e la co rre la c ió n .
C om o se d e fin ió a n te r io rm e n te , co r[i] es un v e c to r que c o m p re n d e e s tim a c io n e s de co rre la c ió n , y co r[0 ] re p re se n ta el fin a l d e la tra m a a c tua l, co r[1 ] re p re s e n ta e l in ic io de la tra m a a c tu a l y co r[2 ] re p re s e n ta el fin a l d e una tra m a a n te rio r.
A d e m á s, se c a lc u la u n a n u e va ca ra c te rís tica , lt_ tn _ tra ck , que p ro p o rc io n a una e s tim a c ió n a la rgo p la zo de la fre cu e n c ia con la q u e las e s tim a c io n e s de fo n d o se a ce rcan a la e n e rg ía d e la tra m a ac tu a l. C u a n d o la e n e rg ía de la tra m a ac tu a l e s tá lo s u fic ie n te m e n te c e rca de la e s tim a c ió n d e fo n d o a ctua l, e sto se re g is tra m e d ia n te u na co n d ic ió n q u e in d ica (1 /0) si el fo n d o e s tá c e rca o no. E s ta señ a l se u tiliza p a ra fo rm a r la m e d id a a la rgo p la zo lt_ tn _ tra ck .
En e ste e je m p lo , se a ñ a d e 0 ,03 cu a n d o la e n e rg ía d e la tra m a ac tu a l e s tá c e rca de la e s tim a c ió n de ru ido de fo n d o y, de lo co n tra rio , el ún ico té rm in o re s ta n te es 0 ,97 v e ce s el v a lo r a n te rio r. En e ste e je m p lo , "ce rca " se d e fin e co m o que la d ife re n c ia e n tre la e n e rg ía de la tra m a ac tu a l, E tot, y la e s tim a c ió n de ru ido de fo n d o , to ta lN o ise , es m e n o r de 10 u n id ad es . T a m b ié n son p o s ib le s o tra s d e fin ic io n e s de "ce rca".
A d e m á s, la d is ta n c ia e n tre la e s tim a c ió n de fon do a c tua l, E tot, y la e n e rg ía d e la tra m a a ctua l, to ta lN o ise , se u tiliza p a ra d e te rm in a r u n a ca ra c te rís tica , lt_ tn _d is t, q u e p ro p o rc io n a u n a e s tim a c ió n a la rgo p la zo de e s ta d is ta n c ia . Se c re a
u n a c a ra c te r ís tic a s im ila r, lt_E llp _ d is t, p a ra la d is ta n c ia e n tre la e n e rg ía m ín im a a la rgo p la zo E to t_ l_ lp y la e n e rg ía de la tra m a a c tu a l, Etot.
st->lt_tn_dist = 0.03 f (Etot - st->totalNoise) 0.97f* st->lt_tn_dist;
st->lt_Ellp_dist = 0.03 f (Etot - st->Etot_l_lp) 0.97f*st->lt_Ellp_dist;
La c a ra c te rís tic a h a rm _ co r_ cn t, p re s e n ta d a a n te r io rm e n te , se u tiliza p a ra c o n ta r el n ú m e ro de tra m a s d e sd e la ú ltim a tra m a q u e tie n e u n a co rre la c ió n o un e ve n to a rm ó n ico , es d ec ir, d e sd e u na tra m a que cu m p le c ie rto s c rite r io s re la c io n a d o s con la a c tiv ida d . Es d ec ir, c u a n d o la c o n d ic ió n h a rm _ c o r_ c n t == 0, e sto im p lica q u e la tra m a a c tu a l m uy p ro b a b le m e n te se a una tra m a activa , y a q u e m u e s tra co rre la c ió n o un e ve n to a rm ó n ico . E s to se u tiliza p a ra fo rm a r una e s tim a c ió n s u a v iz a d a a la rgo p lazo , lt_ h a co _ e v , de la fre cu e n c ia con la q ue o cu rre n d ich o s e ve n to s . En e ste caso , la a c tu a liza c ió n no es s im é tr ica , es d ec ir, se u tilizan d ife re n te s c o n s ta n te s d e tie m p o si la e s tim a c ió n se in c re m e n ta o se reduce , com o p u e d e ve rse a co n tin u a c ió n .
¡f (5t->hanm j» r_ o n t — 0) r cu a n do p ro ba b I e m e nte a divo *i
{
s l-> ll haco ev - Q.03Í Ü .97 f 's M t haco ev: i* in c re m e n ta r e tim ac ión de largo plazo *¡
}
efse
{
£ t-^ t_haco_ ev = 0.99 f’ s t-^ lt h a c o .e y - /* reduc ir e s tim a c ió n de largo plazo V
}
U n v a lo r b a jo d e la c a ra c te rís tic a lt_ tn _ tra ck , p re s e n ta d a a n te rio rm e n te , in d ica q ue la e n e rg ía d e la tra m a de e n tra d a no h a e s ta do c e rca de la e n e rg ía de fo n d o p a ra a lg u n a s tra m a s . E sto se d e b e a q u e lt_ tn _ tra ck se re du ce p a ra c a d a tra m a en la q u e la e n e rg ía de la tra m a a c tu a l no e s tá a ce rc a d e la e s tim a c ió n de la e n e rg ía de fon do . lt_ tn _ tra ck se in c re m e n ta so lo c u a n d o la e n e rg ía de la tra m a a c tu a l e s tá c e rca d e la e s tim a c ió n de la e n e rg ía d e fo n d o co m o se m u e s tra a rrib a . P a ra o b te n e r una m e jo r e s tim a c ió n de cu á n to tie m p o h a d u ra d o e s te "s in s e g u im ie n to ", es d ec ir, la e n e rg ía de la tra m a e s ta n d o le jo s de la e s tim a c ió n de fon do , se fo rm a un co n ta d o r, lo w _ tn _ tra ck_ cn t, p a ra el n úm ero de tra m a s con e s ta a u s e n c ia de se g u im ie n to com o :
it (st-^U_tn_trac k<ü.Q5l) t* cu a n d o lt_tn_tra ck e stá t>aj o */
{
st->law_tn_traclí_cnt++; i* añ a d ir 1 al c o n ta d o r* /
}
elae
{
s t - >lo w _ ln _ tfa c k _ c n L = 0 ; f* re e s tb le ce r el c o n ta d o r* /
}
En el e je m p lo a n te rio r, "b a jo " se d e fin e p o r d e b a jo d e l v a lo r 0 ,05. E s to d eb e ve rse co m o un v a lo r d e e je m p lo , que p o d ría s e le cc io n a rse de m a n e ra d ife re n te .
P a ra el p aso "F o rm a r d e c is io n e s de p a u sa y m ú s ica " ilu s tra d o en la fig u ra 2, se u tilizan las s ig u ie n te s tre s e xp re s io n e s de có d ig o p a ra fo rm a r la d e te cc ió n de p au sa , ta m b ié n d e n o ta d a d e te cc ió n de fon do . En o tra s re a liza c io n e s e im p le m e n ta c io n e s , ta m b ié n se p o d ría n a ñ a d ir o tro s c rite r io s p a ra la d e te cc ió n de p au sa s . La d e c is ió n de m ú s ica real se fo rm a en el có d ig o u tiliza n d o ca ra c te rís tic a s de co rre la c ió n y de e ne rg ía .
1: b g _ b g d = E to t < E to t_ l_ lp 0.6 f * s t-> E to t_ v_ h ;
b g _ b g d se c o n v e rtirá en "1 " o "ve rd a d e ro " c u a n d o E to t e sté c e rca d e la e s tim a c ió n de ru ido de fon do . b g _ b g d s irve co m o u n a m á sca ra p a ra o tro s d e te c to re s de fondo . Es d ec ir, si b g _ b g d no es "ve rd a d e ro ", los d e te c to re s de fo n d o 2 y 3 a co n tin u a c ió n no n e ce s ita n s e r e va lu a d o s . E to t_ v_ h es u na e s tim a c ió n d e la v a r ia n za d e l ru ido , q ue p o d ría d e n o m in a rse a lte rn a tiva m e n te Nvar. E to t_ v_ h se d e riv a de la e n e rg ía to ta l d e e n tra d a (en el d o m in io log a rítm ico ) u tiliz a n d o E to t_v, q u e m ide la va r ia c ió n d e e n e rg ía a b so lu ta e n tre tra m a s . T e n g a en c u e n ta q ue la ca ra c te rís tic a E to t_ v_ h se lim ita a a u m e n ta r so lo un m á x im o de un p e q u e ñ o v a lo r co n s ta n te , p. e j., 0 ,2 p o r c a d a tra m a . E to t_ l_ lp es u n a ve rs ió n s u a v iz a d a d e la e n vo lve n te de m ín im a e n e rg ía E tot_ l.
2: a E _ b g d = s t-> a E n == 0;
C u a n d o aEn es ce ro , a E _ b gd se co n v ie rte en "1 " o "ve rd a d e ro ". aEn es un c o n ta d o r q u e se in c re m e n ta cu a n d o se d e te rm in a q ue u n a se ñ a l a c tiva e s tá p re se n te en u na tra m a a ctu a l, y d ism in u ye cu a n d o se d e te rm in a q ue la tra m a a c tu a l no co m p re n d e u na señ a l a ctiva . aEn no p ue de in c re m e n ta rse m ás de un c ie rto núm e ro , p. e j., 6, y no p uede re d u c irse a m e no s de ce ro . D e spu és de v a r ia s tra m a s co n se cu tiva s , p. e j., 6, s in u n a señ a l a c tiva , aEn se rá igua l a cero .
3: sd 1 _ b g d = (s t-> s ig n _ d yn _ lp > 15) & & (E to t - s t-> E to t_ l_ lp ) < s t-> E to t_ v_ h & & s t-> h a rm _ c o r_ cn t > 20;
A qu í, sd 1 _ b g d se rá "1" o "ve rd a d e ro " cu a n d o se cu m p la n tre s co n d ic io n e s d ife re n te s : La d in á m ica de la señal, s ig n _ d yn _ lp es a lta , en e s te e je m p lo m ás de 15; La e n e rg ía de la tra m a a c tu a l e s tá c e rca de la e s tim a c ió n de fon do ; y: H an p a sa d o c ie rto n ú m e ro de tra m a s sin co rre la c ió n o e ve n to s a rm ó n ico s , en e s te e je m p lo 20 tra m as .
La fu n c ió n de b g_ bg d es s e r un in d ic a d o r p a ra d e te c ta r q ue la e n e rg ía de la tra m a a c tu a l e s tá c e rca de la e n e rg ía m ín im a a la rgo p la zo . Los d o s ú ltim o s , a E _ b gd y sd 1 _ b g d re p re se n ta n u n a d e te cc ió n de p a u sa o de fo n d o en d ife re n te s co n d ic io n e s . a E _ b gd es e l d e te c to r m ás g e n e ra l de los d os, m ie n tra s q u e sd 1 _ b g d d e te c ta p rin c ip a lm e n te p a u sa s de l h ab la en S N R a lta . U na n ue va lóg ica de d e c is ió n seg ún u na re a liza c ió n de la te c n o lo g ía d e s c rita en la p re se n te m e m oria , se c o n s tru ye co m o s igu e en el có d ig o a c o n tin u a c ió n . La ló g ica de d e c is ió n co m p re n d e la c o n d ic ió n de e n m a sc a ra m ie n to b g_ bg d y los d o s d e te c to re s de p a u sa a E _ b gd y sd1 _ b g d . T a m b ié n p o d ría h a b e r un te rc e r d e te c to r de p au sa , q u e e va lú a las e s ta d ís tica s a la rgo p la zo de q u é tan b ien e l to ta lN o ise ra s trea la e s tim a c ió n de e n e rg ía m ín im a. Las co n d ic io n e s e va lu a d a s si la p rim e ra líne a es v e rd a d e ra es la lóg ica de d e c is ió n sob re q ué tan g ra n d e d e b e s e r e l ta m a ñ o d e l paso , u p d t_ s te p y la a c tu a liza c ió n de la e s tim a c ió n de ru ido real es la a s ig n a c ió n de v a lo r a "s t-> b c k r [i] = -". T e n g a en c u e n ta q ue tm p N [i] es un p o te n c ia lm e n te n ue vo n ive l de ru ido ca lc u la d o p re v ia m e n te según la so lu c ió n d e sc rita en W O 2011 /049514. La lóg ica de d e c is ió n a co n tin u a c ió n s igu e la p a rte 209 de la fig u ra 2, q u e se ind ica en p arte en re lac ió n con e l c ó d ig o a co n tin u a c ió n .
¡f{bg bgtS&S, (aE bgdllsdl bg<Jllst->lt tn tfack >0.9Df)) r s i 202 :2 y 204 :2 ) */
í
Í8 t->adjxe(i < 0.S5Í II ( aE..bgd M si->IL..haoo_ev < G.05Í)) S&
(s t-> ll_E llp _dist < 10 II sd1 .b g d ) && s l-> lt..tn . _di&¡<40 &&
{ (Etot - s t*^!o t3 lN o ise ) < 150 f l l s t^ l t fisco ev < 0.1 O f ) ) rffl'i
t
st->first noise uptfteil;
fon( i=0: i< NB BAN DS; i+ }
{
s t-^b ck fl'] = tm pN |i} rm*i
)
}
eise if<aE bgd&&5i->lt haco ev<Q.i5f]
{
updt_step=0,1f:
ií (si->act pred > Q.85f)
í
upd! s*ep=0.01f m rt
í
if (updt_step > G.Of)
s t-> firs i_ rio ¡se_upd i = 1;
forf i=0; ¡<
m
BANDS; h -t J
{
St-> bckrfi] = st->bckft¡] -i- updt_step * (tmpN[i]-$t->bCkr|¡]): fTOffV
}}}
e lse
(5t-> lirst_no¡se updt} =1:
}
else
I* Si en m ú s ic a b a ja r b ck r p a ra b a ja r a d ic io n a lm e n te *f f * s l 203 :2 y 205 :1 * /
if ( s t-> iow _tn_track co t > 300 &S st->lt h a c o .e i/ > 0 j9 f &S s t-> total Noise > 0.01)
{
For ( i=0; i< NB B A N D S ;i++)
{
Else
(st->first_noise_Lipdt) = 1;
}
El se g m e n to de c ó d ig o en el ú ltim o b lo q u e de có d ig o q u e c o m ie n z a co n "/ * S i en m ú s ica ... * / c o n tie n e la re du cc ió n fo rza d a de la e s tim a c ió n de fo n d o q u e se u tiliz a si se s o sp e ch a q ue la e n tra d a a c tu a l es m ú sica . Esto se d e c id e com o u na fu n c ió n :
p e río d o la rgo de ru ido de fo n d o de se g u im ie n to d e fic ie n te en c o m p a ra c ió n con la e s tim a c ió n de e n e rg ía m ín im a, Y, o cu rre n c ia s fre cu e n te s de e ve n to s a rm ó n ico s o de co rre la c ió n , Y, la ú ltim a co n d ic ió n "to ta lN o ise > 0 " es u na ve r ifica c ió n de q u e la e n e rg ía to ta l a c tu a l de la e s tim a c ió n de fo n d o es m a yo r q ue ce ro , lo q u e im p lica q u e p u e d e co n s id e ra rse u n a re du cc ió n de la e s tim a c ió n de fo n d o . A d e m á s, se d e te rm in a si "b ckr[i] > 2 * E _M IN ", d o n d e E _M IN es un p eq u e ñ o v a lo r p os itivo . Esto es u n a v e r ifica c ió n de ca d a e n tra d a en un v e c to r q ue co m p re n d e las e s tim a c io n e s de fo n d o de la su b -b a n d a , de m o do q ue u n a e n tra d a d e b e su p e ra r E _M IN p a ra s e r re d u c id a (en e l e je m p lo s ie n d o m u ltip lica d a p o r 0 ,98). E s tas c o m p ro b a c io n e s se re a liza n p a ra e v ita r re d u c ir las e s tim a c io n e s de fo n d o a va lo re s d e m a s ia d o p eq u e ñ o s.
Las re a liza c io n e s m e jo ran la e s tim a c ió n de ru ido de fon do , lo q u e p e rm ite un re n d im ie n to m e jo ra d o de l S A D /V A D p ara lo g ra r u n a so lu c ió n D T X de a lta e fic ie n c ia y e v ita r la d e g ra d a c ió n en la ca lid a d de l h a b la o de la m ú s ica ca u s a d a p o r el recorte .
C on la e lim in a c ió n de la re tro a lim e n ta c ió n de d e c is io n e s d e s c rita en W O 2011 /09514 de E to t_ v_ h , h ay u n a m e jo r se p a ra c ió n e n tre la e s tim a c ió n de ru ido y e l S A D . Esto tie n e ve n ta ja s , co m o q ue la e s tim a c ió n de ru ido no se ca m b ia s i/cu a n d o se c a m b ia la fu n c ió n /a ju s te d e l SAD . Es d ec ir, la d e te rm in a c ió n de u n a e s tim a c ió n de ru ido de fo n d o se v u e lve in d e p e n d ie n te de la fu n c ió n d e l S A D . A d e m á s, e l a ju s te de la ló g ica de e s tim a c ió n de ru ido se v u e lve m ás fác il ya q ue u no no se ve a fe c ta d o p o r los e fe c to s se cu n d a rio s de l S A D cu a n d o se ca m b ia n las e s tim a c io n e s de fon do .
Claims (14)
1. Un m é to do p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na se ñ a l de a ud io , c o m p re n d ie n d o e l m é to do : o b te n e r (201 ) al m e no s un p a rá m e tro a so c ia d o con un se g m e n to de la se ñ a l de a ud io de e n tra d a con b ase en: u n a p rim e ra g a n a n c ia de p red icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre u n a e n e rg ía de se ñ a l re s idu a l de una p rim e ra p re d icc ió n linea l y u na e n e rg ía de se ñ a l re s idu a l de u n a s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , s ie n d o la se g u n d a p re d icc ió n linea l de un o rde n s u p e r io r q ue la p rim e ra p re d icc ió n lin e a l; y u n a se g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a co m o un c o c ie n te e n tre la e n e rg ía de se ñ a l re s idu a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a te rce ra p re d icc ió n linea l p a ra el se g m e n to de la seña l de a ud io , s ien do la te rce ra p red icc ió n linea l de un o rde n s u p e r io r q u e la s e g u n d a p re d icc ió n linea l;
d e te rm in a r (202 ) si e l se g m e n to de la señ a l de a ud io co m p re n d e u na p a u sa b asad a , al m e no s, en el al m enos un p a rá m e tro ; y:
si se d e te rm in a q ue e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p au sa :
a c tu a liz a r (203 ) u na e s tim a c ió n de ru ido de fo n d o con b a se en el se g m e n to de la señ a l de aud io .
2. El m é to d o seg ún la re iv in d ica c ió n 1, en d o n d e la o b te n c ió n de l al m e no s un p a rá m e tro co m p re n d e :
lim ita r las g a n a n c ia s de p re d icc ió n linea l p rim e ra y se g u n d a p a ra q u e a d o p te n va lo re s en un in te rva lo p re d e fin id o .
3. El m é to d o seg ún la re iv in d ica c ió n 1 ó 2, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
c re a r al m e no s u n a e s tim a c ió n a la rgo p la zo de ca d a u n a de las g a n a n c ia s de p re d icc ió n linea l p rim e ra y seg u n d a , en d o n d e la e s tim a c ió n a la rgo p la zo se b asa a d e m á s en las g a n a n c ia s de p re d icc ió n linea l c o rre sp o n d ie n te s a so c ia d a s con al m e no s un se g m e n to de la se ñ a l de a ud io p re ce d e n te .
4. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 3, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
d e te rm in a r u n a d ife re n c ia e n tre u n a de las g a n a n c ia s de p re d icc ió n linea l a so c ia d a s con el se g m e n to de la señ a l de a ud io y u n a e s tim a c ió n a la rgo p la zo de d ic h a g a n a n c ia de p re d icc ió n lineal.
5. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 4, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e :
d e te rm in a r u n a d ife re n c ia e n tre d o s e s tim a c io n e s a la rgo p la zo a so c ia d a s con u na de las g a n a n c ia s de p red icc ió n linea l.
6. El m é to do seg ún u n a cu a lq u ie ra de las re iv in d ica c io n e s 1 a 5, en d o n d e la o b te n c ió n d e l al m e no s un p a rá m e tro co m p re n d e e l f iltra d o de p aso b a jo de las g a n a n c ia s de p re d icc ió n linea l p rim e ra y seg un da .
7. El m é to d o seg ún la re iv in d ica c ió n 6, en d o n d e los co e fic ie n te s de f iltro de al m e no s un filtro de paso b a jo d e p e n d e n de u na re lac ió n e n tre u na g a n a n c ia de p re d icc ió n linea l a so c ia d a con el se g m e n to de la se ñ a l de a ud io y un p ro m e d io de u na g a n a n c ia de p re d icc ió n linea l co rre sp o n d ie n te o b te n id a con b ase en u n a p lu ra lida d se g m e n to s de la se ñ a l de a ud io p re ce d e n te .
8. El m é to do seg ún cu a lq u ie ra de las re iv in d ica c io n e s p re ce d e n te s , en d o n d e la d e te rm in a c ió n de si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa se b a sa a d e m á s en u n a m e d id a de p ro x im id a d e sp e c tra l a so c ia d a con el se g m e n to de la señ a l de aud io .
9. El m é to do según la re iv in d ica c ió n 8, q u e co m p re n d e a d e m á s o b te n e r la m e d id a de p ro x im id a d e sp e c tra l con base en las e n e rg ía s p a ra un c o n ju n to de b a n d a s de fre cu e n c ia de l se g m e n to de la se ñ a l de a ud io y e s tim a c io n e s de ru ido de fo n d o co rre sp o n d ie n te s al c o n ju n to de b a n d a s de fre cu e n c ia .
10. El m é to do según la re iv in d ica c ió n 9, en d on de , d u ra n te un p e río d o de in ic ia liza c ió n , un v a lo r in ic ia l, Emin se u tiliza co m o las e s tim a c io n e s de ru ido de fo n d o con b ase en el cu a l se o b tie n e la m e d id a de p ro x im id a d e sp ec tra l.
11. Un a p a ra to (1100 ), p a ra a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o de u na señ a l de a u d io q u e co m p re n d e una p lu ra lid a d de se g m e n to s de la se ñ a l de a ud io , e s ta n d o c o n fig u ra d o e l a p a ra to para :
o b te n e r al m enos un p a rá m e tro con b ase en:
u na p rim e ra g a n a n c ia de p re d icc ió n linea l c a lcu la d a co m o un c o c ie n te e n tre u n a e n e rg ía de señ a l re s idu a l de una p rim e ra p re d icc ió n linea l y u na e n e rg ía de se ñ a l re s idu a l de u n a s e g u n d a p re d icc ió n linea l p a ra e l se g m e n to de la señ a l de a ud io , s ie n d o la se g u n d a p re d icc ió n linea l de un o rde n s u p e r io r q ue la p rim e ra p re d icc ió n line a l; y
u n a s e g u n d a g a n a n c ia de p re d icc ió n linea l c a lc u la d a com o un c o c ie n te e n tre la e n e rg ía de señ a l re s id u a l de la s e g u n d a p re d icc ió n linea l y u n a e n e rg ía de señ a l re s idu a l de u n a te rce ra p re d icc ió n linea l p a ra e l se g m e n to de la seña l de a ud io , s ien do la te rce ra p red icc ió n linea l de un o rde n s u p e r io r q u e la s e g u n d a p re d icc ió n linea l;
d e te rm in a r si e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p au sa , b a sa d a , al m e no s, en e l al m e no s un p a rá m e tro ; y
si se d e te rm in a q ue e l se g m e n to de la señ a l de a ud io co m p re n d e u n a p a u sa :
a c tu a liz a r u n a e s tim a c ió n de ru ido de fo n d o con b ase en el se g m e n to de la señ a l de a u d io .
12. El a p a ra to seg ún la re iv in d ica c ió n 11, en d o n d e el a p a ra to se c o n fig u ra a d e m á s p a ra re a liza r e l m é to d o seg ún u na cu a lq u ie ra de las re iv in d ica c io n e s 2 a 10.
13. Un có d e c de a ud io q u e co m p re n d e e l a p a ra to seg ún la re iv in d ica c ió n 11 ó 12.
14. Un d isp o s itivo de c o m u n ica c ió n q u e co m p re n d e el a p a ra to seg ún la re iv in d ica c ió n 11 ó 12.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462030121P | 2014-07-29 | 2014-07-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2869141T3 true ES2869141T3 (es) | 2021-10-25 |
Family
ID=53682771
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15739357.0T Active ES2664348T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
ES19179575T Active ES2869141T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15739357.0T Active ES2664348T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
Country Status (19)
Country | Link |
---|---|
US (5) | US9870780B2 (es) |
EP (3) | EP3582221B1 (es) |
JP (3) | JP6208377B2 (es) |
KR (3) | KR101895391B1 (es) |
CN (3) | CN112927725A (es) |
BR (1) | BR112017001643B1 (es) |
CA (1) | CA2956531C (es) |
DK (1) | DK3582221T3 (es) |
ES (3) | ES2664348T3 (es) |
HU (1) | HUE037050T2 (es) |
MX (3) | MX2021010373A (es) |
MY (1) | MY178131A (es) |
NZ (1) | NZ728080A (es) |
PH (1) | PH12017500031A1 (es) |
PL (2) | PL3582221T3 (es) |
PT (1) | PT3309784T (es) |
RU (3) | RU2713852C2 (es) |
WO (1) | WO2016018186A1 (es) |
ZA (2) | ZA201708141B (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2941782T3 (es) | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
ES2664348T3 (es) * | 2014-07-29 | 2018-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimación de ruido de fondo en señales de audio |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105897455A (zh) * | 2015-11-16 | 2016-08-24 | 乐视云计算有限公司 | 用于检测功能管理配置服务器运营的方法、合法客户端、cdn节点及系统 |
DE102018206689A1 (de) * | 2018-04-30 | 2019-10-31 | Sivantos Pte. Ltd. | Verfahren zur Rauschunterdrückung in einem Audiosignal |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
CN110110437B (zh) * | 2019-05-07 | 2023-08-29 | 中汽研(天津)汽车工程研究院有限公司 | 一种基于相关区间不确定性理论的汽车高频噪声预测方法 |
CN111863016B (zh) * | 2020-06-15 | 2022-09-02 | 云南国土资源职业学院 | 一种天文时序信号的噪声估计方法 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297213A (en) * | 1992-04-06 | 1994-03-22 | Holden Thomas W | System and method for reducing noise |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
JP3685812B2 (ja) * | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
FR2715784B1 (fr) * | 1994-02-02 | 1996-03-29 | Jacques Prado | Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application. |
FR2720850B1 (fr) * | 1994-06-03 | 1996-08-14 | Matra Communication | Procédé de codage de parole à prédiction linéaire. |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP2001236085A (ja) * | 2000-02-25 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 |
DE10026904A1 (de) * | 2000-04-28 | 2002-01-03 | Deutsche Telekom Ag | Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal |
US7254532B2 (en) * | 2000-04-28 | 2007-08-07 | Deutsche Telekom Ag | Method for making a voice activity decision |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
KR100399057B1 (ko) * | 2001-08-07 | 2003-09-26 | 한국전자통신연구원 | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 |
FR2833103B1 (fr) * | 2001-12-05 | 2004-07-09 | France Telecom | Systeme de detection de parole dans le bruit |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7065486B1 (en) * | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
RU2317595C1 (ru) * | 2006-10-30 | 2008-02-20 | ГОУ ВПО "Белгородский государственный университет" | Способ обнаружения пауз в речевых сигналах и устройство его реализующее |
RU2417459C2 (ru) * | 2006-11-15 | 2011-04-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования аудиосигнала |
PL2118889T3 (pl) * | 2007-03-05 | 2013-03-29 | Ericsson Telefon Ab L M | Sposób i sterownik do wygładzania stacjonarnego szumu tła |
CA2690433C (en) * | 2007-06-22 | 2016-01-19 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8489396B2 (en) * | 2007-07-25 | 2013-07-16 | Qnx Software Systems Limited | Noise reduction with integrated tonal noise reduction |
KR101230183B1 (ko) * | 2008-07-14 | 2013-02-15 | 광운대학교 산학협력단 | 오디오 신호의 상태결정 장치 |
JP5513138B2 (ja) * | 2009-01-28 | 2014-06-04 | 矢崎総業株式会社 | 基板 |
US8244523B1 (en) * | 2009-04-08 | 2012-08-14 | Rockwell Collins, Inc. | Systems and methods for noise reduction |
US8886528B2 (en) * | 2009-06-04 | 2014-11-11 | Panasonic Corporation | Audio signal processing device and method |
DE102009034238A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Statorsegment und Stator eines Hybrid- oder Elektrofahrzeuges |
DE102009034235A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Stator eines Hybrid- oder Elektrofahrzeuges, Statorträger |
CN102667927B (zh) * | 2009-10-19 | 2013-05-08 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
CA2778343A1 (en) * | 2009-10-19 | 2011-04-28 | Martin Sehlstedt | Method and voice activity detector for a speech encoder |
CN102136271B (zh) * | 2011-02-09 | 2012-07-04 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
JP5969513B2 (ja) * | 2011-02-14 | 2016-08-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
AP2015008251A0 (en) * | 2012-09-11 | 2015-02-28 | Telefonaktiebogalet Lm Ericsson Publ | Generation of comfort noise |
CN103050121A (zh) * | 2012-12-31 | 2013-04-17 | 北京迅光达通信技术有限公司 | 线性预测语音编码方法及语音合成方法 |
CN106409313B (zh) * | 2013-08-06 | 2021-04-20 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN103440871B (zh) * | 2013-08-21 | 2016-04-13 | 大连理工大学 | 一种语音中瞬态噪声抑制的方法 |
ES2664348T3 (es) * | 2014-07-29 | 2018-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimación de ruido de fondo en señales de audio |
US11114104B2 (en) * | 2019-06-18 | 2021-09-07 | International Business Machines Corporation | Preventing adversarial audio attacks on digital assistants |
KR20230103130A (ko) * | 2021-12-31 | 2023-07-07 | 에스케이하이닉스 주식회사 | 메모리 컨트롤러 및 그 동작 방법 |
-
2015
- 2015-07-01 ES ES15739357.0T patent/ES2664348T3/es active Active
- 2015-07-01 EP EP19179575.6A patent/EP3582221B1/en active Active
- 2015-07-01 KR KR1020177002593A patent/KR101895391B1/ko not_active Application Discontinuation
- 2015-07-01 MX MX2021010373A patent/MX2021010373A/es unknown
- 2015-07-01 EP EP15739357.0A patent/EP3175458B1/en active Active
- 2015-07-01 KR KR1020187025077A patent/KR102012325B1/ko active IP Right Grant
- 2015-07-01 CA CA2956531A patent/CA2956531C/en active Active
- 2015-07-01 ES ES17202308T patent/ES2758517T3/es active Active
- 2015-07-01 WO PCT/SE2015/050770 patent/WO2016018186A1/en active Application Filing
- 2015-07-01 DK DK19179575.6T patent/DK3582221T3/da active
- 2015-07-01 CN CN202110082923.6A patent/CN112927725A/zh active Pending
- 2015-07-01 KR KR1020197023763A patent/KR102267986B1/ko active IP Right Grant
- 2015-07-01 RU RU2018129139A patent/RU2713852C2/ru active
- 2015-07-01 US US15/119,956 patent/US9870780B2/en active Active
- 2015-07-01 RU RU2017106163A patent/RU2665916C2/ru active
- 2015-07-01 MY MYPI2017700095A patent/MY178131A/en unknown
- 2015-07-01 PT PT172023087T patent/PT3309784T/pt unknown
- 2015-07-01 EP EP17202308.7A patent/EP3309784B1/en active Active
- 2015-07-01 JP JP2016552887A patent/JP6208377B2/ja active Active
- 2015-07-01 CN CN201580040591.8A patent/CN106575511B/zh active Active
- 2015-07-01 MX MX2017000805A patent/MX365694B/es active IP Right Grant
- 2015-07-01 PL PL19179575T patent/PL3582221T3/pl unknown
- 2015-07-01 BR BR112017001643-5A patent/BR112017001643B1/pt active IP Right Grant
- 2015-07-01 PL PL17202308T patent/PL3309784T3/pl unknown
- 2015-07-01 NZ NZ728080A patent/NZ728080A/en unknown
- 2015-07-01 HU HUE15739357A patent/HUE037050T2/hu unknown
- 2015-07-01 ES ES19179575T patent/ES2869141T3/es active Active
- 2015-07-01 CN CN202110082903.9A patent/CN112927724B/zh active Active
-
2017
- 2017-01-05 PH PH12017500031A patent/PH12017500031A1/en unknown
- 2017-01-18 MX MX2019005799A patent/MX2019005799A/es unknown
- 2017-09-06 JP JP2017171326A patent/JP6600337B2/ja active Active
- 2017-11-21 US US15/818,848 patent/US10347265B2/en active Active
- 2017-11-30 ZA ZA2017/08141A patent/ZA201708141B/en unknown
-
2019
- 2019-05-10 US US16/408,848 patent/US11114105B2/en active Active
- 2019-05-20 ZA ZA2019/03140A patent/ZA201903140B/en unknown
- 2019-10-04 JP JP2019184033A patent/JP6788086B2/ja active Active
-
2020
- 2020-01-14 RU RU2020100879A patent/RU2760346C2/ru active
-
2021
- 2021-08-03 US US17/392,908 patent/US11636865B2/en active Active
-
2023
- 2023-03-13 US US18/120,483 patent/US20230215447A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2869141T3 (es) | Estimación de ruido de fondo en señales de audio | |
ES2277861T3 (es) | Supresion de ruido. | |
ES2900516T3 (es) | Aparato, método y programa informático para proporcionar parámetros ajustados | |
TW200703240A (en) | Systems, methods, and apparatus for quantization of spectral envelope representation | |
MY150373A (en) | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing | |
US20160293174A1 (en) | Audio bandwidth selection | |
JP2018528464A5 (es) | ||
US20040243404A1 (en) | Method and apparatus for improving voice quality of encoded speech signals in a network | |
US9852738B2 (en) | Method and apparatus for processing lost frame | |
ES2756023T3 (es) | Método y dispositivo para decodificar un flujo de bits de voz y audio | |
US8577672B2 (en) | Audible errors detection and prevention for speech decoding, audible errors concealing | |
EP3281195B1 (en) | Gain parameter estimation based on energy saturation and signal scaling | |
Han et al. | Improved AMR wideband error concealment for mobile communications | |
BR112017021355B1 (pt) | Método e aparelho para gerar um parâmetro de quadro de ganho para produzir um fluxo de bits e memória legível por computador | |
CN112752199A (zh) | 一种基于alsa框架的声卡左右声道独立控制装置及方法 | |
Bronk et al. | IVS and PSAP hardware prototypes for the eCall system | |
Hoskote et al. | A57 LUNG INJURY, REPAIR, AND FIBROSIS: THE PLOT THICKENS FOR THREE'S COMPANY: Buffered Hypercapnia Improves Wound Closure In Alveolar Type 1 Epithelial Cell Monolayers | |
JPH09297600A (ja) | 音声復号装置 |