ES2805308T3 - Mejora del contenido insonoro para decodificador CELP de tasa baja - Google Patents
Mejora del contenido insonoro para decodificador CELP de tasa baja Download PDFInfo
- Publication number
- ES2805308T3 ES2805308T3 ES12844916T ES12844916T ES2805308T3 ES 2805308 T3 ES2805308 T3 ES 2805308T3 ES 12844916 T ES12844916 T ES 12844916T ES 12844916 T ES12844916 T ES 12844916T ES 2805308 T3 ES2805308 T3 ES 2805308T3
- Authority
- ES
- Spain
- Prior art keywords
- tio
- fre
- ita
- domain
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 17
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims abstract description 9
- 241001378740 Mugil liza Species 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 19
- JLKIGFTWXXRPMT-UHFFFAOYSA-N sulphamethoxazole Chemical compound O1C(C)=CC(NS(=O)(=O)C=2C=CC(N)=CC=2)=N1 JLKIGFTWXXRPMT-UHFFFAOYSA-N 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 101100507451 Drosophila melanogaster sip3 gene Proteins 0.000 claims 8
- 235000008100 Ginkgo biloba Nutrition 0.000 claims 1
- 244000194101 Ginkgo biloba Species 0.000 claims 1
- 241001307280 Laoma Species 0.000 claims 1
- 230000005284 excitation Effects 0.000 abstract description 8
- 239000003607 modifier Substances 0.000 abstract description 2
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012797 qualification Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000640643 Adenes Species 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 241000735495 Erica <angiosperm> Species 0.000 description 1
- 235000000421 Lepidium meyenii Nutrition 0.000 description 1
- 240000000759 Lepidium meyenii Species 0.000 description 1
- 241001111950 Sonora Species 0.000 description 1
- 241000919913 Synosis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 235000012902 lepidium meyenii Nutrition 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- PSGAAPLEWMOORI-PEINSRQWSA-N medroxyprogesterone acetate Chemical compound C([C@@]12C)CC(=O)C=C1[C@@H](C)C[C@@H]1[C@@H]2CC[C@]2(C)[C@@](OC(C)=O)(C(C)=O)CC[C@H]21 PSGAAPLEWMOORI-PEINSRQWSA-N 0.000 description 1
- LKACJLUUJRMGFK-UHFFFAOYSA-N methylsulfonal Chemical compound CCS(=O)(=O)C(C)(CC)S(=O)(=O)CC LKACJLUUJRMGFK-UHFFFAOYSA-N 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
Un dispositivo para modificar, durante la decodificación de una señal de sonido, una síntesis de una excitación de dominio de tiempo decodificada por un decodificador (102) de dominio de tiempo, que comprende: un clasificador (104, 105, 106, 301) de la síntesis de la excitación de dominio de tiempo decodificada en uno de un número de categorías; un convertidor (107, 201) de la excitación de dominio de tiempo decodificada en una excitación de dominio de frecuencia; un modificador (107, 203, 204, 205, 206, 207, 208, 209, 210) de la excitación de dominio de frecuencia en función de la categoría en la que el clasificador (104, 105, 106, 301) clasifica la síntesis de la excitación de dominio de tiempo decodificado; un convertidor (107, 202) de la excitación modificada de dominio de frecuencia en una excitación modificada de dominio de tiempo; un filtro (108) de síntesis suministrado con la excitación modificada de dominio de tiempo para producir una síntesis modificada de la excitación de dominio de tiempo decodificada.
Description
DESCRIPCIÓN
M e jo ra del co n te n id o in so n o ro para d e c o d ifica d o r C E LP de ta sa baja
C a m p o
La p rese n te d ivu lg a c ió n se re fie re a un d isp o s itivo y m é to d o p ara m o d ific a r una s ín te s is de una e xc ita c ió n de d om in io de tie m p o d e co d ifica d a p o r un d e c o d ifica d o r de d o m in io de tiem p o .
A n te ce d e n te s
Un cód ec co n ve rsa c io n a l de ú ltim a g e n e ra c ió n p uede re p re s e n ta r con una m u y b uena ca lid ad una señ a l son o ra lim p ia con una ta sa de bits de a lre d e d o r de 8 kbps y una tra n s p a re n c ia de a p ro x im a c ió n a una ta sa de bits de 16 kbps. Para m a n te n e r e sta a lta ca lid ad so n o ra inc lu so a ta s a ba ja de bits, se p ue de u tiliz a r un e sq u e m a de co d ifica c ió n m u ltim o d a l. U su a lm e n te (véase , p o r e je m p lo , el d o cu m e n to U s 6 ,240 ,386 B1) la señ a l de son ido de e n tra d a se d iv id e e n tre d ife re n te s ca te g o ría s q ue re fle jan sus c a ra c te rís tica s . P o r e je m p lo , las d ife re n te s c a te g o ría s pueden in c lu ir de voz, so rd a y de a pa ric ión . El có d e c u tiliza d ife re n te s m o d o s de co d ifica c ió n o p tim iza d o s para to d a s e stas ca te go rías .
S in em ba rg o , a lg u n o s có d e cs so n o ro s d e sp le g a d o s no u tilizan e ste e n fo q u e m u ltim o d a l, lo q ue da com o re su lta d o una ca lid ad sub óp tim a , e sp e c ia lm e n te a ta sa s de b its b a jas p ara una señ a l de s o n id o d ife re n te de so n o rid a d lim p ia. C u a n d o se d e sp lie g a un códec, es d ifíc il m o d ific a r el co d ific a d o r d eb ido al h echo de q ue el f lu jo de b its está e s ta n d a riza d o y cu a lq u ie r m o d ifica c ió n al flu jo de b its ro m p e ría la in te ro p e ra b ilid a d del códec. S in e m ba rg o , se pueden im p le m e n ta r m o d ifica c io n e s en el d e c o d ifica d o r para m e jo ra r la ca lid ad p e rc ib id a en el lad o del recep to r.
R esum en
De a cu e rd o con un p rim e r a sp ec to , la p re se n te d ivu lg a c ió n se re fie re a un d isp o s itivo para m od ifica r, d u ra n te la d e co d ifica c ió n de una señ a l de son ido , una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a p o r un d e c o d ifica d o r de d o m in io de tiem p o , q ue com p re nd e : un c la s if ica d o r de la s ín te s is de e xc ita c ió n de d o m in io del t ie m p o d e c o d ifica d o en uno de un n ú m e ro de ca te go rías ; un c o n v e rtid o r de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en una e xc ita c ió n de d o m in io de fre cu e n c ia ; un m o d ific a d o r de la e xc ita c ió n de d o m in io de fre cu e n c ia en fu n c ió n de la ca te g o ría en la q ue el c la s if ica d o r c la s ifica la s ín te s is de la e xc itac ión de d o m in io de tie m p o d eco d ifica d a ; un c o n v e rtid o r de la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a en una e xc ita c ió n de d o m in io del t ie m p o m o d ificad o ; y un filtro de s ín te s is su m in is tra d o con la e xc ita c ió n de d o m in io del tie m p o m o d ifica d o para p ro d u c ir una s ín tes is m o d ifica d a de la e xc ita c ió n de d o m in io del t ie m p o d eco d ifica d a . El m o d ific a d o r p uede c o m p re n d e r una c a lcu la d o ra de una fre cu e n c ia de co rte d o n d e una co n trib u c ió n de e xc ita c ió n de d o m in io de tie m p o d e ja de usarse ; un ce ro de la e xc ita c ió n del d o m in io de fre cu e n c ia p o r e n c im a de la fre cu e n c ia de corte ; y un n o rm a liz a d o r de la e xc itac ión de d o m in io de fre cu e n c ia p or d e b a jo de la fre cu e n c ia de co rte p ara p ro d u c ir una e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a lizad a .
De a cu e rd o con un se g u n d o a sp ec to , la p rese n te d ivu lg a c ió n se re fie re a un m é to d o para m o d ifica r, d u ra n te la d e co d ifica c ió n de una señ a l de son ido , una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a p o r un d e c o d ifica d o r de d o m in io de tiem p o , q ue com p re nd e : c la s if ica r la s ín te s is de la e xc itac ión de d o m in io de tie m p o d e c o d ifica d a en uno de un n úm e ro de ca te go rías ; c o n v e rtir la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en una e xc ita c ió n de d o m in io de fre cu e n c ia ; m o d ific a r la e xc ita c ió n de d o m in io de fre cu e n c ia en fu n c ió n de la ca te g o ría en la q ue se c la s ifica la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d eco d ifica d a ; c o n v e rtir la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a en una e xc ita c ió n de d o m in io del t ie m p o m o d ificad a ; y s in te tiz a r la e xc ita c ió n de d o m in io de tie m p o m o d ifica d a para p ro d u c ir una s ín te s is m o d ifica d a de la e xc itac ión de d o m in io de tie m p o d eco d ifica d a . La m o d ifica c ió n de la e xc ita c ió n de d o m in io de fre cu e n c ia p uede c o m p re n d e r el cá lcu lo de una fre cu e n c ia de co rte d onde una co n trib u c ió n de e xc ita c ió n de d o m in io de tie m p o d e ja de usa rse ; p o n e r a ce ro la e xc ita c ió n del d o m in io de fre cu e n c ia p o r e n c im a de la fre cu e n c ia de corte ; y n o rm a liza r la e xc itac ión de d o m in io de fre cu e n c ia p or d e b a jo de la fre cu e n c ia de co rte para p ro d u c ir una e xc itac ión de d o m in io de fre cu e n c ia no rm a lizad a .
Las c a ra c te rís tica s a n te rio re s y o tras del d isp o s itivo y m é to d o para m o d ific a r la s ín te s is de una e xc ita c ió n de d om in io de tie m p o se harán m ás e v id e n te s al lee r la s ig u ie n te d e sc rip c ió n no re s tr ic tiva , d ada a m o do de e je m p lo no lim ita tivo con re fe re n c ia a los d ib u jo s a co m pa ñ an te s .
B re ve d e sc rip c ió n de los d ib u jos
En los d ib u jo s ad jun tos :
La fig u ra 1 es un d ia g ra m a e sq u e m á tico s im p lif ica d o q ue m u e s tra la m o d ifica c ió n de un d e c o d ifica d o r C E LP para la m e jo ra de tra m a s so rd a s in a c tiva s y activas ;
La fig u ra 2 es un d ia g ra m a e sq u e m á tico d e ta lla d o q ue m u e s tra la m o d ifica c ió n del d e c o d ifica d o r C E LP para la m e jo ra de tra m a s so rd a s in a c tiva s y activas ;
La fig u ra 3 es un d ia g ra m a e sq u e m á tico s im p lif ica d o q ue m u e s tra la m o d ifica c ió n de un d e c o d ifica d o r C E LP para m e jo ra r las tra m a s de a ud io g en é rica s ; y
La fig u ra 4 es un d ia g ra m a e sq u e m á tico d e ta lla d o q ue m u e s tra la m o d ifica c ió n del d e c o d ifica d o r C E LP para la m e jo ra de tra m a s de a ud io g en érica s .
D e sc rip c ió n
La p re se n te d ivu lg a c ió n se re fie re a un e n fo q u e para im p le m e n ta r en el lad o del d e c o d ifica d o r una d e co d ifica c ió n m u ltim o d a l de m o do q ue se m a n te n g a la in te ro p e ra b ilid a d y se in c re m e n te la ca lid ad p erc ib ida . En la d ivu lga c ió n , a u n q u e A M R -W B co m o se d e sc rib e en la re fe re n c ia [3 G P P T S 26.190 , "A d a p tive M u lti-R a te - W id e b a n d (A M R -W B ) speech codec; T ra n sco d in g fu n c tio n s ] se u tiliza com o e je m p lo ilus tra tivo , d ebe te n e rse en cu e n ta q ue e ste e n fo q u e ta m b ié n se p uede a p lic a r a o tro s tip o s de d e co d ifica d o re s so n o ro s de ta sa b a ja de bits.
En re fe re n c ia a la fig u ra 1, para lo g ra r e sta d e co d ifica c ió n m u ltim o d a l, un d e c o d ifica d o r 102 de e xc ita c ió n de d o m in io de t ie m p o p rim e ro d e co d ifica co m p le ta m e n te el flu jo 101 de b its rec ib ido , p o r e je m p lo el f lu jo de b its A M R -W B , para o b te n e r una e xc ita c ió n d e co d ifica d a de p red icc ió n linea l con e xc ita c ió n de có d ig o (C E L P ) co m p le ta de d o m in io de tie m p o . La e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a se p ro ce sa a tra vé s de un filtro 103 de s ín te s is de p red icc ió n line a l (L P ) p ara o b te n e r una s ín te s is de d o m in io de tie m p o de la señ a l de s o n id o /so n o ra a la fre cu e n c ia de m u es tre o in te rn a del d e co d ifica d o r. P ara A M R -W B , esta fre cu e n c ia de m u e s tre o in te rn a es de 12.8 kHz, pero para o tro cód ec p od ría se r d ife ren te .
La s ín te s is de d o m in io de tie m p o de la tra m a a c tu a l del filtro 103 de s ín te s is LP se p roce sa a tra vé s de un c la s if ica d o r 104 -105 -106 -301 (fig u ra s 1, 2 y 3) su m in is tra d o con la in fo rm a c ió n 109 de d e te cc ió n de a c tiv id a d de vo z (V A D ) del f lu jo 101 de bits. El c la s if ica d o r 104 -105 -106 -301 a na liza y ca te g o riza la s ín te s is de d o m in io de tie m p o b ien sea com o so n o rid a d inac tiva , so n o rid a d de v o z activa , so n o rid a d so rda activa , o a ud io g en é rico . La so n o rid a d in a c tiva (d e te c ta d a en 1051 ) inc lu ye to d o s los ru idos de fo n d o e n tre la rá fag a son ora , la so n o rid a d de vo z a c tiva (d e te c ta d a en 1061) re p re se n ta una tra m a d u ra n te una rá fag a so n o ra a c tiva q ue tie n e ca ra c te rís tic a s de voz, la so n o rid a d so rda a c tiva (d e te c ta d a en 1062) re p re se n ta una tra m a d u ra n te una rá fag a so n o ra que tie n e ca ra c te rís tic a s so rdas, y el a ud io g e n é rico (d e te c ta d o en 3010 ) re p re se n ta m ú s ica o son o rida d re ve rbe ra n te . Se pueden a g re g a r o d e riv a r o tras c a te g o ría s de las ca te g o ría s an te rio res . El e n fo q u e d ivu lg a d o a p u n ta a m e jo ra r en p articu la r, pero no e xc lus ivam en te , la ca lid ad p e rc ib id a de la so n o rid a d inac tiva , la son o rida d so rda a c tiva y el a ud io g enérico .
U na ve z q ue se d e te rm in a la ca te g o ría de la s ín te s is de d o m in io de tiem p o , un c o n v e rtid o r /m o d ific a d o r 107 co n v ie rte la e xc ita c ió n d e co d ifica d a del d e c o d ifica d o r 102 de e xc ita c ió n de d o m in io de tie m p o en d o m in io de fre cu e n c ia usa nd o una tra n s fo rm a c ió n de fre cu e n c ia sin su p e rp o s ic ió n . T a m b ié n se p uede u sa r una tra n s fo rm a c ió n de sup e rp o s ic ió n , pero im p lica un a u m e n to del re tra so de e x tre m o a e x tre m o q ue no es d e se a b le en la m a yo ría de los casos. La re p re se n ta c ió n de fre cu e n c ia de la e xc ita c ió n se d iv id e en d ife re n te s b an da s de fre cu e n c ia en el c o n v e rtid o r /m o d ific a d o r 107. Las b an da s de fre cu e n c ia pueden te n e r un ta m a ñ o fijo , pueden b a sa rse en ban da s c rít ica s [J. D. Joh ns ton , "T ra n s fo rm cod ing o f a ud io s ign a l u s ing p e rce p tu a l no ise c rite r ia ," IE E E J. S e lec t. A re as C o m m u n ., vol. 6, págs. 314 -323 , fe b re ro de 1988], o cu a lq u ie r o tra com b in a c ió n . Luego , la e n e rg ía p o r b an da se c a lcu la y se g u a rd a en la m e m o ria en el co n v e rtid o r /m o d ific a d o r 107 para su uso d e sp u é s del p roce so de re m o d e la c ió n p ara g a ra n tiz a r q ue la m o d ifica c ió n no a lte ra el n ive l de e n e rg ía g lo b a l de la tra m a .
La m o d ifica c ió n de la e xc ita c ió n de d o m in io de fre cu e n c ia re a liza d a p o r el co n v e rtid o r /m o d ific a d o r 107 p uede d ife rir con la c la s ifica c ió n de la s ín tes is . P ara la so n o rid a d in a c tiva y la son o rida d so rda activa , la re m o d e la c ió n puede c o n s is t ir en una n o rm a liza c ió n de las ba jas fre cu e n c ia s con una a d ic ión de ru ido y la su s titu c ió n del co n te n id o de a lta fre cu e n c ia con so lo ru ido . U na fre cu e n c ia de co rte de la s ín tes is de d o m in io del t ie m p o d eco d ifica d a , el lím ite e n tre b a ja y a lta fre cu e n c ia , se p uede fija r en un v a lo r de a lre d e d o r de 1 a 1.2 kHz. P arte del co n te n id o de ba ja fre cu e n c ia de la s ín te s is d e co d ifica d a de d o m in io de tie m p o se m a n tie n e p ara e v ita r a rte fa c to s cu a n d o se co n m u ta e n tre una tra m a no m o d ifica d a y una tra m a m o d ificad a . T a m b ié n es p os ib le h a ce r q ue la fre cu e n c ia de co rte sea va r ia b le de tra m a a tra m a e lig ie n d o un se g m e n to de fre cu e n c ia en fu n c ió n del to n o d e co d ifica d o del d e c o d ifica d o r 102 de e xc ita c ió n de d o m in io de tie m p o . El p roce so de m o d ifica c ió n tie n e el e fe c to de e lim in a r el tip o de ru ido e lé c trico a so c ia d o con el có d e c so n o ro de ta sa ba ja de bits. D e sp u é s del p roce so de m o d ifica c ió n , se a p lica una g a n a n c ia de e m p a re ja m ie n to p or b an da de fre cu e n c ia para re c u p e ra r el n ive l de e n e rg ía in ic ia l p o r b an da de fre cu e n c ia con un lig e ro a u m e n to de la e n e rg ía p ara las fre cu e n c ia s su p e rio re s a 6 kH z p ara c o m p e n s a r una ca íd a de g a n a n c ia del filtro LP en esa s fre cu e n c ia s .
P ara una tra m a c a te g o riza d a com o a ud io g en é rico , el p ro ce sa m ie n to en el co n v e rtid o r /m o d ific a d o r 107 es d ife rente . P rim e ro , la n o rm a liza c ió n se re a liza p o r b an da de fre cu e n c ia p ara to d a s las bandas. En la o p e ra c ió n de n o rm a lizac ió n , to d o s los se g m e n to s d e n tro de una b an da de fre cu e n c ia q ue e s tán p or d e b a jo de una fra cc ió n del v a lo r de fre cu e n c ia m á x im o d en tro de la b anda se e s ta b le ce n en cero. P ara b an da s de fre cu e n c ia m ás a ltas, se ponen a ce ro m ás se g m e n to s p o r banda . E sto s im u la un e sq u e m a de cu a n tifica c ió n de fre cu e n c ia con un p re su p u e s to de bits a lto, pero con m á s bits a s ig n a d o s a las fre cu e n c ia s m ás bajas. D e sp u é s del p roce so de n o rm a liza c ió n , se p uede a p lic a r un re llen o de ru ido p ara re e m p la za r los se g m e n to s a ce ro con ru ido a le a to rio , pero, d e p e n d ie n d o de la ta sa de bits, el re llen o de ru ido no s ie m p re se usa. D e sp u é s del p roce so de m o d ifica c ió n , se a p lica una g a n a n c ia de e m p a re ja m ie n to p o r b anda de fre cu e n c ia para re c u p e ra r el n ive l de e n e rg ía in ic ia l p o r b an da de fre cu e n c ia y se a p lica una corre cc ió n de in c lin a c ió n seg ún la ta s a de b its a lo la rg o de la b anda de fre cu e n c ia p ara c o m p e n s a r la su b e s tim a c ió n s is te m á tica del f iltro LP en caso de e n tra d a de a ud io g en érica . O tra d ife re n c ia c ió n p ara el tra ye c to de a ud io g e n é rico p ro v ie n e del h echo de q ue la g a n a n c ia de e m p a re ja m ie n to no se a p lica a to d o s los se g m e n to s de fre cu e n c ia . D eb ido a q ue el
e sp e c tro del a ud io g e n é rico es u su a lm e n te m á s in te nso q ue el de la son o rid a d , la ca lid ad p e rc ib id a m e jo ra cu a n d o es p o s ib le id e n tif ic a r p u lsos e sp e c tra le s y p o n e r c ie rto é n fa s is al re specto . P ara hacerlo , la g a n a n c ia de e m p a re ja m ie n to co m p le ta con la co rre cc ió n de inc lin a c ió n se a p lica so lo a los s e g m e n to s de e n e rg ía m ás a lto s d e n tro de una b anda de fre cu e n c ia . P ara los se g m e n to s de e n e rg ía m ás bajos, so lo se a p lica una fra cc ió n de la g a n a n c ia de e m p a re ja m ie n to a eso s seg m en tos . E s to da com o re su lta d o un a u m e n to de la d in á m ica espectra l.
D e sp u é s de la re m o d e la c ió n de la fre cu e n c ia de e xc ita c ió n y la g a n a n c ia de e m p a re ja m ie n to , el c o n v e rtid o r /m o d ific a d o r 107 a p lica una tra n s fo rm a c ió n de fre cu e n c ia in ve rsa para o b te n e r la e xc ita c ió n de d o m in io de tie m p o m o d ificad a . E s ta e xc ita c ió n m o d ifica d a se p roce sa a tra vé s del f iltro 108 de s ín te s is LP para o b te n e r una s ín te s is de d o m in io del t ie m p o m o d ificad a . Un s o b re sc r ito r 110 s im p le m e n te so b re sc r ib e la s ín te s is d e co d ifica d a de d o m in io de tie m p o del f iltro 103 de s ín te s is LP con la s ín te s is m o d ifica d a de d o m in io de tie m p o del f iltro 108 de s ín tes is LP d e p e n d ie n d o de la c la s if ica c ió n de la s ín te s is d e co d ifica d a de d o m in io de tie m p o a n tes de la ú ltim a d e sa ce n tu a c ió n y re m u e s tre o a 16 kH z (p a ra el e je m p lo de A M R -W B ) en un filtro y re m u e s tre a d o r 112 q ue e n fa tiza el én fas is .
En ca so de so n o rid a d inac tiva , la ún ica d ife re n c ia en c o m p a ra c ió n con la m o d ifica c ió n de so n o rid a d so rda a c tiva es el uso de un su a v iz a d o r 111 para s u a v iz a r el f iltro 108 de s ín te s is LP para p ro p o rc io n a r una va r ia c ió n de ru ido m ás suave. Las m o d ifica c io n e s re s ta n te s son las m ism a s q ue para el tra ye c to so rdo activo. En el s ig u ie n te te x to se d e sc rib e un e je m p lo m ás d e ta lla d o de im p le m e n ta c ió n del e n fo q u e d ivu lg a d o con re fe re n c ia a la fig u ra 2.
1) C la s ifica c ió n de seña l
C on re fe re n c ia a la fig u ra 2, el c la s if ica d o r 104 -105 -106 -301 re a liza en el d e c o d ifica d o r una c la s ifica c ió n de la s ín tes is 1021 de d o m in io de tie m p o de la señ a l de so n id o /so n o ra com o se d e sc rib e a n te r io rm e n te para las ta sa s de b its d on de se a p lica la m o d ificac ión . P ara s im p lif ic a r los d ibu jos , el filtro 103 de s ín te s is LP no se m u e s tra en la fig u ra 2. La c la s if ica c ió n en el d e c o d ifica d o r es s im ila r a la d e sc rita en las re fe re n c ia s [M ilan J e lin e k y P h ilip p e G o u rna y ; so lic itud de p a te n te P C T W O 03102921 A 1, "A m e th od and d ev ice fo r e ffic ie n t fra m e e ra su re co n c e a lm e n t in lin e a r p re d ic tive based speech co d e cs "] y [T .V a illa n c o u rt e t al., so lic itu d de p a ten te P C T W O 2007073604 A 1, "M e th o d and d e v ice fo r e ffic ie n t fra m e e ra su re co n c e a lm e n t in spe ech cod ecs"], m á s a lg u n a s a d a p ta c io n e s para la d e te cc ió n de aud io g en é rico . Los s ig u ie n te s p a rá m e tro s se u tilizan para la c la s ifica c ió n de las tra m a s en el d e co d ifica d o r: una co rre lac ión n o rm a liza d a rx, una m e d id a de inc lin a c ió n e sp e c tra l et, un c o n ta d o r de e s ta b ilid a d de to n o pc, una e n e rg ía de tra m a re la tiva de la seña l de so n id o al fina l de la tra m a a c tu a l Es, y un c o n ta d o r de c ru ce p o r ce ro zc. El cá lcu lo de e stos p a rá m e tro s q ue se u tilizan para c la s if ica r la señ a l se e xp lica a con tinu ac ión .
La co rre la c ió n rx n o rm a liza d a se ca lcu la al fin a l de la tra m a con base en la s ín te s is de d o m in io del tie m p o de señ a l de so n id o /so n o ra Ssaiida(n). S e u tiliza el re ta rdo de to n o de la ú ltim a su b tra m a del d e c o d ifica d o r 102 de e xc ita c ió n de d o m in io del tiem p o . M ás e sp e c ífica m e n te , la co rre la c ió n rx n o rm a liza d a ca lcu la el to n o s in c ró n ic a m e n te de la s ig u ie n te m anera :
d o n d e x (n ) = Ssaida(n), T es el re ta rdo de to n o de la ú ltim a sub tram a , t= L -T , y L es el ta m a ñ o de la tra m a . Si el re ta rdo de to n o de la ú ltim a su b tra m a es m a yo r que 3 N /2 (N es el ta m a ñ o de la sub tram a), T se e s ta b le ce en el re ta rd o de to n o p ro m e d io de las ú ltim a s dos sub tram as .
P o r lo tan to , la co rre la c ió n rx n o rm a liza d a se ca lcu la u tilizan do la s ín te s is de d o m in io del t ie m p o de seña l de so n id o /so n o ra Ssaida(n). P ara re ta rd o s de to n o m á s b a jos q ue el ta m a ñ o de la su b tra m a (64 m u es tra s), la co rre la c ió n n o rm a liza d a se ca lcu la d os ve ce s en in s ta n te s t= L -T y t= L -2 T , y la co rre la c ió n rx n o rm a liza d a se da co m o el p rom ed io de e s to s d os cá lcu los .
El p a rá m e tro et de in c lin a c ió n e sp e c tra l co n tie n e la in fo rm a c ión sob re la d is trib u c ió n de fre cu e n c ia de la ene rg ía . C om o e je m p lo no lim ita tivo , la in c lin a c ió n e sp e c tra l en el d e c o d ifica d o r se e s tim a co m o el p rim e r co e fic ie n te de a u to co rre la c ió n n o rm a liza d o de la s ín te s is de d o m in io de tiem p o . Se ca lcu la con base en las ú ltim a s 3 su b tra m a s com o:
d o n d e x (n ) = Ssaiida(n) es la señ a l de s ín te s is de d o m in io de tiem p o , N es el ta m a ñ o de la su b tra m a y L es el ta m a ñ o de la tra m a (N = 64 y L = 256 en el e je m p lo de A M R -W B ).
El c o n ta d o r de e s ta b ilid a d de to n o pc e va lú a la va r ia c ió n del p e río do de ton o . Se ca lcu la en el d e c o d ifica d o r de la s ig u ie n te m anera :
Los v a lo re s p0 , p - p2 y p3 co rre sp o n d e n al re ta rd o de to n o de c ircu ito ce rra d o de las 4 su b tra m a s de la tra m a actua l (en el e je m p lo de A m R -W B).
La e n e rg ía Es de tra m a re la tiva se ca lcu la com o una d ife re n c ia e n tre la e n e rg ía de tra m a a c tu a l Ef en dB y su p rom ed io Eit a la rgo p lazo
d o n d e la e n e rg ía de tra m a E f a c tu a l es la e n e rg ía de la s ín tes is de d o m in io de tie m p o Ssaida(n) en dB d e to n o ca lcu la d o s in c ró n ic a m e n te al fin a l de la tra m a com o
d o n d e L = 256 (en el e je m p lo de A M R -W B ) es la lon g itu d de la tra m a y T es el re ta rdo de to n o p ro m e d io de las ú ltim a s d os sub tram as . Si T es m e n o r q ue el ta m a ñ o de la sub tram a, e n to n ce s T se e s ta b le ce en 2 T (la e n e rg ía ca lcu la d a u tiliza n d o dos p e río d o s de to n o p ara re ta rd o s de to n o cortos).
La e n e rg ía p ro m e d io a la rgo p lazo se a c tu a liza en las tra m a s de so n o rid a d a c tiva s u tiliza n d o la s ig u ie n te re lac ión :
E „ = 0.99 E H 0,01 E , (6)
El ú ltim o p a rá m e tro es el c o n ta d o r de c ru ce p or ce ro zc c a lcu la d o en una tra m a de la s ín te s is de d o m in io del t ie m p o Ssaida(n). C om o e je m p lo no lim ita tivo , el c o n ta d o r de c ru ce p or ce ro zc cu e n ta el n ú m e ro de ve ce s q ue el s ig n o de la s ín te s is de d o m in io de tie m p o ca m b ia de p o s itivo a n eg a tivo d u ra n te ese in te rva lo .
P ara h a ce r la c la s ifica c ió n m á s robusta , los p a rá m e tro s de c la s ifica c ió n se co n s id e ra n ju n to s fo rm a n d o una fu n c ió n de m é rito fm . P ara ese p rop ó s ito , los p a rá m e tro s de c la s if ica c ió n se e sca la n p rim e ro u sa nd o una fu n c ió n lineal. C o n s id e re m o s un p a rá m e tro px, su ve rs ió n e sca la d a se o b tie n e usando :
El c o n ta d o r de e s ta b ilid a d de to n o e sca la d o pc se re co rta e n tre 0 y 1. Los co e fic ie n te s de fu n c ió n kp y cp se han e n co n tra d o e xp e rim e n ta lm e n te p ara cad a uno de los p a rá m e tros . Los va lo re s u tiliza d o s en e ste e je m p lo de im p le m e n ta c ió n se re sum e n en la ta b la 1:
T a b la 1. P a rá m e tro s de c la s if ica c ió n de tra m a en el d e c o d ifica d o r y los co e fic ie n te s de sus re sp e c tiva s fu n c io n e s de e sca la
La fu n c ió n del m é rito se d e fin e com o:
d o n d e el su p e rín d ice s ind ica la ve rs ió n a e sca la de los p a rá m e tros .
La c la s ifica c ió n de las tra m a s se re a liza u tiliza n d o la fu n c ió n de m é rito fm y s ig u ie n d o las re g la s re su m id a s en la ta b la 2:
T a b la 2: R eg las de c la s ifica c ió n de señ a le s en el d e co d ifica d o r
A d e m á s de e sta c las ifica c ión , la in fo rm a c ió n 109 sob re la d e te cc ió n de a c tiv id a d de vo z (V A D ) p or el c o d ific a d o r puede tra n s m itirs e al flu jo 101 de b its (fig u ra 1) com o es el caso con el e je m p lo de A M R -W B . P o r lo tan to , se e nv ía un bit al f lu jo 101 de b its para e sp e c ifica r si el c o d ific a d o r co n s id e ra o no la tra m a a c tua l com o co n te n id o a c tivo (V A D = 1) o co n te n id o in a c tivo (ru id o de fondo , V A D = 0). C u a n d o la in fo rm a c ió n de V A D ind ica q ue el co n te n id o es inac tivo , la p o rc ió n de c la s if ica d o r 104, 105, 106 y 301 so b re sc r ib e la c la s ifica c ió n com o sorda.
El e sq u e m a de c la s if ica c ió n ta m b ié n inc lu ye una d e te cc ió n de a u d io g e n é rico (vé a se la p orc ión 301 del c la s if ica d o r de la fig u ra 3). La ca te g o ría de a u d io g e n é rico inc lu ye m ú sica , so n o rid a d re ve rb e ra n te y ta m b ié n p uede in c lu ir m ú sica de fon do . Un se g u n d o paso de c la s ifica c ió n p e rm ite al c la s if ica d o r 104 -105 -106 -301 d e te rm in a r con b uena con fia n za q ue la tra m a a c tua l p uede c a te g o riza rse com o a ud io g enérico . Se u tilizan d os p a rá m e tro s para re a liz a r e ste se g u n d o paso de c las ifica c ión . U no de los p a rá m e tro s es la e n e rg ía de tra m a Ef to ta l com o se fo rm u la en la e cu a c ió n (5).
P rim e ro , una m e d ia de las ú ltim a s cu a re n ta (40 ) v a r ia c io n e s to ta le s de e n e rg ía de tra m a Edf se ca lcu la u tiliza n d o la s ig u ie n te re lac ión :
Luego , se d e te rm in a una d e sv ia c ió n e s ta d ís tica del h is to ria l de v a r ia c ió n de e n e rg ía oe en las ú ltim a s q u in ce (15) tra m a s u tiliza n d o la s ig u ie n te re lac ión :
La d e sv ia c ió n oe re su lta n te da una ind icac ión so b re la e s ta b ilid a d e n e rg é tica de la s ín te s is d eco d ifica d a . T íp ica m e n te , la m ú s ica tie n e una m a yo r e s ta b ilid a d e n e rg é tica (m e n o r d e sv ia c ió n e s ta d ís tica del h is to ria l de va r ia c ió n de e n e rg ía ) q ue la sonora .
A d e m á s, la c la s ifica c ió n del p rim e r paso se usa para e va lu a r el in te rva lo e n tre d os tra m a s c la s if ica d a s com o N uv so rd a s cu a n d o la e n e rg ía de la tra m a Ef, com o se fo rm u la en la e cu ac ió n (5 ) es s u p e r io r a -12d B . C u a n d o una tra m a se c la s if ica com o so rda y la e n e rg ía de la tra m a Ef es m a yo r q ue -9 dB , lo q ue s ig n ifica q ue la señ a l es so rda pero no s ile n c io sa , si la e n e rg ía son o ra a c tiva a la rgo p lazo Elt, com o se fo rm u la en la e cu a c ió n (6), e stá p or d e b a jo de 40dB el c o n ta d o r de in te rva lo s so rd o s se e s ta b le ce en 16, de lo con tra rio , el N uv del c o n ta d o r de in te rva lo s so rd o s se reduce en 8. El N uv del c o n ta d o r ta m b ié n e stá lim ita d o e n tre 0 y 300 p ara la señ a l so n o ra a c tiva y e n tre 0 y 125 para la seña l so n o ra inac tiva . Se re cu e rd a que, en el e je m p lo ilus tra tivo , la d ife re n c ia e n tre la seña l so n o ra a c tiva e in a c tiva puede d e d u c irse de la in fo rm a c ió n v A d de d e te cc ió n de a c tiv id a d de vo z in c lu id a en el flu jo 101 de bits.
Se d e riva un p ro m e d io a la rgo p lazo de e ste c o n ta d o r de tra m a so rda de la s ig u ie n te m a n e ra para la señ a l son o ra activa:
Y de la s ig u ie n te m a n e ra para la señ a l so n o ra inactiva :
N = 0.9 5 -AT ( 12)
A d e m á s, cu a n d o el p rom ed io a la rgo p lazo es m u y a lto y la d e sv ia c ió n g e es a lta, p o r e je m p lo cu a n d o Nuvit> 140 y g e> 5 en el e je m p lo a c tu a l de im p le m e n ta c ió n , el p rom ed io a la rgo p lazo se m o d ifica de la s ig u ie n te m anera :
= 0.2- A ^ 80 (13)
El c la s if ica d o r 104 -105 -106 -301 u tiliza e ste p a rá m e tro en p ro m e d io a la rgo p lazo del n ú m e ro de tra m a s e n tre tra m a s c la s if ica d a s com o so rd a s para d e te rm in a r si la tra m a d ebe c o n s id e ra rse com o a ud io g e n é rico o no. C u a n to m ás se a ce rq ue n las tra m a s so rd a s en el t ie m p o , m ás p ro b a b le es que la tra m a te n g a c a ra c te rís tica s so n o ra s (m e n o s p rob a b le a u d io g en é rico ). En el e je m p lo ilus tra tivo , el u m bra l para d e c id ir si una tra m a se co n s id e ra co m o a ud io g e n é rico G a se d e fin e de la s ig u ie n te m anera :
A L
El p a rá m e tro d e fin id o en la e cu a c ió n (9), se a g re g a p ara no c la s if ica r g ra n d e s v a r ia c io n e s de e n e rg ía com o a u d io g enérico , s ino para m a n te n e rlo com o so n o ra activa .
La m o d ifica c ió n re a liza d a en la e xc ita c ió n d e p e n d e de la c la s ifica c ió n de la tra m a y para a lgún tip o de tra m a s no hay m o d ifica c ió n en a bso lu to . La s ig u ie n te ta b la 3 re su m e el caso en el q ue se p uede re a liz a r una m o d ifica c ió n o no.
T a b la 3: C a te g o ría de señ a l para m o d ifica c ió n de e xc ita c ió n
* La ca te g o ría de a ud io g e n é rico p uede m o d ifica rse o no d e p e n d ie n d o de la im p le m e n ta c ió n . P o r e je m p lo , el aud io g e n é rico p uede m o d ifica rse so lo cu a n d o e stá inac tivo , o el a ud io g e n é rico p uede m o d ific a rse so lo cu a n d o está activo, to d o el t ie m p o o nada.
2 ) T ra n s fo rm a c ió n de fre cu e n c ia
D u ra n te la fa se de m o d ifica c ió n del d o m in io de fre cu e n c ia , la e xc ita c ió n n eces ita se r re p re se n ta d a en el d o m in io de tra n s fo rm a c ió n . P o r e jem p lo , la co n ve rs ió n de tie m p o a fre cu e n c ia se log ra m e d ia n te un co n v e rtid o r 201 de d om in io del tie m p o a fre cu e n c ia del c o n v e rtid o r /m o d ific a d o r 107 u sando una D C T tip o II (tra n s fo rm a c ió n d isc re ta de co se n o ) q ue p ro p o rc io n a una re so lu c ió n de fre cu e n c ia de 25 Hz pero cu a lq u ie r o tra tra n s fo rm a c ió n a d e cu a d a puede se r usada. En ca so de q ue se u tilice o tra tra n s fo rm a c ió n , la re so lu c ió n de fre cu e n c ia (d e fin id a a n te rio rm e n te ), el n úm e ro de b a n d a s de fre cu e n c ia y el n ú m e ro de s e g m e n to s de fre cu e n c ia p o r b an da s (d e fin id o s m ás a d e la n te ) pueden n e ce s ita r una re v is ió n en co n se cu e n c ia . La re p re se n ta c ió n de fre cu e n c ia de la e xc ita c ió n C E LP de d o m in io del t ie m p o fe ca lcu la d a en el c o n v e rtid o r 201 de d o m in io del t ie m p o a fre cu e n c ia se da a con tinu ac ión :
d o n d e ew(n) es la e xc ita c ió n C E LP de d o m in io de tie m p o y L es la lon g itu d de la tra m a . En el e je m p lo de A M R -W B , la lon g itu d de la tra m a es de 256 m u e s tra s para una fre cu e n c ia de m u e s tre o in te rn a co rre sp o n d ie n te de 12.8 kHz.
En un d e c o d ifica d o r C E LP de d o m in io de tie m p o ta l com o 102, la señ a l de e xc ita c ió n de d o m in io de tie m p o v ie n e d ada p o r
e ,d ( « ) = b v ( n ) g c ( n ) (15)
d o n d e v (n ) es la co n trib u c ió n del lib ro de có d ig o s a da p ta tivo , b es la g a n a n c ia del lib ro de có d ig o s ada p ta tivo , c (n ) es la co n trib u c ió n fija del lib ro de cód igos , g es la g a n a n c ia fija del lib ro de cód igos.
3) A n á lis is de e n e rg ía p or banda
A n te s de cu a lq u ie r m o d ifica c ió n de la e xc ita c ió n de d o m in io de tie m p o , el co n v e rtid o r /m o d ific a d o r 107 co m p re n d e una ca lc u la d o ra 208 -209 -210 de g a n a n c ia que in c lu ye una su b ca lc u la d o ra 209 p ara ca lc u la r la e n e rg ía p o r b an da Eb de la e xc ita c ió n de d o m in io de fre cu e n c ia y m a n tie n e la e n e rg ía c a lcu la d a p o r b anda Eb en m e m o ria para el a ju s te de e n e rg ía d e sp u é s de la re m o d e la c ió n del e sp e c tro de exc itac ión . P ara una fre cu e n c ia de m u e s tre o de 12.8 kHz, la e n e rg ía p uede se r ca lcu la d a p o r la s u b ca lcu la d o ra 209 de la s ig u ie n te m anera :
d o n d e CBb re p re se n ta los s e g m e n to s de fre cu e n c ia a cu m u la d o s p o r b an da y Bb el n ú m e ro de s e g m e n to s p or banda de fre cu e n c ia d e fin id o s com o:
Las b a n da s de ba ja fre cu e n c ia pueden co rre sp o n d e r a las b an da s de a ud io c rítica s com o se d e sc rib e en [M ilan Je lin e k y P h ilip p e G o u rna y . La so lic itu d de p a te n te P C T W O 03102921 A 1, "A m e th od and d ev ice fo r e ffic ie n t fra m e e ra su re c o n c e a lm e n t in lin e a r p re d ic tive based speech cod ecs"], pero las b an da s de fre cu e n c ia p o r e n c im a de 3700 Hz pueden se r un poco m ás co rta s para ig u a la r m e jo r la p os ib le v a r ia c ió n de e n e rg ía e sp e c tra l en esa s bandas. C u a lq u ie r o tra c o n fig u ra c ió n de b a n d a s e sp e c tra le s ta m b ié n es pos ib le .
4 ) M o d ifica c ió n de e xc ita c ió n para tra m a s so rd a s in a c tiva s y a c tiva s
A ) F re cu e n c ia de co rte de la co n trib u c ió n de d o m in io de tie m p o fre n te a re llen o de ru ido
P ara lo g ra r una co n m u ta c ió n tra n s p a re n te e n tre la e xc ita c ió n no m o d ifica d a y la e xc ita c ió n m o d ifica d a p ara tra m a s in a c tiva s y tra m a s so rda s a ctivas , se m a n tien e n al m e n o s las fre cu e n c ia s m ás b a jas de la co n trib u c ió n de e xc ita c ió n de d o m in io de tie m p o . El co n v e rtid o r /m o d ific a d o r 107 co m p re n d e una ca lc u la d o ra 203 de fre cu e n c ia de co rte para d e te rm in a r una fre cu e n c ia en la q ue la co n trib u c ió n de d o m in io de tie m p o d e ja de usa rse , la fre cu e n c ia de co rte fc, q ue tie n e un v a lo r m ín im o de 1.2 kHz. E sto s ig n ifica q ue los p rim e ro s 1.2 kH z de la e xc ita c ió n d e co d ifica d a se m a n tien e n s ie m p re y, d e p e n d ie n d o del v a lo r de to n o d e co d ifica d o del d e c o d ifica d o r 102 de e xc ita c ió n de d o m in io de tie m p o , e sta fre cu e n c ia de co rte p uede se r m ayo r. El o c ta vo a rm ó n ico se ca lcu la a p a rtir del to n o m ás ba jo de to d a s las s u b tra m a s y la co n trib u c ió n de d o m in io de tie m p o se m a n tie n e h as ta e ste o c ta vo a rm ó n ico . U na e s tim a c ió n del o c ta vo a rm ó n ico se ca lcu la de la s ig u ie n te m anera :
d o n d e Fs = 12800 Hz, Nsub es el n úm e ro de s u b tra m a s y T es el to n o de su b tra m a d e co d ifica d o . P ara to d o i <Nb d onde Nb es la b an da de fre cu e n c ia m á x im a in c lu id a en el ra ng o de fre cu e n c ia Lf, se re a liza una ve rific a c ió n p ara e n co n tra r la b anda en la q ue se u b ica el o c ta vo a rm ó n ico b uscan do la b an da m ás a lta p ara la cua l aún se ve r ific a la s ig u ie n te d es ig u a ld a d :
d o n d e Lf se d e fine com o:
_ Í175, 275, 375, 475, 600,750,900,1050,1250,1450,1700,1975,'
7 ~ [2300,2675, 3125, 3675, 4075,4475, 4975, 5475, 5975, 6375 ’
El índ ice de esa b anda de fre cu e n c ia en Lf se lla m a rá /octavo e ind ica la b an da de fre cu e n c ia d on de es p ro b a b le q ue se u b iq u e el o c ta vo a rm ó n ico . La c a lcu la d o ra 203 de fre cu e n c ia de co rte c a lcu la d o ra ca lcu la la fre cu e n c ia de co rte fina l ftc com o la fre cu e n c ia m ás a lta e n tre 1.2 kH z y la ú ltim a fre cu e n c ia de la b an da de fre cu e n c ia s en la q ue es p rob a b le q ue se u b iq u e el o c ta vo a rm ó n ico (Lf(/octavo)), u sa nd o la s ig u ie n te re lac ión :
B) N o rm a liza c ió n y re llen o de ru ido.
El co n v e rtid o r /m o d ific a d o r 107 co m p re n d e a d e m á s un ce ro 204 que p one a ce ro los se g m e n to s de fre cu e n c ia de las b a n d a s de fre cu e n c ia p o r e nc im a de la fre cu e n c ia de co rte fc.
P ara las tra m a s ina c tiva s y las tra m a s so rd a s activas , un n o rm a liz a d o r 205 del co n v e rtid o r /m o d ific a d o r 107 n o rm a liza los s e g m e n to s de fre cu e n c ia p o r d eb a jo de fc de las b an da s de fre cu e n c ia de la re p re se n ta c ió n de fre cu e n c ia de la e xc ita c ió n fe C E LP del d o m in io del t ie m p o e n tre [0, 4 ] u sa nd o la s ig u ie n te re lac ión :
E n to nce s, el c o n v e rtid o r /m o d ific a d o r 107 co m p re n d e un g e n e ra d o r 206 de ru ido a le a to rio p ara g e n e ra r ru ido a le a to rio y se re a liza un re llen o de ru ido s im p le a tra vé s de un s u m a d o r 207 para a g re g a r ru ido sob re to d o s los s e g m e n to s de fre cu e n c ia a un n ive l con s ta n te . La fu n c ió n q ue d e sc rib e la a d ic ión de ru ido se d e fin e a co n tin u a c ió n com o:
d o n d e ry es un g e n e ra d o r de n ú m e ro s a le a to rio s q ue e stá lim itad o e n tre -1 y 1.
c) A n á lis is de e n e rg ía p o r b an da del e sp e c tro de e xc ita c ió n m o d ifica d o
La s u b ca lcu la d o ra 208 de la c a lcu la d o ra 208 -209 -210 de g a n a n c ia d e te rm in a la e n e rg ía p o r b anda d e sp u é s de la re m o d e la c ió n del e sp e c tro E b u sa nd o el m ism o m é to d o q ue se d e sc rib e en la secc ión 3 anterio r.
D ) E m p a re ja m ie n to de e n e rg ía
P ara tra m a s in a c tiva s y tra m a s so rda s activas , el e m p a re ja m ie n to de e n e rg ía co n s is te so lo en a ju s ta r la e n e rg ía por b an da d e sp u é s de la m o d ifica c ió n del e sp e c tro de e xc ita c ió n a su v a lo r in ic ia l. P ara cad a b an da i, la s u b ca lcu la d o ra 210 de la c a lcu la d o ra 208 -209 -210 de g a n a n c ia d e te rm in a una g a n a n c ia de e m p a re ja m ie n to Gb p ara a p lica r a to d o s los s e g m e n to s en la b anda de fre cu e n c ia para e m p a re ja r la e n e rg ía de la s ig u ie n te m anera :
d o n d e Eb(i) es la e n e rg ía p o r b anda a n tes de la m o d ifica c ió n del e sp e c tro de e xc ita c ió n co m o se d e te rm in a en la su b ca lc u la d o ra 209 u sa nd o el m é to d o de la se cc ió n 3 a n te r io r y E'b(i) es la e n e rg ía p o r b an da d e sp u é s de la m o d ifica c ió n del e sp e c tro de e xc ita c ió n com o se ca lcu la en la su b ca lc u la d o ra 208. P ara una b anda i e sp e c ífica , la
e xc ita c ió n m o d ifica d a (d e sn o rm a liza d a ) del d o m in io de fre cu e n c ia f com o lo d e te rm in a d o en la su b ca lcu la d o ra 210 p uede e sc rib irse com o:
d o n d e CBb y Bb se d e fine n en la se cc ió n 3 ante rio r.
5) M o d ifica c ió n de e xc ita c ió n para tra m a s de a ud io g e n é rica s
A ) N o rm a liza c ió n y re llen o de ru ido.
A h o ra se hará re fe re n c ia a la fig u ra 3. P ara las tra m a s de a ud io g e n é rica s seg ún lo d e te rm in a d o p o r la porc ió n 301 del c las ifica do r, la n o rm a liza c ió n es lig e ra m e n te d ife re n te y re a liza d a p o r un n o rm a liz a d o r 302. P rim ero , el fa c to r de n o rm a liza c ió n Nf ca m b ia de b anda a banda , u sa nd o un v a lo r m ás a lto. para b an da s de ba ja fre cu e n c ia y un v a lo r in fe rio r para b a n d a s de a lta fre cu e n c ia . La idea es p e rm itir una m a yo r a m p litu d en las b an da s de ba ja fre cu e n c ia d on de la u b icac ión de los p u lsos es m ás p rec isa y una a m p litud m ás b a ja en las b a n da s de a lta fre cu e n c ia d o n d e la u b icac ión de los p u lsos es m e no s p rec isa . En e ste e je m p lo ilus tra tivo , el fa c to r de n o rm a liza c ió n Nf v a r ia b le p o r b an da de fre cu e n c ia se d e fin e com o:
P ara una b an da i de fre cu e n c ia esp ec ífica , la n o rm a liza c ió n de la re p re se n ta c ió n de fre cu e n c ia de la e xc ita c ió n de d o m in io de tie m p o (e xc ita c ió n de d o m in io de fre cu e n c ia ) de tra m a s de a ud io g e n é rica s se p uede d e s c r ib ir de la s ig u ie n te m anera :
d o n d e Bb es el n úm e ro de se g m e n to s p o r b anda de fre cu e n c ia , los s e g m e n to s de fre cu e n c ia a cu m u la d a p o r ban da s es CBb y feN(j) es la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a lizad a . Bb y CBb se d esc rib e n en la se cc ión 3 anterio r.
A d e m á s, el n o rm a liz a d o r 302 co m p re n d e una re du cc ió n a ce ro (no m o s tra d o ) para p o n e r a ce ro to d o s los se g m e n to s de fre cu e n c ia p or d eb a jo de una fra cc ió n Zf del v a lo r m á x im o de feN(j) en cada b an da de fre cu e n c ia para o b te n e r feN(j):
d o n d e Zf se p uede re p re s e n ta r com o:
Se p uede re a liz a r una re du cc ió n a ce ro m ás a g re s iva a u m e n ta n d o el v a lo r del v e c to r Zf, si se d esea a u m e n ta r el p ico del e sp ec tro .
B) A n á lis is de e n e rg ía p or b anda del e sp e c tro de e xc ita c ió n m o d ifica d o
La p orc ión 303 de c a lcu la d o ra de una c a lcu la d o ra 303 -304 -306 de g a n a n c ia d e te rm in a la e n e rg ía p or b anda d e sp u é s de re m o d e la r el e sp e c tro E b u sa nd o el m ism o m é to d o q ue se d e sc rib e en la se cc ión 3 anterio r.
C ) E m p a re ja m ie n to de e n e rg ía
La fig u ra 3 m u e s tra la c a lcu la d o ra 303 -304 -306 de g a n a n c ia y la fig u ra 4 d e sc rib e con m ás d e ta lle la p o rc ión 306 de ca lc u la d o ra de e sta c a lcu la d o ra de ganancia .
P ara tra m a s de a u d io g en é rica s , el e m p a re ja m ie n to de e n e rg ía es m á s co m p lica d o ya q ue ta m b ié n a p u n ta a a u m e n ta r la d in á m ica e sp ec tra l. P ara cad a b an da i de fre cu e n c ia , una su b ca lc u la d o ra 413 de la p orc ión 306 de c a lcu la d o ra de
la c a lcu la d o ra 303 -304 -306 de g a n a n c ia ca lcu la una g a n a n c ia e s tim a d a Ge d e fin id a de m a n e ra s im ila r a la e cu ac ió n (22):
d o n d e Eb(i) es la e n e rg ía p o r b anda a n tes de la m o d ifica c ió n del e sp e c tro de e xc ita c ió n según lo d e te rm in a d o en la p o rc ió n 304 de la c a lcu la d o ra u sa n d o el m é to d o d e sc rito en la secc ión 3 a n te rio r, y E'b(i) es la e n e rg ía p o r banda d e sp u é s de la m o d ifica c ió n del e sp e c tro de e xc ita c ió n seg ún lo c a lcu la d o en la porc ió n 303 de ca lcu la do ra .
U na s u b ca lcu la d o ra 414 de la porc ió n 306 de c a lcu la d o ra a p lica la g a n a n c ia Ge a los p rim e ro s 400 Hz (o las p rim e ras 4 b a n d a s) de la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a feN del n o rm a liz a d o r 302 y el d iv is o r 401 -420 de e sp e c tro para p ro p o rc io n a r una e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a (d e s n o rm a liz a d a ) fedN u sa nd o la s ig u ie n te re lac ión :
Un b u sca d o r 404 d e te rm in a el v a lo r m á x im o maxa<j<b(|feN(j)|) p o r b anda i p o r e n c im a de 400 Hz, d o n d e a = CBb(i) y b = CBb(i) Bb(i) son d e fin id o s en la se cc ió n 3 ante rio r.
P ara las b a n d a s de fre cu e n c ia c o m p re n d id a s e n tre 400 Hz y 2 kH z (b a n d a s 4 a 12) de la e xc ita c ió n del d o m in io de fre cu e n c ia n o rm a liza d a (vé a n se los m ó d u lo s 420 y 450), si la e xc ita c ió n del d o m in io de fre cu e n c ia n o rm a liza d a en un se g m e n to de fre cu e n c ia f'eN(j) ^ 0.86 maxa<j<b(|feN(j)|) (vé a se el m ó d u lo 451), un a m p lif ic a d o r 402 a m p lifica la g a n a n c ia Ge de la s u b ca lcu la d o ra 413 p o r un fa c to r 1.1 co m o se m u e s tra en la línea s u p e r io r de la e cu a c ió n (28). U na su b ca lc u la d o ra 403 a p lica la g a n a n c ia a m p lif ica d a del a m p lif ic a d o r 402 a la e xc ita c ió n e sp e c tra l n o rm a liza d a fe N en el se g m e n to de fre cu e n c ia de a cu e rd o con la p rim e ra línea de la e cu a c ió n (28 ) para o b te n e r la e xc itac ión m o d ifica d a (d e s n o rm a liz a d a ) del d o m in io de fre cu e n c ia fedN.
U na ve z m ás, para las b a n d a s de fre cu e n c ia co m p re n d id a s e n tre 400 Hz y 2 kH z (b a n d a s 4 a 12) de la e xc itac ión de d o m in io de fre cu e n c ia n o rm a liza d a (vé a n se los m ó d u lo s 420 y 450), si la e xc itac ión de d o m in io de fre cu e n c ia n o rm a liza d a en un se g m e n to de fre cu e n c ia f'eN(j) < 0.86 maxa<j<b(|feN(j)|) (vé a se el m ó d u lo 451), un a te n u a d o r 405 a te n ú a la g a n a n c ia Ge de la su b ca lc u la d o ra 413 p or un fa c to r 0.86 com o se m u e s tra en la línea in fe rio r de la e cu ac ió n (28). U na s u b ca lcu la d o ra 406 a p lica la g a n a n c ia a te n u a d a del a te n u a d o r 405 a la e xc ita c ió n e sp e c tra l n o rm a liza d a f'eN en el se g m e n to de fre cu e n c ia de a cu e rd o con la línea in fe rio r de la e cu a c ió n (28 ) para o b te n e r la e xc ita c ió n m o d ifica d a (d e s n o rm a liz a d a ) del d o m in io de fre cu e n c ia fedN.
P ara resum ir, la e xc ita c ió n e sp e c tra l m o d ifica d a (d e sn o rm a liz a d a ) fedN se da de la s ig u ie n te m anera :
F in a lm e n te , para las partes m á s a ltas del e spec tro , en e ste e je m p lo , las b a n d a s de fre cu e n c ia p or e n c im a de 2 kHz (b a n d a s > 12) de la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a (vé a n se los m ó d u lo s 420 y 450), si la e xc itac ión de d om in io de fre cu e n c ia n o rm a liza d a en una fre cu e n c ia se g m e n to fe N j) ^ 0.86 maxa<y<b(|feN(/)|) (vé a se el m ó d u lo 452), una inc lin a c ió n q ue es fu n c ió n de la b anda i de fre cu e n c ia y que ta m b ié n p uede se r fu n c ió n de la ta s a de b its se a g re g a a la g a n a n c ia Ge p a ra c o m p e n s a r la e s tim a c ió n de e n e rg ía d e m a s ia d o ba ja del filtro LPC . El v a lo r de la inc lin a c ió n por b an da de fre cu e n c ia 6 (i) se fo rm u la com o:
La in c lin a c ió n se ca lcu la m e d ia n te la c a lcu la d o ra 407 -408 de in c lin a c ió n y se a p lica a la e xc itac ión de d o m in io de fre cu e n c ia n o rm a liza d a feN p o r el se g m e n to de fre cu e n c ia de a cu e rd o con la línea s u p e r io r de la e cu a c ió n (30) m e d ia n te una s u b ca lcu la d o ra 409 para o b te n e r la e xc ita c ió n fedN de d o m in io de fre cu e n c ia m o d ifica d a (d e sn o rm a liza d a ).
U na ve z m ás, para las partes m ás a ltas del e spec tro , en e ste e je m p lo ilus tra tivo , las b an da s de fre cu e n c ia p or enc im a de 2 kH z (b a n d a s > 12) de la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a (vé a n se los m ó d u lo s 420 y 450), si la
e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a en un fre cu e n c ia se g m e n to f'eN(j) < 0.86 maxa</<b(|feN(/)|) (vé a se el m ó d u lo 452), un a te n u a d o r 410 ca lcu la una g a n a n c ia de a te n u a c ió n /feN(/)/maxa<j<b(|feN(/)|)]2 a p lica d o a la e xc ita c ió n e sp e c tra l n o rm a liza d a feN p o r se g m e n to de fre cu e n c ia de a cu e rd o con la línea in fe rio r de la e cu ac ió n (30 ) p o r una su b ca lc u la d o ra 411 p ara o b te n e r la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a (d e sn o rm a liz a d a ) f'edN.
P ara resum ir, la e xc ita c ió n e sp e c tra l d e sn o rm a liza d a f'edN se d e te rm in a de la s ig u ie n te m anera :
d o n d e a y b se d e sc rib e n en e ste d o cu m e n to a n te rio rm e n te . T a m b ié n es p os ib le a u m e n ta r aún m ás la g a n a n c ia a p lica d a a las ú ltim a s bandas, d on de el e m p a re ja m ie n to de e n e rg ía de LPC es la peor.
6 ) T ra n s fo rm a c ió n de fre cu e n c ia in ve rsa
Un c o m b in a d o r 453 co m b in a las co n trib u c io n e s a la e xc itac ión de d o m in io de fre cu e n c ia m o d ifica d a (d e sn o rm a liza d a ) f'edN de las su b ca lcu la d o ra s 414, 403, 406, 409 y 411 p ara fo rm a r la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a (d e s n o rm a liz a d a ) co m p le ta f'edN.
D e sp u é s de q ue se co m p le ta el p ro ce sa m ie n to de d o m in io de fre cu e n c ia , se a p lica una tra n s fo rm a c ió n 202 inve rsa de fre cu e n c ia -tie m p o a la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a (d e sn o rm a liz a d a ) f'edN del c o m b in a d o r 453 p ara e n c o n tra r la e xc ita c ió n m o d ifica d a de d o m in io del tiem p o . En e sta re a liza c ió n ilus tra tiva , la co n ve rs ió n de fre cu e n c ia a tie m p o se log ra con la inve rsa de la m ism a D C T tip o II q ue se usó para la co n ve rs ió n de tie m p o a fre cu e n c ia d an do una re so lu c ió n de 25 Hz. De nuevo , se pueden u sa r o tras tra n s fo rm a c io n e s . La e xc ita c ió n m o d ifica d a „ /
de d o m in io de tie m p o
-td
se o b tie n e de la s ig u ie n te m anera :
e ste e je m p lo ilus tra tivo , la lon g itu d de la tra m a es de 256 m u e s tra s p ara una fre cu e n c ia de m u e s tre o in te rna co rre sp o n d ie n te de 12.8 kH z (A M R -W B ).
7) S ín te s is filtra n d o y so b re sc r ib ie n d o la s ín te s is a c tu a l de C E LP
U na ve z q ue se co m p le ta la m o d ifica c ió n de la exc itac ión , la e xc ita c ió n m o d ifica d a se p ro ce sa a tra vé s del filtro 108 de s ín te s is p ara o b te n e r una s ín te s is m o d ifica d a p ara la tra m a actua l. El s o b re e s c rito r 110 usa e sta s ín te s is m o d ifica d a p ara s o b re sc r ib ir la s ín te s is d e co d ifica d a y a sí a u m e n ta r la ca lid ad p erce p tiva .
La d e sa ce n tu a c ió n fin a l y el re m u e s tre o a 16 kH z se p ueden re a liz a r luego en el filtro de d e sa ce n tu a c ió n y el re m u e s tre a d o r 112.
Claims (16)
1. Un d isp o s itivo para m o d ifica r, d u ra n te la d e co d ifica c ió n de una señ a l de son ido , una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a p or un d e c o d ifica d o r (102 ) de d o m in io de tiem p o , q ue com p re nd e :
un c la s if ica d o r (104, 105, 106, 301 ) de la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en uno de un n ú m e ro de ca te go rías ;
un c o n v e rtid o r (107, 201 ) de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en una e xc itac ión de d o m in io de fre cu en c ia ;
un m o d ific a d o r (107, 203 , 204, 205 , 206, 207 , 208, 209 , 210 ) de la e xc ita c ió n de d o m in io de fre cu e n c ia en fu n c ió n de la ca te g o ría en la q ue el c la s if ica d o r (104, 105, 106, 301 ) c la s ifica la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d eco d ifica d o ;
un co n v e rtid o r (107, 202 ) de la e xc ita c ió n m o d ifica d a de d o m in io de fre cu e n c ia en una e xc ita c ió n m o d ifica d a de d o m in io de tiem p o ;
un filtro (108 ) de s ín te s is su m in is tra d o con la e xc ita c ió n m o d ifica d a de d o m in io de tie m p o para p ro d u c ir una s ín tes is m o d ifica d a de la e xc ita c ió n de d o m in io de tie m p o d e cod ifica da .
2. Un d isp o s itivo para m o d ifica r una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 1, en d on de el m o d ific a d o r (107, 203, 204 , 206, 207, 208, 209, 210 ) com p re nd e :
una c a lcu la d o ra (203 ) de una fre cu e n c ia de co rte d o n d e se d e ja de u tiliz a r una co n trib u c ió n de e xc ita c ió n de d om in io de tiem p o ;
una re du cc ió n a ce ro (204 ) de la e xc ita c ió n del d o m in io de fre cu e n c ia p o r e n c im a de la fre cu e n c ia de corte ; y un n o rm a liz a d o r (205 ) de la e xc ita c ió n de d o m in io de fre cu e n c ia p o r d e b a jo de la fre cu e n c ia de co rte p ara p ro d u c ir una e xc ita c ió n de d o m in io de fre cu e n c ia no rm a lizad a .
3. Un d isp o s itivo para m o d ific a r una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 2, en d o n d e el m o d ific a d o r (107, 203, 204, 205, 206, 207, 208 , 209, 210 ) co m p re n d e un g e n e ra d o r (206 ) de ru ido a le a to rio y un s u m a d o r (207 ) del ru ido a le a to rio a la e xc itac ión del d o m in io de fre cu e n c ia p ue sto a ce ro p o r e n c im a de la fre cu e n c ia de co rte y n o rm a liza d o p or d e b a jo de d ich a fre cu e n c ia de corte .
4. Un d isp o s itivo para m o d ific a r una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 3, en d on de el m o d ific a d o r (107, 203, 204 , 205, 206, 207, 208, 209, 210 ) com p re nd e :
una c a lcu la d o ra (208, 209, 210 ) de una g a n a n c ia de e m p a re ja m ie n to q ue u tiliza una e n e rg ía de la e xc ita c ió n del d o m in io de fre cu e n c ia an tes y d e sp u é s de la m o d ificac ión , la c a lcu la d o ra (208, 209, 210 ) a p lica la g a n a n c ia de e m p a re ja m ie n to a la e xc ita c ió n n o rm a liza d a del d o m in io de fre cu e n c ia para p ro d u c ir e xc ita c ió n de d o m in io de fre cu e n c ia m o d ificad a .
5. Un d isp o s itivo para m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con cu a lq u ie ra de las re iv in d ica c io n e s 1 a 4, en d o n d e el c la s if ica d o r (104, 105, 106, 301 ) c la s ifica la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a com o so rda ina c tiva o activa .
6. Un d isp o s itivo para m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con una cu a lq u ie ra de las re iv in d ica c io n e s 1 a 5, q ue co m p re n d e un s u a v iz a d o r (111 ) de f iltro de s ín te s is cu a n d o la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a se c la s ifica com o una dada de las c a te g o ría s p or el c las ifica do r.
7. Un d isp o s itivo p ara d e c o d ifica r una señ a l de son ido co d ifica d a p or p a rá m e tro s de co d ifica c ió n , q ue com p re nd e : un d e c o d ifica d o r (102 ) de una e xc itac ión de d o m in io de tie m p o en re sp u e s ta a los p a rá m e tro s de co d ifica c ió n de la señ a l de son ido ;
un filtro (103 ) de s ín te s is se n s ib le a la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a para p ro d u c ir una s ín te s is de d ich a e xc ita c ió n de d o m in io de tiem p o ; y
un d isp o s itivo de a cu e rd o con una cu a lq u ie ra de las re iv in d ica c io n e s 1 a 6, para m o d ifica r la s ín te s is de la e xc ita c ió n de d o m in io de tiem p o .
8. Un m é to d o para m od ifica r, d u ra n te la d e co d ifica c ió n de una señ a l de son ido , una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a p or un d e c o d ifica d o r (102 ) de d o m in io de tiem p o , q ue com p re nd e :
c la s if ica r (104, 105, 106, 301 ) la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en uno de un n ú m e ro de ca te go rías ;
c o n v e rtir (107, 201 ) la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a en una e xc ita c ió n de d o m in io de fre cu en c ia ; m o d ific a r (107, 203, 204, 205, 206, 207, 208, 209 , 210 ) la e xc ita c ió n de d o m in io de fre cu e n c ia en fu n c ió n de la ca te g o ría en la q ue se c la s ifica la s ín te s is de la e xc ita c ió n de d o m in io de tie m p o d ecod ifica do ;
c o n v e rtir (107, 202 ) la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ifica d a en una e xc ita c ió n de d o m in io del t ie m p o m o d ificad a ;
s in te tiz a r (108 ) la e xc ita c ió n m o d ifica d a de d o m in io de tie m p o p ara p ro d u c ir una s ín te s is m o d ifica d a de la e xc ita c ió n de d o m in io de tie m p o d e cod ifica da .
9. Un m é to d o para m o d ific a r una s ín te s is de una e xc ita c ió n de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 8, en d o n d e la e xc ita c ió n de d o m in io de fre cu e n c ia se d iv id e en b a n d a s de fre cu e n c ia , cad a una d iv id id a en se g m e n to s de fre cu e n c ia , y en d o n d e la m o d ifica c ió n de la e xc ita c ió n de d o m in io de fre cu e n c ia com p re nd e :
n o rm a liz a r (302 ) la e xc ita c ió n de d o m in io de fre cu e n c ia u tiliza n d o un fa c to r de n o rm a liza c ió n que v a ría en la b an da de fre cu e n c ia para p ro d u c ir una e xc itac ión de d o m in io de fre cu e n c ia no rm a lizad a .
10. Un m é to d o p ara m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 9, en d o n d e m o d ific a r la e xc ita c ió n de d o m in io de fre cu e n c ia co m p re n d e re d u c ir a ce ro (302 ) los s e g m e n to s de fre cu e n c ia p o r d e b a jo de una fra cc ió n de un v a lo r m á x im o de la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a en la b an da de fre cu e n c ia q ue co m p re n d e los se g m e n to s de fre cu e n c ia .
11. Un m é to d o para m o d ific a r una s ín te s is de una e xc ita c ió n de d o m in io de t ie m p o de a cu e rd o con la re iv in d ica c ió n 9 o 10, en d on de m o d ific a r la e xc itac ión de d o m in io de fre cu e n c ia com p re nd e :
c a lc u la r (303, 304, 306 ) una g a n a n c ia de e m p a re ja m ie n to p o r b anda de fre cu e n c ia u tiliza n d o una e n e rg ía de la e xc ita c ió n del d o m in io de fre cu e n c ia an tes y d e sp u é s de la m o d ificac ión .
12. Un m é to d o p ara m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 11, en d on de m o d ific a r la e xc ita c ió n de d o m in io de fre cu e n c ia com p re nd e , para las b an da s de fre cu e n c ia p o r d eb a jo de una p rim e ra fre cu e n c ia , a p lic a r (306 ) la g a n a n c ia de e m p a re ja m ie n to a la e xc ita c ió n de d o m in io de fre cu e n c ia n o rm a liza d a para p ro d u c ir la e xc ita c ió n de d o m in io de fre cu e n c ia m o d ificad a .
13. Un m é to d o p ara m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 11, q ue com p re nd e , p a ra las b an da s de fre cu e n c ia e n tre una p rim e ra fre cu e n c ia in fe rio r y una se g u n d a fre cu e n c ia sup erio r:
e n c o n tra r (404 ) un v a lo r m á x im o p or b anda de fre cu e n c ia de la e xc itac ión de d o m in io de fre cu e n c ia no rm a lizad a ; a m p lif ic a r (402 ) la g a n a n c ia de e m p a re ja m ie n to p o r un fa c to r de a m p lif ica c ió n p o r se g m e n to de fre cu e n c ia si la e xc ita c ió n n o rm a liza d a del d o m in io de fre cu e n c ia en el se g m e n to de fre cu e n c ia es igua l a o m a yo r q ue un v a lo r p ro p o rc io n a l a d ich o v a lo r m á x im o de la b anda de fre cu en c ia ;
a te n u a r (405 ) la g a n a n c ia de e m p a re ja m ie n to p o r un fa c to r de a te n u a c ió n p o r se g m e n to de fre cu e n c ia de la b anda de fre cu e n c ia si la e xc ita c ió n n o rm a liza d a del d o m in io de fre cu e n c ia en el se g m e n to de fre cu e n c ia es in fe rio r al v a lo r p ro p o rc io n a l a d ich o v a lo r m á x im o de la b anda de fre cu e n c ia ; y
a p lic a r (403, 406 ) la g a n a n c ia de e m p a re ja m ie n to a m p lifica d a o a te n u a d a a la e xc ita c ió n del d o m in io de fre cu e n c ia n o rm a liza d a en d icho se g m e n to de fre cu e n c ia para p ro d u c ir en d ich o se g m e n to de fre cu e n c ia la e xc ita c ió n del d om in io de fre cu e n c ia m o d ificad a .
14. Un m é to d o p ara m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 11, q ue com p re nd e , para las b an da s de fre cu e n c ia p or e nc im a de una fre cu e n c ia dada:
e n c o n tra r (404 ) un v a lo r m á x im o p or b anda de fre cu e n c ia de la e xc itac ión de d o m in io de fre cu e n c ia no rm a lizad a ; c a lc u la r (407, 408 ) una co rre cc ió n de in c lin a c ió n para la g a n a n c ia de e m p a re ja m ie n to cu a n d o la e xc ita c ió n del d om in io de fre cu e n c ia n o rm a liza d a en el se g m e n to de fre cu e n c ia es m a yo r q ue un v a lo r p ro p o rc io n a l a d ich o v a lo r m á x im o de la b an da de fre cu e n c ia , y a p lic a r la co rre cc ió n de inc lin a c ió n c a lcu la d a a la g a n a n c ia de e m p a re ja m ie n to ; y a p lic a r (409 ) la g a n a n c ia de e m p a re ja m ie n to a la que se ha a p lica d o la co rre cc ió n de in c lin a c ió n ca lcu la d a a la e xc ita c ió n del d o m in io de fre cu e n c ia n o rm a liza d a en d ich o se g m e n to de fre cu e n c ia para p ro d u c ir en d ich o se g m e n to de fre cu e n c ia la e xc ita c ió n del d o m in io de fre cu e n c ia m o d ificad a .
15. Un m é to d o p ara m o d ific a r una s ín te s is de una e xc itac ión de d o m in io de tie m p o de a cu e rd o con la re iv in d ica c ió n 11, q ue com p re nd e , para las b an da s de fre cu e n c ia p or e nc im a de una fre cu e n c ia dada:
e n c o n tra r (404 ) un v a lo r m á x im o p or b anda de fre cu e n c ia de la e xc itac ión de d o m in io de fre cu e n c ia no rm a lizad a ;
a te n u a r (410 ) la g a n a n c ia de e m p a re ja m ie n to p o r un fa c to r de a te n u a c ió n p o r se g m e n to de fre cu e n c ia de la b anda de fre cu e n c ia cu a n d o la e xc ita c ió n n o rm a liza d a del d o m in io de fre cu e n c ia en el se g m e n to de fre cu e n c ia es in fe rio r a un v a lo r p ro p o rc io n a l al v a lo r m á x im o de la b anda de fre cu e n c ia ; y
a p lic a r (411 ) la g a n a n c ia de e m p a re ja m ie n to a te n u a d a a la e xc ita c ió n del d o m in io de fre cu e n c ia n o rm a liza d a en d icho se g m e n to de fre cu e n c ia para p ro d u c ir en d ich o se g m e n to de fre cu e n c ia la e xc ita c ió n del d o m in io de fre cu e n c ia m o d ificad a .
16. Un m é to d o para d e c o d ifica r una señ a l de so n id o co d ifica d a p o r p a rá m e tro s de cod ifica c ió n , q ue com p re nd e :
d e c o d ifica r (102 ) una e xc itac ión de d o m in io de tie m p o en re sp u e s ta a los p a rá m e tro s de co d ifica c ió n de la seña l de son ido ;
s in te tiz a r (103 ) la e xc ita c ió n de d o m in io de tie m p o d e co d ifica d a para p ro d u c ir una s ín te s is de d ich a e xc ita c ió n de d o m in io de tie m p o ; y
un m é to d o de a cu e rd o con una cu a lq u ie ra de las re iv in d ica c io n e s 8 a 15, para m o d ific a r la s ín te s is de la e xc itac ión de d o m in io de tiem p o .
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161555246P | 2011-11-03 | 2011-11-03 | |
PCT/CA2012/001011 WO2013063688A1 (en) | 2011-11-03 | 2012-11-01 | Improving non-speech content for low rate celp decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2805308T3 true ES2805308T3 (es) | 2021-02-11 |
Family
ID=48191141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES12844916T Active ES2805308T3 (es) | 2011-11-03 | 2012-11-01 | Mejora del contenido insonoro para decodificador CELP de tasa baja |
Country Status (15)
Country | Link |
---|---|
US (1) | US9252728B2 (es) |
EP (2) | EP2774145B1 (es) |
JP (5) | JP6239521B2 (es) |
KR (1) | KR102105044B1 (es) |
CN (3) | CN104040624B (es) |
CA (1) | CA2851370C (es) |
DK (1) | DK2774145T3 (es) |
ES (1) | ES2805308T3 (es) |
HK (1) | HK1198265A1 (es) |
HR (1) | HRP20201070T1 (es) |
HU (1) | HUE050600T2 (es) |
IN (1) | IN2014DN03022A (es) |
LT (1) | LT2774145T (es) |
SI (1) | SI2774145T1 (es) |
WO (1) | WO2013063688A1 (es) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104040624B (zh) * | 2011-11-03 | 2017-03-01 | 沃伊斯亚吉公司 | 改善低速率码激励线性预测解码器的非语音内容 |
EP3848929B1 (en) | 2013-03-04 | 2023-07-12 | VoiceAge EVS LLC | Device and method for reducing quantization noise in a time-domain decoder |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
CN111312277B (zh) * | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
CN110097892B (zh) * | 2014-06-03 | 2022-05-10 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
JP6401521B2 (ja) * | 2014-07-04 | 2018-10-10 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9972334B2 (en) * | 2015-09-10 | 2018-05-15 | Qualcomm Incorporated | Decoder audio classification |
US10373608B2 (en) | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
WO2019056108A1 (en) | 2017-09-20 | 2019-03-28 | Voiceage Corporation | METHOD AND DEVICE FOR EFFICIENT DISTRIBUTION OF A BINARY BUDGET IN A CELP CODEC |
TWI790705B (zh) * | 2021-08-06 | 2023-01-21 | 宏正自動科技股份有限公司 | 語速調整方法及其系統 |
CN115857614B (zh) * | 2022-11-17 | 2023-12-29 | 弘正储能(上海)能源科技有限公司 | 多路光伏mppt交错式boost控制方法及其系统 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58220199A (ja) * | 1982-06-17 | 1983-12-21 | 日本電気株式会社 | 帯域分割型ボコ−ダ |
JP3088121B2 (ja) * | 1991-04-12 | 2000-09-18 | 沖電気工業株式会社 | 統計励振コードベクトルの最適化方法 |
JP2606006B2 (ja) * | 1991-05-24 | 1997-04-30 | ヤマハ株式会社 | ノイズ音発生装置 |
JP3328080B2 (ja) * | 1994-11-22 | 2002-09-24 | 沖電気工業株式会社 | コード励振線形予測復号器 |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
JP3451998B2 (ja) * | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
US7272553B1 (en) * | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
US7139700B1 (en) * | 1999-09-22 | 2006-11-21 | Texas Instruments Incorporated | Hybrid speech coding and system |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
JP3462464B2 (ja) * | 2000-10-20 | 2003-11-05 | 株式会社東芝 | 音声符号化方法、音声復号化方法及び電子装置 |
JP2003110429A (ja) * | 2001-09-28 | 2003-04-11 | Sony Corp | 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
WO2004084182A1 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Decomposition of voiced speech for celp speech coding |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
CN101185127B (zh) * | 2005-04-01 | 2014-04-23 | 高通股份有限公司 | 用于编码和解码语音信号的高频带部分的方法和设备 |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
KR20080047443A (ko) * | 2005-10-14 | 2008-05-28 | 마츠시타 덴끼 산교 가부시키가이샤 | 변환 부호화 장치 및 변환 부호화 방법 |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US20090281812A1 (en) * | 2006-01-18 | 2009-11-12 | Lg Electronics Inc. | Apparatus and Method for Encoding and Decoding Signal |
US8271277B2 (en) * | 2006-03-03 | 2012-09-18 | Nippon Telegraph And Telephone Corporation | Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
PT2945158T (pt) * | 2007-03-05 | 2020-02-18 | Ericsson Telefon Ab L M | Método e arquitetura para alisamento de ruído de fundo estacionário |
CN101388214B (zh) * | 2007-09-14 | 2012-07-04 | 向为 | 一种变速率的声码器及其编码方法 |
CN100585699C (zh) * | 2007-11-02 | 2010-01-27 | 华为技术有限公司 | 一种音频解码的方法和装置 |
WO2009110738A2 (ko) * | 2008-03-03 | 2009-09-11 | 엘지전자(주) | 오디오 신호 처리 방법 및 장치 |
EP2259254B1 (en) * | 2008-03-04 | 2014-04-30 | LG Electronics Inc. | Method and apparatus for processing an audio signal |
CN101620854B (zh) * | 2008-06-30 | 2012-04-04 | 华为技术有限公司 | 频带扩展的方法、系统和设备 |
CN102105930B (zh) * | 2008-07-11 | 2012-10-03 | 弗朗霍夫应用科学研究促进协会 | 用于编码采样音频信号的帧的音频编码器和解码器 |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
EP3640941A1 (en) * | 2008-10-08 | 2020-04-22 | Fraunhofer Gesellschaft zur Förderung der Angewand | Multi-resolution switched audio encoding/decoding scheme |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
EP2471061B1 (en) * | 2009-10-08 | 2013-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
US8892428B2 (en) * | 2010-01-14 | 2014-11-18 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude |
US8958572B1 (en) * | 2010-04-19 | 2015-02-17 | Audience, Inc. | Adaptive noise cancellation for multi-microphone systems |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
CN102074245B (zh) * | 2011-01-05 | 2012-10-10 | 瑞声声学科技(深圳)有限公司 | 基于双麦克风语音增强装置及语音增强方法 |
CN104040624B (zh) * | 2011-11-03 | 2017-03-01 | 沃伊斯亚吉公司 | 改善低速率码激励线性预测解码器的非语音内容 |
DE102014101462B3 (de) | 2014-02-06 | 2015-03-05 | Sartorius Lab Instruments Gmbh & Co. Kg | Verfahren zur Funktionsprüfung eines Messgerätes |
-
2012
- 2012-11-01 CN CN201280065936.1A patent/CN104040624B/zh active Active
- 2012-11-01 KR KR1020147013465A patent/KR102105044B1/ko active IP Right Grant
- 2012-11-01 JP JP2014539195A patent/JP6239521B2/ja active Active
- 2012-11-01 CN CN201710020311.8A patent/CN106910509B/zh active Active
- 2012-11-01 DK DK12844916.2T patent/DK2774145T3/da active
- 2012-11-01 WO PCT/CA2012/001011 patent/WO2013063688A1/en active Application Filing
- 2012-11-01 IN IN3022DEN2014 patent/IN2014DN03022A/en unknown
- 2012-11-01 SI SI201231800T patent/SI2774145T1/sl unknown
- 2012-11-01 CN CN201710019918.4A patent/CN107068158B/zh active Active
- 2012-11-01 EP EP12844916.2A patent/EP2774145B1/en active Active
- 2012-11-01 LT LTEP12844916.2T patent/LT2774145T/lt unknown
- 2012-11-01 EP EP20172813.6A patent/EP3709298A1/en active Pending
- 2012-11-01 ES ES12844916T patent/ES2805308T3/es active Active
- 2012-11-01 HU HUE12844916A patent/HUE050600T2/hu unknown
- 2012-11-01 CA CA2851370A patent/CA2851370C/en active Active
- 2012-11-02 US US13/667,921 patent/US9252728B2/en active Active
-
2014
- 2014-11-21 HK HK14111781.4A patent/HK1198265A1/xx unknown
-
2017
- 2017-11-01 JP JP2017211617A patent/JP6513769B2/ja active Active
- 2017-11-01 JP JP2017211618A patent/JP6532926B2/ja active Active
-
2019
- 2019-05-22 JP JP2019096082A patent/JP2019152878A/ja active Pending
-
2020
- 2020-07-08 HR HRP20201070TT patent/HRP20201070T1/hr unknown
-
2021
- 2021-11-18 JP JP2021188032A patent/JP7237127B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
EP3709298A1 (en) | 2020-09-16 |
HUE050600T2 (hu) | 2021-01-28 |
KR102105044B1 (ko) | 2020-04-27 |
CN107068158B (zh) | 2020-08-21 |
JP7237127B2 (ja) | 2023-03-10 |
JP2018045243A (ja) | 2018-03-22 |
WO2013063688A1 (en) | 2013-05-10 |
JP2018045244A (ja) | 2018-03-22 |
JP6532926B2 (ja) | 2019-06-19 |
JP2015501452A (ja) | 2015-01-15 |
HK1198265A1 (en) | 2015-03-20 |
JP6513769B2 (ja) | 2019-05-15 |
US9252728B2 (en) | 2016-02-02 |
US20130121508A1 (en) | 2013-05-16 |
JP2019152878A (ja) | 2019-09-12 |
DK2774145T3 (da) | 2020-07-20 |
KR20140090214A (ko) | 2014-07-16 |
EP2774145A4 (en) | 2015-10-21 |
JP2022022247A (ja) | 2022-02-03 |
EP2774145B1 (en) | 2020-06-17 |
JP6239521B2 (ja) | 2017-11-29 |
CN104040624B (zh) | 2017-03-01 |
LT2774145T (lt) | 2020-09-25 |
CN106910509A (zh) | 2017-06-30 |
HRP20201070T1 (hr) | 2020-10-30 |
CN106910509B (zh) | 2020-08-18 |
SI2774145T1 (sl) | 2020-10-30 |
CN107068158A (zh) | 2017-08-18 |
IN2014DN03022A (es) | 2015-05-08 |
CA2851370C (en) | 2019-12-03 |
CA2851370A1 (en) | 2013-05-10 |
CN104040624A (zh) | 2014-09-10 |
EP2774145A1 (en) | 2014-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2805308T3 (es) | Mejora del contenido insonoro para decodificador CELP de tasa baja | |
JP6773743B2 (ja) | フォワードエイリアシング消去を用いた符号器 | |
ES2309969T3 (es) | Procedimiento y dispositivo para la ampliacion artificial de la anchura de banda de señales de voz. | |
CN101185127B (zh) | 用于编码和解码语音信号的高频带部分的方法和设备 | |
ES2484794T3 (es) | Pos-filtro selectivo | |
ES2902587T3 (es) | Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo | |
US7912712B2 (en) | Method and apparatus for encoding and decoding of background noise based on the extracted background noise characteristic parameters | |
FI119533B (fi) | Audiosignaalien koodaus | |
MX2007012191A (es) | Metodos y aparatos para codificar y descodificar una porcion de banda alta de una senal vocal. | |
ES2948521T3 (es) | Método y dispositivo de codificación de señales de voz o audio transitorias, método y dispositivo de decodificación, sistema de procesado y soporte de almacenamiento legible por ordenador | |
AU2014225223B2 (en) | Device and method for reducing quantization noise in a time-domain decoder | |
CN110706715B (zh) | 信号编码和解码的方法和设备 | |
ES2688021T3 (es) | Adición de ruido de confort para modelar ruido de fondo a bajas tasas de bits | |
EP2352147A3 (en) | An apparatus and a method for encoding an audio signal | |
KR20090035727A (ko) | 스피치 신호와 연관된 패킷에 식별자를 포함시키는 시스템 및 방법 | |
BRPI0513608A (pt) | composição para o cuidado dos cabelos, processo para a preparação de uma composição para o cuidado dos cabelos e método para o tratamento dos cabelos | |
BR0115057A (pt) | Método para encobrir os erros em um fluxo de bit codificado, sistema para codificar os sinais de voz e decodificar o fluxo de bit codificado, decodificador, estação móvel e elemento de rede | |
BR0313317A (pt) | Quantização adaptável por largura de banda | |
ES2546028T3 (es) | Un método y un dispositivo de codificación/decodificación | |
CA2899542A1 (en) | Noise filling without side information for celp-like coders | |
CN106409304B (zh) | 一种音频信号的时域包络处理方法及装置、编码器 | |
TWI343560B (en) | Systems, methods, and apparatus for wideband encoding and decoding of active frames | |
JP2009530679A (ja) | オーディオデコーダ内で信号を後処理する方法 | |
ES2394515T3 (es) | Métodos y adaptaciones en una red de telecomunicaciones | |
KR20130047608A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 |