ES2967185T3 - Servidor multimedia de escena de voz escalable - Google Patents

Servidor multimedia de escena de voz escalable Download PDF

Info

Publication number
ES2967185T3
ES2967185T3 ES20721134T ES20721134T ES2967185T3 ES 2967185 T3 ES2967185 T3 ES 2967185T3 ES 20721134 T ES20721134 T ES 20721134T ES 20721134 T ES20721134 T ES 20721134T ES 2967185 T3 ES2967185 T3 ES 2967185T3
Authority
ES
Spain
Prior art keywords
audio
streams
audio streams
accordance
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20721134T
Other languages
English (en)
Inventor
Glenn N Dickins
Feng Deng
Michael Eckert
Craig Johnston
Paul Holmberg
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2967185T3 publication Critical patent/ES2967185T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1881Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with schedule organisation, e.g. priority, sequence management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • H04M3/569Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Acoustics & Sound (AREA)

Abstract

Un sistema de comunicación, un método y un medio legible por computadora para el mismo comprenden un servidor de medios configurado para recibir una pluralidad de flujos de audio desde una pluralidad correspondiente de dispositivos cliente, incluyendo el servidor de medios un circuito configurado para clasificar la pluralidad de flujos de audio basándose en una métrica predeterminada. , agrupar una primera parte de la pluralidad de flujos de audio en un primer conjunto, siendo la primera parte de la pluralidad de flujos de audio los N flujos de audio de mayor clasificación, agrupar una segunda parte de la pluralidad de flujos de audio en un segundo conjunto, el siendo la segunda porción de la pluralidad de flujos de audio los M flujos de audio de menor rango, reenviar los respectivos flujos de audio del primer conjunto a un dispositivo receptor y descartar los respectivos flujos de audio del segundo conjunto, donde N y M son números enteros independientes. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
S e rv id o r m u ltim e d ia de e sce na de v o z e sca la b le
Antecedentes
C a m p o de la d ivu lg a c ió n
E s ta s o lic itu d se re fie re g e n e ra lm e n te a c o m u n ica c io n e s m u ltico m p a rtid a s . M ás e sp e c ífica m e n te , e sta so lic itu d se re fie re a un s e rv id o r m u ltim e d ia de e sce n a de vo z e sca la b le y a un m é to do para, e n tre o tra s cosas, co m u n ica c io n e s de a ud io y voz.
D e sc rip c ió n de té c n ica re la c io n a d a
S is te m a s de te le c o n fe re n c ia de v íd e o y a ud io p ueden p e rm itir q ue m ú ltip le s p artes in te ra c tú e n de fo rm a rem o ta para lle v a r a cabo una co n fe re n c ia . G e n e ra lm e n te , d ise ñ o s e x is te n te s de s e rv id o re s m u ltim e d ia ce n tra le s para a ud io en c o n fe re n c ia s de vo z usan a lg u n a e s tra te g ia o co m b in a c ió n de e s tra te g ia s en una de d os fo rm as .
En una fo rm a , al re e n v ia r to d o s los flu jo s de a ud io e n tra n te s a to d o s los p a rtic ip a n te s que e scu ch a rá n e se flu jo de a ud io en una co n fe re n c ia , el s e rv id o r es ca p a z de e v ita r to d a la ca rga de p ro ce sa m ie n to y d a r al c lie n te m ás fle x ib ilid a d en la re n d e rizac ión . S in e m ba rg o , e ste e n fo q u e no e sca la ni g e s tio n a el a ncho de b an da a gu as aba jo.
En o tra fo rm a , al m e zc la r flu jo s e n tra n te s en la m e zc la e sp e c ífica o e sce n a de a ud io e sp ac ia l q ue re c ib irá cada pun to fina l, y e n v ia r so lo la m ezc la , el s e rv id o r p uede se r cap az de m in im iza r y te n e r un a n ch o de b anda a guas a ba jo fijo in d e p e n d ie n te m e n te del n úm e ro de c lie n te s en una co n fe re n c ia . S in e m ba rg o , e ste e n fo q u e re qu ie re una g ran ca n tid a d de p ro ce sa m ie n to y d e sco d ifica c ió n , m e zc la y re co d ifica c ió n de a ud io en el s e rv id o r que g e n e ra cos tos y re tra so s de p ro ce sa m ie n to a d ic io n a le s . Inc lu so en los ca so s en los q ue ta le s s is te m a s in te n ta n re d u c ir y re u sa r d ive rsa s o p e ra c io n e s de p ro ce sa m ie n to y m e zc la do , e sto s ig u e s ie n d o una ca rga g ran d e . U na ve z m e zc la do , hay una o p o rtu n id a d lim ita d a para el c lien te de c a m b ia r s ig n ific a tiv a m e n te la e sce n a de a ud io p e rce p tu a l a una q ue es d ife re n te a la p ro p o rc io n a d a por el s e rv id o r (p o r e je m p lo , para im p le m e n ta r se g u im ie n to de cab eza ).
S is te m a s p ue de n im p lica r a lg u n a co m b in a c ió n de las d os fo rm a s a n te rio re s , a lte rn a n d o e n tre el uso de re en v ío para s itu a c io n e s en las q ue só lo unos p ocos h ab lan te s e stán a c tivo s y el uso de m e zc la d o cu a n d o hay m u ch os h a b la n te s a ctivos . S in e m ba rg o , ta le s s is te m a s p ue de n te n e r in co n ve n ie n te s , ta le s com o se r in ca p a ce s de p ro p o rc io n a r un a u m e n to su fic ie n te en e fic ie n c ia , e sca la b ilid a d o g es tión de a ncho de banda.
U na so lu c ió n de la té cn ica a n te r io r se p ub lica com o el d o cu m e n to U S 2015 /0055770 A 1, q ue d ivu lg a un c o n tro la d o r de co n fe re n c ia c o n fig u ra d o para c o lo ca r una señ a l de a ud io a gu as a rrib a a so c ia d a con un p a rtic ip a n te de la co n fe re n c ia y una señ a l de s o n id o d en tro de una e sce n a de co n fe re n c ia 2D o 3D para se r re n d e riza d a a un o yen te . El d o cu m e n to U S 2015 /0055770 A1 d ivu lg a que el co n tro la d o r de co n fe re n c ia está c o n fig u ra d o para e s ta b le ce r un pun to X de la e sce n a de co n fe re n c ia con X u b ica c io n e s de o ra d o r e sp a c ia le s d ife re n te s d e n tro de la e sce n a de co n fe re n c ia , s ie n d o X un n ú m e ro ente ro , X >0 ; a s ig n a r la señ a l de a ud io aguas a rrib a a una de las u b ica c io n e s del o rad o r; co lo ca r una señ a l de s o n id o en una u b ica c ió n de s o n id o e sp ac ia l d e n tro del pun to X de la e sce na de la co n fe re n c ia ; y g e n e ra r m e ta d a to s q ue id e n tifica n la u b ica c ió n del o ra d o r a s ig n a d a y la u b ica c ió n de s o n id o e sp ac ia l y p e rm itir que una u n id ad de p ro ce sa m ie n to de a ud io g e n e re una señ a l de a ud io e sp a c ia liza d a b asad a en un co n ju n to de se ñ a le s de a ud io a gu as a ba jo q ue co m p re n d e n la seña l de a ud io a g u a s a rrib a y la señ a l de son ido . En co n se cu e n c ia , e x is te una n e ce s id a d de s is te m a s y m é to d o s para g e s tio n a r la ta sa de b its de d a tos m á x im a y m e d ia e n v ia d a a c lie n te s s in re q u e rir m e zc la d o e x te n s ivo de a ud io en el se rv id o r. A d e m á s, e x is te la n e ce s id a d de s is te m a s y m é to d o s con la ca p a c id a d de re n d e riza r in d iv id u a lm e n te la u b ica c ió n e sp ac ia l de cada flu jo en una e sce n a p la u s ib le y p e rce p tu a lm e n te co n tin u a in d e p e n d ie n te m e n te de c u a le sq u ie ra o p e ra c io n e s de m e zc la d o o se le cc ió n q ue se lleva a cab o en el se rv id o r.
Breve sumario de la divulgación
El o b je to id e n tif ica d o a n te r io rm e n te se re su e lve m e d ia n te el o b je to de las re iv in d ica c io n e s in d e p e n d ie n te s . R e a liza c io n e s p re fe rid a s e s tán d e fin id a s p o r las re iv in d ica c io n e s d e p e n d ie n te s .
D ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n e s tán re la c io n a d o s con c ircu ito s , s is te m a s y m é to d o s para c o m u n ica c ió n m u ltico m p a rtid a e sca la b le , in c lu id a co m u n ica c ió n de voz.
De e s ta m anera , d ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n p ro p o rc io n a n m e jo ra s en al m e no s el cam p o té c n ico de te le co m u n ica c io n e s .
E sta d ivu lg a c ió n p uede re a liza rse de d ive rsa s fo rm as , in c lu id o h a rd w a re o c ircu ito s co n tro la d o s p o r m é to do s im p le m e n ta d o s por o rde n ad or, p ro d u c to s de p ro g ra m a s in fo rm á tico s , s is te m a s y redes in fo rm á tica s , in te rfa ce s de usuario , e in te rfa ce s de p ro g ra m a c ió n de a p lica c io n e s ; así co m o m é to d o s im p le m e n ta d o s p o r hardw are , c ircu ito s de p ro ce sa m ie n to de seña l, co n ju n to s de m e m oria , c ircu ito s in te g ra d o s e sp e c ífico s de a p lica c io n e s , co n ju n to s de p u e rtas p ro g ra m a b le s en cam p o, y s im ila re s . El su m a rio a n te r io r p re te n d e ú n ica m e n te d a r una idea g en e ra l de d ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n , y no lim ita el a lca n ce de la d ivu lg a c ió n de n in g un a m anera .
Descripción de los dibujos
E sta s y o tras c a ra c te rís tica s m ás d e ta lla d a s y e sp e c ífica s de d ive rsa s re a liza c io n e s son m ás co m p le ta m e n te d ivu lg a d a s en la s ig u ie n te d esc ripc ió n , h a c ie n d o re fe re n c ia a los d ib u jo s que se a co m pa ñ an , en los que:
las fig u ra s 1A -1C ilus tra n re sp e c tiva m e n te s is te m a s de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ;
la fig u ra 2 ilus tra un cua d ro de d a to s de a c tiv id a d del h ab la a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ;
las fig u ra s 3 A -3 C ilus tra n re sp e c tiva m e n te fu n c io n e s de p on d e ra c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ;
la fig u ra 4 ilus tra o tro s is te m a de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ;
la fig u ra 5 ilus tra un cu rso de p ro ce so de un m é to do de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ; y
la fig u ra 6 A ilus tra un cu rso de p roce so de o tro m é to d o de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ;
la fig u ra 6B ilu s tra un cu rso de p roce so de o tro m é to d o de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n ; y
la fig u ra 7 ilus tra un cu rso de p ro ce so de o tro m é to do de c o m u n ica c ió n a m o do de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n .
Descripción detallada
En la s ig u ie n te d e sc rip c ió n , se e xp o n e n n u m e ro so s d e ta lles , ta le s com o co n fig u ra c io n e s de c ircu ito , cad en c ias , o p e ra c io n e s y s im ila re s , p a ra p ro p o rc io n a r una co m p re n s ió n de uno o m ás a sp e c to s de la p re se n te d ivu lga c ió n . S erá fá c ilm e n te e v id e n te para un e xp e rto en la té c n ica q ue e s to s d e ta lle s e sp e c ífico s son m e ra m e n te a m o do de e je m p lo y no p re te nd en lim ita r el a lca n ce de e sta so lic itu d . A d e m á s, si b ien la p re se n te d ivu lg a c ió n se cen tra p rin c ip a lm e n te en e je m p lo s en los q ue los d ive rso s c ircu ito s se usan en co m u n ic a c io n e s de voz , se e n te n d e rá q ue e sto es s im p le m e n te un e je m p lo de una im p le m e n ta c ió n . S e e n te n d e rá a d e m á s que los s is te m a s y m é to do s d ivu lg a d o s se p ue de n u sa r en cu a lq u ie r d isp o s itivo en el que e x is ta la n e ce s id a d de c re a r una co n e c tiv id a d de a ud io g e n e ra liza d a p ara una v a r ie d a d de fu e n te s y d e s tin o s de son ido ; por e je m p lo , co m u n ica c io n e s g lo b a le s, In te rn e t de las cosas, s is te m a s de re a lid a d v irtu a l y a u m e n ta d a , s is te m a s de re a lid ad a lte rn a tiva y m ixta , co la b o ra c ió n m ás a m p lia , c re c im ie n to y so p o rte co m u n ita rio , etc. A d e m á s, los s is te m a s y m é to d o s d ivu lg a d o s p ueden s e r a p lica b le s a a p lica c io n e s de so lo a ud io así com o a a ud io en co m b in a c ió n con o tra s m o d a lid a d e s se n so ria le s .
V is ta g en era l
D ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n p ro p o rc io n a n un s is te m a en el que es p os ib le c re a r una im p re s ió n de a lta ca lid a d y, en a lg u n o s caso s, in d is tin g u ib le de una e sce n a con m u ch os o ra d o re s s im u ltá n e o s m ie n tra s se tra n s m ite en cu a lq u ie r m o m en to so lo un su b c o n ju n to de los flu jo s de a ud io rea les. De e ste m odo, d ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n to m a n ve n ta ja de a sp e c to s de fa c to re s n e u ro ló g ico s , n e u ro fis io ló g ico s y p e rce p tu a le s de la a u d ic ió n h u m a n a para c re a r la ilus ió n de una e sce n a co m p le ja co m p le ta de v o ce s s in una tra n s m is ió n o m e zc la d o e xh a u s tivo de datos.
Los h um a n o s tie n d e n a a g ru p a r, cu a n d o es pos ib le , c o m p o n e n te s de a ud io a lo la rgo del t ie m p o y la fre cu e n c ia en un co n ju n to m ás p eq u e ñ o de o b je to s p e rce p tu a le s . Es dec ir, los h u m a n o s tie n d e n a a n a liza r e sce n a s a u d itiva s p e rce p tu a lm e n te en té rm in o s de flu jo s, d o n d e la se m e ja n z a en e sp ac io , e sp ec tro s , co m p o rta m ie n to te m p o ra l, te x tu ra , ton o , m o v im ie n to del ton o , y s im ila re s , cau san que los o b je to s se fu s io n e n . A d e m á s, los h u m a n o s son ca p a ce s de s e n tir co n tin u id a d e n tre los e le m e n to s de un f lu jo a ud itivo , in c lu so cu a n d o ta le s e le m e n to s no e s tén p re se n te s en el e stím u lo .
La re s ta u ra c ió n fo n é m ic a es un fa c to r en la ilus ió n de co n tin u id a d y cóm o se v in c u la con el fu n c io n a m ie n to ce reb ra l de a lto n ive l y la p e rce p c ió n co m p le ta de una e sce n a a ud itiva . P o r e je m p lo , cu a n d o un o ye n te está e scu ch a n d o a un so lo h a b la n te y una s íla b a se o scu re ce o se e lim in a del a ud io y se e n m a sca ra a d e cu a d a m e n te , el o ye n te p e rc ib irá un s o n id o en el lu g a r d on de tu vo lu g a r la e lim in a c ió n . P ara un le n g u a je s ig n ifica tivo , el son ido q ue se p e rc ib e se rá el s o n id o q ue te n g a el m a yo r se n tid o para la o rac ió n . "E n m a sc a ra r" a qu í no se re fie re a la o m is ió n de co n te n id o de a ud io s in o m ás b ien a c u b rir un s o n id o p a rticu la r con o tro s o n id o o ru ido . De esta m anera , el ce re b ro h u m a n o tra ta la a u se n c ia de s o n id o (s ile n c io ) de m a n e ra d ife re n te a la a u se n c ia de se ñ a le s de a ud io s ig n ifica tiva s (s in co n te n id o pero el ru ido re llen a el va c ío ). C u a n d o e stá e n m a sca ra d o , el co n te x to de la in fo rm a c ió n q ue fa lta p uede p ro p o rc io n a rse m e d ia n te p re p a ra c ió n e in fo rm a c ió n p rev ia al e ve n to a u d itivo (en a lg u n o s caso s, h as ta hora s a n te s del e ve n to ), así com o el a ud io que s ig u e al e ven to . El fe n ó m e n o p uede s e r tan fu e rte q ue el o ye n te e sté c o n ve n c id o de q ue o ye (o re cu e rd a h ab e r o íd o ) el s o n id o que fa lta en el pun to de la fra se en el q ue no e s ta b a p rese n te . P o r e je m p lo , o ye n te s que e s tu v ie ro n e xp u e s to s a los flu jo s de a ud io "la **e da e s ta b a en el ca rro " y "la **rn e e s ta b a en la m e sa " (d o n d e ** ind ica una s íla b a e lim in a d a y e n m a sca ra d a del flu jo ) in fo rm a ro n h ab e r e scu ch a d o "ru e d a " " y "co m ida ", re sp e c tiva m e n te , a u n q u e el a ud io fu e id é n tico h as ta la ú ltim a p a la b ra del flu jo .
De e ste m odo, cu a n d o hay co n te n id o que fa lta q ue e s tá a p ro p ia d a m e n te e n m a sca ra d o o re lle n a d o en el hab la, el o ye n te p uede s e r ro bu s to o in c lu so tra b a ja r para in ve n ta r so n id o s q ue se ría n a p ro p ia d o s para c u b rir la pérd ida . Si b ien la d e sc rip c ió n a n te r io r se p ro p o rc io n a con re fe ren c ia a un so lo h ab lan te , los co n ce p to s pueden e x te n d e rse a s itu a c io n e s en las q ue se p ro d u ce n p é rd id a s o c o lis io n e s d en tro del h ab la so b re el hab la, y los c o m p o n e n te s que fa lta n se e n m a sca ra n p or la p re se n c ia de o tro hab la.
La ce g u e ra al ca m b io es o tro fa c to r en la ilus ió n de con tinu ida d . La ce g u e ra al ca m b io es el co n ce p to p o r el cual es m e no s p ro b a b le q ue un o ye n te e scu ch e d is to rs io n e s , cam b ios , s e g m e n to s q ue fa ltan , y m a n ip u la c io n e s g e n e ra le s de un s o n id o en el t ie m p o , la fre cu e n c ia o el e sp a c io d on de se p rod u ce una gran ca n tid a d de a c tiv id a d o ca m b io en una e sce n a a ud itiva . E s te es un su b co n ju n to de la c ie n c ia de la p e rce p c ió n g en e ra l en el q ue los e s tu d io s tie n d e n a re la c io n a rse con in fo rm a c ió n v isu a l; s in e m ba rg o , el s e sg o de a te n c ió n y los e rro re s de p e rce p tu a le s q ue re su ltan de él son s im ila re s en la m a yo ría de los sen tido s .
La ce g u e ra al ca m b io es s im ila r y e stá re la c io n a d a con el co n ce p to de se sg o de fa lta de a te nc ió n . Los dos co n ce p to s son lig e ra m e n te d ife re n te s en q ue la ce g u e ra p or fa lta de a te n c ió n p ro v ie n e de la a te n c ió n a c tiva y s e le c tiva que se a le ja de co sa s q ue p ue de n e s ta r ca m b ia n d o o son e rró ne as , m ie n tra s que la ce g u e ra al cam b io p ro v ie n e de s itu a c io n e s en las q ue m u ch os e ve n to s o una g ran ca n tid a d de a c tiv id a d o cu rren y es de este m o do m á s fá c il o cu lta r los cam b ios .
Lo a n te r io r se p uede re su m ir com o e fe c to s de la ca p a c id a d p e rce p tu a l f in ita o del e s fu e rzo d isp o n ib le para a te n d e r las fu n c io n e s de se g u im ie n to de o b je to s (re ce p c ió n a d e m a n d a y re p ro d u cc ió n s im u ltá n e a s de co n te n id o m u ltim e d ia , o s tre a m in g ) y a c tiv id a d (ca m b io ). De hecho , m u ch o de lo q ue los h u m a n o s co n s id e ra n e scu ch a r es en re a lid a d una fo rm a de a lu c in a c ió n o co n s tru cc ió n de so n id o s a p a rtir de la m e m o ria que co in c id e , de m a nera p la u s ib le , con la s itu a c ió n a c tu a l y la in fo rm a c ió n a u d itiva de e n tra da . C u a n d o se tra ta con co n te n id o que tien e ca p a s de vo z so b re voz , e stas o b se rva c io n e s p e rce p tu a le s se p ueden a p ro v e c h a r para m in im iza r la can tid a d de in fo rm a c ió n n e ce sa ria para tra n s m it ir a o ye n te s in d iv id u a le s en un s is te m a de c o m u n ica c ió n para re c re a r así la e sce n a e sp ac ia l c o m p u e s ta p or m ú ltip le s voce s.
S is te m a de co m u n ica c ió n
Las fig u ra s 1A -1C ilus tra n d ive rso s e je m p lo s de un s is te m a de c o m u n ica c ió n 100a, 100b o 100c de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n . C u a n d o no es re le va n te d is tin g u ir e n tre el tip o p a rticu la r, el s is te m a p ue de d e n o m in a rse c o le c tiva m e n te s is te m a de co m u n ica c ió n 100.
La fig u ra 1A ilus tra un s is te m a de co m u n ica c ió n c e n tra liza d o 100a, en el que un s e rv id o r m u ltim e d ia cen tra l 101 re c ibe flu jo s de a ud io d e sd e una p lu ra lid a d de d isp o s itivo s c lie n te 102 (so lo uno de los cu a le s e stá e tiq ue tad o , p a ra m a yo r c la rid a d de la ilu s tra c ió n ). El s e rv id o r m u ltim e d ia 101 c re a a d e m á s un co n ju n to de flu jo s de sa lid a p ara al m e no s una p orc ión de los d isp o s itivo s c lien te 102. P ara s is te m a s a una e sca la su fic ie n te m e n te g rande, un ú n ico s e rv id o r m u ltim e d ia 101 p uede no s e r cap az de g e s tio n a r to d o s los flu jo s de a ud io e n tra n te s.
La fig u ra 1B ilus tra un s is te m a de c o m u n ica c ió n a n id a d o 100b, en el q ue un s e rv id o r m u ltim e d ia cen tra l 101 re c ibe flu jo s de a ud io d esde una p lu ra lid a d de d isp o s itivo s c lie n te 102 a tra vé s de una p lu ra lid a d de se rv id o re s in te rm e d io s 103. El s e rv id o r in te rm e d io 103 p ue de re e n v ia r flu jo s de a ud io y /o flu jo s de sa lid a d e sd e /h a c ia d ive rso s su b c o n ju n to s de la p lu ra lid a d de d isp o s itivo s c lien te 102 con o s in p roce sa m ie n to .
La fig u ra 1C ilus tra un s is te m a de co m u n ica c ió n co m p a rtid o 100c, en el q ue una p lu ra lid a d de se rv id o re s m u ltim e d ia 101 rec iben flu jo s de a ud io d esde una p lu ra lid a d de d isp o s itivo s c lie n te 102, y en el que unos re sp e c tivo s de la p lu ra lid a d de s e rv id o re s m u ltim e d ia 101 se co m u n ica n e n tre sí. A u n q u e no se ilus tra p a rticu la rm e n te en la fig u ra 1C, el s is te m a de co m u n ica c ió n c o m p a rtid o 100c p ue de in c lu ir a d e m á s se rv id o re s in te rm e d io s d e p e n d ie n d o de la e sca la del s is te m a de c o m u n ica c ió n co m p a rtid o 100c.
En el s is te m a de co m u n ica c ió n 100, d o n d e un d isp o s itivo c lien te p a rticu la r 102 p ro p o rc io n a un f lu jo de a ud io pero no re c ibe un flu jo de sa lid a , el e n la ce de co m u n ica c ió n se ilus tra con una f le ch a de un so lo la d o y puede d e n o m in a rse c o m u n ica c ió n s im p le x . D on de un c lie n te p a rticu la r 102 p ro p o rc io n a un flu jo de a ud io y ta m b ié n re c ibe un f lu jo de sa lid a , el e n la ce de co m u n ica c ió n se ilus tra con una f le ch a de d ob le lad o y p uede d e n o m in a rse c o m u n ica c ió n d úp lex . Si b ien no se ilus tra e xp re sa m e n te , la p re se n te d ivu lg a c ió n ta m b ié n es a p lica b le a co n fig u ra c io n e s en las q ue un d isp o s itivo c lie n te p a rticu la r 102 rec ibe un f lu jo de sa lid a pero no p ro p o rc io n a un flu jo de aud io.
A d e m á s, en el s is te m a de co m u n ica c ió n 100, los d ive rso s e n la ce s de co m u n ica c ió n p ue de n s e r ca b le a d o s (p .e j., a tra vé s de un cab le c o n d u c to r y /o una fib ra óp tica ), in a lá m b rico s (p o r e je m p lo , a tra vé s de W i-F i, B lue too th , c o m u n ica c ió n de ca m p o ce rca n o (N FC ), y s im ila re s ), o una co m b in a c ió n de ca b le a d o s e in a lá m b rico s (p o r e je m p lo ., c a b le a d o e n tre un m ic ró fo n o y un p ro ce sa d o r del d isp o s itivo c lie n te 102 e in a lá m b rico e n tre el d isp o s itivo c lien te 102 y el s e rv id o r m u ltim e d ia 101). M ie n tra s q ue las fig u ra s 1A -1C ilus tra n un n úm e ro p a rticu la r de d isp o s itivo s c lie n te 102 (ta n to en g en e ra l co m o para cad a s e rv id o r m u ltim e d ia 101 y /o s e rv id o r in te rm e d io 103), la p re se n te d ivu lg a c ió n no e stá tan lim ita d a y p ue de s e r a p lica b le a cu a lq u ie r n úm e ro de los d isp o s itivo s c lie n te 102 en cu a lq u ie r d isp os ic ión .
En el s is te m a de c o m u n ica c ió n 100, los d a tos de a ud io q ue re p re se n ta n una vo z p ueden in c lu ir una se r ie de tra m a s de voz. C on p ro p ó s ito s de ilus tra c ión , se d e sc rib e a qu í un e je m p lo en el que tra m a s de vo z tie n e n poco ru ido o se p roce sa n a d e cu a d a m e n te p ara e lim in a r el ru ido . E n to nce s es p os ib le c o n s id e ra r d os ca ra c te rís tica s de cad a tra m a : ra íz cu a d ra d a m e d ia (<r>M<s>) de la e n e rg ía de la tra m a , y el p ico e sp e c tra l o m á x im o de la tra m a. En e s te caso, una co n s id e ra c ió n de la e n e rg ía en un co n ju n to de b a n d a s que tie n e n una ta sa co n s ta n te de a ncho de b an da a fre cu e n c ia co n d u ce a un e sp a c ia d o lo g a rítm ico de las b an da s de fre cu e n c ia . En g ran p arte del e sp ec tro , e s to re fle ja la n a tu ra le za de las b an da s p e rce p tu a le s ta l co m o el a ncho de b an da re c tilín e o e q u iva le n te (E R B ), la e sca la Bark, o el e sp a c ia d o m el. D eb ido a q ue el a ncho de b anda a u m e n ta lin e a lm e n te con la fre cu e n c ia , una e n e rg ía co n s ta n te p o r u n idad de fre cu e n c ia o ru ido b la n co te n d ría un e sp e c tro de p o te n c ia que a u m e n ta m o n ó to n a m e n te en ta l esca la .
La fig u ra 2 ilus tra un cu a d ro de d isp e rs ió n 201 y un g rá fico de b arras 202 de d a tos de a c tiv id a d de hab la a m odo de e je m p lo de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lga c ió n . E sp e c ífica m e n te , la fig u ra 1 ilus tra d a tos de a c tiv id a d del h ab la para un co n ju n to de fra se s de m u e s tra p ara re p re s e n ta r a c tiv id a d del h ab la e s tá n d a r (las " fra se s de H arva rd "). El cu a d ro de d isp e rs ió n 201 m u e s tra el n ivel R M S de una tra m a en d e c ib e lio s (dB ) com o una fu n c ió n de la fre cu e n c ia en H erc io s (H z). M ás e sp e c ífica m e n te , el cu a d ro de d isp e rs ió n 201 m u es tra tra m a s de 20 m ilise g u n d o s (m s) de las fra se s de H arva rd con co m b in a c ió n de 1/3 de octava . El g rá fico de b arras 202 m u e s tra los d a tos del cu a d ro de d isp e rs ió n 201 com o re cu e n to de b a n d a s de fre cu e n c ia , y só lo con s id e ra tra m a s con e n e rg ía p or e nc im a del su e lo de ru ido (a p ro x im a d a m e n te -60 dB). C om o se ilus tra en la fig u ra 2, los e je s h o rizo n ta le s e stán en una e sca la lo g a rítm ica m ie n tra s q ue los e je s ve rtic a le s e stán en una e sca la linea l (a u n q u e el p rop io dB re p re se n ta un v a lo r log a rítm ico ).
C o m o se p ue de v e r en la fig u ra 2, hay una g ran co n ce n tra c ió n de tra m a s de a lta e n e rg ía en b a jas fre cu e n c ia s (< 500 Hz). Las tra m a s de co n te n id o de m a yo r fre cu e n c ia (>2 kH z) son m e no re s en núm ero , a u n q u e son im p o rta n te s para la in te lig ib ilid a d y la lo ca liza c ió n del son ido . C o m o re su ltad o , tra m a s im p o rta n te s para g e s tio n a r la p re se n c ia e sp ac ia l, in te lig ib ilid a d y e sp e c tro s g e n e ra le s se p ue de n p e rd e r si el m e ca n ism o de m e zc la d o o se le cc ió n no tie n e en cu e n ta e sta d isp a r id a d de fre cu e n c ia . E s to es co n s is te n te con la idea de q ue la v o z es una p ro g re s ió n de fo n e m a s y q ue los fo n e m a s con un p ico en fre cu e n c ia s m ás a lta s son de n a tu ra le za so rd a y /o fr ica tiva .
D on de d os o m ás tra m a s de h ab la se su p e rp o n e n , la p ro b a b ilid a d de q ue haya una tra m a de a lta e n e rg ía en cu a lq u ie r in s ta n te aum e n ta . C u a n d o un se rv id o r, ta l co m o el s e rv id o r m u ltim e d ia 100 d e sc rito a n te rio rm e n te , se le cc io n a só lo un su b co n ju n to de las tra m a s de v o z a c tivas p ara su sa lid a en cu a lq u ie r ins ta n te , es p os ib le que la m e zc la de sa lid a e sté d o m in a d a p o r las tra m a s de fre cu e n c ia m ás baja. D e p e n d ie n d o del su b co n ju n to s e le cc io n a d o , d ive rsa s s itu a c io n e s p ueden p rod u c irse . P o r e je m p lo , el e sp e c tro g en era l de la m e zc la puede lle g a r a se r d o m in a d o por la e n e rg ía de ba ja fre cu e n c ia y de e ste m odo so n a r p e rce p tu a lm e n te a b u rrid o o m enos n ítido. En a lg u n o s casos, e sto p uede in c lu so s o n a r al o ye n te com o si el s is te m a e s tu v ie ra p e rd ie n d o a ncho de banda . A d e m á s, los co m p o n e n te s de a lta fre cu e n c ia que son im p o rta n te s para la in te lig ib ilid a d (p o r e je m p lo , en so n id o s fric a tiv o s o so rd o s) p ueden p e rd e rse y re d u c irse de la m ezc la . A d e m á s, el co n te n id o tra n s ito r io o de b an da a ncha q ue se p ie rd e p uede co n d u c ir a una re du cc ió n en la se n sa c ió n de p rese nc ia e sp ac ia l y un a ud io in m e rs ivo rico para ca so s en los q ue el co n ju n to re du c ido de flu jo s se re n d e riza e sp a c ia lm e n te en el c lien te .
P ro m in e n c ia p e rce p tu a l
P ara e v ita r las s itu a c io n e s m e n c io n a d a s a n te rio rm e n te , se in tro d u ce y a p lica una p on d e ra c ió n u o tro e sq u e m a de p rio r iza c ió n a las tra m a s de hab la. El e sq u e m a de p rio rizac ión p uede b asa rse en una o m ás de una e ne rg ía p on de ra da , c a ra c te rís tica s e s tru c tu ra le s o v e rb o s id a d , in c lu id a s c o m b in a c io n e s de las m ism as , y de ese m o do p ro p o rc io n a r una base para d e te rm in a r la p ro m in e n c ia p e rce p tu a l de una tra m a dada. La e n e rg ía p o n d e ra d a se re fie re a una in c lin a c ió n e sp e c tra l o fu n c ió n de p o n d e ra c ió n in tro d u c id a en el cá lcu lo de la e n e rg ía de una tra m a com o p ara e n fa tiz a r fre cu e n c ia s m ás a ltas . C a ra c te rís tica s e s tru c tu ra le s se re fie ren a la co n s id e ra c ió n de la re le va n c ia e s tru c tu ra l y /o se m á n tica de una tra m a , e inc lu ye n la co n s id e ra c ió n de la ca d e n c ia , en la que se da m a yo r p rio rid a d a las tra m a s de in ic io , y /o el e tiq u e ta d o fo n é tico , en el que la p rio riza c ió n e s tá se sg a d a para e n fa tiz a r tra m a s que tie n e n m a yo r co n te n id o de fre cu e n c ia e sp e c tra l y m e n o r e ne rg ía . V e rb o s id a d se re fie re a caso s en los q ue la p o n d e ra c ió n está d e sp la za d a , se sg a d a o e x tra íd a d ire c ta m e n te de ca n tid a d de ac tiv ida d re c ie n te o ve rb o s id a d de un flu jo d e te rm in a d o , in d ica n d o q ue un flu jo q ue in c lu ye a c tiv id a d m ás re c ien te p ro b a b le m e n te t ie n e u na a lta im p o rta n c ia se m á n tica y de e s te m o do m ás p ro b a b le m e n te es el foco de la a te n c ió n p e rce p tu a l.
C om o una base para p o n d e ra c ió n , co n s id e re el cu a d ro de d isp e rs ió n 201 ilu s tra d o en la fig u ra 2. Un cá lcu lo R M S típ ico de e s ta fo rm a se lle va ría a cab o u sa n d o la sum a de la p o te n c ia en las m u e s tra s de tie m p o o en las m u e s tra s de in te rva lo de fre cu e n c ia de una tra n s fo rm a d a de d o m in io de b lo q ue . En el caso de un s is te m a que u sa u na tra n s fo rm a d a de d o m in io de fre cu e n c ia , los in te rva lo s de fre cu e n c ia de la tra n s fo rm a d a p ue de n u sa rse . A q u í, la d ife re n c ia e n tre R M S y el cá lcu lo de p o te n c ia gen e ra l c o rre sp o n d e a la n o rm a liza c ió n p o r el ta m a ñ o del b lo q u e y la o p e ra c ió n de ra íz c u a d ra d a . C u a n d o los v a lo re s se e xp re sa n en dB , lo m ás s e n c illo d esde el p u n to de v is ta de una e xp lica c ió n , es re fe rirse a la e ne rg ía p ro m e d io (p o r m u e s tra ) o to ta l (p o r tra m a ) de l a ud io , a p e sa r de la o p e ra c ió n de ra íz cu a d ra d a , s in p é rd id a de g e n e ra lid a d . A d e m á s , s in p é rd id a de g e n e ra lid a d , la p o n d e ra c ió n p u e d e e xp lica rse con re fe re n c ia a un ú n ico can a l. P ara n tra m a s de m u es tra , la p o te n c ia de tra m a P p ue de re p re se n ta rse de a cu e rd o con la s ig u ie n te e xp re s ió n (1):
En la e xp re s ió n (1), x ( t)( t = 0, ..., n -1 ) es el a ud io ; w t es la fu n c ió n de v e n ta n a , p o r e je m p lo s in (n ( t+ .5 )/n ); y X (k ) p u e d e re p re se n ta rse de a cu e rd o con la s ig u ie n te e xp re s ió n (2):
La p o te n c ia P p u e d e ca lcu la rse a p a rtir de las m u e s tra s de a ud io d e s co d ifica d a s en una tra m a , o p o d ría e s ta r p re se n te d ire c ta m e n te en el flu jo de a ud io co d ifica d o . A d e m á s , la p o te n c ia P p o d ría e x tra e rse de a sp e c to s de la tra m a de co d ifica c ió n de a ud io , ta le s com o el e xp o n e n te en u na tra n s fo rm a d a de d o m in io de fre cu e n c ia , o de los p a re s e sp e c tra le s de líne as o la e n vo lve n te de fre cu e n c ia en un có d e c b a sa d o en m odo a u to rre g re s ivo . En a lg u n o s ca so s , la e n e rg ía c a lcu la d a p ara una tra m a p ue de in c lu ir a lgún p ro ce sa m ie n to , ta l com o la e lim in a c ió n de fre cu e n c ia m uy b a ja s (p o r e je m p lo , <100 H z) que a m e nu do están d o m in a d a s p o r ru ido .
El cua d ro de d isp e rs ió n 201 t ie n e una n a tu ra le za b ise c to ria l. P ara p ro p o rc io n a r m ás é n fa s is al s e c to r de pun to s de la d e re ch a , se p re se n ta una fu n c ió n de p o n d e ra c ió n H (k) de d o m in io de fre cu e n c ia . C on la fu n c ió n de p o n d e ra c ió n H (k), la e xp re s ió n (1 ) a n te r io r se co n v ie rte en la s ig u ie n te e xp re s ió n (3):
En la e xp re s ió n (3), la fu n c ió n de p o n d e ra c ió n H (k) e s tá re p re se n ta d a p o r la s ig u ie n te e xp re s ió n (4):
A rr ib a , h (t) es la re sp u e s ta al im p u lso en el d o m in io de tie m p o . R e p re se n ta n d o los c o e fic ie n te s de p o n d e ra c ió n de fre cu e n c ia com o Hk, la p o te n c ia P se co n v ie rte en la s ig u ie n te e xp re s ió n (5):
Las fig u ra s 3 A -3 C ilus tra n fu n c io n e s de p o n d e ra c ió n a m odo de e je m p lo 301 a , 301 b y 301 c y, com o re fe re n c ia , re p ro d u ce n el cu a d ro de d isp e rs ió n 201. C u a n d o no sea re le va n te d is tin g u ir e n tre la fu n c ió n p a rticu la r, la fun c ión p ue de d e n o m in a rse c o le c tiva m e n te fu n c ió n de p on de ra c ió n 301. P o r co n ve n ie n c ia , la fu n c ió n de p on de ra c ió n 301 se d e sc rib irá m e d ia n te los co e fic ie n te s p o n d e ra d o s de fre cu e n c ia en té rm in o s de Hz, in d ica n d o q ue la re lac ió n e n tre k y f e stá d e te rm in a d a p o r el ta m a ñ o del b lo q ue y la fre cu e n c ia de m u e s tre o (p o r e je m p lo , k = (n * f) /(F s x n)). La fig u ra 3 A ilus tra una fu n c ió n de p on d e ra c ió n de p o te n c ia 301a q ue tie n e la fo rm a p a rticu la r H (F) = ((2000 f) /6000 )8. E s ta fu n c ió n d e se n fa tiza el co n te n id o p o r d e b a jo de 1000 Hz y e n fa tiza el co n te n id o con e n e rg ía a 4000 Hz y su p e rio r. E ste e n fo q u e g a ra n tiza q ue las tra m a s de h ab la de m e n o r e n e rg ía de a lto co n te n id o in fo rm a tivo no se p ie rd en p o r el cá lcu lo RM S.
La fu n c ió n de p o n d e ra c ió n H (k) no se lim ita a una fu n c ió n de p o ten c ia . P or e je m p lo , las fig u ra s 3B y 3C ilus tran fu n c io n e s 301 b y 301 c de p o n d e ra c ió n linea l por pasos, re sp e c tiva m e n te . La fu n c ió n de p o n d e ra c ió n linea l por p asos 301 b de la fig u ra 3B a p lica una p on d e ra c ió n de -30 dB al co n te n id o p or d e b a jo de 1000 Hz, una p on d e ra c ió n de 20 dB al co n te n id o p or e n c im a de 5000 Hz y una p on d e ra c ió n q ue a u m e n ta lin e a lm e n te e n tre e llos. La fu n c ió n de p on d e ra c ió n linea l p o r p asos 301 b de la fig u ra 3B a p lica una p o n d e ra c ió n de -30 dB al co n te n id o p o r d e b a jo de 1000 Hz, una p on d e ra c ió n de 10 dB al co n te n id o p o r e nc im a de 2500 Hz, y una p on d e ra c ió n que a u m e n ta lin e a lm e n te e n tre e llos. Im p le m e n ta d a , la fu n c ió n de p on d e ra c ió n linea l p o r pasos 301 b a p lica rá é n fa s is a la s ib ila n c ia en el hab la. La fu n c ió n de p on d e ra c ió n linea l p o r p asos 301 c a p lica rá é n fas is a las fr ic a tiv a s y tra n s ito r io s c lave. T a n to la fu n c ió n de p o n d e ra c ió n linea l p o r pasos 301 b com o la fu n c ió n de p on d e ra c ió n linea l p o r p asos 301 c d e se n fa tiza rá n el s o n id o so n o ro y o c lu s ivo .
En cu a lq u ie r caso , la fu n c ió n de p o n d e ra c ió n 301 tie n e el im p a c to de g a ra n tiza r q ue el s e c to r en el lado d e re cho del cu a d ro de d isp e rs ió n 201 tie n e una p un tu ac ió n m ás a lta y es p re fe re nc ia l a las tra m a s de e n e rg ía de banda a ncha m ás fre cu e n te s y a lta s en el lad o izq u ie rd o del cua d ro de d isp e rs ió n 201. P o r lo tan to , un e sq u e m a de p rio riza c ió n b a sad o en la fu n c ió n de p on d e ra c ió n 301 p re se rva tra m a s m ás re le va n te s para re te n e r el co n te n id o de a lta fre cu e n c ia y la im p re s ió n de la voz , la in te lig ib ilid a d y las se ñ a le s e sp a c ia le s a so c ia d a s con estos fric a tiv o s y tra n s ito rio s . De e ste m odo, la fu n c ió n de p o n d e ra c ió n 301 so lu c io n a el se sg o de tra m a s le jos de la p ro m in e n c ia p e rce p tu a l d e se n fa tiza n d o el co n te n id o con una fre cu e n c ia in fe rio r a 1000 Hz y e n fa tiza n d o co n te n id o con una fre cu e n c ia s u p e r io r a 4000 Hz. De e sta m a nera , la fu n c ió n de p o n d e ra c ió n 301 no se lim ita a las fo rm a s e xa c ta s ilu s tra d a s en las fig u ra s 3A -3C .
El cá lcu lo de la p ro m in e n c ia p e rce p tu a l (es dec ir, la a p lica c ió n de fu n c ió n de p o n d e ra c ió n 301 a d a tos de aud io ) p re fe rib le m e n te lo re a liza el d isp o s itivo c lien te , ta l com o la p lu ra lid a d de d isp o s itivo s c lie n te 102 d e sc rito s a n te rio rm e n te . De e ste m odo, la p lu ra lid a d de flu jo s de a ud io ca rg a d o s p o r la co rre sp o n d ie n te p lu ra lid a d de d isp o s itivo s c lie n te p uede in c lu ir ta n to d a tos de aud io , q ue ind ican el co n te n id o del f lu jo de aud io, com o m e ta da tos , q ue ind ican la p o n d e ra c ió n y /o p ro m in e n c ia p e rce p tu a l del co n te n id o del f lu jo de aud io.
A d e m á s de la fu n c ió n de p on d e ra c ió n a n te r io rm e n te m e nc ion ad a , el cá lcu lo de p ro m in e n c ia p e rce p tu a l puede in c lu ir una ta sa de señ a l a ru ido (S N R ) de b an da in s ta n tá n e a , d e te cc ió n de in ic io , d e te cc ió n de o tro evento , p on d e ra c ió n de fo n e m a s , v e rb o s id a d , o co m b in a c io n e s de las m ism os.
La S N R de b an da in s ta n tá n e a se basa en las ideas de e s tim a c ió n de ru ido y e s tim a c ió n de p o te n c ia tra m a por tra m a a tra vé s de un co n ju n to de b an da s de fre cu e n c ia p e rce p tu a lm e n te e sp a c ia d a s (p o r e je m p lo , e sp a c ia d a s lo g a rítm ica m e n te ). En p rinc ip io , la e n e rg ía en una tra m a se d iv id e de un co n ju n to de n in te rva lo s de fre cu e n c ia de tra n s fo rm a d a en un co n ju n to de B b an da s p e rce p tu a le s a tra vé s de una m a triz de p o n d e ra c ió n Wb,k. E sto se p ue de re p re se n ta r de a cu e rd o con la s ig u ie n te e xp re s ió n (6):
A l ra s tre a r el m ín im o o a lg u na fo rm a de e s tim a c ió n del ru ido e s ta c io n a rio re c ie n te en la señ a l, es p os ib le e xa m in a r la ta sa de se ñ a l p re se n te en el fon do . E sto p ro p o rc io n a una m e d ic ió n en la que la a c tiv id a d en cada b an da p e rce p tu a l t ie n e igua l im p o rta n c ia in d e p e n d ie n te m e n te de la p o te n c ia a b so lu ta en e sa b an da o del n ivel de ru ido de fo n d o en esa banda . E sto se p ue de re p re se n ta r de a cu e rd o con las s ig u ie n te s e xp re s io n e s (7 ) y (8):
En la e xp re s ió n a n te rio r, S re p re se n ta un v a lo r de a c tiv id a d de señ a l b asad o en b a n da s p e rce p tu a le s y Nb re p re se n ta el ru ido e s ta c io n a rio re c ien te en la seña l.
La d e te cc ió n de in ic io se basa en un a n á lis is de una tra m a a n te r io r com o para e xp re sa r la a c tiv id a d en té rm in o s de p u n tu a c ió n de una d ife re n c ia p o s itiva cu a n d o la e n e rg ía en la tra m a actua l, a ju s ta d a p o r el ru ido e sta c io na rio , es s ig n ific a tiv a m e n te m a yo r q ue la de la tra m a a n te rio r. Esto p uede in c lu irse en la ca ra c te r iza c ió n de Nb de la e xp re s ió n (8) a n te rio r, in c lu id a la su s titu c ió n de la e xp re s ió n (8) p o r un p ro m e d io de u nas p ocas tra m a s re c ien te s de Pb. De e sta m anera , la a c tiv id a d de la señ a l S e s ta ría s e sg a d a a co n ta r so lo las b an da s q ue tu v ie ro n un re c ie n te in ic io o a u m e n to de ene rg ía .
O tras fo rm a s de d e te cc ió n de e ve n to p ue de n b a sa rse en una c la s ifica c ió n de a c tiv id a d del hab la. En tal c la s ifica c ió n , c a ra c te rís tica s a d ic io n a le s re la c io n a d a s con la fo rm a e sp e c tra l y /o la m e d ia y v a r ia n za de los p a rá m e tro s e s ta d ís tico s p ueden s e r e x tra íd a s de las ca ra c te rís tica s base. En un e je m p lo , un c la s if ica d o r p uede b a sa rse en la m e jo ra de c a ra c te rís tica s para c re a r un lím ite de d ec is ió n . El c la s if ica d o r puede , a d ic ion a l o a lte rn a tiva m e n te , b a sa rse en un cau da l e sp ec tra l, que es una m e d id a del g rad o en q ue las tra m a s a lte rn an entre los p icos e sp e c tra le s de ba ja fre cu e n c ia y a lta fre cu e n c ia a lo la rg o del tiem p o . De e sta m anera , el cauda l e sp e c tra l a ña de un é n fa s is h ac ia las tra m a s q ue un o ye n te te n d e ría a n o ta r que fa lta n con o tra m e d ic ión de e ne rg ía .
A d ic io n a l o a lte rn a tiva m e n te , un d isp o s itivo c lien te ta l com o los d isp o s itivo s c lie n te 102 d e sc rito s a n te rio rm e n te p ue de n e s ta r p ro v is to s de la ca p a c id a d de re a liza r a n á lis is del hab la, lo q ue p uede p ro p o rc io n a r una e s tim a c ió n in s ta n tá n e a de q ué fo n e m a e stá p re se n te en la en trada . En uno de ta le s e je m p los , el d isp o s itivo c lien te puede p o n d e ra r fo n e m a s b a sá n d o se en su en tro p ía , d an do a los fo n e m a s q ue se p rod u ce n con m e no s fre cu e n c ia o d u ra n te p e río d o s m ás corto s una p un tu ac ió n m ás a lta. E sto p ro p o rc io n a ría un ca m b io en la s e le cc ió n del hab la h ac ia tra m a s m ás p ro m in e n te s para p re se rva r el co n te n id o de a lta fre cu e n c ia y la e sp a c ia liza c ió n .
La se le cc ió n de flu jo s ta m b ié n p uede e s ta r s e sg a d a h ac ia la p re se rva c ió n de a q u e llo s flu jo s q ue han e s tado a c tiva s (o ve rb a liza d a s ) m ás re c ie n te m e n te . El se sg o de v e rb o s id a d p uede m e d irse b a sá n d o se en un a um e n to en la ve rb o s id a d de un f lu jo d ado d u ra n te los p e río d o s en los q ue e stá a c tiva m ie n tra s o tro s flu jo s no lo están. Un e je m p lo no lim ita tivo de un a lg o ritm o para d e te rm in a r la ve rb o s id a d V g e n e ra un v a lo r e n tre 0 y 1, s a tu ra n d o en cu a lq u ie r e x tre m o para p rop ó s ito s de n o rm a liza c ió n . Un v a lo r m ás a lto ind ica q ue el pun to fin a l ha e s ta d o m ás a c tivo y, de e s te m odo, es m ás p ro b a b le o a d e cu a d o q ue se m a n te n g a com o un ca m p o so n o ro re c ie n te m e n te a c tivo en la m e zc la de sa lid a . La ve rb o s id a d p uede m o d ifica rse en cad a tra m a o in s ta n te en el t ie m p o de a cu e rd o con un co n ju n to de p ará m e tros ; s in e m ba rg o , la p re se n te d ivu lg a c ió n no e stá p a rticu la rm e n te lim ita d a en qué p a rá m e tro s p ue de n se le cc io n a rs e o inc lu irse . G e n e ra lm e n te , la v e rb o s id a d V a u m e n ta rá cu a n d o un pun to fina l e s tá activo , y p uede a u m e n ta r m ás rá p id a m e n te si es el ú n ico pun to fin a l a c tivo en un m o m e n to dado. En caso de q ue no haya ac tiv ida d , es p os ib le que se m a n ten g an los n ive le s de ve rb o s id a d V o te n e r una ca íd a y v in c u la r la ca íd a a un d e sva n e c im ie n to del ca m p o so n o ro asoc iado .
En un e je m p lo , el se sg o o é n fa s is re su lta n te de un a lto v a lo r de ve rb o s id a d V e q u iva le a 6 dB de m a yo r po ten c ia o p ro m in e n c ia p e rce p tu a l p o n d e ra d a (P ) de las e xp re s io n e s a n te r io rm e n te c ita d as . Esto p uede re p re se n ta rse m e d ia n te la s ig u ie n te e xp re s ió n (9):
P(db) = 10 log10(P)6V (9)
En la e xp re s ió n (9), la e sca la de ve rb o s id a d V es a m o do de e je m p lo y no lim ita tiva . En lu g a r de una e sca la de 6 com o la a n te rio r, la e sca la p uede se r cu a lq u ie ra de 3 a 10 dB.
C u a lq u ie r co m b in a c ió n de los cá lcu lo s a n te r io re s se p ue de re a liza r en los d isp o s itivo s c lien te , en los se rv id o re s in te rm e d io s o en el s e rv id o r m u ltim e d ia . A d e m á s, las co m b in a c io n e s se p ue de n re a liza r u sa nd o una co m b in a c ió n de d isp o s itivo s . En un e je m p lo , el cá lcu lo de p ro m in e n c ia p e rce p tu a l a n tes de cu a lq u ie r d e sp la za m ie n to de v e rb o s id a d se p uede re a liza r en el d isp o s itivo c lien te , y d e s p la za m ie n to s a d ic io n a le s se p ueden re a liza r en un se rv id o r. La p o n d e ra c ió n p uede a d e m á s co d ifica rse en una se r ie de bits; p o r e je m p lo , con un có d ig o b in a rio x de 3 b its que va n d esde (000 ) a (111 ), la p o n d e ra c ió n p ue de c o d ifica rse com o P = -35 5x. Ta l co d ifica c ió n p uede fa c ilita r q ue el s e rv id o r m u ltim e d ia c la s if iq u e p aq ue te s , com o se d e sc rib irá con m ás d e ta lle a co n tinu ac ión .
Es p os ib le a d q u ir ir cu a lq u ie ra de los d a tos a n te rio res , ta l com o la tra m a R M S de la tra m a , s in a n a liza r la tra m a com p le ta . P o r e je m p lo , en un d o m in io de fre cu e n c ia , es p os ib le e x tra e r la tra m a R M S u sa nd o so lo la envo lve n te . En un co d ific a d o r de e s tilo de hab la, es p os ib le d e riv a r in fo rm a c ió n a p a rtir del v e c to r de e xc ita c ió n y de los p a rá m e tro s de co d ifica c ió n p re d ic tiva linea l (LP C ).
Los e sq u e m a s de p o n d e ra c ió n d e sc rito s a n te r io rm e n te están d ir ig id o s a p a q u e te s de voz , p rin c ip a lm e n te . En ca so s en los q ue la p on d e ra c ió n b asad a en vo z p ro p o rc io n a m ás se n s ib ilid a d de la d e se a d a (p o r e je m p lo , c ie rto s ca so s de ru ido de a ud io s in voz), es p os ib le a p lica r só lo los e sq u e m a s de p o n d e ra c ió n d on de el d isp o s itivo que re a liza la p o n d e ra c ió n e stá se g u ro de q ue la señ a l in c lu ye a c tiv id a d de voz.
M e zc la d o y se le cc ió n de flu jo s
Un d isp o s itivo se rv id o r, ta l com o el s e rv id o r m u ltim e d ia 101 d e sc rito a n te rio rm e n te , re c ibe y p ro ce sa la p lu ra lida d de flu jo s de a ud io ca rg a d o s p o r la co rre sp o n d ie n te p lu ra lid a d de d isp o s itivo s c lien te . Ta l p ro ce sa m ie n to in c lu ye la se le cc ió n de un su b co n ju n to de flu jo s de a ud io para re e n v ia r y /o m e zc la r en el d isp o s itivo se rv id o r in s ta n tá n e a m e n te . B a sá n d o se en los p rin c ip io s d e sc rito s a n te rio rm e n te , es p os ib le c re a r una in te rp re ta c ió n co n v in ce n te y a v e ce s p e rce p tu a lm e n te in d is tin g u ib le de un flu jo u sa n d o so lo un su b c o n ju n to de los flu jo s p o te n c ia lm e n te activos .
La fig u ra 4 ilus tra a m o do de e je m p lo un s is te m a de co m u n ica c ió n 400 de a cu e rd o con d ive rso s a sp e c to s de la p re se n te d ivu lg a c ió n q ue p uede im p le m e n ta r ta l p ro ce sa m ie n to . El s is te m a de c o m u n ica c ió n 400 p uede se r el m ism o o s im ila r a los s is te m a s de co m u n ica c ió n 100 d e sc rito s a n te rio rm e n te . El s is te m a de co m u n ica c ió n 400 in c lu ye un d isp o s itivo s e rv id o r 410 , que p uede s e r el m ism o o s im ila r al s e rv id o r m u ltim e d ia 101, y una p lu ra lida d de d isp o s itivo s c lie n te 420 , que p ueden s e r los m ism o s o s im ila re s a los d isp o s itivo s c lie n te 102.
C ad a uno de los d isp o s itivo s c lie n te 420 p ro p o rc io n a un f lu jo de a ud io al d isp o s itivo s e rv id o r 410 q ue inc lu ye d a to s de a ud io 421 y m e ta d a to s 422. M ie n tra s q ue la fig u ra 4 ilu s tra los d a tos de a ud io 421 y los m e ta d a to s 422 u sa nd o fle c h a s d ife re n te s ; en la p rác tica , el flu jo de a ud io p ue de in c lu ir los d a tos de a ud io 421 y los m e ta d a to s 422 c o d ifica d o s en un ú n ico f lu jo de datos . Los m e ta d a to s 422 p ueden in c lu ir d a tos in d ica tivo s de una p on d e ra c ió n y /o p ro m in e n c ia pe rce p tu a l, d a tos q ue ind ican una p os ic ió n e sp a c ia l en una e sce na , y /u o tro s datos. A d e m á s, a lg u n o s d a to s p ueden e s ta r in c lu id o s d e n tro de los d a tos de a ud io 421 m ie n tra s q ue o tros d a tos se in c lu ye n d en tro de los m e ta d a to s 422. En un e je m p lo no lim ita tivo , los d a tos de a ud io 421 in c lu ye n d a tos in d ica tivo s de la p o n d e ra c ió n y /o p ro m in e n c ia p e rce p tu a l m ie n tra s q ue los m e ta d a to s 422 in c lu ye n d a tos de p os ic ió n espac ia l.
El d isp o s itivo s e rv id o r 410 in c lu ye un s e rv id o r /e n ru ta d o r de f lu jo de a ud io 430 , un m e zc la d o r 470 y una u n id ad de p ro ce sa m ie n to y /o m u ltip le xa c ió n 480. En ca so s en los que se re a liza re n d e riza c ió n e sp ac ia l, el d isp o s itivo s e rv id o r 410 p uede in c lu ir una c a lcu la d o ra e sp ac ia l 440, una u n id ad de in fo rm a c ió n de e sce n a g lo b a l 450 , y un s e rv id o r de con tro l 460. El s e rv id o r /e n ru ta d o r de flu jo de a ud io 430 re c ibe los d a tos de a ud io 421 de la p lu ra lida d de d isp o s itivo s c lie n te 420 y ca te g o riza los d a tos en una p lu ra lid a d de co n ju n to s 431 -433. La ca te g o riza c ió n p ue de b asa rse en d a tos in c lu id o s en los d a tos de a ud io 421, los m e ta d a to s 422, o a m bo s. A d e m á s, m ie n tra s la fig u ra 4 ilus tra tre s co n ju n to s 431 -433 , la p re se n te d ivu lg a c ió n no e stá tan lim itad a . En a lg u n o s a sp e c to s de la p re se n te d ivu lga c ió n , só lo d os co n ju n to s (o cu a tro o m ás co n ju n to s ) p ueden p ro p o rc io n a rse . El s e rv id o r /e n ru ta d o r de flu jo de a u d io 430 p uede re a liza r la ca te g o riza c ió n c la s if ica n d o p rim e ro la p lu ra lid a d de flu jo s de a ud io b a sá n d o se en una m é trica p re d e te rm in a d a , ta l com o la p o n d e ra c ió n o la p ro m in e n c ia p erce p tu a l d e sc rita a n te rio rm e n te , y a g ru p a n d o los flu jo s de a ud io b a sá n d o se en su c la s ifica c ió n .
En un a sp e c to e je m p la r de la p re se n te d ivu lg a c ió n , el s e rv id o r /e n ru ta d o r de flu jo de a ud io 430 rec ibe L flu jo s de a u d io d esde L d isp o s itivo s c lien te 420, a g ru p a los N flu jo s de a ud io c la s if ica d o s m ás a rriba en el p rim e r con ju n to 431 , a g ru p a las M flu jo s de a ud io c la s if ica d o s m ás a ba jo en el te rc e r co n ju n to 433 , y a g ru p a flu jo s de a ud io de c la s if ica c ió n in te rm e d ia en el s e g u n d o co n ju n to 432. A n te rio rm e n te , L, M, y N son n ú m e ro s e n te ros in d e p e n d ie n te s , ta le s q ue L > M N. Los flu jo s de a ud io del p rim e r co n ju n to 431 p ueden re e n v ia rse com o un flu jo de sa lid a 490 a uno o m ás d isp o s itivo s de re ce p to r a tra vé s de la u n id ad de p ro ce sa m ie n to y /o m u ltip le xa c ió n 480; y los flu jo s de a ud io del te rce r co n ju n to 433 p ue de n d e sca rta rse o ign o ra rse . En a lgunos a sp e c to s de la p re se n te d ivu lg a c ió n , co n te n id o de a ud io de flu jo s de a ud io del s e g u n d o co n ju n to 432 se m e zc la en uno de los flu jo s de a ud io del p rim e r co n ju n to 431, para s e r re en v iad o com o parte del f lu jo de sa lid a 490. El se g u n d o c o n ju n to 432 p ue de s e r m e zc la do en el f lu jo c la s ifica d o m á s a ba jo del p rim e r co n ju n to 431 , p o r e jem p lo . El n ú m e ro de flu jo s en ca d a co n ju n to no e stá p a rticu la rm e n te lim itad o . En a lg u n o s casos, el p rim e r co n ju n to 431 p ue de in c lu ir só lo un ú n ico flu jo ; en o tros casos, el p rim e r co n ju n to 431 p ue de in c lu ir una p lu ra lid a d de flu jo s . El d isp o s itivo de re ce p to r p uede s e r uno c u a lq u ie ra o m ás de la p lu ra lid a d de d isp o s itivo s c lie n te 420 y /o un d isp o s itivo a d ic ion a l s e p a ra d o de la p lu ra lid a d de d isp o s itivo s c lie n te 420.
En c ie rta s o ca s io n es , N o M p ue de s e r cero. Es dec ir, en un pun to te m p o ra l dado, n in g un o de los flu jo s de a ud io de e n tra d a p ue de in c lu ir co n te n id o p rom ine n te , en cuyo caso el p rim e r co n ju n to 431 e s ta ría v a c ío (N = 0). Tal s itu a c ió n p uede p rod u c irse , p o r e je m p lo , cu a n d o los flu jo s de a ud io c o rre sp o n d ie n te s a to d o s los d isp o s itivo s c lie n te 420 inc lu ye n co n te n id o de a ud io re le va n te o d a tos de vo z q ue d eb en re e n v ia rse com o parte del f lu jo de sa lid a 490. A d e m á s, en un pun to te m p o ra l dado, to d o s de los flu jo s de a ud io de e n tra d a p ueden in c lu ir con ten ido p rom ine n te , en cuyo caso el te rc e r co n ju n to 433 e s ta ría v a c ío (M = 0). Ta l s itu a c ió n p ue de p rod u c irse , por e je m p lo , cu a n d o los flu jo s de a ud io c o rre sp o n d ie n te s a to d o s los d isp o s itivo s c lie n te 420 son s ile n c io s o s o in c lu ye n so lo d a tos que no son de voz.
El d isp o s itivo s e rv id o r 410 p uede re c ib ir to d o s los flu jo s de a ud io d esde la p lu ra lida d de d isp o s itivo s c lie n te 420 y re a liza r una ve rific a c ió n in s ta n tá n e a de los flu jo s re c ib id o s en cad a tra m a de có d e c de aud io , para d e te rm in a r así los flu jo s que son re le va n te s para el d isp o s itivo de recep to r. Los co n ju n to s p ue de n a c tu a liza rse a la ta sa de tra m a s de a ud io o a una ta sa m ás len ta q ue la ta sa de tra m a s de aud io . A d e m á s, en ca so s en los que hay m ú ltip le s d isp o s itivo s de re cep to r, el d isp o s itivo s e rv id o r 410 (p o r e je m p lo , m e d ia n te el s e rv id o r de con tro l 460) p ue de ca lc u la r los co n ju n to s 431 -433 de fo rm a in d e p e n d ie n te para cada d isp o s itivo de recep to r. La in fo rm a c ió n de la u n id ad de cá lcu lo e sp ac ia l 430 p ue de p ro p o rc io n a rse a la u n id ad de p ro ce sa m ie n to y /o m u ltip le xa c ió n 480 para s e r in c lu id a en el flu jo de sa lid a 490.
Los re sp e c tivo s d isp o s itivo s c lie n te 420 que a c tú an com o d isp o s itivo de re ce p to r p ue de n te n e r m ú ltip le s in s ta n c ia s de có d e cs para a d a p ta rse a los p o s ib le s flu jo s en tra n te s . En e ste caso, s in e m ba rg o , los d isp o s itivo s c lie n te 420 no n ece s ita n te n e r có d e cs p ara cu b rir to d a s las fu e n te s p o ten c ia le s , s in o q ue p ue de n in c lu ir un n ú m e ro de có d e cs su fic ie n te para g a ra n tiza r q ue hay una co n tin u id a d re la tiva del a ud io d e sco d ifica d o y el re n d e riza d o e sp ac ia l s i/c u a n d o se d e ten ga n e in ic ie n los flu jo s m e d ia n te la se le cc ió n in s ta n tá n e a de flu jo s para tra n s m it ir al d isp o s itivo s e rv id o r 410. Un flu jo que es d e te n id o a b ru p ta m e n te p ue de re q u e rir q ue una o dos tra m a s pasen a tra vé s del có d e c para d e sva n e ce rse o v o lv e r a un e s ta d o neu tra l.
En el caso de un có d e c de d o m in io de fre cu e n c ia , e sto e q u iva le a v a c ia r el b u ffe r de tra m a de d e sco d ifica c ió n q ue tie n e la p arte q ue se d e sva n e ce de la v e n ta n a su p e rp u e s ta . En el ca so de un có d e c b a sad o en un m o de lo o una red n eu ro na l p ro fu n d a (D N N ), e sto p ue de se r una b reve e x tra p o la c ió n de la tra ye c to ria del m o de lo de flu jo a c tu a l y rec ien te , a co p la d o con un d e sva n e c im ie n to a p ro p ia d o .
La fig u ra 5 ilus tra un a lg o ritm o a m o do de e je m p lo p ara d e te rm in a r los con jun tos , ta le s com o los co n ju n to s 431 433 ilu s tra d o s en la fig u ra 4. La fig u ra 5 ilus tra un a lg o ritm o a m o do de e je m p lo m e d ia n te el cua l los N flu jo s m ás p ro m in e n te s se re en v ía n a los d isp o s itivo s c lien te . En el p aso S 510, un d isp o s itivo s e rv id o r ta l com o el d isp o s itivo s e rv id o r 410 de la fig u ra 4 rec ibe un n úm e ro de p a q u e te s L. El paso S 520, el d isp o s itivo se rv id o r o rd e n a los p a q u e te s re c ib id os de a cu e rd o con una m é trica s e le cc io n a d a . El p aso S 520 p uede in c lu ir p rim e ro c la s if ica r la p lu ra lid a d de p aq u e te s b a sá n d o se en una m é trica p re d e te rm in a d a , ta l co m o la p o n d e ra c ió n o p ro m in e n c ia p e rce p tu a l d e sc rita a n te rio rm e n te , y a g ru p a r los flu jo s de a ud io b a sá n d o se en su c la s if ica c ió n de ta l fo rm a q ue los N flu jo s m ás p ro m in e n te s se a g ru p an en un p rim e r con jun to . En el p aso S 530, los p aq u e te s del p rim e r co n ju n to se re en v ía n a un d isp o s itivo de re ce p to r y los p aq u e te s re s ta n te s se d e sca rta n o ign o ran .
La fig u ra 6 A ilus tra un a lg o ritm o a m o do de e je m p lo m e d ia n te el cua l los N flu jo s m ás p ro m in e n te s se re en v ía n a los d isp o s itivo s c lien te , y el a ud io de los flu jo s de p ro m in e n c ia in te rm e d ia se in c lu ye com o una m ezc la . En el paso S 610, un d isp o s itivo s e rv id o r ta l com o el d isp o s itivo s e rv id o r 410 de la fig u ra 4 rec ibe una c a n tid a d de p a q u e te s L. En el p aso S 620, el d isp o s itivo s e rv id o r o rde n a los p a q u e te s re c ib id o s de a cu e rd o con una m é trica s e le cc io n a d a . El p aso S 620 p uede in c lu ir p rim e ro c la s if ica r la p lu ra lida d de p aq u e te s b a sá n d o se en una m é trica p re d e te rm in a d a , ta l com o la p o n d e ra c ió n o p ro m in e n c ia p e rce p tu a l d e sc rita a n te rio rm e n te , y a g ru p a r los flu jo s de a ud io b a sá n d o se en su c la s ifica c ió n de ta l fo rm a q ue los N flu jo s m ás p ro m in e n te s se a g ru p a n en un p rim e r con jun to , los flu jo s de p ro m in e n c ia in te rm e d ia se a g ru p an en un s e g u n d o con jun to , y los M flu jo s m enos p ro m in e n te s se a g ru p a n en un te rc e r con jun to . En el paso S 630, el a ud io p ro ce d e n te de los flu jo s de p ro m in e n c ia in te rm e d ia (es dec ir, flu jo s que no son ni los N m ás p ro m in e n te s ni los M m e no s p ro m in e n te s ) se m e zc la n en el p a q u e te m enos p ro m in e n te del p rim e r con jun to . D on de el n úm e ro to ta l de p a q u e te s es L, el n ú m e ro de p aq u e te s m ás p ro m in e n te s es N, y el n úm e ro de p aq u e te s m e no s p ro m in e n te s es M, los flu jo s de p ro m in e n c ia in te rm e d ia p ueden d e n o ta rse co m o el co n ju n to [N 1, L -M -1 ] y el p a q u e te m e no s p ro m in e n te del p rim e r co n ju n to p uede d e n o ta rse p a q u e te N. En el p aso<s>640, los p aq u e te s del p rim e r con jun to , que inc lu ye n a ud io del se g u n d o co n ju n to com o una m ezc la , se re e n v ía n a un d isp o s itivo de re ce p to r y el res to de los M p aq u e te s se d e sca rta n o igno ran .
Si b ien, com o se se ñ a ló a n te rio rm e n te , N y M no e s tán p a rticu la rm e n te lim itad os , en a lg u n o s a sp e c to s de la p re se n te d ivu lg a c ió n N p uede s e r igua l a d os o tres.
H ay ca so s en los que los flu jo s q ue se re en v ía n d e sd e el s e rv id o r n eces itan a ju s ta rse en una ta sa de bits to ta l m áxim a . En e s to s caso s, hay q ue d e c id ir cóm o a s ig n a r b its e n tre flu jo s . El e n fo q u e p re fe rid o es a s ig n a r m ás bits a flu jo s de m a yo r p rom ine nc ia . La fig u ra 6B ilus tra un a lg o ritm o a m o do de e je m p lo para a s ig n a r b its e n tre flu jo s in d iv id u a le s cu a n d o el to ta l de los N flu jo s re e n v ia d o s d ebe lim ita rse a una ta sa de b its m á x im a p re d e te rm in a d a fija . En e ste caso , la a s ig n a c ió n de bits a cada f lu jo se o rd e n a de a cu e rd o con la m é trica de p rom ine nc ia , por e je m p lo b a sá n d o se en la e n e rg ía pon de ra da , de ta l fo rm a q ue cad a f lu jo de m e n o r p ro m in e n c ia rec ibe un n ú m e ro igua l o m e n o r de bits q ue los a s ig n a d o s a un flu jo de m a yo r p rom ine nc ia . P o r e je m p lo , si se e sp e c ifica un 'd e p ó s ito de b its ' to ta l de 48 kbps con un lím ite de tre s flu jo s , e n to n ce s se p o d rían a s ig n a r 24 K bp s al p rim e r flu jo , 12 K bp s al s e g u n d o y te rc e r flu jo . En e ste caso, los 24 kbps se a s ig n a ría n al flu jo con m a yo r p ro m in e n c ia y los 12 K bp s a ca d a uno de los p a q u e te s con m e n o r p rom ine nc ia . En el paso S 650, un d isp o s itivo s e rv id o r tal co m o el d isp o s itivo s e rv id o r 410 de la fig u ra 4 rec ibe un n úm e ro de p a q u e te s L. En el paso S 660 , el d isp o s itivo s e rv id o r o rde n a los p aq u e te s re c ib id o s de a cu e rd o con una m é trica s e le cc io n a d a . El p aso S 660 p uede inc lu ir p rim e ro c la s if ica r la p lu ra lid a d de p aq u e te s b a sá n d o se en una m é trica p re d e te rm in a d a , ta l co m o la p o n d e ra c ió n u o tra m é trica de p ro m in e n c ia p e rce p tu a l d e sc rita a n te rio rm e n te , y a g ru p a r los flu jo s de a ud io b a sá n d o se en su c la s ifica c ió n de fo rm a q ue los N flu jo s m ás p ro m in e n te s se a g ru p a n en un p rim e r con jun to , las co rrie n te s de p ro m in e n c ia in te rm e d ia se a g ru p a n en un se g u n d o co n ju n to y los M flu jo s m e no s p ro m in e n te s se a g ru p an en un te rc e r con jun to . En el paso S 670 , el d isp o s itivo s e rv id o r a s ig n a bits a cad a uno de los N flu jo s en o rde n de p rom ine nc ia , de ta l fo rm a q ue el to ta l no e xce d e la ta sa de b its m áxim a . En el p aso S 680 , los p a q u e te s del p rim e r con jun to , q ue in c lu ye n a ud io del s e g u n d o co n ju n to com o una m ezc la , se reen v ía n a un d isp o s itivo de re ce p to r y el res to de los M p aq u e te s se d esca rta n o ignoran .
Si b ien, com o se se ñ a ló a n te rio rm e n te , N y M no están p a rticu la rm e n te lim itad os , en a lg u n o s a sp e c to s de la p re se n te d ivu lg a c ió n N p uede s e r igua l a d os o tre s
La fig u ra 7 ilu s tra o tro a lg o ritm o a m o do de e je m p lo para a s ig n a r b its e n tre flu jo s in d iv id u a le s cu a n d o el to ta l de los N flu jo s re e n v ia d o s d eb e lim ita rse a una ta sa de bits m á x im a p re d e te rm in a d a fija . En e ste a lg o ritm o , los flu jo s p o r d e b a jo del um bra l se m e zc la n en el p a q u e te de m a yo r p ro m in e n c ia y lue g o los b its se a s ig n a n a cada f lu jo en o rde n de p rom ine nc ia , d o n d e un f lu jo de m e n o r p ro m in e n c ia re c ibe un n úm e ro igua l o m e n o r de b its que un flu jo de m a yo r p rom ine nc ia . En el paso S 710, un d isp o s itivo s e rv id o r ta l co m o el d isp o s itivo s e rv id o r 410 de la fig u ra 4 re c ibe un n úm e ro de p aq u e te s L. En el paso S 720, el d isp o s itivo s e rv id o r o rd e n a los p a q u e te s re c ib id o s de a cu e rd o con una m é trica s e le cc io n a d a . El paso S 720 p uede in c lu ir p rim e ro c la s if ica r la p lu ra lid a d de p aq u e te s b a sá n d o se en una m é trica p re d e te rm in a d a , ta l com o la p on d e ra c ió n o la p ro m in e n c ia p e rce p tu a l d escrita a n te rio rm e n te , y a g ru p a r los flu jo s de a ud io b a sá n d o se en su c la s if ica c ió n de ta l fo rm a q ue los N flu jo s m ás p ro m in e n te s se a g ru p a n en un p rim e r con jun to , las co rrie n te s de p ro m in e n c ia in te rm e d ia se a g ru p a n en un s e g u n d o co n ju n to y los M flu jo s m e no s p ro m in e n te s se a g ru p an en un te rce r con jun to . En el paso S 730, el a ud io de los flu jo s de p ro m in e n c ia in te rm e d ia (es dec ir, flu jo s que no son ni los N m ás p ro m in e n te s ni los M m enos p ro m in e n te s ) se m e zc la n en el p a q u e te 1, q ue co rre sp o n d e al flu jo de m a yo r p rom ine nc ia . En el p aso S 7400 , el d isp o s itivo s e rv id o r a s ig n a b its a cad a uno de los N flu jo s en o rde n de p ro m in e n c ia , de ta l fo rm a q ue el to ta l no e xce d e la ta sa de b its m áxim a . En el paso S 750 , los p a q u e te s del p rim e r con jun to , q ue in c lu ye n a ud io del s e g u n d o co n ju n to com o una m ezc la , se re en v ía n a un d isp o s itivo de re ce p to r y el re s to de los M p aq u e te s se d e sca rta n o igno ran .
Si b ien, com o se se ñ a ló a n te rio rm e n te , N y M no están p a rticu la rm e n te lim itad os , en a lg u n o s a sp e c to s de la p re se n te d ivu lg a c ió n N p uede se r igua l a d os o tres.
A p lic a c io n e s
C on re sp e c to a los p roce so s , s is te m a s , m é todos , heu rís ticas , etc. d e sc rito s en el p re se n te d o cu m e n to , d ebe e n te n d e rse que, a u n q u e los p asos de ta le s p roce so s , etc, han s id o d e sc rito s com o se p rod u ce n de a cu e rd o con una c ie rta s e cu e n c ia o rd e n a d a , ta le s p ro ce so s p od rían p ra c tica rse con los p asos d e sc rito s re a liza d o s en un o rde n d is tin to al d e sc rito en el p re se n te d o cu m e n to . A d e m á s d ebe e n te n d e rse que c ie rto s p asos p od rían re a liza rse s im u ltá n e a m e n te , q ue o tros p asos p od rían a ña d irse , o q ue c ie rto s pasos d e sc rito s en el p rese n te d o cu m e n to p od rían om itirse . En o tra s p a labras , las d e sc rip c io n e s de los p ro ce so s en el p re se n te d o cu m e n to se p ro p o rc io n a n con el p ro p ó s ito de ilu s tra r c ie rta s re a liza c io n e s , y de n in g u n a m a n e ra d eben in te rp re ta rse com o para lim ita r las re iv ind ica c ion es .
Los e je m p lo s a n te r io re s se han d e sc rito p rin c ip a lm e n te con re sp e c to a la g es tión y re n d e riza d o de e sce n a s de voz ; s in e m ba rg o , la p re se n te d ivu lg a c ió n no d eb e in te rp re ta rse só lo co m o a p lica b le o e sp e c ífica de co n te n id o de voz . Los c o n ce p to s d e sc rito s en la p re se n te d ivu lg a c ió n p ueden e x te n d e rse g e n e ra lm e n te a cu a lq u ie r señ a l de n a tu ra le za a lta m e n te tra n s ito ria , in c lu id o co n te n id o de in fo rm a c ió n s e m á n tica y p o te n c ia lm e n te in te ra c tiva . Las d e sc rip c io n e s a n te r io rm e n te d e sc rita s de la p e rce p c ió n h u m a n a de la vo z y de los so n id o s s im ila re s a la vo z se p ro p o rc io n a n com o e je m p lo s y no com o re s tr ic c io n e s del uso del s is te m a.
A d e m á s, si b ien la p re se n te d ivu lg a c ió n m e n c io n a g e n e ra lm e n te a sp e c to s de in fo rm a c ió n e sp ac ia l en té rm in o s de re co m b in a c ió n y re n d e riza d o de a ud io en el c lie n te fina l, la p re se n te d ivu lg a c ió n p uede e x te n d e rse a s itu a c io n e s en las q ue hay flu jo s de a ud io q ue tie n e n in fo rm a c ió n e xp líc ita so b re su p os ic ión d e s tin a d a en el flu jo , un id e n tif ic a d o r e in fo rm a c ió n del lado del c lien te o d e c is io n e s so b re d ó n d e re n d e riza r el flu jo , o a lg u na co m b in a c ió n de a m bo s o ju n to s . La in fo rm a c ió n p uede co m b in a rse a d e m á s con in fo rm a c ió n a d ic io n a l de con tro l de e sce n a de o tros s is te m a s de con tro l de aud io . De e sta m a ne ra , la a p lica c ió n e sp ac ia l re p re se n ta un s u p e rco n ju n to q ue ta m b ié n a b a rca m ono, d o n d e la m a yo r p arte de la in fo rm a c ió n d ire cc io n a l y /o de d is ta n c ia d e s tin a d a a co n tro la r el re n d e riza d o p uede ig n o ra rse o no e s ta r p resen te . C u a n d o una e sce n a se re nd e riza u sa nd o té c n ica s de a ud io e sp ac ia l para c re a r una im a ge n e sp ac ia l al usuario , el a ud io p ue de e n tre g a rse de m u ch a s m a n e ra s d ife re n te s . P o r e je m p lo , los flu jo s de a ud io p ue de n e n tre g a rse a tra vé s de a u ricu la re s (b in a u ra le s ) y s im u la r la p ro p a g a c ió n a cú s tica y la a cú s tica e sp ac ia l q ue p od ría p ro d u c irse si el so n id o re a lm en te e s tu v ie ra p re se n te ce rca del usuario ; a lte rn a tiva m e n te , la sa lid a de v a r ia s p o s ic io n e s de a lta vo ce s a lre d e d o r de un o ye n te p uede c o n tro la rse p ara c re a r una se n sa c ió n de un ca m p o so n o ro a p ro x im a d o o p e rce p tu a lm e n te e fectivo .
La p re se n te d ivu lg a c ió n se re fie re a un co n ju n to de flu jo s de aud io, cada uno de los cu a le s p ro v ie n e de una fu e n te p a rticu la r que p uede te n e r a c tiv id a d in d e p e n d ie n te de las o tras fue n te s . S in e m ba rg o , cad a uno de estos flu jo s de a ud io no n ece s ita n re p re se n ta r só lo un cana l de aud io. Los p rop ios flu jo s de a ud io p ue de n te n e r c a ra c te rís tica s de a ud io e sp ac ia l ya p a rc ia lm e n te c o d ifica d a s en e llos; por e je m p lo , un flu jo p uede se r aud io b in a ura l o a lg u n a fo rm a de a ud io e sp ac ia l m u ltica na l. A d e m á s, d e n tro de un f lu jo d ad o p uede hab e r cap as a d ic io n a le s y un e n fo q u e je rá rq u ic o para re p re se n ta r fid e lid a d ta n to en té rm in o s de p rec is ión de la señ a l (por e je m p lo , ta s a de b its) y p rec is ión e sp ac ia l (p o r e je m p lo , cap as o cana les).
En d ive rsa s im p le m e n ta c io n e s , las te c n o lo g ía s d ivu lg a d a s en e sta m e m o ria d e sc rip tiva son a p licab les , pero no están lim itad as , a la co d ifica c ió n de a ud io de a ud io m u ltica na l, d on de un s is te m a de c o m u n ica c ió n p uede s e r un s is te m a de co d ifica c ió n de aud io , un s e rv id o r m u ltim e d ia p uede s e r un co d ific a d o r de aud io , y un c lien te puede s e r una fu e n te de aud io.

Claims (13)

REIVINDICACIONES
1. Un s is te m a de co m u n ica c ió n , q ue com p re nd e :
un s e rv id o r m u ltim e d ia co n fig u ra d o para re c ib ir una p lu ra lid a d de flu jo s de a ud io d esde una co rre sp o n d ie n te p lu ra lid a d de d isp o s itivo s c lien te , in c lu ye n d o el s e rv id o r m u ltim e d ia c ircu ite ría co n fig u ra d a para:
c la s if ica r la p lu ra lid a d de flu jo s de a ud io b a sá n d o se en una m é trica p re d e te rm in a d a ; en el q ue la m é trica para un flu jo de a ud io co m p re n d e una e n e rg ía p o n d e ra d a de una tra m a del f lu jo de aud io; en el que la e n e rg ía p o n d e ra d a de la tra m a del f lu jo de a ud io se d e te rm in a u sa nd o una fu n c ió n de p on d e ra c ió n que d e se n fa tiza co n te n id o de fre cu e n c ia e sp e c tra l con una fre cu e n c ia in fe rio r a 1000 Hz y q ue e n fa tiza co n te n id o de fre cu e n c ia e sp ec tra l con una fre cu e n c ia s u p e r io r a 4000 Hz,
a g ru p a r una p rim e ra p orc ión de la p lu ra lid a d de flu jo s de a ud io en un p rim e r con jun to , s ie n d o la p rim e ra porc ión de la p lu ra lid a d de flu jo s de a ud io los N flu jo s de a ud io c la s if ica d o s m ás arriba,
a g ru p a r una s e g u n d a porc ió n de la p lu ra lid a d de flu jo s de a ud io en un s e g u n d o con jun to , s ie n d o la se g u n d a p o rc ió n de la p lu ra lid a d de flu jo s de a ud io los M flu jo s de a ud io c la s if ica d o s m ás aba jo,
re e n v ia r re sp e c tivo s flu jo s de a ud io del p rim e r co n ju n to a un d isp o s itivo de recep to r, y
d e s c a rta r re sp e c tivo s flu jo s de a ud io del s e g u n d o con jun to ,
en el q ue N y M son n ú m e ro s e n te ro s in d e p e n d ie n te s .
2. El s is te m a de c o m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 1, c o n fig u ra d a a d e m á s la c ircu ite ría para:
a g ru p a r una te rce ra p orc ión de la p lu ra lid a d de flu jo s de a ud io en un te rce r con jun to , s ie n d o la te rce ra porc ió n de la p lu ra lid a d de flu jo s de a ud io los flu jo s de a ud io c la s ifica d o s e n tre la p rim e ra porc ió n y la s e g u n d a porc ión , y m e zc la r un co n te n id o de a ud io del te rce r co n ju n to en uno de los flu jo s de a ud io del p rim e r con jun to .
3. El s is te m a de co m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 1 ó 2, en el q ue unos re sp e c tivo s de la p lu ra lida d de flu jo s de a ud io in c lu ye n d a tos y m e ta d a to s de aud io , in c lu ye n d o los m e ta d a to s de un f lu jo de a ud io d a tos in d ica tivo s de la e n e rg ía p o n d e ra d a de una tra m a del flu jo de aud io.
4. El s is te m a de co m u n ica c ió n de a cu e rd o con cu a lq u ie ra de las re iv in d ica c io n e s 1 a 3, en el q ue a ca d a flu jo q ue va a s e r re e n v ia d o m e d ia n te el s e rv id o r se le a s ig na n b its en el que flu jo s de c la s ifica c ió n m á s a lta rec iben b its ig u a le s o m ás a lto s q ue flu jo s de c la s ifica c ió n m ás baja.
5. El s is te m a de co m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 3 ó 4, en el q ue los m e ta d a to s de un flu jo de a u d io in c lu ye n a d e m á s d a tos q ue ind ican una p os ic ió n e sp a c ia l en una escena .
6. El s is te m a de c o m u n ica c ió n de a cu e rd o con una cu a lq u ie ra de las re iv in d ica c io n e s 1 a 5, en el q ue el d isp o s itivo de re ce p to r es uno de la p lu ra lid a d de d isp o s itivo s c lien te .
7. Un m é to do de co m u n ica c ió n , q ue com p re nd e :
re c ib ir una p lu ra lida d de flu jo s de a ud io d esde una co rre sp o n d ie n te p lu ra lida d de d isp o s itivo s c lien te ;
c la s if ica r la p lu ra lid a d de flu jo s de a ud io b a sá n d o se en una m é trica p re d e te rm in a d a ; en el q ue la m é trica para un flu jo de a ud io co m p re n d e una e n e rg ía p o n d e ra d a de una tra m a del f lu jo de aud io; en el que la e n e rg ía p o n d e ra d a de la tra m a del f lu jo de a ud io se d e te rm in a u sa nd o una fu n c ió n de p on d e ra c ió n que d e se n fa tiza co n te n id o de fre cu e n c ia e sp e c tra l con una fre cu e n c ia in fe rio r a 1000 Hz y q ue e n fa tiza co n te n id o de fre cu e n c ia e sp ec tra l con una fre cu e n c ia s u p e r io r a 4000 Hz;
a g ru p a r una p rim e ra p orc ión de la p lu ra lid a d de flu jo s de a ud io en un p rim e r con jun to , s ie n d o la p rim e ra porc ión de la p lu ra lid a d de flu jo s de a ud io los N flu jo s de a ud io c la s if ica d o s m ás arriba;
a g ru p a r una s e g u n d a porc ió n de la p lu ra lid a d de flu jo s de a ud io en un s e g u n d o con jun to , s ie n d o la se g u n d a p o rc ió n de la p lu ra lid a d de flu jo s de a ud io los M flu jo s de a ud io c la s if ica d o s m ás aba jo;
re e n v ia r re sp e c tivo s flu jo s de a ud io del p rim e r co n ju n to a un d isp o s itivo de recep to r; y
d e s c a rta r re sp e c tivo s flu jo s de a ud io del s e g u n d o con jun to ,
en el q ue N y M son n ú m e ro s e n te ro s in d e p e n d ie n te s .
8. El m é to d o de c o m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 7, q ue co m p re n d e adem ás:
a g ru p a r una te rce ra p orc ión de la p lu ra lid a d de flu jo s de a ud io en un te rce r con jun to , s ie n d o la te rce ra porc ió n de la p lu ra lid a d de flu jo s de a ud io los flu jo s de a ud io c la s ifica d o s e n tre la p rim e ra porc ió n y la s e g u n d a porc ión , y m e zc la r un co n te n id o de a ud io del te rce r co n ju n to en uno de los flu jo s de a ud io del p rim e r con jun to .
9. El m é to do de c o m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 7 u 8, en el q ue unos re sp e c tivo s de la p lu ra lida d de flu jo s de a ud io in c lu ye n d a tos y m e ta d a to s de aud io , in c lu ye n d o los m e ta d a to s de un f lu jo de a ud io d a tos in d ica tivo s de la e n e rg ía p o n d e ra d a de una tra m a del flu jo de aud io.
10. El m é to do de co m u n ica c ió n de a cu e rd o con cu a lq u ie ra de las re iv in d ica c io n e s 7 a 9, en el q ue a cad a f lu jo se le a s ig n a n bits, en el que flu jo s de c la s ifica c ió n m ás a lta rec iben b its ig u a le s o m ás a lto s q ue flu jo s de c la s ifica c ió n m ás baja.
11. El m é to d o de co m u n ica c ió n de a cu e rd o con la re iv in d ica c ió n 9 ó 10, en el q ue los m e ta d a to s de un flu jo de a ud io in c lu ye n a d e m á s d a tos q ue ind ican una p os ic ió n e sp a c ia l en una escena .
12. El m é to d o de co m u n ica c ió n de a cu e rd o con una cu a lq u ie ra de las re iv in d ica c io n e s 7 a 11, en el q ue el d isp o s itivo de re ce p to r es uno de la p lu ra lid a d de d isp o s itivo s c lien te .
13. Un m e d io no tra n s ito r io leg ib le por o rd e n a d o r q ue a lm a ce n a in s tru cc io n e s que, cu a n d o son e je cu ta d a s p or un p ro ce sa d o r de un s e rv id o r m u ltim e d ia , hacen q ue el s e rv id o r m u ltim e d ia re a lice el m é to do de cu a lq u ie ra de las re iv in d ica c io n e s 7 a 11.
ES20721134T 2019-04-03 2020-04-03 Servidor multimedia de escena de voz escalable Active ES2967185T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
CN2019081317 2019-04-03
US201962840857P 2019-04-30 2019-04-30
EP19186491 2019-07-16
CN2020076047 2020-02-20
US202062991645P 2020-03-19 2020-03-19
PCT/US2020/026710 WO2020206344A1 (en) 2019-04-03 2020-04-03 Scalable voice scene media server

Publications (1)

Publication Number Publication Date
ES2967185T3 true ES2967185T3 (es) 2024-04-29

Family

ID=70417472

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20721134T Active ES2967185T3 (es) 2019-04-03 2020-04-03 Servidor multimedia de escena de voz escalable

Country Status (8)

Country Link
US (1) US11803351B2 (es)
EP (1) EP3949368B1 (es)
JP (1) JP2022527111A (es)
KR (1) KR20210145265A (es)
CN (1) CN113812136A (es)
BR (1) BR112021019785A2 (es)
ES (1) ES2967185T3 (es)
WO (1) WO2020206344A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4111125A1 (en) 2020-02-24 2023-01-04 Zephyros, Inc. Ballistic composition, ballistic assembly, and method therefor

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230130B1 (en) 1998-05-18 2001-05-08 U.S. Philips Corporation Scalable mixing for speech streaming
US6683858B1 (en) 2000-06-28 2004-01-27 Paltalk Holdings, Inc. Hybrid server architecture for mixing and non-mixing client conferencing
WO2002084645A2 (en) 2001-04-13 2002-10-24 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
DK1629463T3 (da) 2003-05-28 2007-12-10 Dolby Lab Licensing Corp Fremgangsmåde, apparat og computerprogram til beregning og justering af den opfattede styrke af et audiosignal
AU2005234518A1 (en) 2004-04-16 2005-10-27 Dolby Laboratories Licensing Corporation Apparatuses and methods for use in creating an audio scene
EP1738541B1 (en) 2004-04-16 2018-01-10 Dolby Laboratories Licensing Corporation Device and method for routeing a unit of data in a network
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
EP1897012B1 (en) 2005-06-24 2019-07-17 Dolby Laboratories Licensing Corporation Immersive audio communication
US20070253558A1 (en) 2006-05-01 2007-11-01 Xudong Song Methods and apparatuses for processing audio streams for use with multiple devices
EP1855455B1 (en) 2006-05-11 2011-10-05 Global IP Solutions (GIPS) AB Audio mixing
WO2008026754A1 (fr) 2006-08-30 2008-03-06 Nec Corporation Procédé de mixage vocal, serveur de conférence multipoint utilisant le procédé et programme
US9172796B2 (en) 2007-03-14 2015-10-27 Cisco Technology, Inc. Location based mixer priorities in conferences
CN101641936B (zh) 2007-03-29 2013-06-12 艾利森电话股份有限公司 群组通信系统中的媒体流建立
US9602295B1 (en) 2007-11-09 2017-03-21 Avaya Inc. Audio conferencing server for the internet
US20120076305A1 (en) 2009-05-27 2012-03-29 Nokia Corporation Spatial Audio Mixing Arrangement
JP5511106B2 (ja) 2009-11-06 2014-06-04 フリースケール セミコンダクター インコーポレイテッド 電話会議システム、方法、およびコンピュータ・プログラム製品
EP2502155A4 (en) * 2010-11-12 2013-12-04 Polycom Inc HIERARCHICAL AUDIO CODING IN A MULTIPOINT ENVIRONMENT
US8984156B2 (en) 2011-07-21 2015-03-17 Salesforce.Com, Inc. Multi-party mesh conferencing with stream processing
EP2829051B1 (en) 2012-03-23 2019-07-17 Dolby Laboratories Licensing Corporation Placement of talkers in 2d or 3d conference scene
US9654644B2 (en) * 2012-03-23 2017-05-16 Dolby Laboratories Licensing Corporation Placement of sound signals in a 2D or 3D audio conference
EP2829050A1 (en) * 2012-03-23 2015-01-28 Dolby Laboratories Licensing Corporation Schemes for emphasizing talkers in a 2d or 3d conference scene
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014052431A1 (en) 2012-09-27 2014-04-03 Dolby Laboratories Licensing Corporation Method for improving perceptual continuity in a spatial teleconferencing system
ES2728138T3 (es) 2012-12-27 2019-10-22 Bosch Gmbh Robert Disposición de transmisión de audio
US9445053B2 (en) 2013-02-28 2016-09-13 Dolby Laboratories Licensing Corporation Layered mixing for sound field conferencing system
FR3003682A1 (fr) 2013-03-25 2014-09-26 France Telecom Mixage partiel optimise de flux audio codes selon un codage par sous-bandes
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US10009475B2 (en) 2014-02-28 2018-06-26 Dolby Laboratories Licensing Corporation Perceptually continuous mixing in a teleconference
US9876913B2 (en) 2014-02-28 2018-01-23 Dolby Laboratories Licensing Corporation Perceptual continuity using change blindness in conferencing
US10237412B2 (en) * 2014-04-18 2019-03-19 Nuance Communications, Inc. System and method for audio conferencing
MY186995A (en) * 2015-04-22 2021-08-26 Huawei Tech Co Ltd An audio signal processing apparatus and method
WO2017075279A1 (en) 2015-10-27 2017-05-04 ZALON, Zack, J. Audio content production, audio sequencing, and audio blending system and method
CN108766451B (zh) * 2018-05-31 2020-10-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频文件处理方法、装置和存储介质

Also Published As

Publication number Publication date
WO2020206344A1 (en) 2020-10-08
KR20210145265A (ko) 2021-12-01
CN113812136A (zh) 2021-12-17
US20220197592A1 (en) 2022-06-23
EP3949368B1 (en) 2023-11-01
EP3949368A1 (en) 2022-02-09
BR112021019785A2 (pt) 2021-12-07
US11803351B2 (en) 2023-10-31
JP2022527111A (ja) 2022-05-30

Similar Documents

Publication Publication Date Title
RU2763155C2 (ru) Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования
ES2888627T3 (es) Codificación de audio de múltiples flujos
CN110770824B (zh) 多流音频译码
US10224046B2 (en) Spatial comfort noise
CN110072021B (zh) 一种在音频电话会议混合系统中的方法、装置和计算机可读介质
CN109313906A (zh) 音频信号之间的声道间相位差的编码和解码
EP2959669B1 (en) Teleconferencing using steganographically-embedded audio data
TW200947422A (en) Systems, methods, and apparatus for context suppression using receivers
JP2013156667A (ja) 過渡信号符号化方法、復号化方法、及びコンピュータ読取可能媒体
US20090055169A1 (en) Voice encoding device, and voice encoding method
JP4033840B2 (ja) 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
ES2967185T3 (es) Servidor multimedia de escena de voz escalable
Zheng et al. Encoding and communicating navigable speech soundfields
WO2010105695A1 (en) Multi channel audio coding
KR20200017432A (ko) 시간 도메인 채널간 대역폭 확장으로의 고대역 잔차 예측
US8024187B2 (en) Pulse allocating method in voice coding
Falkowski-Gilski Transmitting alarm information in DAB+ broadcasting system
CN111951821A (zh) 通话方法和装置
RU2807215C2 (ru) Медиасервер с масштабируемой сценой для голосовых сигналов
CN107113357B (zh) 与语音质量估计相关的改进方法和设备
US20230410823A1 (en) Spatial audio parameter encoding and associated decoding
Preston Audio Engineering Considerations for a Modern Mixnet
Borgstrom et al. Rate allocation for noncollaborative multiuser speech communication systems based on bargaining theory
CN117476013A (zh) 音频信号的处理方法、装置、存储介质及计算机程序产品
KR20220093158A (ko) 방향성 메타데이터를 사용한 멀티채널 오디오 인코딩 및 디코딩