FI112016B - Konferenssipuhelujärjestely - Google Patents

Konferenssipuhelujärjestely Download PDF

Info

Publication number
FI112016B
FI112016B FI20012539A FI20012539A FI112016B FI 112016 B FI112016 B FI 112016B FI 20012539 A FI20012539 A FI 20012539A FI 20012539 A FI20012539 A FI 20012539A FI 112016 B FI112016 B FI 112016B
Authority
FI
Finland
Prior art keywords
audio
signals
signal
terminal
audio signals
Prior art date
Application number
FI20012539A
Other languages
English (en)
Swedish (sv)
Other versions
FI20012539A0 (fi
FI20012539A (fi
Inventor
Jussi Virolainen
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Priority to FI20012539A priority Critical patent/FI112016B/fi
Publication of FI20012539A0 publication Critical patent/FI20012539A0/fi
Priority to EP02102759A priority patent/EP1324582A1/en
Priority to US10/324,315 priority patent/US20030129956A1/en
Publication of FI20012539A publication Critical patent/FI20012539A/fi
Application granted granted Critical
Publication of FI112016B publication Critical patent/FI112016B/fi

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/50Aspects of automatic or semi-automatic exchanges related to audio conference
    • H04M2203/5072Multiple active speakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Description

112016
Konferenssipuhelujärjestely
Keksinnön ala
Keksintö liittyy konferenssipuhelujärjestelmiin ja erityisesti konfe-renssipuhelun järjestämiseen yhden tietoliikennekanavan yli.
5 Keksinnön tausta
Erilaisia audio- ja videokonferenssipuhelupalveluita on ollut jo pitkään tarjolla erityisesti piirikytkentäisissä tietoliikenneverkoissa. Konferenssi-puhelujärjestelmät voidaan luokitella jaettuihin ja keskitettyihin järjestelmiin, joista keskitetyt järjestelmät ovat osoittautuneet palveluiden tarjoajien ja pääte-10 laitteiden toteutuksen kannalta edullisemmaksi tavaksi toteuttaa konferenssi-puhelupalveluita.
Kuviossa 1 esitetään tunnetun tekniikan mukainen peruskonsepti keskitetyn audiokonferenssipalvelun toteuttamiseksi. Konferenssipuhelujärjes-telmä käsittää konferenssisillan CB ja siihen yhteydessä olevia useita pääte-15 laitteita UE. Jokainen päätelaite UE vastaanottaa päätelaitteen käyttäjän puhetta mikrofonin avulla ja koodaa (Encod) puhesignaalin jollakin sinänsä tunnetulla puhekoodekilla. Koodattu puhe välitetään konferenssisillalle CB, joka dekoodaa (Decod) puhesignaalin vastaanotetusta signaalista. Konferenssisilta CB yhdistää audioprosessointiyksikössä APU eri päätelaitteilta vastaanotetut * » · 20 puhesignaalit käyttämällä jotain sinänsä tunnettua prosessointitapaa, minkä • · # ; ·' jälkeen useita puhesignaaleja käsittävä yhdistetty signaali lähetetään jollakin : sinänsä tunnetulla puhekoodekilla koodattuna (Encod) takaisin päätelaitteille • · UE, jotka dekoodaavat (Decod) vastaanotetusta signaalista yhdistetyn pu-hesignaalin, josta muodostetaan kuultava audiosignaali kaiuttim(i)en tai kuu-25 lokkeiden avulla. Kullekin päätelaitteelle lähetettävästä yhdistetystä audiosignaalista on tyypillisesti poistettu kyseisen päätelaitteen konferenssisillalle lä-: v. hettämä audiosignaali, jotta haitalliset kaikuilmiöt voidaan välttää.
Yhdistetty signaali muodostetaan konferenssisillassa tyypillisesti joko yksikanavaisena (monotoninen) audiosignaalina tai kaksikanavaisena (ste- •\,v 30 reofoninen) audiosignaalina. Kaksikanavaiseen audiosignaaliin voidaan konfe- • · · renssisillassa luoda keinotekoisesti tilavaikutelma eli suorittaa ns. spatialisointi. : Tällöin audiosignaalia käsitellään siten, että kuulijalle syntyy vaikutelma siitä, ,·,* | että konferenssipuheluun osallistujat sijaitsevat eri puolilla virtuaalista konfe renssitilaa. Tällöin eri audiokanavilla lähetettävät audiosignaalit poikkeavat toi- 2 112016 sistaan. Käytettäessä yksikanavaista audiosignaalia kaikki puhesignaalit (eli yhdistetty signaali) lähetetään sekoitettuna samalla audiokanavalla.
Kun käytetään yhtä audiokanavaa, käytetään puheen siirtoon tyypillisesti vain yhtä tiedonsiirtokanavaa. Käytettäessä useampaa audiokanavaa, 5 käytetään silloinkin tyypillisesti vain yhtä tiedonsiirtokanavaa, mutta tunnetaan myös ratkaisuja, joissa kullekin konferenssipuhelun osallistujalle lähetetään muiden osallistujien audiosignaalit kukin omalla kanavallaan tai alikanavallaan. Tällainen ratkaisu on kuvattu esimerkiksi julkaisussa WO 9953673. Muita tunnettuja konferenssipuhelujärjestelmiä, jotka ovat edellä kuvatun peruskon-10 septin erilaisia variaatioita, on kuvattu esimerkiksi patenttijulkaisuissa US 6125115 ja US 5991 385.
Ongelmana tunnetuissa ratkaisuissa on se, että ne soveltuvat huonosti konferenssipuhelussa muodostuvien useiden samanaikaisten audiosignaalien välittämiseen kapean siirtokaistan omaavalla kanavalla ja käytettäessä 15 ennalta määritettyä puhekoodekkia.. Useimmissa konferenssipuhelujärjestel-missä konferenssisillan ja päätelaitteen välillä on käytettävissä ainoastaan yksi monotoninen siirtokanava. Mikäli konferenssipuhelun aikana kaksi tai useampia konferenssipuhelun osanottajia puhuu samanaikaisesti, tunnetun tekniikan mukaisissa ratkaisuissa pystytään lähettämään monotonisella siirtokanavalla 20 joko vain yhden osallistujan audiosignaali kerrallaan tai vaihtoehtoisesti kaikki-en samanaikaisesti puhuvien osallistujien audiosignaalit sekoitettuna yhdeksi iv. monotoniseksi audiosignaaliksi. Ensimmäisessä tapauksessa kuullaan vain » 4 ; yhden osallistujan audiosignaali kerrallaan ja jälkimmäisessä tapauksessa * * · ; samanaikaisiin audiosignaaleihin ei voida luoda spatiaalista erottelua, toisin '· ’· 25 sanoen päätelaitteen käyttäjä kuulee kaikki samanaikaiset audiosignaalit tule- : : vaksi samasta pisteestä, mikä vaikeuttaa esimerkiksi eri puhujien erottamista :,t!: toisistaan. Erityisesti ongelma korostuu matkaviestinverkoissa ja muissa sa mankaltaisissa tietoliikenneverkoissa, joissa päätelaitteen ja konferenssisillan :v; välillä on usein käytettävissä vain yksi, tyypillisesti piirikytkentäinen liikenne- 30 kanava.
Eräänä ratkaisuna esimerkiksi kahden samanaikaisen puhujan ai-heuttamaan ongelmaan on esitetty joko aikajakomultipleksauksen (TDM) tai '···' taajuusjakomultipleksauksen (FDM) käyttöä. Aikajakomultipleksauksessa esi- merkiksi kaksi samanaikaista audiosignaalia, jotka näytteistetään esimerkiksi 8 35 kHz näytteenottotaajuudella, ensin alipäästösuodatetaan esimerkiksi 2 kHz rajataajuudella ja sen jälkeen tämä kaistarajoitettu audiosignaali alinäytteiste- 3 112016 tään 4 kHz näytteenottotaajuudella, jolloin kummankin audiosignaalin informaatiosisältö kompressoidaan puoleen alkuperäisestä. Nämä alinäytteistetyt audiosignaalit lähetetään 4 kHz monotonisella kanavalla aikajakomultipleksat-tuna. Vastaavasti taajuusjakomultipleksauksessa mainituista 2 kHz kaistarajoi-5 tetuista audiosignaaleista toinen moduloidaan 2-4 kHz kaistalle ja toinen audiosignaali jää 0 - 2 kHz kaistalle. Nämä kaistarajoitetut audiosignaalit summataan yhteen ja lähetetään yhtenä monotonisena audiosignaalina. Kummassakin tapauksessa vastaanottava päätelaite demultipleksaa molemmat audiosignaalit monotonisesta audiosignaalista.
10 Molempien edellä kuvattujen toteutusten haittana on kuitenkin se, että samanaikaiset audiosignaalit joudutaan alinäytteistämään 8 kHz:sta 4 kHz.iin ennen multipleksausta, mikä huonontaa audiosignaalin laatua huomattavasti. Edelleen haittana on se, että erityisesti aikajakomultipleksaus voi heikentää siirtokanavalla käytetyn koodauksen laatua vielä lisää, etenkin jos käy-15 tetty koodekki on puhekoodekki. Useissa puhekoodekeissa käytetään ns. lineaarista ennustusta, jossa koodaukseen/dekoodaukseen hyödynnetään aiempia puhenäytteitä. Jos tällöin joka toinen näyte onkin eri signaalista, koodauksen laatu huononee selvästi. Taajuusjakomultipleksauksessa haittana on edelleen se, että koodekki siirtää tyypillisesti alemman taajuuskaistan paremmin 20 kuin yläkaistan, mikä aiheuttaa vääristymää.
Keksinnön lyhyt selostus ; ;' Keksinnön tavoitteena on siten kehittää menetelmä ja menetelmän * $ ·*·; : toteuttava laitteisto siten, että yllä mainitut ongelmat saadaan ratkaistua. Kek- sinnön tavoitteet saavutetaan menetelmällä, konferenssisiltalaitteella, pääte-25 laitteella, tietokoneohjelmilla ja audiosignaalilla, joille on tunnusomaista se, mi-tä sanotaan itsenäisissä patenttivaatimuksissa.
Keksinnön edulliset suoritusmuodot ovat epäitsenäisten patentti- • v; vaatimusten kohteena.
.·*·, Keksintö perustuu siihen, että konferenssipuhelua ohjataan järjes- 30 telmässä, joka käsittää konferenssisillan usealta päätelaitteelta tulevien audio- * · · signaalien yhdistämiseksi ja yhdistetyn signaalin lähettämiseksi edelleen aina- :...: kin yhdelle, tyypillisesti usealle päätelaitteelle käyttäen monotonista siirtokana- : vaa. Menetelmässä tunnistetaan ensin konferenssisillan sisääntulojen audio-
• * · I
.·. : signaaleista olennaisesti samanaikaisesti aktiivisia ennalta määritettyjä audio- 35 komponentteja, kuten puhesignaaleja, jolloin voidaan edullisesti määrittää myös mainittujen audiokomponenttien lukumäärä, ja mikäli todetaan, että näitä 4 112016 samanaikaisesti aktiivisia audiosignaaleja havaitaan vähintään kaksi, suodatetaan mainitut sisääntulojen audiosignaalit olennaisesti erilaisilla, tyypillisesti komplementaarisilla suodattimilla, jonka jälkeen suodatetut audiosignaalit yhdistetään yhdeksi signaaliksi ja lähetetään ainakin yhdelle päätelaitteelle tyypil-5 lisesti monotonisella siirtokanavalla. Keksinnön erään edullisen suoritusmuodon mukaisesti yhdistetty audiosignaali koodataan audiokoodekilla ennen lähettämistä päätelaitteelle. Edelleen keksinnön edullisen suoritusmuodon mukaisesti päätelaitteessa vastaanotetaan yhdistetty signaali, joka dekoodataan vastaavalla audiokoodekilla ja josta erotetaan mainitut sisääntulojen audiosig-10 naalit suodattamalla yhdistetty signaali olennaisesti samanlaisilla suodattimilla kuin konferenssisillan suodattimet, jonka jälkeen päätelaitteessa muodostetaan tilavaikutelma konferenssipuhelun osanottajista mainittujen suodatettujen signaalien perusteella. Keksinnön erään edullisen suoritusmuodon mukaisesti mainitut suodattimet ovat olennaisesti komplementaarisia kampasuodattimia.
15 Keksinnön mukaisen menettelyn etuna on, että voidaan lähettää monotonisella siirtokanavalla olennaisesti hyvälaatuista audiosignaalia myös silloin, kun konferenssipuhelun osallistujista usea puhuu samanaikaisesti. Kuitenkin usean samanaikaisen audiosignaalin välittämiseen tarvittava kaistanleveys on edullisesti pieni. Keksinnön edut korostuvat erityisesti silloin, kun au-20 diosignaali koodataan puhekoodekilla ennen siirtokanavalle lähettämistä. Kek-sinnön erään edullisen suoritusmuodon etuna on, että keksintö on hyvin yksin-. kertainen ja edullinen toteuttaa eikä se edellytä suuren prosessointitehon käyt- : ; * töä.
: Edelleen keksinnön etuna on, että voidaan varmistaa riittävä äänen- • · '· ·: 25 laatu kolmiulotteisesti spatialisoidulle audiosignaalille, jolloin konferenssipuhe- lun osanottajille voidaan muodostaa kolmiulotteinen tilavaikutelma konferens-•\.. · sipuhelun muista osanottajista.
Kuvioiden lyhyt selostus • ♦ ,···', Keksintöä selostetaan nyt lähemmin edullisten suoritusmuotojen yh- • » 30 teydessä, viitaten oheisiin piirroksiin, joista: kuvio 1 esittää tunnetun tekniikan mukaista peruskonseptia keskite-: tyn audiokonferenssipalvelun toteuttamiseksi; : **. kuvio 2 esittää keksinnön erään suoritusmuodon mukaista konfe- j renssisiltajärjestelyä; ' : 35 kuvio 3 esittää keksinnön erään suoritusmuodon mukaisten suodat timien ominaisuuksia; 112016 5 kuvio 4 esittää keksinnön mukaisen päätelaitteen yksinkertaistettua rakennetta; kuvio 5 esittää yleistäen keksinnön mukaista konferenssipuhelujär- jestelyä; 5 kuvio 6 esittää keksinnön erään edullisen suoritusmuodon mukaista konferenssisiltajärjestelyä; ja kuvio 7 esittää vuokaaviona keksinnön mukaisen menettelyn olennaisia menetelmäaskelia.
Keksinnön yksityiskohtainen selostus 10 Keksintöä kuvataan tässä yhteydessä yleisellä tasolla sitomatta keksintöä mihinkään erityiseen tietoliikennejärjestelmään. Keksinnön edut tulevat edullisimmin esille erilaisissa piirikytkentäisissä verkoissa, kuten GSM-verkossa, UMTS-verkossa sekä PSTN-lankaverkoissa käytettävissä konfe-renssipuhelujärjestelyissä. Keksintöä ei kuitenkaan rajoiteta ainoastaan piiri-15 kytkentäisiin verkkoihin, vaan keksinnöllä on saavutettavissa etuja myös pakettivälitteisten tietoliikenneverkkojen yhteydessä, kuten GSM-pohjaisessa GPRS-verkossa, UMTS:n pakettiverkossa sekä Internetin kautta käytettävissä konferenssipuhelujärjestelyissä, missä audiokoodauksessa käytettävä kaistanleveys halutaan pitää edullisesti pienenä, jolloin säästynyttä siirtokaistaa voi-20 daan käyttää esimerkiksi videokuvan lähetykseen.
• » I
‘ Seuraavassa havainnollistetaan keksintöä yksinkertaistetun toteu- ·* ·*’ tusesimerkin pohjalta viitaten kuvioon 2. Kuviossa 2 on esitetty konferenssisilta : CB, joka käsittää sisääntulot (hIn) usealta päätelaitteelta (UEi,..., UEn) tu- ·'.'· levien audiosignaalien vastaanottamiseksi. Päätelaitteilta tulevat audiosignaalit :··: 25 on tyypillisesti koodattu jollakin sinänsä tunnetulla lähetyskoodekilla, jolloin audiosignaalit vastaavasti dekoodataan kuhunkin sisääntuloon kytketyllä vas-taanottokoodekilla (Decodi,..., Decodn). Audiosignaalien koodaaminen pääte-laitteilla ja dekoodaaminen vastaavasti konferenssisillassa ei ole kuitenkaan * » keksinnön kannalta olennaista. Yhteen tai useampaan mainituista sisääntu-
♦ I
30 loista voidaan syöttää myös konferenssisillalla generoituja audiosignaaleja, esimerkiksi haluttuja taustaääniä tai tehosteita, jotka halutaan liittää mukaan yhdistettävään audiosignaaliin. Konferenssisillalle sisääntulevat audiosignaalit käsittävät tyypillisesti erilaisia audiokomponentteja, kuten puhetta, muita pu- • * < heenomaisia ääniä, kuten yskähdyksiä ym., taustamelua sekä mahdollisesti ’ : 35 edellä mainittuja keinotekoisesti luotuja audiosignaaleja. Konferenssisillalta lähetettävän yhdistetyn audiosignaalin jatkokäsittelyn suhteen keksinnön mu- 6 112016 kaiselle menettelylle on olennaista, että sisääntulevista audiosignaaleista pystytään määrittämään ne audiosignaalit, jotka käsittävät olennaisesti samanaikaisesti sellaisia audiokomponentteja, tyypillisesti puhetta, jotka halutaan välittää konferenssipuhelun muille osanottajille yhdistetyssä audiosignaalissa.
5 Tämä määritys voidaan toteuttaa kuvion 2 mukaisella järjestelyllä, jossa kukin konferenssisillan sisääntulo käsittää, edullisesti vastaanottokoode-kin (Decod) jälkeen, VAD-yksikön (VADi,..., VADn, Voice Activity Detection), joka on järjestetty havaitsemaan puheen vastaanotetusta audiosignaalista. Käytännössä VAD-yksiköille tuleva audiosignaali on järjestetty kehyksiin, jotka 10 käsittävät kukin N kappaletta näytteitä. VAD-yksikkö tarkistaa jokaisen kehyksen ja tarkistuksen tuloksena lähetetään ohjausyksikölle CTRL ohjaussignaali, joka kertoo, onko tarkistetusta kehyksestä löydetty aktiivista puhetta vai ei. Täten jokaiselta VAD-yksiköltä johdetaan ohjausyksikölle CTRL ohjaussignaali, yhteensä n kappaletta ohjaussignaaleja, joiden perusteella ohjausyksikkö 15 CTRL pystyy päättelemään ainakin sen, onko sisääntulevien audiosignaalien kehyksissä samanaikaisesti yksi vai useampia aktiivisia puhesignaaleja. Tämä voidaan toteuttaa esimerkiksi siten, että VAD-yksiköiltä tulevat ohjaussignaalit ovat Boolen algebran mahdollistavia signaaleja (esim. puhe=1, ei puhetta=0), jolloin ohjausyksikkö voidaan toteuttaa esimerkiksi yksinkertaisten OR- tai 20 XOR-porttien avulla. Tällöin myös ohjausyksikön ulostuloksi saadaan Boolen , signaali, joka ilmaisee onko kehyksissä samanaikaisesti 0 tai 1 aktiivista pu- hesignaalia (esim. signaaliarvo=0) tai vastaavasti 2 tai enemmän samanaikai- ; ; siä aktiivisia puhesignaaleja (esim. signaaliarvo=1).
• · > ; VAD-yksiköiden sijaan voidaan tässä järjestelyssä käyttää audiosi- 25 säilön tarkistusta käyttäviä välineitä, ns. ACD-yksiköitä (Audio Content Detec-tor), jotka analysoivat audiosignaalin käsittämää informaatiota ja tunnistavat halutut audiokomponentit, kuten puheen, musiikin, taustamelun, tms.. ACD-yksikön ulostulolla voidaan sitten ohjata ohjausyksikköä CTRL edellä kuvatulla tavalla.
* · 30 Edelleen vastaanottavan audiokomponentin tunnistukseen voidaan käyttää audiosignaaliin edullisesti liitettyä metadata- tai ohjausinformaatiota, joka ilmaisee signaalin käsittämien audiokomponenttien tyypin, kuten puheen, I ( ‘* musiikin, taustamelun, tms.
: Keksinnön havainnollistamiseksi ja toteutuksen yksinkertaistami- 1 »* · : 35 seksi kuvion 2 mukaisessa esimerkissä oletetaan, että järjestelmä pystyy erot telemaan monotonisella kanavalla lähetettävään yhdistettyyn signaaliin mak- 7 112016 simissaan kaksi samanaikaista audiosignaalia. Maksimissaan kahden samanaikaisen audiosignaalin käsittelyä varten konferenssisilta käsittää kolme multi-plekseriä MUX1, MUX2 ja MUX3. Jokainen sisääntuleva audiosignaali (li,..., ln) ohjataan edullisesti VAD-tunnistuksen jälkeen kaikille kolmelle multiplekse-5 rille. Ohjausyksikön CTRL ulostulosignaalilla ohjataan multipleksereitä edullisesti siten, että mikäli päätelaitteilta UE tulevista audiosignaaleista havaitaan samanaikaisesti korkeintaan yksi haluttu audiokomponentti, kuten puhe, ohjataan multiplekseri MUX3 päästämään tämä monotoninen signaali sellaisenaan summain-skaalaimelle SUM/SCALE. Jos taas päätelaitteilta UE tulevista au-10 diosignaaleista havaitaan samanaikaisesti kaksi haluttua audiokomponenttia, kuten puhetta, ohjataan ensimmäinen multiplekseri MUX1 päästämään ensimmäinen audiosignaali ensimmäiselle digitaaliselle suodattimelle DF1 ja toinen multiplekseri MUX2 päästämään toinen audiosignaali toiselle digitaaliselle suodattimelle DF2. Digitaalisten suodattimien DF1 ja DF2 ulostulot viedään 15 summain-skaalaimelle SUM/SCALE, jossa digitaalisesti suodatetut signaalit summataan ja skaalataan yhdeksi monotoniseksi signaaliksi. Summain-skaalaimen SUM/SCALE ulostulo viedään järjestelmässä käytettävälle audio-koodekille (Encod) koodattavaksi edelleen siirtotielle lähetettävää signaalia varten.
20 Digitaaliset suodattimet DF1 ja DF2 on suunniteltu edullisesti siten, ... että ne ovat olennaisesti komplementaarisia toisiinsa nähden sekä esto- että päästökaistan suhteen. Tätä voidaan havainnollistaa kuviolla 3, jossa esite- * i · ; tään yksinkertaistettuna esimerkkinä molempien suodattimien DF1 ja DF2 amplitudivasteet taajuuden funktiona. Kuten kuviosta 3 nähdään, vastaa en- * » 'Λ! 25 simmäisen suodattimen DF1 amplitudihuippua 300 toisen suodattimen DF2 amplitudivasteen minimiarvo 302 olennaisesti samalla taajuudella. Edelleen ·* ensimmäisen suodattimen DF1 päästökaista vastaa taajuuskaistaltaan olen naisesti toisen suodattimen DF2 estokaistaa. Vastaavasti taas toisen suodat-j v . timen DF2 amplitudihuippua 304 vastaa ensimmäisen suodattimen DF1 ampli- . · · ·. 30 tudivasteen minimiarvo 306 myös olennaisesti samalla taajuudella. Käytännön · ' toteutuksessa suodattimien komplementaarisuus ei tarvitse kuitenkaan olla ehdottoman tarkka, kuten kuviosta 3 voidaan nähdä. Toisin sanoen, estokais- I I · tan ja päästökaistan ei tarvitse olla täysin estäviä tai läpäiseviä, vaan riittää, että niiden amplitudivasteet poikkeavat toisistaan riittävästi, jotta päätelaitteella S I I j ,: 35 suodatuksen jälkeen saatavat signaalit taas eroavat olennaisesti toisistaan.
Täten estokaistojen vaimennus ei välttämättä tarvitse olla erityisen suuri, vaan 8 112016 esimerkiksi luokkaa -25 dB oleva vaimennus on tyypillisesti riittävä. Edelleen, kuten kuviosta 3 nähdään, on digitaaliset suodattimet DF1 ja DF2 edullista toteuttaa kahtena kampasuodattimena, joiden amplitudivasteet ovat olennaisesti tasavälisiä ja joiden esto- ja päästökaistat ovat toisiinsa nähden vastakkaisilla 5 taajuuskaistoilla. Kampasuodattimen siirtofunktio voidaan esittää esimerkiksi seuraavassa muodossa: H(z) = 1 + gz'm, missä m on suotimen viiveen pituus ja g on efektin vahvistuskerroin. Komplementaarinen suodin saadaan aikaiseksi vaihtamalla g:n merkki vastakkaiseksi. Täten kampasuotimen toteuttaminen on hyvin yksinkertaista ja niiden säätämiseen tarvitaan edullisimmillaan 10 vain edellä kuvatut kaksi suodinparametria. Esto- ja päästökaistojen leveys on edullisesti muutama sata hertsiä, n. 100 - 300 Hz. Vaihtoehtoisesti suodattimet voidaan toteuttaa esimerkiksi suodatinpankin avulla, joka käsittää sopivan levyisiä ja erilaisen päästökaistan omaavia kaistanpäästösuodattimia.
Edelleen keksinnön erään edullisen toteutusmuodon mukaisesti 15 suotimet voivat olla komplementaarisia vain jollakin taajuuskaistan osalla. Tällöin suodatus voidaan tehdä molemmille puhesignaaleille vain tietyllä kaistalla, kuten esimerkiksi 500 - 3000 Hz, jolloin puheen perustaajuus (alle 500 Hz) ja korkeat taajuudet (yli 3 kHz) vain skaalataan ja summataan sellaisinaan. Tällöin äänen paikantaminen tapahtuu suodatetun kaistan alaosassa interauraali-20 sen aikaeron perusteella ja kaistan yläosassa signaalien amplitudierojen pe-rusteella.. Kuitenkin matalilla taajuuksilla (alle 500 Hz) äänen suunnan aistimi-,* nen on vaikeampaa, eikä korkeiden taajuuksienkaan (yli 3 kHz) mukaan otta minen tuo oleellista etua. Näin ollen suodatus voidaan tehdä olennaisesti pie-' : : nemmälläkin kaistalla kuin koko puhekoodauskaistan leveys on. On tietenkin \'·: 25 selvää, että suodatus voidaan toteuttaa myös kahdella tai useammalla kaistal- 1 la tai eri taajuusalueilla kuin yllä on esitetty, esimerkiksi vain yhdellä kaistalla **: 600-2000 Hz, tai kahdella erillisellä kaistalla 400-1200 Hz ja 1800 - 2900 Hz.
Konferenssisilta CB siis muokkaa yhden tai useamman samanaikaisen audio-:v. signaalin lähetettäväksi monofonisellakanavalla konferenssipuheluun osallis- .*·, 30 tuville päätelaitteille. Mikäli audiosignaaleja on vain yksi, lähetetään se muille '·’ konferenssipuheluun osallistuville päätelaitteille sellaisenaan ilman suodatus- '..v ta, jolloin koko käytössä oleva kaistanleveys voidaan käyttää yhden audiosig- naalin välittämiseen. Jos taas samanaikaisia audiosignaaleja on kaksi, ne : /, suodatetaan edellä kuvatulla tavalla, jonka jälkeen suodatetut signaalit sum- ,·, · 35 mataan ja skaalataan yhdeksi audiosignaaliksi, jolloin myös tälle yhdelle au diosignaalille voidaan käyttää koko käytössä oleva kaistanleveys. Suodatus 112016 g pienentää alkuperäisten audiosignaalien taajuussisältöä ja aiheuttaa audiosignaalien lievää värittymistä, mutta sen vaikutus audiosignaalien ymmärrettävyyteen on huomattavasti pienempi kuin tunnetun tekniikan mukaisessa alinäyt-teistyksessä. Tällaisen suodatuksen avulla saavutettava spatiaalinen erottelu 5 parantaa puheen ymmärrettävyyttä enemmän kuin suodatuksen vaikutuksesta aiheutuva äänen värittyminen heikentää sen ymmärrettävyyttä. Puheessa tietyt äänteet, kuten "s", "f, "k", "p" , sisältävät runsaasti korkeita taajuuksia, joiden putoaminen pois tunnetun tekniikan mukaisissa menetelmissä heikentää puheen ymmärrettävyyttä. Keksinnön mukaisessa menettelyssä näin ei käy, 10 koska taajuuskaista on sama kuin alkuperäisessä signaalissa, ainoastaan tiettyjä kaistan osia on suodatettu osittain pois.
Vaikka audiosignaali voidaankin lähettää siirtotielle ilman puhekoo-dausta, saavutetaan keksinnön paras hyöty erityisesti puhekoodauksen kautta. Keksinnön mukaisella suodatuksella samanaikaisia audiosignaaleja esikä-15 sitellään siten, että ne ovat helpommin puhekoodattavissa kuin esimerkiksi tunnetun tekniikan mukaiset alinäytteistetyt audiosignaalit, jotka joko taajuus-tai aikamultipleksataan.
Keksinnön mukaisessa menettelyssä käytettävän päätelaitteen tulee osata erottaa vastaanotetusta monotonisesta audiosignaalista siihen yh-20 distetyt kaksi samanaikaista suodatettua audiosignaalia. Eräs esimerkki tällaisesta päätelaitteesta on esitetty kuviossa 4. Päätelaite vastaanottaa konfe-v . renssisillalta lähetettyä yhdistettyä audiosignaalia ja dekoodaa monotonisen i audiosignaalin vastaanottokoodekilla. Dekoodattu audiosignaali syötetään ; kahdelle digitaaliselle suodattimelle DFT ja DF2', joiden toiminnallisuus vastaa » » * *· ’; 25 edullisesti olennaisesti konferenssisillassa käytettyjä digitaalisia suodattimia DF1 ja DF2. Näin ollen suodattimet DFT ja DF2‘ erottavat dekoodatusta au-diosignaalista ainakin osittain alkuperäiset samanaikaiset audiosignaalit; suodatin DFT suodattaa mainitun ensimmäinen audiosignaalin ja vastaavasti suodatin DF21 mainitun toisen audiosignaalin. Vaikka optimitapauksessa sig-30 naalit saataisiin erotettua täysin toisistaan, olennaista suodatukselle on kuiten- • · · kin se, että audiosignaalien välille muodostuu riittävä kanavaero, jolloin kuulija ;;; voi aistia puhujien paikantuvan eri paikkoihin.
·;·’ Päätelaite käsittää stereotoistovälineet, kuten kaksi kaiutinta tai ste- : reokuulokkeet, joihin suodattimia DFT ja DF21 tulevat alkuperäisiä samanai- 35 kaisia audiosignaaleja olennaisesti vastaavat audiosignaalit syötetään toistoa varten, ensimmäinen audiosignaali esimerkiksi vasempaan (L) stereokana- 10 112016 vaan ja toinen audiosignaali oikeaan (R) stereokanavaan. Mikäli signaalit saadaan erotettua täysin toisistaan, päätelaitteen käyttäjä kuulee edullisesti molemmat samanaikaiset audiosignaalit, ensimmäisen audiosignaalin vasemmasta stereokanavasta ja toisen audiosignaalin oikeasta stereokanavasta.
5 Kuitenkin käytännössä signaaleja ei saada täysin erotettua toisistaan, jolloin päätelaitteen käyttäjä kuulee ensimmäistä audiosignaalia enemmän vasemmasta kanavasta ja toista audiosignaalia enemmän oikeasta kanavasta. Ihmisen kuulojärjestelmä muuntaa jo pienen amplitudieron spatiaaliseksi eroksi. Käytettäessä kuulokkeita suodattimilta tulevat signaalit voidaan toistaa valo sempaan ja oikeaan korvaan sellaisenaan ja kuulijalle tulee vaikutelma spatiaalisesta erottelusta. Koska kaiutinkuuntelussa kuulija kuulee molemmat kanavat molemmilla korvilla, tällöin saatetaan joutua suorittamaan ns. akustisen ylikuulumisen esto (cross-talk cancellation). Päätelaitteessa voidaan spatiaalisen vaikutelman luomiseen käyttää esimerkiksi stereolaajennusmenetelmää, 15 joka on kuvattu hakijan aiemmassa eurooppalaisessa patenttihakemuksessa nro EP01660178.3. Tällöin päätelaite käsittää edullisesti stereolaajennusväli-neet, kuten mainitussa hakemuksessa kuvatun stereolaajennusverkon. Vastaavasti spatiaalista vaikutelmaa voidaan parantaa kaiutinkuuntelua varten esimerkiksi 'Virtual Loudspeaker*'- metodilla tai jollain vastaavalla menetelmäl-20 lä. Eräs tällainen järjestelmä on.kuvattu julkaisussa: Ole Kirkeby and Philip A. Nelson, 'Virtual Source Imaging Using the "Stereo Dipole", 103rd Audio :·.·. Engineering Society Convention, 26-29 September, 1997, New York, AES
| Preprint 4574 (J-10), 1997.
[!' : Päätelaite voi edullisesti käsittää myös spatialisointiyksikön SPU, · ; 25 johon suodattimilta DFT ja DF21 tulevat suodatetut audiosignaalit syötetään ennen niiden syöttöä toistovälineille. Spatialisointiyksikössä konferenssitilasta :···; luodaan keinotekoinen tilamalli, johon konferenssipuhelun eri osanottajat sijoi tetaan omille paikoilleen. Kahden samanaikaisesti puhuvan osanottajan eri si-j ', · jainnit luodaan stereofonisen audiosignaalin signaalikomponentteihin muodos- 30 tettavilla kanavien välisellä aika- ja/tai amplitudieroilla. Nämä spatialisointiyksi-kössä muokatut audiosignaalit syötetään sitten toistovälineille. Näin mahdollis- • » · ::: tetaan aidommalta kuulostavan tilavaikutelman luominen konferenssitilasta » · päätelaitteen käyttäjälle kuin pelkästään syöttämällä eri signaalit eri stereoka-naviin. Spatiaalisen vaikutelman luomiseen päätelaitteessa on olemassa myös ' ·,; 35 muita menetelmiä kuin edellä kuvatut stereolaajennus ja spatialisointi, jotka on 1120 Ί 6 11 kuvattu tässä yhteydessä edullisina suoritusmuotoina niihin kuitenkaan rajoittumatta.
On huomattava, että edellä kuvatut suodatus ja spatialisointi ovat edullisesti passiivisia prosesseja, jotka eivät edellytä erillistä ohjausinformaa-5 tiota ja jotka ovat siten riippumattomia konferenssisillalta tulevasta monotonisesta audiosignaalista. Erityisesti suodatus on laskennallisesti helppo suorittaa, jolloin prosessointitehon tarve jää pieneksi.
Päätelaitteen käsittämät suodattimet DF1' ja DF2' ovat toiminnaltaan edullisesti olennaisesti samanlaisia kuin konferenssisillan suodattimet 10 DF1 ja DF2. Päätelaitteen ja konferenssisillan suodattimien ominaisuuksien ei kuitenkaan tarvitse olla täsmälleen samanlaisia. Esimerkiksi päätelaitteen ja konferenssisillan suodattimien amplitudivasteiden tulee olla olennaisesti samat, mutta esimerkiksi päätelaitteen suodattimien estokaistan ja päästökaistan vahvistus voi olla pienempi kuin konferenssisillan suodattimissa.
15 Edellä keksintöä on kuvattu yksinkertaistaen esimerkillä, jossa yh distettyyn monosignaaliin voidaan erotella vain kaksi samanaikaista audiosignaalia. Keksintö voidaan kuitenkin toteuttaa yleisellä tasolla rajoittamatta samanaikaisten audiosignaalien lukumäärää yhdistetyssä signaalissa. On kuitenkin huomattava, että käytännössä tilanne, jossa konferenssipuhelussa on 20 enemmän kuin kaksi samanaikaista puhujaa, on harvinainen. Keksinnön mu-kaista menettelyä voidaankin kuvata yleistäen kuvion 5 mukaisella
:v. järjestelmällä. Kuviossa 5 konferenssisillalle CB tulee sisääntulona (h.....In) M
* * j kpl samanaikaisia audiosignaaleja, jotka käsitellään kytkentä- ja ; prosessointiyksikössä SWITCH/PROC. Kytkentä- ja prosessointiyksikkö ** ’; 25 SWITCH/PROC käsittää edellä kuvatulla tavalla jokaista sisääntuloa ln kohden oman digitaalisen suodattimen, joita on järjestetty käytettäväksi, mikäli havaitaan useita samanaikaisia audiosignaaleja. Kukin samanaikaisista audiosignaaleista suodatetaan omalla suodattimellaan ja yhdistetään yhdeksi : V monofoniseksi signaaliksi, joka koodataan audiokoodekilla (Encod) ennen : ’ [': 30 monotoniselle siirtokanavalle lähettämistä.
# Alan ammattimiehelle on ilmeistä, että ennen siirtokanavalle lähet-
• · I
tömistä audiosignaalille suoritetaan myös muita toimenpiteitä, jotka ovat tar- t » * ·; · ’ peen signaalin siirtämiseksi kulloinkin käytössä olevassa tietoliikennejärjestel- mässä. Tällaisia toimenpiteitä ovat mm. kanavakoodaus ja signaalin modu- : ‘ : 35 lointi käytettävälle taajuudelle, jotka toimenpiteet ovat tietoliikennejärjestelmä- kohtaisia eivätkä ole sinänsä keksinnön kannalta olennaisia. Käytettävä on 12 112016 monofoninen siirtokanava voi olla esimerkiksi GSM-järjestelmän liikennekana-va, UMTS-järjestelmän liikennekanava, Bluetooth-verkon liikennekanava, langallinen puhelinyhteys PSTN tai jokin pakettikytkentäinen kanava, kuten In-ternet-puhelukonferenssi tai WLAN-pakettikanava, jolla käytettävä kaistanle-5 veys halutaan pitää edullisesti pienenä.
Audiosignaalin vastaanottavassa päätelaitteessa dekoodataan (De-cod) audiokoodekilla vastaanotettu monofoninen audiosignaali ja syötetään se digitaaliseen prosessointiyksikköön DPU. Digitaalinen prosessointiyksikkö DPU käsittää edullisesti olennaisesti vastaavat suodatintoiminnallisuudet, joita 10 käytetään konferenssisillassa CB samanaikaisten audiosignaalien suodattamiseen. Täten syöttämällä dekoodattu vastaanotettu monofoninen audiosignaali kaikkiin suodattimiin, saadaan alkuperäisiä samanaikaisia audiosignaaleja (M kpl) riittävästi vastaavat signaalit erotettua toisistaan. Täten suodatetuille audiosignaaleille luodaan riittävä kanavaero spatiaalisen tilavaikutelman 15 muodostamiseksi kuulijalle. Päätelaite voi edullisesti käsittää spatialisointiyksikön SPU, johon mainitut M kpl audiosignaaleja edelleen syötetään ja joka käsittelee audiosignaalit siten, että niihin liitetään amplitudieron lisäksi myös ajallinen erotus, joka määrittää konferenssipuhelun eri osanottajille omat sijainnit. Spatialisointiyksikön ulostulona saadaan N kpl 20 muokattuja audiosignaaleja, joiden lukumäärä N voi siis olla joko yhtä suuri tai eri suuri kuin samanaikaisten audiosignaalien määrä M konferenssisillassa . (N=M tai N*M). Nämä N kpl audiosignaaleja syötetään sitten toistovälineille, ; ; jotka voivat käsittää stereotoistovälineet tai jonkin muun monikanavaisen • · · ; audiojärjestelmän, kuten ns. 5.1-järjestelmän.
25 Edellä kuvattu samanaikaisten audiosignaalien erottaminen vas- : taanotetusta monotonisesta signaalista ja näiden erotettujen signaalien pro- sessointi spatialisointiyksikössä onnistuu edullisesti ilman erillistä ohjausinformaatiota. Keksinnön erään edullisen suoritusmuodon mukaisesti konferenssi-:v: sillalta lähetettävään monotoniseen signaaliin voidaan kuitenkin lisätä ohjaus- ; ‘"; 30 informaatiota tai metadataa, joka voidaan lähettää joko kaistan sisäisenä (in- band) tai kaistan ulkopuolisena (outband) signaalina. Kyseistä ohjausinformaatiota voidaan käyttää sekä suodatuksen että spatialisoinnin *··>: ohjaamiseen päätelaitteessa. Tämä saattaa olla tarpeen erityisesti silloin, kun | samanaikaisia audiosignaaleja on enemmän kuin kaksi. Tällöin audiosignaalin • * · · 35 mukana välitetty ohjausinformaatio keventää edullisesti päätelaitteen prosessointikuormaa esimerkiksi suodattimien kytkennässä.
13 112016
Esimerkiksi puhekehyksen ohessa voidaan lähettää tieto siitä, onko samanaikaisia audiosignaaleja havaittu yksi tai useampia, jolloin päätelaite voi tämän tiedon perusteella valita sopivat kampasuodattimet. Jos on havaittu vain audiosignaali, ei digitaalista suodatusta tehdä edullisesti lainkaan. Jos 5 taas samanaikaisia audiosignaaleja havaitaan useampia, tehdään suodatus sekä konferenssisillassa että päätelaitteessa spatiaalisen eron aikaansaamiseksi.
Digitaaliset suodattimet konferenssisillassa ja päätelaitteella voivat myös edullisesti olla adaptiivisia. Konferenssisillassa voidaan esimerkiksi las-10 kea adaptiivisesti suodinparametrit suodattimille riippuen puhesignaalien ominaisuuksista ja välittää nämä tai niistä lasketut parametrit oheistietona päätelaitteen suodattimille puhekehysten ohella.
Keksinnön erään edullisen suoritusmuodon mukaisesti adaptiivi-suus voidaan yksinkertaisimmillaan toteuttaa siten, että puhujan puheen pe-15 rustaajuus analysoidaan ja valitaan kahdesta suotimesta se suodin, joka paremmin soveltuu puhujalle. Esimerkiksi puhuja, jonka puheen perustaajuus on korkeampi, suodatetaan aina suodattimena DF1 ja taas puhuja, jonka perustaajuus on matalampi, suodatetaan suodattimena DF2.
Keksinnön erään toisen suoritusmuodon mukaisesti adaptiivinen 20 suodatus voidaan toteuttaa siten, että kunkin puhujan puhesignaalin spektriä .analysoidaan tietyn aikaa konferenssisillassa. Spektrejä verrataan pareittain toisiinsa ja niiden eroja korostamalla luodaan komplementaariset suodattimet.
* t J ; Kun tietyt kaksi puhujaa puhuvat, valitaan näin määritetyt suodattimet. Tämän ; I suoritusmuodon edellytyksenä on, että päätelaitteelle pystytään siirtämään se- ’· 25 kä suodatinparametrit että tieto siitä, ketkä puhujat ovat kulloinkin aktiivisia.
' ‘ Erään edullisen suoritusmuodon mukaisesti, kun havaitaan konfe- renssisillassa vain yksi audiosignaali, lähetetään tämä suodattamattomana päätelaitteelle, joka ei myöskään suodata sitä, mutta spatialisoi sen siten, että se kuuluu olennaisesti vain päätelaitteen käyttäjän jommalla kummalla puolel-30 la. Tällöin, jos toinen puhuja liittyy keskusteluun (kaksi samanaikaista audio- t » » \ signaalia), suoritetaan edellä kuvattu komplementaarinen suodatus ja spatia- lisointi, missä alkuperäinen audiosignaali sijoitetaan samalle puolelle kuulijaa » » kuin aiemminkin ja uusi audiosignaali sijoitetaan kuulijan toiselle puolelle. Täs-i sä toteutuksessa metadatatietona lähetetään puhujaa vastaava tunniste tai :' ·, * 35 paikkatieto päätelaitteelle, jotta ensimmäisen puhujan paikka ei muutu.
14 112016
Keksintö on kuitenkin edullisemmin ja yksinkertaisemmin toteutettavissa tilanteissa, joissa samanaikaisia audiosignaaleja on vain kaksi. Tästä syystä, ja koska useamman kuin kahden samanaikaisen puhujan tilanteet kon-ferenssipuhelussa ovat erittäin harvinaisia, voidaan keksinnön erään edullisen 5 suoritusmuodon mukaisesti suodattaa kolme tai useampi samanaikaista audiosignaalia kahdelle kanavalle. Tämä voi tapahtua edullisesti siten, että jos konferenssisillassa havaitaan useampi kuin kaksi, esimerkiksi kolme, samanaikaista audiosignaalia, suodatetaan ensimmäinen havaittu audiosignaali ensimmäisellä suodattimena ja jäljelle jäävät audiosignaalit summataan ensin yh-10 teen ja suodatetaan sen jälkeen yhdistetty audiosignaali toisella suodattimena. Näin priorisoidaan ensimmäinen audiosignaali, kuten puhesignaali, välitettäväksi itsenäisesti ja useat keskeyttävät puhesignaalit yhdistetään yhdeksi audiosignaaliksi. Tällöin päätelaitteen käyttäjä kuulee ensimmäisen audiosignaalin esimerkiksi vasemmalta puoleltaan ja muut samanaikaiset audiosignaalit 15 olennaisesti samasta paikasta oikealta puoleltaan.
Keksinnön erään edullisen suoritusmuodon mukaisesti päätelaite voi käsittää myös taajuusverhokäyrän interpolaattorin, jota voidaan käyttää usean peräkkäisen suodatuksen aiheuttaman puhesignaalin värittymisen vähentämiseen.
20 Keksinnön erään edullisen suoritusmuodon mukaisesti konferenssi- .... sillasta lähettävän yhden suodattamattoman audiosignaalin vaihtaminen use- aan suodatettuun audiosignaaliin voidaan suorittaa joustavasti tilanteessa, * * * ; ; ‘ jossa jo aiemmin havaitun yhden audiosignaalin lisäksi havaitaan toinen sa- ·;· | manaikainen audiosignaali. Tällöin konferenssisillassa ei välittömästi kytketä :: 25 mainittua ensimmäistä prosessoimatonta audiosignaalia täysitehoiseen suoda- tukseen, vaan käytetävien suodattimien ominaisuuksia säädetään dynaami-sesti tietyllä aikavälillä, esimerkiksi 200 ms, siten, että samanaikaisia audiosignaaleja ei aikavälin alkaessa suodateta lainkaan ja suodatus saavuttaa ;v. olennaisesti halutun tehon mainitun aikavälin kuluttua. Tällöin päätelaitteen • * . · * *, 30 käyttäjä kuulee tämän esimerkiksi siten, että aluksi ensimmäinen audiosignaali kuuluu käyttäjän edestä, mutta kun havaitaan toinen samanaikainen audiosig-·:* naali, audiosignaalit siirtyvät joustavasti mainitun aikavälin kuluessa kuulu- maan esimerkiksi siten, että ensimmäinen audiosignaali kuuluu käyttäjän va-: . ·. semmalta puolelta ja toinen audiosignaali käyttäjän oikealta puolelta.
: 35 Keksinnön mukaista suodatuksen ohjausta voidaan parantaa vielä siten, että estetään erilaisten kohinapurskeiden vaikutukset suodattimien ohja- 15 112016 ukseen. Tämä voidaan keksinnön erään edullisen suoritusmuodon mukaisesti toteuttaa esimerkiksi kuvion 6 mukaisella järjestelyllä. Myös tällöin kukin konfe-renssisillan sisääntulo käsittää, edullisesti vastaanottokoodekin (Decod) jälkeen, VAD-yksikön (VADi,..., VADn), joka on järjestetty havaitsemaan puheen 5 vastaanotetun audiosignaalin audiokehyksistä. VAD-yksikkö tarkistaa jokaisen kehyksen ja tarkistuksen tuloksena lähetetään ohjausyksikölle CTRL ohjaussignaali, joka kertoo, onko tarkistetusta kehyksestä löydetty aktivoitua puhetta vai ei. Jokaiselta VAD-yksiköltä vastaanotetun ohjaussignaalin perusteella ohjausyksikkö CTRL määrittelee esimerkiksi edellä kuvatulla tavalla, onko si-10 sääntulevien audiosignaalien kehyksissä samanaikaisesti yksi vai useampia aktiivisia puhesignaaleja. Eri sisääntulojen audiosignaalien audiokehykset syötetään audioprosessointiyksikölle APU, jonka muodostaman yhdistetyn audiosignaalin audiokehykset syötetään edelleen puskurimuistiin BMEM. Samalla kuhunkin yhdistetyn audiosignaalin audiokehykseen liitetään erillisenä lippuna 15 (esim. yksi bitti) ohjausyksiköltä CTRL saatava edellä kuvatun määrittelyn tulos. Täten jokaiseen puskurimuistiin tallennettuun audiosignaalin audiokehykseen on liitetty tieto, joka indikoi, käsittääkö kyseinen audiokehys samanaikaista puhetta yhdestä vai useammasta konferenssisillan sisääntulosta.
Nyt tämän lipun ilmaisemaa tietoa voidaan käyttää hyväksi multi- 20 pleksereiden ohjauksessa edullisesti siten, että audiosignaalien syöttö joko :·. suodattimiin DF1 ja DF2 tai suoraan summain-skaalaimelle SUM/SCALE mää- ritetään usean peräkkäisen audiokehyksen käsittämän lipun arvon perusteella.
Näin ollen multipleksereiden ohjaus voidaan määrittää esimerkiksi kolmen pe- ; ; räkkäisen audiokehyksen lippujen arvon perusteella. Näin voidaan edullisesti ♦ · ’· *! 25 välttää suodatustoiminnon tarpeeton vaihtaminen tilanteessa, jossa yksittäinen tai esimerkiksi kaksi peräkkäistä audiokehystä käsittää ylimääräisen ko-hinapurskeen, kuten taustakohinaa, joka on VAD-yksikössä tulkittu väärin puheeksi samanaikaisesti jonkin todellisen puhesignaalin lisäksi. Mikäli puskuris-sa olevien audiokehysten lippuarvot osoittavat, että kyseessä oli vain lyhyt ko-30 hinapurske, ohjataan multipleksereitä edullisesti siten, että suodatustoimintoa • ei vaihdeta lainkaan. Jos taas kaikkien kolmen audiokehyksen lippuarvot osoit- »tl *;; ' tavat, että suodatustoiminto tulee vaihtaa, ohjataan multiplekserit suorittamaan vaihto. On selvää, että kolme tarkasteltavaa audiokehystä on vain eräs esi-| ; ; merkki siitä, kuinka montaa audiokehystä voidaan tässä yhteydessä tarkastel- itt t : 35 la. Sopiva audiokehysten määrä voi luonnollisesti vaihdella järjestelmän toteu tuksesta riippuen eikä tarkasteltavien audiokehysten määrä ole välttämättä 16 112016 sama kuin puskuriin tallennettujen audiokehysten määrä. Koska puskurointi aiheuttaa aina viivettä äänilähteen ja kuulijan välisessä tiedonsiirrossa, on puskuriin tallennettavien kehysten lukumäärä edullista pitää vähäisenä, kuten esimerkiksi kolmena kehyksenä. Kehyksen pituutta voidaan kuitenkin muuttaa 5 konferenssisillassa, jolloin myös puskuriin mahtuvien kehysten lukumäärä voi vaihdella. Konferenssisillan muodostaman audiokehyksen pituus on audiosignaalin prosessoinnin kannalta edullista pitää samana kuin käytössä olevan koodekin kehyksen pituus, tyypillisesti joitakin kymmeniä millisekunteja (esim. AMR:llä 20 ms), mutta konferenssisillan muodostaman audiokehyksen pituus 10 voi myös poiketa koodekin kehyksen pituudesta.
Puskurissa olevien audiokehysten lippuarvojen tarkastelu ja multi-pleksereiden ohjaus voidaan edullisesti suorittaa toisen ohjausyksikön avulla, joka voidaan toteuttaa kuvion 6 mukaisesti esimerkiksi tilakoneena FSM. Tilakone käsittää tiedon siitä, mikä on suodatuksen ohjauksen tila tällä hetkellä 15 sekä mikä on puskurimuistissa seuraavana olevien audiokehysten (tietty lukumäärä tai kaikki puskurimuistin käsittämät audiokehykset) lippujen arvo. Kulloinkin käytetyn päättelyn perusteella tilakone muodostaa suodattimille lähetettävän ohjaussignaalin.
Erään vaihtoehtoisen suoritusmuodon mukaisesti tilanteessa, jossa 20 on vain yksi puhuja, puhe voidaan syöttää kampasuodattimille, sen sijaan, että se ohjattaisiin niiden ohi SUM/SCALE yksikölle. Jos suodattimet ovat aidosti komplementaarisia tämä ei eroa siitä, että signaali ohjattaisiin SUM/SCALE
• · · j ·’ yksikölle suoraan, koska summa kampasuotimista on yksikkövahvistus. Tällai- i.i : nen ratkaisu yksinkertaistaa edullisesti konferenssisillan rakennetta. Tällöin 25 uuden puhujan tullessa mukaan voidaan vaihtaa ensimmäiselle suotimelle uu-':": si puhuja ja tiputtaa ensimmäinen puhuja kyseiseltä suotimelta pois.
; ‘" * Keksinnön erään edullisen suoritusmuodon mukaisesti erillisiä VAD-
• M
yksiköitä ei välttämättä tarvita lainkaan, vaan VAD-tunnistus voi tapahtua suo- raan konferenssisillan kunkin sisääntulon vastaanottokoodekissa (Decod). Täl- !···, 30 löin vastaanottokoodekki on järjestetty havaitsemaan vastaanotettujen kehys- ten sisältö, ts. käsittävätkö ne puhetta vai eivät. Tämä havaitseminen tapahtuu :..v vastaanotetun kehyksen tyypin perusteella, jolloin koodekki määrittää onko ky- seessä puhe vai eriasteinen taustamelusta aiheutuva kohina. Tämän perus- : teella voidaan määrätä ns. puhelipun arvo, jolloin jos puhelipun arvo osoittaa, » » * 35 että audiokehys käsittää puhetta, voidaan tämä indikaatio viedä suoraan vas-taanottokoodekilta ohjausyksikölle CTRL ilman, että tarvitaan välissä erillistä 17 112016 VAD-yksikköä. Tämä säästää edullisesti prosessointitehoa konferenssisillassa CB, koska erillistä VAD-laskentaa ei tarvitse suorittaa. Vastaanottokoodekissa suoritettava VAD-tunnistus on alan ammattimiehelle sinänsä tunnettua ja se on kuvattu tarkemmin patenttihakemuksessa WO 01/08136.
5 Keksinnön erään edullisen suoritusmuodon mukaisesti kuvion 5 mukainen päätelaite voi käsittää myös ns. mono/stereoestimaattori (M/S estimator), joka vastaanottaa suodattimilta tulevat audiosignaalit ja analysoi nämä. Määrittämällä signaaleihin muodostuneet amplitudierot mo-no/stereoestimaattorissa voidaan muodostaa estimaatti siitä, kuinka monta 10 äänilähdettä on samanaikaisesti käytössä ja mitkä ovat niiden sijainnit toisiinsa nähden. Tätä tietoa voidaan käyttää hyväksi päätelaitteella esim. mikäli puhujia on kaksi valitaan toistettavaksi suodatetut signaalit tai mikäli puhujian on yksi, signaali dekooderin ulostulosta (ennen suodatusta) voidaan toistaa suoraan kuulijalle. Näin vältetään turha yhden puhujan signaalin värittyminen. Mo-15 no/stereoestimaattorin toiminta on alan ammattimiehelle sinänsä tunnettua ja sen eräs toteutus on kuvattu tarkemmin patenttihakemuksessa EP 955789.
Yleisesti ottaen, keksinnön mukaisten olennaisten menetelmäaske-lien toteuttamista voidaan havainnollistaa kuvion 7 mukaisella vuokaaviolla. Edellä on havainnollistettu keksinnön useita eri suoritusmuotoja. Kuitenkin 20 näillä eri suoritusmuodoilla on tiettyjä yhteisiä, keksinnön toteuttamisen kan-... naita olennaisia vaiheita, joita kuvataan kuvion 7 avulla. Konferenssisillan kan- naita tarkasteltuna aloitustilanteessa (700) konferenssipuheluun ottaa osaa * » · ; ; ‘ useita päätelaitteita, jotka ovat yhteydessä konferenssisillan eri sisääntuloihin ·*·'· : (702). Konferenssisillassa tunnistetaan sisääntulojen audiosignaaleista olen- · •. ‘ : 25 naisesti samanaikaisesti aktiivisena olevia tiettyjä audiosignaaleja (704), jolloin voidaan myös määrittää näiden lukumäärä. Nämä tietyt audiosignaalit ovat ennalta määritettyjä audiosignaaleja, tyypillisesti puhesignaaleja, mutta ne voivat olla myös muita audiosignaaleja, kuten musiikkia tai konferenssisillassa keinotekoisesti luotuja tilaääniä. Yksinkertaisemmillaan edellä mainittu luku-.··, 30 määrän määritys käsittää erottelun yhden ja usean samanaikaisen aktiivisen '·’ audiosignaalin välillä, mutta voidaan määrittää myös aktiivisten audiosignaa- ’.:.: lien tarkka lukumäärä.
Seuraavaksi, mikäli havaitaan, että samanaikaisesti aktiivisia ennal-: ta määritettyjä audiosignaaleja on vähintään kaksi, ohjataan mainitut audiosig- · 35 naalit suodatettavaksi (706). Suodatuksessa käytetään edullisesti komplemen taarisia suodattimia, esimerkiksi kampasuodattimia. Täten suodatetut signaalit 18 112016 saadaan poikkeutettua toisistaan riittävästi niin, että saadaan muodostettua tarvittava informaatio, jotta signaalit voidaan olennaisesti rekonstruoida vastaanotossa. Suodattimien ulostulosta suodatetut signaalit viedään summattavaksi yhdistetyksi audiosignaaliksi (708), jolle tarvittaessa suoritetaan skaala-5 us.
Viimeisenä olennaisena vaiheena lähetetään konferenssisillassa yhdistetty audiosignaali ainakin yhdelle päätelaitteelle, tyypillisesti monotonisella siirtokanavalla (710). On huomattava, että suodatusvaiheesta (706) on myös takaisinkytkentä aiempaan vaiheeseen, jossa sisääntulojen audiosignaa-10 leista määritetään olennaisesti samanaikaisesti aktiivisena olevien tiettyjen audiosignaalien lukumäärä (704). Näin ollen samanaikaisesti aktiivisten audiosignaalien lukumäärää tarkkaillaan jatkuvasti konferenssipuhelun aikana ja suodatuksen ohjausta voidaan edullisesti vaihtaa kesken puheluyhteyden. Edelleen on huomattava, että kuviossa esitetään eräänä suoritusmuotona 15 olennaisesti samanaikaisesti aktiivisena olevien tiettyjen audiosignaalien tun-nistusvaiheesta (704) vaihtoehto, jonka mukaan, mikäli havaitaan vain yksi ennalta määritetty audiosignaali, viedään se suoraan summattavaksi ja skaalattavaksi (708). Tämä edullinen suoritusmuoto ei kuitenkaan ole välttämätön keksinnön toteuttamiseksi. Kuten edellä on erään suoritusmuodon yhteydessä 20 kuvattu, voidaan myös yksi ennalta määritetty audiosignaali suodattaa ennen sen viemistä summattavaksi ja skaalattavaksi.
Konferenssisilta on tyypillisesti tietoliikenneverkkoon konfiguroitu 1*1 ; palvelin, jonka toimintaa hallinnoi konferenssipuhelupalvelua ylläpitävä palve- :·: i luntarjoaja. Konferenssisilta siis dekoodaa puhesignaalin päätelaitteilta vas- • · · 25 taanotetuista signaaleista, yhdistää nämä puhesignaalit käyttämällä jotain si- nänsä tunnettua prosessointitapaa, ja lähettää yhdistetyn audiosignaalin vali-tulla lähetyskoodekilla koodattuna takaisin päätelaitteille. Konferenssisiltana voi toimia myös jokin päätelaite, joka sinänsä voi toimia osanottajana konfe-:1. ’ renssipuhelussa, mutta joka on myös järjestetty tukemaan konferenssipuhelun 30 hallintaa, tyypillisesti konferenssipuhelun ohjaustietojen hallintaa. Puhesignaa-• ‘ lien yhdistäminen yhdistetyksi audiosignaaliksi tapahtuu kuitenkin tyypillisesti tässäkin tapauksessa verkkopalveluna erillisessä konferenssisillassa. Eräitä :.,,: tällaisia osittain konferenssisiltana toimimaan kykeneviä ja konferenssipuhelua : tukevia päätelaitteita ovat Nokia® 9110 ja 9210 Communicator. Edelleen kon- ’·] 35 ferenssisiltana voi toimia esimerkiksi digitaalisen televisioverkon set-top-box.
Keksinnön mukainen konferenssisilta käsittää ainakin määritysvälineet, joilla 19 112016 pystytään määrittämään, kuinka moni konferenssisillalle sisääntulevista audiosignaaleista käsittää olennaisesti samanaikaisesti sellaisia audiokomponentte-ja, jotka halutaan välittää konferenssipuhelun muille osanottajille yhdistetyssä audiosignaalissa. Edelleen keksinnön mukainen konferenssisilta käsittää suo-5 datusvälineet useiden samanaikaisten audiosignaalien suodattamiseksi ja yhdistämiseksi yhdeksi monofoniseksi audiosignaaliksi. Lisäksi keksinnön mukainen konferenssisilta käsittää ohjausvälineet suodattimien ohjaamiseksi mainitun lukumäärän määrityksen perusteella.
Keksintöä voidaan lisäksi hyödyntää erityisesti matkaviestinjärjes-10 telmiin suunnitelluissa pienissä konferenssipuheluissa, joissa yleensä maksimissaan kolme päätelaitetta voi muodostaa keskenään konferenssipuhelun ilman, että operaattorilta tarvitsee tilata konferenssipuhelua erikseen. Mikäli päätelaite käsittää stereotoistovälineet ja välineet spatiaalisen erotuksen muodostamiseksi, tämä ominaisuus indikoidaan edullisesti verkolle, jolloin palvele-15 va verkkoelementti, kuten tukiasema, toimii konferenssisiltana, joka hyödyntää keksinnön mukaista menettelyä.
On huomattava, että edellä esitetyn konferenssipuhelujäijestelmän ja siihen kuuluvien osien, kuten konferenssisillan ja päätelaitteen keksinnön mukaiset toiminnalliset elementit voidaan toteuttaa edullisesti ohjelmistona, 20 kovo-ratkaisuna tai näiden kahden yhdistelmänä. Keksinnön mukainen suodatuksen ohjaus soveltuu erityisen hyvin toteutettavaksi tietokoneohjelmistona, joka käsittää tietokoneen luettavassa muodossa olevat käskyt esimerkiksi digi- *» * • V taalisen signaalinkäsittelyprosessorin DSP ohjaamiseksi ja keksinnön toimin- j : : nallisten askelien suorittamiseksi. Suodatuksen ohjaus voidaan edullisesti to- 25 teuttaa tallennusvälineelle tallennettuna ohjelmistokoodina, joka voidaan suo-riitaa tietokoneen kaltaisella laitteella, kuten esimerkiksi henkilökohtaisella tie-.···. takoneella (PC) tai matkaviestimellä, suodatustoiminnallisuuksien aikaansaa miseksi kyseisellä laitteella. Edelleen keksinnön mukaiset suodatustoiminnalli-.. . suudet voidaan ladata tietokoneen kaltaiseen laitteeseen ohjelmistopäivityk- 30 senä, jolloin keksinnön mukaiset toiminnallisuudet voidaan aikaansaada jo • ·; *' tunnetuissa laitteissa.
: : Keksinnössä voidaan hyödyntää erilaisia audio- ja puhekoodekkeja, kuten esimerkiksi GSM/UMTS-järjestelmistä sinänsä tunnettuja EFR/FR/HR- • I · . ·. puhekoodekkeja ((Enhanced) Full/Half Rate Codec) ja AMR- ja Wideband
I · I
; 35 AMR-puhekoodekkeja (Adaptive Multirate Codec), G.722, G.722.1, G.723.1, ’· ’· G.728, sekä erilaisia aaltomuotokoodekkeja, kuten G.711, sekä MPEG1, 20 112016 MPEG2 ja MPEG4 audiokoodauksessa käytettävät koodekit, kuten AAC-koodekki (Advanced Audio Coding), jotka soveltuvat erilaisten audioformaatti-en koodaamiseen/dekoodaamiseen. Termillä audiokoodekki tarkoitetaan siten sekä audiokoodekkeja perinteisessä mielessä, kuten erilaisia aaltomuotokoo-5 dekkeja, että erilaisissa järjestelmissä käytettäviä puhekoodekkeja sekä bitti-nopeudeltaan skaalautuvia koodekkeja, kuten esimerkiksi MPEG-4 mukainen CELP+AAC. Mikäli toteutuksessa suodatetaan useampia kuin kaksi samanaikaista audiosignaalia, on edullista käyttää esimerkiksi AMR- ja Wideband AMR-puhekoodekkeja tai AAC-koodekkia, jotka pystyvät käsittelemään hyvin 10 suodatuksessa jopa kohtuullisen pahoin vääristyneitä audiosignaaleja.
Alan ammattilaiselle on ilmeistä, että tekniikan kehittyessä keksinnön perusajatus voidaan toteuttaa monin eri tavoin. Keksintö ja sen suoritusmuodot eivät siten rajoitu yllä kuvattuihin esimerkkeihin vaan ne voivat vaihdella patenttivaatimusten puitteissa.
» 1 1 » » * 1 f

Claims (28)

1. Menetelmä konferenssipuhelun ohjaamiseksi järjestelmässä, joka käsittää konferenssisillan (CB) usean päätelaitteilta (UE) tulevan audiosig-5 naalin (li - ln) yhdistämiseksi ja yhdistetyn signaalin lähettämiseksi edelleen ainakin yhdelle mainituista päätelaitteista, joka menetelmä käsittää vaiheet tunnistetaan (704) mainitun konferenssisillan sisääntulojen audiosignaaleista olennaisesti samanaikaisesti aktiivisia ennalta määritettyjä audio-komponentteja, kuten puhesignaaleja, 10 suodatetaan (706) ainakin kaksi mainittua sisääntulojen audiosig naalia olennaisesti erilaisilla suodattimilla (DF1, DF2) erotettavissa olevien signaalien muodostamiseksi, kun samanaikaisesti aktiivisia ennalta määritettyjä audiokomponentteja on enemmän kuin yksi, yhdistetään (708) suodatetut, erotettavissa olevat audiosignaalit yh-15 deksi signaaliksi, lähetetään (710) mainittu yhdistetty signaali ainakin yhdelle päätelaitteelle, vastaanotetaan mainitussa ainakin yhdessä päätelaitteessa mainittu yhdistetty signaali, tunnettu siitä, että 20 erotetaan mainitussa ainakin yhdessä päätelaitteessa mainitut si- sääntulojen audiosignaalit mainitusta yhdistetystä signaalista suodattamalla ; - , - . mainittu yhdistetty signaali olennaisesti samanlaisilla suodattimilla (DF1’t DF2’) ! · • ,·, kuin konferenssisillan suodattimet.
► » ;' 2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, * * » • I 25 että koodataan mainittu yhdistetty signaali audiokoodekilla (Encod) en-’ · ·.: nen sen lähettämistä ainakin yhdelle päätelaitteelle.
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu • siitä, että : " 30 muodostetaan mainitussa päätelaitteessa tilavaikutelma konferens- X sipuhelun osanottajista mainittujen erotettujen signaalien perusteella. * t I
4. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu siitä, f t ’ ·: * ’ että ·,·’· muodostetaan mainittu tilavaikutelma mainittuja suodatettuja sig- : ‘ , j 35 naaleja stereolaajentamalla tai spatialisoimalla (SPU). 112016
5. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että suodatetaan konferenssisillassa mainitut sisääntulojen audiosignaalit olennaisesti erilaisilla suodattimilla siten, että suodatettuihin signaaleihin 5 muodostuu olennainen kanavaero.
6. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että mainitut suodattimet ovat olennaisesti komplementaarisia kampasuodattimia.
7. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, 10 tunnettu siitä, että suoritetaan mainittujen sisääntulojen audiosignaalien suodatus kahdella olennaisesti erilaisella suodattimena.
8. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että 15 suoritetaan mainittujen sisääntulojen audiosignaalien suodatus adaptiivisilla suodattimilla, joiden parametrit määritetään puhesignaalien ominaisuuksien perusteella.
9. Patenttivaatimuksen 7 tai 8 mukainen menetelmä, tunnettu siitä, että 20 suodatetaan ensimmäinen aktiivinen audiosignaali ensimmäisellä suodattimena, yhdistetään mainitun ensimmäisen aktiivisen audiosignaalin jälkeen samanaikaisesti aktivoituvat audiosignaalit yhdistetyksi audiosignaaliksi, ja suodatetaan mainittu yhdistetty audiosignaali toisella suodattimena. ' | j 25
10. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, ‘ ; tunnettu siitä, että määritetään konferenssisillassa ainakin yhden sisään- tulevan audiosignaalin perustaajuus, ja • t ’···' valitaan tai säädetään mainitulle audiosignaalille käytettävä suoda tin määritetyn perustaajuuden perusteella. i '.· 30
11. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii- tä, että . määritetään samanaikaisesti aktiivisten ennalta määrättyjen audio- i-. komponenttien lukumäärä konferenssisillan sisääntulojen käsittämien VAD- yksiköiden tai audiosisältöä määrittävien ACD-yksiköiden avulla. : 35
12. Laite konferenssipuhelun ohjaamiseksi (konferenssisilta, CB), : ’ ; joka on järjestetty yhdistämään useita päätelaitteilta (UE) tulevia audiosignaa- 112016 leja (li - ln) ja lähettämään yhdistetty signaali edelleen ainakin yhdelle mainituista päätelaitteista, joka mainittu laite on jäljestetty tunnistamaan (VAD, CTRL) mainitun laitteen sisääntulojen audiosignaaleista olennaisesti samanaikaisesti aktiivisia ennalta määritettyjä audio-5 komponentteja, kuten puhesignaaleja, suodattamaan (DF1, DF2) mainitut sisääntulojen audiosignaalit olennaisesti erilaisilla suodattimilla erotettavissa olevien signaalien muodostamiseksi, kun samanaikaisesti aktiivisia ennalta määritettyjä audiokomponent-teja on enemmän kuin yksi, tunnettu siitä, että laite on lisäksi järjestetty 10 yhdistämään (SUM/SCALE) suodatetut, erotettavissa olevat audio signaalit sekä signaalien erottamista määrittävää ohjaustietoa (CTRL) yhdeksi signaaliksi, ja lähettämään mainittu yhdistetty signaali ainakin yhdelle päätelaitteelle.
13. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että mainittu laite on järjestetty koodaamaan mainitun yhdistetyn audiosignaalin audiokoodekilla (Encod) ennen sen lähettämistä ainakin yhdelle päätelaitteelle.
14. Patenttivaatimuksen 12 tail3 mukainen laite, tunnettu siitä, 20 että mainittu laite on järjestetty suodattamaan mainitut sisääntulojen au- : diosignaalit olennaisesti erilaisilla suodattimilla (DF1, DF2) siten, että suodatet- v - tuihin signaaleihin muodostuu olennainen kanavaero.
: . . 15. Jonkin patenttivaatimuksen 12-14 mukainen laite, tunnet- « » 2. t u siitä, että | ! mainitut suodattimet ovat olennaisesti komplementaarisia kam- pasuodattimia. I ·
16. Jonkin patenttivaatimuksen 12-15 mukainen laite, tunnet-t u siitä, että * · · : 30 mainitut suodattimet ovat adaptiivisia suodattimia, joiden parametrit I « · on järjestetty määritettäväksi puhesignaalien ominaisuuksien perusteella.
. /. 17. Jonkin patenttivaatimuksen 12-16 mukainen laite, tunnet- tt t u siitä, että mainittujen sisääntulojen audiosignaalien suodatus on järjestetty :,· I 35 suoritettavaksi kahdella olennaisesti erilaisella suodattimena.
: ’ ·.: 18. Patenttivaatimuksen 17 mukainen laite, tunnettu siitä, että 112016 ensimmäinen aktiivinen audiosignaali on järjestetty suodatettavaksi ensimmäisellä suodattimena, mainitun ensimmäisen aktiivisen audiosignaalin jälkeen samanaikaisesti aktivoituvat audiosignaalit on järjestetty yhdistettäväksi yhdistetyksi 5 audiosignaaliksi, ja mainittu yhdistetty audiosignaali on järjestetty suodatettavaksi toisella suodattimena.
19. Jonkin patenttivaatimuksen 12 - 18 mukainen laite, tunnet-t u siitä, että laite on järjestetty 10 määrittämään ainakin yhden sisääntulevan audiosignaalin perustaa- juus, ja valitsemaan tai säätämään mainitulle audiosignaalille käytettävä suodatin määritetyn perustaajuuden perusteella.
20. Jonkin patenttivaatimuksen 12-19 mukainen laite, tunnet- 15 tu siitä, että samanaikaisesti aktiivisten ennalta määrättyjen audiokomponent-tien lukumäärä on järjestetty määritettäväksi konferenssisillan sisääntulojen käsittämien VAD-yksiköiden tai audiosisältöä määrittävien ACD-yksiköiden avulla.
21. Laite konferenssipuhelun ohjaamiseksi (konferenssisilta, CB), joka on järjestetty yhdistämään useita päätelaitteilta (UE) tulevia audiosignaa-leja (h - ln) ja lähettämään yhdistetty signaali edelleen ainakin yhdelle maini- t : ·.'. tuista päätelaitteista, joka mainittu laite on järjestetty : .·, tunnistamaan (VAD, CTRL) mainitun laitteen sisääntulojen audio- i 25 signaaleista olennaisesti samanaikaisesti aktiivisia ennalta määritettyjä audio- • »· ’ ! komponentteja, kuten puhesignaaleja, tunnettu siitä, että laite on lisäksi järjestetty • » '···* suodattamaan mainitut sisääntulojen audiosignaalit olennaisesti komplementaarisilla suodattimilla (DF1, DF2) yhdellä tai useammalla taajuus-i 30 kaistalla, jotka ovat olennaisesti kapeampia kuin puheen taajuus silloin, kun samanaikaisesti aktiivisia ennalta määritettyjä audiokomponentteja on enem-. !·. män kuin yksi, f 5 I !!!< yhdistämään mainitulla yhdellä tai useammalla taajuuskaistalla *: ‘ suodatetut audiosignaalit sekä summaamaan ja skaalaamaan (SUM/SCALE) · 35 mainitun yhden tai useamman taajuuskaistan ulkopuoliset suodattamattomat : ’ .: audiosignaalit yhdeksi yhdistetyksi signaaliksi, ja 112016 lähettämään mainittu yhdistetty signaali ainakin yhdelle päätelaitteelle.
21 112016 Patentti vaati m u kset
22. Päätelaite (UE), joka on järjestetty vastaanottamaan konferens-sisillalta lähetettyä yhdistettyä audiosignaalia, tunnettu siitä, että päätelai- 5 te on lisäksi järjestetty erottamaan sisääntulojen audiosignaalit mainitusta yhdistetystä audiosignaalista suodattamalla mainittu yhdistetty signaali olennaisesti samanlaisilla suodattimilla kuin konferenssisillan suodattimet (DF1’, DF2’), ja muodostamaan tilavaikutelma konferenssipuhelun osanottajista 10 mainittujen suodatettujen signaalien perusteella (SPU).
23. Patenttivaatimuksen 22 mukainen päätelaite, tunnettu siitä, että mainitut suodattimet ovat olennaisesti komplementaarisia kam-pasuodattimia.
24. Patenttivaatimuksen 22 tai 23 mukainen päätelaite, tunnet- t u siitä, että päätelaite käsittää kaksi keskenään olennaisesti erilaista suodatinta mainittujen sisääntulojen audiosignaalien suodattamiseksi.
25. Jonkin patenttivaatimuksen 22 - 24 mukainen päätelaite, 20 tunnettu siitä, että päätelaite käsittää stereo- tai monikanavatoistovälineet erotettujen : *. audiosignaalien toistamiseksi.
26. Jonkin patenttivaatimuksen 22 - 25 mukainen päätelaite, tunnettu siitä, että 25 päätelaite käsittää spatialisointiyksikön (SPU) tai stereolaajen- ; nusyksikön tilavaikutelman luomiseksi konferenssipuhelun osanottajista maini tun yhdistetyn audiosignaalin perusteella.
27. Tietokoneohjelma konferenssipuhelun ohjaamiseksi konferens-sisillassa, joka tietokoneohjelma käsittää ohjelmallisen koodin olennaisesti \\i 30 samanaikaisesti aktiivisten ennalta määritettyjen audiokomponenttien, kuten puhesignaalien, tunnistamiseksi mainitun konferenssisillan sisääntulojen au-diosignaaleista, tunnettu siitä, että tietokoneohjelma käsittää lisäksi ohjelmallisen koodin suodatuksen ohjaamiseksi siten, että ainakin kaksi mainittua sisääntulojen audiosignaalia suodatetaan olennaisesti erilaisil-; 35 la suodattimilla erotettavissa olevien signaalien muodostamiseksi, kun saman- aikaisesti aktiivisia ennalta määritettyjä audiokomponentteja on enemmän kuin * t yksi, 26 1 12016 ohjelmallisen koodin suodatettujen, erotettavissa olevien audiosignaalien sekä signaalien erottamista määrittävän ohjaustiedon yhdistämiseksi yhdeksi signaaliksi, ja ohjelmallisen koodin mainitun yhdistetyn signaalin lähettämiseksi 5 ainakin yhdelle päätelaitteelle.
28. Tietokoneohjelma konferenssisillalta lähetetyn yhdistetyn audiosignaalin vastaanottamiseksi päätelaitteessa, tunnettu siitä, että tietokoneohjelma käsittää ohjelmallisen koodin mainitun yhdistetyn signaalin vastaanoton oh-10 jäämiseksi päätelaitteessa, ohjelmallisen koodin sisääntulojen audiosignaalien erottamiseksi mainitusta yhdistetystä signaalista suodattamalla mainittu yhdistetty signaali olennaisesti samanlaisilla suodattimilla kuin konferenssisillan suodattimet, ja ohjelmallisen koodin tilavaikutelman muodostamiseksi konferenssi-15 puhelun osanottajista mainittujen suodatettujen signaalien perusteella. 112016
FI20012539A 2001-12-20 2001-12-20 Konferenssipuhelujärjestely FI112016B (fi)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FI20012539A FI112016B (fi) 2001-12-20 2001-12-20 Konferenssipuhelujärjestely
EP02102759A EP1324582A1 (en) 2001-12-20 2002-12-16 Teleconferencing Bridge with comb filtering for spatial sound image
US10/324,315 US20030129956A1 (en) 2001-12-20 2002-12-19 Teleconferencing arrangement

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20012539A FI112016B (fi) 2001-12-20 2001-12-20 Konferenssipuhelujärjestely
FI20012539 2001-12-20

Publications (3)

Publication Number Publication Date
FI20012539A0 FI20012539A0 (fi) 2001-12-20
FI20012539A FI20012539A (fi) 2003-06-21
FI112016B true FI112016B (fi) 2003-10-15

Family

ID=8562546

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20012539A FI112016B (fi) 2001-12-20 2001-12-20 Konferenssipuhelujärjestely

Country Status (3)

Country Link
US (1) US20030129956A1 (fi)
EP (1) EP1324582A1 (fi)
FI (1) FI112016B (fi)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020257B2 (en) * 2002-04-17 2006-03-28 Texas Instruments Incorporated Voice activity identiftication for speaker tracking in a packet based conferencing system with distributed processing
US20050059434A1 (en) * 2003-09-12 2005-03-17 Chi-Jen Hong Method for providing background sound effect for mobile phone
US7944861B2 (en) * 2003-10-14 2011-05-17 Tele-Town Hall, Llc System and process for mass telephony conference call
CA2546790C (en) * 2003-11-19 2011-02-22 Research In Motion Limited Systems and methods for added authentication in distributed network delivered half-duplex communications
CN100466671C (zh) * 2004-05-14 2009-03-04 华为技术有限公司 语音切换方法及其装置
US20050259803A1 (en) * 2004-05-19 2005-11-24 Nokia Corporation Managing a conference session
DE102004053597B4 (de) * 2004-11-05 2008-05-29 Infineon Technologies Ag Verfahren zum automatischen Erzeugen und/oder Steuern einer Telekommunikations-Konferenz mit einer Vielzahl von Teilnehmern, Telekommunikations-Konferenz-Endgerät und Telekommunikations-Konferenz-Servereinrichtung
JP2006148816A (ja) * 2004-11-24 2006-06-08 Nec Corp 中継制御装置、多地点間会議システム及び多地点間会議方法
NO328256B1 (no) * 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
US8738787B2 (en) 2005-04-20 2014-05-27 Limelight Networks, Inc. Ad server integration
US8291095B2 (en) * 2005-04-20 2012-10-16 Limelight Networks, Inc. Methods and systems for content insertion
US8000958B2 (en) * 2006-05-15 2011-08-16 Kent State University Device and method for improving communication through dichotic input of a speech signal
US20080187143A1 (en) * 2007-02-01 2008-08-07 Research In Motion Limited System and method for providing simulated spatial sound in group voice communication sessions on a wireless communication device
WO2009100565A1 (zh) * 2008-01-30 2009-08-20 Zte Corporation 一种无线通信系统中实现多方电话会议的方法及系统
US8219400B2 (en) * 2008-11-21 2012-07-10 Polycom, Inc. Stereo to mono conversion for voice conferencing
JP5538425B2 (ja) 2008-12-23 2014-07-02 コーニンクレッカ フィリップス エヌ ヴェ スピーチ取り込み及びスピーチレンダリング
US20100173588A1 (en) * 2009-01-05 2010-07-08 Stuart Owen Goldman Method and apparatus for suppressing radio frequency interference from bluetooth wireless communication channels
WO2010136634A1 (en) * 2009-05-27 2010-12-02 Nokia Corporation Spatial audio mixing arrangement
US8351589B2 (en) * 2009-06-16 2013-01-08 Microsoft Corporation Spatial audio for audio conferencing
US20110075829A1 (en) * 2009-09-30 2011-03-31 Alcatel-Lucent Usa Inc. Method and apparatus for controlling a conference bridge
US9503970B2 (en) * 2009-12-04 2016-11-22 Qualcomm Incorporated Managing a data network connection for mobile communications based on user location
US8670018B2 (en) 2010-05-27 2014-03-11 Microsoft Corporation Detecting reactions and providing feedback to an interaction
US8963987B2 (en) 2010-05-27 2015-02-24 Microsoft Corporation Non-linguistic signal detection and feedback
US8416281B2 (en) 2010-11-24 2013-04-09 International Business Machines Corporation Multipoint conference scalability for co-located participants
US9781169B2 (en) * 2015-01-27 2017-10-03 Tevnos LLC Switch controller for separating multiple portions of call

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3622714A (en) * 1969-09-02 1971-11-23 Bell Telephone Labor Inc Telephonic transmission using complementary comb filters
US4253000A (en) * 1979-01-18 1981-02-24 Rolm Corporation Method and system for reducing conference bridge oscillations
US4456792A (en) * 1982-11-18 1984-06-26 Bell Telephone Laboratories, Incorporated Voice switching arrangement for telephone conferencing
US5271057A (en) * 1991-10-09 1993-12-14 Bell Communications Research, Inc. Audio processing system for teleconferencing system
CA2102857C (en) * 1992-12-31 1998-06-23 Alexander Feiner Technique for reducing echoes in conference communications
TW223724B (en) * 1993-05-24 1994-05-11 American Telephone & Telegraph Conference call participation tracking
US5610906A (en) * 1994-06-29 1997-03-11 Interdigital Technology Corporation Spread-spectrum changeable base station
JPH09102831A (ja) * 1995-07-31 1997-04-15 Canon Inc 通信システム及び通信装置及び通信方法
US5991385A (en) * 1997-07-16 1999-11-23 International Business Machines Corporation Enhanced audio teleconferencing with sound field effect
US6125115A (en) * 1998-02-12 2000-09-26 Qsound Labs, Inc. Teleconferencing method and apparatus with three-dimensional sound positioning
GB2343347B (en) * 1998-06-20 2002-12-31 Central Research Lab Ltd A method of synthesising an audio signal
US6850496B1 (en) * 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6549629B2 (en) * 2001-02-21 2003-04-15 Digisonix Llc DVE system with normalized selection
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder

Also Published As

Publication number Publication date
FI20012539A0 (fi) 2001-12-20
US20030129956A1 (en) 2003-07-10
FI20012539A (fi) 2003-06-21
EP1324582A1 (en) 2003-07-02

Similar Documents

Publication Publication Date Title
FI112016B (fi) Konferenssipuhelujärjestely
FI114129B (fi) Konferenssipuhelujärjestely
US7599834B2 (en) Method and apparatus of voice mixing for conferencing amongst diverse networks
US7724885B2 (en) Spatialization arrangement for conference call
US6463414B1 (en) Conference bridge processing of speech in a packet network environment
US9781273B2 (en) Teleconferencing using monophonic audio mixed with positional metadata
EP3111626B1 (en) Perceptually continuous mixing in a teleconference
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
EP2901668B1 (en) Method for improving perceptual continuity in a spatial teleconferencing system
CN101502089A (zh) 进行音频会议的方法、音频会议装置和编码器之间的切换方法
US6697342B1 (en) Conference circuit for encoded digital audio
KR20230049660A (ko) 오디오 신호를 인코딩하거나 인코딩된 오디오 장면을 디코딩하기 위한 장치, 방법 및 컴퓨터 프로그램
US9258429B2 (en) Encoder adaption in teleconferencing system
EP2171712B1 (en) Method and arrangement for enhancing spatial audio signals
GB2582910A (en) Audio codec extension
US7945006B2 (en) Data-driven method and apparatus for real-time mixing of multichannel signals in a media server
JP2001272998A (ja) 通信方法とワイヤレス呼接続装置
US10242683B2 (en) Optimized mixing of audio streams encoded by sub-band encoding
JP4108396B2 (ja) 多地点制御装置の音声符号化伝送システム
CN113302687B (zh) 多点控制方法、多点电话连接系统及记录介质
CN113330514A (zh) 多点控制方法、装置及程序