NO146521B

NO146521B - Fremgangsmaate og innretning for detektering av naervaer eller fravaer av et talesignal paa en talekanal

Info

Publication number: NO146521B
Application number: NO762317A
Authority: NO
Inventors: Federico Vagliani; Alcide Molinari
Original assignee: Telettra Lab Telefon
Priority date: 1975-07-03
Filing date: 1976-07-02
Publication date: 1982-07-05
Also published as: BR7603465A; NO762317L; DE2623025A1; BE842136A; ES449486A1; LU75069A1; FR2316814A1; FR2316814B1; GB1491662A; US4057690A; NL7607412A; IT1044353B; ZA762946B; NO146521C; JPS5231606A

Description

Oppfinnelsen angår en fremgangsmåte for detektering av nærvær eller fravær av et talesignal i et kanalsignal som er knyttet til en telefonlinje eller talekanal som kan tilhøre et interpolasjonssystem av et sett av talekanaler, ved hvilken det utføres en beregning av kanalsignalets korttidseffekt representert ved et første signal, og dette signal sammenliknes med et første forinnstilt, konstant terskelnivå, for frembringelse av et første logisk signal som definerer kanalen som aktiv når korttidseffekten ligger over terskelnivået. Videre angår oppfinnelsen en innretning for utførelse av fremgangsmåten.

Det problem å øke trafikkapasiteten på telefonlinjer i telefonkommunikasjonssystemer har vært stadig øken-de som følge av økninger både når det gjelder krav til og omkostninger ved sådan overføring. Innenfor den kjente teknikk er det blitt gjort flere forsøk på å optimere sådan telefonoverføring, f.eks. ved hjelp av den teknikk som vanligvis betegnes som taleinterpolasjon. Sådanne taleinter-polasjonssytemer, slik de f.eks. er kjent fra US-PS

3 712 959 og 3 878 337, er imidlertid, for oppnåelse av maksimal effektivitet, avhengige av riktig bestemmelse av om et talesignal i et gitt øyeblikk er til stede i et gitt telefon-talekanalsignal eller ikke. Videre er kvaliteten eller påliteligheten av sådan telefonisk overføring direkte avhengig av riktig deteksjon av tilstedeværelsen eller fra-været av talesignalet i alle de telefontalekanaler som er knyttet til et eneste sådant taleinterpolasjonssystem. Sådan taledeteksjon gjøres imidlertid både vanskelig og kost-bar på grunn av tilstedeværelsen av bakgrunnsstøy, som ikke har noe å gjøre med talesignalet, på hver av de tilhørende telefontalekanaler, idet sådan støy normalt er til stede i telefoniske overføringer. For å kompensere for tilstedeværelsen av sådan støy, opererer tidligere kjente taledeteksjonssystemer ved å beregne omhyllingen av et gitt telefon-talekanalsignal og deretter sammenlikne denne beregning med et forinnstilt, konstant terskelnivå som er forinnstilt på

en verdi som er høyere enn det støynivå som vanligvis fin-nes i sådanne talekanalsignaler. Dersom omhyllingen, som

også er kjent som korttidseffekten, overskrider dette terskelnivå, antar derfor sådanne tidligere kjente systemer at nyttig taleinformasjon er til stede, og talekanalen inntar derfor en aktiv tilstand (aktiv kanal) i hvilken talekanalsignalet vil bli overført. Dersom imidlertid den beregnede omhylling er mindre enn dette forinnstilte terskelnivå, antar disse tidligere kjente systemer at bare støy er til stede, i hvilket tilfelle kanalen derfor inntar en uvirksom tilstand (uvirksom kanal) i hvilken talekanalsignalet ikke blir overført. Disse tidligere kjente systemer knytter derfor tilstedeværelsen av tale til en forholdsvis høy effektterskel, og omvendt. Sådan tidligere kjent taledeteksjon er imidlertid ikke tilfredsstillende da taleom-hyllingen ved forskjellige tidspunkter kan være mindre enn det forinnstilte terskelnivå, i hvilket tilfelle systemet ikke vil overføre informasjon som skulle ha vært overført, slik at kvaliteten og påliteligheten av sådanne tidligere kjente systemer derved reduseres.

Formålet med oppfinnelsen er å tilveiebringe en fremgangsmåte og en innretning som overvinner de foran om-talte ulemper og som øker taledeteksjonsnøyaktigheten ved hensiktsmessig beregning av tidsvariasjonene av den omhylling som er knyttet til et gitt talekanalsignal.

For oppnåelse av ovennevnte formål er det tilveiebrakt en fremgangsmåte av den innledningsvis angitte type som ifølge oppfinnelsen er kjennetegnet ved at variasjonene i den beregnede effekt analyseres ved at det første signal sammenliknes med et andre signal som er nøyaktig relatert til den beregnede effekt, for frembringelse av minst ett andre logisk signal som angir kanalens operasjonstilstand, og det første signal videre sammenliknes med et andre forinnstilt, konstant terskelnivå som er likt eller lavere enn det første terskelnivå, for frembringelse av et tredje logisk signal som definerer kanalen som uvirksom når korttidseffekten ligger under det andre terskelnivå, og at de nevnte logiske signaler behandles i en logisk kombinasjonskrets som på sin utgang avgir det endelige logiske signal som indikerer nærvær eller fravær av talesignalet i talekanalen.

Videre er det tilveiebrakt en innretning for detektering av nærvær eller fravær av et talesignal i et kanalsignal som er knyttet til en telefonlinje eller talekanal som kan tilhøre et interpolasjonssystem av et sett av talekanaler, omfattende en beregner for kanalsignalets korttidseffekt representert ved et første signal, og en sammenlikner for sammenlikning av det første signal med et forinnstilt, konstant terskelnivå, for frembringelse av et første logisk signal som definerer kanalen som aktiv når korttidseffekten ligger over terskelnivået, hvilken innretning er kjennetegnet ved at den omfatter en anordning for . avledning av et andre signal som er nøyaktig relatert til den beregnede effekt, en anordning for separat multiplikasjon av det første eller det andre signal med to forskjellige faktorer, en sammenlikner for sammenlikning av de respektive signaler som skriver seg fra de to multiplikasjoner, med det ikke-multipliserte signal, for frembringelse av to andre logiske signaler som angir kanalens operasjonstilstand, en sammenlikner for sammenlikning av det første signal med et andre forinnstilt, konstant terskelnivå som er likt eller lavere enn det første terskelnivå, f or frembringelse av et tredje logisk signal som definerer kanalen som uvirksom når korttidseffekten ligger under det andre terskelnivå, og en anordning for utførelse av en logisk kombinasjon av de nevnte logiske signaler fra sammenliknerne, for avgivelse av det endelige logiske signal som indikerer nærvær eller fravær av talesignalet i talekanalen.

I taledeteksjonssystemet ifølge oppfinnelsen blir tilstedeværelsen av nyttig taleinformasjon i telefontalekanaler bestemt i avhengighet av en sammenlikning av forskjellige avsnitt av omhyllingen av en gitt talekanal over forskjellige tidsområder. Et sådant talesignal har spesiel-le, tilhørende egenskaper ved at det kan betraktes som en amplitudemodulert bølge bestående av en bærefrekvens og det modulerende signal eller omhvlling. Omhyllingen, eller korttidseffekten, av talesignalet mer båndbegrenset (f.eks. 0 - 100 Hz) enn bærefrekvensen (f.eks. 300 - 3400 Hz), og utmerker seg også ved at den normalt varierer med tiden.

I motsetning til dette er bakgrunnsstøyen, som normalt er

til stede i alle telefon-talekanalsignaler, kjennetegnet ved at dens omhylling eller korttidseffekt er i hovedsaken konstant som funksjon av tiden. Fremgangsmåten og innretningen ifølge oppfinnelsen utnytter denne forskjell mellom omhyllingen eller korttidseffekten av talesignalet sammenliknet med omhyllingen eller korttidseffekten av bakgrunns-støyen i et gitt talekanalsignal til å detektere tilstedeværelsen av tale.

Ved utførelse av fremgangsmåten beregnes korttidseffekten eller omhyllingen av talekanalsignalet og størrel-sen av denne verdi sammenliknes i begynnelsen med to forskjellige terskelnivåer. Det første terskelnivå er innstilt på et nivå over korttidseffekten av den bakgrunnsstøy som normalt er til stede i telefon-talekanalsignalet, og dersom talekanalsignalet overskrider dette forinnstilte nivå, antar systemet at tale er til stede. I dette tilfelle vil talekanalen da innta en aktiv tilstand og talekanalsignalet vil bli overført, på tilsvarende måte som i systemene ifølge den kjente teknikk. Det andre terskelnivå er innstilt på et nivå som er lavere enn det første, og er kjennetegnet ved at korttidseffekten av talesignalet normalt er større enn dette andre terskelnivå. Dersom dette andre terskelnivå overskrider korttidseffekten av talekanalsignalet, vil systemet derfor anta at bare støy er til stede, og talekanalen vil innta en uvirksom tilstand i hvilken dette spe-sielle talekanalsignal ikke vil bli overført. I det tilfel-

le at korttidseffekten av talekanalsignalet faller mellom de nevnte to terskelnivåer, vil systemet sammenlikne korttidseffekten av kanalsignalet slik den er beregnet over én del av tidsområdet (signal "a"), med korttidseffekten av kanalsignalet slik det er beregnet over en annen del av tidsområdet (signal "b"). Dersom differansen mellom disse signaler "a" og "b" er større enn en forutbestemt størrelse, vil systemet anta tilstedeværelse av tale i dette talekanalsignal. En sådan variasjon kunne ikke skyldes støy alene da korttidseffekten av sådan bakgrunnsstøy, slik som foran bemerket, er i hovedsaken konstant som funksjon av tiden.

I de situasjoner hvor korttidseffekten eller omhyllingen

av talekanalsignalet ikke overskrider det første terskelnivå, har således systemet ifølge oppfinnelsen, til forskjell fra de tidligere kjente systemer, evne til å detektere tilstedeværelsen av tale.

Oppfinnelsen skal beskrives nærmere i det følgende under henvisning til tegningene, der fig. 1 viser en typisk, tidligere kjent taledetektor, fig. la viser responsen til den kvadrerende krets i den kjente taledetektor, fig. lb viser responsen til lavpassfilteret/integratoren i den kjente taledetektor, fig. 2 viser en første utførelse av en innretning ifølge oppfinnelsen, fig. 3 viser en annen utførelse av oppfinnelsen, fig. 4a viser en korttidseffektberegner, fig. 4b og 4c viser alternative responser for den første blokk i fig. 4a, og fig. 4d og 4e viser alternative responser for den andre blokk i fig. 4a.

Idet det først henvises til fig. 2 på tegningene, viser denne figur en foretrukket utførelse av en taledeteksjonsinnretning ifølge oppfinnelsen. Til innretningen til-føres et konvensjonelt telefon-talekanalsignal f(t) som normalt inneholder både nyttig taleinformasjon og bakgrunns-støy og som av innretningen analyseres med henblikk på tilstedeværelse av tale. Slik som senere nærmere beskrevet,

er det endelige utgangssignal fra innretningen et logisk signal AT som har to binære tilstander som er betegnet "ON"

(dvs. "PÅ") og "OFF" (dvs. "AV"), idet PÅ-tilstanden svarer til tilstedeværelse av tale på kanalen, hvorved det tilveiebringes en aktiv kanal på hvilken talekanalsignalet over-føres, og AV-tilstanden svarer til fravær av tale (eller tilstedeværelse av bare støy) på kanalen, hvorved det tilveiebringes en uvirksom kanal på hvilken talekanalsignalet ikke overføres.

Talekanalsignalet som skal analyseres av innretningen, kan være et analogt basisbånd-signal f(t), eller et digitalt signal oppnådd ved sampling av signalet f(t) med periode Tc og ved kvantisering av disse sampler enten line-ært, i hvilket tilfelle det oppnås et signal f (n.Tc) med like kvantetrinn, eller med en passende kompanderingslov, vanligvis logaritmisk (type A eller y) , i hvilket tilfelle det oppnås et signal f (n.Tc) med ulike kvantetrinn, og endelig ved koding av de kvantiserte sampler med bq bits pr-sampel (f.eks. bs=8) slik at man oppnår et konvensjonelt PCM-signal.

I konvensjonelle systemer blir vanligvis anordnin-ger for deteksjon av nærvær eller fravær av talesignaler (såkalte taledetektorer eller "Speech Detectors", heretter betegnet med forkortelsen S.D.) etterfulgt av en krets som kalles ettervirkningstidsgenerator ("Hangover Time Generator" eller forkortet H.T.G.). Det hittil mest populære talede-teksjonssystem er det som benyttes f.eks. i T.A.S.I.-systemer (Time Assignment Speech Interpolation Systems) hvis blokkdiagram er vist på fig. 1. Inngangssignalet til systemet er kanalsignalet f(t) som er knyttet til den talekanal CF som undersøkes, mens det endelige utgangssignal UF er et logisk signal AT som bare kan innta to tilstander, PÅ og AV. PÅ svarer til talenærvær (eller aktiv kanal) mens AV svarer til talefråvær (eller uvirksom kanal). En konvensjonell taledetektor ("Conventional Speech Detector" eller forkortet C.S.D.) utfører i hovedsaken to grunnleggende funksjoner, nemlig en beregning av korttidseffekten pe(t) av kanalsignalet f(t), og en sammenlikning av den nevnte beregning med et forinnstilt, konstant terskelnivå ptm. Korttidseffekten pe(t) av kanalsignalet beregnes av S.T.P.E.-blokken ("Short Time Power Estimator") som består av to kaskadekoplede blok-ker, nærmere bestemt en kvadreringskrets ("Square Elevator" eller forkortet S.E.) og et lavpassfilter som integrator ("Low Pass Filter as Integrator" eller forkortet L.P.F.I.). Inngangskanalsignalet f(t) kvadreres av overføringsfunksjo-nen T[i] (fig. la) for S.E. (slik at utgangssignalet u er lik kvadratet av inngangssignalet i, dvs. u=i 2, og blir deretter passende filtrert av L.P.F.I. som mottar f (t) på inn-gangen og har h(t) (fig. lb) som impulsrespons (slik at utgangssignalet u=inngangssignalet i foldet med h). Den således oppnådde korttidseffekt-beregning pe(t) blir deretter sammenliknet med et terskelnivå ptm ved hjelp av en effekt-sammenlikner ("Power Comparator" eller forkortet P.C.) som tilveiebringer det ønskede logiske signal (pe > ptm»AT=PÅ;

pe < ptm -*-AT=AV). Som et eksempel kan terskeleffekten ptm innstilles på ca. -40dBmO, og tidskonstanten t for lavpass-filteret kan variere mellom 5 og 50 msek (verdien -40 dBmO avledes fra en CCITT-anbefåling som angir en sådan grense for støyen på telefonlinjer) . ;Som tidligere nevnt er det en grunnleggende ulempe ved de konvensjonelle systemer at de, for å skjelne mellom tale og støy, utfører bare en sammenlikning mellom den beregnede korttidseffekt og et konstant terskelnivå, og således knytter talenærværet til en forholdsvis høy effekt og omvendt, hvilket ikke alltid er riktig. ;Den foreliggende oppfinnelse benytter seg derimot av visse særegenheter ved talesignalet sammenliknet med tilsvarende særegenheter ved støyen, og spesielt følgende: a) Som en første tilnærmelse kan talesignalet oppde-les i forholdsvis lange tidsintervaller (med varighet mellom 10 og 300 ms) generelt betegnet som stemte segmenter og utstemte segmenter. Under de stemte segmenter vibrerer stemmebåndene, idet den således frembrakte lyd senere modifiseres av stemmeorganet. Under de ustemte segmenter blir på den annen side stemmebåndene ikke stimulert, og lyden frembringes ved luftturbulens i stemmeorganet . ;Med henblikk på den foreliggende oppfinnelse er det viktig å merke seg at korttidseffekten for stemte segmenter er mye høyere enn for ustemte ;segmenter. ;b) Selv om det komplette talesignal avhenger av hurtige fenomener, såsom vibrasjonen av stemmebånd ;og luftturbulens i stemmeorganet, avhenger signa-lets korttidseffekt eller omhylling av mye lang-sommere fenomener, såsom tilstanden av stemmeorganet (dvs. relativ stilling av de forskjellige or-ganer) og intensiteten av stimulansen av stemmebåndene . ;Sammenfatningsvis er omhyllingen eller korttidseffekten pe(t) ikke bare mer båndbegrenset (0 til 50 Hz) ;enn det komplette talesignal (300 til 3.400 Hz), men den er også meget variabel med tiden. Oppfinnelsen er særlig basert på det faktum at selv om korttidseffekten av bak-grunnsstøyen er i hovedsaken konstant med tiden, eller bare langsomt variabel, er korttidseffekten pe(t) av talesignalet sterkt variabel med tiden. Dette faktum utnyttes til å rea-lisere taledeteksjonsinnretningen ifølge oppfinnelsen som vil detektere nærvær eller fravær av tale med større nøyak-tighet enn tidligere kjente taledeteksjonssystemer, f.eks. av den type som er vist på fig. 1. ;Den på fig. 2 viste taledeteksjonsinnretning re-presenterer som nevnt en foretrukket utførelse av en taledetektor S.D.l ifølge oppfinnelsen. Kanalsignalet f(t) ankommer til en korttidseffekt-beregner (S.T.P.E.) som på sin utgang avgir korttidseffektsignalet pe(t) ved tiden t. Signalet pe(t) ankommer via en leder 1 til en forsinkelseslinje D.L. som har en forsinkelse At som forårsaker effektsignalet pe(t-At) ved tiden t-At på en leder 2. Effektsignalet pe(t-At) tilføres over ledere 3 hhv. 4 til to multiplikator-blokker K og l/K', og de multipliserte signaler tilføres over ledere 5 hhv. 6 til to effektsammenliknere P.C.l og P.C.2. Effektsignalet pe(t) blir også over respektive ledere 7, 8, 9, 10 tilført direkte til effektsammenliknere P.C.3 og P.C.4 og effektsammenliknerne P.C.l og P.C.2. Til effektsammenliknerne P.C.3 og P.C.4 blir også tilført de to terskelnivåer ptm (leder 11) og ptl (leder 12) som tilfredsstil-ler betingelsen ptm >ptl. For å oppnå det endelige signal AT blir de logiske utgangssignaler fra effektsammenliknerne P.C.4, P.C.l og P.C.2 kombinert ved hjelp av en ELLER-port hvis utgangssignal tilføres til en ytterligere ELLER-port sammen med utgangssignalet fra P.C.3. ;I den beskrevne utførelse blir således korttidseffekten pe(t), som er en funksjon av tiden, avledet fra kanalsignalet f(t). Korttidseffekten pe(t) ved tiden t sammenliknes med et terskelnivå ptm og dersom pe(t) >ptm, defineres kanalen som aktiv (AT -»*PÅ). Korttidseffekten pe(t) sammenliknes også med et annet terskelnivå ptl (ptl <ptm), og dersom pe(t) <ptl, defineres kanalen som uvirksom (AT--AV). Til slutt blir korttidseffekten pe(t) ved tiden t sammenliknet med samme effekt ved tiden t-At, dvs. med pe(t-At), og dersom pe(t) >Kpe(t-At) eller dersom pe(t) < l/K' pe(t-At), defineres kanalen som aktiv (AT—PÅ), og omvendt som uvirksom (AT—AV). Størrelsene K og K<1> er konstanter som er større enn én og ikke nødvendigvis like.

Som et eksempel kan typiske, foretrukne verdier av ovennevnte parametre være som følger: ptm= -30 til -40 dBmO, ptl=-40 til -50 dBmO, At=10-100 ms, K=l,5 - 8 og K'=l,5 - 8. I dette tilfelle faller de forannevnte signaler "a" og "b" sammen med henholdsvis pe(t) og pe(t-At).

En annen utførelse av en taledetektor S.D.2 ifølge oppfinnelsen er vist på fig. 3. I denne utførelse tilføres kanalsignalet f(t) til to liknende S.T.P.E.-blokker. En "hurtig" korttidseffekt-beregner S.T.P.E.F. avgir på sin utgang (leder 1) signalet pef(t) ved tiden t. En "langsom" korttidseffekt-beregner S. T.P.E.S. avgir på sin utgang (leder 2) signalet pes(t) ved tiden t. Det sistnevnte signal pes(t) tilføres over en leder 3 til en multiplikator K og over en leder 4 til en multiplikator l/K', og videre til en sammenlikner P.C.3 over en leder 7 og til en sammenlikner P.C.4 over en leder 8. Signalet pef(t) tilføres til en sammenlikner P.C.l over en leder 9 og til en sammenlikner P.C.2 over en leder 10. Terskelnivåene ptm og ptl (ptm >ptl) tilføres henholdsvis til effektsammenliknerne P.C.4 og P.C.3 via ledere 11 og 12. Utgangssignalene fra multiplikatorene K og l/K' tilføres over ledere 5 og 6 direkte til P.C.l hhv. P.C.2. For å oppnå det endelige signal AT blir ue logiske utgangssignaler fra P.C.4, P.C.l og P.C.2 kombinert ved hjelp av en ELLER-port hvis utgangssignal tilføres til en ytterligere ELLER-port sammen med utgangssignalet fra P.C.3.

I den beskrevne utførelse blir det således fra kanalsignalet f(t) avledet to forskjellige korttidseffekter, nemlig pes(t) ved å integrere f(t) i forholdsvis lange tidsrom, og pef(t) ved å integrere samme signal i forholdsvis korte tidsrom. Vanligvis er integrasjonstidene for pes(t) to til åtte ganger lengre enn integrasjonstidene for pef(t). Det "langsomme" korttidseffektsignal pes(t) sammenliknes med et terskelnivå ptm, og dersom pes(t) > ptm, defineres kanalen som aktiv (AT —-PÅ). Signalet pes(t) sammenliknes også med et annet terskelnivå ptl (ptl> ptm), og dersom pes(t)< ptl, defineres kanalen som uvirksom (AT —AV) . Til slutt blir det "hurtige" korttidseffektsignal pef(t) sammenliknet med det langsomme korttidseffektsignal pes(t), og dersom pef(t)>K pes(t) eller dersom pef(t)<l/K' pes(t), defineres kanalen som aktiv (AT—PÅ), og omvendt som uvirksom (AT—AV) . Størrelsene K og K<1> er konstanter som er større enn én og ikke nødvendigvis like.

Som et eksempel kan typiske verdier av parametre-ne ptm, ptl, K og K' i den beskrevne utførelse være som følger: ptm= -30 til -40 dBmO, ptl= -50 til -60 dBmO,

K = 1,5 - 8 og K' =1,5-8. I dette tilfelle faller de foran nevnte signaler "a" og "b" sammen med pes(t) hhv. pef(t).

Hva angår blokkene S.T.P.E., S.T.P.E.F. og S.T.P.E.S, som er vist på fig. 1-3, bør man merke seg at disse realiseres på vesentlig forskjellige måter avhengig av om de skal behandle analoge signaler av typen f(t) eller digitaliserte signaler av typen f(nTc) og/eller fA(nTc).

På fig. 4a er vist et blokkdiagram som gjelder generelt for S.T.P.E., S.T.P.E.F. og S.T.P.E.S., og hvor det signal som behandles, kan være analogt eller digitalt. Blokken 1 kan være enten en likeretter R, slik at T[i] faller sammen med T,[i] og u = |i| (fig. 4b), eller en "kvadreringskrets" 1 2 (S.E.), slik at T[i] faller sammen med T2[i] og u = i (fig. 4c).

Blokken 2 er i ethvert tilfelle av L.P.F.I.-type med en impulsrespons enten av rektangulær type h1(t) (fig. 4d) eller avtageride eksponentiell type h^Ét) (fig. 4c).

S.T.P.E.F. og S.T.P.E.S, vil være forskjellige fra hverandre ved forskjellige verdier av tidskonstanten t.

Blokkdiagrammet på fig. 4a er gyldig også når

A A

digitale signaler f(n.Tc) eller fA(n.Tc) behandles. I dette tilfelle vil imidlertid også utgangseffekten pe(nTc)

være digital, og impulsresponsene h-^(nTc) og l^CnTc) av L.P.F.I. må betraktes som samplet.

Effektsammenliknerne P.C. vil ha analoge eller digitale inngangssignaler i overensstemmelse med om signa-A A

lene f(t) eller f(n.Tc) eller fA(n.Tc) behandles. Likele-des vil K og l/K' være analoge eller digitale multiplikato-rer." I ethvert tilfelle vil utgangssignalene fra effektsammenliknerne være logiske signaler (PÅ eller AV).

Før det gjøres en direkte sammenlikning mellom de konvensjonelle taledetektorer (C.S.D.) og taledetektorene S.D.l og S.D.2 ifølge oppfinnelsen, er det nødvendig å definere noen parametre som er et mål på oppførselen av de forskjellige taledetektorer.

a) Man sier at støy-immuniteten ("Noice Immunity" eller forkortet N.I.) for en taledetektor er lik

X dBmO dersom taledetektorens AT-utgangssignal, når bare støy er til stede på inngangskanalen f(t), ikke omkoples til PÅ-tilstand opp til en støyeffekt på X dBmO. Jo høyere støyimmunitet N.I., jo bedre taledetektor S.D.

b) Med innstillingstid ("Set Time" eller forkortet S.T.) menes tidsintervallet fra det øyeblikk i

hvilket et vilkårlig talesignal fremkommer på kanalen f(t) og det øyeblikk hvor AT-signalet endres til PÅ. Jo kortere innstillingstid S.T., jo bedre taledetektor S.D. c) Med nullstillingstid (R.T.) menes tidsintervallet fra det øyeblikk i hvilket et vilkårlig talesignal avsluttes på kanalen f(t) og det øyeblikk hvor AT-signalet endres til AV. Jo kortere nullstillingstid R.T., jo bedre taledetektor S.D. d) Med kvalitet (Q) menes en taledetektors evne til å unngå overførings-"hull" (dvs. avbrytelser på

grunn av at AT-signalet endres til AV) under nær-været av et ord eller en setning på kanalen f(t).

Da kvaliteten Q bare kan vurderes subjektivt, er det vanskelig å uttrykke dens størrelse numerisk. Denne egenskap er imidlertid meget viktig da over-føringsavbrytelser i midten av et ord er meget generende. Jo bedre kvalitet Q, jo bedre taledetektor S.D.

Den overlegne ytelse av taledetektorene S.D.l og S.D.2 ifølge oppfinnelsen sammenliknet med konvensjonelle taledetektorer, kan sammenfattes som følger: a) Ved samme støy-immunitet N.I. oppviser taledetektorene S.D.l og S.D.2 kortere S.T. og R.T., og

mye bedre Q.

b) Ved samme kvalitet Q oppviser taledetektorene

S.D.l og S.D.2 kortere S.T. og R.T., og mye høye-re N.I. (10 til 15 dB).

Claims

1. Fremgangsmåte for detektering av nærvær eller fravær av et talesignal i et kanalsignal som er knyttet til en telefonlinje eller talekanal som kan tilhøre et interpolasjonssystem av et sett av talekanaler, ved hvilken det utføres en beregning av kanalsignalets korttidseffekt representert ved et første signal (a), og dette signal sammenliknes med et første forinnstilt, konstant terskelnivå (ptm), for frembringelse av et første logisk signal som definerer kanalen som aktiv når korttidseffekten ligger over terskelnivået, karakterisert ved at variasjonene i den beregnede effekt analyseres ved at det første signal (a) sammenliknes med et andre signal (b) som er nøyaktig relatert til den beregnede effekt, for frembringelse av minst ett andre logisk signal som angir kanalens operasjonstilstand, og det første signal (a) videre sammenliknes med et andre forinnstilt, konstant terskelnivå (ptl) som er likt eller lavere enn det første terskelnivå (ptl^ptm), for frembringelse av et tredje logisk signal som definerer kanalen som uvirksom når korttidseffekten ligger under det andre terskelnivå, og at de nevnte logiske signaler behandles i en logisk kombinasjonskrets som på sin utgang avgir det endelige logiske signal som indikerer nærvær eller fravær av talesignalet i talekanalen.

2. Fremgangsmåte ifølge krav 1, karakterisert ved at det andre signal (b) oppnås ved å forsinke det første signal (a) med en passende størrelse (At).

3. Fremgangsmåte ifølge krav 1, karakterisert ved at det andre signal (b) selv er en korttids-ef f ekt-beregning lik det første signal (a), men oppnås ved integrering i kortere tidsperioder.

4. Fremgangsmåte ifølge ett av de foregående krav, karakterisert ved at det første eller det andre signal (a hhv. b) multipliseres med to forskjellige faktorer.

5. Fremgangsmåte ifølge krav 4, karakterisert ved at de signaler som skriver seg fra de to multiplikasjoner sammenliknes i to separate sammenliknere med det ikke-multipliserte signal.

6. Fremgangsmåte ifølge ett av de foregående krav, karakterisert ved at alle de logiske signaler som skriver seg fra de nevnte sammenlikninger, utsettes for et første logisk behandlingstrinn, bortsett fra det logiske signal som skriver seg fra sammenlikningen av det første signal (a) med det laveste terskelnivå (ptl).

7. Fremgangsmåte ifølge krav 6, karakterisert ved at det logiske signal som skriver seg fra det nevnte første logiske behandlingstrinn, i et andre behandlingstrinn kombineres med det logiske signal som fremkommer ved sammenlikning av det første signal (a) med det laveste terskelnivå (ptl), og det endelige logiske signal som indikerer nærvær eller fravær av tale, tilveiebringes ved dette andre behandlingstrinn.

8. Innretning for detektering av nærvær eller fravær av et talesignal i et kanalsignal som er knyttet til en telefonlinje eller talekanal som kan tilhøre et inter polasjonssystem av et sett av talekanaler, omfattende en beregner (STPE; STPES) for kanalsignalets korttidseffekt representert ved et første signal (a), og en sammenlikner (PC4) for sammenlikning av det første signal (a) med et forinnstilt, konstant terskelnivå (ptm), for frembringelse av et første logisk signal som definerer kanalen som aktiv når korttidseffekten ligger over terskelnivået, karakterisert ved at den omfatter en anordning (DL; STPEF) for avledning av et andre signal (b) som er nøyaktig relatert til den beregnede effekt, en anordning for separat multiplikasjon av det første eller det andre signal (a hhv. b) med to forskjellige faktorer (K og l/K')» en sammenlikner (PCI hhv. PC2) for sammenlikning av de respektive signaler som skriver seg fra de to multiplikasjoner, med det ikke-multipliserte signal (a eller b), for frembringelse av to andre logiske signaler som angir kanalens operasjonstilstand, en sammenlikner (PC3) for sammenlikning av det første signal (a) med et andre forinnstilt, konstant terskelnivå (ptl) som er likt eller lavere enn det første terskelnivå (ptl ptm), for frembringelse av et tredje logisk signal som definerer kanalen som uvirksom når korttidseffekten ligger under det andre terskelnivå, og en anordning for utførelse av en logisk kombinasjon av de nevnte logiske signaler fra sammenliknerne, for avgivelse av det endelige logiske signal (AT) som indikerer nærvær eller fravær av talesignalet i talekanalen.

9. Innretning ifølge krav 8, karakterisert ved at anordningen for avledning av det andre signal (b) består av en forsinkelseslinje (DL) eller et skift-register (forsinkelse At).

10. Innretning ifølge krav 8, karakterisert ved at anordningen for avledning av det andre signal (b) består av en andre korttidseffekt-beregner (STPEF) som arbeider i kortere integrasjonstidsperioder.