PL185513B1

PL185513B1 - Sposób i urządzenie do selektywnej zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek

Info

Publication number: PL185513B1
Application number: PL96325532A
Authority: PL
Inventors: Torbjörn W. Sölve
Original assignee: Ericsson Inc
Priority date: 1995-09-14
Filing date: 1996-09-13
Publication date: 2003-05-30
Also published as: NO981074L; BR9610290A; KR19990044659A; CA2231107A1; KR100423029B1; RU2163032C2; EP0852052B1; CN1121684C; EE03456B1; AU7078496A; PL325532A1; AU724111B2; MX9801857A; EP0852052A1; CN1201547A; JPH11514453A; EE9800068A; NO981074D0; TR199800475T1; DE69613380D1

Description

Przedmiotem wynalazku jest sposób i urządzenie do soloktyweoj zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek. Wynalazek dotyczy systemu redukcji szumów, a zwłaszcza adaptacyjnego systemu poprawiania zrozumiałości mowy, do zastosowania w cyfrowych radiotelefonach przenośnych.

Przemysł telefonii komórkowej dokonał wyjątkowych kroków w operacjach handlowych w Stanach Zjednoczonych, jak również w pozostałej części świata. Zapotrzebowanie na usługi komórkowe w większości obszarów metropolitalnych wyprzedza aktualną przepustowość systemu. Zakładając, że ten trend utrzyma się, telekomunikacja komórkowa osiągnie nawet najmniejsze rynki wiejskie. W wyniku tego, przepustowość komórkowa musi wzrosnąć z utrzymaniem wysokiej jakości usług przy rozsądnych kosztach. Jednym z ważnych kroków w kierunku zwiększenia przepustowości jest konwersja systemów komórkowych z transmisji analogowej na cyfrową. Ta konwersja jest również ważna z tego powodu, że pierwsza generacja osobistych sieci telekomunikacyjnych (PCN - personal communication networks), wykorzystujących tanie, kieszonkowe telefony bezprzewodowe, nadające się do noszenia i wykorzystywane do nawiązywania lub odbierania rozmów w domu, biurze, na ulicy, w samochodzie itp. prawdopodobnie zostanie wyposażona przez operatorów komórkowych z wykorzystaniem cyfrowej infrastruktury komórkowej następnej generacji.

Cyfrowe systemy telekomunikacyjne mają zaletę w postaci wysokowydajnych cyfrowych metod obróbki sygnałów. Cyfrowa obróbka sygnałów polega głównie na obróbce sygnałów cyfrowych, matematycznej i innej. Na przykład po konwersji (cyfryzacji) sygnału analogowego w postać cyfrową taki sygnał cyfrowy może być poddawany filtracji, wzmacnianiu i tłumieniu, z użyciem prostych procedur matematycznych, w procesorze sygnału cyfrowego (DSP - digital signal processor). Zwykle procesory dSp są wytwarzane jako szybkie układy scalone, tak że operacje przetwarzania danych mogą się odbywać w zasadzie w czasie rzeczywistym. Procesory DSP mogą być wykorzystywane również do zmniejszenia bitowej prędkości transmisji cyfryzowanej mowy, co przekłada się na zmniejszenie zajętości widmowej nadawanych sygnałów radiowych, i zwiększenie przepustowości systemu. Na przykład, jeżeli sygnały mowy są cyfryzowane z zastosowaniem lJ-bitowej liniowej modulacji kodowo - impulsowej (PCM - Pulse Code Modulation) i próbkowane w tempie 8 kHz, to występuje szeregowa prędkość bitowa wynosząca 112 kb/s. Ponadto, wykorzystując matematyczne redundancje i inne przewidywalne właściwości ludzkiej mowy, można zastosować metody kodowania głosu dla kompresji szeregowego strumienia bitowego ze 112 kHz do 7,95 kb/s, z osiągnięciem redukcji w stosunku prędkości transmisji 14:1. Zmniejszone prędkości transmisji przenoszą się na większą dostępność pasma.

185 513

Jedną z popularnych metod kompresji mowy, przyjętą w Stanach Zjednoczonych przez TIA do wykorzystania w charakterze standardu cyfrowego dla systemów komórkowych drugiej generacji (to znaczy ID-24), jest predykcyjne kodowanie liniowe pobudzane wektorowym wykazem źródeł (VSELP - vector sourcebook excited linear predictive coding). Niestety, jeżeli kodowane/komprymowane zużyciem VSELP sygnały akustyczne zawierające mowę są zmieszane z szumem otoczenia o dużym poziomie (zwłaszcza „szumem zabarwionym”), to część wyniku mogą stanowić niepożądane parametry sygnału akustycznego. Na przykład, jeżeli cyfrowy telefon przewoźny jest wykorzystywany w zaszumionym środowisku (na przykład wewnątrz poruszającego się samochodu), to kompresji z zastosowaniem algorytmu kodującego VSELp poddawany jest zarówno szum otoczenia, jak i użyteczny sygnał mowy, i nadawany jest do stacji bazowej, gdzie skomprymowany sygnał jest dekodowany i odtwarzany w postaci słyszalnej mowy. Kiedy w format analogowy odtwarzany jest szum tła, to występują niepożądane słyszalne zniekształcenia szumu, niekiedy i mowy. Te zniekształcenia są bardzo przykre dla przeciętnego słuchacza.

Zniekształcenia są powodowane w dużej części przez środowisko, w którym eksploatowane są telefony przewoźne. Telefony przewoźne są zwykle eksploatowane we wnętrzu samochodu, gdzie często występuje otaczający hałas wytwarzany przez silnik pojazdu i otaczający ruch samochodowy. Ten otaczający hałas we wnętrzu samochodu jest zwykle skupiony w zakresie dolnych częstotliwości słyszalnych, a amplituda szumu może się zmieniać w funkcji takich czynników, jak prędkość i przyspieszenie pojazdu, oraz natężenia otaczającego ruchu samochodowego. Ten rodzaj niskoczęstotliwościowego szumu również powoduje znaczne zmniejszenie zrozumiałości mowy dochodzącej od osoby mówiącej w środowisku samochodu. Zmniejszenie zrozumiałości mowy powodowane przez szum niskoczęstotliwościowy może być szczególnie duże w systemach telekomunikacyjnych wykorzystujących wokoder VSELP, lecz może występować też w systemach nie zawierających wokodera VSELP

Wpływ otaczającego szumu na telefon przewoźny może przejawiać się w sposób zależny od użytkowania tego telefonu przewoźnego. W szczególności telefon przewoźny może być użytkowany w trybie bez trzymania w ręku, z telefonem zamocowanym w uchwycie. Uwalnia to użytkownikowi ręce do kierowania, lecz również zwiększa odległość, którą przebywają wypowiadane przez użytkownika słowa przed dotarciem do wejścia mikrofonowego telefonu. Ten wzrost odległości między użytkownikiem a telefonem, wraz ze zmiennością szumów zewnętrznych, może spowodować, że szum stanowi znaczną część ogólnej energii widma mocy sygnału akustycznego wprowadzanego do telefonu.

Znany sposób i system do adaptacyjnej redukcji szumów został ujawniony w opisie patentowym EP 0 645 756. W tym znanym sposobie skokowo zmienia się tłumienie dla każdej ramki audio.

Inny znany system i sposób poprawy zrozumiałości mowy został ujawniony w opisie EP 0 665 530. W tym przypadku wykrywa się mowę w sygnale za pomocą detektora aktywności głosowej, używającego estymaty energii sygnału. Sygnał pozbawiony mowy jest tłumiony, a zamiast niego wprowadza się szum biały poddany filtracji dolnoprzepustowej. Sygnały są filtrowane w filtrach górnoprzepustowych, zależnie od poziomu szumów, a niezależnie od obecności mowy.

W układzie do redukcji szumów, ujawnionym w EP 0 558 312, za pomocą filtru adaptacyjnego wytwarza się sygnał estymujący składowe szumowe sygnału wejściowego. Za pomocą układu regulacji wzmocnienia dobiera się poziom sygnału estymującego i sumuje się sygnał oryginalny z estymatąw sumatorze sygnałów, wytwarzając sygnał pozbawiony szumu.

W opisie patentowym USA nr 4 811 404 ujawniono ulepszony system tłumienia szumów, wykorzystujący widmową modyfikację wzmocnienia sygnału. System zawiera mechanizm progowy, podbijający wzmocnienie po osiągnięciu pewnego progu stosunku sygnału do szumu.

Niemiecki opis patentowy DE 4 012 349 oraz amerykańskie opisy o numerach 4 461 025 i 5 251 263 dotyczą wszystkie odfiltrowywania niepożądanych składowych sygnałów.

Teoretycznie można implementować różne algorytmy obróbki z wykorzystaniem procesorów sygnałów cyfrowych dla filtrowania szumu tła zakodowanego według VSELP. Te roz185 513 wiązania jednakże często wymagają znacznego zużycia zasobów cyfrowej obróbki cyfrowej, mierzonego w milionach instrukcji wykonywanych w ciągu sekundy (MIPS - millions of instructions executed per second), co zajmuje cenny czas przetwarzania, przestrzeń pamięci i powoduje znaczne zużycie mocy zasilania. Każdy z tych zasobów obróbki sygnałów jednak w przypadku radiotelefonów przenośnych jest limitowany. Dlatego proste zwiększanie objętości przetwarzania procesora DSP nie jest rozwiązaniem optymalnym dla minimalizacji szumu tła kodowanego VSELP i innych rodzajów.

Sposób selektywnej zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek, reprezentującego sygnał akustyczny otrzymany w nadajniku, kształtowany na przemian ze składowej mowy, składowej szumowej i składowej mowy wraz ze składową szumową w którym estymuje się poziom energii ramki sygnału cyfrowego, określa się, w odpowiedzi na estymator otrzymany w etapie estymowania, czy ramka sygnału cyfrowego zawiera składową mowy, uaktualnia się estymator szumu w funkcji poprzedniego estymatora szumu i poziomu energii estymowanego podczas etapu estymowania, gdy następuje stwierdzenie, podczas etapu określania, że w skład ramki nie wchodzi składowa mowy, uzyskuje się dostęp do pozycji w tablicy przeglądowej, zawierającej parametry filtru indeksowane względem poziomów estymatorów szumu, przy czym pozycja do której odbywa się dostęp odpowiada wartości estymatora szumu uaktualnionej podczas etapu uaktualniania, według wynalazku wyróżnia się tym, że wybiera się charakterystyki filtracyjne realizowane przez układ filtru, którego charakterystyka częstotliwościowa wykazuje zmienne wzmocnienie w różnych zakresach częstotliwości. Charakterystyki filtru wybiera się w odpowiedzi na zapamiętane parametry filtracyjne pozycji do której odbył się dostęp podczas etapu osiągania dostępu oraz filtruje się ramkę danych cyfrowych za pomocą filtru, który wykazuje charakterystyki filtracyjne, zmieniając ramki danych cyfrowych w odpowiedzi na te charakterystyki filtracyjne.

Sposób korzystnie obejmuje dodatkowo etap pośredni, w którym wyznacza się estymator profilu szumowego ramki sygnału cyfrowego, jeżeli ramka danych cyfrowych została określona jako pozbawiona składowej mowy.

Estymator profilu szumowego, wyznaczany w etapie wyznaczania estymatora profilu szumowego, korzystnie wykorzystuje się w etapie uaktualniania do uaktualniania estymatora profilu szumowego.

Tablica przeglądowa, do której odbywa się dostęp podczas etapu uzyskiwania dostępu, korzystnie zawiera zestaw pozycji, przy czym każda pozycja zestawu zawiera oddzielne charakterystyki filtru.

Oddzielne charakterystyki zestawu pozycji tablicy przeglądowej obejmują korzystnie oddzielne charakterystyki filtru górnoprzepustowego, a każdą charakterystykę filtru górnoprzepustowego określa się oddzielną częstotliwością graniczną. W innym, korzystnym rozwiązaniu każdą charakterystykę filtru górnoprzepustowego określa się oddzielnym nachyleniem charakterystyki częstotliwościowej.

Sposób korzystnie zawiera dodatkowy etap, w którym inkrementuje się wartość licznika dla zliczania każdej ramki, dla której estymuje się poziom energii podczas etapu estymowania. Etap wyboru charakterystyk filtracyjnych układu filtru korzystnie realizuje się, kiedy wartość licznika jest inkrementowana co N-ty raz, przy czym N jest wartością całkowitą większą od jedności.

Urządzenie do selektywnej zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek, reprezentującego sygnał akustyczny otrzymany w nadajniku, kształtowany na przemian ze składowej mowy, składowej szumowej i składowej mowy wraz ze składową szumową zawierające blok estymacji poziomu energii, dostosowany do odbioru wskaźników ramki sygnału cyfrowego, stanowiący blok do estymacji poziomu energii ramki sygnału cyfrowego, detektor mowy sprzężony z blokiem estymacji poziomu energii, stanowiący blok wykrywania składowej mowy, do określania, czy ramka sygnału cyfrowego zawiera składową mowy, blok estymacji szumu, dostosowany do uruchamiania przez blok wykrywania składowej mowy gdy składowa mowy nie stanowi części ramki, stanowiący blok estymacji szumu do uaktualniania estymatora szumu w funkcji poprzedniego estymatora szumu i poziomu energii estymowanego przez blok estymowania, tablicę przeglądową zawierającą zestaw po6

185 513 zycji, z których każda jest indeksowana względem poziomów estymatorów szumu, przy czym dostęp do danej pozycji odpowiada wartości estymatora szumu wytworzonej przez blok estymacji, według wynalazku wyróżnia się tym, że jest zaopatrzone w filtr dostosowany do odbioru ramki danych cyfrowych, o wybieralnych charakterystykach filtracyjnych realizowanych przez układ filtru, w których charakterystyka częstotliwościowa ma zmienne wzmocnienie w różnych zakresach częstotliwości, przy czym charakterystyki filtru są dobrane odpowiednio do pozycji tablicy przeglądowej, do których się odbył dostęp odpowiednio do estymaty szumu uaktualnionej przez blok estymacji szumu.

Korzystnie, urządzenie dodatkowo zawiera blok estymacji profilu szumowego do wyznaczania estymatora profilu szumowego ramki danych cyfrowych, gdy ramka danych cyfrowych została określona przez blok wykrywania składowej mowy jako pozbawiona składowej mowy.

Rozwiązanie według niniejszego wynalazku umożliwia przygotowanie adaptacyjnego systemu redukcji szumów zmniejszającego niepożądane udziały zakodowanego szumu tła przy minimalizacji zarówno ujemnego oddziaływania na jakość zakodowanej mowy, jak minimalizacji wszelkiego zapotrzebowania na zasoby cyfrowej obróbki sygnałów. Sposób i system według niniejszego wynalazku zwiększa zrozumiałość mowy w cyfryzowanym sygnale akustycznym przez przepuszczenie ramek cyfryzowanego sygnału akustycznego przez układ filtru. Układ filtru działa w charakterze strojonego filtru górnoprzepustowego, który odfiltrowuje pewną część sygnału cyfryzowanego w zakresie dolnych częstotliwości słyszalnych i przepuszcza część sygnału cyfryzowanego w wyższych zakresach częstotliwościowych. Ponieważ szum ma tendencję do skupiania się w dolnym zakresie częstotliwości słyszalnych, i tylko stosunkowo niewielka część zrozumiałości mowy przypada na ten zakres dolnych częstotliwości, to układ filtru odfiltrowuje dużą część szumu cyfryzowanego sygnału akustycznego, i tylko mniej ważne segmenty mowy. W wyniku tego zostaje usunięta znacznie większa cześć eaergii szumów, niż energii mowy. Przez adaptacyjne dostrajanie i wybieranie krzywej odpowiedzi częstotliwościowej układu filtrującego, ogranicza się ilość odfiltrowywanej mowy, i filtracja ma minimalne oddziaływanie na zrozumiałość mowy wyprowadzanej przez radio.

Układ sterowania filtrem wykorzystuje się do strojenia układu filtracyjnego dla otrzymywania różnych charakterystyk częstotliwościowych w funkcji estymatora szumu i/lub wyniku profilu widmowego odpowiadającego szumowi w sygnale akustycznym. Estymator szumu i/lub wyniki profilu widmowego są dostrajane po-ramkowo do sygnału cyfrowego w funkcji detekcji mowy. Jeżeli nie zostaje wykryta mowa, to estymator szumu i/lub wynikowy profil widmowy zostają uaktualnione dla danej ramki. W razie wykrycia mowy, estymator szumu i/lub wynik profilu widmowego pozostawia się bez regulacji.

W pierwszej odmianie wykonania, układ filtrujący oblicza estymatory szumowe dla ramek cyfryzowanych sygnałów akustycznych. Estymator szumu odpowiada ilości szumu tła w ramkach cyfryzowanych sygnałów analogowych. Ponieważ względna ilość szumu tła w stosunku do mowy wzrasta w zakresie niskoczęstotliwościowym, to estymator szumu rośnie. Układ sterujący filtru wykorzystuje estymator szumu do dostrojenia układu filtru dla odfiltrowania większej części zakresu niskoczęstotliwościowego mowy w miarę, jak wzrasta względny stosunek szumu tła do mowy w zakresie niskoczęstotliwościowym. Kiedy nie występuje w ogóle szum tła, nie jest odfiltrowywana żadna część sygnału mowy. Kiedy występuje wysoki poziom szumu tła, usuwane są większe części szumu i informacji mowy. Ponieważ szum zwykle gromadzi się w zakresie niskoczęstotliwościowym, i na ten zakres niskoczęstotliwościowy przypada stosunkowo mała część zrozumiałości sygnału akustycznego, to ogólną zrozumiałość sygnału akustycznego można zwiększyć przez zwiększenie odfiltrowywanej części energii niskoczęstotliwościowej w miarę wzrostu estymatora szumu.

W drugiej odmianie wykonania stosuje się zmodyfikowany układ sterowania filtru służący do takiej regulacji filtru, aby wykazywał różne charakterystyki częstotliwościowe w funkcji profilu szumowego estymatora szumu za wybrany zakres częstotliwościowy w sygnale akustycznym. Układ sterujący filtru zawiera analizator widma, do określania estymatora profilu szumowego w funkcji detekcji mowy. Estymator profilu szumowego jest wyznaczany

185 513 dla aktualnej ramki i porównywany jest z profilem szumowym odniesienia. Na podstawie tego porównania układ filtru dostrajany jest adaptacyjnie dla wycinania różnych ilości energii niskoczęstotliwościowej z aktualnej ramki.

Układ adaptacyjnej redukcji szumów według niniejszego wynalazku może być, korzystnie, stosowany do systemów telekomunikacyjnych, w których radiowe urządzenia nadawczo-odbiorcze przenośne/przewoźne komunikują się kanałami radiowymi między sobą lub z abonentami stałych linii telefonicznych. Każde urządzenie nadawczo-odbiorcze zaopatrzone jest w antenę, odbiornik do przetwarzania sygnałów radiowych, otrzymanych w kanale radiowym za pośrednictwem anteny, na analogowe sygnały akustyczne, oraz nadajnik. Nadajnik zawiera koder-dekoder (kodek) do cyfryzacji analogowych sygnałów akustycznych, do nadawania w ramkach cyfryzowanej informacji mowy, przy czym informacja mowy zawiera zarówno mowę, jak i szum tła. Procesor cyfrowej obróbki sygnałów przetwarza aktualną ramkę na. podstawie estymatora szumu tła i detekcji mowy w aktualnej ramce, dla zminimalizowania szumu tła. Modulator moduluje nośną w. cz. obrobioną ramką informacji cyfryzowanej mowy, w celu następnego nadania przez antenę.

Przedmiot wynalazku, w przykładzie wykonania, został bliżej objaśniony na rysunku, na którym fig. 1 przedstawia ogólny blokowy schemat funkcjonalny dotyczący niniejszego wynalazku, fig. 2 - strukturę ramki i przedziału według cyfrowego standardu IS-54 USA na radiokomunikację komórkową, fig. 3 - schemat blokowy pierwszej korzystnej odmiany wykonania niniejszego wynalazku zaimplementowanego z wykorzystaniem procesora cyfrowej obróbki sygnałów, fig. 4 - blokowy schemat funkcjonalny przykładowej odmiany wykonania według niniejszego wynalazku w jednym z wielu przenośnych radiowych urządzeń nadawczo - odbiorczych w systemie telekomunikacyjnym, fig. 5A i 5B - s^<^<ć działań, ilustrującą funkcje/operacje realizowane przez procesor cyfrowej obróbki sygnałów w implementacji pierwszej odmiany wykonania według niniejszego wynalazku, fig. 6A - wykres, ilustrujący pierwszy przykład charakterystyki tłumienia układu filtru w funkcji częstotliwości, w pierwszej korzystnej odmianie wykonania niniejszego wynalazku, fig. 6B - wykres, ilustrujący drugi przykład charakterystyki tłumienia układu filtru w funkcji częstotliwości w pierwszej korzystnej odmianie wykonania niniejszego wynalazku, fig. 7 - tablicę przeglądową, dostępną dla układu sterowania filtru, w pierwszej korzystnej odmianie wykonania niniejszego wynalazku, fig. 8A i 8B - wykresy, ilustrujące charakterystyki amplitudy w funkcji częstotliwości przykładowych wejściowych sygnałów akustycznych, fig. 9A i 9B - wykresy ilustrujące charakterystyki amplitudy w funkcji częstotliwości wejściowych sygnałów akustycznych z figur, odpowiednio 8A i 8B, po przefiltrowaniu w układzie filtru według niniejs.zego wynalazku, fig. 10 - schemat blokowy drugiej korzystnej odmiany wykonania niniejszego wynalazku zaimplementowanego z wykorzystaniem procesora cyfrowej obróbki sygnałów, fig. 11 - sieć działań odpowiadającą sieci działań z fig. 5B, ilustrującą funkcje/operacje realizowane przez procesor cyfrowej obróbki sygnałów w implementacji drugiej odmiany wykonania według niniejszego wynalazku, natomiast fig. 12 przedstawia przykładową tablicę przeglądową dostępną dla układu sterowania filtru w drugiej korzystnej odmianie wykonania niniejszego wynalazku.

Figura 1 przedstawia ogólny schemat blokowy adaptacyjnego systemu 100 redukcji szumów według niniejszego wynalazku. Adaptacyjny system 100 redukcji szumów zawiera układ 105 sterowania filtru dołączony do układu 115 filtru. Układ 105 sterowania filtru generuje sygnał sterujący filtru dla aktualnej ramki cyfryzowanego sygnału akustycznego. Sygnał sterujący filtru jest doprowadzany do układu 115 filtru, a układ 115 filtru dokonuje dostrojenia, w odpowiedzi na sygnał sterujący filtru, aż do uzyskania charakterystyki górnoprzepustowej wybranej na podstawie sygnału sterującego filtru. Dostrojony układ 115 filtru przefiltrowuje aktualną ramkę cyfryzowanego sygnału akustycznego. Sygnał filtracyjny obrabiany jest przez wokoder 120 w celu wytworzenia sygnału kodowanego reprezentującego scyfryzowany sygnał akustyczny.

W przykładowej odmianie wykonania według niniejszego wynalazku zastosowanej do radiotelefonicznych przenośnych/ruchomych urządzeń nadawczo-odbiorczych w komórkowym systemie telekomunikacyjnym, fig. 2 przedstawia strukturę ramki wielodostępu z po8

185 513 działem czasowym (TDMA - time division multiple access) wykorzystywanej przez standard IS-54 dla cyfrowej telekomunikacji komórkowej. „Ramka” jest to dwudziestomilisekundowy okres czasu, który zawiera jeden blok nadawczy TX, jeden blok odbiorczy RX oraz blok zmierzonej wartości natężenia sygnału wykorzystywany do mobilnego przekazywania ze wspomaganiem (MAHO - mobile-assisted hand-off). Dwie kolejne ramki przedstawione na fig. 2 nadawane są w okresie czterdziestu milisekund. Informacja cyfryzowanej mowy i szumu tła zostaje obrobiona i przefiltrowana na zasadzie filtrowania kolejnych ramek, w sposób opisany dokładniej poniżej.

Korzystne jest, jeżeli funkcje układu 105 sterowania filtru, układu 115 filtru, i wokodera 120, przedstawione na fig. 1 są zaimplementowane za pomocą procesora cyfrowej obróbki sygnałów o dużej szybkości działania. Jednym z nadających się do tego procesorów jest TM320C53 DSP dostępny z firmy Texas Instruments. Ten procesor TM320C53 DSP stanowi pojedynczy scalony jednoukładowy mikroprocesor 16-bitowy, z wewnętrzną pamięcią RAM do magazynowania danych, na przykład ramek mowy przeznaczonych do obróbki, pamięcią ROM, do magazynowania różnych algorytmów obróbki danych, włącznie z algorytmem kompresji mowy VSELP i innymi algorytmami, które opisano poniżej w przypadku implementacji funkcji realizowanych przez układ 105 sterowania filtru i układ 115 filtru.

Na fig. 3 przedstawiono pierwszą odmianę wykonania niniejszego wynalazku. W tej pierwszej odmianie wykonania układ 105 sterowania filtru strojony jest w funkcji estymatorów szumu tła wyznaczonych przez układ sterowania filtru. Ramki informacji akustycznej z modulacją kodowo - impulsową są magazynowane kolejno w wewnętrznej pamięci RAM procesora cyfrowej obróbki sygnałów. Informacja akustyczna może być cyfryzowana za pomocą innych metod cyfryzacji. Każda ramka PCM jest odczytywana z wewnętrznej pamięci RAM procesora DSP i obrabiana przez blok 210 estymacji energii ramki, i magazynowana tymczasowo w tymczasowej pamięci 220 ramki. Energia aktualnej ramki, wyznaczana przez blok 210 estymacji energii ramki, jest podawana do bloków funkcjonalnych estymacji 230 szumu i detektora 240 mowy. Detektor 240 mowy wskazuje, że w danej ramce zawarta jest mowa, kiedy estymator energii przekracza wartość sumy poprzedniego estymatora szumu i progu mowy. Jeżeli detektor mowy stwierdza, że nie występuje mowa, to procesor 200 cyfrowej obróbki sygnałów oblicza uaktualniony estymator szumu w funkcji poprzedniego estymatora szumu i aktualnej energii ramki (blok 230) .

Uaktualniony estymator szumu jest wyprowadzany do selektora 235 filtru. Selektor 235 filtru generuje sygnał sterujący filtru na podstawie estymatora szumu. W korzystnej odmianie wykonania, selektor 235 filtru przy generowaniu sygnału sterującego filtru uzyskuje dostęp do tablicy przeglądowej. Tablica przeglądowa zawiera szereg wartości sterujących filtru, z których każda jest skojarzona z estymatorem szumu lub zakresem estymatorów szumu. Wartość sterująca filtru z tablicy przeglądowej wybierana jest na podstawie uaktualnionego estymatora szumu i ta wartość sterująca filtru reprezentowana jest przez sygnał sterujący filtru wyprowadzany do banku 265 filtru dla układu 115 filtru. Dla stabilizacji tego procesu i uniknięcia kolejnego przełączania między różnymi filtrami, po wyborze nowego filtru ustanawia się czas zawieszenia na N ramek. Nowy filtr może być wybierany tylko co N ramek, przy czym N jest liczbą całkowitą większą od jedności, a korzystnie, większą od 10.

Układ 115 filtru dostrajany jest w odpowiedzi na sygnał sterujący filtru dla uzyskania górnoprzepustowej charakterystyki częstotliwościowej odpowiadającej wprowadzanemu sygnałowi sterującemu filtru i estymatorowi szumu. Dla uzyskania wybranych charakterystyk częstotliwościowych można wykorzystywać różne spośród znanych wielu typów układów filtracyjnych. Te znane filtry obejmują filtry IIR, takie jak filtry Butterwortha, Czebyszewa lub eliptyczne. Filtry IIR są bardziej korzystne od również możliwych do stosowania filtrów FIR, ze względu na mniejsze wymagania przetwarzania. Filtrowany sygnał jest obrabiany przez wokoder 120, który wykorzystywany jest do kompresji prędkości strumienia bitowego sygnału przefiltrowanego. W korzystnych odmianach wykonania, wokoder 120 do kodowania sygnału akustycznego wykorzystuje predykcyjne kodowanie liniowe pobudzane wektorowym wykazem źródeł (VSELP - vector sourcebook excited linear predictive coding). Możliwe jest również stosowanie innych metod i algorytmów kodowania głosu, jak na przykład predykcyj185 513 ne kodowanie liniowe pobudzane kodem (CELP - code excited linear predictive coding), liniowe kodowanie predykcyjne pobudzane impulsem resztkowym (RPE - LTP - pulse excited linear predictive coding), udoskonalone pobudzane kodowanie wielopasmowe (IMBE - improved multiband excited coding). Przy filtrowaniu ramek sygnałów akustycznych według niniejszego wynalazku przed kodowaniem głosowym, minimalizowany jest szum tła, co zasadniczo zmniejsza wszelki niepożądane oddziaływania szumowe na mowę przy jej odtwarzaniu. Zapobiega również „zagłuszaniu” mowy przez szum niskoczęstotliwściowy.

Procesor 200 cyfrowej obróbki sygnałów opisany w odniesieniu do fig. 3 może znaleźć zastosowanie, na przykład w urządzeniu nadawczo-odbiorczym przenośnego radiotelefonu cyfrowego stosowanego w systemie telekomunikacyjnym. Figura 4 przedstawia jedno takie cyfrowe radiowe urządzenie nadawczo-odbiorcze, które może być wykorzystywane w komórkowej sieci telekomunikacyjnej.

Sygnały akustyczne zawierające mowę i szum tła są wprowadzane za pomocą mikrofonu 400 do kodera-dekodera (KODEKA) 402, który może być specjalistycznym układem scalonym (ASIC-application specific integrated circuit). Sygnały akustyczne o ograniczonym paśmie wykryte przez mikrofon 400 są próbkowane przez kodek 402 z prędkością 8 000 próbek na sekundę i łączone blokowo w ramki. Odpowiednio do tego, każda dwudziestomilisekundowa ramka zawiera 160 próbek mowy'. Te próbki zostają skwantowane i przetworzone na kodowany format cyfrowy, na przykład 14-bitowy format liniowy PCM. Po zmagazynowaniu 160 próbek cyfryzowanej mowy dla aktualnej ramki w nadawczym procesorze DSP 200 w wewnętrznej pamięci RAM 202, nadawczy procesor DSP 200 realizuje funkcje kodowania kanałowego, estymację energii ramki, estymację szumu, detekcję mowy, FFT, funkcje filtru i funkcje cyfrowego kodowania/dekodowania mowy zgodnie z algorytmem VSELP, opisanym powyżej w odniesieniu do fig. 3.

Mikroprocesor nadzorczy 432 steruje ogólnie działaniem wszystkich części składowych w urządzeniu nadawczo-odbiorczym przedstawionym na fig. 4. Filtrowane dane strumienia danych PCM generowanego przez nadawczy procesor DSP 200 podawany jest do modulacji kwadraturowej i nadawania. W tym celu matryca 404 bramek ASIC generuje kanał współfazowy (I) i kwadraturowy kanał (Q) informacji na podstawie filtrowanego strumienia danych z DSP 200. Strumienie bitowe I i Q są przetwarzane przez dopasowane filtry dolnoprzepustowe 406 oraz 408 i doprowadzane do mieszaczy IQ w modulatorze zrównoważonym 410. Generator odniesienia 412 i powielacz 414 zapewniają częstotliwość pośrednią (IF) nadawania. Sygnał I jest mieszany z współfazowym sygnałem IF, a sygnał Q mieszany jest z kwadraturowym sygnałem IF (to znaczy, współfazowym sygnałem IF opóźnionym o 90 stopni wprzesuwniku fazowym 416). Po zmieszaniu sygnały I i Q są sumowane, poddawane przemianie „w górę” do częstotliwości kanału w. cz. wybranego przez syntezator 430, i nadawane, za pośrednictwem dipleksera 420 i anteny 422, na wybranym kanale wielkiej częstotliwości.

Po stronie odbiorczej, sygnały odebrane przez antenę 422 i diplekser są poddawane przemianie w dół, w mieszaczu 424, z wielkiej częstotliwości wybranego kanału do pierwszej częstotliwości pośredniej IF, z wykorzystaniem sygnału generatora lokalnego syntetyzowanego przez syntezator kanałowy 430 na podstawie częstotliwości wyjściowej generatora odniesienia 428. Sygnał wyjściowy pierwszego mieszacza IF 424 jest filtrowany i poddawany przemianie częstotliwości w dół, do drugiej częstotliwości pośredniej, na podstawie innego wyjścia z syntezatora kanałowego 430 i demodulatora 426. Odbiorcza matryca 434 bramek następnie przetwarza drugi sygnał IF na szereg impulsów fazowych i szereg impulsów częstotliwościowych. Odbiorczy procesor DSP 436 dokonuje na odebranych sygnałach demodulacji, filtrowania, wzmocnienia/tłumienia, dekodowania kanałowego i ekspansji mowy·'. Obrobione dane mowy następnie przesyłane są do kodeka 402 i przetwarzane w sygnały akustyczne pasma podstawowego dla wysterowywania głośnika 438.

Poniżej opisano, w odniesieniu do sieci działań przedstawionej na fig. 5A i 5B, operacje realizowane przez procesor 200 cyfrowej obróbki sygnałów w przypadku implementacji funkcji układu 105 sterowania filtru, układu 115 filtru, iwokodera 120. Blok 210 estymacji energii wyznacza energię w każdej ramce sygnałów akustycznych. Blok 210 estymacji energii wyznacza energię aktualnej ramki przez obliczenie sumy kwadratów każdej próbki PCM w tej

185 513 ramce (krok 505). Ponieważ próbek w dwudziestomilisekundowej ramce, w przypadku prędkości próbkowania 8 000 próbek na sekundę, jest 160, to sumowanych jest 160 kwadratów próbek PCM. Wyrażony matematycznie, estymator energii ramek wyznaczany jest zgodnie z poniższym równaniem 1 :

160

Energia ramki = S {Samp(i)}² (równanie 1) i=l

Wartość energii ramki obliczona dla ramki aktualnej jest zapamiętywana w wewnętrznej pamięci RAM 202 procesora DSP 200 (krok 510).

Funkcje detektora 240 mowy obejmują pobranie estymatora szumu, uprzednio wyznaczonego przez blok 230, z wewnętrznej pamięci RAM procesora DSP 200 (krok 515). Oczywiście, kiedy urządzenia nadawczo-odbiorcze jest włączane do zasilania po raz pierwszy, nie ma żadnego estymatora szumu. Blok decyzyjny 250 przewiduje wstępnie taką sytuację i w kroku 525 przypisuje pewną wartość estymatora. Korzystne jest, jeżeli estymatorowi szumu przypisuje się arbitralnie pewną dużą wartość, na przykład 20 dB powyżej normalnych poziomów mowy, dla wymuszenia uaktualnienia wartości estymatora, w sposób opisany poniżej. Energię ramki wyznaczoną przez blok 210 estymacji odtwarza się z wewnętrznej pamięci RAM 202 procesora 202 (blok 530). W bloku 535 podejmuje się decyzję, czy energia ramki przekracza sumę odtworzonego estymatora szumu plus zadana wartość progu mowy, jak to przedstawiono w poniższym równaniu 2:

estymator energii ramki > (estymator szumu + próg mowy) (równanie 2)

Wartość progowa mowy może być wartością stałą wyznaczoną doświadczalnie jako większa od krótkookresowych wahań szumu tła i może być ustawiona, na przykład na 9 dB. Ponadto, progowa wartość mowy może być modyfikowana adaptacyjnie dla odzwierciedlenia zmiennych .warunków mówienia, na przykład, kiedy mówiący wchodzi w środowisko bardziej hałaśliwe lub spokojniejsze. Jeżeli estymator energii ramki przekracza sumę zrównania 2, to w bloku 570 ustawia się flagę oznaczającą, że mowa występuje. Jeżeli detektor mowy 240 stwierdzi, że mowa występuje, to blok 230 estymacji szumu jest omijany i odtwarzany jest estymator szumu dla ramki poprzedniej w cyfryzowanym sygnale akustycznym, i wykorzystywany jest w charakterze aktualnego estymatora szumu. Natomiast, jeżeli estymator energii ramki jest mniejszy od sumy z równania 2, to w bloku 540 następuje skasowanie flagi mowy.

Możliwe jest również wykorzystywanie innych systemów wykrywania mowy w aktualnej ramce. Na przykład Europejski Instytut Norm Telekomunikacyjnych (ETSI - European Telecommunications Standards Institute) opracował normę na detekcję aktywności głosowej (VAD - voice activity detection) w globalnym systemie łączności ruchomej (GSM - Global System do Mobile communications), która jest opisana w materiale ETSI: RE/SMG-020632P. który włącza się przez przywołanie. Tę normę można stosować do detekcji mowy według niniejszego wynalazku i zostaje ona dołączona przez przywołanie.

Jeżeli mowa nie występuje, to następuje wykonanie procedury uaktualniającej estymacji szumu w bloku 230 estymacji. W zasadzie, estymator szumu jest ruchomą średnią energii ramki podczas okresów bez mowy. Jak to opisano powyżej, jeżeli wstępny startowy estymator szumu jest dobrany jako dostatecznie wysoki, to nie następuje wykrycie mowy i flaga mowy zostanie skasowana wymuszając w ten sposób uaktualnienie estymatora szumu.

W procedurze estymacji szumu wykonywanej przez blok 230 estymacji, w bloku 545 następuje wyznaczenie różnicy/błędu delta (D) między wartością energii szumu ramki generowaną przez blok 210 estymacji a estymatorem szumu uprzednio obliczonym przez blok estymacji 230 zgodnie z następującym równaniem:

D = aktualna energia ramki - poprzedni estymator szumu (równanie 3)

185 513

W bloku decyzyjnym 550 odbywa się sprawdzenie, czy D jest większe od zera. Jeżeli D jest ujemne, co występuje w przypadku dużych wartości estymatora szumu, to estymator szumu jest przeliczany ponownie w bloku 560 zgodnie z następującym równaniem:

estymator szumu = poprzedni estymator szumu +D/2 (równanie 4)

Ponieważ D jest ujemne, to powoduje ono korekcję w dół estymatora szumu. Stosunkowo dużą wartość kroku wynoszącą D/2 dobrano dla szybkiego skorygowania w przypadku szybkiego obniżania się poziomów szumu. Natomiast, jeżeli energia ramki przekracza estymator szumu, dając w wyniku D większe od zera, to w bloku 555 szum jest uaktualniany zgodnie z poniższym równaniem:

estymator szumu = poprzedni estymator szumu +D/255 (równanie 4)

Ponieważ D jest dodatnie, to estymator szumu należy zwiększyć. Jednak dobiera się mniejszą wartość kroku, wynoszącą D/256 (w stosunku do D/2), dla stopniowego zwiększania estymatora szumu i zapewnienia ważnej ochrony przed szumem stanów nieustalonych.

Estymator szumu obliczony dla aktualnej ramki jest wyprowadzany do selektora 235 filtru. W pierwszej korzystnej odmianie wykonania selektor 235 filtru uzyskuje dostęp do tablicy przeglądowej i wykorzystuje aktualny estymator szumu do wybrania wartości sterującej filtru (krok 572). Układ 115 filtru (w kroku 74) zostaje następnie dostrojony w funkcji wartości sterującej filtru dla uzyskania charakterystyki częstotliwościowej służącej do zwiększenia ilości odfiltrowanego szumu w miarę wzrostu estymatora szumu i szumu tła. Próbki PCM zapamiętane w pamięci RAM procesora DSP są następnie przepuszczane przez ten dostrojony układ 265 filtru dla przefiltrowania próbek PCM dla usunięcia szumu (krok 576). Przefiltrowane próbki PC są następnie przetwarzane przez wokoder 120 (krok 578), a zakodowane próbki są następnie wyprowadzane do nadawczych układów w. cz. (krok 580).

Figury 6A i 6B przedstawiają sposób, w jaki układ 115 filtru dostraja go do otrzymania różnych charakterystyk częstotliwościowych F1-F4 dla różnych sygnałów sterujących filtru wprowadzanych do układu 115 filtru. Jak to przedstawiono na fig. 6a, układ 115 filtru można dobrać do otrzymywania szeregu różnych charakterystyk częstotliwościowych, przy czym charakterystyki F1-F4 mają częstotliwości graniczne, odpowiednio Flc-F4c. Częstotliwości graniczne układu 115 filtru mogą mieścić się, w korzystnej odmianie wykonania, w zakresie 300 Hz do 800 Hz. W miarę wzrostu estymatora szumu, układ filtrujący 115 powinien wykazywać charakterystyki o coraz wyższych częstotliwościach granicznych. Wyższe wartości częstotliwości gramcznych powodują, że większa część energii ramki przypada na zakres niskoczęstotliwościowy mowy wycinany przez układ 115 filtru.

Podobnie, jak to przedstawiono na fig. 6B, układ filtru może być dobrany tak, aby wykazywał szereg różnych charakterystyk częstotliwościowych F1-F4 o różnych nachyleniach a takiej samej częstotliwości granicznej. Częstotliwość graniczna dla charakterystyk częstotliwościowych F1-F4 mieści się w zakresie wspomnianym powyżej. W miarę wzrostu estymatora szumu układ 115 filtru jest dostrajany tak, że wykazuje charakterystyki częstotliwościowe o bardziej stromych zboczach. Zwiększenie stromości zboczy powoduje, że większa część energii ramki przypada na zakres eiskoczęstotliwościoby mowy, wycinany układem 115 filtru.

Układ 115 filtru przefiltrowuje aktualne ramki w zależności od estymatora szumu obliczonego dla aktualnej ramki. Aktualna ramka jest filtrowana tak, że szum zostaje zredukowany a większa część mowy jest przepuszczana. Większa część mowy, która została przepuszczona bez odfiltrowania, stanowi rozpoznawalny sygnał mowy wyprowadzany z tylko minimalnym zmniejszeniem jakości sygnału mowy. Kombinację różnych częstotliwości granicznych i różnych stromości zboczy można wykorzystywać do adaptacyjnego wycinania wybranych części energii ramki przypadającej na niskoczęstotliwościowy zakres mowy.

185 513

Figura 7 przedstawia przykład tablicy przeglądowej, do której ma dostęp selektor 235 filtru w celu wybrania jednej z charakterystyk częstotliwościowych F1-F4 dla obwodu 115 filtru. Tablica przeglądowa zawiera szereg potencjalnych elementów danych pośrednich szumu NI-Nn i wartości sterujące F1-Fn odpowiadające potencjalnym charakterystykom układu 115 filtru. Każdy z estymatorów szumu N1-Nn może reprezentować pewien zakres estymatorów i każdy może być dopasowany do konkretnej wartości sterującej F1-Fn filtru. Układ 105 sterowania filtru generuje pewien sygnał sterujący przez wyliczenie estymatora szumu i odczytanie z tablicy przeglądowej wartości sterującej filtru z nim skojarzonej.

Figury 8A i B oraz 9A i B przedstawiają adaptacyjne filtrowanie sygnału akustycznego w przypadku dwóch ramek dla otrzymania poprawy sygnału akustycznego wyprowadzanego do nadajnika w. cz. Fig. 8A i 8B przedstawiają pierwszą i drugą ramkę sygnału akustycznego zawierającego składowe s1 i s2 mowy oraz składowe szumu, odpowiednio n1 i n2. Jak pokazano, energia szumu n1 i n2 w obu ramkach skupia się w dolnym zakresie częstotliwości akustycznych, natomiast energia mowy s11 s2 skupia się w wyższym zakresie tych częstotliwości akustycznych. Fig. 9A przedstawia sygnał szumowy n1 i sygnał mowy s1 w przypadku pierwszej ramki po przefiltrowaniu. Fig. 9B przedstawia sygnał szumu n2 i sygnał mowy s2 dla drugiej ramki po przefiltrowaniu.

Adaptacyjny system 100 redukcji szumów, jak to omówiono, ma uwzględniać różnice poziom szumu między ramkami, pierwszą i drugą, przez dostrojenie układu 105 sterowania filtru na podstawie obliczonego estymatora szumu dla aktualnej ramki. Na przykład przez układ 105 sterowania filtru wyliczony jest estymator N1 i profil widmowy S1, i dla pierwszej ramki wybrana jest wartość sterująca filtru wynosząca FI. W korzystnej odmianie wykonania układ 115 filtru jest dostrajany na postawie wartości sterującej FI filtru i ma charakterystykę częstotliwościową FI z częstotliwością graniczną Fic, jak to pokazano na fig. 6A. Pierwsza ramka jest przepuszczana przez tak dostrojony układ 115 filtru. Układ 115 filtru jest dobrany tak, że poniżej częstotliwości granicznej Fic charakterystyki FI przypada duża część szumu nl i tylko niewielka część mowy sl. Powoduje to, że szum nl jest skutecznie odfiltrowywany, a część sl mowy jest filtrowana tylko nieznacznie. Filtrowany sygnał akustyczny pierwszej ramki przedstawiono na fig. 9A.

W drugiej ramce, przedstawionej na fig. 8b, występuje wyższy szum tła, i przy założeniu, że nie wykryto mowy, obliczany jest przez układ 105 sterowania filtru wyższy estymator n2 szumu. Na podstawie wyższego estymatora szumu dla drugiej ramki wyznacza się wyższą wartość sterującą F2 filtru. W pierwszym korzystnym wykonaniu układ 115 filtru dostrojony jest zgodnie z wyższą wartością sterującą F2 tak, że ma charakterystykę częstotliwościową o wyższej częstotliwości granicznej F2c, jak pokazano na fig. 6A. Następna ramka sygnału akustycznego przepuszczana jest przez dostrojony układ 115 filtru. Ponieważ częstotliwość graniczna F2c charakterystyki częstotliwościowej F2 jest wyższa dla ramki następnej, to odfiltrowywana jest większa część zarówno szumu n2, jak i mowy s2. Część odfiltrowywanej mowy s2 jest w dalszym ciągu nieznaczna w stosunku do zrozumiałościowej informacji zawartej w ramce, tak że występuje tylko niewielkie oddziaływanie na mowę. Wada w postaci odfiltrowywania większej części mowy s2 jest kompensowana zaletą w postaci eliminacji większej ilości szumu n2 z drugiej ramki. Przefiltrowana część widmowa mowy nie przyczynia się w znacznym stopniu do zrozumiałości mowy. Przefiltrowany sygnał mowy drugiej ramki przedstawiono na fig. 9B.

Na fig. 10-12 przedstawiono drugą korzystną odmianę wykonania adaptacyjnego systemu 100 redukcji szumów. W drugiej korzystnej odmianie wykonania układ 105 sterowania filtru dostraja układ 115 filtru w funkcji estymatorów profilu szumu. Estymator profilu szumu oblicza się dla każdej ramki i porównuje się z profilem szumu odniesienia. Na podstawie tego porównania, układ 115 filtru jest adaptacyjnie dostrajany dla wycinania zmiennych ilości energii niskoczęstotliwościowej z bieżącej ramki.

Na fig. 10 przedstawiono procesor DSP 200 skonfigurowany zgodnie z pierwszą korzystną odmianą wykonania. Jak pokazano, układ 105 sterowania filtru zawiera analizator 270 widma, poza blokiem 210 estymacji energii ramki, blokiem 230 estymacji szumu, detektorem 240 mowy i selektorem 235 filtru, opisanymi w odniesieniu do pierwszej korzystnej odmiany wy185 513 konania. Układ 105 sterowania filtru wyznacza estymatory szumu i detekuje mowę odbieranych ramek w sposób opisany dla pierwszej odmiany wykonania i przedstawiony w sieciach działań 5A i 5B. Po wykryciu mowy w przypadku aktualnej ramki, analizator 270 widma uaktualnia estymator profilu szumu i wykorzystuje estymator profilu szumu do dostrajania układu 115 filtru. Na fig. 11 przedstawiono kroki uaktualniania estymatora profilu szumu i dostrajania układu 115 filtru. Fig. 1 ukazuje kroki realizowane przez analizator 270 widma włączony w ogólny proces uprzednio opisany w sieciach działań z fig. 5 A i 5B dla pierwszej korzystnej odmiany wykonania.

Kiedy mowa nie zostaje wykryta w przypadku aktualnej ramki, analizator 270 widma najpierw wyznacza profil szumowy dla aktualnej ramki (krok 600). Profil szumu wyznaczony dla aktualnej ramki obejmuje obliczenie dla różnych częstotliwości (to znaczy przedziałów częstotliwościowych) w wybranym zakresie niskoczęstotliwościowym mowy dla aktualnej ramki. W. korzystnej odmianie wykonania wybranym zakresem częstotliwości jest zakres od 300 do 800 Hz. Profil szumowy aktualnej ramki można wyznaczyć przez obróbkę aktualnej ramki z użyciem szybkiej transformaty Fouriera (FFT - Fast Fourier Transform) zawierającą N przedziałów częstotliwościowych). Obróbka sygnałów cyfrowych zużyciem transformacji FFT jest znana i jest korzystna w tym, że wymaga bardzo małej mocy obliczeniowej, jeżeli transformacja FFT jest ograniczona do stosunkowo niedużej liczby przedziałów częstotliwościowych, na przykład 32. Transformacja FFT o N przedziałach częstotliwościowych daje obliczonych N wartości energii na N różnych częstotliwościach. Obliczenia energii dla przedziałów częstotliwościowych przypadających wewnątrz wybranego zakresu częstotliwościowego stanowią profil szumowy dla aktualnej ramki.

Dla wyznaczenia estymatora profilu szumowego dla aktualnej ramki (krok 604), profil szumowy aktualnej ramki jest uśredniany z estymatorem profilu wyznaczonego dla poprzedniej ramki sygnału akustycznego. Kiedy nie jest dostępny poprzedni estymator profilu szumowego, jak na przykład po inicjalizacji, można wykorzystać zapamiętany estymator profilu szumowego. Estymator profilu szumowego zawiera estymatory ej (gdzie 1=1, 2,... N), energii szumu, rozmieszczone na kolejnych coraz niższych częstotliwościach (to znaczy, ej jest estymatorem energii szumu dla częstotliwości najwyższej, a e_n dla najniższej w wybranym zakresie częstotliwościowym). W korzystnej odmianie wykonania, każdy estymator ej energii szumu odpowiada średniej z wartości obliczonych na konkretnej częstotliwości w wybranym zakresie częstotliwościowym, za wiele kolejnych ramek, w których nie wykryto mowy. Przez wykorzystanie wielu ramek do określenia estymatora profilu szumowego, układ 115 filtru sterowany jest z większą gradacją. W alternatywnych odmianach wykonania estymator profilu szumowego można przyrównać do profilu szumowego ramki aktualnej.

Estymatory e, energii estymatora profilu szumowego są następnie komparowane z profilem szumowym odniesienia (krok 604). Profil szumowy odniesienia zawiera progi en (gdzie i = 1, 2,...n) energii odniesienia na częstotliwościach odpowiadających częstotliwościom dla estymatorów e, estymatora profilu szumowego. Progi e_rj energii odniesienia można wyznaczać empirycznie. Estymatory ej energii szumu są kolejno komparowane z odpowiednimi progami en energii odniesienia, od estymatora ei energii dla najwyższej częstotliwości do estymatora en energii dla najniższej częstotliwości.

Mówiąc dokładniej, estymator ei jest najpierw porównywany z progiem eri odniesienia szumu. Jeżeli ej jest większe od progu er odniesienia szumu, to wybiera się wartość komparacyjną c1 i wprowadza do selektora 235 filtru. Jeżeli estymator energii szumu e1 jest mniejszy od progu er, to estymator e₂ energii szumu (który jest estymatorem energii szumu dla częstotliwości mniejszej niż ei) jest porównywany z progiem er2 szumu odniesienia. Jeżeli estymator e₂ energii szumu jest większy od progu er₂ odniesienia szumu, to zostaje wybrana i wprowadzona do selektora 235 wartość porównawcza c₂. Ten proces komparacji jest kontynuowany aż do wybrania wartości porównawczej Ci (gdzie i = 1, 2,...n).

Układ 235 filtru wykorzystuje wyznaczoną wartość porównawczą c do wyznaczenia wartości sterującej filtru. Wartość sterująca filtru jest wybierana z tablicy przeglądowej, jak na przykład przedstawiona na fig. 12. Tablica przeglądowa zawiera szereg wartości porównawczych Ci i odpowiednie wartości sterujące F, filtru. Układ 115 filtru dostrajany jest

185 513 w funkcji wybranej wartości sterującej filtru. Układ 115 filtru dostrajany jest tak, aby wykazywał charakterystykę częstotliwościową wskazującą na wycinanie energii niskoczęstotliwościowej z aktualnej ramki. Układ 115 filtru jest dostrajany do eliminowania wzrastających ilości energii niskoczęstotliwościowej w miarę przekraczania przez estymatory energii szumu na kolejnych coraz wyższych częstotliwościach ich odpowiednich progów odniesienia energii. Fig. 6A i 6B przedstawiają przykładowe charakterystyki częstotliwościowe dla wybranych wartości sterujących filtru.

Wykorzystanie estymatorów profilu szumowego umożliwia poprawienie możliwości adaptacyjnego dostrajania układu filtru do eliminacji energii niskoczęstotliwościowej w sposób sprzyjający poprawie ogólnej jakości mowy. Ponieważ środowisko samochodu nie jest jedynym, w którym wykorzystuje się przewoźne urządzenie telekomunikacyjne, a zatem profile szumowe w niektórych przypadkach będą przesunięte bardziej w stronę wyższych częstotliwości, to analizator 270 widma może być selektywnie blokowany, kiedy energia zawarta w niskich częstotliwościach jest niewielka. Również kiedy znaczna część widma częstotliwościowego szumu rezyduje na dolnych częstotliwościach, można zastosować bardziej strome zbocze filtrujące, nawet jeśli będzie wymagało przeznaczenia na to pewnej części mocy obliczeniowej. Te dodatkowe wymagania obróbki są jeszcze bardzo niewielkie.

Jak to w sposób oczywisty wynika z powyższego opisu, adaptacyjny system filtru szumowego według niniejszego wynalazku jest zaimplementowany w sposób prosty i bez znacznego wzrostu ilości obliczeń DSP. Bardziej złożone sposoby redukcji szumu, takie jak „odejmowanie widmowe”, wymagają wykonywania kilku milionów operacji w sekundzie (MIPS) i dużej ilości pamięci do przechowywania danych i kodu programu. Dla porównania, niniejszy wynalazek nadaje się do zaimplementowania z użyciem tylko części MIPS i pamięci potrzebnych do algorytmu „odejmowania widmowego”, który również wprowadza więcej zniekształceń mowy. Zmniejszenie pamięci powoduje zmniejszenie rozmiaru układów scalonych DSP, zmniejszenie MIPS zmniejsza zużycie energii. Obydwa te atrybuty są pożądane w przypadku zasilanych bateryjnie radiotelefonów przenośnych/przewoźnych.

Jakkolwiek wynalazek przedstawiono i opisano odniesieniu do jego korzystnych odmian wykonania, to nie ogranicza się on do tych odmian wykonania. Na przykład, jakkolwiek opisano procesor DSP jako pełniący funkcje bloku 210 estymowania energii ramki, bloku 230 estymowania energii szumu, detektora 240 mowy, selektora 235 filtru i układu 265 filtru, to te funkcje mogłyby być zaimplementowane z użyciem innych składników cyfrowych i/lub analogowych. Ponadto możliwe jest zaimplementowanie adaptacyjnego systemu filtrującego 100, w którym układ 115 filtru jest dostrajany w funkcji zarówno estymatorów szumu, jak i estymatorów profilu szumowego.

185 513

1	2	3	4	5	6
Tx Rx MAHO	Tx Rx MAHO

ramka 20 ms

Fig. 2

185 513

DO NADAJNIKA W. CZ.

185 513

422

402

<Ο

OJ

c kj o CC	BRAMEK	’χΓ <0 ro ro	Q_ <Z) CD >- KI
Jy
o	o	2		o cc
CQ	>-			o
CD CD	QC ł—			CQ
	<c		-D	CD
				O

CO —

O

O CC CD *

185 513

M «X CD >- CO
>-	cc
	LU
<	o
	o
o	o
cc 1—
	rxi
LL·	LU
•o	r*4 cc
'CO	Q_
=3
□_
LU
r^j
cc
o.

—£ m

LO σ

Uh

185 513 <

¢0 σ

* r—I tL<

WZMOCNIENIU

uj o

o

IM

CZĘSTOTLIWOŚĆ Fiq.6b

185 513

SZUM ESTYMOWANY	WARTOŚĆ STERUJĄCA FILTRU
N1	F1
N2	F2
N3	F3
N4	F4
	-
Nn	Fn

185 513

OD

<c c o α

3

a&Md ^v6

185 513

s	£	co S-	o co
ιο -	ΙΟ	to	to

Fiq.ll

185 513

TABLICA PRZEGLĄDOWA

WARTOŚCI POROWNAWCZE ESTYMOWANEJ ENERGII SZUMÓW	WARTOŚCI STERUJĄCE FILTRU
C1	F4
C2	F3
C3	**
Cn	Fn

Fig .1 <2

185 513

Fig.l

Departament Wydawnictw UP RP. Nakład 60 egz. Cena 4,00 zł.

Claims

Zastrzeżenia patentowe

1. Sposób selektywnej zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek, reprezentującego sygnał akustyczny otrzymany w nadajniku, kształtowany na przemian ze składowej mowy, składowej szumowej i składowej mowy wraz ze składową szumową, w którym estymuje się poziom energii ramki sygnału cyfrowego, określa się, w odpowiedzi na estymator otrzymany w etapie estymowania, czy ramka sygnału cyfrowego zawiera składową mowy, uaktualnia się estymator szumu w funkcji poprzedniego estymatora szumu i poziomu energii estymowanego podczas etapu estymowania, gdy następuje stwierdzenie, podczas etapu określania, że w skład ramki nie wchodzi składowa mowy, uzyskuje się dostęp do pozycji w tablicy przeglądowej, zawierającej parametry filtru indeksowane względem poziomów estymatorów szumu, przy czym pozycja do której odbywa się dostęp odpowiada wartości estymatora szumu uaktualnionej podczas etapu uaktualniania, znamienny tym, że wybiera się (574) charakterystyki filtracyjne realizowane przez układ filtru, którego charakterystyka częstotliwościowa wykazuje zmienne wzmocnienie w różnych zakresach częstotliwości, przy czym charakterystyki filtru wybiera się w odpowiedzi na zapamiętane parametry filtracyjne pozycji do której odbył się dostęp podczas etapu osiągania dostępu, oraz filtruje się (576) ramkę danych cyfrowych za pomocą filtru, który wykazuje charakterystyki filtracyjne, zmieniając ramki danych cyfrowych w odpowiedzi na te charakterystyki filtracyjne.
2. Sposób według zastrz. 1, znamienny tym, że dodatkowo obejmuje etap pośredni, w którym wyznacza się (600) estymator profilu szumowego ramki sygnału cyfrowego, jeżeli ramka danych cyfrowych została określona jako pozbawiona składowej mowy.
3. Sposób według zastrz. 2, znamienny tym, że estymator profilu szumowego, wyznaczany w etapie wyznaczania (600) estymatora profilu szumowego, wykorzystuje się w etapie uaktualniania, do uaktualniania estymatora profilu szumowego.
4. Sposób według zastrz. 1, znamienny tym, że tablica przeglądowa, do której odbywa się dostęp podczas etapu uzyskiwania dostępu, zawiera zestaw pozycji (C1-CN, F4-FN), przy czym każda pozycja zestawu zawiera oddzielne charakterystyki filtru.
5. Sposób według zastrz. 4, znamienny tym, że oddzielne charakterystyki zestawu pozycji tablicy przeglądowej obejmują oddzielne charakterystyki filtru górnoprzepustowego, a każdą charakterystykę filtru górnoprzepustowego określa się oddzielną częstotliwością graniczną (F1c, F2c, F3c, F4c).
6. Sposób według zastrz. 4, znamienny tym, że oddzielne charakterystyki zestawu pozycji tablicy przeglądowej obejmują oddzielne charakterystyki filtru górnoprzepustowego, przy czym każdą charakterystykę filtru górnoprzepustowego określa się oddzielnym nachyleniem charakterystyki częstotliwościowej (F1, F2, F3, F4).
7. Sposób według zastrz. 1, znamienny tym, że zawiera dodatkowy etap, w którym inkrementuje się wartość licznika dla zliczania każdej ramki, dla której estymuje się poziom energii podczas etapu estymowania.
8. Sposób według zastrz. 7, znamienny tym, że etap wyboru charakterystyk filtracyjnych układu filtru realizuje się, kiedy wartość licznika jest inkrementowana co N-ty raz, przy czym N jest wartością całkowitą większą od jedności.
9. Urządzenie do selektywnej zmiany ramki sygnału cyfrowego ukształtowanego z wielu kolejnych ramek, reprezentującego sygnał akustyczny otrzymany w nadajniku, kształtowany na przemian ze składowej mowy, składowej szumowej i składowej mowy wraz ze składową szumową, zawierające blok estymacji poziomu energii, dostosowany do odbioru wskaźników ramki sygnału cyfrowego, stanowiący blok do estymacji poziomu energii ramki sygnału cyfrowego, detektor mowy sprzężony z blokiem estymacji poziomu energii, stanowiący blok wykrywania składowej mowy, do określania, czy ramka sygnału cyfrowego za185 513 wiera składową mowy, blok estymacji szumu, dostosowany do uruchamiania przez blok wykrywania składowej mowy gdy składowa mowy nie stanowi części ramki, stanowiący blok estymacji szumu do uaktualniania estymatora szumu w funkcji poprzedniego estymatora szumu i poziomu energii estymowanego przez blok estymowania, tablicę przeglądową zawierającą zestaw pozycji, z których każda jest indeksowana względem poziomów estymatorów szumu, przy czym dostęp do danej pozycji odpowiada wartości estymatora szumu wytworzonej przez blok estymacji, znamienne tym, że jest zaopatrzone w filtr (265) dostosowany do odbioru ramki danych cyfrowych, o wybieralnych charakterystykach filtracyjnych realizowanych przez układ filtru, w których charakterystyka częstotliwościowa ma zmienne wzmocnienie w różnych zakresach częstotliwości, przy czym charakterystyki filtru są dobrane odpowiednio do pozycji tablicy przeglądowej, do których się odbył dostęp odpowiednio do estymaty szumu uaktualnionej przez blok estymacji szumu.
10. U rządzenie według zastrz. a, zn amienne tym, ży do datkowa zowiera biok @70) estymacji profilu szumowego do wyznaczania estymatora profilu szumowego ramki danych cyfrowych, gdy ramka danych cyfrowych została określona przez blok wykrywania składowej mowy jako pozbawiona składowej mowy.