PL207862B1 - Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji - Google Patents

Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji

Info

Publication number
PL207862B1
PL207862B1 PL373045A PL37304503A PL207862B1 PL 207862 B1 PL207862 B1 PL 207862B1 PL 373045 A PL373045 A PL 373045A PL 37304503 A PL37304503 A PL 37304503A PL 207862 B1 PL207862 B1 PL 207862B1
Authority
PL
Poland
Prior art keywords
signal
subband
components
quantizer
quantized
Prior art date
Application number
PL373045A
Other languages
English (en)
Other versions
PL373045A1 (pl
Inventor
Mark Stuart Vinton
Michael Mead Truman
Original Assignee
Dolby Lab Licensing Corp
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp, Dolby Laboratories Licensing Corporation filed Critical Dolby Lab Licensing Corp
Publication of PL373045A1 publication Critical patent/PL373045A1/pl
Publication of PL207862B1 publication Critical patent/PL207862B1/pl

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

Opis wynalazku
Przedmiotem wynalazku jest nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, o bardzo małej szybkości transmisji danych.
Systemy kodowania fonii służą do przetwarzania sygnału akustycznego w sygnał kodowany, który nadaje się do przesyłania lub zapisania. Kodowany sygnał jest odbierany lub odtwarzany oraz dekodowany, aby otrzymać wersję oryginalnego sygnału akustycznego do wysłuchania. Percepcyjne systemy kodowania fonii kodują sygnał akustyczny w sygnał kodowany, który ma mniejszą wymaganą pojemność informacji niż oryginalny sygnał akustyczny, po czym dekodują kodowany sygnał, aby otrzymać sygnał wyjściowy, który jest percepcyjnie nieodróżnialny od oryginalnego sygnału akustycznego. Przykładowy percepcyjny system kodowania fonii jest opisany w publikacji Bosi'ego i in.: ISO/IEC MPEG-2 Advanced Audio Coding, J. AES, tom 45, nr 10, październik 1997, strony 789-814, nazwany Advanced Audio Coding (AAC).
Percepcyjne techniki kodowania, takie jak technika AAC, wykorzystują zestaw filtrów analizy dla sygnału akustycznego, aby otrzymać składowe sygnału cyfrowego, które zwykle mają wysoki poziom dokładności rzędu 16-24 bitów i są rozmieszczone w podpasmach częstotliwości. Szerokości podpasm są zwykle różne i współmierne z szerokościami tak zwanych pasm krytycznych ludzkiego słuchu. Wymagania dotyczące pojemności informacyjnej sygnału są zmniejszane przez kwantowanie składowych sygnałów podpasma do znacznie niższego poziomu dokładności. Ponadto kwantowane składowe mogą być również kodowane w procesie kodowania entropowego, takim jak kodowanie Huffmana. Kwantowanie wprowadza szum do kwantowanych sygnałów, lecz percepcyjne systemy kodowania fonii stosują modele psychoakustyczne, usiłując sterować amplitudą szumu kwantowania tak, że jest on maskowany lub czyniony niesłyszalnym przez składowe widmowe w sygnale. Niedokładną kopię składowych sygnałów podpasma otrzymuje się z kodowanego sygnału przez komplementarne dekodowanie entropowe i dekwantowanie.
Znane percepcyjne systemy kodowania realizują kwantowanie składowych sygnałów podpasma i stosują proces kodowania entropowego dla składowych sygnałów kwantowanych w sposób, który jest praktycznie optymalny lub prawie optymalny. Zarówno kwantowanie jak i kodowanie entropowe działają w miarę możliwości z dużą sprawnością matematyczną.
Konstrukcja optymalnego lub prawie optymalnego urządzenia kwantującego zależy od statystycznych właściwości kwantowanych wartości składowych sygnału. W percepcyjnym systemie kodowania, który wykorzystuje transformację do realizacji zestawu filtrów analizy, wartości składowych sygnału są otrzymywane ze współczynników transformacji w domenie częstotliwości, które są grupowane w podpasma częstotliwości, a następnie normalizowane lub skalowane w odniesieniu do składowej o największej wartości w każdym podpasmie. Jednym przykładem skalowania jest proces znany jako kompansja blokowa. Liczba współczynników, które są grupowane w każdym podpaśmie, zwykle zwiększa się wraz z częstotliwością podpasma tak, że szerokości podpasm zbliżają się do krytycznych szerokości pasm ludzkiego słuchu. Modele psychoakustyczne i procesy przypisywania bitów określają wartość skalowania dla każdego sygnału podpasma. Grupowanie i skalowanie zmieniają właściwości statystyczne kwantowanych wartości składowych sygnałów. W związku z tym sprawność kwantowania jest zwykle optymalizowana dla właściwości grupowanych i skalowanych składowych sygnału.
W znanych percepcyjnych systemach kodowania, takich jak wspomniany powyż ej system AAC, szersze podpasma mają tendencję do posiadania kilku dominujących składowych sygnału podpasma o stosunkowo dużej wartości i znacznie więcej mniejszych składowych sygnału o mniejszych wartościach. Urządzenie kwantujące równomiernie nie kwantuje takiego rozkładu wartości z dużą sprawnością. Sprawność urządzenia kwantującego można poprawić przez kwantowanie mniejszych składowych sygnału z większą dokładnością i kwantowanie większych składowych sygnału z mniejszą dokładnością. Często realizuje się to, stosując urządzenie kwantujące kompresujące, takie jak urządzenie kwantujące, działające według prawa μ lub według prawa A. Urządzenie kwantujące kompresujące może być realizowane przez kompresor umieszczony przed urządzeniem kwantującym równomiernie albo też może być realizowane przez urządzenie kwantujące nierównomiernie, które jest równoważnikiem procesu dwuetapowego. Do odwracania wyników działania urządzenia kwantującego kompresującego stosuje się urządzenie dekwantujące ekspandujące. Urządzenie dekwantujące ekspandujące realizuje ekspansję, która jest zasadniczo odwrotnością kompresji realizowanej w urządzenie kwantującym kompresującym.
PL 207 862 B1
Urządzenie kwantujące kompresujące zwykle zapewnia dobre wyniki w percepcyjnych systemach kodowania fonii, które reprezentują wszystkie składowe sygnału o poziomie dokładności kwantowania, która jest zasadniczo równa lub większa od dokładności określanej przez model psychoakustyczny konieczny do maskowania szumu kwantowania. Kompresja zwykle poprawia sprawność kwantowania przez redystrybucję wartości składowych sygnału bardziej równomiernie w zakresie wejściowym urządzenie kwantującego.
Systemy kodowania fonii o bardzo małej szybkości transmisji danych (VLBR) zwykle nie mogą reprezentować wszystkich składowych sygnału z dokładnością kwantowania wystarczającą do maskowania szumu kwantowania. Pewne systemy kodowania o bardzo małej szybkości transmisji danych próbują odtwarzać sygnał wyjściowy, mający wysoki poziom odbieranej jakości przez nadawanie lub zapisywanie sygnału pasma podstawowego, mającego tylko część szerokości pasma sygnału wejściowego, i regenerowanie brakujących części szerokości pasma sygnału podczas odtwarzania przez kopiowanie składowych widmowych z sygnału pasma podstawowego. Technika ta jest czasami nazywana translacją widmową lub regeneracją widmową. Urządzenia kwantujące kompresujące zwykle nie zapewniają dobrych wyników, gdy są stosowane w systemach kodowania o bardzo małej szybkości transmisji danych, takich jak systemy stosujące regenerację widmową.
Konstrukcja optymalnego lub prawie optymalnego kodera, takiego jak kodery stosowane w typowych systemach kodowania fonii, zależy od statystycznych właściwości kodowanych wartości. W znanych systemach grupy kwantowanych składowych sygnału są kodowane w procesie kodowania Huffmana, który wykorzystuje jedną lub więcej książek kodów do wytwarzania kodów o zmiennej długości, reprezentujących kwantowane składowe sygnału. Najkrótsze kody służą do reprezentowania tych kwantowanych wartości, co do których oczekuje się, że będą występować najczęściej. Każdy kod jest wyrażany przez całkowitą liczbę bitów.
Kodowanie Huffmana często zapewnia dobre wyniki w systemach kodowania fonii, które mogą reprezentować wszystkie składowe sygnału z dokładnością kwantowania wystarczającą do maskowania szumu kwantowania. Kodowanie Huffmana ma jednak poważne ograniczenia, które czynią je nieodpowiednim do stosowania w wielu systemach kodowania o bardzo małej szybkości transmisji danych, co zostanie opisane dalej.
Nadajnik według wynalazku charakteryzuje się tym, że do zestawu filtrów analizy jest dołączone urządzenie kwantujące do kwantowania jednego lub więcej sygnałów podpasma dla generowania kwantowanych sygnałów podpasma. Do urządzenia kwantującego jest dołączony koder dla generowania jednego lub więcej kodowanych sygnałów podpasma przez kodowanie jednego lub więcej kwantowanych sygnałów podpasma przy użyciu procesu kodowania entropowego, zmniejszającego wymaganą pojemność informacyjną kwantowanych sygnałów podpasma. Do kodera jest dołączone urządzenie formatujące do zestawiania jednego lub więcej kodowanych sygnałów podpasma w sygnał wyjściowy. Urządzenie kwantujące ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
Korzystnie zestaw filtrów analizy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
Korzystnie urządzenie kwantujące zawiera ekspander, który ma wejście dołączone do zestawu filtrów analizy i wyjście, do którego jest dołączone wejście urządzenia kwantującego równomiernie, którego wyjście jest dołączone do kodera.
Korzystnie urządzenie kwantujące jest urządzeniem kwantującym nierównomiernie.
Korzystnie koder jest koderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
Korzystnie koder jest koderem z kodowaniem arytmetycznym.
Korzystnie urządzenie kwantujące jest dostosowane do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
Odbiornik według wynalazku charakteryzuje się tym, że do dekodera jest dołączone urządzenie dekwantujące dla generowania jednego lub więcej dekwantowanych sygnałów podpasma przez dekwantowanie składowych sygnału podpasma dla jednego lub więcej dekodowanych sygnałów podpasma. Do urządzenia dekwantującego jest dołączony zestaw filtrów syntezy do generowania sygnału wyjściowego w odpowiedzi na wiele sygnałów podpasma, zawierających jeden lub więcej dekwantowanych sygnałów podpasma. Urządzenie dekwantujące jest komplementarne do urządzenia kwantu4
PL 207 862 B1 jącego i ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
Korzystnie zestaw filtrów syntezy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
Korzystnie urządzenie dekwantujące zawiera urządzenie dekantujące równomiernie, które ma wejście dołączone do dekodera i wyjście, do którego jest dołączone wejście kompresora, którego wyjście jest dołączone do zestawu filtrów syntezy.
Korzystnie urządzenie dekwantujące jest urządzenie dekwantującym nierównomiernie.
Korzystnie dekoder jest dekoderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
Korzystnie dekoder jest dekoderem z kodowaniem arytmetycznym.
Korzystnie urządzenie dekwantujące jest komplementarne do urządzenia kwantującego, dostosowanego do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
Zaletą wynalazku jest zapewnienie ulepszonych systemów kodowania fonii, zwłaszcza nadajnika kodowania fonii i odbiornika kodowania fonii, dla przezwyciężania niedogodności typowego kodowania fonii, które wykorzystuje urządzenia kwantujące kompresujące i kodowanie entropowe, jak w kodowaniu Huffmana. Wynalazek zapewnia poprawę odczuwalnej jakoś ci sygnał ów akustycznych, otrzymywanych z systemów kodowania fonii o małej szybkości transmisji danych. Dzięki wtłaczaniu drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania o ilości mniejszej niż wystąpiłaby bez wtłaczania, uzyskuje się zmniejszenie wymaganej dokładności kwantowania i redukcję entropii kwantowanych drugich składowych sygnału podpasma.
Przedmiot wynalazku jest pokazany w przykładach wykonania na rysunku, na którym:
fig. 1 przedstawia schemat blokowy nadajnika kodowania fonii, fig. 2 - schemat blokowy odbiornika dekodowania fonii, fig. 3 - graficzne przedstawienie kompresji i ekspansji hipotetycznych składowych sygnału podpasma, fig. 4A-4C - graficznie kwantowanie składowych sygnału podpasma z fig. 3, fig. 5 - graficznie funkcję kwantowania z kompresją, fig. 6 - graficznie funkcję kompresji, fig. 7 - graficznie funkcję kwantowania równomiernego, fig. 8 - graficznie funkcję ekspansji, fig. 9 - graficznie funkcję kwantowania z ekspansją, fig. 10 - graficznie funkcję kwantowania z ekspansją/kompresją, fig. 11 - graficznie kodowanie arytmetyczne, fig. 12 - schemat blokowy urządzenia do realizacji różnych aspektów wynalazku.
Figura 1 przedstawia przykład wykonania nadajnika kodowania fonii, który realizuje różne aspekty wynalazku. Zestaw filtrów 12 analizy odbiera z toru 11 informacje fonii, reprezentujące sygnał akustyczny, a w odpowiedzi wytwarza informacje cyfrowe, reprezentujące podpasma częstotliwości sygnału akustycznego. Informacje cyfrowe w każdym z podpasm częstotliwości są kwantowane przez urządzenie kwantujące 14, 15, 16 i podawane na koder 17, który generuje kodowaną reprezentację kwantowanej informacji podawanej na urządzenie formatujące 18. W jednym przykładzie wykonania funkcje kwantowania w urządzeniach kwantujących 14, 15, 16 są przeznaczone do tego, aby w odpowiedzi kwantować informacje kontrolne odbierane ze sterownika 13 kwantowania, który generuje informacje sterowania kwantowaniem w odpowiedzi na informacje fonii odbierane z toru 11. Urządzenie formatujące 18 zestawia kodowaną reprezentację kwantowanej informacji i kwantowaną informację sterowania w sygnał wyjściowy dla nadawania lub zapamiętywania oraz przesyła sygnał wyjściowy w torze 19.
Nadajnik przedstawiony na fig. 1 ma części składowe dla trzech podpasm częstotliwości. Znacznie więcej podpasm jest wykorzystywanych w typowych zastosowaniach, lecz dla przejrzystości rysunku pokazano tylko trzy.
Zestaw filtrów 12 analizy jest realizowany zasadniczo w dowolny sposób, włączając w to szeroki zakres technik filtrów cyfrowych, transformacji blokowych i transformacji fal elementarnych. Przykładowo zestaw filtrów 12 analizy jest realizowany przez jeden lub wiele kwadraturowych filtrów zwierciaPL 207 862 B1 dlanych QMF w układzie kaskadowym, różne dyskretne transformaty typu Fouriera, takie jak dyskretna transformata cosinus DCT lub indywidualna modyfikowana transformata DCT, znana jako transformata z kasowaniem aliasingu w domenie czasu TRAC.
Zestawy filtrów analizy, które są realizowane przez transformacje blokowe, przetwarzają blok lub przedział sygnału wejściowego w zestaw współczynników transformacji, które reprezentują składową widmową tego przedziału sygnału. Grupa złożona z jednego lub wielu sąsiednich współczynników transformacji reprezentuje składową widmową w określonym podpasmie częstotliwości, mającym szerokość pasma współmierną z liczbą współczynników w grupie.
Zestawy filtrów analizy, które są realizowane przez pewien rodzaj filtru cyfrowego, taki jak filtr wielofazowy, a nie przez transformację blokową, dzielą sygnał wejściowy na zestaw sygnałów podpasma. Każdy sygnał podpasma jest czasową reprezentacją składowej widmowej sygnału wejściowego w określonym podpasmie częstotliwości. Korzystnie sygnał podpasma jest dzielony na dziesięć, tak ż e każdy sygnał podpasma ma szerokość pasma, która jest współmierna z liczbą próbek w sygnale podpasma dla jednostkowego przedziału czasu.
W tym opisie określenie sygnał podpasma dotyczy grup zło żonych z jednego lub wielu współczynników transformacji, a określenie składowe sygnału podpasma dotyczy współczynników transformacji. Zasady wynalazku stosuje się także do innych rodzajów wykonania, jednak określenie sygnał podpasma zwykle jest rozumiane jako odnoszące się do sygnałów w domenie czasu, reprezentujących składową widmową określonego podpasma częstotliwości sygnału, a określenie składowe sygnału podpasma zwykle jest rozumiane jako odnoszące się do próbek sygnałów podpasma w domenie czasu.
Sterownik 13 kwantowania realizuje zasadniczo dowolny żądany rodzaj przetwarzania. Jednym przykładem jest proces, który wykorzystuje model psychoakustyczny dla informacji fonii, aby oceniać psychoakustycznie maskujące działania różnych składowych widmowych w sygnale fonii. Możliwych jest wiele zmian, przykładowo sterownik 13 kwantowania może generować informacje sterowania kwantowaniem w odpowiedzi na informacje podpasma częstotliwości dostępne na wyjściu zestawu filtrów 12 analizy zamiast lub oprócz informacji akustycznych dostępnych na wejściu zestawu filtrów. W innym przykładzie wykonania sterownik 13 kwantowania jest wyeliminowany, a urządzenia kwantujące 14, 15, 16 wykorzystują funkcje kwantowania, które nie są dostosowane, a wynalazek nie wymaga zastosowania żadnego szczególnego procesu.
Urządzenie formatujące 18 zestawia kwantowane i kodowane składowe sygnału do postaci właściwej do przesyłania w torze 19 dla nadawania lub zapamiętywania. Formatowany sygnał zawiera na przykład wzory synchronizacji, informacje detekcji/korekcji błędów i ewentualnie informacje sterowania.
Figura 2 przedstawia przykład wykonania odbiornika dekodowania fonii, który realizuje różne aspekty wynalazku. Urządzenie deformatujące 22 odbiera z toru 21 sygnał wejściowy, niosący kodowaną reprezentację kwantowanej informacji cyfrowej, reprezentującej podpasma częstotliwości sygnału akustycznego. Urządzenie deformatujące 22 odbiera kodowaną reprezentację z sygnału wejściowego i podaje ją na dekoder 23, który dekoduje kodowaną reprezentację w celu otrzymania podpasm częstotliwości kwantowanej informacji. Cyfrowa kwantowana informacja w każdym z podpasm częstotliwości jest dekwantowana za pomocą urządzenia dekwantującego 25, 26, 27 i jest podawana na zestaw filtrów 28 syntezy, który wytwarza w torze 29 informację fonii reprezentującą sygnał akustyczny. Funkcje dekwantowania w urządzeniach dekwantujących 25, 26, 27 są dostosowywane w odpowiedzi na informację sterowania dekwantowaniem, odbieraną ze sterownika 24 dekwantowania, który wytwarza informację sterowania dekwantowaniem w odpowiedzi na informację sterowania odbieraną przez urządzenie deformatujące 22 z sygnału wejściowego.
Dekoder 23 stosuje proces, który jest komplementarny do procesu stosowanego w koderze 17. W korzystnym przykładzie wykonania jest stosowane dekodowanie arytmetyczne.
Urządzenia dekwantujące 25, 26, 27 realizują kompresję, która jest komplementarna do ekspansji realizowanej w urządzeniach kwantujących 14, 15, 16. Urządzenie dekwantujące kompresujące jest realizowane przy użyciu funkcji dekwantowania nierównomiernego albo przy użyciu funkcji dekwantowania równomiernego, po której następuje funkcja kompresji. Dekwantowanie nierównomierne i równomierne są realizowane na przykład przez przeszukiwanie tablicy. Dekwantowanie równomierne jest realizowane w procesie, który jedynie dołącza odpowiednią liczbę bitów do kwantowanej wartości. Te dołączone bity mogą wszystkie mieć wartość zerową albo też mogą mieć inną wartość, taką jak próbki z pseudoprzypadkowego sygnału szumu.
PL 207 862 B1
Kompresji nie należy przeprowadzać w całym zakresie wartości, jeżeli urządzenia kwantujące
14, 15, 16 nie zapewniają ekspansji w całym zakresie wartości.
Sterownik 24 dekwantowania przeprowadza zasadniczo dowolny żądany rodzaj przetwarzania. Jednym przykładem jest tu proces, który stosuje model psychoakustyczny dla informacji otrzymanej z sygnału wejściowego, aby ocenić wyniki psychoakustycznego maskowania różnych składowych widmowych w sygnale fonii. Według innego przykładu wykonania sterownik 24 dekwantowania jest wyeliminowany, a urządzenia dekwantujące 25, 26, 27 stosują funkcje dekwantowania, które nie są dostosowywane albo stosują funkcje dekwantowania, które są dostosowywane w odpowiedzi na informacje sterowania dekwantowaniem, odbierane bezpośrednio z sygnału wejściowego przez urządzenie deformatujące 22.
Odbiornik przedstawiony na fig. 2 ma części składowe dla trzech podpasm częstotliwości. W typowym zastosowaniu stosuje się znacznie większą liczbę podpasm, lecz dla przejrzystości pokazano tylko trzy.
Zestaw filtrów 28 syntezy jest realizowany zasadniczo w dowolny żądany sposób obejmujący sposoby, które są odwrotnością technik omówionych powyżej w odniesieniu do zestawu filtrów 12 analizy. Zestawy filtrów syntezy, które są realizowane przez transformacje blokowe, syntezują sygnał wyjściowy z zestawu współczynników transformacji. Zestawy filtrów syntezy, które są realizowane przez pewien rodzaj filtru cyfrowego, taki jak filtr wielofazowy, zamiast transformacji blokowej syntezują sygnał wyjściowy z zestawu sygnałów podpasma. Każdy sygnał podpasma jest reprezentacją opartą na czasie dla zawartości widmowej sygnału wejściowego w danym podpasmie częstotliwości.
Urządzenia kwantujące 14, 15, 16 w wielu systemach kodowania fonii są urządzeniami kwantującymi kompresującymi, ponieważ kompresja poprawia sprawność kwantowania, co wyjaśniono poniżej.
Figura 3 przedstawia linię 31, która reprezentuje wartości składowe hipotetycznych sygnałów podpasm. Odcinki linii prostych łączą sąsiednie wartości dla przejrzystości ilustracji. Na tym i dalszych rysunkach przedstawiono tylko wartości dodatnie, chociaż omawiane tutaj zasady odnoszą się do wykonań, które mają dodatnie i ujemne wartości składowe. Wartości składowe są normalizowane lub skalowane względem wartości największej składowej w sygnale podpasma. Osiem poziomów kwantowania obejmuje znormalizowany zakres wartości od zera do jedności.
Figura 4A przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału podpasma w linii 31 wykorzystującej funkcję kwantowania równomiernego, taką jak funkcja pokazana na fig. 7, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Dodatnie poziomy kwantowania są reprezentowane przez 3-bitową liczbę binarną. Wartości składowych, które są kwantowane do poziomów poniżej poziomu 4, są kwantowane nieskutecznie, ponieważ te poziomy kwantowania mogłyby być reprezentowane tylko przez dwa bity. W rezultacie jeden bit jest tracony dla każdej składowej sygnału, która jest kwantowana poniżej poziomu 4.
Figura 4B przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału podpasma w linii 31 wykorzystującej funkcję kwantowania z kompresją, przedstawioną na fig. 5, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Urządzenie kwantujące kompresujące ma większą sprawność kwantowania niż urządzenie kwantujące równomiernie, ponieważ mniej składowych sygnału jest kwantowanych poniżej poziomu 4. Urządzenie kwantujące kompresujące jest realizowane przez funkcję kwantowania nierównomiernego, taką jak funkcja pokazana na fig. 5 albo też jest realizowane przez funkcję kompresowania, taką jak funkcja pokazana na fig. 6, a następnie przez urządzenie kwantujące równomiernie, pokazane na fig. 7. Linia 32 na fig. 3 reprezentuje wartości sygnałów linii 31 po kompresji za pomocą funkcji pokazanej na fig. 6.
Dokładność kwantowania urządzenia kwantującego kompresującego nie jest równomierna dla wszystkich wartości wejściowych. Dokładność kwantowania dla przedziału małych wartości jest większa niż dokładność kwantowania dla sąsiedniego przedziału większych wartości.
Kompresja zmienia statystyczny rozkład próbek sygnałów podpasm przez zmniejszanie dynamicznego zakresu wartości. Kompresja połączona z normalizacją lub skalowaniem zwiększa dokładność wielu mniejszych wartości przez wtłaczanie tych wartości w wyższe poziomy kwantowania, które skutecznie wykorzystują więcej bitów. Procesy ekspansji i odwrotnego skalowania są używane w odbiorniku, aby usunąć wyniki działania skalowania i kompresji. Funkcja kompresji pokazana na fig. 6 jest funkcją wykładniczą w postaci y = c(x) = xn (1a)
PL 207 862 B1 gdzie c(x) - funkcja kompresji argumentu x, y - wartość skompresowana, n -dodatnia wartość rzeczywista mniejsza niż jeden.
Komplementarna funkcja ekspansji jest pokazana na fig. 8 i ma postać x = e(y) = y1/n (1b) gdzie e(y) - funkcja ekspansji argumentu y.
Innym przykładem funkcji kompresji i ekspansji są funkcje o postaci y = c(x) = logb(x) (2a) x = e(y) = by (2b)
W tradycyjnych systemach kodowania stosuje się wiele postaci funkcji kompresji i ekspansji, przy czym w systemach kodowania może być wykorzystywana każda postać, która zawiera aspekty wynalazku.
Niektóre zastosowania, takie jak przesyłanie fonii w publicznych sieciach komputerowych, wymagają przesyłania kodowanych cyfrowo sygnałów fonii z szybkością transmisji danych, która jest tak mała, że wszystkie ważniejsze składowe sygnału nie mogą być kwantowane z dokładnością wystarczającą do zapewnienia maskowania szumu kwantowania.
Przeprowadzono wiele prób opracowania systemów kodowania z bardzo małą szybkością transmisji danych, aby zapewnić dobrze brzmiący sygnał akustyczny przez kodowanie i przesyłanie sygnału pasma podstawowego, reprezentującego tylko część szerokości pasma sygnału wejściowego i przez wykorzystywanie technik odtwarzania brakują cych części pasma podczas odtwarzania fonii. Zwykle składowe wysokiej częstotliwości są wykluczane z sygnału pasma podstawowego i są regenerowane podczas odtwarzania. Technika ta polega na pobieraniu bitów, które mogły być wykorzystywane do kodowania składowych wielkiej częstotliwości i wykorzystuje te bity do zwiększania dokładności kwantowania składowych małej częstotliwości.
Ta technika pasma podstawowego/regeneracji nie dała zadowalających wyników. Wiele wysiłków przy polepszaniu jakości tego rodzaju systemu kodowania o bardzo małej szybkości transmisji danych miało na celu polepszenie techniki regeneracji. Jednak znane techniki regeneracji widma nie działają zbyt dobrze, ponieważ bity nie są optymalnie przypisywane składowym widmowym z co najmniej dwóch powodów.
Pierwszym powodem jest to, że sygnał pasma podstawowego jest zbyt wąski. Powoduje to zabieranie bitów ze wszystkich składowych sygnału poza sygnałem pasma podstawowego, łącznie z ważnymi składowymi o duż ej wartości, aby kodować składowe sygnału wewnątrz pasma podstawowego, zawierające nieważne składowe o małej wartości. Sygnał pasma podstawowego powinien mieć szerokość pasma w przybliżeniu 5 kHz lub więcej. Niestety, w wielu zastosowaniach o bardzo małej szybkości transmisji danych, ograniczenia szybkości transmisji danych są tak silne, że w przybliżeniu tylko jeden bit może być przesyłany dla każdej składowej widmowej sygnału w ramach szerokości pasma 5 kHz. Ponieważ jeden bit na współczynnik widmowy nie wystarcza do umożliwienia odtwarzania sygnału wyjściowego o wysokiej jakości, znane systemy kodowania zmniejszają szerokość pasma sygnału pasma podstawowego znacznie poniżej 5 kHz, tak że pozostałe składowe sygnału w węższym sygnale pasma podstawowego mogą być kwantowane z większą dokładnością.
Drugim powodem jest to, że zbyt wiele bitów jest przypisywanych składowym sygnału w sygnale pasma podstawowego, które mają małą wartość. Na skutek tego bity są zabierane z ważnych składowych o dużej wartości, aby kodować dokładniej nieważne składowe o małej wartości. Problem ten jest zaostrzany w systemach kodujących, które wykorzystują urządzenie kwantujące skalujące i kompresujące, ponieważ skalowanie i dekompresja wtłaczają wartości małych składowych na wyższe poziomy kwantowania, co omówiono powyżej.
Problemy powodowane przez każdą z tych przyczyn są zmniejszane przez wtłaczanie mniej ważnych, małowartościowych składowych sygnału do zakresu wartości, które są kwantowane przy mniejszej liczbie poziomów kwantowania. Proces ten zmniejsza dokładność kwantowania składowych o małej wartoś ci, lecz zmniejsza również entropię składowych sygnału o małej wartości po kwantowaniu do poziomu, który jest mniejszy niż entropia bez takiego wtłaczania. Wszystkie składowe sygnały są kodowane entropowo do kodu, który reprezentuje mniej ważne składowe sygnału o małej wartości za pomocą mniejszej liczby bitów niż byłoby to możliwe bez wtłaczania ich do mniejszej liczby poziomów kwantowania, a pozostałe bity są wykorzystywane do dokładniejszego kwantowania innych składowych sygnału. Liczba składowych sygnału, które są wtłaczane do mniejszej liczby poziomów kwantowania, jest sterowana za pomocą urządzenia kwantującego ekspandującego.
PL 207 862 B1
Figura 4C przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału pasma podstawowego w linii 31 przy użyciu funkcji kwantowania z ekspansją, pokazanej na fig. 9, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Urządzenie kwantujące ekspandujące ma mniejszą sprawność kwantowania niż urządzenie kwantujące równomiernie, ponieważ więcej składowych sygnału kwantowane jest poniżej poziomu 4. Urządzenie kwantujące ekspandujące jest realizowane przez funkcję kwantowania nierównomiernego, jak pokazana na fig. 9 albo też jest realizowane przez funkcję ekspansji, taka jak funkcja pokazana na fig. 8, a następnie przez urządzenie kwantujące równomiernie, pokazane na fig. 7. Linia 33 na fig. 3 reprezentuje wartości sygnału w linii 31 po ekspandowaniu za pomocą funkcji pokazanej na fig. 8.
Dokładność kwantowania urządzenia kwantującego ekspandującego nie jest równomierna dla wszystkich wartości wejściowych, mianowicie dokładność kwantowania dla przedziału małych wartości jest mniejsza niż dokładność kwantowania dla sąsiedniego przedziału większych wartości.
Kompresję i proces odwrotnego skalowania stosuje się w odbiorniku w celu odwrócenia wyników otrzymanych przez ekspansję i skalowanie.
Ekspansja zmienia statystyczny rozkład próbek sygnału podpasma przez zwiększanie zakresu dynamiki wartości. Ekspansja połączona z normalizacją lub skalowaniem zmniejsza dokładność wielu mniejszych wartości przez wtłaczanie tych wartości na niższe poziomy kwantowania. Większa liczba składowych sygnału o mniejszej wartości jest przykładowo spychana na poziom kwantowania 0. Przez zwiększenie liczby składowych sygnału, które są kwantowane do niskich poziomów kwantowania, obejmujących składowe sygnału kwantowane do zera QTZ oraz przez zastosowanie kodu, który reprezentuje skutecznie te mniejsze składowe i składowe kwantowane do zera, więcej bitów jest do dyspozycji przy dokładniejszym kwantowaniu składowych sygnału o większej wartości.
Na skutek tego ekspansję i kwantowanie wykorzystuje się do identyfikacji ważnych składowych sygnału w szerszym pasmie dla dokładniejszego kodowania. Optymalizuje to przypisywanie bitów tak, że z sygnału kodowanego z bardzo małą szybkością transmisji danych można regenerować sygnał o lepszej jakości.
Urządzenia kwantujące mogą zapewniać ekspansję tylko części całego zakresu wartości, które mają być kwantowane. Ekspansja jest ważna dla mniejszych wartości. W razie potrzeby urządzenia kwantujące mogą również zapewniać kompresję składowych sygnału, takich jak składowe o mniejszych wartościach.
Figura 10 przedstawia funkcję kwantowania 42, która zapewnia ekspansję i kompresję według funkcji 41. Ekspansja jest zapewniana dla wartości mniejszych, a kompresja jest zapewniana dla wartości większych. Ani ekspansji, ani kompresji nie stosuje się wobec wartości średnich.
Stopień ekspansji i kompresji jest dostosowywany do dowolnych lub wszystkich warunków obejmujących właściwości sygnału, liczbę bitów, które są dostępne do kodowania kwantowanych składowych sygnału i bliskości względem dominujących składowych o dużej wartości. Przykładowo większa ekspansja jest zwykle potrzebna dla podobnych do szumu sygnałów podpasma, które mają stosunkowo płaskie widmo. Mniejsza ekspansja jest potrzebna, jeżeli stosunkowo duża liczba bitów jest dostępna do kodowania. Mniejszą ekspansję należy stosować wobec składowych sygnału, które są usytuowane blisko dominujących składowych sygnału o dużej wartości. Informacje o tym, jak ekspansja i kompresja są dostosowane, powinny być przekazywane do odbiornika, aby mógł on zastosować swe procesy komplementarne.
Każde urządzenie kwantujące 14, 15, 16 może wykorzystywać takie same lub inne funkcje ekspansji i funkcje kwantowania. Ponadto urządzenie kwantujące dla określonego sygnału podpasma może być dostosowane lub zmienione w sposób niezależny lub przynajmniej odmienny od tego, jak to ma miejsce w urządzeniach kwantujących innych sygnałów podpasma. Ponadto ekspansja nie musi być przeprowadzana dla wszystkich sygnałów podpasma.
Koder 17 stosuje kodowanie entropowe wobec kwantowanych składowych sygnału, aby zmniejszyć wymagania dotyczące pojemności informacji. W wielu znanych systemach kodowania stosuje się kodowanie Huffmana, lecz nie jest ono dobrze dostosowane do użycia w wielu systemach o bardzo małej szybkości transmisji danych z co najmniej dwóch powodów.
Pierwszy powód wynika z faktu, że kody Huffmana są złożone z całkowitej liczby bitów, a najkrótszy kod ma długość jednego bitu. Kodowanie Huffmana wykorzystuje najkrótszy kod dla kwantowanego symbolu o największym prawdopodobieństwie występowania. Rozsądnie jest przyjąć, że najbardziej prawdopodobną kwantowaną wartością do kodowania jest zero, ponieważ wynalazek ma na celu zwiększenie liczby składowych sygnału kwantowanych do zera w sygnałach podpasm. WynaPL 207 862 B1 lazek może znacznie polepszyć jakość sygnału w systemach o bardzo małej szybkości transmisji danych, jeżeli składowe kwantowane do zera mogą być reprezentowane przez kody o długości mniejszej niż jeden bit.
Mniejsze skuteczne długości kodu można uzyskać, stosując kodowanie Huffmana z wielowymiarowymi książkami kodów. Dzięki temu kodowanie Huffmana stosuje kod o długości jednego bitu do reprezentowania wielokrotnie kwantowanych wartości. Przykładowo, dwuwymiarowa książka kodów umożliwia reprezentowanie przez kod jednobitowy dwóch wartości. Niestety, kodowanie wielowymiarowe nie jest zbyt skuteczne dla większości sygnałów podpasm i potrzebna jest znaczna pojemność pamięci do przechowywania książki kodów. Kodowanie Huffmana może przełączać się adaptacyjnie pomiędzy jedno- i wielowymiarowymi książkami kodów, lecz w kodowanym sygnale potrzebne są bity kontrolne, aby określić, która książka kodów jest stosowana do kodowania części sygnału. Takie bity kontrolne zmniejszają korzyści osiągnięte przez stosowanie wielowymiarowych książek kodów.
Drugim powodem, dla którego kodowanie Huffmana nie jest właściwe w wielu systemach kodowania o bardzo małej szybkości transmisji danych, jest to, że sprawność kodowania jest bardzo wrażliwa na właściwości statystyczne sygnału względem kodu. Jeżeli stosuje się książkę kodów, która jest przeznaczona do wartości kodu mających statystykę bardzo różniącą się od statystyki wartości sygnału rzeczywiście kodowanego, kodowanie Huffmana może być niekorzystne wskutek zwiększenia wymaganej pojemności informacji dla kodowanego sygnału. Problem ten można zmniejszyć przez wybranie najlepszej książki kodów z zestawu książek kodów, lecz potrzebne są bity kontrolne identyfikujące stosowaną książkę kodów. Takie bity kontrolne zmniejszają korzyści osiągnięte przez użycie wielu książek kodu.
Różne techniki kodowania, takie jak kodowanie grupowe, można stosować oddzielnie lub w połączeniu z innymi formami kodowania. Jednak w korzystnym przykładzie wykonania stosuje się kodowanie arytmetyczne, ponieważ może być ono samoczynnie dostosowywane do aktualnej statystyki sygnału i nadaje się do generowania krótszych kodów niż to jest często możliwe w przypadku kodowania Huffmana.
Proces kodowania arytmetycznego przeprowadza obliczenie liczby rzeczywistej w niedomkniętym przedziale [0,1), aby reprezentować wiadomość złożoną z jednego lub wielu symboli. W tym kontekście symbolem jest kwantowana wartość składowej sygnału, a wiadomością jest zbiór poziomów kwantowania dla wielu składowych sygnału. Alfabetem jest zestaw wszystkich możliwych symboli lub kwantowanych wartości, jakie mogą wystąpić w wiadomości. Liczba symboli w wiadomości, która może być reprezentowana przez liczbę rzeczywistą, jest ograniczona przez dokładność liczby rzeczywistej, która jest wyrażana przez koder. Liczba symboli reprezentowanych przez kod liczby rzeczywistej jest dostarczana do dekodera.
Jeżeli M oznacza liczbę symboli w alfabecie, wówczas etapy jednego procesu kodowania arytmetycznego są następujące:
1. Dzielenie przedziału [0,1) na M segmentów, z których każdemu odpowiada określony symbol w alfabecie. Segment przypisany odpowiedniemu symbolowi ma długość proporcjonalną do prawdopodobieństwa wystąpienia tego symbolu.
2. Otrzymywanie pierwszego symbolu z wiadomości i wybieranie odpowiedniego segmentu.
3. Dzielenie wybranego segmentu na M segmentów w sposób podobny, jak w etapie 1. Każdy segment odpowiada symbolowi w alfabecie i ma długość proporcjonalną do prawdopodobieństwa wystąpienia tego symbolu.
4. Otrzymywanie następnego symbolu z wiadomości i wybieranie odpowiedniego segmentu.
5. Przeprowadzanie dalej etapów 3 i 4, aż cała wiadomość zostanie zakodowana lub aż do osiągnięcia granicy dokładności.
6. Generowanie najkrótszej możliwej części binarnej, która reprezentuje dowolną liczbę w ostatnim wybranym segmencie.
Figura 11 przedstawia ten proces przy zastosowaniu do wiadomości z czterech symboli 1300 w alfabecie z czterech symboli, które reprezentują cztery poziomy kwantowania 0, 1, 2 i 3. Prawdopodobieństwa wystąpienia każdego z tych symboli wynoszą odpowiednio 0,55, 0,20, 0,15 i 0,10.
Pierwszy prostokąt po lewej stronie rysunku przedstawia etap 1, w którym niedomknięty przedział [0,1) jest dzielony na cztery segmenty dla każdego symbolu z alfabetu, o długości proporcjonalnej do prawdopodobieństwa wystąpienia poszczególnych symboli.
W etapie 2 z wiadomoś ci sygnał u podpasma otrzymuje się pierwszy symbol reprezentują cy poziom kwantowania 1 i wybiera się odpowiedni niedomknięty przedział [0,55, 0,75).
PL 207 862 B1
Drugi prostokąt usytuowany po prawej stronie pierwszego prostokąta reprezentuje etap 3, w którym wybrany segment jest dzielony na cztery segmenty dla każ dego symbolu w alfabecie.
W etapie 4 z wiadomoś ci otrzymuje się drugi symbol reprezentują cy poziom kwantowania 3 i wybiera się odpowiedni niedomknięty przedział [0,73, 0,75).
Etap 5 wielokrotnie powtarza etapy 3 i 4. Trzeci prostokąt usytuowany po prawej stronie drugiego prostokąta przedstawia wielokrotne powtarzanie etapu 3, w którym poprzednio wybrany segment zostaje podzielony na cztery segmenty dla każdego symbolu w alfabecie.
Przy wielokrotnym powtarzaniu etapu 4, z wiadomości otrzymuje się trzeci symbol reprezentujący poziom kwantowania 0 i wybiera się odpowiedni niedomknięty przedział [0,730, 0,741).
Etap 5 ponownie wielokrotnie powtarza etapy 3 i 4. Czwarty prostokąt po prawej stronie rysunku przedstawia wielokrotne powtarzanie etapu 3, w którym poprzednio wybrany segment zostaje podzielony na cztery segmenty dla każdego symbolu w alfabecie.
Przy wielokrotnym powtarzaniu etapu 4, z wiadomości otrzymuje się czwarty i ostatni symbol reprezentujący poziom kwantowania 0 i wybiera się odpowiedni niedomknięty przedział [0,73000, 0,73605).
Po dojściu do końca wiadomości w etapie 6 jest wytwarzany najkrótszy możliwy ułamek binarny, który reprezentuje pewną liczbę w ostatnim wybranym segmencie. Wytwarzany jest sześciobitowy binarny ułamek 0,1011112 = 0,73437510.
Opisany powyżej proces kodowania wymaga pewnego rozkładu prawdopodobieństwa dla alfabetu symboli, a informacje o tym rozkładzie muszą zostać w pewien sposób przekazane do dekodera. Jeżeli rozkład prawdopodobieństwa zmienia się, wówczas proces kodowania przestaje być optymalny. Koder 17 może obliczać nowy rozkład na podstawie aktualnego prawdopodobieństwa symboli otrzymywanych do kodowania. Obliczanie to przeprowadza się w sposób ciągły, gdy każdy symbol jest otrzymywany z wiadomości, albo też przeprowadza się z mniejszą częstością. Dekoder 23 przeprowadza takie same obliczenia i utrzymuje swój rozkład w synchronizacji z koderem 17. Proces kodowania może rozpoczynać się przy dowolnym żądanym rozkładzie prawdopodobieństwa.
Różne przykłady wykonania wynalazku są realizowane wieloma różnymi sposobami, obejmującymi oprogramowanie uniwersalnego systemu komputerowego albo w urządzeniach, które zawierają wyspecjalizowane części składowe, takie jak procesor sygnałów cyfrowych dołączony do części składowych podobnych do stosowanych w uniwersalnym systemie komputerowym.
Figura 12 przedstawia schemat blokowy urządzenia 70 do realizacji różnych przykładów wykonania wynalazku w nadajniku kodowania fonii lub w odbiorniku dekodowania fonii. Procesor 72 sygnałów cyfrowych zapewnia zasoby obliczeniowe. Pamięć 73 o dostępie swobodnym RAM jest wykorzystywana przez procesor 72 przetwarzający sygnały. Pamięć stała 74 ROM służy do przechowywania programów potrzebnych do działania urządzenia 70. Zespół sterowania 75 wejścia/wyjścia jest interfejsem do odbioru i nadawania sygnałów poprzez kanały telekomunikacyjne 76, 77. W zespole sterowania 75 wejścia/wyjścia są stosowane, w zależności od potrzeb, przetworniki analogowo-cyfrowe i przetworniki cyfrowo-analogowe do odbioru i/lub nadawania analogowych sygnałów fonii. Wszystkie główne części składowe systemu są dołączone do magistrali 71, która może stanowić więcej niż jedną magistralę fizyczną.
W przykładach realizowanych w uniwersalnym systemie komputerowym mogą być zawarte dodatkowe części składowe do sprzęgania z urządzeniami, takimi jak klawiatura lub mysz i monitor, oraz do sterowania pamięcią zawierającą nośnik, taki jak taśma magnetyczna lub dysk magnetyczny albo nośnik optyczny. Nośnik pamięci jest wykorzystywany do zapisywania programów złożonych z poleceń dla systemów operacyjnych, programów narzędziowych i programów użytkowych oraz może zawierać przykłady wykonania programów, które realizują różne aspekty wynalazku.
Funkcje potrzebne do praktycznego wykonania wynalazku mogą być również wykonywane przez części składowe specjalnego przeznaczenia, które są realizowane w różny sposób, w tym jako dyskretne, logiczne części składowe, jeden lub więcej układów scalonych specjalnego przeznaczenia i/lub procesorów sterowanych programowo.
Realizacje programowe wynalazku są przeprowadzane za pomocą wielu różnych nośników czytelnych dla komputera, takich jak tory łączności w paśmie podstawowym lub z modulacją w całym widmie, obejmującym częstotliwości od naddźwiękowych do ultrafioletowych, albo nośniki pamięci obejmujące te nośniki, które przenoszą informacje, wykorzystując dowolną technikę zapisu magnetycznego lub optycznego, łącznie z taśmą magnetyczną, dyskiem magnetycznym i dyskiem optycznym. Różne aspekty wynalazku są realizowane w różnych częściach składowych urządzenia 70 przez
PL 207 862 B1 układy przetwarzania, takie jak układy scalone specjalnego przeznaczenia, uniwersalne układy scalone, mikroprocesory sterowane przez programy zawarte w różnych pamięciach stałych lub pamięciach o dostępie swobodnym oraz przy użyciu innych technik.

Claims (14)

1. Nadajnik kodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, do odbioru sygnału wejściowego, reprezentującego sygnał akustyczny i generowania sygnału wyjściowego, niosącego kodowaną reprezentację sygnału akustycznego, zawierający zestaw filtrów analizy do generowania wielu sygnałów podpasm, reprezentujących podpasma częstotliwości sygnału akustycznego w odpowiedzi na sygnał wejściowy, przy czym każdy sygnał podpasma zawiera jedną lub więcej składowych sygnału podpasma, znamienny tym, że do zestawu filtrów analizy jest dołączone urządzenie kwantujące do kwantowania jednego lub więcej sygnałów podpasma dla generowania kwantowanych sygnałów podpasma, do urządzenia kwantującego jest dołączony koder dla generowania jednego lub więcej kodowanych sygnałów podpasma przez kodowanie jednego lub więcej kwantowanych sygnałów podpasma przy użyciu procesu kodowania entropowego, zmniejszającego wymaganą pojemność informacyjną kwantowanych sygnałów podpasma oraz do kodera jest dołączone urządzenie formatujące do zestawiania jednego lub więcej kodowanych sygnałów podpasma w sygnał wyjś ciowy, przy czym urzą dzenie kwantują ce ma elementy do wtł aczania drugich skł adowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
2. Nadajnik według zastrz. 1, znamienny tym, że zestaw filtrów analizy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
3. Nadajnik według zastrz. 1 albo 2, znamienny tym, że urządzenie kwantujące zawiera ekspander, który ma wejście dołączone do zestawu filtrów analizy i wyjście, do którego jest dołączone wejście urządzenia kwantującego równomiernie, którego wyjście jest dołączone do kodera.
4. Nadajnik według zastrz. 1 albo 2, znamienny tym, że urządzenie kwantujące jest urządzeniem kwantującym nierównomiernie.
5. Nadajnik według zastrz. 1 albo 2, znamienny tym, że koder jest koderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
6. Nadajnik według zastrz. 1 albo 2, znamienny tym, że koder jest koderem z kodowaniem arytmetycznym.
7. Nadajnik według zastrz. 1, znamienny tym, że urządzenie kwantujące jest dostosowane do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
8. Odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, do odbioru sygnału wejściowego, niosący kodowaną reprezentację sygnału akustycznego i generowania sygnału wyjściowego, reprezentującego sygnał akustyczny, zawierający urządzenie deformatujące do odbioru jednego lub więcej kodowanych sygnałów podpasma z sygnału wejściowego, do urządzenia deformatującego jest dołączony dekoder do generowania jednego lub więcej dekodowanych sygnałów podpasma przez dekodowanie jednego lub więcej kodowanych sygnałów podpasma przy użyciu procesu dekodowania entropowego, zwiększającego wymaganą pojemność informacyjną kodowanych sygnałów podpasma, przy czym każdy dekodowany sygnał podpasma zawiera jedną lub więcej składowych sygnału podpasma i reprezentuje odpowiednie podpasmo częstotliwości sygnału akustycznego, znamienny tym, że do dekodera jest dołączone urządzenie dekwantujące dla generowania jednego lub więcej dekwantowanych sygnałów podpasma przez dekwantowanie składowych sygnału podpasma dla jednego lub więcej dekodowanych sygnałów podpasma oraz do urządzenia dekwantującego jest dołączony zestaw filtrów syntezy do generowania sygnału wyjściowego w odpowiedzi na wiele sygnał ów podpasma, zawierają cych jeden lub wię cej dekwantowanych sygnałów podpasma, przy czym urządzenie dekwantujące jest komplementarne do urządzenia kwantującego i ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
PL 207 862 B1
9. Odbiornik według zastrz. 8, znamienny tym, że zestaw filtrów syntezy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
10. Odbiornik według zastrz. 8 albo 9, znamienny tym, że urządzenie dekwantujące zawiera urządzenie dekwantujące równomiernie, które ma wejście dołączone do dekodera i wyjście, do którego jest dołączone wejście kompresora, którego wyjście jest dołączone do zestawu filtrów syntezy.
11. Odbiornik według zastrz. 8 albo 9, znamienny tym, że urządzenie dekwantujące jest urządzeniem dekwantującym nierównomiernie.
12. Odbiornik według zastrz. 8 albo 9, znamienny tym, że dekoder jest dekoderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
13. Odbiornik według zastrz. 8 albo 9, znamienny tym, że dekoder jest dekoderem z kodowaniem arytmetycznym.
14. Odbiornik według zastrz. 8, znamienny tym, że urządzenie dekwantujące jest komplementarne do urządzenia kwantującego, dostosowanego do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
PL373045A 2002-07-16 2003-07-08 Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji PL207862B1 (pl)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/198,638 US7043423B2 (en) 2002-07-16 2002-07-16 Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding

Publications (2)

Publication Number Publication Date
PL373045A1 PL373045A1 (pl) 2005-08-08
PL207862B1 true PL207862B1 (pl) 2011-02-28

Family

ID=30115160

Family Applications (1)

Application Number Title Priority Date Filing Date
PL373045A PL207862B1 (pl) 2002-07-16 2003-07-08 Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji

Country Status (16)

Country Link
US (1) US7043423B2 (pl)
EP (1) EP1537562B1 (pl)
JP (1) JP4786903B2 (pl)
KR (1) KR101019678B1 (pl)
CN (1) CN100367348C (pl)
AT (1) ATE360250T1 (pl)
AU (1) AU2003253854B2 (pl)
CA (1) CA2492647C (pl)
DE (1) DE60313332T2 (pl)
HK (1) HK1073916A1 (pl)
IL (1) IL165869A (pl)
MX (1) MXPA05000653A (pl)
MY (1) MY137149A (pl)
PL (1) PL207862B1 (pl)
TW (1) TWI315944B (pl)
WO (1) WO2004008436A1 (pl)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CA2499212C (en) * 2002-09-17 2013-11-19 Vladimir Ceperkovic Fast codec with high compression ratio and minimum required resources
US7610553B1 (en) * 2003-04-05 2009-10-27 Apple Inc. Method and apparatus for reducing data events that represent a user's interaction with a control interface
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004027146B4 (de) * 2004-06-03 2014-10-30 Unify Gmbh & Co. Kg Verfahren und Vorrichtung zum automatischen Festlegen von zu Codeworten gehörenden Wertebereichsgrenzen für Abtastwerte
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
HUE043155T2 (hu) * 2006-07-04 2019-08-28 Dolby Int Ab Szûrõátalakítót és szûrõkrompresszort tartalmazó szûrõrendszer, és eljárás a szûrõrendszer mûködtetésére
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101400484B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US20100106269A1 (en) * 2008-09-26 2010-04-29 Qualcomm Incorporated Method and apparatus for signal processing using transform-domain log-companding
MX2011003824A (es) * 2008-10-08 2011-05-02 Fraunhofer Ges Forschung Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple.
EP2315358A1 (en) 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
ES2453098T3 (es) 2009-10-20 2014-04-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Códec multimodo de audio
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
US8989884B2 (en) * 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US9786286B2 (en) * 2013-03-29 2017-10-10 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
JP5969727B2 (ja) * 2013-04-29 2016-08-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 動的閾値を用いた周波数帯域圧縮
EP3195507B1 (en) * 2014-09-19 2021-01-20 Telefonaktiebolaget LM Ericsson (publ) Methods for compressing and decompressing iq data, and associated devices
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3353783B1 (en) * 2015-09-25 2019-12-11 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding
US10861475B2 (en) 2015-11-10 2020-12-08 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
CN110992672B (zh) * 2019-09-25 2021-06-29 广州广日电气设备有限公司 红外遥控器学习及编码方法、红外遥控器系统及存储介质
DE102022200893A1 (de) * 2022-01-27 2023-07-27 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zur Codierung und Decodierung von Daten

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4272648A (en) * 1979-11-28 1981-06-09 International Telephone And Telegraph Corporation Gain control apparatus for digital telephone line circuits
US4273970A (en) * 1979-12-28 1981-06-16 Bell Telephone Laboratories, Incorporated Intermodulation distortion test
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US5127021A (en) * 1991-07-12 1992-06-30 Schreiber William F Spread spectrum television transmission
US5394508A (en) 1992-01-17 1995-02-28 Massachusetts Institute Of Technology Method and apparatus for encoding decoding and compression of audio-type data
JP3527758B2 (ja) * 1993-02-26 2004-05-17 ソニー株式会社 情報記録装置
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3685823B2 (ja) * 1993-09-28 2005-08-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JPH0918348A (ja) * 1995-06-28 1997-01-17 Graphics Commun Lab:Kk 音響信号符号化装置及び音響信号復号装置
JP3475985B2 (ja) * 1995-11-10 2003-12-10 ソニー株式会社 情報符号化装置および方法、情報復号化装置および方法
DE10010849C1 (de) * 2000-03-06 2001-06-21 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Analysieren eines Analyse-Zeitsignals

Also Published As

Publication number Publication date
TW200406096A (en) 2004-04-16
JP2005533280A (ja) 2005-11-04
DE60313332D1 (de) 2007-05-31
ATE360250T1 (de) 2007-05-15
EP1537562B1 (en) 2007-04-18
IL165869A0 (en) 2006-01-15
US20040015349A1 (en) 2004-01-22
KR20050021467A (ko) 2005-03-07
CA2492647C (en) 2011-08-30
CA2492647A1 (en) 2004-01-22
CN100367348C (zh) 2008-02-06
DE60313332T2 (de) 2008-01-03
WO2004008436A1 (en) 2004-01-22
HK1073916A1 (en) 2006-01-20
CN1669072A (zh) 2005-09-14
AU2003253854A1 (en) 2004-02-02
JP4786903B2 (ja) 2011-10-05
IL165869A (en) 2010-06-30
MY137149A (en) 2008-12-31
US7043423B2 (en) 2006-05-09
EP1537562A1 (en) 2005-06-08
AU2003253854B2 (en) 2009-02-19
PL373045A1 (pl) 2005-08-08
MXPA05000653A (es) 2005-04-25
TWI315944B (en) 2009-10-11
KR101019678B1 (ko) 2011-03-07

Similar Documents

Publication Publication Date Title
PL207862B1 (pl) Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji
US6058362A (en) System and method for masking quantization noise of audio signals
US6029126A (en) Scalable audio coder and decoder
KR100991450B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
US6253165B1 (en) System and method for modeling probability distribution functions of transform coefficients of encoded signal
EP1080462B1 (en) System and method for entropy encoding quantized transform coefficients of a signal
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
US6011824A (en) Signal-reproduction method and apparatus
KR20060121973A (ko) 양자화 스텝 사이즈 결정 장치 및 방법
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
PL207861B1 (pl) Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
AU4227900A (en) Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
JPH08166799A (ja) 高能率符号化方法及び装置
JP3465698B2 (ja) 信号復号化方法及び装置