PL207862B1 - Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji - Google Patents
Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacjiInfo
- Publication number
- PL207862B1 PL207862B1 PL373045A PL37304503A PL207862B1 PL 207862 B1 PL207862 B1 PL 207862B1 PL 373045 A PL373045 A PL 373045A PL 37304503 A PL37304503 A PL 37304503A PL 207862 B1 PL207862 B1 PL 207862B1
- Authority
- PL
- Poland
- Prior art keywords
- signal
- subband
- components
- quantizer
- quantized
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 230000000295 complement effect Effects 0.000 claims abstract description 10
- 238000013139 quantization Methods 0.000 claims description 74
- 238000000034 method Methods 0.000 claims description 47
- 230000008569 process Effects 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000002347 injection Methods 0.000 claims description 6
- 239000007924 injection Substances 0.000 claims description 6
- 230000006835 compression Effects 0.000 abstract description 39
- 238000007906 compression Methods 0.000 abstract description 39
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 37
- 230000003595 spectral effect Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 5
- 230000008929 regeneration Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
Opis wynalazku
Przedmiotem wynalazku jest nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, o bardzo małej szybkości transmisji danych.
Systemy kodowania fonii służą do przetwarzania sygnału akustycznego w sygnał kodowany, który nadaje się do przesyłania lub zapisania. Kodowany sygnał jest odbierany lub odtwarzany oraz dekodowany, aby otrzymać wersję oryginalnego sygnału akustycznego do wysłuchania. Percepcyjne systemy kodowania fonii kodują sygnał akustyczny w sygnał kodowany, który ma mniejszą wymaganą pojemność informacji niż oryginalny sygnał akustyczny, po czym dekodują kodowany sygnał, aby otrzymać sygnał wyjściowy, który jest percepcyjnie nieodróżnialny od oryginalnego sygnału akustycznego. Przykładowy percepcyjny system kodowania fonii jest opisany w publikacji Bosi'ego i in.: ISO/IEC MPEG-2 Advanced Audio Coding, J. AES, tom 45, nr 10, październik 1997, strony 789-814, nazwany Advanced Audio Coding (AAC).
Percepcyjne techniki kodowania, takie jak technika AAC, wykorzystują zestaw filtrów analizy dla sygnału akustycznego, aby otrzymać składowe sygnału cyfrowego, które zwykle mają wysoki poziom dokładności rzędu 16-24 bitów i są rozmieszczone w podpasmach częstotliwości. Szerokości podpasm są zwykle różne i współmierne z szerokościami tak zwanych pasm krytycznych ludzkiego słuchu. Wymagania dotyczące pojemności informacyjnej sygnału są zmniejszane przez kwantowanie składowych sygnałów podpasma do znacznie niższego poziomu dokładności. Ponadto kwantowane składowe mogą być również kodowane w procesie kodowania entropowego, takim jak kodowanie Huffmana. Kwantowanie wprowadza szum do kwantowanych sygnałów, lecz percepcyjne systemy kodowania fonii stosują modele psychoakustyczne, usiłując sterować amplitudą szumu kwantowania tak, że jest on maskowany lub czyniony niesłyszalnym przez składowe widmowe w sygnale. Niedokładną kopię składowych sygnałów podpasma otrzymuje się z kodowanego sygnału przez komplementarne dekodowanie entropowe i dekwantowanie.
Znane percepcyjne systemy kodowania realizują kwantowanie składowych sygnałów podpasma i stosują proces kodowania entropowego dla składowych sygnałów kwantowanych w sposób, który jest praktycznie optymalny lub prawie optymalny. Zarówno kwantowanie jak i kodowanie entropowe działają w miarę możliwości z dużą sprawnością matematyczną.
Konstrukcja optymalnego lub prawie optymalnego urządzenia kwantującego zależy od statystycznych właściwości kwantowanych wartości składowych sygnału. W percepcyjnym systemie kodowania, który wykorzystuje transformację do realizacji zestawu filtrów analizy, wartości składowych sygnału są otrzymywane ze współczynników transformacji w domenie częstotliwości, które są grupowane w podpasma częstotliwości, a następnie normalizowane lub skalowane w odniesieniu do składowej o największej wartości w każdym podpasmie. Jednym przykładem skalowania jest proces znany jako kompansja blokowa. Liczba współczynników, które są grupowane w każdym podpaśmie, zwykle zwiększa się wraz z częstotliwością podpasma tak, że szerokości podpasm zbliżają się do krytycznych szerokości pasm ludzkiego słuchu. Modele psychoakustyczne i procesy przypisywania bitów określają wartość skalowania dla każdego sygnału podpasma. Grupowanie i skalowanie zmieniają właściwości statystyczne kwantowanych wartości składowych sygnałów. W związku z tym sprawność kwantowania jest zwykle optymalizowana dla właściwości grupowanych i skalowanych składowych sygnału.
W znanych percepcyjnych systemach kodowania, takich jak wspomniany powyż ej system AAC, szersze podpasma mają tendencję do posiadania kilku dominujących składowych sygnału podpasma o stosunkowo dużej wartości i znacznie więcej mniejszych składowych sygnału o mniejszych wartościach. Urządzenie kwantujące równomiernie nie kwantuje takiego rozkładu wartości z dużą sprawnością. Sprawność urządzenia kwantującego można poprawić przez kwantowanie mniejszych składowych sygnału z większą dokładnością i kwantowanie większych składowych sygnału z mniejszą dokładnością. Często realizuje się to, stosując urządzenie kwantujące kompresujące, takie jak urządzenie kwantujące, działające według prawa μ lub według prawa A. Urządzenie kwantujące kompresujące może być realizowane przez kompresor umieszczony przed urządzeniem kwantującym równomiernie albo też może być realizowane przez urządzenie kwantujące nierównomiernie, które jest równoważnikiem procesu dwuetapowego. Do odwracania wyników działania urządzenia kwantującego kompresującego stosuje się urządzenie dekwantujące ekspandujące. Urządzenie dekwantujące ekspandujące realizuje ekspansję, która jest zasadniczo odwrotnością kompresji realizowanej w urządzenie kwantującym kompresującym.
PL 207 862 B1
Urządzenie kwantujące kompresujące zwykle zapewnia dobre wyniki w percepcyjnych systemach kodowania fonii, które reprezentują wszystkie składowe sygnału o poziomie dokładności kwantowania, która jest zasadniczo równa lub większa od dokładności określanej przez model psychoakustyczny konieczny do maskowania szumu kwantowania. Kompresja zwykle poprawia sprawność kwantowania przez redystrybucję wartości składowych sygnału bardziej równomiernie w zakresie wejściowym urządzenie kwantującego.
Systemy kodowania fonii o bardzo małej szybkości transmisji danych (VLBR) zwykle nie mogą reprezentować wszystkich składowych sygnału z dokładnością kwantowania wystarczającą do maskowania szumu kwantowania. Pewne systemy kodowania o bardzo małej szybkości transmisji danych próbują odtwarzać sygnał wyjściowy, mający wysoki poziom odbieranej jakości przez nadawanie lub zapisywanie sygnału pasma podstawowego, mającego tylko część szerokości pasma sygnału wejściowego, i regenerowanie brakujących części szerokości pasma sygnału podczas odtwarzania przez kopiowanie składowych widmowych z sygnału pasma podstawowego. Technika ta jest czasami nazywana translacją widmową lub regeneracją widmową. Urządzenia kwantujące kompresujące zwykle nie zapewniają dobrych wyników, gdy są stosowane w systemach kodowania o bardzo małej szybkości transmisji danych, takich jak systemy stosujące regenerację widmową.
Konstrukcja optymalnego lub prawie optymalnego kodera, takiego jak kodery stosowane w typowych systemach kodowania fonii, zależy od statystycznych właściwości kodowanych wartości. W znanych systemach grupy kwantowanych składowych sygnału są kodowane w procesie kodowania Huffmana, który wykorzystuje jedną lub więcej książek kodów do wytwarzania kodów o zmiennej długości, reprezentujących kwantowane składowe sygnału. Najkrótsze kody służą do reprezentowania tych kwantowanych wartości, co do których oczekuje się, że będą występować najczęściej. Każdy kod jest wyrażany przez całkowitą liczbę bitów.
Kodowanie Huffmana często zapewnia dobre wyniki w systemach kodowania fonii, które mogą reprezentować wszystkie składowe sygnału z dokładnością kwantowania wystarczającą do maskowania szumu kwantowania. Kodowanie Huffmana ma jednak poważne ograniczenia, które czynią je nieodpowiednim do stosowania w wielu systemach kodowania o bardzo małej szybkości transmisji danych, co zostanie opisane dalej.
Nadajnik według wynalazku charakteryzuje się tym, że do zestawu filtrów analizy jest dołączone urządzenie kwantujące do kwantowania jednego lub więcej sygnałów podpasma dla generowania kwantowanych sygnałów podpasma. Do urządzenia kwantującego jest dołączony koder dla generowania jednego lub więcej kodowanych sygnałów podpasma przez kodowanie jednego lub więcej kwantowanych sygnałów podpasma przy użyciu procesu kodowania entropowego, zmniejszającego wymaganą pojemność informacyjną kwantowanych sygnałów podpasma. Do kodera jest dołączone urządzenie formatujące do zestawiania jednego lub więcej kodowanych sygnałów podpasma w sygnał wyjściowy. Urządzenie kwantujące ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
Korzystnie zestaw filtrów analizy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
Korzystnie urządzenie kwantujące zawiera ekspander, który ma wejście dołączone do zestawu filtrów analizy i wyjście, do którego jest dołączone wejście urządzenia kwantującego równomiernie, którego wyjście jest dołączone do kodera.
Korzystnie urządzenie kwantujące jest urządzeniem kwantującym nierównomiernie.
Korzystnie koder jest koderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
Korzystnie koder jest koderem z kodowaniem arytmetycznym.
Korzystnie urządzenie kwantujące jest dostosowane do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
Odbiornik według wynalazku charakteryzuje się tym, że do dekodera jest dołączone urządzenie dekwantujące dla generowania jednego lub więcej dekwantowanych sygnałów podpasma przez dekwantowanie składowych sygnału podpasma dla jednego lub więcej dekodowanych sygnałów podpasma. Do urządzenia dekwantującego jest dołączony zestaw filtrów syntezy do generowania sygnału wyjściowego w odpowiedzi na wiele sygnałów podpasma, zawierających jeden lub więcej dekwantowanych sygnałów podpasma. Urządzenie dekwantujące jest komplementarne do urządzenia kwantu4
PL 207 862 B1 jącego i ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
Korzystnie zestaw filtrów syntezy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
Korzystnie urządzenie dekwantujące zawiera urządzenie dekantujące równomiernie, które ma wejście dołączone do dekodera i wyjście, do którego jest dołączone wejście kompresora, którego wyjście jest dołączone do zestawu filtrów syntezy.
Korzystnie urządzenie dekwantujące jest urządzenie dekwantującym nierównomiernie.
Korzystnie dekoder jest dekoderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
Korzystnie dekoder jest dekoderem z kodowaniem arytmetycznym.
Korzystnie urządzenie dekwantujące jest komplementarne do urządzenia kwantującego, dostosowanego do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
Zaletą wynalazku jest zapewnienie ulepszonych systemów kodowania fonii, zwłaszcza nadajnika kodowania fonii i odbiornika kodowania fonii, dla przezwyciężania niedogodności typowego kodowania fonii, które wykorzystuje urządzenia kwantujące kompresujące i kodowanie entropowe, jak w kodowaniu Huffmana. Wynalazek zapewnia poprawę odczuwalnej jakoś ci sygnał ów akustycznych, otrzymywanych z systemów kodowania fonii o małej szybkości transmisji danych. Dzięki wtłaczaniu drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania o ilości mniejszej niż wystąpiłaby bez wtłaczania, uzyskuje się zmniejszenie wymaganej dokładności kwantowania i redukcję entropii kwantowanych drugich składowych sygnału podpasma.
Przedmiot wynalazku jest pokazany w przykładach wykonania na rysunku, na którym:
fig. 1 przedstawia schemat blokowy nadajnika kodowania fonii, fig. 2 - schemat blokowy odbiornika dekodowania fonii, fig. 3 - graficzne przedstawienie kompresji i ekspansji hipotetycznych składowych sygnału podpasma, fig. 4A-4C - graficznie kwantowanie składowych sygnału podpasma z fig. 3, fig. 5 - graficznie funkcję kwantowania z kompresją, fig. 6 - graficznie funkcję kompresji, fig. 7 - graficznie funkcję kwantowania równomiernego, fig. 8 - graficznie funkcję ekspansji, fig. 9 - graficznie funkcję kwantowania z ekspansją, fig. 10 - graficznie funkcję kwantowania z ekspansją/kompresją, fig. 11 - graficznie kodowanie arytmetyczne, fig. 12 - schemat blokowy urządzenia do realizacji różnych aspektów wynalazku.
Figura 1 przedstawia przykład wykonania nadajnika kodowania fonii, który realizuje różne aspekty wynalazku. Zestaw filtrów 12 analizy odbiera z toru 11 informacje fonii, reprezentujące sygnał akustyczny, a w odpowiedzi wytwarza informacje cyfrowe, reprezentujące podpasma częstotliwości sygnału akustycznego. Informacje cyfrowe w każdym z podpasm częstotliwości są kwantowane przez urządzenie kwantujące 14, 15, 16 i podawane na koder 17, który generuje kodowaną reprezentację kwantowanej informacji podawanej na urządzenie formatujące 18. W jednym przykładzie wykonania funkcje kwantowania w urządzeniach kwantujących 14, 15, 16 są przeznaczone do tego, aby w odpowiedzi kwantować informacje kontrolne odbierane ze sterownika 13 kwantowania, który generuje informacje sterowania kwantowaniem w odpowiedzi na informacje fonii odbierane z toru 11. Urządzenie formatujące 18 zestawia kodowaną reprezentację kwantowanej informacji i kwantowaną informację sterowania w sygnał wyjściowy dla nadawania lub zapamiętywania oraz przesyła sygnał wyjściowy w torze 19.
Nadajnik przedstawiony na fig. 1 ma części składowe dla trzech podpasm częstotliwości. Znacznie więcej podpasm jest wykorzystywanych w typowych zastosowaniach, lecz dla przejrzystości rysunku pokazano tylko trzy.
Zestaw filtrów 12 analizy jest realizowany zasadniczo w dowolny sposób, włączając w to szeroki zakres technik filtrów cyfrowych, transformacji blokowych i transformacji fal elementarnych. Przykładowo zestaw filtrów 12 analizy jest realizowany przez jeden lub wiele kwadraturowych filtrów zwierciaPL 207 862 B1 dlanych QMF w układzie kaskadowym, różne dyskretne transformaty typu Fouriera, takie jak dyskretna transformata cosinus DCT lub indywidualna modyfikowana transformata DCT, znana jako transformata z kasowaniem aliasingu w domenie czasu TRAC.
Zestawy filtrów analizy, które są realizowane przez transformacje blokowe, przetwarzają blok lub przedział sygnału wejściowego w zestaw współczynników transformacji, które reprezentują składową widmową tego przedziału sygnału. Grupa złożona z jednego lub wielu sąsiednich współczynników transformacji reprezentuje składową widmową w określonym podpasmie częstotliwości, mającym szerokość pasma współmierną z liczbą współczynników w grupie.
Zestawy filtrów analizy, które są realizowane przez pewien rodzaj filtru cyfrowego, taki jak filtr wielofazowy, a nie przez transformację blokową, dzielą sygnał wejściowy na zestaw sygnałów podpasma. Każdy sygnał podpasma jest czasową reprezentacją składowej widmowej sygnału wejściowego w określonym podpasmie częstotliwości. Korzystnie sygnał podpasma jest dzielony na dziesięć, tak ż e każdy sygnał podpasma ma szerokość pasma, która jest współmierna z liczbą próbek w sygnale podpasma dla jednostkowego przedziału czasu.
W tym opisie określenie sygnał podpasma dotyczy grup zło żonych z jednego lub wielu współczynników transformacji, a określenie składowe sygnału podpasma dotyczy współczynników transformacji. Zasady wynalazku stosuje się także do innych rodzajów wykonania, jednak określenie sygnał podpasma zwykle jest rozumiane jako odnoszące się do sygnałów w domenie czasu, reprezentujących składową widmową określonego podpasma częstotliwości sygnału, a określenie składowe sygnału podpasma zwykle jest rozumiane jako odnoszące się do próbek sygnałów podpasma w domenie czasu.
Sterownik 13 kwantowania realizuje zasadniczo dowolny żądany rodzaj przetwarzania. Jednym przykładem jest proces, który wykorzystuje model psychoakustyczny dla informacji fonii, aby oceniać psychoakustycznie maskujące działania różnych składowych widmowych w sygnale fonii. Możliwych jest wiele zmian, przykładowo sterownik 13 kwantowania może generować informacje sterowania kwantowaniem w odpowiedzi na informacje podpasma częstotliwości dostępne na wyjściu zestawu filtrów 12 analizy zamiast lub oprócz informacji akustycznych dostępnych na wejściu zestawu filtrów. W innym przykładzie wykonania sterownik 13 kwantowania jest wyeliminowany, a urządzenia kwantujące 14, 15, 16 wykorzystują funkcje kwantowania, które nie są dostosowane, a wynalazek nie wymaga zastosowania żadnego szczególnego procesu.
Urządzenie formatujące 18 zestawia kwantowane i kodowane składowe sygnału do postaci właściwej do przesyłania w torze 19 dla nadawania lub zapamiętywania. Formatowany sygnał zawiera na przykład wzory synchronizacji, informacje detekcji/korekcji błędów i ewentualnie informacje sterowania.
Figura 2 przedstawia przykład wykonania odbiornika dekodowania fonii, który realizuje różne aspekty wynalazku. Urządzenie deformatujące 22 odbiera z toru 21 sygnał wejściowy, niosący kodowaną reprezentację kwantowanej informacji cyfrowej, reprezentującej podpasma częstotliwości sygnału akustycznego. Urządzenie deformatujące 22 odbiera kodowaną reprezentację z sygnału wejściowego i podaje ją na dekoder 23, który dekoduje kodowaną reprezentację w celu otrzymania podpasm częstotliwości kwantowanej informacji. Cyfrowa kwantowana informacja w każdym z podpasm częstotliwości jest dekwantowana za pomocą urządzenia dekwantującego 25, 26, 27 i jest podawana na zestaw filtrów 28 syntezy, który wytwarza w torze 29 informację fonii reprezentującą sygnał akustyczny. Funkcje dekwantowania w urządzeniach dekwantujących 25, 26, 27 są dostosowywane w odpowiedzi na informację sterowania dekwantowaniem, odbieraną ze sterownika 24 dekwantowania, który wytwarza informację sterowania dekwantowaniem w odpowiedzi na informację sterowania odbieraną przez urządzenie deformatujące 22 z sygnału wejściowego.
Dekoder 23 stosuje proces, który jest komplementarny do procesu stosowanego w koderze 17. W korzystnym przykładzie wykonania jest stosowane dekodowanie arytmetyczne.
Urządzenia dekwantujące 25, 26, 27 realizują kompresję, która jest komplementarna do ekspansji realizowanej w urządzeniach kwantujących 14, 15, 16. Urządzenie dekwantujące kompresujące jest realizowane przy użyciu funkcji dekwantowania nierównomiernego albo przy użyciu funkcji dekwantowania równomiernego, po której następuje funkcja kompresji. Dekwantowanie nierównomierne i równomierne są realizowane na przykład przez przeszukiwanie tablicy. Dekwantowanie równomierne jest realizowane w procesie, który jedynie dołącza odpowiednią liczbę bitów do kwantowanej wartości. Te dołączone bity mogą wszystkie mieć wartość zerową albo też mogą mieć inną wartość, taką jak próbki z pseudoprzypadkowego sygnału szumu.
PL 207 862 B1
Kompresji nie należy przeprowadzać w całym zakresie wartości, jeżeli urządzenia kwantujące
14, 15, 16 nie zapewniają ekspansji w całym zakresie wartości.
Sterownik 24 dekwantowania przeprowadza zasadniczo dowolny żądany rodzaj przetwarzania. Jednym przykładem jest tu proces, który stosuje model psychoakustyczny dla informacji otrzymanej z sygnału wejściowego, aby ocenić wyniki psychoakustycznego maskowania różnych składowych widmowych w sygnale fonii. Według innego przykładu wykonania sterownik 24 dekwantowania jest wyeliminowany, a urządzenia dekwantujące 25, 26, 27 stosują funkcje dekwantowania, które nie są dostosowywane albo stosują funkcje dekwantowania, które są dostosowywane w odpowiedzi na informacje sterowania dekwantowaniem, odbierane bezpośrednio z sygnału wejściowego przez urządzenie deformatujące 22.
Odbiornik przedstawiony na fig. 2 ma części składowe dla trzech podpasm częstotliwości. W typowym zastosowaniu stosuje się znacznie większą liczbę podpasm, lecz dla przejrzystości pokazano tylko trzy.
Zestaw filtrów 28 syntezy jest realizowany zasadniczo w dowolny żądany sposób obejmujący sposoby, które są odwrotnością technik omówionych powyżej w odniesieniu do zestawu filtrów 12 analizy. Zestawy filtrów syntezy, które są realizowane przez transformacje blokowe, syntezują sygnał wyjściowy z zestawu współczynników transformacji. Zestawy filtrów syntezy, które są realizowane przez pewien rodzaj filtru cyfrowego, taki jak filtr wielofazowy, zamiast transformacji blokowej syntezują sygnał wyjściowy z zestawu sygnałów podpasma. Każdy sygnał podpasma jest reprezentacją opartą na czasie dla zawartości widmowej sygnału wejściowego w danym podpasmie częstotliwości.
Urządzenia kwantujące 14, 15, 16 w wielu systemach kodowania fonii są urządzeniami kwantującymi kompresującymi, ponieważ kompresja poprawia sprawność kwantowania, co wyjaśniono poniżej.
Figura 3 przedstawia linię 31, która reprezentuje wartości składowe hipotetycznych sygnałów podpasm. Odcinki linii prostych łączą sąsiednie wartości dla przejrzystości ilustracji. Na tym i dalszych rysunkach przedstawiono tylko wartości dodatnie, chociaż omawiane tutaj zasady odnoszą się do wykonań, które mają dodatnie i ujemne wartości składowe. Wartości składowe są normalizowane lub skalowane względem wartości największej składowej w sygnale podpasma. Osiem poziomów kwantowania obejmuje znormalizowany zakres wartości od zera do jedności.
Figura 4A przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału podpasma w linii 31 wykorzystującej funkcję kwantowania równomiernego, taką jak funkcja pokazana na fig. 7, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Dodatnie poziomy kwantowania są reprezentowane przez 3-bitową liczbę binarną. Wartości składowych, które są kwantowane do poziomów poniżej poziomu 4, są kwantowane nieskutecznie, ponieważ te poziomy kwantowania mogłyby być reprezentowane tylko przez dwa bity. W rezultacie jeden bit jest tracony dla każdej składowej sygnału, która jest kwantowana poniżej poziomu 4.
Figura 4B przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału podpasma w linii 31 wykorzystującej funkcję kwantowania z kompresją, przedstawioną na fig. 5, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Urządzenie kwantujące kompresujące ma większą sprawność kwantowania niż urządzenie kwantujące równomiernie, ponieważ mniej składowych sygnału jest kwantowanych poniżej poziomu 4. Urządzenie kwantujące kompresujące jest realizowane przez funkcję kwantowania nierównomiernego, taką jak funkcja pokazana na fig. 5 albo też jest realizowane przez funkcję kompresowania, taką jak funkcja pokazana na fig. 6, a następnie przez urządzenie kwantujące równomiernie, pokazane na fig. 7. Linia 32 na fig. 3 reprezentuje wartości sygnałów linii 31 po kompresji za pomocą funkcji pokazanej na fig. 6.
Dokładność kwantowania urządzenia kwantującego kompresującego nie jest równomierna dla wszystkich wartości wejściowych. Dokładność kwantowania dla przedziału małych wartości jest większa niż dokładność kwantowania dla sąsiedniego przedziału większych wartości.
Kompresja zmienia statystyczny rozkład próbek sygnałów podpasm przez zmniejszanie dynamicznego zakresu wartości. Kompresja połączona z normalizacją lub skalowaniem zwiększa dokładność wielu mniejszych wartości przez wtłaczanie tych wartości w wyższe poziomy kwantowania, które skutecznie wykorzystują więcej bitów. Procesy ekspansji i odwrotnego skalowania są używane w odbiorniku, aby usunąć wyniki działania skalowania i kompresji. Funkcja kompresji pokazana na fig. 6 jest funkcją wykładniczą w postaci y = c(x) = xn (1a)
PL 207 862 B1 gdzie c(x) - funkcja kompresji argumentu x, y - wartość skompresowana, n -dodatnia wartość rzeczywista mniejsza niż jeden.
Komplementarna funkcja ekspansji jest pokazana na fig. 8 i ma postać x = e(y) = y1/n (1b) gdzie e(y) - funkcja ekspansji argumentu y.
Innym przykładem funkcji kompresji i ekspansji są funkcje o postaci y = c(x) = logb(x) (2a) x = e(y) = by (2b)
W tradycyjnych systemach kodowania stosuje się wiele postaci funkcji kompresji i ekspansji, przy czym w systemach kodowania może być wykorzystywana każda postać, która zawiera aspekty wynalazku.
Niektóre zastosowania, takie jak przesyłanie fonii w publicznych sieciach komputerowych, wymagają przesyłania kodowanych cyfrowo sygnałów fonii z szybkością transmisji danych, która jest tak mała, że wszystkie ważniejsze składowe sygnału nie mogą być kwantowane z dokładnością wystarczającą do zapewnienia maskowania szumu kwantowania.
Przeprowadzono wiele prób opracowania systemów kodowania z bardzo małą szybkością transmisji danych, aby zapewnić dobrze brzmiący sygnał akustyczny przez kodowanie i przesyłanie sygnału pasma podstawowego, reprezentującego tylko część szerokości pasma sygnału wejściowego i przez wykorzystywanie technik odtwarzania brakują cych części pasma podczas odtwarzania fonii. Zwykle składowe wysokiej częstotliwości są wykluczane z sygnału pasma podstawowego i są regenerowane podczas odtwarzania. Technika ta polega na pobieraniu bitów, które mogły być wykorzystywane do kodowania składowych wielkiej częstotliwości i wykorzystuje te bity do zwiększania dokładności kwantowania składowych małej częstotliwości.
Ta technika pasma podstawowego/regeneracji nie dała zadowalających wyników. Wiele wysiłków przy polepszaniu jakości tego rodzaju systemu kodowania o bardzo małej szybkości transmisji danych miało na celu polepszenie techniki regeneracji. Jednak znane techniki regeneracji widma nie działają zbyt dobrze, ponieważ bity nie są optymalnie przypisywane składowym widmowym z co najmniej dwóch powodów.
Pierwszym powodem jest to, że sygnał pasma podstawowego jest zbyt wąski. Powoduje to zabieranie bitów ze wszystkich składowych sygnału poza sygnałem pasma podstawowego, łącznie z ważnymi składowymi o duż ej wartości, aby kodować składowe sygnału wewnątrz pasma podstawowego, zawierające nieważne składowe o małej wartości. Sygnał pasma podstawowego powinien mieć szerokość pasma w przybliżeniu 5 kHz lub więcej. Niestety, w wielu zastosowaniach o bardzo małej szybkości transmisji danych, ograniczenia szybkości transmisji danych są tak silne, że w przybliżeniu tylko jeden bit może być przesyłany dla każdej składowej widmowej sygnału w ramach szerokości pasma 5 kHz. Ponieważ jeden bit na współczynnik widmowy nie wystarcza do umożliwienia odtwarzania sygnału wyjściowego o wysokiej jakości, znane systemy kodowania zmniejszają szerokość pasma sygnału pasma podstawowego znacznie poniżej 5 kHz, tak że pozostałe składowe sygnału w węższym sygnale pasma podstawowego mogą być kwantowane z większą dokładnością.
Drugim powodem jest to, że zbyt wiele bitów jest przypisywanych składowym sygnału w sygnale pasma podstawowego, które mają małą wartość. Na skutek tego bity są zabierane z ważnych składowych o dużej wartości, aby kodować dokładniej nieważne składowe o małej wartości. Problem ten jest zaostrzany w systemach kodujących, które wykorzystują urządzenie kwantujące skalujące i kompresujące, ponieważ skalowanie i dekompresja wtłaczają wartości małych składowych na wyższe poziomy kwantowania, co omówiono powyżej.
Problemy powodowane przez każdą z tych przyczyn są zmniejszane przez wtłaczanie mniej ważnych, małowartościowych składowych sygnału do zakresu wartości, które są kwantowane przy mniejszej liczbie poziomów kwantowania. Proces ten zmniejsza dokładność kwantowania składowych o małej wartoś ci, lecz zmniejsza również entropię składowych sygnału o małej wartości po kwantowaniu do poziomu, który jest mniejszy niż entropia bez takiego wtłaczania. Wszystkie składowe sygnały są kodowane entropowo do kodu, który reprezentuje mniej ważne składowe sygnału o małej wartości za pomocą mniejszej liczby bitów niż byłoby to możliwe bez wtłaczania ich do mniejszej liczby poziomów kwantowania, a pozostałe bity są wykorzystywane do dokładniejszego kwantowania innych składowych sygnału. Liczba składowych sygnału, które są wtłaczane do mniejszej liczby poziomów kwantowania, jest sterowana za pomocą urządzenia kwantującego ekspandującego.
PL 207 862 B1
Figura 4C przedstawia graficznie ośmiopoziomowe kwantowanie składowych sygnału pasma podstawowego w linii 31 przy użyciu funkcji kwantowania z ekspansją, pokazanej na fig. 9, która zaokrągla wartości składowych sygnału do najbliższego poziomu kwantowania. Urządzenie kwantujące ekspandujące ma mniejszą sprawność kwantowania niż urządzenie kwantujące równomiernie, ponieważ więcej składowych sygnału kwantowane jest poniżej poziomu 4. Urządzenie kwantujące ekspandujące jest realizowane przez funkcję kwantowania nierównomiernego, jak pokazana na fig. 9 albo też jest realizowane przez funkcję ekspansji, taka jak funkcja pokazana na fig. 8, a następnie przez urządzenie kwantujące równomiernie, pokazane na fig. 7. Linia 33 na fig. 3 reprezentuje wartości sygnału w linii 31 po ekspandowaniu za pomocą funkcji pokazanej na fig. 8.
Dokładność kwantowania urządzenia kwantującego ekspandującego nie jest równomierna dla wszystkich wartości wejściowych, mianowicie dokładność kwantowania dla przedziału małych wartości jest mniejsza niż dokładność kwantowania dla sąsiedniego przedziału większych wartości.
Kompresję i proces odwrotnego skalowania stosuje się w odbiorniku w celu odwrócenia wyników otrzymanych przez ekspansję i skalowanie.
Ekspansja zmienia statystyczny rozkład próbek sygnału podpasma przez zwiększanie zakresu dynamiki wartości. Ekspansja połączona z normalizacją lub skalowaniem zmniejsza dokładność wielu mniejszych wartości przez wtłaczanie tych wartości na niższe poziomy kwantowania. Większa liczba składowych sygnału o mniejszej wartości jest przykładowo spychana na poziom kwantowania 0. Przez zwiększenie liczby składowych sygnału, które są kwantowane do niskich poziomów kwantowania, obejmujących składowe sygnału kwantowane do zera QTZ oraz przez zastosowanie kodu, który reprezentuje skutecznie te mniejsze składowe i składowe kwantowane do zera, więcej bitów jest do dyspozycji przy dokładniejszym kwantowaniu składowych sygnału o większej wartości.
Na skutek tego ekspansję i kwantowanie wykorzystuje się do identyfikacji ważnych składowych sygnału w szerszym pasmie dla dokładniejszego kodowania. Optymalizuje to przypisywanie bitów tak, że z sygnału kodowanego z bardzo małą szybkością transmisji danych można regenerować sygnał o lepszej jakości.
Urządzenia kwantujące mogą zapewniać ekspansję tylko części całego zakresu wartości, które mają być kwantowane. Ekspansja jest ważna dla mniejszych wartości. W razie potrzeby urządzenia kwantujące mogą również zapewniać kompresję składowych sygnału, takich jak składowe o mniejszych wartościach.
Figura 10 przedstawia funkcję kwantowania 42, która zapewnia ekspansję i kompresję według funkcji 41. Ekspansja jest zapewniana dla wartości mniejszych, a kompresja jest zapewniana dla wartości większych. Ani ekspansji, ani kompresji nie stosuje się wobec wartości średnich.
Stopień ekspansji i kompresji jest dostosowywany do dowolnych lub wszystkich warunków obejmujących właściwości sygnału, liczbę bitów, które są dostępne do kodowania kwantowanych składowych sygnału i bliskości względem dominujących składowych o dużej wartości. Przykładowo większa ekspansja jest zwykle potrzebna dla podobnych do szumu sygnałów podpasma, które mają stosunkowo płaskie widmo. Mniejsza ekspansja jest potrzebna, jeżeli stosunkowo duża liczba bitów jest dostępna do kodowania. Mniejszą ekspansję należy stosować wobec składowych sygnału, które są usytuowane blisko dominujących składowych sygnału o dużej wartości. Informacje o tym, jak ekspansja i kompresja są dostosowane, powinny być przekazywane do odbiornika, aby mógł on zastosować swe procesy komplementarne.
Każde urządzenie kwantujące 14, 15, 16 może wykorzystywać takie same lub inne funkcje ekspansji i funkcje kwantowania. Ponadto urządzenie kwantujące dla określonego sygnału podpasma może być dostosowane lub zmienione w sposób niezależny lub przynajmniej odmienny od tego, jak to ma miejsce w urządzeniach kwantujących innych sygnałów podpasma. Ponadto ekspansja nie musi być przeprowadzana dla wszystkich sygnałów podpasma.
Koder 17 stosuje kodowanie entropowe wobec kwantowanych składowych sygnału, aby zmniejszyć wymagania dotyczące pojemności informacji. W wielu znanych systemach kodowania stosuje się kodowanie Huffmana, lecz nie jest ono dobrze dostosowane do użycia w wielu systemach o bardzo małej szybkości transmisji danych z co najmniej dwóch powodów.
Pierwszy powód wynika z faktu, że kody Huffmana są złożone z całkowitej liczby bitów, a najkrótszy kod ma długość jednego bitu. Kodowanie Huffmana wykorzystuje najkrótszy kod dla kwantowanego symbolu o największym prawdopodobieństwie występowania. Rozsądnie jest przyjąć, że najbardziej prawdopodobną kwantowaną wartością do kodowania jest zero, ponieważ wynalazek ma na celu zwiększenie liczby składowych sygnału kwantowanych do zera w sygnałach podpasm. WynaPL 207 862 B1 lazek może znacznie polepszyć jakość sygnału w systemach o bardzo małej szybkości transmisji danych, jeżeli składowe kwantowane do zera mogą być reprezentowane przez kody o długości mniejszej niż jeden bit.
Mniejsze skuteczne długości kodu można uzyskać, stosując kodowanie Huffmana z wielowymiarowymi książkami kodów. Dzięki temu kodowanie Huffmana stosuje kod o długości jednego bitu do reprezentowania wielokrotnie kwantowanych wartości. Przykładowo, dwuwymiarowa książka kodów umożliwia reprezentowanie przez kod jednobitowy dwóch wartości. Niestety, kodowanie wielowymiarowe nie jest zbyt skuteczne dla większości sygnałów podpasm i potrzebna jest znaczna pojemność pamięci do przechowywania książki kodów. Kodowanie Huffmana może przełączać się adaptacyjnie pomiędzy jedno- i wielowymiarowymi książkami kodów, lecz w kodowanym sygnale potrzebne są bity kontrolne, aby określić, która książka kodów jest stosowana do kodowania części sygnału. Takie bity kontrolne zmniejszają korzyści osiągnięte przez stosowanie wielowymiarowych książek kodów.
Drugim powodem, dla którego kodowanie Huffmana nie jest właściwe w wielu systemach kodowania o bardzo małej szybkości transmisji danych, jest to, że sprawność kodowania jest bardzo wrażliwa na właściwości statystyczne sygnału względem kodu. Jeżeli stosuje się książkę kodów, która jest przeznaczona do wartości kodu mających statystykę bardzo różniącą się od statystyki wartości sygnału rzeczywiście kodowanego, kodowanie Huffmana może być niekorzystne wskutek zwiększenia wymaganej pojemności informacji dla kodowanego sygnału. Problem ten można zmniejszyć przez wybranie najlepszej książki kodów z zestawu książek kodów, lecz potrzebne są bity kontrolne identyfikujące stosowaną książkę kodów. Takie bity kontrolne zmniejszają korzyści osiągnięte przez użycie wielu książek kodu.
Różne techniki kodowania, takie jak kodowanie grupowe, można stosować oddzielnie lub w połączeniu z innymi formami kodowania. Jednak w korzystnym przykładzie wykonania stosuje się kodowanie arytmetyczne, ponieważ może być ono samoczynnie dostosowywane do aktualnej statystyki sygnału i nadaje się do generowania krótszych kodów niż to jest często możliwe w przypadku kodowania Huffmana.
Proces kodowania arytmetycznego przeprowadza obliczenie liczby rzeczywistej w niedomkniętym przedziale [0,1), aby reprezentować wiadomość złożoną z jednego lub wielu symboli. W tym kontekście symbolem jest kwantowana wartość składowej sygnału, a wiadomością jest zbiór poziomów kwantowania dla wielu składowych sygnału. Alfabetem jest zestaw wszystkich możliwych symboli lub kwantowanych wartości, jakie mogą wystąpić w wiadomości. Liczba symboli w wiadomości, która może być reprezentowana przez liczbę rzeczywistą, jest ograniczona przez dokładność liczby rzeczywistej, która jest wyrażana przez koder. Liczba symboli reprezentowanych przez kod liczby rzeczywistej jest dostarczana do dekodera.
Jeżeli M oznacza liczbę symboli w alfabecie, wówczas etapy jednego procesu kodowania arytmetycznego są następujące:
1. Dzielenie przedziału [0,1) na M segmentów, z których każdemu odpowiada określony symbol w alfabecie. Segment przypisany odpowiedniemu symbolowi ma długość proporcjonalną do prawdopodobieństwa wystąpienia tego symbolu.
2. Otrzymywanie pierwszego symbolu z wiadomości i wybieranie odpowiedniego segmentu.
3. Dzielenie wybranego segmentu na M segmentów w sposób podobny, jak w etapie 1. Każdy segment odpowiada symbolowi w alfabecie i ma długość proporcjonalną do prawdopodobieństwa wystąpienia tego symbolu.
4. Otrzymywanie następnego symbolu z wiadomości i wybieranie odpowiedniego segmentu.
5. Przeprowadzanie dalej etapów 3 i 4, aż cała wiadomość zostanie zakodowana lub aż do osiągnięcia granicy dokładności.
6. Generowanie najkrótszej możliwej części binarnej, która reprezentuje dowolną liczbę w ostatnim wybranym segmencie.
Figura 11 przedstawia ten proces przy zastosowaniu do wiadomości z czterech symboli 1300 w alfabecie z czterech symboli, które reprezentują cztery poziomy kwantowania 0, 1, 2 i 3. Prawdopodobieństwa wystąpienia każdego z tych symboli wynoszą odpowiednio 0,55, 0,20, 0,15 i 0,10.
Pierwszy prostokąt po lewej stronie rysunku przedstawia etap 1, w którym niedomknięty przedział [0,1) jest dzielony na cztery segmenty dla każdego symbolu z alfabetu, o długości proporcjonalnej do prawdopodobieństwa wystąpienia poszczególnych symboli.
W etapie 2 z wiadomoś ci sygnał u podpasma otrzymuje się pierwszy symbol reprezentują cy poziom kwantowania 1 i wybiera się odpowiedni niedomknięty przedział [0,55, 0,75).
PL 207 862 B1
Drugi prostokąt usytuowany po prawej stronie pierwszego prostokąta reprezentuje etap 3, w którym wybrany segment jest dzielony na cztery segmenty dla każ dego symbolu w alfabecie.
W etapie 4 z wiadomoś ci otrzymuje się drugi symbol reprezentują cy poziom kwantowania 3 i wybiera się odpowiedni niedomknięty przedział [0,73, 0,75).
Etap 5 wielokrotnie powtarza etapy 3 i 4. Trzeci prostokąt usytuowany po prawej stronie drugiego prostokąta przedstawia wielokrotne powtarzanie etapu 3, w którym poprzednio wybrany segment zostaje podzielony na cztery segmenty dla każdego symbolu w alfabecie.
Przy wielokrotnym powtarzaniu etapu 4, z wiadomości otrzymuje się trzeci symbol reprezentujący poziom kwantowania 0 i wybiera się odpowiedni niedomknięty przedział [0,730, 0,741).
Etap 5 ponownie wielokrotnie powtarza etapy 3 i 4. Czwarty prostokąt po prawej stronie rysunku przedstawia wielokrotne powtarzanie etapu 3, w którym poprzednio wybrany segment zostaje podzielony na cztery segmenty dla każdego symbolu w alfabecie.
Przy wielokrotnym powtarzaniu etapu 4, z wiadomości otrzymuje się czwarty i ostatni symbol reprezentujący poziom kwantowania 0 i wybiera się odpowiedni niedomknięty przedział [0,73000, 0,73605).
Po dojściu do końca wiadomości w etapie 6 jest wytwarzany najkrótszy możliwy ułamek binarny, który reprezentuje pewną liczbę w ostatnim wybranym segmencie. Wytwarzany jest sześciobitowy binarny ułamek 0,1011112 = 0,73437510.
Opisany powyżej proces kodowania wymaga pewnego rozkładu prawdopodobieństwa dla alfabetu symboli, a informacje o tym rozkładzie muszą zostać w pewien sposób przekazane do dekodera. Jeżeli rozkład prawdopodobieństwa zmienia się, wówczas proces kodowania przestaje być optymalny. Koder 17 może obliczać nowy rozkład na podstawie aktualnego prawdopodobieństwa symboli otrzymywanych do kodowania. Obliczanie to przeprowadza się w sposób ciągły, gdy każdy symbol jest otrzymywany z wiadomości, albo też przeprowadza się z mniejszą częstością. Dekoder 23 przeprowadza takie same obliczenia i utrzymuje swój rozkład w synchronizacji z koderem 17. Proces kodowania może rozpoczynać się przy dowolnym żądanym rozkładzie prawdopodobieństwa.
Różne przykłady wykonania wynalazku są realizowane wieloma różnymi sposobami, obejmującymi oprogramowanie uniwersalnego systemu komputerowego albo w urządzeniach, które zawierają wyspecjalizowane części składowe, takie jak procesor sygnałów cyfrowych dołączony do części składowych podobnych do stosowanych w uniwersalnym systemie komputerowym.
Figura 12 przedstawia schemat blokowy urządzenia 70 do realizacji różnych przykładów wykonania wynalazku w nadajniku kodowania fonii lub w odbiorniku dekodowania fonii. Procesor 72 sygnałów cyfrowych zapewnia zasoby obliczeniowe. Pamięć 73 o dostępie swobodnym RAM jest wykorzystywana przez procesor 72 przetwarzający sygnały. Pamięć stała 74 ROM służy do przechowywania programów potrzebnych do działania urządzenia 70. Zespół sterowania 75 wejścia/wyjścia jest interfejsem do odbioru i nadawania sygnałów poprzez kanały telekomunikacyjne 76, 77. W zespole sterowania 75 wejścia/wyjścia są stosowane, w zależności od potrzeb, przetworniki analogowo-cyfrowe i przetworniki cyfrowo-analogowe do odbioru i/lub nadawania analogowych sygnałów fonii. Wszystkie główne części składowe systemu są dołączone do magistrali 71, która może stanowić więcej niż jedną magistralę fizyczną.
W przykładach realizowanych w uniwersalnym systemie komputerowym mogą być zawarte dodatkowe części składowe do sprzęgania z urządzeniami, takimi jak klawiatura lub mysz i monitor, oraz do sterowania pamięcią zawierającą nośnik, taki jak taśma magnetyczna lub dysk magnetyczny albo nośnik optyczny. Nośnik pamięci jest wykorzystywany do zapisywania programów złożonych z poleceń dla systemów operacyjnych, programów narzędziowych i programów użytkowych oraz może zawierać przykłady wykonania programów, które realizują różne aspekty wynalazku.
Funkcje potrzebne do praktycznego wykonania wynalazku mogą być również wykonywane przez części składowe specjalnego przeznaczenia, które są realizowane w różny sposób, w tym jako dyskretne, logiczne części składowe, jeden lub więcej układów scalonych specjalnego przeznaczenia i/lub procesorów sterowanych programowo.
Realizacje programowe wynalazku są przeprowadzane za pomocą wielu różnych nośników czytelnych dla komputera, takich jak tory łączności w paśmie podstawowym lub z modulacją w całym widmie, obejmującym częstotliwości od naddźwiękowych do ultrafioletowych, albo nośniki pamięci obejmujące te nośniki, które przenoszą informacje, wykorzystując dowolną technikę zapisu magnetycznego lub optycznego, łącznie z taśmą magnetyczną, dyskiem magnetycznym i dyskiem optycznym. Różne aspekty wynalazku są realizowane w różnych częściach składowych urządzenia 70 przez
PL 207 862 B1 układy przetwarzania, takie jak układy scalone specjalnego przeznaczenia, uniwersalne układy scalone, mikroprocesory sterowane przez programy zawarte w różnych pamięciach stałych lub pamięciach o dostępie swobodnym oraz przy użyciu innych technik.
Claims (14)
1. Nadajnik kodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, do odbioru sygnału wejściowego, reprezentującego sygnał akustyczny i generowania sygnału wyjściowego, niosącego kodowaną reprezentację sygnału akustycznego, zawierający zestaw filtrów analizy do generowania wielu sygnałów podpasm, reprezentujących podpasma częstotliwości sygnału akustycznego w odpowiedzi na sygnał wejściowy, przy czym każdy sygnał podpasma zawiera jedną lub więcej składowych sygnału podpasma, znamienny tym, że do zestawu filtrów analizy jest dołączone urządzenie kwantujące do kwantowania jednego lub więcej sygnałów podpasma dla generowania kwantowanych sygnałów podpasma, do urządzenia kwantującego jest dołączony koder dla generowania jednego lub więcej kodowanych sygnałów podpasma przez kodowanie jednego lub więcej kwantowanych sygnałów podpasma przy użyciu procesu kodowania entropowego, zmniejszającego wymaganą pojemność informacyjną kwantowanych sygnałów podpasma oraz do kodera jest dołączone urządzenie formatujące do zestawiania jednego lub więcej kodowanych sygnałów podpasma w sygnał wyjś ciowy, przy czym urzą dzenie kwantują ce ma elementy do wtł aczania drugich skł adowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
2. Nadajnik według zastrz. 1, znamienny tym, że zestaw filtrów analizy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
3. Nadajnik według zastrz. 1 albo 2, znamienny tym, że urządzenie kwantujące zawiera ekspander, który ma wejście dołączone do zestawu filtrów analizy i wyjście, do którego jest dołączone wejście urządzenia kwantującego równomiernie, którego wyjście jest dołączone do kodera.
4. Nadajnik według zastrz. 1 albo 2, znamienny tym, że urządzenie kwantujące jest urządzeniem kwantującym nierównomiernie.
5. Nadajnik według zastrz. 1 albo 2, znamienny tym, że koder jest koderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
6. Nadajnik według zastrz. 1 albo 2, znamienny tym, że koder jest koderem z kodowaniem arytmetycznym.
7. Nadajnik według zastrz. 1, znamienny tym, że urządzenie kwantujące jest dostosowane do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
8. Odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji, do odbioru sygnału wejściowego, niosący kodowaną reprezentację sygnału akustycznego i generowania sygnału wyjściowego, reprezentującego sygnał akustyczny, zawierający urządzenie deformatujące do odbioru jednego lub więcej kodowanych sygnałów podpasma z sygnału wejściowego, do urządzenia deformatującego jest dołączony dekoder do generowania jednego lub więcej dekodowanych sygnałów podpasma przez dekodowanie jednego lub więcej kodowanych sygnałów podpasma przy użyciu procesu dekodowania entropowego, zwiększającego wymaganą pojemność informacyjną kodowanych sygnałów podpasma, przy czym każdy dekodowany sygnał podpasma zawiera jedną lub więcej składowych sygnału podpasma i reprezentuje odpowiednie podpasmo częstotliwości sygnału akustycznego, znamienny tym, że do dekodera jest dołączone urządzenie dekwantujące dla generowania jednego lub więcej dekwantowanych sygnałów podpasma przez dekwantowanie składowych sygnału podpasma dla jednego lub więcej dekodowanych sygnałów podpasma oraz do urządzenia dekwantującego jest dołączony zestaw filtrów syntezy do generowania sygnału wyjściowego w odpowiedzi na wiele sygnał ów podpasma, zawierają cych jeden lub wię cej dekwantowanych sygnałów podpasma, przy czym urządzenie dekwantujące jest komplementarne do urządzenia kwantującego i ma elementy do wtłaczania drugich składowych sygnału podpasma, mających wartości mniejsze niż pierwsze składowe sygnału podpasma, do zakresu wartości kwantowanych do kilku poziomów kwantowania.
PL 207 862 B1
9. Odbiornik według zastrz. 8, znamienny tym, że zestaw filtrów syntezy stanowi zestaw filtrów mający jedną lub więcej transformat ze współczynnikami transformacji określonymi przez składowe sygnału podpasma.
10. Odbiornik według zastrz. 8 albo 9, znamienny tym, że urządzenie dekwantujące zawiera urządzenie dekwantujące równomiernie, które ma wejście dołączone do dekodera i wyjście, do którego jest dołączone wejście kompresora, którego wyjście jest dołączone do zestawu filtrów syntezy.
11. Odbiornik według zastrz. 8 albo 9, znamienny tym, że urządzenie dekwantujące jest urządzeniem dekwantującym nierównomiernie.
12. Odbiornik według zastrz. 8 albo 9, znamienny tym, że dekoder jest dekoderem dostosowanym do statystyki kodowanych kwantowanych sygnałów podpasma.
13. Odbiornik według zastrz. 8 albo 9, znamienny tym, że dekoder jest dekoderem z kodowaniem arytmetycznym.
14. Odbiornik według zastrz. 8, znamienny tym, że urządzenie dekwantujące jest komplementarne do urządzenia kwantującego, dostosowanego do zakresu wartości wtłaczania drugich składowych sygnału podpasma w odpowiedzi na wartości składowych sygnału podpasma.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/198,638 US7043423B2 (en) | 2002-07-16 | 2002-07-16 | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
Publications (2)
Publication Number | Publication Date |
---|---|
PL373045A1 PL373045A1 (pl) | 2005-08-08 |
PL207862B1 true PL207862B1 (pl) | 2011-02-28 |
Family
ID=30115160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL373045A PL207862B1 (pl) | 2002-07-16 | 2003-07-08 | Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji |
Country Status (16)
Country | Link |
---|---|
US (1) | US7043423B2 (pl) |
EP (1) | EP1537562B1 (pl) |
JP (1) | JP4786903B2 (pl) |
KR (1) | KR101019678B1 (pl) |
CN (1) | CN100367348C (pl) |
AT (1) | ATE360250T1 (pl) |
AU (1) | AU2003253854B2 (pl) |
CA (1) | CA2492647C (pl) |
DE (1) | DE60313332T2 (pl) |
HK (1) | HK1073916A1 (pl) |
IL (1) | IL165869A (pl) |
MX (1) | MXPA05000653A (pl) |
MY (1) | MY137149A (pl) |
PL (1) | PL207862B1 (pl) |
TW (1) | TWI315944B (pl) |
WO (1) | WO2004008436A1 (pl) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
CA2499212C (en) * | 2002-09-17 | 2013-11-19 | Vladimir Ceperkovic | Fast codec with high compression ratio and minimum required resources |
US7610553B1 (en) * | 2003-04-05 | 2009-10-27 | Apple Inc. | Method and apparatus for reducing data events that represent a user's interaction with a control interface |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004027146B4 (de) * | 2004-06-03 | 2014-10-30 | Unify Gmbh & Co. Kg | Verfahren und Vorrichtung zum automatischen Festlegen von zu Codeworten gehörenden Wertebereichsgrenzen für Abtastwerte |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
HUE043155T2 (hu) * | 2006-07-04 | 2019-08-28 | Dolby Int Ab | Szûrõátalakítót és szûrõkrompresszort tartalmazó szûrõrendszer, és eljárás a szûrõrendszer mûködtetésére |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101400484B1 (ko) | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US20100106269A1 (en) * | 2008-09-26 | 2010-04-29 | Qualcomm Incorporated | Method and apparatus for signal processing using transform-domain log-companding |
MX2011003824A (es) * | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
EP2315358A1 (en) | 2009-10-09 | 2011-04-27 | Thomson Licensing | Method and device for arithmetic encoding or arithmetic decoding |
ES2453098T3 (es) | 2009-10-20 | 2014-04-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Códec multimodo de audio |
US8280729B2 (en) * | 2010-01-22 | 2012-10-02 | Research In Motion Limited | System and method for encoding and decoding pulse indices |
US8989884B2 (en) * | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
KR20140117931A (ko) | 2013-03-27 | 2014-10-08 | 삼성전자주식회사 | 오디오 디코딩 장치 및 방법 |
US9786286B2 (en) * | 2013-03-29 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
JP5969727B2 (ja) * | 2013-04-29 | 2016-08-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 動的閾値を用いた周波数帯域圧縮 |
EP3195507B1 (en) * | 2014-09-19 | 2021-01-20 | Telefonaktiebolaget LM Ericsson (publ) | Methods for compressing and decompressing iq data, and associated devices |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3353783B1 (en) * | 2015-09-25 | 2019-12-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding |
US10861475B2 (en) | 2015-11-10 | 2020-12-08 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
CN110992672B (zh) * | 2019-09-25 | 2021-06-29 | 广州广日电气设备有限公司 | 红外遥控器学习及编码方法、红外遥控器系统及存储介质 |
DE102022200893A1 (de) * | 2022-01-27 | 2023-07-27 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zur Codierung und Decodierung von Daten |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3684838A (en) | 1968-06-26 | 1972-08-15 | Kahn Res Lab | Single channel audio signal transmission system |
US4272648A (en) * | 1979-11-28 | 1981-06-09 | International Telephone And Telegraph Corporation | Gain control apparatus for digital telephone line circuits |
US4273970A (en) * | 1979-12-28 | 1981-06-16 | Bell Telephone Laboratories, Incorporated | Intermodulation distortion test |
GB8330885D0 (en) * | 1983-11-18 | 1983-12-29 | British Telecomm | Data transmission |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5054075A (en) | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
US5127021A (en) * | 1991-07-12 | 1992-06-30 | Schreiber William F | Spread spectrum television transmission |
US5394508A (en) | 1992-01-17 | 1995-02-28 | Massachusetts Institute Of Technology | Method and apparatus for encoding decoding and compression of audio-type data |
JP3527758B2 (ja) * | 1993-02-26 | 2004-05-17 | ソニー株式会社 | 情報記録装置 |
TW327223B (en) * | 1993-09-28 | 1998-02-21 | Sony Co Ltd | Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal |
JP3685823B2 (ja) * | 1993-09-28 | 2005-08-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
JPH0918348A (ja) * | 1995-06-28 | 1997-01-17 | Graphics Commun Lab:Kk | 音響信号符号化装置及び音響信号復号装置 |
JP3475985B2 (ja) * | 1995-11-10 | 2003-12-10 | ソニー株式会社 | 情報符号化装置および方法、情報復号化装置および方法 |
DE10010849C1 (de) * | 2000-03-06 | 2001-06-21 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Analysieren eines Analyse-Zeitsignals |
-
2002
- 2002-07-16 US US10/198,638 patent/US7043423B2/en not_active Expired - Fee Related
-
2003
- 2003-06-17 TW TW092116405A patent/TWI315944B/zh not_active IP Right Cessation
- 2003-07-08 KR KR1020057000587A patent/KR101019678B1/ko not_active IP Right Cessation
- 2003-07-08 AU AU2003253854A patent/AU2003253854B2/en not_active Ceased
- 2003-07-08 CN CNB038168332A patent/CN100367348C/zh not_active Expired - Fee Related
- 2003-07-08 CA CA2492647A patent/CA2492647C/en not_active Expired - Fee Related
- 2003-07-08 MX MXPA05000653A patent/MXPA05000653A/es active IP Right Grant
- 2003-07-08 DE DE60313332T patent/DE60313332T2/de not_active Expired - Lifetime
- 2003-07-08 WO PCT/US2003/021506 patent/WO2004008436A1/en active IP Right Grant
- 2003-07-08 AT AT03764416T patent/ATE360250T1/de not_active IP Right Cessation
- 2003-07-08 PL PL373045A patent/PL207862B1/pl unknown
- 2003-07-08 JP JP2004521594A patent/JP4786903B2/ja not_active Expired - Fee Related
- 2003-07-08 EP EP03764416A patent/EP1537562B1/en not_active Expired - Lifetime
- 2003-07-15 MY MYPI20032632A patent/MY137149A/en unknown
-
2004
- 2004-12-19 IL IL165869A patent/IL165869A/en not_active IP Right Cessation
-
2005
- 2005-08-01 HK HK05106539A patent/HK1073916A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
TW200406096A (en) | 2004-04-16 |
JP2005533280A (ja) | 2005-11-04 |
DE60313332D1 (de) | 2007-05-31 |
ATE360250T1 (de) | 2007-05-15 |
EP1537562B1 (en) | 2007-04-18 |
IL165869A0 (en) | 2006-01-15 |
US20040015349A1 (en) | 2004-01-22 |
KR20050021467A (ko) | 2005-03-07 |
CA2492647C (en) | 2011-08-30 |
CA2492647A1 (en) | 2004-01-22 |
CN100367348C (zh) | 2008-02-06 |
DE60313332T2 (de) | 2008-01-03 |
WO2004008436A1 (en) | 2004-01-22 |
HK1073916A1 (en) | 2006-01-20 |
CN1669072A (zh) | 2005-09-14 |
AU2003253854A1 (en) | 2004-02-02 |
JP4786903B2 (ja) | 2011-10-05 |
IL165869A (en) | 2010-06-30 |
MY137149A (en) | 2008-12-31 |
US7043423B2 (en) | 2006-05-09 |
EP1537562A1 (en) | 2005-06-08 |
AU2003253854B2 (en) | 2009-02-19 |
PL373045A1 (pl) | 2005-08-08 |
MXPA05000653A (es) | 2005-04-25 |
TWI315944B (en) | 2009-10-11 |
KR101019678B1 (ko) | 2011-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL207862B1 (pl) | Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji | |
US6058362A (en) | System and method for masking quantization noise of audio signals | |
US6029126A (en) | Scalable audio coder and decoder | |
KR100991450B1 (ko) | 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 | |
US6253165B1 (en) | System and method for modeling probability distribution functions of transform coefficients of encoded signal | |
EP1080462B1 (en) | System and method for entropy encoding quantized transform coefficients of a signal | |
JP3277692B2 (ja) | 情報符号化方法、情報復号化方法及び情報記録媒体 | |
US6011824A (en) | Signal-reproduction method and apparatus | |
KR20060121973A (ko) | 양자화 스텝 사이즈 결정 장치 및 방법 | |
JP2005338850A (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
PL207861B1 (pl) | Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji | |
US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
JPH0846518A (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
AU4227900A (en) | Using gain-adaptive quantization and non-uniform symbol lengths for audio coding | |
JPH08166799A (ja) | 高能率符号化方法及び装置 | |
JP3465698B2 (ja) | 信号復号化方法及び装置 |