PL174314B1 - Sposób i urządzenie do dekodowania sygnałów cyfrowych - Google Patents

Sposób i urządzenie do dekodowania sygnałów cyfrowych

Info

Publication number
PL174314B1
PL174314B1 PL94322680A PL32268094A PL174314B1 PL 174314 B1 PL174314 B1 PL 174314B1 PL 94322680 A PL94322680 A PL 94322680A PL 32268094 A PL32268094 A PL 32268094A PL 174314 B1 PL174314 B1 PL 174314B1
Authority
PL
Poland
Prior art keywords
signal
component
components
output
spectral
Prior art date
Application number
PL94322680A
Other languages
English (en)
Inventor
Kyoya Tsutsui
Mito Sonohara
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of PL174314B1 publication Critical patent/PL174314B1/pl

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

1. Sposób dekodowania sygnalów cyfro- wych, zwlaszcza do dekodowania zakodo- wanego sygnalu poddanego transformacji na skladowe czestotliwosciowe, z zastosowa- niem transformacji odwrotnej, znamienny tym, ze poddaje sie dekodowaniu znormali- zowany i zakodowany pierwszy sygnal za- wierajacy skladowe charakterystyki dzwieku i dekoduje sie drugi sygnal zawierajacy skla- dowe szumu, przeprowadza sie synteze po- szczególnych sygnalów i ich odwrotna transformacje, przy czym podczas dekodo- wania pierwszego sygnalu odtwarza sie ma- ksymalna skladowa czestotliwosciowa charakterystyki dzwieku, na podstawie trans- mitowanych wspólczynników normalizacji. F i g. 2 PL PL

Description

Przedmiotem wynalazku jest sposób i urządzenie do dekodowania sygnałów cyfrowych, zwłaszcza do dekodowania zakodowanego sygnału zawierającego informacje o wejściowych danych cyfrowych, który to zakodowany sygnał podlega następnie transmisji.
Znane sposoby dekodowania przyporządkowane są istniejącym wydajnym technikom kodowania sygnałów akustycznych lub sygnałów mowy i stanowią procesy odwrotne względem zastosowanych metod kodowania. Przykładem znanego kodowania jest kodowanie z podziałem pasma (Sub Band Coding - SBC), które jest nie blokującym podziału pasma częstotliwości
174 314 systemem dla dzielenia sygnału akustycznego w dziedzinie czasu na składowe sygnału w wielu pasmach częstotliwości w każdej założonej jednostce czasu, bez zaimplementowania blokowania dla ich zakodowania. Innym przykładem jest kodowanie transformacyjne, które jest systemem blokującym podział pasma częstotliwości, dzielącym sygnał w dziedzienie czasu na bloki w każdej założonej jednostce czasu dla przetransformowania odpowiednich sygnałów na odpowiednie bloki w dziedzinie częstotliwości (transformacja widmowa), dzieląc w ten sposób sygnały przetransformowane, na składowe sygnału w licznych pasmach częstotliwości dla zakodowania ich w każdym odpowiednim paśmie częstotliwości. Ponadto, znany jest również sposób wydajnego kodowania, w którym kodowanie dzielonego pasma i kodowanie transformacyjne są łączone. W tym przypadku, sygnał w dziedzinie czasu jest dzielony na sygnały w licznych pasmach przez wspomniane kodowanie podzielonego pasma, a następnie wykonywana jest transformacja widmowa sygnałów wszystkich pasm na sygnały w dziedzinie częstotliwości dla zrealizowania kodowania przetransformowanych widmowych sygnałów każdego pasma.
Do podziału pasma w sposobie kodowania dzielonego pasma lub w sposobie łączonego kodowania, stosuje filtry.
Transformacja widmowa jest realizowana również jako transformacja dzieląca wejściowy sygnał akustyczny na bloki w każdej założonej chwili czasu (ramce) w celu wykonania dyskretnej transformacji Fouriera DFT, dyskretnej transformacji kosinusowej DCT Iub zmodyfikowanej transformacji kosinusowej MDCT, na każdym odpowiednim bloku, przez co przekształca się sygnały z dziedziny czasu na sygnały w dziedzinie częstotliwości. Wspomniana zmodyfikowana dyskretna transformacja kosinusowa MDCT jest opisana w publikacji ICASP 1987, pt. Subband/Transform Coding Using Filter Bank Designs Based on Time Domain, Aliasing Cancellation, J.P. Princen A.B. Bradley Univ. of Surrey Royal Melbourne Inst, of Tech.
Dzięki kwantyzacji sygnałów każdego z oddzielnych pasm przez filtrową Iub widmową transformację w taki sposób, możliwe jest kontrolowanie pasm, w których mają miejsce szumy, oraz wykonywanie wydajniejszego kodowania pod względem zmysłu słuchu, poprzez zastosowanie maskowań. Ponadto, w przypadku, gdy realizuje się podejście polegające na wykonywaniu normalizacji, dla każdego odpowiedniego pasma, na przykład przez maksymalną wartość bezwzględnych wartości składowych sygnału w odpowiednich pasmach, przed zastosowaniem kwantyzacji, możliwe jest dalsze zwiększenie wydajności kodowania.
Ponadto, jako sposób wykonywania podziału pasma częstotliwości przez dzielenie szerokości pasma w celu kwantyzacji odpowiednich składowych oddzielnych pasm częstotliwości, wykorzystuje się podział pasma, w którym, np. brana jest pod uwagę charakterystyka słuchu człowieka. Mianowicie, istnieją przypadki, gdy sygnał akustyczny jest dzielony na składowe w licznych (np. 25) pasmach w taki sposób, że szerokość pasm rośnie wraz z przesuwaniem się w stronę większych częstotliwości. W takim przypadku, wykonywane jest kodowanie przez określony przydział bitów dla każdego pasma, Iub kodowanie przez elastyczny przydział bitów dla każdego pasma. Na przykład, kodowanie współczynnika danej uzyskanego po przetworzeniu w operacji zmodyfikowanej dyskretnej transformacji kosinusowej MDCT jest wykonywane przez elastyczny przydział bitów w zależności od współczynnika zmodyfikowanej dyskretnej transformacji kosinusowej MDCT danej dla każdego odpowiedniego pasma, uzyskanego z przetwarzania metodą zmodyfikowanej dyskretnej transformacji kosinusowej MDCT każdego odpowiedniego bloku.
Jako techniki przydziału bitów znane są dwie metody. Jedna z nich przedstawiona jest w publikacji IEEE Transactions of Acoustics, Speech, and Signal Processing, vol. ASSP-25, nr.4, sierpień 1977. Przydział bitów jest wykonywany na podstawie wielkości sygnałów każdego odpowiedniego pasma. Zgodnie z tym, widmo skwantowanego szumu staje się płaskie, a energia szumu minimalna. Jednakże, jeśli nie wykonuje się maskowania pod względem słyszalności, poziom szumu nie jest optymalny. Ponadto, w publikacji ICASSP 1980, pt. The criticlal band coder - digital encoding of perceptual requirements of auditory system, - M.A. Kransner MIT, opisany jest drugi sposób, w którym wykorzystuje się maskowanie charakterystyką słyszalności w celu uzyskania odpowiednich stosunków sygnał/szum dla każdego odpowiedniego pasma w celu wykonania stałego przydziału bitów. Jednakże, zgodnie z tym sposobem,, jeśli przydział
174 314 bitów jest ustalony, nawet jeśli mierzona jest charakterystyka wejściowej fali sinusoidalnej, wartości charakterystyki nie mogą osiągnąć tak dobrych wielkości.
W znanym z europejskiego zgłoszenia patentowego nr 0 525 809 A 2 urządzeniu kodującym wszystkie bity używane do przydziału są rozdzielane w postaci stałego wzoru przydziału bitów wyznaczonego wcześniej dla każdego odpowiedniego małego bloku, oraz w postaci bitów do wykonywania przydziału bitów w zależności od wielkości sygnałów odpowiednich bloków w celu umożliwienia, by ich stosunek zależał od wejściowego sygnału tak, że stosunek tych bitów do bitów stałego wzoru przydziału staje się większy wraz z tym, jak widmo sygnału staje się bardziej wyrównane. Zgodnie z tym rozwiązaniem, w przypadku, gdy energia koncentruje się przy pojedynczej składowej widma tak jak w przypadku fali sinusoidalnej, większa liczba bitów jest przydzielana do bloku zawierającego tę składową widma, przez co uzyskuje się możliwość wyraźnej poprawy całej charakterystyki sygnał/szum. Ponieważ charakterystyka słuchu człowieka jest szczególnie czuła na sygnały posiadające ostrą składową widma, poprawa charakterystyki sygnał/szum przez zastosowanie tej metody nie tylko wykazuje poprawę w cyfrowej wartości pomiaru, lecz również wydatnie poprawia jakość dźwięku z punktu widzenia charakterystyki słuchu.
Jeśli model odnoszący się do charakterystyki słuchu jest precyzyjniejszy i zwiększone są możliwości urządzenia kodującego, może być wykonywane wydajniejsze kodowanie z punktu widzenia charakterystyki słuchu.
Szum zawarty w sygnale akustycznym charakterystyki dźwięku, której energia składowych koncentruje się na określonych częstotliwościach, jest z reguły bardziej słyszalny w porównaniu z szumem w sygnale akustycznym, w którym energia jest równomiernie rozmieszczona w szerokim paśmie częstotliwości, przez co stanowi dużą przeszkodę w słuchaniu. Ponadto, jeśli składowe widmowe posiadające dużą energię, tzn. składowe charakterystyki dźwięku, nie są kwantowane z wystarczająco dobrą dokładnością, w przypadku gdy te składowe widmowe są ponownie przekształcane na sygnały falowe w dziedzinie czasu dla połączenia ich w bloki przed lub po tym przekształceniu, zniekształcenia pomiędzy blokami stają się duże i występują w połączeniu, gdy syntezowane są sygnały falowe sąsiednich bloków czasowych, co oczywiście znacznie przeszkadza prawidłowej słyszalności. Z tego powodu, przy kodowaniu składowych charakterystyki dźwięku, kwantyzacja musi być wykonywana z wystarczająco dużą liczbą bitów. Jednak w przypadku, gdy dokładności kwantyzacji są wyznaczane dla każdego założonego pasma częstotliwości, konieczny jest przydział w jednostkach kodujących wielu bitów dla dużej liczby składowych pasma, w których skład wchodzą składowe charakterystyki dźwięku, dla przeprowadzenia kwantyzacji, wynikiem czego jest niska wydajność kodowania. W związku z tym, poprawa wydajności kodowania bez pogarszania jakości dźwięku, w szczególności jeśli chodzi o sygnały akustyczne, jest trudna do wykonania tradycyjnymi sposobami.
Zgodnie ze znanym sposobem dekodowania sygnałów cyfrowych, transmitowany zakodowany sygnał poddany transformacji na składowe częstotliwościowe, poddaje się odwrotnej transformacji, przed którą przeprowadza się rozkład sekwencji kodu oraz dekodowanie składowych sygnału.
Znane urządzenie do dekodowania sygnałów cyfrowych poddanych w urządzeniu do kodowania transformacji na składowe częstotliwościowe, jest zaopatrzone w układ rozkładu sekwencji kodu, układ dekodowania poszczególnych składowych oraz układ transformacji odwrotnej do zastosowanej w urządzeniu do kodowania transmitowanego sygnału.
Sposób według wynalazku stosuje się do dekodowania sygnałów cyfrowych, zwłaszcza do dekodowania zakodowanego sygnału poddanego transformacji na składowe częstotliwościowe, z zastosowaniem transformacji odwrotnej. Sposób ten charakteryzuje się tym, że poddaje się dekodowaniu znormalizowany i zakodowany pierwszy sygnał zawierający składowe charakterystyki dźwięku i dekoduje się drugi sygnał zawierający składowe szumu, przeprowadza się syntezę poszczególnych sygnałów i ich odwrotną transformację. Podczas dekodowania pierwszego sygnału odtwarza się maksymalną składową częstotliwościową charakterystyki dźwięku, na podstawie transmitowanych współczynników normalizacji.
Korzystnymjest, że odwrotną transformację sygnałów przeprowadza się przed ich syntezą. Pierwszy sygnał zawiera składowe charakterystyki dźwięku zachodzące na siebie w dziedzinie
174 314 częstotliwości. Współczynniki normalizacji ustala się tak, że ze zmniejszaniem ich wartości wzrasta dokładność.
Urządzenie według wynalazku stosuje się do dekodowania sygnałów cyfrowych, zwłaszcza zakodowanego sygnału poddanego transformacji na składowe częstotliwościowe. Urządzenie to jest zaopatrzone w układ rozkładu sekwencji kodu, układ dekodowania poszczególnych składowych oraz układ transformacji odwrotnej. Urządzenie tego rodzaju charakteryzuje się tym, że z jednym wyjściem układu rozkładu sekwencji kodu, którego wejście jest połączone z nośnikiem zapisu danych poprzez głowicę odczytu, układ demodulacji danych EFM oraz dekoder wykrywania i korygowania błędów, jest połączony układ dekodowania składowych charakterystyki dźwięku, poprzez dekoder ze zmienną długością kodu. Z drugim wyjściem układu rozkładu sekwencji kodu jest połączony układ dekodowania składowych charakterystyki szumu. Wyjście układu dekodowania składowych charakterystyki dźwięku, wyjście układu dekodowania składowych charakterystyki szumu i trzecie wyjście układu rozkładu sekwencji kodu, są dołączone do wejść układu syntezy i transformacji.
Korzystnym jest, że wyjście układu dekodowania składowych charakterystyki dźwięku, wyjście układu dekodowania składowych charakterystyki szumu i trzecie wyjście układu rozkładu sekwencji kodu, są dołączone do bloku syntezy, którego wyjście jest dołączone do bloku odwrotnej transformacji, w układzie syntezy i transformacji.
W innym korzystnym rozwiązaniu wyjście układu dekodowania składowych charakterystyki dźwięku i trzecie wyjście układu rozkładu sekwencji kodu, są dołączone do jednego bloku odwrotnej transformacji, a wyjście układu dekodowania składowych charakterystyki szumu jest dołączone do drugiego bloku odwrotnej transformacji, przy czym wyjścia obydwu bloków odwrotnej transformacji są połączone z blokiem syntezy, w układzie syntezy i transformacji.
Przedmiot wynalazku w przykładach wykonania jest odtworzony na rysunku, na którym fig. 1 przedstawia schemat blokowy urządzenia do kodowania, fig.2 - schemat blokowy urządzenia według wynalazku, do dekodowania sygnału zakodowanego w urządzeniu z fig. 1, fig.3 sieć działań ilustrującą sposób przetwarzania sygnałów w układzie oddzielania składowych sygnału, fig. 4 - wykres widmowy wyjaśniający wydzielanie składowych charakterystyki dźwięku, fig. 5 - wykres przedstawiający składowe charakterystyki szumu, w którym składowe charakterystyki dźwięku są usunięte z pierwotnego widma sygnału przy kodowaniu sygnału, fig. 6 - wykres przykładu widma sygnału, fig. 7 - wykres widmowy sygnału będącego różnicą sygnału widmowego z fig. 6 i sygnału uzyskanego po zakodowaniu i zdekodowaniu jednej składowej charakterystyki dźwięku, fig. 8 - wykres wyjaśniający regułę transformacji widma składowych charakterystyki dźwięku, fig. 9 - schemat blokowy układu do kodowania charakterystyki dźwięku, fig. 10 - schemat blokowy układu do dekodowania charakterystyki dźwięku, fig. 11 - schemat wyjaśniający zapis sekwencji kodu uzyskanej na wyjściu systemu kodowania sygnału, fig. 12 - schemat blokowy znanego układu do kodowania sygnałów, fig. 13 - schemat blokowy znanego układu transformacji, fig. 14 - schemat blokowy znanego układu do kodowania składowej sygnału, fig. 15 - schemat blokowy znanego urządzenia do dekodowania, fig. 16 schemat blokowy znanego układu transformacji odwrotnej, fig. 17 - wykres widmowy wyjaśniający znany sposób kodowania, fig. 18 - schemat blokowy drugiego przykładu zespołu syntezy i odwrotnej transformacji, fig. 19 - schemat blokowy drugiego przykładu wykonania urządzenia do kodowania, fig. 20A - tabelę kodów pokazującą zasadę transformacji względem maksymalnego współczynnika widmowego, a fig. 20B przedstawia tabelę kodów pokazującą zasadę transformacji brzegowych współczynników widmowych w przypadku, gdy ta sama reguła transforacji została zastosowana do wszystkich składowych brzegowych.
Na fig. 1 przedstawiony jest schemat blokowy urządzenia do kodowania sygnałów cyfrowych, które omówione jest dla objaśnienia zasady kodowania sygnałów, które są dekodowane w przyporządkowany sposób dekodowania według wynalazku. Do zacisku wejściowego 600 jest doprowadzony sygnał w postaci fali akustycznej. Ta fala akustyczna jest transformowana na składowe częstotliwościowe sygnału w układzie transformacji 601, a sygnał wynikowy jest przesyłany do układu oddzielania składowych sygnału 602.
W układzie oddzielania składowych sygnału 602 składowe częstotliwościowe sygnału otrzymane z układu transformacji 601 są dzielone na składowe charakterystyki dźwięku posia6
174 314 dające ostry rozkład widma, oraz pozostałe składowe sygnału, tzn. składowe charakterystyki szumu, posiadające płaski rozkład widma. Składowe charakterystyki dźwięku są kodowane w układzie kodowania składowych charakterystyki dźwięku 603, a składowe charakterystyki szumu, które są pozostałymi składowymi charakterystyki sygnału, są kodowane przez układ kodowania składowych charakterystyki szumu 604. Sygnał wyprowadzany z układu kodowania składowych charakterystyki dźwięku 603 jest kodowany w układzie kodowania ze zmienną długością kodu 610. Sygnały wyjściowe z układu kodowania ze zmienną długością kodu 610 oraz z układu kodowania składowych charakterystyki szumu 604 są wprowadzane do układu generatora sekwencji kodu 605. Wygenerowana sekwencja kodu jest odprowadzana z tego układu. Koder wykrywania i korygowania błędów ECC 606 dodaje kod korekcji błędów do sekwencji kodu z układu generatora sekwencji kodu 605. Sygnał wyjściowy z kodera wykrywania i korygowania błędów ECC 606 jest modulowany w układzie modulacji danych EFM 607. Tak uzyskany zmodulowany sygnał jest doprowadzony do głowicy zapisu 608, za pomocą której zapisuje się na dysk 609 stanowiący nośnik zapisu, sekwencję kodu wyprowadzoną z układu modulacji danych EFM 607.
Jako układ transformacji 601 korzystnie stosuje się wiele znanych układów transformacji. Na przykład, sygnał wejściowy może być bezpośrednio transformowany na sygnał widmowy przez zmodyfikowaną dyskretną transformację kosinusową MDCT, ale również dyskretna transformacja Fouriera DFT lub dyskretna transformacja kosinusową DCT, mogą być zastosowane do przetwarzania widmowego, zamiast transformacji MDCT.
Ponadto, gdy sygnał może być podzielony na składowe częstotliwości przez filtr dzielący pasmo, oraz jeśli kodowanie jest efektywnie wykonywane w szczególności w przypadku, gdy energia koncentruje się dla określonych Iub szczególnych częstotliwości, to stosuje się sposób transformacji na składowe częstotliwości poprzez transformację widmową, która wy- maga względnie małej ilości operacji.
Układ kodowania składowych charakterystyki dźwięku 603 i układ kodowania składowych charakterystyki szumu 604 są korzystnie realizowane w konfiguracji pokazanej na fig. 14.
Na fig. 2 przedstawiono schemat blokowy urządzenia według wynalazku, do dekodowania sygnałów zakodowanych w urządzeniu z fig. 1. Sekwencja kodu odtworzona z dysku 609 stanowiącego nośnik zapisu danych, za pomocą głowicy odczytu 708, jest dostarczona do układu demodulacji danych eFm 709. W układzie demodulcji danych EFM 709 przeprowadzana jest demodulacja wejściowej sekwencji kodu. Zdemodulowana sekwencja kodu zostaje dostarczona do dekodera wykrywania i korygowania błędów ECC 710, w którym dokonywana jest korekcja błędów. Układ rozkładu sekwencji kodu 701 rozpoznaje, na podstawie informacji o składowej charakterystyki dźwięku ze skorygowanej sekwencji kodu, która część kodu należy do składowej charakterystyki dźwięku, dla podzielenia wejściowej sekwencji kodu na kody składowych charakterystyki dźwięku i kody składowych charakterystyki szumu. Ponadto, układ rozkładu sekwencji kodu 701 wydziela informację dotyczącą składowej charakterystyki dźwięku z wejściowej sekwencji kodu i wysyłają do bloku syntezy 704. Kody składowych charakterystyki dźwięku poddane są dekodowaniu ze zmienną długością kodu w układzie dekodera ze zmienną długością kodu 715 i są wysyłane do układu dekodowania składowych charakterystyki dźwięku 702, a kody składowych charakterystyki szumu są wysyłane do układu dekodowania składowych charakterystyki szumu 703, w których to układach, odpowiednio, wykonywana jest odwrotna kwantyzacja i normalizacja, a odpowiednie składowe zostają zdekodowane.
Następnie, zdekodowane sygnały z układu dekodowania składowych charakterystyki dźwięku 702 i z układu dekodowania składowych charakterystyki szumu 703 są przesyłane do wykonania syntezy odpowiadającej dzieleniu sygnału w układzie oddzielania składowych sygnału 602 z fig. 1. W bloku syntezy 704 dodaje się zdekodowany sygnał składowej charakterystyki dźwięku do założonej pozycji zdekodowanej składowej charakterystyki szumu na podstawie informacji o pozycji składowej charakterystyki dźwięku dostarczonej z układu rozkładu sekwencji kodu 701, przez co wykonuje się syntezę w dziedzinie częstotliwości składowej charakterystyki szumu i składowej charakterystyki dźwięku. Następnie, tak zsyntezowany zdekodowany sygnał przechodzi przez blok odwrotnej transformacji 705, wykonujący odwrotną transformację do wykonywanej przez układ transformacji 601 z fig. 1, tak że sygnał z
174 314 dziedziny częstotliwości odzyskuje swą pierwotną postać w dziedzinie czasu. Wyjściowy sygnał w postaci fali powstający na wyjściu bloku odwrotnej transformacji 705 jest wyprowadzony na zacisk wyjściowy 707.
Należy zaznaczyć, że kolejność wykonywania odwrotnej transformacji i syntezy może być odwrotna. W takim przypadku, układ syntezy i transformacji odwrotnej 711 z fig.2 jest skonstruowany tak, jak pokazano na fig. 18. Blok odwrotnej transformacji 712 będący częścią układu odwrotnej transformacji i syntezy 711 wykonuje odwrotną transformację składowej charakterystyki szumu w dziedzinie częstotliwości pochodzącej z układu dekodowania składowej charakterystyki szumu 703, na sygnał w dziedzinie częstotliwości. Blok odwrotnej transformacji 713 umieszcza zdekodowany sygnał składowej charakterystyki dźwięku z układu dekodującego składowe charakterystyki dźwięku 702 w położeniu w dziedzinie częstotliwości wskazanej przez informację położenia dotyczącą składowej charakterystyki dźwięku pobranej z układu rozkładu sekwencji kodowej 701, dla wykonania odwrotnej transformacji i wygenerowania w dziedzinie czasu sygnału składowej charakterystyki dźwięku. Blok syntezy 714 w dziedzinie czasu łączy sygnał składowych charakterystyki szumu z bloku transformacji odwrotnej 712 i sygnał składowych charakterystyki dźwięku z bloku odwrotnej transformacji 713, przez co powstaje pierwotny sygnał w postaci fali.
Dla bloków odwrotnej transformacji 705, 712, 713 stosuje się konfigurację podobną do konfiguracji z fig. 16.
Na fig. 3 przedstawiono przebieg procesu oddzielania składowych charakterystyki dźwięku w układzie oddzielania składowych sygnału 602 urządzenia kodującego z fig. 1. Na fig. 3, współczynnik I oznacza numery sygnałów widmowych, współczynnik N oznacza całkowitą ilość sygnałów widmowych, a współczynniki P i R oznaczają założone współczynniki.
Składowa charakterystyki dźwięku jest wyznaczana na podstawie następujących prawidłowości. W przypadku, gdy wartość bezwzględna określonego widmowego sygnału jest większa niż innych składowych charakterystyki w sąsiedztwie, różnica pomiędzy wartością bezwzględną i wartością maksymalną spośród wartości sygnałów widmowych w odpowiednim przedziale czasu (blok w transformacji widmowej) ma założoną wartość, lub jest większa, natomiast suma składowej widmowej i sąsiadujących z nią składowych widmowych (np. sąsiednie składowe w obu kierunkach) wskazuje wartość założonego współczynnika, lub większą, dotyczącego energii w założonym paśmie zawierającym te składowe widmowe, ten sygnał widmowy i sygnały widmowe sąsiadujące z nim w obydwu kierunkach, są uważane za składowe charakterystyki dźwięku. Należy zauważyć, że jako założone pasmo do porównywania stosunku dystrybucji energii, może być zastosowane pasmo takie, że jego szerokość jest wąska dla małych częstotliwości, natomiast jest szeroka dla dużych częstotliwości, biorąc pod uwagę krytyczne wartości szerokości pasma związane z granicami słyszalności.
Zgodnie z fig. 3 na początku procesu, w kroku S1, pod zmienną AO podstawiana jest maksymalna bezwzględna wartość widmowa. W kroku S2, numer widmowego sygnału I jest ustawiany na 1. W kroku S3, określona bezwzględna wartość widmowa w określonym przedziale czasu jest podstawiana pod zmienną A.
W kroku S4 rostrzygane jest, czy bezwzględna wartość widmowa jest maksymalną wartością widmową większą niż wszystkie inne lokalnie widoczne składowe. W rezultacie, jeśli to nie jest maksymalna wartość widmowa (NIE), proces przechodzi do kroku S10. W przeciwnym przypadku, gdy jest to maksymalna wartość widmowa (TAK), proces przechodzi do kroku S5.
W kroku S5, porównywany jest stosunek zmiennej A przechowującej bezwzględną wartość widmową w odpowiadającym przedziale czasu zawierającym maksymalną bezwzględną wartość widmową do zmiennej AO przechowującej maksymalną bezwzględną wartość widmową, ze współczynnikiem P określającym założoną wielkość (A/AO > P). W efekcie, jeśli A/AO jest większe niż P (TAK), proces przechodzi do kroku S6.W przeciwnym przypadku (NIE), proces przechodzi do operacji S10.
W kroku S6, wartość energii sąsiadujących widm (np. suma energii widmowych składowych widmowych sąsiadujących z odpowiednią składową widma w obydwu kierunkach) ze składową o rozpatrywanej widmowej wartości bezwzględnej (maksymalnej), jest podstawiana
174 314 pod zmienną X. W następnym kroku S7, wartość energii w założonym paśmie zawierającym maksymalną bezwzględną wartość widmową i sąsiadujące z nią składowe widma, są podstawiane pod zmienną Y.
W następnym kroku S8, stosunek pomiędzy X oznaczającą wartość energii i Y oznaczającą wartość energii w założonym paśmie, jest porównywany z założonym współczynnikiem R (X/Y> R). W efekcie, jeśli X/Y jest większe niż R (TAK), proces przechodzi do kroku S9. W przeciwnym przypadku (NIE), proces przechodzi do kroku SIO.
W kroku S9, w przypadku, gdy energia maksymalna w widmie o maksymalnej wartości i sąsiadujących z nim składowych widmowych wskazuje wielkość większą lub równą założonej wartości odnoszącej się do energii w założonym paśmie zawierającym te składniki widmowe, sygnał o maksymalnej bezwzględnej wartości składowej widmowej i sygnały składowych widmowych, są traktowane jako składowa charakterystyki dźwięku, którą trzeba zarejestrować.
W następnym kroku S10, rostrzygane jest, czy numer I sygnału widmowego zarejestrowanego w kroku S9 i całkowita ilość N wszystkich sygnałów widmowych są sobie równe (I=N). W rezultacie, w przypadku gdy są one równe (TAK), proces jest zakończony. W przeciwnym przypadku (NIE), proces przechodzi do kroku S11. W tym kroku inkrementuje się I w celu zwiększenia o jeden numeru sygnału widmowego. Następnie, proces powraca do kroku S3 i powyżej opisane operacje są powtarzane. Układ oddzielania składowych sygnału 602 dostarcza składową lub składowe częstotliwościowe, które zostały uznane za składowe charakterystyki dźwięku przez opisany proces, do układu kodowania charakterystyki dźwięku 603, oraz dostarcza inne składowe częstotliwościowe, takie jak składowe charakterystyki szumu, do układu kodowania składowej charakterystyki szumu 604. Ponadto, układ oddzielania składowych sygnału 602 dostarcza numer informacji o częstotliwości, która została uznana za składową charakterystyki dźwięku, oraz informację o jej położeniu, do układu generatora sekwencji kodu 605.
Na fig. 4 przedstawiono wykres widmowy w określonym stanie, w którym składowe charakterystyki dźwięku są oddzielane od innych składowych częstotliwości w sposób już opisany. W przykładzie pokazanym na fig. 4, wybrane zostały cztery składowe charakterystyki dźwięku oznaczone przez TCa, TCb, TCc, TCd. Gdy te składowe charakterystyki dźwięku są rozmieszczone w taki sposób, że koncentrują się na małej liczbie sygnałów widmowych, tak jak na fig. 4, nawet jeśli te składowe są kwantowane z dobrą dokładnością, nie wymaga się tak dużej liczby bitów, jaka jest oferowana. Z tego powodu, gdy składowe charakterystyki dźwięku są następnie normalizowane po to, by kwantować znormalizowane składowe poprawiając przez to sprawność kodowania, jeśli sygnały widmowe składające się na dźwięk są, względnie nieliczne, proces normalizacji i/lub rekwantyzacji może zostać pominięty w celu uproszczenia urządzenia.
Na fig. 5 przedstawiono wykres widmowy, w którym przedstawione są składowe charakterystyki szumu, z usuniętymi składowymi charakterystyki dźwięku z pierwotnego sygnału widmowego. Jak pokazano na fig. 5, składowe charakterystyki dźwięku zostały usunięte (wyzerowane) z pierwotnego sygnału widmowego w odpowiednich pasmach b1 + b5. W tym przypadku, współczynniki normalizacji w odpowiednich jednostkach kodujących otrzymują małą wartość. W związku z tym, kwantowanie generowanych szumów może być zredukowane do małej ilości bitów.
Chociaż opisano podej ście polegaj ące na oddzielaniu składowych charakterystyki dźwięku dla umożliwienia wyzerowania składowych charakterystyki dźwięku i składowych sygnału z nimi sąsiadujących, przez co uzyskuje się możliwość efektywnego kodowania, można również stosować sposób kodowania składowych sygnału otrzymanych poprzez odjęcie sygnału uzyskanego z zakodowania składowych charakterystyki dźwięku późniejszego ich zdekodowania, od pierwotnego sygnału widmowego.
Urządzenie do kodowania sygnałów według tej metody zostanie opisane z nawiązaniem do fig. 19. Te same numery odnośników dotyczą zasadniczo tych samych zespołów jak na fig. 1, a ich objaśnienie zostało pominięte.
Sygnał widmowy z wyjścia układu transformacji 601 jest doprowadzony do układu wydzielania składowej charakterystyki dźwięku 802 przez przełącznik 801 sterowany za pomocą układu sterującego 808. Układ wydzielania składowej charakterystyki dźwięku 802 wyznacza
174 314 składową charakterystyki dźwięku, w sposób już opisany w nawiązaniu do fig. 3 dla dostarczania jedynie wyróżnionej składowej charakterystyki dźwięku do układu kodującego składową charakterystyki dźwięku 603. Następnie, układ wydzielania składowej charakterystyki dźwięku 802 wyprowadza informację o ilości składowych charakterystyki dźwięku, oraz informację o środku jej położenia, do układu generatora sekwencji kodu 605. Układ kodowania składowej charakterystyki dźwięku 603 wykonuje normalizację i kwantyzację na wejściowej składowej charakterystyki dźwięku, wysyłając znormalizowaną i skwantowaną składową charakterystyki dźwięku do układu kodowania ze zmienną długością kodu 610 i do lokalnego dekodera 804. Układ kodowania 610 wykonuje kodowanie ze zmienną długością kodu na znormalizowanej i skwantowanej składowej charakterystyki dźwięku i dostarcza uzyskany kod o zmiennej długości do zespołu generatora sekwencji kodowej 605. Lokalny dekoder 804 wykonuje odwrotną kwantyzację i denormalizację skwantowanej i znormalizowanej składowej charakterystyki dźwięku, dekodując sygnał do postaci pierwotnej składowej charakterystyki dźwięku. Skwantowany szum jest zawarty, w tym momencie, w zdekodowanym sygnale. Sygnał wyjściowy z lokalnego dekodera 804 jest doprowadzany do sumatora 805, jako pierwszy skwantowany sygnał. Poza tym, pierwotny sygnał widmowy z układu transformacji 601 jest doprowadzony do sumatora 805 przez przełącznik 806 sterowany za pomocą układu sterującego 808. Sumator 805 odejmuje pierwszy zdekodowany sygnał od pierwotnego sygnału widmowego, wyprowadzając sygnał pierwszej różnicy. W przypadku, gdy sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy składowej charakterystyki dźwięku, została wykonana pierwszy raz w czasie procesu, wspomniany sygnał pierwszej różnicy jest doprowadzony jako składowa charakterystyki szumu do układu kodowania składowej charakterystyki szumu 604 przez przełącznik 807, sterowany przez układ sterujący przełącznikami 808. Następnie, sekwencja procesu wydobywania, kodowania, dekodowania, wyznaczania różnicy składowej charakterystyki dźwięku jest powtarzana, sygnał pierwszej różnicy jest doprowadzany do układu wydzielania składowej charakterystyki dźwięku 802 przez przełącznik 801. Układ wydzielania składowej charakterystyki dźwięku 802, układ kodowania składowej charakterystyki dźwięku 603, lokalny dekoder 804, wykonują proces taki sam jak poprzednio. Dzięki temu, drugi zdekodowany sygnał jest dostarczony do sumatora 805. Poza tym, sygnał pierwszej różnicy jest doprowadzony do sumatora 805 przez przełącznik 806. Sumator 805 odejmuje drugi zdekodowany sygnał od pierwszego sygnału różnicy, wyprowadzając drugi sygnał różnicy. Następnie, gdy sekwencja kodowania, dekodowania, wyznaczania różnicy, składowej charakterystyki dźwięku została wykonana drugi raz w czasie procesu, sygnał drugiej różnicy jest doprowadzony do układu kodowania składowej charakterystyki szumu 604 przez przełącznik 807, jako składowa charakterystyki szumu. W przypadku, gdy sekwencja procesu wydobywania, kodowania, dekodowania, wyznaczania różnicy składowej charakterystyki dźwięku jest dalej powtarzana, przetwarzanie identyczne z opisanym jest wykonywane przez układ wydzielania składowej charakterystyki dźwięku 802, układ kodowania składowej charakterystyki dźwięku 603, lokalny dekoder 804 i sumator 805. Układ sterujący przełącznikami 808 przechowuje wartość progową mówiącą o ilości składowych charakterystyki dźwięku, oraz steruje przełącznikiem 807 w taki sposób, że sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy jest zakończona w przypadku, gdy liczba informacyjna składowej charakterystyki dźwięku uzyskanej z układu wydobywania składowej charakterystyki dźwięku jest większa od założonej wartości progowej. Ponadto, w układzie kodowania składowej charakterystyki dźwięku 603, może być zrealizowany sposób polegający na tym, że gdy wydzielanie jest zakończone, kończona jest sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy składowej charakterystyki dźwięku.
Na fig. 6 i 7 przedstawiono wyjaśnienie opisanego sposobu, przy czym na fig. 7 pokazano sygnał widmowy, w którym sygnał uzyskany po kodowaniu określonej składowej charakterystyki dźwięku, a następnie zdekodowany, został odjęty od sygnału widmowego z fig. 6. Ponadto, składowe narysowane przerywanymi liniami są składowymi wybranymi z sygnału widmowego z fig. 7, a składającymi się na składową charakterystyki dźwięku, co sprawia, że poprawia się dokładność kodowania sygnału widmowego. Przy powtarzaniu tej operacji, możliwe jest wykonywanie kodowania z dużą dokładnością. W przypadku zastosowania tej metody, nawet jeśli
174 314 maksymalna ilość bitów przeznaczonych do kwantyzacji składowej charakterystyki dźwięku nie jest duża, dokładność kodowania jest wystarczająco duża. Zgodnie z tym, zaletą tego rozwiązania jest, że można zredukować ilość bitów niezbędnych do zapisania kwantyzacji. Ponadto, metoda wydzielania składowych charakterystyki dźwięku w sposób wieloetapowy może być stosowana nie tylko w przypadku, gdy sygnał odpowiadający sygnałowi po zakodowaniu składowej charakterystyki dźwięku i następnie zdekodowaniu, jest odejmowany od pierwotnego sygnału widmowego, lecz również w przypadku, gdy sygnał widmowy wydzielonej składowej charakterystyki dźwięku jest zerowany.
Jeśli w przedstawionym przykładzie urządzenia do kodowania pierwotny sygnał w postaci falowej jest rozkładany na składowe charakterystyki dźwięku i składowe charakterystyki szumu, które następnie są kodowane, przez co wykonuje się bardziej wydajne kodowanie, sposób opisany poniżej jest zastosowany w połączeniu z kodowaniem składowych charakterystyki dźwięku, przez co możliwe jest wykonywanie bardziej efektywnego kodowania.
Dla odpowiednich składowych charakterystyki dźwięku, energia koncentruje się na współczynniku widmowym, gdzie wartość bezwzględna jest największa, który jest nazywany maksymalnym współczynnikiem widmowym, i brzegowych współczynnikach, które są nazywane brzegowymi współczynnikami widmowymi. W takim przypadku, nie występuje żadne odchylenie w dystrybucji wartości, gdy odpowiednie współczynniki są kwantowane, a stan dystrybucji maksymalnego współczynnika widmowego i brzegowych współczynników widmowych znacznie różnią się od siebie, w zależności od względnego położenia w dziedzinie częstotliwości. Jeśli współczynniki widmowe składające się na odpowiednie składowe charakterystyki dźwięku są normalizowane poprzez współczynnik normalizacji wyznaczony przez maksymalny współczynnik widmowy, tzn. odpowiednie współczynniki widmowe składające się na składowe charakterystyki dźwięku są dzielone przez maksymalny współczynnik widmowy, to maksymalny współczynnik widmowy po kwantyzacji stanie się prawie równy 1 lub -1. W przeciwieństwie, jeśli składowe charakterystyki dźwięku mają charakterystykę, zgodnie z którą współczynniki widmowe gwałtownie maleją, a maksymalny współczynnik widmowy znajduje się w ich środku, brzegowe współczynniki po kwantyzacji rozmieszczone przy wyższych częstotliwościach mają wartość bliską zeru.
W przypadku jeśli nie występują dysproporcje w rozłożeniu wartości, które mają być kodowane, wykorzystany jest znany, tzw. kod o zmiennej długości do wykonania kodu o mniejszej średniej długości słowa, dzięki czemu możliwe jest wykonywanie efektywnego kodowania.
Biorąc to pod uwagę, w przykładzie wykonania urządzenia do kodowania sygnałów, odpowiednie składowe charakterystyki dźwięku są dzielone na maksymalny współczynnik widmowy i brzegowe współczynniki widmowe, dla zastosowania różnych kodów o zmiennej długości do odpowiednich współczynników widmowych, przez co realizuje się efektywne kodowanie.
Należy zauważyć, że gdy składowe charakterystyki dźwięku mają ostrą dystrybucję widma w dziedzinie częstotliwości, dystrybucja wartości w przypadku, gdy widmowe współczynniki brzegowe są normalizowane i kwantowane, silnie zależy od względnego położenia w dziedzinie częstotliwości wspomnianych brzegowych współczynników widmowych i maksymalnego współczynnika widmowego. Biorąc to pod uwagę, pożądane jest realizowanie podejścia polegającego na dalszej klasyfikacji (podziale) brzegowych współczynników widmowych na kilka zbiorów (grup) w zależności od względnego położenia w dziedzinie częstotliwości względem maksymalnego współczynnika widmowego, dla przetransformowania ich zgodnie z regułami transformacji na kody o zmiennej długości dla każdego oddzielnego zbioru (grupy).
Jako metodę klasyfikacji względnego położenia korzystnie stosuje się metodę wykonywania klasyfikacji ze względu na bezwzględne wartości różnic w dziedzinie częstotliwości względem maksymalnych współczynników widmowych.
Zgodnie z widmem składowych charakterystyki dźwięku pokazanym na fig. 8, trzy reguły transformacji, tzn. reguła transformacji dotycząca maksymalnego współczynnika widmowego ECc, reguła transformacji dotycząca brzegowych współczynników widmowych ECb i ECd, oraz reguła dotycząca brzegowych współczynników widmowych ECa i ECe, są zastosowane do
174 314 wykonania przetworzenia na kody o zmiennej długości. Oczywiście, kodowanie ze zmienną długością może być wykonywane według tej samej reguły transformacji dla wszystkich brzegowych współczynników widmowych, dla uproszczenia całego procesu.
Przykład tabeli kodów prezentujący regułę transformacji względem maksymalnego współczynnika widmowego jest przedstawiony na fig. 20A. Przykład tabeli kodów prezentujący regułę brzegowych współczynników widmowych w przypadku, gdzie ta sama reguła jest użyta dla wszystkich brzegowych współczynników widmowych, jest przedstawiony na fig. 20B.
Maksymalny współczynnik widmowy po normalizacji i kwantyzacji, tzn. skwantowana maksymalna wartość widmowa, jest równy lub bliski 1 lub -1, jak już wspomniano. Jak pokazano na fig. 20A, skoro 00 i 01, które są kodami o długościach mniejszych niż długości kodów dla innych wartości, możliwe jest wydajne zakodowanie maksymalnego współczynnika widmowego.
Brzegowe współczynniki widmowe po normalizacji i kwantyzacji, tzn. skwantowane wartości brzegowych składowych widmowych stają się równe Iub bliskie 0, tak jak to już opisano. Dzięki temu, j ak przedstawiono na fig. 20B, gdy dla 0, które ma kod krótszy niż kody dla innych wartości, jest przypisane 0 (zero), wówczas możliwe jest efektywne zakodowanie brzegowych współczynników widmowych.
Jeśli są dostarczone liczne tabele kodów względem maksymalnego współczynnika widmowego i liczne tabele kodów względem brzegowych współczynników widmowych, można uzyskać dowolną dokładność kwantyzacji wyznaczaną w układzie 603 do kodowania składowej charakterystyki dźwięku, przy wybraniu odpowiedniej tablicy kodów w zależności od założonej dokładności kwantyzacji, przez co można wykonywać wydajniejsze kodowanie.
Na fig. 9 przedstawiono przykład układu do kodowania ze zmienną długością kodu 610, który mieści się w urządzeniu z fig. 1. W układzie z fig. 9, składowe charakterystyki dźwięku doprowadzone do zacisku 800 są klasyfikowane (rozdzielane) ze względu na położenie w dziedzinie częstotliwości względem maksymalnej składowej widma, przez układ sterujący 801. Tak sklasyfikowane składowe widma są, odpowiednio, wysyłane do układu kodowania maksymalnego współczynnika widmowego 802, układu kodowania brzegowego współczynnika widmowego 803 i układu kodowania brzegowego współczynnika kodowego widmowego 804. W tych odpowiednich układach wspomniane składowe widma są kodowane w dziedzinie częstotliwości według wspomnianych już reguł transformacji. Zakodowane sygnały wyjściowe z odpowiednich układów kodujących 802, 803, 804 są wyprowadzane z zacisku wyjściowego 805 układu sterującego 801.
Na fig. 10 przedstawiono przykład układu dekodowania ze zmienną długością kodu 715, który mieści się w urządzeniu z fig. 2. W układzie z fig. 10, kody składowych charakterystyki dźwięku wprowadzone przez zacisk wejściowy 900, są klasyfikowane w sposób odpowiadający klasyfikacji przeprowadzonej w układzie z fig. 9. Tak sklasyfikowane kody są wysyłane, odpowiednio, do układu dekodowania maksymalnego współczynnika widmowego 902, do układu dekodowania brzegowego współczynnika widmowego 903 i do układu dekodowania brzegowego współczynnika kodowego widmowego 904. W tych układach, wspomniane kody są dekodowane według reguł odwrotnej transformacji, opowiadających regułom już opisanej transformacji. Zdekodowane sygnały wyjściowe z wyjść odpowiednich układów dekodujących 902, 903, 904, są odprowadzone poprzez zacisk wyjściowy 905 układu sterującego 901.
Na fig. 11 przedstawiono przykład, w którym sygnał widmowy z fig. 4 jest kodowany za pomocą urządzenia do kodowania zgodnie z opisanym przykładem wykonania. Tak uzyskane sekwencje kodu są zapisywane na nośniku zapisu w postaci dysku 609. W tym przykładzie wykonania, informacja o składowej charakterystyki dźwięku nr ten (np. tcn = 4 w przykładzie z fig. 11) jest najpierw zapisywana na nośnik. Następnie, informacje o składowych charakterystyki dźwięku tca, tce, tcc, tco, oraz składowe charakterystyki szumu nc, nc2, nc3, nc4, nc5, zostają zapisane we wspomnianej kolejności. W informacji o składowej charakterystyki dźwięku tCA, tce, tcc, tcd, informacja o położeniu środkowym CP wskazująca pozycję środka widma składowej charakterystyki dźwięku (np. 15 w przypadku, np. składowej charakterystyki dźwięku tce, informacja o dokładności kwantyzacji wskazująca ilość bitów dla kwantyzacji (np. 6 w przypadku, np., składowej charakterystyki dźwięku tcn, oraz informacja o współczynniku
174 314 normalizacji, są zapisywane wraz z odpowiednimi informacjami o składowych sygnału SCa, SCb, SCc, SCd, SCe, które zostały poddane normalizacji i kwantyzacji, oraz następnie zostały zakodowane kodem o zmiennej długości. W tym przykładzie, reguły transformacji kodów o zmiennej długości są założone zgodnie z żądaną dokładnością kwantyzacji. Urządzenie do dekodowania przeprowadza dekodowanie kodu o zmiennej długości zgodnie z informacją o dokładności kwantyzacji.
Na przykład w przypadku, gdy dokładność kwantyzacji jest ściśle zależna od częstotliwości, zbędne jest zapisywanie informacji o dokładności. Należy zaznaczyć, że jeśli pozycja składowej środka widma odpowiedniej składowej charakterystyki dźwięku jest używana jako pozycja informacji o składowych charakterystyki dźwięku w opisanym już przykładzie wykonania, może być zapisywana pozycja składowej widma o najniższej częstotliwości (np. 14, w przypadku składowej charakterystyki dźwięku TCb).
Ponadto, w odniesieniu do informacji o składowej charakterystyki szumu, informacja o dokładności kwantyzacji (np. 2 w przypadku składowej charakterystyki szumu nci) oraz informacja o współczynniku normalizacji, są zapisywane wraz ze znormalizowanymi odpowiednimi informacjami o składowych SC1, SC2, ..., SC3.
W przypadku, gdy informacja o dokładności kwantyzacji wynosi zero, kodowanie dla danego przypadku nie jest wykonywane w układzie kodowania. W przypadku, gdy dokładność kodowania jest ściśle wyznaczona dla każdego pasma, podobnie jak powyżej, nie jest konieczne zapisywanie informacji o dokładności kwantyzacji.
Na fig. 11 przedstawiono przykład objaśniający rodzaj i porządek informacji rejestrowanych na nośniku zapisu. Na przykład, informacja dotycząca informacji o składowych sygnału SCa, SCb, SCc, SCd, SCe, jest zakodowana kodami o zmiennej długości.
Przedstawione urządzenie do kodowania sygnałów ma zdolność dostarczania informacji o amplitudzie, dotyczącej maksymalnego współczynnika widmowego odpowiedniej składowej charakterystyki dźwięku, jedynie za pomocą informacji o współczynniku normalizacji, umożliwiając przez to wykonywanie bardziej wydajnego kodowania. Układ kodowania składowej charakterystyki dźwięku 603 wykonuje normalizację i kwantyzację, dla składowych częstotliwości, jedynie dla maksymalnego współczynnika widmowego odpowiednich składowych charakterystyki dźwięku. Należy zauważyć, że można zastosować strukturę układu, w której normalizacja i kwantyzacja są wykonywane dla wszystkich odpowiednich składowych charakterystyki dźwięku, również dla tych zawierających maksimum widmowe, w układzie kodowania składowej charakterystyki dźwięku, a skwantowana wartość odpowiadająca maksimum widma nie jest umieszczona w sekwencji kodu generowanego w następnym etapie przez układ 605. W przypadku, gdy wykonywane jest takie kodowanie, informacja o składowej sygnału SCc zawiera kody wskazujące jedynie wartość dodatnią lub ujemną, jak w przykładzie z fig. 11.
Gdy wartość zbliżona do informacji o amplitudzie maksimum widmowego jest wybrana jako współczynnik normalizacji, w przypadku gdy współczynniki normalizacji są zapisywane na nośnik, możliwe jest uzyskanie przybliżonych wartości informacji o amplitudzie maksimów widmowych z tych współczynników normalizacji. Na przykład, w przypadku, gdy informacja widmowa jest wykonywana przez zmodyfikowaną dyskretną transformację kosinusową MDCT lub dyskretną transformację kosinusową DCT, przybliżona wartość maksimum widmowego może być uzyskana z kodów wskazujących wartość dodatnią i ujemną oraz informację o współczynniku normalizacji. Ponadto, na przykład, w przypadku, gdy informacja widmowa jest realizowana przez dyskretną transformację Fouriera DFT, przybliżona wartość maksimum widmowego może być odzyskana jedynie ze składowej fazowej. Dzięki temu można pominąć zapisywanie informacji uzyskanej przez skwantowanie informacji o amplitudzie dla odpowiedniego maksimum widmowego. Ta metoda jest szczególnie efektywna w przypadkach, gdy normalizacja może być wykonywana z dużą dokładnością.
W takim przypadku, gdy dokładność współczynnika normalizacji jest niewystarczająca w urządzeniu do kodowania sygnałów, może zaistnieć przypadek, że dokładność maksymalnego współczynnika widmowego nie będzie wystarczająco zapewniona. Jednakże, zastosowanie sposobu, w którym wykorzystuje się konfigurację urządzenia przedstawionego na fig. 19, do wydzielania składowych charakterystyki dźwięku, umożliwia usunięcie wspomnianego próbie174 314 mu. Jak pokazano na fig. 6 i 7, istnieje duże prawdopodobieństwo, że składowe częstotliwości nachodzące na siebie, w dziedzinie częstotliwości, są wydzielane wielokrotnie, jako składowe charakterystyki dźwięku. W takim przypadku, pożądane jest wykonanie nieliniowego ustalenia dla wykonywania ustalania dla każdego założonego przedziału, np. poprzez wykorzystanie skali logarytmicznej, aby zgodnie ze zmniejszaniem wartości współczynnika normalizacji, rosła dokładność.
Jeśli liczne składowe częstotliwościowe podlegają syntezie w urządzeniu do dekodowania, nawet w przypadku, gdy dokładność jakiegoś współczynnika normalizacji nie jest wystarczająca, możliwe jest zapewnienie określonego stopnia dokładności. Ponadto, chociaż opisano głównie przykład, w którym sygnał akustyczny jest kodowany przez urządzenie kodujące, kodowanie może być wykonywane dla dowolnych sygnałów w postaci fali. Należy zaznaczyć, że kodowanie w tym rozwiązaniu jest szczególnie wydajne w przypadku sygnałów akustycznych, w których składowe charakterystyki dźwięku mają podstawowe znaczenie dla zmysłu słuchu.
Ponadto, dysk 609 z opisanego przykładu wykonania może być, np. nośnikiem magnetooptycznym, optycznym, lub typem nośnika optycznego ze zmienną fazą. Ponadto, półprzewodnik lub karta identyfikacyjna ID, mogą być zastosowane oprócz nośnika taśmowego, jako nośnik zastępujący dysk 609.
Ponadto, chociaż opisano przypadek, w którym tylko składowe charakterystyki dźwięku koduje się kodem ze zmienną długością, składowe charakterystyki szumu mogą być również kodowane kodem ze zmienną długością.
Na fig. 12 przedstawione zostało urządzenie do kodowania, którego zasada stosowana jest w rozwiązaniu przedstawionym na fig. 1. W urządzeniu z fig. 12, sygnał w postaci fali akustycznej doprowadzony jest do zacisku wejściowego 100 i zostaje przekształcany na składowe częstotliwościowe sygnału w układzie transformacji 101. Następnie, odpowiednie składowe są kodowane w układzie kodowania składowej sygnału 102. Układ generatora sekwencji kodu 103 generuje sekwencję kodu i odprowadzają przez zacisk wyjściowy 104.
Układ transformacji 101 z fig. 12 jest pokazany na fig. 13. Jak przedstawiono na fig. 13, sygnał doprowadzony przez zacisk 200 (zacisk 100 z fig. 12) jest dzielony na sygnały w trzech pasmach częstotliwości przez dwa stopnie filtrów rozdzielania 201, 202. W pierwszym filtrze rozdzielania 201, sygnał z zacisku 200jest obcinany o połowę. W drugim filtrze podziału pasma 202, jeden ze zmniejszonych sygnałów przez filtr podziału pasma 201 jest ponownie obcinany o połowę i stanowi M4 sygnału wejściowego. Szerokości pasm dwóch sygnałów wyjściowych filtru podziału pasma 202 stanowią M4 szerokości pasma sygnału doprowadzanego do zacisku 200.
Sygnały odpowiednich trzech pasm podzielonych przez filtry 201, 202 stają się składowymi sygnału widmowego po przejściu przez układy transformacji 203, 204, 205, korzystnie wykonujące zmodyfikowaną dyskretną transformację kosinusową MDCT. Wyjścia tych układów transformacji 203, 204, 205 są dołączone do układu kodowania składowej sygnału 102 z fig. 12.
Nafig. 14 przedstawiono schemat układu kodowania składowej sygnału 102 z fig. 12. Jak przedstawiono nafig. 14, sygnał pojawiający się na wejściu układu kodowania składowej sygnału 102 doprowadzony jest do zacisku 300 i przechodzi normalizację dla każdego założonego pasma w układzie normalizacji 301 i jest przesyłany do układu kwantyzacji 303. Ponadto, sygnał doprowadzony do zacisku 300 jest również przesyłany do układu wyznaczania dokładności kwantyzacji 302.
W układzie kwantyzacji 303 stosuje się kwantyzację sygnału z układu normalizacji 301 na podstawie wyliczonej dokładności kwantyzacji pochodzącej z układu wyznaczania dokładności kwantyzacji 302. Sygnał wyjściowy układu kwantyzacji 303 jest odprowadzony z zacisku 304 i jest przesłany do układu generatora sekwencji kodu 103 z fig. 12. W wyjściowym sygnale na zacisku 304 zawarta jest informacja o współczynniku normalizacji z układu normalizacji 301 i informacja o dokładności kwantyzacji z układu wyznaczania dokładności kwantyzacji 302, oraz skwantowane składowe sygnału z układu kwantyzacji 303.
Schemat znanego urządzenia do dekodowania, przystosowanego do dekodowania akustycznych sygnałów z sekwencji kodów generowanych przez urządzenie do kodowania o strukturze
174 314 z fig. 12 i wyprowadzania zeekkdkwanegk sygnału, jest pckazany na fig. 15. Kcdy cdpcwiednich składcwych sygnału są wydzielcne przez układ rozkładu sekwencji kcdu 401 wygenerowanej przez układ c kcnfiguracji takie jak oa fig. 12, który tc kcd jest dcprcwadzany dc zacisku 400. Odpcwiednie składcwe sygnału są cdtwarzane (rekoostrucwane) przez układ dekcdcwaoia składcwej sygnału 402 z tych kcdów. Następnie, w układzie cdwrctnej traosfcrmacji 403 stcsuje się cdwrctoą transfcrmację kdpkwiaeającą transfcrmacji wykcnanej w układzie transfcrmacji 101 z fig. 12. W ten spcsób uzyskuje się sygnał akustyczny. Ten falcwy sygnał akustyczny jest cdprcwadzcny pcprzez zacisk wyjścicwy 404.
Znana kcnfiguracja układu cdwrctnej transfcrmacji 403 z fig. 15 jest pckazana na fig. 16. Układ ten cdpcwiada przykładcwi kcnfiguracji układu transfcrmacji z fig. 13. Sygnały dcprcwadzcoe z układu dekcdcwania składcwej sygnału 402 przez zaciski 501, 502, 503 są przetwarzane przez układy cdwrctnej transfcrmacji 504, 505, 506 wykcnujące cdwrctną traosfcrmację widma cdpcwiadającą transfcrmacji widma układu z fig. 13. Sygnały cdpcwiednich pasm uzyskane z tych układów cdwrctnej transfcrmacji 504, 505, 506 są łączcne w dwóch stcpoiach filtrów syntezy pasm 507, 508.
Wyjścia układów cdwrctnej transfcrmacji 505 i 506 są, dcłączcne dc filtru syntezy pasm 507, w którym są łączcne. Następnie, wyjście filtru syntezy pasm 507 i wyjście układu cdwrctnej transfcrmacji 504 są dcłączcne dc drugiegc filtru syntezy pasm 508. Sygnał wyjścicwy drugiegc filtru syntezy pasm 508 jest cdprcwadzcne z zacisku 509 (zacisk 404 z fig. 15).
Na fig. 17 wyjaśnicnc spcsób kcdcwaoia przeprcwadzanegc w urządzeniu dc kcdcwaoia pckazaoym oa fig. 12. W przykładzie z fig. 17, sygnał widmcwy jest sygnałem uzyskanym z układu transfcrmacji z fig. 13. Na fig. 17 przedstawicnc, w decybelach, pczicmy bezwzględnych wartcści sygnałów widmcwych (składcwe sygnału) przetwarzanych za pcmccą zmcdyfikcwanej dyskretnej traosfcrmacji kcsinuscwej MDCT.
Na fig. 17, sygnał wejścicwy jest przekształccoy oa 64 sygnały widmcwe w każdym załcżcnym blcku czascwym. Te sygnały widmcwe są pcłączcoe w grupy, ckreślaoe jakc jedncstki kcdcwaoia, cdpcwiadające pięciu załcżcnym pasmcm b1 ± b5, jak zaznaczcoc oa fig. 17, craz przechcdzą ncrmalizację i kwantyzację. W tym przykładzie, szerckcści pasm cdpcwiednich jedncstek kcdcwania są węższe dla pasm c mniejszych częstctliwcściach i szersze dla pasm c większych częstctliwcściach pc tc, by kcntrclcwać występcwanie kwantyzacji szumu w cdniesieniu dc własncści charakterystyki słyszalncści.
W cpisaoym przykładzie, pasma w których składcwe częstctliwcści są kwantcwane, są ustalcne. Z tegc pcwcdu, jeśli np. składcwe widma kcnceotrują się w cbszarze w ckclicy pewnych kcnkretnych częstctliwcści, jeśli próbuje się kwaotcwać te składcwe widma z wystarczającą dckładncścią, trzeba przydzielić wiele bitów dla dużej liczby pczcstałych składcwych widma przynależących dc tegc samegc pasma, cc te składcwe widma.
Jak wynika z fig. 17, gdy ncrmalizacja jest wykonywana w przypadku, gdy sygnały są łączcne w załcżcne pasma, wartcści współczynnika ncrmalizacji są ocrmalizcwane oa pcdstawie cgóloegc współczynnika ncrmalizacji wyzoaczanegc przez składcwą charakterystyki dźwięku, np., w paśmie częstctliwcści b3, gdzie składcwa charakterystyki dźwięku jest zawarta w sygnale.
174 314
FIG.1
FIG.2
174 314 ( 5TAR.T )
FIG.3
174 314
FIG.4
Ο
CZĘSTOTLr
FIG.5 illlli i b-ι i ba i llłllillhllllllllilllllilhlililli b3 | b4 [ bS {
CZĘSTOTL.FIG.6 i
»
llllilhililillllillllnh.lililli b2 I b3 | M | bS |
C.ZĘST0TL. ——
FIG.7
174 314
cząSTOTi. —FIG.8 ,6/0
I----------------------------1
1----------------------------j
FIG.9 ,715
I
FIG.10
174 314
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU nr ten - 4
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU t
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU tCB
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU
D
SKŁADOWA CHARAKTERYSTYKI SZUMU l·
SKŁADOWA CHARAKTERYSTYKI SZUMU nC2
Z z
X
X
X
INF. O POŁOŻENIU ŚRODKOWYM CP=15
INF. O DOKŁAD— NOŚCI KWANTYZACU-e_fiINF. o WSPÓŁCZ. NORMALIZACJI
INF. O SKŁADOWEJ SYGNAŁU
INF. O SKŁADOWEJ SYGNAŁU scb
INF. O SKŁADOWEJ SYGNAŁU SCc INF. O SKŁADOWEJ SYGNAŁU Sed
INF. O SKŁADOWEJ SYGNAŁU SCe
INF. O DOKŁADNOŚCI KWANTYZACJI = 2_
INF. O WSPÓŁCZ. NORMALIZACJI \ INF. O SKŁADOWEJ \ SYGNAŁU S^
SKŁADOWA CHARAKTERYSTYKI
SZUMU „ nC3
Okładowa CHARAKTERYSTYKI SZUMU nC4
INF. O SKŁADOWEJ SYGNAŁU SC? χ INF. O SKŁADOWEJ \ SYGNAŁU SC„
SKŁADOWA CHARAKTERYSTYKI SZUMU nC5
FIG.11
174 314
FIG.12
FIG.13
FIG.14
FIG.15
FIG.16
174 314
CZĘSTOlL.
FIG.17
7//
FIG.18
FIG.19
174 314
KWAW^O- WANA WARTOŚĆ kob
+ 1 00
+ 2/3 100
+ 1/3 110
+ 0 1111
-1/3 1110
-2/3 101
-1 01
FIG.20A
KWANTO- WA NA wartoSĆ kOD
+ 1 1110
+ 2/3 1100
+ 1/3 100
+ 0 0
-13 101
-2/3 1101
-1 1111
FIG.20B
Departament Wydawnictw UP RP. Nakład 90 egz. Cena 4,00 zł

Claims (7)

  1. Zastrzeżenia patentowe
    1. Sposób dekodowania sygnałów cyfrowych, zwłaszcza do dekodowania zakodowanego sygnału poddanego transformacji na składowe częstotliwościowe, z zastosowaniem transformacji odwrotnej, znamienny tym, że poddaje się dekodowaniu znormalizowany i zakodowany pierwszy sygnał zawierający składowe charakterystyki dźwięku i dekoduje się drugi sygnał zawierający składowe szumu, przeprowadza się syntezę poszczególnych sygnałów i ich odwrotną transformację, przy czym podczas dekodowania pierwszego sygnału odtwarza się maksymalną składową częstotliwościową charakterystyki dźwięku, na podstawie transmitowanych współczynników normalizacji.
  2. 2. Sposób według zastrz. 1, znamienny tym, że odwrotną transformację sygnałów przeprowadza się przed ich syntezą.
  3. 3. Sposób według zastrz. 1, znamienny tym, że pierwszy sygnał zawiera składowe charakterystyki dźwięku zachodzące na siebie w dziedzinie częstotliwości.
  4. 4. Sposób według zastrz. 1, znamienny tym, że współczynniki normalizacji ustala się tak, że ze zmniejszaniem ich wartości wzrasta dokładność.
  5. 5. Urządzenie do dekodowania sygnałów cyfrowych, zwłaszcza zakodowanego sygnału poddanego transformacji na składowe częstotliwościowe, które to urządzenie jest zaopatrzone w układ rozkładu sekwencji kodu, układ dekodowania poszczególnych składowych oraz układ transformacji odwrotnej, znamienne tym, że z jednym wyjściem układu rozkładu sekwencji kodu (701), którego wejście jest połączone z nośnikiem zapisu danych (609) poprzez głowicę odczytu (708), układ demodulacji danych EFM (709) oraz dekoder wykrywania i korygowania błędów (710), jest połączony układ dekodowania składowych charakterystyki dźwięku (702) poprzez dekoder ze zmienną długością kodu (715), a z drugim wyjściem układu rozkładu sekwencji kodu (701) jest połączony układ dekodowania składowych charakterystyki szumu (703), przy czym wyjście układu dekodowania składowych charakterystyki dźwięku (702), wyjście układu dekodowania składowych charakterystyki szumu (703) i trzecie wyjście układu rozkładu sekwencji kodu (701), są dołączone do wejść układu syntezy i transformacji (711).
  6. 6. Urządzenie według zastrz. 5, znamienne tym, że wyjście układu dekodowania składowych charakterystyki dźwięku (702), wyjście układu dekodowania składowych charakterystyki szumu (703) i trzecie wyjście układu rozkładu sekwencji kodu (701), są dołączone do bloku syntezy (704), którego wyjście jest dołączone do bloku odwrotnej transformacji (705), w układzie syntezy i transformacji (711).
  7. 7. Urządzenie według zastrz. 5, znamienne tym, że wyjście układu dekodowania składowych charakterystyki dźwięku (702) i trzecie wyjście układu rozkładu sekwencji kodu (701) są dołączone do jednego bloku odwrotnej transformacji (713), a wyjście układu dekodowania składowych charakterystyki szumu (703) jest dołączone do drugiego bloku odwrotnej transformacji (712), przy czym wyjścia obydwu bloków odwrotnej transformacji (712,713) są połączone z blokiem syntezy (714), w układzie syntezy i transformacji (711).
PL94322680A 1993-06-30 1994-06-29 Sposób i urządzenie do dekodowania sygnałów cyfrowych PL174314B1 (pl)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18332293 1993-06-30
PCT/JP1994/001056 WO1995001680A1 (fr) 1993-06-30 1994-06-29 Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement

Publications (1)

Publication Number Publication Date
PL174314B1 true PL174314B1 (pl) 1998-07-31

Family

ID=16133682

Family Applications (2)

Application Number Title Priority Date Filing Date
PL94322680A PL174314B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do dekodowania sygnałów cyfrowych
PL94307740A PL173718B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do kodowania sygnałów cyfrowych

Family Applications After (1)

Application Number Title Priority Date Filing Date
PL94307740A PL173718B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do kodowania sygnałów cyfrowych

Country Status (10)

Country Link
US (1) US5765126A (pl)
EP (2) EP0663739B1 (pl)
JP (1) JP3721582B2 (pl)
KR (1) KR100368854B1 (pl)
CN (2) CN1099777C (pl)
BR (1) BR9405445A (pl)
DE (2) DE69428030T2 (pl)
PL (2) PL174314B1 (pl)
RU (1) RU2131169C1 (pl)
WO (1) WO1995001680A1 (pl)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3282661B2 (ja) * 1997-05-16 2002-05-20 ソニー株式会社 信号処理装置および方法
EP0887958B1 (en) * 1997-06-23 2003-01-22 Liechti Ag Method for the compression of recordings of ambient noise, method for the detection of program elements therein, devices and computer program therefor
WO1999017279A1 (en) * 1997-09-30 1999-04-08 Siemens Aktiengesellschaft A method of encoding a speech signal
US6965697B1 (en) * 1998-07-15 2005-11-15 Sony Corporation Coding apparatus and method, decoding apparatus and method, data processing system, storage medium, and signal
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6801887B1 (en) * 2000-09-20 2004-10-05 Nokia Mobile Phones Ltd. Speech coding exploiting the power ratio of different speech signal components
EP1442453B1 (en) * 2001-10-19 2006-09-06 Koninklijke Philips Electronics N.V. Frequency-differential encoding of sinusoidal model parameters
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法
JP3900000B2 (ja) * 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US6973579B2 (en) 2002-05-07 2005-12-06 Interdigital Technology Corporation Generation of user equipment identification specific scrambling code for the high speed shared control channel
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
ATE381092T1 (de) * 2002-11-29 2007-12-15 Koninkl Philips Electronics Nv Audiodekodierung
DE602006012637D1 (de) 2005-04-01 2010-04-15 Qualcomm Inc Vorrichtung und Verfahren für die Teilband-Sprachkodierung
TR201821299T4 (tr) 2005-04-22 2019-01-21 Qualcomm Inc Kazanç faktörü yumuşatma için sistemler, yöntemler ve aparat.
CN1831940B (zh) * 2006-04-07 2010-06-23 安凯(广州)微电子技术有限公司 基于音频解码器的音调和节奏调节方法
KR101261524B1 (ko) 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
RU2451998C2 (ru) * 2007-09-19 2012-05-27 Квэлкомм Инкорпорейтед Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
RU2464540C2 (ru) * 2007-12-13 2012-10-20 Квэлкомм Инкорпорейтед Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
KR20100086000A (ko) 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
RU2470385C2 (ru) * 2008-03-05 2012-12-20 Войсэйдж Корпорейшн Система и способ улучшения декодированного тонального звукового сигнала
US8498874B2 (en) * 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
WO2011045465A1 (en) * 2009-10-12 2011-04-21 Nokia Corporation Method, apparatus and computer program for processing multi-channel audio signals
EP2523473A1 (en) * 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer
JP6021498B2 (ja) 2012-08-01 2016-11-09 任天堂株式会社 データ圧縮装置、データ圧縮プログラム、データ圧縮システム、データ圧縮方法、データ伸張装置、データ圧縮伸張システム、および圧縮データのデータ構造
EP2720222A1 (en) 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
RU2573248C2 (ru) * 2013-10-29 2016-01-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский технический университет связи и информатики (ФГОБУ ВПО МТУСИ) Способ измерения спектра информационных акустических сигналов телерадиовещания и устройство для его осуществления

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3973081A (en) * 1975-09-12 1976-08-03 Trw Inc. Feedback residue compression for digital speech systems
US4170719A (en) * 1978-06-14 1979-10-09 Bell Telephone Laboratories, Incorporated Speech transmission system
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS59223032A (ja) * 1983-06-01 1984-12-14 Sony Corp ディジタル信号伝送装置
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
JPH061916B2 (ja) * 1986-10-28 1994-01-05 日本電気株式会社 帯域分割符号化復号化装置
EP0267344B1 (en) * 1986-10-30 1993-09-01 International Business Machines Corporation Process for the multi-rate encoding of signals, and device for carrying out said process
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JP2751201B2 (ja) * 1988-04-19 1998-05-18 ソニー株式会社 データ伝送装置及び受信装置
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4827336A (en) * 1987-12-18 1989-05-02 General Electric Company Symbol code generation processing from interframe DPCM of TDM'd spatial-frequency analyses of video signals
IL89672A (en) * 1988-04-29 1994-04-12 Motorola Inc Spectral efficient method of transmitting information signal
JP2638091B2 (ja) * 1988-06-24 1997-08-06 ソニー株式会社 データ伝送方法
CA2002015C (en) * 1988-12-30 1994-12-27 Joseph Lindley Ii Hall Perceptual coding of audio signals
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
US5166686A (en) * 1989-06-30 1992-11-24 Nec Corporation Variable length block coding with changing characteristics of input samples
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JPH03109824A (ja) * 1989-09-22 1991-05-09 Sony Corp ディジタル信号符号化装置
JP2906483B2 (ja) * 1989-10-25 1999-06-21 ソニー株式会社 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
JP2870050B2 (ja) * 1989-10-18 1999-03-10 ソニー株式会社 ディジタルデータの高能率符号化方法
EP0428156B1 (en) * 1989-11-14 1996-08-21 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variations between successive blocks
US5081681B1 (en) * 1989-11-30 1995-08-15 Digital Voice Systems Inc Method and apparatus for phase synthesis for speech processing
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2827410B2 (ja) * 1990-03-14 1998-11-25 ソニー株式会社 デイジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5222289A (en) * 1990-07-10 1993-06-29 Gemcor Engineering Corp. Method and apparatus for fastening
US5244705A (en) * 1990-08-24 1993-09-14 Sony Corporation Disc-shaped recording medium
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder
JP2853717B2 (ja) * 1991-03-08 1999-02-03 日本電気株式会社 可変ビット型adpcmトランスコーダ
ATE165198T1 (de) * 1991-03-29 1998-05-15 Sony Corp Reduzierung der zusaztinformation bei teilbandkodierungsverfahren
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3395192B2 (ja) * 1991-05-25 2003-04-07 ソニー株式会社 ディジタルオーディオ信号再生装置、ディスクプレーヤの再生ポーズ回路及びディスク再生装置の再生制御回路
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE4225434A1 (de) * 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0535889B1 (en) * 1991-09-30 1998-11-11 Sony Corporation Method and apparatus for audio data compression
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
KR0150955B1 (ko) * 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
JPH0629934A (ja) * 1992-07-10 1994-02-04 Nippon Hoso Kyokai <Nhk> 適応差分符号化伝送方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体

Also Published As

Publication number Publication date
CN1099777C (zh) 2003-01-22
WO1995001680A1 (fr) 1995-01-12
KR950703231A (ko) 1995-08-23
EP0663739B1 (en) 2001-08-22
PL173718B1 (pl) 1998-04-30
RU2131169C1 (ru) 1999-05-27
US5765126A (en) 1998-06-09
EP0663739A1 (en) 1995-07-19
CN1113096A (zh) 1995-12-06
CN1217502C (zh) 2005-08-31
BR9405445A (pt) 1999-09-08
EP0663739A4 (en) 1998-09-09
EP1083674A2 (en) 2001-03-14
EP1083674A3 (en) 2001-04-11
DE69428030D1 (de) 2001-09-27
DE69428030T2 (de) 2002-05-29
JP3721582B2 (ja) 2005-11-30
DE69432538T2 (de) 2004-04-01
CN1440144A (zh) 2003-09-03
KR100368854B1 (ko) 2003-05-17
PL307740A1 (en) 1995-06-12
DE69432538D1 (de) 2003-05-22
EP1083674B1 (en) 2003-04-16

Similar Documents

Publication Publication Date Title
PL174314B1 (pl) Sposób i urządzenie do dekodowania sygnałów cyfrowych
CA2140779C (en) Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
EP0720307B1 (en) Digital audio signal coding and/or decoding method
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
US5805770A (en) Signal encoding apparatus, signal decoding apparatus, recording medium, and signal encoding method
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH08166799A (ja) 高能率符号化方法及び装置
JP3685823B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP3465697B2 (ja) 信号記録媒体
JP3465698B2 (ja) 信号復号化方法及び装置
JPH07336231A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
MXPA95004960A (en) Method and information coding device, method and information decoding device, method of transmission of information, and means of registration of information
JPH10107640A (ja) 信号再生装置および方法