FI119343B - Method for signal processing and signal processing apparatus - Google Patents
Method for signal processing and signal processing apparatus Download PDFInfo
- Publication number
- FI119343B FI119343B FI20011924A FI20011924A FI119343B FI 119343 B FI119343 B FI 119343B FI 20011924 A FI20011924 A FI 20011924A FI 20011924 A FI20011924 A FI 20011924A FI 119343 B FI119343 B FI 119343B
- Authority
- FI
- Finland
- Prior art keywords
- signal
- subband
- subbands
- frames
- information
- Prior art date
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
119343119343
Menetelmä signaalin käsittelemiseksi ja signaalin käsittelylaiteMethod for signal processing and signal processing apparatus
Nyt esillä oleva keksintö kohdistuu menetelmään taajuuskaistaltaan rajoitetun signaalin käsittelemiseksi, jossa analogisessa muodossa 5 oleva signaali muutetaan digitaaliseksi, jaetaan mainittu taajuuskaista ainakin ensimmäiseen ja toiseen alikaistaan, ja etsitään toisesta alikaistasta yhtä tai useampaa sinisignaalia, jolloin kunkin löydetyn sinisignaalin vaikutus olennaisesti poistetaan toisen alikaistan sisältämästä signaalista. Keksintö kohdistuu lisäksi signaalin 10 käsittelylaitteeseen, jossa on välineet analogisessa muodossa olevan, taajuuskaistaltaan rajoitetun signaalin muuntamiseksi digitaaliseksi, välineet mainitun taajuuskaistan jakamiseksi ainakin ensimmäiseen ja toiseen alikaistaan, välineet yhden tai useamman sinisignaalin etsimiseksi toisen alikaistan signaalista, ja välineet kunkin löydetyn 15 sinisignaalin vaikutuksen olennaisesti poistamiseksi toisen alikaistan sisältämästä signaalista.The present invention is directed to a method for processing a frequency band limited signal, wherein a signal in analog form 5 is digitized, dividing said frequency band into at least first and second subbands, and searching one or more blue signals in the second subband. The invention further relates to a signal processing device 10 having means for converting a frequency-limited signal in analog form to a digital one, means for dividing said frequency band into at least first and second subbands, means for searching one or more blue signals from the second subband signal; from the signal contained in the subband.
Tunnetaan menetelmiä, joissa analoginen audiosignaali muunnetaan digitaaliseksi ja tallennetaan tallennusvälineelle tai välitetään tiedon-20 siirtokanavan välityksellä vastaanottavaan laitteeseen. Digitaaliseen muotoon muunnettu signaali muunnetaan toistovaiheessa takaisin V·: analogiseksi audiosignaaliksi, jolloin se on kuultavissa äänenä. Analo- ·' gia/digitaalimuunnoksessa audiosignaalista otetaan olennaisesti sään- *"*: nöllisin väliajoin näytteitä, jotka kuvaavat audiosignaalin hetkellisiä ·:··· 25 arvoja. Koska näytteenottoväli ei ole äärettömän pieni, tapahtuu näyt- :*·*. teenotossa alkuperäisen informaation häviämistä, joka ilmenee laskostumisena. Analogia/digitaalimuunnoksessa käytettävä näytteen-ottotaajuus asettaa ylärajan sille, kuinka korkeita taajuuksia voidaan \,lm muuntaa digitaaliseksi. Nyquistin teoreeman mukaan näytteenottotaa- ;·* 30 juuden tulee olla yli kaksinkertainen suurimpaan muunnettavaan signaalitaajuuteen verrattuna.Methods are known for converting an analog audio signal to a digital one and storing it on a recording medium or transmitting it over a data transmission channel to the receiving device. The signal converted to digital is converted back into a V ·: analog audio signal during playback, so that it is audible. In the analogy / digital conversion, samples of the audio signal are taken at substantially regular intervals, * * * representing the instantaneous values of the audio signal:: ··· 25. Since the sampling interval is not infinitely small, sampling of the original information takes place. The sampling rate used in analog / digital conversion sets the upper limit for how high frequencies can be \, lm converted to digital. According to Nyquist's theorem, the sampling rate · * 30 hairs should be more than twice the maximum signal frequency to be converted.
··· • * • • · · :·.* Korkealaatuisessa audiosignaalin digitalisoinnissa käytetään näytteen- " ottotaajuutena jopa yli 40 kHz:n taajuuksia, esim. CD-levyille tallennuk- 35 sessa käytetään näytteenottotaajuutena olennaisesti 44100 Hz, jolloin suurin muunnettava audiosignaalissa esiintyvä taajuus on teoriassa n. 22050 Hz, käytännössä kuitenkin n. 20 000 kHz.··· • * • • · ·: ·. * For high quality audio signal digitization, frequencies of up to 40 kHz are used, e.g., for recording on CDs, the sampling frequency is essentially 44100 Hz, whereby the maximum frequency of the audio signal to be converted is used. is in theory about 22050 Hz, but in practice about 20,000 kHz.
2 119343 Näytteenottotaajuuden lisäksi analogia/digitaalimuunnoksen laatuun vaikuttaa muunnoksessa käytettävä tarkkuus, eli resoluutio. Tarkkuus ilmaisee sen, kuinka monta erilaista näytearvoa analo-5 gia/digitaalimuunnoksessa on mahdollista muodostaa. Esimerkiksi 16-bittisessä muunnoksessa erilaisia mahdollisuuksia on 65536, mikä katsotaan riittäväksi audiosignaalin korkealuokkaisessa muuntamisessa digitaaliseksi.2 119343 In addition to the sampling rate, the quality of the analog / digital conversion is affected by the resolution used in the conversion, i.e. the resolution. Accuracy indicates how many different sample values can be generated in the analog-to-digital conversion. For example, in a 16-bit conversion, there are 65536 different possibilities, which is considered sufficient for high-quality conversion of the audio signal to digital.
10 Ongelmaksi audiosignaalin digitaalisoinnissa muodostuu mm. bittien suuri määrä. Esimerkiksi edellä esitetyillä lukuarvoilla on sekunnin mittaisesta, kaksikanavaisesta signaalista muodostetuissa 16-bittisissä näytteissä 1411200 bittiä (=2 x 44100 x 16), siis 176400 tavua. Tällöin tarvitaan runsaasti tallennus/tiedonsiirtokapasiteettia, jotta digitaali-15 muotoon muunnettu audiosignaali voidaan tallentaa muistivälineelle ja/tai siirtää tiedonsiirtokanavan kautta vastaanottajalle.10 The problem with the digitalization of the audio signal is e.g. large number of bits. For example, the above numerical values have 1411200 bits (= 2 x 44100 x 16), i.e. 176,400 bytes in a 16-bit sample of a two-channel signal lasting one second. In this case, a large amount of storage / communication capacity is required in order to store the digital-converted audio signal on a storage medium and / or to transmit to the recipient via the communication channel.
On kehitetty erilaisia tiivistysmenetelmiä (kompressointimenetelmiä), joilla bittien lukumäärää pyritään vähentämään. Kompressointimene- 20 telmät ovat joko häviöttömiä (lossless) tai häviöllisiä (lossy). Häviöttö- ·**:* missä menetelmissä alkuperäinen digitaalinen informaatio palautuu • · kompressoidun informaation dekompressoinnissa. Häviöllisessä komp-:.*ί'·* ressiossa kompressoidun signaalin dekompressointi ei välttämättä pa- *:··: lauta alkuperäistä digitaalista informaatiota täysin samanlaisena.Various compression methods (compression methods) have been developed to reduce the number of bits. Compression methods are either lossless or lossy. Lossless **: * In which methods the original digital information is restored by decompressing the compressed information. In lossy comp -:. * Ί '· * decompression of the compressed signal may not *: ··: reproduce the original digital information in exactly the same way.
·:·*· 25 Useissa audiosignaalin kompressointimenetelmissä käytetään häviöl- lista kompressiota, koska sillä on mahdollista saada huomattavasti tehokkaampi tiivistys kuin häviöttömällä kompressiolla. Erot dekom-··.·. pressoidun, analogiseksi muunnetun signaalin ja alkuperäisen signaa- ..: Iin välillä eivät häviöllistä kompressiotakaan käytettäessä ole yleensä *·:** 30 kovin helposti korvin kuultavissa. Häviöllisestä kompressoinnista *""* huolimatta ei kaikissa tilanteissa saavuteta kuitenkaan riittävän teho- kasta tiivistystä, jolloin audiosignaalin tallennus/kuuntelu voi häiriintyä.· · · · · · · · · · · · · · · · · · · · · · · · Many audio signal compression methods use lossy compression because it provides a much more efficient compression than lossless compression. Differences decom- ··. ·. between a compressed, analog-to-analog signal, and the original signal .., when using lossy compression, generally * ·: ** is not very easily heard by the ear. However, despite the lossy compression * "" *, not enough compression will be achieved in all situations, which may interfere with the recording / listening of the audio signal.
• · • * ” Eräs tunnettu audiosignaalin häviöllinen kompressointimenetelmä on *· 35 ns. MP3. Tämä menetelmä on suhteellisen tehokas signaaleilla, joilla on hyvät korrelaatio-ominaisuudet. Kuitenkin korkeilla taajuuksilla, joissa esiintyy pääasiassa kohinaa, MP3-kompressio ja muutkin tun 3 119343 netut kompressiomenetelmät ovat melko tehottomia. Tällöin suuri osa kompressiossa muodostetusta binääri-informaatiosta koostuu kohinan osuudesta. Tyypillinen bittivirta MP3-kompressiossa on esim. n. 128000 bittiä sekunnissa.• · • * ”One known audio lossy compression method is * · 35 so-called. MP3. This method is relatively effective for signals with good correlation properties. However, at high frequencies, where noise is predominant, MP3 compression and other known compression methods are quite inefficient. Thus, much of the binary information generated in the compression consists of a portion of noise. A typical bit stream in MP3 compression is, for example, about 128000 bits per second.
55
Nyt esillä olevan keksinnön eräänä tarkoituksena on aikaansaada tehokkaampi menetelmä taajuuskaistaltaan rajoitetun signaalin tiivistämiseksi ja käsittelemiseksi digitaalisessa muodossa sekä signaalin käsittelylaite. Keksintö perustuu siihen ajatukseen, että jaetaan käsiteltävä 10 taajuuskaista ainakin kahteen alikaistaan ja ainakin yhdessä alikaistas-sa esiintyviä signaaleita analysoidaan ja etsitään näissä signaaleissa mahdollisesti esiintyviä sinisignaaleita. Täsmällisemmin ilmaistuna nyt esillä olevan keksinnön mukaiselle menetelmälle on pääasiassa tunnusomaista se, että jaetaan toinen alikaista ainakin kahteen 15 osakaistaan, ja selvitetään kunkin osakaistan sisältämän audiosignaalin energia, joita käytetään signaalissa olevan kohinan esittämiseen. Keksinnön mukaiselle signaalin käsittelylaitteelle on pääasiassa tunnusomaista se, että se käsittää välineet toisen aiikaistan jakamiseksi kahteen tai useampaan osakaistaan, välineet kunkin 20 osakaistan sisältämän energian selvittämiseksi signaalissa olevan ·;*·* kohinan esittämiseksi mainittujen osakaistojen sisältämien energioiden :.**i avulla.It is an object of the present invention to provide a more efficient method of compressing and processing a signal having a limited frequency bandwidth in digital form, and a signal processing device. The invention is based on the idea of dividing the 10 frequency bands to be processed into at least two subbands and analyzing and searching for any blue signals occurring in at least one subband. More specifically, the method of the present invention is essentially characterized by dividing the second subband into at least two subbands, and determining the energy of the audio signal contained in each subband used to represent the noise in the signal. The signal processing device according to the invention is essentially characterized in that it comprises means for dividing a second time band into two or more subbands, means for determining the energy contained in each of the 20 subbands by displaying the noise in the signal;
• · « t * · • · • :*·: Nyt esillä olevalla keksinnöllä saavutetaan merkittäviä etuja tunnetun *:**: 25 tekniikan mukaisiin ratkaisuihin verrattuna. Keksinnön mukaisella me- ; *·; netelmällä saadaan tietyllä taajuuskaistalla esiintyvä analoginen sig naali muunnettua digitaaliseen muotoon siten, että digitaalisoinnissa tarvittava binääri-informaatio voidaan esittää pienemmällä bittimäärällä kuin tunnetun tekniikan mukaisia menetelmiä käytettäessä, siis tiivis-*:** 30 tystehokkuutta saadaan merkittävästi parannettua. Esimerkiksi edellä *"*· esitetyssä esimerkkitilanteessa, jossa kaksikanavaisten 16-bittisten näytteiden näytteenottotaajuus on olennaisesti 44100 Hz, voidaan kek-:·[ sinnön mukaista menetelmää sovellettaessa alkuperäinen signaali \ . esittää n. 64000 bitillä/s. Tämä vastaa yli 20-kertaista pakkaustehok- *· *: 35 kuutta. Tällöin esimerkiksi audioinformaation tallennuksessa tarvitaan vähemmän muistia ja audiosignaalia voidaan välittää tiedonsiirtokana- 4 119343 vassa pienemmällä bittinopeudella kuin tunnetun tekniikan mukaisissa järjestelmissä.The present invention provides significant advantages over the prior art *: **: 25 solutions. With the honey of the invention; · *; the method can convert the analog signal in a certain frequency band into a digital format such that the binary information needed for digitization can be represented with a smaller number of bits than the prior art methods, thus significantly improving the compression efficiency of *: ** 30. For example, in the example situation described above * "* ·, where the sampling rate of the two-channel 16-bit samples is essentially 44100 Hz, the original signal \ can be displayed in the method according to the invention at about 64000 bits / s. - * · *: 35 six, whereby, for example, less information is needed to store audio information and the audio signal can be transmitted on a data transmission channel at a lower bit rate than in prior art systems.
Keksintöä selostetaan seuraavassa tarkemmin viitaten samalla oheisiin 5 piirustuksiin, joissa kuva 1 esittää erästä audiosignaalin taajuusspektriä, kuvat 2a ja 2b 10 esittävät kuvan 1 audiosignaalia muunnettuna keksinnön erään edullisen suoritusmuodon mukaisella menetelmällä alikaistoiksi, kuva 3 esittää periaatetta toisen alikaistan jakamiseksi osakaistoi-15 hin keksinnön erään edullisen suoritusmuodon mukaisessa menetelmässä, kuva 4 esittää keksinnön mukaisella menetelmällä muodostetusta signaalista rekonstruoitua audiosignaalia, 20 ·..*:* kuva 5 esittää keksinnön erään edullisen suoritusmuodon mukaista V·: signaalin käsittelylaitetta, • t · • · · • ·:*·: kuva 6a esittää keksinnön erään edullisen suoritusmuodon mukai- ·:··· 25 sessa menetelmässä käytettävän absoluuttikehyksen ra- .*··. kennetta pelkistetysti, ··* ... kuva 6b esittää keksinnön erään edullisen suoritusmuodon mukai- * * ♦ sessa menetelmässä käytettävän differentiaalikehyksen ra-**:** 30 kennetta pelkistetysti, • · kuva 6c esittää keksinnön erään edullisen suoritusmuodon mukai- sessa menetelmässä käytettävistä kehyksistä muodostettua '! bittivirtaa, • · · * 35 kuva 7a esittää signaalimuutosten toteuttamista peräkkäisten kehys ten välillä, ja 5 119343 kuva 7b esittää nopeiden signaalimuutosten toteuttamista peräkkäisten kehysten välillä.The invention will now be described in more detail with reference to the accompanying drawings, in which Figure 1 illustrates a frequency spectrum of an audio signal, Figures 2a and 2b illustrate the audio signal of Figure 1 converted to subbands by a method according to a preferred embodiment of the invention. 4 shows an audio signal reconstructed from a signal generated by the method according to the invention, 20 · .. *: * Figure 5 shows a V · signal processing device according to a preferred embodiment of the invention, • t · • · · ·:: · shows an absolute frame used in a method according to a preferred embodiment of the invention. Figure 6b illustrates a differential frame for use in a method according to a preferred embodiment of the invention - *: ** 30 structures in a simplified manner, - · Figure 6c shows a method for use in a method according to a preferred embodiment of the invention framed '! bit stream, · · · * 35 Figure 7a shows the implementation of signal changes between successive frames, and 5 119343 Figure 7b shows the implementation of fast signal changes between successive frames.
5 Seuraavassa keksintöä selostetaan käyttämällä esimerkkinä analogisesta signaalista audiosignaalia, jonka taajuuskaista on rajoitettu välille 0-16 kHz. On kuitenkin selvää, että tässä esitettävät lukuarvot ovat vain keksintöä selventäviä, ei rajoittavia esimerkkejä. Kuvassa 1 on eräs esimerkki tällaisesta audiosignaalista. Keksinnön erään edullisen 10 suoritusmuodon mukaisessa menetelmässä tämä taajuuskaista jaetaan kahteen alikaistaan: ensimmäiseen alikaistaan ja toiseen alikais-taan. Jakaminen suoritetaan edullisesti siten, että molemmat alikaistat ovat olennaisesti yhtä leveitä, mutta myös muunlaisia jakoperusteita voidaan soveltaa. Kuvassa 2a on esitetty tällä tavoin jaetun, kuvan 1 15 mukaisen signaalin ensimmäistä alikaistaa, ja vastaavasti kuvassa 2b on esitetty kuvan 1 mukaisen signaalin toista alikaistaa.In the following, the invention will be described using, by way of example of an analog signal, an audio signal having a frequency band limited to 0-16 kHz. However, it is to be understood that the numerical values presented herein are merely illustrative and not limiting examples of the invention. Figure 1 shows an example of such an audio signal. In a method according to a preferred embodiment of the invention, this frequency band is divided into two subbands: a first subband and a second subband. The splitting is preferably performed such that both subbands are substantially the same width, but other splitting criteria can also be applied. Fig. 2a shows a first subband of the signal thus distributed, according to Fig. 1 15, and Fig. 2b, respectively, shows a second subband of the signal according to Fig. 1.
Kuvassa 5 on esitetty keksinnön erään edullisen suoritusmuodon mukainen signaalin käsittelylaite 1, joka käsittää edullisesti ainakin sig-20 naalin koodauslohkon 2. Signaalin koodauslohkossa 2 suoritetaan ··*:’ analogisen signaalin muuntaminen digitaaliseksi signaaliksi keksinnön \*·: mukaisella menetelmällä. Lisäksi signaalin käsittelylaite 1 voi käsittää 0 '· signaalin dekoodauslohkon 3, jossa digitaalisessa muodossa oleva *:*: signaali muunnetaan takaisin analogiseksi signaaliksi. Digitaaliseen ·:··: 25 muotoon muunnettava analoginen signaali on esimerkiksi yhdessä tai ;**\ useammassa mikrofonissa (ei esitetty) muodostettavaa audiosignaalia, joka voi sisältää musiikkia, laulua, puhetta, tms. Analoginen signaali johdetaan analogia/digitaalimuuntimeen 4, jossa suoritetaan signaalin muuntaminen digitaaliseksi. Näytteenottotaajuutena on sopivimmin vä-'*:** 30 hintään kaksi kertaa analogiasignaalin ylärajataajuus, siis tämän esi- ’·*’· merkin mukaisessa järjestelmässä vähintään 32 kHz. Analo- :**]: gia/digitaalimuuntimesta digitaalisessa muodossa oleva signaali joh- :·' detaan ensimmäiseen 5 ja toiseen suodattimeen 6. Ensimmäisessä *! suodattimessa 5 suoritetaan edullisesti alipäästösuodatus, jolloin en- " 35 simmäisen suodattimen 5 ulostulossa on ensimmäisellä alikaistalla oleva osa digitalisoitua analogiasignaalia, tässä esimerkissä taajuusalueella 0-8 kHz. Toisessa suodattimessa 6 vastaavasti suoritetaan 6 119343 edullisesti ylipäästösuodatus, jolloin toisen suodattimen 6 ulostulossa on toisella alikaistalla oleva osa digitalisoitua analogiasignaalia, tässä esimerkissä taajuusalueella 8-16 kHz. Suodattimet 5, 6 ovat edullisesti digitaalisia suodattimia. On kuitenkin selvää, että analogia/digitaali-5 muunnos voidaan suorittaa myös suodatusvaiheen jälkeen, jolloin suodattimina 5,6 käytetään analogisia suodattimia.Figure 5 illustrates a signal processing device 1 according to a preferred embodiment of the invention, preferably comprising at least a signal encoding block 2 of signal 2. The signal encoding block 2 performs a ·· *: 'conversion of an analog signal to a digital signal according to the method of the invention. In addition, the signal processing device 1 may comprise a 0 '· signal decoding block 3 in which the *: *: signal in digital form is converted back to an analog signal. An analog signal to be converted to a digital ·: ··: 25 format is, for example, an audio signal produced in one or; ** \ multiple microphones (not shown), which may include music, vocals, speech, etc. The analog signal is fed to an analog / digital converter 4 conversion to digital. Preferably, the sampling rate is at least '*: ** at least twice the upper limit of the analog signal, i.e., at least 32 kHz in the system according to this precursor' · * '·. Analog: **]: The signal from the digital / digital converter in digital format is: · applied to the first 5 and the second filter 6. In the first *! The filter 5 preferably has low pass filtering, wherein the output of the first 35 filters has a first subband portion of the digitized analog signal, in this example in the frequency range 0-8 kHz. The second filter 6, respectively, performs 6119343 preferably a high pass filter part of the digitized analog signal, in this example, in the frequency range 8-16 kHz Filters 5, 6 are preferably digital filters, but it is clear that the analog / digital-5 conversion can also be performed after the filtering step using analog filters as filters 5,6.
Ensimmäisen suodattimen 5 ulostulossa oleva signaali johdetaan de-simointilohkoon 7. Desimointilohkossa näytetaajuus sopivimmin puoli-10 tetaan, siis signaali desimoidaan kahdella. Tämä on mahdollista, koska ensimmäisen suodattimen 5 ulostuleva signaali ei olennaisesti sisällä korkeampia taajuuksia kuin ensimmäisen alikaistan ylärajataajuus. Tämä ylärajataajuus on korkeintaan V* näytteenottotaajuudesta fs. Desinfioitu signaali johdetaan kompressointilohkoon 8, jossa suoritetaan 15 signaalin kompressointi jollakin sinänsä tunnetulla menetelmällä, kuten MP3. Mainittakoon, että desimointilohkoa 7 ei tarvita, mikäli analo-gia/digitaalimuunnos suoritetaan vasta suodatusvaiheen jälkeen ja kullekin alikaistalle erikseen, koska tällöin voidaan näytteenottotaajuus valita alikaistan ylärajataajuuden mukaan sopivaksi.The signal at the output of the first filter 5 is applied to the decimation block 7. In the decimation block, the sample frequency is preferably halved, i.e. the signal is decimated by two. This is possible because the output signal of the first filter 5 does not contain substantially higher frequencies than the upper limit frequency of the first subband. This upper limit frequency is at most V * of the sampling frequency fs. The disinfected signal is led to a compression block 8 where the signal 15 is compressed by any method known per se, such as MP3. It should be noted that the decimation block 7 is not required if the analog / digital conversion is performed only after the filtering step and for each subband separately, since then the sampling frequency can be selected according to the subband upper limit frequency.
20 ·;- Toinen alikaista käsittää audiosignaalin ollessa kyseessä pääasiassa kohinaa, mutta satunnaisesti voi tällä toisella alikaistalla esiintyä myös v ·' harmonisia taajuuksia tai esim. musiikkisyntetisoijalla muodostettuja *:**: taajuuksia. Toisen suodattimen 6 ulostulosignaali johdetaan ensimmäi- ·:·*: 25 seen analysointilohkoon 9, jossa signaalista etsitään yhtä tai useam- paa, edullisesti korkeintaan neljää sinisignaalia. Kuvassa 1 ja vastaavasti kuvassa 2b on esitetty esimerkinomaisesti yksi sinisignaali, jonka taajuus on n. 11,5 kHz. Mikäli tällaisia sinisignaaleita löytyy, tutkitaan näiden sinisignaalien taajuus ja energia. Taajuus- ja energiainformaatio **:*' 30 tallennetaan edullisesti muistivälineisiin 10. Tämän jälkeen erotusloh- kossa 11 suoritetaan löydettyjen sinisignaalien energioiden vähentämi-nen toisen alikaistan signaalista. Tämän jälkeen erotuslohkon 11 ulos-tulossa on pääasiassa valkoista kohinaa.20 ·; - The second subband includes mainly noise in the case of an audio signal, but occasionally v · 'harmonic frequencies or *: ** frequencies generated by a music synthesizer may also occur in this second subband. The output signal of the second filter 6 is applied to a first analysis block 9, where one or more, preferably up to four, blue signals are searched for. Figure 1 and Figure 2b, respectively, illustrate by way of example a single blue signal having a frequency of about 11.5 kHz. If such blue signals are found, the frequency and energy of these blue signals are investigated. Frequency and energy information **: * '30 is preferably stored in memory means 10. Subsequently, in block 11, the energies of the detected blue signals from the second subband signal are subtracted. Thereafter, the output of the separation block 11 is predominantly white noise.
• ·· • · • · · *· 35 Erotuslohkon 11 jälkeen toisen alikaistan signaalista jäljelle jäänyt sig naali (kohinasignaali) voidaan esittää tiivistetyssä muodossa käyttäen seuraavaa menetelmää. Jaottelulohkossa 12 toisen alikaistan signaali 7 119343 jaetaan osakaistoihin, edullisesti kahdeksaan osakaistaan. Nämä osa-kaistat ovat sopivimmin olennaisesti samanlevyisiä, tässä esimerkissä siis 1 kHz. Toisessa analysointilohkossa 13 määritetään kunkin osa-kaistan sisältämän signaalin energia.After the difference block 11, the signal (noise signal) remaining from the signal of the second subband can be represented in a compressed form using the following method. In the distribution block 12, the signal 7 119343 of the second subband is divided into subbands, preferably eight subbands. These subbands are preferably substantially the same width, i.e. 1 kHz in this example. The second analyzing block 13 determines the energy of the signal contained in each subband.
55
Edellä esitettyjen vaiheiden jälkeen yhdistetään digitalisoitua analogista signaalia kuvaavat eri osat bittivirran muodostuslohkossa 14. Tämä suoritetaan edullisesti siten, että muodostetaan kehyksiä, joissa yksi osa on tarkoitettu ensimmäisen alikaistan kompressoidun signaali-in-10 formaation bittejä varten, yksi toinen osa on tarkoitettu mahdollisesti löydettyjen sinisignaalien taajuutta ja energiaa kuvaavaa binääri-infor-maatiota varten, ja yksi kolmas osa on tarkoitettu kunkin osakaistan signaalienergiaa kuvaavaa binääri-informaatiota varten. Sen jälkeen kun kehys on muodostettu, voidaan se siirtää jatkovaiheisiin, kuten 15 tallennettavaksi muistivälineisiin, esimerkiksi CD-levylle, MD-levylle, ja/tai DVD-levylle. Kehysinformaatio voidaan siirtää myös johonkin tiedonsiirtokanavaan, kuten televerkkoon, jossa informaatio voidaan välittää vastaanottajalle muunnettavaksi takaisin analogiasignaaliksi.Following the above steps, the various sections representing the digitized analog signal are combined in the bit stream generating block 14. This is preferably accomplished by forming frames in which one section is for the bits of the first subband compressed signal in-10, another section is for the frequency of and for binary information describing energy, and one third portion for binary information representing signal energy for each subband. Once the frame has been formed, it can be transferred to further steps such as storage on a storage medium, such as a CD, MD, and / or DVD. Frame information may also be transmitted to a communication channel, such as a telecommunications network, where the information may be transmitted to a recipient for conversion back into an analog signal.
20 Edellä esitettyjä vaiheita toistetaan analogiasignaalin käsittelyn ajan.The above steps are repeated during the processing of the analog signal.
• I· *··· \*·: Kuvataan vielä keksinnön erään edullisen suoritusmuodon mukaisella v*: menetelmällä digitoidun analogiasignaalin muuntamista takaisin analo- ·:··: giseksi signaaliksi signaalin dekoodauslohkossa 3. Binäärisignaali joh- ·:··; 25 detaan bittivirran jaottelulohkoon 15, jossa erotetaan ensimmäisen ali- .···. kaistan ja toisen alikaistan informaatiobitit toisistaan.I · * ··· \ *: further describes the conversion of the digitized analog signal into an analog signal in the v *: method according to a preferred embodiment of the invention, in the signal decoding block 3. The binary signal is led: ··; 25 is detected in the bit stream splitter block 15, where the first subwoofer ··· is separated. the information bits of the band and the second subband.
.. . Ensimmäisen alikaistan biteille suoritetaan dekompressio dekompres- sointilohkossa 16 sekä ylösnäytteistys ylösnäytteistyslohkossa 17. 30 Tällöin ylösnäytteistyslohkon ulostulossa on olennaisesti ensimmäisen *:··: alikaistan signaalia vastaava digitaalinen signaali.... The bits of the first subband are decompressed in the decompression block 16 and the up sampling in the up sampling block 17. The output of the up sampling block is then a substantially digital signal corresponding to the signal of the first *: ··: subband.
··· • ♦ · #« ./ Toisen alikaistan binääri-informaatiosta erotetaan bittien käsittelyloh- \ ” kossa 18 osakaistojen energiaa kuvaavat osat sekä mahdollisia sini- « » · ’· " 35 signaaleita kuvaavat osat. Osakaistojen energiainformaatio johdetaan kohinageneraattorille 19, jossa muodostetaan eri osakaistojen energioiden ja taajuusalueen mukaista kohinaa. Lisäksi kohinageneraattoris- 119343 δ sa 19 generoidaan sinisignaalit, joiden taajuus ja energia on ilmoitettu toisen alikaistan binääri-informaation sinisignaalia kuvaavassa osassa.··· • ♦ · # «./ The second subband binary information separates the energy sections of the subbands 18 into the bit processing block 18 and the portions representing the possible blue signals. The subband energy information is fed to the noise generator 19, where In addition, the noise generator 119343 δ sa 19 generates sinusoidal signals whose frequency and energy are indicated in the sinusoidal portion of the binary information of the second subband.
Sen jälkeen kun ensimmäisen ja toisen alikaistan digitaaliset signaalit 5 on rekonstruoitu vastaanotetusta binääri-informaatiosta, voidaan ne yhdistää summauslohkossa 20. Tämän jälkeen yhdistetty signaali muunnetaan analogiseksi digitaali/analogiamuuntimessa 21. Analoginen signaali voidaan johtaa esimerkiksi kaiuttimeen 22, jolloin signaali on kuultavissa äänenä.After reconstructing the first and second subband digital signals 5 from the received binary information, they can be combined in the summing block 20. The combined signal is then converted to analog in a digital / analog converter 21. The analog signal can be output to a speaker 22 for example.
1010
Keksinnön mukaisella menetelmällä muodostetun eri alikaistojen digitaalinen signaali-informaatio voidaan yhdistää monella eri tavalla bittivirraksi. Tämä voidaan toteuttaa esimerkiksi siten, että käytetään ensimmäisen alikaistan kompressoinnissa käytettävän kompressointime-15 netelmän mukaista kehysrakennetta ja lisätään siihen osia toisen alikaistan binääri-informaatiota varten. Tällöin joissakin sovelluksissa on mahdollista käsitellä keksinnön mukaisella menetelmällä muodostettua bittivirtaa sellaisellakin laitteella, joka on tarkoitettu ensimmäisellä ali-kaistalla käytettävän kompressiomenetelmän mukaisen bittivirran de-20 kompressoimiseen. Bittivirtaan lisätyt toisen alikaistan binääri-infor-maatio tulkitaan esimerkiksi virheellisiksi kehyksiksi. Tällöin dekom-pressoitu analogiasignaali käsittää vain osan analogiasignaalin taa-··*:*: juuskaistasta, mutta äänenlaatu voi silti olla riittävä esimerkiksi keksin- ·:··: nön mukaisella menetelmällä tallennettuihin musiikkikappaleisiin tu- ·:··: 25 tustumista varten.The digital signal information of the various subbands generated by the method of the invention can be combined in many different ways into a bit stream. This may be accomplished, for example, by using a frame structure according to the compression method used for compression of the first subband and adding portions thereof to the binary information of the second subband. Thereby, in some applications, it is possible to process the bit stream generated by the method according to the invention with a device for compressing a de-20 bit stream according to the compression method used in the first subband. For example, the second subband binary information added to the bitstream is interpreted as invalid frames. In this case, the decompressed analog signal comprises only a portion of the analog band signal's frequency band, but the sound quality may still be sufficient for the recording of music tracks recorded by the method of the invention: ···: 25.
·*· • · • ·· * · • · • ·
Seuraavassa kuvataan vielä keksinnön erään edullisen suoritusmuo-...., don mukaista bittivirran muodostusta signaali-informaation esittämisek- si mm. tallennusta ja/tai välittämistä tiedonsiirtokanavassa varten.In the following, a bit stream generation according to a preferred embodiment of the invention for presenting signal information, e.g. for storage and / or transmission on a communication channel.
• « • · _ _ *:· 30 *:·*: Bittivirran muodostuksessa sovelletaan edullisesti kehystämistä, jolloin ΓΊ eri tietoja voidaan esittää kehysten eri osissa (tietueissa). Tässä edulli sessa suoritusmuodossa käytetään ensinnäkin jotakin sinänsä tunne-; tun tekniikan mukaisen kompressointimenetelmän, kuten MP3, kehys- *· " 35 rakennetta esittämään ensimmäisen alikaistan sisältämää informaa tiota. Toisen alikaistan tietojen esittämisessä käytetään edullisesti kahta eri tyyppistä kehystä: absoluuttikehys FR1 ja differentiaalikehys 9 119343 FR2. Kuvassa 6a on esitetty absoluuttikehyksen FR1 rakennetta pelkistetysti. Se käsittää otsikkokentän H1, jossa on tietoa mm. kehyksen tyypistä. Tämä tyyppitieto on sopivimmin sellainen, joka ei ole käytetyn kompressointimenetelmän varattu tyyppi, jolloin tällaista 5 kehystä ei dekompressointivaiheessa tavallisesti pyritä dekompres-soimaan, jos keksinnön mukaisella menetelmällä muodostettua bittivirtaa dekoodataan tunnetun tekniikan mukaisessa dekooderissa. Kehys voi vielä sisältää versiokentän V1 ilmaisemaan sen, minkä version mukaista kehysinformaatio on. Kehyksessä on vielä kehyksen 10 pituustieto L1 sekä tietoa itse signaalista. Tämä signaalitieto käsittää edullisesti osakaistojen lukumäärätiedon SB1, eli tiedon siitä, minkä osakaistojen informaatiota kehyksessä on mukana (esim. viiden ensimmäisen osakaistan informaatio). Lisäksi kehyksessä välitetään mahdollisesti tietoa QT1 differentiaalikehyksissä käytetystä 15 kvantisointitaulukosta (ei esitetty). Kenttä TR1 ilmaisee sen, onko kehys tavallinen kehys vai ns. transienttikehys. Tämä tarkoittaa sitä, että transienttikehyksessä välitetään tietoa signaalissa havaittuun nopeaan muutokseen. Tätä kuvataan hieman myöhemmin tässä selityksessä. Jos kyseessä on transienttikehys, välitetään vielä tieto POS1 20 siitä, missä kohdassa transienttimuutos suoritetaan signaalia dekoo-dattaessa. Kenttä S1 ilmoittaa löydettyjen sinisignaalien lukumäärän * · (edullisesti välillä 0—4), jolloin kehyksessä on vastaava määrä tietoa •V*· sinisignaalien taajuuksista SF1 ja energiasta SE1. Osakaistojen sisäl- ·:·*: tämästä kohinasta välitetään energiatiedot NE1 kultakin käytössä ole- *:·>· 25 valta osakaistalta. Edellä esitettyjen kehystietojen perusteella on de- .··*. koodausvaiheessa mahdollista rekonstruoida analogiasignaalin tämän kehyksen osalta ilman aikaisempaa tietoa signaalista.«· · *:: · Edullisesti 30 30 30 30 edullisesti::::::: 30 30 30 keh 30:::::::::::::::,,,,: Framing is preferably applied to bit stream generation, where ΓΊ different data can be represented in different parts of the frames (records). In this preferred embodiment, firstly, something as such is used emotionally; The frame structure of the prior art compression method, such as MP3, to represent information contained in the first subband. Preferably, two different types of frames are used to represent the second subband: absolute frame FR1 and differential frame 9 119343 FR2. Figure 6a shows the structure of absolute frame FR1. It comprises a header field H1 containing information on, among other things, the type of the frame, this type information being preferably not the reserved type of the compression method used, such a frame being not usually decompressed in the decompression step if the bit stream generated by the method of the invention is decoded The frame may still include a version field V1 to indicate which version of the frame information it is in. The frame still contains the length information L1 of the frame 10 and information about the signal itself. preferably provides subband number information SB1, i.e. information about which subband information is included in the frame (e.g. first five subband information). In addition, the frame possibly transmits information about the quantization table (not shown) used in the QT1 differential frames. Field TR1 indicates whether the frame is a normal frame or a so-called frame. transienttikehys. This means that the transient frame transmits information to the rapid change detected in the signal. This will be described a little later in this specification. In the case of a transient frame, information POS1 20 is still transmitted at which point the transient change is performed when decoding the signal. Field S1 indicates the number of detected blue signals * · (preferably between 0 and 4), so that the frame contains the corresponding amount of information • V * · about the frequencies SF1 and energy SE1 of the blue signals. Subbands Contains:: *: This noise transmits energy information NE1 for each of the available subbands *: ·> · 25. Based on the above frame information, de-. ·· *. in the coding step, it is possible to reconstruct the analog signal for this frame without previous knowledge of the signal.
*· * • · ·* · * • · ·
Differentiaalikehys FR2 on joiltakin osin absoluuttikehyksen FR1 kaltai- • » *·;·* 30 nen. Poikkeuksena on lähinnä se, että taajuus- ja energiatiedot eivät ·:··: ole absoluuttisia arvoja, vaan ne ilmaisevat näiden arvojen muutoksen :***: edellisen kehyksen sisältämiin vastaaviin arvoihin. Tällä tavoin diffe- ♦ ·· ./ rentiaalikehyksiä käyttämällä voidaan edelleen vähentää signaalista **. muodostettavan informaation kokonaismäärää. Myöskään otsikko- • · · ** " 35 kenttää ei tarvita, koska tässä suoritusmuodossa oletetaan, että abso- luuttikehystä seuraa ainakin yksi differentiaalikehys, tosin välissä voi 10 119343 olla ensimmäisen alikaistan kehys, mutta dekooderissa tämä erotetaan omaksi bittivirrakseen.The differential frame FR2 is somewhat similar to the absolute frame FR1 • »* ·; · * 30. The exception is that the frequency and energy data are not ·: ··: absolute values, but represent a change in these values: ***: to the corresponding values in the previous frame. In this way, the use of diffe- ♦ ·· ./ rentals frames can further reduce the signal **. the total amount of information to be generated. Also, the header · · · ** "35 field is not needed because in this embodiment it is assumed that the absolute frame is followed by at least one differential frame, although there may be a first 111143 frame between the frames, but in the decoder this is separated into its own bit stream.
Koska tiedon tallennuksessa ja siirrossa voi tapahtua virheitä (bittivir-5 heitä) ja toisaalta dekoodaus voidaan joissakin tilanteissa aloittaa muualta kuin ensimmäisestä kehyksestä, on peräkkäisten differentiaa-likehyksien FR2 määrä sopivimmin rajoitettu. Siis tiettyä määrää diffe-rentiaalikehyksiä FR2 seuraa aina absoluuttikehys FR1. Differentiaali-kehykseen FR2 on tämän vuoksi järjestetty tässä edullisessa suoritus-10 muodossa laskuri, jota kasvatetaan kullakin peräkkäisellä differentiaali-kehyksellä ja asetetaan alkuarvoonsa (nollataan) absoluuttikehyksen yhteydessä. Tällöin, jos dekoodausvaiheessa havaitaan, että laskurin arvo on väärä, voidaan olettaa virheen tapahtuneen ja kyseistä diffe-rentiaalikehystä ei dekoodata. Dekoodausta voidaan jatkaa seuraavan 15 absoluuttikehyksen tullessa dekoodattavaksi.Because errors may occur in the storage and transmission of data (bitvir-5 them) and, on the other hand, decoding may be started elsewhere than from the first frame, the number of successive difference frames FR2 is preferably limited. Thus, a certain number of differential frames FR2 is always followed by an absolute frame FR1. Therefore, in this preferred embodiment, the differential frame FR2 is provided with a counter which is incremented with each successive differential frame and set to its initial value (reset) in connection with the absolute frame. In this case, if during the decoding step it is found that the counter value is incorrect, an error may be assumed and the differential frame in question is not decoded. The decoding can be continued as the next 15 absolute frames become decodable.
Ensimmäisen alikaistan kehyksiä ja toisen alikaistan kehyksiä sopivimmin vuorotellaan lähetettävässä bittivirrassa. Tätä on havainnollistettu kuvassa 6c. Ensimmäisenä kehyksenä on absoluuttikehys FR1, 20 jota seuraa yksi tai useampi differentiaalikehys FR2. Tämän jälkeen lähetetään yksi ensimmäisen alikaistan kehys ja toistetaan limittämistä.The frames of the first subband and the frames of the second subband are preferably alternated in the transmitted bit stream. This is illustrated in Figure 6c. The first frame is an absolute frame FR1, followed by one or more differential frames FR2. One frame of the first subband is then transmitted and interleaving is repeated.
• · • · · ♦ · · V t• · • · · ♦ · · V t
Siinä vaiheessa kun peräkkäisissä kehyksissä välitettävä signaali-in-:··: formaatio muuttuu, ei muutosta voi suoraan muuttaa vastaavaksi ·:··· 25 muutokseksi audiosignaalissa, koska tämä voi olla korvin kuultavissa ;**\ kiusallisena napsahduksena, paukahduksena, tms. Tällöin muutokset suoritetaan asteittain lähtöarvosta a tavoitearvoon b tietyn ajan kulu-:v. essa, kuten kuvassa 7a on esitetty. Muutos voi olla lineaarinen tai epä- :..f lineaarinen. Joissakin tilanteissa signaali kuitenkin voi sisältää suhteel- 30 lisen nopeita muutoksia eli aikaisemmin mainittuja transientteja. Tällöin *:**: muutos tehdään huomattavasti nopeammin, esimerkiksi neljäsosasi": ajassa normaaliin muutokseen verrattuna. Transienttikehyksessä on edullisesti tieto siitä, missä kohdassa muutos tehdään. Tätä on havain- \ " nollistettu oheisessa kuvassa 7b. Edellä esitetystä huolimatta voidaan ♦ · · '·" 35 joissakin tilanteissa suorittaa myös olennaisesti välitön muutos esim.At the point when the signal-in-: ··: formatting transmitted in successive frames changes, the change cannot be directly transformed to the corresponding ·: ··· 25 changes in the audio signal, as this may be audible to the ear; ** \ annoying clicks, bangs, etc. the changes are made gradually from the starting value a to the target value b over a period of time: v. 7a. The change can be linear or non-linear: .. f linear. However, in some situations, the signal may contain relatively rapid changes, i.e. the transients mentioned earlier. In this case, *: **: the change is made much faster, for example in a quarter "of time compared to a normal change. The transient frame preferably contains information about where the change is made. This is illustrated in Figure 7b below. Notwithstanding the above, in some situations a substantially immediate change can also be made e.g.
uusi sinisignaali on havaittu, jolloin tästä informoidaan kyseisessä kehyksessä jollakin sopivalla tavalla.a new blue signal has been detected, whereupon the frame in question is informed in any suitable way.
11 11934311 119343
Suuri osa nyt esillä olevan keksinnön toiminnoista voidaan toteuttaa esimerkiksi digitaalisen signaalinkäsittely-yksikön (ei esitetty) sovellusohjelmistossa.Most of the functions of the present invention may be implemented, for example, in application software of a digital signal processing unit (not shown).
55
On selvää, että nyt esillä olevaa keksintöä ei ole rajoitettu ainoastaan edellä esitettyihin suoritusmuotoihin, vaan sitä voidaan muunnella oheisten patenttivaatimusten puitteissa.It will be understood that the present invention is not limited to the above embodiments, but may be modified within the scope of the appended claims.
··· t ·#·· • · • « · • M • · *·· • 1 · • · 1 • · • · « · · • · • · • · · *· · * » · • · • · ·1· * · • · ·«· • · ·1« • · • · ··· »· • · • 1· · • · · • · · • ·· · · · · · · · · · · · · · · · · · · · · · · · · · · ··· · 1 · * · • · · · · · · · · · · · · · · · · · · · · · · · · · · ······ ···
Claims (11)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20011924A FI119343B (en) | 2001-10-02 | 2001-10-02 | Method for signal processing and signal processing apparatus |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20011924A FI119343B (en) | 2001-10-02 | 2001-10-02 | Method for signal processing and signal processing apparatus |
FI20011924 | 2001-10-02 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20011924A0 FI20011924A0 (en) | 2001-10-02 |
FI20011924A FI20011924A (en) | 2003-04-03 |
FI119343B true FI119343B (en) | 2008-10-15 |
Family
ID=8561986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20011924A FI119343B (en) | 2001-10-02 | 2001-10-02 | Method for signal processing and signal processing apparatus |
Country Status (1)
Country | Link |
---|---|
FI (1) | FI119343B (en) |
-
2001
- 2001-10-02 FI FI20011924A patent/FI119343B/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
FI20011924A (en) | 2003-04-03 |
FI20011924A0 (en) | 2001-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5687157A (en) | Method of recording and reproducing digital audio signal and apparatus thereof | |
EP1715477B1 (en) | Low-bitrate encoding/decoding method and system | |
KR101517265B1 (en) | Compression of audio scale-factors by two-dimensional transformation | |
JP3354863B2 (en) | Audio data encoding / decoding method and apparatus with adjustable bit rate | |
US6415251B1 (en) | Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one | |
JPH08190764A (en) | Method and device for processing digital signal and recording medium | |
JP2005157390A (en) | Method and apparatus for encoding/decoding mpeg-4 bsac audio bitstream having ancillary information | |
KR19990082402A (en) | Broadband Audio Signal Coder, Broadband Audio Signal Decoder, Broadband Audio Signal Coder and Broadband Audio Signal Recorder | |
WO1995034956A1 (en) | Method and device for encoding signal, method and device for decoding signal, recording medium, and signal transmitting device | |
US20020165631A1 (en) | Audio signal processing with adaptive noise-shaping modulation | |
JP2006126826A (en) | Audio signal coding/decoding method and its device | |
Sinha et al. | The perceptual audio coder (PAC) | |
KR100528325B1 (en) | Scalable stereo audio coding/encoding method and apparatus thereof | |
Johnston et al. | AT&T perceptual audio coding (PAC) | |
JP2005328533A (en) | Method and apparatus for encoding/decoding digital signal utilizing linear quantization by blocks | |
JP2963710B2 (en) | Method and apparatus for electrical signal coding | |
FI119343B (en) | Method for signal processing and signal processing apparatus | |
KR100923301B1 (en) | Method and apparatus for encoding/decoding audio data using bandwidth extension technology | |
JP3304750B2 (en) | Lossless encoder, lossless recording medium, lossless decoder, and lossless code decoder | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
KR100754389B1 (en) | Apparatus and method for encoding a speech signal and an audio signal | |
JPH1083623A (en) | Signal recording method, signal recorder, recording medium and signal processing method | |
JPH0863901A (en) | Method and device for recording signal, signal reproducing device and recording medium | |
JP3594829B2 (en) | MPEG audio decoding method | |
KR20000056661A (en) | A method for backward decoding an audio data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 119343 Country of ref document: FI |