NL1029157C2 - Audio signal decoding method for e.g. cell-phone, involves generating audio signal by decoding input signal, and transforming original waveform of audio signal into compensation waveform for acoustic resonance effect - Google Patents
Audio signal decoding method for e.g. cell-phone, involves generating audio signal by decoding input signal, and transforming original waveform of audio signal into compensation waveform for acoustic resonance effect Download PDFInfo
- Publication number
- NL1029157C2 NL1029157C2 NL1029157A NL1029157A NL1029157C2 NL 1029157 C2 NL1029157 C2 NL 1029157C2 NL 1029157 A NL1029157 A NL 1029157A NL 1029157 A NL1029157 A NL 1029157A NL 1029157 C2 NL1029157 C2 NL 1029157C2
- Authority
- NL
- Netherlands
- Prior art keywords
- audio signal
- waveform
- band
- acoustic resonance
- resonance effect
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/502—Customised settings for obtaining desired overall acoustical characteristics using analog signal processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
P73346NL00P73346NL00
Titel: Apparaat en werkwijze voor het coderen/decoderen van een audiosignaalTitle: Device and method for encoding / decoding an audio signal
Verwijzing naar corresponderende aanvragenReference to corresponding applications
Deze aanvrage roept de prioriteit in van een voorlopige Amerikaanse octrooiaanvrage nr. 60/576 617, die is ingediend op 4 juni 2004 5 en nr. 60/578 862, die is ingediend op 14 juni 2004 bij het Amerikaanse Octrooibureau, en van de Koreaanse octrooiaanvrage nr. 2004-43075 die is ingediend op 11 juni 2004 bij het Koreaanse Octrooibureau, waarvan de beschrijvingen onder verwijzing hierbij in hun geheel worden ingesloten.This application claims the priority of Provisional U.S. Patent Application Nos. 60/576 617, filed June 4, 2004 5 and No. 60/578 862, filed June 14, 2004 with the US Patent Office, and the Korean Patent Office. Patent Application No. 2004-43075 filed June 11, 2004 at the Korean Patent Office, the descriptions of which are hereby incorporated by reference in their entirety.
10 Achtergrond van de uitvinding 1. Veld van de uitvindingBackground of the invention 1. Field of the invention
Het onderhavige algemene inventieve concept heeft betrekking op 15 een apparaat en een werkwijze voor het coderen van een audiosignaal en op een apparaat en werkwijze voor het decoderen van een audiosignaal.The present general inventive concept relates to an apparatus and method for encoding an audio signal and to an apparatus and method for decoding an audio signal.
2. Beschrijving van de stand der techniek 20 Figuur 1 toont de structuur van een menselijk oor dat wordt gebruik voor het waarnemen van geluid.2. Description of the Prior Art Figure 1 shows the structure of a human ear that is used for perceiving sound.
Onder verwijzing naar figuur 1 wordt, wanneer een oorreferentiepunt (ERP) op een extern deel van het menselijk oor wordt afgesloten door een oortelefoon, hoofdtelefoon of een oortelefoondeel etc., een 25 afgesloten ruimte gevormd tussen het ERP en een trommelreferentiepunt (DRP) in een middelste deel van het menselijk oor. Daarom vergroot een 10 2 9 1 5.1.With reference to Figure 1, when an ear reference point (ERP) on an external part of the human ear is closed by an earphone, headphone or earphone part, etc., a closed space is formed between the ERP and a drum reference point (DRP) in a middle part of the human ear. That is why a 10 2 9 1 5.1 increases.
2 resonantie-effect, wanneer het menselijk oor een audiosignaal uitvoer van het audioapparaat detecteert, geluidsdruk met meer dan 15 dB in een frequentiegebied (rond een 1-10 KHz band) die correspondeert met een resonantiefrequentie van de afgesloten ruimte. Wegens dit ERP-DRP 5 resonantie-effect ontstaat er een probleem zelfs als hoge kwaliteits oortelefoontjes, hoofdtelefoons of oortelefoondelen worden gebruikt, met name daarin dat mensen een audiosignaal met een middelband zeer versterkt horen. Bijgevolg neemt de geluidskwaliteit van het audiosignaal af. In het bijzonder wordt dit probleem belangrijker aangezien het gebruik 10 van oortelefoons, hoofdtelefoons, oortelefoondelen etc. toeneemt met het wijd verspreiden gebruik van draagbare audioapparaten en mobiele telefoons.2 resonance effect, when the human ear detects an audio signal output from the audio device, sound pressure of more than 15 dB in a frequency range (around a 1-10 KHz band) corresponding to a resonance frequency of the confined space. Because of this ERP-DRP 5 resonance effect, a problem arises even when high-quality earphones, headphones or earphone parts are used, particularly in that people hear a high-band audio signal very amplified. Consequently, the sound quality of the audio signal decreases. In particular, this problem becomes more important since the use of earphones, headphones, earphone parts etc. increases with the widespread use of portable audio devices and mobile phones.
Samenvatting van de uitvinding 15 Het onderhavige algemene inventieve concept voorziet in een apparaat en een werkwijze voor het decoderen van een audiosignaal voor het compenseren van een ERP-DRP resonantie-effect in een audio decodeerbewerking.Summary of the Invention The present general inventive concept provides an apparatus and method for decoding an audio signal to compensate for an ERP-DRP resonance effect in an audio decoding operation.
Het onderhavige algemene inventieve concept voorziet ook in een 20 voor computer leesbaar medium met uitvoerbare code voor het uitvoeren van de werkwijze voor het decoderen van audio.The present general inventive concept also provides a computer-readable medium with executable code for performing the audio decoding method.
Het onderhavige algemene inventieve concept voorziet ook in een apparaat en een werkwijze voor het coderen van een audiosignaal met een hogere compressiesnelheid in een audiocoderingsverwerking door een ERP-25 DRP resonantie-effect te beschouwen.The present general inventive concept also provides an apparatus and method for encoding an audio signal with a higher compression rate in an audio coding processing by considering an ERP-25 DRP resonance effect.
Het onderhavige algemene inventieve concept voorziet ook in een voor computer leesbaar medium met uitvoerbare code voor het uitvoeren van de werkwijze voor het coderen van audio.The present general inventive concept also provides a computer-readable medium with executable code for performing the audio coding method.
Additionele aspecten van het onderhavige algemene inventieve 30 concept zullen deels uiteen worden gezet in de beschrijving die hierna volgt 10 2 9 1 5 7 3 en deels zal deze duidelijk zijn uit de beschrijving of volgt uit de praktijk van het algemene inventieve concept.Additional aspects of the present general inventive concept will be set forth in part in the description which follows and, in part, it will be clear from the description or follows from the practice of the general inventive concept.
Het hier voorgaande en/of andere aspecten van het onderhavige algemene inventieve concept worden bereikt door te voorzien in een 5 werkwijze voor het decoderen van audio, omvattende het genereren van een audiosignaal door een invoersignaal te decoderen, en het transformeren van een oorspronkelijke golfvorm van het audiosignaal naar een compensatie-golfvorm die is gecompenseerd voor een akoestisch resonantie-effect.The foregoing and / or other aspects of the present general inventive concept are achieved by providing a method for decoding audio, comprising generating an audio signal by decoding an input signal, and transforming an original waveform of the audio signal to a compensation waveform that is compensated for an acoustic resonance effect.
Het voorgaande en/of andere aspecten van het onderhavige 10 algemene inventieve concept worden ook bereikt door te voorzien in een apparaat voor het decoderen van audio, omvattende een decoder voor het genereren van een audiosignaal door een invoersignaal te decoderen, en een resonantiecompensator voor het transformeren van een oorspronkelijke golfvorm van het audiosignaal die is gegenereerd door de decoder, naar een 15 compensatie-golfvorm die wordt gecompenseerd voor een akoestisch resonantie-effect.The foregoing and / or other aspects of the present general inventive concept are also achieved by providing an apparatus for decoding audio, comprising a decoder for generating an audio signal by decoding an input signal, and a resonance compensator for transforming from an original waveform of the audio signal generated by the decoder to a compensation waveform that is compensated for an acoustic resonance effect.
Het voorgaande en/of andere aspecten van het onderhavige algemene inventieve concept worden ook bereikt door te voorzien in een voor de computer leesbaar medium met uitvoerbare code voor het uitvoeren van 20 de werkwijze voor het decoderen van audio.The foregoing and / or other aspects of the present general inventive concept are also achieved by providing a computer-readable medium with executable code for performing the audio decoding method.
Het voorgaande en/of andere aspecten van het onderhavige algemene inventieve concept worden ook bereikt door te voorzien in een werkwijze voor het coderen van audio, omvattende het berekenen van een signaal/afschermverhouding (SMR) van elk van een meervoudig aantal 25 onderband bemonsteringen van een audiosignaal overeenkomstig een afschermdrempelcurve die is aangepast om rekening te houden met een akoestische resonantie-effect, met toewijzing van bits aan elk van de onderband bemonsteringen overeenkomstig de berekende signaal/afschermverhoudingen, en het kwantiseren en coderen van de 30 onderband bemonsteringen in een reeks toegewezen bits.The foregoing and / or other aspects of the present general inventive concept are also achieved by providing a method of encoding audio, comprising calculating a signal / shielding ratio (SMR) of each of a plurality of subband samples of a audio signal according to a shielding threshold curve adapted to account for an acoustic resonance effect, with assignment of bits to each of the subband samples according to the calculated signal / shielding ratios, and quantizing and coding the subband samples in a series of assigned bits .
102915/.102915 /.
44
Het voorgaande en/of andere aspecten van het onderhavige algemene inventieve concept worden bereikt door te voorzien in een apparaat voor het coderen van audio, omvattende een psycho-akoestische modeleenheid voor het berekenen van een signaal/afschermverhouding die 5 is aangepast om rekening te houden met een akoestisch resonantie-effect, een bittoewijzer voor het toewijzen van bits aan elk van de onderband bemonsteringen in overeenstemming met de berekende signaal/afschermverhoudingen, en een kwantisatie/codeereenheid voor het kwantiseren en coderen van de onderband bemonsteringen in een reeks 10 toegewezen bits.The foregoing and / or other aspects of the present general inventive concept are achieved by providing an audio coding apparatus comprising a psychoacoustic model unit for calculating a signal / shielding ratio adapted to take into account an acoustic resonance effect, a bit allocator for assigning bits to each of the subband samples in accordance with the calculated signal / shielding ratios, and a quantization / coding unit for quantizing and coding the subband samples in a series of 10 assigned bits.
Het voorgaande en/of andere aspecten van het onderhavige algemene inventieve concept worden ook bereikt door te voorzien in een voor een computer leesbaar medium met uitvoerbare code voor het uitvoeren van de werkwijze voor het coderen van audio.The foregoing and / or other aspects of the present general inventive concept are also achieved by providing a computer-readable medium with executable code for performing the audio coding method.
1515
Korte beschrijving van de figurenBrief description of the figures
Deze en/of andere aspecten en voordelen van het onderhavige algemene inventieve concept zullen duidelijk worden en gemakkelijker 20 worden begrepen aan de hand van de hiernavolgende beschrijving van de uitvoeringsvormen in samenhang met de begeleidende tekening waarin toont:These and / or other aspects and advantages of the present general inventive concept will become clear and more readily understood with reference to the following description of the embodiments in conjunction with the accompanying drawing, which shows:
Figuur 1 de structuur van het menselijk oor dat wordt gebruikt voor het waarnemen van geluid; 25 Figuur 2 een grafiek dat een resonantie-golfvorm toont tussen een oorreferentiepunt (ERP) en een trommelreferentiepunt (DRP) van het menselijk oor;Figure 1 shows the structure of the human ear used for sound perception; Figure 2 is a graph showing a resonance waveform between an ear reference point (ERP) and a drum reference point (DRP) of the human ear;
Figuur 3 een grafiek dat een compensatie-golfvorm toont dat wordt verkregen door de resonantie-golfvorm van figuur 2 te inverteren; 10 2 9 1 57 5Figure 3 is a graph showing a compensation waveform obtained by inverting the resonance waveform of Figure 2; 10 2 9 1 57 5
Figuur 4 een grafiek dat een resultaat toont dat wordt verkregen door de compensatie-golfvorm toe te passen van figuur 3 op de resonantie-golfvorm van figuur 2;Figure 4 is a graph showing a result obtained by applying the compensation waveform of Figure 3 to the resonance waveform of Figure 2;
Figuur 5 een blokdiagram dat een apparaat voor het decoderen van 5 audio toont overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept;Figure 5 is a block diagram showing an audio decoding apparatus according to an embodiment of the present general inventive concept;
Figuur 6 een stroomschema dat een werkwijze voor het decoderen van een audiosignaal toont overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept; 10 Figuur 7 een vergelijking van een audiosignaal dat wordt gereproduceerd door het apparaat voor het decoderen van audio van figuur 5 met een audiosignaal dat wordt gereproduceerd door een conventioneel apparaat voor het decoderen van audio;Fig. 6 is a flowchart showing a method for decoding an audio signal according to an embodiment of the present general inventive concept; Figure 7 is a comparison of an audio signal reproduced by the audio decoding apparatus of Figure 5 with an audio signal reproduced by a conventional audio decoding apparatus;
Figuur 8 een afschermeffect dat wordt gebruikt om een resonantie-15 effect tussen het ERP en het DRP te beschouwen;Figure 8 is a shielding effect used to consider a resonance effect between the ERP and the DRP;
Figuur 9 een blokdiagram dat een apparaat voor het coderen van audio toont overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept; enFigure 9 is a block diagram showing an audio encoding apparatus according to an embodiment of the present general inventive concept; and
Figuur 10 een stroomschema dat een werkwijze voor het coderen 20 van audio toont overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept.Fig. 10 is a flowchart showing an audio coding method according to an embodiment of the present general inventive concept.
Gedetailleerde beschrijving van de voorkeursuitvoeringsvormen 25 In het hiernavolgende zal in detail worden verwezen naar uitvoeringsvormen van het onderhavige algemene inventieve concept, waarvan voorbeelden worden getoond in de begeleidende tekening, waarbij dezelfde referentiecijfers verwijzen naar dezelfde elementen. De uitvoeringsvormen worden in het hiernavolgende beschreven voor het 1029157 6 uitleggen van het onderhavige algemene inventieve concept onder verwijzing naar de figuren.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS In the following, reference will be made in detail to embodiments of the present general inventive concept, examples of which are shown in the accompanying drawing, wherein the same reference numerals refer to the same elements. The embodiments are described below for explaining the present general inventive concept with reference to the figures.
Figuur 2 is een grafiek dat een resonantie-golfvorm toont tussen een oorreferentiepunt (ERP) en een trommelreferentiepunt (DRP) van een 5 menselijk oor.Figure 2 is a graph showing a resonance waveform between an ear reference point (ERP) and a drum reference point (DRP) of a human ear.
Onder verwijzing naar figuur 2 betreft het een resonantie-golfvorm met een geluidsdruk die toeneemt met meer dan 15 dB rond een 1-10 KHz band wegens een afgesloten ruimte tussen het ERP en het gemeten DRP. De ERP-DRP resonantie-golfvorm kan worden gemeten door een meetmicrofoon 10 in een oor van een persoon of een hulphoofd te steken.Referring to Figure 2, it is a resonance waveform with a sound pressure that increases by more than 15 dB around a 1-10 KHz band due to a closed space between the ERP and the measured DRP. The ERP-DRP resonance waveform can be measured by inserting a measuring microphone 10 into a person's ear or an auxiliary head.
Figuur 3 is een grafiek dat een compensatie-golfvorm toont die wordt verkregen door de resonantie-golfvorm van figuur 2 te inverteren.Fig. 3 is a graph showing a compensation waveform obtained by inverting the resonance waveform of Fig. 2.
Onder verwijzing naar figuur 3 wordt de compensatie-golfvorm verkregen door de resonantie-golfvorm zoals getoond in figuur 2 te 15 in verteren ten aanzien van een frequentieas.With reference to Figure 3, the compensation waveform is obtained by inverting the resonance waveform as shown in Figure 2 with respect to a frequency axis.
Figuur 4 is een grafiek dat een resultaat toont dat is verkregen door de compensatie-golfvorm van figuur 3 toe te passen op de resonantie-golfvorm van figuur 2.Figure 4 is a graph showing a result obtained by applying the compensation waveform of Figure 3 to the resonance waveform of Figure 2.
Onder verwijzing naar figuur 4 hoort een oortelefoon of koptelefoon 20 gebruiker, wanneer de gebruiker een audiosignaal hoort waarop de compensatie-golfvorm van figuur 3 is toegepast, een audiosignaal dat een oorspronkelijk golfvorm heeft. In deze beschrijving wordt ter illustratie aangenomen dat de oorspronkelijke golfvorm van het audiosignaal een platte golfvorm is. Op gemerkt wordt echter dat de oorspronkelijke golfvorm 25 van het audiosignaal een variëteit van andere vormen kan hebben.Referring to Figure 4, when the user hears an audio signal to which the compensation waveform of Figure 3 is applied, an earphone or headset user hears an audio signal having an original waveform. In this description, it is assumed by way of illustration that the original waveform of the audio signal is a flat waveform. It is noted, however, that the original waveform 25 of the audio signal may have a variety of other forms.
Onder verwijzing naar figuren 2, 3, en 4 kan een apparaat voor het decoderen van audio voor het compenseren van ERP-DRP resonantie-effect worden geïmplementeerd door een resonantie-golfvorm te meten dat wordt gegenereerd door het ERP-DRP resonantie-effect, het berekenen van een 30 compensatie-golfvorm door de gemeten resonantie-golfvorm te inverteren, 10 2 9 1 5 7 7 het ontwerpen van één of meer digitale filters, zoals een eindige impulsresponsiefilter (FIR) en/of een oneindige impulsresponsiefilter (IIR), het toepassen van de berekende compensatie-golfvorm op de gemeten resonantie-golfvorm, en het implementeren van de ontworpen digitale filters 5 in een apparaat voor het decoderen van audio.Referring to Figures 2, 3, and 4, an audio decoding apparatus for compensating for an ERP-DRP resonance effect can be implemented by measuring a resonance waveform generated by the ERP-DRP resonance effect, the calculating a compensation waveform by inverting the measured resonance waveform, designing one or more digital filters, such as a finite impulse response filter (FIR) and / or an infinite impulse response filter (IIR), applying the calculated compensation waveform to the measured resonance waveform, and implementing the designed digital filters 5 into an audio decoding device.
Figuur 5 is een blokdiagram dat een apparaat toont voor het decoderen van audio overeenkomstig een uitvoeringsvorm van het . onderhavige algemene inventieve concept.Figure 5 is a block diagram showing an audio decoding apparatus according to an embodiment of the. present general inventive concept.
Onder verwijzing naar figuur 5 omvat het apparaat voor het 10 decoderen van audio een decodeerinrichting 51, een eerste resonantie-compensator 52, een eerste digitaal naar analoog omzetter (DAC) 53, een eerste versterker 54, een tweede resonantie-compensator 55, een tweede DAC 56, en een tweede versterker 57.With reference to Figure 5, the audio decoding apparatus comprises a decoder 51, a first resonance compensator 52, a first digital-to-analog converter (DAC) 53, a first amplifier 54, a second resonance compensator 55, a second DAC 56, and a second amplifier 57.
De decodeerinrichting 51 genereert een audiosignaal door het 15 decoderen van een invoersignaal. Gewoonlijk is het invoersignaal een stroom bits die vanuit een MPEG apparaat wordt verzonden voor het coderen van audio.The decoder 51 generates an audio signal by decoding an input signal. Typically, the input signal is a stream of bits sent from an MPEG device for encoding audio.
De eerste resonantie-compensator 52 transformeert een golfvorm van het audiosignaal die wordt gegenereerd door de decodeerinrichting 51 20 naar een eerste golfvorm die wordt gecompenseerd voor het ERP-DRP resonantie-effect. Zoals geïllustreerd in figuur 3 kan de compensatie-golfvorm die wordt gebruikt voor het compenseren van het ERP-DRP resonantie-effect worden verkregen door de ERP-DRP golfvorm zoals geïllustreerd in figuur 2 te inverteren.The first resonance compensator 52 transforms a waveform of the audio signal generated by the decoder 51 into a first waveform that is compensated for the ERP-DRP resonance effect. As illustrated in Figure 3, the compensation waveform used to compensate for the ERP-DRP resonance effect can be obtained by inverting the ERP-DRP waveform as illustrated in Figure 2.
25 De eerste resonantie-compensator 52 omvat een eerste resonantie- bandextractor 521 en een eerste golfvorm transformeerinrichting 522. De eerste resonantie-bandextractor 521 extraheert een band die wordt beïnvloed door het ERP-DRP resonantie-effect dat moet worden gecompenseerd voor het ERP-DRP resonantie-effect. Dat wil zeggen, de 30 eerste resonantie-bandextractor 521 kan een band van rond 1-10 KHz van 1029157 8 het audiosignaal extraheren. De eerste golfvorm-omzetter 522 transformeert de band die wordt geëxtraheerd door de eerste resonantie-bandextractor 521 naar een compensatie-golfvorm, die (wanneer het audiosignaal vlak is) dezelfde vorm kan hebben als de compensatie-golfvorm zoals geïllustreerd in 5 figuur 3. Zoals hierboven beschreven kan de eerste resonantie-compensator 52 worden gerealiseerd met één of meer digitale filters, zoals een FIR filter of een IIR filter.The first resonance compensator 52 comprises a first resonance band extractor 521 and a first waveform transformer 522. The first resonance band extractor 521 extracts a band that is affected by the ERP-DRP resonance effect to be compensated for the ERP-DRP resonance effect. That is, the first resonance band extractor 521 can extract the audio signal from a band of around 1-10 KHz from 1029157. The first waveform converter 522 transforms the band extracted by the first resonance band extractor 521 into a compensation waveform, which (when the audio signal is flat) may have the same shape as the compensation waveform as illustrated in Figure 3. As described above, the first resonance compensator 52 can be realized with one or more digital filters, such as an FIR filter or an IIR filter.
De eerste DAC 53 converteert het digitale audiosignaal dat moet worden getransformeerd naar de compensatie-golfvorm door de eerste 10 resonantie-compensator 52 naar een analoog audiosignaal. Zoals hierboven beschreven is het audiosignaal dat wordt ingevoerd in de eerste DAC 53 een digitaal audiosignaal dat wordt verkregen door de stroom bits die vanuit het MPEG apparaat wordt verzonden voor het coderen van audio te decoderen en kan worden omgezet in het analoge audiosignaal voor reproductie 15 doeleinden.The first DAC 53 converts the digital audio signal to be transformed into the compensation waveform by the first resonance compensator 52 into an analog audio signal. As described above, the audio signal input to the first DAC 53 is a digital audio signal obtained by decoding the stream of bits sent from the MPEG device for encoding audio and can be converted to the analog audio signal for reproduction purposes .
De eerste versterker 54 voert het analoge audiosignaal dat wordt geconverteerd door de eerste DAC 53 uit naar een luidspreker. De luidspreker kan een linker luidspreker van een audioapparaat zijn dat een afgesloten ruimte vormt tussen het ERP en het DRP van het menselijk oor, 20 zoals oortelefoons, hoofdtelefoon, een oortelefoondeel, etc.The first amplifier 54 outputs the analog audio signal that is converted by the first DAC 53 to a speaker. The loudspeaker can be a left-hand loudspeaker of an audio device that forms a closed space between the ERP and the DRP of the human ear, such as earphones, headphones, an earphone part, etc.
De tweede resonantie-compensator 55, de tweede DAC 56, en de tweede versterker 57 voeren dezelfde functies uit als de eerste resonantie-compensator 52, de eerste DAC 53, en de eerste versterker 54. Daarom zullen beschrijvingen van de tweede resonantie-compensator 55, de tweede 25 DAC 56, en de tweede versterker 57 niet worden gegeven. Echter, terwijl de eerstè resonantie-compensator 52, de eerste DAC 53 en de eerste versterker 54 een audiosignaal uitvoer voor de linker luidspreker kunnen verwerken, kunnen de tweede resonantie-compensator 55, de tweede DAC 56, en de tweede versterker 57 een audiosignaal dat wordt uitgevoerd naar de rechter 30 luidspreker verwerken. Daartoe voorziet de decodeerinrichting 51 in 1Ü 2 9 1 5 7 9 gedecodeerde gegevens om te worden uitgevoerd naar de linker luidspreker aan de eerste resonantie-compensator 52 en gedecodeerde gegevens om te worden uitgevoerd naar de rechter luidspreker aan de tweede resonantie-compensator 55. Hoewel figuur 5 illustreert dat twee kanalen (bijvoorbeeld 5 een linkerkanaal en rechterkanaal) worden verwerkt en uitgevoerd naar twee uitvoerapparaten (bijvoorbeeld luidsprekers), moet worden begrepen dat de uitvoeringsvormen van het onderhavige algemene inventieve concept kunnen worden gebruikt voor het verwerken van een audiosignaal voor een enkel geluidsuitvoerapparaat. De uitvoeringsvormen van het onderhavige 10 algemene inventieve concept kunnen bijvoorbeeld worden gebruikt voor het verwerken van geluid voor een oortelefoondeel.The second resonance compensator 55, the second DAC 56, and the second amplifier 57 perform the same functions as the first resonance compensator 52, the first DAC 53, and the first amplifier 54. Therefore, descriptions of the second resonance compensator 55 , the second DAC 56, and the second amplifier 57 are not given. However, while the first resonance compensator 52, the first DAC 53 and the first amplifier 54 can process an audio signal output for the left speaker, the second resonance compensator 55, the second DAC 56, and the second amplifier 57 can process an audio signal is output to handle the right 30 speaker. To that end, the decoder 51 provides decoded data to be output to the left speaker on the first resonance compensator 52 and decoded data to be output to the right speaker on the second resonance compensator 55. Although Fig. 5 illustrates that two channels (e.g., a left channel and a right channel) are processed and output to two output devices (e.g., speakers), it is to be understood that the embodiments of the present general inventive concept can be used to process an audio signal for a single sound output device. The embodiments of the present general inventive concept can be used, for example, for processing sound for an earphone part.
Figuur 6 is een stroomschema dat een werkwijze toont voor het decoderen van een audiosignaal overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept.Fig. 6 is a flowchart showing a method for decoding an audio signal according to an embodiment of the present general inventive concept.
15 Onder verwijzing naar figuur 6 omvat de werkwijze voor het decoderen van audiobewerkingen 61 tot 66. De werkwijze voor het decoderen van audio zoals getoond in figuur 6 omvat een reeks bewerkingen die kunnen worden uitgevoerd door het apparaat voor het decoderen van audio zoals getoond in figuur 5. Op alternatieve wijze kan de werkwijze van 20 figuur 6 worden geïmplementeerd op andere audioapparaten.Referring to Figure 6, the method for decoding audio operations 61 to 66 comprises. The method for decoding audio as shown in Figure 6 comprises a series of operations that can be performed by the audio decoding apparatus as shown in Figure. 5. Alternatively, the method of Figure 6 can be implemented on other audio devices.
In bewerking 61 wordt een audiosignaal gegenereerd door het decoderen van een invoersignaal.In operation 61, an audio signal is generated by decoding an input signal.
In bewerking 62 wordt een band die wordt beïnvloed door het ΕΚΡΌ RP resonantie-effect (dat wil zeggen die vervolgens wordt getransformeerd 25 wegens het ERP-DRP resonantie-effect) geëxtraheerd uit het audiosignaal.In operation 62, a band that is affected by the RP resonance effect (i.e., which is subsequently transformed due to the ERP-DRP resonance effect) is extracted from the audio signal.
In bewerking 63 wordt de geëxtraheerde band getransformeerd naar een compensatie-golfvorm, welke (wanneer het audiosignaal vlak is) dezelfde vorm kan hebben als de compensatie-golfvorm zoals getoond in figuur 3. Op alternatieve wijze kan de compensatie-golfvorm verschillende 30 vormen hebben, wanneer het audiosignaal niet vlak is.In operation 63, the extracted band is transformed into a compensation waveform, which (when the audio signal is flat) can have the same shape as the compensation waveform as shown in Fig. 3. Alternatively, the compensation waveform can have different shapes, when the audio signal is not flat.
1029157 101029157 10
Dat wil zeggen, in bewerkingen 62 en 63 wordt een golfvorm van het audiosignaal dat is gegenereerd in bewerking 61, getransformeerd naar de compensatie-golfvorm die vervolgens wordt getransformeerd wegens het ERP-DRP resonantie-effect in het audiosignaal. Hierbij is de compensatie-5 golfvorm die vervolgens wordt getransformeerd wegens het ERP-DRP resonantie-effect een compensatie-golfvorm die wordt verkregen door het ERP-DRP resonantie-golfvorm te inverteren. Het audiosignaal wordt dus gecompenseerd voor het ERP-DRP resonantie-effect voordat het ERP-DRP resonantie-effect werkelijk optreedt in het audiosignaal.That is, in operations 62 and 63, a waveform of the audio signal generated in operation 61 is transformed into the compensation waveform which is then transformed due to the ERP-DRP resonance effect in the audio signal. Here, the compensation waveform that is subsequently transformed because of the ERP-DRP resonance effect is a compensation waveform that is obtained by inverting the ERP-DRP resonance waveform. The audio signal is thus compensated for the ERP-DRP resonance effect before the ERP-DRP resonance effect actually occurs in the audio signal.
10 In bewerking 64 wordt het digitale audiosignaal met de compensatie-golfvorm die is verkregen in bewerking 63 geconverteerd naar een analoog audiosignaal. Zoals hierboven beschreven kan het digitale audiosignaal met de compensatie-golfvorm zoals verkregen in bewerking 63 een digitaal audiosignaal zijn dat is verkregen door een stroom bits die 15 vanuit een MPEG apparaat wordt verzonden voor het coderen van audio te decoderen en kan het digitale signaal worden omgezet naar het analoge audiosignaal voor reproductie doeleinden. Op alternatieve wijze kan het digitale audiosignaal worden verkregen vanuit een voor de computer leesbaar medium, zoals een geluidsbestand, een compact disk (CD), of een 20 digitale video disk (DVD).In operation 64, the digital audio signal with the compensation waveform obtained in operation 63 is converted to an analog audio signal. As described above, the digital audio signal with the compensation waveform as obtained in operation 63 can be a digital audio signal obtained by decoding a stream of bits sent from an MPEG apparatus for encoding audio and the digital signal can be converted to the analog audio signal for reproduction purposes. Alternatively, the digital audio signal can be obtained from a computer-readable medium, such as an audio file, a compact disk (CD), or a digital video disk (DVD).
In bewerkingen 65 en 66 wordt het analoge audiosignaal zoals verkregen in bewerking 64 en dat is gecompenseerd voor het ERP-DRP resonantie-effect, versterkt en uitgevoerd naar een luidspreker. Het ERP-DRP resonantie-effect treedt dan op wanneer het analoog audiosignaal 25 wordt uitgevoerd door de versterker. In overeenstemming hiermee wordt een oorspronkelijke audiosignaal met een oorspronkelijke golfvorm gereproduceerd voor waarneming door het menselijk oor, aangezien het ERP-DRP resonantie-effect de compensatie-golfvorm naar de oorspronkelijke golfvorm van het oorspronkelijke audiosignaal 30 transformeert.In operations 65 and 66, the analog audio signal as obtained in operation 64, which is compensated for the ERP-DRP resonance effect, is amplified and output to a speaker. The ERP-DRP resonance effect then occurs when the analog audio signal is output by the amplifier. Accordingly, an original audio signal with an original waveform is reproduced for observation by the human ear, since the ERP-DRP resonance effect transforms the compensation waveform into the original waveform of the original audio signal 30.
1029157 111029157 11
Figuur 7 toont een vergelijking van een audiosignaal dat wordt gereproduceerd door het apparaat voor het decoderen van audio van figuur 5 met een audiosignaal dat wordt gereproduceerd door een conventioneel apparaat voor het decoderen van audio. Een gebruiker kan het 5 gereproduceerde audiosignaal waarnemen door gebruik te maken van bijvoorbeeld een oortelefoon, een hoofdtelefoon of een oortelefoondeel.Figure 7 shows a comparison of an audio signal reproduced by the audio decoding apparatus of Figure 5 with an audio signal reproduced by a conventional audio decoding apparatus. A user can sense the reproduced audio signal by using, for example, an earphone, a headphone or an earphone part.
Andere audioapparaten die een afgesloten ruimte tussen het ERP-DRP van het menselijk oor kunnen creëren, kunnen ook worden gebruikt.Other audio devices that can create an enclosed space between the ERP-DRP of the human ear can also be used.
Onder verwijzing naar figuur 7 is het uitvoer audiosignaal, 10 wanneer de gebruiker een uitvoer audiosignaal hoort dat correspondeert met een invoer audiosignaal 71 met een vlakke golfvorm door gebruik te maken van een conventioneel apparaat voor het decoderen van audio, zoals werkelijk gedetecteerd door de gebruiker, een signaal 72 met een golfvorm met een middenband die wordt versterkt met ongeveer 15 dB.With reference to Figure 7, the output audio signal is when the user hears an output audio signal corresponding to an input audio signal 71 with a flat waveform using a conventional audio decoding apparatus as actually detected by the user, a signal 72 with a waveform with a middle band that is amplified by about 15 dB.
15 Echter, wanneer de gebruiker een uitvoer audiosignaal hoort dat correspondeert met een invoer audiosignaal 73 met een vlakke golfvorm door het gebruik te maken van het apparaat voor het decoderen van audio overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept, is een audiosignaal dat wordt uitgevoerd vanuit het 20 apparaat voor het decoderen van audio overeenkomstig de uitvoeringsvorm van het onderhavige algemene inventieve concept een signaal 74 met een compensatie-golfvorm. Daarom is het uitvoer audiosignaal dat werkelijk wordt gedetecteerd door de gebruiker een signaal 75 met dezelfde vlakke golfvorm als het invoer audiosignaal 73. De oorspronkelijke golfvorm van 25 het invoer audiosignaal 73 kan daarom worden verkregen door de oorspronkelijke golfvorm van het audiosignaal vooraf te compenseren voor het ERP-DRP resonantie-effect door gebruik te maken van de compensatie-golfvorm.However, when the user hears an output audio signal corresponding to a flat waveform input audio signal 73 using the audio decoding apparatus according to an embodiment of the present general inventive concept, an audio signal is output a signal 74 with a compensation waveform from the audio decoding apparatus according to the embodiment of the present general inventive concept. Therefore, the output audio signal actually detected by the user is a signal 75 having the same flat waveform as the input audio signal 73. The original waveform of the input audio signal 73 can therefore be obtained by pre-compensating the original waveform of the audio signal for the ERP-DRP resonance effect by using the compensation waveform.
Hiermee kan een uitvoer audiosignaal met een excellente 30 geluidskwaliteit zonder een versterkte middenband worden waargenomen 1029157 12 wanneer uitvoeringsvormen van het onderhavige algemene inventieve concept worden toegepast op draagbare audioapparaten, mobiele telefoons of personal digital assistants (PDA's), die gebruik maken van oortelefoons, hoofdtelefoons, oortelefoondelen, etc.Hereby an output audio signal with an excellent sound quality without an amplified mid-band can be observed 1029157 12 when embodiments of the present general inventive concept are applied to portable audio devices, mobile telephones or personal digital assistants (PDAs) which use earphones, headphones, earphone parts, etc.
5 Figuur 8 illustreert een afschermeffect dat optreedt wanneer het ERP-DRP resonantie-effect in beschouwing wordt genomen.Figure 8 illustrates a shielding effect that occurs when the ERP-DRP resonance effect is considered.
De meeste audiocompressiealgoritmes met verliezen benadrukken een maximum van een niveau waarbij de menselijke subjectieve waarneming geen onderscheid kan maken tussen een oorspronkelijk 10 audiosignaal van een comprimeert audiosignaal, waarbij het oorspronkelijke audiosignaal en het gecomprimeerde audiosignaal worden vergeleken, in plaats van een minimalisatie van een wiskundige fout tussen het oorspronkelijke audiosignaal en het gecomprimeerde audiosignaal. In termen van een gedetailleerd compressieverwerking wordt geluid dat niet 15 door mensen kan worden gehoord, verwijderd, en worden slechts bits toegewezen voor het representeren van geluid dat mensen kunnen horen.Most lossy audio compression algorithms emphasize a maximum of a level at which human subjective perception cannot distinguish between an original audio signal of a compressed audio signal, comparing the original audio signal and the compressed audio signal, instead of minimizing a mathematical error between the original audio signal and the compressed audio signal. In terms of a detailed compression processing, sound that cannot be heard by people is removed, and only bits are allocated to represent sound that people can hear.
De zeer hoge en zeer lage frequentiecomponenten worden bijvoorbeeld uitgesloten uit de compressiebewerking, aangezien menselijke oren slechts zelden zeer hoge en zeer lage frequentiecomponenten kunnen horen. Voorts 20 kan een frequentiecomponent die - gebaseerd op de karakteristieken van een menselijk oor - door een specifiek afschermfrequentie wordt afgeschermd, met lagere nauwkeurigheid dan normaal worden gecodeerd. Het psycho-akoestische model gebruikt het afschermeffect overeenkomstig de interactie tussen het menselijk oor en de hersenen. Overeenkomstig het 25 psycho-akoestische model wordt een maximale geluidsdruk van de frequentiecomponenten die menselijke oren niet kunnen waarnemen wegens het afschermen, een afschermdrempel genoemd. Wanneer de geluidsdruk van een frequentiecomponent boven de afschermfrequentie komt, kunnen de frequentiecomponenten boven de specifieke 30 afschermfrequentie worden gehoord. Aangezien audiosignalen met 1029157 13 geluidsdrukken lager dan de afscherm drempel niet kunnen worden gehoord, kunnen deze audiosignalen door een codeerbewerking van audio worden verwijderd.For example, the very high and very low frequency components are excluded from the compression operation, since human ears can rarely hear very high and very low frequency components. Furthermore, a frequency component which - based on the characteristics of a human ear - is shielded by a specific screening frequency, can be coded with a lower accuracy than normal. The psychoacoustic model uses the screening effect according to the interaction between the human ear and the brain. According to the psycho-acoustic model, a maximum sound pressure of the frequency components that human ears cannot perceive due to the screening is called a screening threshold. When the sound pressure of a frequency component exceeds the shielding frequency, the frequency components can be heard above the specific shielding frequency. Since audio signals with 1029157 13 sound pressures lower than the shielding threshold cannot be heard, these audio signals can be removed from an audio coding operation.
Onder verwijzing naar figuur 8 wordt een middenband (dat is een 5 ERP-DRP resonantieband) van een afschermdrempelcurve versterkt met meer dan 15 dB wegens het ERP-DRP resonantie-effect. Als de ERP-DRP resonantieband wordt beschouwd als een afschermband, zelfs indien naburige banden van de afschermband in een normale toestand kunnen worden gehoord (dat wil zeggen zonder het ERP resonantie-effect), kunnen 10 de naburige banden van de afschermband niet worden gehoord aangezien deze worden afgeschermd door de afschermband. Daarom kan een compressiesnelheid worden vergroot door de afschermdrempelcurve aan te passen ten einde het ERP-DRP resonantie-effect op het psycho-akoestische model dat wordt gebruikt voor het comprimeren van geluidsgegevens in 15 rekening te brengen.With reference to Fig. 8, a middle band (that is, an ERP-DRP resonance band) of a shielding threshold curve is amplified by more than 15 dB due to the ERP-DRP resonance effect. If the ERP-DRP resonance band is considered as a shielding band even if neighboring bands of the shielding band can be heard in a normal state (ie without the ERP resonance effect), the neighboring bands of the shielding band cannot be heard since these are protected by the screening tape. Therefore, a compression rate can be increased by adjusting the shield threshold curve to account for the ERP-DRP resonance effect on the psycho-acoustic model used for compressing audio data.
Figuur 9 is een blokdiagram dat een apparaat toont voor het coderen van audio overeenkomstig een uitvoeringsvorm van het onderhavige algemene inventieve concept.Figure 9 is a block diagram showing an audio encoding apparatus according to an embodiment of the present general inventive concept.
Onder verwijzing naar figuur 9 omvat het apparaat voor het 20 coderen van audio een filterinstallatie 91, een psycho-akoestisch modeleenheid 92, een bittoewijzer 93, een kwantisatie/codeereenheid 94, en een inrichting voor het formatteren van een stroombits 95.With reference to Fig. 9, the audio coding apparatus comprises a filter installation 91, a psychoacoustic model unit 92, a bit allocator 93, a quantization / coding unit 94, and a device for formatting a current bit 95.
De filterinstallatie 91 verdeelt een audiosignaal in een meervoudig aantal onderband bemonsteringen. Het audiosignaal dat wordt ingevoerd in 25 de filterinstallatie 91 en de psycho-akoestische modeleenheid 92 is een pulscode modulatie (PCM) audiosignaal.The filter installation 91 divides an audio signal into a multiple number of lower band samples. The audio signal that is input to the filter installation 91 and the psychoacoustic model unit 92 is a pulse code modulation (PCM) audio signal.
De psycho-akoestische modeleenheid 92 berekent een signaal naar afschermverhouding (SMR) van elk van de onderband bemonsteringen van het audiosignaal overeenkomstig een afschermdrempelcurve die wordt 30 aangepast ten einde het ERP-DRP resonantie-effect in rekening te brengen.The psychoacoustic model unit 92 calculates a signal to shield ratio (SMR) of each of the subband samples of the audio signal according to a shield threshold curve that is adjusted to account for the ERP-DRP resonance effect.
1029157 141029157 14
Dat wil zeggen, de psycho-akoestische modeleenheid 92 berekent een signaal naar afschermverhouding van elk van de onderbandenbemonsteringen van het audiosignaal door een ERP-DRP resonantieband met afschermdrempels die toenemen wegens het ERP-DRP resonantie-effect 5 te beschouwen. Aangezien de afschermdrempels worden aangepast wegens het ERP-DRP resonantie-effect, kan zowel een spectrum afschermtheorie als een tijd afschermtheorie worden toegepast. Hierbij kunnen de toegepaste afschermtheorieën omvatten gelijktijdige afscherming, afscherming vooraf, en afscherming achteraf die kunnen worden toegepast op conventionele 10 perceptiecodering.That is, the psycho-acoustic model unit 92 calculates a shield-to-screen ratio signal of each of the subband samples of the audio signal by considering an ERP-DRP resonance band with shielding thresholds that increase due to the ERP-DRP resonance effect. Since the shielding thresholds are adjusted due to the ERP-DRP resonance effect, both a spectrum shielding theory and a time shielding theory can be applied. Here, the shielding theories used may include simultaneous shielding, front shielding, and post shielding that can be applied to conventional perception coding.
De psycho-akoestische modeleenheid 92 omvat een FFT (snelle Fourier transformatie) eenheid 921, een resonantieband calculator 922, en een hoog/laagband calculator 923.The psychoacoustic model unit 92 includes an FFT (fast Fourier transformation) unit 921, a resonance band calculator 922, and a high / low band calculator 923.
De FFT eenheid 921 berekent een spectrale golfvorm door een 15 snelle Fourier transformatie van het audiosignaal uit te voeren.The FFT unit 921 calculates a spectral waveform by performing a fast Fourier transformation of the audio signal.
De resonantieband calculator 922 berekent een band die vervolgens wordt getransformeerd wegens het ERP-DRP resonantie-effect. De resonantieband calculator 922 berekent ook een SMR van de ERP-DRP resonantieband. In het bijzonder berekent de resonantieband calculator 922 20 de SMR van de ERP-DRP resonantieband door afschermdrempels te bepalen van de ERP-DRP resonantieband en geluidsdrukniveaus van de onderband bemonsteringen van de spectrale golfvorm zoals berekend door de FFT eenheid 921. De resonantieband calculator 922 berekent dan verschillen tussen de bepaalde afschermdrempels van de ERP-DRP 25 resonantieband en geluidsdrukniveaus van de onderband bemonsteringen. In overeenstemming daarmee kan de resonantieband calculator 922 een afschermeffect bepalen dat voorziet in de ERP-DRP resonantieband op onderband bemonsteringen die de ERP-DRP resonantieband omgeven.The resonance band calculator 922 calculates a band which is then transformed due to the ERP-DRP resonance effect. The resonance band calculator 922 also calculates an SMR of the ERP-DRP resonance band. In particular, the resonance band calculator 922 calculates the SMR of the ERP-DRP resonance band by determining shielding thresholds of the ERP-DRP resonance band and sound pressure levels of the lower band samples of the spectral waveform as calculated by the FFT unit 921. The resonance band calculator 922 calculates then differences between the determined screening thresholds of the ERP-DRP resonance band and sound pressure levels of the lower band samples. Accordingly, the resonance band calculator 922 can determine a shielding effect that provides the ERP-DRP resonance band on lower band samples that surround the ERP-DRP resonance band.
De hoog/laagband calculator 923 berekent SMR's van 30 hoog/laagbanden die corresponderen met andere banden dan de ERP-DRPThe high / low band calculator 923 calculates SMRs of 30 high / low bands that correspond to bands other than the ERP-DRP
1029157 15 resonantieband (dat wil zeggen banden die de ERP-DRP resonantieband omgeven). In het bijzonder berekent de hoog/laagband calculator 923 de SMR's van de hoog/laagbanden door de afschermdrempels van de hoog/laagbanden te bepalen en de geluidsdrukniveaus van de onderband 5 bemonsteringen van de spectrale golfvorm die worden berekend door de FFT eenheid 921. De hoog/laagband calculator 923 berekent dan verschillen tussen de bepaalde afschermdrempels en de geluidsdrukniveaus van de onderband bemonsteringen. In overeenstemming daarmee kan de hoog/laagband calculator 923 een afschermeffect bepalen dat 10 maskeerbanden, andere dan de ERP-DRP resonantieband, voorzien op de onderband bemonsteringen.1029157 resonance band (ie bands that surround the ERP-DRP resonance band). In particular, the high / low band calculator 923 calculates the SMRs of the high / low bands by determining the shielding thresholds of the high / low bands and the sound pressure levels of the lower band 5 samples of the spectral waveform calculated by the FFT unit 921. The high / low band calculator 923 then calculates differences between the determined shielding thresholds and the sound pressure levels of the lower band samples. Accordingly, the high / low band calculator 923 may determine a shielding effect that 10 masking bands, other than the ERP-DRP resonance band, provide on the lower band samples.
Wannneer de psycho-akoestische modeleenheid 92 wordt geïmplementeerd overeenkomstig de ERP-DRP resonantieband, kan de resonantieband calculator 922 en de hoog/laagband calculator 923 worden 15 geïmplementeerd als een enkelvoudige gecombineerde eenheid of als twee afzonderlijke eenheden.When the psychoacoustic model unit 92 is implemented in accordance with the ERP-DRP resonance band, the resonance band calculator 922 and the high / low band calculator 923 can be implemented as a single combined unit or as two separate units.
De bittoewijzer 93 wijst dan bits toe aan elk van de onderband bemonsteringen die zijn verdeeld door de filterinstallatie 91 overeenkomstig de SMR's die zijn berekend door de psycho-akoestische modeleenheid 92.The bit allocator 93 then assigns bits to each of the lower-band samples distributed by the filter installation 91 according to the SMRs calculated by the psychoacoustic model unit 92.
20 Bijvoorbeeld hoeven, ten aanzien van het afschermeffect van de ERP-DRP resonantieband, wanneer een onderband bemonstering een geluidsdruk heeft die kleiner of gelijk is aan de overeenkomstige afschermdrempel van de ERP-DRP resonantieband (dat wil zeggen een SMR die kleiner of gelijk is aan 1) geen bits worden toegewezen aan die 25 onderband bemonstering, aangezien de onderband bemonstering onhoorbaar is wegens het ERP-DRP resonantie-effect. Op dezelfde wijze worden, wanneer een onderband bemonstering met een geluidsdruk dat boven de overeenkomstige afschermdrempel van de ERP-DRP resonantieband uitgaat (dat is een SMR die groter is dan 1), bits toegewezen 30 aan de onderband bemonstering, aangezien de onderband bemonstering 102915? 16 hoorbaar is ondanks het ERP-DRP resonantie-effect. Op gelijke wijze worden bits ofwel toegewezen of niet toe gewezen aan onderband bemonsteringen overeenkomstig de bepaling van het afschermeffect van andere hoog/laagafschermbanden die worden gemaakt door de 5 hoog/laagband calculator 923.For example, with regard to the shielding effect of the ERP-DRP resonance band, when a lower band sampling has a sound pressure that is less than or equal to the corresponding shielding threshold of the ERP-DRP resonance band (i.e., an SMR that is less than or equal to) 1) no bits are assigned to that lower-band sampling, since the lower-band sampling is inaudible due to the ERP-DRP resonance effect. Similarly, when a lower band sampling with a sound pressure exceeding the corresponding shielding threshold of the ERP-DRP resonance band (that is an SMR greater than 1), bits are assigned to the lower band sampling, since the lower band sampling 102915? 16 is audible despite the ERP-DRP resonance effect. Similarly, bits are either assigned or not allocated to lower band samples in accordance with the determination of the shielding effect of other high / low shield bands made by the high / low band calculator 923.
De kwantisatie/coderingseenheid 94 kwantiseert en codeert de onderband bemonsteringen in een reeks toegewezen bits. De formatteerinrichting voor een bitstroom 95 formatteert de gekwantiseerde en gecodeerde onderband bemonsteringen aan een bitstroom door 10 bittoewijzingsinformatie en overige informatie toe te voegen aan de gekwantiseerde en gecodeerde onderband bemonsteringen. Over het algemeen formatteert de formatteerinrichting voor een bitstroom 95 de gekwantiseerde en gecodeerde onderband bemonsteringen overeenkomstig een MPEG standaard.The quantization / coding unit 94 quantizes and codes the lower band samples in a series of allocated bits. The bit stream formatting device 95 formats the quantized and coded subband samples to a bit stream by adding bit allocation information and other information to the quantized and coded subband samples. Generally, the bitstream formatting apparatus 95 formats the quantized and coded subband samples according to an MPEG standard.
15 De stroombits die wordt uitgevoerd vanuit de formatteereenheid voor een stroombits 95 wordt verzonden naar het apparaat voor het decoderen van audio.The stream bits output from the stream bit formatting unit 95 is sent to the audio decoding device.
Figuur 10 is een stroomschema dat een werkwijze toont voor het coderen van een audiosignaal overeenkomstig een uitvoeringsvorm van het 20 onderhavige algemene inventieve concept.Fig. 10 is a flowchart showing a method for coding an audio signal according to an embodiment of the present general inventive concept.
Onder verwijzing naar figuur 10 omvat de werkwijze voor het coderen van audio bewerkingen 101 tot 107. De werkwijze voor het coderen van audio zoals getoond in figuur 10 omvat een reeks bewerkingen die kunnen worden uitgevoerd door het apparaat voor het coderen van audio 25 zoals getoond in figuur 9. De werkwijze van figuur 10 kan op alternatieve wijze worden uitgevoerd door andere audioapparaten.With reference to Fig. 10, the method for encoding audio operations comprises 101 to 107. The method for encoding audio as shown in Figure 10 comprises a series of operations that can be performed by the audio encoding apparatus as shown in Figure 9. The method of Figure 10 can alternatively be performed by other audio devices.
In bewerking 101 wordt een audiosignaal verdeeld in een meervoudig aantal onderbanden.In operation 101, an audio signal is divided into a plurality of lower bands.
In bewerking 102 wordt een spectrale golfvorm berekend door een 30 snelle Fourier transformatie op het audiosignaal uit te voeren.In operation 102, a spectral waveform is calculated by performing a fast Fourier transformation on the audio signal.
1029157 171029157 17
In bewerking 103 wordt een SMR van een ERP-DRP resonantieband berekend. In het bijzonder wordt de SMR van de ERP-DRP resonantieband berekend door afschermdrempels van de ERP-DRP resonantieband te bepalen en geluidsdrukniveaus van de onderband 5 bemonsteringen van de spectrale golfvorm zoals berekend in bewerking 102, en door verschillen te berekenen tussen de bepaalde afschermfrequenties van de ERP-DRP resonantieband en geluidsdrukniveaus van de onderband bemonsteringen.In operation 103, an SMR of an ERP-DRP resonance band is calculated. In particular, the SMR of the ERP-DRP resonance band is calculated by determining shielding thresholds of the ERP-DRP resonance band and sound pressure levels of the lower band samples of the spectral waveform as calculated in operation 102, and by calculating differences between the determined shielding frequencies of the ERP-DRP resonance band and sound pressure levels of the lower band samples.
In bewerking 104 worden SMR's van hoog/laagbanden 10 corresponderend met banden andere dan de ERP-DRP resonantieband (dat wil zeggen banden die de ERP-DRP resonantieband omgeven) berekend. In het bijzonder worden de SMR’s van de hoog/laagbanden berekend door afschermdrempels van de hoog/laagbanden en geluidsdrukniveaus van de onderband bemonsteringen van de spectrale golfvorm zoals berekend in 15 bewerking 102, en door verschillen te berekenen tussen de bepaalde afschermdrempels van de hoog/laagbanden en geluidsdrukniveaus van de onderbanden bemonsteringen.In operation 104, SMRs of high / low bands 10 corresponding to bands other than the ERP-DRP resonance band (i.e., bands surrounding the ERP-DRP resonance band) are calculated. In particular, the SMRs of the high / low bands are calculated by shielding thresholds of the high / low bands and sound pressure levels of the lower band samples of the spectral waveform as calculated in operation 102, and by calculating differences between the determined shielding thresholds of the high / low bands and sound pressure levels of the lower tire samples.
Dat wil zeggen, in bewerkingen 103 en 104 worden de SMR's van de onderband bemonsteringen van het audiosignaal berekend 20 overeenkomstig de afschermdrempels die worden getransformeerd wegens het ERP-DRP resonantie-effect.That is, in operations 103 and 104, the SMRs of the lower-band samples of the audio signal are calculated according to the shielding thresholds that are transformed due to the ERP-DRP resonance effect.
In bewerking 105 worden bits toegewezen aan elk van de onderband bemonsteringen die worden verdeeld in bewerking 101 overeenkomstig de SMR's zoals berekend in bewerkingen 103 en 104.In operation 105, bits are assigned to each of the lower band samples that are distributed in operation 101 according to the SMRs as calculated in operations 103 and 104.
25 In bewerking 106 worden de onderband bemonsteringen gekwantiseerd en gecodeerd in een reeks bits die worden toegewezen in bewerking 105.In operation 106, the lower band samples are quantized and encoded in a series of bits that are assigned in operation 105.
In bewerking 107 worden de onderband bemonsteringen gekwantiseerd en gecodeerd in bewerking 106, geformatteerd in een stroom 1029157 18 bits door bittoewijzingsinformatie toe te voegen en additionele informatie aan de gekwantizeerde en gecodeerde onderband bemonsteringen.In operation 107, the underband samples are quantized and encoded in operation 106, formatted in a stream 1029157 18 bits by adding bit allocation information and additional information to the quantized and coded underband samples.
Het onderhavige algemene inventieve concept kan worden geïmplementeerd als een uitvoerbare code in een voor een computer 5 leesbaar medium omvattende opslagmedia, zoals magnetische opslagmedia (ROM's, RAM's, floppy disks, magnetische tapen, etc.), optisch leesbare media (CD-ROM's, DVD's, etc.), en andere dragers (transmissie via het internet).The present general inventive concept can be implemented as an executable code in a computer readable medium comprising storage media, such as magnetic storage media (ROMs, RAMs, floppy disks, magnetic tapes, etc.), optically readable media (CD-ROMs, DVDs , etc.), and other carriers (transmission via the internet).
Zoals hierboven beschreven kan een audiosignaal met excellente 10 geluidskwaliteit zonder een versterkte middenband worden waargenomen door een gebruiker met oortelefoons, hoofdtelefoons, een oortelefoondeel etc. overeenkomstig de uitvoeringsvormen van het onderhavige algemene inventieve concept, door gebruik te maken van een compensatie-golfvorm voor het compenseren voor een ERP-DRP resonantie-effect, hetgeen een 15 akoestische resonantie-effect is dat resulteert vanwege de structuur van het menselijk oor. In het bijzonder kan het ERP-DRP resonantie-effect dat een belangrijk probleem is geworden met het wijd verspreid gebruik van draagbare audioapparaten, zoals draagbare DVD spelers en MP3 spelers en mobiele telefoons, worden gecompenseerd.As described above, an audio signal with excellent sound quality without an amplified midband can be perceived by a user with earphones, headphones, an earphone part, etc. according to the embodiments of the present general inventive concept, by using a compensation waveform for compensating for an ERP-DRP resonance effect, which is an acoustic resonance effect that results due to the structure of the human ear. In particular, the ERP-DRP resonance effect that has become a major problem with the widespread use of portable audio devices such as portable DVD players and MP3 players and mobile phones can be compensated.
20 Voorts kan de compressiesnelheid aanzienlijk toenemen door een functie toe te voegen voor het met een hogere compressiesnelheid coderen van banden die worden afgeschermd door een ERP-DRP resonantieband dan het coderen van de andere banden door afschermdrempels te beschouwen die worden getransformeerd wegens het ERP-DRP resonantie-effect 25 overeenkomstig een psycho-akoestisch model dat wordt gebruikt voor het met een hogere compressiesnelheid coderen van hoog/laagbanden die niet door mensen kunnen worden gehoord dan het coderen van de andere banden.Furthermore, the compression rate can be increased considerably by adding a function for encoding bands that are shielded by an ERP-DRP resonance band at a higher compression rate than coding the other bands by considering shielding thresholds that are transformed due to the ERP-DRP resonance effect according to a psychoacoustic model used for coding high / low bands that cannot be heard by people at a higher compression rate than coding the other bands.
Hoewel slechts een aantal uitvoeringsvormen van het onderhavige 30 algemene inventieve concept zijn getoond en beschreven wordt opgemerkt 1029157 19 dat de vakman veranderingen kan aanbrengen in deze uitvoeringsvormen zonder afstand te doen van de uitgangspunten en de geest van het algemene inventieve concept, waarvan de beschermingsomvang wordt gedefinieerd in de hiernavolgende conclusies en hun equivalenten.Although only a few embodiments of the present general inventive concept have been shown and described, it is noted that those skilled in the art can make changes to these embodiments without departing from the principles and spirit of the general inventive concept, the scope of which is defined. in the following claims and their equivalents.
5 102 9 1 57'5 102 9 1 57 '
Claims (44)
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US57661704P | 2004-06-04 | 2004-06-04 | |
US57661704 | 2004-06-04 | ||
KR1020040043075A KR100636144B1 (en) | 2004-06-04 | 2004-06-11 | Apparatus and method for encoding/decoding audio signal |
KR20040043075 | 2004-06-11 | ||
US57886204P | 2004-06-14 | 2004-06-14 | |
US57886204 | 2004-06-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
NL1029157A1 NL1029157A1 (en) | 2005-12-06 |
NL1029157C2 true NL1029157C2 (en) | 2007-10-03 |
Family
ID=35697026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NL1029157A NL1029157C2 (en) | 2004-06-04 | 2005-05-31 | Audio signal decoding method for e.g. cell-phone, involves generating audio signal by decoding input signal, and transforming original waveform of audio signal into compensation waveform for acoustic resonance effect |
Country Status (1)
Country | Link |
---|---|
NL (1) | NL1029157C2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3985960A (en) * | 1975-03-03 | 1976-10-12 | Bell Telephone Laboratories, Incorporated | Stereophonic sound reproduction with acoustically matched receiver units effecting flat frequency response at a listener's eardrums |
US5479522A (en) * | 1993-09-17 | 1995-12-26 | Audiologic, Inc. | Binaural hearing aid |
WO2000049837A1 (en) * | 1999-02-17 | 2000-08-24 | Micro Ear Technology, Inc. D/B/A Micro-Tech | Resonant response matching circuit for hearing aid |
EP1343146A2 (en) * | 2002-03-04 | 2003-09-10 | AT&T Corp. | Audio signal processing based on a perceptual model |
-
2005
- 2005-05-31 NL NL1029157A patent/NL1029157C2/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3985960A (en) * | 1975-03-03 | 1976-10-12 | Bell Telephone Laboratories, Incorporated | Stereophonic sound reproduction with acoustically matched receiver units effecting flat frequency response at a listener's eardrums |
US5479522A (en) * | 1993-09-17 | 1995-12-26 | Audiologic, Inc. | Binaural hearing aid |
WO2000049837A1 (en) * | 1999-02-17 | 2000-08-24 | Micro Ear Technology, Inc. D/B/A Micro-Tech | Resonant response matching circuit for hearing aid |
EP1343146A2 (en) * | 2002-03-04 | 2003-09-10 | AT&T Corp. | Audio signal processing based on a perceptual model |
Also Published As
Publication number | Publication date |
---|---|
NL1029157A1 (en) | 2005-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050271367A1 (en) | Apparatus and method of encoding/decoding an audio signal | |
JP5695677B2 (en) | System for synthesizing loudness measurements in single playback mode | |
JP4478183B2 (en) | Apparatus and method for stably classifying audio signals, method for constructing and operating an audio signal database, and computer program | |
TWI505263B (en) | Adaptive dynamic range enhancement of audio recordings | |
KR101356206B1 (en) | Method and apparatus for reproducing audio having auto volume controlling function | |
JP3334419B2 (en) | Noise reduction method and noise reduction device | |
JP4925671B2 (en) | Digital signal encoding / decoding method and apparatus, and recording medium | |
KR100289733B1 (en) | Device and method for encoding digital audio | |
US6128593A (en) | System and method for implementing a refined psycho-acoustic modeler | |
NL1029157C2 (en) | Audio signal decoding method for e.g. cell-phone, involves generating audio signal by decoding input signal, and transforming original waveform of audio signal into compensation waveform for acoustic resonance effect | |
US10587983B1 (en) | Methods and systems for adjusting clarity of digitized audio signals | |
US7305346B2 (en) | Audio processing method and audio processing apparatus | |
US8195317B2 (en) | Data reproduction apparatus and data reproduction method | |
JP4822697B2 (en) | Digital signal encoding apparatus and digital signal recording apparatus | |
US20030233228A1 (en) | Audio coding system and method | |
JP3141853B2 (en) | Audio signal processing method | |
JP3200886B2 (en) | Audio signal processing method | |
KR101386645B1 (en) | Apparatus and method for purceptual audio coding in mobile equipment | |
JP5569476B2 (en) | Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium | |
Brouckxon et al. | Design and evaluation of a microphone signal conditioning system | |
JPH08167247A (en) | High-efficiency encoding method and device as well as transmission medium | |
JPH07161140A (en) | Apparatuses and methods for transmission and receiving of digital audio signal | |
JPH0758643A (en) | Efficient sound encoding and decoding device | |
JPH07294567A (en) | Method and apparatus for measurement of distortion factor of audio signal | |
Chiu et al. | A perceptually transparent audio power reduction algorithm for loudspeaker power management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AD1A | A request for search or an international type search has been filed | ||
RD2N | Patents in respect of which a decision has been taken or a report has been made (novelty report) |
Effective date: 20070802 |
|
PD2B | A search report has been drawn up | ||
V1 | Lapsed because of non-payment of the annual fee |
Effective date: 20101201 |