SE512719C2 - En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion - Google Patents

En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion

Info

Publication number
SE512719C2
SE512719C2 SE9800268A SE9800268A SE512719C2 SE 512719 C2 SE512719 C2 SE 512719C2 SE 9800268 A SE9800268 A SE 9800268A SE 9800268 A SE9800268 A SE 9800268A SE 512719 C2 SE512719 C2 SE 512719C2
Authority
SE
Sweden
Prior art keywords
signal
frequency
bandwidth
spectral envelope
signals
Prior art date
Application number
SE9800268A
Other languages
English (en)
Other versions
SE9800268L (sv
SE9800268D0 (sv
Inventor
Lars Gustaf Liljeryd
Per Rune Albin Ekstrand
Lars Fredrik Henn
Kristofer Kjoerling
Original Assignee
Lars Gustaf Liljeryd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE9702213A external-priority patent/SE9702213D0/sv
Priority claimed from SE9704634A external-priority patent/SE9704634D0/sv
Application filed by Lars Gustaf Liljeryd filed Critical Lars Gustaf Liljeryd
Priority to SE9800268A priority Critical patent/SE512719C2/sv
Publication of SE9800268D0 publication Critical patent/SE9800268D0/sv
Priority to PT98921697T priority patent/PT940015E/pt
Priority to ES03020094T priority patent/ES2247466T3/es
Priority to RU99104814/09A priority patent/RU2256293C2/ru
Priority to EP03020094A priority patent/EP1367566B1/en
Priority to PCT/IB1998/000893 priority patent/WO1998057436A2/en
Priority to JP50196299A priority patent/JP3871347B2/ja
Priority to AT98921697T priority patent/ATE257987T1/de
Priority to PT03020094T priority patent/PT1367566E/pt
Priority to AT03020094T priority patent/ATE303679T1/de
Priority to US09/230,799 priority patent/US6680972B1/en
Priority to DE69831435T priority patent/DE69831435T2/de
Priority to ES98921697T priority patent/ES2213901T3/es
Priority to CNB988007924A priority patent/CN1206816C/zh
Priority to DK98921697T priority patent/DK0940015T3/da
Priority to EP98921697A priority patent/EP0940015B1/en
Priority to BRPI9805989-0A priority patent/BR9805989B1/pt
Priority to CNB2004101000787A priority patent/CN1308916C/zh
Priority to DK03020094T priority patent/DK1367566T3/da
Priority to DE69821089T priority patent/DE69821089T2/de
Priority to AU74465/98A priority patent/AU7446598A/en
Publication of SE9800268L publication Critical patent/SE9800268L/sv
Publication of SE512719C2 publication Critical patent/SE512719C2/sv
Priority to HK01101733A priority patent/HK1030843A1/xx
Priority to US10/680,224 priority patent/US6925116B2/en
Priority to US10/681,105 priority patent/US7328162B2/en
Priority to US10/682,030 priority patent/US7283955B2/en
Priority to HK04100528A priority patent/HK1057815A1/xx
Priority to JP2004355011A priority patent/JP4220461B2/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Luminescent Compositions (AREA)
  • Pyridine Compounds (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Cosmetics (AREA)

Description

nu m... ...nu ..- ....-.._._. 10 15 20 25 30 35 512 719 2 Rösten och flertalet musikinstrument genererar sålunda en avsevärd del redundant information, d v s det existerar ett samband mellan spektralkomponentemas låg- och högband. Spektralkomponenter som har tagits bort genom undertryckning av en audiosignals högband har en direkt relation till lågbandets komponenter. Frekvens- inforrnationen i lågbandet under fm, innehåller enligt uppñnningen huvuddelen av informationen som behövs för att återskapa ett välljudande högband ovanför flm. Det övre frekvensområdet i en tal- eller musiksignal kan därför tas bort före signalöverföring eller signallagring förutsatt att övertoner skapas syntetiskt enligt HBX-metoden i avkodaren.
Två detaljer är av stor vikt vid generering av övertoner: För det första; de nyskapade frekvenskomponenterna måste vara harmoniskt relaterade till den ursprungliga harmoniska serien för att undvika dissonans. Den föreslagna uppfinningen använder transponering för övertonsgenereringen, vilket säkerställer att detta krav uppfylles. För det andra; det genererade högbandets spektralenvelopp måste efterlikna originalsignalens spektralenvelopp med tillräcklig noggrannhet.
Den föreslagna metoden erbjuder två användningssätt, l-IBX-l och l-lBX-Z, vilka skiljer sig i sättet på vilket spektralenveloppen skapas eller justeras: HBX-1, ämnad för användningsområden då medelgod ljudkvalitet är tillräcklig, är en post-process som enbart använder sig av informationen i den av avkodaren mottagna lågpassignalen. Denna signals spektralenvelopp bestämmes och extrapoleras med hjälp av t ex polynom tillsammans med en uppsättning regler eller en kodbok.
Denna information används sedan för kontinuerlig spektraljustering av det syntetiska högbandet.
HBX-Z, ämnad för högkvalitativa användningsområden, är en dubbelsidig process som utöver lâgbandssignalen enligt I-lBX-l även kodar och överför information om högbandets spektralenvelopp. Då spektralenveloppens tidsvariationer är betydligt mindre än de för högbandets signalkomponenter, behöver enbart en liten mängd extra information överföras.
Redan kända metoder för syntetisk ökning av signalers bandbredd är relativt enkla. De flesta är ämnade att förbättra talkodare inom telefoni. Några använder linj är-skíft av bredbandssignaler eller vikningsdistorsion [“High-Frequency Re generation in Speech Coding Systems” J. Makhoul, M. Berouti, IEEE 1979], [“Quality Enhancement of Band Limited Speech by Filtering and Multirate Techniques” H. Yasukawa, ICSLP 1994, Yokohama]. Dessa metoder skapar kraftig dissonans då de används för t ex musiksignaler. Vidare använder US 4.150.253 och Japanska patentansökan No. 06329892 olinjäriteter för att skapa övertoner. Alla sådana metoder genererar icke harmoniska intermodulationsprodukter vilket skapar kraftig dissonans. Därför kan tidigare kända metoder enbart användas vid tillämpningar där kvalitetslcraven är låga. En förfmad telcnik är nödvändig om en stor del av audiospektrumet skall återskapas med hög ljudkvalitet. 10 15 20 25 30 35 512 719 3 Den föreslagna HBX-1 metoden erbjuder fördelen av post-processning, d v s ingen modifiering av kodaren behövs. Operatörer kan erbjuda flera samtidiga program över transmissionskanalen än tidigare altemativt högre ljudkvalitet på befintliga program, eller en kombination av båda. Existerande bitströmsprotokoll eller standarder kan användas utan modifiering.
HBX-2 kan användas för att förbättra tillgänglig kodningstelmik utan eller med mindre modifiering av befintliga bitströmsprotokoll eller standarder. Självfallet kan HBX-Z tekniken integreras i framtida kodare för att öka kodningseffektiviteten.
Realtidsimplementexing av uppfinningen är möjlig i en vanlig signalprocessor eller kraftfull PC. HBK-metoden kan även kodas i en ASIC. I-IBX kan implementeras i olika system för lagring och överföring av audiosignaler, analoga eller digitala, med eller utan psykoakustiska kodare. HBX-l metoden kan integreras i en avkodare eller erbjudas som ett tillbehör. HBX-Z metoden kräver modifiering av kodaren.
De mest attraktiva användningsområdena utgörs av olika typer av lågbitflödeskodare såsom MPEG 1/2 Layer I/II/III, MPEG 2/4 AAC, Dolby AC-3, NTT TwinVQ, CCITT/ITU-R G.722 etc. Dessa kodare är populära inom multimedia, på Intemet såväl som inom professionella användningsområden. T-DAB system (T errestrial Digital Audio Broadcast) använder lågbitflödesprotokoll speciellt inom FM och AM banden. Satellit S-DAB kan tjäna avsevärt på metoden då extremt höga systemkostnader ingår. Genom att använda den föreslagna metoden kan antalet programkanaler utökas i DAB-multiplexen.
SAMMANFATTNING Målet med uppfinningen är att erbjuda en metod och anordning för att öka kodningseffektiviteten eller audiolcvaliteten i ett transmissionssystem för digital audio, se Fig. 25. Metoden baserar sig på harmonisk redundans vilket erbjuder möjligheten att ta bort det högre frekvensområdet i en musik- eller talsignal (1) innan denna kodas, överföres eller lagras (2), följd av syntetisk bandbreddsexpansion av audiosignalen (3) på avkodningssídan (4). Ingen märkbar försämring av ljudkvaliteten erhålles förutsatt att bandbreddsexpansion med hög kvalitet utföres i avkodaren i enlighet med uppfinningen.
Den föreslagna metoden för bitflödesreduktion enligt HBX-l metoden kan sammanfattas i följande steg: - Generering av en första bandbegränsad signal genom nersampling av en ursprunglig signal med full bandbredd, för att därvid reducera bitflödet, - överföring eller lagring av den förstnämnda bandbreddsbegränsade signalen innehållande en högsta frekvens (fm), - generering av en andra signal i avkodaren genom Irransponering av en del av spektrum för den förstnämnda signalen till ett frekvensområde innehållande högre frekvenskomponenter än den förstnämnda signalens högsta frekvens ( f m ), företrädesvis till ett frekvensområde med en högsta frekvens likvärdig den ursprungliga signalens högsta frekvens och 10 15 20 25 30 35 512 719 4 - kombinering av den andra signalen och den förstnämnda signalen för generering av en tredje signal vilken uppvisar större bandbredd än den förstnämnda signalen, i huvudsak likvärdig den urspnmgliga signalens bandbredd.
HBX-Z metoden innefattar ytterligare steg enligt följande: - Urspnmgssignalens spektralenvelopp extraheras och överföres tillsammans med den förstnämnda signalen för att därefter användas för spektralenveloppsjustering av den andra signalen.
De föreslagna HBX metoderna och anordningarna erbjuder följande fördelar: - 1. Varje harmonisk eller sub-harmonisk grupp (2:a ,3:e,...,n:te) genereras och styrs individuellt. - 2. Varje deltonsset skapas från ett individuellt passband inom programmaterialets lågband. - 3. Alla syntetiskt genererade övertoner skapas på ett sådant sätt att en fortsättning på lågbandets harmoniska serie erhålles. - 4. Processen för generering av deltoner är baserad på transponering vilket garanterar att inga hörbara distorsionskorrrponenter erhålles. - 5. Det syntetiskt genererade högfrekvensbandet kan täcka ett stort fiekvensområde. - 6. Ökningen av kodningseffektiviteten är markant. - 7. I HBX-l metoden sker processen enbart i avkodaren. - 8. HBX-l kan appliceras på de flesta kodare, d v s befintliga standarder och protokoll kan användas utan modifiering. - 9. HBX-Z metoden erbjuder hög ljudkvalitet. - 10. Vissa protokoll medger oförändrade användning av HBX-Z då de stödjer överföring av spektralenveloppen. - 11. HBX-Z metoden erbjuder tillverkare av kodare ett helt nytt och kraftfullt verktyg. - 12. Båda HBX algorltmerna är robusta.
KORTFATTAD BESKRIVNING AV RITNINGARN A Föreliggande uppfinning kommer nu att beskrivas med hjälp av exernpel med tillhörande ritningar, vilket ej skall uppfattas som begränsningar av uppfinningens utförande, där: Fig. 1 illustrerar generering av övenoner.
Pig. 2 är ett blockdiagram över en systernlösning för bandbreddsexpansion.
Fig. 3 är ett blockdiagram över en tidsdonränsirnplementerad transponerare.
Fig. 4 illustrerar generering av en kodbok eller tabell för en granulärgenerator.
Fig. 5 illustrerar granulärgeneratorn.
Fig. 6a - 6c är ett blockdiagram över en anordning för STFT-analys och -syntes kopplad för generering av andraton. 10 »_- 'Jr 20 25 30 35 512 719 5 Fig. 7a - 7b år ett blockdiagram över ett enstaka subband i STFT-anordningen utförande ett linjärt frekvensskifi.
Fig. 8 illustrerar hur tredjeton kan genereras.
Fig. 9 illustrerar hur andra- och tredjeton genereras samtidigt.
Fig. 10 illustrerar generering av en kombination av olika överlappande deltonsordningar.
Fig. ll illustrerar ett subband där en parametrisk metod är irnplementerad.
Fig. 12 illustrerar generering av bredbandiga linjära frekvensskifi.
Fig. 13 illustrerar generering av en kombination av icke överlappande deltonsordningar.
Fig. 14 illustrerar hur sub-harmoniska toner kan genereras.
Figs. lSa -15b är ett blockdiagram över en perceptuell kodare.
F ng 16 illustrerar en filterbank för generering av andraton.
F ng 17 illustrerar ett modulerat lågpass prototypfilter.
Fig 18 illustrerar en rnaxirnalt decimerad filterbank.
F15; 19 är ett blockdiagram över en effektiv implementering av den parametriska metoden.
F :g 20 illustrerar subbandsampler och skalfaktorer för en typisk kodare.
Fig 21 illustrerar subbandsampler och enveloppsinformation för HBX-Z.
Fxg 22 illustrerar dold överföring av enveloppsinforrnation med HBX-Z.
Fig 23 illustrerar HBX-Z med förlustfri kodning.
Fig 24 illustrerar ett blockdiagram av en "pseudo-stereo" generator Fig 2 5 illustrerar översiktligt ett förfarande enligt uppfinningen BESKRIVNING AV FÖREDRAGNA UTFÖRINGSFORMER I Fig. l visas generering av M :te ordningens deltoner, där M utgör ett heltal 2 2. Termen M :te deltonen används för enkelhets skull, trots att processen genererar M :te ordningens deltoner till alla deltoner inom ett speciellt frekvensområde som vanligen själva utgör deltoner av okänd ordning. Insignalen med frekvensdornänrepresentationen X (f) är bandbegränsad till området O till fmx . Signalinformationen inom området fmx /M till Q fm /M , där Q utgör den önskade bandbreddsexpansionsfaktorn l < Q S M , extraheras med hjälp av ett bandpassfilter, vilket ger en bandpassignal med spektrum XBP (f Denna bandpassignal transponeras med en faktor M , varvid en andra bandpassignal med spektrum X T ( f ) täckande området f mn till Q f m erhålles. Spektralenveloppen för denna signal justeras med hjälp av ett programmaterialstyrt multibandsfilter vilket ger en signal med spektrum X5 (f) . Denna signal adderas därefter till inssignalen, varvid en utsignal med spektrum Y( f) som täcker frekvensområdet 0 till Q fm erhålles.
En transponering med en faktor M av en tidsdislcret signal x(n) bestående av en summa av cosinuskomponenter med tidsvarianta arnplituder, definieras av relationen 10 15 20 25 30 512 719 6 N-l m) = 28,01) 004219311/ fs +09.) _> (1) i=0 N-1 yw) = 22,01) wSQflMfifl / f. + Bi) <2) i=O där N är antalet deltoner, ,e,. (n), 01,. är respektive deltons frekvens, tidsenvelopp och faskonstant, ßi är godtyckliga faskonstantet på utsignalen och f, är samplingsfrekvensen.
En approximering av en ideal transponering kan användas, förutsatt att dissonansen för transponerade frekvenskomponenter minimeras. Dissonanslo-iteriet beskrivs i [“Tonal Consonance and Critical Bandwidth” R. Plomp, W. J. M. Levelt JASA , Vol 38, 1965], och visar att två toner uppfattas som dissonanta om frekvensdiiïeransen mellan de två tonerna ligger ungefär inom 5 till 50% av den kritiska bandbredden i det frekvensområde där tonerna befinner sig. Kritisk bandbredd fór en given frekvens kan approximeras med @b( f) = 25 + 7s(1+1.4(ï0fT0)2)°-°9 (a) där foch cb angesiI-Iz.
Två toner i konsonans skall ej vara dissonanta efter en transponering. Emellertid kan även en ideal transponering påverka övertonerna så att de får en mindre konsonant karaktär enligt Plomp/Levelt. En ideal transponering kan approximeras enligt yapprax (n) = hålet' (n) COS(27I i )n / fs + (4) i=0 där Af,- skall rninimeras fór att undvika dissonans och 0.0 Af,- S -TScb(Mf,-) (5) är ett riktvärde enligt Plomp/Levelt. Detta förklarar varfor metoder som använder bredbandiga frekvensskift, vikningsdistorsion och andra olinjära metoder ej ger ett tillfredställande resultat då de ej minimerar dissonansen.
En direkt implementation av ovanstående metod visas i Pig. 2. Insignalen är bandbreddsbegränsad till ett område 0 till f rm och transponeringar M = 2,3,4 och bandbreddsexparisioner Q = 2,2,2 används som exempel.
Insignalen leds till en fördröjning 207 vilken kompenserar fórdröjningen i filter och transponerare. Insignalen leds även till bandpassfilter 201, 203, och 205, med passband fm / 2 - fm , fm / 3 - 2 fm / 3 , och f "m / 4 - f m / 2. Utsignalema från filterna kopplas till transponerama 209, 211 och 213 vilka transponerar signalerna 2, 3 respektive 4 gånger. Olika implementeringar av transponerare kommer att beskrivas nedan. 10 15 20 25 30 35 512 719 7 Utgångssignalerna fiån transponerama kopplas till filter 215, 217 och 219 där spektralenvelopperna och signalnívåerna adaptivt justeras, antingen med lågbandets spektralenvelopp som styrdata (HBX-l) eller med den kodade enveloppen från originalhögbandet (HBX-Z). Dessa funktionsblock kommer att beskrivas nedan.
Utgångssignalema fiån funktionsblocken 207, 215, 217 och 219 adderas m h a block 221, 223 och 225, vilket ger utsignalen. Signalen tår i detta exempel frekvensområdet utökat till 2 f m .
Självfallet kan utförandet enligt Fig. 2 varieras på många sätt. Till exempel kan baridpassfiltren 201, 203 och 205 ersättas av ett bandpassfilter med brytfrekvenser fm and Qfmx kopplat mellan block 221 och 223. Justering av spektralenveloppen kan utföras med ett enkelt filter i ledet 221 - 223.
Uppfinníngen erbjuder följande fördelar: - 1. Inga komponenter genereras inom den bandbreddsbegränsade insignalens frekvensområde, vilket innebär att insignalens frekvensområde lämnas opåverkat. - 2. De genererade komponenterna är harmoniskt relaterade till insignalens komponenter och genererar ej dissonans eller andra oönskade effekter. - 3. De genererade komponentemas spektralenvelopp skapar en kontinuerlig fortsättning av insignalens spektralenvelopp. Denna extrapolerade spektralenvelopp utgör en god approximation av mostvarande del av originalets spektralenvelopp.
Transponerarna 209, 211, 213 kan utföras på olika sätt. Typiska tidsdomän-irnplementeringar [“An Efficient Method for Pitch Shifting Digitally Sampled Sounds” K. Lent, Computer Music Journal, Vol. 13, No 4, 1989] expanderar signalen i tid genom att duplicera signalsegment baserade på signalens periodtid. Därefter läses signalen ut med en annan samplingsfrekvens. Tyvärr är dessa metoder beroende av estimering av signalens grundton for att kunna dela upp signalen i lämpliga segment att koppla samman. Begränsningen att metoden baseras på grundtonens periodtid gör tekniken känslig för transienter. Då periodtiden kan vara betydligt längre än en typisk transient, löper man en risk att hela transienten dupliceras i stället fór att expanderas i tid. En förbättrad metod för tidsdornänstransponering föreslås härmed där användningen av avancerad granulär-syntes ger en mer noggrann transponering, speciellt vid höga nansponeringsfaktorer och detta vid lägre beräkningskostnad jämfört med andra kända metoder.
Denna transponerare bygger på mönsterigenkänningsbaserad signalprediktion ["Tirne-Scale Modiñcation of Speech based on a nonlinear Oscillator Model", G. Kubin, W. B. Kleijn, IEEE, 1994] helt utan behov av att uppskatta grundtonen. En vanlig tidsdomänstransponerare baserad på grundtonsestimering kan aldrig fungera väl för alla signaltyper och speciellt ej för stora transponeringsfaktorer.
Transponeraren i Fig. 3 innehåller tre separata moduler: en transientdetektor 301, en tidsexpander 303 och en nedsarnplare 305. .1_..........1 ...in 10 15 20 25 30 512 719 8 Insignalen matas både till tidsexpandern och transientdetektorn. Transientdetektom varnar tidsexpanderenheten när en transient inträffar. Tidsexpandennodulen expanderar signalen i tid och signalen nedsamplas för att erhålla en frekvenstransponering Det finns olika tidsdomänalgoritxner för att erhålla tidsexparision/korrrpression av talsignaler. Några är baserade pâ mönsterigenkänningsprediktion av utsignalen ["Pattern Search Prediction of Speech", R. Bogner, T. Li, Proc.
ICASSP ”89, Vol. l, May 1989]. Detta är en form av granulär syntes [“Díscovering Inner Complexity: Time Shifting and Transposition with a Real-time Granulation Technique", B. Truax, Computer Music Joumal, Vol. 18, No. 2, 1994], insignalen uppdelas i små delar, granuler, som används för att skapa utsignalen.
Systemet använder en tillståndsrymdrepresentation där tillståndsvektorer, eller granuler, representerar in- och utsignalerna. Insignalen representeras av en tillståndsvektor x(n), ekv. 6: m) = [m -1),x(n -1- D),x(n -1- 2D),...,x(n - 1 - (N -1)D)] (s) Vektom erhålls från N tidsfördröjda sampel av insignalen, där N är tillståndsvektorns längd och D är fördröjningen mellan de sampel som används för att skapa Vektom. Den granulära transforrneringen ger sarnplet x(n) efter varje tillståndsvektor x(n-l). Detta ger ekv. 7, där a(.) är transfonnen: 1601) = fl(X(" - 1)) (7) Den grundläggande delen av det föreslagna förfarandet är den granulära uansforrnen och tillståndsövergångsuppslagstabellen eller kodboken. Den granulära transformen används for att bestämma nästa utsignal beroende på de tidigare utsignalerna. Denna transform a(.) bestäms genom att använda en tillståndsövergångskodbok. Kodboken med längd L ornskapas kontinuerligt och innehåller tillståndsvektorerna och nästa sampel som följer varje tillståndsvektor.
Detta betyder att transformen a(.) evalueras för alla övergångar som firms i kodboken, se ñg. 4 och ekv. 8. x(n-L) x(n-L+l) a x(n-L+1) ___ x(n-L+2) (8) M M x(n -1) x(n) 10 15 20 25 30 35 512 719 9 Med denna övergångskodbok beräknas den nya utsignalen y(n) genom att söka efter den tillståndsvektor i kodboken som mest liknar den aktuella tillståndsvektom y(n-1). Denna närmaste-granne-sölming utförs med hjälp av korrelation och ger det nya utsamplet, ekv. 9 y(n) = <1(Y(" ~ 1)) (9) Således är den föreslagna tidsdomäntrarisponeraren baserad på en granulär transfonn som predikterar den nya utsignalen på basis av tidigare utsígnaler och insignaler, fig. 5. Systemet skapar kontinuerligt en kodbok med sampel som representerar ett segment av insignalen. Genom att använda denna kodbok kan systemet prediktera den mest sannolika nästa utsignalen. Denna utsignal matas ut ur kodboken och en ny kodbok skapas för nästa utsignalssegment.
Prediktionen för nästa utsignalssegment utförs genom att korrelera den senaste utsignalen med kodboken för att finna den bästa fortsättningen på utsignalen. Transponeringsfaktorn bestäms av förhållandet mellan insignalssegrnentlängden som används för att skapa kodboken och utsignalssegmentlängden som utmatas ur kod- boken.
Tidsexpansions/kompressionssystemet som beskrivs i ["Time-Scale Modification of Speech based on a nonlinear Oscillator Model", G. Kubin, W. B. Kleijn, IEEE, 1994] fimgerar bra för talsignaler men försämras snabbt för signaler med större komplexitet såsom musik. Den föreslagna tidsdomäntransponeringsalgoritrnen har lösningar för att förbättra prestanda. För att undvika duplicering av transienter används en transientdetektor. När en transient detekteras tillåts inte systemet att alstra en utsignal från signalsegmentet som omger transienten mer än en gång. Detta är mer effektivt och mycket mer tillförlitligt än att endast justera insignalssegmentlängden vid transienter såsom föreslås av [G. Kubin, W. B. Kleijn].
Vidare har det föreslagna förfarandet en mer effektiv kodbokssökning baserad på signalstatistik. Detta betyder att systemet sökeri de mest sannolika kodboksfálten på basis av de tidigare hittade kodboksfalten.
Fördelama med den föreslagna tekniken är uppenbara, det finns inget behov av någon särskild pitch-detektering som övriga system är beroende av och systemet kommer med säkerhet alltid att alstra den mest sannolika sekvensen från den tidigare utsignalen även under transienta förhållanden.
Olika nya frekvensdomäntelcriiker för transponering kommer nu att beskrivas. Signalen som skall transponeras uppdelas i en serie bandpassignaler eller subbandsignaler. Subbandsignalenia transponeras sedan, exakt eller approximativt, och kombineras med insignalen. Detta åstadkommes genom att ansluta analyssubband till syntessubband på nya och innovativa sätt. En sådan mappning kommer hädanefier att refereras till som en "patch". Förfarandet demonstreras först medelst användning av STFT (Short Time Fourier Transform). __” ..._-hä 10 15 20 25 30 512 719 10 Den diskreta STFT:en av en tidsdislcret signal x(n) definieras av Xk<»)= 2x kor-p) ffw (10) p=-w där k = O,1,...,N-1 a) = Zzrk/N och h(n) är ett fönster.
Om fönstret uppfyller följande villkor l) h(O) = 1 1 2) h(n)=0 för n=iN,i2N,i3N,... (1) finns en inverstransforrn som ges av 1 N-i _ m) = g zxkor) efwk" . (12) k=0 Den direkta transformen kan ses som en analysenhet som består av en bank av N bandpassñlter med impulssvaren h(n) expÜcuKn) följt av en bank av N multiplikatorer med bärvågsfrekvenser expfijmxrz) som skiftar bandpassignalerna ned till områden lcring 0 Hz och därigenom bildar de N analyssignalerna X ,<(n). Fönstret fungerar som ett prototyplågpassfilter. En analyskanal visas i fig. 6a. X (n) har små bandbredder och är normalt nedsamplade. Ekv. 10 måste således endast evalueras för n=rR, där R är decirneringsfaktom och r är den nya tidsvariabehr. X ,((n) kan återskapas från X,<(rR) genom uppsampling, d v s infogande av nollor följt av lågpassñltrering, se frg. 6b. Den inversa transforrnen kan ses som en syntesenhet som består av en bank av N multiplikatorer med bärvågor (l/N) expfiwxn) som skiftar signalerna X ,(n ) upp till sina ursprungliga frekvenser, se fig. 6b, följt av steg som adderar bidragen från alla kanalema. STFT:en och ISTFT:en kan omarrangeras i syfie att använda DFT och IDFT, vilket gör det möjligt att använda FFT-algoritrner [“Implementation of the Phase Vocoder using the Fast Fourier Transform”, M. R. Portnoff, IEEE ASSP, Vol. 24, No. 3, 1976].
Fig. 6c visar en patch för alstring av andraton med N=32. För enkelhetens skull visas endast kanalerna 0 till 16.
Mittfrekvensen för BP 16 är lika med Nyqvist-frekvensen, kanalerna 17 till 31 svarar mot de "negativa fiekvensema" och är anslutna på ett motsvarande sätt. Blocken betecknade P kommer att beskrivas senare och skall för tillfället anses vara kortslutna. l5 20 25 30 35 512 719 11 Insignalen antas i detta exempel vara bandbreddsbegränsad på ett sätt så att endast kanalerna 0 t.o.m 7 innehåller signaler. Analyskanalema 8 till 16 är således tomma och behöver inte vara kopplade till syntesenheten.
Analyskanalerna 0 till 7 är kopplade till synteskanalerna 0 till 7. (Denna del av patchen svarar mot 207 i fig. 2).
Analyskanalerna k där 4 5 k 5 7 kopplas också till synteskanalema 2k som skifiar signalerna till frekvensområden belägna kring två gånger niittfrekvenserna fór bandpassfilterna k. Sålunda uppskiftas signalinnehållet i kanalerna k till det ursprimgliga området och transponeras samtidigt upp en oktav.
För att beskriva övertonsgenereringen med reellvärda impulssvar och modulatorer måste den kombinerade utsignalen från de om-mappade inkanalerna k och N - k där 4 5 k 5 7 berälcrias. Se fig. 7a. Detta ger yw) = -I2V[x(n) - h(n)c0s(wkn)]e0s((M -1)w,(n))+ (13) - åkrar) ~= m) sinmknflsinqM _ iiwkn) vilket tydligt representerar en bandpassfiltrering av insignalen följt av ett linjärt frekvensskift eller SSB-SC rnodulation, se tig. 7b.
Forfarandet ovan benämns "styckvis linjärapproximationstransponering". Det alstrar endast exakta andratoner for iiisignaler med frekvenser (om = a), där 4 5 k 5 7. Om emellertid antalet filter är tillräckligt stort kommer awikelserna från de ídeala frekvenserna vara fórsumbara och således ohörbara. Fördelar med detta forfarande är enkel implementering och låg beräkningskosmad. Övertonspatchen i fig. 6c kan enkelt modifieras for andra transponeringar än två. Fig. 8 visar en patch for alstring av tredjeton. Övertoner av olika ordningar kan genereras samtidigt såsom visas i fig. 9, där andra- och tredjetoner används.
Det framgår klart att ovan alstrade spektra innehåller ”nollställen”, eftersom inte alla synteskanaler används. Fig. 10 visar ett förfarande for att transforrnera alla synteskanaler (N = 64, kanalerna O - 32 visas). Alla högbandskanaler vars index inte är primtal rnappas i enlighet med följande förhållande mellan käll- och destinationskanalindex: km, = Mkmm där M är lika med det minsta heltalet 22 som uppfyller villkoret att kmm, ligger i lågbandet och kw, i högbandet. Sålunda mottager ingen synteskanal signaler från mer än en analyskanal, Högbandskanaler med primtalsindex kan rnappas till kwm, = I eller lågbandskanaler kmme > 1 som ger goda approximationer av förhållandet ovan (endast icke primtalsanslutningar med M = 2,3,4,5 visas i fig. 10).
Transponeringen kan göras exakt genom att infora blocken betecknade P (fig. 6c) om N är så stort att alla analyskanaler innehåller högst en diskret frekvenskomponent vardera. I detta fall är X ,c(rR) en komplex exponentialfuriktion med en frekvens som är lika med skillnaden mellan frekvensen for deltonen som finns i 10 15 20 25 30 35 512 719 12 analys-BP passbandet k och filterrnittfrekvensen of För att erhålla en ideal transponering M måste denna frekvens multipliceras med en faktor M. Detta beskrivs i fig. ll. Således omvandlas X,,(rR), där 4 S k S 7 i detta exempel, från rektangulära till polära koordinater såsom visas av blocken R -> P. Argumenten multipliceras med 2 i detta fall och amplitudvärdena lärnnas oförändrade. Signalerna konverteras sedan tillbaka till rektangulära koordinater (P -> R) och bildar signalerna YMufrR) och matas till synteskanalema i enlighet med ñg. 6c.
Decimeringsfaktom och interpoleringsfiltema måste justeras för att kunna hantera de högre kanalfrekvenser som erhålls i P-blocken. Detta förfarande benämns "parametrisk transponering".
Det bör observeras att ovanstående förfaranden skiljer sig från traditionella frekvensdomäns- transponeringstelciiiker som använder STFT, där tabelloscillatorer används för syntes eller, då ISTFT används för syntesen, signalen först snäcks ut i tiden och därefier decirneras.
Patchar som alstrar spektrala nollställen, alstrar också för- och efterekon i tidsdomänen, d v s svaga falska transienter före och efter "riktiga" transienter. Regelbundna nollställen i frekvensdomänen svarar mot ekon i tidsdomänen. Även om P-blocken "fyller igen de spektrala hålen" för långsamt varierande tonala signaler kvarstår transíentproblemen. Genom att bygga in en transientdetektor och koppla till en alternativ patch under transienter eliminieras emellertid dessa effekter. Transientdetektorn övervakar en övre del av lågbandskanalema och söker efter plötsliga ökningar i energi på block-till-block basis, där varje block består av ett antal subbandssarnpel. Block som bedöms innehålla transienter kan behandlas i enlighet med fig. 12 eller ñg. 10 utan parametrisering. Den forsta patchen svarar mot bredbandiga linjära frekvensskift. Konsekutiva lâgbandskanaler mappas till konsekutiva högbandskanaler. I syfte att erhålla den önskade bandbreddsexpansionen dupliceras lågbandskanalema flera gånger såsom visas. Efiersom denna patch endast används för korta tidsförlopp kommer inga negativa effekter på tonaliteten att märkas.
Ett liknande förfarande för att förbättra transientsvaret är att variera antalet kanaler N och alltjämt använda en patch i enlighet med principen i fig. 6c. Ett mindre N används under transienter medan ett större N används under tonala passager. Filterbanksstorleksomkoppling utförs normalt i konventionella kodare i syfie att byta frekvensupplösning mot tidsupplösning.
Andra patch-möjligheter finns. Fig. 13 visar en icke överlappande kombination av andra-, tredje- och fiärdetoner.
De lägsta möjliga övertonstalet används så högt i frekvens som möjligt. Ovanför den övre gränsen för destinationsorrirådet for överton n används överton n + 1.
Det är också möjligt att kombinera amplitud och fasinforrnation från olika analyskanaler. Amplitudsignalema lXk(rR)I kan vara anslutna i enlighet med fig. 12 medan fassignalerna arg{Å7c(rR)} är anslutna i enlighet med principen i fig. 10. På detta sätt kommer lågbandsfrekvensema fortfarande att vara transponerade medan en periodisk upprepning av källområdets spektralenvelopp genereras i stället för en utsträckt envelopp som blir resultatet av en transponering i enlighet med ekv. 2. "Gating" eller lågnivåexpansion kan byggas in i syfte att undvika förstärkning av "tomma" källkanaler. 10 15 20 25 30 35 512 719 13 Fig. 14 visar en anrian tillämpning, alstring av undertoner till en högpassfiltrerad eller basbegränsad signal genom att använda patcher från högre till lägre subband.
De ovan beskrivna frekvensdomänförfarandena kan anpassas för användning i filterbarrksbaserade ljudkodare, såsom MPEG. Vidare antogs i beslcrivningen ovan att den högsta frekvens som fanns i insignalen var signifikant lägre än Nyqvist-frekvensen. Således var det möjligt att utföra en bandbreddsexpansion utan att öka sarnplingsfrekvensen. Detta är emellertid inte alltid fallet varför en uppsampling kan vara nödvändig. När filterbarilcsförfarande används för transponering är det möjligt att integrera uppsarnpling i processen.
De flesta psyke-akustiska kodare använder rnaxirrialt decimerade filterbanlcar i tid/frekvens-transforrneringen [“Introduction to Perceptual Coding”, K. Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996] och [“Multirate Systems and Filter Banks”, P. P. Vaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0-13-605718-71 Analysfilterbanken delar upp PCM-signalen i flera subbandssignaler. Subbandssarnpelvärclena kvantiseras genom att ett reducerat antal bitar används i enlighet med utsignalen från en psykoakustisk modell som estimerar det minimala maskeringsströskelvärdet.
Subbandssampelvärdena kombineras med sidoinformation för att bilda den seriella bitströmmen. Bitströmmen lagras eller överförs sedan, fig. 15a. I dekodern, fig. l5b, kombinerar en syntesfilterbarik subbandssamplerna i syfie att återskapa den ursprungliga signalen. Om bandbreddsexparisionsförfarandet skall integreras i en psyko- akustisk kodare behövs en modifiering av filterbanken.
Eftersom syftet med föreliggande uppfinning är att expandera audiobandbredden är det möjligt att syntesdelen av filterbanken behöver utökas. Syntesdelen mottar en audiosignal, som är uppdelad i L subband (I. = 32 i MPEG- layer I och II) där var och ett har samplingsfrekvensen 11/1. och f, är samplingsfrekvensen för den ursprimgliga PCM-bitströmmen.
Genom att, som ett exempel, mata de L lägsta filtema i en syntesfilterbarik bestående av 2L filter med de mottagna subbandssignalerna skapas en utsignal med en samplingsfrekvens Zjš. Om de L övre filtema matas med nollor kommer audiobandbredden inte att ändras - den utökade filterbanken återskapar endast en uppsamplad version av ursprimgsbitströmmen. Om emellertid de övre filtren matas med de mottagna subbandssignalerna i enlighet med övertonspatchen 1301 i tig. 13 kommer utsignalens bandbredd att öka. Vid alstring av andraton är det enklaste tillvägagångssättet att kopiera de L/2 övre subbandssignalerna av de mottagna signalerna till varannan av de övre kanalema i syntesfiltret, fig. 16. Pga spektralirivertering som uppstår genom decirnering av subbandssignalerna måste varannan av de transponerade kanalema frekvensinverteras före syntesen. Detta åstadkoms genom att tecknet på vartannat sampel i dessa kanaler ändras. Dessutom försvinner aliaskanceleringsegenskaperna för de kritiskt samplade QMF-bankarna, eftersom de övre subbanden är separerade i frekvens, d v s angränsande subbandssignaler överlappar inte i högbandsonirådet.
Aliasreduktionsförfaranden kan användas för att minska denna typ av artifakter. 10 15 20 25 30 512 719 14 Det parametriska förfarandet kan också modifieras. En effektiv QMF-bankslösning beskrivs nu med användning av en transponeringsfaktor 2 som exempel.
Det antas att insignalen x(n) i lågbandet är tonal, i form av ekv. l med e,-(n) = a,- (konstant). ilcke-tonala signaler kommer att behandlas senare. Syftet med det parametriska förfarandet är att alstra y(n) i enlighet med ekv. 2 med M=2, d v s alla frekvenser för de ix(n) ingående komponenterna dubbleras, arnplitudvärdena bibehålls och fasen lämnas obeaktad. För enklare frekvensmanipulering kan ekv. 1 skrivas om som i=0 N-i _ x(n) = Re{za,-ef(zrgrf"/fs+af)}, (11) där de komplexa exponentialfunktionenia endast utgör signaler med positiv frekvens (analytiska signaler), i kontrast till en sinussignal som både har en positiv och en negativ frekvenskomponent.
För att erhålla summan innanför parentesema i ekv. ll byts de sedvanliga cosinusmodulerade filtren i analysbanken ut mot exponentialmodulerade filter, ñg. l7. Filtren täcker källornrådet fiån 'rt/Z till 1t (endast positiva frekvenser) och måste vara smala nog för att kunna separera individuella frekvenskomponenter. I fig. 17 har antalet subband för enkelhetens skull valts till 32. De komplexa subbandssignalema delas upp i sina amplitud- och fasvinkelsrepresentationer och fasvirtlclarna multipliceras med M=2 i enlighet med strukturen i ñg. ll. Reellvärda subbandssignaler erhålls genom att ta realdelen av signalerna. Som en konsekvens av den önskade bandbreddsexpansionen kan, pga fasmultiplikationen, inte analysfilterbanken samplas lo-itiskt. Eftersom bandbredden expanderas med en faktor 2 måste subbanden översamplas med samma faktor, d v s en 32- kanalsfilterbank som täcker frekvensområdet från 11/2 till n (l/4 av det totala frekvensområdet) bör decimeras 32x4/2=64 gånger. För att aliaskancelleringsegenskaperna för QMF-banken skall fungera i samband med det parametriska förfarandet måste några konstanter vid härledningen av de eosinusmodulerade filterbankama modifieras. Med hänvisning till fig. 18, där strukturen för en digital filterbank visas, ger teorin att analysfiltren Hk(z), där k = 0, 1, ..., M-1, kombineras i enlighet med Hk (Z) = akckQk (Z)+Û1<.Ck.Q2M-1-k (Z) f (12) där ak och ck är konstanter med absolutvärdet 1 och Q,(z) ( l=0, I ZM-I ) är modulerade versioner av prototypfiltret P0(z). Konstanterna ak och ck väljs som -jï(2k+i) -jímwnzv ak =e och ck =e L , (13), (14) 10 15 20 25 30 35 512 719 15 där L är antalet kanaler och N är prototypñltrets ordning. Genom att endast välja de filter som motsvarar positiva frekvenser fås ur ekv. 12 H/ÅZ) = akckQkßl- (15) där, såsom nämnts, Hk(z) sträcker sig över området från 11/2 till it och de modulerade versionerna av prototypfiluet kan ses i tig. 17. För att aliaskancelering skall fungera i en konventionell QMF-syntesbank behöver konstanten ak ändras till II -'-2ki 18( +) ak =e , (16) pga det faktum att faserna för frekvenskomponenterna inom subbanden dubbleras, ñg. ll. Ett förenklat exempel på ett blockschema över en ISO/MPEG-layer I/II-avkodare som använder föreliggande uppfinning visas i fig. 19.
I ISO/MPEG-standarden använder kodaren en pseudo QMF-bank för att dela upp PCM-signalen i 32 subband som betecknas V,,(n)- V, 1 (n) i figuren. Syntesbariken med 18 kanaler behövs av två anledningar: 1) För att anpassa bandbredden för de parametriskt expanderade filtren till de ursprungliga subbandens bandbredd så att en filterbank med samma bandbredder för alla kanaler kan användas i syntesen. 2) Den komplexa filterbanken kan inte hantera mycket låga eller mycket höga frekvenskomponenter, d v s irisignalen till den komplexa analysbanken måste vara av bandpasskaraktär. Det är emellertid endast nödvändigt att återskapa källområdet, d v s de 16 övre subbanden, och flytta detta område bort från DC och Nyqvistfrekvensen genom att lägga till ytterligare två subband, vilket ger en total filterbanksstorlek av 18 kanaler.
Efter de parametriska blocken enveloppjusteras de trarisponerade subbanden (i enlighet med HBX-1 eller HBX- 2) och kombineras med de ursprungliga 32 subbanden. Syntesen utförs med en 64-kanals pseudo QMF- syntesbank för att bilda utsignalen y(n). Utsignalen har, i detta specifika fall, en samplingsfrekvens och en bandbredd som är två gånger större än den på kodarsidan.
Noggrann spektralenveloppsestimering är viktig om klangfargen för den ursprungliga signalen skall bibehållas. I HBX-l måste högbandsspektralenveloppen estimeras från lågbandsinforniationen som finns tillgänglig för avkodaren. Enveloppsestimeringen bör utföras genom att nian kontinuerligt extraherar enveloppen för lågbandsspektrumet och justerar högbandets spektralenvelopp i enlighet med särskilda regler.
Ett sätt att extrapolera lågbandsenveloppen är att använda asymptoter i en log-frekvens/log-riivå rymd. Detta är ekvivalent med kurvanpassning med polynom med varierande gradtal i den "normala" lin/lin rymden. Nivån och lutningen för en övre del av lågbandsspektrumet estimeras. Denna information används för att definiera nivån 10 15 20 25 30 35 512 719 16 och lutningen för ett eller flera segment som representerar den nya högbandsenveloppen. Asymptotskärnings- punkterna fixeras i fiekvens och fungerar som rotationspunkter. Det är nödvändigt att stipulera begränsningar för att hålla högbandsenveloppsvariationerna inom realistiska gränser.
Ett alternativt sätt att estimera spektralenveloppen är att använda vektorkvantisering, VQ, för ett stort antal representativa spektralenvelopper och lagra dessa i en uppslagstabell eller kodbok. Vektorkvantisering utförs genom att träna det önskade antalet vektorer på en stor mängd träningsdata, i detta fall spektralenvelopper.
Demia träning görs vanligen med den generaliserade Lloydalogritmen [“Vector Quantization and Signal Compression", A. Gersho, R. M. Gray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0] och ger vektorer som optimalt spänner upp innehållet i träningsdatat. Ett besläktat forfarande för tal utvecklades genom [“Statistical recovery of Wideband Speech from Narrowband Speech”, Y. M. Cheng, D. O”Shaughnessy, P.
Merrnelstein, IEEE Trans. on Speech and Audio Processing, Vol. 2, No. 4, Oct 1984]. När en ny högbandsspektralenvelopp estimeras används den ursprungliga lågbandsenveloppen för att söka i kodboken. När kodboksenveloppen hittats som bäst matchar det aktuella lågbandet används högbandsdelen för denna kodboksenvelopp för att justera det nya högbandsspektïumet. Detta betyder att om VQ-kodboken består av A spektralenvelopper tränade på B envelopper (B>>A) representerar VQ-envelopperna de A mest lika Övergångarna från lågbandsenveloppen till högbandsenvcloppen baserat på B observationer av en uppsättning ljud av varierande karaktär. Teoretiskt sett motsvarar detta de A optimala reglema för att prediktera enveloppen baserat på B observationer. En kombination av ovanstående förfaranden är också möjlig.
Spektralenveloppens finstruktur har mindre inverkan på det upplevda ljudet än spektralenveloppens grov- struktur. Högbandets fmstruktur som erhålls genom ovanstående transponeringsförfaranden är adekvata, emellertid behöver grovstrukturema i allmänhet justeras. Det är således fördelaktigt att filtrera spektralrepresentationen av signalen för att separera grovsmiktiiren från finstrukturen. Grovstzruktiiren erhålls medelst LP-ñltrering, som kan åstadkonunas med FFT-filtrering av signalens spektralrepresentation, d v s transformering av signalen till cepstrurn-domänen där filtrering utförs. Lågbandsenveloppens grovsmilttur används sedan för att estimera högbandsenveloppens grovstruktur. En kodbok kan således innehålla endast den grovstrultturerade enveloppen. Det är också fördelaktigt att lagra och jämföra envelopper i cepstrum-domänen.
När de föreslagna frekvensdomäntransponerarna används är signalens spektrala representation redan tillgänglig och den spektrala justeringen âstadkoms genom att justera subbandsförstärkningen i syfte att skapa en önskad spektralform. Tidsdomäntransponeraren behöver separat spektrumestimering och ñltrering.
I mindre krävande implementationer är det möjligt att använda en fast filter- eller equalizer-inställning eller ingen equalizer alls. I det senare fallet kan högbandet adderas genom att en fast förstärkning på t ex -6 dB används.
De flesta ljud, såsom tal och musik, kan beslcrivas som produkter av långsamt varierande envelopper och snabbt varierande bärvågor med konstant amplitud, såsom beskrivs i [“The Application of Generalized Linearity to 10 15 20 25 30 35 512 719 17 Automatic Gain Control", T.G. Stockharn, Ir, IEEE Trans. on Audio and Electroacoustics, Vol. AU-16, No. 2, June 1968] och ekv. 1. I en typisk kodare kräver de snabbt varierande bärvågoma kodning vid ett högt bitflöde, men de långsamt varierande envelopperna kan kodas vid ett mycket lägre flöde. I de flesta kodare, fig. 20, representeras de snabbt varierande bärvågoma av normaliserade subbandssampel (eller koefñcienter när DCT används) 2001 och de långsarnt varierande enveloppema kan representeras av skalfalctorer 2003. Sådana skalfaktorer definieras som nivån av grupperade subbandssarnpel. Exempel är skalfalctorer i MPEG och AT&T PAC, och exponenter i Dolby AC-3. I ISO/MPEG layer-I/'II-standarden representerar skalfaktorema de maximala absoluta värdena för block av 12 subbandssampel. Subbandssarriplerna normaliseras genom division med sina motsvarande skalfaktorer. Både skalfaktorerna och de normaliserade subbandsarnplerna överförs i bitströmmen till avkodaren 2005.
IHBX-Z förfarandet fig. 21 alstras enveloppiriforrriationen och överförs på samma sätt som i fig. 20, varvid endast lågbandssubbandssarriplema överförs. Den överförda enveloppinforrnationen spänner således över hela frekvensområdet och subbandssamplema spänner endast över ett begränsat fiekvensområde, exkluderancle högbandet. Vid avkodaren transponeras 2103 lågbandssubbandssarrtplema 2101 och kombineras med den mottagna högbandsenvelopinformationen 2105. På detta sätt är den syntetiska högbandsspektralenveloppen identisk med den ursprungliga medan en signifikant bitreduktion fortfarande åstadkoms.
I några kodningsstandarder är det möjligt att överföra skalfaktorer för bredbandsspektra och endast överföra lågbandssubbandssampler såsom visas i fig. 21. HBX-2 kan således användas utan modifiering. I andra kodningstandarder måste skalfaktorema och subbandssarnplerna täcka samma fiekvensområde, d v s skalfaktorerna kan inte överföras om subbandssamplerna utelämnas. För att lösa detta problem föreslås följ ande, se ñg. 22. Subbandsskalfaktorer täcker ett stort dynamiskt område, typiskt större än 100 dB. Det är således möjligt att justera en (eller två) subbandsskalfaktorer, 2201, till en fast låg nivå, säg -100 dB, och att överföra högbandsskalfaktorema i seriell form, "kamoutlerade" som subbandssampel och gömda vid en ohörbart låg ljudnivå, 2202. Detta sätt att överföra högbandsskalfaktorema till avkodaren 2203 säkerställer kompatibilitet med bitströrrissyntax och dekoderstandarder. Det torde inses att valfri information kan överföras på detta sätt.
I ytterligare andra kodningsstandarder fig. 23, används Huffinan eller redudanskodning 2301 för att förbättra kodningsutbytet baserat på redundant signalinformation. I sådana kodare kan skalfaktorema 2302 överföras och spänna över hela ljudbandbredden. Subbandsamplema eller koefñcientema för högbandet kan sättas till noll 2303 eller ett konstant värde som kommer att reduceras i redundanskodningsprocessen till mycket få bitar som mottages vid avkodaren 2304. Det syntetiska högbandet kan skapas som vanligt genom att den överförda spektralinforrnationen används och en signifikant bitflödesredulction åstadkoms.
Besläktade för- och efterbehandlingsförfaranden fmns där endast brussignaler ersätts [“Improving Audio Codecs by Noise Substitution", D. Schultz, IAES, Vol. 44, No. 7/8, 1996] i det existerande högbandet eller där endast några utelämnade övertoner âterskapas [“Audio Spectral Coder”, A.J.S. Ferreira, AES Preprint 4201, l00th Convention, May 11-14 1996, Copenhagen]. Dessa arbetar emellertid på en interrnittent tidsbasis och ger en begränsad kodnings- eller prestandaförbättring. HBX-2-förfarandet arbetar på kontinuerlig basis och ersätter all . .. ...u- .u-.t l0 15 20 25 30 35 512 719 18 typ av signalinforrnation såsom tonala, bruslilcnande och transienta förlopp lika väl. Sålunda erbjuder I-IBX-Z- förfarandet en väsentligt högre kodningsforbättring.
När endast mycket låg kanalkapacitet är tillgänglig, (Internet och långsamrna telefonmodem) används monokodníng av programrnaterialet. I syfte att förbättra den upplevda kvaliteten och göra ljudet mera behagligt kan en enkel "pseudostereo'Kgencrator användas genom att en avtappad fordröjningsledning införs. Denna kan mata tex 10 millisekimders och 15 millisekimders fördröjda signaler vid approximativt -6 dB till varje utgång utöver den ursprungliga monosignalen, se fig. 24. Pseudostereogeneratorn ger en värdefull ljudfórbätuing till en låg beräkningskosmad.

Claims (12)

l0 15 20 25 30 35 512 719 19 PATENTKRAV
1. Förfarande för bitflödesreduktion vid överföring av signaler från en sändare till en nrottagare, kännetecknat av stegen att; - bandbreddsbegränsa en ursprunglig signal innan överföring för att bilda en första signal, - överföra den första, bandbreddsbegränsade signalen, vars högsta frekvens är f'_ max, - mottaga den ßrsta signalen vid mottagaren, - alstra en andra signal vid mottagaren genom att Iransponera en del av den första signalens spektrum till ett frekvensonrråde innehållande högre frekvenser än den ñrsta signalens högsta frekvens (f'_ max), och - kombinera den andra signalen med den första signalen för att på så sätt bilda en tredje signal med större bandbredd än den famn signalen. "
2. Förfirrande enligt hav 1, kännetecknat av att den tredje signalen ges tmgefär samma bandbredd somden ursprungliga signalen.
3. Förfarande enligt hav l, känneteeknat av att en del av spektrurnet ß: den första signalen transformeras till ett fiekvensornråde som sträcker sig från den första signalens högsta frekvens (f'_ max) (fig. l).
4. Förfarande enligt något av haven 1 till 3, kinnetecknat av att spektralenveloppjustering trtförs baserad på estimering av högbandsspektralenvelopen med användning av tillgänglig lågbandsinformation (fig. l).
5. Förfarande enligt något av kraven 1-3, kånnetecknat av att spektralenveloppsinforrnation av urspnmgssignalen extraheras och överförs tillsammans med den första signalen för efterföljande justering av den andra signalen.
6. Förfarande enligt hav 5, kännetecknat av att spektralenveloppsinformationen överförs i en eller några subbandskanaler och att förstärkningen i dessa subbandskanaler är satt till en låg nivå för att säkerställa kompatibilitet med existerande avkodare (fig. 22).
7. Förfarande enligt krav 5, kännetecknat av överföring av skalfaktorer utan överföring av motsvarande subbandsinformation (fig. 21).
8. Förfarande enligt hav 5, kännetecknat av att spektralenveloppsinfomiation överförs samtidigt som tillhörande subbandssampel sätts till 0 eller ett annat konstant värde i syfie att dra fördel av en efterföljande redrmdanskodningsprocess (fig.23).
9. Förfarande enligt krav l, kännetecknat av att transponeringen utförs i frekvensdomänen.
10. Förfarande enligt hav 1, känneteckn at av att transponeringen utförs i tidsdomänen l0 15 20 25 30 35 512 719 20
11. ll. Anordning för att expandera bandbredden för en första bandbreddsbegränsad signal vars högsta frekvens är (max, kännetecknat av stegen att: - alstra en andra signal genom att transponera en del av spektrumet för den första signalen till ett frekvensornr .ide som sträcker sig ovanför den högsta frekvensen (f_max) för den första signalen och - kombinera den andra signalen med den första signalen för att bilda en tredje utsignal med en utökad bandbredd jämiört med den första signalen.
12. Förfarande enligt något av kraven l-3, kännetecknat av att den tredje signalen, då denna är en rnonosignal, uppdelas i två signaler, som var och en består av den tredje signalen och en fördröjd version av densamma för att erhålla en pseudostereosignal (ñg. 24).
SE9800268A 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion SE512719C2 (sv)

Priority Applications (27)

Application Number Priority Date Filing Date Title
SE9800268A SE512719C2 (sv) 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DK03020094T DK1367566T3 (da) 1997-06-10 1998-06-09 Forbedring af kildekodning ved anvendelse af spektralbåndreplikation
DE69821089T DE69821089T2 (de) 1997-06-10 1998-06-09 Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
AU74465/98A AU7446598A (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication
ES98921697T ES2213901T3 (es) 1997-06-10 1998-06-09 Mejora de codificacion de la fuente utilizando la replica de la banda espectral.
DK98921697T DK0940015T3 (da) 1997-06-10 1998-06-09 Forbedring af kildekodning ved anvendelse af spektralbåndreplikation
RU99104814/09A RU2256293C2 (ru) 1997-06-10 1998-06-09 Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
EP03020094A EP1367566B1 (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication
PCT/IB1998/000893 WO1998057436A2 (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication
JP50196299A JP3871347B2 (ja) 1997-06-10 1998-06-09 スペクトル帯域複製を用いた原始コーディングの強化
AT98921697T ATE257987T1 (de) 1997-06-10 1998-06-09 Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
PT03020094T PT1367566E (pt) 1997-06-10 1998-06-09 Melhoria da codificacao na fonte utilizando-se a reproducao da banda espectral
AT03020094T ATE303679T1 (de) 1997-06-10 1998-06-09 Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
US09/230,799 US6680972B1 (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication
DE69831435T DE69831435T2 (de) 1997-06-10 1998-06-09 Verbesserung von Quellenkodierung unter Verwendung von Spektralbandreplikation
PT98921697T PT940015E (pt) 1997-06-10 1998-06-09 Melhoria da codificacao na fonte utilizando-se a reproducao da banda espectral
CNB988007924A CN1206816C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码
ES03020094T ES2247466T3 (es) 1997-06-10 1998-06-09 Mejora de codificacion de la fuente utilizando replicacion de la banda espectral.
EP98921697A EP0940015B1 (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication
BRPI9805989-0A BR9805989B1 (pt) 1997-06-10 1998-06-09 método e aparelho para decodificar um sinal codificado.
CNB2004101000787A CN1308916C (zh) 1997-06-10 1998-06-09 采用频带复现增强源编码
HK01101733A HK1030843A1 (en) 1997-06-10 2001-03-12 Source coding enhancement using spectral-band replication.
US10/680,224 US6925116B2 (en) 1997-06-10 2003-10-08 Source coding enhancement using spectral-band replication
US10/681,105 US7328162B2 (en) 1997-06-10 2003-10-09 Source coding enhancement using spectral-band replication
US10/682,030 US7283955B2 (en) 1997-06-10 2003-10-10 Source coding enhancement using spectral-band replication
HK04100528A HK1057815A1 (en) 1997-06-10 2004-01-27 Source coding enhancement using spectral-band replication.
JP2004355011A JP4220461B2 (ja) 1997-06-10 2004-12-08 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9702213A SE9702213D0 (sv) 1997-06-10 1997-06-10 A method and a device for bit-rate reduction using synthetic bandwidth expansion
SE9704634A SE9704634D0 (sv) 1997-12-12 1997-12-12 Synthetic bandwidth expansion of audio signals
SE9800268A SE512719C2 (sv) 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion

Publications (3)

Publication Number Publication Date
SE9800268D0 SE9800268D0 (sv) 1998-01-30
SE9800268L SE9800268L (sv) 1998-12-11
SE512719C2 true SE512719C2 (sv) 2000-05-02

Family

ID=27355877

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9800268A SE512719C2 (sv) 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion

Country Status (14)

Country Link
US (4) US6680972B1 (sv)
EP (2) EP0940015B1 (sv)
JP (2) JP3871347B2 (sv)
CN (2) CN1206816C (sv)
AT (2) ATE303679T1 (sv)
AU (1) AU7446598A (sv)
BR (1) BR9805989B1 (sv)
DE (2) DE69831435T2 (sv)
DK (2) DK1367566T3 (sv)
ES (2) ES2213901T3 (sv)
HK (2) HK1030843A1 (sv)
PT (2) PT940015E (sv)
SE (1) SE512719C2 (sv)
WO (1) WO1998057436A2 (sv)

Families Citing this family (416)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE371298T1 (de) * 1996-11-07 2007-09-15 Koninkl Philips Electronics Nv Übertragung eines bitstromsignals
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE9903552D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US7085377B1 (en) * 1999-07-30 2006-08-01 Lucent Technologies Inc. Information delivery in a multi-stream digital broadcasting system
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
WO2001053982A1 (en) * 2000-01-18 2001-07-26 National Research Council Of Canada Parallel correlator archtitecture
FI119576B (sv) * 2000-03-07 2008-12-31 Nokia Corp Talbehandlingsanordning och förfarande för behandling av tal, samt en digital radiotelefon
CN1154975C (zh) * 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
FR2807897B1 (fr) 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) * 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
JP3576941B2 (ja) * 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US20020087315A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented multi-scanning language method and system
US6845170B2 (en) 2001-01-11 2005-01-18 Sony Corporation Watermark resistant to resizing and rotation
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
WO2002058052A1 (en) * 2001-01-19 2002-07-25 Koninklijke Philips Electronics N.V. Wideband signal transmission system
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
FR2821476B1 (fr) * 2001-02-23 2003-04-11 France Telecom Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
FR2821501B1 (fr) * 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
US6865273B2 (en) * 2002-06-05 2005-03-08 Sony Corporation Method and apparatus to detect watermark that are resistant to resizing, rotation and translation
US7602936B2 (en) * 2001-03-08 2009-10-13 Sony Corporation Method to make wavelet watermarks resistant to affine transformations
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
WO2003003345A1 (fr) 2001-06-29 2003-01-09 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation des composantes de frequence d'un signal
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
JP4012506B2 (ja) * 2001-08-24 2007-11-21 株式会社ケンウッド 信号の周波数成分を適応的に補間するための装置および方法
EP1446797B1 (en) * 2001-10-25 2007-05-23 Koninklijke Philips Electronics N.V. Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
EP1440433B1 (en) 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
DE10154932B4 (de) * 2001-11-08 2008-01-03 Grundig Multimedia B.V. Verfahren zur Audiocodierung
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
WO2003042648A1 (fr) * 2001-11-16 2003-05-22 Matsushita Electric Industrial Co., Ltd. Codeur de signal vocal, decodeur de signal vocal, procede de codage de signal vocal et procede de decodage de signal vocal
US7317811B2 (en) * 2001-11-28 2008-01-08 Sony Electronics Inc. Method to decode temporal watermarks in compressed video
US7433489B2 (en) * 2001-11-28 2008-10-07 Sony Electronics Inc. Method to ensure temporal synchronization and reduce complexity in the detection of temporal watermarks
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
JP4317355B2 (ja) * 2001-11-30 2009-08-19 パナソニック株式会社 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN1288625C (zh) 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
JP3751001B2 (ja) * 2002-03-06 2006-03-01 株式会社東芝 オーディオ信号再生方法および再生装置
CN1625876B (zh) * 2002-03-20 2011-01-26 伊哥·玻利索维奇·多尼夫 传输离散信号的方法和系统
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
DE60307252T2 (de) 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7921445B2 (en) * 2002-06-06 2011-04-05 International Business Machines Corporation Audio/video speedup system and method in a server-client streaming architecture
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100462615B1 (ko) 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
US7379956B2 (en) * 2002-07-14 2008-05-27 Apple Inc. Encoding and decoding data arrays
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
EP1527442B1 (en) 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
TW564375B (en) * 2002-09-17 2003-12-01 Ind Tech Res Inst Amplitude phase shift information embedding and detecting method based on phase features
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
AU2006235812B2 (en) * 2002-09-18 2009-10-01 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
BRPI0306434B1 (pt) 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
JP4041385B2 (ja) * 2002-11-29 2008-01-30 株式会社ケンウッド 信号補間装置、信号補間方法及びプログラム
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
AU2002953284A0 (en) * 2002-12-12 2003-01-02 Lake Technology Limited Digital multirate filtering
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923300B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923301B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
RU2244386C2 (ru) * 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
US8311809B2 (en) * 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
RU2005135648A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Генерация аудиосигналов
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005010621A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び帯域拡張方法
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
KR101058062B1 (ko) * 2003-06-30 2011-08-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 잡음 부가에 의한 디코딩된 오디오의 품질 개선
FI118550B (sv) * 2003-07-14 2007-12-14 Nokia Corp Förbättrad eksitation för högre frekvensbands kodning i en kodek som utiliserar banduppdelningsbaserade kodningsmetoder
US7082573B2 (en) 2003-07-30 2006-07-25 America Online, Inc. Method and system for managing digital assets
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7844992B2 (en) * 2003-09-10 2010-11-30 Thomson Licensing Video on demand server system and method
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
DE602004032587D1 (de) * 2003-09-16 2011-06-16 Panasonic Corp Codierungsvorrichtung und Decodierungsvorrichtung
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7949057B2 (en) * 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
JP5230103B2 (ja) * 2004-02-18 2013-07-10 ニュアンス コミュニケーションズ,インコーポレイテッド 自動音声認識器のためのトレーニングデータを生成する方法およびシステム
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
US8629836B2 (en) 2004-04-30 2014-01-14 Hillcrest Laboratories, Inc. 3D pointing devices with orientation compensation and improved usability
JP2007535773A (ja) 2004-04-30 2007-12-06 ヒルクレスト・ラボラトリーズ・インコーポレイテッド 自由空間ポインティングデバイスおよびポインティング方法
CN101656074B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频解码装置、音频解码方法以及通信终端和基站装置
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2005112001A1 (ja) 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
KR20070028432A (ko) 2004-06-21 2007-03-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 인코딩 방법
GB2416285A (en) 2004-07-14 2006-01-18 British Broadcasting Corp Transmission of a data signal in an audio signal
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP2008510197A (ja) * 2004-08-17 2008-04-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルなオーディオ符号化
KR100640893B1 (ko) * 2004-09-07 2006-11-02 엘지전자 주식회사 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7620675B1 (en) * 2004-09-23 2009-11-17 Texas Instruments Incorporated Image and audio transform methods
JP4618634B2 (ja) * 2004-10-07 2011-01-26 Kddi株式会社 圧縮オーディオデータ処理方法
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
US7555081B2 (en) * 2004-10-29 2009-06-30 Harman International Industries, Incorporated Log-sampled filter system
ES2791001T3 (es) 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
US8137195B2 (en) 2004-11-23 2012-03-20 Hillcrest Laboratories, Inc. Semantic gaming and application transformation
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060143013A1 (en) * 2004-12-28 2006-06-29 Broadcom Corporation Method and system for playing audio at an accelerated rate using multiresolution analysis technique keeping pitch constant
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
US20060187770A1 (en) * 2005-02-23 2006-08-24 Broadcom Corporation Method and system for playing audio at a decelerated rate using multiresolution analysis technique keeping pitch constant
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
JP4645241B2 (ja) * 2005-03-10 2011-03-09 ヤマハ株式会社 音声処理装置およびプログラム
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8249861B2 (en) 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
EP1742509B1 (en) 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US20070030923A1 (en) * 2005-08-02 2007-02-08 Xiaoming Yu High accuracy non data-aided frequency estimator for M-ary phase shift keying modulation
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
JP4715385B2 (ja) * 2005-08-19 2011-07-06 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2007028407A1 (en) 2005-09-06 2007-03-15 Nero Ag Method for signing a data package and signing apparatus
JP4627548B2 (ja) * 2005-09-08 2011-02-09 パイオニア株式会社 帯域拡張装置、帯域拡張方法および帯域拡張プログラム
BRPI0616624A2 (pt) 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
US20070118361A1 (en) * 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
KR100739180B1 (ko) * 2005-10-20 2007-07-13 엘지전자 주식회사 이동 통신 단말기의 멀티미디어 데이터를 송수신하는 장치및 그 방법
KR100958144B1 (ko) 2005-11-04 2010-05-18 노키아 코포레이션 오디오 압축
EP2381440A3 (en) * 2005-11-30 2012-03-21 Panasonic Corporation Subband coding apparatus and method of coding subband
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
US7489111B2 (en) 2005-12-08 2009-02-10 Robert W. Wise Holstered cordless power tool
US7536299B2 (en) * 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
KR100739786B1 (ko) * 2006-01-20 2007-07-13 삼성전자주식회사 다중 채널 디지털 앰프 시스템 및 그 신호 처리 방법
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
WO2007098258A1 (en) * 2006-02-24 2007-08-30 Neural Audio Corporation Audio codec conditioning system and method
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
CA2646961C (en) * 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
JP2007310298A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域外信号生成装置及び周波数帯域拡張装置
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
WO2008001318A2 (en) * 2006-06-29 2008-01-03 Nxp B.V. Noise synthesis
AR061807A1 (es) * 2006-07-04 2008-09-24 Coding Tech Ab Compresor de filtro y metodo para fabricar respuestas al impulso de filtro de subbanda comprimida
EP1881485A1 (en) 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
WO2008022181A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Updating of decoder states after packet loss concealment
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP5103880B2 (ja) 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
EP1927981B1 (en) * 2006-12-01 2013-02-20 Nuance Communications, Inc. Spectral refinement of audio signals
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US7852745B2 (en) * 2007-03-02 2010-12-14 Signalink Technologies Inc. Non-orthogonal frequency-division multiplexed communication through a non-linear transmission medium
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
JP5355387B2 (ja) * 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN101790757B (zh) * 2007-08-27 2012-05-30 爱立信电话股份有限公司 语音与音频信号的改进的变换编码
WO2009055715A1 (en) * 2007-10-24 2009-04-30 Red Shift Company, Llc Producing time uniform feature vectors of speech
US8326610B2 (en) * 2007-10-24 2012-12-04 Red Shift Company, Llc Producing phonitos based on feature vectors
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8655663B2 (en) 2007-10-26 2014-02-18 D&M Holdings, Inc. Audio signal interpolation device and audio signal interpolation method
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
EP2212884B1 (en) * 2007-11-06 2013-01-02 Nokia Corporation An encoder
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
CA2705968C (en) * 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8423371B2 (en) 2007-12-21 2013-04-16 Panasonic Corporation Audio encoder, decoder, and encoding method thereof
JPWO2009084221A1 (ja) * 2007-12-27 2011-05-12 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090203395A1 (en) * 2008-02-08 2009-08-13 Sony Ericsson Mobile Communications Ab Amplitude modulation radio transmission with extended bandwidth
EP2296145B1 (en) 2008-03-10 2019-05-22 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
EP3273442B1 (en) * 2008-03-20 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a parameterized representation of an audio signal
JP2009300707A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
US9378751B2 (en) * 2008-06-19 2016-06-28 Broadcom Corporation Method and system for digital gain processing in a hardware audio CODEC for audio transmission
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
WO2009157280A1 (ja) * 2008-06-26 2009-12-30 独立行政法人科学技術振興機構 オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法
US8010313B2 (en) 2008-06-27 2011-08-30 Movea Sa Hand held pointing device with roll compensation
US20140184509A1 (en) 2013-01-02 2014-07-03 Movea Sa Hand held pointing device with roll compensation
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
CA2730200C (en) * 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US8463412B2 (en) 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
EP2184929B1 (en) 2008-11-10 2013-04-03 Oticon A/S N band FM demodulation to aid cochlear hearing impaired persons
US8548816B1 (en) * 2008-12-01 2013-10-01 Marvell International Ltd. Efficient scalefactor estimation in advanced audio coding and MP3 encoder
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
PL4231291T3 (pl) * 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
AU2013203159B2 (en) * 2008-12-15 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
EP2211339B1 (en) 2009-01-23 2017-05-31 Oticon A/s Listening system
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
AU2015221516B2 (en) * 2009-01-28 2017-08-10 Dolby International Ab Improved Harmonic Transposition
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
AU2013211560B2 (en) * 2009-01-28 2016-04-28 Dolby International Ab Improved harmonic transposition
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
AU2009339343A1 (en) 2009-02-06 2011-08-18 Oticon A/S Spectral band substitution to avoid howls and sub-oscillation
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
TWI559680B (zh) 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
JP5267257B2 (ja) * 2009-03-23 2013-08-21 沖電気工業株式会社 音声ミキシング装置、方法及びプログラム、並びに、音声会議システム
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
AU2013207549B2 (en) * 2009-04-09 2015-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2013263712B2 (en) * 2009-05-27 2015-11-12 Dolby International Ab Efficient Combined Harmonic Transposition
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
AU2015264887B2 (en) * 2009-05-27 2017-12-07 Dolby International Ab Efficient Combined Harmonic Transposition
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
AU2014201331B2 (en) * 2009-06-29 2015-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
JP5365380B2 (ja) * 2009-07-07 2013-12-11 ソニー株式会社 音響信号処理装置、その処理方法およびプログラム
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
JP5031006B2 (ja) * 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
KR101701759B1 (ko) 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
US9026236B2 (en) 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
WO2011047886A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
EP3723090B1 (en) 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
US8856011B2 (en) 2009-11-19 2014-10-07 Telefonaktiebolaget L M Ericsson (Publ) Excitation signal bandwidth extension
JP5812998B2 (ja) * 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
AU2014200151B2 (en) * 2010-01-19 2015-04-16 Dolby International Ab Improved subband block based harmonic transposition
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
KR101712101B1 (ko) 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
DK2375782T3 (en) * 2010-04-09 2019-03-18 Oticon As Improvements in sound perception by using frequency transposing by moving the envelope
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
US8452826B2 (en) * 2010-05-04 2013-05-28 Raytheon Applied Signal Technology, Inc. Digital frequency channelizer
US8751225B2 (en) 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
EP2581905B1 (en) 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
BR122021003887B1 (pt) * 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
TWI412022B (zh) * 2010-12-30 2013-10-11 Univ Nat Cheng Kung 遞迴式離散餘弦正、逆轉換之系統
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
KR101424372B1 (ko) * 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
CA2827482C (en) * 2011-02-18 2018-01-02 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
WO2012141635A1 (en) * 2011-04-15 2012-10-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive gain-shape rate sharing
US9536534B2 (en) 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
WO2012169133A1 (ja) * 2011-06-09 2012-12-13 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
EP2562751B1 (en) 2011-08-22 2014-06-11 Svox AG Temporal interpolation of adjacent spectra
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
US8774308B2 (en) 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
US8965290B2 (en) * 2012-03-29 2015-02-24 General Electric Company Amplitude enhanced frequency modulation
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2704142B1 (en) 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
AU2014211479B2 (en) 2013-01-29 2017-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
DK2822263T3 (da) 2013-07-05 2019-06-17 Sennheiser Communications As Kommunikationsanordning med ekkoundertrykkelse
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
KR20160087827A (ko) 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
CN103795420B (zh) * 2014-02-10 2017-04-05 南京邮电大学 一种基于分段的sbr多属性数据压缩方法
MX361028B (es) 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
RU2689181C2 (ru) 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
KR102125410B1 (ko) * 2015-02-26 2020-06-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10861475B2 (en) * 2015-11-10 2020-12-08 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10395664B2 (en) 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
JP6621709B2 (ja) * 2016-05-26 2019-12-18 アルパイン株式会社 音声処理装置、音声処理方法及びコンピュータプログラム
CN107845385B (zh) 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
GB201620317D0 (en) * 2016-11-30 2017-01-11 Microsoft Technology Licensing Llc Audio signal processing
NO343581B1 (no) * 2017-03-01 2019-04-08 Dolby Int Ab Fremgangsmåte, anordning og program til spektralinnhyllingsjustering
CN109215675B (zh) * 2017-07-05 2021-08-03 苏州谦问万答吧教育科技有限公司 一种啸叫抑制的方法、装置及设备
US10714098B2 (en) * 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备
WO2022097242A1 (ja) * 2020-11-05 2022-05-12 日本電信電話株式会社 音信号高域補償方法、音信号後処理方法、音信号復号方法、これらの装置、プログラム、および記録媒体
US20230386497A1 (en) * 2020-11-05 2023-11-30 Nippon Telegraph And Telephone Corporation Sound signal high frequency compensation method, sound signal post processing method, sound signal decode method, apparatus thereof, program, and storage medium
CN113516987B (zh) * 2021-07-16 2024-04-12 科大讯飞股份有限公司 一种说话人识别方法、装置、存储介质及设备

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4150253A (en) * 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
SE444750B (sv) * 1985-06-04 1986-04-28 Lars Gustaf Liljeryd Metod for att pa elektronisk veg astadkomma fortydligande av ljud- eller bildinformation jemte anordning for utforande av metoden
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4771465A (en) 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
CA2106440C (en) * 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5687340A (en) * 1995-05-16 1997-11-11 Hewlett-Packard Company Reduced area floating point processor control logic utilizing a decoder between a control unit and the FPU
US5692050A (en) * 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US6049766A (en) * 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
JP3017715B2 (ja) * 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
EP0957579A1 (en) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech

Also Published As

Publication number Publication date
US6925116B2 (en) 2005-08-02
CN1629937A (zh) 2005-06-22
BR9805989A (pt) 1999-08-31
WO1998057436A3 (en) 2000-02-10
HK1030843A1 (en) 2001-05-18
SE9800268L (sv) 1998-12-11
EP1367566A3 (en) 2004-09-08
DE69831435T2 (de) 2006-06-14
US20040078205A1 (en) 2004-04-22
CN1272259A (zh) 2000-11-01
ES2247466T3 (es) 2006-03-01
AU7446598A (en) 1998-12-30
JP2005173607A (ja) 2005-06-30
PT1367566E (pt) 2005-11-30
DK0940015T3 (da) 2004-04-26
US7283955B2 (en) 2007-10-16
DK1367566T3 (da) 2005-10-10
HK1057815A1 (en) 2004-04-16
CN1206816C (zh) 2005-06-15
ATE257987T1 (de) 2004-01-15
SE9800268D0 (sv) 1998-01-30
JP2001521648A (ja) 2001-11-06
EP0940015B1 (en) 2004-01-14
US6680972B1 (en) 2004-01-20
EP1367566A2 (en) 2003-12-03
DE69821089T2 (de) 2004-11-11
DE69821089D1 (de) 2004-02-19
ES2213901T3 (es) 2004-09-01
BR9805989B1 (pt) 2009-12-01
JP3871347B2 (ja) 2007-01-24
DE69831435D1 (de) 2005-10-06
ATE303679T1 (de) 2005-09-15
WO1998057436A2 (en) 1998-12-17
US7328162B2 (en) 2008-02-05
EP0940015A1 (en) 1999-09-08
US20040078194A1 (en) 2004-04-22
JP4220461B2 (ja) 2009-02-04
US20040125878A1 (en) 2004-07-01
EP1367566B1 (en) 2005-08-31
CN1308916C (zh) 2007-04-04
PT940015E (pt) 2004-06-30

Similar Documents

Publication Publication Date Title
SE512719C2 (sv) En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP4289815B2 (ja) サブバンド領域における改良されたスペクトル移動/折返し
EP3244407B1 (en) Apparatus and method for modifying a parameterized representation
US7548853B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
RU2256293C2 (ru) Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
Robinson Speech analysis
JP5236032B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
Boland et al. High quality audio coding using multipulse LPC and wavelet decomposition
Anderson et al. Efficient multi-resolution sinusoidal modeling
Trzos Frequency warping via warped linear prediction

Legal Events

Date Code Title Description
NUG Patent has lapsed