FI118834B - Klassificering av audiosignalen - Google Patents

Klassificering av audiosignalen Download PDF

Info

Publication number
FI118834B
FI118834B FI20045051A FI20045051A FI118834B FI 118834 B FI118834 B FI 118834B FI 20045051 A FI20045051 A FI 20045051A FI 20045051 A FI20045051 A FI 20045051A FI 118834 B FI118834 B FI 118834B
Authority
FI
Finland
Prior art keywords
excitation
subband
audio signal
signal
subbands
Prior art date
Application number
FI20045051A
Other languages
English (en)
Finnish (fi)
Other versions
FI20045051A (sv
FI20045051A0 (sv
Inventor
Janne Vainio
Hannu J Mikkola
Jari Maekinen
Pasi S Ojala
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of FI20045051A0 publication Critical patent/FI20045051A0/sv
Priority to FI20045051A priority Critical patent/FI118834B/sv
Priority to KR1020067019490A priority patent/KR100962681B1/ko
Priority to EP05708203A priority patent/EP1719119B1/en
Priority to AT05708203T priority patent/ATE456847T1/de
Priority to JP2006553606A priority patent/JP2007523372A/ja
Priority to CNA2005800056082A priority patent/CN1922658A/zh
Priority to CN201310059627.XA priority patent/CN103177726B/zh
Priority to BRPI0508328-1A priority patent/BRPI0508328A/pt
Priority to DE602005019138T priority patent/DE602005019138D1/de
Priority to KR1020087023376A priority patent/KR20080093074A/ko
Priority to PCT/FI2005/050035 priority patent/WO2005081230A1/en
Priority to CA002555352A priority patent/CA2555352A1/en
Priority to AU2005215744A priority patent/AU2005215744A1/en
Priority to RU2006129870/09A priority patent/RU2006129870A/ru
Priority to ES05708203T priority patent/ES2337270T3/es
Priority to TW094104984A priority patent/TWI280560B/zh
Priority to US11/063,664 priority patent/US8438019B2/en
Publication of FI20045051A publication Critical patent/FI20045051A/sv
Priority to ZA200606713A priority patent/ZA200606713B/en
Application granted granted Critical
Publication of FI118834B publication Critical patent/FI118834B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Claims (50)

1. Kodare (200) som omfattar en ingäng (201) för att inmata ramar som bildats av en audiosignal pä ett frekvensband, ätminstone ett första 5 excitationsblock (206) för att utföra en första excitation för en icke-tal-liknande audiosignal, och ett andra excitationsblock (207) för att utföra en andra excitation för en talliknande audiosignal, kännetecknad av, att kodaren (200) omfattar vidare ett filter (300) för att dela frekvens-bandet i flera delband, vitka alla har en smalare bandbredd än sagda 10 frekvensband, och ett excitationsurvalsblock (203) för att väljä ett excitationsblock frän en grupp tili vilken hör sagda ätminstone första excitationsblock (206) och sagda andra excitationsblock (207), för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband. 15
2. Kodare (200) enligt patentkrav 1, kännetecknad av, att sagda filter (300) omfattar ett filterblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) 20 omfattar energibestämningsdon för att bestämma en enskild signal-energiuppgift för ätminstone ett delband.
. 3. Kodare (200) enligt patentkrav 2, kännetecknad av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, J 25 av vilka den andra gruppen omfattar delband med högre frekvenser än sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin :***: (LevH) i sagda andra grupp av delband, och att sagda förhällande ··· 30 (LPH) är anordnat att användas för urval av excitationsblocket (206, :·. 207). • *
4. Kodare (200) enligt patentkrav 3, kännetecknad av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första ”**: 35 och andra grupper av delband. ··* t · • ··* ·· · • · · • · • » 118834 32
5. Kodare (200) enligt patentkrav 4, kännetecknad av, att delbandet med den lägsta frekvensen lämnas utanför sagda första och andra grupper av delband.
6. Kodare (200) enligt patentkrav 3, 4 eller 5, kännetecknad av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än sagda första antal, att sagda excitationsurvals-block (203) omfattar ett räknedon för att räkna ett första genomsnittligt standardavvikelsevärde (stdashort) genom att använda signalener-10 gierna av det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelsevärde (stdalong) genom att använda signalener-gierna av det andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. 15
7. Kodare (200) enligt nägot av patentkraven 1-6, kännetecknad av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
8. Kodare (200) enligt nägot av patentkraven 1-7, kännetecknad av, 20 att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
9. Kodare (200) enligt nägot av patentkraven 1-8, kännetecknad av, ,* ,* att sagda andra excitation är en algebraisk kodexciterad lineär beräk- ·;· · 25 nad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX). ···· f":
10. Anordning (700) med en kodare (200) som omfattar en ingang 30 (201) för att inmata ramar av en audiosignal pä ett frekvensband, ät- :\9 minstone ett första excitationsblock (206) för att utföra en första excita- *»·. tion för en icke-talliknande audiosignal, och ett andra excitationsblock • » *" (207) för att utföra en andra excitation för en talliknande audiosignal, *:”s kännetecknad av, att sagda kodare (200) omfattar ett filter (300) för att 35 dela frekvensbandet i flera delband, vilka alla har en smalare band- .···. bredd än sagda frekvensband, och att anordningen (700) omfattar •v. även ett excitationsurvalsblock (203) för att väljä ett excitationsblock • · • · 118834 33 frän en grupp av ätminstone sagda första excitationsblock (206) och sagda andra excitationsblock (207), för att utföra excitation för audio-signalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband. 5
11. Anordning (700) enligt patentkrav 10, kännetecknad av, att sagda filter (300) omfattar ett filterblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock 10 (203) omfattar energibestämningsdon för att bestämma en enskild sig- nalenergiuppgift för ätminstone ett delband.
12. Anordning (700) enligt patentkrav 11, kännetecknad av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, 15 av vilka den andra gruppen omfattar delband med högre frekvenser än sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande 20 (LPH) är anordnat att användas för urval av excitationsblocket (206, 207).
, 13. Anordning (700) enligt patentkrav 12, kännetecknad av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför • · *;j S 25 sagda första och andra grupper av delband. t · ♦ i ·*· Li’·
14. Anordning (700) enligt patentkrav 13, kännetecknad av, att del- bandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband. 30 ϊ\μ
15. Anordning (700) enligt patentkrav 12, 13 eller 14, kännetecknad ,*···, av, att man bestämmer ett första och ett andra antal ramar, varvid • · V sagda andra antal är högre än sagda första antal, att sagda excita- tionsurvalsblock (203) omfattar ett räknedon för att räkna ett första ’·'**· 35 genomsnittligt standardavvikelsevärde (stdashort) genom att använda .···. signalenergier av det första antalet ramar, tili vilket antal hör den :v. aktuella ramen pä varje delband, och för att räkna ett andra genom- • · 34 118834 snittligt standardavvikelsevärde (stdalong) genom att använda signal-energier av det andra antalet ramar, till vilket antal hör den aktuella ramen pä varje delband.
16. Anordning (700) enligt nägot av patentkraven 10-15, känneteck- nad av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
17. Anordning (700) enligt nägot av patentkraven 10-16, känneteck-10 nad av, att sagda kodare (200) är en adaptiv bredbandkodare- avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
18. Anordning (700) enligt nägot av patentkraven 10-17, känneteck-15 nad av, att sagda andra excitation är en algebraisk kodexciterad linear beräknad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX).
19. Anordning (700) enligt nägot av patentkraven 10-18, känneteck- nad av att den är en mobil station.
. 20. Anordning (700) enligt nägot av patentkraven 10-19, känneteck- * * nad av, att den omfattar en sändare för att sända ramar via en kanal • « ’ :.:: 25 med en läg bithastighet, till vilka ramar hör parametrar som produce- rats av det valda excitationsblocket (206, 207). • · « » I • · · ♦ ·# ♦
21. System med en kodare (200) som omfattar en ingäng (201) för att ·**. inmata ramar som bildats av en audiosignal pä ett frekvensband, ät- ··· 30 minstone ett första excitationsblock (206) för att utföra en första excita-:·. ^ tion för en icke-talliknande audiosignal, och ett andra excitationsblock (207) för att utföra en andra excitation för en talliknande audiosignal, **:'* kännetecknat av, att sagda kodare (200) omfattar vidare ett filter (300) f**‘: för att dela frekvensbandet i flera delband, vilka alla har en smalare ·:*·: 35 bandbredd än sagda frekvensband, och att systemet omfattar även ett .···. excitationsurvalsblock (203) för att väljä ett excitationsblock frän grup- pen av ätminstone sagda första excitationsblock (206) och sagda • · 118834 35 andra excitationsblock (207), för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband.
22. System enligt patentkrav 21, kännetecknat av, att sagda filter (300) omfattar ett interblock (301) för att producers information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) omfattar energibestämningsdon för att bestämma en enskild signal-10 energiuppgift för ätminstone ett delband.
23. System enligt patentkrav 22, kännetecknat av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, av vilka sagda andra grupp omfattar delband med högre frekvenser än sagda 15 första grupp, att man bestämmer för audiosignalens ramar ett förhäl-lande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande (LPH) är an-ordnat att användas för urval av excitationsblocket (206, 207). 20
24. System enligt patentkrav 23, kännetecknat av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första , och andra grupper av delband.
« · • « : 25 25. System enligt patentkrav 24, kännetecknat av, att delbandet med t*· de lägre frekvenserna lämnas utanför sagda första och andra grupper j.:’: av delband. ··· ····
26. System enligt patentkrav 23, 24 eller 25, kännetecknat av, att man 30 bestämmer ett första och ett andra antal ramar, varvid sagda andra :·. antal är högre än sagda första antal, att sagda excitationsurvalsblock (203) omfattar ett räknedon för att räkna ett första genomsnittligt stan- **:** dardavvikelsevärde (stdashort) genom att använda signalenergier av ***,J det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje *:*·: 35 delband, och för att räkna ett andra genomsnittligt standardavvikelse- .···. värde (stdalong) genom att använda signalenergier av det andra • * •ΓΙ antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. • ♦ 118834 36
27. System enligt nägot av patentkraven 21-26, kännetecknat av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
28. System enligt nägot av patentkraven 21-27, kännetecknat av, att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
29. System enligt nägot av patentkraven 21-28, kännetecknat av, att 10 sagda andra excitation är en algebraisk kodexciterad lineär beräknad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX).
30. System enligt nägot av patentkraven 21-29, kännetecknat av, att det är en mobil station.
31. System enligt nägot av patentkraven 21-30, kännetecknat av, att det omfattar en sändare för att sända ramar via en kanal med en läg 20 bithastighet, tili vilka ramar hör parametrar som producerats av det valda excitationsblocket (206, 207).
32. Förfarande för packning av audiosignaler pä ett frekvensband, var- ’’ vid en första excitation används för en icke-talliknande audiosignal och : 25 en andra excitation används för en tailiknande audiosignal, känne- tecknat av, att frekvensbandet är delat i flera delband, vilka alla har en l/il smalare bandbredd än sagda frekvensband, att frän gruppen av ätmin- ··· stone sagda första excitation och sagda andra excitation välis en exci- .*·*. tation för att utföra excitation för audiosignalens ram pä basis av audio- 30 signalens egenskaper pä ätminstone ett av sagda delband.
·· • · \.!* 33. Förfarande enligt patentkrav 32, kännetecknat av, att sagda filter (300) omfattar ett interblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram ·:**: 35 pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) y.·' omfattar energibestämningsdon för att bestämma en enskild signal- yy energiuppgift för ätminstone ett delband. • · • · 118834 37
34. Förfarande enligt patentkrav 33, kännetecknat av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, av vilka den andra gruppen omfattar delband med högre frekvenser än 5 sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) I sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande (LPH) är anordnat att användas för urval av excitationsblocket (206, 10 207).
35. Förfarande enligt patentkrav 34, kännetecknat av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första och andra grupper av delband. 15
36. Förfarande enligt patentkrav 35, kännetecknat av, att delbandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband. 20
37. Förfarande enligt patentkrav 34, 35 eller 36, kännetecknat av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än det första antalet, att sagda excitationsurvals-block (203) omfattar ett räknedon för att räkna ett första genomsnittligt j8*"8 standardavvikelsevärde (stdashort) genom att använda signalenergier : 25 av det första antalet ramar, tili vilket antal hör den aktuella ramen pä %.1 varje delband, och för att räkna ett andra genomsnittligt standardia*: avvikelsevärde (stdalong) genom att använda signalenergier av den ·:· andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. 30 :·.
38. Förfarande enligt nägot av patentkraven 32-37, kännetecknat av, *..! att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet. • *"*ϊ
39. Förfarande enligt nägot av patentkraven 32-38, kännetecknat av, ·:··! 35 att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB). • « ··» · • * * • · • · 118834 38
40. Förtarande enligt nägot av patentkraven 32-39, kännetecknat av, att sagda andra excitation är en algebraisk kodexciterad linear beräk-nad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation 5 (transform coded excitation, TCX).
41. Förfarande enligt nägot av patentkraven 32-40, kännetecknat av, att ramarna, vilka omfattar parametrar som producerats av den valda excitationen, sands via en kanal med en lag bithastighet. 10
42. Modul för att klassificera ramar som bildats av en audiosignal pä ett frekvensband för att väljä en excitation frän gruppen av ätminstone en första excitation som är avsedd för en icke-talliknande audiosignal och en andra excitation som är avsedd för en talliknande audiosignal, kän- 15 netecknad av, att modulen omfattar vidare en ingäng för att mata sädan information som hänvisar tili ett frekvensband som är delat i flera delband, vilka alla har en smalare bandbredd än sagda frekvensband, och ett excitationsurvalsblock (203) för att väljä ett excitationsblock frän gruppen av ätminstone sagda första excitationsblock (206) och sagda 20 andra excitationsblock (207) för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband.
• · : .·. 43. Modul enligt patentkrav 42, kännetecknad av, att man bestämmer • · · 25 ätminstone en första grupp och en andra grupp av delband, av vilka sagda andra grupp omfattar delband med högre frekvenser än sagda "V första grupp, att man bestämmer för audiosignalens ramar ett förhäl- ·«{* lande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i 30 sagda andra grupp av delband, och att sagda förhällande (LPH) är an- l**·. ordnat att användas för urval av excitationsblocket (206, 207). • · · • · • · • * ·
44. Modul enligt patentkrav 43, kännetecknad av, att ett eller flera del- * ! band av de tillbudsstäende delbanden lämnas utanför sagda första och 35 andra grupper av delband. ««· • · • * ·· · • * « • · · • · · 118834 39
45. Modul enligt patentkrav 44, kännetecknad av, att delbandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband.
46. Modul enligt patentkrav 43, 44 eller 45, kännetecknad av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än sagda första antal, att sagda excitationsurvalsblock (203) omfattar ett räknedon för att räkna ett första genomsnittligt stan-dardavvikelsevärde (stdashort) genom att använda signalenergier av 10 det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelse-värde (stdalong) genom att använda signalenergier av den andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband.
47. Datorprogramprodukt, som omfattar maskinellt utförbara steg för packning av audiosignaler pä ett frekvensband, varvid en första excitation används för en icke-talliknande audiosignal och en andra excitation används för en talliknande audiosignal, kännetecknad av, att datorprogramprodukten omfattar vidare maskinellt utförbara steg för att 20 dela ett frekvensband i flera delband, vilka alla har en smalare band-bredd än sagda frekvensband, maskinellt utförbara steg för att väljä en excitation frän gruppen av sagda ätminstone första excitation och sagda andra excitation pä basis av audiosignalens egenskaper pä ät-; .·. minstone ett av sagda delband för att utföra excitation för audiosigna ali 25 lens ram. • · • · ··* • ·
48. Datorprogramprodukt enligt patentkrav 47, kännetecknad av, att den omfattar vidare maskinellt utförbara steg för att producera sädan • · · information som uppvisar signalenergierna (E(n)) av audiosignalens 30 aktuella ram pä ätminstone ett delband, och maskinellt utförbara steg för att bestämma signalenergin för ätminstone ett delband. ♦ ·· • · • · ··♦ >e*e5
49. Datorprogramprodukt enligt patentkrav 48, kännetecknad av, att [ man bestämmer ett första och ett andra antal ramar, varvid det andra *. * 35 antalet är högre än det första antalet, att datorprogramprodukten omfattar vidare maskinellt utförbara steg för ett räknedon för att räkna ·*·*: ett första genomsnittligt standardavvikelsevärde (stdashort) genom att • * ; — 118834 40 använda signalenergier av det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelsevärde (stdalong) genom att använda signalenergier av den andra antalet ramar, tili vilket antal hör den aktu-5 elia ramen pä varje delband.
50. Datorprogramprodukt enligt nägot av patentkraven 47-49, känne-tecknad av, att den omfattar vidare maskinellt utförbara steg för att utföra en algebraisk kodexciterad linear beräknad excitation (algebraic 10 code excited linear prediction excitation, ACELP) som sagda andra excitation och maskinellt utförbara steg för att utföra en transformkodad excitation (transform coded excitation, TCX) som den första excitatio-nen. t • · • · • · « * * · ··· · • · • · • · • · · • t • · · • · · *·· · «·· • · · · • · · « · · · * • · • · • ·* «M : : I»» • · • · «·· * * • « ··· «· I • · I • · •
FI20045051A 2004-02-23 2004-02-23 Klassificering av audiosignalen FI118834B (sv)

Priority Applications (18)

Application Number Priority Date Filing Date Title
FI20045051A FI118834B (sv) 2004-02-23 2004-02-23 Klassificering av audiosignalen
DE602005019138T DE602005019138D1 (de) 2004-02-23 2005-02-16 Klassifizierung von audiosignalen
PCT/FI2005/050035 WO2005081230A1 (en) 2004-02-23 2005-02-16 Classification of audio signals
AT05708203T ATE456847T1 (de) 2004-02-23 2005-02-16 Klassifizierung von audiosignalen
JP2006553606A JP2007523372A (ja) 2004-02-23 2005-02-16 エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、周波数バンドのオーディオ信号を圧縮する方法、モジュール、およびコンピュータプログラム製品
CNA2005800056082A CN1922658A (zh) 2004-02-23 2005-02-16 音频信号的分类
CN201310059627.XA CN103177726B (zh) 2004-02-23 2005-02-16 音频信号的分类
BRPI0508328-1A BRPI0508328A (pt) 2004-02-23 2005-02-16 codificador, dispositivo e sistema para codificar os sinais de áudio, método para compactar os sinais de áudio na banda de freqüência, módulo para classificar os quadros, e, programa de computador
KR1020067019490A KR100962681B1 (ko) 2004-02-23 2005-02-16 오디오신호들의 분류
KR1020087023376A KR20080093074A (ko) 2004-02-23 2005-02-16 오디오신호들의 분류
EP05708203A EP1719119B1 (en) 2004-02-23 2005-02-16 Classification of audio signals
CA002555352A CA2555352A1 (en) 2004-02-23 2005-02-16 Classification of audio signals
AU2005215744A AU2005215744A1 (en) 2004-02-23 2005-02-16 Classification of audio signals
RU2006129870/09A RU2006129870A (ru) 2004-02-23 2005-02-16 Классификация звуковых сигналов
ES05708203T ES2337270T3 (es) 2004-02-23 2005-02-16 Clasificacion de señales audio.
TW094104984A TWI280560B (en) 2004-02-23 2005-02-21 Classification of audio signals
US11/063,664 US8438019B2 (en) 2004-02-23 2005-02-22 Classification of audio signals
ZA200606713A ZA200606713B (en) 2004-02-23 2006-08-14 Classification of audio signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20045051 2004-02-23
FI20045051A FI118834B (sv) 2004-02-23 2004-02-23 Klassificering av audiosignalen

Publications (3)

Publication Number Publication Date
FI20045051A0 FI20045051A0 (sv) 2004-02-23
FI20045051A FI20045051A (sv) 2005-08-24
FI118834B true FI118834B (sv) 2008-03-31

Family

ID=31725817

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20045051A FI118834B (sv) 2004-02-23 2004-02-23 Klassificering av audiosignalen

Country Status (16)

Country Link
US (1) US8438019B2 (sv)
EP (1) EP1719119B1 (sv)
JP (1) JP2007523372A (sv)
KR (2) KR100962681B1 (sv)
CN (2) CN1922658A (sv)
AT (1) ATE456847T1 (sv)
AU (1) AU2005215744A1 (sv)
BR (1) BRPI0508328A (sv)
CA (1) CA2555352A1 (sv)
DE (1) DE602005019138D1 (sv)
ES (1) ES2337270T3 (sv)
FI (1) FI118834B (sv)
RU (1) RU2006129870A (sv)
TW (1) TWI280560B (sv)
WO (1) WO2005081230A1 (sv)
ZA (1) ZA200606713B (sv)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR20080101873A (ko) * 2006-01-18 2008-11-21 연세대학교 산학협력단 부호화/복호화 장치 및 방법
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US20080033583A1 (en) * 2006-08-03 2008-02-07 Broadcom Corporation Robust Speech/Music Classification for Audio Signals
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
WO2008090564A2 (en) * 2007-01-24 2008-07-31 P.E.S Institute Of Technology Speech activity detection
US8195454B2 (en) 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
WO2009027980A1 (en) * 2007-08-28 2009-03-05 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method, device and system for speech recognition
WO2009066960A1 (en) * 2007-11-21 2009-05-28 Lg Electronics Inc. A method and an apparatus for processing a signal
DE102008022125A1 (de) * 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
US8340964B2 (en) * 2009-07-02 2012-12-25 Alon Konchitsky Speech and music discriminator for multi-media application
US8606569B2 (en) * 2009-07-02 2013-12-10 Alon Konchitsky Automatic determination of multimedia and voice signals
KR101615262B1 (ko) 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
JP5395649B2 (ja) * 2009-12-24 2014-01-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置及びプログラム
CA3025108C (en) 2010-07-02 2020-10-27 Dolby International Ab Audio decoding with selective post filtering
PL4120248T3 (pl) * 2010-07-08 2024-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder wykorzystujący kasowanie aliasingu w przód
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
MX2013009305A (es) * 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio.
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
MX2013009346A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
CN102982804B (zh) * 2011-09-02 2017-05-03 杜比实验室特许公司 音频分类方法和系统
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
EP2830062B1 (en) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
KR102561265B1 (ko) 2012-11-13 2023-07-28 삼성전자주식회사 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치
CN107424621B (zh) * 2014-06-24 2021-10-26 华为技术有限公司 音频编码方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
KR100367700B1 (ko) * 2000-11-22 2003-01-10 엘지전자 주식회사 음성부호화기의 유/무성음정보 추정방법
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals

Also Published As

Publication number Publication date
RU2006129870A (ru) 2008-03-27
BRPI0508328A (pt) 2007-08-07
ATE456847T1 (de) 2010-02-15
FI20045051A (sv) 2005-08-24
US8438019B2 (en) 2013-05-07
CA2555352A1 (en) 2005-09-01
CN1922658A (zh) 2007-02-28
KR20070088276A (ko) 2007-08-29
ZA200606713B (en) 2007-11-28
CN103177726B (zh) 2016-11-02
WO2005081230A1 (en) 2005-09-01
TWI280560B (en) 2007-05-01
AU2005215744A1 (en) 2005-09-01
FI20045051A0 (sv) 2004-02-23
KR100962681B1 (ko) 2010-06-11
EP1719119B1 (en) 2010-01-27
CN103177726A (zh) 2013-06-26
JP2007523372A (ja) 2007-08-16
KR20080093074A (ko) 2008-10-17
DE602005019138D1 (de) 2010-03-18
TW200532646A (en) 2005-10-01
US20050192798A1 (en) 2005-09-01
EP1719119A1 (en) 2006-11-08
ES2337270T3 (es) 2010-04-22

Similar Documents

Publication Publication Date Title
FI118834B (sv) Klassificering av audiosignalen
EP1719120B1 (en) Coding model selection
US8244525B2 (en) Signal encoding a frame in a communication system
KR20080083719A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
KR20130107257A (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
KR20070017379A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
MXPA06009370A (en) Coding model selection
MXPA06009369A (es) Clasificacion de señales de audio
KR20070063729A (ko) 음성 부호화장치, 음성 부호화 방법, 이를 이용한 이동통신단말기