FI118834B - Klassificering av audiosignalen - Google Patents
Klassificering av audiosignalen Download PDFInfo
- Publication number
- FI118834B FI118834B FI20045051A FI20045051A FI118834B FI 118834 B FI118834 B FI 118834B FI 20045051 A FI20045051 A FI 20045051A FI 20045051 A FI20045051 A FI 20045051A FI 118834 B FI118834 B FI 118834B
- Authority
- FI
- Finland
- Prior art keywords
- excitation
- subband
- audio signal
- signal
- subbands
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 94
- 230000005284 excitation Effects 0.000 claims abstract description 188
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000004590 computer program Methods 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 abstract description 4
- 230000006835 compression Effects 0.000 description 17
- 238000007906 compression Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 3
- 230000006837 decompression Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 2
- 241000237519 Bivalvia Species 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000020639 clam Nutrition 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Stereophonic System (AREA)
Claims (50)
1. Kodare (200) som omfattar en ingäng (201) för att inmata ramar som bildats av en audiosignal pä ett frekvensband, ätminstone ett första 5 excitationsblock (206) för att utföra en första excitation för en icke-tal-liknande audiosignal, och ett andra excitationsblock (207) för att utföra en andra excitation för en talliknande audiosignal, kännetecknad av, att kodaren (200) omfattar vidare ett filter (300) för att dela frekvens-bandet i flera delband, vitka alla har en smalare bandbredd än sagda 10 frekvensband, och ett excitationsurvalsblock (203) för att väljä ett excitationsblock frän en grupp tili vilken hör sagda ätminstone första excitationsblock (206) och sagda andra excitationsblock (207), för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband. 15
2. Kodare (200) enligt patentkrav 1, kännetecknad av, att sagda filter (300) omfattar ett filterblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) 20 omfattar energibestämningsdon för att bestämma en enskild signal-energiuppgift för ätminstone ett delband.
. 3. Kodare (200) enligt patentkrav 2, kännetecknad av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, J 25 av vilka den andra gruppen omfattar delband med högre frekvenser än sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin :***: (LevH) i sagda andra grupp av delband, och att sagda förhällande ··· 30 (LPH) är anordnat att användas för urval av excitationsblocket (206, :·. 207). • *
4. Kodare (200) enligt patentkrav 3, kännetecknad av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första ”**: 35 och andra grupper av delband. ··* t · • ··* ·· · • · · • · • » 118834 32
5. Kodare (200) enligt patentkrav 4, kännetecknad av, att delbandet med den lägsta frekvensen lämnas utanför sagda första och andra grupper av delband.
6. Kodare (200) enligt patentkrav 3, 4 eller 5, kännetecknad av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än sagda första antal, att sagda excitationsurvals-block (203) omfattar ett räknedon för att räkna ett första genomsnittligt standardavvikelsevärde (stdashort) genom att använda signalener-10 gierna av det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelsevärde (stdalong) genom att använda signalener-gierna av det andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. 15
7. Kodare (200) enligt nägot av patentkraven 1-6, kännetecknad av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
8. Kodare (200) enligt nägot av patentkraven 1-7, kännetecknad av, 20 att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
9. Kodare (200) enligt nägot av patentkraven 1-8, kännetecknad av, ,* ,* att sagda andra excitation är en algebraisk kodexciterad lineär beräk- ·;· · 25 nad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX). ···· f":
10. Anordning (700) med en kodare (200) som omfattar en ingang 30 (201) för att inmata ramar av en audiosignal pä ett frekvensband, ät- :\9 minstone ett första excitationsblock (206) för att utföra en första excita- *»·. tion för en icke-talliknande audiosignal, och ett andra excitationsblock • » *" (207) för att utföra en andra excitation för en talliknande audiosignal, *:”s kännetecknad av, att sagda kodare (200) omfattar ett filter (300) för att 35 dela frekvensbandet i flera delband, vilka alla har en smalare band- .···. bredd än sagda frekvensband, och att anordningen (700) omfattar •v. även ett excitationsurvalsblock (203) för att väljä ett excitationsblock • · • · 118834 33 frän en grupp av ätminstone sagda första excitationsblock (206) och sagda andra excitationsblock (207), för att utföra excitation för audio-signalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband. 5
11. Anordning (700) enligt patentkrav 10, kännetecknad av, att sagda filter (300) omfattar ett filterblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock 10 (203) omfattar energibestämningsdon för att bestämma en enskild sig- nalenergiuppgift för ätminstone ett delband.
12. Anordning (700) enligt patentkrav 11, kännetecknad av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, 15 av vilka den andra gruppen omfattar delband med högre frekvenser än sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande 20 (LPH) är anordnat att användas för urval av excitationsblocket (206, 207).
, 13. Anordning (700) enligt patentkrav 12, kännetecknad av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför • · *;j S 25 sagda första och andra grupper av delband. t · ♦ i ·*· Li’·
14. Anordning (700) enligt patentkrav 13, kännetecknad av, att del- bandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband. 30 ϊ\μ
15. Anordning (700) enligt patentkrav 12, 13 eller 14, kännetecknad ,*···, av, att man bestämmer ett första och ett andra antal ramar, varvid • · V sagda andra antal är högre än sagda första antal, att sagda excita- tionsurvalsblock (203) omfattar ett räknedon för att räkna ett första ’·'**· 35 genomsnittligt standardavvikelsevärde (stdashort) genom att använda .···. signalenergier av det första antalet ramar, tili vilket antal hör den :v. aktuella ramen pä varje delband, och för att räkna ett andra genom- • · 34 118834 snittligt standardavvikelsevärde (stdalong) genom att använda signal-energier av det andra antalet ramar, till vilket antal hör den aktuella ramen pä varje delband.
16. Anordning (700) enligt nägot av patentkraven 10-15, känneteck- nad av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
17. Anordning (700) enligt nägot av patentkraven 10-16, känneteck-10 nad av, att sagda kodare (200) är en adaptiv bredbandkodare- avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
18. Anordning (700) enligt nägot av patentkraven 10-17, känneteck-15 nad av, att sagda andra excitation är en algebraisk kodexciterad linear beräknad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX).
19. Anordning (700) enligt nägot av patentkraven 10-18, känneteck- nad av att den är en mobil station.
. 20. Anordning (700) enligt nägot av patentkraven 10-19, känneteck- * * nad av, att den omfattar en sändare för att sända ramar via en kanal • « ’ :.:: 25 med en läg bithastighet, till vilka ramar hör parametrar som produce- rats av det valda excitationsblocket (206, 207). • · « » I • · · ♦ ·# ♦
21. System med en kodare (200) som omfattar en ingäng (201) för att ·**. inmata ramar som bildats av en audiosignal pä ett frekvensband, ät- ··· 30 minstone ett första excitationsblock (206) för att utföra en första excita-:·. ^ tion för en icke-talliknande audiosignal, och ett andra excitationsblock (207) för att utföra en andra excitation för en talliknande audiosignal, **:'* kännetecknat av, att sagda kodare (200) omfattar vidare ett filter (300) f**‘: för att dela frekvensbandet i flera delband, vilka alla har en smalare ·:*·: 35 bandbredd än sagda frekvensband, och att systemet omfattar även ett .···. excitationsurvalsblock (203) för att väljä ett excitationsblock frän grup- pen av ätminstone sagda första excitationsblock (206) och sagda • · 118834 35 andra excitationsblock (207), för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband.
22. System enligt patentkrav 21, kännetecknat av, att sagda filter (300) omfattar ett interblock (301) för att producers information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) omfattar energibestämningsdon för att bestämma en enskild signal-10 energiuppgift för ätminstone ett delband.
23. System enligt patentkrav 22, kännetecknat av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, av vilka sagda andra grupp omfattar delband med högre frekvenser än sagda 15 första grupp, att man bestämmer för audiosignalens ramar ett förhäl-lande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande (LPH) är an-ordnat att användas för urval av excitationsblocket (206, 207). 20
24. System enligt patentkrav 23, kännetecknat av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första , och andra grupper av delband.
« · • « : 25 25. System enligt patentkrav 24, kännetecknat av, att delbandet med t*· de lägre frekvenserna lämnas utanför sagda första och andra grupper j.:’: av delband. ··· ····
26. System enligt patentkrav 23, 24 eller 25, kännetecknat av, att man 30 bestämmer ett första och ett andra antal ramar, varvid sagda andra :·. antal är högre än sagda första antal, att sagda excitationsurvalsblock (203) omfattar ett räknedon för att räkna ett första genomsnittligt stan- **:** dardavvikelsevärde (stdashort) genom att använda signalenergier av ***,J det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje *:*·: 35 delband, och för att räkna ett andra genomsnittligt standardavvikelse- .···. värde (stdalong) genom att använda signalenergier av det andra • * •ΓΙ antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. • ♦ 118834 36
27. System enligt nägot av patentkraven 21-26, kännetecknat av, att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet.
28. System enligt nägot av patentkraven 21-27, kännetecknat av, att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB).
29. System enligt nägot av patentkraven 21-28, kännetecknat av, att 10 sagda andra excitation är en algebraisk kodexciterad lineär beräknad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation (transform coded excitation, TCX).
30. System enligt nägot av patentkraven 21-29, kännetecknat av, att det är en mobil station.
31. System enligt nägot av patentkraven 21-30, kännetecknat av, att det omfattar en sändare för att sända ramar via en kanal med en läg 20 bithastighet, tili vilka ramar hör parametrar som producerats av det valda excitationsblocket (206, 207).
32. Förfarande för packning av audiosignaler pä ett frekvensband, var- ’’ vid en första excitation används för en icke-talliknande audiosignal och : 25 en andra excitation används för en tailiknande audiosignal, känne- tecknat av, att frekvensbandet är delat i flera delband, vilka alla har en l/il smalare bandbredd än sagda frekvensband, att frän gruppen av ätmin- ··· stone sagda första excitation och sagda andra excitation välis en exci- .*·*. tation för att utföra excitation för audiosignalens ram pä basis av audio- 30 signalens egenskaper pä ätminstone ett av sagda delband.
·· • · \.!* 33. Förfarande enligt patentkrav 32, kännetecknat av, att sagda filter (300) omfattar ett interblock (301) för att producera information som uppvisar signalenergierna (E(n)) av den aktuella audiosignalens ram ·:**: 35 pä ätminstone ett delband, och att sagda excitationsurvalsblock (203) y.·' omfattar energibestämningsdon för att bestämma en enskild signal- yy energiuppgift för ätminstone ett delband. • · • · 118834 37
34. Förfarande enligt patentkrav 33, kännetecknat av, att man bestämmer ätminstone en första grupp och en andra grupp av delband, av vilka den andra gruppen omfattar delband med högre frekvenser än 5 sagda första grupp, att man bestämmer för audiosignalens ramar ett förhällande (LPH) mellan den normaliserade signalenergin (LevL) I sagda första grupp av delband och den normaliserade signalenergin (LevH) i sagda andra grupp av delband, och att sagda förhällande (LPH) är anordnat att användas för urval av excitationsblocket (206, 10 207).
35. Förfarande enligt patentkrav 34, kännetecknat av, att ett eller flera delband av de tillbudsstäende delbanden lämnas utanför sagda första och andra grupper av delband. 15
36. Förfarande enligt patentkrav 35, kännetecknat av, att delbandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband. 20
37. Förfarande enligt patentkrav 34, 35 eller 36, kännetecknat av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än det första antalet, att sagda excitationsurvals-block (203) omfattar ett räknedon för att räkna ett första genomsnittligt j8*"8 standardavvikelsevärde (stdashort) genom att använda signalenergier : 25 av det första antalet ramar, tili vilket antal hör den aktuella ramen pä %.1 varje delband, och för att räkna ett andra genomsnittligt standardia*: avvikelsevärde (stdalong) genom att använda signalenergier av den ·:· andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband. 30 :·.
38. Förfarande enligt nägot av patentkraven 32-37, kännetecknat av, *..! att sagda filter (300) är en filterbank för en detektor (202) av talaktivitet. • *"*ϊ
39. Förfarande enligt nägot av patentkraven 32-38, kännetecknat av, ·:··! 35 att sagda kodare (200) är en adaptiv bredbandkodare-avkodare med flera hastigheter (adaptive multi-rate wideband codec, AMR-WB). • « ··» · • * * • · • · 118834 38
40. Förtarande enligt nägot av patentkraven 32-39, kännetecknat av, att sagda andra excitation är en algebraisk kodexciterad linear beräk-nad excitation (algebraic code excited linear prediction excitation, ACELP) och sagda första excitation är en transformkodad excitation 5 (transform coded excitation, TCX).
41. Förfarande enligt nägot av patentkraven 32-40, kännetecknat av, att ramarna, vilka omfattar parametrar som producerats av den valda excitationen, sands via en kanal med en lag bithastighet. 10
42. Modul för att klassificera ramar som bildats av en audiosignal pä ett frekvensband för att väljä en excitation frän gruppen av ätminstone en första excitation som är avsedd för en icke-talliknande audiosignal och en andra excitation som är avsedd för en talliknande audiosignal, kän- 15 netecknad av, att modulen omfattar vidare en ingäng för att mata sädan information som hänvisar tili ett frekvensband som är delat i flera delband, vilka alla har en smalare bandbredd än sagda frekvensband, och ett excitationsurvalsblock (203) för att väljä ett excitationsblock frän gruppen av ätminstone sagda första excitationsblock (206) och sagda 20 andra excitationsblock (207) för att utföra excitation för audiosignalens ram pä basis av audiosignalens egenskaper pä ätminstone ett av sagda delband.
• · : .·. 43. Modul enligt patentkrav 42, kännetecknad av, att man bestämmer • · · 25 ätminstone en första grupp och en andra grupp av delband, av vilka sagda andra grupp omfattar delband med högre frekvenser än sagda "V första grupp, att man bestämmer för audiosignalens ramar ett förhäl- ·«{* lande (LPH) mellan den normaliserade signalenergin (LevL) i sagda första grupp av delband och den normaliserade signalenergin (LevH) i 30 sagda andra grupp av delband, och att sagda förhällande (LPH) är an- l**·. ordnat att användas för urval av excitationsblocket (206, 207). • · · • · • · • * ·
44. Modul enligt patentkrav 43, kännetecknad av, att ett eller flera del- * ! band av de tillbudsstäende delbanden lämnas utanför sagda första och 35 andra grupper av delband. ««· • · • * ·· · • * « • · · • · · 118834 39
45. Modul enligt patentkrav 44, kännetecknad av, att delbandet med de lägsta frekvenserna lämnas utanför sagda första och andra grupper av delband.
46. Modul enligt patentkrav 43, 44 eller 45, kännetecknad av, att man bestämmer ett första och ett andra antal ramar, varvid sagda andra antal är högre än sagda första antal, att sagda excitationsurvalsblock (203) omfattar ett räknedon för att räkna ett första genomsnittligt stan-dardavvikelsevärde (stdashort) genom att använda signalenergier av 10 det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelse-värde (stdalong) genom att använda signalenergier av den andra antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband.
47. Datorprogramprodukt, som omfattar maskinellt utförbara steg för packning av audiosignaler pä ett frekvensband, varvid en första excitation används för en icke-talliknande audiosignal och en andra excitation används för en talliknande audiosignal, kännetecknad av, att datorprogramprodukten omfattar vidare maskinellt utförbara steg för att 20 dela ett frekvensband i flera delband, vilka alla har en smalare band-bredd än sagda frekvensband, maskinellt utförbara steg för att väljä en excitation frän gruppen av sagda ätminstone första excitation och sagda andra excitation pä basis av audiosignalens egenskaper pä ät-; .·. minstone ett av sagda delband för att utföra excitation för audiosigna ali 25 lens ram. • · • · ··* • ·
48. Datorprogramprodukt enligt patentkrav 47, kännetecknad av, att den omfattar vidare maskinellt utförbara steg för att producera sädan • · · information som uppvisar signalenergierna (E(n)) av audiosignalens 30 aktuella ram pä ätminstone ett delband, och maskinellt utförbara steg för att bestämma signalenergin för ätminstone ett delband. ♦ ·· • · • · ··♦ >e*e5
49. Datorprogramprodukt enligt patentkrav 48, kännetecknad av, att [ man bestämmer ett första och ett andra antal ramar, varvid det andra *. * 35 antalet är högre än det första antalet, att datorprogramprodukten omfattar vidare maskinellt utförbara steg för ett räknedon för att räkna ·*·*: ett första genomsnittligt standardavvikelsevärde (stdashort) genom att • * ; — 118834 40 använda signalenergier av det första antalet ramar, tili vilket antal hör den aktuella ramen pä varje delband, och för att räkna ett andra genomsnittligt standardavvikelsevärde (stdalong) genom att använda signalenergier av den andra antalet ramar, tili vilket antal hör den aktu-5 elia ramen pä varje delband.
50. Datorprogramprodukt enligt nägot av patentkraven 47-49, känne-tecknad av, att den omfattar vidare maskinellt utförbara steg för att utföra en algebraisk kodexciterad linear beräknad excitation (algebraic 10 code excited linear prediction excitation, ACELP) som sagda andra excitation och maskinellt utförbara steg för att utföra en transformkodad excitation (transform coded excitation, TCX) som den första excitatio-nen. t • · • · • · « * * · ··· · • · • · • · • · · • t • · · • · · *·· · «·· • · · · • · · « · · · * • · • · • ·* «M : : I»» • · • · «·· * * • « ··· «· I • · I • · •
Priority Applications (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20045051A FI118834B (sv) | 2004-02-23 | 2004-02-23 | Klassificering av audiosignalen |
AU2005215744A AU2005215744A1 (en) | 2004-02-23 | 2005-02-16 | Classification of audio signals |
CNA2005800056082A CN1922658A (zh) | 2004-02-23 | 2005-02-16 | 音频信号的分类 |
ES05708203T ES2337270T3 (es) | 2004-02-23 | 2005-02-16 | Clasificacion de señales audio. |
AT05708203T ATE456847T1 (de) | 2004-02-23 | 2005-02-16 | Klassifizierung von audiosignalen |
KR1020067019490A KR100962681B1 (ko) | 2004-02-23 | 2005-02-16 | 오디오신호들의 분류 |
EP05708203A EP1719119B1 (en) | 2004-02-23 | 2005-02-16 | Classification of audio signals |
PCT/FI2005/050035 WO2005081230A1 (en) | 2004-02-23 | 2005-02-16 | Classification of audio signals |
DE602005019138T DE602005019138D1 (de) | 2004-02-23 | 2005-02-16 | Klassifizierung von audiosignalen |
BRPI0508328-1A BRPI0508328A (pt) | 2004-02-23 | 2005-02-16 | codificador, dispositivo e sistema para codificar os sinais de áudio, método para compactar os sinais de áudio na banda de freqüência, módulo para classificar os quadros, e, programa de computador |
CA002555352A CA2555352A1 (en) | 2004-02-23 | 2005-02-16 | Classification of audio signals |
JP2006553606A JP2007523372A (ja) | 2004-02-23 | 2005-02-16 | エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、周波数バンドのオーディオ信号を圧縮する方法、モジュール、およびコンピュータプログラム製品 |
RU2006129870/09A RU2006129870A (ru) | 2004-02-23 | 2005-02-16 | Классификация звуковых сигналов |
CN201310059627.XA CN103177726B (zh) | 2004-02-23 | 2005-02-16 | 音频信号的分类 |
KR1020087023376A KR20080093074A (ko) | 2004-02-23 | 2005-02-16 | 오디오신호들의 분류 |
TW094104984A TWI280560B (en) | 2004-02-23 | 2005-02-21 | Classification of audio signals |
US11/063,664 US8438019B2 (en) | 2004-02-23 | 2005-02-22 | Classification of audio signals |
ZA200606713A ZA200606713B (en) | 2004-02-23 | 2006-08-14 | Classification of audio signals |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20045051A FI118834B (sv) | 2004-02-23 | 2004-02-23 | Klassificering av audiosignalen |
FI20045051 | 2004-02-23 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20045051A0 FI20045051A0 (sv) | 2004-02-23 |
FI20045051A FI20045051A (sv) | 2005-08-24 |
FI118834B true FI118834B (sv) | 2008-03-31 |
Family
ID=31725817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20045051A FI118834B (sv) | 2004-02-23 | 2004-02-23 | Klassificering av audiosignalen |
Country Status (16)
Country | Link |
---|---|
US (1) | US8438019B2 (sv) |
EP (1) | EP1719119B1 (sv) |
JP (1) | JP2007523372A (sv) |
KR (2) | KR20080093074A (sv) |
CN (2) | CN103177726B (sv) |
AT (1) | ATE456847T1 (sv) |
AU (1) | AU2005215744A1 (sv) |
BR (1) | BRPI0508328A (sv) |
CA (1) | CA2555352A1 (sv) |
DE (1) | DE602005019138D1 (sv) |
ES (1) | ES2337270T3 (sv) |
FI (1) | FI118834B (sv) |
RU (1) | RU2006129870A (sv) |
TW (1) | TWI280560B (sv) |
WO (1) | WO2005081230A1 (sv) |
ZA (1) | ZA200606713B (sv) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
TWI333643B (en) * | 2006-01-18 | 2010-11-21 | Lg Electronics Inc | Apparatus and method for encoding and decoding signal |
US20080033583A1 (en) * | 2006-08-03 | 2008-02-07 | Broadcom Corporation | Robust Speech/Music Classification for Audio Signals |
US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
WO2008090564A2 (en) * | 2007-01-24 | 2008-07-31 | P.E.S Institute Of Technology | Speech activity detection |
BRPI0807703B1 (pt) | 2007-02-26 | 2020-09-24 | Dolby Laboratories Licensing Corporation | Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador |
US8982744B2 (en) * | 2007-06-06 | 2015-03-17 | Broadcom Corporation | Method and system for a subband acoustic echo canceller with integrated voice activity detection |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
US20110035215A1 (en) * | 2007-08-28 | 2011-02-10 | Haim Sompolinsky | Method, device and system for speech recognition |
WO2009066959A1 (en) * | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
DE102008022125A1 (de) * | 2008-05-05 | 2009-11-19 | Siemens Aktiengesellschaft | Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101649376B1 (ko) * | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
US8606569B2 (en) * | 2009-07-02 | 2013-12-10 | Alon Konchitsky | Automatic determination of multimedia and voice signals |
US8340964B2 (en) * | 2009-07-02 | 2012-12-25 | Alon Konchitsky | Speech and music discriminator for multi-media application |
KR101615262B1 (ko) | 2009-08-12 | 2016-04-26 | 삼성전자주식회사 | 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치 |
JP5395649B2 (ja) * | 2009-12-24 | 2014-01-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置及びプログラム |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
EP4398248A3 (en) * | 2010-07-08 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
PL3471092T3 (pl) | 2011-02-14 | 2020-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekodowanie pozycji impulsów ścieżek sygnału audio |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
CN102959620B (zh) | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
CN103534754B (zh) | 2011-02-14 | 2015-09-30 | 弗兰霍菲尔运输应用研究公司 | 在不活动阶段期间利用噪声合成的音频编解码器 |
AR085895A1 (es) * | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
CN102982804B (zh) * | 2011-09-02 | 2017-05-03 | 杜比实验室特许公司 | 音频分类方法和系统 |
US9111531B2 (en) * | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
CN108831501B (zh) | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
JP6170172B2 (ja) | 2012-11-13 | 2017-07-26 | サムスン エレクトロニクス カンパニー リミテッド | 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置 |
CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
DE69926821T2 (de) | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6311154B1 (en) | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
US6640208B1 (en) | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
KR100367700B1 (ko) * | 2000-11-22 | 2003-01-10 | 엘지전자 주식회사 | 음성부호화기의 유/무성음정보 추정방법 |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
-
2004
- 2004-02-23 FI FI20045051A patent/FI118834B/sv active
-
2005
- 2005-02-16 BR BRPI0508328-1A patent/BRPI0508328A/pt not_active Application Discontinuation
- 2005-02-16 AU AU2005215744A patent/AU2005215744A1/en not_active Abandoned
- 2005-02-16 DE DE602005019138T patent/DE602005019138D1/de active Active
- 2005-02-16 CA CA002555352A patent/CA2555352A1/en not_active Abandoned
- 2005-02-16 ES ES05708203T patent/ES2337270T3/es active Active
- 2005-02-16 KR KR1020087023376A patent/KR20080093074A/ko not_active Application Discontinuation
- 2005-02-16 EP EP05708203A patent/EP1719119B1/en active Active
- 2005-02-16 AT AT05708203T patent/ATE456847T1/de not_active IP Right Cessation
- 2005-02-16 JP JP2006553606A patent/JP2007523372A/ja not_active Withdrawn
- 2005-02-16 RU RU2006129870/09A patent/RU2006129870A/ru not_active Application Discontinuation
- 2005-02-16 CN CN201310059627.XA patent/CN103177726B/zh active Active
- 2005-02-16 CN CNA2005800056082A patent/CN1922658A/zh active Pending
- 2005-02-16 WO PCT/FI2005/050035 patent/WO2005081230A1/en active Application Filing
- 2005-02-16 KR KR1020067019490A patent/KR100962681B1/ko active IP Right Grant
- 2005-02-21 TW TW094104984A patent/TWI280560B/zh not_active IP Right Cessation
- 2005-02-22 US US11/063,664 patent/US8438019B2/en active Active
-
2006
- 2006-08-14 ZA ZA200606713A patent/ZA200606713B/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP1719119A1 (en) | 2006-11-08 |
US20050192798A1 (en) | 2005-09-01 |
CN103177726B (zh) | 2016-11-02 |
WO2005081230A1 (en) | 2005-09-01 |
KR100962681B1 (ko) | 2010-06-11 |
RU2006129870A (ru) | 2008-03-27 |
TW200532646A (en) | 2005-10-01 |
JP2007523372A (ja) | 2007-08-16 |
ATE456847T1 (de) | 2010-02-15 |
ZA200606713B (en) | 2007-11-28 |
KR20080093074A (ko) | 2008-10-17 |
US8438019B2 (en) | 2013-05-07 |
EP1719119B1 (en) | 2010-01-27 |
ES2337270T3 (es) | 2010-04-22 |
CN103177726A (zh) | 2013-06-26 |
DE602005019138D1 (de) | 2010-03-18 |
CN1922658A (zh) | 2007-02-28 |
BRPI0508328A (pt) | 2007-08-07 |
TWI280560B (en) | 2007-05-01 |
KR20070088276A (ko) | 2007-08-29 |
CA2555352A1 (en) | 2005-09-01 |
FI20045051A0 (sv) | 2004-02-23 |
AU2005215744A1 (en) | 2005-09-01 |
FI20045051A (sv) | 2005-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI118834B (sv) | Klassificering av audiosignalen | |
EP1719120B1 (en) | Coding model selection | |
US8244525B2 (en) | Signal encoding a frame in a communication system | |
KR20080083719A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
KR20130107257A (ko) | 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치 | |
KR20070017379A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
MXPA06009370A (en) | Coding model selection | |
MXPA06009369A (es) | Clasificacion de señales de audio | |
KR20070063729A (ko) | 음성 부호화장치, 음성 부호화 방법, 이를 이용한 이동통신단말기 |