FI110220B - Komprimering och rekonstruering av talsignal - Google Patents
Komprimering och rekonstruering av talsignal Download PDFInfo
- Publication number
- FI110220B FI110220B FI933182A FI933182A FI110220B FI 110220 B FI110220 B FI 110220B FI 933182 A FI933182 A FI 933182A FI 933182 A FI933182 A FI 933182A FI 110220 B FI110220 B FI 110220B
- Authority
- FI
- Finland
- Prior art keywords
- frames
- speech signal
- converter
- algorithm
- compression
- Prior art date
Links
- 230000006835 compression Effects 0.000 title claims description 51
- 238000007906 compression Methods 0.000 title claims description 51
- 238000000034 method Methods 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000006837 decompression Effects 0.000 claims description 7
- 235000013351 cheese Nutrition 0.000 claims 3
- 240000007594 Oryza sativa Species 0.000 claims 1
- 235000007164 Oryza sativa Nutrition 0.000 claims 1
- 230000006870 function Effects 0.000 claims 1
- 235000009566 rice Nutrition 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000007774 longterm Effects 0.000 description 5
- 230000008054 signal transmission Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (13)
1. Förfarande för att komprimera en talsignal, där - ur talsignalen separeras successiva ramar av vald längd i tidsplanet, och - ramama i tidsplanet leds tili en tidsplans/frekvensplansomvandlare, t.ex. en snabb 5 Fourier-omvandlare frän vars utgäng ramama erhälls i frekvensplanet, kännetecknat av att - ramama i frekvensplanet ordnas tili en bildmatris, d.v.s. ett spektrogram, i vilket ramama i frekvensplanet presenteras som en funktion av tiden, och - bildmatrisen leds tili ett organ som utför en komprimeringsalgoritm pä bilden, ur 10 vars - utgäng en komprimerad talsignal erhälls.
2. Förfarande för rekonstmering av en talsignal som komprimerats medelst ett förfarande i enlighet med patentkrav 1, kännetecknat av att - den komprimerade talsignalen leds tili ett organ som utför en dekomprimeringsal-15 goritm, vars utgäng utgörs av en bildmatris som presenterar ramama i frekvensplanet som en funktion av tiden, - ur bildmatrisen avskiljs ramama i frekvensplanet, - ramama leds tili en omvandlare som utför en frekvensplans/tidsplansomvandling, i vars utgäng de ramar som bildar talsignalen i tidsplanet erhälls. ; 20
3. Förfarande enligt patentkrav 2, kännetecknat av att tidsplans/frekvensplans- • ‘ · * omvandlaren är en omvandlare som utför en omvänd Fourier-omvandling. • ·
4. Förfarande enligt patentkrav 1, kännetecknat av att komprimeringsalgoritmen • ♦ :*·*. är en i och för sig känd JPEG (Joint Photographic Experts Group) och dekomprime- • I . · :·. ringsalgoritmen är en i och för sig känd IJPEG (Inverse JPEG). 25
5. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i ffekvens- :: planet bestär av separata real- och imaginärramar.
6. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i frekvens- : : planet bestär av separata amplitud- och fasramar.
7. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i ffekvens-•, .30 planet utgörs enbart av amplitudramar.
8. Förfarande enligt patentkrav 1, kännetecknat av att för generering av en tvä-dimensionell bildmatris används en halva av ramen i frekvensplanet. 110220 10
9. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att antalet Fourier-omvandlingspunkter i ramen och antalet ramar som omvandlas är detsamma, varvid en kvadratisk bildmatris erhalls.
10. Anordning för att komprimera en talsignal, vilken anordning uppvisar 5. en A/D-omvandlare för att omvandla en talsignal till digital form, - första organ för att dela talsignalen i successiva ramar, samt - en första omvandlare, t.ex. en snabb Fourier-omvandlare som utför en tids-plans/frekvensplansomvandling, kännetecknad av att den omfattar 10. andra organ för att generera en tvädimensionell bildmatris av den första omvandla- rens utgängssignaler, - tredje organ som utför en komprimeringsalgoritm pä bildmatrisen, och - minnesorgan för lagring av mellan- och slutresultaten.
11. Anordning för rekonstruering av en talsignal som komprimerats med en an-15 ordning i enlighet med patentkrav 10, kännetecknad av att anordningen omfattar - fjärde organ som utför en dekomprimeringsalgoritm, - femte organ för att avskilja ramama i lrekvensplanet ffän den tvädimensionella bildmatrisen, - en andra omvandlare som utför en frekvensplans/tidsplansomvandling, 20. sjätte organ för att kombinera ramama i tidsplanet successivt, ;': ·: - en D/A-omvandlare för att omvandla en digital talsignal till analog form, samt ...: - minnesorgan för lagring av mellanresultaten.
: 12. Anordning enligt patentkrav 11, kännetecknad av att den andra omvandlaren 4 · 4 : *.· är en omvandlare som utför en snabb omvänd Fourier-omvandling. • « ·
13. Anordning enligt patentkrav 10 eller 11, kännetecknad av att de tredje orga- . . nen är organ som utför en JPEG-algoritm och de fjärde organen är organ som utför ;.. * en IJPEG-algoritm. • 4 4 4 4 4*4 4 4 4 4 4 4 4 4 4 » 4 I • 4
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI933182A FI110220B (sv) | 1993-07-13 | 1993-07-13 | Komprimering och rekonstruering av talsignal |
GB9414078A GB2280827B (en) | 1993-07-13 | 1994-07-12 | Compression and reconstruction of speech signal |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI933182A FI110220B (sv) | 1993-07-13 | 1993-07-13 | Komprimering och rekonstruering av talsignal |
FI933182 | 1993-07-13 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI933182A0 FI933182A0 (fi) | 1993-07-13 |
FI933182A FI933182A (fi) | 1995-01-14 |
FI110220B true FI110220B (sv) | 2002-12-13 |
Family
ID=8538313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI933182A FI110220B (sv) | 1993-07-13 | 1993-07-13 | Komprimering och rekonstruering av talsignal |
Country Status (2)
Country | Link |
---|---|
FI (1) | FI110220B (sv) |
GB (1) | GB2280827B (sv) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
GB2351889B (en) | 1999-07-06 | 2003-12-17 | Ericsson Telefon Ab L M | Speech band expansion |
DE19939387A1 (de) * | 1999-08-19 | 2001-02-22 | Siemens Ag | Verfahren zum Kodieren von Audiosignalen, insbesondere von Sprach- und/oder Musiksignalen |
AU2003262451B2 (en) * | 1999-09-22 | 2006-01-19 | Macom Technology Solutions Holdings, Inc. | Multimode speech encoder |
CN1151485C (zh) * | 2000-05-02 | 2004-05-26 | 莫绍祥 | 声音及节拍的图象显示方法和设备 |
US7574352B2 (en) | 2002-09-06 | 2009-08-11 | Massachusetts Institute Of Technology | 2-D processing of speech |
UA91827C2 (en) * | 2006-09-29 | 2010-09-10 | Общество С Ограниченной Ответственностью "Парисет" | Method of multi-component coding and decoding electric signals of different origin |
CN111768799B (zh) * | 2019-03-14 | 2024-06-14 | 富泰华工业(深圳)有限公司 | 声音识别方法、装置、计算机装置及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4045616A (en) * | 1975-05-23 | 1977-08-30 | Time Data Corporation | Vocoder system |
IL79775A (en) * | 1985-08-23 | 1990-06-10 | Republic Telcom Systems Corp | Multiplexed digital packet telephone system |
-
1993
- 1993-07-13 FI FI933182A patent/FI110220B/sv not_active IP Right Cessation
-
1994
- 1994-07-12 GB GB9414078A patent/GB2280827B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
FI933182A0 (fi) | 1993-07-13 |
GB2280827B (en) | 1998-01-07 |
GB9414078D0 (en) | 1994-08-31 |
FI933182A (fi) | 1995-01-14 |
GB2280827A (en) | 1995-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
KR100873836B1 (ko) | Celp 트랜스코딩 | |
US6493666B2 (en) | System and method for processing data from and for multiple channels | |
US5091944A (en) | Apparatus for linear predictive coding and decoding of speech using residual wave form time-access compression | |
US5623575A (en) | Excitation synchronous time encoding vocoder and method | |
JP4142292B2 (ja) | オーディオ信号の符号化効率を向上させる方法 | |
EP2360682A1 (en) | Audio packet loss concealment by transform interpolation | |
JPWO2007088853A1 (ja) | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 | |
JP2000305599A (ja) | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 | |
KR20010087391A (ko) | 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성 | |
FI119576B (sv) | Talbehandlingsanordning och förfarande för behandling av tal, samt en digital radiotelefon | |
FI110220B (sv) | Komprimering och rekonstruering av talsignal | |
JP3466080B2 (ja) | デジタルデータの符号化/復号化方法及び装置 | |
US5673364A (en) | System and method for compression and decompression of audio signals | |
EP0954853B1 (en) | A method of encoding a speech signal | |
US6141639A (en) | Method and apparatus for coding of signals containing speech and background noise | |
US7164719B2 (en) | System to reduce distortion due to coding with a sample-by-sample quantizer | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
WO1997016818A1 (en) | Method and system for compressing a speech signal using waveform approximation | |
Najih et al. | Speech compression using discreet wavelet transform | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP5491193B2 (ja) | 音声コード化の方法および装置 | |
JP3576485B2 (ja) | 固定音源ベクトル生成装置及び音声符号化/復号化装置 | |
Bakır | Compressing English Speech Data with Hybrid Methods without Data Loss |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MA | Patent expired |