FI110220B - Komprimering och rekonstruering av talsignal - Google Patents

Komprimering och rekonstruering av talsignal Download PDF

Info

Publication number
FI110220B
FI110220B FI933182A FI933182A FI110220B FI 110220 B FI110220 B FI 110220B FI 933182 A FI933182 A FI 933182A FI 933182 A FI933182 A FI 933182A FI 110220 B FI110220 B FI 110220B
Authority
FI
Finland
Prior art keywords
frames
speech signal
converter
algorithm
compression
Prior art date
Application number
FI933182A
Other languages
English (en)
Finnish (fi)
Other versions
FI933182A0 (fi
FI933182A (fi
Inventor
Ari Sinisalo
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Priority to FI933182A priority Critical patent/FI110220B/sv
Publication of FI933182A0 publication Critical patent/FI933182A0/fi
Priority to GB9414078A priority patent/GB2280827B/en
Publication of FI933182A publication Critical patent/FI933182A/fi
Application granted granted Critical
Publication of FI110220B publication Critical patent/FI110220B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (13)

1. Förfarande för att komprimera en talsignal, där - ur talsignalen separeras successiva ramar av vald längd i tidsplanet, och - ramama i tidsplanet leds tili en tidsplans/frekvensplansomvandlare, t.ex. en snabb 5 Fourier-omvandlare frän vars utgäng ramama erhälls i frekvensplanet, kännetecknat av att - ramama i frekvensplanet ordnas tili en bildmatris, d.v.s. ett spektrogram, i vilket ramama i frekvensplanet presenteras som en funktion av tiden, och - bildmatrisen leds tili ett organ som utför en komprimeringsalgoritm pä bilden, ur 10 vars - utgäng en komprimerad talsignal erhälls.
2. Förfarande för rekonstmering av en talsignal som komprimerats medelst ett förfarande i enlighet med patentkrav 1, kännetecknat av att - den komprimerade talsignalen leds tili ett organ som utför en dekomprimeringsal-15 goritm, vars utgäng utgörs av en bildmatris som presenterar ramama i frekvensplanet som en funktion av tiden, - ur bildmatrisen avskiljs ramama i frekvensplanet, - ramama leds tili en omvandlare som utför en frekvensplans/tidsplansomvandling, i vars utgäng de ramar som bildar talsignalen i tidsplanet erhälls. ; 20
3. Förfarande enligt patentkrav 2, kännetecknat av att tidsplans/frekvensplans- • ‘ · * omvandlaren är en omvandlare som utför en omvänd Fourier-omvandling. • ·
4. Förfarande enligt patentkrav 1, kännetecknat av att komprimeringsalgoritmen • ♦ :*·*. är en i och för sig känd JPEG (Joint Photographic Experts Group) och dekomprime- • I . · :·. ringsalgoritmen är en i och för sig känd IJPEG (Inverse JPEG). 25
5. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i ffekvens- :: planet bestär av separata real- och imaginärramar.
6. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i frekvens- : : planet bestär av separata amplitud- och fasramar.
7. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att ramen i ffekvens-•, .30 planet utgörs enbart av amplitudramar.
8. Förfarande enligt patentkrav 1, kännetecknat av att för generering av en tvä-dimensionell bildmatris används en halva av ramen i frekvensplanet. 110220 10
9. Förfarande enligt patentkrav 1 eller 3, kännetecknat av att antalet Fourier-omvandlingspunkter i ramen och antalet ramar som omvandlas är detsamma, varvid en kvadratisk bildmatris erhalls.
10. Anordning för att komprimera en talsignal, vilken anordning uppvisar 5. en A/D-omvandlare för att omvandla en talsignal till digital form, - första organ för att dela talsignalen i successiva ramar, samt - en första omvandlare, t.ex. en snabb Fourier-omvandlare som utför en tids-plans/frekvensplansomvandling, kännetecknad av att den omfattar 10. andra organ för att generera en tvädimensionell bildmatris av den första omvandla- rens utgängssignaler, - tredje organ som utför en komprimeringsalgoritm pä bildmatrisen, och - minnesorgan för lagring av mellan- och slutresultaten.
11. Anordning för rekonstruering av en talsignal som komprimerats med en an-15 ordning i enlighet med patentkrav 10, kännetecknad av att anordningen omfattar - fjärde organ som utför en dekomprimeringsalgoritm, - femte organ för att avskilja ramama i lrekvensplanet ffän den tvädimensionella bildmatrisen, - en andra omvandlare som utför en frekvensplans/tidsplansomvandling, 20. sjätte organ för att kombinera ramama i tidsplanet successivt, ;': ·: - en D/A-omvandlare för att omvandla en digital talsignal till analog form, samt ...: - minnesorgan för lagring av mellanresultaten.
: 12. Anordning enligt patentkrav 11, kännetecknad av att den andra omvandlaren 4 · 4 : *.· är en omvandlare som utför en snabb omvänd Fourier-omvandling. • « ·
13. Anordning enligt patentkrav 10 eller 11, kännetecknad av att de tredje orga- . . nen är organ som utför en JPEG-algoritm och de fjärde organen är organ som utför ;.. * en IJPEG-algoritm. • 4 4 4 4 4*4 4 4 4 4 4 4 4 4 4 » 4 I • 4
FI933182A 1993-07-13 1993-07-13 Komprimering och rekonstruering av talsignal FI110220B (sv)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FI933182A FI110220B (sv) 1993-07-13 1993-07-13 Komprimering och rekonstruering av talsignal
GB9414078A GB2280827B (en) 1993-07-13 1994-07-12 Compression and reconstruction of speech signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI933182A FI110220B (sv) 1993-07-13 1993-07-13 Komprimering och rekonstruering av talsignal
FI933182 1993-07-13

Publications (3)

Publication Number Publication Date
FI933182A0 FI933182A0 (fi) 1993-07-13
FI933182A FI933182A (fi) 1995-01-14
FI110220B true FI110220B (sv) 2002-12-13

Family

ID=8538313

Family Applications (1)

Application Number Title Priority Date Filing Date
FI933182A FI110220B (sv) 1993-07-13 1993-07-13 Komprimering och rekonstruering av talsignal

Country Status (2)

Country Link
FI (1) FI110220B (sv)
GB (1) GB2280827B (sv)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
GB2351889B (en) 1999-07-06 2003-12-17 Ericsson Telefon Ab L M Speech band expansion
DE19939387A1 (de) * 1999-08-19 2001-02-22 Siemens Ag Verfahren zum Kodieren von Audiosignalen, insbesondere von Sprach- und/oder Musiksignalen
AU2003262451B2 (en) * 1999-09-22 2006-01-19 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
CN1151485C (zh) * 2000-05-02 2004-05-26 莫绍祥 声音及节拍的图象显示方法和设备
US7574352B2 (en) 2002-09-06 2009-08-11 Massachusetts Institute Of Technology 2-D processing of speech
UA91827C2 (en) * 2006-09-29 2010-09-10 Общество С Ограниченной Ответственностью "Парисет" Method of multi-component coding and decoding electric signals of different origin
CN111768799B (zh) * 2019-03-14 2024-06-14 富泰华工业(深圳)有限公司 声音识别方法、装置、计算机装置及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4045616A (en) * 1975-05-23 1977-08-30 Time Data Corporation Vocoder system
IL79775A (en) * 1985-08-23 1990-06-10 Republic Telcom Systems Corp Multiplexed digital packet telephone system

Also Published As

Publication number Publication date
FI933182A0 (fi) 1993-07-13
GB2280827B (en) 1998-01-07
GB9414078D0 (en) 1994-08-31
FI933182A (fi) 1995-01-14
GB2280827A (en) 1995-02-08

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
KR100873836B1 (ko) Celp 트랜스코딩
US6493666B2 (en) System and method for processing data from and for multiple channels
US5091944A (en) Apparatus for linear predictive coding and decoding of speech using residual wave form time-access compression
US5623575A (en) Excitation synchronous time encoding vocoder and method
JP4142292B2 (ja) オーディオ信号の符号化効率を向上させる方法
EP2360682A1 (en) Audio packet loss concealment by transform interpolation
JPWO2007088853A1 (ja) 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
KR20010087391A (ko) 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성
FI119576B (sv) Talbehandlingsanordning och förfarande för behandling av tal, samt en digital radiotelefon
FI110220B (sv) Komprimering och rekonstruering av talsignal
JP3466080B2 (ja) デジタルデータの符号化/復号化方法及び装置
US5673364A (en) System and method for compression and decompression of audio signals
EP0954853B1 (en) A method of encoding a speech signal
US6141639A (en) Method and apparatus for coding of signals containing speech and background noise
US7164719B2 (en) System to reduce distortion due to coding with a sample-by-sample quantizer
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
WO1997016818A1 (en) Method and system for compressing a speech signal using waveform approximation
Najih et al. Speech compression using discreet wavelet transform
JP2796408B2 (ja) 音声情報圧縮装置
JP5491193B2 (ja) 音声コード化の方法および装置
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
Bakır Compressing English Speech Data with Hybrid Methods without Data Loss

Legal Events

Date Code Title Description
MA Patent expired