EP1267330B1 - Erhöhung der Dichte von kodierten Sprachsignalen - Google Patents

Erhöhung der Dichte von kodierten Sprachsignalen Download PDF

Info

Publication number
EP1267330B1
EP1267330B1 EP02013526A EP02013526A EP1267330B1 EP 1267330 B1 EP1267330 B1 EP 1267330B1 EP 02013526 A EP02013526 A EP 02013526A EP 02013526 A EP02013526 A EP 02013526A EP 1267330 B1 EP1267330 B1 EP 1267330B1
Authority
EP
European Patent Office
Prior art keywords
output
sample values
signal
sparseness
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP02013526A
Other languages
English (en)
French (fr)
Other versions
EP1267330A1 (de
Inventor
Roar Hagen
Björn Johansson
Erik Ekudden
Bastiaan Kleijn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/034,590 external-priority patent/US6058359A/en
Priority claimed from US09/110,989 external-priority patent/US6029125A/en
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of EP1267330A1 publication Critical patent/EP1267330A1/de
Application granted granted Critical
Publication of EP1267330B1 publication Critical patent/EP1267330B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Definitions

  • the invention relates generally to speech coding and, more particularly, to the problem of sparseness in coded speech signals.
  • the 40 intermediate multiplication results produced by each of the remaining FIGURE 10 samples are assigned to positions in the FIGURE 11 result block in analogous fashion, and sample 1 of course needs no wrap around.
  • the 40 intermediate multiplication results assigned thereto are summed together, and that sum represents the convolution result for that position.
  • the present invention thus provides the capability of using the local characteristics of a given speech segment to determine whether and how much to modify the sparseness characteristic associated with that segment.
  • the convolution performed in the FIGURE 6 anti-sparseness filter can also be linear convolution, which provides smoother operation because blockwise processing effects are avoided.
  • blockwise processing is described in the above examples, such blockwise processing is not required to practice the invention, but rather is merely a characteristic of the conventional CELP speech encoder/decoder structure shown in the examples.
  • the gain g 1 can first be determined in one of the ways described above with respect to the gain of FIGURE 3, and then the gain factor g 2 can be determined as a function of gain factor g 1 .
  • gain factor g 2 can vary inversely with gain factor g 1 .
  • the gain factor g 2 can be determined in the same manner as the gain of FIGURE 3, and then the gain factor g 1 can be determined as a function of gain factor g 2 , for example g 1 can vary inversely with g 2 .
  • FIGURE 18 illustrates an exemplary method of providing anti-sparseness modification according to the invention.
  • the level of sparseness of the coded speech signal is estimated. This can be done off-line or adaptively during speech processing. For example, in algebraic codebooks and multi-pulse codebooks the samples may be close to each other or far apart, resulting in varying sparseness; whereas in a regular pulse codebook, the distance between samples is fixed, so the sparseness is constant.
  • a suitable level of anti-sparseness modification is determined. This step can also be performed off-line or adaptively during speech processing as described above. As another example of adaptively determining the anti-sparseness level, the impulse response (see FIGURES 6, 9 and 14) can be changed from block to block.
  • the selected level of anti-sparseness modification is applied to the signal.
  • an apparatus for reducing sparseness in an input digital signal may have the following elements.
  • a cellular telephone may comprise the apparatus in accordance with at least one of the 1) - 10).

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (13)

  1. Eine Decodervorrichtung zur Reduzierung einer Spärlichkeit in einem von einer Quelle (21) empfangenen digitalen spärlichen Eingangssignal (A), mit einer ersten Sequenz von Abtastwerten und einem Eingang zum Empfang des digitalen Eingangssignals;
    gekennzeichnet durch
    einen Anti-Spärlichkeitsoperator (ASO) mit einem mit dem Eingang gekoppelten Filter zum Filtern des digitalen Eingangssignals und zum Modifizieren eines Phasenspektrums desselben, wobei jedoch das Größenspektrum im wesentlichen unverändert bleibt, um ein digitales Ausgangssignals (B) zu erzeugen, das eine weitere Sequenz von Abtastwerten umfasst, wobei die weitere Sequenz von Abtastwerten eine größere Dichte von Nicht-Null-Abtastwerten als die erste Sequenz von Abtastwerten aufweist; und
    einen mit dem Anti-Spärlichkeitsoperator gekoppelten Ausgang, um von diesem das digitale Ausgangssignal zu empfangen.
  2. Eine Decodervorrichtung nach Anspruch 1, dadurch gekennzeichnet, dass der Anti-Spärlichkeitsoperator eine Schaltung (31, 33) zum Addieren eines rauschähnlichen Signals zum digitalen Eingangssignal (m(n)) umfasst.
  3. Eine Decodervorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass die Schaltung eine Summierschaltung (31) und einen Multiplizierer (33) umfasst, worin das rauschähnliche Signal mit einem Verstärkungsfaktor multipliziert wird, und wobei die Ausgabe des Multiplizierers an die Summierungsschaltung (31) angelegt wird, wo sie zu dem digitalen spärlichen Eingangssignal hinzuaddiert wird.
  4. Eine Decodervorrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Verstärkungsfaktor fest ist oder eine Funktion eines Parameters, der das Ausmaß einer Periodizität des digitalen Eingangssignals beschreibt.
  5. Eine Decodervorrichtung nach Anspruch 4, dadurch gekennzeichnet, dass der Filter einen Faltungsabschnitt (63) umfasst, der entweder eine zirkulare Faltung oder eine lineare Faltung verwendet, um jeweilige Blöcke von Abtastwerten in der ersten Sequenz von Abtastwerten zu filtern.
  6. Eine Decodervorrichtung zum Verarbeiten eines Rekonstruktionsinformationssignals, aus dem ein akustisches Signal rekonstruiert werden kann, umfassend: ein adaptives Codebuch (23), ein festes Codebuch (21), eine Summierschaltung (210) und ein Synthesefilter (211), wobei die Codebücher jeweilige Ausgänge aufweisen, die mit jeweiligen Eingängen der Summierschaltung gekoppelt sind, und wobei die Summierschaltung einen Ausgang aufweist, der mit einem Eingang des Synthesefilters gekoppelt ist, wobei das feste Codebuch auf das Rekonstruktionsinformationssignal anspricht, zur Erzeugung an seinem Ausgang eines digitalen Ausgabesignals, das eine erste Sequenz von Abtastwerten umfasst, gekennzeichnet durch einen Anti-Spärlichkeitsoperator (ASP) mit einem mit dem Ausgang des festen Codebuchs gekoppelten Eingang, der auf die erste Sequenz von Abtastwerten anspricht und ein Phasenspektrum davon modifiziert, jedoch ein Größenspektrum davon im wesentlichen unverändert belässt, zur Erzeugung einer zweiten Sequenz von Abtastwerten an seinem Ausgang mit einer größeren Dichte von Nicht-Null-Abtastwerten als die erste Sequenz von Abtastwerten.
  7. Eine Decodervorrichtung nach Anspruch 6, gekennzeichnet durch einen Multiplizierer (33), in dem ein rauschartiges Signal mit einem Verstärkungsfaktor multipliziert wird, und wobei die Ausgabe des Multiplizierers an die Summierschaltung (31) angelegt wird.
  8. Eine Decodervorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Verstärkungsfaktor fest ist oder eine Funktion der normalerweise an den Ausgang des adaptiven Codebuchs angelegten Verstärkung ist.
  9. Eine Decodervorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Verstärkungsfaktor 0 ist, wenn die adaptive Codebuchverstärkung einen vorgegebenen Schwellwert überschreitet, und linear ansteigt, wenn sich die adaptive Codebuchverstärkung von dem Schwellwert vermindert.
  10. Eine Decodervorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Verstärkungsfaktor 0 ist, wenn die feste Codebuchverstärkung einen vorgegebenen Schwellwert überschreitet, und linear ansteigt, wenn die feste Codebuchverstärkung sich vom Schwellwert aus vermindert.
  11. Eine Decodervorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Anti-Spärlichkeitsoperatoreingang, statt mit dem Ausgang des festen Codebuch gekoppelt zu sein, mit einem Ausgang der Summierschaltung (210) gekoppelt ist, um die zweite Sequenz von Abtastwerten zu erzeugen.
  12. Eine Decodervorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Anti-Spärlichkeitsoperator, statt mit dem Ausgang des festen Codebuchs gekoppelt zu sein, mit einem Ausgang des Synthesefilters gekoppelt ist, um die zweite Sequenz von Abtastwerten zu erzeugen.
  13. Ein Zellulartelefon mit der Decodervorrichtung nach mindestens einem der Ansprüche 1 bis 12.
EP02013526A 1997-09-02 1998-08-25 Erhöhung der Dichte von kodierten Sprachsignalen Expired - Lifetime EP1267330B1 (de)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US110989 1987-10-21
US5775297P 1997-09-02 1997-09-02
US57752P 1997-09-02
US09/034,590 US6058359A (en) 1998-03-04 1998-03-04 Speech coding including soft adaptability feature
US34590 1998-03-04
US09/110,989 US6029125A (en) 1997-09-02 1998-07-07 Reducing sparseness in coded speech signals
EP98940752A EP1008141B1 (de) 1997-09-02 1998-08-25 Erhöhung der dichte von kodierten sprachsignalen

Related Parent Applications (2)

Application Number Title Priority Date Filing Date
EP98940752.3 Division 1998-08-25
EP98940752A Division EP1008141B1 (de) 1997-09-02 1998-08-25 Erhöhung der dichte von kodierten sprachsignalen

Publications (2)

Publication Number Publication Date
EP1267330A1 EP1267330A1 (de) 2002-12-18
EP1267330B1 true EP1267330B1 (de) 2005-01-19

Family

ID=27443789

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02013526A Expired - Lifetime EP1267330B1 (de) 1997-09-02 1998-08-25 Erhöhung der Dichte von kodierten Sprachsignalen

Country Status (1)

Country Link
EP (1) EP1267330B1 (de)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JP3338074B2 (ja) * 1991-12-06 2002-10-28 富士通株式会社 音声伝送方式
JP3520555B2 (ja) * 1994-03-29 2004-04-19 ヤマハ株式会社 音声符号化方法及び音声音源装置
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms

Also Published As

Publication number Publication date
EP1267330A1 (de) 2002-12-18

Similar Documents

Publication Publication Date Title
EP1008141B1 (de) Erhöhung der dichte von kodierten sprachsignalen
RU2239239C2 (ru) Снижение разреженности в кодированных речевых сигналах
CA2347735C (en) High frequency content recovering method and device for over-sampled synthesized wideband signal
US6334105B1 (en) Multimode speech encoder and decoder apparatuses
EP0763818B1 (de) Verfahren und Filter zur Hervorbebung von Formanten
FI95086C (fi) Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
DE60012760T2 (de) Multimodaler sprachkodierer
NZ536237A (en) Method and device for pitch enhancement of decoded speech
US6301556B1 (en) Reducing sparseness in coded speech signals
EP1267330B1 (de) Erhöhung der Dichte von kodierten Sprachsignalen
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
RU2388069C2 (ru) Снижение разреженности в кодированных речевых сигналах
MXPA00001837A (en) Reducing sparseness in coded speech signals
US6606591B1 (en) Speech coding employing hybrid linear prediction coding
GB2341299A (en) Suppressing noise in a speech communications unit
MXPA96002142A (en) Speech classification with voice / no voice for use in decodification of speech during decorated by quad

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AC Divisional application: reference to earlier application

Ref document number: 1008141

Country of ref document: EP

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT

17P Request for examination filed

Effective date: 20030327

AKX Designation fees paid

Designated state(s): DE FR GB IT

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL)

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AC Divisional application: reference to earlier application

Ref document number: 1008141

Country of ref document: EP

Kind code of ref document: P

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB IT

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

REF Corresponds to:

Ref document number: 69828709

Country of ref document: DE

Date of ref document: 20050224

Kind code of ref document: P

REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1051082

Country of ref document: HK

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

ET Fr: translation filed
26N No opposition filed

Effective date: 20051020

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 19

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20170825

Year of fee payment: 20

Ref country code: DE

Payment date: 20170829

Year of fee payment: 20

Ref country code: IT

Payment date: 20170823

Year of fee payment: 20

Ref country code: GB

Payment date: 20170829

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 69828709

Country of ref document: DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20180824

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20180824