EP0402947B1

EP0402947B1 - Einrichtung und Verfahren zur Sprachkodierung mit Regular-Pulsanregung

Info

Publication number: EP0402947B1
Application number: EP19900111360
Authority: EP
Inventors: Yoshihiro C/O Nec Corporation Unno
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-06-14
Filing date: 1990-06-15
Publication date: 1997-11-26
Anticipated expiration: 2010-06-15
Also published as: EP0402947A3; DE69031749T2; EP0402947A2; DE69031749D1

Claims

Anordnung zur Codierung eines Sprachsignals unter Verwendung eines Regulär-Pulsanregungsschemas mit:
einer ersten Einrichtung (112, 114, 116), die dazu bestimmt ist, mit einem Diskretzeit-Sprachsignal versorgt zu werden und das Diskretzeit-Sprachsignal in mehrere Rahmen zu teilen;

einer zweiten Einrichtung (118, 124) zum Extrahieren mehrerer Parameter aus jedem der von der ersten Einrichtung übergebenen Rahmen;

Syntheseeinrichtung (122) zum Erzeugen eines Signals unter Verwendung der mehreren Parameter und einer Folge von Anregungsimpulsen;

einer dritten Einrichtung (120) zum Erzeugen eines Impulsantwortfunktionssignals unter Verwendung der mehreren Parameter;

einer vierten Einrichtung (126) zum Erzeugen eines Autokorrelationsfunktionssignals unter Verwendung des Impulsantwortfunktionssignals; und

einer fünften Einrichtung (128) zum Erzeugen eines Kreuzkorrelationsfunktionssignals unter Verwendung des Impulsantwortfunktionssignals und einer gewichteten Differenz zwischen einem der Rahmen des Diskretzeit-Sprachsignals und einem Rahmen des durch die Syntheseeinrichtung erzeugten Signals;
gekennzeichnet durch:
eine sechste Einrichtung (130) zum Erzeugen eines Rastersignals, das die Lage eines ersten Anregungsimpulses innerhalb eines Rahmens anzeigt, unter Verwendung des Kreuzkorrelationsfunktionssignals; und

eine siebente Einrichtung (132) zum Empfangen des Autokorrelationsfunktionssignals, des Kreuzkorrelationsfunktionssignals und des Rastersignals, wobei die siebente Einrichtung eine Amplitudenfolge der Anregungsimpulse innerhalb eines Rahmens bestimmt.
Anordnung nach Anspruch 1, wobei die zweite Einrichtung (118, 124) aufweist:
eine achte Einrichtung, die einen oder mehrere erste Parameter, die eine spektrale Hüllkurve darstellen, aus jedem der von der ersten Einrichtung übergebenen Rahmen extrahiert, die ersten Parameter codiert, die codierten ersten Parameter decodiert und die decodierten ersten Parameter erzeugt; und

eine neunte Einrichtung, die zweite und dritte Parameter aus jedem der von der ersten Einrichtung übergebenen Rahmen extrahiert, wobei die zweiten und dritten Parameter jeweils eine Tonhöhenperiode bzw. eine Tonhöhenverstärkung darstellen, wobei die neunte Einrichtung die codierten zweiten und dritten Parameter decodiert und die decodierten zweiten und dritten Parameter erzeugt,

wobei die decodierten ersten, zweiten und dritten Parameter an die dritte Einrichtung (120) übergeben werden.
Anordnung nach Anspruch 2, wobei die dritte Einrichtung (120) aufweist:
einen Impulsgenerator (400) zum Erzeugen eines Impulses;

ein Langzeit-Prädiktionsfilter (402), das den Impuls sowie die zweiten und dritten Parameter empfängt; und

ein Kurzzeit-Prädiktionsfilter (404), das in Reihe mit dem Langzeit-Prädiktionsfilter (402) geschaltet ist und die ersten Parameter und das Ausgangssignal des Langzeit-Prädiktionsfilters empfängt.
Verfahren zum Codieren eines Sprachsignals unter Verwendung eines Regulär-Pulsanregungsschemas mit den Schritten:
(a) Empfangen eines Diskretzeit-Sprachsignals und Teilen des Diskretzeit-Sprachsignals in mehrere Rahmen;

(b) Extrahieren mehrerer Parameter aus jedem der Rahmen des Diskretzeit-Sprachsignals;

(c) Erzeugen eines Signals unter Verwendung der mehreren Parameter und einer Folge von Anregungsimpulsen;

(d) Erzeugen eines Impulsantwortfunktionssignals unter Verwendung der mehreren Parameter;

(e) Erzeugen eines Autokorrelationsfunktionssignals unter Verwendung des Impulsantwortsignals; und

(f) Erzeugen eines Kreuzkorrelationsfunktionssignals unter Verwendung des Impulsantwortfunktionssignals und einer gewichteten Differenz zwischen einem der Rahmen des Diskretzeit-Sprachsignals und einem Rahmen des Signals;
gekennzeichnet durch:
(g) Erzeugen eines Rastersignals, das die Lage eines ersten Anregungsimpulses innerhalb eines Rahmens kennzeichnet, unter Verwendung des Kreuzkorrelationsfunktionssignals; und

(h) Empfangen des Autokorrelationsfunktionssignals, des Kreuzkorrelationsfunktionssignals und des Rastersignals und Bestimmen einer Amplitudenfolge der Anregungsimpulse innerhalb eines Rahmens.
Verfahren nach Anspruch 4, wobei der Schritt (b) die Schritte aufweist:
Extrahieren eines oder mehrerer erster Parameter, die eine spektrale Hüllkurve darstellen, aus jedem der Rahmen des Diskretzeit-Sprachsignals und Codieren der ersten Parameter, Decodieren der codierten ersten Parameter und Erzeugen der decodierten ersten Parameter; und

Extrahieren von zweiten und dritten Parametern aus jedem der Rahmen des Diskretzeit-Sprachsignals, wobei die zweiten und dritten Parameter jeweils eine Tonhöhenperiode bzw. eine Tonhöhenverstärkung darstellen, und Decodieren der codierten zweiten und dritten Parameter und Erzeugen der decodierten zweiten und dritten Parameter,

wobei die decodierten ersten, zweiten und dritten Parameter den mehreren Parametern in Schritt (d) entsprechen.
Verfahren nach Anspruch 5, wobei der Schritt (d) die Schritte aufweist:
Erzeugen eines Impulses;

Empfangen des Impulses sowie der zweiten und dritten Parameter und Erzeugen eines Ausgangssignals, das eine Tonhöhenstruktur darstellt; und

Empfangen der ersten Parameter und des Ausgangssignals, das eine Tonhöhenstruktur darstellt, und Erzeugen eines Ausgangssignals, das eine spektrale Hüllkurvencharakteristik darstellt.