EP1143417B1

EP1143417B1 - Verfahren zur Geschwindigkeitsmodifikation von Sprachsignalen, Verwendung des Verfahrens, und Anordnung zur Durchführung des Verfahrens

Info

Publication number: EP1143417B1
Application number: EP00610036A
Authority: EP
Inventors: Cecilia Brandel; Henrik Johannisson
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2000-04-06
Filing date: 2000-04-06
Publication date: 2005-12-28
Anticipated expiration: 2020-04-06
Also published as: DE60025158T2; EP1143417A1; ATE314719T1; DE60025158D1

Claims

Verfahren des Umsetzens der Sprachrate eines Sprachsignals (2) mit einer Grundperiode unterhalb einer maximal erwarteten Grundperiode, wobei das Verfahren die Schritte umfasst:

Aufteilen des Sprachsignals in Segmente,

Schätzen der Grundperiode (Tp) des Sprachsignals in einem Segment; und

Ausdehnen des Segmentes durch Replizieren eines Teils des Sprachsignals in dem Segment;

Verwenden einer Segmentgröße, die größer ist als die maximal erwartete Grundperiode aber kürzer als zweimal die maximal erwartete Grundperiode;

Kopieren eines Bruchteils des Sprachsignals in das Segment, wobei der Bruchteil eine Dauer gleich der geschätzten Grundperiode (Tp) hat;

Bereitstellen eines Zwischensignals (MWin; IWin) mit derselben Dauer von dem Bruchteil; und

Ausdehnen des Segmentes durch Einfügen des Zwischensignalabstands synchron in das Sprachsignal des Segmentes.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es ferner die Schritte umfasst:

Bereitstellen des Zwischensignals unter Verwendung des kopierten Bruchteils direkt als Zwischensignal, wenn die tatsächlich geschätzte Grundperiode des Segmentes größer als die Hälfte der Segmentgröße ist.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet., dass es ferner die Schritte umfasst:

Kopieren zweier aufeinanderfolgender Bruchteile, wobei jeder Bruchteil eine Dauer gleich der geschätzten Grundperiode hat, wenn die aktuell geschätzte Grundperiode des Segmentes geringer als die Hälfte der Segmentgröße ist, und

Bereitstellen des Zwischensignals als Mittelwert der beiden aufeinanderfolgenden Bruchteile.
Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass es ferner die Schritte umfasst:

Klassifizieren eines Segmentes des Sprachsignals als ein Stille-Segment, wenn der Inhalt der Sprachinformation unterhalb eines voreingestellten Schwellwerts liegt,

Kürzen eines Segmentes, wenn das Segment und eine Zahl von unmittelbar vorangehenden Segmenten als Stille-Segmente klassifiziert worden sind, um eine Expansion vorangehender Segmente zu kompensieren.
Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass eine Segmentgröße von 20 ms verwendet wird.
Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das Segment ausgedehnt wird durch mehrmaliges Einfügen des Zwischensignalabstands synchron in das Sprachsignal des Segmentes.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass ein Überlappungsfenster verwendet wird beim Kopieren des Bruchteils und Einfügen des Zwischensignals.
Verwendung des Verfahrens nach einem der Ansprüche 1 bis 7 in einem Mobiltelefon.
Einrichtung, angepasst zum Umsetzen der Sprachrate eines Sprachsignals (2) mit einer Grundperiode unterhalb einer maximal erwarteten Grundperiode, wobei die Einrichtung umfasst:

eine Vorrichtung (3) zum Aufteilen des Sprachsignals in Segmente;

eine Vorrichtung (8) zum Schätzen der Grundperiode (Tp) des Sprachsignals in einem Segment; und

eine Vorrichtung (9) zum Ausdehnen des Segmentes durch Replizieren eines Teils des Sprachsignals in dem Segment;

eine Vorrichtung (2) zum Auswählen einer Segmentgröße größer als die maximal erwartete Grundperiode, aber kürzer als zweimal die maximal erwartete Grundperiode;

eine Vorrichtung zum Kopieren eines Bruchteils des Sprachsignals in einem Segment, wobei der Bruchteil eine Dauer gleich der geschätzten Grundperiode (T_p) hat;

eine Vorrichtung zum Bereitstellen von dem Bruchteil, eines Zwischensignals (MWin; IWin) mit derselben Dauer; und

eine Vorrichtung (9) zum Ausdehnen des Segmentes durch Einfügen des Zwischensignalabstands synchron in das Sprachsignal des Segmentes.
Einrichtung nach Anspruch 9, dadurch gekennzeichnet, dass sie ferner angepasst ist, um, wenn die aktuell geschätzte Grundfrequenz des Segmentes größer als die Hälfte der Segmentgröße ist, das Zwischensignal durch Verwenden des kopierten Bruchteils direkt als Zwischensignal bereitzustellen.
Einrichtung nach Anspruch 9 oder 10, dadurch gekennzeichnet, dass sie ferner angepasst ist, um, wenn die aktuell geschätzte Grundperiode des Segmentes kleiner als die Hälfte der Segmentgröße ist, zwei aufeinanderfolgende Bruchteile, von denen jedes eine Dauer gleich der geschätzten Grundperiode hat, zu kopieren und das Zwischensignal als einen Durchschnittswert der beiden aufeinanderfolgenden Bruchteile bereitzustellen.
Einrichtung nach einem der Ansprüche 9 bis 11, dadurch gekennzeichnet, dass sie ferner eingerichtet ist, um:

ein Segment des Sprachsignals als ein Stille-Segment zu klassifizieren, wenn der Inhalt der Sprachinformation unterhalb eines voreingestellten Schwellwerts liegt;

ein Segment zu kürzen, wenn das Segment und eine Anzahl von unmittelbar vorhergehenden Segmenten als Stille-Segmente klassifiziert worden sind, um in Bezug auf eine Ausdehnung der vorhergehenden Segmente zu kompensieren.
Einrichtung nach einem der Ansprüche 9 bis 12, dadurch gekennzeichnet, dass sie angepasst ist, um eine Segmentgröße von 20 ms zu verwenden.
Einrichtung nach einem der Ansprüche 9 bis 13, dadurch gekennzeichnet, dass sie angepasst ist, um das Segment durch mehrmaliges Einfügen des Zwischensignalabstandes synchron in das Sprachsignal des Segmentes auszudehnen.
Einrichtung nach einem der Ansprüche 9 bis 14, dadurch gekennzeichnet, dass sie angepasst ist, um ein überlappendes Fenster zu verwenden beim Kopieren des Bruchteils und beim Einfügen des Zwischensignals.
Einrichtung nach einem der Ansprüche 9 bis 15, dadurch gekennzeichnet, dass die Einrichtung ein Mobiltelefon ist.
Einrichtung nach einem der Ansprüche 9 bis 15, dadurch gekennzeichnet, dass die Einrichtung eine integrierte Schaltung ist.