EP1501075B1

EP1501075B1 - Sprachsynthese mittels Verknüpfung von Sprachwellenformen

Info

Publication number: EP1501075B1
Application number: EP04077723A
Authority: EP
Inventors: Geert Coorman; Mario De Brock; Filip Deprez; Justin Fackrell; Steven Leys; Peter Rutten; Jan Demoortel; Andre Schenk; Bert Van Coile
Original assignee: Lernout and Hauspie Speech Products NV
Current assignee: Lernout and Hauspie Speech Products NV
Priority date: 1998-11-13
Filing date: 1999-11-12
Publication date: 2009-04-15
Anticipated expiration: 2019-11-12
Also published as: EP1501075A3; EP1501075A2

Claims

Sprachgenerator, welcher aufweist:
eine Sprachdatenbank (141), welche sich auf Sprachwellenformen bezieht;

ein Sprachwellenformauswahlglied (131), in Kommunikation mit der Sprachdatenbank, welches Wellenformen auswählt, auf welche durch die Datenbank Bezug genommen wird, wobei Designatoren bzw. Bezeichnungsglieder verwendet werden, welche einer phonetischen Umschreibungs- bzw. Lautschrift-Eingabe entsprechen; und

ein Sprachwellenform-Verkettungs- bzw. Verknüpfungsglied (151), in Kommunikation mit der Sprachdatenbank, welches Wellenformen verknüpft, welche von dem Sprachwellenformauswahlglied ausgewählt wurden, um eine Ausgabe eines Sprachsignals herzustellen,

wobei für wenigstens eine geordnete Folge einer ersten Wellenform und einer zweiten Wellenform, das Verknüpfungsglied einen Ort einer abfallenden Flanke der ersten Wellenform und einen Ort einer ansteigenden Flanke der zweiten Wellenform auswählt, wobei jeder Ort so ausgewählt wird, um eine Optimierung einer Phasenanpassung zwischen der ersten und der zweiten Wellenform herzustellen, basierend auf der Formähnlichkeit in Bereichen nahe den Orten, wobei eine Kreuzkorrelationstechnik benutzt wird.
Sprachgenerator nach Anspruch 1, wobei die Technik eine normierte Kreuzkorrelation ist.
Sprachgenerator nach einem der Ansprüche 1 und 2, wobei die Optimierung in einer Vielzahl aufeinanderfolgender Stufen bestimmt wird, wobei wenigstens ein nicht rechteckiges Fenster benützt wird.
Sprachgenerator nach einem der Ansprüche 1 und 2, wobei die Optimierung in einer Vielzahl aufeinanderfolgender Stufen bestimmt wird, wobei die Zeitauflösung, welche zu den ersten und zweiten Wellenformen gehört, nacheinander feiner gemacht wird.
Sprachgenerator nach Ansprüche 4, wobei die Reduzierung in der Zeitauflösung durch Verringern der Taktfolge in der Wellenformabtastung erreicht wird.