EP2329491B1

EP2329491B1 - Hybridspracherkennung

Info

Publication number: EP2329491B1
Application number: EP09810709.7A
Authority: EP
Inventors: Detlef Koll
Original assignee: Multimodal Technologies LLC; MULTIMODAL Tech LLC
Current assignee: MULTIMODAL TECHNOLOGIES LLC
Priority date: 2008-08-29
Filing date: 2009-08-31
Publication date: 2018-04-18
Anticipated expiration: 2029-08-31
Also published as: EP2329491A2; JP2013232001A; CA3002206A1; WO2010025440A2; CA2732255C; US20110238415A1; JP2012501480A; CA2732255A1; EP2329491A4; JP6113008B2; US7933777B2; US20100057450A1; US8249877B2; CA3002206C; US20120296644A1; WO2010025440A3

Claims

Computerimplementiertes Verfahren, das durch eine Client-Einrichtung (106) ausgeführt wird, wobei das Verfahren umfasst:
(A) Empfangen einer Anforderung von einem Anforderer, eine automatische Spracherkennung auf ein Audiosignal anzuwenden;

(B) Bereitstellen des Audiosignals an eine erste Maschine zur automatischen Spracherkennung in der Client-Einrichtung;

(C) Empfangen (322) von ersten Spracherkennungsergebnissen von der ersten Maschine zur automatischen Spracherkennung (112) zu einem ersten Zeitpunkt;

(D) Bereitstellen des Audiosignals an eine zweite Maschine zur automatischen Spracherkennung (120) in einer Server-Einrichtung (118);

(E) Bestimmen (324, 326), ob innerhalb eines vorbestimmten Zeitraums nach dem ersten Zeitpunkt zweite Spracherkennungsergebnisse durch die Client-Einrichtung von der zweiten Maschine zur automatischen Spracherkennung empfangen wurden;

(F) wenn die zweiten Spracherkennungsergebnisse durch die Client-Einrichtung innerhalb des vorbestimmten Zeitraums empfangen wurden, Bereitstellen (330) der zweiten Spracherkennungsergebnisse an den Anforderer in Reaktion auf die Anforderung; und

(G) wenn die zweiten Spracherkennungsergebnisse durch die Client-Einrichtung nicht innerhalb des vorbestimmten Zeitraums empfangen wurden, Bereitstellen (328) der ersten Spracherkennungsergebnisse an den Anforderer in Reaktion auf die Anforderung;
und wobei (E) das Auswählen des vorbestimmten Zeitraums auf Basis eines Typs der zweiten Spracherkennungsergebnisse umfasst.
Computerimplementiertes Verfahren nach Anspruch 1, wobei der vorbestimmte Zeitraum, der für zweite Spracherkennungsergebnisse eines Befehls- und-Steuerungsgrammatiktyps ausgewählt wird, kürzer ist als der vorbestimmte Zeitraum, der für zweite Spracherkennungsergebnisse eines Diktatgrammatiktyps ausgewählt wird.
Vorrichtung, umfassend:
Mittel zum Empfangen einer Anforderung von einem Anforderer, eine automatische Spracherkennung auf ein Audiosignal anzuwenden;

Mittel zum Bereitstellen des Audiosignals an eine erste Maschine zur automatischen Spracherkennung (112) in der Client-Einrichtung (106);

Mittel zum Empfangen von ersten Spracherkennungsergebnissen von der ersten Maschine zur automatischen Spracherkennung zu einem ersten Zeitpunkt;

Mittel zum Bereitstellen des Audiosignals an eine zweite Maschine zur automatischen Spracherkennung (120) in einer Server-Einrichtung (118);

Mittel zum Bestimmen, ob innerhalb eines vorbestimmten Zeitraums nach dem ersten Zeitpunkt zweite Spracherkennungsergebnisse durch die Client-Einrichtung von der zweiten Maschine zur automatischen Spracherkennung empfangen wurden;

Mittel zum Bereitstellen der zweiten Spracherkennungsergebnisse an den Anforderer in Reaktion auf die Anforderung, wenn die zweiten Spracherkennungsergebnisse durch die Client-Einrichtung innerhalb des vorbestimmten Zeitraums empfangen wurden; und

Mittel zum Bereitstellen der ersten Spracherkennungsergebnisse an den Anforderer in Reaktion auf die Anforderung, wenn die zweiten Spracherkennungsergebnisse durch die Client-Einrichtung nicht innerhalb des vorbestimmten Zeitraums empfangen wurden;

und wobei der vorbestimmte Zeitraum auf Basis eines Typs der zweiten Spracherkennungsergebnisse ausgewählt wird.
Vorrichtung nach Anspruch 3, wobei der vorbestimmte Zeitraum, der für zweite Spracherkennungsergebnisse eines Befehls- und- Steuerungsgrammatiktyps ausgewählt wird, kürzer ist als der vorbestimmte Zeitraum, der für zweite Spracherkennungsergebnisse eines Diktatgrammatiktyps ausgewählt wird.