DE102006045719A1 - Medizinisches System mit einer Spracheingabevorrichtung - Google Patents

Medizinisches System mit einer Spracheingabevorrichtung Download PDF

Info

Publication number
DE102006045719A1
DE102006045719A1 DE102006045719A DE102006045719A DE102006045719A1 DE 102006045719 A1 DE102006045719 A1 DE 102006045719A1 DE 102006045719 A DE102006045719 A DE 102006045719A DE 102006045719 A DE102006045719 A DE 102006045719A DE 102006045719 A1 DE102006045719 A1 DE 102006045719A1
Authority
DE
Germany
Prior art keywords
vocabulary
key
speech
record
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102006045719A
Other languages
English (en)
Other versions
DE102006045719B4 (de
Inventor
Sonja Auer
Philipp Quaet-Faslem
Anton Schraufstetter
Birgit Schuster
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthcare GmbH
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102006045719A priority Critical patent/DE102006045719B4/de
Publication of DE102006045719A1 publication Critical patent/DE102006045719A1/de
Application granted granted Critical
Publication of DE102006045719B4 publication Critical patent/DE102006045719B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B17/00Surgical instruments, devices or methods, e.g. tourniquets
    • A61B2017/00017Electrical control of surgical instruments
    • A61B2017/00203Electrical control of surgical instruments with speech control or speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

Die Erfindung betrifft ein medizinisches System mit einer medizinischen Vorrichtung, welche ausgebildet ist, ein Objekt in wenigstens zwei Dimensionen zu erfassen. Das medizinische System weist eine mit der medizinischen Vorrichtung wirkverbundene Benutzerschnittstelle auf, wobei die Benutzerschnittstelle ausgebildet ist, ein Steuersignal zum Steuern der medizinischen Vorrichtung in Abhängigkeit von einer Benutzerinteraktion zu erzeugen und das Steuersignal an die medizinische Vorrichtung zu senden. Die Benutzerschnittstelle weist eine Spracheingabeeinheit auf, welche ausgebildet ist, Sprache repräsentierenden Schall zu erfassen und einen den Schall repräsentierenden Sprach-Datensatz zu erzeugen. Die Spracheingabeeinheit ist ausgebildet, den Sprach-Datensatz zu interpretieren und das Steuersignal in Abhängigkeit von dem Interpretationsergebnis zu erzeugen. Die Spracheingabeeinheit weist ein Trainingsmodul auf, welches ausgebildet ist, ein Anpassen der Spracheingabeeinheit an einen individuellen Benutzer in Abhängigkeit von einem Trainingssteuersignal zu steuern, wobei das Trainingsmodul ausgebildet ist, den Sprach-Datensatz zu interpretieren und in Abhängigkeit von dem Interpretationsergebnis das Trainingssteuersignal zu erzeugen.

Description

  • Die Erfindung betrifft ein medizinisches System mit einer medizinischen Vorrichtung, welche ausgebildet ist, ein Objekt in wenigstens zwei Dimensionen zu erfassen. Das medizinische System weist eine mit der medizinischen Vorrichtung wirkverbundene Benutzerschnittstelle auf, wobei die Benutzerschnittstelle ausgebildet ist, ein Steuersignal zum Steuern der medizinischen Vorrichtung in Abhängigkeit von einer Benutzerinteraktion zu erzeugen und das Steuersignal an die medizinische Vorrichtung zu senden. Die Benutzerschnittstelle weist eine Spracheingabeeinheit auf, welche ausgebildet ist, Sprache repräsentierenden Schall zu erfassen und einen den Schall repräsentierenden Sprach-Datensatz zu erzeugen. Die Spracheingabeeinheit ist ausgebildet den Sprach-Datensatz zu interpretieren und das Steuersignal in Abhängigkeit von dem Interpretationsergebnis zu erzeugen. Die Spracheingabeeinheit weist ein Trainingsmodul auf, welches ausgebildet ist, ein Anpassen der Spracheingabeeinheit an einen individuellen Benutzer in Abhängigkeit von einem Trainingssteuersignal zu steuern.
  • Bei aus dem Stand der Technik bekannten medizinischen Systemen mit einer Benutzerschnittstelle, welche eine Spracheingabeeinheit aufweist, ist ein Trainingsmodul der Spracheingabeeinheit mit einer von Hand bedienbaren Benutzerschnittstelle derart wirkverbunden, dass das Trainingsmodul während einem ersten Adaptieren an einen Sprecher mittels der von Hand bedienbaren Benutzerschnittstelle, beispielsweise einer Tastatur oder einem schwenkbar gelagerten Steuerelement, gesteuert werden kann.
  • Die der Erfindung zugrunde liegende Aufgabe ist es, ein medizinisches System mit einer medizinischen Vorrichtung und einer Spracheingabevorrichtung anzugeben, welche eine verbesserte, einfach zu bedienende Benutzerschnittstelle aufweist.
  • Diese Aufgabe wird durch ein medizinisches System der eingangsgenannten Art gelöst, wobei das Trainingsmodul ausgebildet ist, den Sprach-Datensatz zu interpretieren und in Abhängigkeit von dem Interpretationsergebnis das Trainingssteuersignal zu erzeugen.
  • Bei diesen medizinischen Vorrichtungen kann ein Benutzer, insbesondere der Arzt vorteilhaft die Spracheingabeeinheit zum Adaptieren seiner Sprache mittels des Trainingsmoduls nutzen. Auf diese Weise ist der Benutzer nicht darauf angewiesen, seine Hände zum Steuern des Trainingsmoduls mittels einer von Hand zu bedienenden Benutzerschnittstelle zu verwenden. Der Benutzer hat dadurch vorteilhaft seine Hände frei, um beispielsweise mit seinen Händen an einem Patienten zu arbeiten.
  • Beispielhafte Ausführungsformen für ein medizinisches System sind ein Computer-Tomograph, ein Magnet-Resonanz-Tomograph, eine Röntgen-Erfassungsvorrichtung oder eine Ultraschall-Erfassungsvorrichtung.
  • Die Spracheingabeeinheit kann vorteilhaft ein Mikrophon zum Erfassen von Luftschall und Erzeugen eines den erfassten Luftschall repräsentierenden Mikrophonsignals aufweisen. Die Spracheingabeeinheit kann weiter einen mit dem Mikrophon mindestens mittelbar verbundenen Analog-Digitalwandler aufweisen, welcher ausgebildet ist, das Mikrophonsignal Zeitabschnittsweise insbesondere durch Abtasten zu erfassen ausgangsseitig einen das Mikrophonsignal repräsentierenden Sprach-Datensatz zu erzeugen. Die Spracheingabeeinheit kann den Sprach-Datensatz derart interpretieren, dass die Spracheingabeeinheit den Sprach-Datensatz mit vorrätig gehaltenen Vokabel-Datensätzen vergleichen kann und als Vergleichsergebnis einen Ähnlichkeitsparameter erzeugen kann. Die Spracheingabeeinheit kann ausgebildet sein, in Abhängigkeit von dem Ähnlichkeitsparameter ein dem Vokabel-Datensatz entsprechendes Steuersignal, insbesondere ein Trainingssteuersignal zu erzeugen. Dazu kann die Spracheingabeeinheit mit einem Spei cher für eine Vielzahl von vorbestimmten Vokabel-Datensätzen aufweisen, welche jeweils gesprochene Sprache repräsentieren. In einer bevorzugten Ausführungsform ist das Trainingsmodul ausgebildet, das Interpretieren des Sprach-Datensatzes mittels vorbestimmte vorrätig gehaltenen Trainings-Vokabel-Datensätzen durchzuführen. Die Trainings-Vokabel-Datensätze können in dem Speicher abgespeichert sein, in welchem die Vokabel-Datensätze abgespeichert sind oder in einem gesondert für diese vorgesehenen Speicher abgespeichert sein.
  • In einer bevorzugten Ausführungsform sind die Trainings-Vokabel-Datensätze durch jeweils zueinander verschiedene Key-Vokabel-Datensätze und Subkey-Vokabel-Datensätze gebildet. Die Key-Vokabel-Datensätze repräsentieren jeweils ein Schlüsselwort, wobei die repräsentierten Schlüsselworte jeweils zueinander verschieden sind. Für jedes Schlüsselwort ist wenigstens ein Subkey-Vokabel-Datensatz, bevorzugt mehrere Subkey-Vokabel-Datensätze vorrätiggehalten, wobei der wenigstens eine Subkey-Vokabel-Datensatz zu demselben Key-Vokabel-Datensatz zugeordnet ist. Bei wenigstens zwei Subkey-Vokabel-Datensätzen repräsentieren die Subkey-Vokabel-Datensätze jeweils zueinander und zu dem zugeordeneten Key-Vokabel-Datensatz verschiedene Aussprachen desselben, durch den zugeordneten Key-Vokabel-Datensatz repräsentierten Schlüsselworts.
  • Die Trainings-Vokabel-Datensätze repräsentieren bevorzugt in ihrer Gesamtheit ein reduziertes Vokabular, welches derart gewählt ist, dass ein sicheres Zuordnen von zueinander verschiedenen Sprechern gesprochenen Sprach-Datensätzen erfolgen kann.
  • In einer bevorzugten Ausführungsform des medizinischen Systems repräsentieren die Key-Vokabel-Datensätze jeweils derart zueinander verschiedene Schlüsselworte, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind. Dadurch kann vorteilhaft ein sicheres Interpretieren, insbesondere ein Zuordnen in Abhängigkeit ei nes Ähnlichkeitsparameters erfolgen. Die Spracheingabeeinheit kann ausgebildet sein, das Interpretieren, insbesondere das Zuordnen in Abhängigkeit von einem Ähnlichkeitsparameter Sprach-Datensatz-abschnittsweise durchzuführen.
  • Dazu kann die Spracheingabeeinheit vorteilhaft ein Analysemodul aufweisen, welches beispielsweise einen Formant-Analysator aufweisen kann, welcher ausgebildet ist, einen zeitlichen Abschnitt eines Sprach-Datensatzes mittels Formantanalyse einem entsprechenden klingenden Vokal zuzuordnen. Das Zuordnen kann gemäß einer vorbestimmten Zuordnungsvorschrift, bevorzugt gemäß einer Look-Up-Tabelle erfolgen. Einer Formantanalyse kann dabei die Erkenntnis zugrunde liegen, dass ein von einer menschlichen Stimme erzeugter Vokal eine Grundfrequenz und zu der Grundfrequenz entsprechende Oberwellen aufweist. Die Oberwellen zu der Grundfrequenz werden Formanten genannt, welche in Abhängigkeit von einem gesprochenen klingenden Vokal zueinander verschieden sind. Beispielhafte gesprochene Vokale sind ein „U" wie "Ulrich", „O" wie "oder", "o" wie "offen", „Ä" wie "ändern", „E" wie "Emil", und „I" wie "Ida". Die vorab genannten beispielhaften gesprochenen Vokale weisen jeweils zueinander verschiedene Formanten und/oder Formantanteile auf.
  • In einer bevorzugten Ausführungsform des medizinischen Systems repräsentieren die Key-Vokabel-Datensätze jeweils derart zueinander verschiedene Schlüsselworte, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind, wobei Key-Vokabel-Datensätze, welche jeweils Schlüsselworte mit einem zueinander identisch klingenden Vokal repräsentieren, durch wenigstens einen repräsentierten Sprenglaut und/oder wenigstens einen repräsentierten Zischlaut voneinander verschieden sind. Dadurch kann vorteilhaft ein sicheres Interpretieren der Key-Vokabel-Datensätze erfolgen.
  • In einer beispielhaften Ausführungsform sind die folgenden Schlüsselworte jeweils durch einen Key-Vokabel-Datensatz repräsentiert:
    "Adaptation"
    "Artis"
    "Change Profile"
    "Profile Up"
    "Profile Down"
    "Select Profile"
    "Volume Adaptation"
    "Voice Adaptaion"
    "Command Training"
    "Close Adaptation"
    "Page Up"
    "Page Down"
    "Line Up"
    "Line Down"
    "Select"
    "Start Training"
    "Train All".
  • In einer vorteilhaften Ausführungsform ist die Spracheingabevorrichtung ausgebildet, das Anpassen an den individuellen Sprecher mit wenigstens zwei Anpassungsstufen durchzuführen, wobei die Spracheingabevorrichtung ausgebildet ist, bei nicht erfolgreicher Durchführung einer Anpassungsstufe wenigstens eine Anpassungsstufe wenigstens teilweise in Abhängigkeit von einem zeitlichen Ablauf eines insbesondere vorbestimmten Zeitintervalls zu wiederholen. Auf diese Weise kann einem Benutzer des medizinischen Systems vorteilhaft ein Interagieren abgenommen werden. Der Benutzer braucht im Falle eines fehlerhaften Erkennens nur den zeitlichen Ablauf des Zeitintervalls abzuwarten, nach welchem eine Anpassungsstufe oder eine vorige Anpassungsstufe erneut gestartet wird.
  • Die Erfindung betrifft auch ein Verfahren zum Steuern einer medizinischen Vorrichtung mit einer Spracheingabevorrichtung mittels gesprochener Sprache, wobei die medizinische Vorrichtung zum Erfassen eines Objekts in wenigstens zwei Dimensio nen ausgebildet ist, umfassend folgende Schritte zum Anpassen der Spracheingabevorrichtung an einen individuellen Sprecher:
    • – Starten der Spracheingabevorrichtung zum Anpassen an den individuellen Sprecher durch Erfassen von gesprochener Sprache und Erzeugen eines die gesprochene Sprache repräsentierenden Sprach-Datensatzes;
    • – Interpretieren der erfassten gesprochenen Sprache und Erzeugen eines Interpretationsergebnisses;
    • – Steuern des Anpassens in Abhängigkeit von dem Interpretationsergebnis.
  • In einer vorteilhaften Ausführungsform des Verfahrens erfolgt das Anpassen der Spracheingabevorrichtung an den individuellen Sprecher stufenweise, insbesondere umfassend wenigstens zwei Anpassungsstufen. Beispielhafte Anpassungsstufen sind das Anpassen an einen Lautstärkepegel der erfassten Sprache, insbesondere ein Aussteuern eines Analog-Digitalwandlers, ein Anpassen an eine Sprachcharakteristik oder ein Anpassen an eine ähnlichste abgespeicherte Aussprache.
  • In einer bevorzugten Ausführungsform umfasst das Verfahren den Schritt:
    • – Steuern der Spracheingabevorrichtung bei fehlerhaftem Interpretieren mittels Zeitintervall-Unterbrechens derart, dass wenigstens eine Anpassungsstufe in Abhängigkeit von einem zeitlichen Ablauf eines vorbestimmten Zeitintervalls wenigstens teilweise wiederholt wird.
  • In einer bevorzugten Ausführungsform umfasst das Verfahren die Schritte:
    • – Vorrätighalten von Trainigs-Vokabel-Datensätzen, umfassend Key-Vokabel-Datensätze, wobei die Key-Vokabel-Datensätze jeweils derart zueinander verschiedene Schlüsselworte repräsen tieren, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind;
    • – Interpretieren der Sprach-Datensätze durch Vergleichen mit den Trainings-Vokabel-Datensätzen und erzeugen des Interpretationsergebnisses insbesondere in Abhängigkeit von einem Ähnlichkeitsparameter.
  • In einer weiter bevorzugten Ausführungsform sind Key-Vokabel-Datensätze, welche jeweils Schlüsselworte mit einem zueinander identisch klingenden Vokal repräsentieren, durch wenigstens einen repräsentierten Sprenglaut und/oder wenigstens einen Zischlaut voneinander verschieden.
  • Unabhängig von einem medizinischen System mit einer medizinischen Vorrichtung kann eine Benutzerschnittstelle eines technischen Systems mit einer Spracheingabeeinheit der vorbeschriebenen Art mit einer beliebigen zu steuernden technischen Vorrichtung anstelle einer medizinischen Vorrichtung verbunden sein.
  • Ein technisches System weist dann die Benutzerschnittstelle mit der Spracheingabeeinheit und eine mit der Benutzerschnittstelle verbundene technische Vorrichtung auf.
  • Die Erfindung wird nun im Folgenden anhand von Figuren und weiteren Ausführungsbeispielen erläutert.
  • 1 zeigt schematisch ein Ausführungsbeispiel für ein medizinisches System, welches ausgebildet ist, ein Anpassen einer Spracheingabevorrichtung mittels gesprochener Sprache durchzuführen;
  • 2 zeigt ein Ausführungsbeispiel für ein Verfahren zum Steuern einer medizinischen Vorrichtung zum Erfassen eines Objekts wenigstens zwei Dimensionen mittels gesprochener Sprache.
  • 1 zeigt schematisch ein Ausführungsbeispiel für ein medizinisches System 1. Das medizinische System 1 umfasst eine medizinische Vorrichtung 3, beispielsweise eine Röntgen-Erfassungsvorrichtung. Die medizinische Vorrichtung 3 weist einen Eingang 4 zum Empfangen eines Steuersignals auf und ist ausgebildet, in Abhängigkeit des Steuersignals ein Objekt in zwei Dimensionen zu erfassen und/oder ein Erfassungsergebnis zu erzeugen.
  • Das medizinische System 1 weist auch eine Benutzerschnittstelle 5 auf. Die Benutzerschnittstelle 5 weist eine Spracheingabeeinheit 7 mit einer Verarbeitungseinheit 9 auf. Die Verarbeitungseinheit 9 weist ein Trainingsmodul 11 auf.
  • Die Spracheingabeeinheit 7 weist einen Speicher 13 und einen Speicher 15 auf. Der Speicher 13 und der Speicher 15 können zusammen durch einen gemeinsamen Speicher gebildet sein. Der Speicher 13 ist zum Vorrätighalten von einer Vielzahl von Vokabel-Datensätzen ausgebildet, von denen ein Vokabel-Datensatz 17 beispielhaft bezeichnet ist. Der Speicher 15 ist zum Vorrätighalten von Key-Vokabel-Datensätzen und Subkey-Vokabel-Datensätzen ausgebildet, von denen die Key-Vokabel-Datensätze 19 und 22 und Subkey-Vokabel-Datensätze 20 und 21 des Key-Vokabel-Datensatzes 19 beispielhaft bezeichnet sind.
  • Die Spracheingabeeinheit 7 weist auch einen Analog-Digitalwandler 24 und ein Mikrophon 26 auf. Der Analog-Digitalwandler 24 ist eingangsseitig über eine Verbindungsleitung 36 mit dem Mikrophon 26 verbunden und ausgangsseitig über eine Verbindungsleitung 38 mit der Verarbeitungseinheit 9 verbunden. Die Benutzerschnittstelle 5 weist auch eine Eingabeeinheit 28 mit einer Bildwiedergabeeinheit und einer berührungsempfindlichen Oberfläche 30 auf.
  • Die medizinische Vorrichtung 3 ist über eine Verbindungsleitung 50 ausgangsseitig mit einer Bildwiedergabeeinheit 34 verbunden und ist ausgebildet, ein Erfassungsergebnis eines – insbesondere mittels Röntgenstrahlen – erfassten Objekts mittels der Bildwiedergabeeinheit 34 sichtbar wiederzugeben. Die Verarbeitungseinheit 9 ist über eine bidirektionale Verbindungsleitung 40 mit dem Speicher 13 und über eine bidirektionale Verbindungsleitung 42 mit dem Speicher 15 verbunden. Die bidirektionalen Verbindungsleitungen 40 und 42 können jeweils als Datenbus ausgebildet sein. Die Verarbeitungseinheit 9 ist auch ausgangsseitig über eine Verbindungsleitung 46 mit der Eingabeeinheit 28 und ausgangsseitig über eine Verbindungsleitung 52 mit der Bildwiedergabeeinheit 34 verbunden. Die Verarbeitungseinheit 9 ist eingangsseitig über eine Verbindungsleitung 44 mit der berührungsempfindlichen Oberfläche 30 verbunden. Die Verarbeitungseinheit 9 ist auch ausgangsseitig über eine Verbindungsleitung 52 mit dem Eingang 4 der medizinischen Vorrichtung 3 verbunden und kann über die Verbindungsleitung 52 ein Steuersignal zum Steuern der medizinischen Vorrichtung 3 ausgeben.
  • Die Funktionsweise des medizinischen Systems 1 wird nun im Folgenden erläutert:
    Das Mikrophon 26 ist ausgebildet, einen Luftschall, beispielsweise gesprochene Sprache repräsentierenden Luftschall zu erfassen und ein Mikrophonsignal zu erzeugen, welches den erfassten Luftschall repräsentiert und dieses ausgangsseitig über die Verbindungsleitung 36 ausgeben. Der Analog-Digitalwandler 24 kann das Mikrophonsignal eingangsseitig empfangen und insbesondere gemäß einer vorbestimmten Abtastrate abtasten und eine zeitliche Folge von Abtastwerten erzeugen, wobei jeder Abtastwert einen Amplitudenwert des Mikrophonsignals zu einem Abtastzeitpunkt repräsentiert. Der Analog-Digitalwandler kann einen Sprach-Datensatz erzeugen, welcher wenigstens einen Teil der Abtastwerte repräsentiert. Der Analog-Digitalwandler 24 kann den Sprach-Datensatz über die Verbindungsleitung 38 an die Verarbeitungseinheit 9 senden. Die Verarbeitungseinheit 9 kann in Abhängigkeit von einem Empfangen eines Sprach-Datensatzes das Trainingsmodul 11 starten. In einer anderen Ausführungsform des medizinischen Systems kann die Verarbeitungseinheit 9 das Trainingsmodul in Abhängigkeit von einem Empfangen eines Sprach-Datensatzes o der in Abhängigkeit von einem über die Verbindungsleitung empfangenen Benutzerinteraktionssignal starten.
  • Die berührungsempfindliche Oberfläche 30 der Eingabeeinheit 28 ist ausgebildet, in Abhängigkeit von einem Berühren – beispielsweise durch eine Benutzerhand 60 – ein Benutzerinteraktionssignal zu erzeugen, welches den Ort des Berührens der berührungsempfindlichen Oberfläche 30 repräsentiert. Das Trainingsmodul 11 kann aus dem Speicher 15 ein oder mehrere Key-Vokabel-Datensätze, beispielsweise den Key-Vokabel-Datensatz 19 und 22 auslesen und den Sprach-Datensatz mittels einer Zuordnungseinheit 10 der Verarbeitungseinheit 9 einem Key-Vokabel-Datensatz zuordnen, welcher dem Sprach-Datensatz am ähnlichsten ist. Dazu kann die Zuordnungseinheit 10 beispielsweise für jeden Zuordnungsversuch einen Ähnlichkeitsparameter erzeugen, welcher eine Ähnlichkeit zwischen dem Sprach-Datensatz und einem insbesondere durch Vergleich ermittelten Key-Vokabel-Datensatz repräsentiert. Die Zuordnungseinheit 10 kann das Ermitteln beispielsweise mittels Korrelationsanalyse durchführen. Die Korrelationsanalyse kann beispielsweise eine Formant-Analyse, eine Sprenglaut-Analyse oder Zischlaut-Analyse miteinschließen. Die Verarbeitungseinheit 9 kann in Abhängigkeit von dem Zuordnungsergebnis ein Sprachtraining starten und beispielsweise nach erfolgreichem Durchführen ein Trainingsergebnis erzeugen und dieses – für einen individuellen Benutzer – als Benutzer-Datensatz 23 über eine Verbindungsleitung 51 in einem Speicher 14 abspeichern. Die Verarbeitungseinheit 9 kann über die Verbindungsleitung 51 mit dem Speicher 14 verbunden sein. Das Trainingsmodul 11 kann Trainingsschritte, beispielsweise ein Anpassen eines Lautstärkepegels, ein Anpassen an eine individuelle, benutzerspezifische Aussprache, oder an benutzerspezifische Sprachcharakteristika durchführen. Die Trainingseinheit 11 kann dazu erforderliche Benutzerinteraktionsschritte zum Kommunizieren mit dem Benutzer mittels Spracheingabe durchführen. Die Key-Vokabel-Datensätze 19 und 22 können jeweils zueinander verschiedene Schlüsselworte repräsentieren. Die Subkey-Vokabel-Datensätze 20 und 21 können jeweils zueinander verschiedene Aussprachen des durch den Key-Vokabel-Datensatz 19 repräsentierten Schlüsselworts repräsentieren. Das Trainingsmodul 11 kann daher ein Zuordnen eines empfangenen Sprach-Datensatzes mit einem Key-Vokabel-Datensatz, beispielsweise dem Key-Vokabel-Datensatz 19 alternativ mit dem Subkey-Vokabel-Datensatz 20 oder 21 durchführen.
  • Dargestellt ist auch ein in dem Speicher 14 vorrätig gehaltener für einen individuellen Benutzer erzeugter Benutzer-Datensatz 23. Die Verarbeitungseinheit 9 der Spracheingabeeinheit 7 kann beispielsweise zum Steuern der medizinischen Vorrichtung 3 mittels Spracheingabe einen durch den Benutzer-Datensatz 23 repräsentierten Ähnlichkeitsparameter zugrunde legen. Die Verarbeitungseinheit 9 kann beispielsweise zum Durchführen eines Trainings mittels des Trainingsmoduls 11 ein Bildsignal erzeugen, welches ein Benutzermenü mit Benutzungsoptionen repräsentiert und dieses ausgangsseitig über die Verbindungsleitung 52 an die Bildwiedergabeeinheit 34 senden.
  • Beispielsweise kann die Spracheingabeeinheit 7 zusätzlich zu einem Sprach-Datensatz ein Benutzerinteraktionssignal über die Verbindungsleitung 44 zum Starten eines Trainings mittels des Trainingsmoduls 11 empfangen. Auf diese Weise kann ein Benutzer zusätzlich zu einer Spracheingabe mittels Berühren der berührungsempfindlichen Oberfläche 30 die Spracheingabeeinheit 7 steuern.
  • Zu einem Bedienen der medizinischen Vorrichtung 3 mittels der Spracheingabeeinheit 7 kann mittels des Mikrophons 26 und des Analog-Digitalwandlers 24 ein Sprach-Datensatz erzeugt werden, welcher eine gesprochene Vokabel repräsentiert. Die Verarbeitungseinheit 9 kann aus dem Speicher 13 einen Vokabel-Datensatz, beispielsweise den Vokabel-Datensatz 7, über die Verbindungsleitung 40 auslesen und mittels der Zuordnungseinheit 10 und dem aus dem Speicher 14 ausgelesenen Benutzer-Datensatz 23 ein Zuordnen des Sprach-Datensatzes zu einem ausgelesenen Vokabel-Datensatz in Abhängigkeit von einem Ähn lichkeitsparameter durchführen. Die Verarbeitungseinheit 9 kann daraufhin ein Steuersignal erzeugen, welches dem ähnlichsten Vokabel-Datensatz entspricht und dieses ausgangsseitig über die Verbindungsleitung 52 an den Eingang 4 und somit an die medizinische Vorrichtung 3 senden. Eine Zuordnung von einem Steuersignal zu einem Vokabel-Datensatz kann durch die Benutzerschnittstelle mittels einer Look-Up-Tabelle erfolgen.
  • Die medizinische Vorrichtung 3 kann so mittels Spracheingabe gesteuert werden. Die Verarbeitungseinheit 9 kann auch ausgebildet sein, das Anpassen an den individuellen Sprecher mit wenigstens zwei Anpassungsstufen durchzuführen, eine Anpassungsstufe kann beispielsweise ein Anpassen an einen Lautstärkepegel, insbesondere ein Aussteuerpegel für den Analog-Digitalwandler, oder ein Anpassen an eine Sprachcharakteristik oder eine individuelle Aussprache sein.
  • Die Verarbeitungseinheit 9 kann dabei ausgebildet sein, das Anpassen, insbesondere ein Wechsel in eine andere Anpassungsstufe oder ein Wiederholen einer Anpassungsstufe oder eines Schrittes einer Anpassungsstufe, in Abhängigkeit von einem zeitlichen Ablauf eines Zeitintervalls durchzuführen. Eine Zeitintervalldauer kann beispielsweise in Abhängigkeit von einem Ereignis erzeugt werden. Beispielsweise kann die Zeitintervalldauer in Abhängigkeit einer Häufigkeit des fehlerhaften Interpretierens länger oder kürzer sein. Die Zeitintervalldauer kann vorbestimmt, insbesondere abgespeichert sein.
  • 2 zeigt ein Ausführungsbeispiel für ein Verfahren zum Steuern einer medizinischen Vorrichtung zum Erfassen eines Objekts wenigstens zwei Dimensionen mittels gesprochener Sprache. Bei einem Startschritt 76 kann ein Anpassen einer Spracheingabevorrichtung an einen individuellen Sprecher gestartet werden. In einer Verfahrensstufe 78, umfassend wenigstens einen Verfahrensschritt, kann ein individuelles Anpassen der Spracheingabevorrichtung an einen Lautstärkepegel einer erfassten gesprochenen Sprache erfolgen. Dazu kann das Anpassen in einem Startschritt 64 zum Starten der Spracheingabevorrichtung durchgeführt werden. In einem weiteren Schritt 66 kann eine gesprochene Sprache, insbesondere mittels eines Mikrophons und eines Analog-Digitalwandlers, erfasst werden und ein die gesprochene Sprache repräsentierender Sprach-Datensatz erzeugt werden. In einem weiteren Verfahrensschritt 68 kann die erfasste gesprochene Sprache interpretiert werden, insbesondere durch Vergleichen des Sprach-Datensatzes mit vorrätig gehaltenen Key-Vokabel-Datensätzen. In einem weiteren Verfahrensschritt 70 kann in Abhängigkeit von einem Vergleichsergebnis des Schrittes 68 ein Ähnlichkeitsparameter erzeugt werden, insbesondere mittels Kreuzkorrelation. In einem weiteren Verfahrensschritt 72 kann ein Interpretationsergebnis erzeugt werden. In einem Ausgabeschritt 74 kann das Interpretationsergebnis ausgegeben werden.
  • In der Verfahrensstufe 78 kann das Anpassen, insbesondere ein Schritt des Anpassens, in Abhängigkeit von dem im Schritt 74 ausgegebenen Interpretationsergebnis gesteuert werden. In einer weiteren Verfahrensstufe 80 kann ein Anpassen an eine individuelle Sprachcharakteristik erfolgen. Das Anpassen an die individuelle Sprachcharakteristik kann mittels gesprochener Sprache gesteuert werden. Dazu kann innerhalb der Verfahrensstufe 80 der Verfahrensschritt 64 gestartet werden, und wie bereits beschrieben, gesprochene Sprache erfasst und interpretiert wird. Das dementsprechend erzeugte Interpretationsergebnis kann im Verfahrensschritt 74 ausgegeben werden und ein Steuern des Anpassens an die individuelle Sprachcharakteristik in Abhängigkeit von dem im Verfahrensschritt 74 ausgegebenen Interpretationsergebnis erfolgen.
  • Im Falle wenigstens einer Fehlinterpretation während der Verfahrensstufe 80, insbesondere wenn kein Interpretationsergebnis aus dem Verfahrensschritt 74 erzeugt werden konnte, kann in einem Rückkopplungsschritt 79 die Verfahrensstufe 78 wiederholt werden. Der Rückkopplungsschritt 79 kann beispiels weise in Abhängigkeit von einem Ablauf eines vorbestimmten Zeitintervalls erfolgen.
  • In einer weiteren Verfahrensstufe 82 kann ein Anpassen an eine individuelle Aussprache von Schlüsselwörtern erfolgen. Das Anpassen an die individuelle Aussprache von Schlüsselwörtern kann in Abhängigkeit von erfasster Sprache erfolgen. Dazu kann in einem Startschritt 64 und dem Startschritt 64 folgenden Schritten, wie bereits beschrieben, gesprochene Sprache erfasst und interpretiert werden. Im Falle keiner erfolgreichen Interpretation kann in einem Rückkopplungsschritt 81, insbesondere in Abhängigkeit eines zeitlichen Ablaufs eines Zeitintervalls, die Verfahrensstufe 80 wiederholt werden. Im Falle eines erfolgreichen Durchführens der Verfahrensstufen 78, 80 oder 82 oder aller Verfahrensstufen 78, 80 und 82 kann in einem Ausgabeschritt 84 ein benutzerspezifischer Datensatz erzeugt werden, welcher individuelle Parameter, insbesondere eines erfassten Lautstärkepegels, einer individuellen Sprachcharakteristik und einer individuellen Aussprache repräsentieren.

Claims (10)

  1. Medizinisches System (1) mit einer Medizinischen Vorrichtung (3), welche ausgebildet ist, ein Objekt in wenigstens zwei Dimensionen zu erfassen, wobei das medizinische System (1) eine mit der medizinischen Vorrichtung (3) wirkverbundene Benutzerschnittstelle (5) aufweist, welche ausgebildet ist, ein Steuersignal zum Steuern der medizinischen Vorrichtung in Abhängigkeit von einer Benutzerinteraktion zu erzeugen und das Steuersignal an die medizinische Vorrichtung (3) zu senden, und die Benutzerschnittstelle (5) eine Spracheingabeeinheit (7) aufweist, welche ausgebildet ist, Sprache repräsentierenden Schall zu erfassen und einen den Schall repräsentierenden Sprach-Datensatz zu erzeugen, und den Sprach-Datensatz zu interpretieren und das Steuersignal in Abhängigkeit von dem Interpretationsergebnis zu erzeugen, und die Spracheingabeeinheit (7) ein Trainingsmodul (11) aufweist, welches ausgebildet ist, ein Anpassen der Spracheingabeeinheit (7) an einen individuellen Benutzer in Abhängigkeit von einem Trainingssteuersignal zu steuern, dadurch gekennzeichnet, dass das Trainingsmodul (11) ausgebildet ist, den Sprach-Datensatz zu interpretieren und in Abhängigkeit von dem Interpretationsergebnis das Trainingssteuersignal zu erzeugen.
  2. Medizinisches System nach Anspruch 1, dadurch gekennzeichnet, dass das Trainingsmodul (11) ausgebildet ist, das Interpretieren des Sprach-Datensatzes mittels vorbestimmten, vorrätig gehaltenen Trainings-Vokabel-Datensätzen (19, 20, 21, 22) durchzuführen.
  3. Medizinisches System nach Anspruch 2, dadurch gekennzeichnet, dass die Trainings-Vokabel-Datensätze (19, 20, 21, 22) durch jeweils zueinander verschiedene Key-Vokabel-Datensätze (19, 22) und Subkey-Vokabel-Datensätze (20, 21) gebildet sind, wobei die Key-Vokabel-Datensätze (19, 22) jeweils ein Schlüsselwort repräsentieren und die Schlüsselworte jeweils zueinander verschieden sind, wobei für jedes Schlüsselwort wenigstens ein Subkey-Vokabel-Datensatz (20, 21) oder mehrere Subkey-Vokabel-Datensätze vorrätiggehalten sind, welche jeweils zu demselben Key-Vokabel-Datensatz (19) zugeordnet sind und jeweils zueinander und zu dem zugeordneten Key-Vokabel-Datensatz verschiedene Aussprachen desselben durch den zugeordneten Key-Vokabel-Datensatz (19) repräsentierten Schlüsselworts repräsentieren.
  4. Medizinisches System nach Anspruch 3, dadurch gekennzeichnet, dass die Key-Vokabel-Datensätze (19, 22) jeweils derart zueinander verschiedene Schlüsselworte repräsentieren, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind.
  5. Medizinisches System nach Anspruch 4, dadurch gekennzeichnet, dass die Key-Vokabel-Datensätze (19, 22) jeweils derart zueinander verschiedene Schlüsselworte repräsentieren, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind, wobei Key-Vokabel-Datensätze, welche jeweils Schlüsselworte mit einem zueinander identisch klingenden Vokal repräsentieren, durch wenigstens einen repräsentierten Sprenglaut und/oder wenigstens einen repräsentierten Zischlaut voneinander verschieden sind.
  6. Medizinisches System nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Spracheingabeeinheit (7) ausgebildet ist, das Anpassen an den individuellen Sprecher mit wenigstens zwei Anpassungsstufen durchzuführen, wobei die Spracheingabeeinheit (7) ausgebildet ist, bei nicht erfolgreicher Durchführung einer Anpassungsstufe wenigstens eine Anpassungsstufe wenigstens teilweise in Abhängigkeit von einem zeitlichen Ablauf eines insbesondere vorbestimmten Zeitintervalls zu wiederholen.
  7. Verfahren zum Steuern einer medizinischen Vorrichtung mit einer Spracheingabevorrichtung mittels gesprochener Sprache, wobei die medizinische Vorrichtung zum Erfassen eines Objekts in wenigstens zwei Dimensionen ausgebildet ist, umfassend folgende Schritte zum Anpassen der Spracheingabevorrichtung an einen individuellen Sprecher: – Starten der Spracheingabevorrichtung zum Anpassen an den individuellen Sprecher durch Erfassen von gesprochener Sprache und Erzeugen eines die gesprochene Sprache repräsentierenden Sprach-Datensatzes; – Interpretieren der erfassten gesprochenen Sprache und Erzeugen eines Interpretationsergebnisses; – und Steuern des Anpassens in Abhängigkeit von dem Interpretationsergebnis.
  8. Verfahren zum Steuern einer medizinischen Vorrichtung nach Anspruch 7, umfassend die Schritte: – Anpassen der Spracheingabevorrichtung an den individuellen Sprecher in Anpassungsstufen; – Steuern der Spracheingabevorrichtung bei fehlerhaftem Interpretieren mittels Zeitintervall-Unterbrechens derart, dass wenigstens eine Anpassungsstufe in Abhängigkeit von einem zeitlichen Ablauf eines vorbestimmten Zeitintervalls wenigstens teilweise wiederholt wird.
  9. Verfahren zum Steuern einer medizinischen Vorrichtung nach einem der Ansprüche 7 bis 8, umfassend den Schritt: – Vorrätighalten von Trainigs-Vokabel-Datensätzen, umfassend Key-Vokabel-Datensätze, wobei die Key-Vokabel-Datensätze jeweils derart zueinander verschiedene Schlüsselworte repräsentieren, dass die Schlüsselworte jeweils durch wenigstens einen klingenden Vokal zueinander verschieden sind; – Interpretieren der Sprach-Datensätze durch Vergleichen mit den Trainings-Vokabel-Datensätzen und Erzeugen des Interpretationsergebnisses insbesondere in Abhängigkeit von einem Ähnlichkeitsparameter.
  10. Verfahren zum Steuern einer medizinischen Vorrichtung nach Anspruch 9, dadurch gekennzeichnet, dass Key-Vokabel-Datensätze, welche jeweils Schlüsselworte mit einem zueinander identisch klingenden Vokal repräsentieren, durch wenigstens einen repräsentierten Sprenglaut und/oder wenigstens einen Zischlaut voneinander verschieden sind.
DE102006045719A 2006-09-27 2006-09-27 Medizinisches System mit einer Spracheingabevorrichtung Expired - Fee Related DE102006045719B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102006045719A DE102006045719B4 (de) 2006-09-27 2006-09-27 Medizinisches System mit einer Spracheingabevorrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006045719A DE102006045719B4 (de) 2006-09-27 2006-09-27 Medizinisches System mit einer Spracheingabevorrichtung

Publications (2)

Publication Number Publication Date
DE102006045719A1 true DE102006045719A1 (de) 2008-04-03
DE102006045719B4 DE102006045719B4 (de) 2008-08-14

Family

ID=39134203

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006045719A Expired - Fee Related DE102006045719B4 (de) 2006-09-27 2006-09-27 Medizinisches System mit einer Spracheingabevorrichtung

Country Status (1)

Country Link
DE (1) DE102006045719B4 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4152322A1 (de) 2021-09-16 2023-03-22 Siemens Healthcare GmbH Verfahren zur verarbeitung eines audiosignals, verfahren zur steuerung einer vorrichtung und zugehöriges system
EP4156179A1 (de) 2021-09-23 2023-03-29 Siemens Healthcare GmbH Sprachsteuerung einer medizinischen vorrichtung
EP4156178A1 (de) 2021-09-23 2023-03-29 Siemens Healthcare GmbH Sprachsteuerung einer medizinischen vorrichtung

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4680628A (en) * 1984-01-04 1987-07-14 Itek Corporation Realtime digital diagnostic image processing system
US5345538A (en) * 1992-01-27 1994-09-06 Krishna Narayannan Voice activated control apparatus
US5544654A (en) * 1995-06-06 1996-08-13 Acuson Corporation Voice control of a medical ultrasound scanning machine
DE10306924A1 (de) * 1999-08-20 2003-09-04 Zonare Medical Systems Inc Benutzerschnittstelle für in der Hand gehaltene Abbildungsgeräte

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4680628A (en) * 1984-01-04 1987-07-14 Itek Corporation Realtime digital diagnostic image processing system
US5345538A (en) * 1992-01-27 1994-09-06 Krishna Narayannan Voice activated control apparatus
US5544654A (en) * 1995-06-06 1996-08-13 Acuson Corporation Voice control of a medical ultrasound scanning machine
DE10306924A1 (de) * 1999-08-20 2003-09-04 Zonare Medical Systems Inc Benutzerschnittstelle für in der Hand gehaltene Abbildungsgeräte

Also Published As

Publication number Publication date
DE102006045719B4 (de) 2008-08-14

Similar Documents

Publication Publication Date Title
DE69923379T2 (de) Nicht-interaktive Registrierung zur Spracherkennung
DE69829235T2 (de) Registrierung für die Spracherkennung
DE69725091T2 (de) Verfahren und System zum Editieren von Sätzen während der kontinuierlichen Spracherkennung
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE60124842T2 (de) Rauschrobuste Mustererkennung
EP1282112B1 (de) Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
EP1184839A2 (de) Graphem-Phonem-Konvertierung
DE60212725T2 (de) Verfahren zur automatischen spracherkennung
DE69738116T2 (de) Lokalisierung eines Musters in einem Signal
DE60023398T2 (de) Verfahren und Vorrichtung zur Verbesserung der Spracherkennungsgenauigkeit mittels ereignis-basierter Beschränkungen
EP3291234B1 (de) Verfahren zum beurteilen einer qualität eines stimmeinsatzes eines sprechenden
DE112008001763T5 (de) Spracherkennungsvorrichtung und Navigationssystem
DE102006045719B4 (de) Medizinisches System mit einer Spracheingabevorrichtung
DE4010028A1 (de) Spracherkennungsverfahren
DE60014583T2 (de) Verfahren und vorrichtung zur integritätsprüfung von benutzeroberflächen sprachgesteuerter geräte
EP1125278B1 (de) Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte
DE112014007207T5 (de) Informations-Präsentationssystem
AT513073B1 (de) Gehörtrainingseinheit
DE112017006145T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und informationsverarbeitungssystem
DE112014006591B4 (de) Informationsbereitstellungsvorrichtung und Informationsbereitstellungsverfahren
WO2005069278A1 (de) Verfahren und vorrichtung zur bearbeitung eines sprachsignals für die robuste spracherkennung
DE69814442T2 (de) Strukturerkennung
DE3913638A1 (de) Verfahren zur sprachmusterbildung bei sprachgesteuerten haushalt-grossgeraeten, wie geschirrspuel- oder waschmaschinen
DE102022124133B3 (de) Verfahren zum Verarbeiten gestottert gesprochener Sprache mittels eines Sprachassistenten für ein Kraftfahrzeug
DE102014108371B4 (de) Verfahren zur Sprachsteuerung von unterhaltungselektronischen Geräten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
R081 Change of applicant/patentee

Owner name: SIEMENS HEALTHCARE GMBH, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee