DE102017103533A1 - Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien - Google Patents

Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien Download PDF

Info

Publication number
DE102017103533A1
DE102017103533A1 DE102017103533.8A DE102017103533A DE102017103533A1 DE 102017103533 A1 DE102017103533 A1 DE 102017103533A1 DE 102017103533 A DE102017103533 A DE 102017103533A DE 102017103533 A1 DE102017103533 A1 DE 102017103533A1
Authority
DE
Germany
Prior art keywords
file
additional data
data
control unit
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102017103533.8A
Other languages
English (en)
Inventor
Simon Verdenhalven
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Grundig Business Systems & Co Kg De GmbH
Original Assignee
GRUNDIG BUSINESS SYSTEMS GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GRUNDIG BUSINESS SYSTEMS GmbH filed Critical GRUNDIG BUSINESS SYSTEMS GmbH
Priority to DE102017103533.8A priority Critical patent/DE102017103533A1/de
Publication of DE102017103533A1 publication Critical patent/DE102017103533A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Abstract

Die vorliegende Erfindung dient zur visuellen Anzeige von zumindest einem Teil des Inhalts einer Datei in einem vordefinierbaren Bereich eines Anzeigebereich einer Darstellungseinheit. Der Datei, deren Inhalt angezeigt wird, wird zumindest ein Dateiname und ein Dateityp zugeordnet. In einem weiteren vordefinierbaren Bereich des visuellen Anzeigebereichs der Darstellungseinheit wird in einer Liste die Datei, gegebenenfalls neben weiteren Daten, zumindest mit ihrem Dateinamen dargestellt. Die Datei beinhaltet zumindest partiell Audiodaten, wobei die zumindest partiellen Audiodaten einer Transkription unterzogen werden und die hierbei aus den zumindest partiellen Audiodaten gewonnenen Textdaten werden als Zusatzdaten zur Datei gespeichert. Bei einer Anwahl der Datei im weiteren vordefinierbaren Bereich des Anzeigebereichs werden die Zusatzdaten zur Datei in lesbarer Form im vordefinierbaren Bereich des Anzeigebereichs der Darstellungseinheit angezeigt. Durch dieses Verfahren ist es möglich, die Inhalte von Audiodateien, soweit diese gesprochene Bestandteile beinhalten, in Textdaten zu wandeln und diese dann in einem nebengeordneten Fenster auf einer Anzeigeeinheit darzustellen.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien mit den Verfahrensmerkmalen des Patentanspruches 1 und den Merkmalen der Vorrichtungsansprüche 7 und 8.
  • Vorrichtungen und Verfahren zur Anzeige einer Vorschau von text- oder bildbezogenen Inhalten von text- und/oder bildbasierten Dateien auf einem Bereich eines Bildschirms sind hinlänglich bekannt. So ist es beispielsweise bereits aus der Benutzung des Betriebssystems Windows 7 bekannt in dessen Dateimanager sich eine Liste mit Dateien in einem Fenster auf dem Bildschirm anzeigen zu lassen und in einem neben der Dateiliste angeordneten Bereich eine Vorschau auf den Inhalt der in der Dateiliste angewählten Datei anzeigen zu lassen. Dies ist aber nur bei Dateien möglich, deren Dateiinhalt als Bilddatei oder Textdatei abgespeichert ist. Bei Dateien mit Audiodaten, wie beispielsweise Sounddateien, Sprachdateien und insbesondere Dateien in denen Diktate in Form von gesprochenen Worten abgespeichert sind, ist eine Vorschau nicht möglich. Wird eine solche Datei zur Vorschau angewählt, so erscheint im Vorschaufenster die Meldung: „Vorschau nicht möglich!“.
  • Weiterhin ist aus der EP 2 804 386 A1 eine Vorrichtung bekannt, die es ermöglicht von einem tragbaren Gerät mit einer Anzeigeeinheit dortig darstellbare Daten auf ein mit der Anzeigeeinheit verbundenem weiteren Gerät mit einem Display darzustellen. Eine Vorschau von Sounddateien oder Sprachdateien ist nicht offenbart.
  • Aus der EP 1 599 867 B1 ist ein Verfahren und eine Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei Spracherkennung bekannt. Eine Vorschaufunktion, wie vorherig beschrieben, ist nicht offenbart.
  • Aus der DE 20 2010 006 219 U1 ist eine Vorrichtung zur Koordinierung von Medieninhalten bekannt. Hierbei ist ein Modul vorgesehen, mit dessen Hilfe Medieninhalte kontinuierlich empfangen werden. Im Weiteren ist eine Wiedergabevorrichtung zur Wiedergabe von diesen kontinuierlich empfangenen Medieninhalten vorgesehen. Mithilfe einer Fernkommunikation können übermittelte Sprachdateien empfangen werden. Es ist ein Speicher zum Speichern dieser Sprachdateien vorgesehen, der wiederrum mit einer Wiedergabevorrichtung zur akustischen Ausgabe dieser Sprachdatei verbunden ist. Die Wiedergabe der Medieninhalte kann zu Gunsten von gespeicherten Sprachdateien unterbrochen werden. Eine Anzeige der gespeicherten Sprachdateien in Textform als Vorschau ist nicht offenbart.
  • Aus der EP 0 887 788 B1 ist ein Spracherkennungsapparat zum Übertragen von Sprachdaten auf einen Datenträgen in Textform bekannt. Hierzu ist ein Programm auf einem Computer vorgesehen, das es ermöglicht, Sprachdaten von einem Sprachdatenaufzeichnungsmedium zu lesen. In bestimmten Zeitintervallen nach dem Beginn der Sprachdatei wird eine Spracherkennung vorgenommen und der gewonnene Text wird in einer Datei gespeichert und auf einer Anzeige dargestellt. Eine Vorschaufunktion ist nicht offenbart.
  • Aus DE 10 300 005 A1 ist ein Verfahren zum Erzeugen eines in einem Textverarbeitungsprogramm geschriebenen Textes und ein digitales Diktiergerät hierfür offenbart. Um eine höhere Effizienz bei Schreibarbeiten zu erhalten, wird ein digitales Diktiergerät verwendet und eine erzeugte Sprachdatei von einem Spracherfassungssystem ausgewertet. Beim Diktieren werden auch Kommentare mitdiktiert, vorzugsweise durch Aktivierung eines speziellen Modus mittels einer Federntaste. Die Kommentare können auch von Hand ausgegeben werden. Eine Vorschaufunktion ist aber nicht offenbart.
  • Aus DE 33 481 95 A1 ist eine Verarbeitungsanlage für gespeicherte Dokumente, die sowohl Textbestandteile, als auch gesprochene Bestandteile, aufweisen, bekannt. Die Textbestandteile und die gesprochenen Bestandteile sind jeweils mit eigenen Zeichen unabhängig voneinander getrennt auf einem Anzeigemittel darstellbar. Es können sowohl an den Textbestandteilen, als auch an den gesprochenen Bestandteilen, unabhängig voneinander, Operationen durchgeführt werden. Eine Vorschaufunktion ist aber nicht offenbart.
  • Es sind weiterhin Softwarelösungen bekannt, die es ermöglichen, sogenannte Voice-To-Text Funktionen auszuführen, d. h. Sprache in Text zu wandeln. Es ist auch bereits bekannt mittels einer solcher Softwarelösungen einen Text in ein Sprachsignal umzuwandeln, es handelt sich um sogenannte Text-To-Speech Anwendungen.
  • Im Bereich der Unterhaltungssoftware ist auch das sogenannte „Karaoke Singen“ bekannt. Hierzu werden zu laufender Musik die jeweiligen Passagen des Liedtextes mit eingeblendet.
  • Nachteilig bei dem bekannten Stand der Technik ist, dass es bei Diktierlösungen oder Diktiereinsatzgeräten nicht möglich ist, von diktierten Diktaten oder abgespeicherten Sprachdateien, die in Form einer Audio-Datei vorliegen, sich schnell einen Überblick über deren Inhalt zu verschaffen.
  • Es kann zwar zu den Dateien eine Zusatzdatei gespeichert werden, die Zusatzinformationen zur Sprachdatei enthält, diese Zusatzinformationen müssen aber vom Benutzer selbst erstellt und angelegt werden.
  • Sind im Diktiersystem mehrere Sprachdateien bzw. Audiodateien vorhanden, so ist für einen Nutzer häufig nicht auf die Schnelle möglich zu erfassen, welchen Inhalt diese Dateien oder eine dieser Dateien haben. Der Nutzer kann sich über den Inhalt einer solchen vorliegenden Audiodatei keinen schnellen Überblick verschaffen, da er auf deren Inhat nicht in Form eines Textes einer Textdatei zugreifen und sich diesen auf einem Bildschirm darstellen lassen kann. Er muss stets die Audiodatei anhören, um deren Inhalt zu erfassen.
  • Es ist daher Aufgabe der vorliegenden Erfindung ein Verfahren und eine Vorrichtung aufzuzeigen, die es einem Nutzer ermöglicht, sich schnell Übersicht und Kenntnis über den Inhalt von Audiodateien bzw. Sprachdateien, insbesondere Dateien in Form von digital gespeicherten Diktaten oder Sprachnotizen, die im Speicher einer Computereinheit oder eines elektronischen Gerätes oder auf einer elektronischen Speichereinheit gespeichert sind, zu verschaffen, ohne sich den Inhalt der Datei anhören zu müssen.
  • Diese Aufgabe wird anhand der Merkmale der Patentansprüche 1, 7 und 8 gelöst. Vorteilhafte Ausgestaltungen der Erfindung ergeben sich anhand der weiteren Beschreibung, der Unteransprüche und der Figuren, anhand welcher ein konkretes Ausführungsbeispiel beschrieben ist.
  • Das erfindungsgemäße Verfahren dient zur visuellen Anzeige von zumindest einem Teil des Inhalts einer Datei in einem vordefinierbaren Bereich eines Anzeigebereich einer Darstellungseinheit. Der Datei, deren Inhalt angezeigt wird, wird zumindest ein Dateiname und ein Dateityp zugeordnet. In einem weiteren vordefinierbaren Bereich des visuellen Anzeigebereichs der Darstellungseinheit wird in einer Liste die Datei, gegebenenfalls neben weiteren Daten, zumindest mit ihrem Dateinamen dargestellt. Die Datei beinhaltet zumindest partiell Audiodaten, wobei die zumindest partiellen Audiodaten einer Transkription unterzogen werden und die hierbei aus den zumindest partiellen Audiodaten gewonnenen Textdaten werden als Zusatzdaten zur Datei gespeichert. Bei einer Anwahl der Datei im weiteren vordefinierbaren Bereich des Anzeigebereichs werden die Zusatzdaten zur Datei in lesbarer Form im vordefinierbaren Bereich des Anzeigebereichs der Darstellungseinheit angezeigt. Durch dieses Verfahren ist es möglich die Inhalte von Audiodateien, soweit diese gesprochene Bestandteile beinhalten, in Textdaten zu wandeln und diese dann in einem nebengeordneten Fenster auf einer Anzeigeeinheit darzustellen.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 2 ist vorgesehen, dass die Landessprache der zumindest partiellen Audiodaten in den Zusatzdaten gespeichert wird. Damit ist es möglich die Transkription der Audiodateien und der darin enthaltenen gesprochenen Sprachdaten bereits auf die Landessprache vorzuwählen, wodurch gute Transkriptionsergebnisse erzielt werden.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 3 ist vorgesehen, dass die Transkription der zumindest partiellen Audiodaten der Datei unter Berücksichtigung der Landessprache, die in den Zusatzdaten gespeichert wird, vorgenommen wird und das Ergebnis der Transkription in Textform in den Zusatzdaten gespeichert wird. Durch das Speichern in den Zusatzdaten wird das Ergebnis der Transkription direkt der Audiodatei zugeordnet und es kann eine falsche Zuweisung der Textdaten, die durch die Transkription gewonnen werden, vermieden werden.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 4 ist vorgesehen, dass, wenn in den Zusatzdaten keine Landessprache gespeichert ist, anhand einer Sprachanalyse der zumindest partiellen Audiodaten der Datei und/oder anhand einer Analyse des Dateinames und/oder des Dateityps der Datei und/oder der Landessprache desjenigen Landes, indem sich die Darstellungseinheit aktuell befindet oder in dem die Datei erstellt worden ist, die Landessprache festgelegt und in den Zusatzdaten gespeichert wird. Damit wird die Landessprache automatisch festgelegt und die Transkription wird auf die Landessprache angepasst oder vorausgewählt. Es kann damit eine zur Landessprache zugehörige Transkriptionsroutine angewendet werden.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 5 ist vorgesehen, dass das Ergebnis der Transkription in auswählbare Landessprachen oder in den vorhandnenen Transkriptionsroutinen für Landessprachen übersetzt wird. Damit kann das durch die Transkription gewonnene Ergebnis in andere und/oder weitere Sprachen übersetzt werden. Damit liegen anschließend die Textdaten in verschiedenen Sprachen bzw. Landessprachen vor. Es hat sich als vorteilhaft erwiesen die Übersetzungen in gängige Landessprachen vorzusehen. So wird ein in deutscher Sprache gespeicherter Text sogleich in die englische Sprache übersetzt. Es liegt dann zumindest ein von einer großen Anzahl von Nutzern lesbarer Text vor, zumal die englische Sprache als eine der Weltsprachen anzusehen ist.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 6 ist vorgesehen, dass den Zusatzdaten ein Header zugewiesen wird, in dem die Landessprache, die Anzahl der Transkription, die Anzahl der Zeichen der Transkription, die Anzahl der Übersetzungen in Landessprachen und die Anzahl der Zeichen einer jeden Übersetzung in eine Landessprache gespeichert wird. Die Zuordnung eines Headers gibt dem Verfahren und der Bearbeitung der Zusatzdaten, sowie dem Zugriff auf die Zusatzdaten eine Struktur und ermöglicht einen schnellen Zugriff auf die Textdaten der Zusatzdaten und die weiteren Daten der Zusatzdaten.
  • Die erfindungsgemäße Vorrichtung nach Patentanspruch 7 dient zur Durchführung des Verfahrens nach einem der vorangehenden Verfahrensansprüche 1 bis 6 und weist mindestens eine Steuereinheit und mindestens eine Speichereinheit auf.
  • Die erfindungsgemäße Vorrichtung nach Patentanspruch 8 weist mindestens eine Steuereinheit, mindestens eine Speichereinheit, mindestens eine Darstellungseinheit und mindestens eine Eingabeeinheit auf. Die Darstellungseinheit dient zur visuellen Anzeige von Informationen und die Darstellungseinheit besitzt einen Darstellungsbereich, auf dem mindestens zwei voneinander abgegrenzten Bereiche darstellbar sind. Auf dem ersten Bereich der mindestens zwei voneinander abgegrenzte Bereiche ist eine Auswahl von in der Speichereinheit gespeicherten Dateien darstellbar, wobei zu jede der dargestellten Dateien deren Dateiname und deren Dateityp anzeigbar ist. Mittels der Eingabeeinheit ist mindestens eine Datei der auf dem ersten Bereich der mindestens zwei voneinander abgegrenzte Bereiche darstellbaren Dateien anwählbar. Bei Anwahl einer Datei der auf dem ersten Bereich der mindestens zwei voneinander abgegrenzte Bereiche darstellbaren Dateien überprüft die Steuereinheit, ob diese Datei zumindest partiell Audiodaten enthält. Für den Fall, dass diese Datei zumindest partiell Audiodaten enthält, überprüft die Steuereinheit, ob in der Speichereinheit Zusatzdaten zu dieser Datei vorhanden sind, die auf Basis einer Transkription der zumindest partiell enthaltenen Audiodaten gewonnen sind. Für den Fall, dass Zusatzdaten zu dieser Datei in der Speichereinheit vorhanden sind und es sich bei den Zusatzdaten um Daten aus einer Transkription handelt, stellt die Steuereinheit diese Zusatzdaten in lesbarer Textform auf dem zweiten Bereich der mindestens zwei voneinander abgegrenzte Bereiche zumindest teilweise dar. Für den Fall, dass es sich bei den Zusatzdaten um keine Daten aus einer Transkription handelt, oder wenn keine Zusatzdaten zur Datei in der Speichereinheit gespeichert sind, unterzieht die Steuereinheit die zumindest partiell in der Datei enthaltenen Audiodaten einer Transkription und speichert die durch die Transkription gewonnenen Daten in den Zusatzdaten oder als Zusatzdaten zur Datei in der Speichereinheit. Sodann stellt die Steuereinheit diese Zusatzdaten in lesbarer Textform auf dem zweiten Bereich der mindestens zwei voneinander abgegrenzten Bereiche zumindest teilweise dar.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 9 ist vorgesehen, dass die Steuereinheit bei Anwahl einer Datei der auf dem ersten Bereich der mindestens zwei voneinander abgegrenzten Bereiche darstellbaren Dateien, diese Datei auf dem ersten Bereich der mindestens zwei voneinander abgegrenzten Bereiche farblich oder mit einem Graubereich hinterlegt. Damit kann ein Nutzer unmittelbar erkennen, welcher Datei der angezeigte Text zugehörig ist.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 10 ist vorgesehen, dass die Steuereinheit die Landessprache der zumindest partiellen Audiodaten in den Zusatzdaten speichert und die Transkription der zumindest partiellen Audiodaten der Datei unter Berücksichtigung der Landessprache, vornimmt und das Ergebnis der Transkription in Textform in der Landessprache speichert. Durch die Zuweisung der Landessprache kann die zu einer Landessprache gehörige Transkriptionsroutine angewendet werden.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 11 ist vorgesehen, dass die Steuereinheit, für den Fall, dass in den Zusatzdaten keine Landessprache gespeichert ist, anhand einer Sprachanalyse der zumindest partiellen Audiodaten und/oder anhand einer Analyse des Dateinamens und/oder des Dateityp der Datei und/oder der Landessprache desjenigen Landes, indem sich die Vorrichtung aktuell befindet oder in dem die Datei erstellt worden ist, die Landessprache festgelegt und in den Zusatzdaten speichert. Damit legt die Steuereinheit die Landessprache fest und es wird eine zugehörige Transkriptionsroutine angewendet.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 12 ist vorgesehen, dass die Steuereinheit das Ergebnis der Transkription in auswählbare Landessprachen mittels vorhandener Übersetzungsroutinen übersetzt und in den Zusatzdaten mit der Angabe der jeweiligen Landessprache in der Speichereinheit abspeichert. Damit liegen die aus der Transkription gewonnen Textdaten in mehreren Sprachen vor.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 13 ist vorgesehen, dass die Steuereinheit den Zusatzdaten einer Datei einen Header zuweist, in dem die Steuereinheit die Landessprache, die Anzahl der Zeichen der Transkription in Textform, die Anzahl der Übersetzungen und der Sprache, in denen die Übersetzung erfolgt ist, jeweils mit der Anzahl der Zeichen, vorzugsweise in Textform, speichert. Dies ermöglicht es der Steuereinheit einen beschleunigten Zugriff vorzunehmen, da anhand dieser Daten der erforderliche Speicher zur Umsetzung der Daten vorbestimmbar ist.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 14 ist vorgesehen, dass die Steuereinheit die Zusatzdaten, die in lesbarer Textform auf dem zweiten Bereich der mindestens zwei voneinander abgegrenzte Bereiche zumindest teilweise dargestellt sind, von einem Benutzer über die Eingabeeinheit editierbar sind und vorgenommene Änderungen in den Zusatzdaten in der Speichereinheit speichert. Damit können von einem Nutzer Korrekturen vorgenommen werden.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 15 ist vorgesehen, dass die Vorrichtung ein Diktiergerät, ein Mobiltelefon, ein Laptop oder ein Computer ist.
  • In einer vorteilhaften Ausgestaltung der Erfindung nach Patentanspruch 16 ist vorgesehen, dass eine in der Speichereinheit gespeicherte Datei ein Diktat oder eine Sprachaufnahme ist, die über ein an der Eingabeeinheit anschließbares Mikrofon aufnehmbar oder über eine Schnittstelle der Speichereinheit zuführbar und in der Speichereinheit gespeichert ist.
  • Vorteile und Zweckmäßigkeiten sind in der nachfolgenden Beschreibung in Verbindung mit der jeweiligen Figur zu entnehmen.
  • Sämtliche in den Anmeldeunterlagen offenbarten Merkmale werden als erfindungswesentlich beansprucht, soweit sie einzeln und in Kombination gegenüber dem Stand der Technik neu sind.
  • Die nachfolgende Beschreibung der Erfindung anhand eines konkreten Ausführungsbeispiels stellt keine Limitierung der Erfindung auf dieses konkrete Ausführungsbeispiel dar.
  • Es zeigen die nachfolgenden Figuren:
    • 1 einen schematischen Aufbau einer erfindungsgemäßen Vorrichtung;
    • 2 die schematische Darstellung einer Anzeigevorrichtung; und
    • 3 eine Prinzipskizze zur Erläuterung der Erfindung.
  • In 1 ist der schematische Aufbau einer erfindungsgemäßen Vorrichtung dargestellt. Die erfindungsgemäße Vorrichtung, die vorzugsweise tragbar ausgestaltet ist, besitzt eine Steuereinheit 101. Mit der Steuereinheit 101 ist eine Speichereinheit 102 verbunden. Über die Steuereinheit 101 ist eine Darstellungseinheit 103 ansteuerbar, auf welcher die Steuereinheit 101 Daten, Informationen oder Darstellungen wiedergeben kann. Im Weiteren ist eine Eingabeeinheit 104 vorgesehen, die mit der Steuereinheit 101 verbunden ist. An die Eingabeeinheit 104 können weitere Eingabeeinheiten wie beispielsweise eine Tastatur 108, ein Datenübertragungsgerät 107, ein Mikrofon 106 oder eine Kamera 105 angeschlossen werden. Außerdem sind weitere Schnittstellen vorhanden, die jedoch in 1 nicht dargestellt sind. Bei diesen Schnittstellen handelt es sich beispielsweise um eine HDMI-Schnittstelle, eine USB-Schnittstelle oder eine Funkschnittstelle, die beispielsweise als WiFi-Schnittstelle, Bloototh-Schnittstelle ausgestaltet sein kann.
  • In einer besonderen Ausgestaltung der Erfindung ist die Darstellungseinheit 103 als „Touch-Screen“ ausgestaltet. Damit können über die Darstellungseinheit 103 zugleich Eingaben erfolgen; es kann dann die Eingabeeinheit 104 mit der Darstellungseinheit 103 eine Einheit bilden.
  • Über die Eingabeeinheit 104 sind Eingaben möglich. Will ein Nutzer eine Spracheingabe tätigen oder aber ein Diktat oder eine Sprachnotiz erstellen, so aktiviert er über die Eingabeeinheit 104 diesen Vorgang und kann dann über ein Mikrofon 106, das an der Eingabeeinheit 104 anschließbar ist, eine Spracheingabe tätigen, eine Sprachnotiz verfassen oder ein Diktat eingeben bzw. erstellen bzw. diktieren.
  • Es sind an der Eingabeeinheit 104 diverse Bedienschalter oder Bedienknöpfe vorhanden, mittels derer ein Nutzer sein Diktat starten, wiedergeben, in der Datei nach vorne oder nach hinten springen kann oder seine Eingabe beenden kann.
  • Die über die Eingabeeinheit 104 der Steuereinheit 101 zugeleiteten Daten, speichert diese in der Speichereinheit 102 in jeweils einer Datei. Eine Datei kann somit Sprachdaten und/oder zumindest partiell Sprachdateien oder Audiodaten enthalten.
  • Es können in der Speichereinheit 102 auch Bilddaten oder Textdateien in Dateien oder als Dateien vorhanden sein. Um die in der Speichereinheit 102 vorhandenen Dateien zu verifizieren, sind zu jeder dort gespeicherten Datei Zusatzdaten in der Speichereinheit 102 abgespeichert, anhand derer die Steuereinheit 101 die Dateien verifizieren kann. So sind zu jeder Datei ein Dateiname, ein Dateityp, sowie der Erstellungstag, mit Datum und Uhrzeit, abgespeichert. Eine jede Datei ist mit den Zusatzdaten fest verlinkt, sodass Zusatzdaten nur einer einzigen Datei in der Speichereinheit 102 zuordenbar sind.
  • Möchte sich nunmehr ein Nutzer der Vorrichtung Überblick über die in der Speichereinheit 102 gespeicherten Dateien verschaffen, so aktiviert er über die Steuereinheit 101 die Darstellungseinheit 103. Die Steuereinheit 101 durchsucht die Speichereinheit 102 nach in dieser abgespeicherten Dateien und stellte auf der Darstellungseinheit 103 in einem dort dargestellten Bereich, vorzugsweise einem sogenannten Fenster, die in der Speichereinheit 102 gespeicherten Dateien in Form einen Liste dar.
  • In 2 ist schematisch eine Draufsicht auf die Darstellungseinheit 103 von 1 und die Art und Weise der Darstellung von Dateien und Zusatzdateien auf dieser dargestellt. Die Darstellungseinheit 103 besitzt einen Anzeigebereich 201. Auf diesen Anzeigebereich 201 können mehrere Fenster 202, 207 nebeneinander, getrennt voneinander oder sich überlappend dargestellt werden. In dem ersten Fenster 202 werden von der Steuereinheit 101 eine Auswahl der Dateien, die in der Speichereinheit 102 gespeichert sind, dargestellt. Da die Anzahl der darzustellenden Dateien im Fenster 202 begrenzt ist, wird nur eine Auswahl aller in der Speichereinheit 102 vorhandenen Dateien dargestellt. Neben dem Fenster 202 sind sogenannte Scrollbars angeordnet, mittels derer ein Nutzer, in bekannter Weise, in den dargestellten Fenster 202 scrollen kann.
  • Auf der Darstellung sind gem. 2 drei Dateien 203, 204 und 205 in Form einer Liste, untereinander angeordnet, dargestellt. Die Dateien 203, 204, 205 sind durch den jeweiligen Dateinamen gekennzeichnet, der in der Liste dargestellt ist. Über die Eingabeeinheit 104 kann nunmehr ein Nutzer eine der dargestellten Dateien 203, 204, 205 anwählen. Eine Anwahl wird durch eine Hinterlegung 206 des Dateinamens der Datei 203, 204, 205 dargestellt. In 2 ist die erste Datei 203 angewählt dargestellt.
  • Diese Anwahl der Datei 203 kann beispielsweise durch einen Wechsel das Darstellungsfarbe, durch eine Hinterlegung des Dateinamens mit einem Balken, durch die Darstellung einer Art von Lupenfunktion, usw. dem Nutzer angezeigt und mitgeteilt werden.
  • Nach Anwahl der Datei 203 werden in dem zweiten Fenster 207 die Zusatzdaten, die zur Datei 203 gespeichert sind, angezeigt. Bei diesen Zusatzdaten handelt es sich um Daten, die aufgrund einer Speech-To-Text-Analyse, einer sogenannten Transkription der Audiodaten bzw. Sprachdaten, die in der Datei 203 vorhanden sind, gewonnen wurden. Hierzu unterzieht die Steuereinheit 101 entweder nach der Erstspeicherung der Datei 203 in der Speichereinheit 102 die Datei 203 einer Transkription und speichert das Ergebnis der Transkription als Textdaten, z. B, als ACSII-Zeichen, in der Zusatzdatei. Bei Anwahl der Datei 203 werden diese Zusatzdaten, die den Inhalt der Sprachdaten, die in der Datei 203 enthalten sind, als Textdateien, zu mindestens auszugsweise, dargestellt. Da aber der Darstellungsbereich im Fenster 207 begrenzt ist, können ggf. nicht alle Daten dargestellt werden. Es ist auch dem Fenster 207 mindestens eine Scrollbar zugeordnet, mittels ein Nutzer im Fenster 207 „navigieren“ kann.
  • Durch diese Darstellung der Zusatzdaten zur Datei 203 im Fenster 207 ist eine Vorschaufunktion für Sprachdateien ermöglicht. Damit kann ein Nutzer sich einfach Kenntnis in visueller Form, durch lesen der Zusatzdaten, dargestellt im Fenster 207, über den Inhalt der in der Datei 203 gespeicherten Audiodaten verschaffen.
  • Dies ist insbesondere von Vorteil, wenn es sich bei den Audiodaten um ein Diktat handelt.
  • In einer weiteren Ausgestaltungsform der Erfindung ist vorgesehen, dass die Steuereinheit 101 zu dem Zeitpunkt, zu der eine Datei 203, 204, 205 im Fenster 202 angewählt ist, in der Speichereinheit 104 die Zusatzdaten zur angewählten Datei 203; 204; 205 ermittelt. Sodann überprüft die Steuereinheit 101, ob in den Zusatzdaten Transkriptionsdaten zu den Audiodaten vorhanden sind. Ist dies der Fall, stellt die Steuereinheit 101 diese im Anzeigebereich 207 dar. Ist dies nicht der Fall, so startet die Steuereinheit 101 eine Transkription, sprich sie führt eine Speech-To-Text-Analyse durch und speichert die hierdurch gewonnen Textdaten in den Zusatzdaten zur Datei 203; 204; 205 und stellt diese im Fenster 207 dar. Die Speech-To-Text-Analyse erfolgt über eine in der Speichereinheit 102 oder der Steuereinheit 101 abgelegte Subroutine in Form einer Software, die von der Steuereinheit 101 ausführbar ist.
  • Bei der Steuereinheit 101 handelt es sich in einer vorteilhaften Ausgestaltung der Erfindung um eine Mikrocomputereinheit oder einen Mikrocomputer, eine Mikroprozessoreinheit oder einen Mikroprozessor, eine Mikrocontrollereinheit oder einen Mikrocontroller, oder einen Teil in der Vorrichtung oder um einen Bestandteil eines Steuergerätes der Vorrichtung.
  • Es kann sich die Problematik ergeben, dass die Zusatzdaten in einer Sprache abgelegt sind, die für den Nutzer gegebenenfalls nicht verständlich ist. Daher kann ein Nutzer über die Steuereinheit 101 eine Übersetzungsroutine anstoßen, die die Textdatei entsprechend in eine andere Sprache übersetzt. Voraussetzung hierfür ist, dass zu jeder Textdatei deren Landessprache hinterlegt bzw. abgespeichert ist. Daher speichert die Steuereinheit 101 zu jeder Datei 203, 204, 205 zunächst deren Ursprungslandessprache. Dies ermittelt die Steuereinheit 101 anhand mehrerer Möglichkeiten. Zum einen kann ein Nutzer die Landessprache einstellen. Dies speichert dann die Steuereinheit 101 in den Zusatzdaten zu der Datei 203, 204, 205. Alternativ führt die Steuereinheit 101 eine Analyse der Sprachdaten der Datei 203, 204, 205 durch und ermittelt anhand der Daten die Landessprache. In einer weiteren Ausführung der Erfindung ist eine GPS-Einheit vorgesehen. Anhand der GPS-Einheit ermittelt die Steuereinheit 101 den Standort, an dem sich die Vorrichtung aktuell befindet, ermittelt das zugehörige Land und die Landessprache und speichert diese als Landessprache in der Zusatzdatei, wenn die Datei 203; 204; 205 erstellt wird oder unmittelbar nach deren Erstspeicherung.
  • Der Nutzer kann nunmehr anhand diverser in der Vorrichtung vorhandener Routinen, die von der Steuereinheit 101 ausführbar sind, Übersetzungen von einer Landessprache in eine andere veranlassen. Alternativ ist vorgesehen, dass die Steuereinheit 101 zu einer jeden Übersetzungsroutine, die vorhanden ist, die Zusatzdateien in alle diese entsprechenden Landessprachen zur Übersetzung anstößt. Dies erfolgt dann, wenn der Nutzer die Vorrichtung nicht betreibt, im Ruhemodus der Vorrichtung. Alternativ erfolgt dies im Hintergrund in Form einer Subroutine. Sodann kann der Nutzer die Art der Darstellung und die Landessprache auswählen und es wird im Anzeigefenster 207 diejenige Textpassage, in der angewählten Landessprache dargestellt, die der Datei 203, die angewählt ist, zugeordnet ist.
  • Im 3 ist eine Prinzipskizze zur Erfindung dargestellt. Zunächst erfolgt eine Aufnahme 301 einer Audiodatei 302 über das Aufnahmegerät. Die Audiodatei 302 wird zunächst gespeichert. Parallel dazu oder nach der Speicherung wird eine automatische Spracherkennung 303 vorgenommen und die Audiodatei 303 wird in eine Textdatei 304 transkripert bzw. gewandelt. Die hierdurch gewonnene Textdatei 304 wird mit der Landessprache als Kennzeichnung und mit der Audiodatei 303 im Speicher verknüpft, es erfolgt damit eine Paarbildung bzw. Pärchenbildung 307 und die Audiodatei 302 und die Textdatei 304 bilden jeweils ein zusammengehöriges Pärchen 307. Es können zusätzlich automatisch Übersetzungen 305 der Textdatei 304 in andere Landessprachen vorgenommen werden. Diese Übersetzungen 305 werden wiederrum als weitere Textdatei 307 bzw. übersetzte Datei(en) 307 der Audiodatei 302 entsprechend zugeordnet.
  • Die Dateien 312 bis 318, die in dem zugehörigen Speicher abgespeichert sind, werden in einer Darstellung auf dem Bildschirm 308 dargestellt. Der Bildschirm 308, der vorzugsweise ein Display ist, besitzt zwei voneinander abgegrenzte Darstellungsbereiche 309, 310, die als sogenannte Fenster ausgestaltet sind.
  • Im linken Darstellungsbereich 309 ist eine Auswahl der vorhandenen Dateien 312 bis 318 in Form einer Tabelle 311 dargestellt. Es ist jeder der Dateien 312 bis 318 ein Dateienname, ein Dateityp und ein Kurzzeichen für den Autor der jeweiligen Datei 312 bis 318 zugeodnet. Der jeweilige Dateiname, der Dateityp und der Autor sind der jeweiligen Datei 312 bis 318 zugehörig.
  • Bei der Datei 312 handelt es sich um eine Textdatei in einem Word-Format. Bei der Datei 313 handelt es sich um eine PNG-Datei, bei der Datei 314 handelt es sich um eine Sprachdatei, um eine sogenannte DSS-Datei. DSS-Dateien sind Dateien die speziell zur Speicherung von Diktaten geeignet und zur Speicherung von Sprachsignale optimiert sind. Bei der Datei 315 handelt es um eine XLS-Datei, bei der Datei 316 handelt es sich um eine WAV-Datei. WAV-Dateien sind Dateien zur Speicherung von Audiosignalen. Bei der Datei 317 handelt es sich um eine MP3-Datei. Auch MP3-Dateien sind Audiodateien. Schließlich ist die Datei 318 vorhanden, die wiederum eine Doc-Datei ist.
  • Wählt nunmehr ein Nutzer im linken Darstellungsbereich 309 die Datei 316 an, so wird dies durch eine Umrahmung der Darstellung der Datei 316 im linken Darstellungsbereich 309 angezeigt. Da es sich bei der Datei 316 um eine WAV-Datei handelt, eine Audiodatei, wird im rechten Anzeigebereich 310 in einem weiteren Darstellungsbereich 321, der Inhalt der Textdatei, der mit der Audiodatei 316 gepaart ist, dargestellt, zumindest auszugsweise, soweit der Darstellungsbereich 321 zur Darstellung der Textdatei geeignet und ausreichend ist. Es wird zumindest ein Auszug aus der Textdatei dargestellt in einem zugeordneten weiteren Darstellungsbereich 322 dargestellt. Dieser weiteren Darstellungsbereich 322 ist innerhalb des Darstellungsbereichs 310 angeordnet. Der Darstellungsbereich 322 ist in Form einer Seite eines Blattes Papier dargestellt, so dass man mittels ziehen auf den rechten unteren Bereich 323 des Blattes Papier auf die nächste Seite „umblättern“ kann.
  • Oberhalb des Anzeigebereiches 321 ist im rechten Anzeigebereich 310 ein weiterer Anzeigebereich 320 angeordnet, in dem der Dateiname, die Anzahl der Worte der Textdatei, der Autor und die Länge der Audiodatei, bei Normalwiedergabe, angegeben ist. Die Anzeige der Länge der Audiodatei erfolgt in Zeiteinheit, z. B. im Stunden, Minuten und Sekunden.
  • Der Anzeigebereich 321 ist als Vorschaubereich ausgestaltet, sodass eine Vorschau auf den Inhalt der im linken Anzeigebereich 309 angewählten Datei 316 erfolgt.
  • Im unteren Bereich des linken Anzeigebereichs 309 ist ein Marker 319 angeordnet, der verdeutlicht, dass die mit dem Marker 319 gekennzeichneten Dateien 314, 316, 318 Audiodateien sind.
  • In einer weiteren Ausgestaltung der Erfindung ist vorgesehen, dass zu einer jeden angezeigten Audiodatei 314, 316, 318 zur Kenntlichmachung der Landessprachen, in der eine Textdatei zu dieser Datei vorhanden ist, neben der jeweiligen Datei 314, 316, 318 bzw. deren Dateinamen eine Flagge die dem Land der Landessprache zugehörig ist, dargestellt bzw. angezeigt wird.
  • Bezugszeichenliste
  • 101
    Steuereinheit
    102
    Speichereinheit
    103
    Darstellungseinheit
    104
    Eingabeeinheit
    105
    Kamera
    106
    Mikrofon
    107
    Datenübertragungsgerät
    108
    Tastatur
    201
    Anzeigebereich
    202
    Fenster
    203
    Datei
    204
    Datei
    205
    Datei
    206
    Hinterlegung
    207
    Fenster
    301
    Aufnahme
    302
    Audiodatei
    303
    Spracherkennung
    304
    Textdatei
    305
    Übersetzung
    306
    Paarung/Pärchenbildung
    307
    übersetzte Datei
    308
    Bildschirm
    309
    Darstellungsbereich
    310
    Darstellungsbereich
    311
    Tabelle
    312
    Datei
    313
    Datei
    314
    Datei
    315
    Datei
    316
    Datei
    317
    Datei
    318
    Datei
    319
    Marker
    320
    Anzeigebereich
    321
    Anzeigebereich
    322
    Darstellungsbereich
    323
    Darstellungsbereich
    324
    Bereich
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • EP 2804386 A1 [0003]
    • EP 1599867 B1 [0004]
    • DE 202010006219 U1 [0005]
    • EP 0887788 B1 [0006]
    • DE 10300005 A1 [0007]
    • DE 3348195 A1 [0008]

Claims (16)

  1. Verfahren zur visuellen Anzeige von zumindest einem Teil des Inhalts einer Datei in einem vordefinierbaren Bereich (207) eines Anzeigebereichs (201) einer Darstellungseinheit (103), wobei der Datei zumindest ein Dateiname und ein Dateityp zugeordnet wird, und wobei in einem weiteren vordefinierbaren Bereich (202) des visuellen Anzeigebereichs (201) der Darstellungseinheit (103) in einer Liste die Datei, gegebenenfalls neben weiteren Daten, zumindest mit ihrem Dateinamen dargestellt wird, dadurch gekennzeichnet, dass - die Datei zumindest partiell Audiodaten beinhaltet, - die zumindest partiellen Audiodaten einer Transkription unterzogen werden und die hierbei aus den zumindest partiellen Audiodaten gewonnenen Textdaten als Zusatzdaten zur Datei gespeichert werden, - bei Anwahl der Datei im weiteren vordefinierbaren Bereich (202) des Anzeigebereichs (201) die Zusatzdaten zur Datei in lesbarer Form im vordefinierbaren Bereich (207) des Anzeigebereichs (201) der Darstellungseinheit (103) angezeigt werden.
  2. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass die Landessprache der zumindest partiellen Audiodaten in den Zusatzdaten gespeichert wird.
  3. Verfahren nach Patentanspruch 1 oder 2, dadurch gekennzeichnet, dass die Transkription der zumindest partiellen Audiodaten der Datei unter Berücksichtigung der Landessprache, die in den Zusatzdaten gespeichert wird, vorgenommen wird und das Ergebnis der Transkription in Textform in den Zusatzdaten gespeichert wird.
  4. Verfahren nach einem der vorangehenden Patentansprüche, dadurch gekennzeichnet, dass wenn in den Zusatzdaten keine Landessprache gespeichert ist, anhand einer Sprachanalyse der zumindest partiellen Audiodaten der Datei und/oder anhand einer Analyse des Dateinamens und/oder des Dateityps der Datei und/oder der Landessprache desjenigen Landes, indem sich die Darstellungseinheit (103) aktuell befindet oder in dem die Datei erstellt worden ist, die Landessprache festgelegt und in den Zusatzdaten gespeichert wird.
  5. Verfahren nach einem der vorangehenden Patentansprüche, dadurch gekennzeichnet, dass das Ergebnis der Transkription in auswählbare Landessprachen oder in alle Landesprachen, für die eine Übersetzungsroutine vorhanden ist, übersetzt wird.
  6. Verfahren nach einem der vorangehenden Patentansprüche, dadurch gekennzeichnet, dass den Zusatzdaten ein Header zugewiesen wird, in dem die Landessprache, die Anzahl der Transkription, die Anzahl der Zeichen der Transkription, die Anzahl der Übersetzungen in Landessprachen und die Anzahl der Zeichen einer jeden Übersetzung in eine Landessprache gespeichert wird.
  7. Vorrichtung zur Durchführung des Verfahrens nach einem der vorangehenden Verfahrensansprüche, aufweisend mindestens eine Steuereinheit (101) und mindestens eine Speichereinheit.
  8. Vorrichtung mindestens aufweisend eine Steuereinheit (101), eine Speichereinheit (102), eine Darstellungseinheit (103) und eine Eingabeeinheit (104), wobei - die Darstellungseinheit (103) zur visuellen Anzeige von Informationen dient, - die Darstellungseinheit (103) einen Darstellungsbereich (201) besitzt, auf dem mindestens zwei voneinander abgegrenzte Bereiche (202, 207) darstellbar sind, - auf dem ersten Bereich (202) der mindestens zwei voneinander abgegrenzte Bereiche (202, 207) eine Auswahl (203, 204, 205) von in der Speichereinheit (102) gespeicherten Dateien darstellbar ist, wobei zu jeder der dargestellten Dateien deren Dateiname und deren Dateityp anzeigbar ist, - mittels der Eingabeeinheit (104) mindestens eine Datei der auf dem ersten Bereich (202) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) darstellbaren Dateien anwählbar ist, dadurch gekennzeichnet, dass - bei Anwahl einer Datei (203, 204, 205) der auf dem ersten Bereich (202) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) darstellbaren Dateien (203, 204, 205), die Steuereinheit (101) überprüft, ob diese Datei (203) zumindest partiell Audiodaten enthält, - die Steuereinheit (101), falls diese Datei (203) zumindest partiell Audiodaten enthält, überprüft, ob in der Speichereinheit (102) Zusatzdaten zu dieser Datei (203) vorhanden sind, die auf Basis einer Transkription der zumindest partiell enthaltenen Audiodaten gewonnen sind, - für den Fall, dass Zusatzdaten zu dieser Datei (203) in der Speichereinheit (102) vorhanden sind und es sich bei den Zusatzdaten um Daten einer Transkription handelt, die Steuereinheit (101) diese Zusatzdaten in lesbarer Textform auf dem zweiten Bereich (207) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) zumindest teilweise darstellt, - für den Fall, dass es sich bei den Zusatzdaten um keine Daten einer Transkription handelt, oder wenn keine Zusatzdaten zur Datei (203) in der Speichereinheit (102) gespeichert sind, die Steuereinheit (101) die zumindest partiell in der Datei (203) enthaltenen Audiodaten einer Transkription unterzieht und die durch die Transkription gewonnenen Daten in den Zusatzdaten oder als Zusatzdaten der Datei (203) in der Speichereinheit (102) abspeichert und diese Zusatzdaten in lesbarer Textform auf dem zweiten Bereich (207) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) zumindest teilweise darstellt.
  9. Vorrichtung nach Patentanspruch 8, dadurch gekennzeichnet, dass die Steuereinheit (101) bei Anwahl einer Datei (203; 204; 205) der auf dem ersten Bereich (202) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) darstellbaren Dateien (203, 204, 205), diese Datei (203) auf dem ersten Bereich (202) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) farblich oder mit einem Graubereich (206) hinterlegt.
  10. Vorrichtung nach Patentanspruch 8 oder 9, dadurch gekennzeichnet, dass die Steuereinheit (101) die Landessprache der zumindest partiellen Audiodaten in den Zusatzdaten speichert und die Transkription der zumindest partiellen Audiodaten der Datei (203) unter Berücksichtigung der Landessprache, vornimmt und das Ergebnis der Transkription in Textform in der Landessprache speichert.
  11. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 10, dadurch gekennzeichnet, dass die Steuereinheit (101), für den Fall, dass in den Zusatzdaten keine Landessprache gespeichert ist, anhand einer Sprachanalyse der zumindest partiellen Audiodaten und/oder anhand einer Analyse des Dateinamens und/oder des Dateityp der Datei (203) und/oder der Landessprache desjenigen Landes, indem sich die Vorrichtung aktuell befindet oder in dem die Datei (203) erstellt worden ist, die Landessprache festgelegt und in den Zusatzdaten speichert.
  12. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 11, dadurch gekennzeichnet, dass die Steuereinheit (101) das Ergebnis der Transkription in auswählbare Landessprachen mittels vorhandener Übersetzungsroutinen übersetzt und in den Zusatzdaten mit der Angabe der jeweiligen Landessprache in der Speichereinheit (102) abspeichert.
  13. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 12, dadurch gekennzeichnet, dass die Steuereinheit (102) den Zusatzdaten einer Datei (203; 204; 205) einen Header zuweist, in dem die Steuereinheit (101) die Landessprache, die Anzahl der Zeichen der Transkription in Textform, die Anzahl der Übersetzungen und der Sprachen, in denen die Übersetzung erfolgt ist, jeweils mit der Anzahl der Zeichen, vorzugsweise in Textform, speichert.
  14. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 13, dadurch gekennzeichnet, dass die Steuereinheit (101) die Zusatzdaten, die die Steuereinheit (101) in lesbarer Textform auf dem zweiten Bereich (207) der mindestens zwei voneinander abgegrenzten Bereiche (202, 207) zumindest teilweise darstellt, von einem Benutzer über die Eingabeeinheit (104) editierbar sind und die Steuereinheit (101) vorgenommenen Änderungen in den Zusatzdaten in der Speichereinheit (102) speichert.
  15. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 14, dadurch gekennzeichnet, dass die Vorrichtung ein Diktiergerät, ein Mobiltelefon, ein Laptop oder ein Computer ist.
  16. Vorrichtung nach einem der vorangehenden Patentansprüche 8 bis 15, dadurch gekennzeichnet, dass eine in der Speichereinheit (102) gespeicherten Datei (203, 204, 205) ein Diktat oder eine Sprachaufnahme ist, die über ein an der Eingabeeinheit (104) anschließbares Mikrofon (105) aufnehmbar oder über eine Schnittstelle der Speichereinheit (102) zuführbar und in der Speichereinheit (102) gespeichert ist.
DE102017103533.8A 2017-02-21 2017-02-21 Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien Pending DE102017103533A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102017103533.8A DE102017103533A1 (de) 2017-02-21 2017-02-21 Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102017103533.8A DE102017103533A1 (de) 2017-02-21 2017-02-21 Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien

Publications (1)

Publication Number Publication Date
DE102017103533A1 true DE102017103533A1 (de) 2018-08-23

Family

ID=63045948

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102017103533.8A Pending DE102017103533A1 (de) 2017-02-21 2017-02-21 Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien

Country Status (1)

Country Link
DE (1) DE102017103533A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111863043A (zh) * 2020-07-29 2020-10-30 安徽听见科技有限公司 音频转写文件生成方法、相关设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1109390A2 (de) 1999-12-08 2001-06-20 AT&T Corp. System und Verfahren zum Suchen und Browsen von Sprachpostnachrichten mittels automatischer Spracherkennung
US20080273675A1 (en) 2007-05-03 2008-11-06 James Siminoff Systems And Methods For Displaying Voicemail Transcriptions
US8345832B2 (en) 2009-01-09 2013-01-01 Microsoft Corporation Enhanced voicemail usage through automatic voicemail preview

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1109390A2 (de) 1999-12-08 2001-06-20 AT&T Corp. System und Verfahren zum Suchen und Browsen von Sprachpostnachrichten mittels automatischer Spracherkennung
US20080273675A1 (en) 2007-05-03 2008-11-06 James Siminoff Systems And Methods For Displaying Voicemail Transcriptions
US8345832B2 (en) 2009-01-09 2013-01-01 Microsoft Corporation Enhanced voicemail usage through automatic voicemail preview

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MUTHUSAMY, Yeshwant K.; BARNARD, Etienne; COLE, Ronald A. Reviewing automatic language identification. IEEE Signal Processing Magazine, 1994, 11. Jg., Nr. 4, S. 33-41. doi: 10.1109/79.317925

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111863043A (zh) * 2020-07-29 2020-10-30 安徽听见科技有限公司 音频转写文件生成方法、相关设备及可读存储介质

Similar Documents

Publication Publication Date Title
DE60010827T2 (de) Hintergrundsystem für Audiodatenbeseitigung
DE60020773T2 (de) Graphische Benutzeroberfläche und Verfahren zur Änderung von Aussprachen in Sprachsynthese und -Erkennungssystemen
DE60012655T2 (de) Audiowiedergabe von einem geschriebenen Dokument aus mehreren Quellen
DE3910467C2 (de) Verfahren und Vorrichtung zur Erzeugung von Berichten
DE10040214B4 (de) Verfahren und System zur automatischen Erkennung einer Aktualisierung eines Sprachmodells in einem Spracherkennungssystem
DE60035001T2 (de) Sprachsynthese mit Prosodie-Mustern
DE69834553T2 (de) Erweiterbares spracherkennungssystem mit einer audio-rückkopplung
DE60308952T2 (de) Verfahren und System zur Anzeige und Verknüpfung von Gegenständen aus elektronischer Tinte mit erkanntem Text und Objekten
Schmidt EXMARaLDA and the FOLK tools-two toolsets for transcribing and annotating spoken language.
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE69819690T2 (de) Spracherkennungsvorrichtung unter verwendung eines befehlslexikons
EP1168298A2 (de) Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe
DE102010020829A1 (de) System und Verfahren zum Generieren von Suchtermen
DE10124429A1 (de) System und Verfahren für eine verbesserte Rechtschreibprüfung
DE10151648B4 (de) Verfahren und Vorrichtung zum Erfassen und Speichern von während einer computerbasierten Sitzung gemachten Notizen
DE10054583A1 (de) Verfahren und Vorrichtung zur Behandlung von Sprachinformationen
DE102006034192A1 (de) Spracherkennungsverfahren, -system und -vorrichtung
DE10022586A1 (de) Verfahren zum Erzeugen einer Sprachdatenbank für einen Zielwortschatz zum Trainieren eines Spracherkennungssystems
DE10130510A1 (de) Einrichtung und Verfahren zum Erzeugen einer Audioaufzeichnung mit angekoppelten Daten
DE102017103533A1 (de) Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien
Pincemin et al. Textometry on audiovisual corpora
DE112014006957B4 (de) Informations-Bereitstellsystem
EP2815395A1 (de) Verfahren und einrichtung zur phonetisierung von textenthaltenden datensätzen
EP1359566A1 (de) Verfahren und Anordnung zur sprachbasierten Nutzung von Speichersystemen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
DE112020002116T5 (de) Informationsverarbeitungsvorrichtung und Verfahren und Programm

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0017280000

R082 Change of representative

Representative=s name: DIE PATENTERIE GBR, DE

R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017280000

Ipc: G06F0040400000

R002 Refusal decision in examination/registration proceedings
R006 Appeal filed
R008 Case pending at federal patent court
R081 Change of applicant/patentee

Owner name: GRUNDIG BUSINESS SYSTEMS GMBH & CO. KG, DE

Free format text: FORMER OWNER: GRUNDIG BUSINESS SYSTEMS GMBH, 95448 BAYREUTH, DE

Owner name: GBS ELECTRONIC SOLUTIONS GMBH, DE

Free format text: FORMER OWNER: GRUNDIG BUSINESS SYSTEMS GMBH, 95448 BAYREUTH, DE

R081 Change of applicant/patentee

Owner name: GRUNDIG BUSINESS SYSTEMS GMBH & CO. KG, DE

Free format text: FORMER OWNER: GBS ELECTRONIC SOLUTIONS GMBH, 95448 BAYREUTH, DE