DE19953813A1 - Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung - Google Patents

Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung

Info

Publication number
DE19953813A1
DE19953813A1 DE1999153813 DE19953813A DE19953813A1 DE 19953813 A1 DE19953813 A1 DE 19953813A1 DE 1999153813 DE1999153813 DE 1999153813 DE 19953813 A DE19953813 A DE 19953813A DE 19953813 A1 DE19953813 A1 DE 19953813A1
Authority
DE
Germany
Prior art keywords
speech recognition
creating
procedure
telephone call
integrated speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1999153813
Other languages
English (en)
Inventor
Axel Susen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PUNKT GES fur SOFTWARE MBH S
Original Assignee
PUNKT GES fur SOFTWARE MBH S
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PUNKT GES fur SOFTWARE MBH S filed Critical PUNKT GES fur SOFTWARE MBH S
Priority to DE1999153813 priority Critical patent/DE19953813A1/de
Publication of DE19953813A1 publication Critical patent/DE19953813A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/10Telephonic communication systems specially adapted for combination with other electrical systems with dictation recording and playback systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/656Recording arrangements for recording a message from the calling party for recording conversations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities

Abstract

Es wurde eine Einrichtung vorgestellt, die aus einem Zugang zu einem öffentlichen Kommunikationsnetz, einem Algorithmus zur Spracherkennung, einer Einheit zur Datenverarbeitung, einer Datenbank zur Speicherung von Daten, eine Systemuhr sowie einem Terminal besteht und Telefongespräche über einen Spracherkennungsalgorithmus derart verarbeitet, daß personen- bzw. leitungsbezogene Gesprächsprotokolle erstellt und abgespeichert werden. DOLLAR A Es besteht die Möglichkeit, die Erfindung ohne Gesprächsteilnehmer zu benutzen. Damit ist z. B. die Möglichkeit zur Abgabe eines Ferndiktas gegeben. DOLLAR A Man kann die Erfindung aber auch über eine Konferenzschaltung mit mehr als zwei Gesprächsteilnehmern benutzen. DOLLAR A Die Gesprächsteilnehmer werden auf die Möglichkeit aufmerksam gemacht, daß das Gespräch aufgenommen wird. DOLLAR A Die Abspeicherung von Gesprächen und den dazugehörigen Daten in der Datenbank ist optional. Daher ist ein Zwischenspeicher eingesetzt, der jedes Gespräch in einer Audiodatei aufzeichnet. DOLLAR A Zu den Protokollen kann ein Gesprächsthema sowie der Name des Gesprächspartners eingegeben werden.

Description

Einrichtungen zur Aufzeichnung von Telefongesprächen existieren bereits (siehe z. B. das Patent mit der Nummer WO 97/49219). Diese Erfindungen haben es ermöglicht, daß ein Gesprächsführer seine Gespräche wiederholt auf seinen Inhalt überprüfen kann. Eine gezielte Suche nach bestimmten Gesprächsinhalten und Themen ist damit jedoch nicht möglich. Es ist erforderlich, das gesamte Gespräch bis zur gewünschten Stelle abzuhören, bzw. ungezielt danach zu suchen (das Band vor- und zurückspulen). Diese Zeit wird gespart, wenn man ein schriftliches Protokoll des Gesprächs erstellt und mit der Suchfunktion eines Textverarbeitungsprogrammes gezielt nach Stichworten suchen kann. Es ist darüber hinaus auch weniger Speicherplatz für die geschriebenen Textdateien erforderlich, was wiederum kostengünstiger ist. Diese Möglichkeit bedingt aber wieder viel Zeit oder eine zusätzliche Schreibkraft, die sich mit dem Schreiben dieser Protokolle beschäftigt. Außerdem müßte jedes Gespräch mitgeschnitten werden, da man erst während oder nach dem Gespräch dessen Wichtigkeit verifizieren kann. Dafür spricht jedoch die gezielte Stichwortsuche eines Textverarbeitungsprogrammes, die effizient zu entsprechenden Textpassagen bzw. Gesprächsinhalten führt.
Die Lösung dieser Probleme stellt die sprecherunabhängige Spracherkennung mittels computergesteuertem Sprachalgorithmus dar. Die über ein Netzwerk abgewickelten Anrufe werden damit über ein Datenverarbeitungssystem mit einer Datenbank verarbeitet. Somit werden die Voraussetzungen geschaffen, mit dieser Spracherkennung auch Konferenzschaltungen, bei denen mehr als zwei Gesprächspartner an dem Gespräch teilnehmen per Telefon aufzuzeichnen.
Die Option, diese Einrichtung als Ferndiktiergerät zu benutzen wäre denkbar. Damit könnte der Anwender über das öffentliche Fernsprechnetz ein Diktat computergesteuert an seine Telefonanlage weitergeben. Dort sorgt der Computer für die Speicherung des Diktats. Diese Möglichkeit erschließt auch die Abgabe von Diktaten fremder Personen an den oder die Anwender der Erfindung.
Das Diktat oder das Gesprächsprotokoll soll als Audiodatei oder als Textdatei abspeicherbar sein.
Der Bediener dieser Erfindung hat die Option, vor, während oder nach dem Telefongespräch die Aufzeichnung des Gesprächs zu veranlassen. Ein Gesprächsteilnehmer muß über die Möglichkeit informiert werden, daß alles, was von ihm gesagt wird, aufgezeichnet werden kann. Wird ein Telefongespräch geführt, so wird es von Beginn an in einem Zwischenspeicher als Audiodatei aufgezeichnet. Jede Leitung wird gesondert abgespeichert. Nachdem das gesamte Gespräch aufgezeichnet wurde, veranlaßt der Anwender die schriftliche Speicherung in einer Textdatei oder die Löschung des Gesprächs aus dem Arbeitsspeicher der Erfindung. Beim Speicherbefehl wird mit dem Sprachalgorithmus zur Spracherkennung und der Systemuhr mittels der Datenverarbeitung ein schriftliches Protokoll des Telefongesprächs erstellt und in der Datenbank der Erfindung als Textdatei abgespeichert. Dieses Protokoll unterscheidet die Gesprächsparteien. Anhand der Systemuhr werden chronologisch die Sprachblöcke unterteilt. Diese Sprachblöcke werden der Signalleitung zugeordnet und danach benannt, woher die Signale kommen. Das bedeutet, daß bei der Teilnahme von z. B. vier Personen in einer Konferenzschaltung gespeichert wird, was Sprecher A, B, C oder D bzw. Sprecher 1, 2, 3 oder 4 zu welchem Zeitpunkt in welcher Reihenfolge gesagt hat.
Aus diesen Ausführungen geht hervor, daß die Erfindung nicht nur für zwei Gesprächsteilnehmer, sondern auch für drei und mehr Personen auf jeweils einer Signalleitung angedacht ist. Hierbei setzt das System jedoch den Ausgangspunkt der Anrufe vom Anwender der Erfindung voraus.
Die Erfindung ermöglicht aber auch die Eingabe eines Diktates in eine Audiodatei des Arbeitsspeichers. Dabei wird keine Verbindung zu einem weiteren Gesprächsteilnehmer aufgebaut. Anschließend wird die Audiodatei nach Eingabe eines Befehls vom Sprachalgorithmus in eine Textdatei umgewandelt und in der Datenbank der Erfindung abgespeichert. Diese Option der Eingabe eines Diktates besteht auch für externe Teilnehmer des öffentlichen Fernsprechnetzes. Man könnte die Erfindung in diesem Modus auch als Ferndiktiergerät bezeichnen. Über den Sprachalgorithmus und die Datenverarbeitung wird per Menü die Diktatfunktion aktiviert. Anschließend wird auch hier die Audiodatei in eine Textdatei umgewandelt und in der Datenbank mit gewünschter Kennzeichnung, wie z. B. Anlaß des Anrufs/Diktats abgespeichert.
Die Eingabe erfolgt über das Mikrofon der Fernsprecheinheit des Computers in Verbindung mit dem Sprachalgorithmus.
Anhand der Systemuhr werden das Datum sowie die Uhrzeiten des Gesprächsbeginns und des Gesprächsendes abgespeichert.
Wird der Anrufer angerufen, kann das Datenverarbeitungssystem die vom Anrufer übermittelten Daten, wie z. B. die Telefonnummer des Gesprächsteilnehmers abspeichern und der Textdatei zuordnen.
Die Textdatei wird in einer Windows-kompatiblen Form abgespeichert.
So kann der Anwender sich in der Datenbank gespeicherte Protokolle auf dem Terminal mit Hilfe von Textverarbeitungssystemen unter "Windows" anzeigen lassen.
Eine Stichwortsuchfunktion, die in der Regel jedes Textverarbeitungssystem aufweist, ermöglicht dem Anwender, ein Protokoll thematisch auf Gesprächsinhalte hin zu durchsuchen.
Der Anwender der Erfindung kann die Sprachen mit denen gesprochen wird und die Protokollsprachen selbst wählen. Dies setzt voraus, daß verschiedene Sprachen erkannt werden. Weiterhin kann eine Übersetzung des Protokolls von der gesprochenen Sprache in eine andere Protokollsprache erstellt werden.
Als Auswahlsprachen wären Deutsch, Englisch, Französisch, und Spanisch denkbar.

Claims (11)

1. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung ist dadurch gekennzeichnet, daß es aus einem Zugang zu einem öffentlichen Kommunikationsnetz, einem Algorithmus zur Spracherkennung, einer Einheit zur Datenverarbeitung, einem Arbeitsspeicher, einer Datenbank zur Speicherung von Daten, einer Systemuhr sowie einem Terminal besteht, damit diese Einrichtung Telefongespräche über einen Spracherkennungsalgorithmus derart verarbeitet, daß leitungsbezogene Gesprächsprotokolle erstellt und als Textdateien abgespeichert werden.
2. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 ist dadurch gekennzeichnet, daß jedes Gespräch des Anwenders im Arbeitsspeicher als Audiodatei gespeichert wird.
3. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 und 2 ist dadurch gekennzeichnet, daß der Anwender vor, während oder nach dem Gespräch bestimmt, ob dieser Anruf in der Datenbank als Textdatei aufgezeichnet oder gelöscht wird. Nach Abspeichern der Textdatei wird die zugehörige Audiodatei gelöscht.
4. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 3 ist dadurch gekennzeichnet, daß der Anwender zu Beginn jeder Audiodatei das Thema des Gesprächs und die Namen der teilnehmenden Personen abspeichern kann.
5. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 4 ist dadurch gekennzeichnet, daß die Systemuhr am Anfang jeder Sprachdatei das Datum und die Uhrzeiten des Gesprächsbeginns und des Gesprächsendes abspeichert.
6. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 5 ist dadurch gekennzeichnet, daß die Telefonnummer jedes Gesprächsteilnehmers in der Sprachdatei gespeichert wird.
7. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 6 ist dadurch gekennzeichnet, daß Konferenzgespräche mit mehr als zwei Teilnehmern gespeichert werden können.
8. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 7 ist dadurch gekennzeichnet, daß die Gesprächsteilnehmer bei Aktivierung der Gesprächsaufzeichnung durch eine eingespielte Ansage unüberhörbar darauf aufmerksam gemacht werden, daß das Gespräch aufgezeichnet wird.
9. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 5 ist dadurch gekennzeichnet, daß der Anwender die Erfindung auch ohne Gesprächsteilnehmer zur Erstellung eines Diktats oder eines Memorandums benutzen kann.
10. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 5 ist dadurch gekennzeichnet, daß ein externer Anrufer ohne einen Gesprächsteilnehmer die Erfindung zur Abgabe einer Nachricht oder eines Memorandums benutzen kann.
11. Verfahren zur Erstellung eines Telefongesprächprotokolls mit integrierter Spracherkennung nach Anspruch 1 bis 10 ist dadurch gekennzeichnet, daß Telefongesprächsprotokolle, die in der Datenbank als Textdatei gespeichert sind, zwecks Einsichtnahme in Papierform ausgedruckt werden können.
DE1999153813 1999-11-09 1999-11-09 Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung Withdrawn DE19953813A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE1999153813 DE19953813A1 (de) 1999-11-09 1999-11-09 Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1999153813 DE19953813A1 (de) 1999-11-09 1999-11-09 Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung

Publications (1)

Publication Number Publication Date
DE19953813A1 true DE19953813A1 (de) 2001-05-10

Family

ID=7928391

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1999153813 Withdrawn DE19953813A1 (de) 1999-11-09 1999-11-09 Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung

Country Status (1)

Country Link
DE (1) DE19953813A1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10220518B4 (de) * 2002-05-08 2005-10-27 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformation
DE10220524B4 (de) * 2002-05-08 2006-08-10 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
EP2288130A1 (de) 2009-08-13 2011-02-23 me2me AG Kontext- und benutzerdefinierte Etikettierungstechnik in einem persönlichen Informationsdienst mit Sprachinteraktion

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4101200A1 (de) * 1991-01-17 1992-07-23 Standard Elektrik Lorenz Ag Kommunikationssystem
EP0586954A2 (de) * 1992-09-11 1994-03-16 Siemens Rolm Communications Inc. Techniken zur Erzeugung von Personalcomputeranzeigen und gedruckten Transkripten aus Sprachpostnachrichten
DE4331710A1 (de) * 1993-09-17 1995-03-23 Sel Alcatel Ag Verfahren und Vorrichtung zum Erstellen und Bearbeiten von Textdokumenten
DE19603835A1 (de) * 1995-02-10 1996-08-22 Metz Werke Gmbh & Co Kg Fernsehempfänger mit einem Datenspeicher
US5724410A (en) * 1995-12-18 1998-03-03 Sony Corporation Two-way voice messaging terminal having a speech to text converter
EP0835015A2 (de) * 1996-10-02 1998-04-08 AT&T Corp. Verbessertes Anklopf- und Nachrichtensystem
GB2327173A (en) * 1997-07-09 1999-01-13 Ibm Voice recognition and recording of telephone conversations as text

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4101200A1 (de) * 1991-01-17 1992-07-23 Standard Elektrik Lorenz Ag Kommunikationssystem
EP0586954A2 (de) * 1992-09-11 1994-03-16 Siemens Rolm Communications Inc. Techniken zur Erzeugung von Personalcomputeranzeigen und gedruckten Transkripten aus Sprachpostnachrichten
DE4331710A1 (de) * 1993-09-17 1995-03-23 Sel Alcatel Ag Verfahren und Vorrichtung zum Erstellen und Bearbeiten von Textdokumenten
DE19603835A1 (de) * 1995-02-10 1996-08-22 Metz Werke Gmbh & Co Kg Fernsehempfänger mit einem Datenspeicher
US5724410A (en) * 1995-12-18 1998-03-03 Sony Corporation Two-way voice messaging terminal having a speech to text converter
EP0835015A2 (de) * 1996-10-02 1998-04-08 AT&T Corp. Verbessertes Anklopf- und Nachrichtensystem
GB2327173A (en) * 1997-07-09 1999-01-13 Ibm Voice recognition and recording of telephone conversations as text

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10220518B4 (de) * 2002-05-08 2005-10-27 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformation
DE10220524B4 (de) * 2002-05-08 2006-08-10 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
EP2288130A1 (de) 2009-08-13 2011-02-23 me2me AG Kontext- und benutzerdefinierte Etikettierungstechnik in einem persönlichen Informationsdienst mit Sprachinteraktion

Similar Documents

Publication Publication Date Title
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
EP0614160B1 (de) Tragbares Sprachmodul
DE60019301T2 (de) Verbesserte text-zu-sprache umsetzung
DE10220524B4 (de) Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
EP1324314A1 (de) Spracherkennungssystem und Verfahren zum Betrieb eines solchen
DE4434255A1 (de) Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
DE10054583A1 (de) Verfahren und Vorrichtung zur Behandlung von Sprachinformationen
EP1606794B1 (de) Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem
DE60018349T2 (de) Erzeugung von einem Namenwörterbuch aus aufgezeichneten telephonischen Grüssen für die Spracherkennung
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE102018001572A1 (de) Automatische verzögerung der wiedergabe einer nachricht bei einer vorrichtung
DE19751123C1 (de) Vorrichtung und Verfahren zur sprecherunabhängigen Sprachnamenwahl für Telekommunikations-Endeinrichtungen
DE19953813A1 (de) Verfahren zur Erstellung eines schriftlichen Telefongesprächprotokolls mit integrierter Spracherkennung
DE102019208742B4 (de) Sprachübersetzungssystem zum Bereitstellen einer Übersetzung eines Spracheingabesignals eines Sprechers in ein anderssprachiges Sprachausgabesignal für einen Hörer sowie Übersetzungsverfahren für ein derartiges Sprachübersetzungssystem
DE10118125A1 (de) Automatisches Auskunftssystem
DE69910412T2 (de) Sprachgesteuerte navigation für einen elektronischen post leser
DE102008046431A1 (de) Sprachdialogsystem mit Reject-Vermeidungsverfahren
EP1444855A1 (de) Rücksetzen von versendeten informationen
DE10048069A1 (de) Elektronische Textübertragungsvorrichtung
EP0822694B1 (de) Bedienerführung eines Anrufbeantworters
DE3519327A1 (de) Verfahren fuer die sprachausgabe zur bedienerfuehrung an endgeraeten von fernmelde-, insbesondere fernsprechvermittlungsanlagen
EP0881811B1 (de) Verfahren und Anordnung für ein sprachgesteuertes Kommunikationsendgerät mit gegen unbeabsichtigte Verfälschungen gesicherter akustischer Bedienerführung
DE19956572B4 (de) Verfahren zur Telekommunikation und Kommunikationsterminal
DE60026955T2 (de) Akustische Identifizierung des Anrufers und des Angerufenes für mobiles Kommunikationsgerät
DE19517470A1 (de) Digitaler Anrufbeantworter

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8122 Nonbinding interest in granting licenses declared
8139 Disposal/non-payment of the annual fee
8170 Reinstatement of the former position
8139 Disposal/non-payment of the annual fee