WO2002052529A1 - Multimedia platform and method for supporting an interactive, voice-oriented access to information that is to be transmitted - Google Patents

Multimedia platform and method for supporting an interactive, voice-oriented access to information that is to be transmitted Download PDF

Info

Publication number
WO2002052529A1
WO2002052529A1 PCT/DE2001/004682 DE0104682W WO02052529A1 WO 2002052529 A1 WO2002052529 A1 WO 2002052529A1 DE 0104682 W DE0104682 W DE 0104682W WO 02052529 A1 WO02052529 A1 WO 02052529A1
Authority
WO
WIPO (PCT)
Prior art keywords
language
interactive
scripts
information
programmed
Prior art date
Application number
PCT/DE2001/004682
Other languages
German (de)
French (fr)
Inventor
Laurent Hue
Denis Perraud
Laurent Strullu
Sahra Tronet
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2002052529A1 publication Critical patent/WO2002052529A1/en

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/001Teaching or communicating with blind persons
    • G09B21/006Teaching or communicating with blind persons using audible presentation of the information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals

Definitions

  • Multimedia platform and method to support interactive, language-oriented access to information to be transmitted.
  • the subject of the application relates to an arrangement and a method which are used for voice-controlled, interactive access and voice-oriented output of transmitted data.
  • Information that is accessed is usually displayed visually. Access is then made using a device that contains at least one monitor and often a keyboard. Because of the greater convenience of language delivery of information and language access to services available on the web, it is desirable to provide access where data can be accessed through a language communication medium, e.g. Telephone, are available.
  • a language communication medium e.g. Telephone
  • the algorithms are designed according to the type of data being accessed, ie application-specific.
  • the course of the linguistic interaction is regulated by means of an internal representation, which often makes changes, adjustments and new introductions of dialog processes difficult due to poor accessibility.
  • Changes or additions to program structures for language-oriented applications also require data-type-specific changes.
  • the object of the application is based on the problem of specifying an arrangement and a method for supporting interactive, language-oriented access to information to be transmitted, which avoids data-type-specific adaptations and is flexible with regard to the design of the language interaction.
  • scripts programmed in an interactive speech output language are processed and interpreted.
  • Templates are used to generate such scripts, the templates having a static part programmed in the language supporting interactive speech output and with placeholders which can be dynamically replaced by information to be transmitted.
  • Scripts are formed from the static part of the templates by the dynamic transmission of information and replacement of the placeholders in the template by transmitted information (claims 1 and 6).
  • the transmitted information may e.g. are e-mail messages, website information or database information (claims 2 and 7).
  • the invention defines an interface where data to be processed are converted into a uniform format.
  • the templates are used to define dialogues and sessions for interactive, language-oriented access to the transmitted data. Depending on requirements or depending on the course of the session, the creation and editing of further scripts can be initiated by scripts generated using templates.
  • the invention has the advantage that software for further processing of the transmitted data acts on scripts programmed in a uniform language and is therefore independent of the data type. Program structures for the language-oriented further processing of the transmitted data or for processing and interpreting the scripts, e.g. Browser software or a
  • An XML (Extensible Markup Language) language that supports interactive speech output in particular VoxML TM, VoiceXML TM or DialogML TM, can be selected as the language for programming the scripts (claims 3 and 8). This choice has the advantage that the selected language is standardized and generally accessible, making it easier to use in conjunction with other software.
  • the templates according to the invention can be edited in particular for changing the static part (claims 4 and 9), which in a simple manner e.g. participant-specific adaptation of sessions made possible by modifying templates or the scripts formed from them.
  • Fig. 1 Creation of scripts using templates - schematically -,
  • a template TMP is shown in the top left of FIG. 1, which is formed with static parts XMLst - in the exemplary embodiment the static part is programmed in an XML (Extensible Markup Language) language - and dynamically replaceable placeholders tg.
  • the placeholders tg are replaced by data dat which, for example, e-mail messages iml, web information iwb or database information cations can include idb - indicated at the top right in Figure 1.
  • a script SCRxml is generated in an XML (extensible markup language) language that supports interactive speech output, which script can be used with other software of a multimedia platform according to the invention, for example language browser BRxml - Not shown in Figure 1 -, edited and interpreted.
  • XML extensible markup language
  • FIG. 2 shows a multimedia platform VOX according to the invention.
  • a language browser BRxlm and software for converting text to language TTS are shown on one side of the VOX multimedia platform.
  • the multimedia platform can be equipped with further program structures for language processing.
  • a dashed line that divides the multimedia platform into two is intended to clarify that the software of the multimedia platform VOX, which is used for language processing or for interactive language-oriented access to information, only supports XML (extensible markup language) that supports a certain interactive language output.
  • Scripts SCR and templates TMP are shown on the other side of the multimedia platform VOX according to the invention.
  • the SCR scripts represent program structures that are programmed in the XML (extensible markup language) language that supports interactive speech output and that are used, for example, by the browser software BRxml or the software for converting text to language TTS to the right of the dashed line as part of an interactive language theory - processed session and interpreted.
  • Scripts SCR for language-oriented access to e-mail messages SCRml, website information SCRwb and database information SCRdt are shown as examples.
  • the SCR scripts are formed from templates TMPml, TMPwb and TMPdt by dynamically replacing placeholders tg with transmitted information, for example e-mail messages iml, website information iwb and database information idt - in the fi gur indicated by block arrows.
  • the TMP templates include static program parts XMLmI, XMLwb and XMLdt, which are programmed in the XML (extensible markup language) language that supports interactive speech output. These program parts are also indicated in the SCR scripts.
  • the information iml, iwb and idt for forming the SCR scripts are requested and transmitted as required from the appropriate server facilities or databases.
  • the figure shows a server for e-mail messages SERml, a server for website information SERweb and a database SERdt. The transmission of the corresponding information is indicated by arrows formed with lines.
  • Figure 3 shows a section of a template realized with VoxML TM.
  • the template is used for language-oriented access to e-mail messages.
  • Lines 5 and 6 contain the placeholders ⁇ VP_LAST_DATE>, ⁇ VP_NUM_NEW_EMAIL_WORD> and ⁇ VP_NEW_EMAIL_WORD>.
  • information about the replacement of the three placeholders is requested by the server that provides the e-mail messages and the placeholders by the date of the last e-mail Session, the number of new e-mail messages and the word messages replaced.
  • This template can be easily edited and modified, for example by changing the text to be output in the static part. For example, the text on line 14 To dele ' te all messages in yo r box, press 3, to be replaced by to send all of your messages to the litter box, press 3.

Landscapes

  • Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Interactive voice-oriented sessions are defined with the assistance of scripts programmed in a language that supports interactive voice output. The scripts are generated with the use of templates, which are formed of a static part and of dynamic wildcards. During a session, the wildcards are replaced by transmitted data. The presented methodology can be used independently of the type of the transmitted data. As a result, this renders data-specific adaptations of the software unnecessary.

Description

Beschreibungdescription
Multimediaplattform und Verfahren zur Unterstützung von einem interaktiven, sprachorientierten Zugriff auf zu übermittelnde Informationen.Multimedia platform and method to support interactive, language-oriented access to information to be transmitted.
Der Anmeldungsgegenstand bezieht sich auf eine Anordnung und ein Verfahren, die bei einem sprachgesteuerten, interaktiven Zugriff und sprachorientierter Ausgabe von übermittelten Da- ten zum Einsatz kommen.The subject of the application relates to an arrangement and a method which are used for voice-controlled, interactive access and voice-oriented output of transmitted data.
Üblicherweise werden Informationen, auf die zugegriffen wird, visuell dargestellt. Der Zugriff geschieht dann mittels eines Geräts, das zumindest einen Monitor und häufig eine Tastatur beinhaltet. Wegen der größeren Zweckmäßigkeit einer sprachlichen Ausgabe von Informationen und eines sprachlichen Zugriffs auf Dienstleistungen, die auf dem Web verfügbar sind, ist es wünschenswert, einen Zugang zu ermöglichen, wo Daten mittels eines sprachlichen Kommunikationsmediums, z.B. Telefon, abrufbar sind.Information that is accessed is usually displayed visually. Access is then made using a device that contains at least one monitor and often a keyboard. Because of the greater convenience of language delivery of information and language access to services available on the web, it is desirable to provide access where data can be accessed through a language communication medium, e.g. Telephone, are available.
Deshalb wurden für verschiedene Anwendungen Algorithmen für die Sprachausgabe und Sprachinteraktion entwickelt, z.B. zum Lesen von Webseiten oder für den Zugriff auf Datenbanken.Therefore, algorithms for speech output and speech interaction have been developed for various applications, e.g. to read web pages or to access databases.
Die Algorithmen werden entsprechend dem Datentyp, auf den zugegriffen wird, d.h. anwendungsspezifisch, konzipiert. Der Ablauf der sprachlichen Interaktion wird mittels einer internen Darstellung geregelt, die häufig aufgrund von schlechter Zugänglichkeit Änderungen, Anpassungen und Neueinführungen von Dialogabläufen erschwert. Auch sind bei Änderungen oder Ergänzungen von Programmstrukturen für sprachorientierte Anwendungen datentypspezifische Änderungen notwendig. Dem Anmeldungsgegenstand liegt das Problem zugrunde, eine Anordnung und ein Verfahren zur Unterstützung von einem interaktiven, sprachorientierten Zugriff auf zu übermittelnde Informationen anzugeben, das datentypspezifische Anpassungen vermeidet und flexibel hinsichtlich der Gestaltung der sprachlichen Interaktion ist.The algorithms are designed according to the type of data being accessed, ie application-specific. The course of the linguistic interaction is regulated by means of an internal representation, which often makes changes, adjustments and new introductions of dialog processes difficult due to poor accessibility. Changes or additions to program structures for language-oriented applications also require data-type-specific changes. The object of the application is based on the problem of specifying an arrangement and a method for supporting interactive, language-oriented access to information to be transmitted, which avoids data-type-specific adaptations and is flexible with regard to the design of the language interaction.
Das Problem wird durch die Ansprüche 1 und 6 gelöst.The problem is solved by claims 1 and 6.
Bei der Erfindung werden in einer interaktive Sprachausgabe unterstützenden Sprache programmierte Skripten bearbeitet und interpretiert. Zur Erzeugung von derartigen Skripten werden Schablonen verwendet, wobei die Schablonen einen in der interaktive Sprachausgabe unterstützenden Sprache programmierten statischen Teil und mit durch zu übermittelnde Infor- mationen dynamisch ersetzbare Platzhalter aufweisen. DieIn the invention, scripts programmed in an interactive speech output language are processed and interpreted. Templates are used to generate such scripts, the templates having a static part programmed in the language supporting interactive speech output and with placeholders which can be dynamically replaced by information to be transmitted. The
Skripten werden aus dem statischen Teil der Schablonen durch die dynamische Übermittlung von Informationen und Ersetzung der Platzhalter in der Schablone durch übermittelte Informationen gebildet (Anspruch 1 und 6) . Bei den übermittelten In- formationen kann es sich z.B. um E-mail-Nachrichten, Webseiteninformationen oder Datenbankeninformationen handeln (Anspruch 2 und 7) . Durch die Erfindung wird eine Schnittstelle definiert, wo zu verarbeitende Daten in ein einheitliches Format übergeführt werden. Durch die Schablonen werden Dialo- ge bzw. Sitzungen für einen interaktiven, sprachorientierten Zugang zu übermittelnde Daten definiert. Dabei kann anforderungsabhängig bzw. abhängig vom Sitzungsverlauf durch mittels Schablonen erzeugter Skripten die Erzeugung und Bearbeitung weiterer Skripten initiiert werden. Die Erfindung hat den Vorteil, dass Software zur Weiterverarbeitung der übermittelten Daten auf in einer einheitlichen Sprache programmierte Skripten wirkt und damit unabhängig von dem Datentyp ist. Programmstrukturen für die sprachorientierte Weiterverarbeitung der übermittelten Daten bzw. zur Bearbeitung und Inter- pretation der Skripten wie z.B. Browsersoftware oder eineScripts are formed from the static part of the templates by the dynamic transmission of information and replacement of the placeholders in the template by transmitted information (claims 1 and 6). The transmitted information may e.g. are e-mail messages, website information or database information (claims 2 and 7). The invention defines an interface where data to be processed are converted into a uniform format. The templates are used to define dialogues and sessions for interactive, language-oriented access to the transmitted data. Depending on requirements or depending on the course of the session, the creation and editing of further scripts can be initiated by scripts generated using templates. The invention has the advantage that software for further processing of the transmitted data acts on scripts programmed in a uniform language and is therefore independent of the data type. Program structures for the language-oriented further processing of the transmitted data or for processing and interpreting the scripts, e.g. Browser software or a
Software für die Umwandlung von Text in Sprache (Anspruch 5 und 10) können geändert oder ergänzt werden, ohne dass datentypspezifische Anpassungen notwendig sind.Software for converting text into speech (claim 5 and 10) can be changed or supplemented without data type-specific adjustments being necessary.
Als Sprache für die Programmierung der Skripten kann eine in- teraktive Sprachausgabe unterstützenden XML (Extensible Markup Language) Sprache, insbesondere VoxML™ , VoiceXML™ oder DialogML™, gewählt werden (Anspruch 3 und 8) . Diese Wahl hat den Vorteil, dass die gewählte Sprache standardisiert und allgemein zugänglich ist und damit leichter in Verbindung mit weiterer Software eingesetzt werden kann.An XML (Extensible Markup Language) language that supports interactive speech output, in particular VoxML ™, VoiceXML ™ or DialogML ™, can be selected as the language for programming the scripts (claims 3 and 8). This choice has the advantage that the selected language is standardized and generally accessible, making it easier to use in conjunction with other software.
Die erfindungsgemäßen Schablonen sind insbesondere zur Veränderung des statischen Teils editierbar (Anspruch 4 und 9) , was auf einfache Weise eine z.B. teilnehmerbezogene Anpassung von Sitzungen durch die Abänderung von Schablonen bzw. der aus ihnen gebildeten Skripten ermöglicht.The templates according to the invention can be edited in particular for changing the static part (claims 4 and 9), which in a simple manner e.g. participant-specific adaptation of sessions made possible by modifying templates or the scripts formed from them.
Im folgenden wird die Erfindung anhand von Figuren als Aus- führungsbeispiel näher erläutert. Es zeigenThe invention is explained in more detail below with reference to figures as an exemplary embodiment. Show it
Fig. 1: Erzeugung von Skripten mithilfe von Schablonen - schematisch -,Fig. 1: Creation of scripts using templates - schematically -,
Fig. 2: eine die Erfindung realisierende Multimediaplattform und2: a multimedia platform realizing the invention and
Fig. 3: einen Ausschnitt einer mittels VoxML™ realisierten Schablone .3: a section of a template realized using VoxML ™.
Dabei bezeichnen gleiche Bezeichnungen gleiche ElementeThe same designations designate the same elements
Auf der Figur 1 ist links oben eine Schablone TMP dargestellt, die mit statischen Teilen XMLst - in dem Ausführungs- beispiel ist der statische Teil in einer XML (Extensible Markup Language) Sprache programmiert - und dynamisch zu erset- zenden Platzhaltern tg gebildet ist. Die Platzhalter tg werden durch Daten dat ersetzt, die beispielsweise E-mail- Nachrichten iml, Webinformationen iwb oder Datenbankinforma- tionen idb umfassen können - in Figur 1 rechts oben angedeutet. Durch das Ersetzen merg der Platzhalter tg, das in Figur 1 durch zwei zusammenlaufende Pfeile verdeutlicht ist, wird ein Skript SCRxml in einer interaktive Sprachausgabe unter- stützenden XML (extensible markup language) Sprache erzeugt, das mit anderer Software einer erfindungsgemäßen Multimediaplattform, z.B. Sprachbrowser BRxml - in Figur 1 nicht dargestellt -, bearbeitet und interpretiert werden kann.A template TMP is shown in the top left of FIG. 1, which is formed with static parts XMLst - in the exemplary embodiment the static part is programmed in an XML (Extensible Markup Language) language - and dynamically replaceable placeholders tg. The placeholders tg are replaced by data dat which, for example, e-mail messages iml, web information iwb or database information cations can include idb - indicated at the top right in Figure 1. By replacing the placeholder tg, which is illustrated in FIG. 1 by two converging arrows, a script SCRxml is generated in an XML (extensible markup language) language that supports interactive speech output, which script can be used with other software of a multimedia platform according to the invention, for example language browser BRxml - Not shown in Figure 1 -, edited and interpreted.
Figur 2 zeigt eine erfindungsgemäße Multimediaplattform VOX. Auf der einen Seite der Multimediaplattform VOX sind ein Sprachbrowser BRxlm und eine Software für die Umwandlung von Text in Sprache TTS dargestellt. Die Multimediaplattform kann mit weiteren Programmstrukturen zur Sprachbearbeitung ausges- tattet sein. Eine gestrichelte Linie, die die Multimediaplattform zweiteilt, soll verdeutlichen, dass die Software der Multimediaplattform VOX, die zur Sprachbearbeitung bzw. für einen interaktiven sprachorientierten Zugriff auf Informationen dient, nur in einer bestimmten interaktive Sprach- ausgäbe unterstützenden XML (extensible markup language)FIG. 2 shows a multimedia platform VOX according to the invention. On one side of the VOX multimedia platform, a language browser BRxlm and software for converting text to language TTS are shown. The multimedia platform can be equipped with further program structures for language processing. A dashed line that divides the multimedia platform into two is intended to clarify that the software of the multimedia platform VOX, which is used for language processing or for interactive language-oriented access to information, only supports XML (extensible markup language) that supports a certain interactive language output.
Sprache programmierte Anwendungen bzw. Skripten interpretiert und bearbeitet . Auf der anderen Seite der erfindungsgemäßen Multimediaplattform VOX sind Skripten SCR und Schablonen TMP dargestellt. Die Skripten SCR stellen Programmstrukturen dar, die in der interaktive Sprachausgabe unterstützenden XML (extensible markup language) Sprache programmiert sind, und die beispielsweise von der Browsersoftware BRxml oder der Software für die Umwandlung von Text in Sprache TTS rechts der gestrichelten Linie im Rahmen einer interaktiven sprachorien- tierten Sitzung bearbeitet und interpretiert werden. Exemplarisch sind Skripten SCR für einen sprachorientierten Zugriff auf E-mail-Nachrichten SCRml, Webseiteninformationen SCRwb und Datenbankeninformationen SCRdt dargestellt. Die Skripten SCR werden aus Schablonen TMPml, TMPwb und TMPdt gebildet, indem Platzhalter tg dynamisch durch übermittelte Informationen, z.B. E-mail-Nachrichten iml, Webseiteninformationen iwb und Datenbankeninformationen idt ersetzt werden - in der Fi- gur durch Blockpfeile angedeutet. Die Schablonen TMP umfassen neben den Platzhaltern tg statische Programmteilen XMLmI, XMLwb und XMLdt, die in der interaktive Sprachausgabe unterstützenden XML (extensible markup language) Sprache program- miert sind. Diese Programmteile sind auch in den Skripten SCR angedeutet. Es können mehrere Schablonen TMP bzw. Skripten SCR bei einer Sitzung bzw. Anwendung in Anwendung kommen. Dabei kann z.B. bei der Bearbeitung eines Skripts die Bildung und Bearbeitung eines anderen Skriptes initiiert werden. Die Informationen iml, iwb und idt zur Bildung der Skripten SCR werden je nach Bedarf bei entsprechenden Servereinrichtungen bzw. Datenbanken angefordert und übermittelt. In der Figur ist ein Server für E-mail-Nachrichten SERml, ein Server für Webseiteninformationen SERweb und eine Datenbank SERdt darge- stellt. Die Übermittlung der entsprechenden Informationen ist durch mit Linien gebildeten Pfeilen angedeutet.Language programmed applications and scripts interpreted and edited. Scripts SCR and templates TMP are shown on the other side of the multimedia platform VOX according to the invention. The SCR scripts represent program structures that are programmed in the XML (extensible markup language) language that supports interactive speech output and that are used, for example, by the browser software BRxml or the software for converting text to language TTS to the right of the dashed line as part of an interactive language theory - processed session and interpreted. Scripts SCR for language-oriented access to e-mail messages SCRml, website information SCRwb and database information SCRdt are shown as examples. The SCR scripts are formed from templates TMPml, TMPwb and TMPdt by dynamically replacing placeholders tg with transmitted information, for example e-mail messages iml, website information iwb and database information idt - in the fi gur indicated by block arrows. In addition to the placeholders tg, the TMP templates include static program parts XMLmI, XMLwb and XMLdt, which are programmed in the XML (extensible markup language) language that supports interactive speech output. These program parts are also indicated in the SCR scripts. Several templates TMP or scripts SCR can be used in one session or application. For example, the creation and editing of another script can be initiated when editing a script. The information iml, iwb and idt for forming the SCR scripts are requested and transmitted as required from the appropriate server facilities or databases. The figure shows a server for e-mail messages SERml, a server for website information SERweb and a database SERdt. The transmission of the corresponding information is indicated by arrows formed with lines.
Figur 3 zeigt einen Ausschnitt einer mit VoxML™ realisierten Schablone. Die Schablone dient zum sprachorientierten Zugriff auf E-mail-Nachrichten. In Zeile 5 und 6 stehen die Platzhalter <VP_LAST_DATE>, <VP_NUM_NEW_EMAIL_WORD> und <VP_NEW_EMAIL_WORD> . Bei einer interaktiven sprachorientierten E-mail-Sitzung, wo auf neue E-mail-Nachrichten zugegriffen werden soll, werden Informationen zum Ersetzen der drei Platzhalter von dem Server, der die Emailnachrichten bereitstellt, abgefragt und die Platzhalter durch das Datum der letzten E-mail-Sitzung, die Anzahl der neuen E-mail- Nachrichten und das Wort messages ersetzt. Dadurch ergibt sich ein Text, z.B. you have received three new messages, der mittels des Sprachbrowsers BRxml und der Software zur Umwandlung von Text in Sprache TTS - in Figur 3 nicht dargestellt - über eine geeignete Vorrichtung zur Sprachausgabe, z.B. Lautsprecher, ausgegeben wird. Diese Schablone kann einfach editiert und abgeändert werden, z.B. indem der auszugebende Text im statischen Teil geändert wird. So könnte beispielsweise der Text in Zeile 14 To dele' te all messages in yo r box, press 3, durch to send all of your messages to the litter box, press 3 ersetzt werden. Figure 3 shows a section of a template realized with VoxML ™. The template is used for language-oriented access to e-mail messages. Lines 5 and 6 contain the placeholders <VP_LAST_DATE>, <VP_NUM_NEW_EMAIL_WORD> and <VP_NEW_EMAIL_WORD>. In an interactive language-oriented e-mail session, where new e-mail messages are to be accessed, information about the replacement of the three placeholders is requested by the server that provides the e-mail messages and the placeholders by the date of the last e-mail Session, the number of new e-mail messages and the word messages replaced. This results in a text, for example you have received three new messages, which is output by means of the language browser BRxml and the software for converting text into language TTS - not shown in FIG. 3 - via a suitable device for voice output, for example loudspeaker. This template can be easily edited and modified, for example by changing the text to be output in the static part. For example, the text on line 14 To dele ' te all messages in yo r box, press 3, to be replaced by to send all of your messages to the litter box, press 3.

Claims

Patentansprüche claims
1. Multimediaplattform (VOX) zur Unterstützung von einem interaktiven, sprachorientierten Zugriff auf zu übermitteln- de Informationen (dat) mit Mitteln zur Bearbeitung und Interpretation von in einer interaktive Sprachausgabe unterstützenden Sprache programmierten Skripten (SCR) , mit Schablonen (TMP) zur Erzeugung von in einer interakti- ve Sprachausgabe unterstützenden Sprache programmierten Skripten (SCR) , wobei die Schablonen (TMP) einen in der interaktive Sprachausgabe unterstützenden Sprache programmierten statischen Teil (XMLst) und mit durch zu über mittelnde Informationen (dat) dynamisch ersetzbare Platz- halter (tg) aufweisen.1. Multimedia platform (VOX) to support interactive, language-oriented access to information to be transmitted (dat) with means for processing and interpreting scripts programmed in an interactive voice output (SCR), with templates (TMP) for generating Scripts programmed in an interactive speech output language (SCR), the templates (TMP) a static part programmed in the language supporting the interactive speech output (XMLst) and with placeholders (tg.) that can be dynamically replaced by information (dat) to be transmitted ) exhibit.
2. Multimediaplattform (VOX) nach Anspruch 1, dadurch gekennzeichnet, dass zum Zwecke eines interaktiven, sprachorientierten Zugriffs E-mail-Nachrichten (iml) und/oder Webseiteninformationen (iwb) und/oder Datenbankeninformationen (idb) übermittelbar sind.2. Multimedia platform (VOX) according to claim 1, characterized in that for the purpose of interactive, language-oriented access, e-mail messages (IML) and / or website information (IMB) and / or database information (IDB) can be transmitted.
3. Multimediaplattform (VOX) nach einem der vorhergehenden Ansprüche 1 und 2, dadurch gekennzeichnet, dass die Schablonen (TMP) in einer interaktive Sprachausgabe unterstützenden XML (Extensible Markup Language) Sprache programmiert sind, insbesondere VoxML™ , VoiceXML™ oder Dia- logML™.3. Multimedia platform (VOX) according to one of the preceding claims 1 and 2, characterized in that the templates (TMP) are programmed in an interactive voice output supporting XML (Extensible Markup Language) language, in particular VoxML ™, VoiceXML ™ or DialogML ™ ,
4. Multimediaplattform (VOX) nach einem der vorhergehenden Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Schablonen (TMP) insbesondere zur Veränderung des statischen Teils (XMLst) editierbar sind. 4. Multimedia platform (VOX) according to one of the preceding claims 1 to 3, characterized in that the templates (TMP) are editable, in particular for changing the static part (XMLst).
5. Multimediaplattform (VOX) nach einem der vorhergehenden Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Multimediaplattform (VOX) insbesondere zur Bearbei- tung von in einer interaktive Sprachausgabe unterstützenden Sprache programmierten Skripten (SCR) mit einer Browsersoftware (BRxml) und mit einer Software für die Umwandlung von Text in Sprache (TTS) ausgestattet ist.5. Multimedia platform (VOX) according to one of the preceding claims 1 to 4, characterized in that the multimedia platform (VOX) in particular for the processing of scripts programmed in an interactive voice output supporting language (SCR) with a browser software (BRxml) and with Software for converting text to speech (TTS) is equipped.
6. Verfahren zur Unterstützung von einem interaktiven, sprachorientierten Zugriff auf zu übermittelnde Informationen (dat) mithilfe einer Multimediaplattform (VOX) , bei dem in einer interaktive Sprachausgabe unterstützenden Sprache programmierte Skripten (SCR) bearbeitet und interpretiert werden, mittels Schablonen (TMP) in einer interaktive Sprachausgabe unterstützenden Sprache programmierte Skripten (SCR) erzeugt werden, wobei die Skripten (SCR) aus einer in der interaktive Sprachausgabe unterstützenden Sprache program- mierten statischen Teil der Schablonen (XMLst) durch die dynamische Übermittlung von Informationen (dat) und Ersetzung von dynamisch ersetzbaren Platzhaltern (tg) in der Schablone (TMP) durch übermittelte Informationen (dat) gebildet werden.6.Procedures for supporting interactive, language-oriented access to information to be transmitted (dat) using a multimedia platform (VOX), in which programmed scripts (SCR) are processed and interpreted in a language supporting interactive speech output, using templates (TMP) in one Interactive scripts supporting language-programmed scripts (SCR) are generated, the scripts (SCR) from a static part of the templates (XMLst) programmed in the language supporting the interactive speech output by the dynamic transmission of information (dat) and replacement of dynamically replaceable ones Placeholders (tg) in the template (TMP) are formed by transmitted information (dat).
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass E-mail-Nachrichten (iml) und/oder Webseiteninformationen (iwb) und/oder Datenbankeninformationen (idb) zur Bearbeitung übermittelt werden.7. The method according to claim 6, characterized in that e-mail messages (iml) and / or website information (iwb) and / or database information (idb) are transmitted for processing.
8. Verfahren nach einem der vorhergehenden Ansprüche 6 und 7, dadurch gekennzeichnet, dass Skripten (SCR) erzeugt werden, die in einer interaktive Sprachausgabe unterstützenden XML (Extensible Markup Language) Sprache, insbesondere VoxML™ , VoiceXML™ oder DialogML™, programmiert sind. 8. The method according to any one of the preceding claims 6 and 7, characterized in that scripts (SCR) are generated which are programmed in an XML (Extensible Markup Language) language which supports interactive speech output, in particular VoxML ™, VoiceXML ™ or DialogML ™.
9. Verfahren nach einem der vorhergehenden Ansprüche 6 bis 8 , dadurch gekennzeichnet, dass die Schablonen (TMP) zur Veränderung insbesondere des statischen Teils (XMLst) editiert werden.9. The method according to any one of the preceding claims 6 to 8, characterized in that the templates (TMP) for changing in particular the static part (XMLst) are edited.
10. Verfahren nach einem der vorhergehenden Ansprüche 6 bis 9, dadurch gekennzeichnet, dass in einer interaktive Sprachausgabe unterstützenden Spra- ehe geschriebene Skripten (SCR) mithilfe einer Browsersoftware (BRxml) und mit einer Software für die Umwandlung von Text in Sprache (TTS) bearbeitet werden. 10. The method according to any one of the preceding claims 6 to 9, characterized in that in an interactive speech output supporting language scripts (SCR) processed using a browser software (BRxml) and with a software for the conversion of text to speech (TTS) become.
PCT/DE2001/004682 2000-12-22 2001-12-12 Multimedia platform and method for supporting an interactive, voice-oriented access to information that is to be transmitted WO2002052529A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10064660 2000-12-22
DE10064660.3 2000-12-22

Publications (1)

Publication Number Publication Date
WO2002052529A1 true WO2002052529A1 (en) 2002-07-04

Family

ID=7668730

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2001/004682 WO2002052529A1 (en) 2000-12-22 2001-12-12 Multimedia platform and method for supporting an interactive, voice-oriented access to information that is to be transmitted

Country Status (1)

Country Link
WO (1) WO2002052529A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10317497A1 (en) * 2003-04-16 2004-11-25 Abb Patent Gmbh System for communication between a field device and an operator panel

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADLER, BERGLUND, CARUSO, DEACH, GROSSO, GUTENTAG, MILOWSKI, PAMELL, RICHMAN, ZILLES: "Extensible stylesheet language (XSL) : W3C working draft", W3C : WORLD WIDE WEB CONSORTIUM, 27 March 2000 (2000-03-27), XP002196262, Retrieved from the Internet <URL:www.w3.org/TR/2000/WD-xsl-20000327/slice1.html#section-N608-Introduction-and-Overview> [retrieved on 20020416] *
J. KUNINS: "Answers your questions about VoiceXML", VOICEXMLREVIEW.ORG, 2 January 2001 (2001-01-02), XP002196264, Retrieved from the Internet <URL:http://www.voicexmlreview.org/Feb2001/columns/Feb2001_speak_listen.html> [retrieved on 20020416] *
MORAITAKIS, ZERVAS: "Flexible CGI output with HTML templates", PERFECT SOLUTIONS, XP002196263, Retrieved from the Internet <URL:www.perlfect.com/articles/templates.shtml> [retrieved on 20020416] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10317497A1 (en) * 2003-04-16 2004-11-25 Abb Patent Gmbh System for communication between a field device and an operator panel
DE10317497B4 (en) * 2003-04-16 2013-10-17 Abb Ag System for communication between a field device and an operator panel

Similar Documents

Publication Publication Date Title
DE10220524B4 (en) Method and system for processing voice data and recognizing a language
EP1435088B1 (en) Dynamic creation of a conversational system from dialogue objects
DE4436175B4 (en) Device for remote access to a computer from a telephone handset
DE60305458T2 (en) A SYSTEM AND METHOD FOR PROVIDING A MESSAGE BASED COMMUNICATION INFRASTRUCTURE FOR AN AUTOMATED CALLING CENTER OPERATION
DE60111481T2 (en) Handling of user-specific vocabulary parts in language service systems
DE60313706T2 (en) Speech recognition and response system, speech recognition and response program and associated recording medium
DE10220521B4 (en) Method and system for processing voice data and classifying calls
WO2003054731A9 (en) Method for conducting a computer-aided transformation of structured documents
DE60123153T2 (en) Voice-controlled browser system
DE60214850T2 (en) FOR A USER GROUP, SPECIFIC PATTERN PROCESSING SYSTEM
DE60020504T2 (en) ADJUSTING A LANGUAGE IDENTIFIER TO CORRECTED TEXTS
EP2047668B1 (en) Method, spoken dialog system, and telecommunications terminal device for multilingual speech output
EP1282897B1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
DE10220522B4 (en) Method and system for processing voice data using voice recognition and frequency analysis
WO2001013362A1 (en) Method for facilitating a dialogue
DE10118125A1 (en) Automatic purchasing system for use with user terminal includes user dialogue system with automatic speech recognition device and speech delivery device
WO2002052529A1 (en) Multimedia platform and method for supporting an interactive, voice-oriented access to information that is to be transmitted
DE102006056286B4 (en) A method of reproducing text information by voice in a vehicle
DE60217313T2 (en) METHOD FOR PERFORMING LANGUAGE RECOGNITION OF DYNAMIC REPORTS
EP1659571A2 (en) Speech dialogue system and method for running it
DE10211777A1 (en) Creation of message texts
DE60126948T2 (en) INTERACTIVE DIALOGUE
EP1150479A2 (en) Method for interactive query of information by means of a mobile telephone
EP1240775B1 (en) Communication system and method for establishing an internet connection by means of a telephone
DE3732849A1 (en) SYSTEM ARCHITECTURE FOR AN ACOUSTIC HUMAN / MACHINE DIALOG SYSTEM

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): BR CN US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase