BRPI0413453A - métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo - Google Patents

métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo

Info

Publication number
BRPI0413453A
BRPI0413453A BRPI0413453-2A BRPI0413453A BRPI0413453A BR PI0413453 A BRPI0413453 A BR PI0413453A BR PI0413453 A BRPI0413453 A BR PI0413453A BR PI0413453 A BRPI0413453 A BR PI0413453A
Authority
BR
Brazil
Prior art keywords
input interface
voice input
dialog
producing
dialogue
Prior art date
Application number
BRPI0413453-2A
Other languages
English (en)
Inventor
Martin Oerder
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of BRPI0413453A publication Critical patent/BRPI0413453A/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Stored Programmes (AREA)

Abstract

"MéTODOS PARA OPERAçãO DE UM SISTEMA DE DIáLOGO, PARA PRODUçãO DE UMA INTERFACE DE ENTRADA DE VOZ, E PARA GERAçãO DE UM SISTEMA DE DIáLOGO, INTERFACE DE ENTRADA DE VOZ E SISTEMAS DE DIáLOGO E DE PRODUçãO DE UMA INTERFACE DE ENTRADA DE VOZ DE UM SISTEMA DE DIáLOGO". Um método é descrito para operação de um sistema de diálogo (1) com uma interface de entrada de voz (2) e uma aplicação (3) cooperante com a interface de entrada de voz (2). A interface de entrada de voz (2) detecta sinais de voz áudio (AS) de um usuário e converte estes em um resultado de identificação (BR) na forma de dados binários que podem ser usados diretamente pela aplicação. Este resultado de identificação (BR) é provido pela aplicação (3). Um método e um sistema para a produção de uma correspondente interface de entrada de voz (2), uma interface de entrada de voz (22) e um sistema de diálogo (1) com uma interface de entrada de voz (2) dessa natureza também são descritos.
BRPI0413453-2A 2003-08-12 2004-08-09 métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo BRPI0413453A (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03102501 2003-08-12
PCT/IB2004/051420 WO2005015546A1 (en) 2003-08-12 2004-08-09 Speech input interface for dialog systems

Publications (1)

Publication Number Publication Date
BRPI0413453A true BRPI0413453A (pt) 2006-10-17

Family

ID=34130307

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0413453-2A BRPI0413453A (pt) 2003-08-12 2004-08-09 métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo

Country Status (8)

Country Link
US (1) US20060241946A1 (pt)
EP (1) EP1680780A1 (pt)
JP (1) JP2007502459A (pt)
KR (1) KR20060060019A (pt)
CN (1) CN1836271A (pt)
BR (1) BRPI0413453A (pt)
RU (1) RU2006107558A (pt)
WO (1) WO2005015546A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1750253B1 (en) * 2005-08-04 2012-03-21 Nuance Communications, Inc. Speech dialog system
US7822604B2 (en) * 2006-10-31 2010-10-26 International Business Machines Corporation Method and apparatus for identifying conversing pairs over a two-way speech medium
US20080133365A1 (en) * 2006-11-21 2008-06-05 Benjamin Sprecher Targeted Marketing System
US8417511B2 (en) * 2006-12-28 2013-04-09 Nuance Communications Dynamic grammars for reusable dialogue components
US20080208589A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Presenting Supplemental Content For Digital Media Using A Multimodal Application
US8219385B2 (en) * 2008-04-08 2012-07-10 Incentive Targeting, Inc. Computer-implemented method and system for conducting a search of electronically stored information
US8515734B2 (en) * 2010-02-08 2013-08-20 Adacel Systems, Inc. Integrated language model, related systems and methods
JP5718084B2 (ja) * 2010-02-16 2015-05-13 岐阜サービス株式会社 音声認識用文法作成支援プログラム
US20150242182A1 (en) * 2014-02-24 2015-08-27 Honeywell International Inc. Voice augmentation for industrial operator consoles
KR101893927B1 (ko) 2015-05-12 2018-09-03 전자부품연구원 로봇 자동 충전 장치 및 이를 갖는 로봇 자동 충전 시스템
WO2017161320A1 (en) * 2016-03-18 2017-09-21 Google Inc. Generating dependency parses of text segments using neural networks
DE102016115243A1 (de) * 2016-04-28 2017-11-02 Masoud Amri Programmieren in natürlicher Sprache
CN110111779B (zh) * 2018-01-29 2023-12-26 阿里巴巴集团控股有限公司 语法模型生成方法及装置、语音识别方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0543329B1 (en) * 1991-11-18 2002-02-06 Kabushiki Kaisha Toshiba Speech dialogue system for facilitating human-computer interaction
JPH11143485A (ja) * 1997-11-14 1999-05-28 Oki Electric Ind Co Ltd 音声認識方法及び音声認識装置
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6434529B1 (en) * 2000-02-16 2002-08-13 Sun Microsystems, Inc. System and method for referencing object instances and invoking methods on those object instances from within a speech recognition grammar
JP3423296B2 (ja) * 2001-06-18 2003-07-07 沖電気工業株式会社 音声対話インターフェース装置
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system

Also Published As

Publication number Publication date
CN1836271A (zh) 2006-09-20
EP1680780A1 (en) 2006-07-19
KR20060060019A (ko) 2006-06-02
US20060241946A1 (en) 2006-10-26
WO2005015546A8 (en) 2006-06-01
WO2005015546A1 (en) 2005-02-17
RU2006107558A (ru) 2006-08-10
JP2007502459A (ja) 2007-02-08

Similar Documents

Publication Publication Date Title
BRPI0413453A (pt) métodos para operação de um sistema de diálogo, para produção de uma interface de entrada de voz, e para geração de um sistema de diálogo, interface de entrada de voz e sistemas de diálogo e de produção de uma interface de entrada de voz de um sistema de diálogo
WO2008035275A3 (en) Encoding and decoding of audio objects
AU2003299312A1 (en) Text-to-speech method and system, computer program product therefor
HK1071466A1 (en) Semantic object synchronous understanding implemented with speech application language tags
WO2005045570A3 (en) Mechanism for providing data driven command line output
WO2003062946A3 (en) System and method for generating user interface code
EP3091535A3 (en) Multi-modal input on an electronic device
WO2003079156A3 (en) System and method for graphical rights expressions
ZA200401492B (en) Verbose hardware identification for binding a software package to a computer system having tolerance for hardware changes.
BR9814102A (pt) Sistema e processo para representar informações complexas em forma auditiva
BRPI0509110A8 (pt) Método e dispositivo para processar um sinal estéreo, aparelhos codificador e decodificador, e, sistema de áudio
BR0213596A (pt) Sistema e metodo para transmitir sinais de midia
WO2003089995A3 (en) Methods and apparatus for process, factory-floor, environmental, computer aided manufacturing-based or other control system with real-time data distribution
BRPI0400702A (pt) Apresentação de dados com base na entrada do usuário
DE602006002501D1 (de) Audiokodierung und audiodekodierung
TW200745946A (en) Dynamically generating a voice navigable menu for synthesized data
WO2004072794A3 (en) Systems and methods for contextual mark-up of formatted documents
BRPI0607223A2 (pt) método e sistema para geração de consulta em um sistema de diálogo baseado em tarefa
BR0017086A (pt) Processo para calcular uma distancia perceptual de um sinal de dados e uma primeira representação do sinal de dados, sistema de compressão, e, processo de compressão de dados
TW200746842A (en) Apparatus for processing media signal and method thereof
BR0301722A (pt) Dados subdivididos de guia de programa
ATE534991T1 (de) Kodierung eines audiosignals
WO2007115214A3 (en) Knowledge based encoding of data
BRPI0511839A (pt) método para controle de processo e sistema de controle para um processo
DE50008116D1 (de) Anonymisierungsverfahren

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]