ES2173232T3 - Procedimiento para la identificacion automatica de un texto hablado. - Google Patents

Procedimiento para la identificacion automatica de un texto hablado.

Info

Publication number
ES2173232T3
ES2173232T3 ES96114919T ES96114919T ES2173232T3 ES 2173232 T3 ES2173232 T3 ES 2173232T3 ES 96114919 T ES96114919 T ES 96114919T ES 96114919 T ES96114919 T ES 96114919T ES 2173232 T3 ES2173232 T3 ES 2173232T3
Authority
ES
Spain
Prior art keywords
words
talked
talk
procedure
automatic identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES96114919T
Other languages
English (en)
Inventor
Peter Dr Toma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Application granted granted Critical
Publication of ES2173232T3 publication Critical patent/ES2173232T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Image Processing (AREA)
  • Navigation (AREA)

Abstract

SE PROPONE UN PROCEDIMIENTO PARA EL RECONOCIMIENTO AUTOMATICO DE UN TEXTO HABLADO, EN ESPECIAL PARA SU APLICACION EN UN METODO DE TRADUCCION AUTOMATICA DE VOZ. EL TEXTO HABLADO SE CONVIERTE EN SECUENCIAS DE SEÑALES ELECTRICAS MEDIANTE UN MICROFONO (10) Y ESTAS SE LLEVAN EN FORMA DIGITALIZADA A UN ORDENADOR (12), DONDE SE COMPARAN CON UNAS SECUENCIAS DE SEÑALES DIGITALES (ENTRADAS DE DICCIONARIO) ALMACENADAS EN UNA MEMORIA DE UNIDADES DE VOZ (14) Y SE ASIGNAN COMO CORRESPONDA. EN UN MODO DE ENTRADA A MEMORIA PARA GUARDAR UNIDADES DE VOZ EN LA MEMORIA DE UNIDADES DE VOZ (14), EL RECONOCIMIENTO DE PAUSAS PERMITE DESCOMPONER UN TEXTO HABLADO DIGITALIZADO EN UNIDADES DE VOZ QUE CORRESPONDEN COMO MINIMO A PARTES DE FRASES Y A FRASES COMPLETAS. ESTAS UNIDADES DE VOZ SE ALMACENAN AUTOMATICAMENTE EN LA SECUENCIA HABLADA, CON NUMEROS DE IDENTIFICACION O DIRECCIONES SUCESIVOS. LAS UNIDADES DE VOZ ASI ALMACENADAS SE ANALIZAN POR SEPARADO EN RELACION CON SU LONGITUD Y SECUENCIA DIGITAL Y SE REUNEN EN GRUPOS DE UNIDADES DE VOZ QUE DEBEN SATISFACER DETERMINADOS REQUISITOS DE SEMEJANZA RELATIVOS A SUS SECUENCIAS DE BITS. EN UN NIVEL DE ORDEN SUPERIOR COMO MINIMO, A ESTOS GRUPOS DE UNIDADES DE VOZ SE LES ASIGNAN CONCEPTOS CLAVES CON SECUENCIAS DE BITS MAS CORTAS, QUE A SU VEZ DEBEN CUMPLIR CRITERIOS DE SEMEJANZA. EN UN MODO DE RECONOCIMIENTO SE COMIENZA POR UN PROCESO DE COMPARACION Y BUSQUEDA EN EL NIVEL MAS ALTO Y A CONTINUACION SE PASA COMO MINIMO AL NIVEL SIGUIENTE MAS BAJO, DONDE LAS UNIDADES DE VOZ ALMACENADAS Y CONOCIDAS QUE COINCIDAN CON LAS UNIDADES DE VOZ INTRODUCIDAS Y/O EL IDENTIFICATIVO O DIRECCION CORRESPONDIENTE SE EMPLEAN PARA SELECCIONAR UNA MEMORIA DE SALIDA (17, 18) PARA SACAR UNIDADES DE VOZ ESCRITAS Y/O HABLADAS Y/O ILUSTRADAS EN EL MISMO IDIOMA O AL MENOS OTRO. MEDIANTE LA ORGANIZACION AUTOMATICA DE LAS UNIDADES DE VOZ INTRODUCIDAS AUTOMATICAMENTE SE HACE POSIBLE TAMBIEN AL ACCESO BASTANTE RAPIDO A DICCIONARIOS DE GRAN TAMAÑO.
ES96114919T 1996-06-22 1996-09-18 Procedimiento para la identificacion automatica de un texto hablado. Expired - Lifetime ES2173232T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19624988A DE19624988A1 (de) 1996-06-22 1996-06-22 Verfahren zur automatischen Erkennung eines gesprochenen Textes

Publications (1)

Publication Number Publication Date
ES2173232T3 true ES2173232T3 (es) 2002-10-16

Family

ID=7797698

Family Applications (1)

Application Number Title Priority Date Filing Date
ES96114919T Expired - Lifetime ES2173232T3 (es) 1996-06-22 1996-09-18 Procedimiento para la identificacion automatica de un texto hablado.

Country Status (4)

Country Link
EP (1) EP0814457B1 (es)
AT (1) ATE216118T1 (es)
DE (2) DE19624988A1 (es)
ES (1) ES2173232T3 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19907504C2 (de) * 1999-02-22 2003-05-28 Heiko Barske Audiogerät zum sowie Verfahren zum Umwandeln von Eingabesprachinformation in Ausgabesprachinformation
DE10304461B3 (de) * 2003-02-04 2004-03-04 Siemens Ag Automatische Konfigurierung einer sprecherunabh ngigen Sprachwahl
DE10334400A1 (de) 2003-07-28 2005-02-24 Siemens Ag Verfahren zur Spracherkennung und Kommunikationsgerät
DE102004055230B3 (de) * 2004-11-16 2006-07-20 Siemens Ag Verfahren zur Spracherkennung aus einem vorgebbaren Vokabular
JP4767754B2 (ja) 2006-05-18 2011-09-07 富士通株式会社 音声認識装置および音声認識プログラム
DE102007003862A1 (de) 2007-01-25 2009-02-05 Anders, Klaus E., 26127 Oldenburg Verfahren zur interkulturellen mehrsprachigen Kommunikation unter Einbeziehung einer Plansprache
US9839735B2 (en) 2015-09-08 2017-12-12 Fresenius Medical Care Holdings, Inc. Voice interface for a dialysis machine
DE102015014527A1 (de) 2015-11-11 2017-05-11 Fresenius Medical Care Deutschland Gmbh Medizintechnisches Gerät mit Bedienerunterstützung und Verfahren

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
US4336421A (en) * 1980-04-08 1982-06-22 Threshold Technology, Inc. Apparatus and method for recognizing spoken words
US4481593A (en) * 1981-10-05 1984-11-06 Exxon Corporation Continuous speech recognition
US4870686A (en) * 1987-10-19 1989-09-26 Motorola, Inc. Method for entering digit sequences by voice command
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JPH02297195A (ja) * 1989-03-02 1990-12-07 Nec Corp 形態素解析方式
DE3930889A1 (de) * 1989-09-15 1991-03-28 Philips Patentverwaltung Verfahren zur erkennung von n unterschiedlichen wortketten in einem sprachsignal
JP2989211B2 (ja) * 1990-03-26 1999-12-13 株式会社リコー 音声認識装置における辞書制御方式
EP0472193A3 (en) * 1990-08-23 1993-10-20 Oki Electric Ind Co Ltd Translation device based on voice recognition and voice synthesis
CA2051135C (en) * 1991-09-11 1996-05-07 Kim D. Letkeman Compressed language dictionary
DE4422545A1 (de) * 1994-06-28 1996-01-04 Sel Alcatel Ag Start-/Endpunkt-Detektion zur Worterkennung

Also Published As

Publication number Publication date
DE19624988A1 (de) 1998-01-02
EP0814457A3 (de) 1998-10-21
EP0814457B1 (de) 2002-04-10
DE59609067D1 (de) 2002-05-16
ATE216118T1 (de) 2002-04-15
EP0814457A2 (de) 1997-12-29

Similar Documents

Publication Publication Date Title
DE69709539D1 (de) Verfahren und system zur erkennung eines gesprochenen textes
EP0977174A3 (en) Search optimization system and method for continuous speech recognition
EP0834862A3 (en) Method of key-phrase detection and verification for flexible speech understanding
DE3583067D1 (de) Verfahren und anordnung zur spracherkennung.
CN105244026A (zh) 一种语音处理方法及装置
WO1999016052A3 (en) Speech recognition system for recognizing continuous and isolated speech
GB2073465B (en) Continuous speech recognition
EP0755046A3 (en) Speech recogniser using a hierarchically structured dictionary
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
MXPA02005387A (es) Proceso y dispositivo para reconocimiento de voz que utiliza modelos de lenguaje desarticulados.
ES2173232T3 (es) Procedimiento para la identificacion automatica de un texto hablado.
EP0285222A3 (en) Method for detecting associatively pronounced words
DE3480569D1 (en) Voice recognition
GB2304507A (en) Speech-recognition system utilizing neural networks and method of using same
DE3273358D1 (en) Recognition of speech or speech-like sounds using associative memory
DE60317218D1 (de) Verfahren zur spracherkennung mit automatischen korrektur
Witbrock et al. Improving acoustic models by watching television
AU584130B2 (en) Apparatus and method for identifying spoken words
WO2004008433A3 (en) System and method for mandarin chinese speech recognition using an optimized phone set
DE3378384D1 (en) Recognition of continuous speech
Rahman et al. Speech recognition front-end for segmenting and clustering continuous bangla speech
EP0173986A3 (en) Method of and device for the recognition, without previous training of connected words belonging to small vocabularies
ATE378673T1 (de) System und verfahren zur sprecherunabhängigen echtzeitspracherkennung
Kuhn et al. Recent results in automatic learning rules for semantic interpretation.
EP0982712A3 (en) Segmentation technique increasing the active vocabulary of speech recognizers

Legal Events

Date Code Title Description
FG2A Definitive protection

Ref document number: 814457

Country of ref document: ES