ATE268044T1 - Verfahren und vorrichtung zur verteilten spracherkennung - Google Patents

Verfahren und vorrichtung zur verteilten spracherkennung

Info

Publication number
ATE268044T1
ATE268044T1 AT02251572T AT02251572T ATE268044T1 AT E268044 T1 ATE268044 T1 AT E268044T1 AT 02251572 T AT02251572 T AT 02251572T AT 02251572 T AT02251572 T AT 02251572T AT E268044 T1 ATE268044 T1 AT E268044T1
Authority
AT
Austria
Prior art keywords
acoustic
terminal
server
encoding
processing condition
Prior art date
Application number
AT02251572T
Other languages
English (en)
Inventor
Tetsuo Kosaka
Hiroki Yamamoto
Original Assignee
Canon Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Kk filed Critical Canon Kk
Application granted granted Critical
Publication of ATE268044T1 publication Critical patent/ATE268044T1/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Exchange Systems With Centralized Control (AREA)
AT02251572T 2001-03-08 2002-03-06 Verfahren und vorrichtung zur verteilten spracherkennung ATE268044T1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001065383A JP2002268681A (ja) 2001-03-08 2001-03-08 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法

Publications (1)

Publication Number Publication Date
ATE268044T1 true ATE268044T1 (de) 2004-06-15

Family

ID=18924045

Family Applications (1)

Application Number Title Priority Date Filing Date
AT02251572T ATE268044T1 (de) 2001-03-08 2002-03-06 Verfahren und vorrichtung zur verteilten spracherkennung

Country Status (5)

Country Link
US (1) US20020128826A1 (de)
EP (1) EP1239462B1 (de)
JP (1) JP2002268681A (de)
AT (1) ATE268044T1 (de)
DE (1) DE60200519T2 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3542578B2 (ja) * 2001-11-22 2004-07-14 キヤノン株式会社 音声認識装置及びその方法、プログラム
JP4217495B2 (ja) 2003-01-29 2009-02-04 キヤノン株式会社 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体
KR100672355B1 (ko) 2004-07-16 2007-01-24 엘지전자 주식회사 음성 코딩/디코딩 방법 및 그를 위한 장치
JP4603429B2 (ja) * 2005-06-17 2010-12-22 日本電信電話株式会社 クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体
JP4769121B2 (ja) * 2006-05-15 2011-09-07 日本電信電話株式会社 サーバ・クライアント型音声認識方法、装置およびサーバ・クライアント型音声認識プログラム、記録媒体
KR100861653B1 (ko) * 2007-05-25 2008-10-02 주식회사 케이티 음성 특징을 이용한 네트워크 기반 분산형 음성 인식단말기, 서버, 및 그 시스템 및 그 방법
US9230563B2 (en) * 2011-06-15 2016-01-05 Bone Tone Communications (Israel) Ltd. System, device and method for detecting speech
US10032036B2 (en) * 2011-09-14 2018-07-24 Shahab Khan Systems and methods of multidimensional encrypted data transfer
US9251723B2 (en) * 2011-09-14 2016-02-02 Jonas Moses Systems and methods of multidimensional encrypted data transfer
US9460729B2 (en) 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
EP3304330A4 (de) * 2015-06-01 2018-11-07 Benjamin Aaron Miller Inhaltssegmentierung und zeitabstimmung
CA2988108C (en) 2015-06-01 2023-10-10 Benjamin Aaron Miller Break state detection in content management systems
US10224028B2 (en) 2015-06-01 2019-03-05 Sinclair Broadcast Group, Inc. Break state detection for reduced capability devices
US10855765B2 (en) 2016-05-20 2020-12-01 Sinclair Broadcast Group, Inc. Content atomization

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69028072T2 (de) * 1989-11-06 1997-01-09 Canon Kk Verfahren und Einrichtung zur Sprachsynthese
JPH03150599A (ja) * 1989-11-07 1991-06-26 Canon Inc 日本語音節の符号化方式
US6236964B1 (en) * 1990-02-01 2001-05-22 Canon Kabushiki Kaisha Speech recognition apparatus and method for matching inputted speech and a word generated from stored referenced phoneme data
JP3066920B2 (ja) * 1991-06-11 2000-07-17 キヤノン株式会社 音声認識方法及び装置
JPH04362698A (ja) * 1991-06-11 1992-12-15 Canon Inc 音声認識方法及び装置
US5627939A (en) * 1993-09-03 1997-05-06 Microsoft Corporation Speech recognition system and method employing data compression
US5680506A (en) * 1994-12-29 1997-10-21 Lucent Technologies Inc. Apparatus and method for speech signal analysis
JPH09258771A (ja) * 1996-03-25 1997-10-03 Canon Inc 音声処理方法及び装置
JP3397568B2 (ja) * 1996-03-25 2003-04-14 キヤノン株式会社 音声認識方法及び装置
JPH1097276A (ja) * 1996-09-20 1998-04-14 Canon Inc 音声認識方法及び装置並びに記憶媒体
JPH10161692A (ja) * 1996-12-03 1998-06-19 Canon Inc 音声認識装置及び音声認識方法
JP3962445B2 (ja) * 1997-03-13 2007-08-22 キヤノン株式会社 音声処理方法及び装置
JPH10254486A (ja) * 1997-03-13 1998-09-25 Canon Inc 音声認識装置および方法
US6009387A (en) * 1997-03-20 1999-12-28 International Business Machines Corporation System and method of compression/decompressing a speech signal by using split vector quantization and scalar quantization
US6223157B1 (en) * 1998-05-07 2001-04-24 Dsc Telecom, L.P. Method for direct recognition of encoded speech data
JP2000047696A (ja) * 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US20020116180A1 (en) * 2001-02-20 2002-08-22 Grinblat Zinovy D. Method for transmission and storage of speech

Also Published As

Publication number Publication date
JP2002268681A (ja) 2002-09-20
EP1239462B1 (de) 2004-05-26
DE60200519T2 (de) 2005-06-02
EP1239462A1 (de) 2002-09-11
DE60200519D1 (de) 2004-07-01
US20020128826A1 (en) 2002-09-12

Similar Documents

Publication Publication Date Title
ATE268044T1 (de) Verfahren und vorrichtung zur verteilten spracherkennung
EP1701340A3 (de) Kodiervorrichtung und Dekodiervorrichtung
DE60208614D1 (de) Verfahren und Vorrichtung zur Bereitstellung einer Liste von öffentlichen Schlüsseln in einem Public-Key-System
DE60007620D1 (de) Spracherkennungsverfahren
CN101903947A (zh) 使用接收器进行上下文抑制的系统、方法及设备
ATE305655T1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
ATE292524T1 (de) Vorrichtung und verfahren zur telefonie-basierten spracherkennung für das bereitstellen von informationen zum sortieren von poststücken und paketen.
EP0785631A3 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE60103424D1 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
ATE354156T1 (de) Verfahren zum training oder zur adaption eines spracherkenners
WO2003005340A3 (en) Method and apparatus for improving voice recognition performance in a voice application distribution system
DE60111329D1 (de) Anpassung des phonetischen Kontextes zur Verbesserung der Spracherkennung
EP1447792A3 (de) Verfahren und Vorrichtung zur Modellierung eines Spracherkennungssystems und zur Schätzung einer Wort-Fehlerrate basierend auf einem Text
RU2006132734A (ru) Аудиокодирование
ATE319160T1 (de) Verfahren zur rauschrobusten klassifikation in der sprachkodierung
ATE428997T1 (de) Vorrichtung und verfahren zur mehrfachbeschreibungskodierung
CN114155832A (zh) 基于深度学习的语音识别方法、装置、设备及介质
DE60327020D1 (de) Vorrichtung, Verfahren und computerlesbares Aufzeichnungsmedium zur Erkennung von Schlüsselwörtern in spontaner Sprache
WO2002103675A8 (en) Client-server based distributed speech recognition system architecture
CN110211610A (zh) 评估音频信号损失的方法、装置及存储介质
ATE352078T1 (de) Verfahren, system und vorrichtung zur authentifierung von durch einen benutzer übertragener und/oder empfangener daten
ATE316283T1 (de) Vorrichtung zur verbesserung der spracherkennung
ATE310302T1 (de) Kommunikationsvorrichtung und verfahren zum senden und empfangen von sprachsignalen unter kombination eines spracherkennungsmodules mit einer kodiereinheit
ATE527596T1 (de) Erhalten von konfigurationsdaten für ein datenverarbeitungsgerät
DE60206619D1 (de) Verfahren und vorrichtung zur erzeugung und verteilung von interaktiven echtzeit-medieninhalten uber drahtlose kommunikationsnetze und das internet

Legal Events

Date Code Title Description
RER Ceased as to paragraph 5 lit. 3 law introducing patent treaties