DE60318385D1 - Sprachverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm - Google Patents

Sprachverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm

Info

Publication number
DE60318385D1
DE60318385D1 DE60318385T DE60318385T DE60318385D1 DE 60318385 D1 DE60318385 D1 DE 60318385D1 DE 60318385 T DE60318385 T DE 60318385T DE 60318385 T DE60318385 T DE 60318385T DE 60318385 D1 DE60318385 D1 DE 60318385D1
Authority
DE
Germany
Prior art keywords
program
recording medium
processing apparatus
language processing
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60318385T
Other languages
English (en)
Other versions
DE60318385T2 (de
Inventor
Hiroaki Ogawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE60318385D1 publication Critical patent/DE60318385D1/de
Publication of DE60318385T2 publication Critical patent/DE60318385T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/022Demisyllables, biphones or triphones being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/027Syllables being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
DE60318385T 2002-11-21 2003-11-12 Sprachverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm Expired - Lifetime DE60318385T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002337892A JP4072718B2 (ja) 2002-11-21 2002-11-21 音声処理装置および方法、記録媒体並びにプログラム
JP2002337892 2002-11-21
PCT/JP2003/014342 WO2004047075A1 (ja) 2002-11-21 2003-11-12 音声処理装置および方法、記録媒体並びにプログラム

Publications (2)

Publication Number Publication Date
DE60318385D1 true DE60318385D1 (de) 2008-02-14
DE60318385T2 DE60318385T2 (de) 2009-01-02

Family

ID=32321860

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60318385T Expired - Lifetime DE60318385T2 (de) 2002-11-21 2003-11-12 Sprachverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm

Country Status (8)

Country Link
US (1) US7653541B2 (de)
EP (1) EP1460615B1 (de)
JP (1) JP4072718B2 (de)
KR (1) KR101014086B1 (de)
CN (1) CN100354929C (de)
AU (1) AU2003280726A1 (de)
DE (1) DE60318385T2 (de)
WO (1) WO2004047075A1 (de)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4705023B2 (ja) * 2004-06-10 2011-06-22 パナソニック株式会社 音声認識装置、音声認識方法、及びプログラム
JP4301102B2 (ja) * 2004-07-22 2009-07-22 ソニー株式会社 音声処理装置および音声処理方法、プログラム、並びに記録媒体
JP2007133033A (ja) 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
ATE457510T1 (de) 2005-12-08 2010-02-15 Nuance Comm Austria Gmbh Spracherkennungssystem mit riesigem vokabular
US8756058B2 (en) * 2006-02-23 2014-06-17 Nec Corporation Speech recognition system, speech recognition result output method, and speech recognition result output program
US9245526B2 (en) * 2006-04-25 2016-01-26 General Motors Llc Dynamic clustering of nametags in an automated speech recognition system
GB2457855B (en) 2006-11-30 2011-01-12 Nat Inst Of Advanced Ind Scien Speech recognition system and speech recognition system program
US8868410B2 (en) * 2007-08-31 2014-10-21 National Institute Of Information And Communications Technology Non-dialogue-based and dialogue-based learning apparatus by substituting for uttered words undefined in a dictionary with word-graphs comprising of words defined in the dictionary
CN101452702B (zh) * 2007-12-05 2011-08-10 财团法人工业技术研究院 语音模型的调整方法及其调整模块
US8326631B1 (en) * 2008-04-02 2012-12-04 Verint Americas, Inc. Systems and methods for speech indexing
JP5810912B2 (ja) * 2011-12-28 2015-11-11 富士通株式会社 音声認識装置、音声認識方法及び音声認識プログラム
CN103076893B (zh) * 2012-12-31 2016-08-17 百度在线网络技术(北京)有限公司 一种用于实现语音输入的方法与设备
CN104157285B (zh) * 2013-05-14 2016-01-20 腾讯科技(深圳)有限公司 语音识别方法、装置及电子设备
KR102117082B1 (ko) 2014-12-29 2020-05-29 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
JP6655835B2 (ja) * 2016-06-16 2020-02-26 パナソニックIpマネジメント株式会社 対話処理方法、対話処理システム、及びプログラム
JP6711343B2 (ja) * 2017-12-05 2020-06-17 カシオ計算機株式会社 音声処理装置、音声処理方法及びプログラム
US11232783B2 (en) 2018-09-12 2022-01-25 Samsung Electronics Co., Ltd. System and method for dynamic cluster personalization
US20220335951A1 (en) * 2019-09-27 2022-10-20 Nec Corporation Speech recognition device, speech recognition method, and program
JP6807586B1 (ja) * 2020-01-30 2021-01-06 ベルフェイス株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0384707A (ja) * 1989-08-28 1991-04-10 Victor Co Of Japan Ltd 垂直磁気記録方式
JPH06266386A (ja) 1993-03-16 1994-09-22 Nippon Telegr & Teleph Corp <Ntt> ワードスポッティング方法
EP0789901B1 (de) * 1994-11-01 2000-01-05 BRITISH TELECOMMUNICATIONS public limited company Spracherkennung
JP3576272B2 (ja) 1995-06-22 2004-10-13 シャープ株式会社 音声認識装置および方法
JP2886117B2 (ja) 1995-09-11 1999-04-26 株式会社エイ・ティ・アール音声翻訳通信研究所 音声認識装置
JP3459712B2 (ja) * 1995-11-01 2003-10-27 キヤノン株式会社 音声認識方法及び装置及びコンピュータ制御装置
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
JPH09274496A (ja) 1996-04-09 1997-10-21 Fuji Xerox Co Ltd 音声認識装置
JP2999726B2 (ja) 1996-09-18 2000-01-17 株式会社エイ・ティ・アール音声翻訳通信研究所 連続音声認識装置
JP3428309B2 (ja) 1996-09-24 2003-07-22 松下電器産業株式会社 音声認識装置
US5956668A (en) * 1997-07-18 1999-09-21 At&T Corp. Method and apparatus for speech translation with unrecognized segments
JPH1185179A (ja) 1997-09-16 1999-03-30 Nippon Telegr & Teleph Corp <Ntt> 統計的言語モデルの作成方法
US5983180A (en) * 1997-10-23 1999-11-09 Softsound Limited Recognition of sequential data using finite state sequence models organized in a tree structure
US6631349B1 (en) * 1997-11-27 2003-10-07 Hitachi, Ltd. Speech recognition method and system
JP3476008B2 (ja) 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体
US7310600B1 (en) * 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
JP2001249684A (ja) 2000-03-02 2001-09-14 Sony Corp 音声認識装置および音声認識方法、並びに記録媒体
JP4543294B2 (ja) * 2000-03-14 2010-09-15 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
EP1162602B1 (de) * 2000-06-07 2004-12-15 Sony International (Europe) GmbH Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE10042942C2 (de) * 2000-08-31 2003-05-08 Siemens Ag Verfahren zur Sprachsynthese
GB0027178D0 (en) * 2000-11-07 2000-12-27 Canon Kk Speech processing system

Also Published As

Publication number Publication date
CN100354929C (zh) 2007-12-12
DE60318385T2 (de) 2009-01-02
AU2003280726A1 (en) 2004-06-15
EP1460615B1 (de) 2008-01-02
EP1460615A1 (de) 2004-09-22
US7653541B2 (en) 2010-01-26
US20050143998A1 (en) 2005-06-30
WO2004047075A1 (ja) 2004-06-03
EP1460615A4 (de) 2007-04-25
CN1692405A (zh) 2005-11-02
JP4072718B2 (ja) 2008-04-09
KR20050083547A (ko) 2005-08-26
JP2004170765A (ja) 2004-06-17
KR101014086B1 (ko) 2011-02-14

Similar Documents

Publication Publication Date Title
DE602005001967D1 (de) Bildverarbeitungsvorrichtung und -Verfahren, Aufzeichnungsmedium und Programm
DE60312499D1 (de) Stream-datenverarbeitungseinrichtung, stream-datenverarbeitungsverfahren, programm und medium
DE60318385D1 (de) Sprachverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm
DE602004027684D1 (de) Videoverarbeitungsvorrichtung, Videoverarbeitungsverfahren und Computerprogramm
DE602005018282D1 (de) Bilderzeugungsgerät, Bildverarbeitungsverfahren, Programm und Aufzeichnungsmedium
DE602004017561D1 (de) Informationsverarbeitungsvorrichtung und -verfahren
NO20035855L (no) Anordning, medium og fremgangsmate for opptak, og tilhorende datamaskinprogram
EP1571561A4 (de) Datenverarbeitungsvorrichtung und -verfahren, aufzeichnungsmedium und programm
EP1684506A4 (de) Bildverarbeitungseinrichtung, bildverarbeitungsverfahren, programm dafür und aufzeichnungsmedium
DE602004022103D1 (de) Bildverarbeitungsvorrichtung, Steuerungsverfahren dafür und Programm
EP1575288A4 (de) Informationsverarbeitungseinrichtung, informationsverarbeitungsverfahren und -programm und aufzeichnungsmedium
EP1496441A4 (de) Informationsverarbeitungseinrichtung, verfahren, aufzeichnungsmedium und programm
DE602004030869D1 (de) Dekodierverfahren, dekodiervorrichtung, programm, aufzeichnungs-/wiedergabevorrichtung und -verfahren, und wiedergabevorrichtung und -verfahren
DE602004025646D1 (de) Datenverarbeitungsgerät, -verfahren, -speichermedium und -programm
EP1587311A4 (de) Bildverarbeitungseinrichtung und verfahren, aufzeichnungsmediumund programm
DE602004022945D1 (de) Aufzeichnungsmedium, wiedergabeeinrichtung, aufzeichnungsverfahren, programm und wiedergabeverfahren
DE602004027477D1 (de) Aufzeichnungsmedium, wiedergabeeinrichtung, aufzeichnungsverfahren, programm und wiedergabeverfahren
EP1574961A4 (de) Informations verarbeitungseinrichtung und verfahren, programm und aufzeichnungsmedium
DE60320169D1 (de) Überwachungsverfahren und -vorrichtung, sowie zugehöriges Programm- und Aufzeichnungsmedium
DE602004015561D1 (de) Informationsverarbeitungvorrichtung und Steuerverfahren dafür
DE602004002643D1 (de) Bildverarbeitungsapparat, Bildverarbeitungsmethode und Programm
DE602004024266D1 (de) Datenverarbeitungsgerät und -verfahren
DE602005001717D1 (de) Bildverarbeitungsvorrichtung und -verfahren, Speichermedium und Programm
EP1511036A4 (de) Informationsverarbeitungseinrichtung und -verfahren, aufzeichnungsmedium und programm
EP1612796A4 (de) Informationsverarbeitungseinrichtung und verfahren, programm und aufzeichnungsmedium

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)