JP2005517216A5 - - Google Patents

Download PDF

Info

Publication number
JP2005517216A5
JP2005517216A5 JP2003566843A JP2003566843A JP2005517216A5 JP 2005517216 A5 JP2005517216 A5 JP 2005517216A5 JP 2003566843 A JP2003566843 A JP 2003566843A JP 2003566843 A JP2003566843 A JP 2003566843A JP 2005517216 A5 JP2005517216 A5 JP 2005517216A5
Authority
JP
Japan
Prior art keywords
text
speech recognition
manually
recognition result
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003566843A
Other languages
English (en)
Other versions
JP2005517216A (ja
Filing date
Publication date
Priority claimed from DE10204924A external-priority patent/DE10204924A1/de
Application filed filed Critical
Publication of JP2005517216A publication Critical patent/JP2005517216A/ja
Publication of JP2005517216A5 publication Critical patent/JP2005517216A5/ja
Pending legal-status Critical Current

Links

Claims (11)

  1. 話されたことばの人手で書き起こされたテキストと音声認識結果とがあり、前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることにより、前記話されたことばを書き起こす方法。
  2. 人手で書き起こされたテキストがある話されたことばを書き起こす方法であって、前記方法は、
    前記人手で書き起こされたテキストを斟酌して、前記話されたことばの音声認識をするステップと、
    前記人手で書き起こされたテキストと前記音声認識結果の組み合わせにより、または書き起こしのための前記音声認識結果の採用により、前記話されたことばの書き起こしを生成するステップとを含む方法。
  3. 請求項1または2に記載の方法であって、
    前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることは、人手による書き起こしおよび音声認識の過程の確率的モデルにより、最も確からしい前記話されたことばの書き起こしを決定することからなることを特徴とする方法。
  4. 請求項1または2に記載の方法であって、
    前記音声認識結果は得点付けされたNベストリストまたは得点付けされた単語グラフであり、
    前記人手で書き起こされたテキストと前記音声認識結果との組み合わせは、前記人手で書き起こされたテキストを斟酌した前記Nベストリストまたは前記単語グラフの再得点付けにあることを特徴とする方法。
  5. 請求項2に記載の方法であって、
    前記話されたことばの音声認識における前記人手で書き起こされたテキストの斟酌は、前記音声認識の語彙および/または音声認識言語モデルを選択することにあることを特徴とする方法。
  6. 請求項1または2に記載の方法であって、
    前記人手で書き起こされたテキストは、手書きの形式でおよび/または速記の形式であることを特徴とする方法。
  7. 請求項1または2に記載の方法であって、
    前記人手で書き起こされたテキストは、一般に適用可能な人手による書き起こしの生成と比較して指および/または手の動きの程度を削減するために、キーストロークの省略および/または異なるキーを叩くことにより、そのテキストの生成に要する時間を短縮するようにキーボード入力により生成されたものであることを特徴とする方法。
  8. 音声認識結果がある話されたことばを書き起こす装置であって、
    前記話されたことばの人手による書き起こしのための手段と、
    前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることにより、前記話されたことばの書き起こしを生成するための手段とを含む装置。
  9. 音声認識結果がある話されたことばを音声認識支援を受けて人手で書き起こす装置であって、
    前記話されたことばの人手による書き起こしの連続的な入力のための手段と、
    前記人手による入力と前記音声認識結果の連続的組み合わせのための手段と、
    前記連続的組み合わせおよび前記音声認識結果によって予測される程度まで、テキスト入力を続けることを示唆するための手段と、
    前記示唆されたテキストの継続を受け入れるかまたは拒絶するための手段とを含む装置。
  10. 書かれたことばの人手で書き起こされたテキストとテキスト認識結果とがあり、前記人手で書き起こされたテキストと前記テキスト認識結果とを組み合わせることにより、前記書かれたことばを書き起こす方法。
  11. SMS通信またはビデオの副題の生成をするための、請求項1ないし7いずれか一項記載の方法の使用。
JP2003566843A 2002-02-07 2003-01-30 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置 Pending JP2005517216A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10204924A DE10204924A1 (de) 2002-02-07 2002-02-07 Verfahren und Vorrichtung zur schnellen mustererkennungsunterstützten Transkription gesprochener und schriftlicher Äußerungen
PCT/IB2003/000374 WO2003067573A1 (en) 2002-02-07 2003-01-30 Method and device for the rapid, pattern-recognition-supported transcription of spoken and written utterances

Publications (2)

Publication Number Publication Date
JP2005517216A JP2005517216A (ja) 2005-06-09
JP2005517216A5 true JP2005517216A5 (ja) 2010-05-27

Family

ID=27618362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003566843A Pending JP2005517216A (ja) 2002-02-07 2003-01-30 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置

Country Status (7)

Country Link
US (1) US20060167685A1 (ja)
EP (1) EP1479070B1 (ja)
JP (1) JP2005517216A (ja)
AT (1) ATE358869T1 (ja)
AU (1) AU2003205955A1 (ja)
DE (2) DE10204924A1 (ja)
WO (1) WO2003067573A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050273337A1 (en) * 2004-06-02 2005-12-08 Adoram Erell Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US20070011012A1 (en) * 2005-07-11 2007-01-11 Steve Yurick Method, system, and apparatus for facilitating captioning of multi-media content
KR100654183B1 (ko) * 2005-11-07 2006-12-08 한국전자통신연구원 음성 인식을 이용한 문자 입력 시스템 및 그 방법
US9230222B2 (en) * 2008-07-23 2016-01-05 The Quantum Group, Inc. System and method enabling bi-translation for improved prescription accuracy
JP2013025299A (ja) * 2011-07-26 2013-02-04 Toshiba Corp 書き起こし支援システムおよび書き起こし支援方法
JP6165619B2 (ja) * 2013-12-13 2017-07-19 株式会社東芝 情報処理装置、情報処理方法、および情報処理プログラム
CN109285548A (zh) * 2017-07-19 2019-01-29 阿里巴巴集团控股有限公司 信息处理方法、系统、电子设备、和计算机存储介质
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US11017778B1 (en) 2018-12-04 2021-05-25 Sorenson Ip Holdings, Llc Switching between speech recognition systems
US11488604B2 (en) 2020-08-19 2022-11-01 Sorenson Ip Holdings, Llc Transcription of audio

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0122880A2 (en) * 1983-04-19 1984-10-24 E.S.P. Elektronische Spezialprojekte Aktiengesellschaft Electronic apparatus for high-speed writing on electronic typewriters, printers, photocomposers, processors and the like
JPS6091435A (ja) * 1983-10-25 1985-05-22 Fujitsu Ltd 文字入力装置
JPS62229300A (ja) * 1986-03-31 1987-10-08 キヤノン株式会社 音声認識装置
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
EP0505621A3 (en) * 1991-03-28 1993-06-02 International Business Machines Corporation Improved message recognition employing integrated speech and handwriting information
US5502774A (en) * 1992-06-09 1996-03-26 International Business Machines Corporation Automatic recognition of a consistent message using multiple complimentary sources of information
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
JPH0883092A (ja) * 1994-09-14 1996-03-26 Nippon Telegr & Teleph Corp <Ntt> 情報入力装置及び情報入力方法
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
JP3254977B2 (ja) * 1995-08-31 2002-02-12 松下電器産業株式会社 音声認識方法及び音声認識装置
US5855000A (en) * 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
DE69817844T2 (de) * 1997-06-27 2004-05-06 M.H. Segan Ltd. Partnership, Great Barrington Verfahren und vorrichtung zur spracherkennungscomputereingabe
US6219453B1 (en) * 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US6418431B1 (en) * 1998-03-30 2002-07-09 Microsoft Corporation Information retrieval and speech recognition based on language models
US6078885A (en) * 1998-05-08 2000-06-20 At&T Corp Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems
US6438523B1 (en) * 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
FI981154A (fi) * 1998-05-25 1999-11-26 Nokia Mobile Phones Ltd Menetelmä ja laite puheen tunnistamiseksi
JP2000056796A (ja) * 1998-08-07 2000-02-25 Asahi Chem Ind Co Ltd 音声入力装置および方法
US6457031B1 (en) * 1998-09-02 2002-09-24 International Business Machines Corp. Method of marking previously dictated text for deferred correction in a speech recognition proofreader
US6167376A (en) * 1998-12-21 2000-12-26 Ditzik; Richard Joseph Computer system with integrated telephony, handwriting and speech recognition functions
JP2000339305A (ja) * 1999-05-31 2000-12-08 Toshiba Corp 文書作成装置、及び文書作成方法
US6442518B1 (en) * 1999-07-14 2002-08-27 Compaq Information Technologies Group, L.P. Method for refining time alignments of closed captions
US6904405B2 (en) * 1999-07-17 2005-06-07 Edwin A. Suominen Message recognition using shared language model
JP2001042996A (ja) * 1999-07-28 2001-02-16 Toshiba Corp 文書作成装置、文書作成方法
US6789231B1 (en) * 1999-10-05 2004-09-07 Microsoft Corporation Method and system for providing alternatives for text derived from stochastic input sources
JP2001159896A (ja) * 1999-12-02 2001-06-12 Nec Software Okinawa Ltd 音声認識機能を利用した簡易文字入力方法
US7149970B1 (en) * 2000-06-23 2006-12-12 Microsoft Corporation Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US7243069B2 (en) * 2000-07-28 2007-07-10 International Business Machines Corporation Speech recognition by automated context creation
US6836759B1 (en) * 2000-08-22 2004-12-28 Microsoft Corporation Method and system of handling the selection of alternates for recognized words
US6788815B2 (en) * 2000-11-10 2004-09-07 Microsoft Corporation System and method for accepting disparate types of user input
US20020152071A1 (en) * 2001-04-12 2002-10-17 David Chaiken Human-augmented, automatic speech recognition engine
US20020152075A1 (en) * 2001-04-16 2002-10-17 Shao-Tsu Kung Composite input method
US6839667B2 (en) * 2001-05-16 2005-01-04 International Business Machines Corporation Method of speech recognition by presenting N-best word candidates
US6996525B2 (en) * 2001-06-15 2006-02-07 Intel Corporation Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience
US7058575B2 (en) * 2001-06-27 2006-06-06 Intel Corporation Integrating keyword spotting with graph decoder to improve the robustness of speech recognition
US7467089B2 (en) * 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US6708148B2 (en) * 2001-10-12 2004-03-16 Koninklijke Philips Electronics N.V. Correction device to mark parts of a recognized text
US7124085B2 (en) * 2001-12-13 2006-10-17 Matsushita Electric Industrial Co., Ltd. Constraint-based speech recognition system and method
US20030112277A1 (en) * 2001-12-14 2003-06-19 Koninklijke Philips Electronics N.V. Input of data using a combination of data input systems
US7103542B2 (en) * 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
US6986106B2 (en) * 2002-05-13 2006-01-10 Microsoft Corporation Correction widget
US7137076B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
US7228275B1 (en) * 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers

Similar Documents

Publication Publication Date Title
US9601116B2 (en) Recognizing speech in the presence of additional audio
US8571862B2 (en) Multimodal interface for input of text
US8355915B2 (en) Multimodal speech recognition system
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
US9978364B2 (en) Pronunciation accuracy in speech recognition
US7676364B2 (en) System and method for speech-to-text conversion using constrained dictation in a speak-and-spell mode
TW200638337A (en) Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system
TW200627376A (en) Method and apparatus for constructing Chinese new words by the input voice
JP2005517216A5 (ja)
JP2016521383A (ja) 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体
Kurian et al. Speech recognition of Malayalam numbers
Sajjan et al. Continuous Speech Recognition of Kannada language using triphone modeling
JP2002221989A5 (ja)
Nimje et al. Automatic isolated digit recognition system: an approach using HMM
Janicki et al. Automatic speech recognition for Polish in a computer game interface
JP2011039468A (ja) 電子辞書で音声認識を用いた単語探索装置及びその方法
Ivanov et al. Automated speech recognition technology for dialogue interaction with non-native interlocutors
JP2004170466A (ja) 音声認識方法と電子装置
Lamel et al. Improved acoustic modeling for transcribing Arabic broadcast data.
JP2012255867A (ja) 音声認識装置
Cerva et al. Design and development of voice controlled aids for motor-handicapped persons.
Lamel et al. Alternate phone models for conversational speech
Soe et al. Syllable-based speech recognition system for Myanmar
Ang et al. Open domain continuous filipino speech recognition with code-switching
Abdeen et al. An architecture for multi-lingual hands-free desktop control system for PC windows