JP2005517216A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2005517216A5 JP2005517216A5 JP2003566843A JP2003566843A JP2005517216A5 JP 2005517216 A5 JP2005517216 A5 JP 2005517216A5 JP 2003566843 A JP2003566843 A JP 2003566843A JP 2003566843 A JP2003566843 A JP 2003566843A JP 2005517216 A5 JP2005517216 A5 JP 2005517216A5
- Authority
- JP
- Japan
- Prior art keywords
- text
- speech recognition
- manually
- recognition result
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035897 transcription Effects 0.000 claims 5
Claims (11)
- 話されたことばの人手で書き起こされたテキストと音声認識結果とがあり、前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることにより、前記話されたことばを書き起こす方法。
- 人手で書き起こされたテキストがある話されたことばを書き起こす方法であって、前記方法は、
前記人手で書き起こされたテキストを斟酌して、前記話されたことばの音声認識をするステップと、
前記人手で書き起こされたテキストと前記音声認識結果の組み合わせにより、または書き起こしのための前記音声認識結果の採用により、前記話されたことばの書き起こしを生成するステップとを含む方法。 - 請求項1または2に記載の方法であって、
前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることは、人手による書き起こしおよび音声認識の過程の確率的モデルにより、最も確からしい前記話されたことばの書き起こしを決定することからなることを特徴とする方法。 - 請求項1または2に記載の方法であって、
前記音声認識結果は得点付けされたNベストリストまたは得点付けされた単語グラフであり、
前記人手で書き起こされたテキストと前記音声認識結果との組み合わせは、前記人手で書き起こされたテキストを斟酌した前記Nベストリストまたは前記単語グラフの再得点付けにあることを特徴とする方法。 - 請求項2に記載の方法であって、
前記話されたことばの音声認識における前記人手で書き起こされたテキストの斟酌は、前記音声認識の語彙および/または音声認識言語モデルを選択することにあることを特徴とする方法。 - 請求項1または2に記載の方法であって、
前記人手で書き起こされたテキストは、手書きの形式でおよび/または速記の形式であることを特徴とする方法。 - 請求項1または2に記載の方法であって、
前記人手で書き起こされたテキストは、一般に適用可能な人手による書き起こしの生成と比較して指および/または手の動きの程度を削減するために、キーストロークの省略および/または異なるキーを叩くことにより、そのテキストの生成に要する時間を短縮するようにキーボード入力により生成されたものであることを特徴とする方法。 - 音声認識結果がある話されたことばを書き起こす装置であって、
前記話されたことばの人手による書き起こしのための手段と、
前記人手で書き起こされたテキストと前記音声認識結果とを組み合わせることにより、前記話されたことばの書き起こしを生成するための手段とを含む装置。 - 音声認識結果がある話されたことばを音声認識支援を受けて人手で書き起こす装置であって、
前記話されたことばの人手による書き起こしの連続的な入力のための手段と、
前記人手による入力と前記音声認識結果の連続的組み合わせのための手段と、
前記連続的組み合わせおよび前記音声認識結果によって予測される程度まで、テキスト入力を続けることを示唆するための手段と、
前記示唆されたテキストの継続を受け入れるかまたは拒絶するための手段とを含む装置。 - 書かれたことばの人手で書き起こされたテキストとテキスト認識結果とがあり、前記人手で書き起こされたテキストと前記テキスト認識結果とを組み合わせることにより、前記書かれたことばを書き起こす方法。
- SMS通信またはビデオの副題の生成をするための、請求項1ないし7いずれか一項記載の方法の使用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10204924A DE10204924A1 (de) | 2002-02-07 | 2002-02-07 | Verfahren und Vorrichtung zur schnellen mustererkennungsunterstützten Transkription gesprochener und schriftlicher Äußerungen |
PCT/IB2003/000374 WO2003067573A1 (en) | 2002-02-07 | 2003-01-30 | Method and device for the rapid, pattern-recognition-supported transcription of spoken and written utterances |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005517216A JP2005517216A (ja) | 2005-06-09 |
JP2005517216A5 true JP2005517216A5 (ja) | 2010-05-27 |
Family
ID=27618362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003566843A Pending JP2005517216A (ja) | 2002-02-07 | 2003-01-30 | 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20060167685A1 (ja) |
EP (1) | EP1479070B1 (ja) |
JP (1) | JP2005517216A (ja) |
AT (1) | ATE358869T1 (ja) |
AU (1) | AU2003205955A1 (ja) |
DE (2) | DE10204924A1 (ja) |
WO (1) | WO2003067573A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050273337A1 (en) * | 2004-06-02 | 2005-12-08 | Adoram Erell | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition |
US20070011012A1 (en) * | 2005-07-11 | 2007-01-11 | Steve Yurick | Method, system, and apparatus for facilitating captioning of multi-media content |
KR100654183B1 (ko) * | 2005-11-07 | 2006-12-08 | 한국전자통신연구원 | 음성 인식을 이용한 문자 입력 시스템 및 그 방법 |
US9230222B2 (en) * | 2008-07-23 | 2016-01-05 | The Quantum Group, Inc. | System and method enabling bi-translation for improved prescription accuracy |
JP2013025299A (ja) * | 2011-07-26 | 2013-02-04 | Toshiba Corp | 書き起こし支援システムおよび書き起こし支援方法 |
JP6165619B2 (ja) * | 2013-12-13 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN109285548A (zh) * | 2017-07-19 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 信息处理方法、系统、电子设备、和计算机存储介质 |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US11017778B1 (en) | 2018-12-04 | 2021-05-25 | Sorenson Ip Holdings, Llc | Switching between speech recognition systems |
US11488604B2 (en) | 2020-08-19 | 2022-11-01 | Sorenson Ip Holdings, Llc | Transcription of audio |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0122880A2 (en) * | 1983-04-19 | 1984-10-24 | E.S.P. Elektronische Spezialprojekte Aktiengesellschaft | Electronic apparatus for high-speed writing on electronic typewriters, printers, photocomposers, processors and the like |
JPS6091435A (ja) * | 1983-10-25 | 1985-05-22 | Fujitsu Ltd | 文字入力装置 |
JPS62229300A (ja) * | 1986-03-31 | 1987-10-08 | キヤノン株式会社 | 音声認識装置 |
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
EP0505621A3 (en) * | 1991-03-28 | 1993-06-02 | International Business Machines Corporation | Improved message recognition employing integrated speech and handwriting information |
US5502774A (en) * | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
JPH0883092A (ja) * | 1994-09-14 | 1996-03-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報入力装置及び情報入力方法 |
US5818437A (en) * | 1995-07-26 | 1998-10-06 | Tegic Communications, Inc. | Reduced keyboard disambiguating computer |
JP3254977B2 (ja) * | 1995-08-31 | 2002-02-12 | 松下電器産業株式会社 | 音声認識方法及び音声認識装置 |
US5855000A (en) * | 1995-09-08 | 1998-12-29 | Carnegie Mellon University | Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input |
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
US6122613A (en) * | 1997-01-30 | 2000-09-19 | Dragon Systems, Inc. | Speech recognition using multiple recognizers (selectively) applied to the same input sample |
DE69817844T2 (de) * | 1997-06-27 | 2004-05-06 | M.H. Segan Ltd. Partnership, Great Barrington | Verfahren und vorrichtung zur spracherkennungscomputereingabe |
US6219453B1 (en) * | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6418431B1 (en) * | 1998-03-30 | 2002-07-09 | Microsoft Corporation | Information retrieval and speech recognition based on language models |
US6078885A (en) * | 1998-05-08 | 2000-06-20 | At&T Corp | Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems |
US6438523B1 (en) * | 1998-05-20 | 2002-08-20 | John A. Oberteuffer | Processing handwritten and hand-drawn input and speech input |
FI981154A (fi) * | 1998-05-25 | 1999-11-26 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen tunnistamiseksi |
JP2000056796A (ja) * | 1998-08-07 | 2000-02-25 | Asahi Chem Ind Co Ltd | 音声入力装置および方法 |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
US6167376A (en) * | 1998-12-21 | 2000-12-26 | Ditzik; Richard Joseph | Computer system with integrated telephony, handwriting and speech recognition functions |
JP2000339305A (ja) * | 1999-05-31 | 2000-12-08 | Toshiba Corp | 文書作成装置、及び文書作成方法 |
US6442518B1 (en) * | 1999-07-14 | 2002-08-27 | Compaq Information Technologies Group, L.P. | Method for refining time alignments of closed captions |
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
JP2001042996A (ja) * | 1999-07-28 | 2001-02-16 | Toshiba Corp | 文書作成装置、文書作成方法 |
US6789231B1 (en) * | 1999-10-05 | 2004-09-07 | Microsoft Corporation | Method and system for providing alternatives for text derived from stochastic input sources |
JP2001159896A (ja) * | 1999-12-02 | 2001-06-12 | Nec Software Okinawa Ltd | 音声認識機能を利用した簡易文字入力方法 |
US7149970B1 (en) * | 2000-06-23 | 2006-12-12 | Microsoft Corporation | Method and system for filtering and selecting from a candidate list generated by a stochastic input method |
US7243069B2 (en) * | 2000-07-28 | 2007-07-10 | International Business Machines Corporation | Speech recognition by automated context creation |
US6836759B1 (en) * | 2000-08-22 | 2004-12-28 | Microsoft Corporation | Method and system of handling the selection of alternates for recognized words |
US6788815B2 (en) * | 2000-11-10 | 2004-09-07 | Microsoft Corporation | System and method for accepting disparate types of user input |
US20020152071A1 (en) * | 2001-04-12 | 2002-10-17 | David Chaiken | Human-augmented, automatic speech recognition engine |
US20020152075A1 (en) * | 2001-04-16 | 2002-10-17 | Shao-Tsu Kung | Composite input method |
US6839667B2 (en) * | 2001-05-16 | 2005-01-04 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
US6996525B2 (en) * | 2001-06-15 | 2006-02-07 | Intel Corporation | Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience |
US7058575B2 (en) * | 2001-06-27 | 2006-06-06 | Intel Corporation | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition |
US7467089B2 (en) * | 2001-09-05 | 2008-12-16 | Roth Daniel L | Combined speech and handwriting recognition |
US6708148B2 (en) * | 2001-10-12 | 2004-03-16 | Koninklijke Philips Electronics N.V. | Correction device to mark parts of a recognized text |
US7124085B2 (en) * | 2001-12-13 | 2006-10-17 | Matsushita Electric Industrial Co., Ltd. | Constraint-based speech recognition system and method |
US20030112277A1 (en) * | 2001-12-14 | 2003-06-19 | Koninklijke Philips Electronics N.V. | Input of data using a combination of data input systems |
US7103542B2 (en) * | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
US6986106B2 (en) * | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
US7137076B2 (en) * | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Correcting recognition results associated with user input |
US7228275B1 (en) * | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
-
2002
- 2002-02-07 DE DE10204924A patent/DE10204924A1/de not_active Withdrawn
-
2003
- 2003-01-30 AU AU2003205955A patent/AU2003205955A1/en not_active Abandoned
- 2003-01-30 EP EP03702838A patent/EP1479070B1/en not_active Expired - Lifetime
- 2003-01-30 DE DE60312963T patent/DE60312963T2/de not_active Expired - Lifetime
- 2003-01-30 AT AT03702838T patent/ATE358869T1/de not_active IP Right Cessation
- 2003-01-30 WO PCT/IB2003/000374 patent/WO2003067573A1/en active IP Right Grant
- 2003-01-30 JP JP2003566843A patent/JP2005517216A/ja active Pending
- 2003-01-30 US US10/503,420 patent/US20060167685A1/en not_active Abandoned
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9601116B2 (en) | Recognizing speech in the presence of additional audio | |
US8571862B2 (en) | Multimodal interface for input of text | |
US8355915B2 (en) | Multimodal speech recognition system | |
WO2006054724A1 (ja) | 音声認識装置及び方法ならびにプログラム | |
US9978364B2 (en) | Pronunciation accuracy in speech recognition | |
US7676364B2 (en) | System and method for speech-to-text conversion using constrained dictation in a speak-and-spell mode | |
TW200638337A (en) | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system | |
TW200627376A (en) | Method and apparatus for constructing Chinese new words by the input voice | |
JP2005517216A5 (ja) | ||
JP2016521383A (ja) | 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体 | |
Kurian et al. | Speech recognition of Malayalam numbers | |
Sajjan et al. | Continuous Speech Recognition of Kannada language using triphone modeling | |
JP2002221989A5 (ja) | ||
Nimje et al. | Automatic isolated digit recognition system: an approach using HMM | |
Janicki et al. | Automatic speech recognition for Polish in a computer game interface | |
JP2011039468A (ja) | 電子辞書で音声認識を用いた単語探索装置及びその方法 | |
Ivanov et al. | Automated speech recognition technology for dialogue interaction with non-native interlocutors | |
JP2004170466A (ja) | 音声認識方法と電子装置 | |
Lamel et al. | Improved acoustic modeling for transcribing Arabic broadcast data. | |
JP2012255867A (ja) | 音声認識装置 | |
Cerva et al. | Design and development of voice controlled aids for motor-handicapped persons. | |
Lamel et al. | Alternate phone models for conversational speech | |
Soe et al. | Syllable-based speech recognition system for Myanmar | |
Ang et al. | Open domain continuous filipino speech recognition with code-switching | |
Abdeen et al. | An architecture for multi-lingual hands-free desktop control system for PC windows |