JP2009518729A - 発話に基づく文書履歴追跡のための方法およびシステム - Google Patents
発話に基づく文書履歴追跡のための方法およびシステム Download PDFInfo
- Publication number
- JP2009518729A JP2009518729A JP2008543945A JP2008543945A JP2009518729A JP 2009518729 A JP2009518729 A JP 2009518729A JP 2008543945 A JP2008543945 A JP 2008543945A JP 2008543945 A JP2008543945 A JP 2008543945A JP 2009518729 A JP2009518729 A JP 2009518729A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- document
- text
- sections
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012937 correction Methods 0.000 claims abstract description 31
- 230000009471 action Effects 0.000 claims abstract description 22
- 230000008859 change Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 8
- 238000000275 quality assurance Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Description
・プレーンテキスト;
・オート・テキスト(Auto text)(たとえばテキスト・ブロック);
・スマート・フィールド(たとえば、動的な要素、たとえばデータベースからの人口統計を含むテキスト・ブロック);
・名前を付けられたフィールド(たとえば、識別可能なプレースホルダー);
・その他
といった任意のものでよい。
Claims (16)
- 電子文書中の訂正を履歴追跡する方法が提供であって、ここで、前記電子文書は、発話の諸セクションから認識または転記されたテキストの一つまたは複数のセクションを含む発話に基づく文書であり、前記発話の諸セクションはユーザーによって口述され、発話認識システム中の発話認識器によって処理されて、前記発話に基づく文書のテキストの対応するセクションにされており、当該方法は:
前記発話に基づく文書におけるテキストの各セクションに、少なくとも一つの発話属性を関連付け、ここで、前記発話属性は、テキストの前記セクションに関係する情報をそれぞれ含む、ステップと;
呈示ユニット上に前記発話に基づく文書を呈示するステップと;
テキストの前記諸セクションのいずれかの中で実行される作用を検出するステップと;
前記発話に基づく文書を更新するために、テキストの前記諸セクションのうちの一つにおいて検出された作用の種類に関係する前記発話属性の情報を更新するステップとを有し、それにより、前記発話属性の前記の更新された情報が前記発話に基づく文書の訂正を履歴追跡するために使われる、
方法。 - 前記発話に基づく文書におけるテキストの各セクションに少なくとも一つの発話属性を関連付けるステップが自動的に実行される、請求項1記載の方法。
- テキストの前記諸セクションのいずれかの中で実行される作用を検出するステップが、前記テキスト・セクション内の、またはこのテキスト・セクションの少なくとも一部に対応する発話のセクション内の変更を検出することを含む、請求項1記載の方法。
- 前記発話属性の情報を更新するステップが:
テキストの前記諸セクションのうちの一つで検出された作用の種類に関係した第二の発話属性を、樹状結果表現内に追加することを含む、
請求項1記載の方法。 - 前記作用がテキストの前記諸セクションのうちの少なくとも一つを口述によって変更することであり、前記発話属性の前記更新に先立って:
前記発話認識器によって前記口述された訂正を処理し;
前記発話文書中で前記作用が実行されたのと実質的に同じ位置に前記訂正を含めることを含む、
請求項1記載の方法。 - 前記作用が、テキストの前記諸セクションのうちの少なくとも一つの、入力ユニットを使って前記呈示ユニット上に呈示された前記発話文書に対応するテキスト文書中にタイピングすることによる訂正である、請求項1記載の方法。
- 前記作用が前記ユーザーとは異なるユーザーによって実行される、請求項1記載の方法。
- 当該方法が二度以上実行され、当該方法がさらに、前記発話に基づく文書を更新するために、テキストの前記諸セクションのうちの一つにおいて検出された作用に関係する前記発話属性の情報を、前記発話に基づく文書中に保存されている以前のそのような情報に追加することを含む、請求項1記載の方法。
- 電子文書中の訂正を履歴追跡するシステムであって、前記電子文書は、発話の諸セクションから認識または転記されたテキストの一つまたは複数のセクションを含む発話に基づく文書であり、前記発話の諸セクションはユーザーによって口述され、発話認識システム中の発話認識器によって処理されて、前記発話に基づく文書のテキストの対応するセクションにされており、当該システムは:
前記発話に基づく文書におけるテキストの各セクションに、少なくとも一つの発話属性を関連付ける手段であって、前記発話属性は、テキストの前記セクションに関係する情報をそれぞれ含む手段と;
前記発話に基づく文書を呈示するための少なくとも一つの呈示ユニットと;
テキストの前記諸セクションのいずれかの中で実行される作用を検出する手段と;
前記発話に基づく文書を更新するために、テキストの前記諸セクションのうちの一つにおいて検出された作用の種類に関係する前記発話属性の情報を更新する手段とを有し;それにより、前記発話属性の前記更新された情報が、当該システムの使用において、前記発話に基づく文書の訂正を履歴追跡するために使われる、
システム。 - 前記発話に基づく文書の構造が、文書構築要素のセットから静的に定義される、請求項9記載のシステム。
- 前記発話に基づく文書の構造が、文書構築要素のセットから動的に定義される、請求項9記載のシステム。
- 前記文書構築要素がプレーンテキスト、テキスト・ブロックまたはスマート・フィールドもしくは名前を付けられたフィールドのようなテンプレートである、請求項10または11に記載のシステム。
- 前記発話属性が、前記発話に基づく文書のどの部分が変更されたか、誰が該部分を変更したか、どんな手段で該部分が変更されたか、および/または、いつ該部分が変更されたかに関係する、請求項9記載のシステム。
- 前記発話属性が口述エリア、認識信頼度、範囲に対する検出されたトピック、前記口述エリアのどの部分が変更されたか、前記発話文書のどの領域が置き換えられたか、前記発話文書のどの部分が聞かれるかタッチされるかしたか、である、請求項9記載のシステム。
- 当該システムが、認識および訂正属性に基づくオーディオ・フィルタを含む、請求項9記載のシステム。
- コンピュータによる処理のためのコンピュータ・プログラムが具現されたコンピュータ可読媒体であって、該コンピュータ・プログラムは、電子文書中の訂正を履歴追跡するよう構成されており、ここで、前記電子文書は、発話の諸セクションから認識または転記されたテキストの一つまたは複数のセクションを含む発話に基づく文書であり、発話の前記諸セクションは第一のユーザーによって口述され、発話認識システム中の発話認識器によって処理されて、前記発話に基づく文書のテキストの対応するセクションにされており、当該コンピュータ・プログラムは:
前記発話に基づく文書におけるテキストの各セクションに、少なくとも一つの発話属性を関連付けるコード・セグメントであって、該発話属性は、テキストの前記セクションに関係する情報をそれぞれ含む、コード・セグメントと;
呈示ユニット上に前記発話に基づく文書を呈示するためのコード・セグメントと;
テキストの前記諸セクションのいずれかの中で実行される作用を検出するためのコード・セグメントと;
前記発話に基づく文書を更新するために、テキストの前記諸セクションのうちの一つにおいて検出された作用の種類に関係する前記発話属性の情報を更新するためのコード・セグメントとを有し、それにより、前記発話属性の前記更新された情報が前記発話に基づく文書の訂正を履歴追跡するために使われる、
媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05111830 | 2005-12-08 | ||
PCT/IB2006/054191 WO2007066246A2 (en) | 2005-12-08 | 2006-11-10 | Method and system for speech based document history tracking |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009518729A true JP2009518729A (ja) | 2009-05-07 |
Family
ID=38115867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008543945A Pending JP2009518729A (ja) | 2005-12-08 | 2006-11-10 | 発話に基づく文書履歴追跡のための方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (3) | US8140338B2 (ja) |
EP (1) | EP1960943A2 (ja) |
JP (1) | JP2009518729A (ja) |
CN (1) | CN101326533B (ja) |
WO (1) | WO2007066246A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11354920B2 (en) | 2019-10-12 | 2022-06-07 | International Business Machines Corporation | Updating and implementing a document from an audio proceeding |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8589349B2 (en) | 2010-06-30 | 2013-11-19 | International Business Machines Corporation | Tracking and viewing revision history on a section-by-section basis |
US8832541B2 (en) * | 2011-01-20 | 2014-09-09 | Vastec, Inc. | Method and system to convert visually orientated objects to embedded text |
US8954329B2 (en) * | 2011-05-23 | 2015-02-10 | Nuance Communications, Inc. | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information |
GB2502944A (en) * | 2012-03-30 | 2013-12-18 | Jpal Ltd | Segmentation and transcription of speech |
CN103714048B (zh) * | 2012-09-29 | 2017-07-21 | 国际商业机器公司 | 用于校正文本的方法和系统 |
KR102319530B1 (ko) | 2014-08-18 | 2021-10-29 | 삼성전자주식회사 | 사용자 입력 처리 방법 및 장치 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
CN108647190B (zh) * | 2018-04-25 | 2022-04-29 | 北京华夏电通科技股份有限公司 | 一种语音识别文本插入笔录文档的方法、装置及系统 |
CN108733649B (zh) * | 2018-04-25 | 2022-05-06 | 北京华夏电通科技股份有限公司 | 一种语音识别文本插入笔录文档的方法、装置及系统 |
CN111179939B (zh) * | 2020-04-13 | 2020-07-28 | 北京海天瑞声科技股份有限公司 | 语音转写方法、语音转写装置及计算机存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08166946A (ja) * | 1994-12-13 | 1996-06-25 | Canon Inc | 文書処理方法及びその装置 |
JP2001042996A (ja) * | 1999-07-28 | 2001-02-16 | Toshiba Corp | 文書作成装置、文書作成方法 |
US6374214B1 (en) * | 1999-06-24 | 2002-04-16 | International Business Machines Corp. | Method and apparatus for excluding text phrases during re-dictation in a speech recognition system |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0229232A2 (en) | 1985-12-31 | 1987-07-22 | Tektronix, Inc. | File management system |
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
US6961700B2 (en) * | 1996-09-24 | 2005-11-01 | Allvoice Computing Plc | Method and apparatus for processing the output of a speech recognition engine |
US5966512A (en) * | 1997-06-05 | 1999-10-12 | International Business Machines Corporation | Groupware save operation |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
US7058888B1 (en) * | 2000-04-25 | 2006-06-06 | Microsoft Corporation | Multi-modal text editing correction |
US6963840B2 (en) * | 2001-01-12 | 2005-11-08 | International Business Machines Corporation | Method for incorporating multiple cursors in a speech recognition system |
US20020156816A1 (en) * | 2001-02-13 | 2002-10-24 | Mark Kantrowitz | Method and apparatus for learning from user self-corrections, revisions and modifications |
US6996528B2 (en) * | 2001-08-03 | 2006-02-07 | Matsushita Electric Industrial Co., Ltd. | Method for efficient, safe and reliable data entry by voice under adverse conditions |
US7386454B2 (en) * | 2002-07-31 | 2008-06-10 | International Business Machines Corporation | Natural error handling in speech recognition |
US7444285B2 (en) * | 2002-12-06 | 2008-10-28 | 3M Innovative Properties Company | Method and system for sequential insertion of speech recognition results to facilitate deferred transcription services |
ATE341381T1 (de) * | 2002-12-24 | 2006-10-15 | Koninkl Philips Electronics Nv | Verfahren und system zur markierung eines tonsignals mit metadaten |
US8074184B2 (en) * | 2003-11-07 | 2011-12-06 | Mocrosoft Corporation | Modifying electronic documents with recognized content or other associated data |
US7788237B2 (en) * | 2004-12-17 | 2010-08-31 | Microsoft Corporation | Method and system for tracking changes in a document |
-
2006
- 2006-11-10 JP JP2008543945A patent/JP2009518729A/ja active Pending
- 2006-11-10 CN CN2006800460850A patent/CN101326533B/zh not_active Expired - Fee Related
- 2006-11-10 EP EP06821392A patent/EP1960943A2/en not_active Ceased
- 2006-11-10 US US12/096,068 patent/US8140338B2/en not_active Expired - Fee Related
- 2006-11-10 WO PCT/IB2006/054191 patent/WO2007066246A2/en active Application Filing
-
2012
- 2012-02-03 US US13/366,123 patent/US8364489B2/en active Active
- 2012-12-14 US US13/715,679 patent/US8612231B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08166946A (ja) * | 1994-12-13 | 1996-06-25 | Canon Inc | 文書処理方法及びその装置 |
US6374214B1 (en) * | 1999-06-24 | 2002-04-16 | International Business Machines Corp. | Method and apparatus for excluding text phrases during re-dictation in a speech recognition system |
JP2001042996A (ja) * | 1999-07-28 | 2001-02-16 | Toshiba Corp | 文書作成装置、文書作成方法 |
Non-Patent Citations (2)
Title |
---|
CSNB200500418001; ルービン チャールス: Microsoft Office Word 2003 オフィシャルマニュアル 第1版, 20040712, pp.799-812, 日経BPソフトプレス * |
JPN6011066232; ルービン チャールス: Microsoft Office Word 2003 オフィシャルマニュアル 第1版, 20040712, pp.799-812, 日経BPソフトプレス * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11354920B2 (en) | 2019-10-12 | 2022-06-07 | International Business Machines Corporation | Updating and implementing a document from an audio proceeding |
Also Published As
Publication number | Publication date |
---|---|
CN101326533A (zh) | 2008-12-17 |
US20130103401A1 (en) | 2013-04-25 |
US8364489B2 (en) | 2013-01-29 |
WO2007066246A2 (en) | 2007-06-14 |
US20080312919A1 (en) | 2008-12-18 |
US8140338B2 (en) | 2012-03-20 |
CN101326533B (zh) | 2013-05-08 |
US8612231B2 (en) | 2013-12-17 |
WO2007066246A3 (en) | 2008-01-03 |
EP1960943A2 (en) | 2008-08-27 |
US20120185249A1 (en) | 2012-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009518729A (ja) | 発話に基づく文書履歴追跡のための方法およびシステム | |
US9412370B2 (en) | Method and system for dynamic creation of contexts | |
US8515755B2 (en) | Replacing text representing a concept with an alternate written form of the concept | |
EP1430474B1 (en) | Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word | |
US7949536B2 (en) | Intelligent speech recognition of incomplete phrases | |
US8356243B2 (en) | System and method for structuring speech recognized text into a pre-selected document format | |
JP5255769B2 (ja) | テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル | |
US7693717B2 (en) | Session file modification with annotation using speech recognition or text to speech | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
US6577999B1 (en) | Method and apparatus for intelligently managing multiple pronunciations for a speech recognition vocabulary | |
JP2003162524A (ja) | 言語処理装置 | |
WO2022196087A1 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
Weingartová et al. | Beey: More Than a Speech-to-Text Editor. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090715 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121120 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20121120 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121225 |