JP2013122599A - コンテキストの動的作成のための方法及びシステム - Google Patents
コンテキストの動的作成のための方法及びシステム Download PDFInfo
- Publication number
- JP2013122599A JP2013122599A JP2013000242A JP2013000242A JP2013122599A JP 2013122599 A JP2013122599 A JP 2013122599A JP 2013000242 A JP2013000242 A JP 2013000242A JP 2013000242 A JP2013000242 A JP 2013000242A JP 2013122599 A JP2013122599 A JP 2013122599A
- Authority
- JP
- Japan
- Prior art keywords
- context
- sub
- text
- speech
- electronic document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Abstract
【解決手段】音声の部分は、作成者によって口述され、サブ・コンテキストを音声認識器により、動的に作成及び/又は適合する工程と、サブ・コンテキストをテキストの部分と関連付ける工程とを含む。
【選択図】図1
Description
1. Topic1+SubContextl及びTopic2+SubContext2は既にContextAに関係している。
Claims (8)
- 音声の部分から認識又は翻訳されたテキストの部分を備える音声ベースの文書である電子文書を備える音声認識システムのための方法であって、前記音声の部分は、作成者によって口述され、前記音声認識システム内の音声認識器により、前記音声ベースの文書のテキストの対応する部分に処理され、前記方法は、前記音声認識器による、別々のコンテキストを動的に作成及び/又は適合する工程と、前記別々のコンテキストを前記テキストの部分に関連付ける工程とを含み、前記別々のコンテキストを前記テキストの部分に関連付ける工程は、
前記電子文書に関係した基本主題を識別する工程と、
基本コンテキストを前記電子文書に関連付ける工程であって、前記基本コンテキストは、少なくとも語の組、及び前記基本主題に関係する前記語の組の使用を備える工程と、
前記電子文書内のテキストの特定の部分にそれぞれが関係するサブ主題を識別する工程と、
サブ・コンテキストを前記基本コンテキストから作成する工程であって、前記サブ・コンテキストは、少なくとも特定された語の組、及び前記サブ主題に関係する前記特定された語の組の使用それぞれを備える工程と、
前記サブ・コンテキストそれぞれを前記電子文書内のテキストの一致する部分に関連付ける工程とを更に含む方法。 - 請求項1記載の方法であって、テキストの各部分に対する前記サブ・コンテキストを作成する工程、及び前記サブ・コンテキストを前記電子文書において適合する工程が自動的に行われる方法。
- 請求項1記載の方法であって、前記基本コンテキストから前記サブ・コンテキストを作成する工程は、前記電子文書の残りの部分とは異なる、前記テキストの特定の部分に関する語を識別する工程と、
前記特定された語の組を、前記基本コンテキストを使用することによって作成する工程とを備える方法。 - 音声の部分から認識又は翻訳されたテキストの1つ又は複数の部分を備える音声ベースの文書である電子文書を備える音声認識システムのためのシステムであって、前記音声の部分は、作成者によって口述され、前記音声認識システム内の音声認識器により、前記音声ベースの文書のテキストの対応する部分に処理され、前記システムは、前記音声認識器による、別々のコンテキストを作成及び/又は適合する手段と、前記コンテキストを前記テキストの部分に関連付ける手段とを備え、前記コンテキストを前記テキストの部分に関連付ける手段は、
前記電子文書に関係した基本主題を識別する手段と、
基本コンテキストを前記電子文書に関連付ける手段であって、前記基本コンテキストは、少なくとも語の組、及び前記基本主題に関係する前記語の組の使用を備える手段と、
前記電子文書内のテキストの特定の部分にそれぞれが関係するサブ主題を識別する手段と、
サブ・コンテキストを前記基本コンテキストから作成する手段であって、前記サブ・コンテキストは、少なくとも特定された語の組、及び前記サブ主題に関係する前記特定された語の組の使用それぞれを備える手段と、
前記サブ・コンテキストそれぞれを前記電子文書内のテキストの一致する部分に関連付ける手段とを備えるシステム。 - 請求項4記載のシステムであって、前記電子文書内の各テキスト部分にサブ・コンテキストを作成及び/又は適合する手段は自動的な手段であるシステム。
- 請求項4記載のシステムであって、前記基本コンテキストからサブ・コンテキストを作成する手段は、前記電子文書の残りの部分とは異なる、前記テキストの特定の部分に関する語を識別する手段と、
前記特定された語の組を、前記基本コンテキストを使用することによって作成する手段とを備えるシステム。 - コンピュータによって処理するためのコンピュータ・プログラムを上に実施したコンピュータ読み取り可能な媒体であって、前記コンピュータ・プログラムは、音声の部分から認識又は翻訳されたテキストの1つ又は複数の部分を備える音声ベースの文書である電子文書を備える音声認識システム用に構成され、前記音声の部分は、前記音声認識システム内の音声認識器により、前記音声ベースの文書のテキストの対応する部分に処理され、前記コンピュータ・プログラムは、別々のコンテキストを作成し、前記音声認識器において適合し、前記テキストの部分に前記コンテキストを関連付けるためのコード・セグメントを備え、前記コード・セグメントは、
前記電子文書に関係した基本主題を判定するためのコード・セグメントと、
基本コンテキストを前記電子文書と関連付けるためのコード・セグメントであって、前記基本コンテキストが、語の組、及び前記基本主題に関係する前記語の組の使用を備えるコード・セグメントと、
前記電子文書内のテキストの特定の部分にそれぞれが関係するサブ主題を識別するためのコード・セグメントと、
前記基本コンテキストを使用することによってサブ・コンテキストを作成するためのコード・セグメントであって、前記サブ・コンテキストが、少なくとも特定された語の組、及び前記サブ主題に関係する前記特定された語の組の使用それぞれを備えるコード・セグメントと、
前記サブ・コンテキストそれぞれを前記電子文書内のテキストの一致する部分と関連付けるためのコード・セグメントとを備えるコンピュータ読み取り可能な媒体。 - 請求項4乃至6の何れかに記載のシステムを備えた医療ディクテーション装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05111834 | 2005-12-08 | ||
EP05111834.7 | 2005-12-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008543983A Division JP5401096B2 (ja) | 2005-12-08 | 2006-12-07 | コンテキストの動的作成のための方法及びシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013122599A true JP2013122599A (ja) | 2013-06-20 |
Family
ID=38001915
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008543983A Expired - Fee Related JP5401096B2 (ja) | 2005-12-08 | 2006-12-07 | コンテキストの動的作成のための方法及びシステム |
JP2013000242A Pending JP2013122599A (ja) | 2005-12-08 | 2013-01-04 | コンテキストの動的作成のための方法及びシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008543983A Expired - Fee Related JP5401096B2 (ja) | 2005-12-08 | 2006-12-07 | コンテキストの動的作成のための方法及びシステム |
Country Status (6)
Country | Link |
---|---|
US (3) | US8473296B2 (ja) |
EP (1) | EP1960998B1 (ja) |
JP (2) | JP5401096B2 (ja) |
CN (1) | CN101326573A (ja) |
AT (1) | ATE514162T1 (ja) |
WO (1) | WO2007066304A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6820632B1 (ja) * | 2020-10-05 | 2021-01-27 | 株式会社グルーパー | 情報処理装置、及びプログラム |
JP2022028897A (ja) * | 2020-12-25 | 2022-02-16 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 文章翻訳方法、装置、電子機器及び記憶媒体 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007066304A1 (en) | 2005-12-08 | 2007-06-14 | Koninklijke Philips Electronics N.V. | Method and system for dynamic creation of contexts |
US20090287487A1 (en) * | 2008-05-14 | 2009-11-19 | General Electric Company | Systems and Methods for a Visual Indicator to Track Medical Report Dictation Progress |
US10203861B2 (en) | 2008-05-21 | 2019-02-12 | Please Don't Go, LLC. | Messaging window overlay for a browser |
US9679561B2 (en) | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
US20120316874A1 (en) * | 2011-04-13 | 2012-12-13 | Lipman Brian T | Radiology verification system and method |
CN102436813A (zh) * | 2011-12-21 | 2012-05-02 | 成都众询科技有限公司 | 一种可控语音控制系统 |
US9620111B1 (en) * | 2012-05-01 | 2017-04-11 | Amazon Technologies, Inc. | Generation and maintenance of language model |
US9448772B2 (en) * | 2013-03-15 | 2016-09-20 | Microsoft Technology Licensing, Llc | Generating program fragments using keywords and context information |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9756185B1 (en) * | 2014-11-10 | 2017-09-05 | Teton1, Llc | System for automated call analysis using context specific lexicon |
WO2021080033A1 (ko) | 2019-10-23 | 2021-04-29 | 엘지전자 주식회사 | 음성 분석 방법 및 장치 |
US11688394B1 (en) * | 2020-06-01 | 2023-06-27 | Amazon Technologies, Inc. | Entity language models for speech processing |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273299A (ja) * | 1991-02-28 | 1992-09-29 | Ricoh Co Ltd | 音声認識装置 |
WO2002033691A1 (en) * | 2000-10-17 | 2002-04-25 | Cyberpulse, Llc | Structured speech recognition |
US20030105638A1 (en) * | 2001-11-27 | 2003-06-05 | Taira Rick K. | Method and system for creating computer-understandable structured medical data from natural language reports |
JP2004523004A (ja) * | 2001-03-01 | 2004-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 階層言語モデル |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
JP2009518678A (ja) * | 2005-12-08 | 2009-05-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテキストの動的作成のための方法及びシステム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3118725B2 (ja) * | 1991-09-11 | 2000-12-18 | 株式会社日立製作所 | 自動分類方法 |
US5918236A (en) * | 1996-06-28 | 1999-06-29 | Oracle Corporation | Point of view gists and generic gists in a document browsing system |
US5864819A (en) * | 1996-11-08 | 1999-01-26 | International Business Machines Corporation | Internal window object tree method for representing graphical user interface applications for speech navigation |
US5839106A (en) * | 1996-12-17 | 1998-11-17 | Apple Computer, Inc. | Large-vocabulary speech recognition using an integrated syntactic and semantic statistical language model |
US6154213A (en) * | 1997-05-30 | 2000-11-28 | Rennison; Earl F. | Immersive movement-based interaction with large complex information structures |
US6224383B1 (en) * | 1999-03-25 | 2001-05-01 | Planetlingo, Inc. | Method and system for computer assisted natural language instruction with distracters |
CN1886726A (zh) | 2003-11-28 | 2006-12-27 | 皇家飞利浦电子股份有限公司 | 转录音频信号的方法和设备 |
US20050273839A1 (en) * | 2004-06-02 | 2005-12-08 | Nokia Corporation | System and method for automated context-based data presentation |
US7584103B2 (en) | 2004-08-20 | 2009-09-01 | Multimodal Technologies, Inc. | Automated extraction of semantic content and generation of a structured document from speech |
US8335688B2 (en) * | 2004-08-20 | 2012-12-18 | Multimodal Technologies, Llc | Document transcription system training |
-
2006
- 2006-12-07 WO PCT/IB2006/054645 patent/WO2007066304A1/en active Application Filing
- 2006-12-07 US US12/096,055 patent/US8473296B2/en active Active
- 2006-12-07 AT AT06832129T patent/ATE514162T1/de not_active IP Right Cessation
- 2006-12-07 JP JP2008543983A patent/JP5401096B2/ja not_active Expired - Fee Related
- 2006-12-07 EP EP06832129A patent/EP1960998B1/en active Active
- 2006-12-07 CN CNA2006800460954A patent/CN101326573A/zh active Pending
-
2013
- 2013-01-04 JP JP2013000242A patent/JP2013122599A/ja active Pending
- 2013-06-10 US US13/913,594 patent/US8798997B2/en active Active
-
2014
- 2014-06-20 US US14/310,365 patent/US9412370B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273299A (ja) * | 1991-02-28 | 1992-09-29 | Ricoh Co Ltd | 音声認識装置 |
WO2002033691A1 (en) * | 2000-10-17 | 2002-04-25 | Cyberpulse, Llc | Structured speech recognition |
JP2004523004A (ja) * | 2001-03-01 | 2004-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 階層言語モデル |
US20030105638A1 (en) * | 2001-11-27 | 2003-06-05 | Taira Rick K. | Method and system for creating computer-understandable structured medical data from natural language reports |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
JP2007512608A (ja) * | 2003-11-21 | 2007-05-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル |
JP2009518678A (ja) * | 2005-12-08 | 2009-05-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテキストの動的作成のための方法及びシステム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6820632B1 (ja) * | 2020-10-05 | 2021-01-27 | 株式会社グルーパー | 情報処理装置、及びプログラム |
JP2022060632A (ja) * | 2020-10-05 | 2022-04-15 | 株式会社グルーパー | 情報処理装置、及びプログラム |
JP2022028897A (ja) * | 2020-12-25 | 2022-02-16 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 文章翻訳方法、装置、電子機器及び記憶媒体 |
JP7395553B2 (ja) | 2020-12-25 | 2023-12-11 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 文章翻訳方法、装置、電子機器及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2009518678A (ja) | 2009-05-07 |
US8798997B2 (en) | 2014-08-05 |
US20130275131A1 (en) | 2013-10-17 |
US20080288249A1 (en) | 2008-11-20 |
EP1960998A1 (en) | 2008-08-27 |
JP5401096B2 (ja) | 2014-01-29 |
WO2007066304A1 (en) | 2007-06-14 |
ATE514162T1 (de) | 2011-07-15 |
US9412370B2 (en) | 2016-08-09 |
US20140303976A1 (en) | 2014-10-09 |
EP1960998B1 (en) | 2011-06-22 |
CN101326573A (zh) | 2008-12-17 |
US8473296B2 (en) | 2013-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5401096B2 (ja) | コンテキストの動的作成のための方法及びシステム | |
US7949536B2 (en) | Intelligent speech recognition of incomplete phrases | |
US10720152B2 (en) | Negative n-gram biasing | |
US9442910B2 (en) | Method and system for adding punctuation to voice files | |
US8612231B2 (en) | Method and system for speech based document history tracking | |
JP2006521578A (ja) | 音声認識システム | |
JP2006521578A5 (ja) | ||
JP2006085160A (ja) | アルファニューメリック概念のための音声認識文法の作成 | |
JPWO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
JP2003162524A (ja) | 言語処理装置 | |
Komatani et al. | Restoring incorrectly segmented keywords and turn-taking caused by short pauses | |
US20230317069A1 (en) | Context aware speech transcription | |
US20230153538A1 (en) | Bootstrapping Topic Detection in Conversations | |
Le-Duc | VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain | |
Tran et al. | Automatic speech recognition performance for digital scribes: a performance comparison between general-purpose and specialized models tuned for patient-clinician conversations | |
JP4206253B2 (ja) | 自動音声応答装置及び自動音声応答方法 | |
JP2023007014A (ja) | 応答システム、応答方法、および応答プログラム | |
CN113763921A (zh) | 用于纠正文本的方法和装置 | |
JPWO2018043139A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140310 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140313 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140610 |