JP2018077870A

JP2018077870A - 音声認識方法

Info

Publication number: JP2018077870A
Application number: JP2017238369A
Authority: JP
Inventors: シュベルト，ケル; Schubert Kjell
Original assignee: MModal IP LLC
Current assignee: MModal IP LLC
Priority date: 2006-05-25
Filing date: 2017-12-13
Publication date: 2018-05-17
Also published as: EP2024876A2; US8515755B2; US8412524B2; JP2009538444A; JP2016048565A; JP2014029554A; WO2007139624A2; EP2024876A4; US20120173972A1; US20110131486A1; CA2653973C; US20070276649A1; US7831423B2; CA2653973A1; WO2007139624A3

Abstract

【課題】スピーチの逐語的な転記にできる限り近い文書を作成することを意図とする。【解決手段】第１のフレーズを識別するステップであって、前記第１のフレーズは、概念の第１の書面形式を表すステップと、前記第１と第２のフレーズとの間の相互マッピングを識別するステップであって、前記第２のフレーズは前記概念の第２の書面形式を表すステップと、前記第１のフレーズを前記第２のフレーズと置き換えるステップと、を含む、音声認識方法である。【選択図】図１

Description

本発明は音声認識方法に関するものである。

多くのコンテキストが、人のスピーチに基づき、構造的なテキスト文書を作成することが望ましい。例えば、法律専門家において、証言の書面のトランスクリプトを作成するためにトランスクリプショニストは法定手続きおよび宣誓証言において与えられる証言を転記する。同様に、医療専門家において、診断、予後診断、および医師および他の医療専門家によって書き取られた他の情報のためにトランスクリプトが作られる。これらおよび他の分野におけるトランスクリプトは、得られたトランスクリプトに置かれる依存性および不正確性（例えば患者に誤った処方薬を与える等）の結果による害のため、一般に高度に正確（元のスピーチの意味内容（意味）と、得られるトランスクリプトの意味内容との間との一致の程度について測定した場合）であることが要求される。

高度に正確な最初のトランスクリプトを作成することは、（１）スピーチが転記される話者の特徴（例えば、アクセント、音量、方言、スピード）（２）外的状況（例えば、背景の雑音）（３）トランスクリプショニスト、または転記システム（例えば、不完全な聴力または音声捕獲能力、不完全な言語の理解力）、または（４）録音／送信媒体（例えば、紙、アナログ音声テープ、アナログ電話回線、デジタル電話回線に適用された圧縮アルゴリズム、および携帯電話経路による雑音／不可逆圧縮に伴う悪い副作用）などの変化における様々な理由のために、困難である場合がある。

従って、人のトランスクリプショニストによるものか、または音声認識システムによるものかにかかわらず、自動トランスクリプトの第１の下書きは、様々な誤りを含む場合がある。一般的に、文書に含まれる誤りを訂正するために、このような下書き文書を構成および編集することが必要である。訂正が必要な転記の誤りは、例えば以下のいずれかを含む場合がある。単語または単語配列の欠落、過度な言い回し、つづりの誤り、タイプミス、または誤って認識した単語、句読点の欠落または過剰、および間違った文書構造（間違った、欠落した、または重複する節、目録、段落、または一覧表など）。

しかしながらある状況において、逐語的なトランスクリプトは望ましくない。実際に、トランスクリプショニストは、書かれたトランスクリプトに様々な変更を意図的に導入する場合がある。例えば、トランスクリプショニストは、自然発生のスピーチ効果（例えば、ポーズフィラー、言い淀み、および出だしの失敗）を除去し、重要でない見解およびコメントを切り捨て、データを基準的な形式に変換し、見出しまたは他の注釈的な題材を挿入し、または書面報告書の構造に適合するようにスピーチの順序を変更する場合がある。

さらに、書式設定要件は、フレーズが書式設定要件に従うように、正しく転記されたフレーズをも編集することを必要とする場合がある。例えば、略語および頭文字は完全に綴られることを必要とされる場合がある。これは、転記の誤りのないことにおいてさえ、適用される必要がある場合がある一種の「編集傾向」の一例である。

このような誤りの訂正および他の編集は、一般的に人の校正者によって行われ、単調で、時間が掛かり、費用が掛かり、それ自体間違いを起こしやすい。下書き文書における誤りを自動的に検出し、訂正することを意図する様々な技術が開発されてきたが、このような技術は一般的に、もとのスピーチの逐語的な転記にできる限り近い文書を作成することを意図とする。従って、このような技術は、もとのスピーチの逐語的な転記ではない文書を作成する目的のための訂正、または他の変更を行うことにあまり役立たない、または役立たない。

トランスクリプショニストが、概念の第１の書面形式（略語など）を同一の概念の第２の書面形式（拡張された形式）に置き換えることを可能にするための技術が開示される。例えば、該システムは、自動音声認識装置によってスピーチから作られた下書き文書をトランスクリプショニストへ表示してもよい。トランスクリプショニストが、第２の同一概念の第２の書面形式と置き換えるべき概念の第１の書面形式を認めた場合、該トランスクリプショニストは置換えコマンドを該システムに提供してもよい。それに応じて、該システムは、該概念の第２の書面形式を識別し、下書き文書において、第１の書面形式を第２の書面形式と置き換えてもよい。

本発明の１つの側面は、（Ａ）第１のフレーズを認識するステップであって、該第１のフレーズが概念の第１の書面形式を表すステップと、（Ｂ）第１のフレーズと第２のフレーズとの間の相互マッピングを識別するステップであって、該第２のフレーズが概念の第２の書面形式を表すステップと、（Ｃ）第１のフレーズを第２のフレーズと置き換えるステップと、を含むコンピュータ実装方法に関する。

本発明の別の側面は、（Ａ）第１のフレーズを識別するステップであって、該第１のフレーズは概念の第１の書面形式を表すステップと、（Ｂ）複数のテキストキーが、第１のフレーズに対して少なくとも所定の類似度を有する一致するテキストキーを含むかどうかを決定するステップと、（Ｃ）複数のテキストキーが、一致するテキストキーを含むことが決定された場合、（Ｃ）（ｉ）該テキストキーと関連するテキスト値を識別し、（Ｃ）（ｉｉ）第１のフレーズを該テキスト値と置き換えるステップと、を含むコンピュータ実装方法に関する。

本発明のさらなる側面は、（Ａ）第１のフレーズを識別するステップであって、該第１のフレーズは、概念の拡張された書面形式を表すステップと、（Ｂ）第１のフレーズを修正するためにユーザから指示形式を受信するステップと、（Ｃ）該指示の受信に応じて、概念の短略された書面形式を表す第２のフレーズを識別するステップと、（Ｄ）第１のフレーズを第２のフレーズに置き換えるステップと、を含み、該第２のフレーズが該指示を含まない、コンピュータ実装方法に関する。

さらに本発明の別の側面は、（Ａ）自動音声認識装置を使用する文書を作成するステップと、（Ｂ）文書の第１のフレーズを修正するためにユーザから指示を受信する手段であって、第１のフレーズは、概念の第１の書面形式を表す手段と、（Ｃ）第１のフレーズと第２のフレーズとの間の相互マッピングを識別するステップであって、該第２のフレーズが概念の第２の書面形式を表すステップと、（Ｄ）該指示の受信に応じ、文書において第１のフレーズを第２のフレーズと置き換えるステップと、を含むコンピュータ実装方法に関する。

本発明の様々な側面および実施形態の他の特徴および利点は、以下の説明および請求項から明らかになるであろう。

図１は、本発明の実施形態に従った、下書き文書において概念の第１の書面形式を概念の第２の書面形式と置き換えるためのシステムのデータフロー図である。図２は、本発明の一実施形態に従った、図１のシステムによって行われる方法のフローチャートである。図３は、本発明の一実施形態に従った、図１のシステムの一部のデータフロー図である。図４は、本発明の一実施形態に従った、図３のシステムによって行われる方法のフローチャートである。図５は、本発明の実施形態において使用するための書面形式辞書の図である。図６は、本発明の一実施形態に従った、置換えテキストを選択するための図５の書面形式辞書を使用するための方法のフローチャートである。図７は、本発明の実施形態において使用するための別の書面形式辞書の図である。図８は、本発明の一実施形態に従った、置き換えテキストを選択するための図７の書面形式辞書を使用するための方法のフローチャートである。図９Ａは、概念の１つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。図９Ｂは、概念の１つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。図９Ｃは、概念の１つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。

上記に記載されるように、元の音声の逐語的なトランスクリプトにできる限り近い文書を作成することを目的とし、下書き文書の誤りを自動的に検出し、訂正することを試みる様々な技術が開発されている。しかしながら、場合によっては、必ずしも元の音声の逐語的なトランスクリプトである必要はない文書を作成することが望ましい場合がある。例えば、メディカルトランスクリプショニストは、口述医療レポートを法律または方針によって定められた特定の書式の文書に転写することを要求される場合がある。必須文書書式では、例えば、用語が定められた形式に関わらず、特定の用語を所定の略語（例えば、頭文字）を使用して転写することが必要な場合がある。このような例では、トランスクリプショニストは、文書が作成される元の音声の逐語的なトランスクリプトではない文書を作成する必要がある場合がある。

自動音声認識装置が口述医療レポートの下書き筆記記録を作成する例を考える。図９Ａは、テキストエディタのウィンドウ９００ａに表示される場合がある、該下書き筆記記録を図示する。メディカルトランスクリプショニストは、口述に基づき、下書き筆記記録を検討し、編集して最終的な筆記記録またはその他のレポートを作成する任務を負う。ここで、医師によって口述されたフレーズの逐語的なトランスクリプションであるドラフトトランスクリプトは、「脳血管障害」（テキスト９０４に示される）というフレーズを含むと仮定する。さらに、また一方、メディカルトランスクリプショニストは、拡張形式である「脳血管障害」の代わりに、「ＣＶＡ」という略語をトランスクリプト内に使用する必要があると仮定する。このような略語は、例えば、トランスクリプショニストによって作成されている特定のレポートの書式によって要求される場合がある。

メディカルトランスクリプショニストは、手動で「脳血管障害」というフレーズを削除し、代わりに手動で「ＣＶＡ」と打ち込むことによって、下書き文書を規定のレポート書式に適合させることができる。しかしながらこの解決策は、面倒であり時間がかかる。

または代替的に、メディカルトランスクリプショニストは、全体「検索および置換」コマンドを使用して、すべての「脳血管障害」というインスタンスを「ＣＶＡ」に置換することができる。しかし、この方法で該修正を行うことには、多くの不利点がある。例えば、トランスクリプショニストがドラフトトランスクリプトを連続的に編集する、すなわち、それらをよく見ながら、転写されたテキストを連続的に検討し、修正を行うことが望ましい、または必要な場合がある。例えば、メディカルトランスクリプショニストは、元の音声の録音を聞きながらドラフトトランスクリプトを編集してもよい。全体「検索および置換」コマンドは、順序を外れて文書を修正し、その結果、編集プロセスの流れを崩す可能性がある。

さらに、全体的な「検索および置換」コマンドは、ドラフトトランスクリプトに実際に誤りを導入する可能性がある。例えば、文書内のあるセクションでは「脳血管障害」というフレーズを使用し、文書のその他のセクションでは「ＣＶＡ」を使用する必要がある場合がある。単純にすべての「脳血管障害」というインスタンスを「ＣＶＡ」で置換することは、該レポート書式と矛盾する結果を作成し、従ってメディカルトランスクリプショニストによるさらなる検討および編集が必要となる可能性がある。

手短に言えば、メディカルトランスクリプショニストが直面する１つの問題は、略された書面形式（例えば、「ＣＶＡ」）が必要または望ましい場合に、ドラフトトランスクリプトが特定の概念の拡張書面形式（例えば、「脳血管障害」）を含む場合があり、拡張書面形式が必要または望ましい場合に、トランスクリプトが概念の略された書面形式（例えば、「ＣＶＡ」）を含む場合があるということである。例えば、書面形式（例えば、拡張されたまたは短略された）の訂正選択肢は、文脈による場合があるため、常に正しい書面形式を作成するための自動システムを提供することは、困難または不可能である可能性がある。結果として、概念のある書面形式を別のものと置換するプロセスを簡素化し、かつ少なくとも部分的に自動化するシステムをメディカルトランスクリプショニストに提供することが望まれる。

図１を参照すると、本発明の一実施形態による、このような解決策を提供するためのシステム１００のデータフローダイアグラムが示される。図２を参照すると、本発明の一実施形態による、図１のシステム１００によって実行される方法２００のフローチャートが示される。一般に、自動トランスクリプションシステム１０４は、スポークンオーディオストリーム１０２（図２、ステップ２０２）のドラフトトランスクリプト１０６を作成する。トランスクリプショニスト１１０は、ドラフトトランスクリプト１０６を編集するために編集システム１０８を使用し、それによって編集されたトランスクリプト１１２（図２、ステップ２０４）を作成する。

図３を参照すると、本発明の一実施形態による、システム１００の一部分のデータフローダイアグラムがより詳細に示される。図４を参照すると、本発明の一実施形態による、図４に示されるシステム１００によって実行される方法４００のフローチャートが示される。編集システム１０８は、トランスクリプショニスト１１０（図４、ステップ４０２）にドラフトトランスクリプト１０６を表示する。再び図９Ａを参照すると、編集システム１０８のウィンドウ９００ａに表示される場合があるような、ドラフトトランスクリプト１０６の一図解例が示される。

図３から４には示されていないが、また編集システム１０８は、スポークンオーディオストリーム１０２をトランスクリプショニスト１１０に再生してもよい。編集システム１０８は、例えば、スポークンオーディオストリーム１０２の対応する音声が再生されるとともに、ドラフトトランスクリプト１０６内に徐々にテキストを表示してもよい。

概念の第１の書面形式を示す第１のフレーズ３０６がドラフトトランスクリプト１０６内で特定される（ステップ４０４）。以下の記載において、概念の例として、脳血管障害を使用し、該概念の第１の（拡張された）書面形式として、「脳血管障害」というテキストを使用し、該概念の第２の（略された）書面形式として、「ＣＶＡ」を使用する。

第１のフレーズ３０６は、いずれの様々な方法で特定されてもよい。例えば、トランスクリプショニスト１１０が第１のフレーズ３０６を特定し、第１のフレーズ３０６を示す入力３０２を編集システム１０８に提供してもよい。トランスクリプショニスト１１０は、例えばドラフトトランスクリプト１０６の表示内の第１のフレーズ３０６内にテキストのカーソルを置くことによって、またはドラフトトランスクリプト１０６の表示内の第１のフレーズ３０６をハイライトすることによって、第１のフレーズ３０６を特定してもよい。例えば、図９Ａでは、トランスクリプショニスト１１０は、第１のフレーズ３０６を選択するために、テキストのカーソル９０４を第１のフレーズ３０６を示すテキストの直後に置いている。

または代替的に、編集システム１０８が第１のフレーズ３０６を特定してもよい。例えば、以下により詳細に記載されるように、編集システム１０８は、様々な概念の代替書面形式の辞書を保持してもよい。編集システム１０８がドラフトトランスクリプト１０６内に、テキストをトランスクリプショニスト１１０に表示する場合、編集システム１０８は、辞書を参照することによって、表示されるテキストが概念文書の代替書面形式であるかどうかを判断してもよい。そうであれば、編集システム１０８は、ステップ４０４で、テキストを第１のフレーズ３０６として特定してもよい。

例えば、第１のフレーズ３０６が「脳血管障害」であり、トランスクリプショニスト１１０は、ドラフトトランスクリプト１０６を見ている間、テキストのカーソルをフレーズ内または近くに置くことによってこのフレーズを特定すると仮定する。トランスクリプショニスト１１０は、例えばドラフトトランスクリプト１０６に適用可能なレポート書式が現在の文脈の代わりにフレーズ「ＣＶＡ」を使用することを必要とすることを知っているため、このフレーズを特定してもよい。

トランスクリプショニスト１１０は、特定された第１のフレーズ３０６を修正するように編集システム１０８に指示を出す（ステップ４０６）。指示３０４は、様々な形式のいずれをとってもよい。例えば、トランスクリプショニスト１１０は、ドラフトトランスクリプト１０６内の第１のフレーズ３０６上でダブルクリックすることによって、または所定のキーまたはキーの組み合わせを押すことによって、指示３０４を出してもよい。

指示３０４の受信に応えて、編集システム１０８内の第２のフレーズ識別子３１２は、概念の第２の書面形式を示す第２のフレームを特定する（ステップ４０８）。例えば、第１のフレーズ３０６が「脳血管障害」である場合、第２のフレーズ３０８は、「ＣＶＡ」であってもよく、両方とも脳血管障害の概念を示す。編集システム１０８が第２のフレーズ３０８を特定し得る方法の実施例を、以下にさらに詳細に記載する。

編集システム１０８は、ドラフトトランスクリプト１０６内の第１のフレーズ３０６と第２のフレーズ３０８を置換し、それによって第１のフレーズ３０６が第２のフレーズ３０８に置換された、編集されたトランスクリプト１１２を作成する（ステップ４１０）、テキスト置換子３１０を含む。ステップ４０４〜４１０は、複数のフレーズのために繰り返されてもよいことに留意されたい。

図９Ｂを参照すると、編集システム１０８のウィンドウ９００ｂに表示される場合がある、編集されたトランスクリプト１１２の一図解例が示される。図９００ｂに示される表示は、第１のフレーズ３０６（「脳血管障害」）を置換した、第２のフレーズ３０８（「ＣＶＡ」）を示す、テキスト９０２ｂを含む。トランスクリプショニスト１１０が再び置換指示３０４を出す場合、編集システム１０８は、図９Ｃ（ウィンドウ９００ｃが第１のフレーズ３０６を示すテキスト９０２ｃを含む）に示されるように、第２のフレーズ３０８と第１のフレーズ３０６を置換してもよい。

上記に記載されるように、概念の第１の書面形式を示す第１のフレーズが特定される場合、編集システム１０８は、同一概念の第２の書面形式を示す第２のフレーズを特定してもよい（図４、ステップ４０８）。図５を参照すると、書面形式辞書５００を使用して第２のフレーズ３０８を特定する編集システム１０８の一実施形態が示される。図６を参照すると、本発明の一実施形態による、書面形式辞書５００を使用して第２のフレーズ３０８を特定し、従って図４のステップ４０８を導入するために編集システム１０８が使用する方法のフローチャートが示される。

図５に示される実施例では、書面形式辞書５００は、個々のマッピング５０２ａからｎを含み、ｎは、いずれの番号であってもよい。マッピング５０２ａからｎのそれぞれは、概念に対応する。実施例の目的のために、マッピング５０２ａは、脳血管障害の概念に対応すると仮定する。マッピング５０２ｂは、ミリグラムの概念（例えば、代替書面形式「ミリグラム」および「ｍｇ」によって示されてもよい）等の異なる概念に対応してもよい。より一般的には、マッピング５０２ａからｎは、第１の書面形式５０４ａを第２の書面形式５０４ｂとマップする。

一度第１のフレーズ３０６が特定されると（図４、ステップ４０４）、編集システム１０８は、以下のように第２のフレーズ３０８を特定してもよい。編集システム１０８は、第１のフレーズ３０６と一致する書面形式を求めて書面形式辞書５００内のマッピング５０２ａからｎを検索してもよい（ステップ６０２）。編集システム１０８は、第１のフレーズ３０６と厳密に一致する書面形式を検索してもよい。または代替的に、所定の最低限度の要求される類似性が定義され、編集システム１０８は、少なくとも第１のフレーズと所定の最低限度の類似性を有する書面形式を検索してもよい。

編集システム１０８は、マッピング５０２ａからｎ内の第１の書面形式（ステップ６０２ａ）、マッピング５０２ａからｎ内の第２の書面形式５０４ｂ（ステップ６０２ｂ）、または両方を検索することによって、検索を実行してもよい。編集システム１０８が第１の書面形式５０４ａのみを検索する場合、マッピング５０２ａからｎは、事実上、第１の書面形式５０４ａから第２の書面形式５０４ｂへの一方向マッピングである。同様に、編集システム１０８が第２の書面形式５０４ｂのみを検索する場合、マッピング５０２ａからｎは、事実上、第２の書面形式５０４ｂから第１の書面形式５０４ａへの一方向マッピングである。編集システム１０８が第１の書面形式５０４ａおよび第２の書面形式５０４ｂの両方を検索する場合、マッピング５０２ａからｎは、事実上、第１の書面形式５０４ａと第２の書面形式５０４ｂとの間の双方向マッピングである。

書面形式辞書５００内に（十分に）一致する書面形式が見つかる場合（ステップ６０４）、編集システム１０８は、一致する書面形式マップされる、対応する書面形式を特定する（ステップ６０６）。例えば、ステップ６０２で、第１のフレーズ３０６に一致するものとして第１の書面形式５０４ａの１つが特定される場合、ステップ６０６で編集システム１０８は、対応する第２の書面形式５０４ｂの１つを特定する。具体的な実施例として、ステップ６０２でマッピング５０２ａの第１の形式５０４ａ（「脳血管障害」）が特定される場合、ステップ６０６で編集システム１０８は、マッピング５０２ａの対応する第２の書面形式５０４ｂを特定する（「ＣＶＡ」）。次いで編集システム１０８は、第２のフレーズ３０８として、マップされた書面形式を選択する（ステップ６０８）。

図４に関して上記に記載されるように、一度編集システム１０８が第２のフレーズ３０８を特定すると、編集システム１０８は、ドラフトトランスクリプト１０６内の第１のフレーズ３０６と第２のフレーズ３０８を置換し、それによって編集されたトランスクリプト１１２を作成してもよい（ステップ４１０）。

本発明の実施形態は、書面形式の組の間のマッピングに限定されない。マッピングは、同一概念を示す、３つ以上の書面形式を互いにマップしてもよい。このようなマッピングは、例えば、１つの略語（「ＣＶＡ」等）が複数の用語の略語（「脳血管障害」および「肋骨脊柱角」等）である場合に、有用であり得る。このような場合では、ドラフトトランスクリプト１０６内に略語「ＣＶＡ」が現れる場合、トランスクリプショニスト１１０に略語「ＣＶＡ」を「脳血管障害」または「肋骨脊柱角」のいずれかと置換する機能を提供することが有用であり得る。これから、トランスクリプショニスト１１０に本機能を提供する本発明の実施形態を記載する。

上記に記載されるように、概念の第１の書面形式を示す第１のフレーズが特定される場合、編集システム１０８は、同一概念の第２の書面形式を示す第２のフレーズを特定してもよい（図４、ステップ４０８）。現在説明されているように、第２のフレーズは、第１のフレーズによって示される概念の唯一の代替書面形式である必要はない。むしろ、第２のフレーズは、第１のフレーズによって示される概念の複数の代替書面形式の１つであってもよい。

図７を参照すると、書面形式辞書７００を使用して第２のフレーズ３０８を特定する編集システム１０８の一実施形態が示される。図８を参照すると、本発明の一実施形態による、書面形式辞書７００を使用して第２のフレーズ３０８を特定し、従って図４のステップ４０８を導入するために編集システム１０８が使用する方法のフローチャートが示される。

図７に示される実施例では、書面形式辞書７００は、マッピング７０２ａからｎを含み、ｎは、いずれの番号であってもよい。マッピング７０２ａからｎのそれぞれは、概念に対応する。実施例の目的のために、マッピング５０２ａは、「ＣＶＡ」という略語を有するフレーズに対応すると仮定する。

図５のマッピング５０２ａからｎとは異なり、図７のマッピング７０２ａからｎは、３つ以上の書面形式を互いにマップする。より具体的には、マッピング７０２ａからｎのそれぞれは、列７０４ａからｍに示されるように、概念のｍ書面形式まで互いにマップする。しかしながら、マッピング７０２ａからｎのそれぞれは、同一数の書面形式を含む必要はないことに留意されたい。例えば、マッピング７０２ａは、３つの形式（例えば、第１の形式７０４ａとして「ＣＶＡ」、第２の形式７０４ｂとして「脳血管障害」、および第ｍの形式７０４ｍとして「肋骨脊柱角」）をマップし、一方、マッピング７０２ｂは、２つの形式（例えば、第１の形式７０４ａとして「ミリグラム」、第２の形式７０４ｂとして「ｍｇ」）を互いにマップしてもよい。

一度第１のフレーズ３０６が特定されると（図４、ステップ４０４）、編集システム１０８は、以下のように第２のフレーズ３０８を特定してもよい。編集システム１０８は、書面形式辞書７００内の第１のフレーズ３０６と一致する書面形式を検索してもよい（図８、ステップ８０２）。編集システム１０８は、第１のフレーズ３０６と厳密に一致する書面形式を検索してもよい。または代替的に、所定の最低限度の要求される類似性が定義され、編集システム１０８は、少なくとも第１のフレーズと所定の最低限度の類似性を有する書面形式を検索してもよい。

編集システム１０８は、マッピング７０２ａからｎのそれぞれの書面形式のいずれかの組み合わせを検索することによって、検索を実行してもよい。例えば、編集システム１０８は、マッピング７０２ａからｎ内の第１の書面形式７０４ａのみ（ステップ８０２ａ）、マッピング７０２ａからｎ内の第２の書面形式７０４ｂのみ（ステップ８０２ｂ）等を検索してもよい。または代替的に、例えば、編集システム１０８は、マッピング７０２ａからｎのすべての書面形式７０４ａからｍを検索してもよい。

第１の書面形式７０４ａのみに渡り検索することの一利点は、どの書面形式がドラフトトランスクリプト１０６内に元々現れるかにより、トランスクリプショニスト１１０に代替の異なる組み合わせを提供できるということである。例えば、書面形式辞書７００が以下のマッピング、（１）「ＣＶＡ」、「脳血管障害」、「肋骨脊柱角」、（２）「脳血管障害」、「ＣＶＡ」、および（３）「肋骨脊柱角」、「ＣＶＡ」を含む場合を考える。それぞれのマッピングの第１の書面形式が、それぞれのマッピングのキーとして使用され、「ＣＶＡ」という略語がドラフトスクリプト１０６内に現れる場合、これらの両方が「ＣＶＡ」の代替書面形式であるため、代替「脳血管障害」および「肋骨脊柱角」がトランスクリプショニスト１１０に提供される。しかしながら、ドラフトトランスクリプト１０６内に「脳血管障害」というフレーズが現れる場合、トランスクリプショニスト１１０には、代替「ＣＶＡ」のみが提供され、これは、「肋骨脊柱角」が「脳血管障害」の有効な代替ではないという事実を反映している。

より一般的には、書面形式辞書７００は、無向かつ場合によっては非連結グラフとして見なせ、書面形式を点とし、書面形式マッピング７０２ａからｎを弧とすることができる。書面形式全体を循環する際、編集システム１０８は、テキストのカーソル下にある最長一致部分により画定された本来の書面形式に（単一のグラフの弧を通って）直接に接続されたすべての書面形式間を循環する。

図８の実施例に戻り、（十分に）一致する書面形式が書面形式辞書７００内に見つかった場合（ステップ８０４）、次いで編集システム１０８は、対応する書面形式の１つを特定し、一致する書面形式がそれにマップされる（ステップ８０６）。第１の形式７０４ａが「ＣＶＡ」であり、第２の形式７０４ｂが「脳血管障害」であり、第ｍ（第３）の形式７０４ｍが「肋骨脊柱角」である、マッピング７０２ａの実施例を再度考える。第１のフレーズ３０６が「ＣＶＡ」の場合、第１のフレーズ３０６は、ステップ８０２で、マッピング７０２ａ内の第１の形式７０４ａと一致する。この場合では、マッピング７０２ａ内の対応する形式７０４ｂからｍのいずれかが第２のフレーズ３０８として選択されてもよい（ステップ８０８）。編集システム１０８は、様々な方法のいずれかで、対応する形式７０４ｂからｍの１つを第２のフレーズ３０８として選択してもよい。

例えば、編集システム１０８は、マッピング７０２ａ内の形式７０４ａからｍを順序つきリストとして取扱ってもよい。編集システム１０８は、リスト内の次の形式を第２のフレーズ３０８として選択してもよい。例えば、第１のフレーズ３０６が第１の形式７０４ａ（例えば、「ＣＶＡ」）と一致する場合、編集システム１０８は、第２の形式７０４ｂ（例えば、「脳血管障害」）を第２のフレーズ３０８として選択する。しかしながら、第１のフレーズ３０６が第２の形式７０４ｂ（例えば、「脳血管障害」）と一致する場合、編集システム１０８は、第３の形式７０４ｍ（例えば、「肋骨脊柱角」）を第２のフレーズ３０８として選択してもよい（本実施例では、ｍ＝３であることから）。第１のフレーズ３０６が第ｍの形式７０４ｍ（例えば、「肋骨脊柱角」）と一致する場合、編集システム１０８は、第１の形式７０４ａ（例えば、「ＣＶＡ」）を第２のフレーズ３０８として選択する。

実際面では、本技術は、トランスクリプショニスト１１０が代替形式を通じて循環し、それらの１つを選択し、第１のフレーズ３０６を置換できるようにする。トランスクリプショニスト１１０は、テキストのカーソルを第１のフレーズ内に置き、所定のホットキーを押すことによって第２のフレーズ３０８を選択してもよいことを想起されたい。ホットキーを繰り返し押すことによって、トランスクリプショニスト１１０は、所望の置換が見つかるまで、第１のフレーズ３０６の代替形式を通じて循環してもよい。

第１のフレーズ３０６が適用可能な代替形式を２つのみ有するマッピング内の書面形式と一致する場合、代替形式を通る循環は、適用可能な２つの代替形式間の切り替え効果であってもよい。例えば、２つの適用可能な代替形式が「ＣＶＡ」および「脳血管障害」である場合、ホットキーを繰り返し押すことによって、編集システム１０８が下書きトランスクリプト１０６内の「ＣＶＡ」および「脳血管障害」というフレーズを切り替える。

編集システム１０８は、他の方法で、対応する形式７０４ｂからｍの１つを第２のフレーズ３０８を選択してもよい。例えば、第１の形式７０４ａに複数の代替書面形式がある場合、編集システム１０８は、代替のすべてのリスト（例えば、「脳血管障害」および「肋骨脊柱角」）をトランスクリプショニスト１１０に表示し、トランスクリプショニスト１１０がリスト内の代替の１つを第２のフレーズ３０８として選択できるようにしてもよい。

さらに、編集システム１０８は、下書きトランスクリプト１０６のコンテキスト内の第１のフレーズ３０６に基づき、トランスクリプショニスト１１０が限られた数の代替書面形式のみを利用できるようにしてもよい。例えば、特定の形式は、特定のコンテキスト（例えば、下書きトランスクリプト１０６の特定のセクション）での使用にのみ適していると印を付けてもよい。第１のフレーズ３０６がマッピング７０２ａ内の第１の形式７０４ａと一致するが、マッピング７０２ａ内の第２の形式７０４ｂは、下書きトランスクリプト１０６内の第１のフレーズ３０６のコンテキストと同一のコンテキスト内で使用するのに適していないと印がつけられている場合、編集システム１０８は、トランスクリプショニスト１１０に代替として第２の形式７０４ｂを提供しなくてもよい。

図４に関して上記に記載されるように、一度編集システム１０８が第２のフレーズ３０８を特定すると、編集システム１０８は、下書きトランスクリプト１０６内の第１のフレーズ３０６と第２のフレーズ３０８を置換し、それによって編集されたトランスクリプト３０８を作成してもよい（ステップ４１０）。

本発明の利点には、以下の１つ以上が含まれる。本発明の実施形態は、下書きトランスクリプト１０６を編集し、従って編集されたトランスクリプト１１２を作成するためにトランスクリプショニスト１１０に要求される時間および努力を低減するために使用することができる。下書きトランスクリプト１０６におけるテキストへの訂正を手動で打ち込む必要が無いため、トランスクリプショニスト１１０の時間および努力が低減される。代わりに、トランスクリプショニスト１１０は、単に修正するテキストを特定し、テキストを同一概念の代替書面形式で置換する指示を出すことによって、該訂正を行うことができる。指示自体が置換テキストを含む必要は無い。トランスクリプショニスト１１０は、修正するテキストを特定するための１回のマウスクリックおよび置換指示を出すための１回のキー入力等、少ない数の合図を使用して該行為を実行することができる。

トランスクリプショニスト１１０によって実行される物理的合図の数を減少することに加え、本明細書に開示される技術は、置換テキストを記憶し、特定するというトランスクリプショニスト１１０の負担も軽減する。従来のシステムでは、トランスクリプショニスト１１０が「脳血管障害」というフレーズを見て、略語に置換する必要があると認識する場合、トランスクリプショニスト１１０は、正しい置換略語が「ＣＶ」または「ＣＡ」ではなく、「ＣＶＡ」であるということを記憶していなければいけない場合がある。本明細書に開示される技術は、トランスクリプショニスト１１０が正しい置換テキストを記憶する必要性を低減または削除できる可能性がある。例えば、書面形式辞書が拡張形式「脳血管障害」から略語「ＣＶＡ」への単一マッピングを含む場合、トランスクリプショニスト１１０は、単純に拡張形式を選択し、置換指示を出すだけでよく、それに応じて編集システム１０８が拡張形式と正しい略語を自動的に置換してもよい。特殊概念の代替書面形式が３つ以上ある場合であっても、使用可能な代替をトランスクリプショニスト１１０に表示するシステムの能力が、該代替を記憶し、置換テキストとして使用するのに正しいものを選択するというトランスクリプショニスト１１０の負担を軽減する。

本明細書に開示される技術は自動音声認識装置によって作成される下書きトランスクリプトと併せて使用される場合があるため、トランスクリプショニスト１１０に手動で口頭音声ストリーム１０２を転記することを要求するシステムと比較し、トランスクリプショニスト１１０により必要とされる時間と努力は、さらに減少される。

本明細書に開示の技術は、トランスクリプショニストによって観察される場合に個々のフレーズに変更をおこなうために使用されてもよいため、このような技術は従来の文書転記作業の流れにおいて使用するのに適している。例えば、従来のワードプロセッサグローバル検索および置換え機能とは異なり、本明細書に開示の該技術はトランスクリプトに順序どおりでない変更を行うことを必要としない。さらに、トランスクリプショニスト１１０は、順序どおりの文書に目を通す間、および対応する音声ストリーム１０２を聴く間に訂正が必要なテキストを識別してもよい。従って、このような技術は従来の転記作業の流れにシームレスに統合されてもよい。

本明細書に開示の技術は、置換えられるテキスト（例えば第１のフレーズ３０６）だけではなく、下書きトランスクリプト１０６における該テキストのコンテントに基づき、可能性のあるおよび実際の置換えテキスト（例えば第２のフレーズ３０８）を選択してもよい。例えば、利用可能な代替の書面形式の組は、第１のフレーズ３０６が現れる下書きトランスクリプト１０６の節によって異なってもよい。これは、トランスクリプショニスト１１０が考慮する必要のある代替の数を制限するため、トランスクリプショニストの任務を簡略化し、トランスクリプショニスト１１０が現在のコンテキストに適切でないと決定された置換えテキストを選択することから妨げることによって、トランスクリプショニスト１１０が間違った置換えテキストを選択する可能性を減少する。

さらに、本明細書に開示の技術は、形式指示への固守および最良の実施の順守を促進することなどによって、得られた編集後トランスクリプト１１２の全体的な品質を改善してもよい。例えば、トランスクリプショニスト１１０は、形式指示への固守または最良の実施を順守する代替の書面形式のみを提示されてもよい。トランスクリプショニスト１１０へのこのような代替形式の提示は、トランスクリプショニストがどの代替書面形式が形式指示および／または最良の実施を順守するのかを覚える重荷を減少し、これによってこのような形式指示および／または最良の実施に従う可能性を増加する。

本明細書に開示される技術は、略語をそれらの拡張形式と置換するためだけでなく、拡張形式をそれらの略語と置換するために使用することができる。本機能は、例えば、特定のコンテキストでは概念の短略された書面形式の使用が適切である一方、異なるコンテキストでは同一概念の拡張書面形式の使用が適切である場合があるため、有益である。本明細書に開示される技術は、現在のコンテキストおよび／またはその他の考慮に基づき、トランスクリプショニスト１１０が両方向に容易に置換を行えるようにする。

本発明は、特定の実施形態に関して上記に記載されてきたが、以下の実施形態は、一例としてのみ提供され、本発明の範囲を制限または定義するものではないことが理解されるべきである。また、以下を含むがそれらだけに限定されない様々なその他の実施形態も、特許請求の範囲内である。例えば、本明細書に記載される要素およびコンポーネントは、追加コンポーネントに分割されてもよく、または結合して同一機能を実行するためのより少ないコンポーネントを形成してもよい。

本明細書で提供される特定の実施形態は、概念の略語と拡張形式との間のマッピングに関するが、概念の代替書面形式は、略語−拡張形式関係である必要はない。むしろ、本明細書に開示される技術は、２つ以上のいずれの概念の書面形式の間のマッピングと併せて使用することができる。該マッピングの実施例には、同一概念および異なる言語で表現される概念の代替スペリングを含む。

本明細書で提供される特定の実施例は、音声認識装置によって作成される文書に関するが、これは本発明の必要条件ではない。むしろ、本明細書に開示される技術は、どのように作成されたかに関わらず、いずれの種類の文書に適用することができる。該技術は、例えば従来のテキストエディタを使用して打ち込まれた文書と併せて使用することができる。

概念の代替書面形式間のマッピングは、双方向性である必要はない。例えば、「脳血管障害」が「ＣＶＡ」にマップされる場合があるが、「ＣＶＡ」が「脳血管障害」にマップされる必要はない。

さらに、同一フレーズは、複数の概念の書面形式であってもよい。例えば、書面形式辞書がマッピング（「脳血管障害」、「ＣＶＡ」）および（「ＣＶＡ」、「肋骨脊柱角」）を含む場合を考える。これは、単一フレーズ（「ＣＶＡ」）が複数の概念の書面形式（「脳血管障害」および「肋骨脊柱角」）である一例である。この場合、編集システム１０８は、｛「脳血管障害」、「ＣＶＡ」、「肋骨脊柱角」｝等、両方の概念の代替書面形式のリストを特定してもよい。このリストは、複数の概念の書面形式を含むことに留意されたい。トランスクリプショニスト１１０は、代替書面形式のリストが提示され、そこから置換テキストを選択してもよい。

上記に記載のように、トランスクリプショニスト１１０は、完全に特定することなく第１のフレーズ３０６を選択してもよい。例えば、トランスクリプショニスト１１０は、第１のフレーズ３０６内のテキストカーソルによって第１のフレーズ３０６を選択してもよい。この場合、編集システム１０８は、カーソルの位置に基づいて第１のフレーズ３０６を識別することが必要である。編集システム１０８は、様々な方法でこれを行ってもよい。実施例の目的のために、トランスクリプショニスト１１０が「脳血管障害」の「害」の後にカーソルを置いたと仮定する。編集システム１０８は、該カーソル位置から完全な単語（すなわち、「障害」）まで外側へテキスト選択を拡張することによって第１のフレーズ３０６を識別することを試みてもよい。編集システム１０８は、マッピングにおいて、識別された単語に対する一致を見つけることを試みてもよい。

一致が見つからない場合、編集システム１０８は、書面形式辞書において一致が見つかるまで、またはテキスト選択がある所定の数の単語（例えば、５つ）を含むテキスト選択まで、テキスト選択（例えば、「脳血管障害」まで）を拡張してもよい。代替として、編集システム１０８は、第１のフレーズとして選択されたテキストを含む、書面形式辞書における、最長のフレーズを識別してもよい。複数の一致が見つかった場合、編集システム１０８は、例えば、第１のフレーズ３０６として任意に１つの一致を選択してもよい。

「概念」という用語は、本明細書で使用される場合、例えば、日付、時間、数、コード、薬剤、病歴、診断、処方、フレーズ、一覧表、およびセクションキューを含む。概念は様々な手段における口語および書面であってもよい。とりわけスピーキング概念のそれぞれの手段は、本明細書において「口語形式」の概念として言及される。とりわけ書面概念のそれぞれの手段は、本明細書において「書面形式」の概念として言及される。「意味」概念と「統語」概念との間でしばしば区別がつけられる。「概念」という用語は、本明細書で使用する場合、意味概念および統語概念の両方を含むが、そのいずれかに限らず、「意味概念」または「統語概念」あるいは２つの間のいかなる区別の特定の定義のいずれにも依存しない。

口語音声ストリームは、直接、または非直接受信した生の音声ストリーム（電話、またはＩＰ接続など）、またはあらゆる媒体にあらゆる形式で録音された音声ストリームなどの、あらゆる音声ストリームであってもよい。分散型音声認識（ＤＳＲ）において、クライアントは、処理された音声ストリームで音声認識を行う、サーバーへ送信される処理された音声ストリームを作成するために音声ストリームに前処理を行う。音声ストリーム３０２は、例えば、ＤＳＲクライアントによって作成された処理された音声ストリームであってもよい。

本発明は、いかなる記載された範囲に限定されず（例えば、医療および法律分野）、概してあらゆる範囲におけるあらゆる種類の文書に適用される。さらに、本発明の実施形態と併せて使用される文章は、あらゆる機械可読において表されてもよい。このような形式は、ＸＭＬなどのマークアップ言語において表される、プレーンテキスト文書および構造化文書を含む。このような文書は、あらゆるコンピュータ可読媒体に格納されてもよく、あらゆる種類の通信経路およびプロトコルを使用して送信されてもよい。

上記に記載の技術は、例えば、ハードウェア、ソフトウェア、ファームウェア、またはあらゆるこれらの組み合せにおいて実行されてもよい。上記に記載の技術は、プロセッサ、プロセッサにより可読な格納媒体（例えば、揮発性メモリ、および非揮発性メモリおよび／または格納要素を含む）、少なくとも１つのインプットデバイス、および少なくとも１つのアウトプットデバイスを含む、プログラム可能なコンピュータで実行する、１つ以上のコンピュータプログラムにおいて実行されてもよい。プログラムコードは、記載した機能を実行するための入力機器を使用して入力されるインプットおよびアウトプットを作成するために適用されてもよい。アウトプットは、１つ以上のアウトプットデバイスへ提供されてもよい。

以下の請求項の範囲内のそれぞれのコンピュータプログラムは、アセンブリ言語、マシン言語、高水準手続きプログラム言語、またはオブジェクト指向プログラム言語などの、あらゆるプログラム言語において実行されてもよい。プログラム言語は、例えば、コンパイルされた、または解釈されたプログラム言語であってもよい。

それぞれのコンピュータプログラムは、コンピュータプロセッサによる実行のための機械可読格納デバイスにおいて明白に具象化される、コンピュータプログラム製品において実行されてもよい。本発明の方法ステップは、インプットを操作し、アウトプットを作成することにより、本発明の機能を行うためのコンピュータ可読媒体において、明白に具象化されるプログラムを実行するコンピュータプロセッサにより、コンピュータプロセッサにより行われてもよい。適したプロセッサは、例として、汎用および特殊用途のマイクロプロセッサの両方を含む。概して、プロセッサは、読取り専用メモリおよび／またはランダムアクセスメモリから指示およびデータを受信する。明白に具象化するコンピュータプログラム指示のための適した格納デバイスは、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭおよびフラッシュメモリデバイスなどの半導体メモリデバイスなどの、非揮発性メモリのすべての形式、内部ハードディスクおよびリムーバブルディスクなどの磁気ディスク、光磁気ディスク、およびＣＤ−ＲＯＭを含む。前述のあらゆるものは、特別に設計されたＡＳＩＣ（特定用途向け集積回路）またはＦＰＧＡ（フィールド・プログラマブル・ゲート・アレイ）によって補完され、または組み込まれてもよい。また、コンピュータは、概して内部ディスク（図示せず）またはリムーバブルディスクなどの格納媒体からプログラムおよびデータを受信することができる。また、これらの要素は、あらゆる印刷エンジン、またはマーキングエンジン、ディスプレイ画面、または紙面、フィルム、ディスプレイ画面、または他のアウトプット媒体にカラー、またはグレースケールを作成する能力のある、他のブラウン管式デバイスと併せて使用されてもよい、本明細書に記載の方法を実行するコンピュータプログラムを実行するために適した他のコンピュータのみならず、従来のデスクトップまたはワークステーションコンピュータに見られるであろう。

Claims

コンピュータが実行する方法であって、
（Ａ）同一の概念を示す少なくとも３つの複数の文字表記のうち、第１の文字表記を表す文章内の第１のフレーズを、編集システムによって特定するステップと、
（Ｂ）前記第１のフレーズと同一の概念を示す第２の文字表記を表す第２のフレーズ、及び第３の文字表記を表す第３のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから検索して特定するステップと、
（Ｃ）前記第２のフレーズと前記第３のフレーズを表示するステップと、
（D）前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するための入力データを受信するステップと、
（E）前記文書において、前記編集システムによって前記第１のフレーズを前記第２のフレーズと前記第３のフレーズのうち選択された１つと置き換え、さらに、前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するステップと、
を含む、方法。
（F）前記（Ｃ）の前に、ユーザからの前記第１のフレーズを修正するという指示を受信するステップをさらに含み、
（Ｃ）は、前記指示の受信に応じて行われることを特徴とする請求項１に記載の方法。
前記指示は、ユーザによる1回のキーストロークによって作成される指示を備える、請求項２に記載の方法。
前記第１のフレーズは、前記文書に第１のフレーズを備え、（E）は、前記文書において、前記第１のフレーズを前記第２のフレーズと前記第３のフレーズのうち選択された一つと置き換えるステップを含む、請求項１に記載の方法。
（F）において、自動音声認識装置を使用して前記文書の少なくとも１部分を作成し、該文書の少なくとも１部分は前記第１のフレーズを含むステップをさらに含む、請求項１に記載の方法。
（Ａ）同一の概念を示す少なくとも３つの複数の文字表記のうち、第１の文字表記を表す文章内の第１のフレーズを特定する手段と、
（Ｂ）前記第１のフレーズと同一の概念を示す第２の文字表記を表す第２のフレーズ、及び第３の文字表記を表す第３のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから検索して特定する手段と、
（Ｃ）前記第２のフレーズと前記第３のフレーズを表示する手段と、
（D）前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するための入力データを受信する手段と、
（E）前記文書において、前記第１のフレーズを前記第２のフレーズと前記第３のフレーズのうち選択された１つと置き換え、さらに、前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示する手段と、
を備える、装置。
コンピュータが実行する方法であって、
（Ａ）自動音声認識装置を使用して文書を作成するステップと、
（Ｂ）ユーザからの文章内の前記第１のフレーズを修正するという指示を受信するステップであって、前記第１のフレーズは、同一の概念を示す少なくとも３つの複数の文字表記のうち第１の文字表記を表すステップと、
（Ｃ）前記第１のフレーズと同一の概念を示す第２の文字表記を表す第２のフレーズ、及び第３の文字表記を表す第３のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから特定するステップと、
（Ｄ）前記指示の受信に応じ、前記第２のフレーズと前記第３のフレーズを表示するステップと、
（E）前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するための入力データを受信するステップと、
（F）前記文書において、前記第１のフレーズを前記第２のフレーズと前記第３のフレーズのうち選択された１つと置き換え、さらに、前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するステップと、
を含む方法。
前記第1のフレーズは、前記第２のフレーズから短略された、請求項７に記載の方法。
前記第２のフレーズは、前記第１のフレーズから短略された、請求項７に記載の方法。
自動音声認識装置を使用して文書を作成する手段と、
ユーザからの前記文章内の前記第１のフレーズを修正するという指示を受信する手段とであって、
前記第１のフレーズは、同一の概念を示す少なくとも３つの複数の文字表記のうち第１の文字表記を表す手段と、
前記第１のフレーズと同一の概念を示す第２の文字表記を表す第２のフレーズ、及び第３の文字表記を表す第３のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから特定する手段と、
前記指示の受信に応じ、前記第２のフレーズと前記第３のフレーズを表示する手段と、
前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示するための入力データを受信する手段と、
前記文書において、前記第１のフレーズを前記第２のフレーズと前記第３のフレーズのうち選択された１つと置き換え、さらに、前記第２のフレーズと前記第３のフレーズのうち選択された１つを表示する手段と、
とを備える、装置。