JP2018077870A - 音声認識方法 - Google Patents

音声認識方法 Download PDF

Info

Publication number
JP2018077870A
JP2018077870A JP2017238369A JP2017238369A JP2018077870A JP 2018077870 A JP2018077870 A JP 2018077870A JP 2017238369 A JP2017238369 A JP 2017238369A JP 2017238369 A JP2017238369 A JP 2017238369A JP 2018077870 A JP2018077870 A JP 2018077870A
Authority
JP
Japan
Prior art keywords
phrase
document
transcriptionist
representing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017238369A
Other languages
English (en)
Inventor
シュベルト,ケル
Schubert Kjell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MModal IP LLC
Original Assignee
MModal IP LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38750611&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2018077870(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by MModal IP LLC filed Critical MModal IP LLC
Publication of JP2018077870A publication Critical patent/JP2018077870A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Abstract

【課題】スピーチの逐語的な転記にできる限り近い文書を作成することを意図とする。【解決手段】第1のフレーズを識別するステップであって、前記第1のフレーズは、概念の第1の書面形式を表すステップと、前記第1と第2のフレーズとの間の相互マッピングを識別するステップであって、前記第2のフレーズは前記概念の第2の書面形式を表すステップと、前記第1のフレーズを前記第2のフレーズと置き換えるステップと、を含む、音声認識方法である。【選択図】図1

Description

本発明は音声認識方法に関するものである。
多くのコンテキストが、人のスピーチに基づき、構造的なテキスト文書を作成することが望ましい。例えば、法律専門家において、証言の書面のトランスクリプトを作成するためにトランスクリプショニストは法定手続きおよび宣誓証言において与えられる証言を転記する。同様に、医療専門家において、診断、予後診断、および医師および他の医療専門家によって書き取られた他の情報のためにトランスクリプトが作られる。これらおよび他の分野におけるトランスクリプトは、得られたトランスクリプトに置かれる依存性および不正確性(例えば患者に誤った処方薬を与える等)の結果による害のため、一般に高度に正確(元のスピーチの意味内容(意味)と、得られるトランスクリプトの意味内容との間との一致の程度について測定した場合)であることが要求される。
高度に正確な最初のトランスクリプトを作成することは、(1)スピーチが転記される話者の特徴(例えば、アクセント、音量、方言、スピード)(2)外的状況(例えば、背景の雑音)(3)トランスクリプショニスト、または転記システム(例えば、不完全な聴力または音声捕獲能力、不完全な言語の理解力)、または(4)録音/送信媒体(例えば、紙、アナログ音声テープ、アナログ電話回線、デジタル電話回線に適用された圧縮アルゴリズム、および携帯電話経路による雑音/不可逆圧縮に伴う悪い副作用)などの変化における様々な理由のために、困難である場合がある。
従って、人のトランスクリプショニストによるものか、または音声認識システムによるものかにかかわらず、自動トランスクリプトの第1の下書きは、様々な誤りを含む場合がある。一般的に、文書に含まれる誤りを訂正するために、このような下書き文書を構成および編集することが必要である。訂正が必要な転記の誤りは、例えば以下のいずれかを含む場合がある。単語または単語配列の欠落、過度な言い回し、つづりの誤り、タイプミス、または誤って認識した単語、句読点の欠落または過剰、および間違った文書構造(間違った、欠落した、または重複する節、目録、段落、または一覧表など)。
しかしながらある状況において、逐語的なトランスクリプトは望ましくない。実際に、トランスクリプショニストは、書かれたトランスクリプトに様々な変更を意図的に導入する場合がある。例えば、トランスクリプショニストは、自然発生のスピーチ効果(例えば、ポーズフィラー、言い淀み、および出だしの失敗)を除去し、重要でない見解およびコメントを切り捨て、データを基準的な形式に変換し、見出しまたは他の注釈的な題材を挿入し、または書面報告書の構造に適合するようにスピーチの順序を変更する場合がある。
さらに、書式設定要件は、フレーズが書式設定要件に従うように、正しく転記されたフレーズをも編集することを必要とする場合がある。例えば、略語および頭文字は完全に綴られることを必要とされる場合がある。これは、転記の誤りのないことにおいてさえ、適用される必要がある場合がある一種の「編集傾向」の一例である。
このような誤りの訂正および他の編集は、一般的に人の校正者によって行われ、単調で、時間が掛かり、費用が掛かり、それ自体間違いを起こしやすい。下書き文書における誤りを自動的に検出し、訂正することを意図する様々な技術が開発されてきたが、このような技術は一般的に、もとのスピーチの逐語的な転記にできる限り近い文書を作成することを意図とする。従って、このような技術は、もとのスピーチの逐語的な転記ではない文書を作成する目的のための訂正、または他の変更を行うことにあまり役立たない、または役立たない。
トランスクリプショニストが、概念の第1の書面形式(略語など)を同一の概念の第2の書面形式(拡張された形式)に置き換えることを可能にするための技術が開示される。例えば、該システムは、自動音声認識装置によってスピーチから作られた下書き文書をトランスクリプショニストへ表示してもよい。トランスクリプショニストが、第2の同一概念の第2の書面形式と置き換えるべき概念の第1の書面形式を認めた場合、該トランスクリプショニストは置換えコマンドを該システムに提供してもよい。それに応じて、該システムは、該概念の第2の書面形式を識別し、下書き文書において、第1の書面形式を第2の書面形式と置き換えてもよい。
本発明の1つの側面は、(A)第1のフレーズを認識するステップであって、該第1のフレーズが概念の第1の書面形式を表すステップと、(B)第1のフレーズと第2のフレーズとの間の相互マッピングを識別するステップであって、該第2のフレーズが概念の第2の書面形式を表すステップと、(C)第1のフレーズを第2のフレーズと置き換えるステップと、を含むコンピュータ実装方法に関する。
本発明の別の側面は、(A)第1のフレーズを識別するステップであって、該第1のフレーズは概念の第1の書面形式を表すステップと、(B)複数のテキストキーが、第1のフレーズに対して少なくとも所定の類似度を有する一致するテキストキーを含むかどうかを決定するステップと、(C)複数のテキストキーが、一致するテキストキーを含むことが決定された場合、(C)(i)該テキストキーと関連するテキスト値を識別し、(C)(ii)第1のフレーズを該テキスト値と置き換えるステップと、を含むコンピュータ実装方法に関する。
本発明のさらなる側面は、(A)第1のフレーズを識別するステップであって、該第1のフレーズは、概念の拡張された書面形式を表すステップと、(B)第1のフレーズを修正するためにユーザから指示形式を受信するステップと、(C)該指示の受信に応じて、概念の短略された書面形式を表す第2のフレーズを識別するステップと、(D)第1のフレーズを第2のフレーズに置き換えるステップと、を含み、該第2のフレーズが該指示を含まない、コンピュータ実装方法に関する。
さらに本発明の別の側面は、(A)自動音声認識装置を使用する文書を作成するステップと、(B)文書の第1のフレーズを修正するためにユーザから指示を受信する手段であって、第1のフレーズは、概念の第1の書面形式を表す手段と、(C)第1のフレーズと第2のフレーズとの間の相互マッピングを識別するステップであって、該第2のフレーズが概念の第2の書面形式を表すステップと、(D)該指示の受信に応じ、文書において第1のフレーズを第2のフレーズと置き換えるステップと、を含むコンピュータ実装方法に関する。
本発明の様々な側面および実施形態の他の特徴および利点は、以下の説明および請求項から明らかになるであろう。
図1は、本発明の実施形態に従った、下書き文書において概念の第1の書面形式を概念の第2の書面形式と置き換えるためのシステムのデータフロー図である。 図2は、本発明の一実施形態に従った、図1のシステムによって行われる方法のフローチャートである。 図3は、本発明の一実施形態に従った、図1のシステムの一部のデータフロー図である。 図4は、本発明の一実施形態に従った、図3のシステムによって行われる方法のフローチャートである。 図5は、本発明の実施形態において使用するための書面形式辞書の図である。 図6は、本発明の一実施形態に従った、置換えテキストを選択するための図5の書面形式辞書を使用するための方法のフローチャートである。 図7は、本発明の実施形態において使用するための別の書面形式辞書の図である。 図8は、本発明の一実施形態に従った、置き換えテキストを選択するための図7の書面形式辞書を使用するための方法のフローチャートである。 図9Aは、概念の1つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。 図9Bは、概念の1つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。 図9Cは、概念の1つの書面形式を別の書面形式と置き換えるために、本発明の実施形態によって提供される図式的なユーザインタフェースの説明図である。
上記に記載されるように、元の音声の逐語的なトランスクリプトにできる限り近い文書を作成することを目的とし、下書き文書の誤りを自動的に検出し、訂正することを試みる様々な技術が開発されている。しかしながら、場合によっては、必ずしも元の音声の逐語的なトランスクリプトである必要はない文書を作成することが望ましい場合がある。例えば、メディカルトランスクリプショニストは、口述医療レポートを法律または方針によって定められた特定の書式の文書に転写することを要求される場合がある。必須文書書式では、例えば、用語が定められた形式に関わらず、特定の用語を所定の略語(例えば、頭文字)を使用して転写することが必要な場合がある。このような例では、トランスクリプショニストは、文書が作成される元の音声の逐語的なトランスクリプトではない文書を作成する必要がある場合がある。
自動音声認識装置が口述医療レポートの下書き筆記記録を作成する例を考える。図9Aは、テキストエディタのウィンドウ900aに表示される場合がある、該下書き筆記記録を図示する。メディカルトランスクリプショニストは、口述に基づき、下書き筆記記録を検討し、編集して最終的な筆記記録またはその他のレポートを作成する任務を負う。ここで、医師によって口述されたフレーズの逐語的なトランスクリプションであるドラフトトランスクリプトは、「脳血管障害」(テキスト904に示される)というフレーズを含むと仮定する。さらに、また一方、メディカルトランスクリプショニストは、拡張形式である「脳血管障害」の代わりに、「CVA」という略語をトランスクリプト内に使用する必要があると仮定する。このような略語は、例えば、トランスクリプショニストによって作成されている特定のレポートの書式によって要求される場合がある。
メディカルトランスクリプショニストは、手動で「脳血管障害」というフレーズを削除し、代わりに手動で「CVA」と打ち込むことによって、下書き文書を規定のレポート書式に適合させることができる。しかしながらこの解決策は、面倒であり時間がかかる。
または代替的に、メディカルトランスクリプショニストは、全体「検索および置換」コマンドを使用して、すべての「脳血管障害」というインスタンスを「CVA」に置換することができる。しかし、この方法で該修正を行うことには、多くの不利点がある。例えば、トランスクリプショニストがドラフトトランスクリプトを連続的に編集する、すなわち、それらをよく見ながら、転写されたテキストを連続的に検討し、修正を行うことが望ましい、または必要な場合がある。例えば、メディカルトランスクリプショニストは、元の音声の録音を聞きながらドラフトトランスクリプトを編集してもよい。全体「検索および置換」コマンドは、順序を外れて文書を修正し、その結果、編集プロセスの流れを崩す可能性がある。
さらに、全体的な「検索および置換」コマンドは、ドラフトトランスクリプトに実際に誤りを導入する可能性がある。例えば、文書内のあるセクションでは「脳血管障害」というフレーズを使用し、文書のその他のセクションでは「CVA」を使用する必要がある場合がある。単純にすべての「脳血管障害」というインスタンスを「CVA」で置換することは、該レポート書式と矛盾する結果を作成し、従ってメディカルトランスクリプショニストによるさらなる検討および編集が必要となる可能性がある。
手短に言えば、メディカルトランスクリプショニストが直面する1つの問題は、略された書面形式(例えば、「CVA」)が必要または望ましい場合に、ドラフトトランスクリプトが特定の概念の拡張書面形式(例えば、「脳血管障害」)を含む場合があり、拡張書面形式が必要または望ましい場合に、トランスクリプトが概念の略された書面形式(例えば、「CVA」)を含む場合があるということである。例えば、書面形式(例えば、拡張されたまたは短略された)の訂正選択肢は、文脈による場合があるため、常に正しい書面形式を作成するための自動システムを提供することは、困難または不可能である可能性がある。結果として、概念のある書面形式を別のものと置換するプロセスを簡素化し、かつ少なくとも部分的に自動化するシステムをメディカルトランスクリプショニストに提供することが望まれる。
図1を参照すると、本発明の一実施形態による、このような解決策を提供するためのシステム100のデータフローダイアグラムが示される。図2を参照すると、本発明の一実施形態による、図1のシステム100によって実行される方法200のフローチャートが示される。一般に、自動トランスクリプションシステム104は、スポークンオーディオストリーム102(図2、ステップ202)のドラフトトランスクリプト106を作成する。トランスクリプショニスト110は、ドラフトトランスクリプト106を編集するために編集システム108を使用し、それによって編集されたトランスクリプト112(図2、ステップ204)を作成する。
図3を参照すると、本発明の一実施形態による、システム100の一部分のデータフローダイアグラムがより詳細に示される。図4を参照すると、本発明の一実施形態による、図4に示されるシステム100によって実行される方法400のフローチャートが示される。編集システム108は、トランスクリプショニスト110(図4、ステップ402)にドラフトトランスクリプト106を表示する。再び図9Aを参照すると、編集システム108のウィンドウ900aに表示される場合があるような、ドラフトトランスクリプト106の一図解例が示される。
図3から4には示されていないが、また編集システム108は、スポークンオーディオストリーム102をトランスクリプショニスト110に再生してもよい。編集システム108は、例えば、スポークンオーディオストリーム102の対応する音声が再生されるとともに、ドラフトトランスクリプト106内に徐々にテキストを表示してもよい。
概念の第1の書面形式を示す第1のフレーズ306がドラフトトランスクリプト106内で特定される(ステップ404)。以下の記載において、概念の例として、脳血管障害を使用し、該概念の第1の(拡張された)書面形式として、「脳血管障害」というテキストを使用し、該概念の第2の(略された)書面形式として、「CVA」を使用する。
第1のフレーズ306は、いずれの様々な方法で特定されてもよい。例えば、トランスクリプショニスト110が第1のフレーズ306を特定し、第1のフレーズ306を示す入力302を編集システム108に提供してもよい。トランスクリプショニスト110は、例えばドラフトトランスクリプト106の表示内の第1のフレーズ306内にテキストのカーソルを置くことによって、またはドラフトトランスクリプト106の表示内の第1のフレーズ306をハイライトすることによって、第1のフレーズ306を特定してもよい。例えば、図9Aでは、トランスクリプショニスト110は、第1のフレーズ306を選択するために、テキストのカーソル904を第1のフレーズ306を示すテキストの直後に置いている。
または代替的に、編集システム108が第1のフレーズ306を特定してもよい。例えば、以下により詳細に記載されるように、編集システム108は、様々な概念の代替書面形式の辞書を保持してもよい。編集システム108がドラフトトランスクリプト106内に、テキストをトランスクリプショニスト110に表示する場合、編集システム108は、辞書を参照することによって、表示されるテキストが概念文書の代替書面形式であるかどうかを判断してもよい。そうであれば、編集システム108は、ステップ404で、テキストを第1のフレーズ306として特定してもよい。
例えば、第1のフレーズ306が「脳血管障害」であり、トランスクリプショニスト110は、ドラフトトランスクリプト106を見ている間、テキストのカーソルをフレーズ内または近くに置くことによってこのフレーズを特定すると仮定する。トランスクリプショニスト110は、例えばドラフトトランスクリプト106に適用可能なレポート書式が現在の文脈の代わりにフレーズ「CVA」を使用することを必要とすることを知っているため、このフレーズを特定してもよい。
トランスクリプショニスト110は、特定された第1のフレーズ306を修正するように編集システム108に指示を出す(ステップ406)。指示304は、様々な形式のいずれをとってもよい。例えば、トランスクリプショニスト110は、ドラフトトランスクリプト106内の第1のフレーズ306上でダブルクリックすることによって、または所定のキーまたはキーの組み合わせを押すことによって、指示304を出してもよい。
指示304の受信に応えて、編集システム108内の第2のフレーズ識別子312は、概念の第2の書面形式を示す第2のフレームを特定する(ステップ408)。例えば、第1のフレーズ306が「脳血管障害」である場合、第2のフレーズ308は、「CVA」であってもよく、両方とも脳血管障害の概念を示す。編集システム108が第2のフレーズ308を特定し得る方法の実施例を、以下にさらに詳細に記載する。
編集システム108は、ドラフトトランスクリプト106内の第1のフレーズ306と第2のフレーズ308を置換し、それによって第1のフレーズ306が第2のフレーズ308に置換された、編集されたトランスクリプト112を作成する(ステップ410)、テキスト置換子310を含む。ステップ404〜410は、複数のフレーズのために繰り返されてもよいことに留意されたい。
図9Bを参照すると、編集システム108のウィンドウ900bに表示される場合がある、編集されたトランスクリプト112の一図解例が示される。図900bに示される表示は、第1のフレーズ306(「脳血管障害」)を置換した、第2のフレーズ308(「CVA」)を示す、テキスト902bを含む。トランスクリプショニスト110が再び置換指示304を出す場合、編集システム108は、図9C(ウィンドウ900cが第1のフレーズ306を示すテキスト902cを含む)に示されるように、第2のフレーズ308と第1のフレーズ306を置換してもよい。
上記に記載されるように、概念の第1の書面形式を示す第1のフレーズが特定される場合、編集システム108は、同一概念の第2の書面形式を示す第2のフレーズを特定してもよい(図4、ステップ408)。図5を参照すると、書面形式辞書500を使用して第2のフレーズ308を特定する編集システム108の一実施形態が示される。図6を参照すると、本発明の一実施形態による、書面形式辞書500を使用して第2のフレーズ308を特定し、従って図4のステップ408を導入するために編集システム108が使用する方法のフローチャートが示される。
図5に示される実施例では、書面形式辞書500は、個々のマッピング502aからnを含み、nは、いずれの番号であってもよい。マッピング502aからnのそれぞれは、概念に対応する。実施例の目的のために、マッピング502aは、脳血管障害の概念に対応すると仮定する。マッピング502bは、ミリグラムの概念(例えば、代替書面形式「ミリグラム」および「mg」によって示されてもよい)等の異なる概念に対応してもよい。より一般的には、マッピング502aからnは、第1の書面形式504aを第2の書面形式504bとマップする。
一度第1のフレーズ306が特定されると(図4、ステップ404)、編集システム108は、以下のように第2のフレーズ308を特定してもよい。編集システム108は、第1のフレーズ306と一致する書面形式を求めて書面形式辞書500内のマッピング502aからnを検索してもよい(ステップ602)。編集システム108は、第1のフレーズ306と厳密に一致する書面形式を検索してもよい。または代替的に、所定の最低限度の要求される類似性が定義され、編集システム108は、少なくとも第1のフレーズと所定の最低限度の類似性を有する書面形式を検索してもよい。
編集システム108は、マッピング502aからn内の第1の書面形式(ステップ602a)、マッピング502aからn内の第2の書面形式504b(ステップ602b)、または両方を検索することによって、検索を実行してもよい。編集システム108が第1の書面形式504aのみを検索する場合、マッピング502aからnは、事実上、第1の書面形式504aから第2の書面形式504bへの一方向マッピングである。同様に、編集システム108が第2の書面形式504bのみを検索する場合、マッピング502aからnは、事実上、第2の書面形式504bから第1の書面形式504aへの一方向マッピングである。編集システム108が第1の書面形式504aおよび第2の書面形式504bの両方を検索する場合、マッピング502aからnは、事実上、第1の書面形式504aと第2の書面形式504bとの間の双方向マッピングである。
書面形式辞書500内に(十分に)一致する書面形式が見つかる場合(ステップ604)、編集システム108は、一致する書面形式マップされる、対応する書面形式を特定する(ステップ606)。例えば、ステップ602で、第1のフレーズ306に一致するものとして第1の書面形式504aの1つが特定される場合、ステップ606で編集システム108は、対応する第2の書面形式504bの1つを特定する。具体的な実施例として、ステップ602でマッピング502aの第1の形式504a(「脳血管障害」)が特定される場合、ステップ606で編集システム108は、マッピング502aの対応する第2の書面形式504bを特定する(「CVA」)。次いで編集システム108は、第2のフレーズ308として、マップされた書面形式を選択する(ステップ608)。
図4に関して上記に記載されるように、一度編集システム108が第2のフレーズ308を特定すると、編集システム108は、ドラフトトランスクリプト106内の第1のフレーズ306と第2のフレーズ308を置換し、それによって編集されたトランスクリプト112を作成してもよい(ステップ410)。
本発明の実施形態は、書面形式の組の間のマッピングに限定されない。マッピングは、同一概念を示す、3つ以上の書面形式を互いにマップしてもよい。このようなマッピングは、例えば、1つの略語(「CVA」等)が複数の用語の略語(「脳血管障害」および「肋骨脊柱角」等)である場合に、有用であり得る。このような場合では、ドラフトトランスクリプト106内に略語「CVA」が現れる場合、トランスクリプショニスト110に略語「CVA」を「脳血管障害」または「肋骨脊柱角」のいずれかと置換する機能を提供することが有用であり得る。これから、トランスクリプショニスト110に本機能を提供する本発明の実施形態を記載する。
上記に記載されるように、概念の第1の書面形式を示す第1のフレーズが特定される場合、編集システム108は、同一概念の第2の書面形式を示す第2のフレーズを特定してもよい(図4、ステップ408)。現在説明されているように、第2のフレーズは、第1のフレーズによって示される概念の唯一の代替書面形式である必要はない。むしろ、第2のフレーズは、第1のフレーズによって示される概念の複数の代替書面形式の1つであってもよい。
図7を参照すると、書面形式辞書700を使用して第2のフレーズ308を特定する編集システム108の一実施形態が示される。図8を参照すると、本発明の一実施形態による、書面形式辞書700を使用して第2のフレーズ308を特定し、従って図4のステップ408を導入するために編集システム108が使用する方法のフローチャートが示される。
図7に示される実施例では、書面形式辞書700は、マッピング702aからnを含み、nは、いずれの番号であってもよい。マッピング702aからnのそれぞれは、概念に対応する。実施例の目的のために、マッピング502aは、「CVA」という略語を有するフレーズに対応すると仮定する。
図5のマッピング502aからnとは異なり、図7のマッピング702aからnは、3つ以上の書面形式を互いにマップする。より具体的には、マッピング702aからnのそれぞれは、列704aからmに示されるように、概念のm書面形式まで互いにマップする。しかしながら、マッピング702aからnのそれぞれは、同一数の書面形式を含む必要はないことに留意されたい。例えば、マッピング702aは、3つの形式(例えば、第1の形式704aとして「CVA」、第2の形式704bとして「脳血管障害」、および第mの形式704mとして「肋骨脊柱角」)をマップし、一方、マッピング702bは、2つの形式(例えば、第1の形式704aとして「ミリグラム」、第2の形式704bとして「mg」)を互いにマップしてもよい。
一度第1のフレーズ306が特定されると(図4、ステップ404)、編集システム108は、以下のように第2のフレーズ308を特定してもよい。編集システム108は、書面形式辞書700内の第1のフレーズ306と一致する書面形式を検索してもよい(図8、ステップ802)。編集システム108は、第1のフレーズ306と厳密に一致する書面形式を検索してもよい。または代替的に、所定の最低限度の要求される類似性が定義され、編集システム108は、少なくとも第1のフレーズと所定の最低限度の類似性を有する書面形式を検索してもよい。
編集システム108は、マッピング702aからnのそれぞれの書面形式のいずれかの組み合わせを検索することによって、検索を実行してもよい。例えば、編集システム108は、マッピング702aからn内の第1の書面形式704aのみ(ステップ802a)、マッピング702aからn内の第2の書面形式704bのみ(ステップ802b)等を検索してもよい。または代替的に、例えば、編集システム108は、マッピング702aからnのすべての書面形式704aからmを検索してもよい。
第1の書面形式704aのみに渡り検索することの一利点は、どの書面形式がドラフトトランスクリプト106内に元々現れるかにより、トランスクリプショニスト110に代替の異なる組み合わせを提供できるということである。例えば、書面形式辞書700が以下のマッピング、(1)「CVA」、「脳血管障害」、「肋骨脊柱角」、(2)「脳血管障害」、「CVA」、および(3)「肋骨脊柱角」、「CVA」を含む場合を考える。それぞれのマッピングの第1の書面形式が、それぞれのマッピングのキーとして使用され、「CVA」という略語がドラフトスクリプト106内に現れる場合、これらの両方が「CVA」の代替書面形式であるため、代替「脳血管障害」および「肋骨脊柱角」がトランスクリプショニスト110に提供される。しかしながら、ドラフトトランスクリプト106内に「脳血管障害」というフレーズが現れる場合、トランスクリプショニスト110には、代替「CVA」のみが提供され、これは、「肋骨脊柱角」が「脳血管障害」の有効な代替ではないという事実を反映している。
より一般的には、書面形式辞書700は、無向かつ場合によっては非連結グラフとして見なせ、書面形式を点とし、書面形式マッピング702aからnを弧とすることができる。書面形式全体を循環する際、編集システム108は、テキストのカーソル下にある最長一致部分により画定された本来の書面形式に(単一のグラフの弧を通って)直接に接続されたすべての書面形式間を循環する。
図8の実施例に戻り、(十分に)一致する書面形式が書面形式辞書700内に見つかった場合(ステップ804)、次いで編集システム108は、対応する書面形式の1つを特定し、一致する書面形式がそれにマップされる(ステップ806)。第1の形式704aが「CVA」であり、第2の形式704bが「脳血管障害」であり、第m(第3)の形式704mが「肋骨脊柱角」である、マッピング702aの実施例を再度考える。第1のフレーズ306が「CVA」の場合、第1のフレーズ306は、ステップ802で、マッピング702a内の第1の形式704aと一致する。この場合では、マッピング702a内の対応する形式704bからmのいずれかが第2のフレーズ308として選択されてもよい(ステップ808)。編集システム108は、様々な方法のいずれかで、対応する形式704bからmの1つを第2のフレーズ308として選択してもよい。
例えば、編集システム108は、マッピング702a内の形式704aからmを順序つきリストとして取扱ってもよい。編集システム108は、リスト内の次の形式を第2のフレーズ308として選択してもよい。例えば、第1のフレーズ306が第1の形式704a(例えば、「CVA」)と一致する場合、編集システム108は、第2の形式704b(例えば、「脳血管障害」)を第2のフレーズ308として選択する。しかしながら、第1のフレーズ306が第2の形式704b(例えば、「脳血管障害」)と一致する場合、編集システム108は、第3の形式704m(例えば、「肋骨脊柱角」)を第2のフレーズ308として選択してもよい(本実施例では、m=3であることから)。第1のフレーズ306が第mの形式704m(例えば、「肋骨脊柱角」)と一致する場合、編集システム108は、第1の形式704a(例えば、「CVA」)を第2のフレーズ308として選択する。
実際面では、本技術は、トランスクリプショニスト110が代替形式を通じて循環し、それらの1つを選択し、第1のフレーズ306を置換できるようにする。トランスクリプショニスト110は、テキストのカーソルを第1のフレーズ内に置き、所定のホットキーを押すことによって第2のフレーズ308を選択してもよいことを想起されたい。ホットキーを繰り返し押すことによって、トランスクリプショニスト110は、所望の置換が見つかるまで、第1のフレーズ306の代替形式を通じて循環してもよい。
第1のフレーズ306が適用可能な代替形式を2つのみ有するマッピング内の書面形式と一致する場合、代替形式を通る循環は、適用可能な2つの代替形式間の切り替え効果であってもよい。例えば、2つの適用可能な代替形式が「CVA」および「脳血管障害」である場合、ホットキーを繰り返し押すことによって、編集システム108が下書きトランスクリプト106内の「CVA」および「脳血管障害」というフレーズを切り替える。
編集システム108は、他の方法で、対応する形式704bからmの1つを第2のフレーズ308を選択してもよい。例えば、第1の形式704aに複数の代替書面形式がある場合、編集システム108は、代替のすべてのリスト(例えば、「脳血管障害」および「肋骨脊柱角」)をトランスクリプショニスト110に表示し、トランスクリプショニスト110がリスト内の代替の1つを第2のフレーズ308として選択できるようにしてもよい。
さらに、編集システム108は、下書きトランスクリプト106のコンテキスト内の第1のフレーズ306に基づき、トランスクリプショニスト110が限られた数の代替書面形式のみを利用できるようにしてもよい。例えば、特定の形式は、特定のコンテキスト(例えば、下書きトランスクリプト106の特定のセクション)での使用にのみ適していると印を付けてもよい。第1のフレーズ306がマッピング702a内の第1の形式704aと一致するが、マッピング702a内の第2の形式704bは、下書きトランスクリプト106内の第1のフレーズ306のコンテキストと同一のコンテキスト内で使用するのに適していないと印がつけられている場合、編集システム108は、トランスクリプショニスト110に代替として第2の形式704bを提供しなくてもよい。
図4に関して上記に記載されるように、一度編集システム108が第2のフレーズ308を特定すると、編集システム108は、下書きトランスクリプト106内の第1のフレーズ306と第2のフレーズ308を置換し、それによって編集されたトランスクリプト308を作成してもよい(ステップ410)。
本発明の利点には、以下の1つ以上が含まれる。本発明の実施形態は、下書きトランスクリプト106を編集し、従って編集されたトランスクリプト112を作成するためにトランスクリプショニスト110に要求される時間および努力を低減するために使用することができる。下書きトランスクリプト106におけるテキストへの訂正を手動で打ち込む必要が無いため、トランスクリプショニスト110の時間および努力が低減される。代わりに、トランスクリプショニスト110は、単に修正するテキストを特定し、テキストを同一概念の代替書面形式で置換する指示を出すことによって、該訂正を行うことができる。指示自体が置換テキストを含む必要は無い。トランスクリプショニスト110は、修正するテキストを特定するための1回のマウスクリックおよび置換指示を出すための1回のキー入力等、少ない数の合図を使用して該行為を実行することができる。
トランスクリプショニスト110によって実行される物理的合図の数を減少することに加え、本明細書に開示される技術は、置換テキストを記憶し、特定するというトランスクリプショニスト110の負担も軽減する。従来のシステムでは、トランスクリプショニスト110が「脳血管障害」というフレーズを見て、略語に置換する必要があると認識する場合、トランスクリプショニスト110は、正しい置換略語が「CV」または「CA」ではなく、「CVA」であるということを記憶していなければいけない場合がある。本明細書に開示される技術は、トランスクリプショニスト110が正しい置換テキストを記憶する必要性を低減または削除できる可能性がある。例えば、書面形式辞書が拡張形式「脳血管障害」から略語「CVA」への単一マッピングを含む場合、トランスクリプショニスト110は、単純に拡張形式を選択し、置換指示を出すだけでよく、それに応じて編集システム108が拡張形式と正しい略語を自動的に置換してもよい。特殊概念の代替書面形式が3つ以上ある場合であっても、使用可能な代替をトランスクリプショニスト110に表示するシステムの能力が、該代替を記憶し、置換テキストとして使用するのに正しいものを選択するというトランスクリプショニスト110の負担を軽減する。
本明細書に開示される技術は自動音声認識装置によって作成される下書きトランスクリプトと併せて使用される場合があるため、トランスクリプショニスト110に手動で口頭音声ストリーム102を転記することを要求するシステムと比較し、トランスクリプショニスト110により必要とされる時間と努力は、さらに減少される。
本明細書に開示の技術は、トランスクリプショニストによって観察される場合に個々のフレーズに変更をおこなうために使用されてもよいため、このような技術は従来の文書転記作業の流れにおいて使用するのに適している。例えば、従来のワードプロセッサグローバル検索および置換え機能とは異なり、本明細書に開示の該技術はトランスクリプトに順序どおりでない変更を行うことを必要としない。さらに、トランスクリプショニスト110は、順序どおりの文書に目を通す間、および対応する音声ストリーム102を聴く間に訂正が必要なテキストを識別してもよい。従って、このような技術は従来の転記作業の流れにシームレスに統合されてもよい。
本明細書に開示の技術は、置換えられるテキスト(例えば第1のフレーズ306)だけではなく、下書きトランスクリプト106における該テキストのコンテントに基づき、可能性のあるおよび実際の置換えテキスト(例えば第2のフレーズ308)を選択してもよい。例えば、利用可能な代替の書面形式の組は、第1のフレーズ306が現れる下書きトランスクリプト106の節によって異なってもよい。これは、トランスクリプショニスト110が考慮する必要のある代替の数を制限するため、トランスクリプショニストの任務を簡略化し、トランスクリプショニスト110が現在のコンテキストに適切でないと決定された置換えテキストを選択することから妨げることによって、トランスクリプショニスト110が間違った置換えテキストを選択する可能性を減少する。
さらに、本明細書に開示の技術は、形式指示への固守および最良の実施の順守を促進することなどによって、得られた編集後トランスクリプト112の全体的な品質を改善してもよい。例えば、トランスクリプショニスト110は、形式指示への固守または最良の実施を順守する代替の書面形式のみを提示されてもよい。トランスクリプショニスト110へのこのような代替形式の提示は、トランスクリプショニストがどの代替書面形式が形式指示および/または最良の実施を順守するのかを覚える重荷を減少し、これによってこのような形式指示および/または最良の実施に従う可能性を増加する。
本明細書に開示される技術は、略語をそれらの拡張形式と置換するためだけでなく、拡張形式をそれらの略語と置換するために使用することができる。本機能は、例えば、特定のコンテキストでは概念の短略された書面形式の使用が適切である一方、異なるコンテキストでは同一概念の拡張書面形式の使用が適切である場合があるため、有益である。本明細書に開示される技術は、現在のコンテキストおよび/またはその他の考慮に基づき、トランスクリプショニスト110が両方向に容易に置換を行えるようにする。
本発明は、特定の実施形態に関して上記に記載されてきたが、以下の実施形態は、一例としてのみ提供され、本発明の範囲を制限または定義するものではないことが理解されるべきである。また、以下を含むがそれらだけに限定されない様々なその他の実施形態も、特許請求の範囲内である。例えば、本明細書に記載される要素およびコンポーネントは、追加コンポーネントに分割されてもよく、または結合して同一機能を実行するためのより少ないコンポーネントを形成してもよい。
本明細書で提供される特定の実施形態は、概念の略語と拡張形式との間のマッピングに関するが、概念の代替書面形式は、略語−拡張形式関係である必要はない。むしろ、本明細書に開示される技術は、2つ以上のいずれの概念の書面形式の間のマッピングと併せて使用することができる。該マッピングの実施例には、同一概念および異なる言語で表現される概念の代替スペリングを含む。
本明細書で提供される特定の実施例は、音声認識装置によって作成される文書に関するが、これは本発明の必要条件ではない。むしろ、本明細書に開示される技術は、どのように作成されたかに関わらず、いずれの種類の文書に適用することができる。該技術は、例えば従来のテキストエディタを使用して打ち込まれた文書と併せて使用することができる。
概念の代替書面形式間のマッピングは、双方向性である必要はない。例えば、「脳血管障害」が「CVA」にマップされる場合があるが、「CVA」が「脳血管障害」にマップされる必要はない。
さらに、同一フレーズは、複数の概念の書面形式であってもよい。例えば、書面形式辞書がマッピング(「脳血管障害」、「CVA」)および(「CVA」、「肋骨脊柱角」)を含む場合を考える。これは、単一フレーズ(「CVA」)が複数の概念の書面形式(「脳血管障害」および「肋骨脊柱角」)である一例である。この場合、編集システム108は、{「脳血管障害」、「CVA」、「肋骨脊柱角」}等、両方の概念の代替書面形式のリストを特定してもよい。このリストは、複数の概念の書面形式を含むことに留意されたい。トランスクリプショニスト110は、代替書面形式のリストが提示され、そこから置換テキストを選択してもよい。
上記に記載のように、トランスクリプショニスト110は、完全に特定することなく第1のフレーズ306を選択してもよい。例えば、トランスクリプショニスト110は、第1のフレーズ306内のテキストカーソルによって第1のフレーズ306を選択してもよい。この場合、編集システム108は、カーソルの位置に基づいて第1のフレーズ306を識別することが必要である。編集システム108は、様々な方法でこれを行ってもよい。実施例の目的のために、トランスクリプショニスト110が「脳血管障害」の「害」の後にカーソルを置いたと仮定する。編集システム108は、該カーソル位置から完全な単語(すなわち、「障害」)まで外側へテキスト選択を拡張することによって第1のフレーズ306を識別することを試みてもよい。編集システム108は、マッピングにおいて、識別された単語に対する一致を見つけることを試みてもよい。
一致が見つからない場合、編集システム108は、書面形式辞書において一致が見つかるまで、またはテキスト選択がある所定の数の単語(例えば、5つ)を含むテキスト選択まで、テキスト選択(例えば、「脳血管障害」まで)を拡張してもよい。代替として、編集システム108は、第1のフレーズとして選択されたテキストを含む、書面形式辞書における、最長のフレーズを識別してもよい。複数の一致が見つかった場合、編集システム108は、例えば、第1のフレーズ306として任意に1つの一致を選択してもよい。
「概念」という用語は、本明細書で使用される場合、例えば、日付、時間、数、コード、薬剤、病歴、診断、処方、フレーズ、一覧表、およびセクションキューを含む。概念は様々な手段における口語および書面であってもよい。とりわけスピーキング概念のそれぞれの手段は、本明細書において「口語形式」の概念として言及される。とりわけ書面概念のそれぞれの手段は、本明細書において「書面形式」の概念として言及される。「意味」概念と「統語」概念との間でしばしば区別がつけられる。「概念」という用語は、本明細書で使用する場合、意味概念および統語概念の両方を含むが、そのいずれかに限らず、「意味概念」または「統語概念」あるいは2つの間のいかなる区別の特定の定義のいずれにも依存しない。
口語音声ストリームは、直接、または非直接受信した生の音声ストリーム(電話、またはIP接続など)、またはあらゆる媒体にあらゆる形式で録音された音声ストリームなどの、あらゆる音声ストリームであってもよい。分散型音声認識(DSR)において、クライアントは、処理された音声ストリームで音声認識を行う、サーバーへ送信される処理された音声ストリームを作成するために音声ストリームに前処理を行う。音声ストリーム302は、例えば、DSRクライアントによって作成された処理された音声ストリームであってもよい。
本発明は、いかなる記載された範囲に限定されず(例えば、医療および法律分野)、概してあらゆる範囲におけるあらゆる種類の文書に適用される。さらに、本発明の実施形態と併せて使用される文章は、あらゆる機械可読において表されてもよい。このような形式は、XMLなどのマークアップ言語において表される、プレーンテキスト文書および構造化文書を含む。このような文書は、あらゆるコンピュータ可読媒体に格納されてもよく、あらゆる種類の通信経路およびプロトコルを使用して送信されてもよい。
上記に記載の技術は、例えば、ハードウェア、ソフトウェア、ファームウェア、またはあらゆるこれらの組み合せにおいて実行されてもよい。上記に記載の技術は、プロセッサ、プロセッサにより可読な格納媒体(例えば、揮発性メモリ、および非揮発性メモリおよび/または格納要素を含む)、少なくとも1つのインプットデバイス、および少なくとも1つのアウトプットデバイスを含む、プログラム可能なコンピュータで実行する、1つ以上のコンピュータプログラムにおいて実行されてもよい。プログラムコードは、記載した機能を実行するための入力機器を使用して入力されるインプットおよびアウトプットを作成するために適用されてもよい。アウトプットは、1つ以上のアウトプットデバイスへ提供されてもよい。
以下の請求項の範囲内のそれぞれのコンピュータプログラムは、アセンブリ言語、マシン言語、高水準手続きプログラム言語、またはオブジェクト指向プログラム言語などの、あらゆるプログラム言語において実行されてもよい。プログラム言語は、例えば、コンパイルされた、または解釈されたプログラム言語であってもよい。
それぞれのコンピュータプログラムは、コンピュータプロセッサによる実行のための機械可読格納デバイスにおいて明白に具象化される、コンピュータプログラム製品において実行されてもよい。本発明の方法ステップは、インプットを操作し、アウトプットを作成することにより、本発明の機能を行うためのコンピュータ可読媒体において、明白に具象化されるプログラムを実行するコンピュータプロセッサにより、コンピュータプロセッサにより行われてもよい。適したプロセッサは、例として、汎用および特殊用途のマイクロプロセッサの両方を含む。概して、プロセッサは、読取り専用メモリおよび/またはランダムアクセスメモリから指示およびデータを受信する。明白に具象化するコンピュータプログラム指示のための適した格納デバイスは、例えば、EPROM、EEPROMおよびフラッシュメモリデバイスなどの半導体メモリデバイスなどの、非揮発性メモリのすべての形式、内部ハードディスクおよびリムーバブルディスクなどの磁気ディスク、光磁気ディスク、およびCD−ROMを含む。前述のあらゆるものは、特別に設計されたASIC(特定用途向け集積回路)またはFPGA(フィールド・プログラマブル・ゲート・アレイ)によって補完され、または組み込まれてもよい。また、コンピュータは、概して内部ディスク(図示せず)またはリムーバブルディスクなどの格納媒体からプログラムおよびデータを受信することができる。また、これらの要素は、あらゆる印刷エンジン、またはマーキングエンジン、ディスプレイ画面、または紙面、フィルム、ディスプレイ画面、または他のアウトプット媒体にカラー、またはグレースケールを作成する能力のある、他のブラウン管式デバイスと併せて使用されてもよい、本明細書に記載の方法を実行するコンピュータプログラムを実行するために適した他のコンピュータのみならず、従来のデスクトップまたはワークステーションコンピュータに見られるであろう。

Claims (10)

  1. コンピュータが実行する方法であって、
    (A)同一の概念を示す少なくとも3つの複数の文字表記のうち、第1の文字表記を表す文章内の第1のフレーズを、編集システムによって特定するステップと、
    (B)前記第1のフレーズと同一の概念を示す第2の文字表記を表す第2のフレーズ、及び第3の文字表記を表す第3のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから検索して特定するステップと、
    (C)前記第2のフレーズと前記第3のフレーズを表示するステップと、
    (D)前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するための入力データを受信するステップと、
    (E)前記文書において、前記編集システムによって前記第1のフレーズを前記第2のフレーズと前記第3のフレーズのうち選択された1つと置き換え、さらに、前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するステップと、
    を含む、方法。
  2. (F)前記(C)の前に、ユーザからの前記第1のフレーズを修正するという指示を受信するステップをさらに含み、
    (C)は、前記指示の受信に応じて行われることを特徴とする請求項1に記載の方法。
  3. 前記指示は、ユーザによる1回のキーストロークによって作成される指示を備える、請求項2に記載の方法。
  4. 前記第1のフレーズは、前記文書に第1のフレーズを備え、(E)は、前記文書において、前記第1のフレーズを前記第2のフレーズと前記第3のフレーズのうち選択された一つと置き換えるステップを含む、請求項1に記載の方法。
  5. (F)において、自動音声認識装置を使用して前記文書の少なくとも1部分を作成し、該文書の少なくとも1部分は前記第1のフレーズを含むステップをさらに含む、請求項1に記載の方法。
  6. (A)同一の概念を示す少なくとも3つの複数の文字表記のうち、第1の文字表記を表す文章内の第1のフレーズを特定する手段と、
    (B)前記第1のフレーズと同一の概念を示す第2の文字表記を表す第2のフレーズ、及び第3の文字表記を表す第3のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから検索して特定する手段と、
    (C)前記第2のフレーズと前記第3のフレーズを表示する手段と、
    (D)前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するための入力データを受信する手段と、
    (E)前記文書において、前記第1のフレーズを前記第2のフレーズと前記第3のフレーズのうち選択された1つと置き換え、さらに、前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示する手段と、
    を備える、装置。
  7. コンピュータが実行する方法であって、
    (A)自動音声認識装置を使用して文書を作成するステップと、
    (B)ユーザからの文章内の前記第1のフレーズを修正するという指示を受信するステップであって、前記第1のフレーズは、同一の概念を示す少なくとも3つの複数の文字表記のうち第1の文字表記を表すステップと、
    (C)前記第1のフレーズと同一の概念を示す第2の文字表記を表す第2のフレーズ、及び第3の文字表記を表す第3のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから特定するステップと、
    (D)前記指示の受信に応じ、前記第2のフレーズと前記第3のフレーズを表示するステップと、
    (E)前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するための入力データを受信するステップと、
    (F)前記文書において、前記第1のフレーズを前記第2のフレーズと前記第3のフレーズのうち選択された1つと置き換え、さらに、前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するステップと、
    を含む方法。
  8. 前記第1のフレーズは、前記第2のフレーズから短略された、請求項7に記載の方法。
  9. 前記第2のフレーズは、前記第1のフレーズから短略された、請求項7に記載の方法。
  10. 自動音声認識装置を使用して文書を作成する手段と、
    ユーザからの前記文章内の前記第1のフレーズを修正するという指示を受信する手段とであって、
    前記第1のフレーズは、同一の概念を示す少なくとも3つの複数の文字表記のうち第1の文字表記を表す手段と、
    前記第1のフレーズと同一の概念を示す第2の文字表記を表す第2のフレーズ、及び第3の文字表記を表す第3のフレーズを、同一の概念を示す複数の文字表記を含むマッピングから特定する手段と、
    前記指示の受信に応じ、前記第2のフレーズと前記第3のフレーズを表示する手段と、
    前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示するための入力データを受信する手段と、
    前記文書において、前記第1のフレーズを前記第2のフレーズと前記第3のフレーズのうち選択された1つと置き換え、さらに、前記第2のフレーズと前記第3のフレーズのうち選択された1つを表示する手段と、
    とを備える、装置。
JP2017238369A 2006-05-25 2017-12-13 音声認識方法 Pending JP2018077870A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/440,950 US7831423B2 (en) 2006-05-25 2006-05-25 Replacing text representing a concept with an alternate written form of the concept
US11/440,950 2006-05-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015211554A Division JP2016048565A (ja) 2006-05-25 2015-10-28 音声認識方法

Publications (1)

Publication Number Publication Date
JP2018077870A true JP2018077870A (ja) 2018-05-17

Family

ID=38750611

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2009512008A Pending JP2009538444A (ja) 2006-05-25 2007-04-12 音声認識方法
JP2013211981A Pending JP2014029554A (ja) 2006-05-25 2013-10-09 音声認識方法
JP2015211554A Pending JP2016048565A (ja) 2006-05-25 2015-10-28 音声認識方法
JP2017238369A Pending JP2018077870A (ja) 2006-05-25 2017-12-13 音声認識方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2009512008A Pending JP2009538444A (ja) 2006-05-25 2007-04-12 音声認識方法
JP2013211981A Pending JP2014029554A (ja) 2006-05-25 2013-10-09 音声認識方法
JP2015211554A Pending JP2016048565A (ja) 2006-05-25 2015-10-28 音声認識方法

Country Status (5)

Country Link
US (3) US7831423B2 (ja)
EP (1) EP2024876A4 (ja)
JP (4) JP2009538444A (ja)
CA (1) CA2653973C (ja)
WO (1) WO2007139624A2 (ja)

Families Citing this family (225)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
GB2432704B (en) * 2004-07-30 2009-12-09 Dictaphone Corp A system and method for report level confidence
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8032372B1 (en) * 2005-09-13 2011-10-04 Escription, Inc. Dictation selection
US8286071B1 (en) 2006-06-29 2012-10-09 Escription, Inc. Insertion of standard text in transcriptions
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20090216532A1 (en) * 2007-09-26 2009-08-27 Nuance Communications, Inc. Automatic Extraction and Dissemination of Audio Impression
US8612853B2 (en) * 2007-11-15 2013-12-17 Harold W. Milton, Jr. System for automatically inserting reference numerals in a patent application
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10169599B2 (en) * 2009-08-26 2019-01-01 International Business Machines Corporation Data access control with flexible data disclosure
US9224007B2 (en) 2009-09-15 2015-12-29 International Business Machines Corporation Search engine with privacy protection
US9600134B2 (en) * 2009-12-29 2017-03-21 International Business Machines Corporation Selecting portions of computer-accessible documents for post-selection processing
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10431336B1 (en) 2010-10-01 2019-10-01 Cerner Innovation, Inc. Computerized systems and methods for facilitating clinical decision making
US10734115B1 (en) 2012-08-09 2020-08-04 Cerner Innovation, Inc Clinical decision support for sepsis
US11398310B1 (en) 2010-10-01 2022-07-26 Cerner Innovation, Inc. Clinical decision support for sepsis
US11348667B2 (en) 2010-10-08 2022-05-31 Cerner Innovation, Inc. Multi-site clinical decision support
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10628553B1 (en) 2010-12-30 2020-04-21 Cerner Innovation, Inc. Health information transformation system
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
EP2721606A4 (en) * 2011-06-19 2015-04-01 Mmodal Ip Llc DOCUMENT EXTENSION IN A DICTIONARY BASED DOCUMENT GENERATION WORKFLOW
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8856156B1 (en) 2011-10-07 2014-10-07 Cerner Innovation, Inc. Ontology mapper
US9195853B2 (en) 2012-01-15 2015-11-24 International Business Machines Corporation Automated document redaction
US9311286B2 (en) * 2012-01-25 2016-04-12 International Business Machines Corporation Intelligent automatic expansion/contraction of abbreviations in text-based electronic communications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US10249385B1 (en) 2012-05-01 2019-04-02 Cerner Innovation, Inc. System and method for record linkage
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10156956B2 (en) 2012-08-13 2018-12-18 Mmodal Ip Llc Maintaining a discrete data representation that corresponds to information contained in free-form text
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9021380B2 (en) 2012-10-05 2015-04-28 Google Inc. Incremental multi-touch gesture recognition
US8782549B2 (en) 2012-10-05 2014-07-15 Google Inc. Incremental feature-based gesture-keyboard decoding
US8701032B1 (en) 2012-10-16 2014-04-15 Google Inc. Incremental multi-word recognition
US8850350B2 (en) 2012-10-16 2014-09-30 Google Inc. Partial gesture text entry
US8843845B2 (en) 2012-10-16 2014-09-23 Google Inc. Multi-gesture text input prediction
US8819574B2 (en) 2012-10-22 2014-08-26 Google Inc. Space prediction for text input
US9892278B2 (en) 2012-11-14 2018-02-13 International Business Machines Corporation Focused personal identifying information redaction
US8832589B2 (en) 2013-01-15 2014-09-09 Google Inc. Touch keyboard using language and spatial models
EP2954514B1 (en) 2013-02-07 2021-03-31 Apple Inc. Voice trigger for a digital assistant
US11894117B1 (en) 2013-02-07 2024-02-06 Cerner Innovation, Inc. Discovering context-specific complexity and utilization sequences
US10946311B1 (en) 2013-02-07 2021-03-16 Cerner Innovation, Inc. Discovering context-specific serial health trajectories
US10769241B1 (en) 2013-02-07 2020-09-08 Cerner Innovation, Inc. Discovering context-specific complexity and utilization sequences
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9081500B2 (en) 2013-05-03 2015-07-14 Google Inc. Alternative hypothesis error correction for gesture typing
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10483003B1 (en) 2013-08-12 2019-11-19 Cerner Innovation, Inc. Dynamically determining risk of clinical condition
US10446273B1 (en) 2013-08-12 2019-10-15 Cerner Innovation, Inc. Decision support with clinical nomenclatures
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
WO2015156011A1 (ja) * 2014-04-08 2015-10-15 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9710526B2 (en) 2014-06-25 2017-07-18 Microsoft Technology Licensing, Llc Data set preview technology
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10950329B2 (en) 2015-03-13 2021-03-16 Mmodal Ip Llc Hybrid human and computer-assisted coding workflow
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US11152084B2 (en) * 2016-01-13 2021-10-19 Nuance Communications, Inc. Medical report coding with acronym/abbreviation disambiguation
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10579743B2 (en) 2016-05-20 2020-03-03 International Business Machines Corporation Communication assistant to bridge incompatible audience
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
EP3571608A4 (en) 2017-01-17 2020-10-28 MModal IP LLC PROCEDURES AND SYSTEMS FOR MANIFESTATION AND TRANSMISSION OF FOLLOW-UP NOTIFICATIONS
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US10372824B2 (en) 2017-05-15 2019-08-06 International Business Machines Corporation Disambiguating concepts in natural language
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US11282596B2 (en) 2017-11-22 2022-03-22 3M Innovative Properties Company Automated code feedback system
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US20200110794A1 (en) * 2018-10-03 2020-04-09 International Business Machines Corporation Emoji modification
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN110047488B (zh) * 2019-03-01 2022-04-12 北京彩云环太平洋科技有限公司 语音翻译方法、装置、设备及控制设备
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11730420B2 (en) 2019-12-17 2023-08-22 Cerner Innovation, Inc. Maternal-fetal sepsis indicator
CN111415412B (zh) * 2020-03-18 2023-08-04 北京山维科技股份有限公司 一种立体测图采编系统和方法
US11776578B2 (en) 2020-06-02 2023-10-03 Trapelo Corp. Automatic modification of values of content elements in a video
US11681879B2 (en) 2021-01-25 2023-06-20 International Business Machines Corporation Masking personal traits in anonymous feedback

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003513389A (ja) * 1999-11-05 2003-04-08 マイクロソフト コーポレイション 言語入力ユーザインタフェース
WO2004044887A1 (ja) * 2002-11-11 2004-05-27 Matsushita Electric Industrial Co., Ltd. 音声認識用辞書作成装置および音声認識装置

Family Cites Families (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4459049A (en) 1982-03-24 1984-07-10 International Business Machines Corporation Abbreviated typing with special form display
US4650349A (en) 1984-02-17 1987-03-17 Cpt Corporation Speed typing apparatus and method
JPS61211770A (ja) * 1985-03-18 1986-09-19 Nec Corp 略語選択入力方式
US4760528A (en) 1985-09-18 1988-07-26 Levin Leonid D Method for entering text using abbreviated word forms
JPS63657A (ja) * 1986-06-20 1988-01-05 Brother Ind Ltd 日本語ワ−ドプロセツサ
US5179627A (en) * 1987-02-10 1993-01-12 Dictaphone Corporation Digital dictation system
JPH0524999Y2 (ja) * 1987-05-12 1993-06-24
JPS6462766A (en) * 1987-09-03 1989-03-09 Matsushita Electric Ind Co Ltd Machine translation device
JPH01318156A (ja) * 1988-06-20 1989-12-22 Fuji Xerox Co Ltd 文書処理装置
US5008871A (en) * 1988-12-22 1991-04-16 Howells Joseph A Dictate/transcribe control for digital dictation system
JPH0792796B2 (ja) 1989-03-30 1995-10-09 ブラザー工業株式会社 文書作成装置
JP2840664B2 (ja) * 1989-04-27 1998-12-24 株式会社リコー 意味分類方法
JPH0524999A (ja) 1991-07-16 1993-02-02 Matsushita Electric Ind Co Ltd 炭化珪素薄膜の製造方法
JP3350556B2 (ja) * 1992-04-20 2002-11-25 株式会社リコー 検索システム
US5742834A (en) * 1992-06-24 1998-04-21 Canon Kabushiki Kaisha Document processing apparatus using a synonym dictionary
US5384892A (en) * 1992-12-31 1995-01-24 Apple Computer, Inc. Dynamic language model for speech recognition
CA2137981C (en) 1993-12-22 2001-04-17 Steven A. Shaiman Method and system for presenting alternatives for selection using adaptive learning
US5594638A (en) * 1993-12-29 1997-01-14 First Opinion Corporation Computerized medical diagnostic system including re-enter function and sensitivity factors
NZ248751A (en) 1994-03-23 1997-11-24 Ryan John Kevin Text analysis and coding
US5761689A (en) 1994-09-01 1998-06-02 Microsoft Corporation Autocorrecting text typed into a word processing document
US5634084A (en) 1995-01-20 1997-05-27 Centigram Communications Corporation Abbreviation and acronym/initialism expansion procedures for a text to speech reader
US6061675A (en) * 1995-05-31 2000-05-09 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog
US5873660A (en) 1995-06-19 1999-02-23 Microsoft Corporation Morphological search and replace
US6173261B1 (en) * 1998-09-30 2001-01-09 At&T Corp Grammar fragment acquisition using syntactic and semantic clustering
US6041292A (en) * 1996-01-16 2000-03-21 Jochim; Carol Real time stenographic system utilizing vowel omission principle
US6684188B1 (en) * 1996-02-02 2004-01-27 Geoffrey C Mitchell Method for production of medical records and other technical documents
US5870706A (en) * 1996-04-10 1999-02-09 Lucent Technologies, Inc. Method and apparatus for an improved language recognition system
US5875448A (en) * 1996-10-08 1999-02-23 Boys; Donald R. Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator
US6182029B1 (en) * 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
US6055494A (en) * 1996-10-28 2000-04-25 The Trustees Of Columbia University In The City Of New York System and method for medical language extraction and encoding
US5893062A (en) * 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
US5864805A (en) 1996-12-20 1999-01-26 International Business Machines Corporation Method and apparatus for error correction in a continuous dictation system
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
UA64743C2 (uk) * 1997-03-13 2004-03-15 Фьост Опініон Корпорейшн Автоматизований спосіб керування лікуванням (варіанти) та система керування лікуванням захворювань (варіанти) шляхом здійснення способів оптимізації лікування і медичної діагностики за допомогою вибору варіантів питань, медичної діагностики, терапевтичних змін, режиму попереднього перегляду, визначення відсутності відповіді, оцінювання здоров'я, визначення значущого симптому
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6064957A (en) * 1997-08-15 2000-05-16 General Electric Company Improving speech recognition through text-based linguistic post-processing
AU9513198A (en) * 1997-09-30 1999-04-23 Ihc Health Services, Inc. Aprobabilistic system for natural language processing
US6182039B1 (en) * 1998-03-24 2001-01-30 Matsushita Electric Industrial Co., Ltd. Method and apparatus using probabilistic language model based on confusable sets for speech recognition
US7043426B2 (en) * 1998-04-01 2006-05-09 Cyberpulse, L.L.C. Structured speech recognition
US7020601B1 (en) * 1998-05-04 2006-03-28 Trados Incorporated Method and apparatus for processing source information based on source placeable elements
US6424983B1 (en) 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6064961A (en) * 1998-09-02 2000-05-16 International Business Machines Corporation Display for proofreading text
US6338038B1 (en) * 1998-09-02 2002-01-08 International Business Machines Corp. Variable speed audio playback in speech recognition proofreader
US6064965A (en) * 1998-09-02 2000-05-16 International Business Machines Corporation Combined audio playback in speech recognition proofreader
US6374225B1 (en) * 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
JP2002528752A (ja) * 1998-10-21 2002-09-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 統計的言語モデルのパラメータの決定方法
US6122614A (en) * 1998-11-20 2000-09-19 Custom Speech Usa, Inc. System and method for automating transcription services
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
JP3795692B2 (ja) * 1999-02-12 2006-07-12 マイクロソフト コーポレーション 文字処理装置および方法
US6526380B1 (en) * 1999-03-26 2003-02-25 Koninklijke Philips Electronics N.V. Speech recognition system having parallel large vocabulary recognition engines
US7164753B2 (en) * 1999-04-08 2007-01-16 Ultratec, Incl Real-time transcription correction system
US6347296B1 (en) 1999-06-23 2002-02-12 International Business Machines Corp. Correcting speech recognition without first presenting alternatives
US6345249B1 (en) * 1999-07-07 2002-02-05 International Business Machines Corp. Automatic analysis of a speech dictated document
US6865258B1 (en) * 1999-08-13 2005-03-08 Intervoice Limited Partnership Method and system for enhanced transcription
US6732113B1 (en) * 1999-09-20 2004-05-04 Verispan, L.L.C. System and method for generating de-identified health care data
US6418410B1 (en) 1999-09-27 2002-07-09 International Business Machines Corporation Smart correction of dictated speech
US6879957B1 (en) * 1999-10-04 2005-04-12 William H. Pechter Method for producing a speech rendition of text from diphone sounds
US6789231B1 (en) 1999-10-05 2004-09-07 Microsoft Corporation Method and system for providing alternatives for text derived from stochastic input sources
KR100307623B1 (ko) * 1999-10-21 2001-11-02 윤종용 엠.에이.피 화자 적응 조건에서 파라미터의 분별적 추정 방법 및 장치 및 이를 각각 포함한 음성 인식 방법 및 장치
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US20030093272A1 (en) * 1999-12-02 2003-05-15 Frederic Soufflet Speech operated automatic inquiry system
US7490048B2 (en) * 1999-12-18 2009-02-10 Raymond Anthony Joao Apparatus and method for processing and/or for providing healthcare information and/or healthcare-related information
US6734886B1 (en) * 1999-12-21 2004-05-11 Personalpath Systems, Inc. Method of customizing a browsing experience on a world-wide-web site
US6738784B1 (en) * 2000-04-06 2004-05-18 Dictaphone Corporation Document and information processing system
US6912498B2 (en) 2000-05-02 2005-06-28 Scansoft, Inc. Error correction in speech recognition by correcting text around selected area
US20020049600A1 (en) * 2000-05-12 2002-04-25 Lernout & Hauspie Speech Products N.V. Speech processor apparatus and system
GB0011798D0 (en) * 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
US6636848B1 (en) * 2000-05-31 2003-10-21 International Business Machines Corporation Information search using knowledge agents
US7031908B1 (en) * 2000-06-01 2006-04-18 Microsoft Corporation Creating a language model for a language processing system
US6735562B1 (en) * 2000-06-05 2004-05-11 Motorola, Inc. Method for estimating a confidence measure for a speech recognition system
EP1317750B1 (en) 2000-09-08 2007-06-06 Koninklijke Philips Electronics N.V. Speech recognition method with a replace command
GB2366893B (en) * 2000-09-08 2004-06-16 Roke Manor Research Improvements in or relating to word processor systems or the like
CN1529861B (zh) * 2000-11-07 2010-12-29 阿斯科瑞帕兹公司 由语言输入创建数据库和结构化信息的系统及方法
CN1443329A (zh) * 2000-11-22 2003-09-17 里科尔公司 记录医疗体检结果的系统和方法
AU2002237495A1 (en) * 2001-03-13 2002-09-24 Intelligate Ltd. Dynamic natural language understanding
US7188064B2 (en) * 2001-04-13 2007-03-06 University Of Texas System Board Of Regents System and method for automatic semantic coding of free response data using Hidden Markov Model methodology
US7519529B1 (en) * 2001-06-29 2009-04-14 Microsoft Corporation System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service
DE10138408A1 (de) * 2001-08-04 2003-02-20 Philips Corp Intellectual Pty Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
US7529685B2 (en) * 2001-08-28 2009-05-05 Md Datacor, Inc. System, method, and apparatus for storing, retrieving, and integrating clinical, diagnostic, genomic, and therapeutic data
US20030065503A1 (en) * 2001-09-28 2003-04-03 Philips Electronics North America Corp. Multi-lingual transcription system
US20030069760A1 (en) * 2001-10-04 2003-04-10 Arthur Gelber System and method for processing and pre-adjudicating patient benefit claims
WO2003038808A1 (en) * 2001-10-31 2003-05-08 Koninklijke Philips Electronics N.V. Method of and system for transcribing dictations in text files and for revising the texts
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
JP2003228559A (ja) * 2001-11-30 2003-08-15 Hitachi Ltd 申請書の処理システム及び処理システムに用いられるプログラム
US7035797B2 (en) * 2001-12-14 2006-04-25 Nokia Corporation Data-driven filtering of cepstral time trajectories for robust speech recognition
US7231343B1 (en) * 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
US7257531B2 (en) * 2002-04-19 2007-08-14 Medcom Information Systems, Inc. Speech to text system using controlled vocabulary indices
US7197460B1 (en) * 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
US7869998B1 (en) * 2002-04-23 2011-01-11 At&T Intellectual Property Ii, L.P. Voice-enabled dialog system
US7292975B2 (en) * 2002-05-01 2007-11-06 Nuance Communications, Inc. Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription
US7380203B2 (en) 2002-05-14 2008-05-27 Microsoft Corporation Natural input recognition tool
US20060041836A1 (en) * 2002-09-12 2006-02-23 Gordon T J Information documenting system with improved speed, completeness, retriveability and granularity
US7016844B2 (en) * 2002-09-26 2006-03-21 Core Mobility, Inc. System and method for online transcription services
US7503001B1 (en) * 2002-10-28 2009-03-10 At&T Mobility Ii Llc Text abbreviation methods and apparatus and systems using same
AU2003290955A1 (en) * 2002-11-22 2004-06-18 Transclick, Inc. Language translation system and method
US7774694B2 (en) * 2002-12-06 2010-08-10 3M Innovation Properties Company Method and system for server-based sequential insertion processing of speech recognition results
JP4660071B2 (ja) * 2003-03-13 2011-03-30 シャープ株式会社 文作成支援装置、および文作成支援プログラム
EP1623339A2 (en) * 2003-05-01 2006-02-08 Axonwave Software Inc. A method and system for concept generation and management
JP3855058B2 (ja) * 2003-06-30 2006-12-06 独立行政法人情報通信研究機構 言い換えを利用した文章作成支援処理装置および方法
JP2005043461A (ja) * 2003-07-23 2005-02-17 Canon Inc 音声認識方法及び音声認識装置
US7149693B2 (en) * 2003-07-31 2006-12-12 Sony Corporation Automated digital voice recorder to personal information manager synchronization
US8311835B2 (en) * 2003-08-29 2012-11-13 Microsoft Corporation Assisted multi-modal dialogue
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US7860717B2 (en) * 2003-09-25 2010-12-28 Dictaphone Corporation System and method for customizing speech recognition input and output
JP2005122128A (ja) * 2003-09-25 2005-05-12 Fuji Photo Film Co Ltd 音声認識システム及びプログラム
US7996223B2 (en) * 2003-10-01 2011-08-09 Dictaphone Corporation System and method for post processing speech recognition output
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
EP1678707B1 (en) * 2003-10-21 2008-07-30 Philips Intellectual Property & Standards GmbH Intelligent speech recognition with user interfaces
KR100589148B1 (ko) * 2003-10-29 2006-06-12 현대자동차주식회사 엔진의 가변흡기모듈
US20050102140A1 (en) * 2003-11-12 2005-05-12 Joel Davne Method and system for real-time transcription and correction using an electronic communication environment
WO2005052785A2 (en) * 2003-11-28 2005-06-09 Koninklijke Philips Electronics N.V. Method and device for transcribing an audio signal
US7523316B2 (en) * 2003-12-08 2009-04-21 International Business Machines Corporation Method and system for managing the display of sensitive content in non-trusted environments
KR100618824B1 (ko) * 2004-05-08 2006-08-31 삼성전자주식회사 상 변화 메모리 장치의 전류 펄스 폭을 제어하는 구동회로 및 프로그래밍 방법
GB2415518A (en) * 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
US7421647B2 (en) * 2004-07-09 2008-09-02 Bruce Reiner Gesture-based reporting method and system
US20060020886A1 (en) * 2004-07-15 2006-01-26 Agrawal Subodh K System and method for the structured capture of information and the generation of semantically rich reports
US20060015371A1 (en) * 2004-07-16 2006-01-19 Noah Knauf Health tracking system
US20060020466A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based medical patient evaluation method for data capture and knowledge representation
GB2432704B (en) * 2004-07-30 2009-12-09 Dictaphone Corp A system and method for report level confidence
US7584103B2 (en) * 2004-08-20 2009-09-01 Multimodal Technologies, Inc. Automated extraction of semantic content and generation of a structured document from speech
US8412521B2 (en) * 2004-08-20 2013-04-02 Multimodal Technologies, Llc Discriminative training of document transcription system
US7650628B2 (en) * 2004-10-21 2010-01-19 Escription, Inc. Transcription data security
US7747500B2 (en) * 2004-11-01 2010-06-29 Hewlett-Packard Development Company, L.P. Managing and evaluating procurement risk
US7502741B2 (en) * 2005-02-23 2009-03-10 Multimodal Technologies, Inc. Audio signal de-identification
EP1934828A4 (en) * 2005-08-19 2008-10-08 Gracenote Inc METHOD AND SYSTEM FOR MANAGING THE OPERATION OF A REPRODUCTION DEVICE
WO2007024769A2 (en) * 2005-08-22 2007-03-01 The Personal Bee, Inc. Semantic discovery engine
CA2662564C (en) * 2006-11-22 2011-06-28 Multimodal Technologies, Inc. Recognition of speech in editable audio streams
US7917355B2 (en) * 2007-08-23 2011-03-29 Google Inc. Word detection
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
CA2680304C (en) * 2008-09-25 2017-08-22 Multimodal Technologies, Inc. Decoding-time prediction of non-verbalized tokens

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003513389A (ja) * 1999-11-05 2003-04-08 マイクロソフト コーポレイション 言語入力ユーザインタフェース
WO2004044887A1 (ja) * 2002-11-11 2004-05-27 Matsushita Electric Industrial Co., Ltd. 音声認識用辞書作成装置および音声認識装置

Also Published As

Publication number Publication date
EP2024876A2 (en) 2009-02-18
US8515755B2 (en) 2013-08-20
US8412524B2 (en) 2013-04-02
JP2009538444A (ja) 2009-11-05
JP2016048565A (ja) 2016-04-07
JP2014029554A (ja) 2014-02-13
WO2007139624A2 (en) 2007-12-06
EP2024876A4 (en) 2013-05-29
US20120173972A1 (en) 2012-07-05
US20110131486A1 (en) 2011-06-02
CA2653973C (en) 2012-09-18
US20070276649A1 (en) 2007-11-29
US7831423B2 (en) 2010-11-09
CA2653973A1 (en) 2007-12-06
WO2007139624A3 (en) 2008-07-03

Similar Documents

Publication Publication Date Title
JP2018077870A (ja) 音声認識方法
US8041565B1 (en) Precision speech to text conversion
US7668718B2 (en) Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
JP5385134B2 (ja) コンピュータ実装方法
US7693717B2 (en) Session file modification with annotation using speech recognition or text to speech
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
US8666742B2 (en) Automatic detection and application of editing patterns in draft documents
TW200842616A (en) Techniques for customization of phonetic schemes
US11922944B2 (en) Phrase alternatives representation for automatic speech recognition and methods of use
Foley et al. 36 Managing Transcription Data for Automatic Speech Recognition with Elpis
US20070067168A1 (en) Method and device for transcribing an audio signal
US20230306963A1 (en) Intuitive dictation
US10198160B2 (en) Approach for processing audio data at network sites
JP2022068817A (ja) 音声記録のための音声認識率を向上させる方法、システム、およびコンピュータ読み取り可能な記録媒体
CN116783649A (zh) 语音识别中的诊断服务

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190411

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190507