JP5917804B2 - アンカーを用いた文書編集 - Google Patents

アンカーを用いた文書編集 Download PDF

Info

Publication number
JP5917804B2
JP5917804B2 JP2010521906A JP2010521906A JP5917804B2 JP 5917804 B2 JP5917804 B2 JP 5917804B2 JP 2010521906 A JP2010521906 A JP 2010521906A JP 2010521906 A JP2010521906 A JP 2010521906A JP 5917804 B2 JP5917804 B2 JP 5917804B2
Authority
JP
Japan
Prior art keywords
text
anchor
anchor text
instance
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010521906A
Other languages
English (en)
Other versions
JP2010537315A (ja
JP2010537315A5 (ja
Inventor
シューベルト、クエル
Original Assignee
マルチモーダル・テクノロジーズ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マルチモーダル・テクノロジーズ・エルエルシー filed Critical マルチモーダル・テクノロジーズ・エルエルシー
Publication of JP2010537315A publication Critical patent/JP2010537315A/ja
Publication of JP2010537315A5 publication Critical patent/JP2010537315A5/ja
Application granted granted Critical
Publication of JP5917804B2 publication Critical patent/JP5917804B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、文書の編集、殊に、自動トランスクリプションシステムを用いて作成された原稿中の間違いを修正することに関する。
口述に基づいて構造化テキスト文書を作成することが、多くの場面で要望される。例えば法律業務においては、口述筆記者が、法廷審理や陳述において述べられた証言を書き取り、証言録取書を作成する。同様に、医療業務においても、診断、予後診断、処方等の医師や医療専門家による口頭での情報が文書として記録される。このような分野での口述筆記には、この記録に対して要求される信頼度や、不正確だった場合に生じうる害(例えば、間違った薬を患者に処方する等の害)故に、(元の口述された言葉の意味内容と、書き取られた言葉の意味内容との一致性という点で、)高い正確さが要求されるものである。しかし様々な理由で、最初から高度に正確な口述筆記を作成するのは難しいことがある。
それゆえ、口述筆記の最初の原稿には、それが人による筆記で作成されたものか自動音声認識システムによって作成されたものかによらず、様々なエラーが含まれうる。そのため、一般的に、原稿を校閲して、含まれているエラーを訂正するよう編集する必要がある。そのようなエラー訂正は、一般的に校閲者によってなされるので、手間と時間と経費がかかるうえに、それ自体がエラーを起こしやすい。したがって、原稿の誤りを訂正する技術の向上が必要である。
ユーザーは、原稿中のテキストを、左右の「アンカー」テキストと置換テキストとを含む入力を与えることで編集する。これに応答して、文書編集システムは、原稿中で左のアンカーテキストの後ろに右のアンカーテキストが続いている箇所(インスタンス)を見つけ出し、見つけ出したインスタンスの間のテキストを、ユーザーによって指定された置換テキストに置き換える。例えば、該ユーザーが、左アンカーテキストと、後続する置換テキストと、それに後続する右アンカーテキストとからなる文字列を打ち込むと、これに応答して、上記のような置換を該編集システムが行う。この結果、該ユーザーは、修正すべきテキストの位置まで誘導するためのカーソルキーや他のナビゲーションコマンドを用いずに、原稿中の修正すべきテキストの位置と修正内容両方を指定することができる。これにより、このようなマニュアルナビゲーションに伴う遅延を回避し、修正作業効率を向上させることができる。
例えば、本発明のひとつの実施例により構成されるコンピュータで実施される方法は、(A)第1アンカーテキストと、第2アンカーテキストと、置換テキストとを識別するステップと、(B)文書中に、前記第1アンカーテキストのインスタンスと、この第1アンカーテキストに後続して前記第2アンカーテキストのインスタンスがあるかどうか判定するステップと、(C)前記文書中に前記第1アンカーテキストのインスタンスと、この第1アンカーテキストに後続して前記第2アンカーテキストのインスタンスがあると判定された場合に、前記文書中で、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にあるテキストを前記置換テキストに置き換えるステップとを含む。
本発明のその他の特徴および様々な利点および実施例は、以下の記載および請求範囲から明らかになるであろう。
本発明の実施例による、筆記原稿を編集するシステムのデーターフローを示す図である。 図2Aは、本発明の様々な実施例による、図1のシステムにより実行される文書編集方法のフローチャートを示す図である。 図2Bは、本発明の様々な実施例による、図1のシステムにより実行される文書編集方法のフローチャートを示す図である。 図2Cは、本発明の様々な実施例による、図1のシステムにより実行される文書編集方法のフローチャートを示す図である。 図3Aは、本発明の様々な実施例による、図1のシステムで用いられるグラフィカルユーザーインターフェースを示す図である。 図3Bは、本発明の様々な実施例による、図1のシステムで用いられるグラフィカルユーザーインターフェースを示す図である。
ユーザーは、原稿のテキストの編集を、左右の「アンカー」テキストと置換テキストとを入力することを含む入力操作によりおこなう。これに応答して、文書編集システムは、原稿中で左のアンカーテキストの後ろに右のアンカーテキストが続いている実際の該当箇所(インスタンス)を識別し、識別したインスタンスの間のテキストを、ユーザーによって指定された置換テキストに置き換える。例えば、ユーザーが、左アンカーテキストと、後続する置換テキストと、それに後続する右アンカーテキストとからなる文字列を打ち込むと、これに応答して、上記のような置換を編集システムが行う。この結果、ユーザーは、修正すべきテキストの位置まで誘導するためのカーソルキーや他のナビゲーションコマンドを用いずに、原稿中の修正すべきテキストの位置と修正内容両方を指定することができる。これにより、このようなマニュアルナビゲーションに伴う遅延を回避し、修正作業効率を向上させることができる。
例えば、図1に、本発明の実施例による筆記原稿106の編集システム100のデーターフローを図示する。図2Aは、本発明の一実施例による、図1のシステム100により実行される文書編集方法200のフローチャートを示す。トランスクリプションシステム104は、口述された一連の音声(オーディオストリーム)102を文字情報として記録し、筆記原稿106を作成する(ステップ202)。口述音声ストリーム102としては、例えば、医師によって口述される診察記録等がある。口述音声ストリーム102は、どのような形態のものでもよい。例えば、それは、直接または(電話やIP接続等を介して)間接的に受信される生の音声であってもよいし、任意の媒体に任意の形式で記録される音声であってもよい。
トランスクリプションシステム104では、筆記原稿106を、口述筆記者によって、または自動音声認識装置を用いて、あるいは両者を併用して作成する。筆記原稿106は、例えば、口述音声ストリーム102の一言一句の(逐語的)記録でも、逐語的でない記録でもよい。さらに、筆記原稿106は、プレーンテキスト文書であってもよいが、書類の区分を叙述したXMLドキュメントや別の種類のドキュメント構造の構造化文書であってもよい。
ユーザー150は、文書編集システム108を用いて筆記原稿106を編集し、これにより筆記原稿106の改訂(編集)版130を作成する。例えば、ユーザー150は、トランスクリプションシステム104による音声文書化処理におけるエラーを修正するよう筆記原稿106を編集することができる。しかしまた、ユーザー150は、それ以外の目的で編集することもできる。例えば、トランスクリプションシステム104によって作成された原稿106のテキストが口述音声ストリーム102の対応する口述内容に正確に対応していたとしても、そのテキストの意味を明確にするための編集をすることもできる。したがって、以下の記載ではユーザー150が「エラー修正」を行う例について述べるが、より広範な意味では、ユーザー150が筆記原稿106に対して、どのような種類の編集をおこなってもよい。
図3Aに、本発明の実施例による、編集システム108とユーザー150と間の相互作用(インタラクション)のためのグラフィカルユーザーインターフェースの第1状態300aを示す。このグラフィカルユーザーインターフェースは、従来のワードプロセッサやテキストエディタで用いられるものと同様の方法で、筆記原稿106中のテキスト314の一部を表示するフレーム302を含む。編集システム108は、テキスト314が正確に口述音声ストリーム102の口述内容を表しているかどうかをユーザー150が確かめることができるように、ユーザー150に対して口述音声ストリーム102を再生することができる。編集システム108は、ユーザー150に対して、口述音声ストリーム102のどこを現在再生中か示すオーディオカーソル位置110(図1)を表示することができる。文書編集システム108は、例えば、オーディオカーソル位置110に対応するテキスト314内の箇所を強調表示することで、現オーディオカーソル位置110を目で確認できるようする。図3Aにおいては、単語「complaining」324が強調表示されており、これにより、図3Aに示すグラフィカルユーザーインターフェースの第1状態300aでは、オーディオカーソル位置110が、筆記原稿106に単語「complaining」324として記録された口述音声ストリーム102内の言葉に対応することを示している。文書編集システム108は、オーディオカーソル位置110の視覚的表示(例えば強調表示されるテキスト)を、口述音声ストリーム102の再生につれてダイナミックに更新して、ユーザー150が、再生中の口述音声ストリーム102に対応するテキストを目で追跡できるようにすることができる。
また、編集システム108は、テキスト314の(つまり筆記原稿106中の)、次の編集コマンド(例えばテキストの追加や削除)が適用される箇所を示すテキストカーソル位置112を表示することもできる。図3Aに示す状態300aでは、テキストカーソル位置112は、縦ライン326によって、「history」と「of」という単語の間に視覚的に表示されている。なお、テキストカーソル位置112とオーディオカーソル位置110は、めいめいに変更可能である。例えば、ユーザー150は、オーディオカーソル位置110が口述音声ストリーム102の再生に従って移動している間に、テキストカーソル位置112に(例えばライン326の位置に)テキストを打ち込むことができる。
図3Aに例示する状態300aでは、筆記原稿106にエラーがある。すなわち、口述音声ストリーム102に含まれる「than known history」という言葉が、間違って「than no history」というテキスト316として文字化されている。このテキスト316は、「than」318と「no」320と「history」322という単語を含んでいる。そのようなエラーを従来の文書編集システムを用いて訂正するには、ユーザー150は、一般的に、様々な矢印キーを操作する等の手入力操作でテキストカーソル326を間違った単語320の位置まで移動させることになる。この操作において、ユーザー150がかなりの量のナビゲーションを行う必要がある。例えば、従来のトランスクリプション編集システムならば、所謂「ピギーバック」モードにおいてテキストカーソル326がオーディオカーソル324に自動的に追随するように構成することができる。例えば、編集システム108では、ユーザー150がこのシステム108をピギーバックモードに切り替えるコマンドや、このモードを終了させるコマンドを出すことができるようにする。しかしシステム108がピギーバックモードのときに、間違った単語320にユーザー150が気付かないままで、オーディオカーソル324とピギーバックされているテキストカーソル326とが「complaining」という単語に達してしまった場合は、この単語を訂正する前に、ユーザー150は、この間違った単語「no」320の位置までテキストカーソル326を手入力操作で戻す必要がある。これには、いくつかのカーソルナビゲーションコマンドを入力する必要があることもあり、単に間違った単語320の位置にカーソルを移動させ、手入力操作でその間違った単語320を削除して代わりの単語をタイプするというだけの作業に、かなりの時間がかかることがしばしばある。
さらに、カーソルキーを使用したり、またはさもなければテキストカーソルナビゲーションコマンドを出したりすると、通常、システム108は自動的にピギーバックモードを終了してしまう。したがって、従来の編集システム150では、ユーザー150が、そのようなマニュアルナビゲーションコマンドを用いてテキストカーソル326を編集すべきテキストの位置に移動させ、それからそのテキストを編集した場合、オーディオカーソル位置110は、口述音声ストリーム102の再生が続いている間、それにつれて前に進み続けるが、テキストカーソル位置112は編集位置に留まってしまう。その場合、オーディオカーソル位置110に追いつくためには、ユーザー150が「ピギーバックモードの開始」コマンドを手操作で(例えば「ピギーバックモードの開始」を指示する所定の組み合わせのキー操作で)入力するか、テキスト314中の現在のオーディオカーソル位置110に対応する位置を目で確かめて、手操作でテキストカーソル位置112を移動させてオーディオカーソル位置110と同じ位置になるようにしなければならない。これらの操作はいずれも手間と時間がかかる。また、結果的にユーザー150が口述音声ストリーム102や対応するテキストの現在位置を見失ってしまうことがある。この場合、正確さを保つためにはユーザー150が手操作で口述音声ストリーム102を巻き戻す必要があり、これにより、編集作業に更なる遅れが生じてしまう。
これに対して、図1から図3に示す実施例では、ユーザー150はカーソルナビゲーションコマンドを入力することなく間違った単語320を編集することができる。つまりその代わりに、文書編集システム108にテキスト置換入力152を行う(図2A、ステップ204)。置換入力152は、例えば、左の「アンカー」テキスト154(ステップ206)と、置換テキスト156(ステップ208)と、右の「アンカー」テキスト158(ステップ210)を含む。
例えば、図3Aの実施例では、グラフィカルユーザーインターフェースに置換入力フィルード304が設けられており、ここにユーザー150が置換入力152を打ち込むことができる。ユーザー150は、例えば所定のキーまたは所定の組み合わせのキーを押すことで置換入力フィルード304をアクティブにして入力を受け取るようにする。別の例として、ユーザー150は、マウスカーソル(図示せず)をフィルード304内に置いてマウスボタンをクリックすることで置換入力フィルード304をアクティブにすることができる。更に別の例として、システム108がデフォルトとして「アンカー置換」モードになるようにしてもよいし、ユーザー150からのコマンドに応答して「アンカー置換」モードになるようにしてもよい。そしてこの「アンカー置換」モードの間、ユーザー150がタイプするテキストが全て置換入力フィルード304に入力されるようにする。これらの方法は、ユーザー150が置換入力152を置換入力フィルード304に入力するための方法のいくつかの例にすぎない。フィルード304がアクティブになると、ユーザー150はフィルード304に置換入力152を打ち込むことで置換入力152を行うことができる。
図3Aの実施例では、ユーザー150は、置換入力152として「than known history」306とタイプしており、そのうち、左アンカーテキスト154は単語「than」308であり、置換テキスト156は単語「known」310であり、右アンカーテキスト158は単語「history」312である。これは、ユーザー150が、筆記原稿106中で「history」が後続する「than」の位置を特定して、これらの単語の間のテキストを「known」という単語で置き換えようとしていることを示す。これらの単語「than」および「history」が、置き換えるべきテキストの位置を指定するので、「アンカー」と呼ばれる。
一般的に、文書編集システム108は、置換入力152を用いて間違った単語320を訂正するために、アンカーサーチモジュール114によって、筆記原稿106中で左アンカーテキスト154(例えば「than」308)に右アンカーテキスト158(例えば「history」312)が後続している箇所(インスタンス)を見つけ出す(ステップ212)。なお、筆記原稿106中には、左アンカーテキスト154のインスタンスと右アンカーテキスト158のインスタンスとの間に、若干の量のテキストが存在するかもしれないことに留意されたい。そこでサーチモジュール114が、これらの識別されたアンカーのインスタンスの間にあるテキスト124(例えば「no」という単語320)も識別するようにする(ステップ214)。サーチモジュール114は、左右のアンカーのインスタンスおよび置換すべきテキストの各位置を、それぞれ状態116,118,120として保存する。文書編集システム108は、次に置換モジュール122を用いて、文書106中の識別されたテキスト124を置換テキスト156(例えば「known」310)に置き換える(ステップ216)。
図3Aの例での置換結果を、図3Bのグラフィカルユーザーインターフェースの更新状態300bにおいて示す。ここでは、元の(間違った)単語「no」320が置換テキストである「known」328に置き換えられており、単語「no」320には取消線330が引かれて、この単語が削除されたことを示している。つまりこの例では、ユーザー150は、矢印キー等のカーソルナビゲーションコマンドを用いて手入力操作でテキストカーソル326を置換すべき単語124の位置まで動かす代わりに、単に置換入力306をタイプするだけで、単語「no」を「known」に置き換えることができる。文書編集システム108は、このようにして、ユーザー150が置換入力152を行えば、それに応答して2つのステップを実行することで、筆記原稿106の編集を行えるようにしている。すなわち、(1)置換すべきテキスト124の位置を特定し、(2)そのテキスト124を、ユーザー150が指定した置換テキスト156で置き換える。
編集システム108は、置換が行われた後に自動的にピギーバックモードに戻って、ユーザー150が現在のオーディオカーソル位置110から遅延無く筆記原稿106の校閲を継続することができるように構成してもよい。さらに、置換が行われた後に自動的に置換フィルード304の内容が消去されるようにして、ユーザー150が手操作でフィルード304の内容を消去する必要なく別の置換入力をフィルード304に入力することができるようにしてもよい。
図2Bは、本発明の実施例による、筆記原稿106の編集に用いることができる別の方法220のフローチャートを示す。図2Aに示す方法同様、方法220も、口述音声ストリーム102を文字化して筆記原稿106を作成し(ステップ202)、そしてユーザー150からの置換入力152を受け取るものである(ステップ204)。
次にサーチモジュール114が、筆記原稿106内で、アンカー154および158のインスタンスの検索を開始する位置126を初期化する(ステップ222)。例えば、検索位置126を、筆記原稿106の冒頭、または現在のテキストカーソル位置112、あるいは現在のオーディオカーソル位置110に対応する文書106中のテキスト位置にくるように初期化する。これらを含む任意の仕方で検索位置126を初期化できるように、サーチモジュール114をユーザー150によって設定可能としてもよい。
サーチモジュール114は、現在の検索位置126から、左アンカーテキスト154に右アンカーテキスト158が後続している文書106中のインスタンスを検索する。サーチモジュール114が一対のアンカー154および158のインスタンスを見つけたら(ステップ224)、サーチモジュール114は、保存中の左右のアンカー位置116および118を更新して、それぞれ現在見つかった左右のアンカー位置を反映するようにする。また、置換モジュール122は、両アンカー154および158の間のテキスト(例えば、図3Aにおける単語「no」320)を置換テキスト156(例えば単語「known」310)で置き換えていいかどうかユーザー150に確認を促す(ステップ226)。置換モジュール122がユーザー150に確認を促す方法として任意の方法をもちいてよい。例えば、図3Aに強調表示されたテキスト316で示されるように、置換モジュール122は、現在の左アンカーテキスト154と、置換すべきテキスト124と、右アンカーテキスト158とからなる組み合わせを、表示されている原稿106の中で強調表示する。アンカー154および158のインスタンスを置換テキスト156のインスタンスから区別するために、異なった書式をとるようにしてもよい。例えば、アンカーのインスタンス318および322を1つの色(例えば緑色)で強調表示し、置換テキストのインスタンス328(図3B)は、同色または別の色で強調表示した上でアンダーラインを引き、そして置換された(削除された)テキスト330は、同色または別の色で強調表示した上で取消線を引くようにしてもよい。
サーチモジュール114が1つのアンカーに部分一致する箇所を見つけた場合、つまり例えば「an」というアンカーが単語全体または単語の末尾ではなく単語の中央部と一致するような場合(例えば「stand」)、サーチモジュール114は、部分一致インスタンスを、完全一致に対して用いられる色(例えば緑色)とは異なる色(例えば黄色)で強調表示できる。サーチモジュール114は、筆記原稿106中にアンカーのインスタンスを1つも見出さなかった場合に、そのアンカーを置換フィルード304において別の色(例えば赤)で表示することで、検索できなかったことをユーザー150に示すことができる。
さらにまた、ここに開示する例においては、サーチモジュール114が、左アンカーテキスト154を筆記原稿106中の単語の末尾部と照合して一致を検出しているが、これは一例にすぎず、本発明を限定するものではない。例えば、サーチモジュール114は、左アンカーテキスト154と筆記原稿106中の単語の先頭部との一致を検出してもよい。例えば、ユーザー150は「than」という単語318を見つけ出すために「th」というテキストを左アンカーテキスト154として入力する。この結果、「th know h」と置換フィルード304に打ち込めば、「than no history」というテキスト316がマッチする。なおこれは、置換入力306(「th know h」)が筆記原稿106中の連続する文字とは一致しない例であることに留意されたい。
ユーザー150が単語の先頭部を左アンカーとして入力できるようにすると、単語の先頭部は、単語の末尾部よりユーザー150が簡単且つ迅速に思い出してタイプできるので有利となる。さらに広い意味で、システム108を、ユーザー150が単語の先頭部や末尾部、あるいはその他の任意の文字列部分を左アンカーテキスト154および/または右アンカーテキスト156として入力できるようにしてもよい。
ユーザー150は、文書編集システム108に確定入力160を行って、ユーザー150が置換実行を望んでいるかどうかの指示を行う。例えば、ユーザー150は、ENTERキーを押すことで確定入力160を行って置換実行を指示し、ESCAPEキーを押すことで置換を実行しないよう指示する。ユーザー150が置換実行を確定すると(ステップ228)、置換モジュール122が上記の手順で置換を実行する(ステップ230)。
ユーザー150が置換を確定するか確定しないかの指示を出した後に、サーチモジュール114は検索位置126を、筆記原稿106中の現在の右アンカーのインスタンスの直後の位置まで進めることで検索位置126を更新する(ステップ232)。それから方法220はステップ224に戻り、原稿108中の残りの左右のアンカー154および158のインスタンスに対して同様の処理を繰り返す。
なお、置換モジュール122は、ユーザー150に対して、置換を実行した結果のプレビューを表示する機能を備えることができることに留意されたい。例えば、ユーザー150が置換入力152を行うと(例えば置換テキスト306を打ち込むと)、ユーザー150が置換を確定する前でも、置換モジュール122が、図3Bに示すように、置換される(削除される)テキスト330には取消線を引き、置換テキスト328は強調表示と下線で示すことができる。ユーザー150が置換を実行しないという指示を出した場合、置換モジュール122は、表示されているテキスト314を元の状態(例えば図3Aに示すような状態)に戻すことができる。このようなプレビュー機能を設けると、ユーザー150が置換を確定するかどうかの決定をする際の速度と精度を高められる。
編集効率を更に高めるためには、ユーザー150が置換入力152を完了するまで待ってから、サーチモジュール114による左右のアンカー154および158のインスタンスの検索を開始する必要はない。その代わりに、例えば、図2Cに示す方法240のように、ユーザー150が置換入力152を行っている途中に、サーチモジュール114がアンカー154および158の検索を行うようにしてもよい。そして、ユーザー150が置換入力152を行っている間に、検索結果に関するダイナミックに更新されるフィードバックをユーザー150に対して行うようにしてもよい。図2Aおよび図2Bのそれぞれの方法200,220と同様に、図2Cの方法240も、口述音声ストリーム102を文字化して、筆記原稿106を作成することから始まる。
図3Aに示す例を再び参照して説明する。ユーザー150が306を打ち込み始めると、サーチモジュール114が306の最初の文字列部分を左アンカーテキスト154の最初の部分とみなして(ステップ244)、左アンカーテキスト154のインスタンスの検索を、それまでにユーザー150が打ち込み終えた文字に基づいて開始する(ステップ246)。例えば、ユーザー150が「t」という文字をタイプしたとき、サーチモジュール114は、筆記原稿106中で文字「t」が最初に出てくる箇所(インスタンス)を検索し、表示されているテキスト314内で強調表示する(ステップ248)。ユーザー150が続けて「th」とタイプすると、サーチモジュール114は、検索を更新して、筆記原稿106中で「th」というテキストが最初に出てくる箇所(インスタンス)を検索し、このインスタンスを表示テキスト314内で強調表示する(ステップ248)。サーチモジュール114は、ユーザー150が空白や句読点等の非英数字を打ち込むまで、このようにして検索を続ける(ステップ250)。非英数字が打ち込まれた時点で、サーチモジュール114はユーザーによる左アンカーテキスト154の入力が完了したとみなし、次にユーザー150がタイプする文字を置換テキスト156の最初の部分として処理し始める(ステップ252)。
サーチモジュール114は、ユーザー150が置換テキスト156をタイプしている間にその置換テキスト156のインスタンスを検索する必要はない。サーチモジュール114は、単に目下強調表示されている左アンカーテキスト154のインスタンス(例えば図3Aではテキスト「than」318)の直後にあるテキスト(例えばテキスト「no」320)であればどれでも強調表示できる(ステップ254)。サーチモジュール114は、ユーザー150がまた別の空白や句読点等の非英数字を打ち込むまでこの状態を続けることができ、非英数字が打ち込まれた時点で、ユーザーによる置換テキスト156の入力が完了したとみなし(ステップ256)、次にユーザー150が打ち込んだ文字列部分(例えば、単語または単語の一部)を右アンカーテキストの最初の部分として処理し始める(ステップ258)。
ユーザー150が右アンカーテキスト158を打ち込むとき、サーチモジュール114は、筆記原稿106中の左アンカーテキスト154からの予め定められた(例えば、文字または単語単位で規定される)距離128の範囲内にある右アンカーテキスト158を検索することができる(ステップ260)。例えば、左アンカーテキスト154の現在のインスタンスが、図3Aに示すように、「than」という単語318であるならば、ユーザー150が「history」312の「h」という文字をタイプしたときに、サーチモジュール114は、最大検索距離128として指定された文字数または単語数以内で「than」という単語318の後に来る「h」のインスタンスを検索する。図3Aに示す例では、そのようなインスタンスが見つかり、サーチモジュール114によって、「history」322の中の「h」という文字が強調表示されることになる(ステップ262)。サーチモジュール114は、ユーザー150が右アンカーテキスト158(例えば「history」という単語322)を引き続きタイプするとき、検索を更新し続ける。
ここで実施例に図示するように、置換フィルード304に打ち込まれている右端の(最後の)単語(または単語部分あるいは区別された文字列部分)が、ユーザー150によって指定された右アンカーとして処理される。その結果、サーチモジュール114は、あるひとつの単語を先ず右アンカーとして処理し、もしユーザー150が別の単語を追加して打ち込んだならば、その追加された単語を右アンカーとして処理し、その前の単語は置換テキストとして処理するという具合に処理を進めることができる。
なお、最大検索距離128は任意に選択されることに留意されたい。さらに、複数通りの検索距離を設定しておいてもよい。例えば、1つの検索距離(例えば単語5個分)を単語検索に適用し、別の検索距離(例えば単語ゼロ)を句読点に対して適用するとよい。
以上説明したように、図3Aおよび図3Bに示す個々のアンカー308および312は完全な単語であるが、これは本発明の必須要件ではない。むしろ、アンカーは単語の一部であってよい。
サーチモジュール114が、ユーザー150の意図したインスタンスとは違う左アンカーテキスト154および/または右アンカーテキスト158のインスタンスを識別することもありうる。例えば、ユーザー150が「than no history」というテキストを狙って「an known hist」という置換入力を行ったときに、「fan of history」というテキストが筆記原稿106中にあれば、サーチモジュール114が、狙ったテキストの代わりに、この違うテキストを該当箇所として見つけ出すこともある。そのような可能性を考慮して、編集システム108では、ユーザー150がアンカー移動コマンド162を入力することで、手操作で文書106中の次または前のアンカーに移動できるようにすることができる。例えば、システム108では、ALT+左矢印キーを左アンカーテキスト154の前のインスタンスに移動する機能に割り当て、ALT+左矢印キーを左アンカーテキスト154の次のインスタンスに移動する機能に割り当てることができる。
同様に、システム108では、SHIFT+ALT+左矢印キーを右アンカーテキスト158の前のインスタンスに移動する機能に割り当て、SHIFT+ALT+左矢印キーを右アンカーテキスト158の次のインスタンスに移動する機能に割り当てることができる。なおサーチモジュール114は、ユーザーのコマンドに応答して、左アンカーテキスト154の現在のインスタンスの位置116から、次の右アンカーテキスト158のインスタンスの検索を開始できることに留意されたい。右アンカーテキスト158のインスタンスが見つからなかった場合、置換フィルード304に打ち込まれた右端の単語は、右アンカーテキストとしてではなく、左アンカーテキスト154の現在のインスタンスの右側に挿入すべき単語として処理することができる。
アンカーは、他にも様々な形で筆記原稿の編集に用いることができる。例えば、サーチモジュール114が左アンカー154のインスタンスを見つけたのに、その左アンカー154のインスタンスから最大検索距離128の範囲内に右アンカー158のインスタンスが見つからなかった場合、置換モジュール122は、左アンカー154のインスタンスに後続するテキストを置換テキストで置き換えるのではなく、筆記原稿106中の左アンカー154のインスタンスの直後の位置に置換テキスト156を挿入することができる。この場合、置換入力152中の左アンカーテキスト154の右側の全ての単語(例えば、図3Aに示す入力306の単語「known history」)が、該当箇所の見つからなかった右アンカー候補(例えば「history」という単語312)も含めて置換テキスト156として処理され、文書106の左アンカー154のインスタンスの後ろに挿入することができる。
別の例として、ユーザー150は、「hello,」のように、1つの区切り記号が後続する左アンカーをタイプし且つ右アンカーをタイプしないことによって、句読点を置換することができる。これに応答して、文書編集システム108は、あらゆる句読点が後続する左アンカー154を検索し、もしそのような組み合わせが見つかったら、その見つかった句読点をユーザー150によってタイプされた句読点に置き換える。例えば、置換入力132が「hello,」ならば、「hello.」というテキストが「hello,」に置き換えられることになる。
あるいは、他の例として、ユーザー150が「hello,」のように、1つの区切り記号が後続する左アンカーをタイプし且つ右アンカーをタイプしなかった場合、文書編集システム108は、その単語(「hello」)を左アンカーとして処理し、後続の句読点(「,」)を右アンカーとして処理するかもしれない。上記のように、「hello.」というコンマが後続していないテキストをサーチモジュール114が見つけた場合、置換モジュール122はコンマを置換テキストとして扱い、「hello.」を「hello,.」に置き換える。このような置換を行った後、文書編集システム108はテキストフォーマット化ルール、例えば、句読点の直後にある句読点は全て削除するというルールを、文書106に適用することができる。この結果、「hello,.」が「hello,」に置き換えられる。このように、句読点の検索置換のために特別なルールを適用せずとも、元のテキスト「hello.」をテキスト「hello,.」に置き換える別の方法を効果的に用いることができる。つまり、1つの単語が後続する左アンカーに適用される一般的ルールを、句読点が直後に来る左アンカーにも適用することができる。
余分な句読点を取り除くことは、筆記原稿106に対して行うことのできる置換後処理の1つの例にすぎない。他の例として、単語間はシングルスペースとし、ピリオドの後ろはダブルスペースとするというルールの適用や、文の最初の単語およびその他の単語(「I」等)の自動大文字表記化等がある。
同様に、ユーザー150が1つの句読点からなる置換入力152を行い、それから削除キーを押す等して削除コマンドを入力すれば、編集システム108がその句読点のインスタンスを検索し、それを削除できる。例えば、ユーザー150がピリオドをタイプした場合、文書編集システム108は、ピリオドを左アンカーとみなし、文書106中にあるピリオドの次のインスタンスを検索する。そこでユーザー150が削除キーを押すか、さもなければ削除コマンドを出すことによって、検索されたピリオドを削除することができる。
編集システム108は、筆記原稿106内をナビゲートするのを容易にする様々なコマンドを提供できる。そのようなコマンドは、キーボードショートカットを用いるなど、任意の多様な方法で出すことができる。例えば、編集システム108が、直前に置換されたテキストの直後の位置まで口述音声ストリーム102を巻き戻すコマンドを提供できる。そのようなコマンドは、ユーザー150が置換処理を行っている間に口述音声ストリーム102の現在位置を見失った場合に役に立つ。というのも、このコマンドによって、ユーザー150は簡単に置換箇所の直後の位置から校閲を再開できるようになるからである。
ユーザー150が置換フィルード304に左アンカーのみ打ち込んでから(つまり、置換テキストも右アンカーも打ち込まずに)ENTERキーを押すか同等のコマンドを出した場合、編集システム108は、筆記原稿106中でこの指定された左アンカーが次に出てくる位置までテキストカーソル位置112を移動させる。これにより、ユーザー150は、カーソルキーやその他のナビゲーションコマンドを使うことなく文書106内のテキストまで直ぐにジャンプすることができる。
同様に、ユーザー150が置換フィルード304に左アンカーのみ打ち込んでから(つまり、置換テキストも右アンカーも打ち込まずに)削除キーを押すか同等のコマンドを出した場合、編集システム108は、筆記原稿106中で次に出て来る左アンカーを削除する。これにより、ユーザー150は、文書106中で次に出て来る指定された左アンカーを、カーソルキーやその他のナビゲーションコマンドを使ってその位置までカーソルを移動させてから手入力操作で削除したりすることなく簡単に削除することができる。
ユーザー150がカーソルキーのどれか、またはESCAPEキー、あるいは他の所定のキーを押すと、編集システム108はピギーバックモードを止めることができる。これにより、ユーザー150は、オーディオカーソル位置110に結びつけることなく手入力操作で文書106内のカーソル位置を移動させたいと思ったときに、直ぐにピギーバックモードを終了することができる。
このように上記およびその他の本発明の実施例は、全般的に、ユーザー150が文書106を編集するのに要するカーソル矢印キーやその他のマニュアルテキストカーソルナビゲーションコマンド等の使用を最小限にするものである。これにより、従来技術に比べてユーザー150が行わなければならない入力操作量を減らし、全体での編集効率を高めている。そのような攻略法は全ての状況や全てのユーザーにとって効果を上げるものではないかもしれないが、ユーザー150は、いつでも、アンカー編集モードを止めて、従来の技術で原稿106を編集する選択をすることができる。その結果、ユーザーがそれぞれに、従来の編集技術と、ここで開示した編集技術とを自由に組み合わせて、各自にとって最も効率の良いやり方で文書106を編集することができる。
以上述べた実施例では、筆記原稿106が口述筆記によって作成されているが、これは本発明の必須要件ではない。むしろ、ここに開示した技術は、口述筆記により作成されたかどうかに関わらず、いかなる種類の文書にも適用することができる。例えば、ここに開示した技術は、口述内容を参照することなく書かれた文書に適用できる。従って、文書106は、「口述筆記」文書でなくてもよく、より広い意味で、どんな種類の文書であってもよい。
以上、本発明の詳細な実施例について説明してきたが、上記実施例は説明に供するためだけのものであって、本発明の範囲を制限ないし限定するものではないことが理解されよう。以下に述べる実施形態を含み且つそれに限定されない他の多様な実施形態も、本発明の請求範囲に含まれる。例えば、ここに記載した各構成要素は、同じ機能を実施するために、分割することで構成要素を付加してもよいし、統合して構成要素の数を減らしてもよい。例えば、図2Aおよび図2Bの種々の方法の構成要素を互いに組み合わせても良い。
本発明は、上記の分野(医療記録や裁判記録等)に限定されるものではなく、あらゆる種類の構造化書類に広く適用できる。さらに、本発明の実施例に用いられている(筆記原稿106や、編集された筆記文書110や、編集された文書624等の)様々な文書は、任意の機械読み取り可能な形式で表されてよい。そのような形式には、プレーンテキスト文書や、XML等のマークアップ言語で表された構造化文書が含まれる。そのような文書は、コンピュータで読み取り可能な任意の媒体に保存したり、任意の種類の通信チャネルおよびプロトコルを用いて送信したりできる。
ここに開示した技術は、エラー検出訂正以外の作業に用いることができる。例えば、ここに開示した技術は、自動トランスクリプションシステムにより作成された原稿に適用することができる。このようなシステムには自動音声認識装置が含まれる。自動音声認識装置では、各単語に対し、その単語が正確に認識されている確率を示す「確信度」が付される。ここに開示する技術を、そのような確信度の注釈が付された原稿に適用した場合、そのシステムは、エラーの可能性があるフィルードとして識別された任意の内容(例えば、編集パターン(D、E、C)における内容Dにマッチする任意の内容D)の確信度を低下することができる。そのように確信度を低下させれば、その内容を見直して修正するのを促進することになる。
さらに、異なる種類(分類)のエラーを識別して、異なるやり方で処理することもできる。例えば、内容の削除は、内容の変更とは別に処理し、内容の変更は、内容の追加とは別に処理するようにする。単語のスペルミスを、他の単語に置き換えるのとは違ったやり方で処理してもよい。句読点の間違いを、スペルミスとは違ったやり方で処理してもよい。エラーの分類は、最初に編集パターンを作る際に行ってもよいし、エラー検出時に行ってもよい。エラーが検出されると、そのエラーの分類によって、行うべき修正作業を選択してもよい。これに加えて、あるいはこれに代えて、今後エラーを防止するための作業手続を提示してもよい。例えば、エラーの分類を、(筆記原稿106等の)原稿を作成するのに用いられる(人手による、ないしは自動的な)トランスクリプションシステム104の性能向上に役立てることもできる。該エラーの分類は、特定の分類に属するエラーに対して適用される専用の修正ルールを規定するのに用いることもできる。
上記のように、各分類子が対応する内容Dに関連付けられている。分類子122は、任意のレベルの精度で内容に関連付けられる。例えば、特定の単語(例えば「John」)に関連付けることができる。この場合、分類子は、その単語が出現する文脈によって、その単語に適用すべき適切な修正ルールを選択する。しかしまた分類子は、単語の他に、文、文書の一区画、文書全体といった、あらゆるレベルの精度で内容に関連付けることができる。いずれの場合も、分類子は、その内容が出現する前後関係に基づいて、その内容に適用すべき適切な修正ルールを選択する。
なおここでは、自動トランスクリプションシステムに適用されるものとして、幾つかの技術を説明しているが、これは本発明の必須要件ではない。例えば、図1Aは、筆記原稿106とこれに対応する編集後の筆記文書106をシステム100のトレーニングに用いる例を示す。しかしシステム100を、(人手による、または自動的な)音声文書化により作成されたのではない原稿(およびこれに対応する編集された文書)でトレーニングしてもよい。例えば、システム100を、手書き文書や、他の文書から光学文字認識(OCR)を用いて作成された文書を用いてトレーニングできる。同様に、修正システム704によって修正される原稿702も、筆記原稿である必要はなく、エラーの検出修正が望まれる文書であれば、どのような種類のものでもよい。
ここではルール118を「修正」ルールと呼んでいるが、このようなルールは音声文書化におけるミスを修正するためのものに限定されず、より一般的に、任意の編集操作を行うために用いることができる。例えば、修正ルールを、書式付け要求に沿ってテキストを編集するために用いてもよい。したがって、修正ルール118は、より一般的な意味で、編集ルールといえる。
上記の技術は、例えば、ハードウエア、ソフトウエア、ファームウエア、またはこれらの組み合わせに実施することができる。上記の技術は、プログラマブルコンピュータ上で実行される1つ以上のコンピュータプログラムによって実施することができる。なおプログラマブルコンピュータは、プロセッサと、プロセッサにより読み出し可能な記憶媒体(例えば、揮発性および不揮発性メモリおよび/または記憶素子等)と、少なくとも1つの入力手段と、少なくとも1つの出力手段とを備えている。プログラムコードを、上記の機能を実行し且つ出力を生成するために入力装置を用いて入力される入力に適用できる。該出力は、1つまたは複数の出力装置に提供することができる。
下記の特許請求の範囲に含まれる各コンピュータプログラムは、アセンブリ言語、マシン語、高水準手続プログラミング言語、オブジェクト指向プログラミング言語等の、いかなるプログラミング言語でも実施することができる。該プログラミング言語は、例えば、コンパイラ型またはインタプレタ型のプログラミング言語でありえる。
このようなコンピュータプログラムは、それぞれ、コンピュータプロセッサによって実行することができるように、機械読み取り可能な記憶手段の形で具現化したコンピュータプログラム製品として実施できる。本発明の方法の各ステップは、コンピュータプロセッサが、コンピュータで読み取り可能な媒体に具現化されたプログラムを実行することよって実行可能であり、これにより、入力部を操作して出力を発生させることによって本発明の機能が実行される。このプロセッサとしては、例えば、汎用および専用のマイクロプロセッサのいずれも適している。通常、該プロセッサは、命令やデータを、読み取り専用メモリないしランダムアクセスメモリから受け取る。コンピュータプログラム命令を実施するのに適した記憶手段として、例えば、EPROMやEEPROMやフラッシュメモリを含む半導体メモリ、内部ハードディスクやリムーバブルディスク等の磁気ディスク、磁気光学ディスク、およびCD−ROM等の、あらゆる形式の不揮発性メモリを用いることができる。上記構成のいずれにも、特別に設計したASIC(application-specific integrated circuits)またはEPCA(Field-Programmable Gate Array)を増設または統合することができる。コンピュータは、一般的に、内部ディスク(図示せず)やリムーバブルディスク等の記憶媒体からプログラムおよびデータを受け取ることができる。これらの構成要素も、従来のデスクトップコンピュータやワークステーションコンピュータ、ならびにその他の、ここに記載した方法を実施するコンピュータプログラムを実行するのに適したコンピュータに見られる。またこれらのコンピュータは、任意のデジタルプリントエンジンやマーキングエンジン、あるいはディスプレイモニタ等の、カラーまたは白黒の画素を紙、フィルム、表示画面または出力媒体に生成することのできるラスター出力装置と接続して用いることができる。

Claims (14)

  1. コンピュータを含む文書編集システムで実施される方法であって、
    (A)自動音声認識装置を使用してオーディオ信号に基づいて文書を生成するステップと、
    (B)アンカーサーチモジュールが第1アンカーテキストと、第2アンカーテキストと、置換テキストとを識別するステップと、
    (C)前記アンカーサーチモジュールが前記文書中に、前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあるかどうか判定するステップと、
    (D)前記文書中に前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあると前記アンカーサーチモジュールにより判定された場合に、
    (D1)前記アンカーサーチモジュールが前記第1アンカーテキストのインスタンスと前記第2アンカーテキストのインスタンスの間の前記文書中のテキストを識別し、
    (D2)置換モジュールが前記第1アンカーテキストのインスタンスを置き換えずに、かつ、前記第2アンカーテキストのインスタンスを置き換えずに、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にあるテキストを前記置換テキストに置き換え、
    (D3)前記文書編集システムが再生中のオーディオ信号における位置を示す現在のオーディオカーソル位置に対応する前記文書中の位置にテキストカーソルを動かす、ステップとを含み、
    前記ステップ(B)の前に、前記第1アンカーテキストと前記第2アンカーテキストと前記置換テキストとを指定する入力をユーザーから受け取るステップ(E)を更に含み、
    前記第1アンカーテキストと前記第2アンカーテキストとが、それぞれ特定の単語を含み、
    前記ステップ(E)が、前記第1アンカーテキストと前記置換テキストと前記第2アンカーテキストとがこの順序で配列されたテキスト列を前記ユーザーから受け取ることを含み、
    前記ステップ(E)は、複数の列部分からなるテキスト列を前記ユーザーから受け取り、前記複数の列部分のうち左端の列部分を前記第1アンカーテキストとして識別し、前記複数の列部分のうち右端の列部分を前記第2アンカーテキストとして識別し、前記左端の列部分と前記右端の列部分の間のテキストを前記置換テキストとして識別することを含む、
    方法。
  2. 前記ステップ(E)が、前記文書内でテキストカーソル位置を変えることなく、前記ユーザーからの前記入力を受け取ることを含む、
    請求項1に記載の方法。
  3. 前記文書中に前記第1アンカーテキストのインスタンスと前記第2アンカーテキストのインスタンスの検索を、前記ユーザーからの入力を受け取りながら行う、
    請求項1に記載の方法。
  4. 前記ステップ(D)が、前記文書の前記第1アンカーテキストと前記第2アンカーテキストとの間で前記文書中のテキストを前記置換テキストに置き換えることを含み、前記方法は、前記ステップ(E)の前に前記ユーザーが前記第1アンカーテキストのみを打ち込んだ後に前記ユーザが指示した場合に、前記文書編集システムが前記文書内でテキストカーソルを前記第1アンカーテキストが次に出てくる位置に移動させるステップをさらに含む、
    請求項1に記載の方法。
  5. 前記ステップ(D)が、前記文書中の、前記第1アンカーテキストのインスタンスと第2アンカーテキストのインスタンスの間にある全てのテキストを前記置換テキストに置き換えることを含む、
    請求項1に記載の方法。
  6. 前記第1アンカーテキストは1つの単語からなる、
    請求項1に記載の方法。
  7. 前記ステップ(B)および(C)が、前記ユーザーからテキストカーソルナビゲーションコマンドを受け取ることなく行われる、
    請求項1に記載の方法。
  8. コンピュータを含む文書編集システムで実施される方法であって、
    (A)自動音声認識装置を使用してオーディオ信号に基づき文書を生成するステップと、
    (B)アンカーサーチモジュールが第1アンカーテキストと、第2アンカーテキストと、置換テキストとを識別するステップと、
    (C)(1)前記アンカーサーチモジュールが前記文書中に、前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに配置された前記第2アンカーテキストのインスタンスがあるかどうか判定し、(2)前記文書中で前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間のテキストを置換すべきかどうかを指示するユーザーからの入力を受け取るステップと、
    (D)前記文書中に前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあると前記アンカーサーチモジュールにより判定された場合であって、前記文書中の、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にある前記テキストを、このテキストを置換するよう指示するユーザー入力の場合のみに、
    (D1)前記アンカーサーチモジュールが前記第1アンカーテキストのインスタンスと前記第2アンカーテキストのインスタンスの間の前記文書中のテキストを識別し、
    (D2)置換モジュールが前記第1アンカーテキストのインスタンスを置き換えずに、かつ、前記第2アンカーテキストのインスタンスを置き換えずに、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にあるテキストを前記置換テキストに置き換え、
    (D3)前記文書編集システムが再生中のオーディオ信号における位置を示す現在のオーディオカーソル位置に対応する前記文書中の位置にテキストカーソルを動かす、ステップとを含み、
    前記ステップ(B)の前に、前記第1アンカーテキストと前記第2アンカーテキストと前記置換テキストとを指定する入力を前記ユーザーから受け取るステップ(E)を更に含み、
    前記第1アンカーテキストと前記第2アンカーテキストとが、それぞれ特定の単語を含み、
    前記ステップ(E)が、前記第1アンカーテキストと前記置換テキストと前記第2アンカーテキストとがこの順序で配列されたテキスト列を前記ユーザーから受け取ることを含み、
    前記ステップ(E)は、複数の列部分からなるテキスト列を前記ユーザーから受け取り、前記複数の列部分のうち左端の列部分を前記第1アンカーテキストとして識別し、前記複数の列部分のうち右端の列部分を前記第2アンカーテキストとして識別し、前記左端の列部分と前記右端の列部分の間のテキストを前記置換テキストとして識別することを含む、
    方法。
  9. 前記文書中に前記第1アンカーテキストのインスタンスはあるが、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスは無いことが検出された場合に、前記文書中の、前記第1アンカーテキストの前記インスタンスの後ろに、前記置換テキストおよび前記第2アンカーテキストを挿入するステップ(F)を更に含む、
    請求項1に記載の方法。
  10. 前記ステップ(F)が、前記置換テキストを前記文書に挿入した後に前記文書に対してテキスト書式化ルールを適用することを更に含む、
    請求項9に記載の方法。
  11. オーディオ信号に基づき文書を生成する自動音声認識手段と、
    第1アンカーテキストと、第2アンカーテキストと、置換テキストとを識別するテキスト識別手段と、
    文書中に、前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあるかどうかを判定する検索手段と、
    前記文書中に前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあることが判明した場合に、前記文書中で、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にあるテキストを識別する識別手段と;
    前記文書中に前記第1アンカーテキストのインスタンスと、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスがあることが判明した場合に、前記第1アンカーテキストのインスタンスを置き換えずに、かつ、前記第2アンカーテキストのインスタンスを置き換えずに、前記文書中で、前記第1アンカーテキストの前記インスタンスと前記第2アンカーテキストの前記インスタンスの間にあるテキストを前記置換テキストに置き換え、再生中のオーディオ信号における位置を示す現在のオーディオカーソル位置に対応する前記文書中の位置にテキストカーソルを動かす、置換手段とを備え、
    前記第1アンカーテキストと前記第2アンカーテキストと前記置換テキストとを指定する入力をユーザーから受け取るためのユーザー入力手段を更に備え、
    前記第1アンカーテキストと前記第2アンカーテキストとが、それぞれ特定の単語を含み、
    前記ユーザー入力手段が、前記第1アンカーテキストと前記置換テキストと前記第2アンカーテキストとがこの順序で配列されたテキスト列を前記ユーザーから受け取るための手段を備え、
    前記ユーザー入力手段は、
    複数の列部分からなるテキスト列を前記ユーザーから受け取る手段と、
    前記複数の列部分のうち左端の列部分を前記第1アンカーテキストとして識別する手段と、
    前記複数の列部分のうち右端の列部分を前記第2アンカーテキストとして識別する手段と、
    前記左端の列部分と前記右端の列部分の間のテキストを前記置換テキストとして識別する手段とを備える、
    装置。
  12. 前記ユーザー入力手段は、前記文書内でテキストカーソル位置を変えることなく、前記ユーザーからの前記入力を受け取る手段を備える、
    請求項11に記載の装置。
  13. 前記置換手段が、前記文書の前記第1アンカーテキストと前記第2アンカーテキストとの間で前記文書中のテキストを前記置換テキストに置き換える手段と、前記ユーザーが前記第1アンカーテキストのみを打ち込んだ後にユーザー指示した場合に、前記文書内でテキストカーソルを前記第1アンカーテキストが次に出てくる位置に移動させる手段とを備える、
    請求項11に記載の装置。
  14. 前記文書中に前記第1アンカーテキストのインスタンスはあるが、この第1アンカーテキストの後ろに前記第2アンカーテキストのインスタンスは無いことが検出された場合に、前記文書中の、前記第1アンカーテキストの前記インスタンスの後ろに、前記置換テキストおよび前記第2アンカーテキストを挿入する手段を更に備える、
    請求項11に記載の装置。
JP2010521906A 2007-08-19 2008-07-01 アンカーを用いた文書編集 Active JP5917804B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/840,970 2007-08-19
US11/840,970 US8959433B2 (en) 2007-08-19 2007-08-19 Document editing using anchors
PCT/US2008/068942 WO2009025933A1 (en) 2007-08-19 2008-07-01 Document editing using anchors

Publications (3)

Publication Number Publication Date
JP2010537315A JP2010537315A (ja) 2010-12-02
JP2010537315A5 JP2010537315A5 (ja) 2011-10-06
JP5917804B2 true JP5917804B2 (ja) 2016-05-18

Family

ID=40378503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010521906A Active JP5917804B2 (ja) 2007-08-19 2008-07-01 アンカーを用いた文書編集

Country Status (5)

Country Link
US (2) US8959433B2 (ja)
EP (1) EP2179372B1 (ja)
JP (1) JP5917804B2 (ja)
CA (1) CA2684748A1 (ja)
WO (1) WO2009025933A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010894B2 (en) * 2005-05-18 2011-08-30 Microsoft Corporation Memory optimizing for re-ordering user edits
US20100125450A1 (en) * 2008-10-27 2010-05-20 Spheris Inc. Synchronized transcription rules handling
US8259124B2 (en) * 2008-11-06 2012-09-04 Microsoft Corporation Dynamic search result highlighting
JP5430277B2 (ja) * 2009-08-04 2014-02-26 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、及びコンピュータプログラム
US9135223B2 (en) * 2010-01-15 2015-09-15 Apple Inc. Automatically configuring white space around an object in a document
US20110179350A1 (en) * 2010-01-15 2011-07-21 Apple Inc. Automatically placing an anchor for an object in a document
US8572496B2 (en) * 2010-04-27 2013-10-29 Go Daddy Operating Company, LLC Embedding variable fields in individual email messages sent via a web-based graphical user interface
US8612455B2 (en) * 2010-10-06 2013-12-17 Treato Ltd. System and method for detecting personal experience event reports from user generated internet content
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
KR101294558B1 (ko) * 2013-04-15 2013-08-07 김민철 오타 수정 방법
KR101901744B1 (ko) * 2013-07-19 2018-09-28 네이버 주식회사 오타 수정 방법
US20150058006A1 (en) * 2013-08-23 2015-02-26 Xerox Corporation Phonetic alignment for user-agent dialogue recognition
EP2851896A1 (en) * 2013-09-19 2015-03-25 Maluuba Inc. Speech recognition using phoneme matching
KR101381101B1 (ko) * 2013-11-13 2014-04-02 주식회사 큐키 문자열 사이의 연관성 판단을 통한 오타 수정 방법
US20150254211A1 (en) * 2014-03-08 2015-09-10 Microsoft Technology Licensing, Llc Interactive data manipulation using examples and natural language
US9812130B1 (en) * 2014-03-11 2017-11-07 Nvoq Incorporated Apparatus and methods for dynamically changing a language model based on recognized text
US10643616B1 (en) * 2014-03-11 2020-05-05 Nvoq Incorporated Apparatus and methods for dynamically changing a speech resource based on recognized text
KR102217560B1 (ko) * 2014-03-20 2021-02-19 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
US9565147B2 (en) 2014-06-30 2017-02-07 Go Daddy Operating Company, LLC System and methods for multiple email services having a common domain
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9767172B2 (en) * 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9978370B2 (en) * 2015-07-31 2018-05-22 Lenovo (Singapore) Pte. Ltd. Insertion of characters in speech recognition
US10324589B2 (en) 2016-10-25 2019-06-18 International Business Machines Corporation Navigation by usage locations in a document editing application
US11373654B2 (en) * 2017-08-07 2022-06-28 Sonova Ag Online automatic audio transcription for hearing aid users
US10698500B2 (en) * 2018-07-24 2020-06-30 Bank Of America Corporation Touch-based and audio-responsive user interface for elimination of a query's component terms
KR101946545B1 (ko) 2018-09-18 2019-02-11 네이버 주식회사 오타 수정 방법
US11574134B2 (en) * 2018-12-20 2023-02-07 Lexmark International, Inc. Systems and methods of processing a document in an imaging device
US11670291B1 (en) * 2019-02-22 2023-06-06 Suki AI, Inc. Systems, methods, and storage media for providing an interface for textual editing through speech
USD946589S1 (en) * 2019-11-21 2022-03-22 Monday.com Ltd. Display screen or portion thereof with animated graphical user interface
USD947228S1 (en) * 2020-06-05 2022-03-29 Shelterzoom Corp. Display screen or portion thereof with animated graphical user interface
EP4221169A1 (en) * 2022-01-31 2023-08-02 Koa Health B.V. Sucursal en España System and method for monitoring communication quality
JP7414868B2 (ja) * 2022-02-18 2024-01-16 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062074A (en) * 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
JP3025724B2 (ja) * 1992-11-24 2000-03-27 富士通株式会社 類義語生成処理方法
US5515491A (en) 1992-12-31 1996-05-07 International Business Machines Corporation Method and system for managing communications within a collaborative data processing system
US5781909A (en) * 1996-02-13 1998-07-14 Microtouch Systems, Inc. Supervised satellite kiosk management system with combined local and remote data storage
US5761683A (en) * 1996-02-13 1998-06-02 Microtouch Systems, Inc. Techniques for changing the behavior of a link in a hypertext document
US5802299A (en) * 1996-02-13 1998-09-01 Microtouch Systems, Inc. Interactive system for authoring hypertext document collections
US5917486A (en) 1996-11-04 1999-06-29 Prolexia Reading Education Software Corporation System and method for client program control of a computer display cursor
US6100881A (en) * 1997-10-22 2000-08-08 Gibbons; Hugh Apparatus and method for creating interactive multimedia presentation using a shoot lost to keep track of audio objects of a character
US6081772A (en) 1998-03-26 2000-06-27 International Business Machines Corporation Proofreading aid based on closed-class vocabulary
US6115686A (en) * 1998-04-02 2000-09-05 Industrial Technology Research Institute Hyper text mark up language document to speech converter
US6064961A (en) 1998-09-02 2000-05-16 International Business Machines Corporation Display for proofreading text
US6360237B1 (en) * 1998-10-05 2002-03-19 Lernout & Hauspie Speech Products N.V. Method and system for performing text edits during audio recording playback
US7089278B1 (en) 1999-09-07 2006-08-08 Fuji Xerox Co., Ltd. Anchored conversations: adhesive, in-context, virtual discussion forums
US20030074353A1 (en) * 1999-12-20 2003-04-17 Berkan Riza C. Answer retrieval technique
US6618722B1 (en) * 2000-07-24 2003-09-09 International Business Machines Corporation Session-history-based recency-biased natural language document search
ATE286294T1 (de) 2001-03-29 2005-01-15 Koninkl Philips Electronics Nv Synchronisierung eines audio- und eines textcursors während der editierung
US7142705B2 (en) * 2001-05-01 2006-11-28 Canon Kabushiki Kaisha Radiation image processing apparatus, image processing system, radiation image processing method, storage medium, and program
US6690364B1 (en) * 2001-05-31 2004-02-10 Palm Source, Inc. Method and system for on screen text correction via pen interface
US7146358B1 (en) * 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
US7200720B1 (en) * 2001-12-28 2007-04-03 Oracle International Corporation System and method for efficiently performing memory intensive computations including a bidirectional synchronization mechanism for maintaining consistency of data
US20030172048A1 (en) * 2002-03-06 2003-09-11 Business Machines Corporation Text search system for complex queries
US7308643B1 (en) * 2003-07-03 2007-12-11 Google Inc. Anchor tag indexing in a web crawler system
US20050060290A1 (en) * 2003-09-15 2005-03-17 International Business Machines Corporation Automatic query routing and rank configuration for search queries in an information retrieval system
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7856413B2 (en) * 2004-10-14 2010-12-21 International Business Machines Corporation Dynamic search criteria on a search graph
US7499940B1 (en) * 2004-11-11 2009-03-03 Google Inc. Method and system for URL autocompletion using ranked results
US7480667B2 (en) 2004-12-24 2009-01-20 Microsoft Corporation System and method for using anchor text as training data for classifier-based search systems
US9208229B2 (en) 2005-03-31 2015-12-08 Google Inc. Anchor text summarization for corroboration
US8015482B2 (en) 2005-09-14 2011-09-06 Microsoft Corporation Dynamic anchoring of annotations to editable content
US20070168465A1 (en) * 2005-12-22 2007-07-19 Toppenberg Larry W Web Page Optimization Systems
US7774328B2 (en) * 2006-02-17 2010-08-10 Google Inc. Browseable fact repository
US20070198474A1 (en) * 2006-02-06 2007-08-23 Davidson Michael P Contact list search with autocomplete
US7895518B2 (en) * 2007-04-27 2011-02-22 Shapewriter Inc. System and method for preview and selection of words

Also Published As

Publication number Publication date
EP2179372A1 (en) 2010-04-28
EP2179372B1 (en) 2019-08-21
EP2179372A4 (en) 2012-04-11
CA2684748A1 (en) 2009-02-26
JP2010537315A (ja) 2010-12-02
US8959433B2 (en) 2015-02-17
US20150112677A1 (en) 2015-04-23
WO2009025933A1 (en) 2009-02-26
US20090113293A1 (en) 2009-04-30

Similar Documents

Publication Publication Date Title
JP5917804B2 (ja) アンカーを用いた文書編集
EP3709245A1 (en) Generating a meeting review document that includes links to one or more documents reviewed
EP3709244A1 (en) Generating suggested document edits from recorded media using artificial intelligence
US11080466B2 (en) Updating existing content suggestion to include suggestions from recorded media using artificial intelligence
JP5175206B2 (ja) 草稿文書における編集パターンの自動検出及び適用
US11263384B2 (en) Generating document edit requests for electronic documents managed by a third-party document management service using artificial intelligence
US11392754B2 (en) Artificial intelligence assisted review of physical documents
US11720741B2 (en) Artificial intelligence assisted review of electronic documents
US7546529B2 (en) Method and system for providing alternatives for text derived from stochastic input sources
US9372843B2 (en) Document association device, document association method, and non-transitory computer readable medium
US20190267007A1 (en) Text correction apparatus and text correction method
US11922944B2 (en) Phrase alternatives representation for automatic speech recognition and methods of use
JPH04229364A (ja) 強調特性変更方法及びシステム
JPH11102361A (ja) 文字入力修正方法及び前記方法手順を記録した記録媒体
US20240012980A1 (en) Methods and systems for generating and selectively displaying portions of scripts for nonlinear dialog between at least one computing device and at least one user
JPH07219962A (ja) キーワード作成装置
JP2009211285A (ja) 文章入力補助装置、及び文章入力補助プログラム
JPH05143593A (ja) 文字列修正方式
JP2006268621A (ja) 機械翻訳プログラム、機械翻訳装置
JPH07168842A (ja) キーワード作成装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110630

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140710

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140718

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140808

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151002

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20151215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160127

RD15 Notification of revocation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7435

Effective date: 20160222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160407

R150 Certificate of patent or registration of utility model

Ref document number: 5917804

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250