JP5747066B2 - トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 - Google Patents
トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 Download PDFInfo
- Publication number
- JP5747066B2 JP5747066B2 JP2013231893A JP2013231893A JP5747066B2 JP 5747066 B2 JP5747066 B2 JP 5747066B2 JP 2013231893 A JP2013231893 A JP 2013231893A JP 2013231893 A JP2013231893 A JP 2013231893A JP 5747066 B2 JP5747066 B2 JP 5747066B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- section
- user
- topic
- heading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Description
当業者は、本発明の目的はこれに限定されないことを理解するであろう。たとえば、本発明はユーザーの校閲に反応しての構造化テキストの修正の手段を提供することもねらいとしている。
以下で、本発明の好ましい実施形態について図面を参照しつつより詳細に説明する。
ユーザーは、当該テキスト中の第一の位置で付与されたラベル(406)を選択し、その付与されたラベルを当該テキスト中の第二の位置に移動することによってセクション境界を再定義してもよい。前記第二の位置がセクション境界を定義し、前記選択されたラベルが前記セクション見出しを定義する。
〔態様1〕
テキストをテキストセクションにセグメント分割し、注釈付けされたトレーニング・データに基づいて各テキストセクションにトピックを付与する方法であって、
・トレーニング・データから抽出された統計モデルを使うことによって当該テキストをテキストセクションにセグメント分割し、
・前記トレーニング・データから抽出された統計モデルを使うことによって各テキストセクションに該テキストセクションの内容を示すトピックを付与し、
・前記ラベルを前記テキストセクションに付与するために当該テキストにラベルをセクション見出しとして挿入することによって、構造化されたテキストを生成し、
・前記構造化されたテキストをユーザーに提示し、
・ユーザーの校閲に反応して前記構造化されたテキストの修正を処理する、
ステップを有することを特徴とする方法。
〔態様2〕
テキストセクションに付与された前記トピックがさらにラベルの集合に付与されており、該ラベルの一つが前記テキストセクションに付与されて当該テキストにセクション見出しとして挿入されることを特徴とする、態様1記載の方法。
〔態様3〕
前記構造化されたテキストをユーザーに提示することがさらに、各テキストセクションについて、該テキストセクションに付与された前記トピックに付与された前記ラベルの集合を提示することを含むことを特徴とする、態様1または2記載の方法。
〔態様4〕
前記テキスト修正が、当該テキストのセクションへのセグメント分割の修正ならびに/またはラベルとテキストセクションとの間の対応付けの修正を含むことを特徴とする、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
態様3または4記載の方法であって、前記構造化されたテキストの修正が:
・あるテキストセクションにラベルを、該テキストセクションに付与されている前記トピックに付与された前記ラベルの集合のうちの一つのラベルを選択することによって付与し、
・当該テキスト中の第一の位置で付与されたラベルを選択し、その付与されたラベルを当該テキスト中の第二の位置に移動することによってセクション境界を再定義し、前記第二の位置がセクション境界を定義し、前記選択されたラベルが前記セクション見出しを定義し、
・ラベルを入力し、該入力されたラベルを前記テキストセクションに付与する、
ことを含むことを特徴とする方法。
〔態様6〕
態様1ないし5のうちいずれか一項記載の方法であって、前記構造化されたテキストの修正の前記処理が、ユーザーの校閲に反応して当該テキスト中の修正を実行し、その後:
・前記トレーニング・データから抽出された統計モデルを使い、かつ前記実行された修正を参照することによって、当該テキストをテキストセクションに再セグメント分割し、
・前記実行された修正を参照することによって当該テキストにラベルをセクション見出しとして挿入することによって構造化されたテキストを再生成し、前記ラベルを前記テキストセクションに付与し、前記構造化されたテキストを校閲のためにユーザーに提示する、
ステップを引き起こすことを含むことを特徴とする方法。
〔態様7〕
態様1ないし6のうちいずれか一項記載の方法であって、前記構造化されたテキストの修正の前記処理が、当該テキスト内であるテキスト部分がセクション見出しを記述する定型として識別されたときに、該テキスト部分をラベルによって置き換えることを含むことを特徴とする方法。
〔態様8〕
態様1ないし7のうちいずれか一項記載の方法であって、前記テキストセグメント分割の粒度が、カスタマイズ可能な粒度パラメータによってユーザーにより制御されることを特徴とする方法。
〔態様9〕
態様1ないし8のうちいずれか一項記載の方法であって、前記統計モデルを適応させるために、前記構造化されたテキストの修正がログに記録され、解析されることを特徴とする方法。
〔態様10〕
テキストをテキストセクションにセグメント分割し、注釈付けされたトレーニング・データに基づいて各テキストセクションにトピックを付与するテキストセグメント分割システムであって、
・トレーニング・データから抽出された統計モデルを使うことによって当該テキストをテキストセクションにセグメント分割する手段と、
・前記トレーニング・データから抽出された統計モデルを使うことによって各テキストセクションに該テキストセクションの内容を示すトピックを付与する手段であって該トピックがさらにラベルの集合に付与されている手段と、
・前記ラベルを前記テキストセクションに付与するために当該テキストに前記ラベルの集合のうちの一つのラベルをセクション見出しとして挿入することによって、構造化されたテキストを生成する手段と、
・前記構造化されたテキストをユーザーに提示する手段と、
・ユーザーの校閲に反応して前記構造化されたテキストの修正を処理する手段、
とを有することを特徴とするシステム。
〔態様11〕
態様10記載のテキストセグメント分割システムであって、前記構造化されたテキストの修正を処理する手段が、当該テキストのセクションへのセグメント分割の修正ならびに/またはラベルとテキストセクションとの間の対応付けの修正を実行するよう適応されていることを特徴とするシステム。
〔態様12〕
態様10または11記載のテキストセグメント分割システムであって、前記構造化されたテキストの修正を処理する手段がさらに:
・あるテキストセクションにラベルを、該テキストセクションに付与されている前記トピックに付与された前記ラベルの集合のうちの一つのラベルを選択することによって付与し、
・当該テキスト中の第一の位置で付与されたラベルを選択し、その付与されたラベルを当該テキスト中の第二の位置に移動することによってセクション境界を再定義し、前記第二の位置がセクション境界を定義し、前記選択されたラベルが前記セクション見出しを定義し、
・ラベルを入力し、該入力されたラベルを前記テキストセクションに付与する、
ことを実行するよう適応されていることを特徴とするシステム。
〔態様13〕
態様10ないし12のうちいずれか一項記載のシステムであって、前記構造化されたテキストの修正を処理する前記手段が、ユーザーの校閲に反応して当該テキスト中の修正を実行するよう適応されており、さらに:
・前記トレーニング・データから抽出された統計モデルを使い、かつ前記実行された修正を参照することによって、当該テキストをテキストセクションに再セグメント分割し、
・前記実行された修正を参照することによって当該テキストにラベルをセクション見出しとして挿入することによって構造化されたテキストを再生成し、前記ラベルを前記テキストセクションに付与し、前記構造化されたテキストを校閲のためにユーザーに提示する、
ステップをその後引き起こす手段を有することを特徴とするシステム。
〔態様14〕
態様10ないし13のうちいずれか一項記載のシステムであって、前記構造化されたテキストの実行された修正をログに記録して解析する手段をさらに有しており、該ログに記録して解析する手段が前記統計モデルを適応させるよう適応されていることを特徴とするシステム。
〔態様15〕
テキストをテキストセクションにセグメント分割し、注釈付けされたトレーニング・データに基づいて各テキストセクションにトピックを付与するためのコンピュータプログラムであって、
・トレーニング・データから抽出された統計モデルを使うことによって当該テキストをテキストセクションにセグメント分割し、
・前記トレーニング・データから抽出された統計モデルを使うことによって各テキストセクションに該テキストセクションの内容を示すトピックを付与し、該トピックはさらにラベルの集合に付与されており、
・前記ラベルを前記テキストセクションに付与するために当該テキストに前記ラベルの集合のうちの一つのラベルをセクション見出しとして挿入することによって、構造化されたテキストを生成し、
・前記構造化されたテキストをユーザーに提示し、
・ユーザーの校閲に反応して前記構造化されたテキストの修正を処理する、
プログラム手段を有することを特徴とするプログラム。
〔態様16〕
態様15記載のコンピュータプログラムであって、前記構造化されたテキストの修正を処理するプログラム手段が、当該テキストのセクションへのセグメント分割の修正ならびに/またはラベルとテキストセクションとの間の対応付けの修正を実行するよう適応されており、該ラベルとテキストセクションとの間の対応付けの修正のために前記プログラム手段がさらに:
・あるテキストセクションにラベルを、該テキストセクションに付与されている前記トピックに付与された前記ラベルの集合のうちの一つのラベルを選択することによって付与し、
・当該テキスト中の第一の位置で付与されたラベルを選択し、その付与されたラベルを当該テキスト中の第二の位置に移動することによってセクション境界を再定義し、前記第二の位置がセクション境界を定義し、前記選択されたラベルが前記セクション見出しを定義し、
・ラベルを入力し、該入力されたラベルを前記テキストセクションに付与する、
ステップを実行するよう適応されていることを特徴とするプログラム。
〔態様17〕
態様15または16記載のコンピュータプログラムであって、前記構造化されたテキストの修正を処理する前記プログラム手段が、ユーザーの校閲に反応して当該テキスト中の修正を実行するよう適応されており、さらに:
・前記トレーニング・データから抽出された統計モデルを使い、かつ前記実行された修正を参照することによって、当該テキストをテキストセクションに再セグメント分割し、
・前記実行された修正を参照することによって当該テキストにラベルをセクション見出しとして挿入することで構造化されたテキストを再生成し、前記ラベルを前記テキストセクションに付与し、前記構造化されたテキストを校閲のためにユーザーに提示する、
ステップをその後引き起こすためのプログラム手段を有することを特徴とするプログラム。
〔態様18〕
テキストをテキストセクションにセグメント分割し、注釈付けされたトレーニング・データに基づいて各テキストセクションにトピックを付与するためのユーザーインターフェースであって、
・トレーニング・データから抽出された統計モデルを使うことにより構造化されたテキストをユーザーに提示する手段と、
・各テキストセクションに付与された各トピックに付与されているラベルの集合をユーザーに提示する手段と、
・ユーザーの校閲に反応して前記構造化されたテキストの修正を処理する入力手段と、
・統計モデルをトレーニングするために前記構造化されたテキストの処理された修正をログに記録して解析する手段、
とを有することを特徴とするユーザーインターフェース。
〔態様19〕
態様18記載のユーザーインターフェースであって、前記構造化されたテキストがグラフィカルユーザーインターフェースによってユーザーに提示され、前記入力手段が、ユーザーが前記提示されたラベルの集合のうちの一つのラベルを選択してその選択されたラベルがテキストセクションに付与されるという形で、前記構造化されたテキストの修正を処理するよう適応されていることを特徴とするユーザーインターフェース。
〔態様20〕
態様18または19記載のユーザーインターフェースであって、統計モデルを使い、かつ前記処理された修正を参照することによって、ユーザーの校閲に反応して再セグメント分割され、再ラベル付けされたテキストを提供する手段をさらに有することを特徴とするユーザーインターフェース。
402 テキストウィンドウ
404 提案ウィンドウ
406 ラベル
408 ポインタ
410 ラベルリスト
412 ラベル
414 ラベル
416 ラベル
418 ユーザー入力欄
500 セグメント分割システム
502 音声
504 入力装置
506 ユーザー
508 外部記憶装置
510 音声認識モジュール
512 非構造化テキストモジュール
514 統計モデルモジュール
516 処理ユニット
518 構造化テキストモジュール
520 グラフィカルユーザーインターフェース
Claims (20)
- コンピュータによって実行される方法であって:
構造化されていないテキストをテキストセクションにセグメント分割した結果を、セグメント分割およびトピック付与手段から、受領手段によって、受領する段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含む、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して、出力手段によって、出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに割り当てられた前記トピックに対応し、前記少なくとも一つのテキストセクションに付与された前記トピックは複数のセクション見出しに関連付けられており、前記少なくとも一つのテキストセクションについての前記セクション見出しは前記複数のセクション見出しから選択される、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を、入力手段によって、受領する段階と;
前記第一の構造化されたテキストを、ユーザーから受領された前記少なくとも一つの修正に従って、修正手段によって修正して第二の構造化されたテキストを生成する段階とを含む、
方法。 - コンピュータによって実行される方法であって:
構造化されていないテキストをテキストセクションにセグメント分割した結果を、セグメント分割およびトピック付与手段から、受領手段によって、受領する段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含む、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して、出力手段によって、出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに割り当てられた前記トピックに対応する、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を、入力手段によって、受領する段階と;
前記第一の構造化されたテキストを、ユーザーから受領された前記少なくとも一つの修正に従って、修正手段によって修正して第二の構造化されたテキストを生成する段階とを含み、
前記少なくとも一つのテキストセクションに付与されたトピックは複数のセクション見出しに関連付けられており、前記少なくとも一つのテキストセクションについての前記セクション見出しは、前記複数のセクション見出しから選択され、
前記セクション見出しの選択は、トピックに付与されるテキストセクションの前に特定のセクション見出しがくる頻度を反映するトレーニング・データに基づく計数統計を使うことによって、および/またはテキストセクションの先頭に見出される明示的な言語表現を使うことによって行われる、
方法。 - 前記少なくとも一つのテキストセクションについての前記セクション見出しは、前記複数のセクション見出しのうちで、前記少なくとも一つのテキストセクションに割り当てられたトピックについて最も頻繁に選択されるセクション見出しである、請求項2記載の方法。
- 前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しをユーザーに提供する段階をさらに含み、前記少なくとも一つの修正は、前記複数のセクション見出しのうちからの、前記少なくとも一つのテキストセクションについての代替的なセクション見出しのユーザーによる選択を含む、請求項2記載の方法。
- 前記少なくとも一つの修正は、前記少なくとも一つのテキストセクションについて挿入されたセクション見出しを置換するためにユーザーによって入力される新しいセクション見出しを含み、前記新しいセクション見出しは、前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しのうちのどのセクション見出しとも異なっている、請求項2記載の方法。
- 前記セクション見出しは前記第一の構造化されたテキスト中に、ある第一の位置において挿入され、前記少なくとも一つの修正は、前記セクション見出しを前記第一の位置とは異なる第二の位置に移動させて、前記少なくとも一つのテキストセクションの境界を再定義することを含む、請求項1記載の方法。
- 前記複数のテキストセクションが第一の複数のテキストセクションであり、当該方法がさらに:
ユーザーから受け取られた前記少なくとも一つの修正を無効にすることなく、前記第二の構造化されたテキストの少なくとも一部を第二の複数のテキストセクションに再セグメント化する段階と;
前記第二の複数のテキストセクションおよび該第二の複数のテキストセクションのそれぞれについての対応するセクション見出しを含む第三の構造化されたテキストを生成する段階とを含む、
請求項1記載の方法。 - コンピュータによって実行される方法であって:
構造化されていないテキストをテキストセクションにセグメント分割した結果を、セグメント分割およびトピック付与手段から、受領手段によって、受領する段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含む、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して、出力手段によって、出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに割り当てられた前記トピックに対応する、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を、入力手段によって、受領する段階と;
前記第一の構造化されたテキストを、ユーザーから受領された前記少なくとも一つの修正に従って、修正手段によって修正して第二の構造化されたテキストを生成する段階とを含み、
あるテキスト部分を、前記少なくとも一つのテキストセクションについての前記セクション見出しの完全なまたは部分的な言語表現として識別する段階と;
ユーザーに提供される前記第一の構造化されたテキストから前記テキスト部分を除去する段階とをさらに含む、
方法。 - セグメント分割の粒度がカスタマイズ可能な粒度パラメータを使ってユーザーによって制御される、請求項1記載の方法。
- コンピュータによって実行される方法であって:
構造化されていないテキストをテキストセクションにセグメント分割した結果を、セグメント分割およびトピック付与手段から、受領手段によって、受領する段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含む、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して、出力手段によって、出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに割り当てられた前記トピックに対応する、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を、入力手段によって、受領する段階と;
前記第一の構造化されたテキストを、ユーザーから受領された前記少なくとも一つの修正に従って、修正手段によって修正して第二の構造化されたテキストを生成する段階とを含み、
前記セグメント分割およびトピック付与手段が、構造化されていないテキストをセグメント分割するおよび/または少なくとも一つのテキストセクションにトピックを付与することにおいて、注釈付けされたトレーニング・データから構築される少なくとも一つの統計モデルを使い、ユーザーから受け取られる前記少なくとも一つの修正が前記少なくとも一つの統計モデルを適応させるためにログに記録され、解析され、
前記少なくとも一つの統計モデルはトピックシーケンス確率、トピック位置確率、セクション長確率および/またはテキスト放出確率を含む、
方法。 - コンピュータ・システムを有する装置であって、前記コンピュータ・システムは:
構造化されていないテキストをテキストセクションにセグメント分割した結果をセグメント分割およびトピック付与手段から受け取る段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含み、前記トピックは複数のセクション見出しに関連付けられている、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しから選択される、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を受け取る段階と;
前記ユーザーから受け取られた前記少なくとも一つの修正に従って前記第一の構造化されたテキストを修正して第二の構造化されたテキストを生成する段階とを実行するよう構成されている、
装置。 - 前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しが、前記第一の構造化されたテキストとともにユーザーに提供され、前記少なくとも一つの修正は、前記複数のセクション見出しのうちからの、前記少なくとも一つのテキストセクションについての代替的なセクション見出しのユーザーによる選択を含む、請求項11記載の装置。
- 前記少なくとも一つの修正は、前記少なくとも一つのテキストセクションについて挿入されたセクション見出しを置換するためにユーザーによって入力される新しいセクション見出しを含み、前記新しいセクション見出しは、前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しのうちのどのセクション見出しとも異なっている、請求項11記載の装置。
- 前記セクション見出しは前記第一の構造化されたテキスト中に、ある第一の位置において挿入され、前記少なくとも一つの修正は、前記セクション見出しを前記第一の位置とは異なる第二の位置に移動させて、前記少なくとも一つのテキストセクションの境界を再定義することを含む、請求項11記載の装置。
- コンピュータ・システムを有する装置であって、前記コンピュータ・システムは:
構造化されていないテキストをテキストセクションにセグメント分割した結果をセグメント分割およびトピック付与手段から受け取る段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含み、前記トピックは複数のセクション見出しに関連付けられている、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しから選択される、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を受け取る段階と;
前記ユーザーから受け取られた前記少なくとも一つの修正に従って前記第一の構造化されたテキストを修正して第二の構造化されたテキストを生成する段階とを実行するよう構成されており、
前記複数のテキストセクションが第一の複数のテキストセクションであり、前記コンピュータ・システムがさらに:
ユーザーから受け取られた前記少なくとも一つの修正を無効にすることなく、前記第二の構造化されたテキストの少なくとも一部を第二の複数のテキストセクションに再セグメント化する段階と;
前記第二の複数のテキストセクションおよび該第二の複数のテキストセクションのそれぞれについての対応するセクション見出しを含む第三の構造化されたテキストを生成する段階とを実行するよう構成されている、
装置。 - コンピュータ・システムを有する装置であって、前記コンピュータ・システムは:
構造化されていないテキストをテキストセクションにセグメント分割した結果をセグメント分割およびトピック付与手段から受け取る段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含み、前記トピックは複数のセクション見出しに関連付けられている、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに対して出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しから選択される、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を受け取る段階と;
前記ユーザーから受け取られた前記少なくとも一つの修正に従って前記第一の構造化されたテキストを修正して第二の構造化されたテキストを生成する段階とを実行するよう構成されており、
前記コンピュータ・システムが前記セグメント分割およびトピック付与手段を有し、前記セグメント分割およびトピック付与手段が、構造化されていないテキストをセグメント分割するおよび/または少なくとも一つのテキストセクションにトピックを付与することにおいて、注釈付けされたトレーニング・データから構築される少なくとも一つの統計モデルを使うよう構成されており、前記コンピュータ・システムがさらに、ユーザーから受け取られる前記少なくとも一つの修正を、前記少なくとも一つの統計モデルを適応させるためにログに記録し、解析するよう構成されており、
前記少なくとも一つの統計モデルはトピックシーケンス確率、トピック位置確率、セクション長確率および/またはテキスト放出確率を含む、
装置。 - 実行可能な命令がエンコードされている少なくとも一つのコンピュータ可読記憶デバイスであって、前記命令は、コンピュータ・システムによって実行されたときに:
構造化されていないテキストをテキストセクションにセグメント分割した結果をセグメント分割およびトピック付与手段から受け取る段階であって、前記結果は少なくとも一つのテキストセクションについて該少なくとも一つのテキストセクションの内容を示すトピックを含み、前記トピックは複数のセクション見出しに関連付けられている、段階と;
前記少なくとも一つのテキストセクションおよび該少なくとも一つのテキストセクションについてのセクション見出しを含む第一の構造化されたテキストをユーザーに出力する段階であって、前記セクション見出しは前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた複数のセクション見出しから選択される、段階と;
前記第一の構造化されたテキストに対する少なくとも一つの修正を指示するユーザー入力を受け取る段階と;
前記ユーザーから受け取られた前記少なくとも一つの修正に従って前記第一の構造化されたテキストを修正して第二の構造化されたテキストを生成する段階とを含む、
方法を実行する、
コンピュータ可読記憶デバイス。 - 前記少なくとも一つのテキストセクションについての前記セクション見出しは、前記複数のセクション見出しのうちで、前記少なくとも一つのテキストセクションに割り当てられたトピックについて最も頻繁に選択されるセクション見出しである、請求項17記載のコンピュータ可読記憶デバイス。
- 前記方法がさらに、前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しをユーザーに提供する段階を含み、前記少なくとも一つの修正は、前記複数のセクション見出しのうちからの、前記少なくとも一つのテキストセクションについての代替的なセクション見出しのユーザーによる選択を含む、請求項17記載のコンピュータ可読記憶デバイス。
- 前記少なくとも一つの修正は、前記少なくとも一つのテキストセクションについて挿入されたセクション見出しを置換するためにユーザーによって入力される新しいセクション見出しを含み、前記新しいセクション見出しは、前記少なくとも一つのテキストセクションに付与されたトピックに関連付けられた前記複数のセクション見出しのうちのどのセクション見出しとも異なっている、請求項17記載のコンピュータ可読記憶デバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03104316.9 | 2003-11-21 | ||
EP03104316 | 2003-11-21 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011170125A Division JP5450524B2 (ja) | 2003-11-21 | 2011-08-03 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014059896A JP2014059896A (ja) | 2014-04-03 |
JP5747066B2 true JP5747066B2 (ja) | 2015-07-08 |
Family
ID=34610120
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006540706A Expired - Fee Related JP4808160B2 (ja) | 2003-11-21 | 2004-11-12 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
JP2011103843A Pending JP2011204249A (ja) | 2003-11-21 | 2011-05-06 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
JP2011170125A Expired - Fee Related JP5450524B2 (ja) | 2003-11-21 | 2011-08-03 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
JP2013231893A Expired - Fee Related JP5747066B2 (ja) | 2003-11-21 | 2013-11-08 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006540706A Expired - Fee Related JP4808160B2 (ja) | 2003-11-21 | 2004-11-12 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
JP2011103843A Pending JP2011204249A (ja) | 2003-11-21 | 2011-05-06 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
JP2011170125A Expired - Fee Related JP5450524B2 (ja) | 2003-11-21 | 2011-08-03 | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
Country Status (4)
Country | Link |
---|---|
US (4) | US8200487B2 (ja) |
EP (1) | EP1687739A2 (ja) |
JP (4) | JP4808160B2 (ja) |
WO (1) | WO2005050474A2 (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7958443B2 (en) | 2003-02-28 | 2011-06-07 | Dictaphone Corporation | System and method for structuring speech recognized text into a pre-selected document format |
US20040243545A1 (en) * | 2003-05-29 | 2004-12-02 | Dictaphone Corporation | Systems and methods utilizing natural language medical records |
WO2005050474A2 (en) | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics |
US7844464B2 (en) * | 2005-07-22 | 2010-11-30 | Multimodal Technologies, Inc. | Content-based audio playback emphasis |
US7680648B2 (en) * | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
JP2009501370A (ja) * | 2005-07-15 | 2009-01-15 | シンク ソフトウェア ピーティーワイ リミテッド | 自由テキスト・メッセージについて構造化データを提供する方法および装置 |
US8036889B2 (en) * | 2006-02-27 | 2011-10-11 | Nuance Communications, Inc. | Systems and methods for filtering dictated and non-dictated sections of documents |
US8301448B2 (en) | 2006-03-29 | 2012-10-30 | Nuance Communications, Inc. | System and method for applying dynamic contextual grammars and language models to improve automatic speech recognition accuracy |
US8996587B2 (en) * | 2007-02-15 | 2015-03-31 | International Business Machines Corporation | Method and apparatus for automatically structuring free form hetergeneous data |
JP5256654B2 (ja) * | 2007-06-29 | 2013-08-07 | 富士通株式会社 | 文章分割プログラム、文章分割装置および文章分割方法 |
US8073682B2 (en) * | 2007-10-12 | 2011-12-06 | Palo Alto Research Center Incorporated | System and method for prospecting digital information |
US8671104B2 (en) | 2007-10-12 | 2014-03-11 | Palo Alto Research Center Incorporated | System and method for providing orientation into digital information |
US8165985B2 (en) | 2007-10-12 | 2012-04-24 | Palo Alto Research Center Incorporated | System and method for performing discovery of digital information in a subject area |
US20100057577A1 (en) * | 2008-08-28 | 2010-03-04 | Palo Alto Research Center Incorporated | System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing |
US20100057536A1 (en) * | 2008-08-28 | 2010-03-04 | Palo Alto Research Center Incorporated | System And Method For Providing Community-Based Advertising Term Disambiguation |
US8209616B2 (en) * | 2008-08-28 | 2012-06-26 | Palo Alto Research Center Incorporated | System and method for interfacing a web browser widget with social indexing |
US8010545B2 (en) * | 2008-08-28 | 2011-08-30 | Palo Alto Research Center Incorporated | System and method for providing a topic-directed search |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
GB0917753D0 (en) | 2009-10-09 | 2009-11-25 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9424246B2 (en) | 2009-03-30 | 2016-08-23 | Touchtype Ltd. | System and method for inputting text into electronic devices |
US9189472B2 (en) | 2009-03-30 | 2015-11-17 | Touchtype Limited | System and method for inputting text into small screen devices |
US10191654B2 (en) | 2009-03-30 | 2019-01-29 | Touchtype Limited | System and method for inputting text into electronic devices |
GB0905457D0 (en) | 2009-03-30 | 2009-05-13 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB201016385D0 (en) | 2010-09-29 | 2010-11-10 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB201003628D0 (en) | 2010-03-04 | 2010-04-21 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9031944B2 (en) | 2010-04-30 | 2015-05-12 | Palo Alto Research Center Incorporated | System and method for providing multi-core and multi-level topical organization in social indexes |
US8554542B2 (en) * | 2010-05-05 | 2013-10-08 | Xerox Corporation | Textual entailment method for linking text of an abstract to text in the main body of a document |
GB201200643D0 (en) | 2012-01-16 | 2012-02-29 | Touchtype Ltd | System and method for inputting text |
US9377373B2 (en) * | 2010-10-05 | 2016-06-28 | Infraware, Inc. | System and method for analyzing verbal records of dictation using extracted verbal features |
JP5392228B2 (ja) * | 2010-10-14 | 2014-01-22 | 株式会社Jvcケンウッド | 番組検索装置および番組検索方法 |
JP5392227B2 (ja) * | 2010-10-14 | 2014-01-22 | 株式会社Jvcケンウッド | フィルタリング装置およびフィルタリング方法 |
US9223769B2 (en) | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
WO2014018039A1 (en) * | 2012-07-26 | 2014-01-30 | Nuance Communications, Inc. | Text formatter with intuitive customization |
US11468243B2 (en) * | 2012-09-24 | 2022-10-11 | Amazon Technologies, Inc. | Identity-based display of text |
US9141407B2 (en) * | 2012-11-14 | 2015-09-22 | Honeywell International Inc. | System and approach for defining labels for enumeration values of parameters in a wall module |
JP5945062B2 (ja) * | 2013-02-28 | 2016-07-05 | 株式会社東芝 | データ処理装置および物語モデル構築方法 |
US9575958B1 (en) * | 2013-05-02 | 2017-02-21 | Athena Ann Smyros | Differentiation testing |
US9390079B1 (en) * | 2013-05-10 | 2016-07-12 | D.R. Systems, Inc. | Voice commands for report editing |
US11183300B2 (en) * | 2013-06-05 | 2021-11-23 | Nuance Communications, Inc. | Methods and apparatus for providing guidance to medical professionals |
US9058374B2 (en) | 2013-09-26 | 2015-06-16 | International Business Machines Corporation | Concept driven automatic section identification |
WO2015166508A1 (en) * | 2014-04-30 | 2015-11-05 | Hewlett-Packard Development Company, L.P. | Correlation based instruments discovery |
US11488040B2 (en) | 2014-05-22 | 2022-11-01 | The Bank Of New York Mellon | System and methods for prediction communication performance in networked systems |
WO2015179636A1 (en) * | 2014-05-22 | 2015-11-26 | The Bank Of New York Mellon | Liquidity forecasting and management system and method |
WO2015183127A1 (ru) * | 2014-05-30 | 2015-12-03 | Общество С Ограниченной Ответственностью "Петер-Сервис Рнд" | Способ сегментирования данных |
US9761222B1 (en) * | 2014-06-11 | 2017-09-12 | Albert Scarasso | Intelligent conversational messaging |
US10380225B1 (en) | 2014-07-15 | 2019-08-13 | Google Llc | Systems and methods for layout transformation of document content |
JP2016071406A (ja) * | 2014-09-26 | 2016-05-09 | 大日本印刷株式会社 | ラベル付与装置、ラベル付与方法、及びプログラム |
US10223442B2 (en) | 2015-04-09 | 2019-03-05 | Qualtrics, Llc | Prioritizing survey text responses |
US10339160B2 (en) | 2015-10-29 | 2019-07-02 | Qualtrics, Llc | Organizing survey text responses |
US9880863B2 (en) | 2015-11-13 | 2018-01-30 | The Boeing Company | Methods and systems for increasing processor speed by creating rule engine rules from unstructured text |
US9519871B1 (en) * | 2015-12-21 | 2016-12-13 | International Business Machines Corporation | Contextual text adaptation |
GB201610984D0 (en) | 2016-06-23 | 2016-08-10 | Microsoft Technology Licensing Llc | Suppression of input images |
US10600097B2 (en) | 2016-06-30 | 2020-03-24 | Qualtrics, Llc | Distributing action items and action item reminders |
US11645317B2 (en) | 2016-07-26 | 2023-05-09 | Qualtrics, Llc | Recommending topic clusters for unstructured text documents |
US10650621B1 (en) | 2016-09-13 | 2020-05-12 | Iocurrents, Inc. | Interfacing with a vehicular controller area network |
US10176889B2 (en) * | 2017-02-09 | 2019-01-08 | International Business Machines Corporation | Segmenting and interpreting a document, and relocating document fragments to corresponding sections |
US10169325B2 (en) * | 2017-02-09 | 2019-01-01 | International Business Machines Corporation | Segmenting and interpreting a document, and relocating document fragments to corresponding sections |
JP6930179B2 (ja) * | 2017-03-30 | 2021-09-01 | 富士通株式会社 | 学習装置、学習方法及び学習プログラム |
RU2643467C1 (ru) | 2017-05-30 | 2018-02-01 | Общество с ограниченной ответственностью "Аби Девелопмент" | Сопоставление разметки для похожих документов |
US10997223B1 (en) * | 2017-06-28 | 2021-05-04 | Amazon Technologies, Inc. | Subject-specific data set for named entity resolution |
US20190006027A1 (en) * | 2017-06-30 | 2019-01-03 | Accenture Global Solutions Limited | Automatic identification and extraction of medical conditions and evidences from electronic health records |
US10489502B2 (en) * | 2017-06-30 | 2019-11-26 | Accenture Global Solutions Limited | Document processing |
RU2666277C1 (ru) * | 2017-09-06 | 2018-09-06 | Общество с ограниченной ответственностью "Аби Продакшн" | Сегментация текста |
US11521722B2 (en) | 2017-10-20 | 2022-12-06 | Google Llc | Capturing detailed structure from patient-doctor conversations for use in clinical documentation |
US10699065B2 (en) * | 2017-11-06 | 2020-06-30 | Microsoft Technology Licensing, Llc | Electronic document content classification and document type determination |
US11568231B2 (en) * | 2017-12-08 | 2023-01-31 | Raytheon Bbn Technologies Corp. | Waypoint detection for a contact center analysis system |
US11023551B2 (en) * | 2018-02-23 | 2021-06-01 | Accenture Global Solutions Limited | Document processing based on proxy logs |
US11314807B2 (en) | 2018-05-18 | 2022-04-26 | Xcential Corporation | Methods and systems for comparison of structured documents |
US10936628B2 (en) | 2018-05-30 | 2021-03-02 | International Business Machines Corporation | Automatic processing of ambiguously labeled data |
US10783314B2 (en) * | 2018-06-29 | 2020-09-22 | Adobe Inc. | Emphasizing key points in a speech file and structuring an associated transcription |
US10769205B2 (en) | 2018-08-09 | 2020-09-08 | Bank Of America Corporation | Resource management using natural language processing tags |
US10642890B2 (en) | 2018-08-09 | 2020-05-05 | Bank Of America Corporation | Dynamic memory allocation using natural language processing tags |
US10963510B2 (en) | 2018-08-09 | 2021-03-30 | Bank Of America Corporation | Dynamic natural language processing tagging |
US10915778B2 (en) | 2018-08-27 | 2021-02-09 | Samsung Electronics Co., Ltd. | User interface framework for multi-selection and operation of non-consecutive segmented information |
CN109192212B (zh) * | 2018-11-13 | 2019-12-10 | 苏州思必驰信息科技有限公司 | 语音控制方法及装置 |
US20200311412A1 (en) | 2019-03-29 | 2020-10-01 | Konica Minolta Laboratory U.S.A., Inc. | Inferring titles and sections in documents |
US11853701B2 (en) * | 2019-06-23 | 2023-12-26 | LitLingo Technologies, Inc. | Method for recommending and implementing communication optimizations |
US11308944B2 (en) | 2020-03-12 | 2022-04-19 | International Business Machines Corporation | Intent boundary segmentation for multi-intent utterances |
LU101705B1 (en) | 2020-03-26 | 2021-09-27 | Microsoft Technology Licensing Llc | Document control item |
CN111785272B (zh) * | 2020-06-16 | 2021-06-11 | 杭州云嘉云计算有限公司 | 一种在线标注方法及系统 |
CN112417083B (zh) * | 2020-11-12 | 2022-05-17 | 福建亿榕信息技术有限公司 | 一种构建部署文本实体关系提取模型的方法和存储设备 |
US20230409808A1 (en) * | 2020-11-25 | 2023-12-21 | Nec Corporation | Information processing device, information processing method and recording medium |
CN113722425A (zh) * | 2021-07-23 | 2021-11-30 | 阿里巴巴达摩院(杭州)科技有限公司 | 数据处理方法、计算机设备及计算机可读存储介质 |
JP2023035617A (ja) * | 2021-09-01 | 2023-03-13 | 株式会社東芝 | コミュニケーションデータログ処理装置、方法及びプログラム |
US11809477B1 (en) * | 2022-11-28 | 2023-11-07 | Intuit Inc. | Topic focused related entity extraction |
Family Cites Families (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4477698A (en) | 1982-09-07 | 1984-10-16 | Melita Electronics Labs, Inc. | Apparatus for detecting pick-up at a remote telephone set |
US4965763A (en) | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
JPH0683807B2 (ja) | 1988-03-04 | 1994-10-26 | ナショナル住宅産業株式会社 | 板状ワークの塗装乾燥装置 |
US5253164A (en) | 1988-09-30 | 1993-10-12 | Hpr, Inc. | System and method for detecting fraudulent medical claims via examination of service codes |
US5111398A (en) * | 1988-11-21 | 1992-05-05 | Xerox Corporation | Processing natural language text using autonomous punctuational structure |
US5327341A (en) | 1991-10-28 | 1994-07-05 | Whalen Edward J | Computerized file maintenance system for managing medical records including narrative reports |
US5325293A (en) | 1992-02-18 | 1994-06-28 | Dorne Howard L | System and method for correlating medical procedures and medical billing codes |
JPH05307556A (ja) | 1992-04-30 | 1993-11-19 | Olympus Optical Co Ltd | 統合データベースを用いた情報処理装置 |
JPH0683807A (ja) * | 1992-08-31 | 1994-03-25 | Toshiba Corp | 文書作成装置 |
JPH08506911A (ja) | 1992-11-23 | 1996-07-23 | パラゴン、コンセプツ、インコーポレーテッド | ファイル・アクセスを行うためにユーザーがカテゴリを選択するコンピュータ・ファイリング・システム |
US5392209A (en) | 1992-12-18 | 1995-02-21 | Abbott Laboratories | Method and apparatus for providing a data interface between a plurality of test information sources and a database |
WO1995000914A1 (en) | 1993-06-28 | 1995-01-05 | Scott & White Memorial Hospital And Scott, Sherwood And Brindley Foundation | Electronic medical record using text database |
US5623681A (en) * | 1993-11-19 | 1997-04-22 | Waverley Holdings, Inc. | Method and apparatus for synchronizing, displaying and manipulating text and image documents |
US5623679A (en) * | 1993-11-19 | 1997-04-22 | Waverley Holdings, Inc. | System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects |
GB2285895A (en) | 1994-01-19 | 1995-07-26 | Ibm | Audio conferencing system which generates a set of minutes |
NZ248751A (en) | 1994-03-23 | 1997-11-24 | Ryan John Kevin | Text analysis and coding |
AU2463895A (en) | 1994-05-02 | 1995-11-29 | Catalina Information Resources, Inc. | Method and apparatus for real-time tracking of retail sales of selected products |
US5799268A (en) | 1994-09-28 | 1998-08-25 | Apple Computer, Inc. | Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like |
JP3666907B2 (ja) | 1994-10-20 | 2005-06-29 | 富士通株式会社 | データベース用ファイル格納管理システム |
US5734883A (en) | 1995-04-27 | 1998-03-31 | Michael Umen & Co., Inc. | Drug document production system |
US5689585A (en) | 1995-04-28 | 1997-11-18 | Xerox Corporation | Method for aligning a text image to a transcription of the image |
US5883986A (en) | 1995-06-02 | 1999-03-16 | Xerox Corporation | Method and system for automatic transcription correction |
US5664109A (en) | 1995-06-07 | 1997-09-02 | E-Systems, Inc. | Method for extracting pre-defined data items from medical service records generated by health care providers |
US6006221A (en) | 1995-08-16 | 1999-12-21 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US5675788A (en) | 1995-09-15 | 1997-10-07 | Infonautics Corp. | Method and apparatus for generating a composite document on a selected topic from a plurality of information sources |
US6192112B1 (en) | 1995-12-29 | 2001-02-20 | Seymour A. Rapaport | Medical information system including a medical information server having an interactive voice-response interface |
US5754840A (en) | 1996-01-23 | 1998-05-19 | Smartpatents, Inc. | System, method, and computer program product for developing and maintaining documents which includes analyzing a patent application with regards to the specification and claims |
US6684188B1 (en) | 1996-02-02 | 2004-01-27 | Geoffrey C Mitchell | Method for production of medical records and other technical documents |
US5970463A (en) | 1996-05-01 | 1999-10-19 | Practice Patterns Science, Inc. | Medical claims integration and data analysis system |
US6052693A (en) | 1996-07-02 | 2000-04-18 | Harlequin Group Plc | System for assembling large databases through information extracted from text sources |
US6279017B1 (en) * | 1996-08-07 | 2001-08-21 | Randall C. Walker | Method and apparatus for displaying text based upon attributes found within the text |
US5924074A (en) | 1996-09-27 | 1999-07-13 | Azron Incorporated | Electronic medical records system |
US6055494A (en) | 1996-10-28 | 2000-04-25 | The Trustees Of Columbia University In The City Of New York | System and method for medical language extraction and encoding |
US6182029B1 (en) | 1996-10-28 | 2001-01-30 | The Trustees Of Columbia University In The City Of New York | System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters |
US6021202A (en) | 1996-12-20 | 2000-02-01 | Financial Services Technology Consortium | Method and system for processing electronic documents |
US5924068A (en) | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
US6108629A (en) | 1997-04-25 | 2000-08-22 | At&T Corp. | Method and apparatus for voice interaction over a network using an information flow controller |
US5875429A (en) | 1997-05-20 | 1999-02-23 | Applied Voice Recognition, Inc. | Method and apparatus for editing documents through voice recognition |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US5974412A (en) | 1997-09-24 | 1999-10-26 | Sapient Health Network | Intelligent query system for automatically indexing information in a database and automatically categorizing users |
AU9513198A (en) | 1997-09-30 | 1999-04-23 | Ihc Health Services, Inc. | Aprobabilistic system for natural language processing |
DE19809563A1 (de) | 1998-03-05 | 1999-09-09 | Siemens Ag | Medizinischer Arbeitsplatz |
US6199079B1 (en) | 1998-03-09 | 2001-03-06 | Junglee Corporation | Method and system for automatically filling forms in an integrated network based transaction environment |
US6088437A (en) | 1998-04-23 | 2000-07-11 | Touch Tone Technologies Inc. | Call processing system, method and computer program product |
US6915254B1 (en) | 1998-07-30 | 2005-07-05 | A-Life Medical, Inc. | Automatically assigning medical codes using natural language processing |
US6553385B2 (en) | 1998-09-01 | 2003-04-22 | International Business Machines Corporation | Architecture of a framework for information extraction from natural language documents |
US6438533B1 (en) | 1998-10-30 | 2002-08-20 | College Of American Pathologists | System for retrieval of information from data structure of medical records |
US6360215B1 (en) | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
JP2000200273A (ja) | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
US6910179B1 (en) | 1998-11-10 | 2005-06-21 | Clarita Corporation | Method and apparatus for automatic form filling |
US6499041B1 (en) | 1998-12-29 | 2002-12-24 | International Business Machines Corporation | Methods, systems and computer program products for copying between templates having associated field designations |
JP2000235574A (ja) * | 1999-02-16 | 2000-08-29 | Ricoh Co Ltd | 文書処理装置 |
US6611802B2 (en) | 1999-06-11 | 2003-08-26 | International Business Machines Corporation | Method and system for proofreading and correcting dictated text |
US20020007285A1 (en) | 1999-06-18 | 2002-01-17 | Rappaport Alain T. | Method, apparatus and system for providing targeted information in relation to laboratory and other medical services |
US6865258B1 (en) | 1999-08-13 | 2005-03-08 | Intervoice Limited Partnership | Method and system for enhanced transcription |
US7278094B1 (en) | 2000-05-03 | 2007-10-02 | R. R. Donnelley & Sons Co. | Variable text processing for an electronic press |
US6434547B1 (en) | 1999-10-28 | 2002-08-13 | Qenm.Com | Data capture and verification system |
US6789060B1 (en) | 1999-11-01 | 2004-09-07 | Gene J. Wolfe | Network based speech transcription that maintains dynamic templates |
US6529902B1 (en) * | 1999-11-08 | 2003-03-04 | International Business Machines Corporation | Method and system for off-line detection of textual topical changes and topic identification via likelihood based methods for improved language modeling |
US7124144B2 (en) | 2000-03-02 | 2006-10-17 | Actuate Corporation | Method and apparatus for storing semi-structured data in a structured manner |
GB2362238A (en) | 2000-05-12 | 2001-11-14 | Applied Psychology Res Ltd | Automatic text classification |
US20020095313A1 (en) | 2000-09-28 | 2002-07-18 | Haq Mohamed M. | Computer system for assisting a physician |
US20020099717A1 (en) | 2001-01-24 | 2002-07-25 | Gordon Bennett | Method for report generation in an on-line transcription system |
US20020103826A1 (en) | 2001-01-29 | 2002-08-01 | Banta Corporation | System and method for creating documents populated with variable data |
US7373600B2 (en) | 2001-03-27 | 2008-05-13 | Koninklijke Philips Electronics N.V. | DICOM to XML generator |
US20020143818A1 (en) | 2001-03-30 | 2002-10-03 | Roberts Elizabeth A. | System for generating a structured document |
US6947936B1 (en) | 2001-04-30 | 2005-09-20 | Hewlett-Packard Development Company, L.P. | Method for a topic hierarchy classification system |
US6920448B2 (en) | 2001-05-09 | 2005-07-19 | Agilent Technologies, Inc. | Domain specific knowledge-based metasearch system and methods of using |
US20020188452A1 (en) | 2001-06-11 | 2002-12-12 | Howes Simon L. | Automatic normal report system |
US20030208382A1 (en) | 2001-07-05 | 2003-11-06 | Westfall Mark D | Electronic medical record system and method |
US20030018668A1 (en) * | 2001-07-20 | 2003-01-23 | International Business Machines Corporation | Enhanced transcoding of structured documents through use of annotation techniques |
US6928425B2 (en) | 2001-08-13 | 2005-08-09 | Xerox Corporation | System for propagating enrichment between documents |
US7031979B2 (en) | 2001-08-31 | 2006-04-18 | Hewlett-Packard Development Company, L.P. | Report generation system and method |
MXPA04003846A (es) | 2001-10-23 | 2004-07-08 | Electronic Data Syst Corp | Sistema y metodo para manejar contratos usando extraccion de texto. |
US20040186817A1 (en) * | 2001-10-31 | 2004-09-23 | Thames Joseph M. | Computer-based structures and methods for generating, maintaining, and modifying a source document and related documentation |
JP2003196296A (ja) * | 2001-12-25 | 2003-07-11 | Celestar Lexico-Sciences Inc | 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 |
US20030154080A1 (en) | 2002-02-14 | 2003-08-14 | Godsey Sandra L. | Method and apparatus for modification of audio input to a data processing system |
US7171615B2 (en) | 2002-03-26 | 2007-01-30 | Aatrix Software, Inc. | Method and apparatus for creating and filing forms |
US7054859B2 (en) | 2002-06-13 | 2006-05-30 | Hewlett-Packard Development Company, L.P. | Apparatus and method for responding to search requests for stored documents |
US6892198B2 (en) | 2002-06-14 | 2005-05-10 | Entopia, Inc. | System and method for personalized information retrieval based on user expertise |
US20040139400A1 (en) | 2002-10-23 | 2004-07-15 | Allam Scott Gerald | Method and apparatus for displaying and viewing information |
US7039625B2 (en) | 2002-11-22 | 2006-05-02 | International Business Machines Corporation | International information search and delivery system providing search results personalized to a particular natural language |
US7444285B2 (en) | 2002-12-06 | 2008-10-28 | 3M Innovative Properties Company | Method and system for sequential insertion of speech recognition results to facilitate deferred transcription services |
US7233938B2 (en) | 2002-12-27 | 2007-06-19 | Dictaphone Corporation | Systems and methods for coding information |
US7426496B2 (en) | 2004-03-03 | 2008-09-16 | Microsoft Corporation | Assisted form filling |
US7958443B2 (en) | 2003-02-28 | 2011-06-07 | Dictaphone Corporation | System and method for structuring speech recognized text into a pre-selected document format |
US20040186746A1 (en) | 2003-03-21 | 2004-09-23 | Angst Wendy P. | System, apparatus and method for storage and transportation of personal health records |
US8290958B2 (en) | 2003-05-30 | 2012-10-16 | Dictaphone Corporation | Method, system, and apparatus for data reuse |
US20040243552A1 (en) | 2003-05-30 | 2004-12-02 | Dictaphone Corporation | Method, system, and apparatus for viewing data |
US20040243545A1 (en) | 2003-05-29 | 2004-12-02 | Dictaphone Corporation | Systems and methods utilizing natural language medical records |
US8095544B2 (en) | 2003-05-30 | 2012-01-10 | Dictaphone Corporation | Method, system, and apparatus for validation |
US20040255239A1 (en) | 2003-06-13 | 2004-12-16 | Ankur Bhatt | Generating electronic reports of data displayed in a computer user interface list view |
US7814093B2 (en) | 2003-07-25 | 2010-10-12 | Microsoft Corporation | Method and system for building a report for execution against a data store |
US7860717B2 (en) | 2003-09-25 | 2010-12-28 | Dictaphone Corporation | System and method for customizing speech recognition input and output |
US20050120300A1 (en) | 2003-09-25 | 2005-06-02 | Dictaphone Corporation | Method, system, and apparatus for assembly, transport and display of clinical data |
US7542909B2 (en) | 2003-09-30 | 2009-06-02 | Dictaphone Corporation | Method, system, and apparatus for repairing audio recordings |
US8024176B2 (en) | 2003-09-30 | 2011-09-20 | Dictaphone Corporation | System, method and apparatus for prediction using minimal affix patterns |
US7996223B2 (en) | 2003-10-01 | 2011-08-09 | Dictaphone Corporation | System and method for post processing speech recognition output |
US7774196B2 (en) | 2003-10-01 | 2010-08-10 | Dictaphone Corporation | System and method for modifying a language model and post-processor information |
US20050144184A1 (en) | 2003-10-01 | 2005-06-30 | Dictaphone Corporation | System and method for document section segmentation |
WO2005050474A2 (en) | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics |
US7315811B2 (en) | 2003-12-31 | 2008-01-01 | Dictaphone Corporation | System and method for accented modification of a language model |
US7430711B2 (en) | 2004-02-17 | 2008-09-30 | Microsoft Corporation | Systems and methods for editing XML documents |
US7783474B2 (en) | 2004-02-27 | 2010-08-24 | Nuance Communications, Inc. | System and method for generating a phrase pronunciation |
US7822598B2 (en) | 2004-02-27 | 2010-10-26 | Dictaphone Corporation | System and method for normalization of a string of words |
US7379946B2 (en) | 2004-03-31 | 2008-05-27 | Dictaphone Corporation | Categorization of information using natural language processing and predefined templates |
US8504369B1 (en) | 2004-06-02 | 2013-08-06 | Nuance Communications, Inc. | Multi-cursor transcription editing |
US7617450B2 (en) | 2004-09-30 | 2009-11-10 | Microsoft Corporation | Method, system, and computer-readable medium for creating, inserting, and reusing document parts in an electronic document |
CA2614233A1 (en) | 2005-07-05 | 2007-01-11 | Dictaphone Corporation | System and method for auto-reuse of document text |
-
2004
- 2004-11-12 WO PCT/IB2004/052405 patent/WO2005050474A2/en active Application Filing
- 2004-11-12 EP EP04799135A patent/EP1687739A2/en not_active Withdrawn
- 2004-11-12 US US10/595,831 patent/US8200487B2/en active Active
- 2004-11-12 JP JP2006540706A patent/JP4808160B2/ja not_active Expired - Fee Related
-
2011
- 2011-05-06 JP JP2011103843A patent/JP2011204249A/ja active Pending
- 2011-08-03 JP JP2011170125A patent/JP5450524B2/ja not_active Expired - Fee Related
- 2011-08-15 US US13/210,214 patent/US8332221B2/en active Active
-
2012
- 2012-09-14 US US13/619,972 patent/US8688448B2/en active Active
-
2013
- 2013-11-08 JP JP2013231893A patent/JP5747066B2/ja not_active Expired - Fee Related
-
2014
- 2014-02-19 US US14/184,440 patent/US9128906B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1687739A2 (en) | 2006-08-09 |
US20120095751A1 (en) | 2012-04-19 |
US8688448B2 (en) | 2014-04-01 |
WO2005050474A3 (en) | 2006-07-13 |
JP4808160B2 (ja) | 2011-11-02 |
US20130066625A1 (en) | 2013-03-14 |
US20080201130A1 (en) | 2008-08-21 |
US8200487B2 (en) | 2012-06-12 |
US8332221B2 (en) | 2012-12-11 |
JP5450524B2 (ja) | 2014-03-26 |
US20140236580A1 (en) | 2014-08-21 |
US9128906B2 (en) | 2015-09-08 |
JP2011204249A (ja) | 2011-10-13 |
JP2007514998A (ja) | 2007-06-07 |
JP2014059896A (ja) | 2014-04-03 |
WO2005050474A2 (en) | 2005-06-02 |
JP2012009046A (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5747066B2 (ja) | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 | |
JP5255769B2 (ja) | テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル | |
US8666742B2 (en) | Automatic detection and application of editing patterns in draft documents | |
EP2179372B1 (en) | Document editing using anchors | |
EP1611569B1 (en) | System for speech recognition and correction, correction device and method for creating a lexicon of alternatives | |
EP1787288B1 (en) | Automated extraction of semantic content and generation of a structured document from speech | |
US20130304453A9 (en) | Automated Extraction of Semantic Content and Generation of a Structured Document from Speech | |
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140722 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5747066 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |