JPH11316760A - 位置指示情報を使用してドキュメントの要約を生成する方法とシステム - Google Patents

位置指示情報を使用してドキュメントの要約を生成する方法とシステム

Info

Publication number
JPH11316760A
JPH11316760A JP11020925A JP2092599A JPH11316760A JP H11316760 A JPH11316760 A JP H11316760A JP 11020925 A JP11020925 A JP 11020925A JP 2092599 A JP2092599 A JP 2092599A JP H11316760 A JPH11316760 A JP H11316760A
Authority
JP
Japan
Prior art keywords
document
indicators
summarizer
summarizing
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11020925A
Other languages
English (en)
Other versions
JP4229507B2 (ja
Inventor
Julian M Kupiec
エム クピーク ジュリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH11316760A publication Critical patent/JPH11316760A/ja
Application granted granted Critical
Publication of JP4229507B2 publication Critical patent/JP4229507B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】従来の技術では、読み手が要約のある部分に特
に興味がある場合、ドキュメント全体のテキストをスキ
ャンして、興味がある要約の部分を探さなければならな
かった。 【解決手段】 ドキュメントからテキスト情報と対応す
る位置情報を抽出し、この抽出したテキストをテキスト
サマライザに提供する(S220)。、そして、テキス
トと位置情報から出力するプリント可能出力ファイルを
生成する(S230)。そして、インジケータが付いた
要約を生成し、ドキュメントテキストのハイライト表示
を行う(S260)。このインジケータは、要約部分を
抽出したドキュメントの中の対応する位置を示す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動的にテキスト
を処理するための方法およびシステムに関する。特に、
本発明はドキュメントの位置指示情報を使用してドキュ
メントの要約を生成する方法およびシステムに関する。
【0002】
【従来の技術】自動的に生成されたドキュメントの要約
は、ドキュメントを調査するために必要な時間を減らす
ことによって、貴重な機能を発揮する。従来の要約は、
要約されたドキュメントの全体的な内容を見事に表示す
る。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
要約では、ドキュメントの内容にアクセスするための手
段は何も提供しない。このため、読み手が要約のある部
分に特に興味がある場合、要約の中の興味のポイントに
対応するドキュメントの部分を捜すために、この読み手
はドキュメント全体のテキストをスキャンすることを強
いられる。要約の部分に相当するドキュメントの部分を
捜すことにおいて、読み手を支援する必要性がある。
【0004】
【課題を解決するための手段】本発明は、インジケータ
を含む要約ページを生成するものであり、このインジケ
ータは、要約されたドキュメントにおいて、要約情報を
抽出した箇所、または、要約情報が最も関係する箇所を
ユーザが発見することを支援する。本発明によって、ユ
ーザは要約からドキュメント内の関係位置へ位置を指示
することができる。本発明は、要約のために抽出された
ドキュメントの位置のハイライト表示も行う。
【0005】本発明は、位置情報および/または位置指
示情報を要約に加えることによって、要約情報を要約し
たドキュメントの内容に結合する。本発明の方法および
システムは、ドキュメントから抽出した内容の位置情報
を保存することによって、またインジケータが付いた要
約を生成することによって、従来の画像またはテキスト
のドキュメント要約システムと共に動作するものであ
り、このインジケータは要約の各部分を抽出したドキュ
メント内の対応する位置を示している。ある実施形態で
は、これらのインジケータはページとライン数を示すと
共に、要約したドキュメントの中に同じインジケータを
持っている。
【0006】本発明は、従来のドキュメントサマライザ
の中に入力するためにドキュメントからファイルを用意
し、自動ドキュメントサマライザからの出力を受け取
り、また出力を調整して出力した要約とドキュメントと
にインジケータを与える。
【0007】本発明のインジケータによって、インジケ
ータが示す情報を使用してドキュメントに直接アクセス
することによって、または、出力されたドキュメント内
の一致するインジケータを捜し当てることによって、ユ
ーザは要約に関連するドキュメントの対応する部分に素
早くアクセスできる。出力されたドキュメント内の抽出
した部分をハイライト表示することによって、この作業
は容易に実行できる。
【0008】本発明は、ある装置とつながれた自動サマ
ライザを使用しており、この装置はは要約材料が置かれ
ている元のドキュメントにおけるページ画像およびペー
ジ位置を識別できる。位置情報は、従来のまたは改良さ
れたテキストまたは画像サマライザによって生成する。
画像要約では、画像一致方法を用いることによって、ペ
ージ番号を発見できる。テキスト要約の場合は、従来の
プリントソフトウェアを改良して、本発明を実行するソ
フトウェアにプリントソフトウェアが割り当てたページ
番号を知らせることができる。
【0009】
【発明の実施の形態】図1は、本発明のドキュメントサ
マライザ10の1つの実施形態によるブロック図を示
す。このドキュメントサマライザ10は、メモリ14お
よびハードドライブ16と通信するプロセサ12を備え
ている。プロセサ12は、入出力インターフェース18
を介して、ペン20,マウス22、キーボード24、デ
ィスプレイ26、光学文字認識システム28、プリンタ
30、およびスキャナ32などの任意の数の従来の入出
力装置とも通信する。ユーザがこの入出力装置20〜3
2を操作して、ドキュメントサマライザ10の動作をコ
ントロールする。プロセサ12は、リンク34を介し
て、外部データ記憶装置38とも通信する。このリンク
34は、割り込み可能接続部36を含む。
【0010】図1に示すように、ドキュメントサマライ
ザ10はプログラムされた汎用コンピュータを使用して
実行することが好ましい。しかしながら、このシステム
は、専用コンピュータ、プログラムされたマイクロプロ
セサまたはマイクロコントローラおよびすべての必要な
周辺集積回路素子、ASICまたは他の集積回路、ディ
スクリート素子の回路などの結線接続の電子論理回路、
プログラム可能論理ディバイスなどを用いて実行するこ
ともでき、このプログラム可能論理ディバイスには、P
LD、PLA、FPGA、またはPALが含まれる。一
般に、有限ステートマシンが図2および図3に示すフロ
ーチャートを実行できるような装置であれば、いかなる
装置でも、ドキュメントサマライザ10を実行するため
に使用できる。
【0011】さらに、図1に示すように、メモリ14は
スタティックRAMまたはダイナミックRAMを用いて
実行することが好ましい。しかしながら、このメモリ1
4は、フロッピーディスクおよびディスクドライブ、書
込み可能な光ディスクおよびディスクドライブ、ハード
ドライブ、フラッシュメモリなどを用いて実行すること
もできる。また、このメモリ14は単一メモリの別個の
部分または物理的に別個のメモリでもよいことは理解さ
れよう。
【0012】さらに、マイクロプロセサ12を外部のデ
ータ記憶装置38と接続しているリンク34は、ネット
ワーク(図示せず)への有線によるリンクまたは無線リ
ンクでもよいことは理解されよう。このネットワーク
は、ローカルエリアネットワーク、広域ネットワーク、
イントラネット、インターネット、または任意の他の分
散処理ネットワークおよびストレージネットワークでも
よい。この場合、以下に概要を説明する方法に基づい
て、ドキュメントサマライザ10が処理をするために、
ドキュメントを外部のデータ記憶装置38からダウンロ
ードできる。
【0013】図2および図3は、本発明の方法の1つの
実施形態による制御ルーチンの概要を示すフローチャー
トである。制御ルーチンはステップS100で始まり、
ドキュメントをドキュメントサマライザ10に入力する
ステップS110に続く。ステップS120で、この制
御ルーチンはドキュメントが要約可能かどうかを決定す
る。ドキュメントが要約可能でない場合、制御ルーチン
はステップS130へと続く。ステップS130におい
て、制御ルーチンは「総称」カバーシートをプリントし
て、ステップS140へ移る。この「総称」カバーシー
トは、いかなるタイプの情報を含んでいてもよく、入力
するドキュメントに関係がないことでもよい。ステップ
S140において、ドキュメントがプリントされ、制御
ルーチンはステップS150へと続く。このステップS
150で制御ルーチンは終了する。
【0014】ステップS120で、制御ルーチンがドキ
ュメントは要約可能であると判断する場合、制御ルーチ
ンはステップS160にジャンプする。ステップS16
0において、制御ルーチンは、ドキュメントが特別な処
理を必要とするかどうか、または、特別な処理が有益で
あるような特別なタイプであるかどうかを決定する。特
別なタイプのドキュメントは、ユーザによって識別され
てもよい。特別なタイプの例には、それぞれが要約フィ
ールドを持つE-mailのメッセージのグループがある。こ
の例については、以下に一層詳細に説明する。
【0015】ドキュメントが特別なフォーマットの場
合、制御ルーチンはステップS170へと続く。しかし
ながら、制御ルーチンがドキュメントは特別なフォーマ
ットでないと決定した場合、制御ルーチンはステップS
180に移動する。ステップS170において、特別処
理に従って制御ルーチンは要約情報を抽出すると共に、
ステップS270へとジャンプする。
【0016】ステップS180では、制御ルーチンはド
キュメントのフォーマットを識別して、ステップS19
0へと続く。ステップS190において、制御ルーチン
はプリント可能ファイルを入力したドキュメントから生
成する。このプリント可能ファイルは、次のステップで
使用するレイアウト情報を生成するために必要である。
制御ルーチンは次にステップS200に進む。このステ
ップでは、制御ルーチンはプリント可能ファイルからテ
キストを抽出して、サマライザが処理するのに適した別
のファイルを作成する。この後、制御ルーチンはステッ
プS210に続く。このステップでは、ステップS19
0で作成されたプリント可能ファイル上の位置情報と、
ステップS200で作成された抽出されたテキストファ
イルについて対応するポインタとを有するレイアウトフ
ァイルを作成する。制御ルーチンは次にステップS22
0に進む。このステップでは、抽出したテキストファイ
ルを分析して、テキストのどの部分を要約の中に含める
かを決める。この制御ルーチンは従来のまたは改良した
テキストサマライザを使用できる。制御ルーチンはこの
後ステップS230に進む。このステップでは、制御ル
ーチンはステップS190で生成したプリント可能ファ
イルの中に要約テキストを連結することによって、プリ
ント可能な出力ファイルを生成する。この要約は、カバ
ーページ内のオリジナルドキュメントの前の出力ファイ
ルの中に置くことが好ましい。制御ルーチンは次にステ
ップS240へと続く。ステップS240において、制
御ルーチンはインジケータを付けることによって出力フ
ァイルを変更する。このインジケータは、オリジナルド
キュメント内の要約の部分の位置を示している。このイ
ンジケータは、抽出したテキストファイルおよびレイア
ウトファイルを参照して作成する。制御ルーチンは次に
ステップS250に続く。このステップで、出力ファイ
ルは変更されて、インジケータをカバーページのマージ
ンに置く。制御ルーチンは次にステップS260へと続
く。
【0017】ステップS260においては、制御ルーチ
ンは別のインジケータを加えて出力ファイルを変更す
る。この別のインジケータは、要約の部分に対応するド
キュメントの部分の隣に位置している。制御ルーチン
は、ステップS260でドキュメントの指示された部分
のハイライト表示も行う。制御ルーチンは次にステップ
S270へ進む。ステップS270において、制御ルー
チンは出力ファイルをプリンタに送り、ドキュメントを
プリントして、その後制御ルーチンが終了するステップ
S280に進む。
【0018】ステップS160において、入力されたド
キュメントが特別な処理を必要とすると判断された場
合、制御ルーチンはステップS170に進む。このステ
ップS170において、制御ルーチンはインジケータが
付いた要約ページを有する出力ファイルを生成する。こ
のインジケータは、入力されたドキュメント内のどこか
ら要約の各部分が生成されたかを示している。この分野
で通常の技術を持つ者は、ステップS180〜S260
は入力されたドキュメントのタイプに基づいて変更され
ることができ、さらに本発明の一部を形成していること
を知るであろうということを、ステップS160および
S170の概念は、明白にする。
【0019】特別な処理が有効な入力ファイルの1つの
例は、それぞれが「題目」フィールドを持ついくつかの
E-mailのメッセージを含むドキュメントである。この制
御ルーチンは、そのようなドキュメントは特別処理を要
求するかまたは特別処理が有効であることを認識してい
る。あるいは、ユーザは、入力したドキュメントが制御
ルーチンに対してユーザインターフェース(図示せず)
を用いる特別な処理を必要とすることを確認できる。こ
の実施形態では、制御ルーチンの処理は、予め定義した
「題目」フィールドがあり、これらの「題目」フィール
ドから要約を生成して、これによりドキュメントにテキ
スト要約処理を実行する必要性をなくするという知識を
利用している。要約には、各「題目」フィールドからの
テキストならびにインジケータが含まれており、このイ
ンジケータは、出力ファイルの中で要約の各部分を発見
できる位置を示している。
【0020】本発明の動作の一例を、図2および図3の
フローチャートを参照しながら以後説明する。この例の
ソースドキュメントは、ポストスクリプトファイルであ
る。ポストスクリプトはアドビシステム社(Adobe Syst
ems, Inc.)のページ記述言語であり、柔軟性のあるフ
ォント能力と高品質のグラフィックスを提供する。ポス
トスクリプトは、英語に似たコマンドを使用して、ペー
ジレイアウトをコントロールすると共に、アウトライン
フォントをロードしたり伸縮したりする。ページ記述言
語は、ページ記述言語による命令を使用して、プリンタ
またはディスプレイ装置に対する出力を記述して、テキ
ストおよびグラフィックスを構成して、これにより必要
なページイメージを作成する。
【0021】ポストスクリプトファイルの処理はステッ
プS100で開始され、ファイルをシステムに入力する
ステップS110に続く。制御ルーチンはステップS1
20に進む。このステップでは、制御ルーチンはドキュ
メントが要約可能であることを決定し、次にステップS
160に続く。このステップで、制御ルーチンはポスト
スクリプトファイルが所定の特別タイプの1つでないこ
とを決定する。
【0022】制御ルーチンはステップS180に移る。
このステップで、入力したドキュメントがポストスクリ
プトであると識別される。制御ルーチンはステップS1
90に移る。このステップで、制御ルーチンはプリント
可能出力ファイルを生成する。この例では、ポストスク
リプトファイルはすでにプリント可能であるので、制御
ルーチンはプリント可能ファイルとして単に入力したド
キュメントのコピーを作るだけである。このため、この
プリント可能ファイルもポストスクリプトファイルであ
る。制御ルーチンは次にステップS200に移る。この
ステップで、制御ルーチンは、改良したポストスクリプ
ト用インタープリタおよびテキスト抽出プログラムを用
いて、プリント可能ファイルからテキストを抽出する。
ステップS200において、このポストスクリプト用イ
ンタープリタはポストスクリプトファイルを分析して、
位置情報を含むASCIIファイルを生成する。本発明
はこのときテキスト抽出プログラムを利用する。このテ
キスト抽出プログラムは、フォントの違いのマップを作
成し、文字の流れを分析し、またワード、ライン、およ
びパラグラフを選び出す。このテキスト抽出プログラム
は、識別され抽出されたテキストに基づいて、位置情報
の記録も行う。制御ルーチンは次にステップS210へ
と続く。ステップS210において、制御ルーチンはレ
イアウトファイルを生成して、ステップS220に移
る。
【0023】ステップS220において、このシステム
は、テキストサマライザを使用してASCIIファイル
を分析して、抽出されたテキストのどの部分を要約の中
に含むかを決定する。制御ルーチンは次に、ポストスク
リプトジェネレータがプリント可能出力ファイルを作成
するステップS230に移る。ステップS230におい
て、ステップS220からの要約されたテキストとステ
ップS210で作成されたレイアウトファイルからの要
約されたテキストに相当する位置情報とを用いて、出力
ファイルを作成する。制御ルーチンは次にステップS2
40に移る。ステップS240において、制御ルーチン
は、インジケータを要約に加える命令を用いて、出力す
るポストスクリプトファイルを変更する。制御ルーチン
は次にステップS250へと続く。ステップS250に
おいて、インジケータをカバーページのマージンに加え
る命令を、出力するポストスクリプトファイルに追加す
る。制御ルーチンは次にステップS260に進む。
【0024】ステップS260において、制御ルーチン
は出力するポストスクリプトファイルを変更して、要約
の部分に相当するドキュメントの部分をハイライト表示
する。制御ルーチンは次にステップS270に移る。こ
のステップでは、制御ルーチンは出力するポストスクリ
プトファイルをプリンタに送り、その後制御ルーチンが
終了するステップS280へと続く。
【0025】本発明をポストスクリプトファイルおよび
ASCIIファイルと関連してこれまで説明してきた
が、本発明は、例えばすべてのタイプのグラフィック、
オーデオ、およびビデオのドキュメントフォーマットを
含むすべてのタイプのドキュメントフォーマットに関連
して使用できることは理解されよう。
【0026】ステップS210、S220、およびS2
40はすべてオプションであり、またインジケータは所
望する出力のスタイルに適当などのようなフォームも作
ることができることは理解されよう。このインジケータ
は、位置情報を提供することによって、またはドキュメ
ント内の別のインジケータと一致するインジケータとし
て、ドキュメントの内容を参照する必要があるだけであ
る。
【0027】そのうえ、上述しまた図2および図3で説
明した制御ルーチンの実施形態では、単一の出力ファイ
ルが生成されるが、通常の技術を持つ者は、例えば、要
約が付いたカバーページのみを持つ第1の出力ファイル
とドキュメントのみを持つ第2の出力ファイルというよ
うに、この制御ルーチンは任意の数の出力ファイルを生
成できることは理解できる。
【0028】典型的なドキュメントサマライザは、要約
したドキュメント内でセンテンスが表示されるのと同じ
順序で、要約の中でセンテンスを表示する。しかしなが
ら、これらのセンテンスは、関連するドキュメントの中
で表示される場合と要約の中では、同じ順序ではなくて
もよい。この場合、要約がセンテンスを表示する順序
で、または、センテンスが関連するドキュメントの中で
表示される順序で、インジケータを要約の中で表示して
もよい。センテンスが関連するドキュメント内で表示さ
れる順序でインジケータを要約ページ上で表示する場
合、インジケータから要約の各対応する部分までリーダ
を設けることができる。
【0029】要約したドキュメントの出力は、要約した
ドキュメントのどの部分がインジケータに対応するかを
たやすく表示するインジケータの位置決めを容易に行う
ことはできない。このため、要約したドキュメント内の
インジケータから、要約のために抽出した要約したドキ
ュメントの部分までに、リーダを加えることもできる。
【0030】インジケータは、要約ページのマージンの
縦方向の位置に置くことができる。この縦方向の位置
は、要約したドキュメントの対応する部分の縦方向の位
置に一致している。このような構成にすることによっ
て、ユーザがドキュメントをパラパラめくるとき、要約
したドキュメントの中でインジケータを発見することが
一層容易になる。縦方向の位置が要約シートのインジケ
ータの縦方向の位置と一致しない場合、要約したドキュ
メント内のインジケータを極めて素早く取り除くことが
できる。他方、要約シート内の対応するインジケータの
縦方向の位置と一致する縦方向の位置を持つインジケー
タは、2つのインジケータ間が一致していることをドキ
ュメントのユーザに素早く示すことができる。
【0031】さらに、本発明はキーワードのリストにつ
いてのインジケータも提供する。従来のドキュメントの
カタログ作成システムは、迅速に捜査してキーワードに
関連するドキュメントを捜し当てることができるキーワ
ードのリストを生成する。本発明は、要約したドキュメ
ント内のキーワードの位置を示すために、キーワードの
隣にインジケータを提供するキーワードリスト発生シス
テムを用いれば有益である。
【0032】インジケータは、ドキュメント要約の部分
でバックグラウンドカラーまたはフォントカラーの形態
を取ることもできる。この場合、要約したドキュメント
内の一致するインジケータは、要約の対応する部分と一
致するバックグラウンドまたはフォントのカラーを用い
てハイライト表示される。また、インジケータは、コン
トラスト、輝度、明るさ、フラッシング、スクローリン
グ、モーション、ボリューム、反射、トーンおよびバラ
ンス等を用いて、ハイライト表示してもよい。このイン
ジケータは、ボールドまたはイタリックなどの文字属性
の形態を取ることもできる。この場合、例えば、要約の
部分をボールドで、他の部分はイタリックで表示でき
る。また、このインジケータは、大文字、アンダーライ
ン、文字サイズ、フォントなどの文字属性の形態をとっ
てもよい。ソーステキストは対応する文字属性を持つの
で、オリジナルのドキュメントに一致していることを表
示できる。インジケータが、インジケータ間を区別で
き、また要約の各部分が下線が付いたオリジナルドキュ
メント内のソースに一致していることを示すいかなる形
態も取ることができることは理解されよう。
【0033】図4は、本発明によるプロセサ12の1つ
の実施形態のブロック図を示す。このプロセサ12は、
汎用コンピュータ50を用いて実行することが好まし
い。汎用コンピュータ50は、コントローラ52、メモ
リ54、ドキュメントタイプ識別器56、ドキュメント
インタープリタ58、テキスト抽出器60、ドキュメン
トサマライザ62、出力フォーマッタ64、およびバス
66を含む。この汎用コンピュータ50の構成要素は、
バス66によって相互接続されている。ドキュメントタ
イプ識別器56、ドキュメントインタープリタ58、テ
キスト抽出器60、ドキュメントサマライザ62、およ
び出力フォーマッタ64は、図2および図3のフローチ
ャートを実行するために使用する。ドキュメントタイプ
識別器56、ドキュメントインタープリタ58、テキス
ト抽出器60、ドキュメントサマライザ62、および出
力フォーマッタ64は、コントローラ52上で動作しメ
モリ54に記憶されるソフトウェアルーチンとして実行
することが好ましいことは理解されよう。これらの構成
要素を具体化するには他の多くの方法があることは、当
業者には明白であることも理解されよう。
【0034】「ドキュメント」という用語は、テキス
ト、オーデオ、ビデオ、または情報記憶ファイルと結合
したすべての他の情報記憶ファイルを含むことを意図し
ていることは理解されよう。さらに、「テキスト」とい
う用語は、テキスト、ディジタルインク、オーデオ、オ
ーデオバー、ビデオ、またはドキュメントの構造を含む
すべての他のドキュメントの内容を含むことを意図して
いることは理解されよう。また、「ディスプレイ」とい
う用語はドキュメント内のテキストのタイプに適当なす
べてのタイプの表示装置を含むことを意図していること
も理解されよう。さらに、「部分」という用語は、例え
ば、ワード、センテンス、フレーズ、パラグラフ、セク
ション、ページ、およびドキュメントのすべての他の区
別可能な部分などのドキュメントのすべての分割可能な
構造を含むことを意図していることは理解されよう。構
造上の情報は、ドキュメントの分割可能な部分を示す。
【0035】図5は、本発明の1つの実施形態の出力さ
れたサンプルを示す。図6は、要約されたソースドキュ
メント70を示す。
【0036】要約シート72は、ヘッダ74および要約
部76を含む。この要約シート72は、ドキュメントの
抽出した部分80の隣にある要約したドキュメントのタ
イトル78も含んでおり、この抽出した部分はドキュメ
ントの全体的な内容を反映している。要約部76は抽出
した部分82およびキーワード88のリストを含んでお
り、この抽出した部分82は要約したドキュメント70
の部分の内容を反映している。インジケータ84は、対
応する抽出した部分82の隣に配置されている。これら
のインジケータ84は、要約シート72のマージンに配
置した対応するタブ86を有する。このタブ86は、要
約したドキュメント70内のインジケータ84に対応す
る抽出した部分の縦方向の位置を示す。この例では、要
約したドキュメントは、要約シートのインジケータ84
およびタブ86に対応するインジケータまたはタブを付
けて出力されていない。本発明の別の実施形態では、イ
ンジケータおよびタブを要約したドキュメント70の出
力の中に提供できることは理解されよう。
【0037】以上の説明および記述は、全体的に位置お
よび場所の情報を引き合いに出してきたが、インジケー
タが位置情報を含むという事実の結果として、本発明の
インジケータは有益なナビゲーション情報を含むことは
理解されよう。従って、このインジケータはナビゲーシ
ョン情報を含んでおり、このナビゲーション情報は、ユ
ーザがドキュメントをナビゲートして要約の特定の部分
が由来するドキュメント内の位置を求めるために有益で
ある。
【0038】本発明を上記した特定の実施形態を用いて
説明してきたが、多くの代替え例、修正例、および変更
例は当業者には明白である。従って、上述した好適な実
施形態は例証するものであって、限定するものではな
い。
【図面の簡単な説明】
【図1】 本発明のドキュメントサマライザの1つの実
施形態によるブロック図である。
【図2】 本発明の1つの実施形態による制御ルーチン
の概要の前半部分を示すフローチャートである。
【図3】 本発明の1つの実施形態による制御ルーチン
の概要の後半部分を示すフローチャートである。
【図4】 本発明のプロセサの1つの実施形態を示すブ
ロック図である。
【図5】 本発明の1つの実施形態が生成したサンプル
を示す図である。
【図6】 図5の要約を生成するために分析したソース
ドキュメントを示す図である。
【符号の説明】
10,62 ドキュメントサマライザ、12 プロセ
サ、18 I/Oインターフェース、26 ディスプレ
イ、58 ドキュメントインタープリタ、60テキスト
抽出器、64 出力フォーマッタ、70 要約したドキ
ュメント、72要約シート、74 ヘッダ、76 要約
部、78 タイトル、80 ドキュメントの抽出した部
分、82 抽出した部分、84 インジケータ、86
タブ、88 キーワード。

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 ドキュメントを要約する方法であって、 ドキュメントから対応する位置情報とともにテキストを
    抽出するステップと、 前記ドキュメントの内容を反映する前記抽出されたテキ
    ストの部分を識別するステップと、 前記識別された部分および前記ドキュメント内の前記対
    応する抽出されたテキストの位置を示す第1のインジケ
    ータのセットを含むプレゼンテーションファイルを生成
    するステップと、 前記プレゼンテーションファイルを表示するステップ
    と、を備えることを特徴とするドキュメントを要約する
    方法。
  2. 【請求項2】 請求項1に記載のドキュメントを要約す
    る方法であって、前記位置情報がページおよびライン数
    から成ることを特徴とするドキュメントを要約する方
    法。
  3. 【請求項3】 請求項1に記載のドキュメントを要約す
    る方法であって、前記位置情報が構造的情報から成るこ
    とを特徴とするドキュメントを要約する方法。
  4. 【請求項4】 請求項3に記載のドキュメントを要約す
    る方法であって、前記構造的情報がボリューム番号、セ
    クション番号、章番号、パラグラフ番号、センテンス番
    号、フレーズ番号、およびワード番号のうち1つから成
    ることを特徴とするドキュメントを要約する方法。
  5. 【請求項5】 請求項1に記載のドキュメントを要約す
    る方法であって、前記位置情報がレイアウト情報から成
    ることを特徴とする方法。
  6. 【請求項6】 請求項1に記載のドキュメントを要約す
    る方法であって、前記位置情報が縦方向および横方向の
    位置情報から成ることを特徴とする方法。
  7. 【請求項7】 請求項1に記載のドキュメントを要約す
    る方法であって、前記ドキュメントを所定のタイプであ
    ると識別するステップをさらに備えると共に、前記抽出
    するステップと前記識別するステップとがこの所定のタ
    イプに対応することを特徴とするドキュメントを要約す
    る方法。
  8. 【請求項8】 請求項7に記載のドキュメントを要約す
    る方法であって、前記ドキュメントがユーザの入力によ
    って所定のタイプであると識別されることを特徴とする
    方法。
  9. 【請求項9】 請求項1に記載のドキュメントを要約す
    る方法であって、前記生成するステップが前記第1のイ
    ンジケータのセットを前記要約上の対応する識別された
    部分の隣に配置するステップを含むことを特徴とする方
    法。
  10. 【請求項10】 請求項9に記載のドキュメントを要約
    する方法であって、前記生成するステップが、第2のイ
    ンジケータのセットを、前記ドキュメントの前記対応す
    る抽出されたテキスト部分の縦方向の位置に対応する縦
    方向の位置の要約ページのマージン上に配置するステッ
    プをさらに含み、前記インジケータの第2のセットが前
    記インジケータの第1のセットに対応することを特徴と
    するドキュメントを要約する方法。
  11. 【請求項11】 請求項10に記載のドキュメントを要
    約する方法であって、前記生成するステップが前記第1
    のインジケータのセットの各々から対応する前記第2の
    インジケータのセットに対してリーダを生成するステッ
    プをさらに含むことを特徴とするドキュメントを要約す
    る方法。
  12. 【請求項12】 請求項1に記載のドキュメントを要約
    する方法であって、生成するステップが、 前記第1のインジケータのセットに対応する第2のイン
    ジケータのセットを生成するステップと、 この第2のインジケータのセットを、前記対応する抽出
    されたテキストの隣の前記ドキュメントの前記レイアウ
    トの中に配置するステップと、を含むことを特徴とする
    ドキュメントを要約する方法。
  13. 【請求項13】 請求項12に記載のドキュメントを要
    約する方法であって、前記第1のインジケータのセット
    が、表示属性での要約の各対応する部分の表示を含み、
    この表示属性が、同じ対応する表示属性での前記ドキュ
    メントの前記対応する抽出されたテキストの表示を含む
    前記第2のインジケータのセットに対応することを特徴
    とするドキュメントを要約する方法。
  14. 【請求項14】 請求項13に記載のドキュメントを要
    約する方法であって、前記表示属性がボールド、イタリ
    ック、大文字、アンダーライン、文字サイズ、フォン
    ト、フォントのカラー、バックグラウンドのカラー、コ
    ントラスト、輝度、明るさ、フラッシング、スクローリ
    ング、モーション、ボリューム、反射、トーンおよびバ
    ランスのうちの1つであることを特徴とするドキュメン
    トを要約する方法。
  15. 【請求項15】 プロセサであって、 ドキュメントからテキストならびに対応する抽出された
    テキストの位置情報を抽出するテキスト抽出器と、 前記ドキュメントの内容を反映する前記抽出されたテキ
    ストの部分を識別するドキュメントサマライザと、 前記識別された部分と、前記ドキュメント内の前記対応
    する抽出されたテキストの位置を示す第1のインジケー
    タのセットとを含む表示ファイルのレイアウトをフォー
    マットする表示ファイルフォーマッタと、 を備えるプロセサと、 前記表示ファイルを表示するプレゼンテーションシステ
    ムと、を備えることを特徴とする自動ドキュメントサマ
    ライザ。
  16. 【請求項16】 請求項15に記載の自動ドキュメント
    サマライザであって、前記位置情報がページとライン数
    とから成ることを特徴とするサマライザ。
  17. 【請求項17】 請求項15に記載の自動ドキュメント
    サマライザであって、前記位置情報が構造的情報から成
    ることを特徴とする自動ドキュメントサマライザ。
  18. 【請求項18】 請求項17に記載の自動ドキュメント
    サマライザであって、前記構造的情報がボリューム番
    号、セクション番号、章番号、パラグラフ番号、センテ
    ンス番号、フレーズ番号、およびワード番号のうち1つ
    を含むことを特徴とする自動ドキュメントサマライザ。
  19. 【請求項19】 請求項15に記載の自動ドキュメント
    サマライザであって、前記位置情報がレイアウト情報か
    ら成ることを特徴とするサマライザ。
  20. 【請求項20】 請求項15に記載の自動ドキュメント
    サマライザであって、前記位置情報が縦方向および横方
    向の位置情報から成ることを特徴とする自動ドキュメン
    トサマライザ。
  21. 【請求項21】 請求項15に記載の自動ドキュメント
    サマライザであって、 前記プロセサが、前記ドキュメ
    ントを所定のタイプであると識別するドキュメントタイ
    プ識別器をさらに含み、 前記テキスト抽出器が前記識別された所定のタイプに対
    応する方法を用いて前記テキストを抽出し、前記ドキュ
    メントサマライザが前記識別された所定のタイプに対応
    する方法を用いて部分を識別することを特徴とする自動
    ドキュメントサマライザ。
  22. 【請求項22】 請求項21に記載の自動ドキュメント
    サマライザであって、前記ドキュメントタイプ識別器が
    タイプ識別ユーザインターフェースを含むことを特徴と
    する自動ドキュメントサマライザ。
  23. 【請求項23】 請求項15に記載の自動ドキュメント
    サマライザであって、前記表示ファイルフォーマッタが
    前記第1のインジケータのセットを前記レイアウトの中
    の前記対応する識別された部分の隣に配置することを特
    徴とする自動ドキュメントサマライザ。
  24. 【請求項24】 請求項23に記載の自動ドキュメント
    サマライザであって、前記表示ファイルフォーマッタ
    が、さらに第2のインジケータのセットを前記ドキュメ
    ントの前記対応する抽出されたテキスト部分の縦方向の
    位置に対応する縦方向の位置の要約ページのマージンの
    中に配置すると共に、前記第2のインジケータのセット
    が前記第1のインジケータのセットに対応することを特
    徴とする自動ドキュメントサマライザ。
  25. 【請求項25】 請求項24に記載の自動ドキュメント
    サマライザであって、前記表示ファイルフォーマッタ
    が、さらに前記各々の第1のインジケータのセットから
    対応する前記第2のインジケータのセットにリーダを生
    成することを特徴とする自動ドキュメントサマライザ。
  26. 【請求項26】 請求項15に記載の自動ドキュメント
    サマライザであって、前記表示ファイルフォーマッタが
    前記第1のインジケータのセットに対応する第2のイン
    ジケータのセットを生成し、この第2のインジケータの
    セットを前記対応する抽出されたテキストに隣接するド
    キュメントのレイアウトの中に配置することを特徴とす
    る自動ドキュメントサマライザ。
  27. 【請求項27】 請求項26に記載の自動ドキュメント
    サマライザであって、前記第1のインジケータのセット
    が、表示属性での要約の各対応する部分の表示を含み、
    この表示属性が、同じ対応する表示属性の中での前記ド
    キュメントの前記対応する抽出されたテキストの表示を
    含む前記第2のインジケータのセットに対応することを
    特徴とする自動ドキュメントサマライザ。
  28. 【請求項28】 請求項27に記載の自動ドキュメント
    サマライザであって、表示属性がボールド、イタリッ
    ク、大文字、アンダーライン、文字サイズ、フォント、
    フォントのカラー、バックグラウンドのカラー、コント
    ラスト、輝度、明るさ、フラッシング、スクローリン
    グ、モーション、ボリューム、反射、トーンおよびバラ
    ンスのうちの1つであることを特徴とする自動ドキュメ
    ントサマライザ。
JP02092599A 1998-01-30 1999-01-29 位置指示情報を使用してドキュメントの要約を生成する方法とシステム Expired - Fee Related JP4229507B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/016,224 US6533822B2 (en) 1998-01-30 1998-01-30 Creating summaries along with indicators, and automatically positioned tabs
US09/016,224 1998-01-30

Publications (2)

Publication Number Publication Date
JPH11316760A true JPH11316760A (ja) 1999-11-16
JP4229507B2 JP4229507B2 (ja) 2009-02-25

Family

ID=21776009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02092599A Expired - Fee Related JP4229507B2 (ja) 1998-01-30 1999-01-29 位置指示情報を使用してドキュメントの要約を生成する方法とシステム

Country Status (3)

Country Link
US (1) US6533822B2 (ja)
EP (1) EP0933712A3 (ja)
JP (1) JP4229507B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6861364B1 (en) 1999-11-30 2005-03-01 Canon Kabushiki Kaisha Laser etching method and apparatus therefor

Families Citing this family (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000067162A1 (en) * 1999-05-05 2000-11-09 West Publishing Company Document-classification system, method and software
US7038797B1 (en) * 1999-05-25 2006-05-02 Silverbrook Research Pty Ltd Method and system for delivery of mail
US7509572B1 (en) 1999-07-16 2009-03-24 Oracle International Corporation Automatic generation of document summaries through use of structured text
US7475334B1 (en) * 2000-01-19 2009-01-06 Alcatel-Lucent Usa Inc. Method and system for abstracting electronic documents
US6820237B1 (en) 2000-01-21 2004-11-16 Amikanow! Corporation Apparatus and method for context-based highlighting of an electronic document
US7114124B2 (en) * 2000-02-28 2006-09-26 Xerox Corporation Method and system for information retrieval from query evaluations of very large full-text databases
US7035788B1 (en) * 2000-04-25 2006-04-25 Microsoft Corporation Language model sharing
AU2001261505A1 (en) 2000-05-11 2001-11-20 University Of Southern California Machine translation techniques
GB2362972A (en) * 2000-06-02 2001-12-05 Res Summary Com An internet based searchable database for up to date financial executive summaries with links to full documents
US7167901B1 (en) * 2000-10-26 2007-01-23 International Business Machines Corporation Method and apparatus for improved bookmark and histories entry creation and access
US7047491B2 (en) * 2000-12-05 2006-05-16 Schubert Daniel M Electronic information management system for abstracting and reporting document information
US10114821B2 (en) * 2000-12-27 2018-10-30 Tractmanager, Inc. Method and system to access to electronic business documents
US20070283288A1 (en) 2000-12-27 2007-12-06 Tractmanager, Inc. Document management system having bookmarking functionality
CA2332102A1 (en) * 2001-01-23 2002-07-23 Ibm Canada Limited-Ibm Canada Limitee Method, apparatus, media and signals for simplifying a program listing
US7178099B2 (en) * 2001-01-23 2007-02-13 Inxight Software, Inc. Meta-content analysis and annotation of email and other electronic documents
US7861161B1 (en) 2001-06-19 2010-12-28 Microstrategy, Inc. Report system and method using prompt objects
US7356758B1 (en) 2001-06-19 2008-04-08 Microstrategy Incorporated System and method for run-time report resolution of reports that include prompt objects
US7302639B1 (en) * 2001-06-19 2007-11-27 Microstrategy, Inc. Report system and method using prompt in prompt objects
US7925616B2 (en) 2001-06-19 2011-04-12 Microstrategy, Incorporated Report system and method using context-sensitive prompt objects
WO2003005166A2 (en) 2001-07-03 2003-01-16 University Of Southern California A syntax-based statistical translation model
US7712028B2 (en) * 2001-10-19 2010-05-04 Xerox Corporation Using annotations for summarizing a document image and itemizing the summary based on similar annotations
US7849147B2 (en) * 2001-11-27 2010-12-07 International Business Machines Corporation Method and apparatus for summarization of threads in electronic mail
US20030101065A1 (en) * 2001-11-27 2003-05-29 International Business Machines Corporation Method and apparatus for maintaining conversation threads in electronic mail
US7392280B2 (en) * 2001-11-27 2008-06-24 International Business Machines Corporation Method for summarization of threads in electronic mail
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
JP2003316530A (ja) * 2002-04-22 2003-11-07 Konica Minolta Holdings Inc 印刷サーバ装置およびネットワーク印刷システム
US8078505B2 (en) 2002-06-10 2011-12-13 Ebay Inc. Method and system for automatically updating a seller application utilized in a network-based transaction facility
GB2390704A (en) * 2002-07-09 2004-01-14 Canon Kk Automatic summary generation and display
EP1573562A4 (en) * 2002-10-31 2007-12-19 Arizan Corp METHOD AND DEVICES FOR SUMMARY OF DOCUMENT CONTENT FOR MOBILE COMMUNICATION DEVICES
US7711545B2 (en) 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US20050146750A1 (en) * 2003-12-24 2005-07-07 Moroney Brian W. Apparatus, system, and method for printing on variable form media
US7315988B2 (en) * 2004-02-02 2008-01-01 International Business Machines Corporation System and method for using short captions to map user interfaces
US7516414B2 (en) 2004-02-02 2009-04-07 International Business Machines Corporation System and method for tab order mapping of user interfaces
US20050172235A1 (en) * 2004-02-02 2005-08-04 International Business Machines Corporation System and method for excluded elements mapping in a user interface
US20050177399A1 (en) * 2004-02-05 2005-08-11 Park Ben H. System and method for generating documentation from flow chart navigation
WO2005089340A2 (en) 2004-03-15 2005-09-29 University Of Southern California Training tree transducers
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US7716597B2 (en) * 2004-03-31 2010-05-11 International Business Machines Corporation Dynamic materialization of disappearing entities
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE202005022113U1 (de) 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US7685136B2 (en) * 2005-01-12 2010-03-23 International Business Machines Corporation Method, system and program product for managing document summary information
EP1686454B1 (en) 2005-01-28 2018-12-26 Kyocera Corporation Display apparatus
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US20060291003A1 (en) * 2005-06-23 2006-12-28 Xerox Corporation Tabbed document copying systems and methods
US8316291B1 (en) * 2005-07-28 2012-11-20 Adobe Systems Incorporated Packaging an electronic document and/or a method of displaying the package
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
CN100444096C (zh) * 2005-12-20 2008-12-17 国际商业机器公司 用于进行内容导航的系统和方法
US8509563B2 (en) * 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US20080000145A1 (en) * 2006-06-18 2008-01-03 Marc Weinberger Animal trap remover
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US7945627B1 (en) * 2006-09-28 2011-05-17 Bitdefender IPR Management Ltd. Layout-based electronic communication filtering systems and methods
US7689928B1 (en) * 2006-09-29 2010-03-30 Adobe Systems Inc. Methods and apparatus for placing and interpreting reference marks on scrollbars
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8572184B1 (en) 2007-10-04 2013-10-29 Bitdefender IPR Management Ltd. Systems and methods for dynamically integrating heterogeneous anti-spam filters
US8010614B1 (en) 2007-11-01 2011-08-30 Bitdefender IPR Management Ltd. Systems and methods for generating signatures for electronic communication classification
US20090144277A1 (en) * 2007-12-03 2009-06-04 Microsoft Corporation Electronic table of contents entry classification and labeling scheme
US8250469B2 (en) * 2007-12-03 2012-08-21 Microsoft Corporation Document layout extraction
US8392816B2 (en) * 2007-12-03 2013-03-05 Microsoft Corporation Page classifier engine
US8695100B1 (en) 2007-12-31 2014-04-08 Bitdefender IPR Management Ltd. Systems and methods for electronic fraud prevention
US20100070863A1 (en) * 2008-09-16 2010-03-18 International Business Machines Corporation method for reading a screen
US8170966B1 (en) 2008-11-04 2012-05-01 Bitdefender IPR Management Ltd. Dynamic streaming message clustering for rapid spam-wave detection
US20100235314A1 (en) * 2009-02-12 2010-09-16 Decisive Analytics Corporation Method and apparatus for analyzing and interrelating video data
US8458105B2 (en) * 2009-02-12 2013-06-04 Decisive Analytics Corporation Method and apparatus for analyzing and interrelating data
US20100240019A1 (en) * 2009-03-17 2010-09-23 Sathy Kumar R Instructional aids and methods
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9864501B2 (en) * 2010-07-30 2018-01-09 Apaar Tuli Displaying information
US9576276B2 (en) * 2010-11-29 2017-02-21 International Business Machines Corporation Context-informed summarization of communications
US9165285B2 (en) 2010-12-08 2015-10-20 Microsoft Technology Licensing, Llc Shared attachments
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US10552799B2 (en) 2011-04-28 2020-02-04 Microsoft Technology Licensing, Llc Upload of attachment and insertion of link into electronic messages
US8682989B2 (en) 2011-04-28 2014-03-25 Microsoft Corporation Making document changes by replying to electronic messages
US9137185B2 (en) 2011-04-28 2015-09-15 Microsoft Technology Licensing, Llc Uploading attachment to shared location and replacing with a link
US11308449B2 (en) 2011-04-28 2022-04-19 Microsoft Technology Licensing, Llc Storing metadata inside file to reference shared version of file
US8965983B2 (en) * 2011-05-06 2015-02-24 Microsoft Technology Licensing, Llc Changes to documents are automatically summarized in electronic messages
US10185932B2 (en) 2011-05-06 2019-01-22 Microsoft Technology Licensing, Llc Setting permissions for links forwarded in electronic messages
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
CN103874994B (zh) * 2011-10-14 2017-09-08 雅虎控股公司 用于自动概括电子文档的内容的方法和装置
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US20140032574A1 (en) * 2012-07-23 2014-01-30 Emdadur R. Khan Natural language understanding using brain-like approach: semantic engine using brain-like approach (sebla) derives semantics of words and sentences
CN103593344B (zh) * 2012-08-13 2016-09-21 北大方正集团有限公司 一种信息采集方法和装置
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US20170300748A1 (en) * 2015-04-02 2017-10-19 Scripthop Llc Screenplay content analysis engine and method
US10318559B2 (en) * 2015-12-02 2019-06-11 International Business Machines Corporation Generation of graphical maps based on text content
US9858248B2 (en) 2016-03-29 2018-01-02 International Business Machines Corporation Hotspot navigation within documents
EP3255556A1 (de) * 2016-06-10 2017-12-13 Renato Casutt Schnell-lese-verfahren und -system für text
US11481550B2 (en) 2016-11-10 2022-10-25 Google Llc Generating presentation slides with distilled content
US10936648B2 (en) 2017-12-12 2021-03-02 Google Llc Generating slide presentations using a collaborative multi-content application
JP7095376B2 (ja) * 2018-04-17 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JPH0418673A (ja) * 1990-05-11 1992-01-22 Hitachi Ltd テキスト情報抽出方法および装置
US5339391A (en) * 1990-05-14 1994-08-16 Microelectronics And Computer Technology Corporation Computer display unit with attribute enhanced scroll bar
US5367623A (en) * 1990-09-25 1994-11-22 Sharp Kabushiki Kaisha Information processing apparatus capable of opening two or more windows on screen, one window containing a page and other windows containing supplemental information
US5297249A (en) * 1990-10-31 1994-03-22 International Business Machines Corporation Hypermedia link marker abstract and search services
US5204947A (en) * 1990-10-31 1993-04-20 International Business Machines Corporation Application independent (open) hypermedia enablement services
CA2077274C (en) * 1991-11-19 1997-07-15 M. Margaret Withgott Method and apparatus for summarizing a document without document image decoding
US5638543A (en) * 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
US5384703A (en) * 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
US5623679A (en) 1993-11-19 1997-04-22 Waverley Holdings, Inc. System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects
US5696963A (en) 1993-11-19 1997-12-09 Waverley Holdings, Inc. System, method and computer program product for searching through an individual document and a group of documents
US5806079A (en) * 1993-11-19 1998-09-08 Smartpatents, Inc. System, method, and computer program product for using intelligent notes to organize, link, and manipulate disparate data objects
US5506951A (en) * 1994-03-01 1996-04-09 Ishikawa; Hiroshi Scroll bar with jump tags
JP3647518B2 (ja) 1994-10-06 2005-05-11 ゼロックス コーポレイション コード化したワードトークンを使用して文書画像をハイライトで強調する装置
JP3700733B2 (ja) * 1995-06-12 2005-09-28 富士ゼロックス株式会社 文書管理装置及び文書管理方法
US5918240A (en) * 1995-06-28 1999-06-29 Xerox Corporation Automatic method of extracting summarization using feature probabilities
US5778397A (en) * 1995-06-28 1998-07-07 Xerox Corporation Automatic method of generating feature probabilities for automatic extracting summarization
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5867164A (en) * 1995-09-29 1999-02-02 Apple Computer, Inc. Interactive document summarization
JP3160201B2 (ja) * 1996-03-25 2001-04-25 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法、情報検索装置
US5924108A (en) * 1996-03-29 1999-07-13 Microsoft Corporation Document summarizer for word processors
US5794233A (en) 1996-04-09 1998-08-11 Rubinstein; Seymour I. Browse by prompted keyword phrases
US5721897A (en) * 1996-04-09 1998-02-24 Rubinstein; Seymour I. Browse by prompted keyword phrases with an improved user interface
US6064384A (en) * 1996-08-26 2000-05-16 E-Brook Systems Pte Ltd Computer user interface system and method having book image features
US6091930A (en) * 1997-03-04 2000-07-18 Case Western Reserve University Customizable interactive textbook
US6237011B1 (en) * 1997-10-08 2001-05-22 Caere Corporation Computer-based document management system
US6029165A (en) * 1997-11-12 2000-02-22 Arthur Andersen Llp Search and retrieval information system and method
US5975580A (en) * 1997-12-22 1999-11-02 Insalaco; Anthony Process management system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6861364B1 (en) 1999-11-30 2005-03-01 Canon Kabushiki Kaisha Laser etching method and apparatus therefor
US7169709B2 (en) 1999-11-30 2007-01-30 Canon Kabushiki Kaisha Laser etching method and apparatus therefor
US7674395B2 (en) 1999-11-30 2010-03-09 Canon Kabushiki Kaisha Laser etching method and apparatus therefor

Also Published As

Publication number Publication date
JP4229507B2 (ja) 2009-02-25
EP0933712A3 (en) 2001-01-17
US6533822B2 (en) 2003-03-18
US20020010719A1 (en) 2002-01-24
EP0933712A2 (en) 1999-08-04

Similar Documents

Publication Publication Date Title
JP4229507B2 (ja) 位置指示情報を使用してドキュメントの要約を生成する方法とシステム
JPH077410B2 (ja) 文書レイアウト方法
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JPH06259420A (ja) 文章編集支援装置
JPH076168A (ja) Dbcsコード・ページを使ってsbcsフォント及びdbcsフォントを与える構造化された文書を編集する方法
JP2763227B2 (ja) 書式決定方法
US5640581A (en) CD-ROM information editing apparatus
JPH0883280A (ja) 文書処理装置
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2928515B2 (ja) 訳語出力装置
JPH10207875A (ja) 表作成装置およびその方法
JP3206600B2 (ja) 文書生成装置
JPH11272666A (ja) 文書編集システム、方法、及び記録媒体
JPH07141366A (ja) 文書作成装置及び注釈付き文書作成方法
JP3537260B2 (ja) リンク付文書検索表示システム
JP3692711B2 (ja) 機械翻訳装置
JP2005309533A (ja) 文書編集装置、文書視覚方法法およびそのプログラム
JP3699511B2 (ja) 文書処理方法及び装置
JPH11184854A (ja) 電子辞書
JPH0778800B2 (ja) 文書処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP3893709B2 (ja) 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体
JPH10340262A (ja) ドキュメント作成支援装置
JPH07182344A (ja) 機械翻訳装置
JPH09167157A (ja) 編集装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060123

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080603

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees