JP4630480B2 - 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム - Google Patents
要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム Download PDFInfo
- Publication number
- JP4630480B2 JP4630480B2 JP2001079349A JP2001079349A JP4630480B2 JP 4630480 B2 JP4630480 B2 JP 4630480B2 JP 2001079349 A JP2001079349 A JP 2001079349A JP 2001079349 A JP2001079349 A JP 2001079349A JP 4630480 B2 JP4630480 B2 JP 4630480B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- extracted
- expression
- data
- extraction function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、収集された文書データの分析作業を支援する要約抽出プログラム、文書分析支援プログラム、コンピュータシステムによる要約抽出方法、コンピュータシステムによる文書分析支援方法、文書分析支援システムに関する。
【0002】
【従来の技術】
インターネット、イントラネット、エクストラネットなどの技術向上により、企業内さらには企業間で情報の収集、情報の共有化が図られている。
【0003】
企業は集めた情報に対して各種の分析を行うなどにより情報の有効利用を試みる。
【0004】
【発明が解決しようとする課題】
その一方で、企業が日報データなどを計算機システムで管理すると、収集されるデータ数が膨大になり、集めた日報データに含まれている有効な情報をユーザが把握することが困難になる場合がある。
【0005】
また、収集された日報データの記載量が多い場合には、その日報データの中から有効な記載部分を探すまでのユーザの労力が大きくなる。したがって、日報データから有効な情報を把握する作業の効率化が求められている。
【0006】
さらに、収集したデータに含まれている有効な情報をユーザが適切に把握するためにシステムの操作性の向上が望まれる。
【0007】
本発明は、以上のような実情に鑑みてなされたもので、大量の文書データを扱う計算機システムにおいて、ユーザの操作性を高め、有効な情報の把握を可能とするための要約抽出プログラム、文書分析支援プログラム、コンピュータシステムによる要約抽出方法、コンピュータシステムによる文書分析支援方法、文書分析支援システムを提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明を実現するにあたって講じた具体的手段について以下に説明する。
【0009】
第1の発明は、コンピュータに、所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、文書データの中から、概念定義辞書に登録されている文書表現を抽出する抽出機能、「抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、分類軸に基づいて、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用してアンド検索処理又は文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、抽出機能によって抽出された文書表現の比較対象となる文書表現を対応テーブルに基づいて決定し、抽出機能によって抽出された文書表現と比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、文書データと要約情報とを関連付ける分析機能を実現させるための要約抽出プログラムである。
【0010】
この第1の発明により、文書データに関する要約情報、及び要約情報に関する文書データを自在に対応付けることができる。
【0011】
第2の発明は、文書データの分析を支援するためにコンピュータに、所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、文書データの中から、概念定義辞書に登録されている前記文書表現を抽出する抽出機能、「抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、分類軸に基づいて、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用してアンド検索処理又は文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、抽出機能によって抽出された文書表現の比較対象となる文書表現を対応テーブルに基づいて決定し、抽出機能によって抽出された文書表現と比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、文書データと要約情報とを関連付ける分析機能、文書データと要約情報との間にリンクを設け、文書データと要約情報とを組合せた画面データを生成する画面生成機能を実現させるための文書分析支援プログラムである。
【0012】
この第2の発明を利用すると、ユーザは、ある要約情報に関連する文書データの表示から他の要約情報に関連する文書データの表示に柔軟に移行できる。したがって、ユーザの操作性を向上させることができ、ユーザは文書データを効率的に分析できる。
【0013】
第3の発明は、上記第2の発明の変形例である。この第3の発明において、画面生成機能は、所定の階層関係にしたがって要約情報を指定するための条件指定領域を画面データに含め、分析機能による関連付け結果に基づいて、所定の階層関係とユーザによって指定された内容とに基づいて構成される条件を満たす文書データを求め、この求めた文書データとその文書データから求められた要約情報とを組合せた画面データを生成する。
【0014】
この第3の発明を利用すれば、ユーザは所定の階層関係にしたがって要約情報を絞り込みながら文書データを表示させることができる。
【0015】
その一方で、ユーザは所定の階層関係にしたがわなくても自由に要約情報を指定し、この指定した要約情報に関連のある文書データを表示できる。すなわち、ユーザは表示の階層を随時指定できる。
【0016】
したがって、ユーザは意図にそった文書データを表示させることができる。
【0017】
第4の発明は、上記第2の発明の変形例である。この第4の発明において、文書データには、その文書データを分類するために分類情報が付されており、画面生成機能は、分析機能による関連付け結果と分類情報とに基づいて、ユーザによって指定された内容に関連する文書データを求め、この求めた文書データとその文書データから抽出された要約情報とその文書データに付されている分類情報とを組合せた画面データを生成する。
【0018】
なお、分類情報には、報告者、報告日時などのような文書データの書誌的情報が利用可能である。
【0019】
この第4の発明を利用すれば、ユーザは要約情報と分類情報の双方を利用して文書データの表示を柔軟に移行させることができる。
【0020】
第5の発明は、上記第4の発明の変形例である。この第5の発明において、画面生成機能は、所定の階層関係にしたがって要約情報と分類情報に関する指定を行うための条件指定領域を画面データに含め、分析機能による関連付け結果に基づいて、所定の階層関係とユーザによって指定された内容とに基づいて構成される条件を満たす文書データを求め、この求めた文書データとその文書データから求められた要約情報とその文書データに付されている分類情報とを組合せた画面データを生成する。
【0021】
この第5の発明を利用すれば、ユーザは要約情報と分類情報を利用しつつ上記第4の発明と同様の操作を行うことができる。
【0022】
第6の発明は、第3と第5の発明の変形例である。この第6の発明において、条件指定領域は、条件を構成するための選択肢の階層関係を利用し、ある階層の選択肢が指定された場合に、指定された選択肢の下位の選択肢と指定された選択肢と同じ階層の他の選択肢とをユーザに提示する。
【0023】
この第6の発明を利用すると、同一階層の選択肢を組合せて条件を構成することができる。したがって、ユーザの意図に沿った表示を容易に提供でき、ユーザの分析作業を効率化できる。
【0030】
上記のようなプログラム、及びこのプログラムを記録した記録媒体を用いることによって、上述した機能を有していない計算機システム、サーバやクライアント等の計算機に対して、簡単に上述した機能を付加することができる。
【0031】
なお、上記第1から第6の発明のプログラムで実施される要約抽出方法、文書分析支援方法を発明の対象としてもよい。
【0032】
また、上記第1から第6の発明のプログラムで実現される機能を実現する手段を具備したコンピュータシステムを発明の対象としてもよい。
【0033】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施の形態について説明する。なお、以下に示す各図において、同一の部分については同一の符号を付してその説明を省略し、異なる部分についてのみ詳しく説明する。
【0034】
(第1の実施の形態)
本実施の形態においては、報告の記載された文書データを分析する作業を支援する文書分析支援プログラムについて説明する。
【0035】
図1は、本実施の形態に係る文書分析支援プログラムによって計算機上で実現される機能を示すブロック図である。
【0036】
本実施の形態に係る文書分析支援プログラム1は、取得機能2、要約抽出機能3、操作受付機能4、画面生成機能5を計算機や計算機システム上で実現する。
【0037】
また、文書分析支援プログラム1は、概念定義辞書6を参照する。
【0038】
取得機能2は、分析対象の文書データを取得する。この例では、文書データは、メーカーの営業日報等の報告データとする。また、この文書データには、その報告者、報告日時、販売店名などのような文書データを分類するための分類情報が付されている。
【0039】
概念定義辞書6は、文書データから要約情報を抽出するために利用する要約要素とその属性とを関連付けして登録している。例えば、概念定義辞書では、「Aスナック」に属性「自社商品」、「Bスナック」に属性「他社商品」が関連付けされている。また、「売れています」に属性「結果−プラス情報」、「販売不振です」に属性「結果−マイナス情報」が関連付けされている。また、「試食会」に属性「アクション」、「宣伝」に属性「アクション」が関連付けされている。
【0040】
要約抽出機能3は、抽出機能7、分析機能8とを具備する。
【0041】
抽出機能7は、取得機能2によって取得された文書データを受け付け、概念定義辞書6を参照する。そして、抽出機能7は、概念定義辞書6に登録されている要約要素と文書データとを比較し、概念定義辞書6の要約要素と同じ表現が文章データ内に存在する場合に、その要約要素とその属性と文章データ中の位置を記録する。
【0042】
分析機能8は、抽出機能7によって抽出された要約要素又は属性を複数の分類軸に基づいて組合せて要約情報を抽出する。要約情報を構成するための分類軸は、「商品−アクション」「商品−結果」「商品−アクション−結果」などのように予め定められている。
【0043】
抽出された要約要素又は属性の組合せを行うか否かを判定する判定処理としては、アンド検索処理8a、文書区切り処理8b、係り受け分析処理8c、対応付け分析処理8dのうち操作受付機能4においてユーザに選択された処理が利用される。
【0044】
アンド検索処理8aでは、抽出された要約要素を分類軸にしたがって全て組合せる。
【0045】
文書区切り処理8bでは、文書データを所定の文書分割規則にしたがって区切り、この区切られた状態を利用して抽出機能7による抽出結果を組合せる。例えば、文章データを「。」、「、」、「.」、「,」などで区切る。そして、区切られた範囲内で、抽出された要約要素を分類軸にしたがって組合せる。
【0046】
係り受け分析処理8cでは、抽出された要約要素に比較を意味する要素が付されている場合にはこの要約要素を組合せの候補から排除し、残りの要約要素を利用してアンド検索処理8a又は文書区切り処理8bを実行する。例えば、比較を意味する要素には「〜より」「〜と比べて」「対〜比」などがある。
【0047】
対応付け分析処理8dでは、比較関係にある要約要素を関連付けた対応テーブル9を参照し、抽出された要約要素に比較を意味する要素が付されているがこの要約要素の比較対象となる要約要素が抽出されていない場合、この要約要素の比較対象となる要約要素を対応テーブル9に基づいて決定し、要約要素の組合せを行う。例えば、対応テーブル9には互いに競合関係にある自社商品と他社商品とが対応付けされているとする。そして、「他社商品よりは売れています」という文書データについて分析を行ったとする。この場合、比較を意味する「より」の付されている「他社商品」が抽出されるが、この「他社商品」の比較対象がないため、対応テーブル9から「自社商品」が決定され、「自社商品」「売れています」という組合せ結果が得られる。
【0048】
要約抽出機能3により、例えば「…Aスナックはスーパーマーケットで7月に売れています…」という文書データについて、「Aスナック売れています」などの要約情報を抽出することができる。また、この文書データに自社商品のプラス情報が含まれていることが把握される。
【0049】
操作受付機能4は、要約抽出機能3で利用する判定処理8a〜8dの選定内容をユーザから受け付けると、その内容を要約抽出機能3の分析機能8に通知する。
【0050】
また、操作受付機能4は、画面表示に関するユーザの指定内容を受け付けると、その指定内容を画面生成機能5に通知する。
【0051】
画面生成機能5は、文書データと要約作成機能によって抽出された要約情報との間にリンクを設ける。これにより、同一の要約情報を持つ文書データが、要約情報を介してリンクで結合される。
【0052】
また、画面生成機能5は、日付・店名・報告者名などの書誌事項からなる分類情報、要約抽出機能3によって抽出された要約情報、日報本文である文書データをセットした画面データを生成する。画面データは、ディスプレイ10に表示される。
【0053】
図2は、文書分析支援プログラム1により生成された画面データの表示例を示す図である。
【0054】
この画面11は、「期間」、「商品名称」、「業態」、「プラス情報かマイナス情報かの別」、「要約情報の内容」という順序の階層にしたがってユーザが表示条件を選択するための条件指定領域11a、11bを含む。なお、要約情報の内容を選択するための条件指定領域11bには、要約情報の内容毎に、その要約情報の抽出された文書データの件数が表示される。
【0055】
表示条件は、分類情報及び要約情報とを階層的に組合せて指定される。
【0056】
また、画面11は、現在の指定状態を表示する領域11cを含む。
【0057】
さらに、画面11は、指定された表示条件を満たす文書データ、その文書データから抽出された全ての要約情報、その文書データに付されている分類データとを組合せて一覧表示する一覧領域11dを含む。
【0058】
ここで、画面11を参照したユーザが一覧領域11dに掲載されているある分類情報を操作受付機能4により指定した場合、画面生成機能5は、指定された分類データが付されている文書データを抽出する。そして、抽出された文書データ、その文書データに付されている分類情報、その文書データから抽出された要約情報とを組合せ、一覧表示する画面データを生成する。
【0059】
一方、画面11を参照したユーザが一覧領域11dに掲載されているある要約情報を操作受付機能4により指定した場合、画面生成機能5は、指定された要約情報の抽出された文書データを抽出する。そして、抽出された文書データ、その文書データに付されている分類情報、その文書データから抽出された要約情報とを組合せ、一覧表示する画面データを生成する。
【0060】
このように、画面生成機能5は、ユーザに指定された要約情報又は分類情報にしたがって文書データを抽出する情報抽出処理5a、ユーザに階層的に指定された内容にしたがって文書データを抽出する階層抽出処理5bを備えている。さらに、画面生成機能5は、文書データのうち要約情報の抽出された部分の表示性質を変更する処理5c、抽出された文書データをXMLで記述する構造化処理5dを備える。
【0061】
図3は、上記のような構成を持つ文書分析支援プログラム1の動作を例示するフロー図である。
【0062】
文書分析支援プログラム1は、まず、分析対象の文書データとその文書データに付されている分類情報とを読み込んで(S1)、それぞれの文書データに含まれている所定の要約要素を抽出し、この抽出結果に基づいて要約情報を抽出し、文書データと要約情報とを関連付ける(S2)。
【0063】
次に、文書分析支援プログラム1は、ユーザが表示条件を選択するための条件指定領域11a、11bを持つ画面11を表示する(S3)。
【0064】
ユーザは、条件指定領域11aにおけるプルダウンメニュー及び条件指定領域11bにおけるリストにより表示する文書データを指定する。
【0065】
例えば、ユーザは、分類情報の日付が「2001年3月1日〜2001年3月31日」内であり、分類情報の商品が「Aスナック」「Bスナック」であり、要約情報に「プラス情報」「景品を付けるので売行きがよい」を持つことを条件として指定する。
【0066】
すると、文書分析支援プログラム1は、ユーザの指定した条件を受け付け(S4)、この条件を満たす文書データとその要約情報とその分類情報とを組合せた一覧を表示する(S5)。
【0067】
以後、ユーザによる分析作業が継続する限り、条件の受け付けとこの条件を満たす内容の表示が繰り返される(S6)。
【0068】
すなわち、ユーザは、一覧に表示されている分類情報と要約情報とを参照し、さらに分析を継続したい場合に、分類情報又は要約情報の表示をマウスで指定(クリック)し、新たな条件を提示する。分類情報と要約情報は自由に組合せて条件を選択できる。
【0069】
すると、文書分析支援プログラム1は、このユーザの指定した条件を受け付け、この条件を満たす文書データとその要約データとその分類データとを組合せた新規の一覧を表示する。
【0070】
以上のような文書分析支援プログラム1を利用することにより得られる効果について以下に説明する。
【0071】
例えば、企業で使われる日報データ、月報データ、営業報告データ、店頭管理日報データ等の文書データの数は膨大になる。
【0072】
ユーザは、本実施の形態に係る文書分析支援プログラム1を起動し、収集された文書データをこの文書分析支援プログラム1に読み込ませる。すると、文書データから要約情報が抽出される。
【0073】
ユーザは、文書分析支援プログラム1を利用し、抽出された要約情報の内容にしたがって、文書データを分類し、集計すると、「ある商品に関する情報が多い」、「“ある販売促進活動をしたところ売れている”という情報が多い」、「ある競合他社商品に関する情報が多い」などのような定量情報を容易に求めることができる。
【0074】
そして、ユーザは、商品別、メーカー別、営業部署別などの観点で文書データを自動的に分類し、分析に利用できる。
【0075】
また、ユーザは、例えば要約情報別の件数を表示することで、検索などを実行しなくても市場状況を把握できる。
【0076】
また、ユーザは、提示された要約情報を読むことで大量の文書データ全てを読まなくても状況を把握することができる。
【0077】
ここで、例えば階層的な表示条件をユーザに指定させる方式のみを採用して「ラッピングをするが売行きが悪い」に関する文書データを抽出する場合、「マイナス情報」を指定し、さらにマイナス情報の中から「ラッピングをするが売行きが悪い」を指定して文書データを表示するという複数ステップの操作を要する。
【0078】
しかしながら、本実施の形態に係る文書分析支援プログラム1では、上記図2の画面11に示すように、文書データの表示条件を絞り込んで自社の商品「Aスナック」の「プラス情報」の「景品を付けるので売行きがよい」に関連する文書データを表示した場合であっても、さらに文書データの要約情報及び分類情報としてユーザの選択した条件と全く異なる内容が提示されている。
【0079】
具体的には、図2の一覧の中には「景品を付けるので売行きが良い」だけでなく「ラッピングをするが売行きが悪い」のような全く傾向の違う要約情報が一緒に表示されている。分類情報についても同様である。
【0080】
そして、本実施の形態に係る文書分析支援プログラム1は、文書データの要約情報の欄に掲載された内容とその要約情報の抽出された文書データとの間にリンクを設けている。
【0081】
したがって「ラッピングをするが売行きが悪い」をクリックすると、画面はこのクリックした内容に該当する文書データを表示する。このように、条件を指定する同一の階層に属するある項目から他の項目に直接移行する機能を設けることで、ユーザの操作性を向上できる。
【0082】
すなわち、本実施の形態に係る文書分析支援プログラム1を利用すれば、ある条件を満たす一覧から他の条件を満たす一覧に柔軟に移行することができる。また、本実施の形態に係る文書分析支援プログラム1を利用すれば、ユーザは表示のための条件を階層に関係なく随時指定することができるため、ユーザの操作性を向上させることができる。
【0083】
(第2の実施の形態)
本実施の形態においては、上記第1の実施の形態における要約抽出機能3について詳細に説明する。
【0084】
概念定義辞書6には、「Aスナック」「Bスナック」「Cスナック」のような商品名の要約要素と、「試食会」「完売」「売れています」のようなアクション又は結果に関する要約要素とが登録されているとする。
【0085】
また、要約抽出機能3の抽出機能7には、「Bスナックは試食会で完売。Aスナック情報。対Cスナック比120%で売れています。」という文章データが受け付けられたとする。
【0086】
この場合、抽出機能7は、この文書データと概念定義辞書6との双方に含まれている商品名の要約要素「Aスナック」「Bスナック」「Cスナック」と、アクション又は結果に関する要約要素「試食会」「完売」「売れています」を抽出する。
【0087】
図4は、要約抽出機能3の抽出機能7による要約要素の抽出結果を例示する図である。要約要素とその位置とその要素IDとが抽出されている。
【0088】
要約抽出機能3の分析機能8は、抽出された要約要素を分類軸に基づいて組合せて要約情報を抽出する。
【0089】
対応テーブル9は、対応付け分析処理8dに参照されるテーブルである。この対応テーブル9には、競合関係にある商品名「Aスナック」「Bスナック」「Cスナック」が関連付けて登録されている。
【0090】
上記の文書データ「Bスナックは試食会で完売。Aスナック情報。対Cスナック比120%で売れています。」について「商品」と「アクション又は結果」の正しい組合せは、「Bスナック−試食会」「Bスナック−完売」「Aスナック−売れています」の3つである。
【0091】
上記各種判定処理8a〜8dの分析精度を適合率(抽出した結果の内容が正しい割合)及び再現率(抽出した結果に含まれていなければならない内容が実際に含まれている割合)で評価すると以下のようになる。なお、組合せに利用する分類軸は「商品−アクション」、「商品−結果」とする。
【0092】
アンド検索処理8aでは、上記図4に示す抽出された要素を分類軸にしたがって全て組合せる。したがって、このアンド検索処理8aで抽出される要約情報は「Bスナック−試食会」「Bスナック−完売」「Bスナック−売れています」「Aスナック−試食会」「Aスナック−完売」「Aスナック−売れています」「Cスナック−試食会」「Cスナック−完売」「Cスナック−売れています」の9つである。この結果の適合率は33%、再現率は100%である。したがって、ユーザは、文書データから再現率を優先して要約情報を抽出する場合、操作受付機能4でアンド検索処理8aを選択する。
【0093】
文書区切り処理8bでは、「。」で文書データを区切り、その範囲内でアンド検索を行う。したがって、この文書区切り処理8bで抽出される要約情報は「Bスナック−試食会」「Bスナック−完売」「Cスナック−売れています」の3つである。この結果の適合率は66%、再現率は66%となる。したがって、ユーザは、文書データから適合率と再現率とを同程度に優先して要約情報を抽出する場合、操作受付機能4で文書区切り処理8bを選択する。
【0094】
係り受け分析処理8cは、「。」で区切られた範囲内又はその範囲より前に位置し、該当要素にもっとも近い位置にあり、除外接続詞が続かない商品を探し、組合せを行う。したがって、この係り受け分析処理8cで抽出される要約情報は「Bスナック−試食会」「Bスナック−完売」「Aスナック−売れています」の3つである。この結果の適合率は適合率100%、再現率は100%となる。
【0095】
対応付け分析処理8dは、係り受け分析処理で対応商品が判断できず、除外接続詞の付されている他社商品に対応する自社商品を対応テーブル9から求め、対応商品として組合せを行う。したがって、この対応付け分析処理8dで抽出される要約情報は「Bスナック−試食会」「Bスナック−完売」「Aスナック−売れています」の3つである。この結果の適合率は100%、再現率は100%となる。
【0096】
したがって、ユーザは、文書データから適合率と再現率の双方を優先して要約情報を抽出する場合、操作受付機能4で係り受け分析処理8c又は対応付け分析処理8dを選択する。
【0097】
そして、要約抽出機能3は、「自社商品」に対してプラス情報の結果又はプラス情報のアクションが組み合わされている場合には、この要約情報をプラス情報であると判定する。
【0098】
一方、要約抽出機能3は、「自社商品」に対してマイナス情報の結果又はマイナス情報のアクションが組み合わされている場合、及び「他社商品」に対してプラス情報の結果又はプラス情報のアクションが組み合わされている場合、この要約情報をマイナス情報であると判定する。
【0099】
以上説明したように、本実施の形態に係る文書分析支援プログラム1では、要約情報を抽出する分析機能8において複数の判定処理8a〜8dを実行可能であり、ユーザはこの判定処理8a〜8dの自由に選択できる。したがって、対象とする文書データの質やユーザのニーズに合わせて柔軟に表示を変化させることができる。
【0100】
(第3の実施の形態)
本実施の形態においては、上記第1の実施の形態に係る文書分析支援プログラム1の変形例について説明する。
【0101】
図5は、表示条件を指定する階層を固定化した状態を例示する図である。この図5では、まず第1階層でメーカーについての条件を選択し、第2階層でそのメーカーの商品についての条件を指定する。
【0102】
このように、表示条件の階層を固定化した場合、同じ階層の条件は一緒に選択することができない。例えば、メーカーM1とメーカーM2の双方を指定することはできない。
【0103】
したがって、「メーカーM2のBスナックとメーカーM3のCスナックの情報とを含む文書データを抽出したい」というニーズがあっても、M2社Bスナックに関する文書データの中からユーザ自身がM3社Cスナックに関する文書データを抽出する(M3社Cスナックに関する文書データの中からユーザ自身がM2社Bスナックに関する文書データを抽出する)しか手段がない。
【0104】
そこで、本実施の形態における画面生成機能5では、図6に示すように、条件の階層をユーザが利用時に指定可能とする。メーカーM1、M2などのように同じ階層レベルにある条件も上下の階層として利用可能とする。
【0105】
図6は、メーカーと商品に関する条件の指定状況を例示する図である。
【0106】
本実施の形態における画面生成機能5は、ユーザがある条件を指定すると、その指定された条件と親子関係にある一つ下の階層における全ての条件と、選択された条件と同じ階層に属し未指定の条件からなるリスト、及び「文書表示」を表示する。
【0107】
そして、ユーザによって「文書表示」が指定された段階で指定された条件を満たす文書データとその要約情報とその分類情報とを抽出し、組合せて表示する。
【0108】
図6では、まず、全てのメーカーM1〜Mmの名称が表示条件のリストとして表示されている。ユーザがこのリストから「メーカーM2」を選ぶと、メーカーM2の商品「商品P1」〜「Pp」及びメーカーM2を除く「メーカーM1」、「メーカーM3」〜「メーカーMm」の記載されたリストが表示される。
【0109】
図7は、このような同一階層の指定を実現するための処理を例示したフロー図である。
【0110】
まず、画面生成機能5は、条件と「文書表示」の記載されたリストを表示する(T1)。
【0111】
次に、画面生成機能5は、リストに対する指示を受け付け(T2)、「文書表示」が選択されるか否かを判断する(T3)。
【0112】
「文書表示」が選択されなかった場合、画面生成機能5は、「最新指定」フラグの付された条件のフラグを「指定」フラグに変更し(T4)、新たに指定された条件に「最新指定」フラグを付す(T5)。
【0113】
そして、画面生成機能5は、「最新指定」フラグの付された条件の子の条件と、「最新指定」フラグの付された条件と同一階層であり「指定フラグ」の付されていない条件と、「文書表示」とを記載したリストを表示する(T6)。
【0114】
「文書表示」が選択されるまで同様の処理が繰り返され、「文書表示」が選択されると、画面生成機能5は、「指定」フラグの付された全てを条件を利用して文書データを抽出し、画面データを生成する(T7)。
【0115】
このように、本実施の形態においては、ユーザが同じ階層レベルにある表示条件も親子関係と同様に指定可能とした。
【0116】
これにより、例えば「メーカー名」「要約データの内容」「文書データ」というトップダウンの条件指定のみではなく、同じ階層レベルの条件であっても柔軟に選択できるため、ユーザの操作性を向上させることができる。
【0117】
すなわち、例えば「メーカー」「要約データの内容」「文書データ」というように条件指定の階層と階層の数とが決められている場合よりも、ユーザのニーズに応じた絞り込みが可能となる。
【0118】
なお、本実施の形態においては、「メーカー」について同一階層の指定を可能とする場合について説明しているが、「物流」「販売促進」「商品」などの他の階層においても同一階層で指定可能にできる。
【0119】
また、複数の階層において同一階層の指定を可能としてもよい。
【0120】
(第4の実施の形態)
本実施の形態においては、上記第3の実施の形態に係る文書分析支援プログラムの変形例について説明する。
【0121】
本実施の形態においても、上記各実施の形態と同様に、表示されている文書データと要約情報との間でリンクを設けている。そして、例えば「ラッピングをするが売行きが悪い」という要約情報をクリックすると、この要約情報の抽出された文書データを画面に表示する。本実施の形態における画面移行には、上記第3の実施の形態で述べた条件の指定方法を利用する。
【0122】
図8は、先の指定内容と指定の階層と新規の指定内容とに基づく条件の関係を例示する図。
【0123】
図8で、ユーザは、「メーカーM2」「メーカーM1」「文書表示」と条件を絞り込み、この条件を満たす文書データを抽出し、表示に至っている。
【0124】
ここで、表示された文書データの要約情報又は分類情報として「メーカーM1」「商品P2」が記載されており、ユーザがこの記載をクリックしたとする。
【0125】
すると、画面生成機能5は、図8の実線の矢印で示したように、先におけるユーザの絞り込み順序を逆にたどり、「メーカーM1」の指定された状態に戻り、さらに「商品P2」が指定されたとする。
【0126】
すなわち、本実施の形態においては、表示された要約情報又は分類情報が指定された場合に、この指定をユーザが先に行っていた場合、又はこの指定の属する階層においてユーザが指定を行っていた場合には、その指定された条件に至るまでの先の指定内容が有効なまま条件が構成され、文書データが抽出される。
【0127】
一方、要約情報又は分類情報が指定された場合に、この指定が未だユーザによって行われていなかった場合には、階層のトップに戻り、指定された内容のみで条件が構成され、文書データが抽出される。
【0128】
したがって、ユーザは、先の絞り込み操作を活かしたまま要約情報又は分類情報を指定し、文書データを表示できる。これにより、ユーザは、求める情報にできるだけ限定した内容を提示することができる。
【0129】
(第5の実施の形態)
本実施の形態においては、上記第1から第4までの実施の形態に係る文書分析支援プログラム1の変形例について説明する。
【0130】
画面生成機能5は、要約情報がクリックされると、文書データのうちこの要約情報に対応する領域を強調表示する。
【0131】
図9は、要約情報の提示欄で「景品をつけた」がクリックされ、文書データの該当する記載「景品をつけて」が強調表示されている。
【0132】
このような機能は、要約抽出機能3による要約情報抽出時に、文書データ中に要約情報の作成結果をタグとして挿入しておき、要約情報欄の記載と対応付けておくことで実現可能である。
【0133】
例えば、HTMLファイルの場合、要約情報とそれに対応する文書データの記載との間をリンクで結合し、クリックされた場合に該当部分が強調表示されたHTMLファイルを表示する。
【0134】
なお、要約情報がクリックされた場合に強調表示することで対応関係をユーザに提示するのみではなく、例えば予めその要約情報をその種別に応じた色により表示し、その要約情報に対応する文書データの記載のその色で表示してもよい。
【0135】
このように文書データから抽出された要約情報が文書データ中のどこにあるかをユーザに明確に提示することで、文書データの記載量が多くてもユーザは要約情報の具体的な記載内容を素早く知ることができる。
【0136】
また、ユーザは要約情報を持つ文書データ全文を読まなくても要約情報に該当する記載近傍を読んで内容を把握できるため、情報集約度を高くすることができる。
【0137】
(第6の実施の形態)
本実施の形態においては、上記第1から第5までの実施の形態に係る文書分析支援プログラム1の変形例について説明する。
【0138】
画面生成機能5は、画面の文書データの表示領域をXML(Extensible Markup Language)にて記述する。その結果、上記各実施の形態のように複数の文書データを組合せることが可能である。
【0139】
また、画面の文書データの表示領域をXMLで記述することで、複数の文書データを含む電子ファイルから各文書データを任意に選択し、組合せることができる。
【0140】
このようにユーザが抽出された文書データをさらに編集可能とすることで、ユーザがさらに情報を集約して関係者への報告に利用することが可能になり、ナレッジマネージメントシステムとしての利便性が向上する。
【0141】
なお、上記各実施の形態に係る文書分析支援プログラム1によって実現される機能は、同様の作用・機能を実現可能であれば配置を変更させてもよく、また各機能を自由に組合せてもよい。
【0142】
上記各実施の形態で説明した文書分析支援プログラム1は、例えば磁気ディスク(フロッピーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体12に書き込んでコンピュータに適用可能である。また、このプログラムは通信媒体により伝送して、計算機、計算機システムに適用可能である。
【0143】
コンピュータは、記録媒体12に記録された文書分析支援プログラム1を記録媒体12から読み込み、プログラムによって動作が制御されることにより、上述した機能を実現する。
【0144】
(第7の実施の形態)
本実施の形態においては、上記各実施の形態に係る文書分析支援プログラム1の利用態様について説明する。
【0145】
図10は、上記各実施の形態に係る文書分析支援プログラム1により実施されるサービスをASP(アプリケーション・サービス・プロバイダ)が提供する形態を例示するブロック図である。
【0146】
ユーザ13は、自己の端末14からネットワーク15を経由してASP16の管理する文書分析支援プログラム1を利用することで、文書データの分析作業を効率的にかつ容易に実施できる。
【0147】
また、ASP16のサービスの提供を受けることで、ユーザ13は、自己で文書分析支援プログラム1を管理する場合よりも保守、運用の面で効率的に分析支援サービスを利用できる。
【0148】
ASP16は、ユーザに分析支援サービスを提供し、ユーザから対価を得ることができる。
【0149】
【発明の効果】
以上詳記したように本発明においては、文書データから要約情報を抽出し、ユーザの指定した要約情報に関連する文書データを表示する。
【0150】
したがって、大量の文書データの内容を分析するユーザの操作性を高めることができ、ユーザに有効な情報を提供できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書分析支援プログラムによって計算機上で実現される機能を示すブロック図。
【図2】同実施の形態に係る文書分析支援プログラムにより生成された画面データの表示例を示す図。
【図3】同実施の形態に係る文書分析支援プログラムの動作を例示するフロー図。
【図4】要約抽出機能の抽出機能による要約要素の抽出結果を例示する図。
【図5】表示条件を指定する階層を固定化した状態を例示する図。
【図6】条件の階層をユーザが利用時に指定可能な状態を例示した図。
【図7】同一階層の指定を実現するための処理を例示したフロー図。
【図8】先の指定内容と指定の階層と新規の指定内容とに基づく条件の関係を例示する図。
【図9】要約情報の指定により文書データの該当する記載が強調表示された状態を例示する図。
【図10】文書分析支援プログラムにより実施されるサービスをASPが提供する形態を例示するブロック図。
【符号の説明】
1…文書分析支援プログラム
2…取得機能
3…要約抽出機能
4…操作受付機能
5…画面生成機能
5a…情報抽出処理
5b…階層抽出処理
5c…表示性質変更処理5c
5d…構造化処理5d
6…概念定義辞書
7…抽出機能
8…分析機能
8a…アンド検索機能
8b…文書区切り処理
8c…係り受け分析処理
8d…対応付け分析処理
9…対応テーブル
Claims (11)
- コンピュータに、
所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出する抽出機能、
「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付ける分析機能
を実現させるための要約抽出プログラム。 - 文書データの分析を支援するためにコンピュータに、
所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、前記文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出する抽出機能、
「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付ける分析機能、
前記文書データと前記要約情報との間にリンクを設け、前記文書データと前記要約情報とを組合せた画面データを生成する画面生成機能
を実現させるための文書分析支援プログラム。 - 請求項2記載の文書分析支援プログラムにおいて、
前記画面生成機能は、所定の階層関係にしたがって前記要約情報を指定するための条件指定領域を前記画面データに含め、前記分析機能による関連付け結果に基づいて、前記所定の階層関係と前記ユーザによって指定された内容とに基づいて構成される条件を満たす文書データを求め、この求めた文書データとその文書データから求められた要約情報とを組合せた画面データを生成する
ことを特徴とする文書分析支援プログラム。 - 請求項2記載の文書分析支援プログラムにおいて、
前記文書データには、その文書データを分類するために分類情報が付されており、
前記画面生成機能は、前記分析機能による関連付け結果と前記分類情報とに基づいて、前記ユーザによって指定された内容に関連する文書データを求め、この求めた文書データとその文書データから抽出された要約情報とその文書データに付されている分類情報とを組合せた画面データを生成する
ことを特徴とする文書分析支援プログラム。 - 請求項4記載の文書分析支援プログラムにおいて、
前記画面生成機能は、所定の階層関係にしたがって要約情報と分類情報に関する指定を行うための条件指定領域を画面データに含め、前記分析機能による関連付け結果に基づいて、前記所定の階層関係と前記ユーザによって指定された内容とに基づいて構成される条件を満たす文書データを求め、この求めた文書データとその文書データから求められた要約情報とその文書データに付されている分類情報とを組合せた画面データを生成する
ことを特徴とする文書分析支援プログラム。 - 請求項3又は請求項5記載の文書分析支援プログラムにおいて、
前記条件指定領域は、前記条件を構成するための選択肢の階層関係を利用し、ある階層の選択肢が指定された場合に、指定された選択肢の下位の選択肢と指定された選択肢と同じ階層の他の選択肢とを前記ユーザに提示することを特徴とする文書分析支援プログラム。 - コンピュータシステムにより文書データの要約を抽出する方法において、
前記コンピュータシステムは、所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出し、
前記コンピュータシステムは、「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付ける
ことを特徴とする要約抽出方法。 - コンピュータシステムにより文書データの分析を支援する方法であって、
前記コンピュータシステムは、所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、前記文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出し、
前記コンピュータシステムは、「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付け、
前記コンピュータシステムは、前記文書データと前記要約情報との間にリンクを設け、前記文書データと前記要約情報とを組合せた画面データを生成し、表示し、
前記コンピュータシステムは、前記ユーザによって新規に要約情報が指定されると、前記文書データと前記要約情報との関連付け結果にしたがって、新規に指定された要約情報に関連する文書データを求め、この求めた文書データとその文書データから抽出された要約情報とを組合せた画面データを生成し、表示する
ことを特徴とする文書分析支援方法。 - コンピュータシステムにより文書データの分析を支援する方法であって、
前記コンピュータシステムは、前記文書データとその文書データを分類するために付されている分類データとを受け付け、
前記コンピュータシステムは、所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、前記文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出し、
前記コンピュータシステムは、「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付け、
前記コンピュータシステムは、前記文書データと前記要約情報と前記分類情報の間にリンクを設け、前記文書データと前記要約情報と前記分類情報とを組合せた画面データを生成し、表示する
ことを特徴とする文書分析支援方法。 - 文書データの分析を支援するシステムにおいて、
所定の文書表現とその属性とを関連付けて登録している概念定義辞書を参照し、前記文書データの中から、前記概念定義辞書に登録されている前記文書表現を抽出する抽出手段、
「前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せるために予め定められている分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を全て組合せるアンド検索処理」、「前記文書データを文書分割規則にしたがって区切り、この区切られた範囲内で、前記分類軸に基づいて、前記抽出機能によって抽出された前記少なくとも2つの文書表現またはその属性を組合せる文書区切り処理」、「抽出された文書表現に比較を意味する文書表現が付されている場合にこの文書表現を組合せの候補から排除し、残りの抽出された文書表現を利用して前記アンド検索処理又は前記文書区切り処理を実行する係り受け分析処理」、「比較関係にある文書表現を関連付けた対応テーブルを参照し、前記抽出機能によって抽出された文書表現に比較を意味する文書表現が付されているが前記抽出機能によって抽出された文書表現の比較対象となる文書表現が抽出されていない場合に、前記抽出機能によって抽出された文書表現の比較対象となる文書表現を前記対応テーブルに基づいて決定し、前記抽出機能によって抽出された文書表現と前記比較対象となる文書表現とを組合せる対応付け分析処理」のうち、ユーザに選択された処理を実行することにより、前記抽出機能によって抽出された少なくとも2つの文書表現またはその属性を組合せた要約情報を求め、前記文書データと前記要約情報とを関連付ける分析手段と、
前記文書データと前記要約情報との間にリンクを設け、前記文書データと前記要約情報とを組合せた画面データを生成する画面生成手段と
を具備する文書分析支援システム。 - 請求項10記載の文書分析支援システムにおいて、
前記文書データには、その文書データを分類するために分類情報が付されており、
前記画面生成手段は、前記分析手段による関連付け結果と前記分類情報とに基づいて、前記文書データと前記要約情報と前記分類情報とを組合せた画面データを生成する
ことを特徴とする文書分析支援システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001079349A JP4630480B2 (ja) | 2001-03-19 | 2001-03-19 | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム |
US10/098,567 US20020143739A1 (en) | 2001-03-19 | 2002-03-18 | Computer program product, method, and system of document analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001079349A JP4630480B2 (ja) | 2001-03-19 | 2001-03-19 | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002278983A JP2002278983A (ja) | 2002-09-27 |
JP4630480B2 true JP4630480B2 (ja) | 2011-02-09 |
Family
ID=18935814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001079349A Expired - Fee Related JP4630480B2 (ja) | 2001-03-19 | 2001-03-19 | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20020143739A1 (ja) |
JP (1) | JP4630480B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1300718C (zh) * | 2002-10-31 | 2007-02-14 | 卡西欧计算机株式会社 | 信息显示装置和信息显示处理程序 |
CN1629834A (zh) * | 2003-12-17 | 2005-06-22 | 国际商业机器公司 | 计算机辅助写作、电子文档的浏览、检索和预订发布 |
US7644351B1 (en) * | 2005-06-27 | 2010-01-05 | Information Sciences Corporation | Data collection and processing system and methods |
US7668791B2 (en) * | 2006-07-31 | 2010-02-23 | Microsoft Corporation | Distinguishing facts from opinions using a multi-stage approach |
US7925496B1 (en) * | 2007-04-23 | 2011-04-12 | The United States Of America As Represented By The Secretary Of The Navy | Method for summarizing natural language text |
JP5955186B2 (ja) * | 2012-09-28 | 2016-07-20 | 株式会社Nttドコモ | 情報処理装置 |
WO2015187129A1 (en) * | 2014-06-03 | 2015-12-10 | Hewlett-Packard Development Company, L.P. | Document classification based on multiple meta-algorithmic patterns |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US226752A (en) * | 1880-04-20 | Machine for making paper pails | ||
US220962A (en) * | 1879-10-28 | Improvement in apparatus for distilling petroleum | ||
JP2783558B2 (ja) * | 1988-09-30 | 1998-08-06 | 株式会社東芝 | 要約生成方法および要約生成装置 |
WO1995012173A2 (en) * | 1993-10-28 | 1995-05-04 | Teltech Resource Network Corporation | Database search summary with user determined characteristics |
JP3571408B2 (ja) * | 1995-03-31 | 2004-09-29 | 株式会社日立製作所 | 文書加工方法および装置 |
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
CA2184518A1 (en) * | 1996-08-30 | 1998-03-01 | Jim Reed | Real time structured summary search engine |
US6009442A (en) * | 1997-10-08 | 1999-12-28 | Caere Corporation | Computer-based document management system |
US6222535B1 (en) * | 1997-10-23 | 2001-04-24 | Alcatel Usa Sourcing, L.P. | System and method for facilitating issue tracking |
US6353824B1 (en) * | 1997-11-18 | 2002-03-05 | Apple Computer, Inc. | Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments |
US20020036694A1 (en) * | 1998-05-07 | 2002-03-28 | Merril Jonathan R. | Method and system for the storage and retrieval of web-based educational materials |
US6631496B1 (en) * | 1999-03-22 | 2003-10-07 | Nec Corporation | System for personalizing, organizing and managing web information |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
US6845369B1 (en) * | 2000-01-14 | 2005-01-18 | Relevant Software Inc. | System, apparatus and method for using and managing digital information |
US7137067B2 (en) * | 2000-03-17 | 2006-11-14 | Fujitsu Limited | Device and method for presenting news information |
US6941513B2 (en) * | 2000-06-15 | 2005-09-06 | Cognisphere, Inc. | System and method for text structuring and text generation |
US6978420B2 (en) * | 2001-02-12 | 2005-12-20 | Aplix Research, Inc. | Hierarchical document cross-reference system and method |
-
2001
- 2001-03-19 JP JP2001079349A patent/JP4630480B2/ja not_active Expired - Fee Related
-
2002
- 2002-03-18 US US10/098,567 patent/US20020143739A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2002278983A (ja) | 2002-09-27 |
US20020143739A1 (en) | 2002-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9817562B2 (en) | Methods and apparatus for managing and exchanging information using information objects | |
US9430470B2 (en) | Automated report service tracking system and method | |
US7548914B2 (en) | System and method for providing active tags | |
US7840601B2 (en) | Editable table modification | |
US7640511B1 (en) | Methods and apparatus for managing and inferring relationships from information objects | |
US20060225000A1 (en) | Graphical application interface using browser | |
US9075859B2 (en) | Parameterized database drill-through | |
US7774295B2 (en) | Database track history | |
US20080134060A1 (en) | System for creating a graphical visualization of data with a browser | |
JP5697256B2 (ja) | 検索装置、検索方法、検索プログラム及び記録媒体 | |
US20060224983A1 (en) | Graphical visualization of data using browser | |
US20070129977A1 (en) | User interface incorporating data ecosystem awareness | |
US20090281997A1 (en) | Method and a system for searching information using information device | |
US20060224972A1 (en) | Graphical application interface with a browser | |
US20150127688A1 (en) | Facilitating discovery and re-use of information constructs | |
JP2007505422A (ja) | 製品情報を格納するためのカタログ分類装置、該カタログ分類装置を使用するシステム及び方法 | |
US20220075833A1 (en) | Web services for data aggregation and application for path traversal in knowledge graphs | |
US20060224980A1 (en) | Method of creating graphical visualizations of data with a browser | |
JP5313295B2 (ja) | 文書探索サービス提供方法及びシステム | |
Isaacs et al. | Footprints: A visual search tool that supports discovery and coverage tracking | |
JP4630480B2 (ja) | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム | |
JP2001117935A (ja) | テキスト情報アクセス装置、その方法、及び記録媒体 | |
Lu et al. | Clustering e-commerce search engines based on their search interface pages using WISE-Cluster | |
JP4251550B2 (ja) | 電子カタログ処理プログラム | |
JP4550996B2 (ja) | コンテンツの評価装置、評価方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4630480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |