JP2005275948A - 情報処理装置、情報処理方法、及び制御プログラム - Google Patents

情報処理装置、情報処理方法、及び制御プログラム Download PDF

Info

Publication number
JP2005275948A
JP2005275948A JP2004090021A JP2004090021A JP2005275948A JP 2005275948 A JP2005275948 A JP 2005275948A JP 2004090021 A JP2004090021 A JP 2004090021A JP 2004090021 A JP2004090021 A JP 2004090021A JP 2005275948 A JP2005275948 A JP 2005275948A
Authority
JP
Japan
Prior art keywords
document
classification
destination information
classification destination
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004090021A
Other languages
English (en)
Inventor
Kenichi Abe
健一 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004090021A priority Critical patent/JP2005275948A/ja
Publication of JP2005275948A publication Critical patent/JP2005275948A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 利用者が文書の内容を素早く的確に判断するために適した要約文を作成し、利用者の利便性を向上させた情報処理装置を提供する。
【解決手段】 文書分類部202により文書に分類先情報を付加する。分類先選択部204を用いて利用者が要約文に反映したい分類先情報を選択し、文書要約部205により、選択した分類先情報の内容を強調した要約文を作成する。作成した要約文を要約結果表示部206に表示する。
【選択図】 図2

Description

本発明は、文書の要約文をユーザに提示する情報処理装置及び情報処理方法、並びに前記情報処理方法を実現するための制御プログラムに関する。
近年のデジタル情報化社会においては、ネットワークを通じて電子化されたテキストが氾濫し、個人の情報処理能力を遙かに上回る量の情報に日常的に接する事態になっている。このため、文書管理の必要性とともに、文書の要約を作成してそれをユーザに提示し、個人が読むテキストの量を制限する文書要約機能が注目されている。
この文書要約機能により文書の要約文を表示して、ユーザが文書を開かずに内容を把握し、必要なファイルであるかどうかの判断を行うことにより、必要のない文書を開いて読み、また閉じるといった無駄な作業が省かれ、業務の効率化を実現することができる。
このような要約技術の必要性が高まる中、近年、自動文書要約機能を搭載したソフトウェアが提案されてきている。このソフトウェアは、要約対象となる文書を分析し、重要文と判断された文を抜き出すことにより要約文を作成している。また、自動収集した文書や、ユーザが作成した文書を自動的に分類するソフトウェアも提案されてきている。
しかしながら、上記自動文書要約機能では、分類ソフトウェアにより分類された文書を要約する際にも、要約対象文書単体の情報から要約文を作成するため、十分な精度の要約文が得られないという問題があった。
この問題を解消するものとして、例えば、要約対象の文章が属する分野毎に複数の学習用文章を用いて分野別特徴ベクトルを生成し、要約対象の文章が属する分野も考慮して要約文を生成する文書要約装置が提案されている(特許文献1を参照)。この装置は、要約対象の文章を構成する文の文ベクトルと、この文ベクトルに基づいて要約対象の文章に対応する文章ベクトルとを生成し、前記文ベクトルと、要約対象の文章が属する分野を特徴づける前記分野別特徴ベクトルと、前記文章ベクトルとに基づいて、前記要約対象の文章から重要文を抽出する。これにより、要約対象の文章について要約文を自動的に生成するに際し、当該要約対象の文章が属する分野も考慮して要約文を生成することができ、より正確な要約文の作成を図るものである。
特開2003−108571号公報
しかしながら、上記従来の文書要約技術では、利用者が選択した分類の内容を反映した要約文を生成することはできなかった。例えば、同じ文書に対して、利用者が選択する分類に応じて異なる要約文を作成することはできず、したがって、利用者がより必要とする内容を含んだ要約文を得ることは困難であった。
本発明は上記従来の問題点に鑑み、利用者がより必要とする内容を含んだ要約文を得ることができる情報処理装置、情報処理方法及び制御プログラムを提供することを目的とする。
上記目的を達成するために、本発明の情報処理装置は、分類項目に従って文書を分類する文書分類手段と、前記文書分類手段により分類された各々の文書に対して分類先情報を設定する分類先情報設定手段と、前記文書分類手段により分類された文書を要約する文書要約手段とを備え、前記文書要約手段は、前記分類先情報設定手段で設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする。
本発明の情報処理装置は、分類項目に従って文書を分類する文書分類手段と、前記文書分類手段により分類された各々の文書に対し分類先情報を保持する分類先情報保持手段と、前記文書分類手段により分類された文書を要約する文書要約手段と、要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択手段とを備え、前記文書要約手段は、前記分類先選択手段により選択された分類先情報を反映した要約文を出力することを特徴とする。
本発明の情報処理方法は、分類項目に従って文書を分類する文書分類工程と、前記文書分類工程により分類された文書を要約する文書要約工程とを実行する情報処理方法において、前記文書分類工程により分類された各々の文書に対して分類先情報を設定する工程を実行し、前記文書要約工程は、前記設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする。
本発明の情報処理方法は、分類項目に従って文書を分類する文書分類工程と、前記文書分類工程により分類された文書を要約する文書要約工程とを実行する情報処理方法において、前記文書分類工程により分類された各々の文書に対し分類先情報を分類先情報保持手段に保持する工程と、要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択工程とを実行し、前記文書要約工程は、前記分類先選択工程により選択された分類先情報を反映した要約文を出力することを特徴とする。
本発明の制御プログラムは、分類項目に従って文書を分類する文書分類ステップと、前記文書分類ステップにより分類された文書を要約する文書要約ステップとを備えた、コンピュータで読み取り可能な制御プログラムであって、前記文書分類ステップにより分類された各々の文書に対して分類先情報を設定するステップを設け、前記文書要約ステップは、前記設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする。
本発明の制御プログラムは、分類項目に従って文書を分類する文書分類ステップと、前記文書分類ステップにより分類された文書を要約する文書要約ステップとを備えた、コンピュータで読み取り可能な制御プログラムであって、前記文書分類ステップにより分類された各々の文書に対し分類先情報を分類先情報保持手段に保持するステップと、要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択ステップとを設け、前記文書要約ステップは、前記分類先選択ステップにより選択された分類先情報を反映した要約文を出力することを特徴とする。
本発明によれば、選択された分類の内容を反映した要約文を生成することができ、利用者がより必要とする要約文を得ることが可能である。
本発明の情報処理装置、情報処理方法、及び制御プログラムの実施の形態について、図面を参照しながら説明する。
<本実施形態の構成>
図1は、本発明の実施の一形態に係る情報処理装置のハード構成を示すブロック図である。
同図において、11はマイクロプロセッサ(CPU)であり、ROM12又は外部メモリ14に記憶された制御プログラムコードを実行して本実施形態の文書要約処理のための演算や論理判断等を行い、またアドレスバスAB、コントロールバスCB及びデータバスDBを介して、それらのバスに接続された各構成要素を制御する。ここで、アドレスバスABは、CPU11が制御の対象とする構成要素を指定するためのアドレス信号を転送する。コントロールバスCBは、CPU11が制御の対象とする各構成要素に対してCPU11から出力されるコントロール信号を転送する。データバスDBは、各構成要素相互間のデータ転送を行う。
12は読み出し専用の固定メモリ(ROM)であり、本実施形態で実行される処理プログラム(後述する図3及び図4のフロー)等の制御プログラムコードを記憶する。13は書き込み可能なランダムアクセスメモリ(RAM)であり、各構成要素から送られた各種データの一時記憶に用いられる。
14は外部メモリであり、本実施形態に係る文書要約処理(後述する図3及び図4のフロー)を実行するプログラムコード等が格納される。15はキーボードであり、アルファベットキーや、ひらがなキー、カタカナキー、句読点等の文字記号入力キー、カーソル移動を支持するカーソル移動キー等の各種の機能キーを備えている。
16は表示用ビデオメモリ(VRAM)であり、表示すべきデータの表示パターンを蓄える。17はCRTコントローラであり、表示用ビデオメモリ(VRAM)16に蓄えられた内容を後述の表示装置(CRT)18に表示する役割を担う。18は陰極線管や液晶パネル等の表示装置(CRT)であり、表示装置18の画面上に、ドット構成の表示パターン及びカーソルがCRTコントローラ17による制御によって表示される。19はネットワークコントローラであり、当該情報処理装置をイーサーネット(Ethernet(登録商標))などのネットワークに接続する役割を担う。
かかる各構成要素から成る情報処理装置は、キーボード15からの各種の入力及びネットワークコントローラ19から供給されるネットワーク経由の各種の入力に応じて作動するものであって、キーボード15からの入力又はネットワークコントローラ19からの入力が供給されると、まず、インタラプト信号がマイクロプロセッサ(CPU)11へ送られ、マイクロプロセッサ(CPU)11が、外部メモリ14内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。
図2は、図1に示した情報処理装置の文書要約機能を表すブロック図である。
201は、文書を格納する文書格納部であり、例えば図1中の外部メモリ14等が相当する。202は、文書格納部201に格納されている文書を分類する文書分類部であり、図1中のCPU11等が相当する。203は、文書分類部202によって分類された各々の文書の分類先を保持する分類先情報保持部であり、図1中のRAM13等が相当する。
204は、利用者が要約文を作成する際に、出力する要約文に反映させたい分類先情報を選択するための分類先選択部であり、図1中のキーボード15等が相当する。205は、分類先選択部204で選択した分類先情報を分類先情報保持部203から取り出し、分類先情報を反映した要約文を作成する文書要約部であり、図1中のCPU11等が相当する。206は、文書要約部206で作成された要約文を利用者に提示する要約結果表示部であり、図1中のCRT18に相当する。
<本実施形態の動作>
図3は、本実施形態に係る情報処理装置の文書要約処理の実行手順を示したフローチャートである。
まずステップS301において、予め分類カテゴリを設定しておき、次のステップS302では、分類カテゴリに関連するキーワードを規定とした分類ベクトルを作成する。これを全ての分類カテゴリに対して行う。
続くステップS303では、入力された文書を分類する文書分類処理を実行する。この文書分類処理の手順については図4で後述する。そして、ステップS304において、全ての文書について分類がなされたかについて判断し、全ての文書が分類されていたらステップS305へ移る。分類されていなければステップS303に戻り、次の文書の分類を行う。なお、ステップS303とS304の処理は、文書が入力される度に行われる。
ステップS305では、要約対象文書を選択する。選択された要約対象文書は、前記ステップS301によって設定された分類先カテゴリの情報を属性として持っている。要約対象文書を選択した後は、ステップS306において、要約対象文書がどの分類カテゴリに属しているのかを表示し、利用者に選択させる。
続くステップS307では、前記ステップS306で選択した分類カテゴリの分類情報を反映した要約文を作成する。具体的には、例えば要約対象文書の各文のキーワードを抽出し、文の特徴ベクトルを作成する。そして文書分類時に作成した分類カテゴリの特徴ベクトルと文の特徴ベクトルとの類似度を求め、類似度の高い文に大きなスコアを加算する。さらに、キーワードの出現回数や、文の位置などを考慮して各文にスコア付けを行い、スコアの高い文を要約文として選択する。これにより、ユーザが選択した分類カテゴリの内容を反映した要約文が出力される。また、同じ文書に対してユーザが選択する分類カテゴリが異なれば出力される要約文も異なる。
そしてステップS308において、前記ステップS307で作成された要約文を利用者に提示する。
図4は、図3で説明した文書分類処理(ステップS303)の詳細な手順を示すフローチャートである。
まずステップS401では、入力された文書からその文書を特徴づけるキーワードを抽出し、文書ベクトルを作成する。次のステップS402では、前記ステップS401で求めた文書ベクトルと全ての分類カテゴリにおける分類ベクトルとの類似度を計算する。2つのベクトルv1,v2の類似度Sを求めるには、例えば次式を用いる。
Figure 2005275948
続くステップS403では、前記ステップS402で求められた類似度が高い分類先候補を利用者に表示し、さらにステップS404は、前記ステップS403で表示された分類先候補から利用者が分類先を選択する。ここでは複数の分類先を選択することができる。なお、ステップS403及びS404の処理は、類似度が上位のものを自動的に分類するようにしても良い。そしてステップS405において、分類された文書に分類先情報を設定する。
このように本実施形態では、ある文書を複数のカテゴリに分類し、分類先情報を文書の属性として保持する。この文書を要約する時に、利用者が分類先情報を選択することによって、選択した分類先の内容を反映した要約文が生成され、利用者がより必要とする要約文を得ることができる。
なお、上記実施形態では、文書を格納する文書格納部201を、単一の装置を構成する外部メモリ14に配置するものとして説明したが、これを複数の外部記憶装置に分散配置し、ネットワークコントローラ19を介してネットワーク上で処理するように構成しても良い。
本発明は、上述した実施形態の装置に限定されず、複数の機器から構成されるシステムに適用しても、1つの機器から成る装置に適用しても良い。前述した実施形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体をシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、完成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMを用いることができる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、次のプログラムコードの指示に基づき、その拡張機能を拡張ボードや拡張ユニットに備わるCPUなどが処理を行って実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の実施の一形態に係る情報処理装置のハード構成を示すブロック図である。 図1に示した情報処理装置の文書要約機能を表すブロック図である。 実施形態に係る情報処理装置の文書要約処理の実行手順を示したフローチャートである。 図3で説明した文書分類処理(ステップS303)の詳細な手順を示すフローチャートである。
符号の説明
11 マイクロプロセッサ
12 ROM
13 RAM
14 外部メモリ
15 キーボード
16 表示用ビデオメモリ(VRAM)
17 CRTコントローラ
18 表示装置(CRT)
19 ネットワークコントローラ
201 文書格納部
202 文書分類部
203 分類先情報保持部
204 分類先選択部
205 文書要約部
206 要約結果表示部

Claims (7)

  1. 分類項目に従って文書を分類する文書分類手段と、
    前記文書分類手段により分類された各々の文書に対して分類先情報を設定する分類先情報設定手段と、
    前記文書分類手段により分類された文書を要約する文書要約手段とを備え、
    前記文書要約手段は、
    前記分類先情報設定手段で設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする情報処理装置。
  2. 分類項目に従って文書を分類する文書分類手段と、
    前記文書分類手段により分類された各々の文書に対し分類先情報を保持する分類先情報保持手段と、
    前記文書分類手段により分類された文書を要約する文書要約手段と、
    要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択手段とを備え、
    前記文書要約手段は、前記分類先選択手段により選択された分類先情報を反映した要約文を出力することを特徴とする情報処理装置。
  3. 前記分類手段は、1つの文書が1つ以上の分類項目に所属するように文書を分類することを特徴とする請求項1又は2に記載の情報処理装置。
  4. 分類項目に従って文書を分類する文書分類工程と、前記文書分類工程により分類された文書を要約する文書要約工程とを実行する情報処理方法において、
    前記文書分類工程により分類された各々の文書に対して分類先情報を設定する工程を実行し、
    前記文書要約工程は、
    前記設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする情報処理方法。
  5. 分類項目に従って文書を分類する文書分類工程と、前記文書分類工程により分類された文書を要約する文書要約工程とを実行する情報処理方法において、
    前記文書分類工程により分類された各々の文書に対し分類先情報を分類先情報保持手段に保持する工程と、
    要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択工程とを実行し、
    前記文書要約工程は、前記分類先選択工程により選択された分類先情報を反映した要約文を出力することを特徴とする情報処理方法。
  6. 分類項目に従って文書を分類する文書分類ステップと、前記文書分類ステップにより分類された文書を要約する文書要約ステップとを備えた、コンピュータで読み取り可能な制御プログラムであって、
    前記文書分類ステップにより分類された各々の文書に対して分類先情報を設定するステップを設け、
    前記文書要約ステップは、
    前記設定された分類先情報を参照して、要約対象の文書が属する少なくとも1つの分類項目を反映した要約文を出力することを特徴とする制御プログラム。
  7. 分類項目に従って文書を分類する文書分類ステップと、前記文書分類ステップにより分類された文書を要約する文書要約ステップとを備えた、コンピュータで読み取り可能な制御プログラムであって、
    前記文書分類ステップにより分類された各々の文書に対し分類先情報を分類先情報保持手段に保持するステップと、
    要約対象の文書に対して前記分類先情報保持手段から分類先情報を選択するための分類先選択ステップとを設け、
    前記文書要約ステップは、前記分類先選択ステップにより選択された分類先情報を反映した要約文を出力することを特徴とする制御プログラム。
JP2004090021A 2004-03-25 2004-03-25 情報処理装置、情報処理方法、及び制御プログラム Withdrawn JP2005275948A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004090021A JP2005275948A (ja) 2004-03-25 2004-03-25 情報処理装置、情報処理方法、及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004090021A JP2005275948A (ja) 2004-03-25 2004-03-25 情報処理装置、情報処理方法、及び制御プログラム

Publications (1)

Publication Number Publication Date
JP2005275948A true JP2005275948A (ja) 2005-10-06

Family

ID=35175539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004090021A Withdrawn JP2005275948A (ja) 2004-03-25 2004-03-25 情報処理装置、情報処理方法、及び制御プログラム

Country Status (1)

Country Link
JP (1) JP2005275948A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009053942A (ja) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd 文書処理プログラム、文書処理装置及び文書処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009053942A (ja) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd 文書処理プログラム、文書処理装置及び文書処理システム

Similar Documents

Publication Publication Date Title
TWI475406B (zh) 取決於上下文之輸入方法
US20030145285A1 (en) Method of displaying correct word candidates, spell checking method, computer apparatus, and program
JP2006179003A (ja) 意味論的文書スマートネール
JPH10333799A (ja) ウィンドウディスプレイに複数のダイアログボックスを表示するためのシステム及び方法
JPH11316760A (ja) 位置指示情報を使用してドキュメントの要約を生成する方法とシステム
KR20180105546A (ko) 클레임 요소 명사의 요소 명사 참조 번호를 획득하기 위한 요소 명사 참조 번호 획득방법
WO2006059513A1 (ja) 表示装置、表示装置の制御方法及び情報記憶媒体
JP2937520B2 (ja) 文書検索装置
JP2005275948A (ja) 情報処理装置、情報処理方法、及び制御プログラム
JP2001005809A (ja) 文書作成装置、文書作成方法、及び文書作成プログラムが記録された記録媒体
JP3564317B2 (ja) 文書表示方法及び表示装置
JPH08212230A (ja) 文書検索方法及び文書検索装置
JP2005346560A (ja) 検索結果提示方法およびその装置並びに検索結果提示プログラムを格納した記憶媒体
JP3969689B2 (ja) 文書作成支援装置、文書作成支援方法及び文書作成支援プログラムを記憶した記憶媒体
JP3177045B2 (ja) オンライン文字認識装置
JP2006252294A (ja) 文書処理装置、文書処理方法、及び記憶媒体
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JP2004252545A (ja) 情報処理装置、情報処理方法及び記憶媒体
JP3305219B2 (ja) ヘルプ機能検索装置とヘルプ機能検索装置制御プログラムを記憶した媒体
JPH11184854A (ja) 電子辞書
JPH0991311A (ja) 情報蓄積検索装置およびその制御方法
JP3537260B2 (ja) リンク付文書検索表示システム
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH0934890A (ja) 手書き文字入力装置及び仮名漢字変換方法
JPH10240120A (ja) 手話学習装置、手話学習方法及び手話学習データ記憶媒体

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060418

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605