JP2000123020A - 文書分類装置 - Google Patents

文書分類装置

Info

Publication number
JP2000123020A
JP2000123020A JP10289549A JP28954998A JP2000123020A JP 2000123020 A JP2000123020 A JP 2000123020A JP 10289549 A JP10289549 A JP 10289549A JP 28954998 A JP28954998 A JP 28954998A JP 2000123020 A JP2000123020 A JP 2000123020A
Authority
JP
Japan
Prior art keywords
classification
keyword
document
category
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10289549A
Other languages
English (en)
Other versions
JP3792411B2 (ja
Inventor
Atsushi Ito
篤 伊藤
Ayako Oono
亜矢子 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP28954998A priority Critical patent/JP3792411B2/ja
Publication of JP2000123020A publication Critical patent/JP2000123020A/ja
Application granted granted Critical
Publication of JP3792411B2 publication Critical patent/JP3792411B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 分類体系中の便宜的なカテゴリには文書が分
類されないようにすることができる文書分類装置を提供
する。 【解決手段】 分類体系変更部4は、分類体系bのカテ
ゴリとフラグとを関連付けたテーブルを管理しているの
で、このテーブル中の文書の分類先としたくないカテゴ
リの無効化フラグは“無効”に設定する。分類部3は、
キーワード抽出部2が文書aから抽出したキーワードを
キーとして文書を分類体系bに分類するが、前記テーブ
ルを参照して、無効化フラグが“無効”に設定されてい
るカテゴリへの分類は行わない。あるいは、分類体系変
更部4がキーワードとフラグとを関連付けたテーブルを
管理し、このテーブル中の文書の分類のキーとしたくな
いキーワードの無効化フラグを“無効”に設定すること
で、分類部3が、当該キーワードをキーとした文書の分
類を行わないようにしてもよい。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、電子化された文
書からキーワードを抽出し、この抽出したキーワードを
キーとして、カテゴリの木構造で表現される分類体系に
文書を分類する文書分類装置に関する。
【0002】
【従来の技術】このような文書分類装置は、特開平7−
78186号公報に開示されている。すなわち、かかる
技術は、文書に付されたキーワードと、分類体系の各カ
テゴリのノード名にあたるキーワードの一致、不一致を
判断し、一致したカテゴリに文書を自動的に分類するも
のであるため、分類体系を容易に作成でき、作成した分
類体系に応じて自動的に分類することができる。
【0003】
【発明が解決しようとする課題】しかし、前記従来技術
には次のような問題がある。すなわち、例えば、図1に
示すような分類体系を用いた場合、カテゴリ「製品別」
は、その子カテゴリである「プリンタ」「カメラ」「複
写機」をまとめるための便宜的なカテゴリであるにもか
かわらず、「製品別」というキーワードをもった文書
が、かかるカテゴリに分類されてしまうという不具合が
ある。
【0004】この発明の目的は、分類体系中の便宜的な
カテゴリには文書が分類されないようにすることができ
る文書分類装置を提供することにある。
【0005】この発明の別の目的は、文書の分類状態を
気にしないで分類体系中にカテゴリを作成することがで
きるようにすることにある。
【0006】
【課題を解決するための手段】請求項1に記載の発明
は、電子化された文書からキーワードを抽出するキーワ
ード抽出手段と、この抽出したキーワードをキーとする
ことにより、カテゴリの木構造で表現される分類体系に
文書を分類する文書分類手段と、前記分類体系中の所望
のカテゴリへの前記分類を禁止する分類禁止手段と、を
備えている文書分類装置である。
【0007】したがって、便宜的なカテゴリへの文書の
分類を禁止することができる。
【0008】請求項2に記載の発明は、電子化された文
書からキーワードを抽出するキーワード抽出手段と、こ
の抽出したキーワードをキーとすることにより、カテゴ
リの木構造で表現される分類体系に文書を分類する文書
分類手段と、所望のキーワードをキーとした前記分類を
禁止する分類禁止手段と、を備えている文書分類装置で
ある。
【0009】したがって、特定のキーワードをキーとし
た便宜的なカテゴリへの文書の分類を禁止することがで
きる。
【0010】請求項3に記載の発明は、請求項1または
2に記載の発明において、文書分類手段は、分類禁止手
段による分類の禁止およびその解除の対象となったカテ
ゴリおよびキーワードに応じて、文書分類手段により分
類済みの文書を再分類するものである。
【0011】したがって、特定のカテゴリへの文書の分
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて分類済みの文書を自動的
に再分類するので、ユーザは文書の分類状態を気にしな
いで分類体系中にカテゴリを簡単に作成することができ
る。
【0012】
【発明の実施の形態】図2は、この発明の実施の一形態
である文書分類装置1の機能ブロック図である。図2に
示すように、文書分類装置1は、電子化された文書aか
らキーワードを抽出するキーワード抽出部2と、この抽
出したキーワードをキーとして、カテゴリの木構造で表
現される分類体系bに文書を分類し、分類結果cを得る
分類部3と、所望のキーワードあるいは分類体系b中の
所望のカテゴリを無効化、あるいはこの無効化したキー
ワード、カテゴリを有効化する分類体系変更部4とを備
えている。また、分類部3は、このキーワード、カテゴ
リを有効化、無効化するのに応じて、すでに分類済みの
文書の再分類も行う。また、分類部3が具体的に如何に
して文書を分類するかについては、特開平7−7818
6号公報に開示されているので、説明を省略する。キー
ワード抽出部2は、この発明のキーワード抽出手段を実
施し、分類部3は、この発明の文書分類手段を実施し、
分類体系変更部4は、この発明の分類禁止手段を実施す
るものである。
【0013】以上のような文書分類装置1の動作例につ
いて説明する。キーワード抽出部2が文書aから抽出し
たキーワードが{製品別、FAX}であり、分類体系b
が図1に示すものであったとする。
【0014】このままであれば、分類部3が分類体系b
中の「製品別」というカテゴリに文書aを分類すること
になるが、このカテゴリは便宜的につけたものであり、
ここには分類したくない。分類体系変更部4は、図3に
例示するような分類体系のカテゴリとフラグ(無効化フ
ラグ)とを関連付けたテーブルを管理しているので、こ
のテーブル中の「製品別」カテゴリの無効化フラグを
“無効”に設定する。分類部3は、{製品別、FAX}
のキーワードをもつ文書の分類先のカテゴリとして、
「製品別」を得た後、前記テーブルを参照して、「製品
別」カテゴリの無効化フラグを参照する。そして、この
無効化フラグが“無効”に設定されていて、「製品別」
カテゴリへの分類が禁止されているので、結果として、
“{}(適当な分類先がない)”という分類結果cが得
られる。以上のようにして、便宜的なカテゴリへの文書
の分類を禁止することができる。
【0015】次に、文書分類装置1の別の動作例につい
て説明する。分類体系bが図4に示すようなもので、キ
ーワード抽出部2が抽出したキーワードが{製品別、F
AX}であったとする。この動作例では、あるカテゴリ
を無効化するのではなく、あるキーワードを無効化す
る。
【0016】すなわち、分類体系変更部4では、図5に
示すようなキーワードとフラグ(無効化フラグ)を対応
付けたテーブルを管理していて、このテーブルの「製品
別」キーワードのフラグを“無効”にする。分類部3
は、前記テーブルを参照して、「製品別」キーワードの
フラグが“無効”であるため、キーワード抽出部2が抽
出したキーワード{製品別、FAX}から「製品別」を
除外し、キーワード{FAX}を得る。これにより、キ
ーワード「製品別」をキーとした文書aの分類が禁止さ
れるので、文書aの分類先のカテゴリとして{会社別/
A社/製品別/FAX}が得られる。以上のようにし
て、特定のキーワードをキーとした便宜的なカテゴリへ
の文書の分類を禁止することができる。
【0017】また、前記の動作例において、図3、図5
に示すテーブルにおける、あるキーワード、カテゴリ
(例えば、図4における「A社」というカテゴリ)の無
効化フラグが“無効”または“有効”に変更された場
合、分類部3は、分類済みの文書aのうち、当該キーワ
ードを持つもの、あるいは当該カテゴリに分類されたも
のをすべて再分類する。
【0018】このように、特定のカテゴリへの文書の分
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて、分類済みの文書を自動
的に再分類するので、ユーザは文書の分類状態を気にし
ないで分類体系中にカテゴリを簡単に作成することがで
きる。
【0019】
【発明の効果】請求項1に記載の発明は、便宜的なカテ
ゴリへの文書の分類を禁止することができる。
【0020】請求項2に記載の発明は、特定のキーワー
ドをキーとした便宜的なカテゴリへの文書の分類を禁止
することができる。
【0021】請求項3に記載の発明は、請求項1または
2に記載の発明において、特定のカテゴリへの文書の分
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて分類済みの文書を自動的
に再分類するので、ユーザは文書の分類状態を気にしな
いで分類体系中にカテゴリを簡単に作成することができ
る。
【図面の簡単な説明】
【図1】この発明の一実施の形態にかかる文書分類装置
で扱う分類体系の例を示すブロック図である。
【図2】前記文書分類装置の構成を示す機能ブロック図
である。
【図3】前記文書分類装置の分類体系変更部が管理する
キーワードと無効化フラグを対応付けたテーブルを示す
表である。
【図4】前記文書分類装置で扱う分類体系の例を示すブ
ロック図である。
【図5】前記文書分類装置の分類体系変更部が管理する
キーワードと無効化フラグを対応付けたテーブルを示す
表である。
【符号の説明】
1 文書分類装置 2 キーワード抽出手段 3 文書分類手段 4 分類禁止手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 電子化された文書からキーワードを抽出
    するキーワード抽出手段と、 この抽出したキーワードをキーとすることにより、カテ
    ゴリの木構造で表現される分類体系に文書を分類する文
    書分類手段と、 前記分類体系中の所望のカテゴリへの前記分類を禁止す
    る分類禁止手段と、を備えている文書分類装置。
  2. 【請求項2】 電子化された文書からキーワードを抽出
    するキーワード抽出手段と、 この抽出したキーワードをキーとすることにより、カテ
    ゴリの木構造で表現される分類体系に文書を分類する文
    書分類手段と、 所望のキーワードをキーとした前記分類を禁止する分類
    禁止手段と、を備えている文書分類装置。
  3. 【請求項3】 文書分類手段は、分類禁止手段による分
    類の禁止およびその解除の対象となったカテゴリおよび
    キーワードに応じて、文書分類手段により分類済みの文
    書を再分類するものである請求項1または2に記載の文
    書分類装置。
JP28954998A 1998-10-12 1998-10-12 文書分類装置 Expired - Fee Related JP3792411B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28954998A JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28954998A JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Publications (2)

Publication Number Publication Date
JP2000123020A true JP2000123020A (ja) 2000-04-28
JP3792411B2 JP3792411B2 (ja) 2006-07-05

Family

ID=17744691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28954998A Expired - Fee Related JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Country Status (1)

Country Link
JP (1) JP3792411B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181277A (ja) * 2011-04-14 2016-10-13 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品カテゴリ情報を判断する方法および装置
JP2017532674A (ja) * 2014-10-06 2017-11-02 スイス リインシュランス カンパニー リミテッド 一致度測定量に基づくデータオブジェクトのパターン認識ベースの監視および制御的処理のためのシステムと方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08339363A (ja) * 1994-09-14 1996-12-24 Ricoh Co Ltd 文書処理装置
JP2572314B2 (ja) * 1991-05-31 1997-01-16 株式会社テレマティーク国際研究所 キーワード抽出装置
JPH09190447A (ja) * 1996-01-10 1997-07-22 Nec Corp 電子メール分類装置
JPH09223150A (ja) * 1996-02-16 1997-08-26 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2572314B2 (ja) * 1991-05-31 1997-01-16 株式会社テレマティーク国際研究所 キーワード抽出装置
JPH08339363A (ja) * 1994-09-14 1996-12-24 Ricoh Co Ltd 文書処理装置
JPH09190447A (ja) * 1996-01-10 1997-07-22 Nec Corp 電子メール分類装置
JPH09223150A (ja) * 1996-02-16 1997-08-26 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
伊藤篤: "再分類可能な電子メールのフォルダリング", 情報処理学会第53回全国大会講演論文集(3), CSNG200201762001, 4 September 1996 (1996-09-04), pages 409 - 3, ISSN: 0000726437 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181277A (ja) * 2011-04-14 2016-10-13 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品カテゴリ情報を判断する方法および装置
JP2017532674A (ja) * 2014-10-06 2017-11-02 スイス リインシュランス カンパニー リミテッド 一致度測定量に基づくデータオブジェクトのパターン認識ベースの監視および制御的処理のためのシステムと方法

Also Published As

Publication number Publication date
JP3792411B2 (ja) 2006-07-05

Similar Documents

Publication Publication Date Title
US6678822B1 (en) Method and apparatus for securely transporting an information container from a trusted environment to an unrestricted environment
US7472114B1 (en) Method and apparatus to define the scope of a search for information from a tabular data source
US7475336B2 (en) Document information processing apparatus and document information processing program
JP4625334B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体、並びに資源管理装置
US7039856B2 (en) Automatic document classification using text and images
US20100257141A1 (en) Apparatus and method for document collection and filtering
JP5004868B2 (ja) 情報処理装置及びその制御方法、並びにプログラム
US8643489B2 (en) Image processing system, history management apparatus, image processing control apparatus and computer readable medium
KR101800373B1 (ko) 불법 콘텐츠 검색 시스템 및 그 방법
US20060174345A1 (en) Apparatus and method for acceleration of malware security applications through pre-filtering
CN112567407A (zh) 电子邮件的隐私保护标记和分类
CN102414677A (zh) 包括自动分类规则的数据分类流水线
JP4852638B2 (ja) メール管理装置、複合装置、及び通信方法
WO2002037326A1 (en) System for monitoring publication of content on the internet
JP2009282611A5 (ja)
JP2007004431A (ja) 文書管理システム、文書廃棄装置および文書管理方法
US20130142433A1 (en) System and method for fingerprinting for comics
CN103154957A (zh) 出版物的指纹提取方法、出版物的指纹提取装置、利用指纹的出版物识别系统及利用指纹的出版物识别方法
JP2000123020A (ja) 文書分類装置
JPH0736768A (ja) 電子ファイル装置
Iwamoto et al. Pisces Gadiformes: taxonomy of grenadiers of the New Caledonian region, southwest Pacific
JP2010176387A (ja) 電子スクラップシステム、電子スクラップ方法、電子スクラップサーバ、および利用者端末
JP2002251403A (ja) 文書蓄積・検索システム
US8614803B2 (en) User interface of image forming apparatus with restricted editing function
JP2003178009A (ja) メッセージ処理方法およびその処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050628

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060405

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120414

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140414

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees