JP3792411B2 - 文書分類装置 - Google Patents

文書分類装置 Download PDF

Info

Publication number
JP3792411B2
JP3792411B2 JP28954998A JP28954998A JP3792411B2 JP 3792411 B2 JP3792411 B2 JP 3792411B2 JP 28954998 A JP28954998 A JP 28954998A JP 28954998 A JP28954998 A JP 28954998A JP 3792411 B2 JP3792411 B2 JP 3792411B2
Authority
JP
Japan
Prior art keywords
classification
document
category
keyword
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28954998A
Other languages
English (en)
Other versions
JP2000123020A (ja
Inventor
篤 伊藤
亜矢子 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP28954998A priority Critical patent/JP3792411B2/ja
Publication of JP2000123020A publication Critical patent/JP2000123020A/ja
Application granted granted Critical
Publication of JP3792411B2 publication Critical patent/JP3792411B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、電子化された文書からキーワードを抽出し、この抽出したキーワードをキーとして、カテゴリの木構造で表現される分類体系に文書を分類する文書分類装置に関する。
【0002】
【従来の技術】
このような文書分類装置は、特開平7−78186号公報に開示されている。すなわち、かかる技術は、文書に付されたキーワードと、分類体系の各カテゴリのノード名にあたるキーワードの一致、不一致を判断し、一致したカテゴリに文書を自動的に分類するものであるため、分類体系を容易に作成でき、作成した分類体系に応じて自動的に分類することができる。
【0003】
【発明が解決しようとする課題】
しかし、前記従来技術には次のような問題がある。すなわち、例えば、図1に示すような分類体系を用いた場合、カテゴリ「製品別」は、その子カテゴリである「プリンタ」「カメラ」「複写機」をまとめるための便宜的なカテゴリであるにもかかわらず、「製品別」というキーワードをもった文書が、かかるカテゴリに分類されてしまうという不具合がある。
【0004】
この発明の目的は、分類体系中の便宜的なカテゴリには文書が分類されないようにすることができる文書分類装置を提供することにある。
【0005】
この発明の別の目的は、文書の分類状態を気にしないで分類体系中にカテゴリを作成することができるようにすることにある。
【0006】
【課題を解決するための手段】
請求項1に記載の発明は、電子化された文書からキーワードを抽出するキーワード抽出手段と、この抽出したキーワードをキーとすることにより、カテゴリの木構造で表現される分類体系に前記文書を分類する文書分類手段と、前記分類体系のカテゴリとフラグとを関連付けて、所望のカテゴリのフラグが無効または有効に設定されたテーブルを管理する分類禁止手段と、を備え、前記文書分類手段は、前記分類禁止手段における前記テーブルを参照して、所望のカテゴリのフラグが無効であった場合に、前記カテゴリに前記文書を分類しないこと、を特徴とする。
【0007】
したがって、便宜的なカテゴリへの文書の分類を禁止することができる。
【0012】
【発明の実施の形態】
図2は、この発明の実施の一形態である文書分類装置1の機能ブロック図である。図2に示すように、文書分類装置1は、電子化された文書aからキーワードを抽出するキーワード抽出部2と、この抽出したキーワードをキーとして、カテゴリの木構造で表現される分類体系bに文書を分類し、分類結果cを得る分類部3と、所望のキーワードあるいは分類体系b中の所望のカテゴリを無効化、あるいはこの無効化したキーワード、カテゴリを有効化する分類体系変更部4とを備えている。また、分類部3は、このキーワード、カテゴリを有効化、無効化するのに応じて、すでに分類済みの文書の再分類も行う。また、分類部3が具体的に如何にして文書を分類するかについては、特開平7−78186号公報に開示されているので、説明を省略する。キーワード抽出部2は、この発明のキーワード抽出手段を実施し、分類部3は、この発明の文書分類手段を実施し、分類体系変更部4は、この発明の分類禁止手段を実施するものである。
【0013】
以上のような文書分類装置1の動作例について説明する。キーワード抽出部2が文書aから抽出したキーワードが{製品別、FAX}であり、分類体系bが図1に示すものであったとする。
【0014】
このままであれば、分類部3が分類体系b中の「製品別」というカテゴリに文書aを分類することになるが、このカテゴリは便宜的につけたものであり、ここには分類したくない。分類体系変更部4は、図3に例示するような分類体系のカテゴリとフラグ(無効化フラグ)とを関連付けたテーブルを管理しているので、このテーブル中の「製品別」カテゴリの無効化フラグを“無効”に設定する。分類部3は、{製品別、FAX}のキーワードをもつ文書の分類先のカテゴリとして、「製品別」を得た後、前記テーブルを参照して、「製品別」カテゴリの無効化フラグを参照する。そして、この無効化フラグが“無効”に設定されていて、「製品別」カテゴリへの分類が禁止されているので、結果として、“{}(適当な分類先がない)”という分類結果cが得られる。以上のようにして、便宜的なカテゴリへの文書の分類を禁止することができる。
【0015】
次に、文書分類装置1の別の動作例について説明する。分類体系bが図4に示すようなもので、キーワード抽出部2が抽出したキーワードが{製品別、FAX}であったとする。この動作例では、あるカテゴリを無効化するのではなく、あるキーワードを無効化する。
【0016】
すなわち、分類体系変更部4では、図5に示すようなキーワードとフラグ(無効化フラグ)を対応付けたテーブルを管理していて、このテーブルの「製品別」キーワードのフラグを“無効”にする。分類部3は、前記テーブルを参照して、「製品別」キーワードのフラグが“無効”であるため、キーワード抽出部2が抽出したキーワード{製品別、FAX}から「製品別」を除外し、キーワード{FAX}を得る。これにより、キーワード「製品別」をキーとした文書aの分類が禁止されるので、文書aの分類先のカテゴリとして{会社別/A社/製品別/FAX}が得られる。以上のようにして、特定のキーワードをキーとした便宜的なカテゴリへの文書の分類を禁止することができる。
【0017】
また、前記の動作例において、図3、図5に示すテーブルにおける、あるキーワード、カテゴリ(例えば、図4における「A社」というカテゴリ)の無効化フラグが“無効”または“有効”に変更された場合、分類部3は、分類済みの文書aのうち、当該キーワードを持つもの、あるいは当該カテゴリに分類されたものをすべて再分類する。
【0018】
このように、特定のカテゴリへの文書の分類、特定のキーワードをキーとする文書の分類が禁止され、あるいは禁止が解除されても、その対象であるカテゴリおよびキーワードに応じて、分類済みの文書を自動的に再分類するので、ユーザは文書の分類状態を気にしないで分類体系中にカテゴリを簡単に作成することができる。
【0019】
【発明の効果】
請求項1に記載の発明は、便宜的なカテゴリへの文書の分類を禁止することができる。
【図面の簡単な説明】
【図1】この発明の一実施の形態にかかる文書分類装置で扱う分類体系の例を示すブロック図である。
【図2】前記文書分類装置の構成を示す機能ブロック図である。
【図3】前記文書分類装置の分類体系変更部が管理するキーワードと無効化フラグを対応付けたテーブルを示す表である。
【図4】前記文書分類装置で扱う分類体系の例を示すブロック図である。
【図5】前記文書分類装置の分類体系変更部が管理するキーワードと無効化フラグを対応付けたテーブルを示す表である。
【符号の説明】
1 文書分類装置
2 キーワード抽出手段
3 文書分類手段
4 分類禁止手段

Claims (1)

  1. 電子化された文書からキーワードを抽出するキーワード抽出手段と、
    この抽出したキーワードをキーとすることにより、カテゴリの木構造で表現される分類体系に前記文書を分類する文書分類手段と、
    前記分類体系のカテゴリとフラグとを関連付けて、所望のカテゴリのフラグが無効または有効に設定されたテーブルを管理する分類禁止手段と、を備え、
    前記文書分類手段は、前記分類禁止手段における前記テーブルを参照して、所望のカテゴリのフラグが無効であった場合に、前記カテゴリに前記文書を分類しないこと、
    を特徴とする文書分類装置。
JP28954998A 1998-10-12 1998-10-12 文書分類装置 Expired - Fee Related JP3792411B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28954998A JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28954998A JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Publications (2)

Publication Number Publication Date
JP2000123020A JP2000123020A (ja) 2000-04-28
JP3792411B2 true JP3792411B2 (ja) 2006-07-05

Family

ID=17744691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28954998A Expired - Fee Related JP3792411B2 (ja) 1998-10-12 1998-10-12 文書分類装置

Country Status (1)

Country Link
JP (1) JP3792411B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737057B (zh) * 2011-04-14 2015-04-01 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置
EP3204899A1 (en) * 2014-10-06 2017-08-16 Swiss Reinsurance Company Ltd. System and method for pattern-recognition based monitoring and controlled processing of data objects based on conformity measurements

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2572314B2 (ja) * 1991-05-31 1997-01-16 株式会社テレマティーク国際研究所 キーワード抽出装置
JP3491856B2 (ja) * 1994-09-14 2004-01-26 株式会社リコー 文書処理装置
JP2885161B2 (ja) * 1996-01-10 1999-04-19 日本電気株式会社 電子メール分類装置
JPH09223150A (ja) * 1996-02-16 1997-08-26 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理方法

Also Published As

Publication number Publication date
JP2000123020A (ja) 2000-04-28

Similar Documents

Publication Publication Date Title
US7472114B1 (en) Method and apparatus to define the scope of a search for information from a tabular data source
US7047492B2 (en) Document management system
US8595849B2 (en) Method and apparatus to report policy violations in messages
US8813176B2 (en) Method and apparatus for creating an information security policy based on a pre-configured template
US7984029B2 (en) Reliability of duplicate document detection algorithms
US20030037044A1 (en) Enumerated roles in a directory system
JP5004868B2 (ja) 情報処理装置及びその制御方法、並びにプログラム
CA2384487A1 (en) A method and system for managing images over a communication network
JP4852638B2 (ja) メール管理装置、複合装置、及び通信方法
JP2005539295A (ja) ウエブサービス装置及び方法
JP2009282611A5 (ja)
JP2007200276A (ja) 管理システム,管理サーバおよび管理プログラム
US20080243818A1 (en) Content-based accounting method implemented in image reproduction devices
US8365247B1 (en) Identifying whether electronic data under test includes particular information from a database
JP3792411B2 (ja) 文書分類装置
JP2007004645A (ja) 個人情報管理システム
JPH10320288A (ja) アクセス制御方法及びシステム及びアクセス制御プログラムを格納した記憶媒体
JP2002251403A (ja) 文書蓄積・検索システム
JP3982969B2 (ja) 文書管理装置
İNANÇ The Microgastrinae (Hymenoptera: Braconidae) fauna of the Thrace Region of Turkey
JP2009104610A (ja) 画像処理システム、画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2000123019A (ja) 文書分類装置
Parker Current HIV/AIDS Infection Rates: Categorization and Stigmatization
Barbosa et al. Automatically constructing collections of online database directories
EP1160683A3 (en) A system and method for categorising and retrieving documents on a network

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050628

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060405

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120414

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140414

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees