JP3792411B2 - 文書分類装置 - Google Patents
文書分類装置 Download PDFInfo
- Publication number
- JP3792411B2 JP3792411B2 JP28954998A JP28954998A JP3792411B2 JP 3792411 B2 JP3792411 B2 JP 3792411B2 JP 28954998 A JP28954998 A JP 28954998A JP 28954998 A JP28954998 A JP 28954998A JP 3792411 B2 JP3792411 B2 JP 3792411B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- document
- category
- keyword
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
この発明は、電子化された文書からキーワードを抽出し、この抽出したキーワードをキーとして、カテゴリの木構造で表現される分類体系に文書を分類する文書分類装置に関する。
【0002】
【従来の技術】
このような文書分類装置は、特開平7−78186号公報に開示されている。すなわち、かかる技術は、文書に付されたキーワードと、分類体系の各カテゴリのノード名にあたるキーワードの一致、不一致を判断し、一致したカテゴリに文書を自動的に分類するものであるため、分類体系を容易に作成でき、作成した分類体系に応じて自動的に分類することができる。
【0003】
【発明が解決しようとする課題】
しかし、前記従来技術には次のような問題がある。すなわち、例えば、図1に示すような分類体系を用いた場合、カテゴリ「製品別」は、その子カテゴリである「プリンタ」「カメラ」「複写機」をまとめるための便宜的なカテゴリであるにもかかわらず、「製品別」というキーワードをもった文書が、かかるカテゴリに分類されてしまうという不具合がある。
【0004】
この発明の目的は、分類体系中の便宜的なカテゴリには文書が分類されないようにすることができる文書分類装置を提供することにある。
【0005】
この発明の別の目的は、文書の分類状態を気にしないで分類体系中にカテゴリを作成することができるようにすることにある。
【0006】
【課題を解決するための手段】
請求項1に記載の発明は、電子化された文書からキーワードを抽出するキーワード抽出手段と、この抽出したキーワードをキーとすることにより、カテゴリの木構造で表現される分類体系に前記文書を分類する文書分類手段と、前記分類体系のカテゴリとフラグとを関連付けて、所望のカテゴリのフラグが無効または有効に設定されたテーブルを管理する分類禁止手段と、を備え、前記文書分類手段は、前記分類禁止手段における前記テーブルを参照して、所望のカテゴリのフラグが無効であった場合に、前記カテゴリに前記文書を分類しないこと、を特徴とする。
【0007】
したがって、便宜的なカテゴリへの文書の分類を禁止することができる。
【0012】
【発明の実施の形態】
図2は、この発明の実施の一形態である文書分類装置1の機能ブロック図である。図2に示すように、文書分類装置1は、電子化された文書aからキーワードを抽出するキーワード抽出部2と、この抽出したキーワードをキーとして、カテゴリの木構造で表現される分類体系bに文書を分類し、分類結果cを得る分類部3と、所望のキーワードあるいは分類体系b中の所望のカテゴリを無効化、あるいはこの無効化したキーワード、カテゴリを有効化する分類体系変更部4とを備えている。また、分類部3は、このキーワード、カテゴリを有効化、無効化するのに応じて、すでに分類済みの文書の再分類も行う。また、分類部3が具体的に如何にして文書を分類するかについては、特開平7−78186号公報に開示されているので、説明を省略する。キーワード抽出部2は、この発明のキーワード抽出手段を実施し、分類部3は、この発明の文書分類手段を実施し、分類体系変更部4は、この発明の分類禁止手段を実施するものである。
【0013】
以上のような文書分類装置1の動作例について説明する。キーワード抽出部2が文書aから抽出したキーワードが{製品別、FAX}であり、分類体系bが図1に示すものであったとする。
【0014】
このままであれば、分類部3が分類体系b中の「製品別」というカテゴリに文書aを分類することになるが、このカテゴリは便宜的につけたものであり、ここには分類したくない。分類体系変更部4は、図3に例示するような分類体系のカテゴリとフラグ(無効化フラグ)とを関連付けたテーブルを管理しているので、このテーブル中の「製品別」カテゴリの無効化フラグを“無効”に設定する。分類部3は、{製品別、FAX}のキーワードをもつ文書の分類先のカテゴリとして、「製品別」を得た後、前記テーブルを参照して、「製品別」カテゴリの無効化フラグを参照する。そして、この無効化フラグが“無効”に設定されていて、「製品別」カテゴリへの分類が禁止されているので、結果として、“{}(適当な分類先がない)”という分類結果cが得られる。以上のようにして、便宜的なカテゴリへの文書の分類を禁止することができる。
【0015】
次に、文書分類装置1の別の動作例について説明する。分類体系bが図4に示すようなもので、キーワード抽出部2が抽出したキーワードが{製品別、FAX}であったとする。この動作例では、あるカテゴリを無効化するのではなく、あるキーワードを無効化する。
【0016】
すなわち、分類体系変更部4では、図5に示すようなキーワードとフラグ(無効化フラグ)を対応付けたテーブルを管理していて、このテーブルの「製品別」キーワードのフラグを“無効”にする。分類部3は、前記テーブルを参照して、「製品別」キーワードのフラグが“無効”であるため、キーワード抽出部2が抽出したキーワード{製品別、FAX}から「製品別」を除外し、キーワード{FAX}を得る。これにより、キーワード「製品別」をキーとした文書aの分類が禁止されるので、文書aの分類先のカテゴリとして{会社別/A社/製品別/FAX}が得られる。以上のようにして、特定のキーワードをキーとした便宜的なカテゴリへの文書の分類を禁止することができる。
【0017】
また、前記の動作例において、図3、図5に示すテーブルにおける、あるキーワード、カテゴリ(例えば、図4における「A社」というカテゴリ)の無効化フラグが“無効”または“有効”に変更された場合、分類部3は、分類済みの文書aのうち、当該キーワードを持つもの、あるいは当該カテゴリに分類されたものをすべて再分類する。
【0018】
このように、特定のカテゴリへの文書の分類、特定のキーワードをキーとする文書の分類が禁止され、あるいは禁止が解除されても、その対象であるカテゴリおよびキーワードに応じて、分類済みの文書を自動的に再分類するので、ユーザは文書の分類状態を気にしないで分類体系中にカテゴリを簡単に作成することができる。
【0019】
【発明の効果】
請求項1に記載の発明は、便宜的なカテゴリへの文書の分類を禁止することができる。
【図面の簡単な説明】
【図1】この発明の一実施の形態にかかる文書分類装置で扱う分類体系の例を示すブロック図である。
【図2】前記文書分類装置の構成を示す機能ブロック図である。
【図3】前記文書分類装置の分類体系変更部が管理するキーワードと無効化フラグを対応付けたテーブルを示す表である。
【図4】前記文書分類装置で扱う分類体系の例を示すブロック図である。
【図5】前記文書分類装置の分類体系変更部が管理するキーワードと無効化フラグを対応付けたテーブルを示す表である。
【符号の説明】
1 文書分類装置
2 キーワード抽出手段
3 文書分類手段
4 分類禁止手段
Claims (1)
- 電子化された文書からキーワードを抽出するキーワード抽出手段と、
この抽出したキーワードをキーとすることにより、カテゴリの木構造で表現される分類体系に前記文書を分類する文書分類手段と、
前記分類体系のカテゴリとフラグとを関連付けて、所望のカテゴリのフラグが無効または有効に設定されたテーブルを管理する分類禁止手段と、を備え、
前記文書分類手段は、前記分類禁止手段における前記テーブルを参照して、所望のカテゴリのフラグが無効であった場合に、前記カテゴリに前記文書を分類しないこと、
を特徴とする文書分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28954998A JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28954998A JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000123020A JP2000123020A (ja) | 2000-04-28 |
JP3792411B2 true JP3792411B2 (ja) | 2006-07-05 |
Family
ID=17744691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28954998A Expired - Fee Related JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3792411B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737057B (zh) * | 2011-04-14 | 2015-04-01 | 阿里巴巴集团控股有限公司 | 一种商品类目信息的确定方法及装置 |
EP3204899A1 (en) * | 2014-10-06 | 2017-08-16 | Swiss Reinsurance Company Ltd. | System and method for pattern-recognition based monitoring and controlled processing of data objects based on conformity measurements |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2572314B2 (ja) * | 1991-05-31 | 1997-01-16 | 株式会社テレマティーク国際研究所 | キーワード抽出装置 |
JP3491856B2 (ja) * | 1994-09-14 | 2004-01-26 | 株式会社リコー | 文書処理装置 |
JP2885161B2 (ja) * | 1996-01-10 | 1999-04-19 | 日本電気株式会社 | 電子メール分類装置 |
JPH09223150A (ja) * | 1996-02-16 | 1997-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類処理方法 |
-
1998
- 1998-10-12 JP JP28954998A patent/JP3792411B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000123020A (ja) | 2000-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7472114B1 (en) | Method and apparatus to define the scope of a search for information from a tabular data source | |
US7047492B2 (en) | Document management system | |
US8595849B2 (en) | Method and apparatus to report policy violations in messages | |
US8813176B2 (en) | Method and apparatus for creating an information security policy based on a pre-configured template | |
US7984029B2 (en) | Reliability of duplicate document detection algorithms | |
US20030037044A1 (en) | Enumerated roles in a directory system | |
JP5004868B2 (ja) | 情報処理装置及びその制御方法、並びにプログラム | |
CA2384487A1 (en) | A method and system for managing images over a communication network | |
JP4852638B2 (ja) | メール管理装置、複合装置、及び通信方法 | |
JP2005539295A (ja) | ウエブサービス装置及び方法 | |
JP2009282611A5 (ja) | ||
JP2007200276A (ja) | 管理システム,管理サーバおよび管理プログラム | |
US20080243818A1 (en) | Content-based accounting method implemented in image reproduction devices | |
US8365247B1 (en) | Identifying whether electronic data under test includes particular information from a database | |
JP3792411B2 (ja) | 文書分類装置 | |
JP2007004645A (ja) | 個人情報管理システム | |
JPH10320288A (ja) | アクセス制御方法及びシステム及びアクセス制御プログラムを格納した記憶媒体 | |
JP2002251403A (ja) | 文書蓄積・検索システム | |
JP3982969B2 (ja) | 文書管理装置 | |
İNANÇ | The Microgastrinae (Hymenoptera: Braconidae) fauna of the Thrace Region of Turkey | |
JP2009104610A (ja) | 画像処理システム、画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 | |
JP2000123019A (ja) | 文書分類装置 | |
Parker | Current HIV/AIDS Infection Rates: Categorization and Stigmatization | |
Barbosa et al. | Automatically constructing collections of online database directories | |
EP1160683A3 (en) | A system and method for categorising and retrieving documents on a network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050628 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050816 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110414 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120414 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130414 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140414 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |