JP2000123020A - 文書分類装置 - Google Patents
文書分類装置Info
- Publication number
- JP2000123020A JP2000123020A JP10289549A JP28954998A JP2000123020A JP 2000123020 A JP2000123020 A JP 2000123020A JP 10289549 A JP10289549 A JP 10289549A JP 28954998 A JP28954998 A JP 28954998A JP 2000123020 A JP2000123020 A JP 2000123020A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- keyword
- document
- category
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
類されないようにすることができる文書分類装置を提供
する。 【解決手段】 分類体系変更部4は、分類体系bのカテ
ゴリとフラグとを関連付けたテーブルを管理しているの
で、このテーブル中の文書の分類先としたくないカテゴ
リの無効化フラグは“無効”に設定する。分類部3は、
キーワード抽出部2が文書aから抽出したキーワードを
キーとして文書を分類体系bに分類するが、前記テーブ
ルを参照して、無効化フラグが“無効”に設定されてい
るカテゴリへの分類は行わない。あるいは、分類体系変
更部4がキーワードとフラグとを関連付けたテーブルを
管理し、このテーブル中の文書の分類のキーとしたくな
いキーワードの無効化フラグを“無効”に設定すること
で、分類部3が、当該キーワードをキーとした文書の分
類を行わないようにしてもよい。
Description
書からキーワードを抽出し、この抽出したキーワードを
キーとして、カテゴリの木構造で表現される分類体系に
文書を分類する文書分類装置に関する。
78186号公報に開示されている。すなわち、かかる
技術は、文書に付されたキーワードと、分類体系の各カ
テゴリのノード名にあたるキーワードの一致、不一致を
判断し、一致したカテゴリに文書を自動的に分類するも
のであるため、分類体系を容易に作成でき、作成した分
類体系に応じて自動的に分類することができる。
には次のような問題がある。すなわち、例えば、図1に
示すような分類体系を用いた場合、カテゴリ「製品別」
は、その子カテゴリである「プリンタ」「カメラ」「複
写機」をまとめるための便宜的なカテゴリであるにもか
かわらず、「製品別」というキーワードをもった文書
が、かかるカテゴリに分類されてしまうという不具合が
ある。
カテゴリには文書が分類されないようにすることができ
る文書分類装置を提供することにある。
気にしないで分類体系中にカテゴリを作成することがで
きるようにすることにある。
は、電子化された文書からキーワードを抽出するキーワ
ード抽出手段と、この抽出したキーワードをキーとする
ことにより、カテゴリの木構造で表現される分類体系に
文書を分類する文書分類手段と、前記分類体系中の所望
のカテゴリへの前記分類を禁止する分類禁止手段と、を
備えている文書分類装置である。
分類を禁止することができる。
書からキーワードを抽出するキーワード抽出手段と、こ
の抽出したキーワードをキーとすることにより、カテゴ
リの木構造で表現される分類体系に文書を分類する文書
分類手段と、所望のキーワードをキーとした前記分類を
禁止する分類禁止手段と、を備えている文書分類装置で
ある。
た便宜的なカテゴリへの文書の分類を禁止することがで
きる。
2に記載の発明において、文書分類手段は、分類禁止手
段による分類の禁止およびその解除の対象となったカテ
ゴリおよびキーワードに応じて、文書分類手段により分
類済みの文書を再分類するものである。
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて分類済みの文書を自動的
に再分類するので、ユーザは文書の分類状態を気にしな
いで分類体系中にカテゴリを簡単に作成することができ
る。
である文書分類装置1の機能ブロック図である。図2に
示すように、文書分類装置1は、電子化された文書aか
らキーワードを抽出するキーワード抽出部2と、この抽
出したキーワードをキーとして、カテゴリの木構造で表
現される分類体系bに文書を分類し、分類結果cを得る
分類部3と、所望のキーワードあるいは分類体系b中の
所望のカテゴリを無効化、あるいはこの無効化したキー
ワード、カテゴリを有効化する分類体系変更部4とを備
えている。また、分類部3は、このキーワード、カテゴ
リを有効化、無効化するのに応じて、すでに分類済みの
文書の再分類も行う。また、分類部3が具体的に如何に
して文書を分類するかについては、特開平7−7818
6号公報に開示されているので、説明を省略する。キー
ワード抽出部2は、この発明のキーワード抽出手段を実
施し、分類部3は、この発明の文書分類手段を実施し、
分類体系変更部4は、この発明の分類禁止手段を実施す
るものである。
いて説明する。キーワード抽出部2が文書aから抽出し
たキーワードが{製品別、FAX}であり、分類体系b
が図1に示すものであったとする。
中の「製品別」というカテゴリに文書aを分類すること
になるが、このカテゴリは便宜的につけたものであり、
ここには分類したくない。分類体系変更部4は、図3に
例示するような分類体系のカテゴリとフラグ(無効化フ
ラグ)とを関連付けたテーブルを管理しているので、こ
のテーブル中の「製品別」カテゴリの無効化フラグを
“無効”に設定する。分類部3は、{製品別、FAX}
のキーワードをもつ文書の分類先のカテゴリとして、
「製品別」を得た後、前記テーブルを参照して、「製品
別」カテゴリの無効化フラグを参照する。そして、この
無効化フラグが“無効”に設定されていて、「製品別」
カテゴリへの分類が禁止されているので、結果として、
“{}(適当な分類先がない)”という分類結果cが得
られる。以上のようにして、便宜的なカテゴリへの文書
の分類を禁止することができる。
て説明する。分類体系bが図4に示すようなもので、キ
ーワード抽出部2が抽出したキーワードが{製品別、F
AX}であったとする。この動作例では、あるカテゴリ
を無効化するのではなく、あるキーワードを無効化す
る。
示すようなキーワードとフラグ(無効化フラグ)を対応
付けたテーブルを管理していて、このテーブルの「製品
別」キーワードのフラグを“無効”にする。分類部3
は、前記テーブルを参照して、「製品別」キーワードの
フラグが“無効”であるため、キーワード抽出部2が抽
出したキーワード{製品別、FAX}から「製品別」を
除外し、キーワード{FAX}を得る。これにより、キ
ーワード「製品別」をキーとした文書aの分類が禁止さ
れるので、文書aの分類先のカテゴリとして{会社別/
A社/製品別/FAX}が得られる。以上のようにし
て、特定のキーワードをキーとした便宜的なカテゴリへ
の文書の分類を禁止することができる。
に示すテーブルにおける、あるキーワード、カテゴリ
(例えば、図4における「A社」というカテゴリ)の無
効化フラグが“無効”または“有効”に変更された場
合、分類部3は、分類済みの文書aのうち、当該キーワ
ードを持つもの、あるいは当該カテゴリに分類されたも
のをすべて再分類する。
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて、分類済みの文書を自動
的に再分類するので、ユーザは文書の分類状態を気にし
ないで分類体系中にカテゴリを簡単に作成することがで
きる。
ゴリへの文書の分類を禁止することができる。
ドをキーとした便宜的なカテゴリへの文書の分類を禁止
することができる。
2に記載の発明において、特定のカテゴリへの文書の分
類、特定のキーワードをキーとする文書の分類が禁止さ
れ、あるいは禁止が解除されても、その対象であるカテ
ゴリおよびキーワードに応じて分類済みの文書を自動的
に再分類するので、ユーザは文書の分類状態を気にしな
いで分類体系中にカテゴリを簡単に作成することができ
る。
で扱う分類体系の例を示すブロック図である。
である。
キーワードと無効化フラグを対応付けたテーブルを示す
表である。
ロック図である。
キーワードと無効化フラグを対応付けたテーブルを示す
表である。
Claims (3)
- 【請求項1】 電子化された文書からキーワードを抽出
するキーワード抽出手段と、 この抽出したキーワードをキーとすることにより、カテ
ゴリの木構造で表現される分類体系に文書を分類する文
書分類手段と、 前記分類体系中の所望のカテゴリへの前記分類を禁止す
る分類禁止手段と、を備えている文書分類装置。 - 【請求項2】 電子化された文書からキーワードを抽出
するキーワード抽出手段と、 この抽出したキーワードをキーとすることにより、カテ
ゴリの木構造で表現される分類体系に文書を分類する文
書分類手段と、 所望のキーワードをキーとした前記分類を禁止する分類
禁止手段と、を備えている文書分類装置。 - 【請求項3】 文書分類手段は、分類禁止手段による分
類の禁止およびその解除の対象となったカテゴリおよび
キーワードに応じて、文書分類手段により分類済みの文
書を再分類するものである請求項1または2に記載の文
書分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28954998A JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28954998A JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000123020A true JP2000123020A (ja) | 2000-04-28 |
JP3792411B2 JP3792411B2 (ja) | 2006-07-05 |
Family
ID=17744691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28954998A Expired - Fee Related JP3792411B2 (ja) | 1998-10-12 | 1998-10-12 | 文書分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3792411B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016181277A (ja) * | 2011-04-14 | 2016-10-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 製品カテゴリ情報を判断する方法および装置 |
JP2017532674A (ja) * | 2014-10-06 | 2017-11-02 | スイス リインシュランス カンパニー リミテッド | 一致度測定量に基づくデータオブジェクトのパターン認識ベースの監視および制御的処理のためのシステムと方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08339363A (ja) * | 1994-09-14 | 1996-12-24 | Ricoh Co Ltd | 文書処理装置 |
JP2572314B2 (ja) * | 1991-05-31 | 1997-01-16 | 株式会社テレマティーク国際研究所 | キーワード抽出装置 |
JPH09190447A (ja) * | 1996-01-10 | 1997-07-22 | Nec Corp | 電子メール分類装置 |
JPH09223150A (ja) * | 1996-02-16 | 1997-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類処理方法 |
-
1998
- 1998-10-12 JP JP28954998A patent/JP3792411B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2572314B2 (ja) * | 1991-05-31 | 1997-01-16 | 株式会社テレマティーク国際研究所 | キーワード抽出装置 |
JPH08339363A (ja) * | 1994-09-14 | 1996-12-24 | Ricoh Co Ltd | 文書処理装置 |
JPH09190447A (ja) * | 1996-01-10 | 1997-07-22 | Nec Corp | 電子メール分類装置 |
JPH09223150A (ja) * | 1996-02-16 | 1997-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類処理方法 |
Non-Patent Citations (1)
Title |
---|
伊藤篤: "再分類可能な電子メールのフォルダリング", 情報処理学会第53回全国大会講演論文集(3), CSNG200201762001, 4 September 1996 (1996-09-04), pages 409 - 3, ISSN: 0000726437 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016181277A (ja) * | 2011-04-14 | 2016-10-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 製品カテゴリ情報を判断する方法および装置 |
JP2017532674A (ja) * | 2014-10-06 | 2017-11-02 | スイス リインシュランス カンパニー リミテッド | 一致度測定量に基づくデータオブジェクトのパターン認識ベースの監視および制御的処理のためのシステムと方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3792411B2 (ja) | 2006-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6678822B1 (en) | Method and apparatus for securely transporting an information container from a trusted environment to an unrestricted environment | |
US7472114B1 (en) | Method and apparatus to define the scope of a search for information from a tabular data source | |
US7475336B2 (en) | Document information processing apparatus and document information processing program | |
JP4625334B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体、並びに資源管理装置 | |
US7039856B2 (en) | Automatic document classification using text and images | |
US20100257141A1 (en) | Apparatus and method for document collection and filtering | |
JP5004868B2 (ja) | 情報処理装置及びその制御方法、並びにプログラム | |
US8643489B2 (en) | Image processing system, history management apparatus, image processing control apparatus and computer readable medium | |
KR101800373B1 (ko) | 불법 콘텐츠 검색 시스템 및 그 방법 | |
US20060174345A1 (en) | Apparatus and method for acceleration of malware security applications through pre-filtering | |
CN112567407A (zh) | 电子邮件的隐私保护标记和分类 | |
CN102414677A (zh) | 包括自动分类规则的数据分类流水线 | |
JP4852638B2 (ja) | メール管理装置、複合装置、及び通信方法 | |
WO2002037326A1 (en) | System for monitoring publication of content on the internet | |
JP2009282611A5 (ja) | ||
JP2007004431A (ja) | 文書管理システム、文書廃棄装置および文書管理方法 | |
US20130142433A1 (en) | System and method for fingerprinting for comics | |
CN103154957A (zh) | 出版物的指纹提取方法、出版物的指纹提取装置、利用指纹的出版物识别系统及利用指纹的出版物识别方法 | |
JP2000123020A (ja) | 文書分類装置 | |
JPH0736768A (ja) | 電子ファイル装置 | |
Iwamoto et al. | Pisces Gadiformes: taxonomy of grenadiers of the New Caledonian region, southwest Pacific | |
JP2010176387A (ja) | 電子スクラップシステム、電子スクラップ方法、電子スクラップサーバ、および利用者端末 | |
JP2002251403A (ja) | 文書蓄積・検索システム | |
US8614803B2 (en) | User interface of image forming apparatus with restricted editing function | |
JP2003178009A (ja) | メッセージ処理方法およびその処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050628 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110414 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120414 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130414 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140414 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |