JP2002157262A - 分類ルール定義支援方法 - Google Patents
分類ルール定義支援方法Info
- Publication number
- JP2002157262A JP2002157262A JP2000357623A JP2000357623A JP2002157262A JP 2002157262 A JP2002157262 A JP 2002157262A JP 2000357623 A JP2000357623 A JP 2000357623A JP 2000357623 A JP2000357623 A JP 2000357623A JP 2002157262 A JP2002157262 A JP 2002157262A
- Authority
- JP
- Japan
- Prior art keywords
- classification rule
- classification
- user
- rule
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】分類体系が客観的で複雑な場合、利用者が登録
したい分類ルールが真に妥当か否かを評価するための情
報を利用者に提示することが不可欠である。 【解決手段】利用者が入力した分類ルールを複数の分類
済み電子文書に適用して分類ルールの妥当性を計算し、
利用者に報知する。また、利用者が指定した電子文書を
解析し、関連する分類ルールを複数の分類済み電子文書
を参照して抽出し、利用者に報知する。
したい分類ルールが真に妥当か否かを評価するための情
報を利用者に提示することが不可欠である。 【解決手段】利用者が入力した分類ルールを複数の分類
済み電子文書に適用して分類ルールの妥当性を計算し、
利用者に報知する。また、利用者が指定した電子文書を
解析し、関連する分類ルールを複数の分類済み電子文書
を参照して抽出し、利用者に報知する。
Description
【0001】
【発明の属する技術分野】本発明は、新聞記事やWeb
ページなどの電子文書をその記述形式あるいは内容に応
じて自動分類する文書分類システムに係り、特に分類す
るためのルールを利用者が追加定義する作業を支援する
分類ルール定義支援方法に関する。
ページなどの電子文書をその記述形式あるいは内容に応
じて自動分類する文書分類システムに係り、特に分類す
るためのルールを利用者が追加定義する作業を支援する
分類ルール定義支援方法に関する。
【0002】
【従来の技術】電子文書の属性や記述形式、キーワード
の組合せなどに応じて文書を自動分類する機能がメール
閲覧システム(http://www.lotus.com/home.nsf/we
lcome/ccmail等)や文書管理システム(http://www.
justsystem.co.jp/software/sys/class/class.html
等)などに搭載されている。これらのシステムでは、
(1)分類するためのルールを利用者自身に入力定義さ
せる、(2)カテゴリを特徴付ける代表的な電子文書を
利用者に指定させる、(3)カテゴリ毎にプロファイル
と呼ばれるカテゴリ定義情報を定義させる、のいずれか
によって分類ルールを抽出するリソースデータを定義さ
せ、それらから分類ルールを自動生成し、自動分類を実
現している。
の組合せなどに応じて文書を自動分類する機能がメール
閲覧システム(http://www.lotus.com/home.nsf/we
lcome/ccmail等)や文書管理システム(http://www.
justsystem.co.jp/software/sys/class/class.html
等)などに搭載されている。これらのシステムでは、
(1)分類するためのルールを利用者自身に入力定義さ
せる、(2)カテゴリを特徴付ける代表的な電子文書を
利用者に指定させる、(3)カテゴリ毎にプロファイル
と呼ばれるカテゴリ定義情報を定義させる、のいずれか
によって分類ルールを抽出するリソースデータを定義さ
せ、それらから分類ルールを自動生成し、自動分類を実
現している。
【0003】
【発明が解決しようとする課題】分類体系が利用者個人
の主観によって定義されていたり、カテゴリ数が比較的
少ない場合は、分類ルールの保守・更新も容易である
が、分類体系が客観的で複雑なものになってきて複数の
利用者が分類ルールを共用し、保守するような場合、あ
る利用者が登録した分類ルールが他の既存の分類ルール
に悪影響を及ぼす可能性がある。従って、利用者が登録
しようとしている分類ルールが真に妥当なものである
(信頼度の高い、分類精度を高く維持できるものであ
る)かを評価するための情報を利用者に提示することが
不可欠となる。
の主観によって定義されていたり、カテゴリ数が比較的
少ない場合は、分類ルールの保守・更新も容易である
が、分類体系が客観的で複雑なものになってきて複数の
利用者が分類ルールを共用し、保守するような場合、あ
る利用者が登録した分類ルールが他の既存の分類ルール
に悪影響を及ぼす可能性がある。従って、利用者が登録
しようとしている分類ルールが真に妥当なものである
(信頼度の高い、分類精度を高く維持できるものであ
る)かを評価するための情報を利用者に提示することが
不可欠となる。
【0004】また、そもそも利用者は新しい分類ルール
を追加定義することができない場合が多い。そこで、種
となる文書を指定すると、当該文書に関連する新旧ルー
ルを自動的に抽出し、利用者にその一覧を提示し、取捨
選択させることによって分類ルールの追加登録を支援で
きるような支援が不可欠である。
を追加定義することができない場合が多い。そこで、種
となる文書を指定すると、当該文書に関連する新旧ルー
ルを自動的に抽出し、利用者にその一覧を提示し、取捨
選択させることによって分類ルールの追加登録を支援で
きるような支援が不可欠である。
【0005】
【課題を解決するための手段】本発明では、入力装置を
介して利用者によって入力された分類ルールを複数の分
類済み電子文書に適用することによって当該分類ルール
の妥当性を計算し、前記計算結果を出力装置を介して利
用者に報知することにより、上記課題を解決する。ま
た、本発明では、入力装置を介して利用者によって指定
された電子文書を解析し、当該文書に関連する新しい分
類ルールあるいは既存の分類ルールを複数の分類済み電
子文書を参照することによって抽出し、前記抽出結果を
出力装置を介して利用者に報知することにより、上記課
題を解決する。
介して利用者によって入力された分類ルールを複数の分
類済み電子文書に適用することによって当該分類ルール
の妥当性を計算し、前記計算結果を出力装置を介して利
用者に報知することにより、上記課題を解決する。ま
た、本発明では、入力装置を介して利用者によって指定
された電子文書を解析し、当該文書に関連する新しい分
類ルールあるいは既存の分類ルールを複数の分類済み電
子文書を参照することによって抽出し、前記抽出結果を
出力装置を介して利用者に報知することにより、上記課
題を解決する。
【0006】
【発明の実施の形態】本発明の実施例について、以下図
面を用いて詳細に説明する。なお、これにより本発明が
限定されるものではない。
面を用いて詳細に説明する。なお、これにより本発明が
限定されるものではない。
【0007】本実施例では、新聞記事をその内容に応じ
てカテゴリに分類することを想定している。ルールを登
録する人は新聞記者でもシステム管理者でも構わない。
以下の説明で使用するカテゴリ体系は、新聞の面に相当
するものを用いる。すなわち、「政治」、「経済」、
「国際」、「スポーツ」、「社会」、「文化」などのカ
テゴリからなる。
てカテゴリに分類することを想定している。ルールを登
録する人は新聞記者でもシステム管理者でも構わない。
以下の説明で使用するカテゴリ体系は、新聞の面に相当
するものを用いる。すなわち、「政治」、「経済」、
「国際」、「スポーツ」、「社会」、「文化」などのカ
テゴリからなる。
【0008】分類の対象となる文書は新聞記事以外でも
良い。例えば、Webページや電子メール、特許明細書
などの電子文書についても全く同等に扱える。
良い。例えば、Webページや電子メール、特許明細書
などの電子文書についても全く同等に扱える。
【0009】図1は本発明の概要を示す図である。利用
者1は分類システムの搭載された計算機2に対して、
「(新聞記事の)タイトルに「首相」というキーワード
があれば「政治」カテゴリに分類する」という新しい分
類ルールを追加登録したい旨を計算機2の入力装置を介
して計算機2に伝える(1a)。すると、分類システム
(計算機2)は入力された分類ルール案を受理し、その
ルールが分類ルールとしてどの程度有効であるかを計算
してその結果を計算機2の出力装置を介して利用者1に
報知する。例えば、「ルールの信頼度は95%で妥当で
す。本ルールは856件に適用でき、そのうち813件につい
て正しく分類できました」などと出力する(2a)。利
用者1はその出力結果を受けてそのルールを追加登録す
るか否かを判断する。もし、出力結果が思わしくない場
合、ルールを修正して再チェックすることも可能であ
る。計算機からの出力情報の詳細については図2以降で
述べる。
者1は分類システムの搭載された計算機2に対して、
「(新聞記事の)タイトルに「首相」というキーワード
があれば「政治」カテゴリに分類する」という新しい分
類ルールを追加登録したい旨を計算機2の入力装置を介
して計算機2に伝える(1a)。すると、分類システム
(計算機2)は入力された分類ルール案を受理し、その
ルールが分類ルールとしてどの程度有効であるかを計算
してその結果を計算機2の出力装置を介して利用者1に
報知する。例えば、「ルールの信頼度は95%で妥当で
す。本ルールは856件に適用でき、そのうち813件につい
て正しく分類できました」などと出力する(2a)。利
用者1はその出力結果を受けてそのルールを追加登録す
るか否かを判断する。もし、出力結果が思わしくない場
合、ルールを修正して再チェックすることも可能であ
る。計算機からの出力情報の詳細については図2以降で
述べる。
【0010】図2は本実施例の画面の一例を示す図であ
り、分類ルールの追加登録時に用いる画面である。本画
面10は大きく、利用者1が分類ルール案を入力するエ
リア10aと、そのルールの妥当性を解析した結果を出
力するエリア10bからなる。分類ルール案を入力する
エリアは、ルールの条件部を入力するエリア20と帰結
部を入力するエリア30、ルールではなくて種となる文
書のID(あるいは格納位置)を入力するエリア40か
らなる。図2では、「もし文書のタイトル中にキーワー
ド「首相」が出現し、かつ、文書の本文中にキーワード
「国会」が出現する場合、その文書をカテゴリ「政治」
に分類するというルール案が記述されている。
り、分類ルールの追加登録時に用いる画面である。本画
面10は大きく、利用者1が分類ルール案を入力するエ
リア10aと、そのルールの妥当性を解析した結果を出
力するエリア10bからなる。分類ルール案を入力する
エリアは、ルールの条件部を入力するエリア20と帰結
部を入力するエリア30、ルールではなくて種となる文
書のID(あるいは格納位置)を入力するエリア40か
らなる。図2では、「もし文書のタイトル中にキーワー
ド「首相」が出現し、かつ、文書の本文中にキーワード
「国会」が出現する場合、その文書をカテゴリ「政治」
に分類するというルール案が記述されている。
【0011】ここで、評価ボタン60を押すと、上記ル
ールの妥当性が計算され、その結果が10bに表示され
る。10bでは、当該ルールが妥当であるか否かを判断
した文80と、妥当性(信頼度)を定量的に算出した値
81、当該ルールが適用された文書件数82、適用され
た文書件数のうち正しく分類できた文書件数83、正し
く分類されなかった文書の件数およびその一覧84(選
択して表示ボタンを押すと内容を参照できる)、当該ル
ールに関連するルール一覧85を表示している。
ールの妥当性が計算され、その結果が10bに表示され
る。10bでは、当該ルールが妥当であるか否かを判断
した文80と、妥当性(信頼度)を定量的に算出した値
81、当該ルールが適用された文書件数82、適用され
た文書件数のうち正しく分類できた文書件数83、正し
く分類されなかった文書の件数およびその一覧84(選
択して表示ボタンを押すと内容を参照できる)、当該ル
ールに関連するルール一覧85を表示している。
【0012】利用者はこれらの情報を参考にして、当該
ルールを分類ルールとして追加登録するか否かを判断す
る。また、必要に応じてルールの一部を修正し、妥当性
を再チェックする。追加登録する場合、登録ボタン70
を押下することにより、追加登録される。
ルールを分類ルールとして追加登録するか否かを判断す
る。また、必要に応じてルールの一部を修正し、妥当性
を再チェックする。追加登録する場合、登録ボタン70
を押下することにより、追加登録される。
【0013】また、種文書IDの入力エリア40に文書
IDを入力して評価ボタン60を押下すると、当該種文
書からキーワードを自動抽出してルール候補を自動生成
し、各ルール候補の妥当性をチェックして結果を表示す
る。
IDを入力して評価ボタン60を押下すると、当該種文
書からキーワードを自動抽出してルール候補を自動生成
し、各ルール候補の妥当性をチェックして結果を表示す
る。
【0014】図3は本実施例のブロック構成を示す図で
ある。分類ルール定義支援は、大きくルール解析部10
0、ルール照合部、文書解析部300、評価結果算出部
400、文書表示処理部500、入出力インタフェース
600、分類済み文書インデクス700、分類済み電子
文書800、登録ルール900からなる。
ある。分類ルール定義支援は、大きくルール解析部10
0、ルール照合部、文書解析部300、評価結果算出部
400、文書表示処理部500、入出力インタフェース
600、分類済み文書インデクス700、分類済み電子
文書800、登録ルール900からなる。
【0015】ルール解析部100では、図2の画面を介
して利用者1によって入力された分類ルールを受理し、
ルール照合部200で分類済み文書インデクスと照合で
きるように、分類ルールの構成を解析し、構成要素に分
解する。本実施例では図2に示すようにルールの条件部
と帰結部の入力エリアが明確に区別されているのでルー
ル構成の解析は容易である。また、条件部を構成する条
件もキーワードの入力エリアとキーワード出現位置の入
力エリアが明確に区別されているので、これも解析は容
易である。帰結部においては複数のカテゴリがorで連結
されることも考えられるが、これらの文字列からカテゴ
リ情報を抽出する処理は容易であるためここでは言及し
ない。
して利用者1によって入力された分類ルールを受理し、
ルール照合部200で分類済み文書インデクスと照合で
きるように、分類ルールの構成を解析し、構成要素に分
解する。本実施例では図2に示すようにルールの条件部
と帰結部の入力エリアが明確に区別されているのでルー
ル構成の解析は容易である。また、条件部を構成する条
件もキーワードの入力エリアとキーワード出現位置の入
力エリアが明確に区別されているので、これも解析は容
易である。帰結部においては複数のカテゴリがorで連結
されることも考えられるが、これらの文字列からカテゴ
リ情報を抽出する処理は容易であるためここでは言及し
ない。
【0016】文書解析部200は、図2の画面を介して
利用者1が種文書を指定した場合に起動される。ここで
は、指定された文書IDに対応する文書情報を読み込
み、その文書の特定箇所を自然言語解析し、キーワード
を抽出し、キーワードとその出現箇所を対にして蓄積す
る。これらの対の一つ一つを分類ルール候補として扱
う。この特定箇所をどこにすべきか、またどのような単
語をキーワードとして抽出するかについては予めプロフ
ァイルとして定義しておくことにより設定可能である。
例えば新聞記事で言えば、特定箇所として「タイトルと
本文の最初の一文」、キーワードとして「名詞」と定義
することが可能である(もちろんこれらの設定を受理し
て解析できる処理プログラムは必要である)。
利用者1が種文書を指定した場合に起動される。ここで
は、指定された文書IDに対応する文書情報を読み込
み、その文書の特定箇所を自然言語解析し、キーワード
を抽出し、キーワードとその出現箇所を対にして蓄積す
る。これらの対の一つ一つを分類ルール候補として扱
う。この特定箇所をどこにすべきか、またどのような単
語をキーワードとして抽出するかについては予めプロフ
ァイルとして定義しておくことにより設定可能である。
例えば新聞記事で言えば、特定箇所として「タイトルと
本文の最初の一文」、キーワードとして「名詞」と定義
することが可能である(もちろんこれらの設定を受理し
て解析できる処理プログラムは必要である)。
【0017】ルール照合部300では、分類ルール候補
を分類済み文書インデクスに適用し、どの文書に適用で
きるのかをチェックする。分類済み文書インデクス70
0は図5に示すように、文書ID701、カテゴリ70
2、キーワード703、キーワードの出現位置情報70
4、キーワードの出現頻度705から構成されるデータ
であり、予め分類済み電子文書を自然言語解析して生成
しておく。分類ルール候補の条件部に記載されているキ
ーワードおよびキーワードの出現位置情報が分類済み文
書インデクス700のキーワード703および出現位置
情報704とマッチするか否かをチェックし、条件部の
条件すべてを満たす文書の文書ID701およびそのカ
テゴリ702を対にして抽出する。
を分類済み文書インデクスに適用し、どの文書に適用で
きるのかをチェックする。分類済み文書インデクス70
0は図5に示すように、文書ID701、カテゴリ70
2、キーワード703、キーワードの出現位置情報70
4、キーワードの出現頻度705から構成されるデータ
であり、予め分類済み電子文書を自然言語解析して生成
しておく。分類ルール候補の条件部に記載されているキ
ーワードおよびキーワードの出現位置情報が分類済み文
書インデクス700のキーワード703および出現位置
情報704とマッチするか否かをチェックし、条件部の
条件すべてを満たす文書の文書ID701およびそのカ
テゴリ702を対にして抽出する。
【0018】またルール照合部300では、分類ルール
候補を登録ルール900と比較することにより、分類ル
ール候補に類似する登録ルールを抽出する。登録ルール
900は図4にその一例を示すように、識別子IFを伴
う条件部と、識別子THENを伴う帰結部からなってお
り、これは図2における条件部および帰結部と同一の構
成をなす。ここでは、条件部を比較して、分類ルール候
補の条件部に出現するキーワードと同一のキーワードが
条件部に出現する登録ルールを抽出する。
候補を登録ルール900と比較することにより、分類ル
ール候補に類似する登録ルールを抽出する。登録ルール
900は図4にその一例を示すように、識別子IFを伴
う条件部と、識別子THENを伴う帰結部からなってお
り、これは図2における条件部および帰結部と同一の構
成をなす。ここでは、条件部を比較して、分類ルール候
補の条件部に出現するキーワードと同一のキーワードが
条件部に出現する登録ルールを抽出する。
【0019】評価結果算出部400では、ルール照合部
200での照合結果を受け取って、その分類ルール候補
がどの程度妥当であるかを算出する。ここでは、以下の
数値を計算する。
200での照合結果を受け取って、その分類ルール候補
がどの程度妥当であるかを算出する。ここでは、以下の
数値を計算する。
【0020】(1)分類ルール候補が何件の文書とマッ
チしたか(図2の82に対応)。
チしたか(図2の82に対応)。
【0021】(2)上記(1)のうち、何件の文書を正
しく分類できたか(図2の83に対応)。
しく分類できたか(図2の83に対応)。
【0022】(3)上記(1)のうち、何件の文書を正
しく分類できなかったか(図2の84に対応)。
しく分類できなかったか(図2の84に対応)。
【0023】(4)ルールの信頼度(図2の81に相
当)。
当)。
【0024】(1)については、ルール照合部200で
マッチした文書の数をカウントすることによって容易に
得られる。(2)については分類済み文書インデクス7
00に記述されたカテゴリ702と分類ルール候補で指
定されたカテゴリ31が一致する文書の件数をカウント
することにより容易に得られる。(3)については
(1)の値と(2)の値の差を計算することにより容易
に得られる。また、正しく分類できなかった文書IDを
上記(1)と(2)との差分から取得する。(4)の算
出の一例としては、上記(2)の値を上記(1)で割る
ことが考えられる。
マッチした文書の数をカウントすることによって容易に
得られる。(2)については分類済み文書インデクス7
00に記述されたカテゴリ702と分類ルール候補で指
定されたカテゴリ31が一致する文書の件数をカウント
することにより容易に得られる。(3)については
(1)の値と(2)の値の差を計算することにより容易
に得られる。また、正しく分類できなかった文書IDを
上記(1)と(2)との差分から取得する。(4)の算
出の一例としては、上記(2)の値を上記(1)で割る
ことが考えられる。
【0025】評価結果算出部400で算出された上記数
値は入出力インタフェース600を介して利用者1に図
2の画面として出力される。また、ルール照合部200
で抽出された類似ルールについても利用者1に出力され
る(図2の85に対応)。また、入力された分類ルール
候補が妥当なものか否かを端的に表したメッセージ(図
2の80に対応)の出力については、上記(4)のルー
ルの信頼度の値に閾値を設けておくことにより容易に出
力切換可能である。例えば、上記(4)の値の閾値を9
0%としておくことにより、それより高い場合、「妥当
です」、低い場合「不適切です」と表示させることは容
易である。
値は入出力インタフェース600を介して利用者1に図
2の画面として出力される。また、ルール照合部200
で抽出された類似ルールについても利用者1に出力され
る(図2の85に対応)。また、入力された分類ルール
候補が妥当なものか否かを端的に表したメッセージ(図
2の80に対応)の出力については、上記(4)のルー
ルの信頼度の値に閾値を設けておくことにより容易に出
力切換可能である。例えば、上記(4)の値の閾値を9
0%としておくことにより、それより高い場合、「妥当
です」、低い場合「不適切です」と表示させることは容
易である。
【0026】これらの出力結果から利用者1は当該分類
候補を追加登録するか否かを判断する。利用者1は正し
く分類できなかった文書の内容をチェックすることによ
り、それらがノイズとみなせる文書であるか、正しく分
類できない別の重要要因を持つものであるのかをチェッ
クできる。また、利用者1は図2の画面を介してルール
を修正して再評価することが可能である。
候補を追加登録するか否かを判断する。利用者1は正し
く分類できなかった文書の内容をチェックすることによ
り、それらがノイズとみなせる文書であるか、正しく分
類できない別の重要要因を持つものであるのかをチェッ
クできる。また、利用者1は図2の画面を介してルール
を修正して再評価することが可能である。
【0027】
【発明の効果】本発明によれば、大量の分類済み電子文
書データを参照して、利用者が定義した分類ルールの妥
当性を定量的に評価するので、分類ルールを登録する前
にその影響を把握することができ、信頼度の高い分類ル
ールを維持することができる。
書データを参照して、利用者が定義した分類ルールの妥
当性を定量的に評価するので、分類ルールを登録する前
にその影響を把握することができ、信頼度の高い分類ル
ールを維持することができる。
【図1】本実施例の概要を示す図。
【図2】本実施例の画面の一例を示す図。
【図3】本実施例のブロック構成を示す図。
【図4】分類ルールを示す図。
【図5】分類済み文書インデクスの構成を示す図。
1…ルール解析部、2…文書解析部、3…ルール照合
部、4…評価結果算出部、5…文書表示処理部、6…入
出力インタフェース、7…分類済み文書インデクス、8
…分類済み電子文書。
部、4…評価結果算出部、5…文書表示処理部、6…入
出力インタフェース、7…分類済み文書インデクス、8
…分類済み電子文書。
Claims (7)
- 【請求項1】 分類ルールに基づいて電子文書をカテゴ
リに分類する文書分類システムにおける分類ルール定義
支援方法であって、 入力装置を介して利用者によって入力された分類ルール
を複数の分類済み電子文書に適用することによって当該
分類ルールがどの程度信頼性があり、分類精度の向上あ
るいは維持にどの程度貢献するかを計算し、前記計算結
果を出力装置を介して利用者に報知することを特徴とす
る分類ルール定義支援方法。 - 【請求項2】 請求項1記載の分類ルールは、キーワー
ドの出現形態に関して記述した条件部と、当該条件を満
たした時に分類されるべきカテゴリを記述した帰結部を
含むことを特徴とする請求項1記載の分類ルール定義支
援方法。 - 【請求項3】 請求項2記載の条件部は、あるキーワー
ドが電子文書中のどこに出現したかに関する情報を記述
可能であることを特徴とする請求項2記載の分類ルール
定義支援方法。 - 【請求項4】 請求項1記載の分類ルール定義支援方法
において、利用者に報知する計算結果は、前記利用者が
入力した分類ルールが適用される文書件数あるいはその
割合、当該分類ルールによって正しく分類された文書件
数あるいはその割合、当該分類ルールによって正しく分
類されなくなる文書件数あるいはその割合の少なくとも
一つを含むことを特徴とする分類ルール定義支援方法。 - 【請求項5】 請求項1記載の分類ルール定義支援方法
において、前記利用者が入力した分類ルールに合致しな
かった電子文書あるいは前記合致しなかった電子文書が
分類されるカテゴリ情報を出力装置を介して利用者に報
知することを特徴とする請求項1記載の分類ルール定義
支援方法。 - 【請求項6】 請求項1記載の分類ルール定義支援方法
において、前記利用者が入力した分類ルールに類似した
ルールを既存の分類ルールの中から抽出し、出力装置を
介して利用者に報知することを特徴とする請求項1記載
の分類ルール定義支援方法。 - 【請求項7】 電子文書をその形式あるいは内容に応じ
てカテゴリに分類する分類システムにおける分類ルール
定義支援方法であって、 入力装置を介して利用者によって指定された電子文書を
解析し、当該文書に関連する新しい分類ルールあるいは
既存の分類ルールを複数の分類済み電子文書を参照する
ことによって抽出し、前記抽出結果を出力装置を介して
利用者に報知することを特徴とする分類ルール定義支援
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000357623A JP2002157262A (ja) | 2000-11-20 | 2000-11-20 | 分類ルール定義支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000357623A JP2002157262A (ja) | 2000-11-20 | 2000-11-20 | 分類ルール定義支援方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002157262A true JP2002157262A (ja) | 2002-05-31 |
Family
ID=18829650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000357623A Pending JP2002157262A (ja) | 2000-11-20 | 2000-11-20 | 分類ルール定義支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002157262A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008521088A (ja) * | 2004-11-15 | 2008-06-19 | ベクトン・ディキンソン・アンド・カンパニー | オープンエキスパートシステムと共に使用するグラフィカルユーザインタフェース |
JP2008524712A (ja) * | 2004-12-17 | 2008-07-10 | ゼネラル・エレクトリック・カンパニイ | ドメイン特定のデータ・エンティティ・マッピング方法及びシステム |
WO2009087986A1 (ja) * | 2008-01-10 | 2009-07-16 | Nec Corporation | 情報提供システム、情報提供装置、情報提供方法およびプログラム |
JP2010176665A (ja) * | 2009-01-27 | 2010-08-12 | Palo Alto Research Center Inc | ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 |
US8176050B2 (en) | 2005-08-19 | 2012-05-08 | Fujitsu Limited | Method and apparatus of supporting creation of classification rules |
JP2014059891A (ja) * | 2007-04-10 | 2014-04-03 | Ab Initio Technology Llc | ビジネスルールの編集およびコンパイルの、方法、コンピュータプログラム、およびシステム |
JP2015007922A (ja) * | 2013-06-25 | 2015-01-15 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
US9547638B2 (en) | 2008-06-30 | 2017-01-17 | Ab Initio Technology Llc | Data logging for rule specifications |
US9984059B2 (en) | 2013-09-27 | 2018-05-29 | Ab Initio Technology Llc | Evaluating rules applied to data |
KR102068507B1 (ko) * | 2019-07-11 | 2020-01-21 | (주)시큐레이어 | 기계 학습 모델의 신뢰도를 판단하기 위한 후처리 방법 및 이를 사용한 후처리 장치 |
-
2000
- 2000-11-20 JP JP2000357623A patent/JP2002157262A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008521088A (ja) * | 2004-11-15 | 2008-06-19 | ベクトン・ディキンソン・アンド・カンパニー | オープンエキスパートシステムと共に使用するグラフィカルユーザインタフェース |
JP2008524712A (ja) * | 2004-12-17 | 2008-07-10 | ゼネラル・エレクトリック・カンパニイ | ドメイン特定のデータ・エンティティ・マッピング方法及びシステム |
US8176050B2 (en) | 2005-08-19 | 2012-05-08 | Fujitsu Limited | Method and apparatus of supporting creation of classification rules |
JP2014059891A (ja) * | 2007-04-10 | 2014-04-03 | Ab Initio Technology Llc | ビジネスルールの編集およびコンパイルの、方法、コンピュータプログラム、およびシステム |
US9589232B2 (en) | 2007-04-10 | 2017-03-07 | Ab Initio Technology Llc | Editing and compiling business rules |
WO2009087986A1 (ja) * | 2008-01-10 | 2009-07-16 | Nec Corporation | 情報提供システム、情報提供装置、情報提供方法およびプログラム |
US9547638B2 (en) | 2008-06-30 | 2017-01-17 | Ab Initio Technology Llc | Data logging for rule specifications |
JP2010176665A (ja) * | 2009-01-27 | 2010-08-12 | Palo Alto Research Center Inc | ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 |
JP2015007922A (ja) * | 2013-06-25 | 2015-01-15 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
US9984059B2 (en) | 2013-09-27 | 2018-05-29 | Ab Initio Technology Llc | Evaluating rules applied to data |
US10540436B2 (en) | 2013-09-27 | 2020-01-21 | Ab Initio Technology Llc | Evaluating rules applied to data |
KR102068507B1 (ko) * | 2019-07-11 | 2020-01-21 | (주)시큐레이어 | 기계 학습 모델의 신뢰도를 판단하기 위한 후처리 방법 및 이를 사용한 후처리 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI438637B (zh) | 用於擷取及管理社群智慧資訊的系統及方法 | |
KR101715432B1 (ko) | 단어쌍취득장치, 단어쌍취득방법 및 기록 매체 | |
Evans et al. | A framework for named entity recognition in the open domain. | |
US20160154876A1 (en) | Using context to extract entities from a document collection | |
US20030225763A1 (en) | Self-improving system and method for classifying pages on the world wide web | |
JP3888812B2 (ja) | 事実データ統合方法および装置 | |
US20040236566A1 (en) | System and method for identifying special word usage in a document | |
CN109634436B (zh) | 输入法的联想方法、装置、设备及可读存储介质 | |
JP2008541223A (ja) | 諸文書にわたる文脈要約情報の決定方法 | |
WO2005096182A1 (ja) | 情報抽出システム | |
KR20120109943A (ko) | 문장에 내재한 감정 분석을 위한 감정 분류 방법 | |
CN107506472B (zh) | 一种学生浏览网页分类方法 | |
CN112307336A (zh) | 热点资讯挖掘与预览方法、装置、计算机设备及存储介质 | |
CN111339457A (zh) | 用于从网页抽取信息的方法和设备及存储介质 | |
JP2002157262A (ja) | 分類ルール定義支援方法 | |
JP2016218512A (ja) | 情報処理装置及び情報処理プログラム | |
CN112182451A (zh) | 网页内容摘要生成方法、设备、存储介质及装置 | |
Xu et al. | Using SVM to extract acronyms from text | |
JP2002007433A (ja) | 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム | |
CN109815391A (zh) | 基于大数据的新闻数据分析方法及装置、电子终端 | |
JP3583631B2 (ja) | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN108614825B (zh) | 一种网页特征提取方法和装置 | |
Li et al. | Cleaning web pages for effective web content mining | |
JP2003196294A (ja) | 知識分析システムおよび知識分析方法 | |
JP4525433B2 (ja) | 文書集約装置及びプログラム |