JP3441500B2 - 文書分類装置 - Google Patents
文書分類装置Info
- Publication number
- JP3441500B2 JP3441500B2 JP33059293A JP33059293A JP3441500B2 JP 3441500 B2 JP3441500 B2 JP 3441500B2 JP 33059293 A JP33059293 A JP 33059293A JP 33059293 A JP33059293 A JP 33059293A JP 3441500 B2 JP3441500 B2 JP 3441500B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- documents
- topic structure
- attribute information
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文書検索サービス、電
子会議システム、パソコン通信、電子メールの分野にお
いて、文書の検索,作成,分類等を行う文書分類装置に
関する。
子会議システム、パソコン通信、電子メールの分野にお
いて、文書の検索,作成,分類等を行う文書分類装置に
関する。
【0002】
【従来の技術】従来における文書処理装置に関する例と
しては、以下に述べるようなものがある。まず、第一の
従来例として、特開昭63−175965号公報に「文
書処理装置」として開示されているものがある。これ
は、ユーザが作成した文書や電子メール等から入力され
た文章をその内容に応じて自動的に分類し、中味の概要
を表わす要約テーブルを付けて格納するものであり、こ
れにより、要約テーブルの確認によりユーザが望む文書
を容易に引出すことができる。
しては、以下に述べるようなものがある。まず、第一の
従来例として、特開昭63−175965号公報に「文
書処理装置」として開示されているものがある。これ
は、ユーザが作成した文書や電子メール等から入力され
た文章をその内容に応じて自動的に分類し、中味の概要
を表わす要約テーブルを付けて格納するものであり、こ
れにより、要約テーブルの確認によりユーザが望む文書
を容易に引出すことができる。
【0003】第二の従来例として、特開昭63−225
856号公報に「文書登録装置」として開示されている
ものがある。これは、文書登録の際、文書分類を指定す
ることにより文書分類に固有の分類付属情報を提示し、
文書付属情報を設定するものであり、これにより、ユー
ザが容易にかつ迅速にかつ入力誤りが少なく文書付属情
報を設定することができるようになる。
856号公報に「文書登録装置」として開示されている
ものがある。これは、文書登録の際、文書分類を指定す
ることにより文書分類に固有の分類付属情報を提示し、
文書付属情報を設定するものであり、これにより、ユー
ザが容易にかつ迅速にかつ入力誤りが少なく文書付属情
報を設定することができるようになる。
【0004】第三の従来例として、特開平1−3045
75号公報に「文書処理装置」として開示されているも
のがある。これは、作成された文書を多面的に自動分類
して登録した後、所望の文書を適確にかつ能率的に検索
するものであり、これにより、文書を容易にかつ能率的
に作成することができるようになる。
75号公報に「文書処理装置」として開示されているも
のがある。これは、作成された文書を多面的に自動分類
して登録した後、所望の文書を適確にかつ能率的に検索
するものであり、これにより、文書を容易にかつ能率的
に作成することができるようになる。
【0005】
【発明が解決しようとする課題】第一の従来例では、文
書に対してキーワード抽出を行い、フレーム型の要約テ
ーブルを付与する。ユーザは、その要約テーブルをもと
に文書の検索を行っている。第二の従来例では、ユーザ
が文書にキーワードを付ける時、最初に、文書分類を指
定すると、文書分類毎に登録されたキーワードを表示
し、そのキーワードを用いて文書にキーワード付与を行
っている。第三の従来例では、文書からキーワードを抽
出することによってキーワードを得て、そこから、トピ
ックス名と文書目的名とを得て文書にキーワードとして
付与している。
書に対してキーワード抽出を行い、フレーム型の要約テ
ーブルを付与する。ユーザは、その要約テーブルをもと
に文書の検索を行っている。第二の従来例では、ユーザ
が文書にキーワードを付ける時、最初に、文書分類を指
定すると、文書分類毎に登録されたキーワードを表示
し、そのキーワードを用いて文書にキーワード付与を行
っている。第三の従来例では、文書からキーワードを抽
出することによってキーワードを得て、そこから、トピ
ックス名と文書目的名とを得て文書にキーワードとして
付与している。
【0006】しかし、このような文書処理方法では、文
書に複数のキーワードを付与しているため、検索する時
には便利であるが、いざこれらの文書を分類しようとす
ると、どのように分類すればよいかが一意に決まらず、
これによりユーザサイドで混乱が生じるおそれがある。
しかも、この場合、ある特定の分類体系によって文書を
分類した場合、業務上の都合により分類体系を変えたよ
うな時に全て再分類しなければならないという問題があ
る。
書に複数のキーワードを付与しているため、検索する時
には便利であるが、いざこれらの文書を分類しようとす
ると、どのように分類すればよいかが一意に決まらず、
これによりユーザサイドで混乱が生じるおそれがある。
しかも、この場合、ある特定の分類体系によって文書を
分類した場合、業務上の都合により分類体系を変えたよ
うな時に全て再分類しなければならないという問題があ
る。
【0007】また、特願平5−114424号に「文書
処理装置」として本出願人により出願されているものが
ある。これは、文書に付けられた属性情報をもとに、任
意の分類体系にそって文書を分類するようにしたもので
ある。しかし、この場合、文書の分類はそれぞれの文書
毎に行うため、分類体系を変更した場合、全ての文書に
対して文書毎に再分類を行わなければならないという問
題がある。
処理装置」として本出願人により出願されているものが
ある。これは、文書に付けられた属性情報をもとに、任
意の分類体系にそって文書を分類するようにしたもので
ある。しかし、この場合、文書の分類はそれぞれの文書
毎に行うため、分類体系を変更した場合、全ての文書に
対して文書毎に再分類を行わなければならないという問
題がある。
【0008】
【課題を解決するための手段】請求項1記載の発明で
は、文書データベース中の文書から作者、タイトル、キ
ーワード等の属性情報を抽出する属性抽出部と、この抽
出された属性情報をもとに文書を分類する文書分類部
と、この分類された文書を、属性情報をノードする木構
造である話題構造として表現し格納するフォルダと、文
書の分類時に、前記話題構造から上位ノードをつなげて
付けて表わした話題構造リストを得、この話題構造リス
トの個々の要素と文書に付随した属性情報との一致量を
計算し、この一致量に基づいて文書を分類する一致量文
書分類手段とより文書分類装置を構成した。
は、文書データベース中の文書から作者、タイトル、キ
ーワード等の属性情報を抽出する属性抽出部と、この抽
出された属性情報をもとに文書を分類する文書分類部
と、この分類された文書を、属性情報をノードする木構
造である話題構造として表現し格納するフォルダと、文
書の分類時に、前記話題構造から上位ノードをつなげて
付けて表わした話題構造リストを得、この話題構造リス
トの個々の要素と文書に付随した属性情報との一致量を
計算し、この一致量に基づいて文書を分類する一致量文
書分類手段とより文書分類装置を構成した。
【0009】請求項2記載の発明では、文書データベー
ス中の文書から作者、タイトル、キーワード等の属性情
報を抽出する属性抽出部と、この抽出された属性情報を
もとに文書を分類する文書分類部と、この分類された文
書を、属性情報をノードする 木構造である話題構造から
得られた上位ノードをつなげて付けて表わした話題構造
リストとして格納するフォルダと、文書の分類時に、前
記話題構造リストの個々の要素と文書に付随した属性情
報との一致量を計算し、この一致量に基づいて文書を分
類する一致量文書分類手段とより文書分類装置を構成し
た。
ス中の文書から作者、タイトル、キーワード等の属性情
報を抽出する属性抽出部と、この抽出された属性情報を
もとに文書を分類する文書分類部と、この分類された文
書を、属性情報をノードする 木構造である話題構造から
得られた上位ノードをつなげて付けて表わした話題構造
リストとして格納するフォルダと、文書の分類時に、前
記話題構造リストの個々の要素と文書に付随した属性情
報との一致量を計算し、この一致量に基づいて文書を分
類する一致量文書分類手段とより文書分類装置を構成し
た。
【0010】請求項3記載の発明では、請求項1又は2
記載の発明において、前記属性情報は、文書を引数とす
る述語を含む。
記載の発明において、前記属性情報は、文書を引数とす
る述語を含む。
【0011】請求項4記載の発明では、請求項1又は2
記載の発明において、一致量の高いノードに文書を分類
する。
記載の発明において、一致量の高いノードに文書を分類
する。
【0012】
【作用】請求項1、2記載の発明においては、文書を、
その文書に付随した属性情報から得られた話題構造に基
づいて分類することが可能となる。また、文書を分類す
る際に一致量を計算し、この一致量をもとに適切なフォ
ルダに分類するようにしたことにより、文書を適切なフ
ォルダにユーザの希望する基準によって分類することが
可能となる。
その文書に付随した属性情報から得られた話題構造に基
づいて分類することが可能となる。また、文書を分類す
る際に一致量を計算し、この一致量をもとに適切なフォ
ルダに分類するようにしたことにより、文書を適切なフ
ォルダにユーザの希望する基準によって分類することが
可能となる。
【0013】請求項3記載の発明においては、文書の属
性をもとに、検索条件をノードする木構造状の話題構造
に基づいて分類することが可能となる。
性をもとに、検索条件をノードする木構造状の話題構造
に基づいて分類することが可能となる。
【0014】請求項4記載の発明においては、文書を分
類する際に一致量を計算し、この一致量の最も高い、一
つ又は複数のフォルダに分類することにより、文書を最
も適切なフォルダに自動的に分類することが可能とな
る。
類する際に一致量を計算し、この一致量の最も高い、一
つ又は複数のフォルダに分類することにより、文書を最
も適切なフォルダに自動的に分類することが可能とな
る。
【0015】
【実施例】本発明の一実施例を図1及び図2、表1及び
表2に基づいて説明する。図1は、文書分類装置の基本
的構成をブロック化して示すものであり、文書データベ
ース1と、この文書データベース1の中の文書から作
者、タイトル、キーワード等の属性情報を抽出する属性
抽出部2と、この抽出された属性情報をもとに文書を分
類する文書分類部3と、この分類された文書を話題構造
として表現し格納するフォルダ4とより構成されてい
る。また、本装置は、以下に列挙するような構成要件も
備えている。
表2に基づいて説明する。図1は、文書分類装置の基本
的構成をブロック化して示すものであり、文書データベ
ース1と、この文書データベース1の中の文書から作
者、タイトル、キーワード等の属性情報を抽出する属性
抽出部2と、この抽出された属性情報をもとに文書を分
類する文書分類部3と、この分類された文書を話題構造
として表現し格納するフォルダ4とより構成されてい
る。また、本装置は、以下に列挙するような構成要件も
備えている。
【0016】属性情報に、キーワードをつけた。また、
話題構造を、キーワードをノードする木構造より構成し
た。この場合、前記話題構造を、文書を引数とする述語
をノードとする木構造より構成することもできる。ま
た、前記話題構造を、キーワードリストの集合より構成
することもできる。また、前記話題構造を、文書を引数
とする述語のリストの集合より構成することもできる。
話題構造を、キーワードをノードする木構造より構成し
た。この場合、前記話題構造を、文書を引数とする述語
をノードとする木構造より構成することもできる。ま
た、前記話題構造を、キーワードリストの集合より構成
することもできる。また、前記話題構造を、文書を引数
とする述語のリストの集合より構成することもできる。
【0017】また、分類に基づいて文書を一覧する文書
一覧手段を設けた。分類時に、文書に付随した属性情報
と話題構造のノードとから一致量を計算し、この一致量
に基づいて文書を分類する一致量文書分類手段を設け
た。この場合、一致量の高いノードに文書を分類するノ
ード文書分類手段を設けることもできる。その一致量
は、ノードのリスト表現の個々の要素と一致するものに
より計算して得ることができる。
一覧手段を設けた。分類時に、文書に付随した属性情報
と話題構造のノードとから一致量を計算し、この一致量
に基づいて文書を分類する一致量文書分類手段を設け
た。この場合、一致量の高いノードに文書を分類するノ
ード文書分類手段を設けることもできる。その一致量
は、ノードのリスト表現の個々の要素と一致するものに
より計算して得ることができる。
【0018】次に、上述した図1の構成に対応する具体
例について説明する。まず、文書データベース1の文書
は、属性抽出部2により属性が抽出される。ここでいう
属性とは、作者、タイトル、キーワード等である。文書
分類部3は、その属性をもとに文書を分類する。この分
類結果はフォルダ4に話題構造を表現した状態で格納さ
れる。
例について説明する。まず、文書データベース1の文書
は、属性抽出部2により属性が抽出される。ここでいう
属性とは、作者、タイトル、キーワード等である。文書
分類部3は、その属性をもとに文書を分類する。この分
類結果はフォルダ4に話題構造を表現した状態で格納さ
れる。
【0019】図2は、フォルダ4内の話題構造の例を示
したものである。話題構造は、話題をノードとする木構
造である。この木構造のルートは、「.」で表わす。ル
ートの下位ノードとして、general(一般)、chat(おし
ゃべり)に分かれ、generalは、society (社会)、sci
ence (科学)、culture (文化)に分かれる。また、s
ociety の下には、smoking (たばこに関する話題)が
あり、culture の下にはjapan(日本)、india (イン
ド)があり、science の下にもsmokingがあるがこれは
科学的立場からたばこをとらえた場合の分類である。フ
ォルダ4は、このような話題構造を実現したもので、ge
neral 、culture といった個々のノードに文書を格納で
きる。
したものである。話題構造は、話題をノードとする木構
造である。この木構造のルートは、「.」で表わす。ル
ートの下位ノードとして、general(一般)、chat(おし
ゃべり)に分かれ、generalは、society (社会)、sci
ence (科学)、culture (文化)に分かれる。また、s
ociety の下には、smoking (たばこに関する話題)が
あり、culture の下にはjapan(日本)、india (イン
ド)があり、science の下にもsmokingがあるがこれは
科学的立場からたばこをとらえた場合の分類である。フ
ォルダ4は、このような話題構造を実現したもので、ge
neral 、culture といった個々のノードに文書を格納で
きる。
【0020】次に、文書の分類の第一の例について述べ
る。
る。
【0021】ある文書につけられたキーワードが、smok
ing とindia の場合、その文書は、「インドのタバコに
関する文書」を表わしていると考えられる。このような
文書は、フォルダ4のsmoking とindia の両方に格納さ
れることが望ましい。そこで、今、この場合の分類の手
順について述べる。まず、話題構造から、次のようなリ
ストを得る。
ing とindia の場合、その文書は、「インドのタバコに
関する文書」を表わしていると考えられる。このような
文書は、フォルダ4のsmoking とindia の両方に格納さ
れることが望ましい。そこで、今、この場合の分類の手
順について述べる。まず、話題構造から、次のようなリ
ストを得る。
【0022】
(general
general.society
general.society.smoking
general.science
general.science.smoking
general.culture
general.culture.japan
general.culture.india
chat)
これは、話題構造の各ノードを、その上位ノードをつな
げて付けて表わしたものである。これを話題構造リスト
Tと便宜的に呼ぶ。一方、文書につけられたキーワード
は、{smoking、india}である。これをキーワードKと
呼ぶ。
げて付けて表わしたものである。これを話題構造リスト
Tと便宜的に呼ぶ。一方、文書につけられたキーワード
は、{smoking、india}である。これをキーワードKと
呼ぶ。
【0023】Tの個々の要素tiに対して、一致量を計
算する。一致量は、{K中にあるキーワードの集合A、
K中にないキーワードの集合B}という2つの組で表わ
す。Tの一致量の計算結果を表1に示す。
算する。一致量は、{K中にあるキーワードの集合A、
K中にないキーワードの集合B}という2つの組で表わ
す。Tの一致量の計算結果を表1に示す。
【表1】
次に、その得られた一致量から、文書を格納すべき場所
を求める。まず、一致量の中から、K中にあるキーワー
ドが他の候補のサブセットになるようなものを除く。こ
の例では、集合Aが空集合であるものが除かれる。すな
わち、 ({smoking},{general.society}) ({smoking},{general.science}) ({india} ,{general.culture}) が残る。次に、集合Aが同じ場合には、集合Bが他の候
補のスーパーセットになっているものを除く。この例で
は、このようなものはない。従って、最終的に、 general.society.smoking general.science.smoking general.culture.india が得られることになり、このような値が求める文書を格
納すべき場所となる。このように格納する場所はひとつ
とは限らないが、文書をコピーしたり、或いは、リンク
をはることにより可能である。
を求める。まず、一致量の中から、K中にあるキーワー
ドが他の候補のサブセットになるようなものを除く。こ
の例では、集合Aが空集合であるものが除かれる。すな
わち、 ({smoking},{general.society}) ({smoking},{general.science}) ({india} ,{general.culture}) が残る。次に、集合Aが同じ場合には、集合Bが他の候
補のスーパーセットになっているものを除く。この例で
は、このようなものはない。従って、最終的に、 general.society.smoking general.science.smoking general.culture.india が得られることになり、このような値が求める文書を格
納すべき場所となる。このように格納する場所はひとつ
とは限らないが、文書をコピーしたり、或いは、リンク
をはることにより可能である。
【0024】次に、文書の分類の第二の例について述べ
る。ある文書には、キーワードとして、smoking 、scie
nce がつけられているものとする。この文書は「たばこ
における科学的な内容」を表わしていると考えられる。
このような内容について一致量を求めると、表2のよう
な内容となる。
る。ある文書には、キーワードとして、smoking 、scie
nce がつけられているものとする。この文書は「たばこ
における科学的な内容」を表わしていると考えられる。
このような内容について一致量を求めると、表2のよう
な内容となる。
【表2】
従って、
({science.smoking},{general})
が得られ、
general.science.smoking
が文書を格納する場所になる。
【0025】従って、文書に付随した属性情報から、文
書のキーワードをつけるだけで、ユーザの用意した話題
構造に沿って、文書を自動的に分類整理することができ
る。この場合、文書の作者や日付といった任意の属性を
もとに自動的にフォルダ4に分類していくことができ、
これにより、話題構造は無理に木構造にする必要がなく
なりユーザに使い易くすることができる。また、文書を
分類する時に、キーワードや検索条件にどれだけ一致す
るか、どれだけ一致しないキーワードや検索条件がある
かという2つの基準によって分類するため、文書を正確
に適切な場所に分類することができる。
書のキーワードをつけるだけで、ユーザの用意した話題
構造に沿って、文書を自動的に分類整理することができ
る。この場合、文書の作者や日付といった任意の属性を
もとに自動的にフォルダ4に分類していくことができ、
これにより、話題構造は無理に木構造にする必要がなく
なりユーザに使い易くすることができる。また、文書を
分類する時に、キーワードや検索条件にどれだけ一致す
るか、どれだけ一致しないキーワードや検索条件がある
かという2つの基準によって分類するため、文書を正確
に適切な場所に分類することができる。
【0026】次に、本発明の別の実施例を図3及び図
4、表3に基づいて説明する(請求項3に対応)。図3
は、前述した図1の文書分類装置に代わる構成例を示す
ものである。すなわち、本装置は、到着した電子メール
を受信する電子メール受信部5と、ユーザがキーワード
を入力するキーワード入力部6と、受信した電子メール
の分類を行う電子メール分類部7と、その分類された電
子メールを話題構造として表現し格納するフォルダ8
と、そのフォルダ8内の電子メールをフォルダ毎に表示
する電子メール表示部9とからなっている。また、本装
置では、以下に列挙するような構成要件も備えている。
4、表3に基づいて説明する(請求項3に対応)。図3
は、前述した図1の文書分類装置に代わる構成例を示す
ものである。すなわち、本装置は、到着した電子メール
を受信する電子メール受信部5と、ユーザがキーワード
を入力するキーワード入力部6と、受信した電子メール
の分類を行う電子メール分類部7と、その分類された電
子メールを話題構造として表現し格納するフォルダ8
と、そのフォルダ8内の電子メールをフォルダ毎に表示
する電子メール表示部9とからなっている。また、本装
置では、以下に列挙するような構成要件も備えている。
【0027】電子メールを受信したことをフォルダ8毎
に表示するフォルダ表示手段を有している。また、電子
メールを前記キーワード入力部6より入力されたキーワ
ードとヘッダ情報とをもとにフォルダ8内に格納する。
に表示するフォルダ表示手段を有している。また、電子
メールを前記キーワード入力部6より入力されたキーワ
ードとヘッダ情報とをもとにフォルダ8内に格納する。
【0028】次に、上述した図3の構成に対応する具体
的な例について説明する。本実施例は、受信した電子メ
ールを、自動的に話題構造に基づいてフォルダ8に分類
する場合について述べるものである。まず、電子メール
受信部5は、到着した電子メールを受信する。キーワー
ド入力部6は、ユーザにキーワードの入力を問い合わせ
る。電子メール分類部7は、ユーザの入力したキーワー
ドと、電子メールのヘッダ情報とから、フォルダ8への
分類を行う。電子メール表示部9は、フォルダ8毎に電
子メールの表示を行う。分類結果はフォルダ8に話題構
造を表現した状態で格納される。
的な例について説明する。本実施例は、受信した電子メ
ールを、自動的に話題構造に基づいてフォルダ8に分類
する場合について述べるものである。まず、電子メール
受信部5は、到着した電子メールを受信する。キーワー
ド入力部6は、ユーザにキーワードの入力を問い合わせ
る。電子メール分類部7は、ユーザの入力したキーワー
ドと、電子メールのヘッダ情報とから、フォルダ8への
分類を行う。電子メール表示部9は、フォルダ8毎に電
子メールの表示を行う。分類結果はフォルダ8に話題構
造を表現した状態で格納される。
【0029】図4は、フォルダ8内の話題構造の例を示
したものである。便宜上、ルートのフォルダ8
は、「.」で表わしている。まず、フォルダ8は、proj
ect A、project B、rec に分けられる。project Aは
さらに細分化され、meeting (会議に関するもの)と、
From =fujita(作者が藤田=ここではプロジェクトの
リーダとするもの)とに分かれる。meeting はその下位
分類としてgijiroku(議事録)があり、From =fujita
は、下位分類としてrenraku (連絡事項)とshiji(指
示)がある。rec の下には、Subject=enkai (enkai
をサブジェクトするもの)をもつ。
したものである。便宜上、ルートのフォルダ8
は、「.」で表わしている。まず、フォルダ8は、proj
ect A、project B、rec に分けられる。project Aは
さらに細分化され、meeting (会議に関するもの)と、
From =fujita(作者が藤田=ここではプロジェクトの
リーダとするもの)とに分かれる。meeting はその下位
分類としてgijiroku(議事録)があり、From =fujita
は、下位分類としてrenraku (連絡事項)とshiji(指
示)がある。rec の下には、Subject=enkai (enkai
をサブジェクトするもの)をもつ。
【0030】ここで、今、プロジェクトAのリーダであ
るfujitaから議事録の作成を依頼する電子メールが届い
た場合の例について説明する。まず、電子メール受信部
5が、電子メールを受信する。ユーザは、電子メールを
読んで内容を理解し、その内容をフォルダ8に格納しよ
うとする。そこで、キーワード入力部が、ユーザにキー
ワードの入力を要求する。ユーザは、プロジェクトAに
おける議事録に関するものであるため、gijirokuとproj
ect Aとの2つのキーワードを入力する。この場合、話
題構造リストの一致量を計算すると、表3のようにな
る。
るfujitaから議事録の作成を依頼する電子メールが届い
た場合の例について説明する。まず、電子メール受信部
5が、電子メールを受信する。ユーザは、電子メールを
読んで内容を理解し、その内容をフォルダ8に格納しよ
うとする。そこで、キーワード入力部が、ユーザにキー
ワードの入力を要求する。ユーザは、プロジェクトAに
おける議事録に関するものであるため、gijirokuとproj
ect Aとの2つのキーワードを入力する。この場合、話
題構造リストの一致量を計算すると、表3のようにな
る。
【表3】
ここで、From=fujita は、電子メールの送付者がfuji
taである場合に真になるものとする。この計算により、
まず、キーワードと一致するものの集合を考えると、 ({projectA,gijiroku}),{meeting}) ({projectA,From=fujita},{}) ({projectA,From=fujita},{renraku}) ({projectA,From=fujita},{shiji}) が残る。この中から、次にキーワードと一致しないもの
の集合を考えると、 projectA,gijiroku,meeting projectA,From=fujita の2つの場所に、電子メールが格納されたことになる。
taである場合に真になるものとする。この計算により、
まず、キーワードと一致するものの集合を考えると、 ({projectA,gijiroku}),{meeting}) ({projectA,From=fujita},{}) ({projectA,From=fujita},{renraku}) ({projectA,From=fujita},{shiji}) が残る。この中から、次にキーワードと一致しないもの
の集合を考えると、 projectA,gijiroku,meeting projectA,From=fujita の2つの場所に、電子メールが格納されたことになる。
【0031】従って、本実施例では、単にキーワードだ
けでなく、作者(From)やタイトル(Subject)とい
ったヘッダ情報をもとに、ユーザの用意したフォルダ8
に分類するため、到着した電子メールを自動的に適切な
条件に応じて、任意の体系で分類することができる。ま
た、分類体系に応じて表示することにより、特定の条件
に合う電子メールを探そうとした場合に、予めその条件
によって分類されていれば、再度、検索をしなくても済
むようになる。さらに、キーワードに基づいて分類する
ことにより、自然に楽な形で分類、保存、再表示を行う
ことができる。さらにまた、フォルダ表示手段を設けた
ことにより、ユーザは、特定の条件にあった電子メール
だけの受信を知ることができ、これにより緊急度の高さ
に応じて適切な対応をすることができる。
けでなく、作者(From)やタイトル(Subject)とい
ったヘッダ情報をもとに、ユーザの用意したフォルダ8
に分類するため、到着した電子メールを自動的に適切な
条件に応じて、任意の体系で分類することができる。ま
た、分類体系に応じて表示することにより、特定の条件
に合う電子メールを探そうとした場合に、予めその条件
によって分類されていれば、再度、検索をしなくても済
むようになる。さらに、キーワードに基づいて分類する
ことにより、自然に楽な形で分類、保存、再表示を行う
ことができる。さらにまた、フォルダ表示手段を設けた
ことにより、ユーザは、特定の条件にあった電子メール
だけの受信を知ることができ、これにより緊急度の高さ
に応じて適切な対応をすることができる。
【0032】次に、本発明の第一の参考例を図5〜図
7、表4に基づいて説明する。図5は、前述した図1,
図3の文書分類装置に代わる構成例を示すものである。
すなわち、本装置は、ニュース記事を受信するニュース
受信部10と、そのニュース記事につけられたニュース
グループ名を分解しキーワードの形に直すニュースグル
ープ名解析部11と、キーワードをもとにニュース記事
を分類する記事分類部12と、この分類されたニュース
記事を話題構造として表現し格納するフォルダ13と、
フォルダ13内のニュース記事をフォルダ毎に表示する
ニュース表示部14とからなっている。
7、表4に基づいて説明する。図5は、前述した図1,
図3の文書分類装置に代わる構成例を示すものである。
すなわち、本装置は、ニュース記事を受信するニュース
受信部10と、そのニュース記事につけられたニュース
グループ名を分解しキーワードの形に直すニュースグル
ープ名解析部11と、キーワードをもとにニュース記事
を分類する記事分類部12と、この分類されたニュース
記事を話題構造として表現し格納するフォルダ13と、
フォルダ13内のニュース記事をフォルダ毎に表示する
ニュース表示部14とからなっている。
【0033】次に、上述した図5の構成に対応する具体
例について説明する。本参考例は、電子提示板やニュー
スといったメディアから流れてくる記事を、自分の好み
の話題構造で再分類する場合の例を示すものである。ま
ず、ニュース受信部10は、ニュース記事を受信する。
ここで、ニュース記事とは、属性としてNG(ニュース
グループ)名がつけられた一つの文書である。NG名
は、一つとは限らず複数つけられることもある。そし
て、ニュースグループ名解析部11は、ニュース記事に
付けられたNGを分解し、キーワードの形に直す。記事
分類部12は、このようなキーワードをもとに、ニュー
ス記事をフォルダ13に分類する。ニュース表示部14
は、フォルダ毎に記事を表示する。
例について説明する。本参考例は、電子提示板やニュー
スといったメディアから流れてくる記事を、自分の好み
の話題構造で再分類する場合の例を示すものである。ま
ず、ニュース受信部10は、ニュース記事を受信する。
ここで、ニュース記事とは、属性としてNG(ニュース
グループ)名がつけられた一つの文書である。NG名
は、一つとは限らず複数つけられることもある。そし
て、ニュースグループ名解析部11は、ニュース記事に
付けられたNGを分解し、キーワードの形に直す。記事
分類部12は、このようなキーワードをもとに、ニュー
ス記事をフォルダ13に分類する。ニュース表示部14
は、フォルダ毎に記事を表示する。
【0034】図6は、ニュースグループの構成の一例を
示すものである。ニュース記事は、これらニュースグル
ープ名が属性としてつけられている。複数のニュースグ
ループ名をつけることをクロスポストといい、それぞれ
のニュースグループに投稿したことになる。また、図7
は、フォルダ13内の話題構造の例を示したものであ
る。ニュースグループの構成と異なる構成を、個人用の
分類として用意することができる。
示すものである。ニュース記事は、これらニュースグル
ープ名が属性としてつけられている。複数のニュースグ
ループ名をつけることをクロスポストといい、それぞれ
のニュースグループに投稿したことになる。また、図7
は、フォルダ13内の話題構造の例を示したものであ
る。ニュースグループの構成と異なる構成を、個人用の
分類として用意することができる。
【0035】さて、ニュースグループ名として、rico
h.rec.go(囲碁に関する話題)と、ricoh.sys.soft
(ソフトウェア)のつけられた記事が到着した場合を例
に説明する。この場合、ニュース記事の内容は囲碁のソ
フトに関するものだと推定される。ニュース記事をフォ
ルダ13に格納する場合には、sys.soft.games.goと
いうフォルダ13が望ましい。
h.rec.go(囲碁に関する話題)と、ricoh.sys.soft
(ソフトウェア)のつけられた記事が到着した場合を例
に説明する。この場合、ニュース記事の内容は囲碁のソ
フトに関するものだと推定される。ニュース記事をフォ
ルダ13に格納する場合には、sys.soft.games.goと
いうフォルダ13が望ましい。
【0036】まず、ニュース受信部10は、ニュース記
事を受信する。次に、ニュースグループ名解析部11は
ニュースグループ名を解析する。これは、ピリオドで区
切られたNG名を分解する処理に当たる。これにより、
キーワードとして、ricoh,rec,go,sys,softが得ら
れる。次に、記事分類部12は、このキーワードをもと
にニュース記事をフォルダ13に分類する。すなわち、
まず、一致量を求めると、表4のようになる。
事を受信する。次に、ニュースグループ名解析部11は
ニュースグループ名を解析する。これは、ピリオドで区
切られたNG名を分解する処理に当たる。これにより、
キーワードとして、ricoh,rec,go,sys,softが得ら
れる。次に、記事分類部12は、このキーワードをもと
にニュース記事をフォルダ13に分類する。すなわち、
まず、一致量を求めると、表4のようになる。
【表4】
これにより、一致量として、
({sys,soft,go},{games})
が残る。これに対応するフォルダ13としては、
sys.soft.games.go
に格納する。また、ニュース表示部14は、ユーザがフ
ォルダ13を選択した時、その選択した記事を表示す
る。
ォルダ13を選択した時、その選択した記事を表示す
る。
【0037】従って、本参考例では、記事につけられた
ニュースグループ名を分解再構成し、ユーザは自分の分
類体系にのっとってニュース記事を分類し、表示するこ
とができ、これにより、ユーザは予め用意されたニュー
スグループ体系とは異なった自分独自のニュースグルー
プ体系を作ることができる。また、フォルダ毎にまとま
りにして表示することにより、ユーザは自分独自のニュ
ースグループ体系で、違和感なく、ニュース記事を読む
ことができる。
ニュースグループ名を分解再構成し、ユーザは自分の分
類体系にのっとってニュース記事を分類し、表示するこ
とができ、これにより、ユーザは予め用意されたニュー
スグループ体系とは異なった自分独自のニュースグルー
プ体系を作ることができる。また、フォルダ毎にまとま
りにして表示することにより、ユーザは自分独自のニュ
ースグループ体系で、違和感なく、ニュース記事を読む
ことができる。
【0038】次に、本発明の第二の参考例を図2及び図
8に基づいて説明する。図8は、前述した図1,図3,
図5の文書分類装置に代わる構成例を示すものである。
すなわち、本装置は、作者、タイトル、キーワード等の
属性情報の付与された文書の集合からなる文書データベ
ース15と、属性間の分類体系をノードにより定義した
トピック構造の集合からなるトピック構造定義ファイル
16と、文書の集合の中からトピック構造の各ノードに
適した文書を配置する文書配置分類手段17とからなっ
ている。
8に基づいて説明する。図8は、前述した図1,図3,
図5の文書分類装置に代わる構成例を示すものである。
すなわち、本装置は、作者、タイトル、キーワード等の
属性情報の付与された文書の集合からなる文書データベ
ース15と、属性間の分類体系をノードにより定義した
トピック構造の集合からなるトピック構造定義ファイル
16と、文書の集合の中からトピック構造の各ノードに
適した文書を配置する文書配置分類手段17とからなっ
ている。
【0039】文書配置分類手段17は、トピック構造の
各ノードに配置されるべき文書を検索する文書検索式を
予め求めておく文書検索式生成手段としての文書検索式
生成部18と、トピック構造の各ノードに配置されるべ
き文書を検索する文書検索手段としての文書検索部19
と、その検索した文書をユーザに対して提示する文書提
示手段としての文書表示部20とからなっている。
各ノードに配置されるべき文書を検索する文書検索式を
予め求めておく文書検索式生成手段としての文書検索式
生成部18と、トピック構造の各ノードに配置されるべ
き文書を検索する文書検索手段としての文書検索部19
と、その検索した文書をユーザに対して提示する文書提
示手段としての文書表示部20とからなっている。
【0040】この場合、トピック構造は、キーワードを
ノードとする木構造、又は、文書を引数とする述語をノ
ードとする木構造から構成することができる。また、ト
ピック構造の各ノード毎に配置すべき文書を既読又は未
読又はその両方について求め、文書毎に既読情報を付与
する既読情報付与手段(図示せず)を設けることもでき
る。
ノードとする木構造、又は、文書を引数とする述語をノ
ードとする木構造から構成することができる。また、ト
ピック構造の各ノード毎に配置すべき文書を既読又は未
読又はその両方について求め、文書毎に既読情報を付与
する既読情報付与手段(図示せず)を設けることもでき
る。
【0041】次に、上述した図8の構成に対応する具体
例について説明する。まず、文書検索式生成部18は、
トピック構造ファイル定義ファイル16内のトピック構
造の各ノードに対して、文書検索式を生成する。次に、
文書検索部19は、その生成された文書検索式に基づい
て、文書データベース15から文書を検索する。そし
て、文書表示部20は、その検索した文書をユーザに対
して提示(表示、出力)する。これにより、トピック構
造定義ファイル16を変更したような場合でも、検索式
生成をやり直すだけで済むため、動的な分類体系の変更
を行うことができる。
例について説明する。まず、文書検索式生成部18は、
トピック構造ファイル定義ファイル16内のトピック構
造の各ノードに対して、文書検索式を生成する。次に、
文書検索部19は、その生成された文書検索式に基づい
て、文書データベース15から文書を検索する。そし
て、文書表示部20は、その検索した文書をユーザに対
して提示(表示、出力)する。これにより、トピック構
造定義ファイル16を変更したような場合でも、検索式
生成をやり直すだけで済むため、動的な分類体系の変更
を行うことができる。
【0042】ここで、トピック構造の例を、前記図2に
基づいて説明する。この場合、トピック構造はキーワー
ドをノードとする木構造である。この木構造のルート
は、「.」で表わす。この例では、ルートの下位ノード
として、general(一般)、chat(おしゃべり)があり、
general は、society (社会)、science (科学)、cu
lture (文化)に分かれる。また、society の下には、
smoking (たばこに関する話題)があり、culture の下
にはjapan(日本)、india (インド)がある。science
の下にもsmoking があるが、これは科学的立場からた
ばこをとらえた場合の分類である。このように、トピッ
ク構造により話題間の構造が定義され、そのトピック構
造のノードに文書を配置することにより、文書の分類を
行うことができる。
基づいて説明する。この場合、トピック構造はキーワー
ドをノードとする木構造である。この木構造のルート
は、「.」で表わす。この例では、ルートの下位ノード
として、general(一般)、chat(おしゃべり)があり、
general は、society (社会)、science (科学)、cu
lture (文化)に分かれる。また、society の下には、
smoking (たばこに関する話題)があり、culture の下
にはjapan(日本)、india (インド)がある。science
の下にもsmoking があるが、これは科学的立場からた
ばこをとらえた場合の分類である。このように、トピッ
ク構造により話題間の構造が定義され、そのトピック構
造のノードに文書を配置することにより、文書の分類を
行うことができる。
【0043】次に、文書検索式の生成方法について述べ
る。まず、話題構造から、次のようなリストを得る。
る。まず、話題構造から、次のようなリストを得る。
【0044】
(general
general.society
general.society.smoking
general.science
general.science.smoking
general.culture
general.culture.japan
general.culture.india
chat)
これは、トピック構造の各ノードを、その上位ノードを
つなげて付けて表わしたものである。そこで、今、ノー
ドgeneral.society.smoking (このノードをTとす
る)に配置される文書を検索する文書検索式を求めてみ
る。
つなげて付けて表わしたものである。そこで、今、ノー
ドgeneral.society.smoking (このノードをTとす
る)に配置される文書を検索する文書検索式を求めてみ
る。
【0045】トピック構造に含まれるノードが、genera
l.society.smoking だけならば、文書検索式は、gene
ral|society|smoking である(ここで、文書検索中の
キーワードは、そのキーワードを含む文書を検索する式
とする。記号|はorの意味である)。ところが、この
他にも、ノードがある場合、そのノードに置かれる文書
の分を減らす必要がある。今、Tの文書検索式の初期値
をSexpr=general|society|smoking とし、まず、
そのTとgeneral(Sとする)とにより、次のような処理
を行う。
l.society.smoking だけならば、文書検索式は、gene
ral|society|smoking である(ここで、文書検索中の
キーワードは、そのキーワードを含む文書を検索する式
とする。記号|はorの意味である)。ところが、この
他にも、ノードがある場合、そのノードに置かれる文書
の分を減らす必要がある。今、Tの文書検索式の初期値
をSexpr=general|society|smoking とし、まず、
そのTとgeneral(Sとする)とにより、次のような処理
を行う。
【0046】TとSとの両方に含まれるキーワードが
ない場合は、Sexprはそのままとする。
ない場合は、Sexprはそのままとする。
【0047】そうでない場合は、次のようにする。
【0048】(a)AをTに含まれSに含まれるキーワ
ードを|でつないだものとする。
ードを|でつないだものとする。
【0049】(b)BをSに含まれTに含まれるキーワ
ードを|でつないだものとする。
ードを|でつないだものとする。
【0050】(c)SexprからSに「だけ」配置される
文書を除かなければならない。
文書を除かなければならない。
【0051】すなわち、Sexpr=Sexpr−(B&~A)
となる。
となる。
【0052】ただし、&はand、~はnotの意味で
ある。
ある。
【0053】(d)Sexpr=Sexpr&(A|~B)とな
る。
る。
【0054】このような手順()により、
Sexpr=(general|society|smoking)&(society|
smoking) となる。また、これと同様にして、Tとトピック構造の
他のノードとの間で処理を行うと、 Sexpr=(general|society|smoking) &(society|smoking) &(smoking) &(society|smoking|~science) &(society|~science) &(society|smoking|~culture) &(society|smoking|~(culture|japan)) &(society|smoking|~(culture|india)) =smoking&(society|~science) となり、Tに対する文書検索式を求めることができる。
このような一連の作業をトピック構造の全てのノードで
行うことにより、文書の文書検索式を予め求めておくこ
とができる。
smoking) となる。また、これと同様にして、Tとトピック構造の
他のノードとの間で処理を行うと、 Sexpr=(general|society|smoking) &(society|smoking) &(smoking) &(society|smoking|~science) &(society|~science) &(society|smoking|~culture) &(society|smoking|~(culture|japan)) &(society|smoking|~(culture|india)) =smoking&(society|~science) となり、Tに対する文書検索式を求めることができる。
このような一連の作業をトピック構造の全てのノードで
行うことにより、文書の文書検索式を予め求めておくこ
とができる。
【0055】従って、本参考例では、分類体系を表現し
たトピック構造に基づいて文書を分類するため、文書を
ユーザ毎に分類整理することができる。これにより、分
類体系の動的な変更に応じて、文書毎の再分類の必要の
ない文書分類装置を提供することができる。また、分類
体系の各ノードに対応した文書検索式を予め求めておく
ことにより、文書を動的に、しかも、高速に分類整理す
ることができる。さらに、トピック構造のノードを任意
にキーワードで表現することにより、文書をキーワード
付けするだけで、分類体系に基づいて分類することがで
きる。
たトピック構造に基づいて文書を分類するため、文書を
ユーザ毎に分類整理することができる。これにより、分
類体系の動的な変更に応じて、文書毎の再分類の必要の
ない文書分類装置を提供することができる。また、分類
体系の各ノードに対応した文書検索式を予め求めておく
ことにより、文書を動的に、しかも、高速に分類整理す
ることができる。さらに、トピック構造のノードを任意
にキーワードで表現することにより、文書をキーワード
付けするだけで、分類体系に基づいて分類することがで
きる。
【0056】また、トピック構造の各ノードを、任意に
文書を引数とする述語すなわち特定の文書を検索する文
書検索式(例えば、作者=itoh)とすることによ
り、文書の作者や日付といった任意の属性をもとに、動
的な分類を行うことができる。これにより、キーワード
の付けられていない文書も同様に分類することができ
る。さらに、文書毎に既読かどうかを検索式に含めるよ
うにすることによって、文書を既読、未読、その両方に
ついて、それぞれノードに置かれる文書を求めることも
できる。
文書を引数とする述語すなわち特定の文書を検索する文
書検索式(例えば、作者=itoh)とすることによ
り、文書の作者や日付といった任意の属性をもとに、動
的な分類を行うことができる。これにより、キーワード
の付けられていない文書も同様に分類することができ
る。さらに、文書毎に既読かどうかを検索式に含めるよ
うにすることによって、文書を既読、未読、その両方に
ついて、それぞれノードに置かれる文書を求めることも
できる。
【0057】
【発明の効果】請求項1記載の発明は、文書に付随した
属性情報から得られた話題構造に基づいて分類すること
ができ、これにより、文書を自動的に分類整理すること
ができる。また、文書を分類する際に一致量を計算し、
この一致量をもとに適切なフォルダに分類することによ
り、文書を適切なフォルダにユーザの希望する基準によ
って分類することができる。
属性情報から得られた話題構造に基づいて分類すること
ができ、これにより、文書を自動的に分類整理すること
ができる。また、文書を分類する際に一致量を計算し、
この一致量をもとに適切なフォルダに分類することによ
り、文書を適切なフォルダにユーザの希望する基準によ
って分類することができる。
【0058】請求項2記載の発明は、文書に付随した属
性情報から得られた話題構造に基づいて分類することが
でき、これにより、文書を自動的に分類整理することが
できる。また、文書を分類する際に一致量を計算し、こ
の一致量をもとに適切なフォルダに分類することによ
り、文書を適切なフォルダにユーザの希望する基準によ
って分類することができる。さらに、話題構造を無理に
木構造にする必要をなくすことができる。
性情報から得られた話題構造に基づいて分類することが
でき、これにより、文書を自動的に分類整理することが
できる。また、文書を分類する際に一致量を計算し、こ
の一致量をもとに適切なフォルダに分類することによ
り、文書を適切なフォルダにユーザの希望する基準によ
って分類することができる。さらに、話題構造を無理に
木構造にする必要をなくすことができる。
【0059】請求項3記載の発明は、文書の属性をもと
に、検索条件をノードする木構造状の話題構造に基づい
て分類することができ、これにより、文書の作者や日付
といった任意の属性をもとに、自動的に分類したい分類
体系に沿って分類整理することができる。
に、検索条件をノードする木構造状の話題構造に基づい
て分類することができ、これにより、文書の作者や日付
といった任意の属性をもとに、自動的に分類したい分類
体系に沿って分類整理することができる。
【0060】請求項4記載の発明は、文書を分類する際
に一致量を計算し、この一致量の最も高い、一つ又は複
数のフォルダに分類することにより、文書を最も適切な
フォルダに自動的に分類することができる。
に一致量を計算し、この一致量の最も高い、一つ又は複
数のフォルダに分類することにより、文書を最も適切な
フォルダに自動的に分類することができる。
【図1】本発明の一実施例である文書分類装置の構成を
示すブロック図である。
示すブロック図である。
【図2】話題構造の一例を示すブロック図である。
【図3】本発明の別の実施例である文書分類装置の構成
を示すブロック図である。
を示すブロック図である。
【図4】話題構造の一例を示すブロック図である。
【図5】本発明の第一の参考例である文書分類装置の構
成を示すブロック図である。
成を示すブロック図である。
【図6】ニュースグループの一例を示すブロック図であ
る。
る。
【図7】フォルダの一例を示すブロック図である。
【図8】本発明の第二の参考例である文書分類装置の構
成を示すブロック図である。
成を示すブロック図である。
1 文書データベース
2 属性抽出部
3 文書分類部
4 フォルダ
6 キーワード入力部
7 電子メール分類部
8 フォルダ
9 電子メール表示部
10 ニュース受信部
11 ニュースグループ名解析部
12 記事分類部
13 フォルダ
14 ニュース表示部
15 文書データベース
16 トピック構造定義ファイル
17 文書配置分類手段
18 文書検索式生成手段
19 文書検索手段
20 文書提示手段
フロントページの続き
(56)参考文献 特開 平5−89173(JP,A)
特開 平2−170642(JP,A)
榊原康文、三末和雄,決定木の学習に
よる文書データの分類と日本語キーワー
ドの抽出,情報処理学会研究報告(92−
AI−82),日本,社団法人情報処理学
会,1992年 5月26日,Vol.92,N
o.42,p.1−10
河合敦夫,意味属性の学習結果にもと
づく文書自動分類方式,情報処理学会論
文誌,日本,社団法人情報処理学会,
1992年 9月15日,Vol.33,No.
9,p.1114−1122
渡辺勇,緩い協調:協調情報フィルタ
リング,情報処理学会研究報告(91−H
I−35),日本,社団法人情報処理学
会,1991年 3月 8日,Vol.91,
No.18,p.179−186
湯浅寛子、小島啓二,情報のブロード
キャッチシステム,情報処理学会研究報
告(93−IM−13,93−GW−4),日
本,社団法人情報処理学会,1993年10月
29日,Vol.93,No.95,p.37−
44
(58)調査した分野(Int.Cl.7,DB名)
G06F 17/30
JICSTファイル(JOIS)
Claims (4)
- 【請求項1】 文書データベース中の文書から作者、タ
イトル、キーワード等の属性情報を抽出する属性抽出部
と、 この抽出された属性情報をもとに文書を分類する文書分
類部と、 この分類された文書を、属性情報をノードする木構造で
ある話題構造として表現し格納するフォルダと、 文書の分類時に、前記話題構造から上位ノードをつなげ
て付けて表わした話題構造リストを得、この話題構造リ
ストの個々の要素と文書に付随した属性情報との一致量
を計算し、この一致量に基づいて文書を分類する一致量
文書分類手段と、よりなることを特徴とする文書分類装
置。 - 【請求項2】 文書データベース中の文書から作者、タ
イトル、キーワード等の属性情報を抽出する属性抽出部
と、 この抽出された属性情報をもとに文書を分類する文書分
類部と、 この分類された文書を、属性情報をノードする木構造で
ある話題構造から得られた上位ノードをつなげて付けて
表わした話題構造リストとして格納するフォルダと、 文書の分類時に、前記話題構造リストの個々の要素と文
書に付随した属性情報との一致量を計算し、この一致量
に基づいて文書を分類する一致量文書分類手段と、より
なることを特徴とする文書分類装置。 - 【請求項3】 前記属性情報は、文書を引数とする述語
を含むことを特徴とする請求項1又は2記載の文書分類
装置。 - 【請求項4】 一致量の高いノードに文書を分類するこ
とを特徴とする請求項1又は2記載の文書分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33059293A JP3441500B2 (ja) | 1993-05-17 | 1993-12-27 | 文書分類装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5-114424 | 1993-05-17 | ||
JP11442493 | 1993-05-17 | ||
JP33059293A JP3441500B2 (ja) | 1993-05-17 | 1993-12-27 | 文書分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0778186A JPH0778186A (ja) | 1995-03-20 |
JP3441500B2 true JP3441500B2 (ja) | 2003-09-02 |
Family
ID=26453165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33059293A Expired - Fee Related JP3441500B2 (ja) | 1993-05-17 | 1993-12-27 | 文書分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3441500B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3871794B2 (ja) * | 1997-03-06 | 2007-01-24 | 富士通株式会社 | 電子メールシステムおよびそのプログラム記憶媒体 |
EP0883069A1 (en) | 1997-06-06 | 1998-12-09 | Matsushita Electric Industrial Co., Ltd. | A retrieval menu creation device and method, and a recording medium storing a retrieval menu creation program |
JPH1153154A (ja) * | 1997-08-07 | 1999-02-26 | Nec Corp | 電子メール表示装置および電子メール表示プログラムを記録したコンピュータが読み取り可能な記録媒体 |
US6349307B1 (en) * | 1998-12-28 | 2002-02-19 | U.S. Philips Corporation | Cooperative topical servers with automatic prefiltering and routing |
JP4644925B2 (ja) * | 2000-10-12 | 2011-03-09 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2008276575A (ja) * | 2007-04-27 | 2008-11-13 | Kokuyo Co Ltd | データ管理装置及びそのプログラム |
US8165985B2 (en) * | 2007-10-12 | 2012-04-24 | Palo Alto Research Center Incorporated | System and method for performing discovery of digital information in a subject area |
CN102737057B (zh) * | 2011-04-14 | 2015-04-01 | 阿里巴巴集团控股有限公司 | 一种商品类目信息的确定方法及装置 |
JP2021124863A (ja) | 2020-02-04 | 2021-08-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びコンピュータプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02170642A (ja) * | 1988-12-22 | 1990-07-02 | Fuji Xerox Co Ltd | 電子メールシステム |
JP3303926B2 (ja) * | 1991-09-27 | 2002-07-22 | 富士ゼロックス株式会社 | 構造化文書分類装置及び方法 |
-
1993
- 1993-12-27 JP JP33059293A patent/JP3441500B2/ja not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
榊原康文、三末和雄,決定木の学習による文書データの分類と日本語キーワードの抽出,情報処理学会研究報告(92−AI−82),日本,社団法人情報処理学会,1992年 5月26日,Vol.92,No.42,p.1−10 |
河合敦夫,意味属性の学習結果にもとづく文書自動分類方式,情報処理学会論文誌,日本,社団法人情報処理学会,1992年 9月15日,Vol.33,No.9,p.1114−1122 |
渡辺勇,緩い協調:協調情報フィルタリング,情報処理学会研究報告(91−HI−35),日本,社団法人情報処理学会,1991年 3月 8日,Vol.91,No.18,p.179−186 |
湯浅寛子、小島啓二,情報のブロードキャッチシステム,情報処理学会研究報告(93−IM−13,93−GW−4),日本,社団法人情報処理学会,1993年10月29日,Vol.93,No.95,p.37−44 |
Also Published As
Publication number | Publication date |
---|---|
JPH0778186A (ja) | 1995-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170118163A1 (en) | Organizing messages in a messaging system using social network information | |
KR101384931B1 (ko) | 이미지 처리 방법, 장치 또는 시스템 | |
US8032598B1 (en) | Methods and systems of electronic message threading and ranking | |
US8135669B2 (en) | Information access with usage-driven metadata feedback | |
Cole et al. | Document retrieval for e-mail search and discovery using formal concept analysis | |
US20080189336A1 (en) | Creating and managing digital media content using contacts and relational information | |
US20100262597A1 (en) | Method and system for searching information of collective emotion based on comments about contents on internet | |
US7979388B2 (en) | Deriving hierarchical organization from a set of tagged digital objects | |
JP2000113064A (ja) | 最適行為者選定支援システム | |
JP2000066970A (ja) | 人脈情報管理システム、人脈情報管理方法および記録媒体 | |
JP3441500B2 (ja) | 文書分類装置 | |
CN106897437B (zh) | 一种知识系统的高阶规则多分类方法及其系统 | |
WO2004038609A2 (en) | Intelligent classification system | |
JP2003108592A (ja) | 検索方法および検索装置 | |
US7529803B2 (en) | Searching electronic mail and messages | |
US20010051987A1 (en) | E-mail system and E-mail transmission method of broadcasting | |
JPH1145284A (ja) | プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3816891B2 (ja) | 要約作成装置、要約作成方法、メッセージ配信装置、メッセージ配信方法およびプログラム | |
JP5963281B2 (ja) | 関連情報提示装置及び関連情報提示方法 | |
Dive | Artefacts and archives: Considering cross-collection knowledge networks in museums | |
JP4718897B2 (ja) | 電子メールおよびファイルの管理方法、プログラム及び計算機システム | |
JP3465615B2 (ja) | 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体 | |
JP3425784B2 (ja) | 文献情報検索装置 | |
JP3700772B2 (ja) | 電子メール配送システム | |
JPH1145258A (ja) | 電子文書管理方法および装置並びに電子文書管理プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080620 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090620 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090620 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100620 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |