JP2002222083A

JP2002222083A - 事例蓄積装置および方法

Info

Publication number: JP2002222083A
Application number: JP2001019565A
Authority: JP
Inventors: Koji Tsukamoto; 浩司塚本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-01-29
Filing date: 2001-01-29
Publication date: 2002-08-09
Also published as: US6549752B2; US20020102526A1

Abstract

(57)【要約】【課題】少数の正解事例しかない場合でも、それらを
もとに効率良く十分な量の正解事例を蓄積していくこと
が課題である。【解決手段】事例データベース２６は、各事例に関す
る情報を蓄積し、学習器２４は、正解事例の集合から、
カテゴリを判定するための推論規則を生成して、未知事
例のカテゴリを推論する。問い合わせ生成部２２は、未
知事例の推論結果が正しいか否かの判定を仰ぐための問
い合わせを生成し、ユーザインタフェース２１は、その
問い合わせを画面に表示する。ユーザが判定結果を入力
すると、中央コントローラ２３は、判定された未知事例
を、新たな正解事例として事例データベース２６に記録
する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、正解事例から統計
的な情報を抽出し、未知事例について何らかの推論を行
う学習器が学習対象として用いる事例を、準備するため
の技術に関する。ここで、正解事例とは、推論すべき特
徴が既にわかっている事例に対応し、未知事例とは、そ
の特徴がわかっていない事例に対応する。

【０００２】特に、分野分けされたテキスト、タグを付
けられたテキスト、光学的文字認識（Optical Characte
r Recognition ，ＯＣＲ）におけるイメージファイルと
文字との対応づけ、画像が表しているものの名称等のよ
うに、推論結果が正解であるか否かが人間にとっては明
白であるが、機械にとっては明白ではないような場合
に、正解事例を準備する事例蓄積装置およびその方法に
関する。

【０００３】

【従来の技術】統計的な方法を使って正解事例から学習
を行い、未知事例に対して何らかの推論を行う方法は、
以下に示すように、今までにいろいろと提案されてい
る。（１）文書の自動分類を行うために、分野を決められた
正解文書群を用意し、そこから単語の出現頻度等の統計
的な推定方法（学習）を用いて、分類の統計的基準（推
論規則）を作成し、その基準を用いて未知の文書の分野
を推定する方法。分類の統計的基準は、必ずしも人間に
可読なものばかりではなく、ニューラルネットワークの
重みや主成分分析におけるキーワードの組合せ等でも良
い。（２）文書のフィルタリングを行うため、ユーザが必要
な文書と必要でない文書を分けるプロセスを利用し、そ
の時判別の手がかりとなったと考えられる単語の情報等
を利用することにより、分類の統計的基準を生成してゆ
き、その基準を用いて新たな文書のフィルタリングを行
う方法。（３）テキストのタグづけを自動的に行うため、タグづ
けされた正解テキストを用意し、タグの周辺の単語の情
報等を用いてタグづけの基準を生成し、その基準を用い
てタグのついていない文書のタグづけを行う方法。（４）精度の良いＯＣＲを実現するために、イメージフ
ァイルと正解の文字との対応づけを用意し、そこから線
素の情報等を用いて認識の基準を生成し、その基準を用
いて未知のイメージファイルがどの文字に対応している
かを判定する方法。（５）画像が表しているものの名称や色等の何らかの特
徴を判定するため、イメージファイルと正解の判定結果
の対を用意し、そこから画素の情報を用いて判定の基準
を生成し、その基準を用いて未知の画像がどの判定結果
に属するかを判定する方法。

【０００４】これらの方法は、正解事例があるカテゴリ
に属するものとみなし、事例の特徴と正解のカテゴリと
の対応関係を抽出し、この対応関係を用いて未知の事例
のカテゴリを推論する枠組と考えることができる。この
ような枠組において、推論の精度を向上させるために、
現在まで様々な技術が提案されている。

【０００５】例えば、文書の自動分類に限っていえば、
特開平５−５４０３７、特開平５−２３３７０６、特開
平５−３２４７２６、特開平６−１３１２２５、特開平
６−３４８７５５、特開平７−３６８９７、特開平７−
３６７６７、特開平７−４９８７５、特開平７−７８１
８６、特開平７−１１４５７２、特開平７−１９２００
２、特開平８−１５３１２１等が挙げられる。

【０００６】

【発明が解決しようとする課題】しかしながら、上述し
た従来の推論方法には、次のような問題がある。これら
の推論方法はいずれも、正解事例が十分存在し、そこか
らカテゴライズのための有意な情報を抽出できる場合を
想定している。しかし、例えば文書分類において、Ｗｅ
ｂや社内の文書を分類することを考えた場合、カテゴリ
は数百〜数千になる場合もあり、これらに対して十分精
度の高い推論規則を作るための十分な量（少なくとも各
カテゴリについて１００程度）の正解事例を用意するの
は、かなりの労力を要する。

【０００７】また、推論の手がかりになりそうな情報を
提示したり、ユーザに尋ねたりする枠組としては、特開
平９−２２４１４、特開平９−１５３０４９等の装置が
ある。しかし、これらはともに、学習器とユーザが協力
して効率的に正解事例をつくる枠組ではなく、これらの
装置では、簡単な操作で正解事例をためていくことはで
きない。

【０００８】また、タグつきコーパス（タグつきテキス
トを集めたデータベース）においても、精度の高いタグ
づけルールを作るための十分な量の文例を準備するのは
困難である。同様に、ＯＣＲにおける日本語の文字の判
定においては、文字の種類が数千種類におよぶため、そ
れぞれの文字に対して、判定のための規則を構成できる
ような十分な量の正解を準備するのは難しい。

【０００９】通常、十分な量の正解事例がない場合に
は、なるべく正解率が高くなるような良い推論アルゴリ
ズムや、良い特徴を探すことが多い。しかしながら、十
分な量の正解事例がない場合、どのような方法を用いて
も精度の高い推論を行うことができないことが多く、こ
の場合、人手で正解事例を徐々にためていかざるを得な
い。したがって、この正解事例をためていくプロセスを
いかに効率良く行うかが重要となる。

【００１０】本発明の課題は、精度の高い推論規則を生
成するために、少数の正解事例しかない場合でも、それ
らをもとに効率良く十分な量の正解事例を蓄積していく
事例蓄積装置およびその方法を提供することである。

【００１１】

【課題を解決するための手段】図１は、本発明の事例蓄
積装置の原理図である。図１の事例蓄積装置は、格納手
段１１、学習手段１２、問い合わせ手段１３、および制
御手段１４を備える。

【００１２】格納手段１１は、正解事例の集合に関する
情報を格納する。学習手段１２は、格納手段１１に格納
された情報を参照しながら推論規則を生成し、その推論
規則に従って、推論対象の事例の既知の特徴から目的の
特徴を推論する。

【００１３】問い合わせ手段１３は、学習手段１２の推
論結果が正しいか否かをユーザに問い合わせ、そのユー
ザから回答を受け取る。制御手段１４は、その回答に基
づいて推論対象の事例の目的の特徴を決定し、決定され
た目的の特徴を含む推論対象の事例の情報を、正解事例
の集合に関する情報に追加する。

【００１４】格納手段１１は、例えば、各正解事例の既
知の特徴と目的の特徴の対応関係を保持している。事
例、既知の特徴、および目的の特徴の組み合わせとして
は、例えば、以下のようなものが考えられる。（１）文書、文書の特徴、文書のカテゴリ（２）タグづけされたテキストデータ、テキストデータ
の特徴、タグのカテゴリ（３）画像、画像特徴（画像から抽出された特徴量）、
画像が表す文字（４）画像、画像特徴、画像が表すものの名前学習手段１２は、格納手段１１に格納された既知の特徴
と目的の特徴の対応関係に基づき、既知の特徴から目的
の特徴を推論するための推論規則を生成する。そして、
その推論規則を既知の特徴を有する他の事例に適用し
て、その事例の目的の特徴を推論し、推論結果を出力す
る。このとき、推論対象の他の事例としては、未知事例
や誤っている可能性のある正解事例が用いられる。

【００１５】問い合わせ手段１３は、学習手段１２が出
力した推論結果を受け取り、それが正しいか否かの判定
をユーザに要請する。そして、ユーザが入力した判定結
果を回答として受け取る。推論結果が正しくない場合、
ユーザは、判定結果とともに、正しい目的の特徴を回答
として入力することができる。

【００１６】ユーザが推論結果は正しいと判定した場
合、制御手段１４は、推論に用いた既知の特徴と推論さ
れた目的の特徴の対応関係を、正解事例の情報として格
納手段１１に格納する。また、ユーザが推論結果は正し
くないと判定し、推論された目的の特徴を修正した場
合、制御手段１４は、推論に用いた既知の特徴と修正さ
れた目的の特徴の対応関係を、正解事例の情報として格
納手段１１に格納する。

【００１７】このような事例蓄積装置によれば、ユーザ
は、提示された推論結果に対して、正しいか否かの判定
結果を入力する単純な操作を繰り返すだけで、正解事例
を効率良く蓄積することができる。さらに、新たに蓄積
された正解事例を用いて推論規則を再生成することで、
推論規則の精度を徐々に高めることができる。

【００１８】例えば、図１の格納手段１１は、後述する
図２の事例データベース２６に対応し、図１の学習手段
１２は図２の学習器２４に対応し、図１の問い合わせ手
段１３は図２のユーザインタフェース２１および問い合
わせ生成部２２に対応し、図１の制御手段１４は図２の
中央コントローラ２３に対応する。

【００１９】

【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。本実施形態の事例蓄
積装置は、正解事例からカテゴリ（目的の特徴）を推論
するための推論規則を生成する装置（学習器）と、それ
ぞれの事例に関する情報を蓄積するデータベースと、ユ
ーザの判定を仰ぐインタフェースを備え、未知事例の推
論結果をユーザに提示し、ユーザの判定結果を記録する
ことにより、正解事例を準備する。

【００２０】事例蓄積装置は、それぞれのカテゴリに少
数の正解事例をあらかじめ用意しておき、それらを用い
て推論規則を学習し、未知事例に対して推論規則を適用
した結果をユーザに提示し、ユーザは正誤判定あるいは
修正を行う。このような処理を繰り返す。ユーザは、提
示された推論結果に対して、例えば、単純に○（正）ま
たは×（誤）をつけていけば良いだけであり、さらに、
正解事例がたまるごとにほとんどが○に属するようにな
る。したがって、簡単な操作で効率良く正解事例を蓄積
することができる。

【００２１】推論規則のアルゴリズムとしては、例え
ば、決定木、決定リスト、ニューラルネットワーク、ナ
イーブベイズ（naive Bayes ）、ベイジアンネットワー
ク、遺伝的アルゴリズム、事例ベース推論、最小自乗
法、回帰分析、ブースティング（boosting）、バギング
（bagging ）、サポートベクトルマシン等が用いられ
る。

【００２２】図２は、このような事例蓄積装置の構成図
である。図２の事例蓄積装置は、ユーザインタフェース
２１、問い合わせ生成部２２、中央コントローラ２３、
学習器２４、アクセスインタフェース２５、および事例
データベース２６を備える。

【００２３】中央コントローラ２３は、問い合わせ生成
部２２、学習器２４、およびアクセスインタフェース２
５を制御する。学習器２４は、中央コントローラ２３の
指示に基づいて、正解事例から、カテゴリを判定するた
めの推論規則を生成し、未知事例のカテゴリを推論す
る。事例データベース２６は、それぞれの事例に関する
情報を蓄積し、アクセスインタフェース２５は、中央コ
ントローラ２３の指示に基づいて、事例データベース２
６に格納された情報にアクセスする。

【００２４】問い合わせ生成部２２は、中央コントロー
ラ２３の指示に基づいて、未知事例の推論結果が正しい
か否かの判定を仰ぐための問い合わせを生成し、ユーザ
インタフェース２１は、その問い合わせを画面に表示す
る。そして、ユーザインタフェース２１は、ユーザが入
力した判定結果を回答として中央コントローラ２３に伝
え、アクセスインタフェース２５は、この判定結果を事
例データベース２６に記録する。ユーザが推論された未
知事例のカテゴリを承認した場合、その事例は新たな正
解事例として記録される。

【００２５】図３は、図２の事例蓄積装置による蓄積処
理のフローチャートである。まず、ユーザは、正解事例
の集合と未知事例の集合を準備して（ステップＳ１）、
それらの事例の特徴とカテゴリの対応関係を、事例デー
タベース（ＤＢ）２６に格納する（ステップＳ２）。

【００２６】次に、学習器２４は、事例データベース２
６に格納された正解事例を用いて推論規則を生成し（ス
テップＳ３）、中央コントローラ２３は、終了条件が満
たされたか否かを判定する（ステップＳ４）。この終了
条件としては、例えば、以下のようなものが用いられ
る。（１）必要な正解率の値をあらかじめ設定しておく。そ
して、事例蓄積装置が、生成された推論規則を未知事例
に適用した結果をユーザに提示し、修正させたときに、
推論結果がどれくらいの割合で正解していたかを記録し
ておき、その値があらかじめ設定された正解率を上回っ
ていれば、処理を終了する。（２）必要な正解率の値をあらかじめ設定し、学習に用
いない正解事例を別に作成しておく。そして、生成され
た推論規則をその正解事例に適用した結果の正解率が、
あらかじめ設定された正解率を上回っていれば、処理を
終了する。

【００２７】終了条件が満たされていなければ、次に、
中央コントローラ２３は、事例データベース２６から適
当数の未処理の未知事例を取り出して、学習器２４に与
え、学習器２４は、与えられた未知事例に、生成された
推論規則を適用して、カテゴリを推論する（ステップＳ
５）。このとき、推論されたカテゴリが事例データベー
ス２６に記録される。

【００２８】次に、問い合わせ生成部２２は、未知事例
の推論結果を１つずつユーザインタフェース２１の画面
に表示し、ユーザに正誤判定を要請する（ステップＳ
６）。ユーザが○×の判定結果を入力すると（ステップ
Ｓ７）、中央コントローラ２３は、入力された判定結果
を事例データベース２６に反映する（ステップＳ８）。
そして、事例蓄積装置は、ステップＳ３以降の処理を繰
り返し、ステップＳ４において終了条件が満たされる
と、処理を終了する。

【００２９】この処理において、事例データベース２６
は、例えば、図４のような事例データテーブルの形式で
事例データを格納する。図４において、各行のデータが
１つの事例データに対応し、各事例データは、事例の識
別情報（ＩＤ）、フラグ、事例が属するカテゴリ、およ
び事例の内容を含んでいる。このうち、フラグは、正解
事例であるか否かを表し、内容は、実際に事例に含まれ
ている情報（既知の特徴）を表す。

【００３０】フラグが“○”となっている事例は、あら
かじめ用意された正解事例、または、既にカテゴリの推
論が行われ、推論結果がユーザにより判定された未知事
例に対応する。言い換えれば、このフラグは、ユーザへ
の問い合わせが不要であることを表す。また、フラグが
“×”となっている事例は、まだ推論が行われていない
未処理の未知事例に対応し、このフラグは、ユーザへの
問い合わせが必要であることを表す。

【００３１】ステップＳ７において、推論されたカテゴ
リの判定結果が正であれば、その未知事例はそのまま正
解事例となる。そこで、対応するフラグが“×”から
“○”に書き換えられる。また、判定結果が誤であれ
ば、ユーザによりカテゴリが修正される。この場合、対
応するフラグが“×”から“○”に書き換えられ、推論
されたカテゴリがユーザにより指定されたカテゴリに書
き換えられる。こうして、ユーザに提示された未知事例
が正解事例にとして蓄積されていき、処理の終了時に
は、最初に用意された未知事例のほとんどが正解事例に
変換される。

【００３２】ところで、未知事例すべてではなく、機械
にとって学習を行うのが困難な事例だけを、統計的な方
法を使うことにより自動的に選択して、ユーザの判定を
求めることも考えられる。例えば、学習器が推論結果の
確信度を出力する場合、事例蓄積装置は、未知事例に対
して推論規則を適用した結果、確信度が低いもののみを
ユーザに提示して、ユーザの判定を仰ぐ。そして、判定
結果を合わせて再び推論規則の生成を行う。

【００３３】未知事例に低い確信度で正しいカテゴリが
割り当てられた場合、その事例を正解事例に加えて推論
規則を生成することにより、少数の正解事例と少ない労
力の判定とから、正解率の高い推論規則が生成される。
一般に、確信度の低い事例を学習すると、学習器が生成
する推論規則の精度は上がる傾向にある。

【００３４】ここで、確信度に関しては、学習すること
の難しいサンプルの確信度は低くなりがちであるという
事実を利用している。例えば、以下の文献に例示されて
いるように、多くの学習器は確信度を返すことができ
る。（１）Quinlan,“C4.5:Programs for Machine Learnin
g, ”Morgan Kaufmann(1993) の決定木（２）Rumelhart, McClelland “Parallel distributed
processing: exploration in the microstructure of
cognition,”MIT Press(1986) のニューラルネットワー
ク（３）Freund, Schapire“Experiments with a New Boo
sting Algorithm,” Machine Learning: Proceedings o
f the Thirteenth International Conference(1996) の
Boosting Algorithm この確信度の値を利用することにより、すべての未知事
例の推論結果を人間が判定するのではなく、機械にとっ
て簡単な事例（確信度が高いもの）については機械が判
定し、機械に判断が困難な事例（確信度が低いもの）だ
けを人間が判定することが可能になる。したがって、少
ない労力で効率良く正解事例を蓄積することができる。

【００３５】図５は、このような事例蓄積装置の構成図
である。図５の事例蓄積装置は、図２の構成に事例選択
部２７を付加した構成を有し、図６に示すような処理を
行う。図６のフローチャートにおいて、ステップＳ１１
〜Ｓ１５およびステップＳ１７〜Ｓ１８の処理は、図３
のステップＳ１〜Ｓ５およびステップＳ７〜Ｓ８の処理
と同様である。

【００３６】ステップＳ１５において、推論されたカテ
ゴリと確信度が事例データベース２６に記録されると、
事例選択部２７は、中央コントローラ２３の指示に基づ
き、学習器２４から出力された各事例の確信度をチェッ
クする（ステップＳ１６）。そして、所定値より小さな
確信度を有する事例を選択して、それらの推論結果を問
い合わせ生成部２２に与える。問い合わせ生成部２２
は、受け取った未知事例の推論結果を１つずつユーザイ
ンタフェース２１の画面に表示し、ユーザに正誤判定を
要請する。

【００３７】この場合、事例データベース２６は、例え
ば、図７のような事例データテーブルの形式で事例デー
タを格納する。図７の事例データテーブルは、図４の情
報に確信度の項目を付加した形式を有し、フラグが
“×”となっている事例は、カテゴリの推論は終了して
いるが、推論結果がユーザにより判定されていない未知
事例に対応する。

【００３８】また、最初にある程度の量の正解事例が用
意されたとしても、その中に無視できない誤りが含まれ
ている場合もある。この場合、事例蓄積装置は、誤りを
含んだ正解事例の集合から学習器を用いて推論規則を生
成する。そして、その規則をそれらの正解事例に適用し
た結果を判定し、確信度の低いものをユーザに提示して
判定を仰ぐ。

【００３９】これにより、正解事例の集合に含まれる誤
りを少なくしていき、精度の高い推論規則をつくること
ができる。一般に、確信度の低い推論結果は誤りである
可能性が高いので、すべての推論結果をチェックする場
合に比べて、少ない労力で誤りの少ない正解事例を得る
ことができる。

【００４０】図８は、このような処理のフローチャート
である。図８のフローチャートにおいて、ステップＳ２
２〜Ｓ２４およびステップＳ２７〜Ｓ２８の処理は、図
３のステップＳ２〜Ｓ４およびステップＳ７〜Ｓ８の処
理と同様である。

【００４１】ステップＳ２１において、ユーザは、誤り
を含む正解事例の集合を準備し、事例蓄積装置に入力す
る。ステップＳ４において終了条件が満たされていなけ
れば、次に、中央コントローラ２３は、事例データベー
ス２６から適当数の未処理の正解事例を取り出して、学
習器２４に与え、学習器２４は、与えられた正解事例に
推論規則を適用して、カテゴリを推論する（ステップＳ
２５）。このとき、推論されたカテゴリと確信度が事例
データベース２６に記録される。

【００４２】次に、事例選択部２７は、学習器２４から
出力された各事例の確信度をチェックし、所定値より小
さな確信度を有する事例を選択して、それらの推論結果
を問い合わせ生成部２２に与える（ステップＳ２６）。
そして、問い合わせ生成部２２は、受け取った事例の推
論結果を１つずつユーザインタフェース２１の画面に表
示し、ユーザに正誤判定を要請する。

【００４３】図９は、事例データベース２６に格納され
た事例データテーブルの例を示している。図９のフラグ
は、ユーザにより判定されたか否かを表し、フラグが
“○”となっている事例は、既にカテゴリの推論が行わ
れ、推論結果がユーザにより判定された事例に対応す
る。言い換えれば、このフラグは、ユーザへの問い合わ
せが不要であることを表す。また、フラグが“×”とな
っている事例は、まだユーザにより判定されていない事
例に対応し、このフラグは、ユーザへの問い合わせが必
要であることを表す。

【００４４】ステップＳ２７において、推論されたカテ
ゴリの判定結果が正であれば、対応するフラグが“×”
から“○”に書き換えられる。また、判定結果が誤であ
れば、対応するフラグが“×”から“○”に書き換えら
れ、推論されたカテゴリがユーザにより指定されたカテ
ゴリに書き換えられる。これにより、誤った正解事例の
カテゴリが修正される。

【００４５】以上説明した事例蓄積装置には、ユーザイ
ンタフェースが１つしか設けられていないが、通信ネッ
トワークを介して事例蓄積装置に複数のユーザインタフ
ェースを接続し、複数のユーザが事例蓄積装置を利用で
きるようにすることも考えられる。このようなシステム
によれば、推論結果の判定作業を複数のユーザが分担し
て行うことができ、より効率良く正解事例が蓄積され
る。

【００４６】図１０は、図２の事例蓄積装置に複数のユ
ーザインタフェースを接続した事例蓄積システムを示し
ている。図１０において、ルータ２８は、通信ネットワ
ーク上に設けられ、各ユーザインタフェース２１と中央
コントローラ２３または問い合わせ生成部２２の間の通
信を中継する。

【００４７】図１１は、図１０の事例蓄積システムによ
る蓄積処理のフローチャートである。図１１のフローチ
ャートにおいて、ステップＳ３１〜Ｓ３５の処理は、図
３のステップＳ１〜Ｓ５の処理と同様である。

【００４８】ステップＳ３５において、推論されたカテ
ゴリが事例データベース２６に記録されると、問い合わ
せ生成部２２は、複数の未知事例の推論結果を、ルータ
２８を介して複数のユーザインタフェース２１に振り分
けて送信し、各ユーザに正誤判定を要請する（ステップ
Ｓ３６）。各ユーザが○×の判定結果を入力し、ルータ
２８を介して中央コントローラ２３に送信すると（ステ
ップＳ３７）、中央コントローラ２３は、受け取った判
定結果をまとめて事例データベース２６に反映する（ス
テップＳ３８）。

【００４９】また、図１２は、図５の事例蓄積装置に複
数のユーザインタフェースを接続した事例蓄積システム
を示しており、このシステムは、図１３に示すような処
理を行う。図１３のフローチャートにおいて、ステップ
Ｓ４１〜Ｓ４５の処理は、図６のステップＳ１１〜Ｓ１
５の処理と同様である。

【００５０】ステップＳ４５において、推論されたカテ
ゴリと確信度が事例データベース２６に記録されると、
事例選択部２７は、学習器２４から出力された各事例の
確信度をチェックし、所定値より小さな確信度を有する
事例を選択して、それらの推論結果を問い合わせ生成部
２２に与える（ステップＳ４６）。その後、事例蓄積シ
ステムは、ステップＳ４７〜Ｓ４９において、図１１の
ステップＳ３６〜Ｓ３８と同様の処理を行う。

【００５１】次に、図１４から図２３までを参照しなが
ら、上述した事例蓄積装置および事例蓄積システムの応
用例について説明する。図２および図５の事例蓄積装
置、図２および図５の事例蓄積装置と、図１０および図
１２の事例蓄積システムは、文書分類、テキストのタグ
づけ、ＯＣＲ、画像認識等の任意の処理に応用すること
が可能である。

【００５２】図１４は、図２の事例蓄積装置を用いて文
書分類を行う構成を示している。図１４の事例蓄積装置
は、図２の構成にデータ変換部３１を付加した構成を有
する。例えば、Ｗｅｂ上の文書の分類規則を作るための
正解事例を準備するために、分類先のカテゴリが１００
０種類あり、１つの文書サンプルが複数のカテゴリに属
しても良いという条件が与えられた場合を想定する。こ
の場合、「情報」というカテゴリを対象とした処理の手
順は、以下のようになる。

【００５３】１．ユーザは、適当に５０００文書を用意
し、その中から「情報」に属する文書をすべてピックア
ップする。例えば、１０文書がピックアップされた場
合、残りの４９９０文書を「情報」以外のカテゴリに属
する文書とする。これらの５０００文書は、あらかじめ
用意された正解事例の集合に対応し、カテゴリ付き文書
３２として格納される。また、ユーザは、どちらのカテ
ゴリに属するかをチェックしていない文書を１００００
文書用意する。これらの１００００文書は、未知事例の
集合に対応し、カテゴリなし文書３３として格納され
る。

【００５４】２．データ変換部３１は、図１５に示すよ
うに、カテゴリ付き文書３２の情報を事例データテーブ
ル３４の形式に変換する。ここでは、「情報」以外のカ
テゴリはまとめて、「ｎｏｔ情報」として記録されてお
り、各文書の内容として、「コントローラ」や「データ
ベース」のような、文書中に現れる特定の単語の出現回
数が記録されている。また、この例では、確信度は必ず
しも必要ではなく、省略することもできる。カテゴリな
し文書３３の情報も同様に変換されて、事例データテー
ブル３４に記録され、事例データテーブル３４は事例デ
ータベース２６に格納される。

【００５５】３．学習器２４は、どちらに属するかわか
っている文書（最初は５０００文書）を用いて、「情
報」に属する文書か否かを判定するための推論規則を生
成する。

【００５６】４．中央コントローラ２３は、学習器２４
がチェックしていない１００００文書のうち、任意に１
０００文書を選び、学習器２４は、得られた推論規則を
用いてこれらの１０００文書が「情報」に属するか否か
を判定する。

【００５７】５．問い合わせ生成部２２は、１０００文
書の判定結果を、図１６のような画面に順次表示するこ
とで、ユーザに提示する。ユーザは、その結果が正しい
か否かを判定し、Ｙｅｓボタン３５またはＮｏボタン３
６をクリックすることで、判定結果を入力する。問い合
わせ生成部２２は、学習器２４が「情報」に属すると判
定した文書を、まとめてユーザに提示することもでき
る。

【００５８】６．例えば、ユーザが、提示された文書の
うち、２文書のカテゴリを「情報」と判定し、残りの９
９８文書のカテゴリを「ｎｏｔ情報」と判定したとす
る。この場合、「情報」に属する文書は、最初の１０文
書に新たな２文書を加えて、１２文書となり、「ｎｏｔ
情報」に属する文書は、最初の４９９０文書に新たな９
９８文書を加えて、５９８８文書となる。そして、これ
らの６０００文書を正解事例として用いて、「３．」以
降の処理が繰り返される。

【００５９】この処理において自動的にできない部分
は、最初の若干のデータ（少数の「情報」に関する文書
とそうでない文書）の準備を除けば、ユーザによる判定
だけである。しかし、この判定は非常に簡単な作業であ
り、これを繰り返すだけで正しいカテゴリのついた文書
群を蓄積することができる。

【００６０】図１７は、図５の事例蓄積装置を用いてテ
キストのタグづけを行う構成を示している。図１７の事
例蓄積装置は、図５の構成にデータ変換部４１を付加し
た構成を有する。

【００６１】例えば、文書中の時間表現、地名、人名、
会社名等を自動的にタグづけするシステムを作る場合、
どのようなテキストデータを抜き出すべきかを決定する
規則が必要であるが、この規則を人間が作成するのでは
コストが高く、正解テキストデータから学習を行うのが
良いと考えられる。

【００６２】しかし、正解テキストデータの作成もコス
トがかかるため、これを低コストで行うために、時間表
現等のタグのついた少数のタグ付きデータ４２と、タグ
のついていない多数のタグなしデータ４３を用意し、事
例蓄積装置に入力する。タグ付きデータ４２は、あらか
じめ用意された正解事例に対応し、タグなしデータ４３
は、未知事例に対応する。

【００６３】事例蓄積装置は、まず、タグ付きデータ４
２を読み込み、データ変換部４１は、図１８に示すよう
に、タグ付きデータ４２を事例データテーブル４４の形
式に変換する。

【００６４】ここでは、文書中の特定のテキストデータ
（文字列）が１つの事例に対応し、「時間表現」、「地
名」、「人名」、「会社名」、および「ｅｌｓｅ」がカ
テゴリに対応する。このうち、「ｅｌｓｅ」は、時間表
現、地名、人名、および会社名以外のカテゴリを表す。
「時間表現」、「地名」、「人名」、または「会社名」
に属するテキストデータはタグづけされたデータとみな
され、「ｅｌｓｅ」に属するテキストデータはタグづけ
されないデータとみなされる。

【００６５】また、各テキストデータの内容として、そ
の文字列の品詞や前後の文字列の品詞が記録されてい
る。これらの品詞は、文書中における区間の特徴を表し
ている。タグなしデータ４３も同様に変換されて、事例
データテーブル４４に記録され、事例データテーブル４
４は事例データベース２６に格納される。

【００６６】次に、学習器２４は、カテゴリが確定して
いるテキストデータを用いて推論規則を生成し、その推
論規則を用いて、タグなしデータ４３に対応するテキス
トデータにどのようなタグがつくかを推論する。

【００６７】事例選択部２７は、タグの推論が行われた
テキストデータのうち、確信度の低いものを選び、問い
合わせ生成部２２は、推論されたタグを、図１９のよう
な画面に順次表示することで、ユーザに提示する。ユー
ザは、提示されたタグが正しいか否かを判定し、Ｙｅｓ
ボタン４５またはＮｏボタン４６をクリックすること
で、判定結果を入力する。また、提示されたタグが正し
くなければ、どのようなタグがつくべきかを指定する。
事例蓄積装置は、この判定結果を正解事例として事例デ
ータテーブル４４に反映し、同様の処理を繰り返す。

【００６８】図２０は、図１２の事例蓄積システムを用
いてＯＣＲ処理を行う構成を示している。図２０の事例
蓄積システムは、図１２の構成にデータ変換部５１を付
加した構成を有する。例えば、文字の画像情報から文字
を同定するために、文字の画像と文字コードの対応づけ
がなされたデータを準備する場合を想定する。

【００６９】この場合、ユーザは、文字コードに対応づ
けられた画像データ（文字のわかっている画像データ）
５２と、文字コードに対応づけられていない画像データ
（文字のわかっていない画像データ）５３を用意し、事
例蓄積装置に入力する。画像データ５２は、あらかじめ
用意された正解事例に対応し、画像データ５３は、未知
事例に対応する。

【００７０】事例蓄積システムは、まず、画像データ５
２を読み込み、データ変換部５１は、図２１に示すよう
に、画像データ５２を事例データテーブル５４の形式に
変換する。ここでは、文字の画像データが１つの事例に
対応し、正解文字を表す文字コードがカテゴリに対応す
る。また、各画像データの内容として、画像データを複
数の領域に分割したときの、各領域から抽出される線素
の情報が記録されている。画像データ５３も同様に変換
されて、事例データテーブル５４に記録され、事例デー
タテーブル５４は事例データベース２６に格納される。

【００７１】次に、学習器２４は、カテゴリが確定して
いる画像データを用いて推論規則を生成し、その推論規
則を用いて、画像データ５３がどのような文字に対応す
るかを推論する。

【００７２】事例選択部２７は、文字の推論が行われた
画像データのうち、確信度の低いものを選び、問い合わ
せ生成部２２は、推論された文字をユーザに提示する画
面情報を生成し、ルータ２８を介して複数のユーザに振
り分ける。このとき、各ユーザインタフェース２１に
は、図２２のような画面が表示される。ユーザは、提示
された文字が正しいか否かを判定し、Ｙｅｓボタン５５
またはその他ボタン５６をクリックすることで、判定結
果を入力する。

【００７３】ユーザがその他ボタン５６をクリックする
と、問い合わせ生成部２２により文字種の選択メニュー
５７が表示され、ユーザがアルファベットを選択する
と、アルファベットの選択メニュー５８が表示される。
そして、ユーザは、選択メニュー５８に含まれる文字を
クリックすることで、正解文字を指定する。

【００７４】中央コントローラ２３は、ルータ２８を介
して、複数のユーザの判定結果を収集し、正解事例とし
て事例データテーブル５４に反映した後、同様の処理を
繰り返す。

【００７５】図２３は、図１２の事例蓄積システムを用
いて画像認識を行う構成を示している。図２３の事例蓄
積システムは、図１２の構成にデータ変換部６１を付加
した構成を有する。

【００７６】例えば、Ｗｅｂ上のオンラインショッピン
グ等のサイトにおいては、多数の商品の写真が掲載され
ており、それぞれに「バッグ」等の名前がつけられてい
るが、これらの名前は、必ずしも統一されておらず、誤
りを含んでいる場合もある。また、名前の数が限られて
いる場合もある。このような場合、商品の画像に正しい
名前を割り付ける処理の手順は、以下のようになる。

【００７７】１．ユーザは、名前つき画像データ６２を
準備する。この画像データ６２は、一部誤りを含む正解
事例の集合に対応する。２．データ変換部６１は、各画像データから色やエッジ
等の画像特徴を取り出し、画像特徴と名前の対応関係を
記録した事例データテーブルを生成して、事例データベ
ース２６に保存する。

【００７８】３．学習器２４は、事例データベース２６
に保存されたすべての事例を用いて、画像特徴から商品
の名前を推論する推論規則を生成する。４．事例選択部２７は、名前の推論が行われた画像デー
タのうち、確信度の低いものを選び、問い合わせ生成部
２２は、推論された名前をユーザに提示する画面情報を
生成し、ルータ２８を介して複数のユーザに振り分け
る。

【００７９】５．ユーザは、提示された名前が正しいか
否かを判定し、判定結果を入力する。このとき、提示さ
れた名前が正しくなければ、正しい名前を指定する。６．中央コントローラ２３は、ルータ２８を介して、複
数のユーザの判定結果を収集し、正解事例として事例デ
ータベース２６に反映した後、同様の処理を繰り返す。

【００８０】ところで、図２および図５の事例蓄積装置
と、図１０および図１２の事例蓄積システムは、例え
ば、図２４に示すような情報処理装置（コンピュータ）
を用いて構成される。図２４の情報処理装置は、ＣＰＵ
（中央処理装置）７１、メモリ７２、入力装置７３、出
力装置７４、外部記憶装置７５、媒体駆動装置７６、ネ
ットワーク接続装置７７、および画像入力装置７８を備
え、それらはバス７９により互いに接続されている。

【００８１】メモリ７２は、例えば、ＲＯＭ、ＲＡＭ等
を含み、処理に用いられるプログラムとデータを格納す
る。ＣＰＵ７１は、メモリ７２を利用してプログラムを
実行することにより、必要な処理を行う。

【００８２】例えば、図２の問い合わせ生成部２２、中
央コントローラ２３、学習器２４、図５の事例選択部２
７、図１４のデータ変換部３１、図１７のデータ変換部
４１、図２０のデータ変換部５１、および図２３のデー
タ変換部６１は、プログラムにより記述されたソフトウ
ェアコンポーネントとしてメモリ７２に格納される。

【００８３】入力装置７３は、例えば、キーボード、ポ
インティングデバイス、タッチパネル等であり、ユーザ
からの指示や情報の入力に用いられる。出力装置７４
は、例えば、ディスプレイ装置、スピーカ、プリンタ等
であり、ユーザへの問い合わせや処理結果を出力する。
入力装置７３および出力装置７４は、図２のユーザイン
タフェース２１に対応する。

【００８４】外部記憶装置７５は、例えば、磁気ディス
ク装置、光ディスク装置、光磁気ディスク装置、テープ
装置等である。情報処理装置は、この外部記憶装置７５
に、上述のプログラムとデータを保存しておき、必要に
応じて、それらをメモリ７２にロードして使用する。ま
た、外部記憶装置７５は、図２の事例データベース２６
としても用いられる。

【００８５】媒体駆動装置７６は、可搬記録媒体８０を
駆動し、その記録内容にアクセスする。可搬記録媒体８
０としては、メモリカード、フロッピー（登録商標）デ
ィスク、ＣＤ−ＲＯＭ（Compact Disk Read Only Memor
y ）、光ディスク、光磁気ディスク等、任意のコンピュ
ータ読み取り可能な記録媒体が用いられる。ユーザは、
この可搬記録媒体８０に上述のプログラムとデータを格
納しておき、必要に応じて、それらをメモリ７２にロー
ドして使用する。

【００８６】ネットワーク接続装置７７は、ＬＡＮ（Lo
cal Area Network）等の任意の通信ネットワークに接続
され、通信に伴うデータ変換を行う。また、情報処理装
置は、上述のプログラムとデータをネットワーク接続装
置７７を介して、サーバ等の他の装置から受け取り、必
要に応じて、それらをメモリ７２にロードして使用す
る。

【００８７】画像入力装置７８は、例えば、スキャナで
あり、文書や写真を含む任意の画像を、情報処理装置が
処理可能なデータに変換する。図２５は、図２４の情報
処理装置にプログラムとデータを供給することのできる
コンピュータ読み取り可能な記録媒体を示している。可
搬記録媒体８０やサーバ８１のデータベース８２に保存
されたプログラムとデータは、メモリ７２にロードされ
る。このとき、サーバ８１は、プログラムとデータを搬
送する搬送信号を生成し、ネットワーク上の任意の伝送
媒体を介して、情報処理装置に送信する。そして、ＣＰ
Ｕ７１は、そのデータを用いてそのプログラムを実行
し、必要な処理を行う。

【００８８】（付記１）正解事例の集合に関する情報
を格納する格納手段と、前記格納手段に格納された情報
を参照しながら推論規則を生成し、該推論規則に従っ
て、推論対象の事例の既知の特徴から目的の特徴を推論
する学習手段と、前記学習手段の推論結果が正しいか否
かをユーザに問い合わせ、該ユーザから回答を受け取る
問い合わせ手段と、前記回答に基づいて前記推論対象の
事例の目的の特徴を決定し、決定された目的の特徴を含
む該推論対象の事例の情報を、前記正解事例の集合に関
する情報に追加する制御手段とを備えることを特徴とす
る事例蓄積装置。（付記２）前記学習手段は、前記推論対象の事例の情
報が追加された前記正解事例の集合に関する情報に基づ
いて、新たな推論規則を生成し、該新たな推論規則に従
って、他の事例の目的の特徴を推論することを特徴とす
る付記１記載の事例蓄積装置。（付記３）複数の推論対象の事例に関する推論結果の
中から、前記ユーザに問い合わせるべき事例の推論結果
を選択する選択手段をさらに備えることを特徴とする付
記１記載の事例蓄積装置。（付記４）前記問い合わせ手段は、複数の推論対象の
事例に関する推論結果が正しいか否かを、通信ネットワ
ークを介して複数のユーザに問い合わせることを特徴と
する付記１記載の事例蓄積装置。（付記５）複数の事例の各々について、既知の特徴、
目的の特徴、およびユーザへの問い合わせが必要である
か否かを表すフラグ情報を格納するための格納手段と、
前記格納手段に格納された情報を参照しながら、問い合
わせが不要であることを表すフラグ情報を有する事例の
集合から推論規則を生成し、問い合わせが必要であるこ
とを表すフラグ情報を有する事例を推論対象として、該
推論規則に従って該推論対象の事例の既知の特徴から目
的の特徴を推論する学習手段と、前記学習手段の推論結
果が正しいか否かを前記ユーザに問い合わせ、該ユーザ
から回答を受け取る問い合わせ手段と、前記回答に基づ
いて前記推論対象の事例の目的の特徴を決定し、該推論
対象の事例のフラグ情報を、問い合わせが不要であるこ
とを表すフラグ情報に変更する制御手段とを備えること
を特徴とする事例蓄積装置。（付記６）カテゴリを有する文書の集合に関する情報
を格納する格納手段と、前記格納手段に格納された情報
を参照しながら推論規則を生成し、該推論規則に従っ
て、推論対象の文書の特徴からカテゴリを推論する学習
手段と、前記学習手段の推論結果が正しいか否かをユー
ザに問い合わせ、該ユーザから回答を受け取る問い合わ
せ手段と、前記回答に基づいて前記推論対象の文書のカ
テゴリを決定し、決定されたカテゴリを含む該推論対象
の文書の情報を、前記文書の集合に関する情報に追加す
る制御手段とを備えることを特徴とする事例蓄積装置。（付記７）タグづけされたテキストデータの集合に関
する情報を格納する格納手段と、前記格納手段に格納さ
れた情報を参照しながら推論規則を生成し、該推論規則
に従って、推論対象のテキストデータの特徴からタグの
カテゴリを推論する学習手段と、前記学習手段の推論結
果が正しいか否かをユーザに問い合わせ、該ユーザから
回答を受け取る問い合わせ手段と、前記回答に基づいて
前記推論対象のテキストデータに対するタグのカテゴリ
を決定し、決定されたカテゴリを含む該推論対象のテキ
ストデータの情報を、前記テキストデータの集合に関す
る情報に追加する制御手段とを備えることを特徴とする
事例蓄積装置。（付記８）画像の集合に関する情報を格納する格納手
段と、前記格納手段に格納された情報を参照しながら推
論規則を生成し、該推論規則に従って、推論対象の画像
の既知の特徴から目的の特徴を推論する学習手段と、前
記学習手段の推論結果が正しいか否かをユーザに問い合
わせ、該ユーザから回答を受け取る問い合わせ手段と、
前記回答に基づいて前記推論対象の画像の目的の特徴を
決定し、決定された目的の特徴を含む該推論対象の画像
の情報を、前記画像の集合に関する情報に追加する制御
手段とを備えることを特徴とする事例蓄積装置。（付記９）コンピュータのためのプログラムを記録し
た記録媒体であって、該プログラムは、正解事例の集合
に関する情報を参照しながら推論規則を生成し、前記推
論規則に従って、推論対象の事例の既知の特徴から目的
の特徴を推論し、推論結果が正しいか否かをユーザに問
い合わせ、前記ユーザから回答を受け取り、前記回答に
基づいて前記推論対象の事例の目的の特徴を決定し、決
定された目的の特徴を含む該推論対象の事例の情報を、
前記正解事例の集合に関する情報に追加する処理を前記
コンピュータに実行させることを特徴とするコンピュー
タ読み取り可能な記録媒体。（付記１０）正解事例の集合に関する情報を参照しな
がら推論規則を生成し、前記推論規則に従って、推論対
象の事例の既知の特徴から目的の特徴を推論し、推論結
果が正しいか否かをユーザに問い合わせ、前記ユーザか
ら回答を受け取り、前記回答に基づいて前記推論対象の
事例の目的の特徴を決定し、決定された目的の特徴を含
む該推論対象の事例の情報を、前記正解事例の集合に関
する情報に追加する処理をコンピュータに実行させるた
めのプログラム。（付記１１）コンピュータにプログラムを搬送する搬
送信号であって、該プログラムは、正解事例の集合に関
する情報を参照しながら推論規則を生成し、前記推論規
則に従って、推論対象の事例の既知の特徴から目的の特
徴を推論し、推論結果が正しいか否かをユーザに問い合
わせ、前記ユーザから回答を受け取り、前記回答に基づ
いて前記推論対象の事例の目的の特徴を決定し、決定さ
れた目的の特徴を含む該推論対象の事例の情報を、前記
正解事例の集合に関する情報に追加する処理を前記コン
ピュータに実行させることを特徴とする搬送信号。（付記１２）正解事例の集合に関する情報をコンピュ
ータに登録し、前記コンピュータが、以下のａ）、
ｂ）、ｃ）、ｄ）、ｅ）、およびｆ）の処理を行うこと
を特徴とする事例蓄積方法。

【００８９】ａ）登録された情報を参照しながら推論規
則を生成する処理ｂ）前記推論規則に従って、推論対象の事例の既知の特
徴から目的の特徴を推論する処理ｃ）推論結果が正しいか否かをユーザに問い合わせる処
理ｄ）前記ユーザから回答を受け取る処理ｅ）前記回答に基づいて前記推論対象の事例の目的の特
徴を決定する処理ｆ）決定された目的の特徴を含む該推論対象の事例の情
報を、前記正解事例の集合に関する情報に追加する処理

【００９０】

【発明の効果】本発明によれば、少数の正解事例と多数
の正解のわからない事例を準備する、あるいは誤りを含
む正解事例を準備するという比較的楽な作業だけで、そ
れらの事例の統計的性質を用いることにより、簡単な操
作で効率的に正解事例を蓄えていくことができる。

【図面の簡単な説明】

【図１】本発明の事例蓄積装置の原理図である。

【図２】第１の事例蓄積装置の構成図である。

【図３】第１の蓄積処理のフローチャートである。

【図４】第１の事例データテーブルを示す図である。

【図５】第２の事例蓄積装置の構成図である。

【図６】第２の蓄積処理のフローチャートである。

【図７】第２の事例データテーブルを示す図である。

【図８】第３の蓄積処理のフローチャートである。

【図９】第３の事例データテーブルを示す図である。

【図１０】第１の事例蓄積システムの構成図である。

【図１１】第４の蓄積処理のフローチャートである。

【図１２】第２の事例蓄積システムの構成図である。

【図１３】第５の蓄積処理のフローチャートである。

【図１４】第３の事例蓄積装置の構成図である。

【図１５】第１のデータ変換を示す図である。

【図１６】第１の表示画面を示す図である。

【図１７】第４の事例蓄積装置の構成図である。

【図１８】第２のデータ変換を示す図である。

【図１９】第２の表示画面を示す図である。

【図２０】第３の事例蓄積システムの構成図である。

【図２１】第３のデータ変換を示す図である。

【図２２】第３の表示画面を示す図である。

【図２３】第４の事例蓄積システムの構成図である。

【図２４】情報処理装置の構成図である。

【図２５】記録媒体を示す図である。

【符号の説明】

２１ユーザインタフェース２２問い合わせ生成部２３中央コントローラ２４学習器２５アクセスインタフェース２６事例データベース２７事例選択部２８ルータ３１、４１、５１、６１データ変換部３２カテゴリ付き文書３３カテゴリなし文書３４、４４、５４事例データテーブル３５、４５、５５Ｙｅｓボタン３６、４６Ｎｏボタン４２タグ付きデータ４３タグなしデータ５２文字のわかっている画像データ５３文字のわかっていない画像データ５６その他ボタン５７、５８選択メニュー６２名前つき画像データ７１ＣＰＵ７２メモリ７３入力装置７４出力装置７５外部記憶装置７６媒体駆動装置７７ネットワーク接続装置７８画像入力装置７９バス８０可搬記録媒体８１サーバ８２データベース

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｎ 3/08 Ｇ０６Ｎ 3/08 Ｚ

Claims

【特許請求の範囲】

【請求項１】正解事例の集合に関する情報を格納する
格納手段と、前記格納手段に格納された情報を参照しながら推論規則
を生成し、該推論規則に従って、推論対象の事例の既知
の特徴から目的の特徴を推論する学習手段と、前記学習手段の推論結果が正しいか否かをユーザに問い
合わせ、該ユーザから回答を受け取る問い合わせ手段
と、前記回答に基づいて前記推論対象の事例の目的の特徴を
決定し、決定された目的の特徴を含む該推論対象の事例
の情報を、前記正解事例の集合に関する情報に追加する
制御手段とを備えることを特徴とする事例蓄積装置。
【請求項２】複数の推論対象の事例に関する推論結果
の中から、前記ユーザに問い合わせるべき事例の推論結
果を選択する選択手段をさらに備えることを特徴とする
請求項１記載の事例蓄積装置。
【請求項３】前記問い合わせ手段は、複数の推論対象
の事例に関する推論結果が正しいか否かを、通信ネット
ワークを介して複数のユーザに問い合わせることを特徴
とする請求項１記載の事例蓄積装置。
【請求項４】複数の事例の各々について、既知の特
徴、目的の特徴、およびユーザへの問い合わせが必要で
あるか否かを表すフラグ情報を格納するための格納手段
と、前記格納手段に格納された情報を参照しながら、問い合
わせが不要であることを表すフラグ情報を有する事例の
集合から推論規則を生成し、問い合わせが必要であるこ
とを表すフラグ情報を有する事例を推論対象として、該
推論規則に従って該推論対象の事例の既知の特徴から目
的の特徴を推論する学習手段と、前記学習手段の推論結果が正しいか否かを前記ユーザに
問い合わせ、該ユーザから回答を受け取る問い合わせ手
段と、前記回答に基づいて前記推論対象の事例の目的の特徴を
決定し、該推論対象の事例のフラグ情報を、問い合わせ
が不要であることを表すフラグ情報に変更する制御手段
とを備えることを特徴とする事例蓄積装置。
【請求項５】カテゴリを有する文書の集合に関する情
報を格納する格納手段と、前記格納手段に格納された情報を参照しながら推論規則
を生成し、該推論規則に従って、推論対象の文書の特徴
からカテゴリを推論する学習手段と、前記学習手段の推論結果が正しいか否かをユーザに問い
合わせ、該ユーザから回答を受け取る問い合わせ手段
と、前記回答に基づいて前記推論対象の文書のカテゴリを決
定し、決定されたカテゴリを含む該推論対象の文書の情
報を、前記文書の集合に関する情報に追加する制御手段
とを備えることを特徴とする事例蓄積装置。
【請求項６】タグづけされたテキストデータの集合に
関する情報を格納する格納手段と、前記格納手段に格納された情報を参照しながら推論規則
を生成し、該推論規則に従って、推論対象のテキストデ
ータの特徴からタグのカテゴリを推論する学習手段と、前記学習手段の推論結果が正しいか否かをユーザに問い
合わせ、該ユーザから回答を受け取る問い合わせ手段
と、前記回答に基づいて前記推論対象のテキストデータに対
するタグのカテゴリを決定し、決定されたカテゴリを含
む該推論対象のテキストデータの情報を、前記テキスト
データの集合に関する情報に追加する制御手段とを備え
ることを特徴とする事例蓄積装置。
【請求項７】画像の集合に関する情報を格納する格納
手段と、前記格納手段に格納された情報を参照しながら推論規則
を生成し、該推論規則に従って、推論対象の画像の既知
の特徴から目的の特徴を推論する学習手段と、前記学習手段の推論結果が正しいか否かをユーザに問い
合わせ、該ユーザから回答を受け取る問い合わせ手段
と、前記回答に基づいて前記推論対象の画像の目的の特徴を
決定し、決定された目的の特徴を含む該推論対象の画像
の情報を、前記画像の集合に関する情報に追加する制御
手段とを備えることを特徴とする事例蓄積装置。
【請求項８】コンピュータのためのプログラムを記録
した記録媒体であって、該プログラムは、正解事例の集合に関する情報を参照しながら推論規則を
生成し、前記推論規則に従って、推論対象の事例の既知の特徴か
ら目的の特徴を推論し、推論結果が正しいか否かをユーザに問い合わせ、前記ユーザから回答を受け取り、前記回答に基づいて前記推論対象の事例の目的の特徴を
決定し、決定された目的の特徴を含む該推論対象の事例の情報
を、前記正解事例の集合に関する情報に追加する処理を
前記コンピュータに実行させることを特徴とするコンピ
ュータ読み取り可能な記録媒体。
【請求項９】正解事例の集合に関する情報を参照しな
がら推論規則を生成し、前記推論規則に従って、推論対象の事例の既知の特徴か
ら目的の特徴を推論し、推論結果が正しいか否かをユーザに問い合わせ、前記ユーザから回答を受け取り、前記回答に基づいて前記推論対象の事例の目的の特徴を
決定し、決定された目的の特徴を含む該推論対象の事例の情報
を、前記正解事例の集合に関する情報に追加する処理を
コンピュータに実行させるためのプログラム。
【請求項１０】正解事例の集合に関する情報をコンピ
ュータに登録し、前記コンピュータが、以下のａ）、ｂ）、ｃ）、ｄ）、
ｅ）、およびｆ）の処理を行うことを特徴とする事例蓄
積方法。ａ）登録された情報を参照しながら推論規則を生成する
処理ｂ）前記推論規則に従って、推論対象の事例の既知の特
徴から目的の特徴を推論する処理ｃ）推論結果が正しいか否かをユーザに問い合わせる処
理ｄ）前記ユーザから回答を受け取る処理ｅ）前記回答に基づいて前記推論対象の事例の目的の特
徴を決定する処理ｆ）決定された目的の特徴を含む該推論対象の事例の情
報を、前記正解事例の集合に関する情報に追加する処理