JP2963033B2 - サンプル分類支援装置 - Google Patents

サンプル分類支援装置

Info

Publication number
JP2963033B2
JP2963033B2 JP7252662A JP25266295A JP2963033B2 JP 2963033 B2 JP2963033 B2 JP 2963033B2 JP 7252662 A JP7252662 A JP 7252662A JP 25266295 A JP25266295 A JP 25266295A JP 2963033 B2 JP2963033 B2 JP 2963033B2
Authority
JP
Japan
Prior art keywords
tree
classification
sample
attribute
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7252662A
Other languages
English (en)
Other versions
JPH0997264A (ja
Inventor
浦 智 康 三
谷 部 史 鳥
田 益 規 植
尾 利 数 瀬
下 竜 実 真
井 章 弘 亀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NOMURA SOGO KENKYUSHO KK
Original Assignee
NOMURA SOGO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NOMURA SOGO KENKYUSHO KK filed Critical NOMURA SOGO KENKYUSHO KK
Priority to JP7252662A priority Critical patent/JP2963033B2/ja
Publication of JPH0997264A publication Critical patent/JPH0997264A/ja
Application granted granted Critical
Publication of JP2963033B2 publication Critical patent/JP2963033B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大量のサンプルを
分類して所定の特性を有するサンプルを所定の集団とし
て分類するサンプル分類・分析作業を支援するサンプル
分類支援装置に係り、特にユーザーに分類しようとする
集団の属性を自由に設定させ、その集団に分類されたサ
ンプルのばらつきの程度を迅速に評価するサンプル分類
分類支援装置に関する。
【0002】
【従来の技術】一般にマーケットリサーチやダイレクト
メールや商品の販売評価等の分野において、膨大な顧客
データの中から、所定の商品等を購買する顧客層を分類
し、その顧客層の有する属性(年収、年齢、職業等の顧
客を特定する性質)を分析することによって、潜在的な
消費者層を明らかにする作業が行われている。
【0003】上記顧客データは、この明細書における
「サンプル」に該当する。ここで、サンプルは顧客デー
タを含むが、顧客データ以外のたとえば実験データ、植
物の品種改良サンプル等種々のものがあり得る。言い換
えれば、本発明はマーケットリサーチ等に限られず、種
々のサンプル分類問題に応用し得るが、以下の説明では
理解容易のためにマーケットリサーチにおける顧客の分
類・分析を題材として本発明を説明する 従来から、顧客データの分類・分析方法として、スコア
リング法とクロステーブル分析法の知られていた。スコ
アリング法は、統計分析に基づいた分析モデルである。
この方法は、所定の数式によって各サンプルにスコアを
付し、所定のスコアを有するサンプルを抽出する。
【0004】たとえば、「住居状況」と「収入」が知ら
れている顧客データがあった場合、下記の数式によって
の各顧客のスコアを算出する。
【0005】スコア=α×住居状況+β×収入+γ ここで、住居状況はたとえば借家を1、持家を2、収入
は高額を1、低額を2のように適当な数値に変換する。
α,β,γは統計的分析から求められたウェイトを付
す。
【0006】スコアリング法では、上記各顧客のスコア
を求めた後、所定のスコアのレンジに含まれる顧客を抽
出する。これによって、ある特性を有する顧客層が分離
される。
【0007】しかし、上記スコアは非説明変数と呼ばれ
ており、求められた数値に対してはその意味を説明する
ことができないものである。このため、スコアからサン
プルのイメージが把握困難であった。このサンプルイメ
ージが不明であることは、顧客の分類・分析上の大きな
障害となる。たとえば、分類をさらに改良する場合、サ
ンプルイメージが不明であると、どの属性について分類
の仕方を改良すべきかわからないことがあった。
【0008】また、ウェイトα,β,γの付与も、サン
プルの特性を考慮して調整するのが、困難かつ複雑であ
るため、ウェイトの適否の判断と、ウェイトの再調整が
困難であった。
【0009】上記スコアリング法に対して、クロステー
ブル分析法はサンプルのイメージが把握容易である利点
を有している。クロステーブル分析法は、マトリックス
を用いた分類分析アプローチであって、単純な属性の分
類項目同士を組み合わせて、比較的複雑な分類を行うも
のである。図6に上記クロステーブル分析法による顧客
分析の一例を示す。
【0010】図6の例では、属性「収入」について「高
額」と「低額」による分類と、属性「住居状況」につい
て「持家」と「借家」による分類がされている顧客デー
タが与えられている。特性PとNは、購買層の顧客の特
性をP、非購買層の顧客の特性をNとする。
【0011】クロステーブル分析法では、上記顧客デー
タに対して属性の分類を相互に組み合わせる。すなわ
ち、図6に示すように、属性「持家」と属性「借家」の
顧客を、さらにそれぞれ収入に応じて「高額」と「低
額」の顧客に分類する。この分類によって、たとえば図
6に示すように、「持家」かつ「高額収入」に分類され
た顧客は特性P(購買層)が20名、特性Nが0名とな
り、「持家」かつ「低額収入」に分類された顧客は特性
P(購買層)が0名、特性N(非購買層)が20名とな
る。「借家」についての分類も同様に特性Pと特性Nの
顧客が偏って分類される。
【0012】このように偏って分類される分類は有効な
分類である。すなわち、この分類結果から、購買層は
「持家」かつ「高額収入」か、「借家」かつ「低額収
入」のいずれかの一方の属性を有していることがわか
る。この属性を利用して、購買層の顧客の発掘に役立て
ることができる。
【0013】クロステーブル分析法では、有効な分類に
成功した場合は、上述したように分析しようとする顧客
層あるいは顧客集団のイメージを容易に把握することが
できる。
【0014】
【発明が解決しようとする課題】しかしながら、上記ク
ロステーブル分析法には、属性の組合せに限界があると
いう問題があった。すなわち、多数の属性テーブルを組
み合わせる場合、組合せテーブルが急激に膨大化し、実
際上処理が困難になった。
【0015】これは、新たな属性テーブルの属性項目を
組み込む度に、すべての組合せについて一律に分類して
しまうことに原因があった。このため、本質的に有効で
ない分類項目についても分類を行ってしまい、分類項目
の組合せ的爆発を生じてしまうのであった。
【0016】また、同一の理由により、クロステーブル
分析法は、柔軟な分類に不向きであった。すなわち、分
析者が有効な分類となりそうな分類を集中的に試みるこ
とができなかった。
【0017】そこで、本発明が解決しようとする課題
は、サンプルイメージが把握しやすく、かつ、自由に分
類する属性を組み合わせられるようにしたサンプル分類
支援装置を提供することにある。
【0018】
【課題を解決するための手段】上記課題を解決するため
に、本願請求項1に係るサンプル分類支援装置は、所定
のサンプル集合を属性項目によって木構造状に分類した
ツリー対して、前記属性項目を追加、変更、削除するツ
リー編集手段と、前記ツリー編集手段と連動し、前記ツ
リー編集手段によって作成したツリーの構造に従って前
記サンプルを分類し、前記ツリーの各ノードに対応する
サンプルの情報を格納するツリーデータベースを構築す
るツリーデータベース構築手段と、前記分類ツリーの各
末端ノードに分類されたサンプルのばらつきの程度を評
価する分類評価手段と、を備えたことを特徴とするもの
である。
【0019】本願請求項2に係るは、上記請求項1のサ
ンプル分類支援装置において、前記サンプルの属性をヒ
ストグラム分析し、その属性でサンプルを最適に区分す
る評価項目を生成するヒストグラム分析手段を備えたこ
とを特徴とするものである。
【0020】本願請求項3に係るサンプル分類支援装置
は、上記請求項1のサンプル分類支援装置において、前
記ツリー編集手段は、ツリーの部品を定義および登録で
き、前記ツリー部品を選択あるいは削除する操作によっ
て前記ツリーを構築することができることを特徴とする
ものである。
【0021】本願請求項4に係るサンプル分類支援装置
は、上記請求項1または2のサンプル分類支援装置にお
いて、前記ツリー編集手段は、前記属性項目あるいは評
価項目をユーザーに提示し、ユーザーの選択した項目に
応じてツリーを構成することを特徴とするものである。
【0022】本願請求項5に係るサンプル分類支援装置
は、上記請求項1または2のサンプル分類支援装置にお
いて、ユーザーに前記属性項目あるいは評価項目の定義
およびそのツリー構造の条件を設定させ、この設定され
た属性項目および評価項目の定義および条件に従って前
記ツリーを自動的に生成するツリー自動生成手段を備え
たことを特徴とするものである。
【0023】本発明のサンプル分類支援装置によれば、
ツリー編集手段が分類対象のサンプル集合の現在の分類
体系を表現したツリーをユーザーに示し、ユーザーによ
るツリーの編集を可能にする。
【0024】このツリーにおいては、サンプルの属性に
よって枝が分岐し、ノード(ツリーの葉の部分)を構成
する。したがって、属性項目を追加、変更、削除するこ
とによって、ツリーの構造、すなわちサンプルの分類体
系を変更することができる。
【0025】ツリー編集手段は、コンピュータの画面上
でツリーの所定のノードに対して属性項目を追加、変
更、削除させ、これによって、ユーザーの望む分類体
系、すなわちツリーを形成させる。
【0026】ツリーデータベース構築手段は、上記ツリ
ー編集手段と連動し、ツリー編集手段によって編集され
た分類体系に応じてサンプルを分類する。このツリーデ
ータベース構築手段は、ツリーの各ノードに対応するサ
ンプルの情報を格納したツリーデータベースを構築す
る。
【0027】分類評価手段は、上記ツリーデータベース
中のサンプル集合に対し、所定の特性を有するサンプル
が偏って存在しているか否かを評価する。所定の特性の
サンプルが偏って分類されていれば、その分類は有効な
分類であり、その分類の意味を分析することによって有
益な情報を得ることができる。
【0028】
【発明の実施の形態】以下に本発明の一実施形態による
サンプル分類支援装置について願書に添付の図面を用い
て説明する。図1は、本発明のサンプル分類支援装置に
よるサンプル分類の方法と、分類のための各処理に関与
する各構成手段を示している。図1において、符号1
は、分類しようとするサンプルのすべてを格納した母集
合データベースを示している。母集合データベース1
は、特性Pと特性Nが混在したサンプルのデータを格納
している。ここで、特性Pのサンプルはたとえば購買層
の顧客、特性Nのサンプルはたとえば非購買層の顧客の
ようなものとする。
【0029】母集合データベース1には、たとえば、図
1に示すように属性「年収」、「住居」、「取引年
数」、「利用額」等に関するデータが各サンプルごとに
格納されている。
【0030】本発明のサンプル分類支援装置による分類
は、母集合データベース1に対して、ユーザーに属性を
自由に選択させて分類体系たるツリー2を構成させ、こ
のツリー2の各ノード3に対応するサンプル情報を格納
したツリーデータベース4を構築する。さらに、本発明
のサンプル分類支援装置は、末端の各ツリーデータベー
ス4の特性P,Nのばらつきの程度を評価し、ユーザー
にいずれの分類が有効な分類かを判断させる。
【0031】図1中の一分類例について説明すれば、母
集合データベース1に対して最初に属性「職種」によっ
て「自営業」と「サラリーマン」とに分類し、次に一方
のノードである「自営業」に対して属性「年齢」によっ
て評価項目「高齢」と「低齢」とに分類し、続いて「高
齢の自営業」に対して属性「利用頻度」によって評価項
目「高度」と「低度」に分類している。なお、評価項目
については後述する。
【0032】この結果、最終的な末端ノードの属性「自
営業、かつ高齢、かつ利用頻度が高度」に対応するツリ
ーデータベース4が構築される。図の例では、このツリ
ーデータベース4中には、特性Pの顧客が4名、特性N
の顧客が6名分類されている。したがって特性Pと特性
Nの顧客の比率は0.4:0.6となり、分類によるば
らつきの程度を示すエントロピーは-(0.4*log0.4+0.6*l
og0.6)となった。このエントロピーについては後に説明
する。
【0033】上記サンプル分類のために、本発明のサン
プル分類支援装置は、ヒストグラム分析手段5と、ツリ
ー編集手段6と、ツリーデータベース構築手段7(図に
おいてデータベースをD/Bと略記する。以下同じ。)
と、分類評価手段8とを備えている。
【0034】ヒストグラム分析手段5は、ツリー編集に
先だって、各属性に関するサンプルのヒストグラム(分
布図)を分析し、その属性について、どの範囲でサンプ
ルを団塊として区分するのが有効かを分析するものであ
る。この属性を最適に区分するものが前述した評価項目
である。
【0035】ヒストグラム分析手段5によるヒストグラ
ム分析を図2を用いて以下に説明する。図2において、
母集合データベース1のサンプルは、属性項目「年齢」
について連続的な分布を有している。この年齢の分布か
ら、何歳以上を「高齢」とし、何歳以下を「低齢」とす
るかによって、分類の効果が大きく左右される。
【0036】ヒストグラム分析手段5は、この年齢分布
を所定の幅、たとえば5歳ごとに区分してヒストグラム
を作成する。AICに基づく最適ヒストグラムは、前記
ヒストグラムの度数の山を判断し、24歳以下の団塊
と、25歳以上の団塊に区分する。AID分析は、年齢
の分布にさらに「購入の有無」による確率を加味したヒ
ストグラムの分布を最適な団塊に区分する。図2の例で
はAID分析によっても、24歳以下を「低齢」、25
歳以上を「高齢」に区分するのが最適となった。この属
性項目「年齢」を24歳を境に区分した「低齢」と「高
齢」の項目を評価項目という。
【0037】なお、評価項目はサンプル分類上、属性項
目に含まれており、単に「属性項目によって分類」とい
う場合でも「属性項目・評価項目によって分類」を意味
することがある。
【0038】次に、ツリー編集手段6およびツリーデー
タベース構築手段7について説明する。ツリー編集手段
6はユーザーに自由に属性項目や評価項目を選択させて
ツリー2を構成させる。ツリー編集手段6による編集の
一過程を図3を用いて説明する。
【0039】図3は、ツリー編集手段6によって商品利
用特性に関するツリー2を構成している場合を示してい
る。この分類では、最初に「家電同種」の商品を利用し
たことの有無でサンプルを分類し、次に「家電同種を利
用したことがない顧客」について「鉄道券」の利用回数
で分類をしている。
【0040】本実施形態のツリー編集手段6は、所定の
ノードに対して「項目操作」と「区分操作」の選択メニ
ューを表示する。「項目操作」は属性項目・評価項目に
対する操作を、「区分操作」は属性項目・評価項目より
下流の分類に対する操作をそれぞれ指示することができ
るようになっている。
【0041】図3において属性項目「鉄道券」に対する
操作は、「項目操作」の場合を例示している。この「項
目操作」によれば、「鉄道券」の削除、「鉄道券」以下
の分類を部品として登録、「鉄道券」以下の分類を標準
ツリーとして登録のいずれかを選択することができる。
【0042】一方、「家電同種を利用したことが有る」
というノードに対する操作は「区分操作」を例示してい
る。この「区分操作」は、「項目編集」、「末端情報参
照」、「印刷」のいずれかを選択させ、「項目編集」を
選択した場合はさらに、「項目追加」、「部品追加」、
「標準ツリー追加」のいずれかの操作を選択させる。
【0043】ここで「項目追加」を選択した場合、ツリ
ー編集手段6は候補となる属性項目を表示し、ユーザー
に選択させる。ユーザーが、適当な属性項目を選択する
ことにより、ノード「あり」の下に新たなツリー部分が
形成される。
【0044】また、「部品追加」や「標準ツリー追加」
を選択した場合は、候補となる部品や標準ツリーを表示
し、ユーザーに選択させる。ユーザーが所定の部品や標
準ツリーを選択すると、ノード「あり」の下に選択され
た部品や標準ツリーが追加される。
【0045】また、ツリー編集手段6は、画面の下部に
メニューを表示している。このメニューによって編集の
途中で評価を行うことができる。この評価結果を参照す
ることによってユーザーは分類の方向の良否を判断する
ことができる。これによって、有望な分類については、
さらに細かく属性項目等を設定して有効な分類を得るに
至ることができる。一方、たとえば、サンプル数が急激
に減ってしまう分類は無意味な分類と判断でき、これよ
うな分類はそれ以上の分類を避けることができる。
【0046】ツリーデータベース構築手段7は、上記ツ
リー編集手段6の操作と連動し、ツリー2の構造に応じ
て自動的にサンプルを分類し、各ツリー2の各ノードに
対応するサンプルの情報を格納したツリーデータベース
4を構築する。すなわち、ツリー編集手段6によって所
定のツリー2が形成されると、そのツリー2の構造か
ら、ツリーデータベース構築手段7は属性項目の組合せ
を読みとり、この属性項目の組合せに応じてサンプルの
集合を分類し、ツリーデータベース4を構築する。
【0047】次に、分類評価手段8および上記エントロ
ピーについて以下に説明する。
【0048】分類評価手段8は、起動命令を受けたとき
に、ツリー2の末端ノード3に分類されたサンプルの特
性P,Nのばらつきを評価する。このばらつきの評価
は、分類のエントロピーEを求めることによって行う。
評価関数たる「分類のエントロピー」は、Eを分類エン
トロピー、Pi を特性Pi のサンプルが含まれる確率と
すると、次にように表される。
【0049】E=−ΣPi*logPi ここで、logは、底が0.5の対数とする。
【0050】たとえば、前述した図1の例の属性「自営
業、かつ高齢、かつ利用頻度が高度」の末端ノードに
は、特性Pの顧客が4名、特性Nの顧客が6名分類され
ているので、特性Pと特性Nの顧客の比率は0.4:
0.6となり、エントロピーE=−(0.4log0.
4+0.6log0.6)となる。
【0051】分類エントロピーEは、0と1の間の値を
とり、0に近づくほど所定の特性Pi を偏って分類した
ことを示し、1に近づくほど各特性Pi が均等に混在し
ていることを示す。
【0052】たとえば、特性Pのサンプルが100%、
特性Nのサンプルが0%の分類である場合、E=−(1
×log1+0×log0)=0となる。
【0053】反対に、特性Pと特性のサンプルがそれぞ
れ50%混在しているときは、E=−(0.5×log
0.5+0.5×log0.5)=1となる。
【0054】上記分類エントロピーEを、ツリー2の各
ノード3について計算することにより、その分類が有効
か否か、すなわち特定の特性を備えたサンプルが分離さ
れているか否かを容易に判断することができる。
【0055】さらに、所定のノードに対して、さらに細
かい分類を幾つか試みことによって、そのノードをさら
に細かく分類することが有意義か否かを判断することが
できる。この判断によって、無意味な分類を排除でき、
効率よく有効な分類・分析に到達することができる。
【0056】図4は、分類の評価を行った場合のツリー
の一部を例示している。図4に示すように、分類評価手
段8を作動させると、ツリーの各末端ノードの下方に、
分類エントロピーEの値と特性P,Nのサンプル個数を
表示される。これによって、十分有効な分類はそれ以上
の分類を止め、より細かい分類が有意義な場合はさらに
細かい分類を試みることができる。
【0057】次に、本発明のサンプル分類支援装置によ
る処理の流れをデータファイルの生成の面から図5を用
いて以下に説明する。
【0058】図5は、サンプル分類支援装置による処理
の流れと、処理の途中で生成されるデータファイルを示
している。本発明のサンプル分類支援装置による分類に
おいて、母集合データベース1が与えられると、最初に
前述したヒストグラム分析手段5によって属性項目につ
いてのヒストグラム分析を行う(ステップ100)。ヒ
ストグラム分析の結果は、評価項目編集参考データD/
B9に格納される。この評価項目編集参考データD/B
9を参照することにより、ユーザーは各属性について必
要な評価項目を編集することができる(ステップ11
0)。ユーザーが編集した評価項目は評価項目定義D/
B10に格納される。この評価項目定義D/B10に基
づいて、評価項目D/Bの生成処理が行われ(ステップ
120)、評価項目D/B11が構成される。
【0059】ここから、処理がツリーの自動生成とユー
ザーによるツリーの逐次生成に分かれる。ツリーの自動
生成では、ユーザーによる自動生成条件定義(ステップ
130)が予め行われる。この自動生成条件の定義は、
ツリーの構成や、終端条件等を定義するものであり、そ
の定義の結果は、自動生成条件D/B12に格納され
る。次に、図示しないツリー自動生成手段により、自動
生成条件D/B12に基づいてツリーの自動生成が行わ
れる(ステップ140)。この際、ツリー自動生成手段
は、サンプルツリーD/B13を適宜参照する。
【0060】なお、以上がツリーの自動生成であるが、
このツリーの自動生成は、本発明のサンプル分類支援装
置に必要不可欠というものではなく、必要に応じて付加
できるものであることを、ここに付記する。
【0061】次に、ユーザーによるツリーの逐次生成が
行われる(ステップ150)。このツリーの逐次生成
は、自動生成したツリーを修正する形によって行うこと
もでき、また、最初からユーザーによって、ツリーを編
集することもできる。このツリーの逐次生成の処理で
は、すでに説明したように、ツリー編集手段6とツリー
データベース構築手段7がユーザーの作業を支援する。
この際、サンプルツリーD/B13が適宜参照される。
【0062】上記ツリーの逐次生成の結果、ツリーデー
タベース4が生成される。さらに、これらツリーデータ
ベース4に対して、分類評価手段8によりばらつきの程
度を評価する(ステップ160)。
【0063】
【発明の効果】上記説明から明らかなように、本発明に
よるサンプル分類支援装置によれば、与えられたサンプ
ルの集合に対して、ユーザーは自由に属性項目と評価項
目を設定して前記サンプルを所定の属性を有する集団に
分類することができる。このとき、ツリー編集手段は、
サンプルの分類体系を木構造のツリーによってユーザー
に示し、属性項目・評価項目の追加・削除・変更を容易
に編集させる。ツリーデータベース構築手段は、ツリー
編集手段と連動して、自動的にサンプルを分類してノー
ドに対応するサンプルのデータベース(ツリーデータベ
ース)を構築する。また、分類評価手段は、各ツリーデ
ータベースのばらつきの程度を迅速に算出する。
【0064】これにより、ユーザーは、サンプルの分類
体系を視覚的に編集でき、かつ、その分類によるツリー
の末端ノードのサンプルイメージを容易に把握でき、さ
らに分類の評価を参照しながらより有効な分類に迅速に
到達することができる。
【0065】また、ヒストグラム分析手段を有する本発
明のサンプル分類支援装置によれば、各属性をヒストグ
ラム分析し、その属性についてサンプルを最適に区分す
る評価項目を容易に決定させる。これにより、各属性に
ついてサンプルを適当に分類することができ、有効なサ
ンプル分類・分析を支援することができる。
【0066】さらに、ツリー自動生成手段を有するサン
プル分類支援装置によれば、ユーザーは属性項目・評価
項目の定義と自動生成条件を設定するのみで概略の分類
ツリーを得ることができるので、より効率的なサンプル
分類を実現することができる。
【図面の簡単な説明】
【図1】本発明のサンプル分類支援装置によるサンプル
分類の処理と、各処理に関与する各構成手段を概念的に
示した図。
【図2】本発明のヒストグラム分析手段によるヒストグ
ラム分析を概念的に説明した図。
【図3】本発明のツリー編集手段によるツリー編集の一
画面を例示した図。
【図4】各末端ノード近傍に分類の評価値を表示したツ
リーの一部を示した図。
【図5】本発明のサンプル分類支援装置による処理の流
れを生成する各種ファイルとともに表示した流れ図。
【図6】従来のクロステーブル分析法による分類の一例
を示した図。
【符号の説明】
1 母集合データベース 2 ツリー 3 ノード 4 ツリーデータベース 5 ヒストグラム分析手段 6 ツリー編集手段 7 ツリーデータベース構築手段 8 分類評価手段 9 評価項目編集参考データD/B 10 評価項目定義D/B 11 評価項目D/B 12 自動生成条件D/B 13 サンプルツリーD/B
───────────────────────────────────────────────────── フロントページの続き (72)発明者 瀬 尾 利 数 神奈川県横浜市保土ケ谷区神戸町134番 地 株式会社野村総合研究所内 (72)発明者 真 下 竜 実 神奈川県横浜市保土ケ谷区神戸町134番 地 株式会社野村総合研究所内 (72)発明者 亀 井 章 弘 神奈川県横浜市保土ケ谷区神戸町134番 地 株式会社野村総合研究所内 (56)参考文献 特開 平6−149781(JP,A) 特開 平4−260169(JP,A) 特開 昭62−85377(JP,A) 特開 平2−24773(JP,A) 特開 平6−282578(JP,A) 特開 平7−262165(JP,A) 特開 平5−67134(JP,A) W.H.Press,.B.P.Fl anneryほか,Numerical Recipes in C[日本語版 ]pp.463−471,株式会社技術評論 社,平成6年8月25日初版第1刷 (58)調査した分野(Int.Cl.6,DB名) G06F 17/30

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】所定のサンプル集合を属性項目によって木
    構造状に分類したツリー対して、前記属性項目を追加、
    変更、削除するツリー編集手段と、 前記ツリー編集手段と連動し、前記ツリー編集手段によ
    って作成したツリーの構造に従って前記サンプルを分類
    し、前記ツリーの各ノードに対応するサンプルの情報を
    格納するツリーデータベースを構築するツリーデータベ
    ース構築手段と、 前記分類ツリーの各末端ノードに分類されたサンプルの
    ばらつきの程度を評価する分類評価手段と、を備えたこ
    とを特徴とするサンプル分類支援装置。
  2. 【請求項2】前記サンプルの属性をヒストグラム分析
    し、その属性でサンプルを最適に区分する評価項目を生
    成するヒストグラム分析手段を備えたことを特徴とする
    請求項1に記載のサンプル分類支援装置。
  3. 【請求項3】前記ツリー編集手段は、ツリーの部品を定
    義および登録でき、前記ツリー部品を選択あるいは削除
    する操作によって前記ツリーを構築することができるこ
    とを特徴とする請求項1に記載のサンプル分類支援装
    置。
  4. 【請求項4】前記ツリー編集手段は、前記属性項目ある
    いは評価項目をユーザーに提示し、ユーザーの選択した
    項目に応じてツリーを構成することを特徴とする請求項
    1または2に記載のサンプル分類支援装置。
  5. 【請求項5】ユーザーに前記属性項目あるいは評価項目
    の定義およびそのツリー構造の条件を設定させ、この設
    定された属性項目および評価項目の定義および条件に従
    って前記ツリーを自動的に生成するツリー自動生成手段
    を備えたことを特徴とする請求項1または2に記載のサ
    ンプル分類支援装置。
JP7252662A 1995-09-29 1995-09-29 サンプル分類支援装置 Expired - Lifetime JP2963033B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7252662A JP2963033B2 (ja) 1995-09-29 1995-09-29 サンプル分類支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7252662A JP2963033B2 (ja) 1995-09-29 1995-09-29 サンプル分類支援装置

Publications (2)

Publication Number Publication Date
JPH0997264A JPH0997264A (ja) 1997-04-08
JP2963033B2 true JP2963033B2 (ja) 1999-10-12

Family

ID=17240488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7252662A Expired - Lifetime JP2963033B2 (ja) 1995-09-29 1995-09-29 サンプル分類支援装置

Country Status (1)

Country Link
JP (1) JP2963033B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6092064A (en) * 1997-11-04 2000-07-18 International Business Machines Corporation On-line mining of quantitative association rules
JP3266586B2 (ja) * 1999-07-07 2002-03-18 インターナショナル・ビジネス・マシーンズ・コーポレーション データ分析システム
JP3492620B2 (ja) * 2000-10-24 2004-02-03 株式会社エヌイーシー総研 履歴情報編集システム、履歴情報編集方法、履歴情報管理サーバ、編集用端末及び記録媒体
JP2004185547A (ja) * 2002-12-06 2004-07-02 Hitachi Ltd 医療データ解析システム及び医療データ解析方法
JP6078437B2 (ja) * 2013-08-28 2017-02-08 株式会社日立ソリューションズ パーソナル情報匿名化システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
W.H.Press,.B.P.Flanneryほか,Numerical Recipes in C[日本語版]pp.463−471,株式会社技術評論社,平成6年8月25日初版第1刷

Also Published As

Publication number Publication date
JPH0997264A (ja) 1997-04-08

Similar Documents

Publication Publication Date Title
US6643646B2 (en) Analysis of massive data accumulations using patient rule induction method and on-line analytical processing
JP3575602B2 (ja) オンライン・データベース・マイニング
JP3049636B2 (ja) データ分析方法
US6507851B1 (en) Customer information retrieving method, a customer information retrieving apparatus, a data preparation method, and a database
US6263327B1 (en) Finding collective baskets and inference rules for internet mining
US9047585B2 (en) Method and system for informed decision making to locate a workforce
US7219307B2 (en) Methods for graphically representing interactions among entities
US7908159B1 (en) Method, data structure, and systems for customer segmentation models
US20020065708A1 (en) Method and system for interactive visual analyses of organizational interactions
WO2001024032A2 (en) Optimized rule based constraints for collaborative filtering systems
JPH1185769A (ja) 対象の集団から選択可能な特性を有する対象群を発見する方法
WO1995009400A1 (fr) Procede et dispositif de gestion de bases de donnees, et procede et dispositif d'extraction de donnees a partir de la base de donnees
US8275682B2 (en) Systems and methods for consumer price index determination using panel-based and point-of-sale market research data
DE60032258T2 (de) Bestimmen ob eine variable numerisch oder nicht numerisch ist
Ariestya et al. Marketing strategy for the determination of staple consumer products using FP-growth and apriori algorithm
JP2010277567A (ja) Dm配布エリア分析装置
JP2001117947A (ja) 高次元データを分類するための方法及びそれにより形成される分類木並びにコンピュータシステム
Collier et al. A perspective on data mining
JP2963033B2 (ja) サンプル分類支援装置
US6529895B2 (en) Determining a distribution of a numeric variable
US7516050B2 (en) Defining the semantics of data through observation
JP4194697B2 (ja) 分類ルール探求式クラスター分析装置
CN112434140B (zh) 一种答复信息处理方法及系统
JPH09305571A (ja) 時系列データ処理方法
JP2001175672A (ja) 情報フィルタリングシステム、その方法及びその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110806

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120806

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120806

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term