JP5500070B2 - データ分類システム、データ分類方法、及びデータ分類プログラム - Google Patents
データ分類システム、データ分類方法、及びデータ分類プログラム Download PDFInfo
- Publication number
- JP5500070B2 JP5500070B2 JP2010522625A JP2010522625A JP5500070B2 JP 5500070 B2 JP5500070 B2 JP 5500070B2 JP 2010522625 A JP2010522625 A JP 2010522625A JP 2010522625 A JP2010522625 A JP 2010522625A JP 5500070 B2 JP5500070 B2 JP 5500070B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- data
- axis
- item
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2008年7月30日に、日本に出願された特願2008−195895号に基づき優先権を主張し、その内容をここに援用する。
次に、本発明の第1の実施形態について図面を参照して説明する。図1は、本発明に係るデータ分類システムの構成の一例を示すブロック図である。図1に示すように、データ分類システムは、入力手段101と、分類軸候絞込み手段1021と、指標計算手段103と、出力手段104と、分類階層蓄積部201と、基準項目蓄積部202と、データ蓄積部203とを含む。
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(1)
=1/2×1/6×(ComDist(家庭,健康)+ComDist(家庭,医療)+ComDist(健康,医療))
・・・式(2)
=1/2×1/6×(ComDist(家庭,健康)+ComDist(家庭,医療)+ComDist(健康,医療))
=1/2×1/6×(2+3+3)
=0.67
・・・式(3)
次に、本発明の第2の実施形態について説明する。図7は、第2の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図7に示すように、本実施形態では、データ分類システムが、図1に示した指標計算手段103に代えて、第2の指標計算手段1031を含む点で、第1の実施形態と異なる。
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
・・・式(4)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(5)
=1/Max(X)×1/N×ΣDepth(X,ci)
・・・式(6)
=1/Max(X)×1/N×ΣDepth(X,ci)
=1/Max(X)×1/N×Σ(分類項目別データ数表の分類項目の深さ)
・・・式(7)
=1/DataNum×|∪データ(ci)|
・・・式(8)
=1/DataNum×|∪データ(ci)|
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
・・・式(9)
=1/(1/|∪データ(ci)|×ΣCatNum(ci))
・・・式(10)
=1/(1/|∪データ(ci)|×ΣCatNum(ci))
=1/(RecNum(データ別項目分類表,分類項目数>0)×Σ(データ別項目分類表のデータ数))
・・・式(11)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(C1,C2)
=1/Max(社会)×1/(2×3)×(ComDist(家族,外交)+ComDist(家族,医療)+ComDist(外交,医療))
=1/2×1/6×(4+4+4)
=1
・・・式(12)
=1/Max(X)×1/N×Σ(分類項目別データ数表の分類項目の深さ)
=1/Max(社会)×1/3×(2+2+1)
=1/2×1/3×(2+2+1)
=0.833
・・・式(13)
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
=1/6×6
=1
・・・式(14)
=1/(RecNum(データ別項目分類表,分類項目数>0)×Σ(データ別項目分類表のデータ数))
=1/(1/6×(3+2+3))
=6/8
=0.75
・・・式(15)
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
=0.25×1+0.25×0.833+0.25×1+0.25×0.75
=0.895
=0.90
・・・式(16)
次に、本発明の第3の実施形態について説明する。図11は、第3の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図11に示すように、本実施形態では、データ分類システムが、図7に示した構成要素に加えて、表示手段105を含む点で、第2の実施形態と異なる。
次に、本発明の第4の実施形態について説明する。図14は、第4の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図14に示すように、本実施の形態では、データ分類システムが、図1に示した構成要素に加えて、多次元分類軸作成手段1023を含む点で、第1の実施形態と異なる。また、本実施形態では、データ分類システムが、指標計算手段103に代えて、多次元指標計算手段1032を含む点で、第1の実施形態と異なる。
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
・・・式(17)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(18)
=1/2(1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家族,健康))+(1/2×1/6×(ComDist(外交,医学)+ComDist(外交,移植)+ComDist(医学,移植)))+1/4×(ComDist(社会,社会))
=1/2(1/2×1/6×(2+2+2)+(1/2×1/6×(4+4+2))+1/4×(0)
=0.67
・・・式(19)
次に、本発明の第5の実施形態について説明する。図17は、第5の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図17に示すように、本実施形態では、データ分類システムが、図14に示した多次元指標計算手段1032に代えて、第2の多次元指標計算手段1033を含む点で、第4の実施形態と異なる。
=1/次元数×Σ(1/Max(Xi)×Depth(Xi,cij)
・・・式(20)
=W1×多次元独立性((X1:C1)−(X2:C2)−・・・)+W2×多次元具体性((X1:C1)−(X2:C2)−・・・)+W3×多次元網羅性((X1:C1)−(X2:C2)−・・・)+W4×多次元一意性((X1:C1)−(X2:C2)−・・・)
・・・式(21)
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
・・・式(22)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(C1,C2)
・・・式(23)
=1/次元数×Σ具体性(Xi:Ci)
・・・式(24)
=1/Max(X)×1/N×ΣDepth(X,cj)
・・・式(25)
=1/次元数×1/N×ΣΣ(1/Max(Xi)×Depth(Xi,cij))
=1/(N次元数)×Σ(分類項目別データ数表の深さ指標)
・・・式(26)
=1/DataNum×|∪データ(cij,ckl,・・・)|
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
・・・式(27)
=|∪データ(cij,ckl,・・・)|/ΣCatNum(cij,ckl,・・・)
=RecNum(データ別項目分類表,分類項目数>0)/Σ(データ別項目分類表のデータ数)
・・・式(28)
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
=1/2(1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家庭,健康))+(1/2×1/6×(ComDist(外交,医学)+comDist(外交,移植)+ComDist(医学,移植)))+1/4×(ComDist(社会,社会))
=1/2(1/2×1/6×(2+2+2)+(1/2×1/6×(4+4+2))+1/4×(0)
=0.667
・・・式(29)
=1/(N次元数)×Σ(分類項目別データ数表の深さ指標)
=1/9×(1+1+1+1+1+1+1+1+1)
=1
・・・式(30)
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
=1/6×2
=0.333
・・・式(31)
=RecNum(データ別項目分類表,分類項目数>0)/Σ(データ別項目分類表のデータ数)
=2/(0+1+0+2+0+0)
=2/3
=0.667
・・・式(32)
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
=0.25×0.667+0.25×1+0.25×0.333+0.25×0.667
=0.67
・・・式(33)
次に、本発明の第6の実施形態について説明する。図19は、第6の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図19に示すように、本実施形態では、データ分類システムが、図17に示した構成要素に加えて、多次元表示手段1051を含む点で、第5の実施形態と異なる。
次に、本発明の第7の実施形態について説明する。図22は、第7の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図22に示すように、本実施形態では、データ分類システムが、図19に示した構成要素に加えて、検索手段106を含む点で、第6の実施形態と異なる。
次に、本発明の第8の実施形態について説明する。図23は、第8の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図23に示すように、本実施形態では、データ分類システムが、図22に示した構成要素に加えて、データ対応付け手段107を含む点で、第7の実施形態と異なる。
103 指標計算手段
104 出力手段
105 表示手段
106 検索手段
107 データ対応付け手段
201 分類階層蓄積部
202 基準項目蓄積部
203 データ蓄積部
1021 分類軸候補絞込み手段
1023 多次元分類候補作成手段
1031 第2の指標計算手段
1032 多次元指標計算手段
1033 第2の多次元指標計算手段
1051 多次元表示手段
Claims (32)
- 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するデータ分類システムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段と、
前記基準項目の子孫の分類項目から複数の分類項目を選択して分類軸候補とし、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込手段と、
前記分類軸絞込手段が絞り込んだ分類軸候補について、当該分類軸候補を表示する優先度を計算する優先度計算手段と
を備える、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
分類軸絞込手段は、分類項目に対応するデータ量が所定数以上であること、又は前記分類項目に対応するデータ量が上位所定割合以内であることのうちの少なくともいずれか一方の条件と、分類項目間の共通祖先までの長さが特定の範囲内であることという条件とを満たす分類軸を選択する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
優先度計算手段は、分類階層における分類項目間の共通の先祖までの長さに応じて、優先度を決定する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
優先度計算手段は、分類階層における分類項目間の階層的な距離を計算し、更に、分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、分類軸候補の優先度を決定する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
分類軸絞込手段が絞り込んだ分析軸候補と、優先度計算手段が計算した優先度とを読み込み、データ群とともに表示制御する表示制御手段を更に備え、
前記表示制御手段は、前記分類軸候補を優先度順に表示し、前記分類軸候補を選択することによって分類軸を切り替えて表示し、分類軸内の分類項目を選択することによって、データ群を選択又は絞り込み可能である、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を分類軸候補絞込手段に出力するデータ検索手段を備え、
前記分類軸絞込手段は、前記データ検索手段の検索結果に基づいて分類軸候補を絞り込み、
優先度計算手段は、前記データ検索手段が検索したデータ群に対応する分類軸の優先度を計算する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け手段を備える、データ分類システム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを多次元分類軸として出力するデータ分類システムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段と、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸を作成する際に、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込手段と、
前記分類軸絞込手段が絞り込んだ分類軸候補を組合せることによって、多次元の分類軸候補を作成する多次元分類軸作成手段と、
分類階層における分類項目間の階層的な距離に基づいて、多次元分類軸候補の優先度を計算する多次元優先度計算手段と
を備える、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
分類軸絞込手段は、各次元の分類軸の分類項目に対応するデータ量が所定数以上であるか、又は上位所定割合以内である分類項目を含み、且つ各次元の分類軸の分類項目間の階層的な距離として分類項目間の共通祖先までの長さが特定の範囲内となる分類項目を含む多次元分類軸を選択する、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
多次元優先度計算手段は、各次元の分類軸の分類階層における分類項目間の共通の先祖までの長さに応じて、多次元分類軸の優先度を変更する、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
多次元優先度計算手段は、各次元の分類軸の分類階層における分類項目間の階層的な距離を計算し、更に、各次元の分類軸の分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、多次元分類軸候補の優先度を決定する、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
分類軸絞込手段が絞り込んだ多次元分析軸候補と、多次元優先度計算手段が計算した優先度とを読み込み、データ群とともに一覧形式又は表形式で表示制御する多次元表示制御手段を備え、
前記多次元表示制御手段は、前記多次元分析軸候補を選択し、各次元の分類項目を表形式又は一覧形式に配置して表示し、1つ又は複数の分類項目を選択することによって、選択した分類項目に対応するデータの数、データ名、データ属性又は特徴語のうちの少なくともいずれか1つを表示する、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を多次元分類軸候補絞込手段に出力するデータ検索手段を更に備える、データ分類システム。 - 請求項8に記載のデータ分類システムであって、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け手段を更に備える、データ分類システム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するデータ分類方法であって、
基準項目蓄積手段が、前記分類項目を選択するための基準項目となる分類項目群を予めデータベースに蓄積する基準項目蓄積行程と、
分類軸絞込手段が、前記基準項目の子孫の分類項目から複数の分類項目を選択して分類軸候補とし、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込行程と、
優先度計算手段が、絞り込んだ前記分類軸候補について、当該分類軸候補を表示する優先度を計算する優先度計算行程と
を含む、データ分類方法。 - 請求項15に記載のデータ分類方法であって、
前記分類軸絞込手段が実行する分類軸絞込行程は、分類項目に対応するデータ量が所定数以上であること、又は前記分類項目に対応するデータ量が上位所定割合以内であることのうちの少なくともいずれか一方の条件と、分類項目間の共通祖先までの長さが特定の範囲内であることという条件とを満たす分類軸を選択する、データ分類方法。 - 請求項15に記載のデータ分類方法であって、
前記優先度計算手段が実行する優先度計算行程は、分類階層における分類項目間の共通の先祖までの長さに応じて、優先度を決定する、データ分類方法。 - 請求項15に記載のデータ分類方法であって、
前記優先度計算手段が実行する優先度計算行程は、分類階層における分類項目間の階層的な距離を計算し、更に、分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、分類軸候補の優先度を決定する、データ分類方法。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを多次元分類軸として出力するデータ分類方法であって、
基準項目蓄積手段が、前記分類項目を選択するための基準項目となる分類項目群を予めデータベースに蓄積する基準項目蓄積行程と、
分類軸絞込手段が、前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸を作成する際に、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込行程と、
多次元分類軸作成手段が、絞り込んだ前記分類軸候補を組合せることによって、多次元の分類軸候補を作成する多次元分類軸作成行程と、
多次元優先度計算手段が、分類階層における分類項目間の階層的な距離に基づいて、多次元分類軸候補の優先度を計算する多次元優先度計算行程と
を含む、データ分類方法。 - 請求項19に記載のデータ分類方法であって、
前記分類軸絞込手段が実行する分類軸絞込行程は、各次元の分類軸の分類項目に対応するデータ量が所定数以上であるか、又は上位所定割合以内である分類項目を含み、且つ各次元の分類軸の分類項目間の階層的な距離として分類項目間の共通祖先までの長さが特定の範囲内となる分類項目を含む多次元分類軸を選択する、データ分類方法。 - 請求項19に記載のデータ分類方法であって、
前記多次元優先度計算手段が実行する多次元優先度計算行程は、各次元の分類軸の分類階層における分類項目間の共通の先祖までの長さに応じて、多次元分類軸の優先度を変更する、データ分類方法。 - 請求項19に記載のデータ分類方法であって、
前記多次元優先度計算手段が実行する多次元優先度計算行程は、各次元の分類軸の分類階層における分類項目間の階層的な距離を計算し、更に、各次元の分類軸の分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、多次元分類軸候補の優先度を決定する、データ分類方法。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するためのデータ分類プログラムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段を備えたコンピュータに、
前記基準項目の子孫の分類項目から複数の分類項目を選択して分類軸候補とし、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込処理と、
絞り込んだ前記分類軸候補について、当該分類軸候補を表示する優先度を計算する優先度計算処理と
を実行させる、データ分類プログラム。 - 請求項23に記載のデータ分類プログラムであって、
コンピュータに、
分類軸絞込処理にて、分類項目に対応するデータ量が所定数以上であること、又は前記分類項目に対応するデータ量が上位所定割合以内であることのうちの少なくともいずれか一方の条件と、分類項目間の共通祖先までの長さが特定の範囲内であることという条件とを満たす分類軸を選択する処理を実行させる、データ分類プログラム。 - 請求項23に記載のデータ分類プログラムであって、
コンピュータに、
分類軸絞込処理で絞り込んだ分析軸候補と、優先度計算処理で計算した優先度とを読み込み、データ群とともに表示制御する表示制御処理を実行させ、
前記表示制御処理にて、前記分類軸候補を優先度順に表示し、前記分類軸候補を選択することによって分類軸を切り替えて表示し、分類軸内の分類項目を選択することによって、データ群を選択又は絞り込み可能に処理を実行させる、データ分類プログラム。 - 請求項23に記載のデータ分類プログラムであって、
コンピュータに、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を出力するデータ検索処理を実行させ、
分類軸絞込処理にて、前記データ検索処理の検索結果に基づいて分類軸候補を絞り込む処理を実行させ、
優先度計算処理にて、前記データ検索処理で検索したデータ群に対応する分類軸の優先度を計算する処理を実行させる、データ分類プログラム。 - 請求項23に記載のデータ分類プログラムであって、
コンピュータに、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け処理を実行させる、データ分類プログラム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを多次元分類軸として出力するためのデータ分類プログラムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段を備えたコンピュータに、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸を作成する際に、分類項目に対応するデータ量と、分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む分類軸絞込処理と、
絞り込んだ前記分類軸候補を組合せることによって、多次元の分類軸候補を作成する多次元分類軸作成処理と、
分類階層における分類項目間の階層的な距離に基づいて、多次元分類軸候補の優先度を計算する多次元優先度計算処理と
を実行させる、データ分類プログラム。 - 請求項28に記載のデータ分類プログラムであって、
コンピュータに、
分類軸絞込処理にて、各次元の分類軸の分類項目に対応するデータ量が所定数以上であるか、又は上位所定割合以内である分類項目を含み、且つ各次元の分類軸の分類項目間の階層的な距離として分類項目間の共通祖先までの長さが特定の範囲内となる分類項目を含む多次元分類軸を選択する処理を実行させる、データ分類プログラム。 - 請求項28に記載のデータ分類プログラムであって、
コンピュータに、
分類軸絞込処理で絞り込んだ多次元分析軸候補と、多次元優先度計算処理で計算した優先度とを読み込み、データ群とともに一覧形式又は表形式で表示制御する多次元表示制御処理を実行させ、
前記多次元表示制御処理で、前記多次元分析軸候補を選択し、各次元の分類項目を表形式又は一覧形式に配置して表示し、1つ又は複数の分類項目を選択することによって、選択した分類項目に対応するデータの数、データ名、データ属性又は特徴語のうちの少なくともいずれか1つを表示する処理を実行させる、データ分類プログラム。 - 請求項28に記載のデータ分類プログラムであって、
コンピュータに、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を出力するデータ検索処理を実行させる、データ分類プログラム。 - 請求項28に記載のデータ分類プログラムであって、
コンピュータに、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け処理を実行させる、データ分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010522625A JP5500070B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008195895 | 2008-07-30 | ||
JP2008195895 | 2008-07-30 | ||
PCT/JP2009/003601 WO2010013472A1 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
JP2010522625A JP5500070B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010013472A1 JPWO2010013472A1 (ja) | 2012-01-05 |
JP5500070B2 true JP5500070B2 (ja) | 2014-05-21 |
Family
ID=41610186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522625A Active JP5500070B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9342589B2 (ja) |
JP (1) | JP5500070B2 (ja) |
WO (1) | WO2010013472A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9361367B2 (en) | 2008-07-30 | 2016-06-07 | Nec Corporation | Data classifier system, data classifier method and data classifier program |
US8650198B2 (en) * | 2011-08-15 | 2014-02-11 | Lockheed Martin Corporation | Systems and methods for facilitating the gathering of open source intelligence |
JP6473645B2 (ja) * | 2015-03-30 | 2019-02-20 | 株式会社日立ソリューションズ東日本 | 情報表示装置 |
JP6641936B2 (ja) * | 2015-12-01 | 2020-02-05 | 富士通株式会社 | 情報処理装置、情報処理プログラム、及び情報処理方法 |
AU2018313274B2 (en) * | 2017-08-11 | 2022-06-30 | Ancestry.Com Operations Inc. | Diversity evaluation in genealogy search |
US11500884B2 (en) | 2019-02-01 | 2022-11-15 | Ancestry.Com Operations Inc. | Search and ranking of records across different databases |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202535A (ja) * | 2004-01-14 | 2005-07-28 | Hitachi Ltd | 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体 |
JP2006171931A (ja) * | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニングプログラム |
JP2007102309A (ja) * | 2005-09-30 | 2007-04-19 | Mitsubishi Electric Corp | 自動分類装置 |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251144A (en) | 1991-04-18 | 1993-10-05 | Texas Instruments Incorporated | System and method utilizing a real time expert system for tool life prediction and tool wear diagnosis |
JPH0573615A (ja) | 1991-09-17 | 1993-03-26 | Kobe Nippon Denki Software Kk | 階層構造型情報の管理方式 |
JP3096353B2 (ja) | 1992-04-22 | 2000-10-10 | 株式会社戸上電機製作所 | データの分類方法 |
US5325445A (en) | 1992-05-29 | 1994-06-28 | Eastman Kodak Company | Feature classification using supervised statistical pattern recognition |
EP0582885A3 (en) | 1992-08-05 | 1997-07-02 | Siemens Ag | Procedure to classify field patterns |
US5353346A (en) | 1992-12-22 | 1994-10-04 | Mpr Teltech, Limited | Multi-frequency signal detector and classifier |
US5640492A (en) | 1994-06-30 | 1997-06-17 | Lucent Technologies Inc. | Soft margin classifier |
US5596993A (en) | 1994-09-21 | 1997-01-28 | Beth Israel Hospital | Fetal data processing system and method |
US5561431A (en) | 1994-10-24 | 1996-10-01 | Martin Marietta Corporation | Wavelet transform implemented classification of sensor data |
JP3577819B2 (ja) | 1995-07-14 | 2004-10-20 | 富士ゼロックス株式会社 | 情報探索装置及び情報探索方法 |
JPH0981585A (ja) | 1995-09-14 | 1997-03-28 | Ricoh Co Ltd | 電子ファイリング装置 |
JP3670076B2 (ja) | 1996-03-07 | 2005-07-13 | 松下電器産業株式会社 | データ表示装置 |
US5765029A (en) | 1996-05-08 | 1998-06-09 | Xerox Corporation | Method and system for fuzzy image classification |
US5930392A (en) * | 1996-07-12 | 1999-07-27 | Lucent Technologies Inc. | Classification technique using random decision forests |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US5956721A (en) * | 1997-09-19 | 1999-09-21 | Microsoft Corporation | Method and computer program product for classifying network communication packets processed in a network stack |
US6185328B1 (en) * | 1998-01-21 | 2001-02-06 | Xerox Corporation | Method and system for classifying and processing of pixels of image data |
US6229923B1 (en) * | 1998-01-21 | 2001-05-08 | Xerox Corporation | Method and system for classifying and processing of pixels of image data |
JPH11306187A (ja) | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | カテゴリ付文書の検索結果の提示処理方法およびその装置 |
US6304773B1 (en) * | 1998-05-21 | 2001-10-16 | Medtronic Physio-Control Manufacturing Corp. | Automatic detection and reporting of cardiac asystole |
US6192360B1 (en) * | 1998-06-23 | 2001-02-20 | Microsoft Corporation | Methods and apparatus for classifying text and for building a text classifier |
JP3665480B2 (ja) | 1998-06-24 | 2005-06-29 | 富士通株式会社 | 文書整理装置および方法 |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
US6185336B1 (en) * | 1998-09-23 | 2001-02-06 | Xerox Corporation | Method and system for classifying a halftone pixel based on noise injected halftone frequency estimation |
JP2000171931A (ja) | 1998-09-30 | 2000-06-23 | Fuji Photo Film Co Ltd | 写真用固体微粒子分散物、その製造方法、及びそれを含有するハロゲン化銀写真感光材料 |
US6421683B1 (en) * | 1999-03-31 | 2002-07-16 | Verizon Laboratories Inc. | Method and product for performing data transfer in a computer system |
US6907566B1 (en) * | 1999-04-02 | 2005-06-14 | Overture Services, Inc. | Method and system for optimum placement of advertisements on a webpage |
US7185075B1 (en) | 1999-05-26 | 2007-02-27 | Fujitsu Limited | Element management system with dynamic database updates based on parsed snooping |
US7363359B1 (en) | 1999-05-26 | 2008-04-22 | Fujitsu Limited | Element management system with automatic remote backup of network elements' local storage |
WO2000075788A1 (en) | 1999-05-26 | 2000-12-14 | Fujitsu Network Communications, Inc. | Network element management system |
US6490556B2 (en) * | 1999-05-28 | 2002-12-03 | Intel Corporation | Audio classifier for half duplex communication |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
US6671680B1 (en) * | 2000-01-28 | 2003-12-30 | Fujitsu Limited | Data mining apparatus and storage medium storing therein data mining processing program |
JP2001216306A (ja) | 2000-01-31 | 2001-08-10 | Hitachi Ltd | カテゴリ作成装置 |
US7325201B2 (en) * | 2000-05-18 | 2008-01-29 | Endeca Technologies, Inc. | System and method for manipulating content in a hierarchical data-driven search and navigation system |
US7113934B2 (en) | 2000-05-25 | 2006-09-26 | Fujitsu Limited | Element management system with adaptive interfacing selected by last previous full-qualified managed level |
US6459974B1 (en) * | 2001-05-30 | 2002-10-01 | Eaton Corporation | Rules-based occupant classification system for airbag deployment |
US7028024B1 (en) * | 2001-07-20 | 2006-04-11 | Vignette Corporation | Information retrieval from a collection of information objects tagged with hierarchical keywords |
AUPR824401A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw002) |
JP4404533B2 (ja) * | 2002-08-30 | 2010-01-27 | 株式会社ニデック | 眼内レンズの製造方法及び該方法にて得られる眼内レンズ |
JP2004110161A (ja) * | 2002-09-13 | 2004-04-08 | Fuji Xerox Co Ltd | テキスト文比較装置 |
JP4233836B2 (ja) * | 2002-10-16 | 2009-03-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
JP4305083B2 (ja) | 2003-07-14 | 2009-07-29 | 富士ゼロックス株式会社 | 単語間類似度計算装置およびプログラム |
JP4451624B2 (ja) | 2003-08-19 | 2010-04-14 | 富士通株式会社 | 情報体系対応付け装置および対応付け方法 |
US7877238B2 (en) * | 2003-09-12 | 2011-01-25 | Sysmex Corporation | Data classification supporting method, computer readable storage medium, and data classification supporting apparatus |
US7577655B2 (en) | 2003-09-16 | 2009-08-18 | Google Inc. | Systems and methods for improving the ranking of news articles |
KR20050045746A (ko) * | 2003-11-12 | 2005-05-17 | 삼성전자주식회사 | 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치 |
JP2005267604A (ja) * | 2004-02-18 | 2005-09-29 | Fuji Xerox Co Ltd | 動作分類支援装置および動作分類装置 |
US7710897B2 (en) | 2004-08-26 | 2010-05-04 | Fujitsu Limited | Automatic discovery of logical network elements from existing links in a network |
JP4671164B2 (ja) | 2004-11-11 | 2011-04-13 | 日本電気株式会社 | 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム |
WO2006087854A1 (ja) | 2004-11-25 | 2006-08-24 | Sharp Kabushiki Kaisha | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
TW200622402A (en) * | 2004-12-28 | 2006-07-01 | Innolux Display Corp | Liquid crystal panel and its cutting method |
JP2006285419A (ja) * | 2005-03-31 | 2006-10-19 | Sony Corp | 情報処理装置および方法、並びにプログラム |
US7912871B2 (en) * | 2005-07-27 | 2011-03-22 | Technion Research And Development Foundation Ltd. | Incremental validation of key and keyref constraints |
JP4992715B2 (ja) | 2005-08-04 | 2012-08-08 | 日本電気株式会社 | データ処理装置、データ処理方法、データ処理プログラム |
FR2902913A1 (fr) * | 2006-06-21 | 2007-12-28 | France Telecom | Procede et dispositif de codage d'une note de similarite semantique et spatiale entre concepts d'une ontologie memorisee sous forme de treillis numerote hierarchiquement |
US7873616B2 (en) * | 2006-07-07 | 2011-01-18 | Ecole Polytechnique Federale De Lausanne | Methods of inferring user preferences using ontologies |
US8001130B2 (en) | 2006-07-25 | 2011-08-16 | Microsoft Corporation | Web object retrieval based on a language model |
US7720830B2 (en) | 2006-07-31 | 2010-05-18 | Microsoft Corporation | Hierarchical conditional random fields for web extraction |
US7921106B2 (en) | 2006-08-03 | 2011-04-05 | Microsoft Corporation | Group-by attribute value in search results |
US7912875B2 (en) * | 2006-10-31 | 2011-03-22 | Business Objects Software Ltd. | Apparatus and method for filtering data using nested panels |
US8065307B2 (en) | 2006-12-20 | 2011-11-22 | Microsoft Corporation | Parsing, analysis and scoring of document content |
EP2111593A2 (en) | 2007-01-26 | 2009-10-28 | Information Resources, Inc. | Analytic platform |
US20080221983A1 (en) * | 2007-03-06 | 2008-09-11 | Siarhei Ausiannik | Network information distribution system and a method of advertising and search for supply and demand of products/goods/services in any geographical location |
CN101295305B (zh) | 2007-04-25 | 2012-10-31 | 富士通株式会社 | 图像检索装置 |
US8229881B2 (en) | 2007-07-16 | 2012-07-24 | Siemens Medical Solutions Usa, Inc. | System and method for creating and searching medical ontologies |
KR100930799B1 (ko) * | 2007-09-17 | 2009-12-09 | 한국전자통신연구원 | 자동화된 클러스터링 방법 및 이를 이용한 이동통신환경에서 다중 경로의 클러스터링 방법 및 장치 |
JP4998237B2 (ja) | 2007-12-06 | 2012-08-15 | 富士通株式会社 | 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法 |
US9361367B2 (en) | 2008-07-30 | 2016-06-07 | Nec Corporation | Data classifier system, data classifier method and data classifier program |
US9378202B2 (en) * | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
-
2009
- 2009-07-29 WO PCT/JP2009/003601 patent/WO2010013472A1/ja active Application Filing
- 2009-07-29 JP JP2010522625A patent/JP5500070B2/ja active Active
- 2009-07-29 US US13/056,030 patent/US9342589B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202535A (ja) * | 2004-01-14 | 2005-07-28 | Hitachi Ltd | 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体 |
JP2006171931A (ja) * | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニングプログラム |
JP2007102309A (ja) * | 2005-09-30 | 2007-04-19 | Mitsubishi Electric Corp | 自動分類装置 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2010013472A1 (ja) | 2012-01-05 |
US9342589B2 (en) | 2016-05-17 |
WO2010013472A1 (ja) | 2010-02-04 |
US20110153615A1 (en) | 2011-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5423676B2 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
JP5063682B2 (ja) | 文書データベースにおける文書の領域識別のための方法 | |
US7778952B2 (en) | Displaying facts on a linear graph | |
US8280886B2 (en) | Determining candidate terms related to terms of a query | |
CN101692223B (zh) | 响应于用户输入精炼搜索空间 | |
US20080040342A1 (en) | Data processing apparatus and methods | |
JP5187313B2 (ja) | 文書重要度算出システム、文書重要度算出方法およびプログラム | |
KR20160083017A (ko) | 소셜 데이터 네트워크에서 인플루언서들 및 그들의 커뮤니티를 식별하기 위한 시스템 및 방법 | |
JP5500070B2 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
Mazeika et al. | Entity timelines: visual analytics and named entity evolution | |
Crespo Azcarate et al. | Improving image retrieval effectiveness via query expansion using MeSH hierarchical structure | |
US10896163B1 (en) | Method and apparatus for query formulation | |
Zigkolis et al. | Collaborative event annotation in tagged photo collections | |
JPWO2014049708A1 (ja) | 文書分析装置およびプログラム | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
Hoang et al. | Crowdsourcing scholarly data | |
JP2006099753A (ja) | 名前及びキーワードのグループ化方法、そのプログラムおよび記録媒体並びに装置 | |
KR101078978B1 (ko) | 문서 분류 시스템 | |
KR101201218B1 (ko) | 니치 기술 영역 발견을 지원하는 니치 기술 영역 발견을 지원하는 특허 정보 처리 방법 | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
Huang et al. | Rough-set-based approach to manufacturing process document retrieval | |
Alahmari et al. | Linked Data and Entity Search: A Brief History and Some Ways Ahead. | |
KR20150057497A (ko) | 온라인 텍스트 문서의 계층적 트리 기반 주제탐색 방법 및 시스템 | |
Rástočný et al. | Web search results exploration via cluster-based views and zoom-based navigation | |
US11681700B1 (en) | Methods and apparatuses for clustered storage of information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5500070 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |