JP5423676B2 - データ分類システム、データ分類方法、及びデータ分類プログラム - Google Patents
データ分類システム、データ分類方法、及びデータ分類プログラム Download PDFInfo
- Publication number
- JP5423676B2 JP5423676B2 JP2010522626A JP2010522626A JP5423676B2 JP 5423676 B2 JP5423676 B2 JP 5423676B2 JP 2010522626 A JP2010522626 A JP 2010522626A JP 2010522626 A JP2010522626 A JP 2010522626A JP 5423676 B2 JP5423676 B2 JP 5423676B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- data
- item
- items
- axis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 78
- 238000004364 calculation method Methods 0.000 claims description 207
- 230000008569 process Effects 0.000 claims description 35
- 230000036541 health Effects 0.000 description 52
- 238000013500 data storage Methods 0.000 description 50
- 238000010586 diagram Methods 0.000 description 45
- 230000006870 function Effects 0.000 description 34
- 239000003814 drug Substances 0.000 description 23
- 230000010365 information processing Effects 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 16
- 239000000284 extract Substances 0.000 description 14
- 238000002054 transplantation Methods 0.000 description 11
- 239000000470 constituent Substances 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 241000111471 Convolvulus scoparius Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2008年7月30日に、日本に出願された特願2008−195896号に基づき優先権を主張し、その内容をここに援用する。
次に、本発明の第1の実施形態について図面を参照して説明する。図1は、本発明によるデータ分類システムの構成の一例を示すブロック図である。図1に示すように、データ分類システムは、入力手段101と、分類軸候補作成手段102と、指標計算手段103と、出力手段104と、分類階層蓄積部201と、基準項目蓄積部202と、データ蓄積部203と、を含む。
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(1)
=1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家族,健康))
・・・式(2)
=1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家族,健康))
=1/2×1/6×(2+2+2)
=0.5
・・・式(3)
=1/2×1/6×(ComDist(家庭,健康)+ComDist(家庭,医療)+ComDist(健康,医療))
・・・式(4)
=1/2×1/6×(ComDist(家庭,健康)+ComDist(家庭,医療)+ComDist(健康,医療))
=1/2×1/6×(2+3+3)
=0.67
・・・式(5)
次に、本発明の第2の実施形態について説明する。図7は、第2の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図7に示すように、本実施の形態では、データ分類システムが、図1に示した指標計算手段103に代えて、第2の指標計算手段1031を含む点で、第1の実施形態と異なる。
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
・・・式(6)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(7)
=1/Max(X)×1/N×ΣDepth(X,ci)
・・・式(8)
=1/Max(X)×1/N×ΣDepth(X,ci)
=1/Max(X)×1/N×Σ(分類項目別データ数表の分類項目の深さ)
・・・式(9)
=1/DataNum×|∪データ(ci)|
・・・式(10)
=1/DataNum×|∪データ(ci)|
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
・・・式(11)
=1/(1/|∪データ(ci)|×ΣCatNum(ci))
・・・式(12)
=1/(1/|∪データ(ci)|×ΣCatNum(ci))
=1/(RecNum(データ別項目分類表,分類項目数>0)×Σ(データ別項目分類表のデータ数))
・・・式(13)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(C1,C2)
=1/Max(社会)×1/(2×3)×(ComDist(家族,外交)+ComDist(家族,医療)+ComDist(外交,医療))
=1/2×1/6×(4+4+4)
=1
・・・式(14)
=1/Max(X)×1/N×Σ(分類項目別データ数表の分類項目の深さ)
=1/Max(社会)×1/3×(2+2+1)
=1/2×1/3×(2+2+1)
=0.833
・・・式(15)
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
=1/6×6
=1
・・・式(16)
=1/(RecNum(データ別項目分類表,分類項目数>0)×Σ(データ別項目分類表のデータ数))
=1/(1/6×(3+2+3))
=6/8
=0.75
・・・式(17)
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
=0.25×1+0.25×0.833+0.25×1+0.25×0.75
=0.895
=0.90
・・・式(18)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(C1,C2)
=1/Max(社会)×1/(2×3)×(ComDist(家庭,家族)+ComDist(家族,健康)+ComDist(家族,健康))
=1/2×1/6×(2+2+2)
=0.5
・・・式(19)
=1/Max(X)×1/N×Σ(分類項目別データ数表の分類項目の深さ)
=1/Max(社会)×1/3×(2+2+2)
=1/2×1/3×(2+2+2)
=1
・・・式(20)
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
=1/6×4
=0.667
・・・式(21)
=1/(RecNum(データ別項目分類表,分類項目数>0)×Σ(データ別項目分類表のデータ数))
=1/(1/4×(3+3+2))
=4/8
=0.5
・・・式(22)
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
=0.25×0.5+0.25×1+0.25×0.667+0.25×0.5
=0.667
=0.67
・・・式(23)
次に、本発明の第3の実施形態について説明する。図12は、第3の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図12に示すように、本実施形態では、データ分類システムが、図7に示した分類軸候補作成手段102に代えて、分類軸候補絞込み手段1021を含む点で、第2の実施形態と異なる。なお、以下、主として、第2の実施形態と異なる点について説明する。
次に、本発明の第4の実施形態について説明する。図15は、第4の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図15に示すように、本実施形態では、データ分類システムが、図12に示した構成要素に加えて、表示手段105を含む点で、第3の実施形態と異なる。
次に、本発明の第5の実施形態について説明する。図18は、第5の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図18に示すように、本実施の形態では、データ分類システムが、分類軸候補作成手段102に代えて多次元分類軸候補作成手段1022を含み、指標計算手段103に代えて多次元指標計算手段1032を含む点で、第1の実施形態と異なる。
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
・・・式(24)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(ci,cj)
・・・式(25)
=1/2(1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家族,健康))+(1/2×1/6×(ComDist(外交,医学)+ComDist(外交,移植)+ComDist(医学,移植)))+1/4×(ComDist(社会,社会))
=1/2(1/2×1/6×(2+2+2)+(1/2×1/6×(4+4+2))+1/4×(0)
=0.67
・・・式(26)
次に、本発明の第6の実施形態について説明する。図21は、第6の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図21に示すように、本実施の形態では、データ分類システムが、図18に示した多次元指標計算手段1032に代えて、第2の多次元指標計算手段1033を含む点で、第5の実施形態と異なる。
=1/次元数×Σ(1/Max(Xi)×Depth(Xi,cij)
・・・式(27)
=W1×多次元独立性((X1:C1)−(X2:C2)−・・・)+W2×多次元具体性((X1:C1)−(X2:C2)−・・・)+W3×多次元網羅性((X1:C1)−(X2:C2)−・・・)+W4×多次元一意性((X1:C1)−(X2:C2)−・・・)
・・・式(28)
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
・・・式(29)
=1/Max(X)×1/(2×組合せ数)×ΣComDist(C1,C2)
・・・式(30)
=1/次元数×Σ具体性(Xi:Ci)
・・・式(31)
=1/Max(X)×1/N×ΣDepth(X,cj)
・・・式(32)
=1/次元数×1/N×ΣΣ(1/Max(Xi)×Depth(Xi,cij))
=1/(N次元数)×Σ(分類項目別データ数表の深さ指標)
・・・式(33)
=1/DataNum×|∪データ(cij,ckl,・・・)|
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
・・・式(34)
=|∪データ(cij,ckl,・・・)|/ΣCatNum(cij,ckl,・・・)
=RecNum(データ別項目分類表,分類項目数>0)/Σ(データ別項目分類表のデータ数)
・・・式(35)
=1/次元数×Σ独立性(Xi:Ci)+1/(2×次元数)×ΣComDist(Xi,Xj)
=1/2(1/2×1/6×(ComDist(家庭,家族)+ComDist(家庭,健康)+ComDist(家庭,健康))+(1/2×1/6×(ComDist(外交,医学)+comDist(外交,移植)+ComDist(医学,移植)))+1/4×(ComDist(社会,社会))
=1/2(1/2×1/6×(2+2+2)+(1/2×1/6×(4+4+2))+1/4×(0)
=0.667
・・・式(36)
=1/(N次元数)×Σ(分類項目別データ数表の深さ指標)
=1/9×(1+1+1+1+1+1+1+1+1)
=1
・・・式(37)
=1/DataNum×RecNum(データ別項目分類表,分類項目数>0)
=1/6×2
=0.333
・・・式(38)
=RecNum(データ別項目分類表,分類項目数>0)/Σ(データ別項目分類表のデータ数)
=2/(0+1+0+2+0+0)
=2/3
=0.667
・・・式(39)
=W1×独立性(X:C)+W2×具体性(X:C)+W3×網羅性(X:C)+W4×一意性(X:C)
=0.25×0.667+0.25×1+0.25×0.333+0.25×0.667
=0.67
・・・式(40)
次に、本発明の第7の実施形態について説明する。図23は、第7の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図23に示すように、本実施の形態では、データ分類システムが、多次元分類軸候補作成手段1022に代えて、分類軸候補絞込み手段1021と第2の多次元分類軸候補作成手段1023とを含む点で、第6の実施形態と異なる。
次に、本発明の第8の実施形態について説明する。図24は、第8の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図24に示すように、本実施の形態では、データ分類システムが、図17に示した構成要素に加えて、多次元表示手段1051を含む点で、第7の実施形態と異なる。
本実施形態では、多次元表示手段1051は、データID群とその数を表示している。
次に、本発明の第9の実施形態について説明する。図27は、第9の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図27に示すように、本実施の形態では、データ分類システムが、図24に示した構成要素に加えて、検索手段106を含む点で、第8の実施形態と異なる。
次に、本発明の第10の実施形態について説明する。図28は、第10の実施形態におけるデータ分類システムの構成の一例を示すブロック図である。図28に示すように、本実施形態では、データ分類システムが、図27に示した構成要素に加えて、データ対応付け手段107を含む点で、第9の実施形態と異なる。
102 分類軸候補作成手段
103 指標計算手段
104 出力手段
105 表示手段
106 検索手段
107 データ対応付け手段
201 分類階層蓄積部
202 基準項目蓄積部
203 データ蓄積部
1021 分類軸候補絞込み手段
1022 多次元分類軸候補作成手段
1023 第2の多次元分類軸候補作成手段
1031 第2の指標計算手段
1032 多次元指標計算手段
1033 第2の多次元指標計算手段
1051 多次元表示手段
Claims (26)
- 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するデータ分類システムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段と、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて、分類軸候補を作成する分類軸候補作成手段と、
分類階層における分類項目間の階層的な距離に基づいて、前記分類軸候補作成手段が作成した分類軸候補について、当該分類軸候補の優先度を計算する優先度計算手段と
を備える、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
優先度計算手段は、分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖まで長さに応じて、優先度を変更する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
優先度計算手段は、
分類階層における分類項目間の階層的な距離を計算し、更に、分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、分類軸候補の優先度を決定する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
分類軸候補作成手段は、分類項目に対応するデータ量と、分類階層における分類項目間の階層的な距離とに基づいて、計算対象となる分類軸候補を絞り込む、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
分類軸候補作成手段は、分類項目に対応するデータ量が所定数以上であるか、又は上位所定割合以内であるかのうちの少なくともいずれか一方の条件をみたし、且つ分類項目間の共通の祖先の分類項目までの長さが特定の範囲内となる分類軸を選択する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
分類軸候補作成手段が作成した分類軸候補と、優先度計算手段が計算した優先度とを読み込み、データ群とともに表示制御する表示制御手段を更に備え、
前記表示制御手段は、前記分類軸候補を優先度順に表示し、前記分類軸候補を選択することによって分類軸を切り替えて表示し、分類軸内の分類項目を選択することによって、データ群を選択又は絞り込み可能である、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を分類軸候補作成手段に出力するデータ検索手段を備え、
前記分類軸候補作成手段は、前記データ検索手段の検索結果に基づいて分類軸候補を作成し、
優先度計算手段は、前記データ検索手段が検索したデータ群に対応する分類軸の優先度を計算する、データ分類システム。 - 請求項1に記載のデータ分類システムであって、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け手段を備える、データ分類システム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを出力するデータ分類システムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段と、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸候補を作成し、複数の分類軸候補を組合せることによって、多次元分類軸候補を作成する多次元分類軸候補作成手段と、
分類階層における分類項目間の階層的な距離に基づいて、前記多次元分類軸候補作成手段が作成した多次元分類軸候補について、当該多次元分類軸候補の優先度を計算する多次元優先度計算手段と
を備える、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
多次元優先度計算手段は、分類階層での分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖までの長さに応じて、多次元分類軸の優先度を変更する、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
多次元優先度計算手段は、各次元の分類軸の分類階層における分類項目間の階層的な距離を計算し、更に、各次元の分類軸の分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、多次元分類軸候補の優先度を決定する、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
多次元分類軸候補作成手段は、各次元の分類軸に対応するデータ量と、各次元の分類軸の分類項目間の階層的な距離とに基づいて、計算対象となる多次元分類軸候補を絞り込む、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
多次元分類軸候補作成手段は、各次元の分類軸の分類項目に対応するデータ量が所定数以上であるか、又は上位所定割合以内である分類項目を含み、且つ各次元の分類軸の分類項目間の階層的な距離として分類項目間の共通祖先までの長さが特定の範囲内となる分類項目を含む多次元分類軸を選択する、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
多次元分類軸候補作成手段が作成した多次元分類軸候補と、多次元優先度計算手段が計算した優先度とを読み込み、データ群とともに一覧形式又は表形式で表示制御する多次元表示制御手段を備え、
前記多次元表示制御手段は、前記多次元分類軸候補を選択し、各次元の分類項目を表形式又は一覧形式に配置して表示し、1つ又は複数の分類項目を選択することによって、選択した分類項目に対応するデータの数、データ名、データ属性又は特徴語のうちの少なくともいずれか1つを表示する、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
データ群を検索キーワードに基づいて検索し、前記データ群を検索した結果を多次元分類軸候補作成手段に出力するデータ検索手段を更に備える、データ分類システム。 - 請求項9に記載のデータ分類システムであって、
階層的な分類項目とデータ群とを入力し、入力した分類項目とデータとの対応付けを行うデータ対応付け手段を更に備える、データ分類システム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するデータ分類方法であって、
前記分類項目を選択するための基準項目となる分類項目群を予めデータベースに蓄積し、前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて、分類軸候補を作成する分類軸候補作成行程と、
分類階層における分類項目間の階層的な距離に基づいて、作成した前記分類軸候補について、当該分類軸候補の優先度を計算する優先度計算行程と
を含む、データ分類方法。 - 請求項17に記載のデータ分類方法であって、
優先度計算行程は、分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖まで長さに応じて、優先度を変更する、データ分類方法。 - 請求項17に記載のデータ分類方法であって、
優先度計算行程は、分類階層における分類項目間の階層的な距離を計算し、更に、分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、分類軸候補の優先度を決定する、データ分類方法。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを出力するデータ分類方法であって、
前記分類項目を選択するための基準項目となる分類項目群を予めデータベースに蓄積し、前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸候補を作成し、複数の分類軸候補を組合せることによって、多次元分類軸候補を作成する多次元分類軸候補作成行程と、
分類階層における分類項目間の階層的な距離に基づいて、作成した前記多次元分類軸候補について、多次元分類軸候補の優先度を計算する多次元優先度計算行程と
を含む、データ分類方法。 - 請求項20に記載のデータ分類方法であって、
多次元優先度計算行程は、分類階層での分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖までの長さに応じて、多次元分類軸の優先度を変更する、データ分類方法。 - 請求項20に記載のデータ分類方法であって、
多次元優先度計算行程は、各次元の分類軸の分類階層における分類項目間の階層的な距離を計算し、更に、各次元の分類軸の分類項目の分類階層での深さ、分類項目群に対応するデータ量、又は分類項目群に対応するデータの重複度合いのうちの少なくともいずれか1つに基づいて、多次元分類軸候補の優先度を決定する、データ分類方法。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸として出力するためのデータ分類プログラムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段を備えたコンピュータに、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて、分類軸候補を作成する分類軸候補作成処理と、
分類階層における分類項目間の階層的な距離に基づいて、作成した前記分類軸候補について、当該分類軸候補の優先度を計算する優先度計算処理と
を実行させる、データ分類プログラム。 - 請求項23に記載のデータ分類プログラムであって、
コンピュータに、
優先度計算処理にて、分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖まで長さに応じて、優先度を変更する処理を実行させる、データ分類プログラム。 - 階層的な分類項目と、当該分類項目に対応するデータ群とに基づいて、前記データ群に対応する分類項目を複数選択して分類軸を作成し、複数の分類軸の組合せを出力するためのデータ分類プログラムであって、
前記分類項目を選択するための基準項目となる分類項目群を予め蓄積する基準項目蓄積手段を備えたコンピュータに、
前記基準項目の子孫の分類項目においてデータに少なくとも1つ対応する分類項目の組合せに基づいて分類軸候補を作成し、複数の分類軸候補を組合せることによって、多次元分類軸候補を作成する多次元分類軸候補作成処理と、
分類階層における分類項目間の階層的な距離に基づいて、作成した前記多次元分類軸候補について、多次元分類軸候補の優先度を計算する多次元優先度計算処理と
を実行させる、データ分類プログラム。 - 請求項25に記載のデータ分類プログラムであって、
コンピュータに、
多次元優先度計算処理にて、分類階層での分類項目間の階層的な距離として、分類階層における分類項目間の共通の先祖までの長さに応じて、多次元分類軸の優先度を変更する処理を実行させる、データ分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010522626A JP5423676B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008195896 | 2008-07-30 | ||
JP2008195896 | 2008-07-30 | ||
PCT/JP2009/003602 WO2010013473A1 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
JP2010522626A JP5423676B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010013473A1 JPWO2010013473A1 (ja) | 2012-01-05 |
JP5423676B2 true JP5423676B2 (ja) | 2014-02-19 |
Family
ID=41610187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522626A Expired - Fee Related JP5423676B2 (ja) | 2008-07-30 | 2009-07-29 | データ分類システム、データ分類方法、及びデータ分類プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9361367B2 (ja) |
JP (1) | JP5423676B2 (ja) |
WO (1) | WO2010013473A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9342589B2 (en) | 2008-07-30 | 2016-05-17 | Nec Corporation | Data classifier system, data classifier method and data classifier program stored on storage medium |
JP5060591B2 (ja) * | 2010-06-03 | 2012-10-31 | 株式会社東芝 | 文書分析装置およびプログラム |
US8639695B1 (en) * | 2010-07-08 | 2014-01-28 | Patent Analytics Holding Pty Ltd | System, method and computer program for analysing and visualising data |
AU2010202901B2 (en) | 2010-07-08 | 2016-04-14 | Patent Analytics Holding Pty Ltd | A system, method and computer program for preparing data for analysis |
US8650198B2 (en) * | 2011-08-15 | 2014-02-11 | Lockheed Martin Corporation | Systems and methods for facilitating the gathering of open source intelligence |
KR101510647B1 (ko) * | 2011-10-07 | 2015-04-10 | 한국전자통신연구원 | 이슈 템플릿 추출 기반의 웹 동향 분석 방법 및 장치 |
US9053140B2 (en) * | 2012-02-03 | 2015-06-09 | Apple Inc. | Enhanced B-trees with record merging |
JP5319829B1 (ja) * | 2012-07-31 | 2013-10-16 | 楽天株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN104142947A (zh) * | 2013-05-09 | 2014-11-12 | 鸿富锦精密工业(深圳)有限公司 | 文件分类系统及方法 |
CN103366013B (zh) * | 2013-07-29 | 2016-03-02 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及服务器 |
EP3037983A4 (en) | 2013-08-21 | 2017-03-08 | Hitachi, Ltd. | Data processing system, data processing method, and data processing device |
US10725800B2 (en) | 2015-10-16 | 2020-07-28 | Dell Products L.P. | User-specific customization for command interface |
US10748116B2 (en) * | 2015-10-16 | 2020-08-18 | Dell Products L.P. | Test vector generation from documentation |
US10432484B2 (en) | 2016-06-13 | 2019-10-01 | Silver Peak Systems, Inc. | Aggregating select network traffic statistics |
KR102351854B1 (ko) * | 2019-12-05 | 2022-01-14 | 한양대학교 산학협력단 | 기술 도메인에 대한 기술 발전도 생성 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JP2006139518A (ja) * | 2004-11-11 | 2006-06-01 | Nec Corp | 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム |
Family Cites Families (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251144A (en) * | 1991-04-18 | 1993-10-05 | Texas Instruments Incorporated | System and method utilizing a real time expert system for tool life prediction and tool wear diagnosis |
JPH0573615A (ja) | 1991-09-17 | 1993-03-26 | Kobe Nippon Denki Software Kk | 階層構造型情報の管理方式 |
JP3096353B2 (ja) | 1992-04-22 | 2000-10-10 | 株式会社戸上電機製作所 | データの分類方法 |
US5325445A (en) * | 1992-05-29 | 1994-06-28 | Eastman Kodak Company | Feature classification using supervised statistical pattern recognition |
EP0582885A3 (en) * | 1992-08-05 | 1997-07-02 | Siemens Ag | Procedure to classify field patterns |
US5353346A (en) * | 1992-12-22 | 1994-10-04 | Mpr Teltech, Limited | Multi-frequency signal detector and classifier |
US5640492A (en) * | 1994-06-30 | 1997-06-17 | Lucent Technologies Inc. | Soft margin classifier |
US5596993A (en) * | 1994-09-21 | 1997-01-28 | Beth Israel Hospital | Fetal data processing system and method |
US5561431A (en) * | 1994-10-24 | 1996-10-01 | Martin Marietta Corporation | Wavelet transform implemented classification of sensor data |
JPH0981585A (ja) | 1995-09-14 | 1997-03-28 | Ricoh Co Ltd | 電子ファイリング装置 |
JP3670076B2 (ja) | 1996-03-07 | 2005-07-13 | 松下電器産業株式会社 | データ表示装置 |
US5765029A (en) * | 1996-05-08 | 1998-06-09 | Xerox Corporation | Method and system for fuzzy image classification |
US5983170A (en) * | 1996-06-25 | 1999-11-09 | Continuum Software, Inc | System and method for generating semantic analysis of textual information |
US5930392A (en) | 1996-07-12 | 1999-07-27 | Lucent Technologies Inc. | Classification technique using random decision forests |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US5956721A (en) * | 1997-09-19 | 1999-09-21 | Microsoft Corporation | Method and computer program product for classifying network communication packets processed in a network stack |
US6185328B1 (en) | 1998-01-21 | 2001-02-06 | Xerox Corporation | Method and system for classifying and processing of pixels of image data |
US6229923B1 (en) | 1998-01-21 | 2001-05-08 | Xerox Corporation | Method and system for classifying and processing of pixels of image data |
JPH11306187A (ja) | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | カテゴリ付文書の検索結果の提示処理方法およびその装置 |
WO1999059673A1 (en) | 1998-05-21 | 1999-11-25 | Medtronic Physio-Control Manufacturing Corp. | Automatic detection and reporting of cardiac asystole |
US6192360B1 (en) | 1998-06-23 | 2001-02-20 | Microsoft Corporation | Methods and apparatus for classifying text and for building a text classifier |
JP3665480B2 (ja) * | 1998-06-24 | 2005-06-29 | 富士通株式会社 | 文書整理装置および方法 |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
US6185336B1 (en) | 1998-09-23 | 2001-02-06 | Xerox Corporation | Method and system for classifying a halftone pixel based on noise injected halftone frequency estimation |
US6421683B1 (en) | 1999-03-31 | 2002-07-16 | Verizon Laboratories Inc. | Method and product for performing data transfer in a computer system |
US6907566B1 (en) | 1999-04-02 | 2005-06-14 | Overture Services, Inc. | Method and system for optimum placement of advertisements on a webpage |
US7363359B1 (en) * | 1999-05-26 | 2008-04-22 | Fujitsu Limited | Element management system with automatic remote backup of network elements' local storage |
US7185075B1 (en) * | 1999-05-26 | 2007-02-27 | Fujitsu Limited | Element management system with dynamic database updates based on parsed snooping |
WO2000075788A1 (en) * | 1999-05-26 | 2000-12-14 | Fujitsu Network Communications, Inc. | Network element management system |
US6490556B2 (en) | 1999-05-28 | 2002-12-03 | Intel Corporation | Audio classifier for half duplex communication |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
US6671680B1 (en) * | 2000-01-28 | 2003-12-30 | Fujitsu Limited | Data mining apparatus and storage medium storing therein data mining processing program |
JP2001216306A (ja) | 2000-01-31 | 2001-08-10 | Hitachi Ltd | カテゴリ作成装置 |
US7325201B2 (en) | 2000-05-18 | 2008-01-29 | Endeca Technologies, Inc. | System and method for manipulating content in a hierarchical data-driven search and navigation system |
US7113934B2 (en) * | 2000-05-25 | 2006-09-26 | Fujitsu Limited | Element management system with adaptive interfacing selected by last previous full-qualified managed level |
US6459974B1 (en) | 2001-05-30 | 2002-10-01 | Eaton Corporation | Rules-based occupant classification system for airbag deployment |
US7028024B1 (en) | 2001-07-20 | 2006-04-11 | Vignette Corporation | Information retrieval from a collection of information objects tagged with hierarchical keywords |
AUPR824401A0 (en) | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw002) |
JP2003141159A (ja) | 2001-11-06 | 2003-05-16 | Fujitsu Ltd | 距離インデクスを用いた検索装置および方法 |
JP4404533B2 (ja) * | 2002-08-30 | 2010-01-27 | 株式会社ニデック | 眼内レンズの製造方法及び該方法にて得られる眼内レンズ |
JP2004110161A (ja) * | 2002-09-13 | 2004-04-08 | Fuji Xerox Co Ltd | テキスト文比較装置 |
JP4233836B2 (ja) | 2002-10-16 | 2009-03-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
JP4305083B2 (ja) * | 2003-07-14 | 2009-07-29 | 富士ゼロックス株式会社 | 単語間類似度計算装置およびプログラム |
JP2005036162A (ja) | 2003-07-18 | 2005-02-10 | Sumitomo Bakelite Co Ltd | 熱硬化性樹脂組成物 |
JP4451624B2 (ja) | 2003-08-19 | 2010-04-14 | 富士通株式会社 | 情報体系対応付け装置および対応付け方法 |
US7877238B2 (en) * | 2003-09-12 | 2011-01-25 | Sysmex Corporation | Data classification supporting method, computer readable storage medium, and data classification supporting apparatus |
US7577655B2 (en) * | 2003-09-16 | 2009-08-18 | Google Inc. | Systems and methods for improving the ranking of news articles |
KR20050045746A (ko) | 2003-11-12 | 2005-05-17 | 삼성전자주식회사 | 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치 |
JP2005202535A (ja) | 2004-01-14 | 2005-07-28 | Hitachi Ltd | 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体 |
JP2005267604A (ja) * | 2004-02-18 | 2005-09-29 | Fuji Xerox Co Ltd | 動作分類支援装置および動作分類装置 |
US7428528B1 (en) | 2004-03-31 | 2008-09-23 | Endeca Technologies, Inc. | Integrated application for manipulating content in a hierarchical data-driven search and navigation system |
US7710897B2 (en) * | 2004-08-26 | 2010-05-04 | Fujitsu Limited | Automatic discovery of logical network elements from existing links in a network |
US7693683B2 (en) * | 2004-11-25 | 2010-04-06 | Sharp Kabushiki Kaisha | Information classifying device, information classifying method, information classifying program, information classifying system |
JP2006171931A (ja) | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニングプログラム |
TW200622402A (en) | 2004-12-28 | 2006-07-01 | Innolux Display Corp | Liquid crystal panel and its cutting method |
JP2006285419A (ja) * | 2005-03-31 | 2006-10-19 | Sony Corp | 情報処理装置および方法、並びにプログラム |
US7912871B2 (en) | 2005-07-27 | 2011-03-22 | Technion Research And Development Foundation Ltd. | Incremental validation of key and keyref constraints |
US8775158B2 (en) * | 2005-08-04 | 2014-07-08 | Nec Corporation | Data processing device, data processing method, and data processing program |
JP2007102309A (ja) | 2005-09-30 | 2007-04-19 | Mitsubishi Electric Corp | 自動分類装置 |
FR2902913A1 (fr) | 2006-06-21 | 2007-12-28 | France Telecom | Procede et dispositif de codage d'une note de similarite semantique et spatiale entre concepts d'une ontologie memorisee sous forme de treillis numerote hierarchiquement |
US7873616B2 (en) | 2006-07-07 | 2011-01-18 | Ecole Polytechnique Federale De Lausanne | Methods of inferring user preferences using ontologies |
US8001130B2 (en) * | 2006-07-25 | 2011-08-16 | Microsoft Corporation | Web object retrieval based on a language model |
US7720830B2 (en) * | 2006-07-31 | 2010-05-18 | Microsoft Corporation | Hierarchical conditional random fields for web extraction |
US7921106B2 (en) * | 2006-08-03 | 2011-04-05 | Microsoft Corporation | Group-by attribute value in search results |
US7912875B2 (en) | 2006-10-31 | 2011-03-22 | Business Objects Software Ltd. | Apparatus and method for filtering data using nested panels |
US8065307B2 (en) * | 2006-12-20 | 2011-11-22 | Microsoft Corporation | Parsing, analysis and scoring of document content |
WO2008092147A2 (en) * | 2007-01-26 | 2008-07-31 | Information Resources, Inc. | Analytic platform |
US20080221983A1 (en) | 2007-03-06 | 2008-09-11 | Siarhei Ausiannik | Network information distribution system and a method of advertising and search for supply and demand of products/goods/services in any geographical location |
CN101295305B (zh) * | 2007-04-25 | 2012-10-31 | 富士通株式会社 | 图像检索装置 |
US8229881B2 (en) * | 2007-07-16 | 2012-07-24 | Siemens Medical Solutions Usa, Inc. | System and method for creating and searching medical ontologies |
KR100930799B1 (ko) | 2007-09-17 | 2009-12-09 | 한국전자통신연구원 | 자동화된 클러스터링 방법 및 이를 이용한 이동통신환경에서 다중 경로의 클러스터링 방법 및 장치 |
JP4998237B2 (ja) * | 2007-12-06 | 2012-08-15 | 富士通株式会社 | 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法 |
US9342589B2 (en) | 2008-07-30 | 2016-05-17 | Nec Corporation | Data classifier system, data classifier method and data classifier program stored on storage medium |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
-
2009
- 2009-07-29 WO PCT/JP2009/003602 patent/WO2010013473A1/ja active Application Filing
- 2009-07-29 JP JP2010522626A patent/JP5423676B2/ja not_active Expired - Fee Related
- 2009-07-29 US US13/056,031 patent/US9361367B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JP2006139518A (ja) * | 2004-11-11 | 2006-06-01 | Nec Corp | 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2010013473A1 (ja) | 2012-01-05 |
US9361367B2 (en) | 2016-06-07 |
US20110179037A1 (en) | 2011-07-21 |
WO2010013473A1 (ja) | 2010-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5423676B2 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
US7519582B2 (en) | System and method for performing a high-level multi-dimensional query on a multi-structural database | |
Cole et al. | Document retrieval for e-mail search and discovery using formal concept analysis | |
Ma | Author bibliographic coupling analysis: A test based on a Chinese academic database | |
US20080040342A1 (en) | Data processing apparatus and methods | |
JP5187313B2 (ja) | 文書重要度算出システム、文書重要度算出方法およびプログラム | |
KR20160083017A (ko) | 소셜 데이터 네트워크에서 인플루언서들 및 그들의 커뮤니티를 식별하기 위한 시스템 및 방법 | |
WO2008106667A1 (en) | Searching heterogeneous interrelated entities | |
JP5500070B2 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
Mazeika et al. | Entity timelines: visual analytics and named entity evolution | |
Chopra et al. | A survey on improving the efficiency of different web structure mining algorithms | |
Lal et al. | Information retrieval system and challenges with dataspace | |
Priss | Facet-like structures in computer science | |
Menin et al. | From linked data querying to visual search: towards a visualization pipeline for LOD exploration | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
CN114691845B (zh) | 语义搜索方法、装置、电子设备、存储介质及产品 | |
Coneglian et al. | Ontological semantic agent in the context of big data: A tool applied to information retrieval in scientific research | |
KR101201218B1 (ko) | 니치 기술 영역 발견을 지원하는 니치 기술 영역 발견을 지원하는 특허 정보 처리 방법 | |
KR20150057497A (ko) | 온라인 텍스트 문서의 계층적 트리 기반 주제탐색 방법 및 시스템 | |
Rástočný et al. | Web search results exploration via cluster-based views and zoom-based navigation | |
Devignes et al. | BioRegistry: Automatic extraction of metadata for biological database retrieval and discovery | |
US11681700B1 (en) | Methods and apparatuses for clustered storage of information | |
Li et al. | Timeline: a Chinese event extraction and exploration system | |
Sima et al. | Keyword query approach over rdf data based on tree template | |
Lettieri et al. | Nets of legal information connecting and displaying heterogeneous legal sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131111 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5423676 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |