JP5433764B1 - 階層構造改変処理装置、階層構造改変方法及びプログラム - Google Patents
階層構造改変処理装置、階層構造改変方法及びプログラム Download PDFInfo
- Publication number
- JP5433764B1 JP5433764B1 JP2012241436A JP2012241436A JP5433764B1 JP 5433764 B1 JP5433764 B1 JP 5433764B1 JP 2012241436 A JP2012241436 A JP 2012241436A JP 2012241436 A JP2012241436 A JP 2012241436A JP 5433764 B1 JP5433764 B1 JP 5433764B1
- Authority
- JP
- Japan
- Prior art keywords
- node
- hierarchical structure
- nodes
- lowering operation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 124
- 238000012986 modification Methods 0.000 title claims abstract description 78
- 230000004048 modification Effects 0.000 title claims abstract description 78
- 238000002715 modification method Methods 0.000 title claims description 12
- 238000000547 structure data Methods 0.000 claims abstract description 94
- 230000008859 change Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 77
- 238000000605 extraction Methods 0.000 claims description 63
- 239000000284 extract Substances 0.000 claims description 18
- 230000001629 suppression Effects 0.000 description 62
- 230000008569 process Effects 0.000 description 58
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 13
- 238000012795 verification Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000008094 contradictory effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】階層構造改変処理装置は、階層構造のノードを格納する階層構造データと複数のノードの各々の分類結果データとを記憶する記憶手段と、所定の条件で現在位置から上位の階層に変更する上げ操作候補のノードの集合を抽出する上げ操作候補抽出手段と、上げ操作の候補になるノードの変更先である階層にあるノード数が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除く取除手段を備える。
【選択図】図1
Description
また、特許文献1には、階層構造のデータの変更をまとめて適用すると共に互いに矛盾する変更を回避する階層構造改変処理装置、階層構造改変方法及びプログラムを提供することを課題とし、階層構造改変処理装置は、階層構造のノードを格納する階層構造データと複数のノードの各々の分類結果データとを記憶する記憶部と、所定の条件で現在位置から上位の階層に変更する上げ操作候補のノードの集合を抽出する上げ操作候補抽出部と、他の所定の条件で現在位置から下位の階層に変更する下げ操作候補のノードの集合を抽出する下げ操作候補抽出部と、上げ操作候補抽出部により抽出された上げ操作候補のノードと下げ操作候補抽出部により抽出された下げ操作候補のノードとに対する操作をまとめて処理することで、互いに矛盾する操作を回避する矛盾回避処理部とを備えることが開示されている。
(1) 階層構造を構成する複数のノードからなる階層構造データと、複数の分類器によって算出された前記複数のノードの各々に対する分類結果データとを記憶する記憶手段と、前記分類結果データに含まれる前記各ノードの適正位置が前記階層構造データの前記各ノードの位置である現在位置より上位の階層である割合を示す上げ操作指数が第1の所定値を超えている、前記現在位置から前記上位の階層に変更する上げ操作の候補になる前記ノードの集合を抽出する上げ操作候補抽出手段と、前記上げ操作候補抽出手段によって抽出された上げ操作の候補になるノードの変更先である階層にあるノード数が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除く取除手段と、を備える階層構造改変処理装置である。
[階層構造改変処理装置100の機能構成]
図1は、第1実施形態に係る階層構造改変処理装置100の機能構成を示す図である。階層構造改変処理装置100は、階層構造を構成する複数のノードを記憶した階層構造データに対して、タクソノミー改変を行う装置である。階層構造データを構成する複数のノードは、例えば、文書に対応している。文書を階層構造に分類することで、例えば、情報検索時の検索の性能を向上させることができ、オントロジーの構築に用いることができる。タクソノミー改変とは、分類法を用いた階層構造データの変更をいい、具体的には、階層構造を構成するノードの位置を、その位置から上位又は下位に変更することをいう。
図2は、第1実施形態に係る階層構造改変処理装置100のハードウェア構成を示す図である。本発明が実施される処理装置は標準的なものでよく、以下に、構成の一例を示す。
Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F(I/F:インタフェース)1040、メインメモリ1050、BIOS(Basic Input Output System)1060、表示装置1122、I/Oコントローラ1070、キーボード及びマウス等の入力装置1100、ハードディスク1074、光ディスクドライブ1076、並びに半導体メモリ1078を備える。なお、ハードディスク1074、光ディスクドライブ1076、及び半導体メモリ1078はまとめて記憶モジュール2と呼ぶ。
図3は、第1実施形態に係る階層構造データ30の例を示す図である。階層構造データ30は、階層構造データ記憶モジュール20(図1参照)に格納されている。階層構造データ30は、図3において円で表された複数のノードが、線で表されるエッジによって結び付けられ、階層構造を形成している。階層構造データ30は、1つのノードの下位に複数のノードがつながっている構造である。なお、下位には1つのノードがつながっていてもよいし、下位につながっているノードがない場合(いわゆるリーフノード)もある。図3の例は、ノード31の上位のノードがノード32であり、ノード32の更に上位のノードがノード33であることを示し、ノード33は、下位のノード32以外の複数のノードに対してつながっている。階層構造は、木構造を含む。また、1つの下位のノードが2つ以上の上位のノードにつながっていてもよい。図3の例に表された1つのノードは、例えば、1つの文書に対応している。なお、階層構造データ30は、文書に対応している必要はないが、文書を分類するための文書分類器を実際に構成するためには、ノードに対応付けられた文書事例が必要であり、これをコーパスという。コーパスには、機械学習分類器を訓練するための訓練コーパス(トレーニングコーパス)と、分類性能を測定するためのテストコーパス(正解データ)とがあるが、いずれも、1つのノードに対して複数の文書が対応してよい。また、1つのノードは、文書の他、属性を表すクラスに対応付けられていてもよい。なお、以降の図において、ノード内に表される記号、例えば、ノード31の「k.3」をラベルという。
コーパスはタクソノミーを前提として、それに付随するものである。上げ操作等は全てタクソノミーの構造を対象としたものであるので、その結果としてテストコーパスにもトレーニングコーパスにも影響する。したがって、本実施の形態における対象としている階層構造データ30は、訓練コーパス、テストコーパスのいずれか一方又は両方であってもよい。
図4は、第1実施形態に係るノード上げ操作を説明する図である。図5は、第1実施形態に係るノード下げ操作を説明する図である。ここでは、いずれも「k.3」のラベルを有するノード31に焦点をあてて説明する。
そこで、次に、矛盾する変更をなくしてまとめて処理を行う場合に有用なアルゴリズムについて説明する。図6は、第1実施形態に係る矛盾する変更に対する回避方法を示す図である。ここで、以下は、操作判定モジュール12により判定処理が行われる。「k.3」のラベルを有するノード31は、上げ操作対象のノードであると共に、下げ操作対象のノードである。この場合、一律に下げ操作を優先するものである。
図7(1)は、「k.2」のラベルを有するノード35と「k.3」のラベルを有するノード31が、「j.3」のラベルを有するノード32の子のノードの全ての組み合わせの中で最も高い曖昧性スコアdd(下げ操作指数dd)を持ち、ノード35からノード31方向の混同数とノード31からノード35方向の混同数に大きな差がないとする。そして、マージ用ノード61(「k.4」のラベル)を新設し、ノード35とノード31をノード61の下に移動する。これは、図5(b)に示したように「組み合わせのノードの両方を、新たに組み合わせのノードの位置に新設したノードの下位ノードにする」ことに該当する。図7(2)は、その移動後の結果を示すものであり、ノード61の下にノード62(「k.2」のラベルであり、元のノード35)とノード63(「k.3のラベルであり、元のノード31)がある。
操作抑制モジュール16は、上げ操作候補抽出モジュール10によって抽出された上げ操作の候補になるノードの変更先である階層にあるノード数が、予め定められた閾値より多い又は以上である場合は、そのノードを集合(上げ操作の候補になるノードの集合)から取り除く。
例えば、図8(1)の例に示すように、「上げ操作候補抽出モジュール10によって抽出された上げ操作の候補になるノード」として、ノード31(「k.3」のラベル)が抽出されたとする。ここでノード33(「i」のラベル)に所属する子のノード数がnだったとする。つまり、「変更先である階層にあるノード数」がnである。
n>Cmax (1)
ただし、Cmaxは、予め定められた定数(閾値)である。ただし、性能測定の結果によって、この定数を調整するようにしてもよい。また、条件(1)は、n≧Cmaxであってもよい。
条件(1)が成立する場合、ノード31(「k.3」のラベル)を集合から取り除く。つまり、上げ操作の対象としない。そして、条件(1)が成立しない場合、ノード31(「k.3」のラベル)を集合に残す。つまり、上げ操作の対象とする。
操作抑制モジュール16は、下げ操作候補抽出モジュール11によって抽出された下げ操作の候補になるノードよりも下位にある階層の数とそのノードに対して祖先の関係にあるノードよりも上位にある階層の数との和が、予め定められた閾値より多い又は以上である場合は、そのノードを集合(下げ操作の候補になるノードの集合)から取り除く。
例えば、図7(1)の例に示すように、「下げ操作候補抽出モジュール11によって抽出された下げ操作(マージ操作を含む)の候補になるノード」として、ノード31(「k.3」のラベル)が抽出されたとする。ここでノード31(「k.3」のラベル)の深さをdlk.3だったとする。なお、深さdlとは、対象としているノードから下方向にリーフノードまで辿った場合の辿り数の最大値である。また、深さの他に、下位に位置するサブグラフの数を用いてもよい。つまり、対象としているノードよりも下位に位置するサブグラフの数が、予め定められた閾値より多い又は以上である場合は、そのノードを集合(下げ操作の候補になるノードの集合)から取り除くようにしてもよい。対象としているノードの階層そのものを深さとして計数してもよいし、計数しなくてもよい。「そのノードに対して祖先の関係にあるノード」として、ここではノード31の親であるノード32(「j.3」のラベル)を選んだとする。なお、直上の親だけでなく、さらにその上の親のノード、例えば、ノード33(「i」のラベル)であってもよい。ここでノード32(「j.3」のラベル)の深さをdrj.3だったとする。深さdrとは、ルートノードから対象としているノードまで辿った場合の辿り数の最大値である。
drj.3+dlk.3>Dmax (2)
ただし、Dmaxは、予め定められた定数(閾値)である。ただし、性能測定の結果によって、この定数を調整するようにしてもよい。また、条件(2)は、drj.3+dlk.3≧Dmaxであってもよい。
条件(2)が成立する場合、ノード31(「k.3」のラベル)を集合から取り除く。つまり、下げ操作の対象としない。そして、条件(2)が成立しない場合、ノード31(「k.3」のラベル)を集合に残す。つまり、下げ操作の対象とする。
a)操作対象ノードの親のルートからリーフまでの深さ
b)操作対象ノードを頂点とするサブグラフのリーフまでの深さ
を加算して、一定値を越える候補を取り除く処理を行うものである。深さ抑制機能そのものでは、下げ操作及びマージ操作のタクソノミー構造への適用は行わないので、構造変更に伴う深さ変動も生じない。なお、下げ操作及びマージ操作を後の処理で適用した場合は、操作対象ノードのルートからの深さは1増加することになる。前記b)の値はこの適用によっては変化しない。
また、幅抑制機能は上げ操作に、深さ抑制機能は下げ操作及びマージ操作に適用するものである。
S12:制御モジュール1は、上げ操作の対象になるノードの集合を記憶モジュール2に退避する。
S15:制御モジュール1(操作抑制モジュール16)は、深さ抑制の条件を満たす下げ操作候補又はマージ操作候補を適用予定の操作集合から取り除く。
S16:制御モジュール1は、下げ操作とマージ操作の対象になるノードの集合を記憶モジュール2に退避する。
S21:制御モジュール1(階層構造改変処理モジュール13)は、マージ操作の対象になるノードの集合の各ノードに対してマージ操作を行う。
S112:制御モジュール1(下げ操作候補抽出モジュール11)は、階層構造データ30の全てのノードに対して、下げ操作の候補を抽出する。下げ操作の候補は、前述の図5で説明した処理により抽出できる。階層構造データ30の各ノードに対する処理順序は、どのような順序でもよい。
S114:制御モジュール1は、下げ操作とマージ操作の対象になるノードの集合を記憶モジュール2に退避する。
S118:制御モジュール1(操作抑制モジュール16)は、深さ抑制の条件を満たす下げ操作候補又はマージ操作候補を適用予定の操作集合から取り除く。
S120:制御モジュール1(階層構造改変処理モジュール13)は、下げ操作の対象になるノードの集合の各ノードに対して下げ操作を行う。
S121:制御モジュール1(階層構造改変処理モジュール13)は、マージ操作の対象になるノードの集合の各ノードに対してマージ操作を行う。
S122:制御モジュール1は、操作を行った階層構造データを、改変後階層構造データ記憶モジュール22に記憶する。
次に、本発明を適用した第2実施形態について説明する。第2実施形態は、まとめて処理を行う場合に有用な、第1実施形態とは異なる第2のアルゴリズムに関するものである。なお、以下の説明及び図面において、前述した実施形態と同様の機能を果たす部分には、同一の符号又は末尾に同一の符号を付して、重複する説明を適宜省略する。
図11は、第2実施形態に係る階層構造改変処理装置200の機能構成を示す図である。階層構造改変処理装置200の制御モジュール201は、次点下げ操作候補抽出モジュール214を備える。また、矛盾回避処理モジュール215の操作判定モジュール212は、次点下げ操作候補抽出モジュール214により抽出されたノードに対する判定をする。記憶モジュール202は、第1実施形態の改変後階層構造データ記憶モジュール22とは異なる階層構造データを格納する改変後階層構造データ記憶モジュール222を備える。
図12は、第2実施形態に係る矛盾する変更に対する回避方法を示す図である。ここで、以下は、操作判定モジュール212により判定処理が行われる。「k.3」のラベルを有するノード31は、上げ操作対象のノードであると共に、下げ操作対象のノードである。次点下げ操作候補抽出モジュール214により抽出された組み合わせ(k.1,k.2)と、下げ操作指数ddが最大である組み合わせ(k.2,k.3)との関係において、下げ操作指数dd(k.2,k.3)と下げ操作指数ddn(k.1,k.2)との差の絶対値は、係数γ(第2の所定値)以下である。ここで、次点の組み合わせに対する下げ操作指数を、ddnで表す。この場合に、「k.3」のラベルを有するノード31は、上げ操作対象にする。また、次点の組み合わせである(k.1,k.2)に対して、下げ操作の対象にする。
なお、この時点で、次点下げ操作の候補に対して深さ抑制を行ってもよい。
なお、この時点で、次点下げ操作の候補に対して深さ抑制を行ってもよい。
S138:制御モジュール201(操作判定モジュール212)は、S132で抽出された下げ操作の対象になるノードの下げ操作指数(dd)と、そのノードと同じ階層の次に下げ操作の対象になる次点下げ操作対象のノードの下げ操作指数(ddn)との下げ操作指数の差の絶対値が、係数γより大きいか否かを判断する。差の絶対値が係数γより大きい場合(S138:YES)には、処理をS139に移し、差の絶対値が係数γ以下の場合(S138:NO)には、処理をS140に移す。
S140:制御モジュール201(操作判定モジュール212)は、S138にて処理対象のノードを、下げ操作の対象になるノードの集合から削除する。よって、処理対象のノードは、上げ操作の対象になる。
S141:制御モジュール201(操作判定モジュール212)は、S138にて処理対象のノードに対応する同じ階層の次点下げ操作の対象になるノードを、下げ操作の対象に追加する。
S142〜S147:制御モジュール201は、第1実施形態のS117〜S122と同様の処理を行う。なお、S147では、改変後階層構造データ記憶モジュール222に記憶する。
次に、本発明を適用した第3実施形態について説明する。第3実施形態は、まとめて処理を行う場合に有用な、第1及び第2実施形態とは異なる第3のアルゴリズムに関するものである。
図15は、第3実施形態に係る階層構造改変処理装置300の機能構成を示す図である。階層構造改変処理装置300の制御モジュール301は、上げ操作候補抽出モジュール310、下げ操作候補抽出モジュール311、操作判定モジュール312、矛盾回避処理モジュール315、操作抑制モジュール316を備える。また、記憶モジュール302は、第1実施形態の改変後階層構造データ記憶モジュール22や第2実施形態の改変後階層構造データ記憶モジュール222とは異なる階層構造データを格納する改変後階層構造データ記憶モジュール322を備える。なお、操作抑制モジュール316は、前述の操作抑制モジュール16と同等の機能を有する。
図16は、第3実施形態に係る矛盾する変更に対する回避方法を示す図である。ここで、以下は、操作判定モジュール312により判定処理が行われる。「k.3」のラベルを有するノード31は、上げ操作対象のノードであると共に、下げ操作対象のノードである。この場合に、「k.3」ラベルを有するノード31の上げ操作指数duと、ノード31と同一の階層であり下げ操作指数ddが最大値である下げ操作指数dd(k.2,k.3)とにおいて、上げ操作指数duが、下げ操作指数ddに係数δ(第3の所定値)を乗じた値より小さければ、下げ操作対象にする。他方、上げ操作指数duが、下げ操作指数ddに係数δを乗じた値以上であれば、上げ操作対象にする。なお、係数δは、階層構造改変処理装置300の入力モジュール(図示せず)から、パラメータとして与えてよい。
S51:制御モジュール301(操作抑制モジュール316)は、幅抑制の条件を満たす上げ操作候補を適用予定の操作集合から取り除き、duを算出する。
S54:制御モジュール301(下げ操作候補抽出モジュール311)は、階層構造データ30の全てのノードに対して、マージ操作の候補を抽出する。
S55:制御モジュール301(操作抑制モジュール316)深さ抑制の条件を満たす下げ操作候補又はマージ操作候補を適用予定の操作集合から取り除き、ddを算出する。
S63:制御モジュール301(階層構造改変処理モジュール13)は、マージ操作の対象になるノードの集合の各ノードに対してマージ操作を行う。
S152:制御モジュール301(下げ操作候補抽出モジュール311)は、階層構造データ30の全てのノードに対して、下げ操作候補を抽出する。そして、抽出した下げ操作候補に関して下げ操作指数ddを算出する。下げ操作候補の抽出及び下げ操作指数ddの算出は、前述の図5で説明した処理により抽出できる。
S153:制御モジュール301(下げ操作候補抽出モジュール311)は、階層構造データ30の全てのノードに対して、マージ操作の候補を抽出する。
S154:制御モジュール301は、下げ操作とマージ操作の対象になるノードの集合と、各ノードの下げ操作指数ddとを記憶モジュール302に退避する。
S156:制御モジュール301(操作判定モジュール312)は、上げ操作の対象になるノードの集合の各ノードの上げ操作指数duが、各ノードに対応する下げ操作の対象になるノードの下げ操作指数ddに係数δを乗じた数より小さいか否かを各々判断する。上げ操作指数duが下げ操作指数ddに係数δを乗じた数より小さい場合(S156:YES)には、処理をS157に移し、上げ操作指数duが下げ操作指数ddに係数δを乗じた数以上である場合(S156:NO)には、処理をS158に移す。
S158:制御モジュール301(操作判定モジュール312)は、S156で処理対象にしたノードを、下げ操作の対象になるノードの集合から削除する。よって、処理対象のノードは、上げ操作の対象になる。
S160:制御モジュール301(操作抑制モジュール316)は、深さ抑制の条件を満たす下げ操作候補又はマージ操作候補を適用予定の操作集合から取り除く。
S162:制御モジュール301(階層構造改変処理モジュール13)は、下げ操作の対象になるノードの集合の各ノードに対して下げ操作を行う。
S163:制御モジュール301(階層構造改変処理モジュール13)は、マージ操作の対象になるノードの集合の各ノードに対してマージ操作を行う。
S164:制御モジュール301は、操作を行った階層構造データを改変後階層構造データ記憶モジュール322に記憶する。
(1)矛盾回避処理部は、上げ操作候補抽出部による上げ操作の候補であり、かつ下げ操作候補抽出部による下げ操作の候補である各ノードに対して、下げ操作を行うように判定する操作判定部と、前記操作判定部の判定結果に応じた操作を行い、前記上げ操作候補抽出部による前記上げ操作のみの候補である前記各ノードに対して上げ操作を行い、前記下げ操作候補抽出部による前記下げ操作のみの候補である前記各ノードに対して下げ操作を行うことで、対象になる前記各ノードの位置を変更して前記階層構造データを改変する階層構造改変処理部とを有する。
(2)同一の階層の前記各ノードの組み合わせのうち、前記下げ操作指数が前記最高値の組み合わせの次に大きい値の組み合わせである次点組み合わせに対して、前記所定の条件によって前記下げ操作の候補になる前記ノードの集合を抽出する次点下げ操作候補抽出部を備え、矛盾回避処理部は、前記上げ操作候補抽出部による前記上げ操作の候補であり、かつ前記下げ操作候補抽出部による前記下げ操作の候補である前記各ノードに対する操作を判定する操作判定部と、前記操作判定部の判定結果に応じた操作を行い、前記上げ操作候補抽出部による前記上げ操作のみの候補である前記各ノードに対して上げ操作を行い、前記下げ操作候補抽出部による前記下げ操作のみの候補である前記各ノードに対して下げ操作を行うことで、対象になる前記各ノードの位置を変更して前記階層構造データを改変する階層構造改変処理部と、を有し、前記操作判定部は、前記最高値の組み合わせと前記次点組み合わせとの前記下げ操作指数の差の絶対値が第2の所定値より大きいことに応じて、前記各ノードに対して前記下げ操作を行うように判定し、前記最高値の組み合わせと前記次点組み合わせとの前記下げ操作指数の差の絶対値が前記第2の所定値に等しいか小さいことに応じて、前記各ノードに対して、前記上げ操作を行い、かつ、前記次点下げ操作候補抽出部により抽出された前記下げ操作の候補である前記各ノードに対して前記下げ操作を行うように判定する。
(3)矛盾回避処理部は、前記上げ操作候補抽出部による前記上げ操作の候補であり、かつ前記下げ操作候補抽出部による前記下げ操作の候補である前記各ノードに対する操作を判定する操作判定部と、前記操作判定部の判定結果に応じた操作を行い、前記上げ操作候補抽出部による前記上げ操作のみの候補である前記各ノードに対して上げ操作を行い、前記下げ操作候補抽出部による前記下げ操作のみの候補である前記各ノードに対して下げ操作を行うことで、対象になる前記各ノードの位置を変更して前記階層構造データを改変する階層構造改変処理部と、を有し、前記操作判定部は、前記各ノードの前記上げ操作指数が前記下げ操作指数に第3の所定値を乗じた値よりも小さいことに応じて前記下げ操作を行うように判定し、前記上げ操作指数が前記下げ操作指数に前記第3の所定値を乗じた値に等しいか大きいことに応じて前記上げ操作を行うように判定する。
前述の実施の形態では、上げ操作に対して幅抑制、下げ操作又はマージ操作に対して深さ抑制を行っているが、上げ操作に対して深さ抑制、下げ操作又はマージ操作に対して幅抑制を行うようにしてもよい。さらに、上げ操作に対して幅抑制と深さ抑制の両方、下げ操作又はマージ操作に対して幅抑制と深さ抑制の両方を行うようにしてもよい。
2,202,302 記憶モジュール
10,310 上げ操作候補抽出モジュール
11,311 下げ操作候補抽出モジュール
12,212,312 操作判定モジュール
13 階層構造改変処理モジュール
15,215,315 矛盾回避処理モジュール
16,316 操作抑制モジュール
20 階層構造データ記憶モジュール
21 分類結果データ記憶モジュール
22,222,322 改変後階層構造データ記憶モジュール
30 階層構造データ
31〜38 ノード
100,200,300 階層構造改変処理装置
214 次点下げ操作候補抽出モジュール
dd 下げ操作指数
du 上げ操作指数
Claims (9)
- 階層構造を構成する複数のノードからなる階層構造データと、複数の分類器によって算出された前記複数のノードの各々に対する分類結果データとを記憶する記憶手段と、
前記分類結果データに含まれる前記各ノードの適正位置が前記階層構造データの前記各ノードの位置である現在位置より上位の階層である割合を示す上げ操作指数が第1の所定値を超えている、前記現在位置から前記上位の階層に変更する上げ操作の候補になる前記ノードの集合を抽出する上げ操作候補抽出手段と、
前記上げ操作候補抽出手段によって抽出された上げ操作の候補になるノードの変更先である階層にあるノード数が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除く取除手段と、
を備える階層構造改変処理装置。 - 同一の階層の前記各ノードの組み合わせのうち、前記分類結果データに含まれる前記各ノードの適正位置から、ペア対象毎に、正解データと結果データとが不一致となる場合にカウントするミスに対する、正解データと結果データとが不一致で、かつ、その結果データがペア対象の場合にカウントする曖昧性の割合に基づき算出された曖昧性スコアを示す下げ操作指数が最高値の組み合わせに対して、所定の条件によって前記現在位置から下位の階層に変更する下げ操作の候補になる前記ノードの集合を抽出する下げ操作候補抽出手段
を更に備える請求項1に記載の階層構造改変処理装置。 - 前記上げ操作候補抽出手段により抽出された前記上げ操作の候補になる前記ノードと、前記下げ操作候補抽出手段により抽出された前記下げ操作の候補になる前記ノードとに対する操作をまとめて処理することで、互いに矛盾する操作を回避する矛盾回避処理手段
を更に備える請求項2に記載の階層構造改変処理装置。 - 階層構造を構成する複数のノードからなる階層構造データと、複数の分類器によって算出された前記複数のノードの各々に対する分類結果データとを記憶する記憶手段と、
同一の階層の前記各ノードの組み合わせのうち、前記分類結果データに含まれる前記各ノードの適正位置から、ペア対象毎に、正解データと結果データとが不一致となる場合にカウントするミスに対する、正解データと結果データとが不一致で、かつ、その結果データがペア対象の場合にカウントする曖昧性の割合に基づき算出された曖昧性スコアを示す下げ操作指数が最高値の組み合わせに対して、所定の条件によって前記現在位置から下位の階層に変更する下げ操作の候補になる前記ノードの集合を抽出する下げ操作候補抽出手段と、
前記下げ操作候補抽出手段によって抽出された下げ操作の候補になるノードよりも下位にある階層の数と該ノードに対して祖先の関係にあるノードよりも上位にある階層の数との和が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除く取除手段と、
を備える階層構造改変処理装置。 - 前記ノードは、文書に対応付けられている、
請求項1から請求項4までのいずれか1項に記載の階層構造改変処理装置。 - 階層構造を構成する複数のノードからなる階層構造データと、複数の分類器によって算出された前記複数のノードの各々に対する分類結果データとを記憶する記憶手段と、上げ操作候補抽出手段と、取除手段とを備えるコンピュータによって行われる階層構造改変方法であって、
前記上げ操作候補抽出手段が行う、前記分類結果データに含まれる前記各ノードの適正位置が前記階層構造データの前記各ノードの位置である現在位置より上位の階層である割合を示す上げ操作指数が第1の所定値を超えている、前記現在位置から前記上位の階層に変更する上げ操作の候補になる前記ノードの集合を抽出するステップと、
前記取除手段が行う、前記上げ操作候補抽出手段によって抽出された上げ操作の候補になるノードの変更先である階層にあるノード数が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除くステップ
を含む階層構造改変方法。 - 請求項6に記載の階層構造改変方法のステップをコンピュータに実行させるためのプログラム。
- 階層構造を構成する複数のノードからなる階層構造データと、複数の分類器によって算出された前記複数のノードの各々に対する分類結果データとを記憶する記憶手段と、下げ操作候補抽出手段と、取除手段とを備えるコンピュータによって行われる階層構造改変方法であって、
前記下げ操作候補抽出手段が行う、同一の階層の前記各ノードの組み合わせのうち、前記分類結果データに含まれる前記各ノードの適正位置から、ペア対象毎に、正解データと結果データとが不一致となる場合にカウントするミスに対する、正解データと結果データとが不一致で、かつ、その結果データがペア対象の場合にカウントする曖昧性の割合に基づき算出された曖昧性スコアを示す下げ操作指数が最高値の組み合わせに対して、所定の条件によって前記現在位置から下位の階層に変更する下げ操作の候補になる前記ノードの集合を抽出するステップと、
前記取除手段が行う、前記下げ操作候補抽出手段によって抽出された下げ操作の候補になるノードよりも下位にある階層の数と該ノードに対して祖先の関係にあるノードよりも上位にある階層の数との和が、予め定められた閾値より多い又は以上である場合は、該ノードを前記集合から取り除くステップ
を含む階層構造改変方法。 - 請求項8に記載の階層構造改変方法のステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012241436A JP5433764B1 (ja) | 2012-11-01 | 2012-11-01 | 階層構造改変処理装置、階層構造改変方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012241436A JP5433764B1 (ja) | 2012-11-01 | 2012-11-01 | 階層構造改変処理装置、階層構造改変方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5433764B1 true JP5433764B1 (ja) | 2014-03-05 |
JP2014092826A JP2014092826A (ja) | 2014-05-19 |
Family
ID=50396596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012241436A Active JP5433764B1 (ja) | 2012-11-01 | 2012-11-01 | 階層構造改変処理装置、階層構造改変方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5433764B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642320A (zh) * | 2020-04-27 | 2021-11-12 | 北京庖丁科技有限公司 | 文档目录结构的提取方法、装置、设备和介质 |
-
2012
- 2012-11-01 JP JP2012241436A patent/JP5433764B1/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642320A (zh) * | 2020-04-27 | 2021-11-12 | 北京庖丁科技有限公司 | 文档目录结构的提取方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2014092826A (ja) | 2014-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5142135B2 (ja) | データを分類する技術 | |
US9972105B2 (en) | Visualization of data clusters | |
US11797607B2 (en) | Method and apparatus for constructing quality evaluation model, device and storage medium | |
US20160004978A1 (en) | Automatic detection of anomalies in graphs | |
JP2017224184A (ja) | 機械学習装置 | |
CN110442725B (zh) | 实体关系抽取方法及装置 | |
TW200900958A (en) | Link spam detection using smooth classification function | |
JP7332949B2 (ja) | 評価方法、評価プログラム、および情報処理装置 | |
US20150169430A1 (en) | Selecting webpage test paths | |
JP7443349B2 (ja) | コード分類のためのハイブリッド機械学習モデル | |
US20230045330A1 (en) | Multi-term query subsumption for document classification | |
JP2017111733A (ja) | 学習装置、学習方法および学習プログラム | |
KR102419824B1 (ko) | 메뉴 구조 기반 웹 사이트의 유사도 평가 방법 | |
JP6540384B2 (ja) | 評価プログラム、手順書評価方法、および評価装置 | |
US20220004885A1 (en) | Computer system and contribution calculation method | |
JP5433764B1 (ja) | 階層構造改変処理装置、階層構造改変方法及びプログラム | |
JP6432266B2 (ja) | グループ化方法、グループ化装置、およびグループ化プログラム | |
JP5133275B2 (ja) | 階層構造改変処理装置、階層構造改変方法及びプログラム | |
JP5433765B1 (ja) | 階層構造改変処理装置、階層構造改変方法及びプログラム | |
JP6199497B2 (ja) | データ処理システム | |
JP2016045552A (ja) | 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置 | |
JP5310196B2 (ja) | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 | |
JP7087484B2 (ja) | 情報処理装置,制御プログラムおよび情報処理方法 | |
WO2016013099A1 (ja) | 素性データ管理システム、および素性データ管理方法 | |
JP6633009B2 (ja) | 表データ分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5433764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |