JP4957656B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP4957656B2
JP4957656B2 JP2008152369A JP2008152369A JP4957656B2 JP 4957656 B2 JP4957656 B2 JP 4957656B2 JP 2008152369 A JP2008152369 A JP 2008152369A JP 2008152369 A JP2008152369 A JP 2008152369A JP 4957656 B2 JP4957656 B2 JP 4957656B2
Authority
JP
Japan
Prior art keywords
pattern
primary
extraction
primary pattern
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008152369A
Other languages
English (en)
Other versions
JP2009301154A (ja
Inventor
千登 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008152369A priority Critical patent/JP4957656B2/ja
Publication of JP2009301154A publication Critical patent/JP2009301154A/ja
Application granted granted Critical
Publication of JP4957656B2 publication Critical patent/JP4957656B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
コンピュータの処理能力、記憶装置の容量の飛躍的な増大に加え、IT化やネットワーク化が進んだことで大量な情報が容易に集められるようになってきた。集めた情報から市場機会やリスクに関する情報を早期に発見したり、隠れた知識を発見したりすることへの期待が高まっている。
しかし、集めた情報の量はしばしば人間の処理能力をはるかに超えるものとなる。このため、せっかく大量に集めた情報からリスクを発見したり、知識を抽出したりして活用することは実際には労力を伴う難しいものであった。
一方、パターン・マイニング等の技術の進展により、そのような大量の情報の中から例えば同時に購入される商品のパターンなどの情報が抽出可能となってきた。同時に購入される品物のパターンや購入される順序のパターンを抽出する技術が顧客の購買行動の分析などの需要から注目を集めて研究開発されてきたが、最近ではさまざまな情報の構造化、半構造化が進んできたこともあり、木構造のような構造を持つパターンを抽出するパターン・マイニングの技術が注目されてきている。構造情報を抽出するパターン・マイニングの技術の中でも、特に木構造はXML(eXtensible Markup Language)をはじめとしてドキュメントの構造化や知識表現などさまざまな情報の構造化に用いられるためパターン抽出への期待も大きい。
木構造のデータ群から部分木のパターンを抽出する技術には大きく分けて、親子関係が厳密に一致する構造だけを抽出するinduced subtree miningの技術と、親子関係が多少乱れても先祖―子孫の関係があれば構造を抽出するembedded subtree miningの技術がある。
現実社会で発生するデータ、例えば電子文書であるドキュメントの操作履歴などのように人の操作を記録したものでは、たとえ同じ内容の作業を行っても、作業者の操作順などが厳密には一致しないため操作の履歴データの親子関係が厳密に一致することは期待できない。このため、そのようなデータからパターンを抽出するためには、親子関係に揺れが生じたとしてもパターンが抽出できるembedded subtree miningの技術を適用することが望ましい。また、人の操作の記録だけではなく、情報を整理した木構造データのようなものからも埋め込まれている隠れた構造を抽出するためには同様にembedded subtree miningを用いる必要がある。
embedded subtree miningを実現する従来の技術としては、TreeMiner、Dryade、MB3−miner、TRIPSなどを挙げることができる。
これらに関連する技術として、例えば、特許文献1には、データの集合からその中に含まれる重要なパターンを検出する方法及びシステムを提供することを課題とし、木構造データで表されたデータ集合を含むデータベースから、集計対象となる候補パターンを用いて、頻出パターンを検出するシステムであって、(1)データベースから候補パターンにマッチするパターンを集計する手段と、(2)前記集計により出現頻度の高いパターンを検出する手段と、(3)前記検出したパターンから、次の集計対象となる候補パターンを生成する手段と、を有するように構成することが開示されている。
また、例えば、特許文献2には、順序木において頻出するパターンを抽出するのに好適な抽出装置等を提供することを課題とし、抽出装置の入力受付部は、1つ以上の順序木の入力を受け付け、変換部は、入力が受け付けられた順序木のそれぞれを系列表現へ変換し、抽出部は、変換された系列表現のそれぞれが含むパターンのうち、所定の頻度以上で出現するパターンを抽出し、系列表現は、順序木を深さ優先探索して、枝を進む際に通過する節はその名前を表すマークを、枝を戻る際はバックトラックマークを、それぞれ並べることによりでき、パターンは、系列表現であるマークの列中の名前を表すマークのいずれかを最初のマークとして、これから射影を0回以上繰り返したときに、最初のマークから最後のマークに至るまでに出会うマークの列をいい、射影が成立するか否かは、マークの列の列文脈と、射影文脈の値により判定することが開示されている。
特開2001−134575号公報 特開2004−355457号公報
しかし、embedded subtree miningは、induced subtree miningよりもパターンの抽出能力が高い反面、抽出結果のパターンが大量になるという問題があった。これら従来技術のうち、Dryadeは、出現数の同じ場合にはより大きなパターンを出力するというclosed pattern(クローズドパターン)の抽出を実現するが、兄弟ノードに同じものを含めないという機能制限がある。また、そのような場面が頻出するドキュメントの操作履歴などの多くの現実のデータのマイニングには適さなかった。なお、closed pattern miningでは、同じ出現数のパターンの中で小さくないものを抽出するが、この抽出されるパターンがclosed patternである。また、極端な例として、ノード一つだけからなるパターンであっても、同じラベルのノードを持つパターンがなければ、closed patternとなり得る。
closed pattern又はMaximal pattern(マクシマルパターン)の抽出は、所定の情報量を落とさずに出力パターン数を削減することができるため、抽出したパターンを利用するうえで重要である。本発明は、embedded subtree miningにおいて、closed pattern又はMaximal patternを出力するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、前記一次パターン抽出手段によって抽出された一次パターンに該一次パターンの出現数を表す符号を付加する符号付加手段と、前記符号付加手段によって符号が付加された一次パターンから二次パターンを抽出する二次パターン抽出手段と、前記一次パターンと前記二次パターンを比較して、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段を具備することを特徴とする情報処理装置である。
請求項2の発明は、複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、前記一次パターン抽出手段によって抽出された一次パターンを該一次パターンの出現数毎に分類する分類手段と、前記分類手段によって分類された一次パターンから二次パターンを抽出する二次パターン抽出手段と、前記二次パターン抽出手段による二次パターンの抽出処理過程で、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段を具備することを特徴とする情報処理装置である。
請求項3の発明は、前記一次パターン抽出手段は、対象としているノードよりも下位にあるパターンの出現数を用いてパターンを抽出することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項4の発明は、前記一次パターン抽出手段は、対象としているノードよりも下位であるパターンの出現数に基づいて、該パターンの抽出を継続することを特徴とする請求項1から3のいずれか一項に記載の情報処理装置である。
請求項5の発明は、前記選択手段は、前記二次パターン抽出手段によって抽出されなかった前記一次パターンを選択することを特徴とする請求項1、3、4のいずれか一項に記載の情報処理装置である。
請求項6の発明は、前記選択手段は、前記二次パターン抽出手段による抽出のときに抽出されなかった前記一次パターンを選択することを特徴とする請求項2から4のいずれか一項に記載の情報処理装置である。
請求項7の発明は、前記符号付加手段は、前記一次パターンの順序を前記二次パターン抽出手段によって抽出される順序に揃えることを特徴とする請求項1から6のいずれか一項に記載の情報処理装置である。
請求項8の発明は、前記一次パターン抽出手段と前記二次パターン抽出手段の抽出の順序を揃えることを特徴とする請求項1から6のいずれか一項に記載の情報処理装置である。
請求項9の発明は、コンピュータを、複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、前記一次パターン抽出手段によって抽出された一次パターンに該一次パターンの出現数を表す符号を付加する符号付加手段と、前記符号付加手段によって符号が付加された一次パターンから二次パターンを抽出する二次パターン抽出手段と、前記一次パターンと前記二次パターンを比較して、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段として機能させることを特徴とする情報処理プログラムである。
請求項10の発明は、コンピュータを、複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、前記一次パターン抽出手段によって抽出された一次パターンを該一次パターンの出現数毎に分類する分類手段と、前記分類手段によって分類された一次パターンから二次パターンを抽出する二次パターン抽出手段と、前記二次パターン抽出手段による二次パターンの抽出処理過程で、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段として機能させることを特徴とする情報処理プログラムである。
請求項1記載の情報処理装置によれば、embedded subtree miningにおいて、closed pattern又はMaximal patternを出力することができる。
請求項2記載の情報処理装置によれば、embedded subtree miningにおいて、closed pattern又はMaximal patternを出力することができる。
請求項3記載の情報処理装置によれば、本構成を有していない場合に比較して、第1のパターンの抽出処理の負荷を軽減させることができる。
請求項4記載の情報処理装置によれば、本構成を有していない場合に比較して、第1のパターンの抽出処理の負荷を軽減させることができる。
請求項5記載の情報処理装置によれば、本構成を有していない場合に比較して、closed patternを確実に抽出することができる。
請求項6記載の情報処理装置によれば、本構成を有していない場合に比較して、closed patternを確実に抽出することができる。
請求項7記載の情報処理装置によれば、本構成を有していない場合に比較して、選択処理の負荷を軽減させることができる。
請求項8記載の情報処理装置によれば、本構成を有していない場合に比較して、選択処理の負荷を軽減させることができる。
請求項9記載の情報処理プログラムによれば、embedded subtree miningにおいて、closed pattern又はMaximal patternを出力することができる。
請求項10記載の情報処理プログラムによれば、embedded subtree miningにおいて、closed pattern又はMaximal patternを出力することができる。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。以下説明する実施の形態は、要素間に設定した関係を木構造として扱えるデータ群(以下、単にツリーともいう)の中から、複数回現れる関係構造(以下、単にパターンともいう)を抽出する技術に関するものである。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「所定」という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
第1の実施の形態は、図1に示すように、ツリーデータ入力モジュール102、ツリーデータ記憶モジュール104、第一整形モジュール106、第二整形モジュール108、パターン抽出モジュール110、パターン記憶モジュール112、出力モジュール114、パターン選択モジュール116、制御モジュール118を有している。
ツリーデータ入力モジュール102は、ツリーデータ記憶モジュール104と接続されており、図示しない入力インタフェースを介してツリーデータを受け取り、そのツリーデータを必要なら処理にあわせて加工するなどして、ツリーデータ記憶モジュール104に渡す。
ツリーデータ記憶モジュール104は、ツリーデータ入力モジュール102、第一整形モジュール106、パターン抽出モジュール110と接続されている。ツリーデータ入力モジュール102から受け取ったツリーデータを格納し、パターン抽出モジュール110からの要求にこたえてツリーデータの一部あるいは全部に関する情報を渡す。また、第一整形モジュール106により整形されたツリーデータも受け付けて格納し、その第一整形モジュール106から得たツリーデータに対してもパターン抽出モジュール110が二次パターン抽出処理ができるようにする。
第一整形モジュール106は、ツリーデータ記憶モジュール104、パターン記憶モジュール112、制御モジュール118と接続されている。パターン記憶モジュール112に記憶されている一次パターンに、その一次パターンの出現数を表す符号を付加して、ツリーデータ記憶モジュール104に記憶させる。また、一次パターンの順序をパターン抽出モジュール110による二次パターン抽出処理によって抽出される順序に揃えるようにしてもよい。
つまり、第一整形モジュール106は、パターン抽出モジュール110によって抽出され、パターン記憶モジュール112に格納された一次パターンについて加工する。そして、パターン抽出モジュール110を再利用すること(つまり、二次パターン抽出処理)により、closed patternを選択できるようにするための前処理を行い、処理結果をツリーデータ記憶モジュール104に渡す。
第二整形モジュール108は、パターン抽出モジュール110、パターン選択モジュール116、制御モジュール118と接続されており、パターン抽出モジュール110による二次パターン抽出処理の結果を加工する。つまり、二次パターンに対して、パターン選択モジュール116のパターン選択処理に適合させる変換を行う。
パターン抽出モジュール110は、ツリーデータ記憶モジュール104、第二整形モジュール108、パターン記憶モジュール112、制御モジュール118と接続されている。パターン抽出モジュール110は、2つの処理を行う。
1つ目の処理(以下、一次パターン抽出処理ともいう)は、ツリーデータ記憶モジュール104に記憶されている複数のツリーデータ内で、複数回現れる一次パターンを抽出し、パターン記憶モジュール112に渡す。その場合、対象としているノードよりも下位にあるパターンの出現数を用いてパターンを抽出するようにしてもよい。また、対象としているノードよりも下位であるパターンの出現数に基づいて、そのパターンの抽出を継続するようにしてもよい。
2つ目の処理(以下、二次パターン抽出処理ともいう)は、ツリーデータ記憶モジュール104に記憶されている第一整形モジュール106によって符号が付加された一次パターンから、二次パターンを抽出し、第二整形モジュール108に渡す。
つまり、図示しない入力装置を介してユーザから、あるいはシステムの設定により指定された条件にしたがってツリーデータ記憶モジュール104に格納されたツリーデータの中から共通のパターンを抽出してパターン記憶モジュール112又は第二整形モジュール108に渡す。
パターン記憶モジュール112は、第一整形モジュール106、パターン抽出モジュール110、パターン選択モジュール116と接続されている。パターン抽出モジュール110による一次パターン抽出処理により抽出された一次パターンを記憶し、第一整形モジュール106とパターン選択モジュール116に供給する。
パターン選択モジュール116は、第二整形モジュール108、パターン記憶モジュール112、出力モジュール114、制御モジュール118と接続されている。一次パターンと二次パターンを比較して、ツリーデータ内で複数回現れるパターンのうち、closed patternを選択する。パターン抽出モジュール110による二次パターン抽出によって抽出されなかった一次パターンを選択するようにしてもよい。つまり、パターン選択モジュール116は、第二整形モジュール108から得た情報にしたがって、パターン記憶モジュール112に格納されているパターンの取捨選択を行って、出力モジュール114に渡す。
出力モジュール114は、パターン選択モジュール116と接続されており、パターン選択モジュール116からパターンを受け取り、そのパターンを出力する。パターンを出力するとは、そのパターンの構造をディスプレイに表示すること、プリンタで印刷すること、データベース等へ書き込むこと、通信回線を介して他のシステムへ送信すること等が含まれる。
制御モジュール118は、第一整形モジュール106、第二整形モジュール108、パターン抽出モジュール110、パターン選択モジュール116と接続されており、これらのモジュールに対して、各々の処理を行うように制御する。
図2は、第1の実施の形態における処理の流れを示すフローチャートである。
ステップS202では、パターン抽出モジュール110が一次パターン抽出処理を行う。
一次パターン抽出処理は、従来技術であるembedded subtree miningの技術を用いるようにしてもよい。また、一次パターン抽出として、複数のツリーデータ内で複数回現れるパターンの探索を、そのツリーデータ内の現在の処理対象となっているノードより下位のノードに対して行い、パターンの探索を、ツリーデータ内の現在の処理対象となっているノードより上位のノードであってその上位のノードの下位にあり、かつ未探索のノード毎に探索するようにしてもよい。また、それらの処理の一部を変更して採用してもよい。第1の実施の形態では、図3〜5に示す処理を用いる。
図3の例に示すフローチャートは、closed patternの抽出を前提として出力パターンの削減と無駄になる処理を除いた、パターン抽出の処理の流れである。また図4の例に示すフローチャートは、その場合の一次パターン抽出処理における再帰部分の処理の流れを示したものである。図5の例に示すフローチャートは、その場合の二次パターン抽出処理における再帰部分の処理の流れを示したものである。これらの処理の詳細については後述する。
理解を容易にするために、例えば図10に示したような、ドキュメントの操作ログの2つのツリーデータがあった場合に最低出現数が2のパターンを抽出する場合を想定する。図10(a)のツリー例は、ドキュメントの作成として、閲覧と承認が2人の操作者によって並行して行われ、承認の後に、さらに2人の操作者によって、一方では印刷され閲覧が行われ、他方では修正され閲覧が行われたことを示している。また、図10(b)のツリー例は、ドキュメントの作成として、閲覧と修正が2人の操作者によって並行して行われ、修正の後に承認が行われ、さらに2人の操作者によって、一方では印刷され閲覧が行われ、他方では修正され閲覧が行われたことを示している。つまり、図10(b)のツリー例は、図10(a)のツリー例に承認の前に修正のノードが付加されたものである。
まず、説明と図の簡単のために図10に示すツリーのラベルの「作成」をA、「閲覧」をB、「修正」をC、「印刷」をD、「承認」をEと変換して説明する。つまり、図10の例に示すノードのラベルをこのように変換したツリーを図11に示す。
そして、次に説明の簡単のために、ツリーデータの文字列表記を導入する。図11のツリー例において、兄弟ノード間では左側のノードが先と順番を決めて、それぞれルートノードから深さ優先探索を行い、各ノードに到着したときにラベルを読み上げ、上位のノードに戻るときに記号(−1)を読み上げて文字列にしたものをツリーの文字列表記とする。例えば、図11(a)、図11(b)については、それぞれ図12(a)に示す「AB−1EDB−1−1CB」、図12(b)に示す「AB−1CEDB−1−1CB」のようになる。また、簡単のために各文字列の最後に続く−1は省略して表記する。以降の説明では、パターンの出現数をサポートとも呼ぶ。
図11に示す2つのツリー例を入力として最低出現数を2としたときのembedded subtree patternは、図21の例に挙げるように多くのパターン(「AB−1D:2」、「AB−1DB:2」等)が出力される。なお、「:2」は、サポートが2であることを示している。
これに対して、後述する図3に示すフローチャートによる処理を施すことで、一次パターン抽出の処理時に抽出されるパターンは大きく削減され図22の例に示すようになる。
ステップS204では、第一整形モジュール106が、ステップS202の処理結果に対して、一次パターンの出現数を表す符号を付加する整形処理を行う。
つまり、第一整形モジュール106は、一次パターン抽出処理の結果を整形する。closed patternは、サポート数が同じであるパターン間での包含関係を判定し、より大きなパターンに包含されるパターンを出力しない。このため、サポート数に対応し、かつ他のラベルと共通にならない符号をラベルとして設定したノードを各パターンツリーのルートの上位につけて新たなツリーとする。例えば、サポート数2に対して符号Yを与えることにより、EB−1B(図22の4行目のパターン)は、YEB−1B(図23の4行目のパターン)のツリーに変換される。同様にして図22のパターンは図23のように変換される。
ステップS206では、パターン抽出モジュール110が、ステップS204の処理結果に対して、二次パターン抽出処理を行う。
つまり、パターン抽出モジュール110は、整形された一次パターンに再度パターン抽出をかける。この際の最低出現するサポート数の指定は2とするが、必要に応じてこの指定を変えるようにしてもよい。
複数のパターンの中に現れ、さらに追加したルートノード(サポート数を表している)が等しい場合には、そのパターンは同じサポートを持つ他のパターンの中に含まれるということを意味する。すなわち、二次パターン抽出処理による抽出結果のパターンを、一次パターン抽出処理の結果から除いたものがclosed patternになる。
二次パターン抽出処理は、サポート数を表すラベルがルートノードにあるものだけを探せばよいので、二次パターン抽出の処理自体をそのように動作を制限することもできる。この制御以外は一次パターン抽出と同じ機構を用いて処理することもできる。なお、一次パターン抽出と二次パターン抽出は処理が異なっており、必ずしも全く同じ機構でなければならないわけではない。
ステップS208では、第二整形モジュール108が、ステップS206の処理結果に対して、整形処理を行う。
つまり、第二整形モジュール108は、二次パターン抽出処理の結果をパターン記憶モジュール112に含まれている一次パターンと比較しやすくする処理を行う。パターン選択モジュール116が直接それぞれのデータの形式に対応することで、第二整形モジュール108による二次結果整形の処理を省略することも可能である。
ステップS210では、パターン選択モジュール116が、一次パターン及び二次パターンを用いて、closed patternを選択し、出力モジュール114がclosed patternを出力する。
つまり、パターン選択モジュール116は、パターン記憶モジュール112に記憶されたパターンデータの中から、二次パターン抽出処理で抽出されなかったものを選択する。ここでの例では、図21に示したパターンの中から図24にないもの(先頭のYの違いを除いて比べる)を選んで出力することになる。あるいは、図23に示したパターンの中から図24に無いものを選択して、形式を図21の形に戻すなどの処理を行って出力する。
この選択処理の結果は、ここでの例ではAB−1EDB−1−1CB(図21)という一つのパターンだけとなり、一つだけのパターンがclosed pattern miningの出力結果となる。
次に図3〜図5の説明を行う。これらのフローチャート例は、パターン抽出処理をclosed patternの抽出にあわせて効率化したものである。
図3に示すフローチャート例では、頻出ラベルを抽出し(ステップS302)、未処理の頻出ラベルがあった場合(ステップS304でy)には、未処理の頻出ラベルを一つ選んで(ステップS306)、そのラベルをルートノードとしたツリーパターンを作成し(ステップS308)、図4又は図5で説明するパターン抽出再帰処理(ステップS310)に入る。なお、一次パターン抽出処理では図4に示すフローチャート例のパターン抽出再帰処理、二次パターン抽出処理では図5に示すフローチャート例のパターン抽出再帰処理である。未処理の頻出ラベルがなくなった場合(ステップS304でn)には、図3に示すパターン抽出処理を終了する(ステップS399)。
図4に示すフローチャート例では、まず、作業中のパターンツリーのあるパスを選択し、そのパス上のノードを列挙する。そして、下位サポートと呼ぶ変数を用意して初期化する(ステップS402)。
未処理ノードがあり、かつ、下位サポートに同じものがない場合(ステップS404でy)は、ステップS406へ進み、それ以外の場合はステップS420へ進む。
ステップS406では、未処理ノードを選択する。例えば、パスとして最も右側のパス(rightmost path : RMP)を選ぶことができる。より具体的には、図4の処理に入ったときに、作業中のパターンが図13に示すツリー例であった場合、列挙されるノードはAとEとなる(以降もラベルを利用してノードの指定を行う)。
ステップS408では、伸張候補である頻出するラベルを探索する。ステップS406で最初にEが選ばれたとすると、ステップS408では、Eの子供ノードとして頻出するラベルを列挙する。
ステップS410では、未処理の頻出ラベルがあるか否かを判断する。かかる判断においてある場合(ステップS410でy)にはステップS412へ進み、それ以外の場合(ステップS410でn)にはステップS404に戻る。この例では、BとDとEが挙げられるので、ステップS412へ進む。
そして、ステップS412では、伸張候補である頻出するラベルを選択する。そして、ステップS414で、その選択されたラベルついてのパターンを生成する。さきの例では、Dを選んで子ノードとした場合には図14、Cを選んで子ノードとした場合には図15、Bを選んで子ノードとした場合には図16のパターンとなる。ここで、Dが選ばれたとすると、図14に示すパターン例が生成される。
そして、ステップS416では、再帰的に本処理であるパターン抽出処理を呼び出す。再帰的に呼び出された先では例えば図17、18、19に示すようなパターンが調べられて出力される。
そして、ステップS418では、ステップS416の再帰的処理から戻ってくると、下位サポートを更新する。さきの例では、下位サポートは2に設定される。この下位サポートの更新は、未処理の頻出ラベルを選択した際にすぐ行ってもよい。更新の際には下位サポートの値は最大の値を保つように更新する。そして、ステップS410へ戻る。
さきの例は、Eの子ノードになるラベルの処理が全て終わると(ステップS410でn)、次の伸張箇所のノードの選択(ステップS406)に移る。しかし、このとき既に下位サポートの数値が図13のサポートの値と同じになっている(ステップS404でn)ので、新たな伸張箇所についての探索は行わない。これは、仮にAから何らかのノードを伸張したパターンが頻出になったとしても、そのパターンは必ずEの子供があるパターンにおいてAに同じノードを伸張したパターンに含まれてしまうためである。
ステップS420では、下位サポートに同じものがあるか否かを判断する。かかる判断において同じものがある場合(ステップS420でy)には終了し(ステップS499)、それ以外の場合(ステップS420でn)はステップS422へ進む。つまり、下位サポートがそのパターンのサポートと同じでない場合には、そのパターンと同じサポートであり、かつそのパターンを含むパターンが存在しない可能性があるのでパターンを出力する(ステップS422)。
この処理により、closed patternになりえないパターンの出力が抑えられて処理効率を上げることができる。
次に、図5に示すフローチャート例を用いて、二次パターン抽出処理におけるパターン抽出再帰処理を説明する。二次パターン抽出処理におけるパターン抽出再帰処理は、図4に示したフローチャート例と同様の処理を行う。つまり、ステップS502、ステップS506〜ステップS516は、それぞれステップS402、ステップS406〜ステップS416と同様である。二次パターン抽出処理では、下位サポートの判断処理が不要となる。したがって、ステップS404とは異なりステップS504で「未処理ノードあり」の判断だけを行い、ステップS418とステップS420の処理が不要となる。
次に、第2の実施の形態を説明する。図6は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。
第1の実施の形態では、抽出したパターンから再度パターンを抽出した後で、パターン同士を比較していたが、第2の実施の形態では、二次抽出パターンを出力しない。二次抽出パターンは、例に示したように一次抽出パターンよりも数が多くなる場合があり、このことが処理効率を下げる場合がある。第2の実施の形態は、二次抽出処理と選択処理においてパターンの抽出を行うのではなく、一次パターンが二次抽出処理において出現するか否かの判断を行うものである。
第2の実施の形態は、図6に示すように、ツリーデータ入力モジュール602、ツリーデータ記憶モジュール604、第一整形モジュール606、パターン抽出モジュール610、パターン記憶モジュール612、出力モジュール614、パターン選択モジュール616、制御モジュール618を有している。
第1の実施の形態と同様のモジュールは、同様の名称にしている。なお、第1の実施の形態と異なるのは、第二整形モジュール108がないことである。つまり、一次パターン抽出処理までは第1の実施の形態と同様である。第1の実施の形態と異なるモジュールの働きについて説明する。
パターン抽出モジュール610は、ツリーデータ記憶モジュール604、パターン記憶モジュール612、パターン選択モジュール616、制御モジュール618と接続されており、パターン抽出モジュール610による一次パターン抽出処理によって抽出された一次パターンを一次パターンの出現数毎に分類し、その分類された一次パターンから二次パターンを抽出する。
パターン選択モジュール616は、パターン抽出モジュール610、パターン記憶モジュール612、出力モジュール614、制御モジュール618と接続されており、パターン抽出モジュール610によって一次パターンを参照して行われる二次パターンの抽出処理過程で、ツリーデータ内で複数回現れるパターンのうち、closed patternを選択する。つまり、参照パターンに沿ってラベルの選択が行えない場合、参照パターンを出力する。また、パターン抽出モジュール610の二次パターン抽出処理による抽出のときに抽出されなかった一次パターンを選択するようにしてもよい。
図7に示すフローチャート例は、第2の実施の形態による処理例である。一次パターンを抽出し(ステップS702)、一次パターンを整形し(ステップS704)、一次パターンのリストに沿って、二次パターンの抽出処理と同時に一次パターンの選択処理を行う(ステップS706)。
ステップS702での一次パターンの抽出処理は、例えば、図3、図4に示す処理例と同様のものであってもよい。
図8に示すフローチャート例は、二次パターン抽出・一次パターン選択出力処理(ステップS706)の処理例を示したものである。
図5に示すフローチャート例との違いは、頻出ラベルの選択(ステップS806)が参照パターン(一次パターン)に沿って行われることと、参照パターンに沿ってラベルの選択が行えない(参照パターンが頻出パターンとして出現しない)場合(ステップS804でn)、参照パターンを出力する(ステップS812)点である。
ステップS802では、一次パターンから頻出ラベルを抽出する。
ステップS804では、参照パターンに沿ったラベルを選択できるか否かを判断する。かかる判断において選択できる場合(ステップS804でy)にはステップS806へ進み、それ以外の場合(ステップS804でn)はステップS812へ進む。
ステップS806では、ステップS804で選択できると判断したラベルを選択する。
ステップS808では、そのラベルを用いたパターンを作成する。
ステップS810では、図9に示すフローチャート例を呼び出す。戻ってきたらステップS804に戻る。
ステップS812では、参照パターンを出力する。
ステップS814では、未処理の参照パターンがあるか否かを判断する。かかる判断において未処理の参照パターンがある場合(ステップS814でy)にはステップS816へ進み、それ以外の場合(ステップS814でn)には終了する(ステップS899)。
ステップS816では、参照パターンを更新して、ステップS804へ戻る。
図9に示すフローチャート例は、図8のステップS810から呼び出されて再帰的にパターンを探索する処理例である。
この処理例も図5に示すフローチャート例と類似した処理を行うが、伸張箇所が決まった際にラベルを参照パターンに沿って選べなかったとき(ステップS912、参照パターンが頻出パターンとして出現しえないとき)、参照パターンを出力する点(ステップS922)が異なっている。
図9に示すフローチャート例に制御が移ったとき、常に抽出中のパターンと参照パターンは一致している。
ステップS902では、未処理の参照パターンがあるか否かを判断する。かかる判断においてある場合にはステップS904に進み、それ以外の場合には終了する(ステップS999)。
ステップS904では、参照パターンを更新する。
つまり、ステップS902、ステップS904では、参照パターンを抽出処理中のパターンよりも先に進める(次のラベルを選択する指針とするためには参照パターンが先に進んでいなければならない)処理を行っている。
ステップS906以降では、参照パターンが先に進んでいるため、参照パターンに従って制御を進める(ラベルの選択を行う)ことができる。
ステップS906では、参照パターンにしたがって、ノードを選択できるか否かを判断する。かかる判断において選択できる場合(ステップS906でy)にはステップS908に進み、それ以外の場合(ステップS906でn)は終了する(ステップS999)。
ステップS908では、その参照パターンにしたがって、ノードを選択する。
ステップS910では、伸張候補である頻出ラベルを探索する。
ステップS912では、参照パターンにしたがって、ラベルを選択できるか否かを判断する。かかる判断において選択できる場合(ステップS912でy)にはステップS914に進み、それ以外の場合(ステップS912でn)はステップS922に進む。
ステップS914では、ステップS912で選択できると判断されたラベル、つまり伸張候補の頻出ラベルを選択する。
ステップS916では、パターンを作成する。
ステップS918では、パターン抽出再帰処理(図9に示すフローチャート例による処理)を再帰的に呼び出す。
ステップS920では、参照パターンは同じノードからの伸張であるか否かを判断する。かかる判断において同じノードからの伸張である場合(ステップS920でy)にはステップS912に戻り、それ以外の場合(ステップS920でn)はステップS906に戻る。
ステップS922では、その参照パターンを出力する。
ステップS924では、未処理の参照パターンがあるか否かを判断する。かかる判断においてある場合(ステップS924でy)にはステップS926に進み、それ以外の場合(ステップS924でn)には終了する(ステップS999)。
ステップS926では、参照パターンを更新し、ステップS920に進む。
図8と図9に示すフローチャート例の処理により、二次パターン探索・一次パターン選択出力の処理を効率的に実行することができる。処理の結果、図11に示すツリー例を入力として、最低出現する回数として2を指定すると、一次パターン抽出の結果として図22に示すパターンがパターン記憶モジュール612に保持された後、図24に示すパターン例は出力されずに、直接結果として図20に示すclosed patternを表す出力が一つ提示される。
前述の第1の実施の形態又は第2の実施の形態において、パターン選択モジュール116又はパターン選択モジュール616による処理に先立って、参照パターンは辞書順などで整列させておくことでより効率的に処理を実現することができる。この整列は出力した一次パターンを第一整形モジュール106又は第一整形モジュール606にて整列処理をかけることでも実現できる。また、一次パターン抽出処理、二次パターン抽出処理における処理の順序を制御することによっても実現できる。つまり、参照パターンの整列と二次パターン抽出処理の処理順が揃っていることが処理効率を高めることになる。
また、前述の例ではサポート数として2だけであったが、通常はデータのツリーの数も多く、サポート数は2以上であってもよい。
制御モジュール118、制御モジュール618は、第1の実施の形態、第2の実施の形態の両方において、例えばサポートの数毎に一次結果の整形以降の処理を行うように制御するようにしてもよい。
また、サポートの数の違いを無視した処理に変形すると、Maximal patternの抽出処理を実現することもできる。
また、一次パターン抽出処理の結果を直接、二次パターン抽出(探索)処理で入力できるように一次パターン抽出処理の出力部分あるいは二次パターン抽出(探索)処理の入力部分を改変することで、一次結果の整形を省略する構成とすることも容易な変更である。
十分に大きな主記憶装置を用意して、一次パターン抽出処理の結果を主記憶上に保持することでパターン記憶モジュール112又はパターン記憶モジュール612を主記憶上に用意することもできる。
また、前述の例では、サポート数を表す符号をパターンの先頭に付加したが、パターンの最後尾やルートノードの最初の子ノードとして付加するようにしてもよい。
また、一次パターン抽出処理の結果をサポート数毎に処理するように制御することで、大量のパターンを分割処理することもできる。その場合には、第一整形モジュール106では、サポート数を表すノードをルートノードにつける必要が必ずしもなくなるため、第一整形モジュール106の処理をそのように適用させる改変も可能である。
なお、前述の実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図25に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなりえるコンピュータ等である。パターン抽出モジュール110、第一整形モジュール106、第二整形モジュール108、パターン抽出モジュール610、第一整形モジュール606等のプログラムを実行するCPU2501(この例では演算部としてCPUを用いた)と、そのプログラムやデータを記憶するRAM2502と、本コンピュータを起動するためのプログラム等が格納されているROM2503と、補助記憶装置であるHD2504(例えばハードディスクを用いることができる)と、キーボード、マウス等のデータを入力する入力装置2506と、CRTや液晶ディスプレイ等の出力装置2505と、通信ネットワークと接続するための通信回線インタフェース2507(例えばネットワークインタフェースカードを用いることができる)、そして、それらをつないでデータのやりとりをするためのバス2508により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図25に示すハードウェア構成は、1つの構成例を示すものであり、前述の実施の形態は、図25に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図25に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、情報家電、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blue−ray Disk)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 第1の実施の形態によるパターン抽出の処理例を示すフローチャートである。 第1の実施の形態による一次パターン抽出における再帰処理例を示すフローチャートである。 第1の実施の形態による二次パターン抽出における再帰処理例を示すフローチャートである。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による二次パターン抽出・一次パターン選択出力の処理例を示すフローチャートである。 第2の実施の形態によるパターン抽出における再帰処理例を示すフローチャートである。 ドキュメントの操作ログのツリーデータの例を示す説明図である。 ドキュメントの操作ログのツリーデータのラベルを変換した例を示す説明図である。 ツリーデータを文字列表記した場合の例を示す説明図である。 作業中のパターンの例を示す説明図である。 ラベルDを選択した場合のパターンの例を示す説明図である。 ラベルCを選択した場合のパターンの例を示す説明図である。 ラベルBを選択した場合のパターンの例を示す説明図である。 出力されるパターンの例を示す説明図である。 出力されるパターンの例を示す説明図である。 出力されるパターンの例を示す説明図である。 出力されるclosed patternの例を示す説明図である。 対象とする2つのツリーの最低出現数を2としたときの抽出されるembedded subtree patternの例を示す説明図である。 一次パターン抽出処理によって抽出されるパターンの例を示す説明図である。 抽出された一次パターンに符号を付加した例を示す説明図である。 二次パターン抽出によって抽出されたパターンの例を示す説明図である。 第1及び第2の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
符号の説明
102、602…ツリーデータ入力モジュール
104、604…ツリーデータ記憶モジュール
106、606…第一整形モジュール
108…第二整形モジュール
110、610…パターン抽出モジュール
112、612…パターン記憶モジュール
114、614…出力モジュール
116、616…パターン選択モジュール
118、618…制御モジュール

Claims (10)

  1. 複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、
    前記一次パターン抽出手段によって抽出された一次パターンに該一次パターンの出現数を表す符号を付加する符号付加手段と、
    前記符号付加手段によって符号が付加された一次パターンから二次パターンを抽出する二次パターン抽出手段と、
    前記一次パターンと前記二次パターンを比較して、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段
    を具備することを特徴とする情報処理装置。
  2. 複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、
    前記一次パターン抽出手段によって抽出された一次パターンを該一次パターンの出現数毎に分類する分類手段と、
    前記分類手段によって分類された一次パターンから二次パターンを抽出する二次パターン抽出手段と、
    前記二次パターン抽出手段による二次パターンの抽出処理過程で、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段
    を具備することを特徴とする情報処理装置。
  3. 前記一次パターン抽出手段は、対象としているノードよりも下位にあるパターンの出現数を用いてパターンを抽出する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記一次パターン抽出手段は、対象としているノードよりも下位であるパターンの出現数に基づいて、該パターンの抽出を継続する
    ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。
  5. 前記選択手段は、前記二次パターン抽出手段によって抽出されなかった前記一次パターンを選択する
    ことを特徴とする請求項1、3、4のいずれか一項に記載の情報処理装置。
  6. 前記選択手段は、前記二次パターン抽出手段による抽出のときに抽出されなかった前記一次パターンを選択する
    ことを特徴とする請求項2から4のいずれか一項に記載の情報処理装置。
  7. 前記符号付加手段は、前記一次パターンの順序を前記二次パターン抽出手段によって抽出される順序に揃える
    ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。
  8. 前記一次パターン抽出手段と前記二次パターン抽出手段の抽出の順序を揃える
    ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。
  9. コンピュータを、
    複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、
    前記一次パターン抽出手段によって抽出された一次パターンに該一次パターンの出現数を表す符号を付加する符号付加手段と、
    前記符号付加手段によって符号が付加された一次パターンから二次パターンを抽出する二次パターン抽出手段と、
    前記一次パターンと前記二次パターンを比較して、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段
    として機能させることを特徴とする情報処理プログラム。
  10. コンピュータを、
    複数の木構造内で複数回現れる一次パターンを抽出する一次パターン抽出手段と、
    前記一次パターン抽出手段によって抽出された一次パターンを該一次パターンの出現数毎に分類する分類手段と、
    前記分類手段によって分類された一次パターンから二次パターンを抽出する二次パターン抽出手段と、
    前記二次パターン抽出手段による二次パターンの抽出処理過程で、前記複数の木構造内で複数回現れるパターンのうち、二次パターンに現れない一次パターンを選択する選択手段
    として機能させることを特徴とする情報処理プログラム。
JP2008152369A 2008-06-11 2008-06-11 情報処理装置及び情報処理プログラム Expired - Fee Related JP4957656B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008152369A JP4957656B2 (ja) 2008-06-11 2008-06-11 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008152369A JP4957656B2 (ja) 2008-06-11 2008-06-11 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2009301154A JP2009301154A (ja) 2009-12-24
JP4957656B2 true JP4957656B2 (ja) 2012-06-20

Family

ID=41548008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008152369A Expired - Fee Related JP4957656B2 (ja) 2008-06-11 2008-06-11 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP4957656B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5772437B2 (ja) * 2011-09-21 2015-09-02 富士ゼロックス株式会社 データ構造抽出プログラム及びデータ構造抽出装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3353829B2 (ja) * 1999-08-26 2002-12-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 膨大な文書データからの知識抽出方法、その装置及び媒体
JP3853305B2 (ja) * 2003-05-30 2006-12-06 株式会社ジャストシステム 抽出装置、抽出方法、ならびに、プログラム
JP4039488B2 (ja) * 2003-08-18 2008-01-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 多頻度パターン抽出装置、多頻度パターン抽出方法、及びそのプログラムと記録媒体
JP4151980B2 (ja) * 2005-07-08 2008-09-17 インターナショナル・ビジネス・マシーンズ・コーポレーション システム、検出方法およびプログラム

Also Published As

Publication number Publication date
JP2009301154A (ja) 2009-12-24

Similar Documents

Publication Publication Date Title
US8521727B2 (en) Search apparatus, search method, and computer readable medium
JP4097263B2 (ja) ウェブアプリケーションモデル生成装置、ウェブアプリケーション生成支援方法及びプログラム
US6714927B1 (en) Apparatus for retrieving documents
JP5675676B2 (ja) 業務分析設計支援装置、業務分析設計支援方法、および業務分析設計支援プログラム
JP4957656B2 (ja) 情報処理装置及び情報処理プログラム
US8510693B2 (en) Changing abstraction level of portion of circuit design during verification
JP5810792B2 (ja) 情報処理装置及び情報処理プログラム
JP4957618B2 (ja) 情報処理装置及び情報処理プログラム
JP5555238B2 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP2009187224A (ja) 情報処理装置及び情報処理プログラム
JP4935768B2 (ja) 情報処理装置及び情報処理プログラム
JP5900486B2 (ja) 関連仕様対応付けシステム、関連仕様対応付け方法およびプログラム
JP5971069B2 (ja) 情報処理装置、タイトル抽出方法及びプログラム
JP6497087B2 (ja) 情報処理装置及び情報処理プログラム
JP5202598B2 (ja) ワークフロー管理装置、及びワークフロー管理プログラム
JP4134824B2 (ja) 情報処理装置及びプログラム
JP6511793B2 (ja) テストケース生成プログラム、テストケース生成方法及びテストケース生成装置
JP5760868B2 (ja) 情報処理装置及び情報処理プログラム
JP4220439B2 (ja) 構造化データ変換装置及び方法
JP7365446B2 (ja) モデルライフサイクル管理のために再利用解析を実行するための方法及びシステム
JP5842437B2 (ja) 情報処理装置及び情報処理プログラム
JP2010176354A (ja) 情報処理装置及び情報処理プログラム
JP2008046850A (ja) 文書種類判別装置及び文書種類判別プログラム
JP6303758B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4957656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees