JP2007018349A - システム、検出方法およびプログラム - Google Patents

システム、検出方法およびプログラム Download PDF

Info

Publication number
JP2007018349A
JP2007018349A JP2005200293A JP2005200293A JP2007018349A JP 2007018349 A JP2007018349 A JP 2007018349A JP 2005200293 A JP2005200293 A JP 2005200293A JP 2005200293 A JP2005200293 A JP 2005200293A JP 2007018349 A JP2007018349 A JP 2007018349A
Authority
JP
Japan
Prior art keywords
item
pattern
additional
closed
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005200293A
Other languages
English (en)
Other versions
JP4151980B2 (ja
Inventor
Itsusei Yoshida
吉田 一星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2005200293A priority Critical patent/JP4151980B2/ja
Priority to US11/481,208 priority patent/US7584187B2/en
Publication of JP2007018349A publication Critical patent/JP2007018349A/ja
Application granted granted Critical
Publication of JP4151980B2 publication Critical patent/JP4151980B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】第1アイテム空間について求めた閉パターンに基づいて、第1アイテム空間に新たなアイテムを追加した第2アイテム空間における閉パターンを求める。
【解決手段】トランザクション処理の対象であるアイテム集合をトランザクション毎に記録した履歴情報に基づいて、アイテムの最大集合である閉パターンを検出するシステムを提供する。このシステムは、第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録している。そして、何れかの第1閉パターンに、第1アイテム空間に含まれていない追加アイテムを追加して追加パターンを生成し、追加パターン全体を含むトランザクションの集合と、何れかの第1閉パターン全体を含むトランザクションの集合とを比較する。比較された集合が互いに一致したことを条件に、当該第1閉パターンおよび追加パターンの和集合を、第2アイテム空間における第2閉パターンとして検出する。
【選択図】図4

Description

本発明は、システム、検出方法およびプログラムに関する。特に、本発明は、トランザクションの履歴情報を解析するシステム、検出方法およびプログラムに関する。
近年、大量に蓄積されたデータの中から有用な情報を抽出するデータマイニングが研究されている。データマイニングによれば、例えば、小売店の発行済みレシートのデータに基づき、「木曜日には、消費者はビールと紙おむつを一緒に買う」といった相関ルールを抽出できる。このため、経営者や責任者の経験や勘によらずとも、企業の在庫管理方針や販売戦略を適切に設定できることが期待されている。
対象となるデータに頻繁に現れるアイテム(例えば、商品)の組を検出する技術は、頻出パターンマイニングと呼ばれ、従来より様々な研究が行われている(非特許文献1を参照。)。更に、全ての頻出パターンを列挙するためには、出現頻度と集合の包含関係を用いて記述される極大条件を満たすパターンだけを求めれば充分であることが知られている(非特許文献2を参照。)。このパターンは、閉パターン(closed pattern)と呼ばれている。
更に、従来、頻繁に現れる閉パターンを求めることができれば、その閉パターンの部分集合を列挙することで、頻出パターンを求めることができることが知られている(非特許文献2を参照。)。このため、閉パターンを効率的に求める様々な方法が研究されている(例えば非特許文献3を参照。)。
R. Agrawal, R. Srikant:Fast Algorithms for Mining Association Rules, Proc. of the 20th Int'l Conference on Very Large Databases, Santiago, Chile, Sept. 1994. Expanded version available as IBM Research Report RJ9839, June 1994. N. Pasquier, Y. Bastide, R. Taouil, and L. Lakhal:Discovering frequent closed itemsets for association rules, In 7th Intl. Conf. on Database Theory, January 1999. T. Uno, T. Asai, Y. Uchida, H. Arimura: LCM: An Efficient Algorithm for Enumerating Frequent Closed Item Sets, Proceedings of the ICDM 2003 Workshop on Frequent Itemset Mining Implementations, 2003.
ある販売システムにおける販売処理の各々をトランザクションとし、その販売処理によって一緒に販売された商品をアイテムとした例により、本発明の課題を説明する。この例において、データベースは、多数のトランザクションの履歴を、各々のトランザクションにおいて販売されたアイテムの集合として記録している。このデータベースから閉パターンを求めれば、この販売システムにおいて頻繁に販売される商品の組を求めることができる。
データマイニングを販売戦略に有効活用するためには、単に全ての商品を対象として頻出パターンを求めるのでは不十分な場合がある。例えば、売れ行き不振の原因調査のため、売れ行きが不振な特定商品のみについて頻出パターンを求めたい場合がある。また、小売店の商品配置を検討するために、同一の陳列棚に陳列された商品群のみについて頻出パターンを求めたい場合がある。このような場合には、特定のアイテムの集合から構成されるアイテム空間を対象に、閉パターンを検出すればよい。
しかしながら、商品の陳列方法や売れ行きその他の状況は、時間の経過や販売店の所在地等によって異なる。従って、ある第1アイテム空間を対象に閉パターンを検出した場合であっても、その第1アイテム空間に新たなアイテムを追加した第2アイテム空間について、更に閉パターンを求める必要が生じる場合がある。このような場合、従来は、第1アイテム空間について求めた閉パターンの情報を破棄して、新たに第2アイテム空間についての閉パターンを求めていた。このため、アイテム空間の僅かな変更であっても、閉パターンの検出処理に長い時間を要していた。
そこで本発明は、上記の課題を解決することのできるシステム、検出方法およびプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明の第1の形態においては、トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報に基づいて、トランザクションの組に共通するアイテムの最大集合である閉パターンを検出するシステムであって、予め定められたアイテムの集合から構成される第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録している記録部と、記録されている何れかの第1閉パターンに、第1アイテム空間に含まれていないアイテムである追加アイテムを追加することにより追加パターンを生成する生成部と、追加パターン全体をアイテム集合中に含むトランザクションの集合と、記録されている何れかの第1閉パターン全体をアイテム集合中に含むトランザクションの集合とを比較する比較部と、比較部により比較された集合が互いに一致したことを条件に、当該第1閉パターンおよび追加パターンの和集合を、第1アイテム空間に追加アイテムを追加した第2アイテム空間における閉パターンである第2閉パターンとして検出する検出部とを備えるシステム、当該システムによって閉パターンを検出する検出方法、および、当該システムとして情報処理装置を機能させるプログラムを提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、第1アイテム空間について求めた閉パターンに基づいて、第1アイテム空間に新たなアイテムを追加した第2アイテム空間における閉パターンを求めることができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、情報システム10の全体構成を示す。情報システム10は、データベース装置20と、解析システム30とを備える。データベース装置20は、利用者から要求された商品販売等のトランザクションを処理し、トランザクションの履歴を記録した履歴情報を記録する。具体的には、データベース装置20は、トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報を記録している。そして、データベース装置20は、トランザクションを処理する毎に、履歴情報において既に記録されたアイテム集合に、当該トランザクションのアイテム集合を追加して記録する。
解析システム30は、履歴情報に基づいて、トランザクションの組に共通するアイテムの最大集合である閉パターンを検出する。詳細には、解析システム30は、閉パターンを検出する対象となるアイテムの集合であるアイテム空間の指定を利用者から入力する。そして、解析システム30は、履歴情報中のアイテム集合のうち、指定された当該アイテム空間における閉パターンを検出して出力する。
本実施例における情報システム10は、第1アイテム空間について求めた閉パターンに基づいて、第1アイテム空間に新たなアイテムを追加した第2アイテム空間における閉パターンを求める。これにより、検出の対象を拡大した場合であっても、これまでより効率的な処理によって閉パターンを検出することを目的とする。
図2は、データベース装置20のデータ構造の概略を示す。(a)に示すように、データベース装置20は、トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報を記録している。ここで、トランザクションとは、例えば、データベース装置20等の情報処理装置において同一利用者から受けた要求に応じて行う一連の処理を示す。一例として、トランザクションは、商品販売用ウェブサイトにおいて、複数の商品を一緒に販売して一括に決済する処理である。
また、アイテムとは、トランザクション処理の対象であり、その他に、トランザクションを要求した要求元の属性であってもよいし、トランザクション処理の内容を示す属性であってもよい。一例として、アイテムは、商品販売用ウェブサイトにおいて販売された商品である。その他の具体例として、アイテムは、商品購入者の性別や年齢層であってもよいし、購入処理か購入のキャンセル処理かといった処理種別であってもよい。
本図の例では、データベース装置20は、履歴情報として、tからtまでの4つのトランザクションの履歴を記録している。そして、データベース装置20は、トランザクションtに対応付けて、その対象となったアイテムA、B、CおよびEを記録している。即ちこの例によれば、トランザクションtにおいてアイテムA、B、CおよびEが販売されたことが分かる。
また、アイテム空間とは、予め定められたアイテムの集合をいう。そして、あるアイテム空間における閉パターンとは、そのアイテム空間が示すアイテムの集合のみに着目したときに閉パターンとしての性質を満たすアイテムの集合をいう。例えば本図において、アイテム空間{A,B,C}について閉パターンを検出する場合には、履歴情報からアイテムEを除外した情報が閉パターンの検出対象となる。
(b)に、アイテムをインデックスとしてそのアイテムを含むトランザクションの集合を求める検索用テーブルを示す。この検索用テーブルは、(a)に示す履歴情報に基づいて、後述する構築部330によって構築される。この検索用テーブルは、履歴情報からトランザクション集合を求める処理を効率化するためのものであり、(a)に示す履歴情報と同一内容を示す。
図3は、解析システム30の機能構成を示す。解析システム30は、DBアクセス部300と、閉パターン検出本体部310と、インターフェイス部320とを有する。DBアクセス部300は、構築部330と、取得部340とを有する。DBアクセス部300は、データベース装置20をアクセスしてアクセス結果を閉パターン検出本体部310に供給する。閉パターン検出本体部310は、第1アイテム空間について既に求められた第1閉パターンに基づいて、第2アイテム空間における第2閉パターンを求めてインターフェイス部320に出力する。インターフェイス部320は、閉パターン検出本体部310を用いて、利用者から指定されたアイテム空間における閉パターンの集合を検出し、検出結果を出力する。
DBアクセス部300は、構築部330と、取得部340とを有する。構築部330は、既に述べたように、履歴情報に基づいて検索用テーブルを構築する。そして、構築部330は、閉パターン検出本体部310の必要に応じ、履歴情報自体、または、検索用テーブルを閉パターン検出本体部310に対して出力する。また、取得部340は、閉パターン検出本体部310の指定に応じ、指定されたあるパターンをアイテム集合として含むトランザクションの数を履歴情報から取得する。
インターフェイス部320は、入力部350と、選択部360と、判断部370と、出力部380とを有する。入力部350は、閉パターンを検出する対象となるアイテム空間である対象アイテム空間の指定を入力する。選択部360は、対象アイテム空間のうち第1アイテム空間に含まれていないアイテムを順次追加アイテムとして選択する。これに応じ、閉パターン検出本体部310は、追加アイテムを第1アイテム空間に追加した第2アイテム空間における第2閉パターンを検出する。判断部370は、閉パターン検出本体部310によって第2閉パターンが検出されたことに応じ、第2アイテム空間が対象アイテム空間と一致するか否かを判断する。
選択部360は、一致しなかったことを条件に、次の追加アイテムを選択する。これにより、既に検出されて閉パターン検出本体部310中の記録部400に記録された第2閉パターンを次の第1閉パターンとして、その第1閉パターンに追加すべき追加アイテムが選択される。一方で、第2アイテム空間が対象アイテム空間と一致することを条件に、出力部380は、検出された第2閉パターンを、履歴情報中で頻繁に現れるアイテム集合として出力する。例えば、出力部380は、第2閉パターンが示す販売対象の集合を、消費者によって一緒に購入され易い販売対象の集合として出力してもよい。
図4は、閉パターン検出本体部310の機能構成を示す。閉パターン検出本体部310は、記録部400と、配列アクセス部410と、生成部420と、比較部430と、記録制御部440と、検出部450とを有する。記録部400は、予め定められたアイテム集合から構成される第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録している。例えば、記録部400は、予め定められた販売対象の集合から構成される第1アイテム空間について求められた第1閉パターンを記録していてもよい。具体的な構造としては、記録部400は、第1閉パターンの各々を要素とする配列変数を記録していてもよい。この第1閉パターンは、第2アイテム空間における閉パターンの候補である第2閉パターン候補となる。
配列アクセス部410は、配列変数の要素を先頭から順に読み出す。また、配列アクセス部410は、比較部430の要求に応じ、配列変数中の任意の要素を読み出し比較部430に出力する。生成部420は、記録部400に記録されている何れかの第1閉パターンに、選択部360によって選択された追加アイテムを追加することにより追加パターンを生成する。全ての第2閉パターンを求めるには、生成部420は、記録部400に記録されている全ての第1閉パターンの各々に対して、追加アイテムを順次追加することによって複数の追加パターンの各々を生成する。
比較部430は、追加パターン全体をアイテム集合中に含むトランザクションの集合を求める。具体的には、比較部430は、追加パターンに含まれる何れのアイテムをも含むトランザクションを、データベース装置20中の履歴情報から検索することにより当該集合を求める。より詳細には図2(b)に示す検索用テーブルを用い、比較部430は、追加パターンに含まれる各々のアイテムをインデックスとして検索用テーブルを検索し、何れのアイテムにも対応するトランザクションの集合を求めてもよい。例えば、追加パターンが{A,C}であれば、{A,C}全体を含むトランザクションtおよびトランザクションtが求められる。
そして、比較部430は、記録部400に記録されている何れかの第1閉パターン全体をアイテム集合中に含むトランザクションの集合を求める。追加パターンの場合と同様に、比較部430は、当該第1閉パターンに含まれる各々のアイテムをインデックスとして検索用テーブルを検索し、何れのアイテムにも対応するトランザクションの集合を求めてもよい。
全ての第2閉パターンを適切に求めるためには、比較部430は、記録部400に記録されている全ての第2閉パターン候補の各々について当該第2閉パターン候補全体をアイテム集合中に含むトランザクションの集合を求める。そして、比較部430は、求められたこれらの集合の各々と、追加パターンについて求めた集合とを比較する。
記録制御部440は、取得部340により追加パターンの数を取得させ、その数が予め定められた基準以上か否かを判断する。また、基準以上である場合に限り、記録制御部440は、追加パターンについてのトランザクションの集合が、何れかの第2閉パターン候補についてのトランザクションの集合と一致したか否かを判断する。一致したことを条件に、記録制御部440は、当該第2閉パターン候補に代えて、当該第2閉パターン候補および当該追加パターンの和集合を新たな第2閉パターン候補として記録部400に追加して記録する。一方で、基準以上ではあるが、一致しなかったことを条件に、記録制御部440は、当該追加パターンを第2閉パターン候補として記録部400に追加して記録する。記録処理は、配列アクセス部410を経由して行われる。例えば、配列アクセス部410は、追加する第2閉パターンを配列変数の末尾要素の次の要素として記録してもよい。
検出部450は、全ての追加パターンについての処理の完了に応じ、記録部400に記録されている第2閉パターン候補の各々を第2閉パターンとして検出し、検出結果を判断部370に送る。
図5は、記録部400のデータ構造の一例を示す。記録部400は、第2閉パターン候補の各々を要素とする配列変数を記録している。閉パターンは、アイテムの集合であるから、各々の閉パターンは少なくとも1つのアイテムに対応付けられている。本図では、配列変数の各要素は、第2閉パターン候補を識別する識別情報およびアイテムへのポインタのみを有している。そして、そのパターンに含まれるアイテム集合は、各アイテムを連結したリスト構造で管理されている。例えば、識別情報を1とするパターンは、アイテムA、アイテムBおよびアイテムCをアイテム集合として含む。
また、配列変数に代えて、記録部400は、各々の第2閉パターン候補を選択することによって順次次の第2閉パターン候補を選択することのできる他のデータ構造によって当該パターンを記録していてもよい。例えば、記録部400は、片方向に走査可能なリスト構造によって第2閉パターン候補を記録していてもよいし、双方向に操作可能なリスト構造によって第2閉パターン候補を記録していてもよい。
また、何れの閉パターンも検出されていない場合等において、記録部400は、何れの閉パターンをも含まない空集合を示す情報を記録している。この場合、閉パターン検出本体部310は、空集合に対しても同様に図3の機能を適用することで、任意のアイテム空間における閉パターンを検出することができる。
図6は、データベース装置20により対象アイテム空間の閉パターンが検出される処理の一例を示す。入力部350は、対象アイテム空間の指定を入力する(S600)。構築部330は、検索用テーブルを構築する(S610)。選択部360は、追加アイテムを選択する(S620)。閉パターン検出本体部310は、第1アイテム空間に当該追加アイテムを追加した第2アイテム空間における閉パターンを検出する(S630)。第2アイテム空間が対象アイテム空間に一致しなければ(S640)、解析システム30は、S620に処理を戻す。
一方、第2アイテム空間が対象アイテム空間に一致すれば(S640:YES)、出力部380は、検出された第2閉パターンの各々を、履歴情報中で頻繁に現れるアイテム集合として出力する(S650)。
図7は、図6のS630における処理の一例を示す。この処理は、記録部400が記録する第1閉パターンの記録順序によって異なる。本図では、記録部400が、各々の第1閉パターンを、当該パターンに含まれるアイテムの組み合わせ木を所定の走査順序で走査した順序に従って配列しているものとする。より詳細には、図10(a)に、アイテムの組み合わせを示す木構造データの一例を示す。この木構造において、親ノード(図上方向)が示すアイテム集合に他のアイテムを追加したアイテム集合は、当該親ノードの子ノードとして配置される。即ち例えば、ノードCを示す親ノードの子ノードには、ノードCを含むノードCおよびノードBから構成されるアイテム集合が配置される。記録部400は、この木構造を右深さ優先探索によって走査する走査順序に従って第1閉パターンの各々を配列して記録している。
図7に戻る。配列アクセス部410は、配列変数の要素を先頭から順に読み出す(S700)。検出部450は、配列アクセス部410により読み出された要素が、追加アイテムを含むか、または、配列変数の末尾に達して要素が読み出せなかったかを判断する(S710)。ここで、配列変数中の各要素は、アイテム集合の組み合わせを示す木構造を右深さ優先探索によって走査した走査順序で配列されている。このため、追加アイテムを含む要素が読み出された場合には、その後続の何れの要素も当該追加アイテムを含む。従って、配列変数を先頭から読み出して初めて追加アイテムが読み出された時点で、その後の要素の読み出しを省略しても構わない。
追加アイテムを含むことを条件に、または、配列変数の末尾要素に達したことを条件に(S710:YES)、検出部450は、その時点で記録部400に記録されていた第2閉パターン候補を第2閉パターンとして検出する(S720)。読み出された要素が追加アイテムを含まないことを条件に(S710:NO)、生成部420は、読み出された要素が示す第1閉パターンに、追加アイテムを追加することにより追加パターンを生成する(S730)。記録制御部440は、追加パターン全体をアイテム集合として含むトランザクションの数が基準以上か否かを判断する(S740)。基準未満であれば(S740:NO)、閉パターン検出本体部310はS700に処理を戻す。
このとき、好ましくは、配列アクセス部410は、既に読み出した要素と次に読み出す要素との比較により一部の処理を省略する。具体的には、配列アクセス部410は、読み出した要素が示すアイテム集合が、既に読み出された何れかの要素が示すアイテム集合であって取得されたトランザクションの数が基準以下のアイテム集合を含むことを条件に、読み出した当該要素を生成部420に処理させずに次の要素を読み出す。これにより、重複処理を省略して処理を効率化できる。より詳しくは、この処理は、図9のプログラム例における20行目から24行目の命令により実現される。
一方、基準以上であれば(S740:YES)、比較部430は、当該追加パターン全体を含むトランザクションの集合と、各々の第2閉パターン候補について求めた当該第2閉パターン候補全体をアイテム集合として含むトランザクションの集合とを比較する(S750)。何れかの第2閉パターン候補についてのトランザクションの集合と一致したことを条件に、記録制御部440は、一致した当該第2閉パターン候補を示す要素を配列変数から除外する(S770)。なお、ここでいうトランザクションの集合とは、履歴情報のうち第2アイテム空間についてのみに着目した情報に基づくトランザクションの集合をいう。即ち、第2アイテム空間が{A,C}であれば、トランザクション{A,C,E}はトランザクション{A,C,D}と同一と判断される。
このとき、配列変数中で当該要素の後続の各要素は、1要素ずつ先頭方向に移動されて配列される。そして、記録制御部440は、当該追加パターンおよび当該第2閉パターン候補の和集合を示す要素を、配列変数の末尾要素の次に追加する(S780)。一方で、何れの第2閉パターン候補についてのトランザクションの集合とも一致しなかったことを条件に(S760:NO)、記録制御部440は、当該追加パターンを示す要素を、配列変数の末尾要素の次に追加する(S790)。これによって、要素を追加した後の配列変数も、アイテム集合の組み合わせを示す木構造を右深さ優先探索で走査した走査順序によって、第2閉パターン候補を配列することができる。
図8は、本実施例の処理を実現するプログラムの例を示す(第1例)。本プログラム例において変数Sは第2閉パターン候補を記録する。変数nは、対象アイテム空間のアイテム数を示す。変数Iは第1閉パターンを示す。また、xは、追加アイテムを示し、I〜は追加パターンを示す。また、minsupは、トランザクションの数について予め定められた基準値を示す。
1行目から8行目のプログラムは、図6に示すフローチャートに対応する。即ち、6行目においてアイテム空間を順次1つずつ拡大し、5行目において拡大されるアイテム空間について順次閉パターンを求める。5行目の関数呼び出しにより9行目から19行目に処理が移る。11行目の命令により、生成部420は、各々の第1閉パターンを順次選択する。12行目の命令により、生成部420は、選択された第1閉パターンに追加アイテムを追加することにより追加パターンを生成する。13行目の命令により、追加パターン全体を含むトランザクションの数が基準以上か否かが判断される。
14行目の命令により、比較部430は、何れかの第2閉パターン候補について求めた当該第2閉パターン候補全体を含むトランザクションの集合が、追加パターン全体を含むトランザクションの集合と一致するか否かを判断する。15行目の命令により、記録制御部440は、一致した当該第2閉パターン候補を、第2閉パターン候補の集合から除外し、それに代えて、当該第2閉パターン候補および追加パターンの和集合が新たな第2閉パターン候補として追加する。即ち、比較部430により比較された集合が互いに一致したことを条件に、検出部450は、当該第1閉パターンおよび前記追加パターンの和集合を第2アイテム空間における第2閉パターンとして検出することができる。
図9は、本実施例の処理を実現するプログラムの例を示す(第2例)。本図のプログラムは、図8に示した「Algorithm NEXT」部分に置き換えて実行され、記録部400が第2閉パターン候補を配列変数として記録する場合の処理を示している。本図においてSは、当該配列変数を示す。4行目および5行目の命令によって、検出部450は、第2閉パターン候補が追加アイテムを含むか否かを判断する。読み出された場合には、6行目に示す処理によって本図の処理を終了する。
7行目の命令により、生成部420は、追加パターンを生成する。追加パターン全体を含むトランザクションの数が基準以上であることを条件に(8行目)、次の行に処理が移る。9行目の命令により、比較部430は、何れかの第2閉パターン候補について求めた当該第2閉パターン候補全体を含むトランザクションの集合が、追加パターン全体を含むトランザクションの集合と一致するか否かを判断する。
10行目の命令により、一致した当該第2閉パターン候補が配列変数から取り除かれ、その後続要素の各々は順次先頭側に1要素分移動して配列される。11行目の命令により、追加パターンおよび当該第2閉パターン候補の和集合から構成される新たな第2閉パターン候補が、配列変数の末尾要素の次の要素として追加される。12行目および13行目において、配列変数の変更に伴い必要に応じ、配列変数の添え字を変更する。
15行目の命令により、追加パターンを示す要素が新たな第2閉パターン候補として配列変数の末尾要素の次に追加される。18行目から24行目は、次に読み出す第1閉パターンについての処理が、既に読み出された第1閉パターンについての処理と同一となる場合に、当該同一の処理を省略するための命令群を示す。即ち、これらの命令群により、配列アクセス部410は、読み出した要素が示すアイテム集合が、既に読み出された何れかの要素が示すアイテム集合を含むことを条件に、読み出した当該要素を生成部420に処理させずに次の要素を読み出す。
図10は、本実施例の処理過程を示す。本図は、図2に示した履歴情報に基づいて閉パターンを求める処理の具体的な処理過程を示す。(a)に、A、BおよびCから構成される第1アイテム空間における閉パターンの集合を示す。即ち、この第1アイテム空間において、閉パターンは、それぞれ、B、C、CA、CBおよびCBAである。これらの閉パターンは、木構造における斜線を付したノードとして表される。この例を用いて、第1アイテム空間に要素Eを追加した第2アイテム空間について閉パターンを求める処理を説明する。
生成部420は、要素Bから構成される第1閉パターン(以降、パターンBなどと称す)に、追加アイテムである要素Eを追加することにより追加パターンEBを生成する。比較部430は、パターンBおよびパターンEBの各々について、当該パターン全体を含むトランザクションの集合を求める。図2に示したように、パターンBを含むトランザクションの集合はt、tおよびtである。そして、要素Bおよび要素Eの何れをも含むトランザクションの集合も、t、tおよびtである。このため、比較部430は、パターンBを除外し、パターンBおよびパターンBEの和集合を新たな第2閉パターン候補として追加する(b)。
次に、生成部420は、要素Cから構成される第1閉パターンに、追加アイテムである要素Eを追加することにより追加パターンECを生成する(c)。追加パターンEC全体を含むトランザクションの集合は、パターンCB全体を含むトランザクションの集合に一致する。このため、比較部430は、パターンCBを除外し、パターンCBおよびパターンECの和集合であるパターンECBを新たな第2閉パターン候補として追加する(d)。
次に、比較部430は、パターンCAに追加アイテムである要素Eを追加することにより追加パターンECAを生成する(e)。追加パターンECA全体を含むトランザクションの集合は、パターンCBA全体を含むトランザクションの集合と一致する。このため、比較部430は、パターンCBAを除外し、パターンCBAおよびパターンECAの和集合であるパターンECBAを新たな第2閉パターン候補として追加する(f)。
以上、図1から図10に示した実施例によれば、既に第1アイテム空間について求めた閉パターンに基づいて、第1アイテム空間に他のアイテムを追加した第2アイテム空間における閉パターンを求めることができる。これにより、例えば、以下のような応用が可能となる。
(1)検出対象となるアイテムの種類の追加
記録部400は、販売対象の集合を示す第1アイテム空間についての閉パターンを記録している。生成部420は、購入者の属性を追加アイテムとして第1アイテム空間に追加することにより追加パターンを生成する。これに応じて求められた第2閉パターンは、出力部380によって、一緒に購入され易い販売対象および当該販売対象を購入し易い購入者の属性の集合として出力される。このように、解析の対象を販売商品のみから購入者の属性にまで拡大した場合であっても、既に求めた閉パターンの検出結果を有効活用して処理を効率化できる。
(2)検出対象の変化への追従
ウェブ・サーバは、複数のウェブページを有している。ウェブページのコンテンツが変更されると、新たなウェブページが既存のウェブページに追加されたり、新たなウェブページが既存のウェブページと置き換えられる場合がある。このような場合に、従来は、既存のウェブページの閲覧記録について既に閉パターンを求めたとしても、新たなウェブページを含めたウェブページ全体について改めて閉パターンを求めなければならなかった。
これに対して、本例の解析システム30を応用すれば、新たなウェブページを含めたウェブページ全体について効率的に閉パターンを求めることができる。この処理において、具体的には、履歴情報は、少なくとも1つのウェブページを利用者に表示するトランザクション処理毎に、表示した当該ウェブページをアイテムとして記録している。そして、記録部400は、予め定められたウェブページの組を第1アイテム空間として第1閉パターンを記録している。生成部420は、新たに追加されたウェブページを追加アイテムとして追加パターンを生成する。検出部450は、第1閉パターンおよび追加パターンの和集合を、当該新たなウェブページを含むウェブページの組を示す第2アイテム空間における第2閉パターンとして検出する。
このように、本例によれば、既に求めた閉パターンの検出結果を有効活用して、新たなアイテムを追加したアイテム空間についての閉パターンを効率的に検出できる。
図11は、解析システム30として機能する情報処理装置500のハードウェア構成の一例を示す。情報処理装置500は、ホストコントローラ1082により相互に接続されるCPU1000、RAM1020、及びグラフィックコントローラ1075を有するCPU周辺部と、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部と、入出力コントローラ1084に接続されるBIOS1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部とを備える。
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスするCPU1000及びグラフィックコントローラ1075とを接続する。CPU1000は、BIOS1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィックコントローラ1075は、CPU1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、CPU1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して外部の装置と通信する。ハードディスクドライブ1040は、情報処理装置500が使用するプログラム及びデータを格納する。CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、RAM1020又はハードディスクドライブ1040に提供する。
また、入出力コントローラ1084には、BIOS1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。BIOS1010は、情報処理装置500の起動時にCPU1000が実行するブートプログラムや、情報処理装置500のハードウェアに依存するプログラム等を格納する。フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力チップ1070を介してRAM1020またはハードディスクドライブ1040に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
情報処理装置500に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、入出力チップ1070及び/又は入出力コントローラ1084を介して、記録媒体から読み出され情報処理装置500にインストールされて実行される。プログラムが解析システム30に働きかけて行わせる動作は、図1から図10において説明した解析システム30における動作と同一であるから、説明を省略する。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを情報処理装置500に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
図1は、情報システム10の全体構成を示す。 図2は、データベース装置20のデータ構造の概略を示す。 図3は、解析システム30の機能構成を示す。 図4は、閉パターン検出本体部310の機能構成を示す。 図5は、記録部400のデータ構造の一例を示す。 図6は、データベース装置20により対象アイテム空間の閉パターンが検出される処理の一例を示す。 図7は、図6のS630における処理の一例を示す。 図8は、本実施例の処理を実現するプログラムの例を示す(第1例)。 図9は、本実施例の処理を実現するプログラムの例を示す(第2例)。 図10は、本実施例の処理過程を示す。 図11は、解析システム30として機能する情報処理装置500のハードウェア構成の一例を示す。
符号の説明
10 情報システム
20 データベース装置
30 解析システム
300 DBアクセス部
310 閉パターン検出本体部
320 インターフェイス部
330 構築部
340 取得部
350 入力部
360 選択部
370 判断部
380 出力部
400 記録部
410 配列アクセス部
420 生成部
430 比較部
440 記録制御部
450 検出部
500 情報処理装置

Claims (15)

  1. トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報に基づいて、トランザクションの組に共通するアイテムの最大集合である閉パターンを検出するシステムであって、
    予め定められたアイテムの集合から構成される第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録している記録部と、
    記録されている何れかの前記第1閉パターンに、前記第1アイテム空間に含まれていないアイテムである追加アイテムを追加することにより追加パターンを生成する生成部と、
    前記追加パターン全体をアイテム集合中に含むトランザクションの集合と、記録されている何れかの前記第1閉パターン全体をアイテム集合中に含むトランザクションの集合とを比較する比較部と、
    前記比較部により比較された集合が互いに一致したことを条件に、当該第1閉パターンおよび前記追加パターンの和集合を、前記第1アイテム空間に前記追加アイテムを追加した第2アイテム空間における閉パターンである第2閉パターンとして検出する検出部と
    を備えるシステム。
  2. トランザクションを処理する毎に、前記履歴情報において既に記録されたアイテム集合に、当該トランザクションのアイテム集合を追加して記録するデータベース装置を更に備え、
    前記比較部は、前記追加パターンに含まれる何れのアイテムをも含むトランザクションを、前記データベース装置中の前記履歴情報から検索することにより、前記追加パターン全体を含むトランザクションの集合を求め、さらに、
    前記第1閉パターンに含まれる何れのアイテムをも含むトランザクションを、前記データベース装置中の前記履歴情報から検索することにより、前記第1閉パターン全体を含むトランザクションの集合を求める
    請求項1に記載のシステム。
  3. 前記履歴情報は、トランザクション処理によって一緒に販売された販売対象の集合を前記アイテム集合として、販売処理を示すトランザクション毎に記録し、
    前記記録部は、予め定められた販売対象の集合から構成される第1アイテム空間について求められた第1閉パターンを記録し、
    前記検出部によって検出された第2閉パターンが示す販売対象の集合を、一緒に購入され易い販売対象の集合として出力する出力部
    を更に備える請求項1に記載のシステム。
  4. 前記履歴情報は、更に、販売対象の購入者の属性を前記アイテム集合に含めて記録し、
    前記生成部は、当該購入者の属性を前記追加アイテムとして前記追加パターンを生成し、
    前記出力部は、前記検出部によって検出された第2閉パターンを、一緒に購入され易い販売対象および当該販売対象を購入し易い購入者の属性の集合として出力する
    請求項3に記載のシステム。
  5. 前記記録部に対する閉パターンの記録を制御する記録制御部を更に備え、
    前記記録部は、全ての前記第1閉パターンを、前記第2閉パターンの候補である第2閉パターン候補として記録し、
    前記生成部は、前記第1閉パターンの各々に、前記追加アイテムを順次追加することにより前記追加パターンの各々を生成し、
    前記追加パターンが生成される毎に、
    前記比較部は、当該追加パターン全体を含むトランザクションの集合と、各々の前記第2閉パターン候補について求めた当該第2閉パターン候補全体をアイテム集合として含むトランザクションの集合とを比較し、
    前記記録制御部は、当該追加パターンについてのトランザクションの集合が、何れかの前記第2閉パターン候補についてのトランザクションの集合と一致したことを条件に、当該第2閉パターン候補に代えて、当該第2閉パターン候補および当該追加パターンの和集合を第2閉パターン候補として前記記録部に記録し、一致しないことを条件に、当該追加パターンを第2閉パターン候補として前記記録部に追加して記録し、
    前記検出部は、全ての前記追加パターンについての処理の完了に応じ、前記記録部に記録されている第2閉パターン候補の各々を第2閉パターンとして検出する
    請求項1に記載のシステム。
  6. 前記追加パターンをアイテム集合として含むトランザクションの数を取得する取得部を更に備え、
    前記記録制御部は、取得した当該トランザクションの数が予め定められた基準以上であることを条件に、第1閉パターンおよび前記追加パターンの和集合、または、前記追加パターンを、第2閉パターン候補として前記記録部に追加して記録する
    請求項5に記載のシステム。
  7. 閉パターンを検出する対象となるアイテム空間である対象アイテム空間の指定を入力する入力部と、
    前記対象アイテム空間のうち前記第1アイテム空間に含まれていないアイテムを順次前記追加アイテムとして選択する選択部と
    を更に備え、
    前記生成部は、各々の前記第1閉パターンに対して、前記選択部によって選択された追加アイテムを追加することによって前記追加パターンを生成し、
    前記検出部によって前記第2閉パターンが検出されたことに応じ、前記第2アイテム空間が前記対象アイテム空間と一致するか否かを判断する判断部を更に備え、
    前記選択部は、一致しなかったことを条件に、前記記録部に既に記録された前記第2閉パターンを次の第1閉パターンとし、当該第1閉パターンに追加する追加アイテムを選択する
    を更に備える請求項5に記載のシステム。
  8. 前記記録部は、前記第1閉パターンの各々を要素とする配列変数を記録し、
    前記配列変数の要素を先頭から順に読み出す配列アクセス部を更に備え、
    前記生成部は、読み出された要素が示す第1閉パターンに、前記追加アイテムを追加することにより前記追加パターンを生成し、
    前記記録制御部は、前記配列変数において当該第2閉パターン候補を示す要素を前記配列変数から除外し、当該追加パターンおよび前記第2閉パターン候補の和集合を示す要素、または、当該追加パターンを示す要素を、前記配列変数の末尾要素の次に追加する
    請求項5に記載のシステム。
  9. 前記生成部は、前記配列アクセス部により要素が読み出される毎に、当該要素が前記追加アイテムを含まないことを条件に、当該要素が示す第1閉パターンに前記追加アイテムを追加し、
    前記検出部は、前記配列アクセス部により読み出された要素が、前記追加アイテムを含むことを条件に、または、当該要素が配列変数の末尾要素であることを条件に、全ての前記追加パターンについての処理が完了されたと判断する
    請求項8に記載のシステム。
  10. 前記記録部は、親ノードが示すアイテム集合に他のアイテムを追加したアイテム集合を当該親ノードの子ノードとして配置した木構造を、深さ優先探索によって走査する走査順序に従って、前記第1閉パターンの各々を配列して記録する
    請求項8に記載のシステム。
  11. 前記追加パターンをアイテム集合として含むトランザクションの数を取得する取得部を更に備え、
    前記配列アクセス部は、読み出した要素が示すアイテム集合が、既に読み出された何れかの要素が示すアイテム集合であって取得されたトランザクションの数が基準以下のアイテム集合を含むことを条件に、読み出した当該要素を前記生成部に処理させずに次の要素を読み出す
    請求項8に記載のシステム。
  12. 前記履歴情報に基づいて、アイテムをインデックスとして当該アイテムを含むトランザクションの集合を求める検索用テーブルを構築する構築部を更に備え、
    前記比較部は、前記追加パターン全体を含むトランザクションの集合を、前記追加パターンに含まれる各々のアイテムをインデックスとして前記検索用テーブルからトランザクションの集合を求めることにより生成し、さらに、
    前記第1閉パターン全体を含むトランザクションの集合を、前記第1閉パターンに含まれる各々のアイテムをインデックスとして前記検索用テーブルからトランザクションの集合を求めることにより生成する
    請求項1に記載のシステム。
  13. 前記履歴情報は、少なくとも1つのウェブページを利用者に表示するトランザクション処理毎に、表示した当該ウェブページをアイテムとして記録しており、
    前記記録部は、予め定められたウェブページの組を前記第1アイテム空間として第1閉パターンを記録しており、
    前記生成部は、他のウェブページを前記追加アイテムとして前記追加パターンを生成し、
    前記検出部は、第1閉パターンおよび前記追加パターンの和集合を、前記他のウェブページを含むウェブページの組を示す第2アイテム空間における第2閉パターンとして検出する
    請求項1に記載のシステム。
  14. トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報に基づいて、トランザクションの組に共通するアイテムの最大集合である閉パターンを検出する検出方法であって、
    予め定められたアイテムの集合から構成される第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録する段階と、
    記録されている何れかの前記第1閉パターンに、前記第1アイテム空間に含まれていないアイテムである追加アイテムを追加することにより追加パターンを生成する段階と、
    前記追加パターン全体をアイテム集合中に含むトランザクションの集合と、記録されている何れかの前記第1閉パターン全体をアイテム集合中に含むトランザクションの集合とを比較する段階と、
    比較された集合が互いに一致したことを条件に、当該第1閉パターンおよび前記追加パターンの和集合を、前記第1アイテム空間に前記追加アイテムを追加した第2アイテム空間における閉パターンである第2閉パターンとして検出する段階と
    を備える検出方法。
  15. トランザクション処理の対象をアイテムとして含むアイテム集合をトランザクション毎に記録した履歴情報に基づいて、トランザクションの組に共通するアイテムの最大集合である閉パターンを検出するシステムとして、情報処理装置を機能させるプログラムであって、
    前記情報処理装置を、
    予め定められたアイテムの集合から構成される第1アイテム空間について求められた第1閉パターンを少なくとも1つ記録している記録部と、
    記録されている何れかの前記第1閉パターンに、前記第1アイテム空間に含まれていないアイテムである追加アイテムを追加することにより追加パターンを生成する生成部と、
    前記追加パターン全体をアイテム集合中に含むトランザクションの集合と、記録されている何れかの前記第1閉パターン全体をアイテム集合中に含むトランザクションの集合とを比較する比較部と、
    前記比較部により比較された集合が互いに一致したことを条件に、当該第1閉パターンおよび前記追加パターンの和集合を、前記第1アイテム空間に前記追加アイテムを追加した第2アイテム空間における閉パターンである第2閉パターンとして検出する検出部と
    して機能させるプログラム。
JP2005200293A 2005-07-08 2005-07-08 システム、検出方法およびプログラム Expired - Fee Related JP4151980B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005200293A JP4151980B2 (ja) 2005-07-08 2005-07-08 システム、検出方法およびプログラム
US11/481,208 US7584187B2 (en) 2005-07-08 2006-07-05 System, detecting method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005200293A JP4151980B2 (ja) 2005-07-08 2005-07-08 システム、検出方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2007018349A true JP2007018349A (ja) 2007-01-25
JP4151980B2 JP4151980B2 (ja) 2008-09-17

Family

ID=37619407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005200293A Expired - Fee Related JP4151980B2 (ja) 2005-07-08 2005-07-08 システム、検出方法およびプログラム

Country Status (2)

Country Link
US (1) US7584187B2 (ja)
JP (1) JP4151980B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230186A (ja) * 2008-03-19 2009-10-08 Research Organization Of Information & Systems あいまい頻出集合の探索方法及び探索装置
JP2009301154A (ja) * 2008-06-11 2009-12-24 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2012084062A (ja) * 2010-10-14 2012-04-26 Internatl Business Mach Corp <Ibm> 意味のある頻出アイテムセットを抽出するシステム、方法及びプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9563669B2 (en) 2012-06-12 2017-02-07 International Business Machines Corporation Closed itemset mining using difference update
US9110969B2 (en) * 2012-07-25 2015-08-18 Sap Se Association acceleration for transaction databases
CN104899408A (zh) * 2014-03-05 2015-09-09 孙宝文 有趣项集获取方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5813003A (en) * 1997-01-02 1998-09-22 International Business Machines Corporation Progressive method and system for CPU and I/O cost reduction for mining association rules
US6389416B1 (en) * 1999-02-19 2002-05-14 International Business Machines Corporation Depth first method for generating itemsets
US20030208488A1 (en) * 2000-09-20 2003-11-06 North Dakota State University System and method for organizing, compressing and structuring data for data mining readiness
US6990486B2 (en) * 2001-08-15 2006-01-24 International Business Machines Corporation Systems and methods for discovering fully dependent patterns
JP2003076937A (ja) 2001-09-06 2003-03-14 Shinichi Morishita 結合ルールの抽出方法、抽出システムおよび結合ルール抽出プログラム
US20030217055A1 (en) * 2002-05-20 2003-11-20 Chang-Huang Lee Efficient incremental method for data mining of a database
US7243100B2 (en) * 2003-07-30 2007-07-10 International Business Machines Corporation Methods and apparatus for mining attribute associations
US7433879B1 (en) * 2004-06-17 2008-10-07 Versata Development Group, Inc. Attribute based association rule mining
US8572233B2 (en) * 2004-07-15 2013-10-29 Hewlett-Packard Development Company, L.P. Method and system for site path evaluation using web session clustering
US7533095B2 (en) * 2005-04-19 2009-05-12 International Business Machines Corporation Data mining within a message handling system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230186A (ja) * 2008-03-19 2009-10-08 Research Organization Of Information & Systems あいまい頻出集合の探索方法及び探索装置
JP2009301154A (ja) * 2008-06-11 2009-12-24 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2012084062A (ja) * 2010-10-14 2012-04-26 Internatl Business Mach Corp <Ibm> 意味のある頻出アイテムセットを抽出するシステム、方法及びプログラム
US8954468B2 (en) 2010-10-14 2015-02-10 International Business Machines Corporation Extracting a meaningful frequent itemset

Also Published As

Publication number Publication date
JP4151980B2 (ja) 2008-09-17
US20070011162A1 (en) 2007-01-11
US7584187B2 (en) 2009-09-01

Similar Documents

Publication Publication Date Title
JP4378646B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US7346600B2 (en) Data analyzer
CA2659288C (en) System and method for detecting and analyzing pattern relationships
US8935249B2 (en) Visualization of concepts within a collection of information
KR101017016B1 (ko) 이미지 매칭에 기초한 상품 정보 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US7840556B1 (en) Managing performance of a database query
US7769771B2 (en) Searching a document using relevance feedback
US20140229476A1 (en) System for Information Discovery &amp; Organization
JP4151980B2 (ja) システム、検出方法およびプログラム
US11907659B2 (en) Item recall method and system, electronic device and readable storage medium
Dhyani et al. Big data analytics using Hadoop
JP2004178604A (ja) 情報検索装置及びその方法
EP1315103B1 (en) File search method and apparatus, and index file creation method and device
Ma et al. Measuring the coverage and redundancy of information search services on e-commerce platforms
JP2009043263A (ja) 質問分類方法およびそのシステム
Tsai et al. A change detection method for sequential patterns
CN111553765A (zh) 一种电商搜索排序方法、装置及计算设备
US20180247240A1 (en) Judgment support system and judgment support method
JP2007179161A (ja) プログラムの実行に必要なデータをデータベースから先読みするシステム
CN103597485A (zh) 模式提取装置及其方法
JP7261095B2 (ja) ビジネスマッチング支援装置、及びビジネスマッチング支援方法
JP2006201926A (ja) 類似文書検索システム、類似文書検索方法、およびプログラム
CN107844592A (zh) 一种查询元数据的方法和装置
WO2013157603A1 (ja) 検索クエリ分析装置、検索クエリ分析方法、及びコンピュータ読み取り可能な記録媒体
KR100340036B1 (ko) 사용자 프로파일을 이용한 상품정보 필터링 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080129

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080626

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080630

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees