JP5368665B2 - リンクに重み付けされたアソシエーションルールに戻って転送されるエキスパートデータベース - Google Patents

リンクに重み付けされたアソシエーションルールに戻って転送されるエキスパートデータベース Download PDF

Info

Publication number
JP5368665B2
JP5368665B2 JP2004504150A JP2004504150A JP5368665B2 JP 5368665 B2 JP5368665 B2 JP 5368665B2 JP 2004504150 A JP2004504150 A JP 2004504150A JP 2004504150 A JP2004504150 A JP 2004504150A JP 5368665 B2 JP5368665 B2 JP 5368665B2
Authority
JP
Japan
Prior art keywords
item
identifier
record
user
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004504150A
Other languages
English (en)
Other versions
JP2005525642A (ja
Inventor
ベンジャミン ホスケン
Original Assignee
マイクロソフト インターナショナル ホールディングス ビイ.ヴイ.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マイクロソフト インターナショナル ホールディングス ビイ.ヴイ. filed Critical マイクロソフト インターナショナル ホールディングス ビイ.ヴイ.
Publication of JP2005525642A publication Critical patent/JP2005525642A/ja
Application granted granted Critical
Publication of JP5368665B2 publication Critical patent/JP5368665B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Description

本発明はデータ項目のアソシエーションルールを調べるためのトランザクションデータベース情報を解析するシステム及びプロセスに関し、特に、創発的な重み付けアソシエーションルールを確立するためのトランザクションデータの強化解析を後方リンクづけ(backlinking)するシステム及び方法に関するものである。
データマイニングシステム及びデータマイニングツールは、一般的には多量の情報のデータベースに含まれるデータ内のアソシエーション(連関)関係を特定するために用いられる。例えば、ソース情報が、非連関の項目に関して導かれた商業的なトランザクションを表す場合、異なる項目間のアソシエーション関係は、正確性及び信頼性の相対度による解析によって特定されることができる。これらのアソシエーション関係は、様々な目的のために用いられ、特にトランザクションデータによってカバーされた項目の集合に関する類似顧客行動を予測することを含んでいる。実際では、製品設計のプレゼンテーション及び実体は、宣伝活動(キャンペーン)等をマーケティングするが、顧客の興味と要求を反映して効果的にあわせられる。
従来、トランザクション的な情報のデータベースからマイニング(掘り出された)関係は、一般にエキスパートデータベースと呼ばれる参照データベース内にあるアソシエーションルールとして集められる。各アソシエーションルールは、関係する項目に関して、項目間のアソシエーションの重要性又は強度を表す重みで修飾される。まとめられたアソシエーションルールの一群は、エキスパートデータベースに対してクエリーアサーション(query assertion)として表された様々な問題への解決策を提供するために用いられる。
従来では、エキスパートデータベースを介した関係性のトレースは、アソシエーションされる相対的な重みに基づいて様々な関係の枝間を区別していたのだが、クエリーは関係項目に関する非常によく相関付けられた解決集合を解くことができる。そのクエリー自身は、特定の項目、項目集合、又はエキスパートデータベース内で特定される項目に関連した属性として表される。
エキスパートデータベースを作るために用いられる知識エンジニアリングに関するマニュアル的プロセスに対して、自動化されたアソシエーションマイニング技術は、特に、評価されるデータ量が多い場合、且つマイニングされたアソシエーションの有益性が時間が経るとともにすぐに減じられる場合に好適である。しかしながら、従来の自動化アソシエーションマイニング解析技術は、様々な制限を受けている。特に、その自動化技術は、トランザクションデータ内の特定された項目数が指数的に存在する中でアソシエーションを特定する傾向がある。エキスパートデータベースに対するクエリーの実行性能は、データベースサイズの増加とともに自然に減少する。さらに、生成されたアソシエーションルールの多くは、定義されたクエリーとは関係がなく、エキスパートデータベースへアサートされるだろう同じようなクエリーとも関係がない。
別の問題は、基本的なトランザクションデータ内のバリエーションがアソシエーションに関係する質に影響を与えるかもしれないということである。トランザクションデータで特定される特定の項目の回数によって、及び巨大な集合のトランザクション内の項目の分配によって、特定されたアソシエーションの強度を定義した解析を歪めることができる。このため、自動解析によって特定された関係の定義された強度の信頼性を大きく変えることができる。
従来のシステムでは、例えば、一連の商業トランザクションを表すトランザクションデータレコード集合のアルゴリズム的処理を介してアソシエーションルールを生成する。ソースのトランザクションデータの性質に依存して、項目のアソシエーションが、ペアになった固有の項目の出現割合に基づいて最初に特定される。すなわち、この場合、トランザクションは複数の項目、項目の集合を含む。トランザクションデータレコード集合における特定項目の集合に関する出現割合は、従来では項目集合のサポートと呼ばれていた。Agrawal,Imielinski abd Swami, Proc.of the 1993 ACM SigMod Conf. On Management of Data, May 1993, pp.207-216による「巨大データベース内の項目集合間におけるアソシエーションルールのマイニング」に述べられているように、重要な項目集合を区別するために、最少のサポート閾値を確立することができる。そこで述べられているように、サポート閾値は、ビジネス上の理由から決定される統計的な有意性を表すために経験的(実験的)に選ばれる。与えられた例においては、最少のサポート閾値1%で設定される。最少の有意性よりも少ないアソシエーションを表す、サポート閾値よりも小さなサポートを持つアソシエーションルールが廃棄される。
また、生成されたエキスパートデータベースのサイズを小さくするために、Agrawal論文は構文上の制約の使用を述べている。クエリーに関して興味のある項目、それとは逆に興味の無い項目が、ルール生成において有利であることが知られている。アソシエーションルールの生成上の対応する制約は、興味に関するアソシエーションルールのみが生成され且つエキスパートデータベースに格納される結果により、トランザクションデータレコードのアルゴリズム検討において実行される。
結局、Agrawal論文は、アソシエーションルールの強度の信頼性をアサーションする技術を述べている。その技術は、クエリーに関する解集合を発見することにおいて、解経路のルール強度の妥当性がトランザクションデータ集合内のアソシエーションルールの表示に基づいて正規化されることができることを想定している。Agrawalによって表されているが、所与のアソシエーションルールに関する信頼度の従来の計算は、アソシエーションルールをサポートするソーストランザクションデータレコードのほんの僅かにすぎない。つまり、アソシエーションルールX→I(ここで、Xはトランザクションデータ集合T内で特定された項目集合で、IはXに無い単一の項目である)の信頼度Cは、X→IのサポートをXのサポートで割った比である。
生成されたアソシエーションルールをエキスパートデータベースに含められるために制限する閾値として、Agrawal論文で用いられたアソシエーションルールに関する定義された信頼度を使用することができる。幾つかの定義された最小値を超える信頼レベルによるアソシエーションルールは、実際、最小の信頼であると考えられている。閾値の信頼レベルの定義は、超過したルールの統計的有意性の全体的評価に基づいて、再度、実験的に行う。
最小の関連度及び信頼度のアソシエーションルールのために定義されたサポート及び信頼値が、慣例的に、エキスパートデータベース内の対応するルールともに格納される。エキスパートデータベースへの次のクエリー評価は、これらのサポート及び信頼値を一部用いることができ、最適解集合を特定する。Obataなどに発行された米国特許6,272,478は、アソシエーションルールに関する割当てられた評価値の全般的に類似した応用例を述べている。詳しくは、コスト及び販売値がアソシエーションルールへの属性として割当てられ、アソシエーションルールの最適集合の定義における付加的な基準の評価を可能にし、用いられたクエリーに関する解集合に到達するよう使用される。これらの付加的な基準の評価は、例えば、収益を最適化する解集合を選択できるようにする。複数の項目がアソシエーションルールの前後の用語で特定される場合、包含される項目集合に対応する数学公式がアソシエーションルールの評価で用いられる。評価値及び公式はエキスパートデータベースで提供される項目辞書に格納されることができるが、その評価値及び公式は、サポート及び信頼値の独立性を引き出す。
定義された最小の関連度及び信頼度を有するアソシエーションによるエキスパートデータベースの生成は、広範囲なクエリーアサーションが少なくとも最小の関連度及び信頼度に等しい解集合へ適切に解決されるようにする。到達した解集合の最小の関連度及び信頼度を引き上げ且つ変化させるのに、解集合を定義することに利用されるアソシエーションルールのサポート及び信頼値の進歩的な評価を用いることができる。さらに、独立した評価基準の付加的な考察は、用いられたクエリーの最後の解集合を定義するのに目標とされた要因を考慮するようにしている。
トランザクション項目に関連付けられ、付加的で別々に与えられた情報の評価は、生成されたアソシエーションルール集合が特定の目的のために評価されることができるようにする。しかしながら、生成された任意の解集合の正確さ且つ信頼度は、全体として、基本のアソシエーションルールの正確さ且つ信頼度に大きく制限されたままである。従来どおりに由来するアソシエーションルールによっては、有意義な方法においても、トランザクションデータに潜在的に反映され、且つ従来のマイニング技術によって用いられた最小のサポート及び信頼度に適合する関係を実質的に区別することができない。したがって、従来では、生成されたエキスパートデータベースは、このデータベースから派生され得る情報の質及び範囲に制限されていた。
したがって、従来のマイニング技術によって用いられた最小のサポート及び信頼度の制限を超えて、良く識別された正確さ及び信頼度の程度をサポートするエキスパートデータベースの自動生成を提供する必要性がある。
(発明の概要)
したがって、本発明の全体の目的は、正確さ及び信頼度が高く、良く識別された程度で、決定プロセスをサポートするために用いることができるエキスパートデータベースを生成する効果的なシステム及び方法を提供することである。
これは、エキスパートデータベース項目のアソシエーションルールを確立する基礎として、参照としての項目と、対応する“エキスパートな”ユーザによって特定された関係項目との間の前方リンクのアソシエーションを最初に定義するために、トランザクションデータレコードの評価を提供するシステム及び方法による本発明で達成される。次に、前方リンクアソシエーションは、参照項目と関係項目との間の後方リンクアソシエーションルールを特定するために評価される。後方にリンク付けされたアソシエーションの深さ及び強度を反映する個々の後方リンクアソシエーションルールと一致する後方リンクの重みが特定され、且つ前方リンクアソシエーションに関連付けられ、エキスパートデータベースに集められたアソシエーションルールを引き続いて評価するための強化基礎を提供する。
本発明の優位性というのは、エキスパートデータベースを構築するために用いられたアソシエーションルールが、エキスパートデータベースへのクエリーから得られる解集合において、信頼度及び正確さのより大きな程度を提供するということにある。エキスパートは、参照前項目を基にして特定されることが好ましく、高い予測で有意性のあるアソシエーションを直接特定できるようにする。
本発明の別の優位性というのは、関連ある“エキスパートな”ユーザの母集団のつながりを介して後方にリンク付けされた関係の特定が、高い予測で有意性のあるアソシエーションを直接強化できるようにすることにある。アソシエーションの関連強化は、エキスパートデータベースの対応するアソシエーションルールの重み予測を増加させるために用いられる。
本発明のさらに別の優位性は、エキスパートデータベースのためのアソシエーションルールの集合を生成するシステム及びプロセスが、解析パラメータの確立された集合に基づいて自動的であるということにある。好ましくは、これら解析パラメータは、ソーストランザクションデータレコード、処理された項目の性質、及びトランザクションデータレコードのプール(pool)で特定されたユーザ数に関するあまりクリティカルでない経験的(実験的)検討に大きく基づいた詳細な解析プロシジャーにとっての閾値を設定する。
(発明の詳細な説明)
本発明は、エキスパートデータベースをコンピュータを介して生成するために用いられ、トランザクションデータレコードの集まりから自動化されたプロセスが動作する。これらのソースレコードは、商業的なトランザクションを意味していたり又は関係するのが普通であるが、もっと一般的には、個々の項目のアイデンティティに対してユーザによってとられる定量化できる行動の明細である。本発明の好ましい実施例のために、トランザクションデータレコードは、様々なマルチメディアコンテンツをサンプリングし、そのコンテンツの見直しや推奨を読み出し、及びそのコンテンツを取得するなど、ユーザに接続されたネットワークによる電子商取引(eコマース)を反映する。
図1に示すように、本発明の典型的且つ好ましいアプリケーション環境10は、従来のオーディオのトラック及びアルバムなどのマルチメディアコンテンツの閲覧及び取得をサポートする電子商取引サイト12を含む。電子商取引サイト12は、引用でここに組み入れられるBenjamin E.Hoskenによる共同未処理出願No.09/616,474の“自動化された代替的コンテンツ推奨を生成する方法及びシステム”に記載され、且つ本出願の譲受人に割当てられているような、コンピュータで自動化されたコンテンツ推奨アプリケーションを実行するネットワークサーバシステムとして実行されるのが好ましい。
そのコンテンツ推奨システムは、クライアントコンピュータシステム14を動作させるのだが、ユーザがインターネットなどの通信ネットワーク16を介して接続し、電子商取引サイト12を介してアクセス可能なコンテンツストア18に直接的に又は間接的に格納されたマルチメディアコンテンツを閲覧することができるようにする。本発明の好ましい実施例において、コンテンツストア18は、見直し、背景情報や履歴情報、アートワーク(artwork)、サンプルクリップ、及びオーディオコンテンツの取得可能なコピーを含む。
ユーザに閲覧するトランザクションアクティビティは、トランザクションデータベース20へリアルタイムで取り込まれる(キャプチャーされる)のが普通である。キャプチャーされたトランザクションは、特定のコンテンツに関係したリンクのクリッキングから範囲を定め、コンテンツサンプルをストリーミングするために聴き、そして電子商取引コンテンツ取得を完了させるユーザによってとられた特定可能な行動に関係する任意のコンテンツに反映することができる。一般的にこれらアクティビティの多くの認識に関して、付帯的なユーザの興味である代替的コンテンツを提案するために、コンテンツ推奨アプリケーションを含む。エキスパートデータベース22のアソシエーションルールへ適用可能なクエリーを確立するために、これらの推奨はユーザ行動を解析することによって生成されるのが好ましい。次に、エキスパートデータベース22に対するクエリーの評価によって特定された代替コンテンツ推奨の解集合が、ユーザへ提示される。
本発明によれば、エキスパートデータベース22は、電子商取引サイト12の操作で蓄積されたトランザクションデータレコードの自動解析を介して生成される。トランザクションデータレコードは、ポータル(入口)ウェッブサイト、及び従来の小口やメイルオーダ、及び大量コンテンツや情報や商品配送サイトなど、同様なトランザクション情報の他のソース源から等しく得られる。
トランザクションデータレコードは、典型的にはバッチでデータマイニングサーバシステム26に関連したデータストア24に転送される。データマイニングサーバシステム26で実行されたデータマイニングアプリケーションプログラムによる解析実行後、新たなエキスパートデータベース22を構築するアソシエーションルールの集合が生成され、電子商取引サイト12に戻される。
図2に示すようなシステムレベルプロセス30でさらに詳細にされるが、トランザクションレコードデータは、解析プログラムによってアクセスするために、データストア24内のトランザクションデータベース32に格納されるのが好ましい。本発明によれば、解析プログラム34は、後方リンキング解析を実行し、トランザクションデータレコードに特定された活性可能な項目間における実質的な関係値のアソシエーションルールを識別する。後方リンキング解析34のゴールは、処理された項目間の変化した関係を表すアソシエーションルールを生成することである。それは、後方リンキング解析が、単に可能性のある結果でなく、むしろトランザクションデータレコードの単なる機械的な解析に対して、実証性の高い項目関係であってさらにエキスパートを表すアソシエーションルールを識別することを求めるアソシエーションルールを見分けるということである。これによって生じたエキスパートデータベース36は、推奨生成システム38の動作のより信頼できる基礎を提供することができる。認証され且つ実証的な関係を識別する集中と拡散は、後方リンキング解析プログラム34に提供された解析パラメータによって定義されるのが好ましい。
後方リンキング解析の好ましいプロセス40が図3に示される。トランザクションデータレコードは一致するか、又はテーブル1に詳細に示した好ましいユーザトランザクションデータレコード等の整合性のあるデータ表現形式に合致されるのが一般的である。

テーブル1
ユーザトランザクションレコード
ユーザトランザクション{
ユーザID //固有のユーザ/エンティティの識別子
項目ID //固有の項目の識別子
アクションID //例えば、取得、ダウンロード、マウスクリック
ユーザ識別子のユーザIDは典型的には個人に割当てられ、電子商取引サイト12によってエンティティを処理するが、興味のあるエンティティを処理する集合的な識別子を表すこともできる。項目識別子の項目IDは電子商取引サイト12と同様に、典型的には個々の処理可能な項目の識別子として割当てられる。項目自体は、デジタル的に又は物理的に分配された、ある特定のコンテンツや情報、又は製造番号と一致する。あるいはまた、トランザクションデータレコードによって特定された項目は、アルバムのコンテンツトラックやアーティストの属性などの集合的な項目の要素を表すことができる。
テーブル2に詳細に示されるように、項目の仕様レコードはトランザクションデータレコードに関連して与えられるのが好ましく、項目属性を特定の項目(項目ID)と関係づける。項目の要素を特定するのに加え、トランザクションデータレコードで特定される項目に関してとられたアクション間の関係を付加的に見分けるため、項目属性をその後に用いる。
最後に、項目及びとられたユーザの特定アクションを明示するために、アクション識別子のアクションIDが用いられる。アクションの特質は、電子商取引サイト12によってあらわされるアクション可能な項目の特質によって左右されるだろう。電子商取引サイト12の目的が、代替のコンテンツの推奨をもたらすことにある場合、興味のあるアクションがコンテンツレビュー及び背景情報の閲覧、グラフィック及びアートに関連したコンテンツを見ること、コンテンツ及びコンテンツ例のダウンロード、並びにコンテンツ購入を含んでいることが好ましい。

テーブル2
項目の仕様レコード
項目{
項目ID //固有の項目の識別子
記述 //項目のテキスト記述
属性_1…属性_N /項目
分類する/限定する
ユーザのトランザクションデータレコードからユーザ項目データ集合42が生成され、テーブル3に詳細に示されるように、ユーザ項目レコードの形式で表されるのが好ましい。累積的な重み値が、ユーザの各固有な組合わせ及びトランザクションデータレコードで特定される項目のために定義される。

テーブル3
関連レコードに重みづけされたユーザ項目
ユーザ項目{
ユーザID //固有のユーザ/エンティティの識別子
項目ID //固有の項目の識別子
重み //累積的に計算された重み値
好ましくは、各トランザクションデータレコードから与えられた重み値は、トランザクションアクションIDと、付加的な基本_重みとの関係を定義する、アクション/基本_重みトランザクションテーブルから定義され、ルール値によって特定されたコンピュータ関数のアプリケーションに従う。テーブル4に、好ましいアクション/重みトランザクションレコードの詳細を示した。

テーブル4
アクション/基本−重みトランザクションレコード
アクション重みトランザクション{
アクションID //例えば、購入,ダウンロード,マウス−クリック
ルール //定義された計算関数
基本_重み //クリック=0.1,プレイ=0.25,購入=1.0
経験的に割当てられた基本_重み、及びルールを用いて、アクション/重みトランザクションレコードを生成するのが好ましい。本発明の好ましい実施例では、基本_重み値が0と1の間の範囲にあり、且つ対応するアクションの同様の意味を表すよう割当てられる。この結果、コンテンツの電子購入をサポートする電子商取引サイト12のために、アクション可能なユーザのアクティビティが前記範囲を超えて配信される。
例えば、コンテンツのレビューページの検索を閲覧することは、基本_重み値が低く割当てられるが、コンテンツの実際の購入は、基本_重み値が最大に割当てられる。
ユーザトランザクションデータレコードの前進処理がテーブル5に表された擬似コードのプロシジャと矛盾させないことによって、ユーザ項目のデータ集合が生成されるようにするのが好ましい。本プロシジャはユーザトランザクションデータレコードを統合するために機能し、ユーザ及び項目の各固有の組合わせに関する最終的で累積的な重みを生成する。

テーブル5
ユーザ項目の重み付けされた関連性の生成
ユーザトランザクションにおける各トランザクションT{
T.項目ID及びT.ユーザIDを用いてユーザ項目のUIを検索
アクション重みトランザクションのアクションIDを検索
ルール関数を適用し、且つ新たな累積的重みWを生成
UIレコードを重みWで更新し又は挿入する
プロシジャの実行に適用されるルール関数は、単純又は複雑で、項目及びアクションの特質の評価に基づいて経験的に設定される。最も単純なケースでは、ルールが線形の加算関数を定義する。より複雑なルールは、実際の購入などの異なる特定アクションに対して、他のアクションに比例して重み属性部分に関する上限値を定義する。本発明の好ましい実施例を参照すると、ルール関数は、特定の音楽アーティストに関与するアクションに割当てられる。蓄積された重みWに対する現在のアクションの寄与は、ユーザによって購入された音楽コンテンツトラック総数を乗じ、さらにアクションの基本_重み値を乗じた換算(スケーリング)定数kと等しいものとして定義される。
より複雑なルールは、ユーザによってとられたその後の行動に基づくアクションを選択的に再評価することを伴うことができる。例えば、ユーザ行動が音楽コンテンツトラックをサンプリングし購入することの両方を含む場合、サンプリングアクションへ属性づけることができる重みの寄与が割り引かれる。実行チケットが購入される場合、ユーザによって購入された音楽コンテンツトラック総数による重みの寄与は、大きな換算(スケーリング)定数k1を用いることによって増やされる。
本発明にとって、ユーザ項目のデータ集合の異なる要素に関する重み値の累積は、本来のトランザクションデータレコードに表れたユーザの共通性から“エキスパートな”ユーザ集合を見分けるための正確な基礎を提供する。基本_重み値及び割当てられたルール関数は、一般的には、ユーザ行為の相対的な意味を興味のある究極の関連ルールへとあらわさなければならないが、基本_重み値及びルール関数は、定義された共通的な重みに極端に小さな個々の相違を生成する必要はない。むしろ、集合的な項目に対して累積された広範な重み値の範囲は、要望された“エキスパート”ユーザの集合を見分けるための正確な基礎を提供することができる。特に本発明の好ましい実施例において、様々なアーティストによる仕事の集まりを表した項目に対する重みの累積は、代替コンテンツの推奨を提供する究極の目的にとって、異なるアーティストに関する“エキスパート”ユーザを見分けるのに十分である。
次に、ユーザ項目のデータ集合の前方リンク解析44が実行される。この前方リンク解析は、テーブル6に詳細に示されるような、前方リンクデータの構造表現を記憶する前方リンクデータレコードを用いるのが好ましい。

テーブル6
前方リンク レコード
前方リンク{
項目ID //参照項目の識別子
項目IDRel //関係項目の識別子
カウント //関連のサポートカウンタ
前方リンクデータレコードは、テーブル7に表した擬似コードのプロシジャと整合したユーザ項目データレコードの項目リンク解析を実行することを介して生成される。この前方リンク生成プロシジャは、異なる項目に関するユーザ“エキスパート”をまず識別するように作用し、次に、項目に関連したユーザ項目のデータ集合のために、これらユーザ“エキスパート”によるサポートを特定する。

テーブル7
前方リンクの生成
For each I.itemID in Items I
Look up top A userID from UserItems UI who have
UI.itemID==I.itemID and
UI.weight>Weight B
For each user U in top A userID Ordered by UI.weight
For each UI.userItem for U.userID
Look Up ForwardLinks FL where
I.itemID==FL.itemID and
UI.itemID==FL.itemIDRel
If found
Update ForwardLinks
Set FL.count=FL.count+1
Else
Insert into ForwardLinks
(I.itemID,UI.itemID,1)
End If
End For
End For
End For
Delete from ForwardLinks all records where
FL.count<count C //閾値が前方リンクを刈り込む
前方リンク生成プロシジャにおいて、指定された項目に関する“エキスパート”ユーザの集合が、その項目に関する最も認識されたアクティビティを有するユーザを特定することによってまず定義されるのが好ましい。現在の項目の累積的な重み値によってトップAのユーザがユーザ項目テーブルから選択される。好ましくは、トップAのユーザの選択は、後方リンキング解析プロセス40への解析パラメータとして与えられるエキスパートの閾値の重みB値の仕様に基づいて実行される。
経験的(実験的)に定義された30のトップA値が、本発明の好ましい実施例において良好な動作結果をもたらす一方で、目標とするトップA値は、一般のケースにおけるユーザ個体数の比率として選択されるのが好ましい。この比率は、ユーザ個体数に関連した重み値の分配に関する統計解析を通じて、又はデータベースを生成するのに用いられるユーザ個体数の比率を段々に増加する間に究極に生成されたエキスパートデータベースの質に関する連続した評価によって、定義される。しかしながら、用いられる目標比率は、ユーザ個体数の50%より少ないのが好ましく、且つ典型的には任意の所与の項目に関しては30%より少ないだろう。トランザクションデータレコードにあらわれた情報の特定の性質に左右されるのだが、項目ごとの基礎でユーザ個体数の10%以下をあらわす、“エキスパート”ユーザの部分個体数は、本発明によればエキスパートデータベース36の最終生成のために堅牢(ロバスト)な基礎を提供することができる。
次に、前方リンク生成プロシジャは、“エキスパート”ユーザのユーザ項目データ集合内に生じる参照/関係の項目の一組に関するサポートカウントを定義する。サポートカウントのカウント値は、参照項目に関する“エキスパート”ユーザの部分個体数が所与の関係項目に関するトランザクションを実行した項目数として定義される。参照/関係の項目の一組、及び個々のサポートカウント値は、前方リンクレコードテーブルで累積される。サポートカウントが累積されると、最小のサポート閾値要求が割当てられる。
定義された最小サポート閾値よりも小さなサポートカウントを有する前方リンクデータレコードは、前方リンクレコードテーブルから除去される。この最小サポート閾値要求は、後方リンキング解析プロセス40への解析パラメータとして与えられるが、実際には“エキスパート”ユーザの共通によって、前方リンクされた項目とは関係のない最小同意レベルを定義する。好ましい最小サポート閾値は、2つのカウントである。経験的(実験的)に設定される固定の最小サポート閾値をより高めにして用いることができるが、好ましくは、最小サポート閾値は、各参照項目に関して特定された“エキスパート”ユーザのトップA数に適応して準拠する。この各参照項目は固定制限され、参照項目の総数の考慮に基づいて実験的(経験的)に設定される。このため、例えば、10,000個の項目カタログにとっての最小サポート閾値制限は、少なくとも100ユーザの“エキスパート”な部分個体数のために500で設定される。参照項目に関するトップAの“エキスパート”なユーザ部分個体数が100より少ない場合、最小サポート閾値制限は、2つの好ましい最小サポートカウント制限を比例配分降下して減少させる。図4は、前方リンクプロシジャによって生成されたデータ構造60の全体図を示している。データ構造60は、項目リンクがサポートカウントに関連した項目によって定義されるリンク型ノード構造である。
次に、前方リンクデータ構造60の後方リンク解析46が実行される。広報リンク解析は、好ましくは、テーブル8に詳細に示された形式の後方リンクデータレコードを生成するため、前方リンクデータテーブルを超えて作用する。

テーブル8
後方リンク レコード
後方リンク{
項目ID //参照項目の識別子
項目IDRel //関係項目の識別子
強さ //関連の距離行列
深さ //ノードの横断カウント
後方リンクデータレコードは、テーブル9に示された擬似コードプロシジャに整合する後方リンク解析の実行を通して生成される。この後方リンク生成プロシジャは、前方リンク解析を介して通常は無関係な項目間に存在し得る関係を強化することを特定し且つ定量化するために機能する。実際、後方リンク解析は、異なる“エキスパート”ユーザの部分個体数によって少なくとも推論で容認される項目間の関係を特定するために機能する。

テーブル9
後方リンクの生成
For each I.itemID in Items I{
Do a depth-first search over ForwardLinks FL
Looking for I.itemID==FL.itemIDRel
If found
Insert into BackLinks
(I.itemID,FL.itemID,func(FL.count),depth)
Break depth-first search
End If
While the search depth<depth D
End For
深さ優先探索(depth-first search)は、好ましくは、参照項目を連続して特定するために、項目仕様テーブルによって提供される項目カタログを使って、前方リンクデータテーブルのレコードを超えて実行される。深さ優先探索は、再帰(リカージョン)深さの制限Dを受けるが、項目に関係した前方リンクとしての枝根幹(branch root)参照項目を特定する第1の前方リンクレコードを識別するために各前方リンク枝(branch)を下っていく。深さ制限のD値は、後方リンキング解析プロセス40への別の解析パラメータとして提供されるのが好ましい。枝の深さ優先探索は、後方リンクが見つかったときはつねに終了する。枝のノードを下って選択された枝根幹ノードの以降の連続において、深さ制限のカウントD内であれば、枝における次の可能性としての後方リンクが発見されるだろう。後方リンクが見つかる場合、参照/関係の項目の一組を含む後方リンクデータレコード、計算された関連強さの値、及び見つかった前方リンクデータレコードの関連ノードのネットワーク深さが、後方リンクデータテーブルに記憶される。
本発明によれば、見つかった後方リンクは、前方リンクの参照/関係の項目の意味を強化するものとして認識される。さらに本発明は、狭義としては、関連した“エキスパート”ユーザの部分個体数の系統を通じて累進的に大きな程度の容認をあらわす後方リンクが関連した枝根幹ノードを、広義としては、後方リンクの意味を認識する。したがって、エキスパートデータベース36の有効性への後方リンクの意味は、後方リンクの増加した関連ノード深さを減じるよう期待される。それゆえ、深さ制限D値のために大きな値を用いることは、特に利益となると信じられていない。しかしながら、深さ制限D値を増やすことは、解析処理時間を増加することになる。本発明の好ましい実施例のために、度を超えて大きなD値は避けられるべきである。好ましくは、深さ制限カウントDが2〜8の範囲にあり、生成されたエキスパートデータベース36の有効性とリンク解析処理時間との間の合理的なバランスをもたらすために値4が実験的にみつけられるだろう。
各深さ優先探索の間、深さの値が選択されたルート(根幹)ノードに関連して定義される。後方リンク関係による典型的な前方リンク型ノード構造70が、図5に示されている。項目Aをあらわすノードより開始する、構造70の深さ優先探索から発見される後方リンク関係は、1、2、及び3の個々のノード深さで、項目B,F、及びJを含む。項目C及びDへの枝根幹の進行において、深さ1の個々の後方リンクが項目H及びIに関して見つけられる。
バックリンクに関連した強さパラメータは、バックリンクのサポートカウント、言い換えれば、バックリンクを確立する端末のフォワードリンクデータレコードのカウントをサポートする機能として計算される。好ましくは、この強さパラメータは、ユーザプール(pool)におけるルート前方リンク“エキスパート”ユーザの普及の機能として、“エキスパート”ユーザによるバックリンクによって特定された関係のサポートの比率を反映する。したがって、本発明の好ましい実施例にとって、この強さパラメータは、次のように計算処理される。
Figure 0005368665
ここで、mは経験的(実験的)な換算(スケーリング)定数で、CountBLはバックリンクサポートカウント、ExpertsBLはバックリンク項目関係において“エキスパート”であるユーザ数であり、ExpertsRFLは関連の枝根幹前方リンク項目関係において“エキスパート”であるユーザ数であり、Usersはトランザクションデータレコードのプールにおいて特定されるユーザ数である。バックリンクのために計算される強さ値は、全体的には図6で示されるような、対応するバックリンクレコードに記憶される。
次に、バックリンクレコードは、自己参照の出現を除去するために評価される。自己参照は、参照及び関係付けられた項目の組が同じ項目を参照する場合に出現する。好ましくは、自己参照は、テーブル10に示された擬似コードプロシジャに整合した解析動作において除去される。

テーブル10
自己参照の移動
後方リンクの各リンクBL{
BL.項目ID ==BL.項目IDRel場合 //それは自己参照である
後方リンクからBLを削除
最後に、エキスパートデータベース36をあらわす関係ルールが、前方リンクデータレコードによって特定された参照/関係の項目の一組に対応して生成され、且つテーブル11に詳細に示された形式の関連ルールレコードに記憶される。

テーブル11
関連ルール レコード
関連ルール{
項目ID //参照項目の識別子
項目IDRel //関係項目の識別子
カウント //関連のサポートカウンタ
信頼度 //計算されたルールの信頼行列
強さ //関連の距離行列
深さ //ノードの横断カウント
好ましくは、生成された関連ルールは、対応する前方リンクデータレコードからのサポートカウント、及びオプション的に計算された信頼値を前方に運ぶ。本発明の好ましい実施例のために、従来の方法で必要とされるように信頼値を事前計算し且つ正規化することができる。例えば、参照項目を含む関連の総数に対する参照/関係の項目の一組のためのサポート比率として信頼値を計算することができる。その信頼値は関連ルールのために事前計算されない場合、以降の計算を許可するために関連ルールレコードに充分な情報が含まれる。
本発明によれば、関連ルールレコードもまた、計算された信頼値の要素として、又は前記強さ値及び深さ値から計算された派生値として、関連した参照/関係の項目の一組のための強さ値及び深さ値を直接的に含む。強さ及び深さの値の直接的な包含は、柔軟なエキスパートデータベース36の利用を可能にする。事前に計算された信頼値に強さ及び深さ値を組み込むことは、エキスパートデータベースの従来の使用に殆ど整合するエキスパートデータベース36の生成が行えるようにする。強さ及び深さ値に関して組み合わされた値を含むことは、強さ及び深さの値の有効性を失うことなく使いやすい行列を提供する。
本発明によれば、参照/関係の項目に関連する他に存在する信頼度は、対応するバックリンクの強さ及び深さの逆数によって増加される。強さ及び深さの値の中間として、その深さ値はより信頼のある意味ある要因であるものとして認識される。バックリンクのために定義される強さ値は、トランザクションデータレコードのプールにおいて特定されるユーザ数に高く影響されるものとして認識される。さらに、この強さ及び深さの値による信頼値に対する全体の寄与は、エキスパートデータベース36を通して関連付けられる項目の基本的性質に依存するだろう。項目関連における信頼への寄与は、以下のように定義される。
Figure 0005368665
ここで、p及びqは、経験的(実験的)な換算(スケーリング)定数である。
このように、正確且つ信頼性の程度をうまくしかも高度に見分けながら決定プロセスをサポートするために用いられることが可能なエキスパートデータベースを生成する効果的なシステム及び方法を述べてきた。前述したような本発明の好ましい実施例の記載において、開示された実施例の多くの修正及び変形は、本技術分野の当業者であれば容易に明らかになるだろう。したがって、付随的な特許請求の範囲の見地からすると、前述した詳細な実施形態以外の方法での実施も含まれることが理解されるべきである。
図1は、本発明の実施のための好ましい環境を示すネットワーク図である。 図2は、本発明の好ましい実施例に従うエキスパートデータベースの生成及び使用を詳細にするブロック図である。 図3は、本発明の好ましい実施例に従うエキスパートデータベースを生成する好ましいプロセスのフロー図である。 図4は、本発明の好ましい実施例に従うユーザ項目集合間の関係によって定義された前方リンク構造を表すノードネットワーク図である。 図5は、本発明の好ましい実施例に従う項目アソシエーション変化させる基礎としての後方リンクの特定をさらに詳細にする図4のノードネットワーク図である。 図6は、本発明の好ましい実施例に従って生成されたエキスパートデータベースのイラスト的な表示を提供する。

Claims (12)

  1. 推奨コンテンツを作成するコンテンツ推奨システムによってクエリーされるエキスパートデータベースを生成する方法であって、前記エキスパートデータベースは、アソシエーションルールレコードを有し、前記アソシエーションルールレコードは、項目集合内のある項目に対してユーザ集合内のあるユーザによって実行されたアクションを特定させるトランザクションデータレコードを有するトランザクションデータベースを解析することにより生成され、前記項目集合は、項目の識別子を含む項目の仕様レコードを有する項目仕様テーブルにより定義され、前記トランザクションデータレコードの各々は、第1のユーザ識別子、第1の項目の識別子、及びアクション識別子を含み、
    前記コンテンツ推奨システムが、
    (1)前記トランザクションデータレコードに基づいて、前記第1のユーザ識別子と同じ値を有する第2のユーザ識別子、前記第1の項目の識別子と同じ値を有する第2の項目の識別子、およびある項目に対してあるユーザによって実行されたアクションの重み値である基本重みの累積値を含むユーザ項目レコードを生成し、前記累積値が所定の閾値より大きいエキスパートユーザを表す前記第2のユーザ識別子を特定する処理であって、前記基本重みは、前記アクション識別子ごとに事前に割当てられた値であ特定する処理と、
    (2)前記項目仕様テーブルにおける項目ごとに、前記第2の項目の識別子が前記項目仕様テーブルの項目の識別子と同じ値を有する前記ユーザ項目レコードから、前記エキスパートユーザを表す前記第2のユーザ識別子を抽出し前記抽出した第2のユーザ識別子ごとに、前記項目仕様テーブルの項目の識別子と、前記抽出した第2のユーザ識別子に係る前記第2の項目の識別子との関係を特定させる前方リンクレコードを生成する処理であって、前記前方リンクレコードは、前記項目仕様テーブルの項目の識別子と同じ値を有する第1の参照項目の識別子、前記第2の項目の識別子と同じ値を有する第1の関係項目の識別子、および初期値が1である第1のサポートカウントを含み、前記前方リンクレコードを生成する際、前記第1の参照項目の識別子と前記第1の関係項目の識別子とにより特定される前記前方リンクレコードがすでに生成されている場合は、前記特定される前方リンクレコードの前記第1のサポートカウントをインクリメントして更新する、生成する処理と、
    (3)前記項目仕様テーブルにおける項目ごとに、前記第1の関係項目の識別子に対して所定の深さの制限内で深さ優先探索を実行して、前記項目仕様テーブルの項目の識別子と前記第1の関係項目の識別子とが等しいと判定された場合、前記判定された項目仕様テーブルの項目の識別子と同じ値を有する第2の参照項目の識別子、前記判定された第1の関係項目の識別子に係る前記第1の参照項目の識別子と同じ値を有する第2の関係項目の識別子、前記判定された第1の関係項目の識別子に係る前記第1のサポートカウントに基づいて計算される、前記第2の参照項目の識別子と前記第2の関係項目の識別子との関連の強さを表す第1の強さ値、及び前記判定された第1の関係項目の識別子に係る前記第1の参照項目の識別子に対する前記判定された第1の関係項目の識別子の深さを表す第1の深さ値を含む、前記前方リンクレコードに対応する後方リンクレコードを生成する処理と、
    (4)前記前方リンクレコードの集合及び前記後方リンクレコードの集合に基づいて、前記アソシエーションルールレコードを生成して前記エキスパートデータベースに記録する処理であって、前記アソシエーションルールレコードは、前記前方リンクレコードの集合における各前方リンクレコードに関し、前記第1の参照項目の識別子と同じ値を有する第3の参照項目の識別子、前記第1の関係項目の識別子と同じ値を有する第3の関係項目の識別子、前記第1のサポートカウントと同じ値を有する第2のサポートカウント、前記第1のサポートカウントに基づいて計算される信頼度、前記前方リンクレコードに対応する前記後方リンクレコードの前記第1の強さ値と同じ値を有する第2の強さ値、及び前記前方リンクレコードに対応する前記後方リンクレコードの前記第1の深さ値と同じ値を有する第2の深さ値を含む、記録する処理と
    を実行することを特徴とする方法。
  2. 前記所定の閾値は、前記項目仕様テーブル項目ごとに、アクションを実行したユーザ数の50%よりも少ない数が前記エキスパートユーザの数となるように設定されることを特徴とする請求項1に記載の方法。
  3. 前記前方リンクレコードの集合は、所定の閾値よりも少ない前記第1のサポートカウントを有する前方リンクレコードを含まないことを特徴とする請求項2に記載の方法。
  4. 前記後方リンクレコードの集合における各後方リンクレコードに関し、前記後方リンクレコードの信頼度は、前記第1の深さ値に逆比例することを特徴とする請求項3に記載の方法。
  5. 前記後方リンクレコードの集合における各後方リンクレコードに関し、前記後方リンクレコードの信頼度は、前記後方リンクレコードに対応する前方リンクレコードの前記第1のサポートカウントに比例することを特徴とする請求項4に記載の方法。
  6. コンピュータの実行を通してアソシエーションルールレコードを有するエキスパートデータベースを生成するシステムであって、
    (a)項目の仕様レコードの集合を記憶する第1のデータベースであって、前記項目の仕様レコードの各々は、項目の識別子を含む、第1のデータベースと、
    (b)前記第1のデータベース内のある項目に対して、ユーザ集合内のあるユーザによって実行されたアクションを特定させるトランザクションデータレコードの集合を記憶する第2のデータベースであって、前記トランザクションデータレコードの各々は、第1のユーザ識別子、第1の項目の識別子、及びアクション識別子を含む、第2のデータベースと、
    (c)前記エキスパートデータベースを記憶するために提供される第3のデータベースと、
    (d)前記第1のデータベースと前記第2のデータベースと前記第3のデータベースとに結合されたコンピュータであって、
    前記トランザクションデータレコードに基づいて、前記第1のユーザ識別子と同じ値を有する第2のユーザ識別子、前記第1の項目の識別子と同じ値を有する第2の項目の識別子、およびある項目に対してあるユーザによって実行されたアクションの重み値である基本重みの累積値を含むユーザ項目レコードを生成し、前記累積値が所定の閾値より大きいエキスパートユーザを表す前記第2のユーザ識別子を特定する処理であって、前記基本重みは、前記アクション識別子ごとに事前に割当てられた値であ特定する処理と、
    前記第1のデータベースにおける項目ごとに、前記第2の項目の識別子が前記第1のデータベースの項目の識別子と同じ値を有する前記ユーザ項目レコードから、前記エキスパートユーザを表す前記第2のユーザ識別子を抽出し前記抽出した第2のユーザ識別子ごとに、前記第1のデータベースの項目の識別子と、前記抽出した第2のユーザ識別子に係る前記第2の項目の識別子との関係を特定させる前方リンクレコードを生成する処理であって、前記前方リンクレコードは、前記第1のデータベースの項目の識別子と同じ値を有する第1の参照項目の識別子、前記第2の項目の識別子と同じ値を有する第1の関係項目の識別子、および初期値が1である第1のサポートカウントを含み、前記前方リンクレコードを生成する際、前記第1の参照項目の識別子と前記第1の関係項目の識別子とにより特定される前記前方リンクレコードがすでに生成されている場合は、前記特定される前方リンクレコードの前記第1のサポートカウントをインクリメントして更新する、生成する処理と、
    前記第1のデータベースにおける項目ごとに、前記第1の関係項目の識別子に対して所定の深さの制限内で深さ優先探索を実行して、前記第1のデータベースの項目の識別子と前記第1の関係項目の識別子とが等しいと判定された場合、前記判定された第1のデータベースの項目の識別子と同じ値を有する第2の参照項目の識別子、前記判定された第1の関係項目の識別子に係る前記第1の参照項目の識別子と同じ値を有する第2の関係項目の識別子、前記判定された第1の関係項目の識別子に係る前記第1のサポートカウントに基づいて計算される、前記第2の参照項目の識別子と前記第2の関係項目の識別子との関連の強さを表す第1の強さ値、及び前記判定された第1の関係項目の識別子に係る前記第1の参照項目の識別子に対する前記判定された第1の関係項目の識別子の深さを表す第1の深さ値を含む、前記前方リンクレコードに対応する後方リンクレコードを生成する処理と、
    前記前方リンクレコードの集合及び前記後方リンクレコードの集合に基づいて、前記前方リンクレコードの集合における各前方リンクレコードに関し、前記第1の参照項目の識別子と同じ値を有する第3の参照項目の識別子、前記第1の関係項目の識別子と同じ値を有する第3の関係項目の識別子、前記第1のサポートカウントと同じ値を有する第2のサポートカウント、前記第1のサポートカウントに基づいて計算される信頼度、前記前方リンクレコードに対応する前記後方リンクレコードの前記第1の強さ値と同じ値を有する第2の強さ値、及び前記前方リンクレコードに対応する後方リンクレコードの前記第1の深さ値と同じ値を有する第2の深さ値を含む前記アソシエーションルールレコードを生成して前記エキスパートデータベースに記録する処理と
    を実行するコンピュータと
    を備えたことを特徴とするシステム。
  7. 前記コンピュータはさらに、前記コンピュータが実行する各処理を制御する所定の解析パラメータを受信するために結合され、前記所定の解析パラメータは、
    前記ユーザ集合の何人のユーザが前記第1のデータベースの項目に関してエキスパートユーザであり得るかを定義する第1のパラメータと、
    前記第3のデータベースに含まれる前記アソシエーションルールレコードの各々に要求される最小信頼度を定義する第2のパラメータと
    を含むことを特徴とする請求項6に記載のシステム。
  8. 前記所定の閾値は、前記第1のデータベース項目ごとに、アクションを実行したユーザ数の50%よりも少ない数が前記エキスパートユーザの数となるように設定されることを特徴とする請求項6に記載のシステム。
  9. 前記前方リンクレコードの集合は、所定の閾値を超える前記第1のサポートカウントを有する前方リンクレコードを含むことを特徴とする請求項8に記載のシステム。
  10. 前記後方リンクレコードの集合における各後方リンクレコードに関し、前記後方リンクレコードの信頼度は、前記後方リンクレコードに対応する前記前方リンクレコードの前記第1のサポートカウントに比例することを特徴とする請求項9に記載のシステム。
  11. 前記後方リンクレコードの集合における各後方リンクレコードに関し、前記後方リンクレコードの信頼度は、前記第1の深さ値に逆比例することを特徴とする請求項10に記載のシステム。
  12. 前記後方リンクレコードの集合における各後方リンクレコードに関し、前記後方リンクレコードの信頼度は、前記後方リンクレコードに対応する前方リンクレコードの前記第1のサポートカウントに比例することを特徴とする請求項11に記載のシステム。
JP2004504150A 2002-05-10 2003-05-09 リンクに重み付けされたアソシエーションルールに戻って転送されるエキスパートデータベース Expired - Fee Related JP5368665B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/143,381 US6763354B2 (en) 2002-05-10 2002-05-10 Mining emergent weighted association rules utilizing backlinking reinforcement analysis
US10/143,381 2002-05-10
PCT/US2003/014884 WO2003096232A1 (en) 2002-05-10 2003-05-09 Expert database forward back link weighted association rules

Publications (2)

Publication Number Publication Date
JP2005525642A JP2005525642A (ja) 2005-08-25
JP5368665B2 true JP5368665B2 (ja) 2013-12-18

Family

ID=29400116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004504150A Expired - Fee Related JP5368665B2 (ja) 2002-05-10 2003-05-09 リンクに重み付けされたアソシエーションルールに戻って転送されるエキスパートデータベース

Country Status (8)

Country Link
US (1) US6763354B2 (ja)
EP (1) EP1508103B1 (ja)
JP (1) JP5368665B2 (ja)
AT (1) ATE557354T1 (ja)
AU (1) AU2003229030A1 (ja)
DK (1) DK1508103T3 (ja)
ES (1) ES2386540T3 (ja)
WO (1) WO2003096232A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010053991A1 (en) * 2000-03-08 2001-12-20 Bonabeau Eric W. Methods and systems for generating business models
WO2003038749A1 (en) * 2001-10-31 2003-05-08 Icosystem Corporation Method and system for implementing evolutionary algorithms
US7134082B1 (en) * 2001-12-04 2006-11-07 Louisiana Tech University Research Foundation As A Division Of The Louisiana Tech University Foundation Method and apparatus for individualizing and updating a directory of computer files
US7636709B1 (en) * 2002-10-03 2009-12-22 Teradata Us, Inc. Methods and systems for locating related reports
US7065532B2 (en) * 2002-10-31 2006-06-20 International Business Machines Corporation System and method for evaluating information aggregates by visualizing associated categories
WO2004090692A2 (en) 2003-04-04 2004-10-21 Icosystem Corporation Methods and systems for interactive evolutionary computing (iec)
US7146361B2 (en) * 2003-05-30 2006-12-05 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND)
US7243100B2 (en) * 2003-07-30 2007-07-10 International Business Machines Corporation Methods and apparatus for mining attribute associations
US7333960B2 (en) 2003-08-01 2008-02-19 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7356518B2 (en) * 2003-08-27 2008-04-08 Icosystem Corporation Methods and systems for multi-participant interactive evolutionary computing
US7707220B2 (en) * 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
EP1927058A4 (en) 2005-09-21 2011-02-02 Icosystem Corp SYSTEM AND METHOD FOR SUPPORTING THE PRODUCT DESIGN AND QUANTIFYING ACCEPTANCE
US9047269B2 (en) * 2005-10-28 2015-06-02 Openconnect Systems Incorporated Modeling interactions with a computer system
US8577732B1 (en) 2005-11-16 2013-11-05 Sprint Spectrum L.P. Method and system for providing custom background-downloads
US7711806B1 (en) 2005-11-16 2010-05-04 Sprint Spectrum L.P. Method for dynamically adjusting frequency of content transmissions to a communication device
US8095642B1 (en) 2005-11-16 2012-01-10 Sprint Spectrum L.P. Method and apparatus for dynamically adjusting frequency of background-downloads
US7668867B2 (en) 2006-03-17 2010-02-23 Microsoft Corporation Array-based discovery of media items
CA2659672A1 (en) * 2006-06-26 2008-01-03 Icosystem Corporation Methods and systems for interactive customization of avatars and other animate or inanimate items in video games
JP4240096B2 (ja) * 2006-09-21 2009-03-18 ソニー株式会社 情報処理装置および方法、プログラム並びに記録媒体
US7792816B2 (en) * 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
JP4983401B2 (ja) * 2007-05-25 2012-07-25 富士ゼロックス株式会社 情報処理装置及び制御プログラム
US8107399B2 (en) * 2007-06-08 2012-01-31 Alcatel-Lucent Usa Inc. Methods and devices for providing robust nomadic wireless mesh networks using directional antennas
US20090016355A1 (en) * 2007-07-13 2009-01-15 Moyes William A Communication network initialization using graph isomorphism
US9088615B1 (en) * 2008-07-31 2015-07-21 Pulse Secure, Llc Determining a reduced set of remediation actions for endpoint integrity
US8280899B2 (en) * 2009-10-14 2012-10-02 Microsoft Corporation Abstracting events for data mining
TW201115582A (en) * 2009-10-29 2011-05-01 Acer Inc Method for determining data correlation and data processing method for memory
AU2010202901B2 (en) * 2010-07-08 2016-04-14 Patent Analytics Holding Pty Ltd A system, method and computer program for preparing data for analysis
US8589244B2 (en) * 2011-10-05 2013-11-19 Cellco Partnership Instant, accurate, and efficient product recommendations to client endpoint
US9110969B2 (en) * 2012-07-25 2015-08-18 Sap Se Association acceleration for transaction databases
US10593003B2 (en) * 2013-03-14 2020-03-17 Securiport Llc Systems, methods and apparatuses for identifying person of interest
CN105022761B (zh) * 2014-04-30 2020-11-03 腾讯科技(深圳)有限公司 群组查找方法和装置
US10102308B1 (en) 2015-06-30 2018-10-16 Groupon, Inc. Method and apparatus for identifying related records
US10885047B2 (en) * 2016-07-01 2021-01-05 Oracle International Corporation System and method providing association rule aggregates
CN107622409B (zh) * 2016-07-15 2020-05-15 北京车慧科技有限公司 购车能力的预测方法和预测装置
JP6804763B2 (ja) * 2017-03-16 2020-12-23 国立研究開発法人情報通信研究機構 対話システム、対話装置及びそのためのコンピュータプログラム
CN111260138B (zh) * 2020-01-18 2023-05-26 湖南大学 加权和自适应并行关联规则的火电机组能耗动态优化方法
CN113033175A (zh) * 2021-04-07 2021-06-25 芜湖市标准化研究院 一种标准有效性评估方法及系统
CN112989026B (zh) * 2021-04-14 2023-08-01 华南理工大学 一种基于关联规则的文本推荐方法
CN113468245B (zh) * 2021-07-19 2023-05-05 金陵科技学院 面向轨道交通应用的动态最小支持度计算方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4719571A (en) 1986-03-05 1988-01-12 International Business Machines Corporation Algorithm for constructing tree structured classifiers
US5515534A (en) * 1992-09-29 1996-05-07 At&T Corp. Method of translating free-format data records into a normalized format based on weighted attribute variants
US5704018A (en) 1994-05-09 1997-12-30 Microsoft Corporation Generating improved belief networks
US5615341A (en) 1995-05-08 1997-03-25 International Business Machines Corporation System and method for mining generalized association rules in databases
US5794209A (en) 1995-03-31 1998-08-11 International Business Machines Corporation System and method for quickly mining association rules in databases
US5704017A (en) 1996-02-16 1997-12-30 Microsoft Corporation Collaborative filtering utilizing a belief network
US5854630A (en) * 1996-07-01 1998-12-29 Sun Microsystems, Inc. Prospective view for web backtrack
US5933818A (en) * 1997-06-02 1999-08-03 Electronic Data Systems Corporation Autonomous knowledge discovery system and method
US6282548B1 (en) 1997-06-21 2001-08-28 Alexa Internet Automatically generate and displaying metadata as supplemental information concurrently with the web page, there being no link between web page and metadata
JPH1115842A (ja) * 1997-06-24 1999-01-22 Mitsubishi Electric Corp データマイニング装置
US6061682A (en) * 1997-08-12 2000-05-09 International Business Machine Corporation Method and apparatus for mining association rules having item constraints
US5983224A (en) 1997-10-31 1999-11-09 Hitachi America, Ltd. Method and apparatus for reducing the computational requirements of K-means data clustering
US6236978B1 (en) * 1997-11-14 2001-05-22 New York University System and method for dynamic profiling of users in one-to-one applications
US6094645A (en) 1997-11-21 2000-07-25 International Business Machines Corporation Finding collective baskets and inference rules for internet or intranet mining for large data bases
US6212526B1 (en) 1997-12-02 2001-04-03 Microsoft Corporation Method for apparatus for efficient mining of classification models from databases
US6249773B1 (en) * 1998-03-26 2001-06-19 International Business Machines Corp. Electronic commerce with shopping list builder
US6049797A (en) 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes
US6324533B1 (en) * 1998-05-29 2001-11-27 International Business Machines Corporation Integrated database and data-mining system
US6240411B1 (en) 1998-06-15 2001-05-29 Exchange Applications, Inc. Integrating campaign management and data mining
US6567814B1 (en) * 1998-08-26 2003-05-20 Thinkanalytics Ltd Method and apparatus for knowledge discovery in databases
US6175830B1 (en) * 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
JP4743740B2 (ja) * 1999-07-16 2011-08-10 マイクロソフト インターナショナル ホールディングス ビー.ブイ. 自動化された代替コンテンツ推奨を作成する方法及びシステム
NL1013997C2 (nl) 1999-12-30 2001-07-03 Cons Health Entrepreneurs Bv Werkwijze voor het verzamelen en leveren van informatie.

Also Published As

Publication number Publication date
EP1508103A1 (en) 2005-02-23
DK1508103T3 (da) 2012-06-25
AU2003229030A1 (en) 2003-11-11
EP1508103A4 (en) 2008-10-29
JP2005525642A (ja) 2005-08-25
EP1508103B1 (en) 2012-05-09
WO2003096232A1 (en) 2003-11-20
US20030212651A1 (en) 2003-11-13
ES2386540T3 (es) 2012-08-22
ATE557354T1 (de) 2012-05-15
US6763354B2 (en) 2004-07-13

Similar Documents

Publication Publication Date Title
JP5368665B2 (ja) リンクに重み付けされたアソシエーションルールに戻って転送されるエキスパートデータベース
AU782052B2 (en) Method and system for researching sales effects of advertising using association analysis
US6976000B1 (en) Method and system for researching product dynamics in market baskets in conjunction with aggregate market basket properties
US7003517B1 (en) Web-based system and method for archiving and searching participant-based internet text sources for customer lead data
US6611814B1 (en) System and method for using virtual wish lists for assisting shopping over computer networks
US8055548B2 (en) System for collaborative internet competitive sales analysis
US8407104B2 (en) Catalog based price search
US8688623B2 (en) Method and system to identify a preferred domain of a plurality of domains
JP3049636B2 (ja) データ分析方法
US20020065797A1 (en) System, method and computer program for automated collaborative filtering of user data
US20030187677A1 (en) Processing user interaction data in a collaborative commerce environment
WO2010110869A1 (en) System and method for assessing marketing data
JP2003523547A (ja) データ・ウエアハウス環境で情報を視覚化する方法
WO2008121872A1 (en) Cluster-based assessment of user interests
JP2004531820A (ja) ウェブ・ページのアノテーション・システム
US20030020739A1 (en) System and method for comparing populations of entities
Yang et al. Discovery of online shopping patterns across websites
Ying et al. Research on E-commerce Data Mining and Managing Model in The Process of Farmers' Welfare Growth
Hu et al. An olam framework for web usage mining and business intelligence reporting
JP4018919B2 (ja) ディレクトリ流通管理装置及び方法
Ma et al. The development strategy of electronic commerce in China: New perspective and policy implications
Abd Wahab et al. A Brief Review on the Knowledge Management and Data Mining for Marketing Decision
Virk Improving E-Commerce Recommendations using High Utility Sequential Patterns of Historical Purchase and Click Stream Data
Desikan et al. Web mining for business computing
JP2000242626A (ja) 電子商取引履歴分析方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090706

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091001

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091008

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091106

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091207

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100105

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20100226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110127

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20110128

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110128

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110506

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110805

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110902

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130116

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130218

RD16 Notification of change of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7431

Effective date: 20130510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130626

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130726

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130731

RD15 Notification of revocation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7435

Effective date: 20130731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130913

R150 Certificate of patent or registration of utility model

Ref document number: 5368665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees