JP6494777B2 - 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス - Google Patents

端末にプッシュされるデータコンテンツを選択するための方法およびデバイス Download PDF

Info

Publication number
JP6494777B2
JP6494777B2 JP2017543954A JP2017543954A JP6494777B2 JP 6494777 B2 JP6494777 B2 JP 6494777B2 JP 2017543954 A JP2017543954 A JP 2017543954A JP 2017543954 A JP2017543954 A JP 2017543954A JP 6494777 B2 JP6494777 B2 JP 6494777B2
Authority
JP
Japan
Prior art keywords
data content
feature
user attribute
node
attribute type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017543954A
Other languages
English (en)
Other versions
JP2018511116A (ja
Inventor
磊 姜
磊 姜
勇 李
勇 李
磊 肖
磊 肖
大鵬 ▲劉▼
大鵬 ▲劉▼
▲書▼彬 ▲張▼
▲書▼彬 ▲張▼
川江 ▲羅▼
川江 ▲羅▼
▲亜▼娟 宋
▲亜▼娟 宋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2018511116A publication Critical patent/JP2018511116A/ja
Application granted granted Critical
Publication of JP6494777B2 publication Critical patent/JP6494777B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本出願は、中国の国家知識産権局に2015年4月8日に出願した「METHOD AND DEVICE FOR SELECTING DATA CONTENT TO BE PUSHED TO TERMINALS」と題した中国特許出願第201510164053.1号の優先権を主張するものであり、この中国特許出願は、参照によりその全体が本明細書に組み込まれる。
本開示は、コンピュータの技術分野に関し、特に、端末にプッシュされるデータコンテンツを選択するための方法およびデバイスに関する。
インターネット広告、ニュースコンサルティング(news consulting)、採用情報公開ウェブサイトなどの通常のテクノロジーの応用においては、サーバが、端末にデータコンテンツをプッシュする。通常のオンライン広告ビジネスにおいては、ユーザがウェブページをブラウジングするときに、サーバが、ユーザの端末にユーザに対応するオンライン広告をプッシュ(配信)し、ユーザによるオンライン広告のクリックのクリック率(つまり、CTRと略されるクリック率とも呼ばれる、オンライン広告をプッシュする回数に対する、オンライン広告がプッシュされた後にオンライン広告をクリックする回数の比)またはオンライン広告に対応する製品もしくはサービスを購入する確率などのパラメータをカウントする。パラメータは、サーバによって選択された広告コンテンツが端末のユーザの関心を得て、ユーザの要件に従うかどうかを反映することができる。サーバが特定のユーザのための広告コンテンツを選択するとき、ユーザによってクリックされ、リンクによってユーザが購入を行う広告が、できる限り選択される。
ユーザにプッシュされる、ユーザの要件により厳密に従う広告を選択するために、広告は、通常のテクノロジーにおいては、マッチモデル(match model)と併せてユーザの属性に基づいてプッシュされる。たとえば、よくあるマッチモデルは、グルーピングホットディグリー(grouping hot degree)モデル(つまり、ユーザグループが、年齢および性別などのユーザの基本属性に基づいて分けられる可能性があり、各ユーザグループの最上位のCTRがカウントされる)、論理回帰(logic regression)モデル(つまり、論理回帰モデルは、ユーザの属性、広告の基本的な品質、広告スペースの属性、ならびにユーザ、広告スペース、および広告の複合属性(cross attribute)に基づいて確立される)などを含む。多くの場合、機械学習の方法が、上述のマッチモデルで使用され、機械学習の方法においては、上述のカウントされた履歴的データが、サンプルデータとして、時折モデルに入力され、モデルの各パラメータが、機械学習によって調整され、その結果、モデルは、より新しいユーザの癖に適応し得る。マッチモデルが更新された後、サーバは、更新されたマッチモデルに基づいて、ユーザの端末にプッシュされる、ユーザに最もよく合致するデータコンテンツを選択することができる。
しかし、上述のマッチモデルに基づいてユーザの属性に合致するデータコンテンツを選択する方法が少なくとも以下の問題を有することが、研究を通じて発明者によって発見される。マッチモデルは、サンプルデータに基づいて時折オフラインでマッチモデルに対して機械学習を実行するようにして更新されるので、マッチモデルによって取得されるモデルパラメータは、サーバがマッチモデルに基づいてプッシュされるデータコンテンツを選択するときに最新の統計データに基づいておらず、したがって、サーバによって選択されたデータコンテンツとユーザとの間の相関の程度または合致の程度が低く、結果として、データコンテンツをプッシュする精度が低くなる。
このような事情に鑑みて、プッシュされるデータコンテンツを選択する精度が低いという通常のテクノロジーの技術的な問題を解決するために、端末にプッシュされるデータコンテンツを選択するための方法が、本開示の実施形態の第1の態様によって提供される。
端末にプッシュされるデータコンテンツを選択するための方法は、ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得することと、データコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを探索することであって、決定木オブジェクトのツリーノード(tree node)が、枝ノード(branch node)および葉ノードを含み、枝ノードが、ユーザ属性タイプと1対1の対応を有し、ユーザ属性タイプ内のそれぞれの特徴のセクション(characteristic section)の特徴の閾値が、ユーザ属性タイプに対応する枝ノードに記憶され、枝ノードの下位ノードが、特徴の閾値と1対1の対応を有し、葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、葉ノードに記憶される、探索することと、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内でユーザ識別子に対応する葉ノードの位置を特定することであって、特徴の値が、決定木オブジェクトの根ノードから位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する、位置を特定することと、位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの回数およびプッシュの回数に基づいて選択基準値を生成し、ユーザ識別子に対応する端末にプッシュされるデータコンテンツを選択基準値に基づいて選択することとを含む。
さらに、プッシュされるデータコンテンツを選択する精度が低いという通常のテクノロジーの技術的な問題を解決するために、端末にプッシュされるデータコンテンツを選択するためのデバイスが、本開示の実施形態の第2の態様によって提供される。
端末にプッシュされるデータコンテンツを選択するためのデバイスは、ユーザ識別子獲得モジュール、決定木獲得モジュール、葉ノード位置特定モジュール、およびデータコンテンツ選択モジュールを含む。ユーザ識別子獲得モジュールは、ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得するように構成される。決定木獲得モジュールは、データコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを探索するように構成され、決定木オブジェクトのツリーノードは、枝ノードおよび葉ノードを含み、枝ノードは、ユーザ属性タイプと1対1の対応を有し、ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値は、ユーザ属性タイプに対応する枝ノードに記憶され、枝ノードの下位ノードは、特徴の閾値と1対1の対応を有し、葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数は、葉ノードに記憶される。葉ノード位置特定モジュールは、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内でユーザ識別子に対応する葉ノードの位置を特定するように構成され、特徴の値は、決定木オブジェクトの根ノードから位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する。データコンテンツ選択モジュールは、位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの回数およびプッシュの回数に基づいて選択基準値を生成し、ユーザ識別子に対応する端末にプッシュされるデータコンテンツを選択基準値に基づいて選択するように構成される。
本開示の実施形態は、以下のような有利な効果を有する。
上述の決定木オブジェクトが、マッチモデルとして提供され、大きな選択基準値を有するデータコンテンツが、ユーザ識別子に対応する特徴の値をデータコンテンツに対応する決定木オブジェクト内の枝ノードとマッチングすることによってプッシュされるように選択され、周期的サンプリングの後に、決定木オブジェクトがサンプリングされたサンプルに基づいて機械学習によってオフラインで更新されるのではなく、上述の決定木オブジェクトが、決定木オブジェクトの論理的な構造のおかげでユーザのブラウジングの履歴に基づいてリアルタイムで更新される。つまり、ユーザ識別子に対応する特徴の値をデータコンテンツに対応する決定木オブジェクト内の枝ノートとマッチングする場合、決定木オブジェクト内の統計データは、より新しいユーザのブラウジングの履歴に帰せられ、したがって、マッチングの結果は、運用するユーザの動作の癖またはブラウジングの癖により厳密に従うことができ、それによって、プッシュされるデータコンテンツを選択する精度を高める。
本開示の実施形態または通常のテクノロジーの技術的解決策をより明瞭に示すために、以下で、実施形態または通常のテクノロジーの説明において必要とされる図面が、簡単に紹介される。明らかに、以下の説明における図面は、本開示の一部の実施形態である。当業者には、さらに、その他の図面が、いかなる創造的な努力もなしに図面に従って得られる可能性がある。
実施形態による端末にプッシュされるデータコンテンツを選択するための方法の流れ図である。 実施形態による決定木オブジェクト内のすべてのツリーノードの論理関係の図である。 実施形態による決定木オブジェクト内のすべてのツリーノードの論理関係の図である。 実施形態による決定木オブジェクト内の葉ノードに関してユーザ属性タイプを拡張するプロセスの流れ図である。 実施形態による決定木オブジェクト内の葉ノードに関してユーザ属性タイプを拡張する概略図である。 実施形態による端末にプッシュされるデータコンテンツを選択するためのデバイスの概略図である。 実施形態による、端末にプッシュされるデータコンテンツを選択するためのデバイスの概略構造図である。
以降、本開示の実施形態の技術的解決策が、本開示の実施形態の図面に関連して明瞭で完全に説明される。明らかに、説明される実施形態は、本開示の実施形態の一部であるに過ぎず、すべての実施形態ではない。創造的な努力なしに本開示の実施形態に基づいて当業者によって得られるすべてのその他の実施形態は、本開示の保護範囲内に入る。
マッチモデルがマッチモデルの不合理な設計が原因でリアルタイムで更新されないので、マッチモデルに依存してプッシュされるデータコンテンツを選択する精度が低いという通常のテクノロジーにおける技術的問題を解決するために、端末にプッシュされるデータコンテンツを選択するための方法が、実施形態によって提供される。方法は、コンピュータプログラムに依存して実行され、コンピュータプログラムは、データコンテンツが選択され、それからクライアントプログラムにプッシュされる、オンライン広告掲載プログラム、ニュースリソースアプリケーション、メール広告普及プログラム(mail advertisement popularizing program)、レジュメプッシュプログラムなどのサーバプログラムである可能性がある。コンピュータプログラムは、フォンノイマン型アーキテクチャを有するコンピュータシステム上で実行される可能性がある。コンピュータシステムは、データコンテンツが選択され、それから対応するクライアントプログラムにプッシュされる、オンライン広告掲載プログラム、ニュースリソースアプリケーション、メール広告普及プログラム、レジュメプッシュプログラムなどのサーバプログラムが実行されるサーバデバイスである可能性がある。
実施形態において、複数のデータコンテンツが、前もって上述のサーバデバイスに記憶される。たとえば、オンライン広告プッシュプログラムにおいては、オンライン広告を記憶するための広告データベースが、提供され、各オンライン広告が、1つのデータコンテンツであり、オンライン広告サービスプロバイダが、広告データベースにレコードを追加することによって広告データベースに記憶されるオンライン広告を追加する。レジュメプッシュプログラムにおいては、レジュメを記憶するためのレジュメデータベースが、提供され、ユーザは、求人ウェブサイト上でレジュメを作成し、レジュメデータベースにレジュメをアップロードすることができる。
データコンテンツを選択するプロセスは、ユーザに最もよく合致するかまたはプッシュされた後にユーザのブラウジングする可能性が最も高いデータコンテンツに関して、サーバデバイスにおいてデータコンテンツを記憶するためのデータベースを探索することを含む。実施形態においては、複数のユーザ属性タイプが、予め設定され、各属性タイプが、属性タイプに対応する特徴のセクションを与えられる。
たとえば、衣料品広告プッシュシステムにおいて、予め設定されるユーザ属性タイプは、「性別」、「年齢層」、「ブランド」などを含む可能性があり、ユーザ属性タイプ「性別」は、特徴のセクション「男性」および特徴のセクション「女性」を含む可能性があり、ユーザ属性タイプ「年齢層」は、「1970年以降」、「1980年以降」、「1990年以降」、および「2000年以降」などの特徴のセクションを含む可能性がある。特徴のセクションは、特徴の閾値によって定義される可能性があり、たとえば、特徴のセクション「男性」および「女性」は、ブール型変数によって定義される可能性があり、特徴のセクション「1970年以降」は、特徴の閾値[70, 79]によって定義される可能性がある。
データコンテンツがプッシュされる端末のユーザアカウントのユーザ属性は、上述のユーザ属性タイプに複数の特徴の値を有する可能性があり、データコンテンツを選択するプロセスは、データベース内のデータコンテンツを横断する(traverse)ことと、各データコンテンツに対応する分類された統計データを探索し、ユーザ属性の複数の特徴の値に対応する統計データを選択することと、選択された統計データに基づいて、プッシュされた後の横断されたデータコンテンツのブラウジングの可能性を推定することと、大きなブラウジングの可能性を有するデータコンテンツを、プッシュされるように選択することとを含む。
特に、図1に示されるように、端末にプッシュされるデータコンテンツを選択するための方法は、ステップS102からステップS108を含む。
ステップS102においては、ユーザ識別子が獲得され、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値が獲得される。
ユーザ識別子は、ユーザによってサーバプログラム上で登録されたユーザアカウントである可能性があり、または登録することなく普及する(popularize)ためのユーザの電子メールアドレス、IPアドレス、もしくは電話番号である可能性がある、ユーザを区別するための識別子情報である。予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値は、ログに記録されたユーザアカウントのユーザプロファイルまたはユーザの動作レコード内の属性値を抽出することによって得られる可能性がある。
たとえば、オンラインレジュメプッシュアプリケーションの応用の筋書きにおいては、アプリケーションが、2種類のユーザアカウント、すなわち、応募者のユーザおよび採用担当者のユーザを含む。応募者のユーザは、レジュメを作成することができ、作成されたデータが、オンラインレジュメプッシュアプリケーションのデータベースに記憶されるデータコンテンツであり、応募者のユーザは、通常は人である。採用担当者のユーザは、オンラインレジュメのプッシュの対象であり、通常は会社または団体である。オンラインレジュメプッシュアプリケーションのサーバプログラムは、おおかた会社によく合致するレジュメに関して、応募者のユーザによって作成された大量のレジュメを探索し、レジュメを、採用担当者のユーザユーザに対応する端末にプッシュすることができる(端末上のオンラインレジュメプッシュアプリケーションのクライアントプログラムにプッシュするか、または応募者のユーザのメールボックスに電子メールを送信する可能性がある)。会社の職員は、採用担当者のユーザとして登録するとき、予め設定されたユーザ属性タイプに基づいて会社のプロファイルを記入すべきである。
たとえば、予め設定されたユーザ属性タイプは、会社名、業種、関連地域(affiliated region)、会社の特質(enterprise quality)などを含む可能性がある。「会社名」が「A」と記入され、「業種」が「インターネット」と記入され、「関連地域」が「Shenzhen」と記入され、「会社の特質」が「国有」と記入される場合、記入された「A」、「インターネット」、「Shenzhen」、および「国有」が、それぞれ、ユーザ属性タイプ、すなわち、会社名、業種、関連地域、および会社の特質内の特徴の値である。
オンライン広告普及プログラム(online advertisement popularizing program)の応用の筋書きにおいては、大量の広告データ(映像広告、写真広告などである可能性がある)が、サーバのデータベースに記憶される。オンライン広告普及プログラムは、ウェブページ探索エンジンに基づき、ユーザ識別子は、端末のIPアドレスである可能性があり、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値は、IPアドレスに対応する探索履歴を探索することによって抽出され得る。
たとえば、予め設定されたユーザ属性タイプが「関心のある製品の種類」、「端末の位置」などを含む場合、IPアドレスに対応する探索履歴が探索される。探索履歴が「粉ミルク」、「乳母車」、「おむつ」などのキーワードを含み、ユーザ属性タイプ「関心のある製品の種類」内の特徴のセクションが「ベビー用品および子供用品」を含む場合、ユーザ属性タイプ「関心のある製品の種類」内の端末のIPアドレスに対応する特徴の値は、「ベビー用品および子供用品」である。端末のIPアドレスに対応する地理的位置が問い合わせにより「Dongguan」であり、ユーザ属性タイプ「端末の位置」内の特徴のセクションが「Guangdong省」を含む場合、ユーザ属性タイプ「端末の位置」内の端末のIPアドレスに対応する特徴の値は、「Guangdong省」である。
ステップS104においては、データコンテンツが獲得され、データコンテンツに対応する決定木オブジェクトが探索され、決定木オブジェクトのツリーノードが枝ノード(branch node)および葉ノードを含み、枝ノードがユーザ属性タイプと1対1の対応を有し、ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値がユーザ属性タイプに対応する枝ノードに記憶され、枝ノードの下位ノードが特徴の閾値と1対1の対応を有し、葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が葉ノードに記憶される。
木構造に論理的に従うデータ構造(つまり、よくあるプログラム設計言語において定義されたツリー型(Tree type))が、決定木オブジェクトを記憶するために使用される可能性がある。各データコンテンツは、1つの決定木オブジェクトに対応する。たとえば、オンライン広告プッシュプログラムにおいては、オンライン広告が作成される度に、オンライン広告識別子Aidが、オンライン広告に割り当てられ、オンライン広告識別子AidおよびAidに対応する決定木オブジェクトが、マッピングテーブルに記憶され、Aidが、マッピングテーブルのキーであり、決定木オブジェクトが、マッピングテーブルの値である。
決定木オブジェクトは、論理的には木構造である。図2に示される応用のシナリオにおいて、決定木オブジェクトは、木階層を含む。第1の階層のツリーノードは、枝ノードであり、決定木ノードの根ノードである。第2の階層のツリーノードにおいて、ツリーノード「男性」は枝ノードであり、ツリーノード「女性」は葉ノードである。第3の階層のそれぞれのツリーノードは、葉ノードである。
図2において、根ノードは、ユーザ属性タイプ「性別」に対応し、ユーザ属性タイプ「性別」内の特徴のセクション「男性」および特徴のセクション「女性」の特徴の閾値を記憶し、特徴の閾値は、ブール変数、数、または文字列によって定義され得る。
第2の階層のそれぞれのツリーノードは、根ノードの下位ノードであり、根ノードの下位ノードとしてのツリーノード「男性」は、根ノードに対応するユーザ属性タイプ「性別」内の特徴のセクション「男性」の特徴の閾値に対応し、根ノードの下位ノードとしてのツリーノード「女性」は、根ノードに対応するユーザ属性タイプ「性別」内の特徴のセクション「女性」の特徴の閾値に対応する。
第3の階層のそれぞれのツリーノードは、枝ノード「男性」の下位ノードであり、枝ノード「男性」は、ユーザ属性タイプ「学歴」に対応し、ユーザ属性タイプ「学歴」内の特徴のセクション「高卒以下」、特徴のセクション「短期大学士(2-year college degree)」、および特徴のセクション「修士以上」の特徴の閾値を記憶し、閾値は、数または文字列によって定義される可能性がある。葉ノード「高卒以下」は、ユーザ属性タイプ「学歴」内の特徴のセクション「高卒以下」の特徴の閾値に対応し、葉ノード「短期大学士」は、ユーザ属性タイプ「学歴」内の特徴のセクション「短期大学士」の特徴の閾値に対応し、葉ノード「修士以上」は、ユーザ属性タイプ「学歴」内の特徴のセクション「修士以上」の特徴の閾値に対応する。
葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、葉ノードに記憶される。たとえば、図2に示されるように、葉ノード「短期大学士」に関しては、クリックの回数(クリック)200およびプッシュの回数(インプレッション)1000が、葉ノードに記憶され、つまり、クリックの回数200およびプッシュの回数1000が、決定木オブジェクト内の葉ノード「短期大学士」に論理的に対応する。
ステップS106においては、ユーザ識別子に対応する葉ノードが、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内で位置を特定される。特徴の値は、決定木オブジェクトの根ノードから位置を特定された葉ノードまでの経路上の各枝ノードに対応する特徴のセクションの特徴の閾値に合致する。
ユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内で葉ノードの位置を特定するプロセスは、特徴のセクション内の特徴の閾値が決定木の枝ノード内の特徴の値に合致するかどうかを判定することと、枝ノードの下位ノードに移動することによって上述の動作を繰り返し実行することとを含む。
ステップS108においては、位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数が、獲得され、選択基準値が、クリックの回数およびプッシュの回数に基づいて生成され、データコンテンツが、ユーザ識別子に対応する端末にプッシュされるように選択基準値に基づいて選択される。
図2に示されるように、ユーザが出会い系サイトの登録プロフィールを記入し、「性別」が「男性」と記入され、「学歴」が「短期大学士」と記入され、「結婚歴(marital status)」が「離婚」と記入され、「年齢」が「32」と記入される場合、予め設定されたユーザ属性タイプ「性別」内のユーザのユーザ識別子の特徴の値は、「男性」であり(その他の実施形態において、特徴の値は、文字列「男性」によって表されない可能性があり、またはブール変数、数、もしくは英語文字列などのデータ形式の特徴の値によって表される可能性があり、以下同様である)、ユーザ属性タイプ「学歴」内の特徴の値は、「短期大学士」であり、ユーザ属性タイプ「結婚歴」内の特徴の値は、「離婚」であり、ユーザ属性タイプ「年齢層」内の特徴の値は、「32歳」である。
図2を参照すると、ユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内で位置を特定するとき、根ノードに対応するユーザ属性タイプが「性別」であるので、根ノードに記憶された特徴のセクションの特徴の閾値は、ユーザ属性タイプ「性別」内の特徴の閾値「男性」および特徴の閾値「女性」である。ユーザ識別子に対応する特徴の値に関して、特徴の値「男性」は、根ノードに記憶された特徴の閾値「男性」に合致する可能性があり、根ノードの下位ノード、すなわち、枝ノード「男性」が、さらに判断するために獲得される可能性がある。
枝ノード「男性」に対応するユーザ属性タイプは、「学歴」であり、枝ノード「男性」に記憶された特徴のセクションの特徴の閾値は、ユーザ属性タイプ「学歴」内の特徴の閾値「高卒以下」、特徴の閾値「短期大学士」、および特徴の閾値「修士以上」である。したがって、ユーザ識別子に対応する特徴の値に関して、特徴の値「短期大学士」は、枝ノード「男性」に記憶された特徴の閾値「短期大学士」に合致する可能性があり、枝ノード「男性」の下位ノード、すなわち、葉ノード「短期大学士」が、さらに判断するために獲得される可能性がある。
葉ノード「短期大学士」が葉ノードであるので、葉ノードに記憶されたクリックの回数200およびプッシュの回数1000が、獲得される可能性があり、つまり、履歴的な統計において、決定木オブジェクトに対応するデータコンテンツは、ユーザに1000回プッシュされており、ユーザの性別は、「男性」であり、ユーザの学歴は、「短期大学士」であり、データコンテンツは、ユーザによって200回だけクリックされる。したがって、性別が「男性」であり、学歴が「短期大学士」であるユーザグループのためのデータコンテンツの履歴的なクリック率の統計データが、取得される可能性があり、履歴的なクリック率の統計データが、ユーザ識別子のためのデータコンテンツの選択基準値として提供される。
実施形態においては、データベース内のデータコンテンツが、ユーザ識別子のための各データコンテンツの選択基準値を生成するために横断される可能性があり、最も大きな選択基準値を有するデータコンテンツ、または予め設定された閾値を超える選択基準値を有するデータコンテンツが、ユーザ識別子に対応する端末にプッシュされるように選択される。その他の実施形態において、データコンテンツは、電子メールまたはソーシャルネットワークプラットフォームによってユーザ識別子に対応する端末にプッシュされる可能性もある。
要約すると、データコンテンツがプッシュされるユーザ識別子を決定した後、ユーザ識別子に対応する大きな選択基準値を有するデータコンテンツが、プッシュされるように探索され、データコンテンツを探索する方法は、ユーザ識別子に対応する特徴の値をデータコンテンツの決定木オブジェクトの各枝ノードに対応する特徴の閾値とマッチングし、マッチングされた葉ノードに記憶されたクリックの回数およびプッシュの回数を探索し、ユーザ識別子に対応する選択基準値を探索することである。
このようにして構築されたデータコンテンツに対応する決定木オブジェクトは、ユーザの操作によって返されたブラウジングの履歴に基づいてリアルタイムで更新される可能性があり、つまり、ユーザによって返されたブラウジングの履歴に対応するクリックの回数およびプッシュの回数が、決定木オブジェクトをリアルタイムで更新することを実現するために、決定木オブジェクトに対応する葉ノードに追加される。
特に、決定木オブジェクトを更新するプロセスは、端末によってアップロードされたブラウジングの履歴を受け取り、端末に対応するユーザ識別子、およびブラウジングの履歴に対応するデータコンテンツを獲得することと、データコンテンツに対応する決定木オブジェクトを獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得し、獲得された特徴の値に基づいて決定木オブジェクト内でユーザ識別子に対応する葉ノードの位置を特定し、ブラウジングの履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすこととを含む。
上述の例において、最も大きな選択基準値を有するデータコンテンツ(たとえば、登録情報が「男性」、「短期大学士」、「離婚」、および「32歳」であるユーザに合致するユーザのプロファイル)が、上述の出会い系サイト上で、登録情報が「男性」、「短期大学士」、「離婚」、および「32歳」であるユーザに送信された後、返されるブラウジングの履歴は、ユーザがブラウジングするためにデータコンテンツをクリックする場合、クリックの回数1およびプッシュの回数1である。
ブラウジングの履歴を受け取ると、サーバによって探索されたブラウジングの履歴に対応するユーザの特徴の値は、「男性」、「短期大学士」、「離婚」、および「32歳」であり、ブラウジングの履歴に対応するデータコンテンツの決定木オブジェクト内の葉ノード「短期大学士」が、上述の同じ位置特定方法で位置を特定される可能性があり、葉ノード「短期大学士」に記憶されたクリックの回数が、201に増やされ、葉ノード「短期大学士」に記憶されたプッシュの回数が、1001に増やされる。同様に、ユーザがデータコンテンツをクリックしない場合、葉ノード「短期大学士」に記憶されたプッシュの回数は、1001に増やされ、葉ノード「短期大学士」に記憶されたクリックの回数は、変更されないままである。
さらに、決定木オブジェクトは、決定木オブジェクトのツリーノードの数を増やすため、つまり、決定木オブジェクト内の枝ノードに対応するユーザ属性タイプの数を増やすために、履歴的な統計データに基づいてリアルタイムで拡張され得る。データコンテンツは、データコンテンツをプッシュする精度をさらに高めるために、更新された決定木オブジェクトに基づいてプッシュされるように選択され、その結果、データコンテンツは、ユーザの動作システムまたはユーザの属性によりしっかりと合致し、ユーザは、より簡単にデータコンテンツに興味を持つ。
特に、ブラウジングの履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすステップは、ブラウジングの履歴内のデータコンテンツに対応するクリックの回数およびプッシュの回数を獲得することと、決定木オブジェクト内の根ノードから位置を特定された葉ノードまでの経路上の枝ノードを獲得し、経路上の枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいてブラウジングの履歴内で獲得されたデータコンテンツに対応するクリックの回数およびプッシュの回数をカテゴリ毎に足すこととをさらに含む。
図3に示されるように、性別が「男性」であり、学歴が「短期大学士」である葉ノード「短期大学士」は、クリックの総数200およびプッシュの総数1000を記憶するだけでなく、カテゴリ毎にユーザ属性タイプ「結婚歴」に記憶された3つの予め設定された特徴のセクションのクリックの回数、およびカテゴリ毎にユーザ属性タイプ「年齢層」に記憶された3つの予め設定されたセクションのクリックの回数も記憶する。特に、特徴のセクション「未婚」に対応するクリックの回数は120であり、プッシュの回数は400であり、特徴のセクション「離婚」に対応するクリックの回数は20であり、プッシュの回数は400であり、特徴のセクション「死別」に対応するクリックの回数は60である(3つの場合のクリックの回数の合計およびプッシュの回数の合計は、それぞれ、クリックの総数200およびプッシュの回数200に等しくない可能性がある。たとえば、ユーザ識別子は、特定のユーザ属性タイプ内のいずれか1つの特徴のセクションに対応しない)。特に、特徴のセクション「30歳以下」に対応するクリックの回数は130であり、プッシュの回数は500であり、特徴のセクション「30歳から40歳まで」に対応するクリックの回数は30であり、プッシュの回数は400であり、特徴のセクション「40歳以上」に対応するクリックの回数は40であり、プッシュの回数は100である。
上の例と同様に、登録情報が「男性」、「短期大学士」、「離婚」、および「32歳」であるユーザによって返されたブラウジングの履歴が受け取られた後、まず、葉ノード「短期大学士」が、位置を特定され、「離婚」に対応するクリックの数が、21に増やされ、「30歳から40歳まで」に対応するクリックの数が、31に増やされ、クリックの総数が、201に増やされ、プッシュの総数が、1001に増やされ、その他の特徴の値に対応するクリックの回数は、変更されないままである。
候補ユーザ属性タイプは、決定木オブジェクトの枝ノードに対応しないユーザ属性タイプであり、図4に示されるように、決定木オブジェクト内の根ノードから葉ノード「短期大学士」までの経路上の枝ノードは、「性別」および「学歴」にのみ対応し、枝ノードは、残りの「結婚歴」および「年齢層」に対応しない。したがって、「結婚歴」および「年齢層」は、根ノードから葉ノード「短期大学士」までの経路上の候補ユーザ属性タイプである。根ノードから葉ノード「女性」までの経路上の円ノードは、「性別」にのみ対応し、したがって、「学歴」、「結婚歴」、および「年齢層」は、根ノードから葉ノード「女性」までの経路に関する候補ユーザ属性タイプである。決定木オブジェクト内の葉ノードに記憶されたクリックの回数およびプッシュの回数が上述のようにしてリアルタイムで更新された後、候補ユーザ属性タイプが、決定木オブジェクトを拡張するために、葉ノードに記憶されたすべての特定の値に対応するクリックの回数の間の相関に基づいて選択される。
特に、図4に示されるように、候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいてブラウジングの履歴内で獲得されたデータコンテンツに対応するクリックの回数およびプッシュの回数をカテゴリ毎に足すステップは、ステップS202からステップS206をさらに含む。
ステップS202においては、候補ユーザ属性タイプに対応する情報利得(information gain)が、カテゴリ毎に位置を特定された葉ノードに記憶された候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの回数およびプッシュの回数に基づいて生成される。
実施形態において、葉ノードSのユーザ属性タイプAの情報利得は、以下の式によって計算される。
Figure 0006494777
ここで、FAは、ユーザ属性タイプA内の特徴のセクションの集合であり、vは、ユーザ属性タイプA内のそれぞれの特徴のセクションの特徴の閾値であり、p(v)は、ユーザ属性タイプA内のそれぞれの特徴のセクション内のプッシュの回数の分布確率(distribution probability)であり、Svは、それぞれの特徴のセクションの特徴の閾値vに対応するクリックの回数およびプッシュの回数の集合であり、p1は、葉ノードSに対応するプッシュの回数に対するクリックの回数の比であり、p2は、Svに対応するプッシュの回数に対するクリックの回数の比である。
たとえば、図4を参照すると、p1は、葉ノード「短期大学士」に記憶されたプッシュの総数1000に対するクリックの総数200の比であり、したがって、
Entropy(S)=-0.2×log2 0.2-0.8×log2 0.8
である。
ユーザ属性タイプ「結婚歴」内のそれぞれの特徴のセクションの特徴の閾値vは、「未婚」、「離婚」、および「死別」まで横断され、
vが「未婚」である場合、p(v)は400/1000=0.4に等しく、p2は120/400=0.3に等しい場合、
Entropy(Sv)=-0.3×log2 0.3-0.7×log2 0.7
であり、
vが「離婚」である場合、p(v)は400/1000=0.4に等しく、p2は20/400=0.05に等しい場合、
Entropy(Sv)=-0.05×log2 0.05-0.95×log2 0.95
であり、
vが「死別」である場合、p(v)は200/1000=0.2に等しく、p2は60/200=0.3に等しい場合、
Entropy(Sv)=-0.3×log2 0.3-0.7×log2 0.7
であり、
ユーザ属性タイプ「結婚歴」の情報利得は、このようにして得られる。
同様に、図3を参照すると、ユーザ属性タイプ「年齢層」内のそれぞれの特徴のセクションの特徴の閾値vは、「30歳以下」、「30歳から40歳まで」、および「40歳以上」まで横断され、
vが「30歳以下」である場合、p(v)は500/1000=0.5に等しく、p2は130/500=0.26に等しい場合、
Entropy(Sv)=-0.26×log2 0.26-0.74×log2 0.74
であり、
vが「30歳から40歳」である場合、p(v)は400/1000=0.4に等しく、p2は30/400=0.075に等しい場合、
Entropy(Sv)=-0.075×log2 0.075-0.925×log2 0.925
であり、
vが「40歳以上」である場合、p(v)は100/1000=0.1に等しく、p2は40/100=0.4に等しい場合、
Entropy(Sv)=-0.4×log2 0.4-0.6×log2 0.6
であり、
Entropy(SA)は、このようにして計算され、したがって、ユーザ属性タイプ「年齢層」の情報利得が、取得される。
ステップS204においては、その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプが、探索される。
ステップS206においては、候補ユーザ属性タイプが発見される場合、位置を特定された葉ノードが、枝ノードとして設定され、枝ノードの葉ノードが、発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて生成される。
たとえば、G(結婚歴)-G(年齢層)=aであり、aが情報利得の閾値以上である場合、図5に示されるように、葉ノード「短期大学士」が、枝ノード「短期大学士」として更新され、葉ノード「未婚」、葉ノード「離婚」、および葉ノード「死別」が、枝ノード「短期大学士」に追加され、つまり、特徴のセクション「未婚」、「離婚」、および「死別」の特徴の閾値が、枝ノード「短期大学士」に記憶され、特徴のセクション「年齢層」に基づいて記憶されたクリックの数が、それぞれの枝ノードに記憶される。
多くの候補ユーザ属性タイプが存在する場合、たとえば、葉ノードLが4つの候補ユーザ属性タイプA、B、C、およびDを有する場合、まず、G(A)、G(B)、G(C)、およびG(D)が計算され、それから、より大きなGを有する2つの候補ユーザ属性タイプが探索されることが示されるべきである。たとえば、G(A)>G(B)>G(C)>G(D)である場合、G(A)-G(B)が計算され、G(A)-G(B)が情報利得の閾値を超えている場合、候補ユーザ属性タイプAが、ツリーノードに対応するように選択される。
G(A)-G(B)が情報利得の閾値未満である場合、決定木オブジェクトは、変更されないままであり、決定木オブジェクトの葉ノードは、分割されない。分割された葉ノードにおいては、図5に示されるように、ブラウジングの履歴と、候補ユーザ属性タイプ(図5に示されるユーザ属性タイプ「年齢層」)内のそれぞれの特徴のセクションに対応するクリックの回数およびプッシュの回数とに基づいて再カウントされた葉ノードに対応するクリックの回数およびプッシュの回数が、記憶される。
決定木オブジェクトを拡張する場合、データコンテンツをプッシュする精度がさらに改善され得る。候補ユーザ属性タイプの情報利得は、候補ユーザ属性タイプ内の特徴のセクションに対応するクリックの回数およびプッシュの回数の分布が一様である場合に大きく、つまり、決定木オブジェクトを拡張する場合、特徴のセクションに対応するクリックの回数およびプッシュの回数の分布が一様である候補ユーザ属性タイプが、選択され、したがって、枝ノードの葉ノードに入る確率は、ユーザ識別子に対応する特徴の値に基づいて葉ノードの位置を特定するとき、互いに近いことが上述の式から分かる。
したがって、候補ユーザ属性タイプが候補ユーザ属性タイプにおける情報利得を計算することによって選択される場合、決定木オブジェクト内のすべての葉ノードに入る確率が、釣り合いを取られる可能性があり、それによって、厳密な一致条件が原因で特定の葉ノードがユーザ識別子の特徴の値に合致する確率が低くなることを防ぎ、決定木オブジェクトを記憶する空間の利用を改善する。
新たに追加されたデータコンテンツに関して、決定木オブジェクトが、リアルタイムの動作プロセスにおいて生成され得る。特に、データコンテンツに対応する決定木オブジェクトを探索するステップは、データコンテンツに対応する決定木オブジェクトが見つからない場合にデータコンテンツに対応する決定木オブジェクトを生成することであって、生成される決定木オブジェクトの根ノードが葉ノードである、生成することと、データコンテンツのためにデフォルトの選択基準値を割り当てることとをさらに含む。
つまり、決定木オブジェクトが新たに追加されたデータコンテンツのために生成された後、決定木オブジェクトが、その後、端末によって返されるブラウジングの履歴に基づいてリアルタイムで拡張される。決定木オブジェクトは、最初、根ノードである単一のノードのみを有する可能性がある(下位ノードがないので、単一のノードは葉ノードでもある)。受け取られるブラウジングの履歴が増えるにつれて、候補ユーザ属性タイプが、枝ノードを生成するために順次選択され、それによって、決定木オブジェクトを完成させる。
また、決定木オブジェクトを拡張する解決策が使用された後、続いて、ユーザ属性タイプが追加される場合、追加されるユーザ属性タイプに対応する枝ノードが、追加されるユーザ属性タイプのブラウジングの履歴に関する統計に基づいて決定木オブジェクト内で追加され、したがって、ユーザ属性タイプへの参照が、ユーザ属性タイプに関する拡張によって決定木オブジェクト内でリアルタイムで追加される可能性があり、それによって、データコンテンツをプッシュするためのシステムの拡張を改善する。
任意で、クリックの回数およびプッシュの回数に基づいて選択基準値を生成するステップは、データコンテンツに対応する価格調整係数(pricing weighting coefficient)を獲得することと、価格調整係数に、プッシュの回数に対するクリックの回数の比を掛けて、データコンテンツのための選択基準値を得ることとをさらに含む。
たとえば、オンライン広告プッシュアプリケーションにおいて、すべての広告をクリックする価格は異なり、選択基準値を生成するときに価格調整係数が与えられる。このようにして、選択基準値は、履歴的な統計CTRだけでなく、広告のクリックの利益にも帰せられ、したがって、オンライン広告の利益が、最大化される。
任意で、データコンテンツを獲得するステップは、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づくキーワードマッチングによってデータコンテンツを事前にフィルタリングすることをさらに含む。
データコンテンツをプッシュするための既存のシステムにおいては、データベースに記憶された大量のデータコンテンツが存在し、データベース内のデータコンテンツが、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて事前にフィルタリングされ、特徴の値に対応するキーワードを持たないデータコンテンツが、取り除かれる。
たとえば、出会い系サイトの応用の筋書きにおいては、対象のプッシュするユーザの性別が男性である場合、女性のユーザのプロファイルが、事前にフィルタリングされる可能性があり、女性のユーザのプロファイルが、男性のユーザにプッシュされるように、上述のステップS104からステップS108までのプロセスに従ってより大きな選択基準値を有する女性のユーザのプロファイルを求めて探索される。
決定木オブジェクトとのマッチングの回数は、データコンテンツを事前にフィルタリングすることによって減らされる可能性があり、それによって、計算量を減らし、コンピュータの実行効率を高める。
マッチモデルがマッチモデルの不合理な設計が原因でリアルタイムで更新されないので、プッシュされるようにマッチモデルに基づいてデータコンテンツを選択する精度が低いという通常のテクノロジーにおける技術的問題を解決するために、端末プッシュされるデータコンテンツを選択するためのデバイスが、実施形態によって提供され、図6に示されるように、デバイスは、ユーザ識別子獲得モジュール102、決定木獲得モジュール104、葉ノード位置特定モジュール106、およびデータコンテンツ選択モジュール108を含む。
ユーザ識別子獲得モジュール102は、ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得するように構成される。
決定木獲得モジュール104は、データコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを探索するように構成され、決定木オブジェクトのツリーノードは、枝ノードおよび葉ノードを含み、枝ノードは、ユーザ属性タイプと1対1の対応を有し、ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値は、ユーザ属性タイプに対応する枝ノードに記憶され、枝ノードの下位ノードは、特徴の閾値と1対1の対応を有し、葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数は、葉ノードに記憶される。
葉ノード位置特定モジュール106は、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内でユーザ識別子に対応する葉ノードの位置を特定するように構成され、特徴の値は、決定木オブジェクトの根ノードから位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する。
データコンテンツ選択モジュール108は、位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの回数およびプッシュの回数に基づいて選択基準値を生成し、ユーザ識別子に対応する端末にプッシュされるデータコンテンツを選択基準値に基づいて選択するように構成される。
実施形態においては、図6に示されるように、端末にプッシュされるデータコンテンツを選択するためのデバイスが、アップロードされたブラウジングの履歴を受け取り、ブラウジングの履歴に対応するユーザ識別子およびブラウジングの履歴に対応するデータコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得し、獲得された特徴の値に基づいて決定木オブジェクト内のユーザ識別子に対応する葉ノードの位置を特定し、ブラウジングの履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすように構成された決定木更新モジュール110をさらに含む。
実施形態において、決定木更新モジュール110は、ブラウジングの履歴内のデータコンテンツに対応するクリックの回数およびプッシュの回数を獲得し、決定木オブジェクト内の根ノードから位置を特定された葉ノードまでの経路上の枝ノードを獲得し、経路上の枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいてブラウジングの履歴内で獲得されたデータコンテンツに対応するクリックの回数およびプッシュの回数をカテゴリ毎に足すようにさらに構成される。
実施形態において、決定木更新モジュール110は、カテゴリ毎に位置を特定された葉ノードに記憶された候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの回数およびプッシュの回数に基づいて候補ユーザ属性タイプに対応する情報利得を生成し、その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプを探索し、候補ユーザ属性タイプが発見される場合、位置を特定された葉ノードを枝ノードとして設定し、発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて枝ノードの葉ノードを生成するようにさらに構成される。
実施形態において、決定木更新モジュール110は、以下の式によって葉ノードSのユーザ属性タイプAの情報利得を計算するようにさらに構成される。
Figure 0006494777
ここで、FAは、ユーザ属性タイプA内の特徴のセクションの集合であり、vは、ユーザ属性タイプA内のそれぞれの特徴のセクションの特徴の閾値であり、p(v)は、ユーザ属性タイプA内のそれぞれの特徴のセクション内のプッシュの回数の分布確率であり、Svは、それぞれの特徴のセクションの特徴の閾値vに対応するクリックの回数およびプッシュの回数の集合であり、p1は、葉ノードSに対応するプッシュの回数に対するクリックの回数の比であり、p2は、Svに対応するプッシュの回数に対するクリックの回数の比である。
実施形態においては、図6に示されるように、端末にプッシュされるデータコンテンツを選択するためのデバイスが、データコンテンツに対応する決定木オブジェクトが見つからない場合にデータコンテンツに対応する決定木オブジェクトを生成するように構成された決定木生成モジュール112であって、生成される決定木オブジェクトの根ノードが葉ノードである、決定木生成モジュール112をさらに含む。
決定木獲得モジュールは、データコンテンツに対応する決定木オブジェクトが発見されない場合にデータコンテンツのためにデフォルトの選択基準値を割り当てるようにさらに構成される。
実施形態において、データコンテンツ選択モジュール108は、データコンテンツに対応する価格調整係数を獲得し、価格調整係数に、プッシュの回数に対するクリックの回数の比を掛けて、データコンテンツのための選択基準値を得るようにさらに構成される。
実施形態においては、図6に示されるように、端末にプッシュされるデータコンテンツを選択するためのデバイスが、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づくキーワードマッチングによってデータコンテンツを事前にフィルタリングするように構成されたデータコンテンツフィルタリングモジュール114をさらに含む。
本開示の実施形態において、図1から図5に示された端末にプッシュされるデータコンテンツを選択するための方法は、図6に示される端末にプッシュされるデータコンテンツを選択するためのデバイスの各ユニットによって実行され得る。たとえば、図1に示されたステップS102、S104、S106、およびS108は、それぞれ、図6に示されるユーザ識別子獲得モジュール102、決定木獲得モジュール104、葉ノード位置特定モジュール106、およびデータコンテンツ選択モジュール108によって実行され得る。図4に示されたステップS202、S204、およびS106は、図6に示される決定木更新モジュール110によって実行され得る。
本開示の別の実施形態によれば、図6に示された端末にプッシュされるデータコンテンツを選択するためのデバイスのユニットのすべてもしくは一部は、1つもしくは複数の別のユニットとして組み合わせられる可能性があり、またはユニットのうちの1つもしくは複数は、より少ない機能を有する複数のユニットに分けられる可能性があり、これらは、本開示の実施形態の技術的効果に影響を与えることなく同じ動作を実現し得る。上述のユニットは、論理的機能に基づいて分けられる。実際の応用においては、1つのユニットの機能が、複数のユニットによって実現される可能性があり、または複数のユニットの機能が、1つのユニットによって実現される可能性がある。本開示のその他の実施形態において、端末デバイスは、その他のモジュールも含む可能性がある。しかし、実際の応用においては、これらの機能が、その他のユニットによって協力して実現されるか、または複数のユニットによって協力して実現される可能性もある。
本開示の別の実施形態によれば、図1から図5に示されたように端末にプッシュされるデータコンテンツを選択するための方法を実行するための(プログラムコードを含む)コンピュータプログラムが、図6に示されるように端末にプッシュされるデータコンテンツを選択するためのデバイスを構築するため、および本開示の実施形態による端末にプッシュされるデータコンテンツを選択するための方法を実現するために、中央演算処理装置(CPU)、ランダムアクセスメモリ(RAM)、または読み出し専用メモリ(ROM)などの処理要素およびストレージ要素を含むコンピュータなどのよくあるコンピュータデバイス上で実行される。コンピュータプログラムは、たとえば、コンピュータ可読記録媒体に記録され、コンピュータ可読記録媒体を介して上述のコンピュータデバイスにロードされ、コンピュータデバイス上で実行される可能性がある。
要約すると、本開示の実施形態は、以下のような有利な効果を有する。
上述の決定木オブジェクトが、マッチモデルとして提供され、大きな選択基準値を有するデータコンテンツが、ユーザ識別子に対応する特徴の値をデータコンテンツに対応する決定木オブジェクト内の枝ノードとマッチングすることによってプッシュされるように選択され、周期的サンプリングの後に、決定木オブジェクトがサンプリングされたサンプルに基づいて機械学習によってオフラインで更新されるのではなく、上述の決定木オブジェクトが、決定木オブジェクトの論理的な構造のおかげでユーザのブラウジングの履歴に基づいてリアルタイムで更新される。つまり、ユーザ識別子に対応する特徴の値をデータコンテンツに対応する決定木オブジェクト内の枝ノートとマッチングする場合、決定木オブジェクト内の統計データは、より新しいユーザのブラウジングの履歴に帰せられ、したがって、マッチングの結果は、運用するユーザの動作の癖またはブラウジングの癖により厳密に従うことができ、それによって、プッシュされるデータコンテンツを選択する精度を高める。
本開示の実施形態による端末にプッシュされるデータコンテンツを選択するためのデバイスの概略構造図である図7を参照すると、図7に示されるように、端末にプッシュされるデータコンテンツを選択するためのデバイスは、少なくとも1つのプロセッサ701、たとえば、CPU、少なくとも1つの通信バス702、ユーザインターフェース703、およびメモリ704を含む可能性がある。特に、通信バス702は、これらの構成要素の間の接続の通信を実現するために使用される。特に、ユーザインターフェース703は、ディスプレイ(Display)を含む可能性がある。任意で、ユーザインターフェース703は、標準的な有線インターフェースおよび標準的なワイヤレスインターフェースをさらに含む可能性がある。メモリ704は、高速なRAMメモリである可能性があり、不揮発性メモリ(non-volatile memory)、たとえば、少なくとも1つの磁気ディスクメモリである可能性もある。任意で、メモリ704は、上述のプロセッサ701から遠く離れた少なくとも1つのメモリデバイスである可能性がある。1組のプログラムコードが、メモリ704に記憶され、プロセッサ701が、ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得することと、データコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを探索することであって、決定木オブジェクトのツリーノードが、枝ノードおよび葉ノードを含み、枝ノードが、ユーザ属性タイプと1対1の対応を有し、ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値が、ユーザ属性タイプに対応する枝ノードに記憶され、枝ノードの下位ノードが、特徴の閾値と1対1の対応を有し、葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、葉ノードに記憶される、探索することと、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づいて決定木オブジェクト内でユーザ識別子に対応する葉ノードの位置を特定することであって、特徴の値が、決定木オブジェクトの根ノードから位置を特定された葉ノードまでの経路上の各枝ノードに対応する特徴のセクションの特徴の閾値に合致する、位置を特定することと、位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの回数およびプッシュの回数に基づいて選択基準値を生成し、ユーザ識別子に対応する端末にプッシュされるデータコンテンツを選択基準値に基づいて選択することとを行うためにメモリ704に記憶されたプログラムコードを呼び出す。
任意の実施形態において、プロセッサ701は、端末によってアップロードされたブラウジングの履歴を受け取り、端末に対応するユーザ識別子、およびブラウジングの履歴に対応するデータコンテンツを獲得し、データコンテンツに対応する決定木オブジェクトを獲得し、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値を獲得し、獲得された特徴の値に基づいて決定木オブジェクト内のユーザ識別子に対応する葉ノードの位置を特定し、ブラウジングの履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすためにメモリ704に記憶されたプログラムコードを呼び出す。
任意の実施形態において、プロセッサ701がブラウジングの履歴の履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすためにメモリ704に記憶されたプログラムコードを呼び出すことは、ブラウジングの履歴内のデータコンテンツに対応するクリックの回数およびプッシュの回数を獲得することと、決定木オブジェクト内の根ノードから位置を特定された葉ノードまでの経路上の枝ノードを獲得し、経路上の枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいてブラウジングの履歴内で獲得されたデータコンテンツに対応するクリックの回数およびプッシュの回数をカテゴリ毎に足すこととをさらに含む。
任意の実施形態においては、プロセッサ701が、候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいてブラウジングの履歴内で獲得されたデータコンテンツに対応するクリックの回数およびプッシュの回数をカテゴリ毎に足すためにメモリ704に記憶されたプログラムコードを呼び出した後、プロセッサ701は、カテゴリ毎に位置を特定された葉ノードに記憶された候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの回数およびプッシュの回数に基づいて候補ユーザ属性タイプに対応する情報利得を生成し、その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプを探索し、候補ユーザ属性タイプが発見される場合、位置を特定された葉ノードを枝ノードとして設定し、発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて枝ノードの葉ノードを生成するためにメモリ704に記憶されたプログラムコードを呼び出す。
任意の実施形態において、プロセッサ701がデータコンテンツに対応する決定木オブジェクトを探索するためにメモリ704に記憶されたプログラムコードを呼び出すことは、データコンテンツに対応する決定木オブジェクトが見つからない場合にデータコンテンツに対応する決定木オブジェクトを生成することであって、生成される決定木オブジェクトの根ノードが葉ノードである、生成することと、データコンテンツのためにデフォルトの選択基準値を割り当てることとをさらに含む。
任意の実施形態において、プロセッサ701がクリックの回数およびプッシュの回数に基づいて選択基準値を生成するためにメモリ704に記憶されたプログラムコードを呼び出すことは、データコンテンツに対応する価格調整係数を獲得し、価格調整係数に、プッシュの回数に対するクリックの回数の比を掛けて、データコンテンツのための選択基準値を得ることをさらに含む可能性がある。
任意の実施形態において、プロセッサ701がデータコンテンツを獲得するためにメモリ704に記憶されたプログラムコードを呼び出すことは、予め設定されたユーザ属性タイプ内のユーザ識別子に対応する特徴の値に基づくキーワードマッチングによってデータコンテンツを事前にフィルタリングすることをさらに含む可能性がある。
たとえば、流れ図に表されたまたはその他の方法で本明細書に記載された論理および/またはステップは、論理的機能を実装するための実行可能な命令の順序付けリストと考えられる可能性があり、命令実行システム、デバイス、または機器(たとえば、コンピュータに基づくシステム、プロセッサを含むシステム、または命令実行システム、デバイス、もしくは機器から命令を取得し、命令を実行することができるその他のシステム)のために使用されるように任意のコンピュータ可読媒体に実装されるか、あるいは命令実行システム、デバイス、または機器と併せて使用される可能性がある。本明細書に関して、「コンピュータ可読媒体」は、命令実行システム、デバイス、もしくは機器のために、または命令実行システム、デバイス、もしくは機器と併せて使用されるプログラムを含むか、記憶するか、通信するか、または拡散するか、または転送し得る任意のデバイスである可能性がある。コンピュータ可読媒体の例(非網羅的なリスト)は、1つまたは複数の配線を有する電気接続部分(電子デバイス)、ポータブルコンピュータの筐体(磁気デバイス)、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能で編集可能な読み出し専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバデバイス、およびポータブルコンパクトディスク読み出し専用メモリ(CDROM)を含む。加えて、コンピュータ可読媒体は、紙またはその他の媒体に対して光学的走査が実行され得るので、プログラムが印刷され得る紙またはその他の好適な媒体である可能性もあり、プログラムは、紙またはその他の媒体を編集するか、変換するか、または必要なときにその他の好適な方法で処理することによって電子的な方法で得られる可能性があり、コンピュータのメモリに記憶される。
本開示の各部分はハードウェア、ソフトウェア、ファームウェア、またはこれらの組合せによって実装され得ることを理解されたい。上述の実施形態においては、複数のステップまたは方法が、好適な命令実行システムによって実行される、メモリに記憶されたソフトウェアまたはファームウェアによって実装される。たとえば、ハードウェアによって実装される場合、別の実施形態と同様に、ステップまたは方法は、以下の当技術分野で知られているテクノロジー、すなわち、データ信号に対する論理的機能を実装するための論理ゲート回路を有するディスクリート論理回路、好適な組合せ論理ゲート回路を有する専用集積回路、プログラマブルゲートアレイ(PGA)、またはフィールドプログラマブルゲートアレイ(FPGA)のいずれか1つまたは組合せによって実装される可能性がある。
上で参照されたメモリ媒体は、読み出し専用メモリ、磁気ディスク、光ディスクなどである可能性がある。本開示の実施形態が図示され、上で説明されたが、上述の実施形態は例示的であるに過ぎず、本開示に関する限定であると理解されず、本開示の範囲内で当業者によって上述の実施形態に対して変更、修正、置き換え、および交換がなされ得ることを理解されたい。
102 ユーザ識別子獲得モジュール
104 決定木獲得モジュール
106 葉ノード位置特定モジュール
108 データコンテンツ選択モジュール
110 決定木更新モジュール
112 決定木生成モジュール
114 データコンテンツフィルタリングモジュール
701 プロセッサ
702 少なくとも1つの通信バス
703 ユーザインターフェース
704 メモリ

Claims (20)

  1. 端末にプッシュされるデータコンテンツを選択するための、プロセッサと前記プロセッサによって実行されるプログラム指示を格納するメモリとを含む端末で端末にプッシュされるデータコンテンツを選択するために遂行される、方法であって、
    前記方法は、
    ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得するステップと、
    データコンテンツを獲得し、前記データコンテンツに対応する決定木オブジェクトを探索するステップであって、前記決定木オブジェクトのツリーノードが、枝ノードおよび葉ノードを含み、前記枝ノードが、前記ユーザ属性タイプと1対1の対応を有し、前記ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値が、前記ユーザ属性タイプに対応する前記枝ノードに記憶され、前記枝ノードの下位ノードが、前記特徴の閾値と1対1の対応を有し、前記葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、前記葉ノードに記憶される、ステップと、
    前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する前記特徴の値に基づいて前記決定木オブジェクト内で前記ユーザ識別子に対応する葉ノードの位置を特定するステップであって、前記特徴の値が、前記決定木オブジェクトの根ノードから前記位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する、ステップと、
    前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの前記回数およびプッシュの前記回数に基づいて選択基準値を生成し、前記ユーザ識別子に対応する端末にプッシュされるデータコンテンツを前記選択基準値に基づいて選択するステップとを含む、方法。
  2. アップロードされたブラウジングの履歴を受け取り、前記アップロードされたブラウジングの履歴に対応するユーザ識別子および前記アップロードされたブラウジングの履歴に対応するデータコンテンツを獲得するステップと、
    前記データコンテンツに対応する決定木オブジェクトを獲得し、前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得し、前記獲得された特徴の値に基づいて前記決定木オブジェクト内の前記ユーザ識別子に対応する葉ノードの位置を特定し、前記アップロードされたブラウジングの履歴に基づいて位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすステップとをさらに含む請求項1に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  3. 前記アップロードされたブラウジングの履歴に基づいて前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やす前記ステップが、
    前記アップロードされたブラウジングの履歴内の前記データコンテンツに対応するクリックの回数およびプッシュの回数を獲得するステップと、
    前記決定木オブジェクト内の前記根ノードから前記位置を特定された葉ノードまでの前記経路上の枝ノードを獲得し、前記経路上の前記枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいて前記アップロードされたブラウジングの履歴内で獲得された前記データコンテンツに対応するクリックの前記回数およびプッシュの前記回数をカテゴリ毎に足すステップとをさらに含む請求項2に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  4. 前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいて前記アップロードされたブラウジングの履歴内で獲得された前記データコンテンツに対応するクリックの前記回数およびプッシュの前記回数をカテゴリ毎に足す前記ステップの後に、
    カテゴリ毎に前記位置を特定された葉ノードに記憶された前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの前記回数およびプッシュの前記回数に基づいて前記候補ユーザ属性タイプに対応する情報利得を生成するステップと、 その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプを探索するステップと、
    前記候補ユーザ属性タイプが発見される場合、前記位置を特定された葉ノードを枝ノードとして設定し、前記発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて前記枝ノードの葉ノードを生成するステップとをさらに含む請求項3に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  5. カテゴリ毎に前記位置を特定された葉ノードに記憶された前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの前記回数およびプッシュの前記回数に基づいて前記候補ユーザ属性タイプに対応する前記情報利得を生成する前記ステップが、
    葉ノードSのユーザ属性タイプAの情報利得を、以下の式、すなわち、
    Figure 0006494777
    によって計算するステップであって、前記式中、FAが、前記ユーザ属性タイプA内の特徴のセクションの集合であり、vが、前記ユーザ属性タイプA内のそれぞれの特徴のセクションの特徴の閾値であり、p(v)が、前記ユーザ属性タイプA内のそれぞれの特徴のセクション内のプッシュの回数の分布確率であり、Svが、それぞれの特徴のセクションの特徴の閾値vに対応するクリックの回数およびプッシュの回数の集合であり、p1が、前記葉ノードSに対応するプッシュの回数に対するクリックの回数の比であり、p2が、Svに対応するプッシュの回数に対するクリックの回数の比である、ステップを含む請求項4に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  6. 前記データコンテンツに対応する前記決定木オブジェクトを探索する前記ステップが、
    前記データコンテンツに対応する決定木オブジェクトが見つからない場合に前記データコンテンツに対応する前記決定木オブジェクトを生成するステップであって、生成される決定木オブジェクトの根ノードが葉ノードである、ステップと、
    前記データコンテンツのためにデフォルトの選択基準値を割り当てるステップとをさらに含む請求項1から5のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  7. クリックの前記回数およびプッシュの前記回数に基づいて前記選択基準値を生成する前記ステップが、
    前記データコンテンツに対応する価格調整係数を獲得し、前記価格調整係数に、プッシュの前記回数に対するクリックの前記回数の比を掛けて、前記データコンテンツのための選択基準値を得るステップをさらに含む請求項1から5のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  8. 前記データコンテンツを獲得する前記ステップが、
    前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する前記特徴の値に基づくキーワードマッチングによってデータコンテンツを事前にフィルタリングするステップをさらに含む請求項1から5のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するための方法。
  9. 端末にプッシュされるデータコンテンツを選択するためのデバイスであって、
    ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得するように構成されたユーザ識別子獲得モジュールと、
    データコンテンツを獲得し、前記データコンテンツに対応する決定木オブジェクトを探索するように構成された決定木獲得モジュールであって、前記決定木オブジェクトのツリーノードが、枝ノードおよび葉ノードを含み、前記枝ノードが、前記ユーザ属性タイプと1対1の対応を有し、前記ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値が、前記ユーザ属性タイプに対応する前記枝ノードに記憶され、前記枝ノードの下位ノードが、前記特徴の閾値と1対1の対応を有し、前記葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、前記葉ノードに記憶される、決定木獲得モジュールと、
    前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する前記特徴の値に基づいて前記決定木オブジェクト内で前記ユーザ識別子に対応する葉ノードの位置を特定するように構成された葉ノード位置特定モジュールであって、前記特徴の値が、前記決定木オブジェクトの根ノードから前記位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する、葉ノード位置特定モジュールと、
    前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの前記回数およびプッシュの前記回数に基づいて選択基準値を生成し、前記ユーザ識別子に対応する端末にプッシュされるデータコンテンツを前記選択基準値に基づいて選択するように構成されたデータコンテンツ選択モジュールとを含む、デバイス。
  10. アップロードされたブラウジングの履歴を受け取り、前記アップロードされたブラウジングの履歴に対応するユーザ識別子および前記アップロードされたブラウジングの履歴に対応するデータコンテンツを獲得し、
    前記データコンテンツに対応する決定木オブジェクトを獲得し、前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得し、前記獲得された特徴の値に基づいて前記決定木オブジェクト内の前記ユーザ識別子に対応する葉ノードの位置を特定し、前記アップロードされたブラウジングの履歴に基づいて前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすように構成された決定木更新モジュールをさらに含む請求項9に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  11. 前記決定木更新モジュールが、
    前記アップロードされたブラウジングの履歴内の前記データコンテンツに対応するクリックの回数およびプッシュの回数を獲得し、
    前記決定木オブジェクト内の前記根ノードから前記位置を特定された葉ノードまでの前記経路上の枝ノードを獲得し、前記経路上の前記枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいて前記アップロードされたブラウジングの履歴内で獲得された前記データコンテンツに対応するクリックの前記回数およびプッシュの前記回数をカテゴリ毎に足すようにさらに構成される請求項10に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  12. 前記決定木更新モジュールが、
    カテゴリ毎に前記位置を特定された葉ノードに記憶された前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの前記回数およびプッシュの前記回数に基づいて前記候補ユーザ属性タイプに対応する情報利得を生成し、
    その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプを探索し、 前記候補ユーザ属性タイプが発見される場合、前記位置を特定された葉ノードを枝ノードとして設定し、前記発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて前記枝ノードの葉ノードを生成するようにさらに構成される請求項11に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  13. 前記決定木更新モジュールが、葉ノードSのユーザ属性タイプAの情報利得を以下の式、すなわち、
    Figure 0006494777
    によって計算するようにさらに構成され、前記式中、FAが、前記ユーザ属性タイプA内の特徴のセクションの集合であり、vが、前記ユーザ属性タイプA内のそれぞれの特徴のセクションの特徴の閾値であり、p(v)が、前記ユーザ属性タイプA内のそれぞれの特徴のセクション内のプッシュの回数の分布確率であり、Svが、それぞれの特徴のセクションの特徴の閾値vに対応するクリックの回数およびプッシュの回数の集合であり、p1が、前記葉ノードSに対応するプッシュの回数に対するクリックの回数の比であり、p2が、Svに対応するプッシュの回数に対するクリックの回数の比である請求項12に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  14. 前記データコンテンツに対応する前記決定木オブジェクトが見つからない場合に前記データコンテンツに対応する決定木オブジェクトを生成するように構成された決定木生成モジュールであって、生成される決定木オブジェクトの根ノードが葉ノードである、決定木生成モジュールをさらに含み、
    前記決定木獲得モジュールが、前記データコンテンツに対応する前記決定木オブジェクトが発見されない場合に前記データコンテンツのためにデフォルトの選択基準値を割り当てるようにさらに構成される請求項9から13のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  15. 前記データコンテンツ選択モジュールが、前記データコンテンツに対応する価格調整係数を獲得し、前記価格調整係数に、プッシュの前記回数に対するクリックの前記回数の比を掛けて、前記データコンテンツのための選択基準値を得るようにさらに構成される請求項9から13のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  16. 前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する前記特徴の値に基づくキーワードマッチングによってデータコンテンツを事前にフィルタリングするように構成されたデータコンテンツフィルタリングモジュールをさらに含む請求項9から13のいずれか一項に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  17. 端末にプッシュされるデータコンテンツを選択するためのデバイスであって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに接続され、プログラムコードを記憶するメモリとを含み、 前記少なくとも1つのプロセッサが、
    ユーザ識別子を獲得し、予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得することと、
    データコンテンツを獲得し、前記データコンテンツに対応する決定木オブジェクトを探索することであって、前記決定木オブジェクトのツリーノードが、枝ノードおよび葉ノードを含み、前記枝ノードが、前記ユーザ属性タイプと1対1の対応を有し、前記ユーザ属性タイプ内のそれぞれの特徴のセクションの特徴の閾値が、前記ユーザ属性タイプに対応する前記枝ノードに記憶され、前記枝ノードの下位ノードが、前記特徴の閾値と1対1の対応を有し、前記葉ノードに対応する特徴の閾値に対応するクリックの回数およびプッシュの回数が、前記葉ノードに記憶される、探索することと、
    前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する前記特徴の値に基づいて前記決定木オブジェクト内で前記ユーザ識別子に対応する葉ノードの位置を特定することであって、前記特徴の値が、前記決定木オブジェクトの根ノードから前記位置を特定された葉ノードまでの経路上のそれぞれのツリーノードに対応する特徴の閾値に合致する、位置を特定することと、
    前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を獲得し、クリックの前記回数およびプッシュの前記回数に基づいて選択基準値を生成し、前記ユーザ識別子に対応する端末にプッシュされるデータコンテンツを前記選択基準値に基づいて選択することとを行うために前記メモリに記憶された前記プログラムコードの命令を呼び出すように構成される、デバイス。
  18. 前記少なくとも1つのプロセッサが、
    アップロードされたブラウジングの履歴を受け取り、前記アップロードされたブラウジングの履歴に対応するユーザ識別子および前記アップロードされたブラウジングの履歴に対応するデータコンテンツを獲得し、
    前記データコンテンツに対応する決定木オブジェクトを獲得し、前記予め設定されたユーザ属性タイプ内の前記ユーザ識別子に対応する特徴の値を獲得し、前記獲得された特徴の値に基づいて前記決定木オブジェクト内の前記ユーザ識別子に対応する葉ノードの位置を特定し、前記アップロードされたブラウジングの履歴に基づいて前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすために前記メモリに記憶された前記プログラムコードの命令を呼び出すように構成される請求項17に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  19. 前記アップロードされたブラウジングの履歴に基づいて前記位置を特定された葉ノードに記憶されたクリックの回数およびプッシュの回数を増やすための前記命令を呼び出すことが、
    前記アップロードされたブラウジングの履歴内の前記データコンテンツに対応するクリックの回数およびプッシュの回数を獲得することと、
    前記決定木オブジェクト内の前記根ノードから前記位置を特定された葉ノードまでの前記経路上の枝ノードを獲得し、前記経路上の前記枝ノードに対応するユーザ属性タイプの他に、予め設定された候補ユーザ属性タイプも獲得し、前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいて前記アップロードされたブラウジングの履歴内で獲得された前記データコンテンツに対応するクリックの前記回数およびプッシュの前記回数をカテゴリ毎に足すこととを含む請求項18に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
  20. 前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに基づいて前記アップロードされたブラウジングの履歴内で獲得された前記データコンテンツに対応するクリックの前記回数およびプッシュの前記回数をカテゴリ毎に足すための前記命令を呼び出した後、前記少なくとも1つのプロセッサが、 カテゴリ毎に前記位置を特定された葉ノードに記憶された前記候補ユーザ属性タイプ内のそれぞれの特徴のセクションに対応するクリックの前記回数およびプッシュの前記回数に基づいて前記候補ユーザ属性タイプに対応する情報利得を生成し、
    その他の探索されたユーザ属性タイプの情報利得との間の差が情報利得の閾値以上である情報利得を有する候補ユーザ属性タイプを探索し、
    前記候補ユーザ属性タイプが発見される場合、前記位置を特定された葉ノードを枝ノードとして設定し、前記発見された候補ユーザ属性タイプ内の特徴のセクションの特徴の閾値に基づいて前記枝ノードの葉ノードを生成するために前記メモリに記憶された前記プログラムコードの命令を呼び出すように構成される請求項19に記載の端末にプッシュされるデータコンテンツを選択するためのデバイス。
JP2017543954A 2015-04-08 2016-04-08 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス Active JP6494777B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510164053.1 2015-04-08
CN201510164053.1A CN106156127B (zh) 2015-04-08 2015-04-08 选择数据内容向终端推送的方法及装置
PCT/CN2016/078867 WO2016161976A1 (zh) 2015-04-08 2016-04-08 选择数据内容向终端推送的方法和装置

Publications (2)

Publication Number Publication Date
JP2018511116A JP2018511116A (ja) 2018-04-19
JP6494777B2 true JP6494777B2 (ja) 2019-04-03

Family

ID=57071725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017543954A Active JP6494777B2 (ja) 2015-04-08 2016-04-08 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス

Country Status (4)

Country Link
US (1) US10789311B2 (ja)
JP (1) JP6494777B2 (ja)
CN (1) CN106156127B (ja)
WO (1) WO2016161976A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740453B (zh) * 2016-02-03 2018-06-19 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN106682102B (zh) * 2016-12-02 2019-07-19 中国通信建设集团设计院有限公司 一种基于关键字集合的信息匹配方法
CN108334522B (zh) * 2017-01-20 2021-12-14 阿里巴巴集团控股有限公司 确定海关编码的方法,以及确定类型信息的方法和系统
CN107038256B (zh) * 2017-05-05 2018-06-29 平安科技(深圳)有限公司 基于数据源的业务定制装置、方法及计算机可读存储介质
CN108011936B (zh) * 2017-11-28 2021-06-04 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
US11556836B1 (en) * 2018-02-12 2023-01-17 Intuit Inc. System and method for matching specialists and potential clients
CN108540831B (zh) * 2018-04-19 2019-10-22 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108763017B (zh) * 2018-05-18 2023-04-25 平安普惠企业管理有限公司 金融业务的应用软件数据处理方法、服务端及存储介质
US11790381B1 (en) 2018-08-09 2023-10-17 Intuit Inc. System and method for attribute selection for expert matchmaking
CN109255013A (zh) * 2018-08-14 2019-01-22 平安医疗健康管理股份有限公司 理赔决策方法、装置、计算机设备和存储介质
US11245777B1 (en) * 2018-09-11 2022-02-08 Groupon, Inc. Multi-application interactive support and communication interface
CN109635185A (zh) * 2018-11-12 2019-04-16 平安科技(深圳)有限公司 一种舆情数据推送方法、装置、存储介质和终端设备
CN109559173B (zh) * 2018-11-30 2020-11-13 杭州可靠护理用品股份有限公司 一种基于用途的纸尿裤功能层自适应配置方法与系统
CN109684549A (zh) * 2018-12-24 2019-04-26 拉扎斯网络科技(上海)有限公司 目标数据预测方法、装置、电子设备及计算机存储介质
CN109885597B (zh) * 2019-01-07 2023-05-30 平安科技(深圳)有限公司 基于机器学习的用户分群处理方法、装置及电子终端
EP3709229A1 (en) * 2019-03-13 2020-09-16 Ricoh Company, Ltd. Learning device and learning method
CN111814030B (zh) * 2019-04-10 2023-10-27 百度在线网络技术(北京)有限公司 推送方法、装置、设备和介质
CN110135590B (zh) * 2019-04-15 2022-05-17 平安科技(深圳)有限公司 信息处理方法、装置、介质及电子设备
CN111083722B (zh) * 2019-04-15 2024-06-07 中兴通讯股份有限公司 模型的推送、模型的请求方法及装置、存储介质
CN111770125A (zh) * 2019-05-23 2020-10-13 北京沃东天骏信息技术有限公司 用于推送信息的方法和装置
CN110222960B (zh) * 2019-05-23 2022-11-25 深圳供电局有限公司 一种自动匹配任务生成的方法及系统
CN110351371A (zh) * 2019-07-15 2019-10-18 星联云服科技有限公司 一种在云存储系统中进行数据推送的方法及系统
US11397591B2 (en) * 2019-11-07 2022-07-26 Kyndryl, Inc. Determining disorder in technological system architectures for computer systems
CN110990699B (zh) * 2019-11-29 2021-12-07 广州市百果园信息技术有限公司 一种信息推送系统、方法、装置、设备和存储介质
CN111339418B (zh) * 2020-02-26 2023-07-18 抖音视界有限公司 页面展示方法、装置、电子设备和计算机可读介质
CN111460285B (zh) * 2020-03-17 2023-11-03 阿波罗智联(北京)科技有限公司 信息处理方法、装置、电子设备和存储介质
CN112243021A (zh) * 2020-05-25 2021-01-19 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备及计算机可读存储介质
CN111859156B (zh) * 2020-08-04 2024-02-02 上海秒针网络科技有限公司 发布人群的确定方法、装置、可读存储介质及电子设备
CN111966904B (zh) * 2020-08-18 2023-09-05 深圳平安智慧医健科技有限公司 基于多用户画像模型的信息推荐方法和相关装置
CN112015986B (zh) * 2020-08-26 2024-01-26 北京奇艺世纪科技有限公司 数据推送方法、装置、电子设备及计算机可读存储介质
CN113761886A (zh) * 2020-10-16 2021-12-07 北京沃东天骏信息技术有限公司 确定目标任务的方法、装置、电子设备及存储介质
CN112566137A (zh) * 2020-12-06 2021-03-26 广州技象科技有限公司 根据发送数据进行组网方法、装置、设备和存储介质
CN112948608B (zh) * 2021-02-01 2023-08-22 北京百度网讯科技有限公司 图片查找方法、装置、电子设备及计算机可读存储介质
KR102394160B1 (ko) * 2021-05-25 2022-05-06 김민혁 웹 서비스를 이용하는 고객의 행동 조건에 따라 푸시 안내 메시지를 전송할 수 있는 웹 서비스 운영 서버 및 그 동작 방법
CN113343147B (zh) * 2021-06-18 2024-01-19 北京百度网讯科技有限公司 信息处理方法、装置、设备、介质及程序产品
CN113742571B (zh) * 2021-08-03 2024-04-26 大箴(杭州)科技有限公司 一种基于大数据的消息推送方法及装置、存储介质
CN114240527A (zh) * 2021-10-12 2022-03-25 北京淘友天下科技发展有限公司 资源推送方法、装置、电子设备、可读介质及计算机程序
CN114301975B (zh) * 2021-11-30 2023-07-28 乐美科技股份私人有限公司 应用内推送信息的处理方法、装置、设备及存储介质
CN115187345A (zh) * 2022-09-13 2022-10-14 深圳装速配科技有限公司 智能家居建材推荐方法、装置、设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6727914B1 (en) * 1999-12-17 2004-04-27 Koninklijke Philips Electronics N.V. Method and apparatus for recommending television programming using decision trees
JP2004046488A (ja) * 2002-07-11 2004-02-12 Fujitsu Ltd 情報プッシュ機能を備えた情報整理表示システム
WO2005031589A1 (en) * 2003-09-23 2005-04-07 Marchex, Inc. Performance-based online advertising system and method
CN101075253A (zh) * 2007-02-15 2007-11-21 腾讯科技(深圳)有限公司 一种广告信息推送系统和方法
US7908238B1 (en) * 2007-08-31 2011-03-15 Yahoo! Inc. Prediction engines using probability tree and computing node probabilities for the probability tree
JP5290041B2 (ja) * 2008-05-16 2013-09-18 株式会社エヌ・ティ・ティ・ドコモ 情報検索装置及び情報検索方法
US8738436B2 (en) * 2008-09-30 2014-05-27 Yahoo! Inc. Click through rate prediction system and method
CN101505461B (zh) * 2008-12-29 2011-06-15 北京握奇数据系统有限公司 一种信息发布处理的方法和装置
US20120072411A1 (en) * 2010-09-16 2012-03-22 Microsoft Corporation Data representation for push-based queries
US20130151332A1 (en) * 2011-12-10 2013-06-13 Rong Yan Assisted adjustment of an advertising campaign
CN102436506A (zh) * 2011-12-27 2012-05-02 Tcl集团股份有限公司 一种网络服务器端海量数据的处理方法及装置
CN103902538B (zh) * 2012-12-25 2017-03-15 中国银联股份有限公司 基于决策树的信息推荐装置及方法
JP5693630B2 (ja) 2013-03-18 2015-04-01 ヤフー株式会社 広告抽出装置、広告抽出方法及び広告抽出プログラム
CN103685502B (zh) 2013-12-09 2017-07-25 腾讯科技(深圳)有限公司 一种消息推送方法、装置及系统
CN103618668A (zh) * 2013-12-18 2014-03-05 清华大学 微博推送、接收方法及装置
CN103744968A (zh) * 2014-01-09 2014-04-23 小米科技有限责任公司 一种终端应用中的信息推送方法及装置

Also Published As

Publication number Publication date
JP2018511116A (ja) 2018-04-19
CN106156127A (zh) 2016-11-23
US10789311B2 (en) 2020-09-29
US20170329856A1 (en) 2017-11-16
WO2016161976A1 (zh) 2016-10-13
CN106156127B (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
JP6494777B2 (ja) 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス
CN111782965B (zh) 意图推荐方法、装置、设备及存储介质
US10546006B2 (en) Method and system for hybrid information query
US9922333B2 (en) Automated multivariate behavioral prediction
CN107451861B (zh) 一种大数据下用户上网特征识别的方法
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN103218431B (zh) 一种能识别网页信息自动采集的系统
US20130238425A1 (en) Advertisement Selection Using Multivariate Behavioral Model
CN107908606A (zh) 基于不同信息源自动生成报表的方法和系统
JP5615857B2 (ja) 分析装置、分析方法及び分析プログラム
CN112148889A (zh) 一种推荐列表的生成方法及设备
CN103310003A (zh) 一种基于点击日志的新广告点击率预测方法及系统
CN111523072A (zh) 页面访问数据统计方法、装置、电子设备及存储介质
CN107146112A (zh) 一种移动互联网广告投放方法
CN104866557A (zh) 一种基于建构学习理论的个性化即时学习支持系统与方法
US20220114603A1 (en) Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning
JP2013531841A (ja) ウェブサイトのリモートユーザを識別する方法
CN110880124A (zh) 转化率评估方法及装置
CN112116426A (zh) 一种推送物品信息的方法和装置
CN112868003A (zh) 使用用户互动度的基于实体的搜索系统
US10331713B1 (en) User activity analysis using word clouds
CN116823410B (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN111753151A (zh) 一种基于互联网用户行为的服务推荐方法
CN115858815A (zh) 确定映射信息的方法、广告推荐方法、装置、设备及介质
JP5384567B2 (ja) 潜在クラス分析装置、潜在クラス分析方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190305

R150 Certificate of patent or registration of utility model

Ref document number: 6494777

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250