JP2018536937A - プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体 - Google Patents

プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体 Download PDF

Info

Publication number
JP2018536937A
JP2018536937A JP2018526889A JP2018526889A JP2018536937A JP 2018536937 A JP2018536937 A JP 2018536937A JP 2018526889 A JP2018526889 A JP 2018526889A JP 2018526889 A JP2018526889 A JP 2018526889A JP 2018536937 A JP2018536937 A JP 2018536937A
Authority
JP
Japan
Prior art keywords
feature
predicted value
standard deviation
variation
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018526889A
Other languages
English (en)
Other versions
JP6547070B2 (ja
Inventor
磊 姜
磊 姜
戈 ▲陳▼
戈 ▲陳▼
列▲瓊▼ 江
列▲瓊▼ 江
磊 ▲劉▼
磊 ▲劉▼
▲東▼波 黄
▲東▼波 黄
文杰 李
文杰 李
浩 黄
浩 黄
俊青 谷
俊青 谷
▲偉▼ 黄
▲偉▼ 黄
志 江
志 江
弘 ▲張▼
弘 ▲張▼
▲瀾▼ 徐
▲瀾▼ 徐
思宇 朱
思宇 朱
▲偉▼ 金
▲偉▼ 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2018536937A publication Critical patent/JP2018536937A/ja
Application granted granted Critical
Publication of JP6547070B2 publication Critical patent/JP6547070B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本発明の実施形態は、プッシュ情報を粗選択するための方法および装置を開示する。方法は、予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定するステップと、フィーチャの標準偏差を計算するステップと、標準偏差の変動確率を決定するステップと、重み、標準偏差、および変動確率に基づいて予測値を計算するステップであって、標準偏差および変動確率が、重みを補正する変動値の計算に使用される、ステップと、予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択するステップとを含む。本発明の実施形態は、コンピュータ記憶媒体も開示する。

Description

本開示は、情報処理の分野に関し、詳細には、プッシュ情報を粗選択およびソーティングするための方法および装置、ならびにコンピュータ記憶媒体に関する。
情報技術の発展に伴い、既存の技術は常に、情報プッシュの分野における情報プッシュの効率を改善するために、情報プッシュのターゲットユーザを決定するという問題の解消に向けられている。情報プッシュは、広告プッシュ、ならびにユーザに推奨されるビデオ、オーディオ、および写真とテキスト情報、などを含む。ユーザの興味のあるプッシュ情報をユーザに送るために、またプッシュ情報の送信およびリソース有効利用を改善するために、さまざまなプッシュ情報の人気度のソーティングが予測される。予測時には、予測値の粗選択およびソーティング、ならびに正確な選択およびソーティングが含められる。粗選択およびソーティング時に、人気度が比較的高いわずかな量のプッシュ情報が、何千ものプッシュ情報からプッシュ情報の現在のデータに従って選択され、次いで、正確な選択およびソーティング時に、粗選択されたプッシュ情報の人気度、および粗選択されたプッシュ情報がビューまたはクリックされる予測確率が、さらに正確にソーティングされる。しかし、既存の技術においては、通常、一部のプッシュ情報がユーザに非常に人気があり、そのプッシュ情報には、プッシュ時間が短いという問題があり、その結果、粗選択時にそのプッシュ情報がフィルタリングされてしまい、それによって、処理結果の精度が低いという問題が生じる、ということが分かっている。
上記に鑑みて、本発明の実施形態は、粗選択結果の精度が低いという問題を少なくとも一部解消するために、プッシュ情報を粗選択およびソーティングするための方法および装置、ならびにコンピュータ記憶媒体を提供しようとするものである。
実施形態の技術的解決策は、このようにして実現される。
本発明の実施形態の第1の態様は、プッシュ情報を粗選択するための方法であって、
予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定するステップと、
フィーチャの標準偏差を計算するステップと、
標準偏差の変動確率を決定するステップと、
重み、標準偏差、および変動確率に基づいて予測値を計算するステップであって、標準偏差および変動確率が、重みを補正するための変動値の計算に使用される、ステップと、
予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択するステップと
を含む方法を提供する。
本発明の実施形態の第2の態様は、プッシュ情報を粗選択するための装置であって、決定ユニットと、計算ユニットと、選択ユニットとを含み、
決定ユニットが、予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定することを行うように構成され、
計算ユニットが、フィーチャの標準偏差を計算することを行うように構成され、
決定ユニットがさらに、標準偏差の変動確率を決定することを行うように構成され、
計算ユニットがさらに、重み、標準偏差、および変動確率に基づいて予測値を計算することであって、標準偏差および変動確率が、重みを補正するための変動値の計算に使用される、計算することを行うように構成され、
選択ユニットが、予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択することを行うように構成される
装置を提供する。
本発明の実施形態の第3の態様は、コンピュータ記憶媒体であって、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令が、プッシュ情報を粗選択するための方法の実施に使用される、コンピュータ記憶媒体を提供する。本発明の実施形態において提供される、プッシュ情報を粗選択するための方法および装置、ならびにコンピュータ記憶媒体では、粗選択のための予測値が計算されるときに、フィーチャの標準偏差が決定され、フィーチャに対応する変動確率が決定され、標準偏差および変動確率が、フィーチャに対応する重みを補正するための変動値の計算に使用され得る。このようにして、標準値が比較的大きく変動するとき、現在のところは履歴プッシュデータが比較的わずかなプッシュ情報が、粗選択されたプッシュ情報として、後続の正確な選択に入って再選択される機会を得る。その結果、良好なプッシュ効果のある、一部のオーダーが、履歴プッシュデータがわずかであることにより粗選択の際にフィルタリングされてしまい、結果として、良好なプッシュ効果のあるプッシュ情報が選択され得ないという、既存の技術における問題がついに解消され得、それにより、粗選択の精度が改善する。
本発明の一実施形態による、プッシュ情報を粗選択するための第1の方法の概略フローチャートである。 本発明の一実施形態による、プッシュ情報を粗選択するための第2の方法の概略フローチャートである。 本発明の一実施形態による、プッシュ情報を粗選択するための第1の装置の概略構造図である。 本発明の一実施形態による、プッシュ情報を粗選択するための第2の装置の概略構造図である。 本発明の一実施形態による、予測値の計算の概略フローチャートである。
本発明の技術的解決策についてはさらに、下で、本明細書の添付の図面を参照し、本明細書の具体的実施形態に即して、詳細に述べる。下で説明する好ましい実施形態は、本開示について説明および解説するために使用されているにすぎず、本開示を限定するために使用されているのではないことを理解されたい。
図1に示すように、一実施形態は、プッシュ情報を粗選択するための方法であって、以下を含む方法を提供する。
ステップS110:予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定する。
ステップS120:フィーチャの標準偏差を計算する。
ステップS130:標準偏差の変動確率を決定する。
ステップS140:重み、標準偏差、および変動確率に基づいて予測値を計算し、標準偏差および変動確率が、重みを補正する変動値の計算に使用される。
ステップS150:予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択する。
本実施形態におけるプッシュ情報は、広告などの情報を含んでよい。広告は、本明細書では、社会的広告など、さまざまなタイプの広告を含んでよい。本実施形態におけるプッシュ情報を粗選択するための方法は、さまざまなプッシュ情報のプッシュプラットフォームに利用されてもよく、情報を効果プッシュとして使用することを決定するさまざまな選択デバイスに使用されてもよい。
本実施形態では、ステップS110は、「プッシュ情報の履歴プッシュデータに従って」を含む。履歴プッシュデータは、本明細書では、広告に対応し、履歴広告データを含んでよい。履歴広告データは、本明細書では、クリック、ビュー、または広告によって期待されるコンバージョン行動の実行をするシードユーザ、行動有効期限、クリック率、コンバージョン率、広告掲載位置、および広告掲載時間など、プッシュ過程においてプッシュ情報に基づいて生成されるさまざまなデータを含んでよい。コンバージョン行動は、アプリケーション(APP)のダウンロードや、対応するプッシュ情報の中で促進されたサービスおよび商品の購入など、プッシュ情報がユーザに実施することを望む操作を含んでよい。
本実施形態では、ステップS120において計算される標準偏差は、フィーチャについての標準偏差である。標準偏差は、本明細書では、フィーチャが指定値であるときの履歴プッシュデータ内の操作結果の標準偏差である。操作結果は、本明細書では、そのフィーチャが指定値であるユーザがプッシュデータによって期待される操作を実施するかどうかを示す値を表すために使用される。例として、広告Aを例として使用して、対応するフィーチャが年齢である。4つのビットがそれぞれ、4つの異なる年齢グループを表す場合、ユーザCが第1の年齢グループに含まれると仮定すると、第1の年齢グループに対応する第1のビットが1であり、他のビットが0である。この場合、年齢というフィーチャの値は1000である。標準偏差が計算されるとき、その年齢フィーチャが1000である履歴プッシュデータのデータ行が使用される場合、これらのデータ行は、ユーザが広告Aをクリックするかどうかについての操作結果の列を含む。操作結果の列内で、「1」は広告をクリックすることを表し、「0」は広告をクリックしないことを表すものと仮定する。例えば、履歴プッシュデータのデータ行のうち、50個のデータ行の年齢フィーチャの値が1000であり、標準偏差の値を求めるために、結果列のうちの50列がサンプルデータとして抽出される。値が求められる標準偏差は、第1の年齢グループにおける、年齢フィーチャの標準偏差である。予測値が計算されるとき、プッシュ情報を受領する1組のユーザが決定され、これらのユーザの年齢フィーチャが抽出される。例えば、第1の年齢グループに含まれるユーザの間で、プッシュされた広告をクリックする確率値が計算される。別の例として、フィーチャの値が「性別が女性であること」であり、「性別が女性であること」というフィーチャの標準偏差が、履歴プッシュデータ内の、プッシュ情報によって期待されるコンバージョン操作の女性による実行の標準偏差である。例えば、この標準偏差は、女性による広告のクリックの標準偏差である。
ステップS130において、標準偏差の変動確率が決定され、本実施形態では、変動確率は、プリセットアルゴリズムを使用することによって決定されてよく、例えば、変動確率は、ランダムアルゴリズムを使用することによって決定される。ランダムアルゴリズムは、本明細書では、ガウスランダムアルゴリズムを含む。
ステップS140において、重み、標準偏差、および変動確率に基づいて予測値が計算される。重みは、本明細書では、それに応じて予測値を計算する各フィーチャの重みである。
本実施形態における予測値の計算に加わるフィーチャは、プッシュ情報のフィーチャおよびユーザフィーチャを含んでよい。プッシュ情報は、本明細書では、プッシュ位置およびプッシュ識別子を含んでよい。プッシュ識別子は、本明細書では、プッシュ情報のシーケンス番号とすることができる。プッシュ位置は、プッシュ情報がリリースされるリリース位置を含んでよい。リリース位置は、本明細書では、ソーシャルアプリケーション、例えばWechatモーメンツ、アプリケーションログインインターフェースの最初のページ、およびアプリケーションページのページヘッダ部上での、情報リリース位置を含んでよい。確実なことには、リリース位置は、本明細書では、ブラウザの最初のページ、ブラウザのサイド広告位置、フローティングウィンドウなどを含んでよい。ユーザフィーチャは、プッシュ情報を読み、プッシュ情報をクリックし、またはプッシュ情報によって期待される他のコンバージョン行動を実行するユーザのフィーチャを含んでよい。これらのユーザフィーチャは、ユーザの年齢、性別、職業、行動嗜好、趣味、および消費水準など、ユーザ特性を表すことのできる、さまざまなフィーチャを含んでよい。
本実施形態では、プッシュ情報の継続的なリリース、およびプッシュ情報によって期待されるコンバージョン行動のユーザによる実行の確率を表すために、予測値が使用され得る。例えば、ある時間期間にわたって広告Aがリリースされており、広告Aのリリースによって生成された履歴広告データに従って、フィーチャ標準偏差が計算される。ステップS130において、変動確率が決定され、ステップS140において、標準偏差および変動確率を使用することによって、重みが補正されて、補正された重みが取得され、次いで、補正された重みを使用することによって、広告Aが後にクリックされる確率が予測される。
予測値は、ステップS140において以下の式を使用することによって、具体的に計算され得る。
前述の式では、yは予測値であり、xiはフィーチャiの値であり、wiはフィーチャiの重みであり、σiは、フィーチャの標準偏差である。予測値は、本実施形態では、ロジスティック回帰アルゴリズムを使用することによって計算される。具体的実装時には、予測値は、ベイジアンアルゴリズムを使用することによって計算されてもよい。
は、変動確率および標準偏差に基づく計算によって取得される、補正された重みである。ベイジアンアルゴリズムでは、元の重みが、補正された重みと置換され得、したがって、本実施形態における予測値もやはり、計算によって取得される。本実施形態では、合計でI個のフィーチャがあり、iの値が1からIであることに留意されたい。Iは、1以上の整数である。
は、eの指数であることに留意されたい。eは自然定数である。
具体的実装時には、さまざまなプッシュ情報の予測値に従って、予測値がソートされ得、上位にランク付けされたプッシュ情報が次いで、今回の、プッシュ情報を粗選択した粗選択結果として選択され、またはその予測値が粗選択しきい値より大きいプッシュ情報が、今回の、プッシュ情報を粗選択した粗選択結果として使用される。結論として、本実施形態におけるステップS140が実施された後、予測値に基づいて、プリセット条件を満足させるプッシュ情報がやはり選択され得る。選択されたプッシュ情報は、効果プッシュのプッシュ情報として使用され得る。効果プッシュは、プッシュ効果に基づいて利益を生むプッシュ操作とすることができる。
本実施形態では、重みを補正するために、標準偏差および変動確率が導入される。このようにして、現在のところはプッシュ時間が比較的短いまたはプッシュ量が比較的わずかであるものの、期待されるプッシュ効果を達成するプッシュ情報が、コンテストに加わると、プッシュ量が比較的わずかなプッシュ情報が、プッシュ量が比較的わずかであることにより粗選択時に見逃されてしまうという状況が軽減され、それにより、良好なプッシュ効果のあるプッシュ情報が粗選択時に選択される状況が改善する。例えば、広告はオーダーによって識別される。広告は、オーダーがあると、広告プラットフォームに掲載され得る。掲載時間が短い、または掲載量がわずかであることにより、広告には履歴広告データが比較的わずかしかない。既存の技術を使用することによってオーダーが粗選択される場合、掲載量がわずかな、または掲載時間が短い広告は、容易にスクリーニングされてしまうことがあり、その結果、粗選択された広告は、最良の掲載効果のある1つまたは複数の広告ではなく、それによって、粗選択の精度が低いといった現象が生じる。しかし、本実施形態における情報処理方法を用いて、変動確率および標準偏差を導入することによって、履歴プッシュデータがわずかであることが原因でデータの変動が大きく、良好なプッシュ効果のあるプッシュ情報を見逃してしまう、という状況が軽減され、それにより、粗選択の精度が改善する。
いくつかの実施形態では、方法がさらに、
変動係数を決定するステップであって、変動係数が、変動値の値範囲を制限するために使用される、ステップ
を含む。
ステップS140は、重み、標準偏差、変動確率、および変動係数に基づいて予測値を計算するステップを含んでよい。
本実施形態の方法には変動係数も導入され、変動係数は、本明細書では、変動値の値範囲を制限するために使用される。フィーチャの標準偏差が過度に大きいとき、前述の実施形態の方法が使用される場合は、変動値の値が過度に大きくなり得る。本実施形態では変動係数が導入され、変動係数は、変動確率および標準偏差に基づいて取得された結果との乗算演算を実施して、変動値を取得するために使用され得る。本実施形態では、変動係数は通常、0より大きく1以下の整数である。変動係数の値が0である場合、本例では、変動値は0となり得る。この場合、重みは補正されず、したがって、履歴プッシュデータのデータ量がわずかであることが原因で標準偏差の変動が大きいという現象が顧みられない。変動係数は、プリセットパラメータとすることができ、具体的には、履歴操作記録に従って取得される経験値、または1回もしくは複数回の実験による実験データから取得される実験値とすることができ、結論として、本実施形態のプッシュ情報を粗選択するための方法が計算されるときに、前もって知られ得る値とすることができる。本実施形態では、変動係数は、変動値が過度に大きいまたは過度に小さいという事態を回避して、フィーチャ値の変動が過度に大きいことにより計算結果が十分正確ではないという状況を回避するように、変動値を調整するために導入され、それによって、粗選択の精度がさらに改善する。
図2は、一実施形態による、プッシュ情報を粗選択するための方法の別の概略フローチャートである。この方法は、具体的には、プッシュ情報フィーチャおよびユーザフィーチャを抽出するステップと、標準偏差を計算するステップであって、予測値を計算するための、フィーチャのさまざまな標準偏差を計算するステップを含む、ステップと、標準偏差を計算する間、計算する前、または計算した後に、変動係数を決定し、安全因子を決定し、変動確率を決定するステップと、次いで、変動確率、標準偏差、変動係数、および安全因子に基づいて予測値を計算するステップと、最後に、予測値をソーティングして、ソーティング結果を生成するステップと、ソーティング結果に基づいて、その予測値がプッシュ結果として上位にランク付けされているプッシュ情報を選択するステップとを含む。
いくつかの他の実施形態では、方法がさらに、
変動係数を決定するステップであって、変動係数が、変動値の値範囲を制限するために使用される、ステップ
を含む。
ステップS140は、重み、標準偏差、変動確率、および変動係数に基づいて予測値を計算するステップを含んでよい。
方法はさらに、
安全因子を決定するステップであって、安全因子が、標準偏差が特定の値であるとき、または標準偏差が取得されないときに生じる、変動値の異常解を防ぐために使用される、ステップ
を含む。
ステップS140は、
重み、標準偏差、変動確率、および安全因子に基づいて予測値を計算するステップ
を含んでよい。
本実施形態では安全因子が導入される。標準偏差が異常または極端な状況にある場合、標準偏差が異常であるということをどのように判定するか。例として、標準偏差の値が特定の値であり、具体的には、標準偏差が0である。本実施形態では、標準偏差を取得しないときも標準偏差異常であり、通常、標準偏差が取得されない場合、標準偏差は0としてデフォルト設定される。標準偏差が0である場合、それによって、変動値が0となり得る。安全因子が本実施形態に導入される。安全因子は通常、極めて小さい正の数である。本実施形態では、安全因子は、所定の値未満の定数であり、例えば、通常は、千分の1以下の定数である。例えば、安全因子の値は、1万分の1である。
標準偏差が正常であるとき、極めて小さい値は、変動値の計算に対して極めてわずかな干渉を行うためである。標準偏差が異常であるとき、安全因子は極めて小さい正の数であり、したがって、変動値は0ではなく、変動値は通常、極めて小さい。このようにして、安全因子を導入したことにより、電子デバイスは、異常変動値によって生じる異常予測値現象を計算する。
本実施形態に対するさらなる改善として、変動確率、標準偏差、安全因子、および変動係数に基づく利用可能な例を、下に具体的に提示する。ステップS140は、
予測値yを、以下の式、
を使用することによって計算するステップ
を含んでよく、
上式で、xiはフィーチャiの値であり、wiはフィーチャiの重みであり、αは変動係数であり、βは安全因子であり、σiはフィーチャの標準偏差である。
明らかに、本実施形態では、σiは0になり得ない。σiが0である場合、
は異常であり、それによって、変動値異常が生じる。このようにして、予測値計算の異常が生じる。確実なことには、具体的実装時には、プッシュ情報のフィーチャ値の標準偏差が0である状況は、ほとんど発生しない。
本実施形態では、合計でI個のフィーチャがあり、iの値が1からIであることに留意されたい。Iは、1以上の整数である。
前述の式によれば、プッシュ情報を粗選択するための予測値が、好都合かつ正確に計算され得、計算過程において異常が発生する確率は比較的低く、変動値の値範囲は制御範囲内にあり、それにより、プッシュ情報の粗選択の精度が大いに改善する。
図1に示すように、本実施形態の一実施形態は、プッシュ情報を粗選択するための別の方法であって、以下を含む方法を提供する。
ステップS110:予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定する。
ステップS120:フィーチャの標準偏差を計算する。
ステップS130:標準偏差の変動確率を決定する。
ステップS140:重み、標準偏差、および変動確率に基づいて予測値を計算し、標準偏差および変動確率が、重みを補正する変動値の計算に使用される。
ステップS150:予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択する。
第1に、本実施形態のプッシュ情報を粗選択するための方法は、前述の実施形態の任意の技術的解決策に対して改善したものである。例えば、ステップS140は、実施形態3において提示される式を使用して、予測値を計算してよい。本実施形態は、ステップS110が、
予測値を計算するためのプッシュ情報フィーチャを決定するステップ、および
予測値を計算するためのユーザフィーチャを決定するステップ
を含み得るという点で、前述の実施形態とは異なる。
プッシュ情報フィーチャは、プッシュ情報のリリース位置、リリース時間、プッシュ情報の持続時間、プッシュ情報の情報ボリューム、およびプッシュ情報の識別子など、さまざまな情報を含んでよい。
ユーザフィーチャは、予測値を計算するために使用され、ユーザフィーチャは、本明細書では、ユーザの年齢、性別、皮膚の色、国籍、および職業など、さまざまなフィーチャを含んでよい。Iの値は、本実施形態では、プッシュ情報フィーチャの数量とユーザフィーチャの数量の和とすることができる。
既存の技術では、プッシュ情報が粗選択されるとき、プッシュ情報は通常、単にプッシュ情報フィーチャに従って粗選択され、それによって、フィーチャ特性がプッシュ情報のプッシュ効果に及ぼす影響を顧みないという結果となって、良好なプッシュ効果のあるプッシュ情報が低い予測値を有するという状況が生じる。第1に、ユーザフィーチャが本実施形態に導入され、ユーザフィーチャは、予測値を計算するためのフィーチャとして使用される。実施形態1から実施形態3において提示される技術的解決策を参照すると、x1をプッシュ情報フィーチャまたはユーザフィーチャの値とすることができ、それによって、プッシュ情報の粗選択の精度がさらに改善する。第2に、本実施形態では、ユーザフィーチャを決定することによって、すべてのユーザフィーチャではなく、ユーザのわずかな数量のユーザフィーチャが、予測値を計算するためのユーザフィーチャとして選択される。このようにして、ユーザフィーチャが過度に多いことにより大きな計算量が生まれることが、回避され得る。例えば、本実施形態では、指定数量のユーザフィーチャが予測値の計算に加わることが決定される。指定数量は所定の値であり、通常、指定数量は、1以上、好ましくは2以上の整数である。
プッシュ情報フィーチャが選択される場合は、既存の技術を参照されたい。本明細書では、詳細は提供されない。ユーザフィーチャをスクリーニングするための複数の様式がある。2つのオプション様式を下に提示する。
オプション様式1:
ステップS110において予測値を計算するためのユーザフィーチャを決定するステップが、
ユーザフィーチャの信頼度を決定するステップ、および
この信頼度に基づいて、予測値を計算するためのユーザフィーチャを選択するステップ
を含み得る。
本実施形態では、信頼度は、ユーザフィーチャの現実性および正当性の確率とすることができる。ユーザフィーチャの信頼度は、ユーザフィーチャを取得するための様式に従った値割当てによって決定され得る。例えば、取得様式は、ユーザ入力に基づいて決定されるフィーチャ、ならびに電子デバイスによって情報処理および統合を自動的に実施することによって取得されるフィーチャを含み得る。例えば、ユーザは、ソーシャルネットワークにおいて、性別、年齢、出身校などを埋める。電子デバイスによって統合されるフィーチャは、ユーザ操作に基づいて決定されるユーザ行動嗜好などのフィーチャを含む。信頼度が決定されるとき、信頼度は、ユーザフィーチャのフィーチャ属性に従って決定されてもよい。例えば、電子デバイスが、ユーザがある話題に注目すべくログインする頻度情報に関する統計値、およびユーザによって埋められる頻度情報を収集する。この場合、ユーザフィーチャ属性および情報源が参照され得る。この場合、信頼度が決定されるとき、電子デバイスの頻度情報の統計値のほうが、たいていの場合、ユーザによって埋められる頻度情報より正確なので、信頼度に値が割り当てられるときに、電子デバイスが頻度情報に関する統計値を収集している場合は、より高い値が割り当てられ、頻度情報がユーザによって埋められている場合は、より低い値が割り当てられる。別の例として、ユーザ性別について、電子デバイスは、ユーザ行動特性を使用することによって、ユーザが女性ユーザであるかそれとも男性ユーザであるかを分析し得る。しかし、明らかに、比較的トランスペアレントなソーシャルアプリケーションまたは知人ソーシャルイベントでは、ユーザまたは友人によって埋められるユーザ性別のほうが、ユーザ行動特性に従って電子デバイスによって分析されるユーザ性別より正確である。この場合、2つの様式、すなわちフィーチャ属性と情報源を参照して、信頼度に値が割り当てられる。具体的実装時には、ユーザフィーチャの信頼度を決定するための複数の様式があり、それらの様式は、本実施形態では1つずつ例として使用されない。
信頼度が決定されると、その信頼度に従って、予測値を計算するためのユーザフィーチャが選択される。信頼度の昇順に従って、上位にランク付けされているN個の信頼度に対応するユーザフィーチャが、予測値を計算するためのユーザフィーチャとして選択される。別の例として、その信頼度が信頼度しきい値より大きいユーザフィーチャが、予測値のユーザフィーチャとして選択される。
オプション様式2:
ステップS110において予測値を計算するためのユーザフィーチャを決定するステップが、
ユーザフィーチャから、予測値を計算するためのユーザフィーチャとして1つまたは複数の非処理ユーザフィーチャを選択するステップ
を含み得る。
本実施形態では、ユーザフィーチャが、被処理フィーチャと非処理フィーチャとに分割される。被処理フィーチャは、複数の情報の処理に基づいて取得されるフィーチャであり、非処理フィーチャは、ユーザによって埋められる、二次的な情報統合などの様式で決定されるのではない、フィーチャを含み得る。例えば、身分証明書をスキャンすることによって取得される年齢、名前、身分証明書番号、および原籍地はすべて、非処理フィーチャである。別の例として、ユーザがアプリケーションAを開く、記録された統計的頻度に従って、他の情報との二次的な統合処理によってではなく直接的な統計的演算を使用することによって取得されるフィーチャも、非処理フィーチャとすることができる。被処理フィーチャは、定められた非処理フィーチャを除くすべてのフィーチャとすることができる。例えば、ユーザによる商品およびサービスの購入や旅行のチケットの予約などの方法に従って決定されるユーザの消費水準、というユーザフィーチャは、ユーザ購入行動、予約行動などと統合され、したがって、被処理フィーチャである。
非処理フィーチャの非処理、すなわち、決定の直接性のため、非処理フィーチャは、被処理フィーチャの精度より高い精度を有する。したがって、本実施形態では、1つまたは複数の非処理フィーチャが、予測値を計算するためのユーザフィーチャとして使用される。予測値を計算するためのユーザフィーチャの数量は、静的なプリセット値であってもよく、動的に決定される動的な値であってもよい。例えば、すべての非処理フィーチャが、本実施形態における予測値を計算するためのユーザフィーチャとして使用されるなら、この場合、予測値を計算するためのユーザフィーチャの数量は、動的に決定される。確実なことには、プリセット値が予め決定されてよく、それによって、プリセット数量の非処理フィーチャが、複数の非処理フィーチャから、予測値を計算するためのユーザフィーチャとして選択される。したがってこの場合、そのためには、いくつかの非処理フィーチャを、予測値を計算するためのユーザフィーチャとして選択する仕方が必要となり得る。例えば、非処理フィーチャに対して前もって優先度が設定されてよく、その優先度に従って、予測値を計算するためのいくつかのユーザフィーチャが選択される。
本実施形態では、ユーザの基本的ユーザフィーチャが、好ましくは、予測値を計算するためのユーザフィーチャとして選択されてよく、例えば、年齢、性別、職業、地域、および学歴など、ユーザの比較的基本的な情報が、予測値を計算するためのユーザフィーチャとして選択される。確実なことには、これらの基本的情報は、ユーザまたは友人によって埋められてよく、また信頼度が比較的高いユーザフィーチャであり得、精度が比較的高い非処理フィーチャが、予測値を計算するためのユーザフィーチャとして選択され得る。
本実施形態では、第1に、ユーザフィーチャが、プッシュ情報の粗選択に加わるように導入され、それによって、プッシュ情報を粗選択するためにプッシュ情報フィーチャのみが使用されることから生じる、精度が低いという状況が軽減される。加えて、ユーザフィーチャの選択によって、一部のユーザフィーチャのみが計算のために選択されて、情報量が低減し、粗選択の効率の低下が回避される。最後に、ユーザフィーチャが選択されるとき、ユーザフィーチャが信頼度に従って選択されてもよく、非処理フィーチャが、計算に加わるように選択されてもよい。どの様式でユーザフィーチャが選択されるかに関わらず、計算の精度はこの場合も改善し得る。
図3に示すように、一実施形態は、プッシュ情報を粗選択するための装置であって、決定ユニット110と、計算ユニット120と、選択ユニット130とを含み、
決定ユニット110が、予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定することを行うように構成され、
計算ユニット120が、フィーチャの標準偏差を計算することを行うように構成され、
決定ユニット110がさらに、標準偏差の変動確率を決定することを行うように構成され、
計算ユニット120がさらに、重み、標準偏差、および変動確率に基づいて予測値を計算することであって、標準偏差および変動確率が、重みを補正する変動値の計算に使用される、計算することを行うように構成され、
選択ユニット130が、予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択することを行うように構成される、
装置を提供する。
決定ユニット110および選択ユニット130の具体的な構造は、プロセッサまたは処理回路に対応していてよい。プロセッサは、アプリケーションプロセッサ、中央処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、またはプログラマブルアレイなどの処理構造を含んでよい。処理回路は、専用集積回路を含んでよい。
決定ユニット110および選択ユニット130は、異なるプロセッサまたは処理回路に別々に対応していてもよく、同じプロセッサまたは処理回路に対応するように統合されてもよい。決定ユニット110および選択ユニット130が、同じプロセッサまたは処理回路に対応するように統合されるとき、プロセッサまたは処理回路は、決定ユニット110および選択ユニット130の機能を、時分割多重またはスレッド並行処理によって別々に実現してよい。
本実施形態における計算ユニット120の具体的な構造は、計算機または計算機能を有するプロセッサの構造に対応していてよい。計算ユニット120は、最初に、標準偏差を計算し、次いで、標準偏差および変動確率を使用することによって変動値を計算し、変動値および重みを使用することによって補正された重みを計算し、最後に、補正された重みおよびフィーチャの値に基づいて予測値を計算するために、使用される。
図4に示すように、一実施形態は、プロセッサ220と、記憶媒体240と、ディスプレイ250と、少なくとも1つの外部通信インターフェース210とを含む、プッシュ情報を粗選択するための装置を提供する。プロセッサ220、記憶媒体240、および外部通信インターフェース210はすべて、バス230を使用することによって接続されている。プロセッサ220は、マイクロプロセッサ、中央処理ユニット、デジタル信号プロセッサ、またはプログラマブルロジックアレイなど、処理機能をもつ電子部品および構成要素であってよい。コンピュータ実行可能命令が、記憶媒体240上に記憶される。プロセッサ220は、前述の方法、具体的には、例えば、予測値を計算するためのフィーチャ、およびこのフィーチャに対応する重みを、プッシュ情報の履歴プッシュデータに従って決定するステップ、フィーチャの標準偏差を計算するステップ、標準偏差の変動確率を決定するステップ、重み、標準偏差、および変動確率に基づいて予測値を計算するステップであって、標準偏差および変動確率が、重みを補正する変動値の計算に使用される、ステップ、ならびに予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択するステップ、のうちのいずれか1つを実施するために、記憶媒体240内に記憶されたコンピュータ実行可能命令を実行する。
本実施形態では、標準偏差、変動確率、および予測値の関連説明については、対応する実施形態を参照されたい。ここでは詳細は提示しない。例えば、変動確率はランダム確率であってよい。例えば、変動確率はガウスランダム確率値に等しい。
本実施形態における、プッシュ情報を粗選択するための装置は、プッシュ情報を粗選択するための1つまたは複数のサーバからなる構造であってよい。サーバは、広告などのプッシュ情報のプラットフォーム内に位置するデバイスであってよい。結論として、本実施形態における、プッシュ情報を粗選択するための装置は、プッシュ情報を粗選択するという前述の方法に対する実装ハードウェアを提供し、プッシュ情報の粗選択の精度が高いという特徴を有する。
一実施形態では、決定ユニット110がさらに、変動係数を決定することを行うように構成され、変動係数は、変動値の値範囲を制限するために使用され、
計算ユニット120が、重み、標準偏差、変動確率、および変動係数に基づいて予測値を計算することを行うように構成される。
本実施形態では、決定ユニット110が、ヒューマン-マシン相互作用インターフェースに対応していてよく、作業スタッフによって入力された変動係数が、ヒューマン-マシン相互作用インターフェースを使用することによって受領されてよい。確実なことには、決定ユニット110は、やはりプロセッサまたは処理回路に対応していて、コンピュータ記憶媒体内に予め記憶されている変動係数を読み出してもよく、通信インターフェースに対応しており、それによって、他の電子デバイスが変動係数を見い出し、または受領してもよい。
本実施形態では、計算ユニット120が、重み、標準偏差、変動確率、および変動係数に従って、予測値を具体的に計算する。変動係数、標準偏差、または変動確率は、変動値を計算するためのパラメータである。具体的な計算の関数関係または方法については、前述の実施形態を参照されたい。具体的な計算の関数関係または方法については、本実施形態では繰り返し述べない。
結論として、本実施形態に変動係数を導入することによって、標準偏差が過度に大きいことにより予測値が異常となる状況が軽減され、それによって、計算の精度が改善する。
別の実施形態では、決定ユニット110がさらに、変動係数を決定することを行うように構成され、変動係数は、変動値の値範囲を制限するために使用され、
計算ユニット120が、重み、標準偏差、変動確率、および変動係数に基づいて予測値を計算することを行うように構成される。
一実施形態では、決定ユニット110が、安全因子を決定することを行うように構成され、安全因子は、標準偏差が特定の値であるとき、または標準偏差が取得されないときに生じる、変動値の異常解を防ぐために使用され、
計算ユニット120が、重み、標準偏差、変動確率、および安全因子に基づいて予測値を計算することを行うように構成される。
安全因子が本実施形態に導入される。安全因子は、千分の1未満の定数などの極めて小さい値とすることができる。本実施形態では、決定ユニット110に対応するハードウェア構造について、前述の実施形態における変動係数の、定められたハードウェア構造を参照されたい。しかし、本実施形態において決定される安全因子には、相違点がある。本明細書における標準偏差異常は、標準偏差が所定の異常値であることを含み得、または異常値を取得しないこと、もしくは異常条件を満足させる他の標準偏差取得状況であり得る。
確実なことには、本実施形態の実施形態における安全因子は、変動係数、標準偏差、および変動確率と同様に、変動値の計算に加わる従属変数である。
本実施形態では、計算ユニット120は、安全因子に基づいて変動値を計算し、それによって、変動値異常が予測値異常を生じさせるのを回避し、計算過程における異常状況の発生を低減させる。
予測値を計算するための複数の関数関係がある。本実施形態では、予測値yを、以下の式、
を使用することによって計算するために、計算ユニット120が使用され、
上式で、xiはフィーチャiの値であり、wiはフィーチャiの重みであり、αは変動係数であり、βは安全因子であり、σiはフィーチャの標準偏差である。
確実なことには、計算ユニットは、ベイジアンアルゴリズムまたはロジスティック回帰アルゴリズムを使用することによって予測値を計算してよい。アルゴリズムは、前述のアルゴリズムに限定されない。
結論として、本実施形態は、予測値を具体的に計算する装置を提供する。この装置は、予測値に従ったプッシュ情報の粗選択の精度が高いという特性を有し、構造が単純であり実装に好都合であるという特性も有する。
いくつかの実施形態では、決定ユニット110が、予測値を計算するためのプッシュ情報フィーチャを決定すること、および予測値を計算するためのユーザフィーチャを決定することを行うように構成される。
本実施形態における決定ユニット110のハードウェア構造は、前述の実施形態において提示された決定ユニットのハードウェア構造に類似している。本実施形態における決定ユニット110によって決定される、予測値を計算するために使用されるフィーチャは、プッシュ情報フィーチャおよびユーザフィーチャを含むことに留意されたい。プッシュ情報フィーチャは、プッシュ位置やプッシュ時間など、さまざまなプッシュ情報を含んでよく、ユーザフィーチャは、ユーザのさまざまな形態のフィーチャを含んでよい。
このようにして、本実施形態のプッシュ情報を粗選択するための装置は、予測値を計算するときにプッシュ情報フィーチャならびにユーザフィーチャに注目し、認識されたユーザフィーチャとプッシュ情報フィーチャを分けて考えず、それによって、予測値が計算されるときに、ユーザフィーチャがプッシュ効果に及ぼす影響が顧みられない、という事態が回避され、したがって、プッシュ情報の粗選択の精度がこの場合も改善する。
決定ユニット110に対応する複数のオプション構造がある。2つのオプション構造を下に提示する。
オプション構造1:
決定ユニット110が、ユーザフィーチャの信頼度を決定すること、およびこの信頼度に基づいて、予測値を計算するためのユーザフィーチャを選択することを行うように構成される。この場合、決定ユニット110は、やはりプロセッサまたは処理回路に対応していてもよく、比較器に対応していてもよい。例えば、比較器による比較によって、その信頼度が信頼度しきい値より大きいユーザフィーチャが、予測値を計算するためのユーザフィーチャとして選択される。
オプション構造2:
決定ユニット110が、ユーザフィーチャから、予測値を計算するためのユーザフィーチャとして1つまたは複数の非処理ユーザフィーチャを選択することを行うように、特定的に構成される。本実施形態では、決定ユニット110に対応するハードウェア構造はやはり、プロセッサまたは処理回路を含んでいてよい。ユーザフィーチャを非処理フィーチャと被処理フィーチャとに分割することによって、1つまたは複数の非処理フィーチャが、予測値を計算するためのユーザフィーチャとして選択される。
結論として、第1に、本実施形態のプッシュ情報を粗選択するための装置では、予測値を計算するためにユーザフィーチャが導入され、予測値に基づいてプッシュ情報を粗選択した結果が、精度が高いという特性を有する。第2に、計算にユーザフィーチャを導入することによって生じる、計算量が大きいという問題が、ユーザフィーチャをスクリーニングすることによって回避され得る。第3に、信頼度が高いユーザフィーチャ、またはユーザ特性を正確に表すことのできる、非処理フィーチャなどのユーザフィーチャが、計算に加わるように選択され、それにより、粗選択結果の精度がこの場合も改善する。
具体例を下に提示する。
本例におけるプッシュ情報は、広告とすることができ、本例は、前述の実施形態において記録された任意の技術的解決策に基づいて、広告を粗選択するための方法を提示する。本実施形態では、
本例では、広告の予測値yが、以下の式を使用することによって計算され、予測値は、広告がクリックされる確率とすることができる。
上式で、xiはフィーチャiの値であり、wiはフィーチャiの重みであり、αは変動係数であり、βは安全因子であり、σiはフィーチャの標準偏差である。rand_gaussianは、ガウスランダム分布に従うことによって決定されたランダム確率である。
αは、変動値の変動係数である。αが0であるとき、変動値は作用しない。
βは、極めて小さい定数であり、通常は1万分の1とすることができる。
σiは、そのフィーチャiが指定値の値を有する、処理すべきデータの標準偏差である。標準偏差の値の求め方については、以下の表を例として使用することによって説明する。本例では、履歴広告データに従って分類モデルが第1に決定されてよく、次いで、その分類モデルを使用することによって、データベース内の掲載すべき広告の広告情報およびテストすべきユーザデータが処理されて、ユーザが広告をクリックする確率が決定する。広告情報は、テストすべきユーザデータ、すなわち処理すべきデータである。
前述の表では、中間列5がフィーチャ列と呼ばれ、第1の列が行シーケンス番号列、第7の列がカテゴリタグ列である。iは、フィーチャ列のシーケンス番号である。Table 1(表1)のフィーチャ列内の「1」は、論理値が「はい」であることを表し、0は、論理値が「いいえ」であることを表す。例えば、第2の列では、「1」は男性であることを表し、「0」は男性ではないことを表す。
第2の列の場合、男性という4つの記録があり、4つの記録はそれぞれ、その行シーケンス番号が1、4、5および6であるフィーチャ行内にあり、4つの行に対応するカテゴリタグはそれぞれ、1、0、0および0である。したがって、σiの計算は、(1,0,0,0)の標準偏差の計算である。確実なことには、標準偏差の値を求めるための2つ以上の具体的様式があり、1つの具体例を本明細書に提示する。
小サイズおよび中サイズの広告の予測値は、変動値を導入することによっていくらか変動し、したがって、これらのオーダーは、コンテストに加わる機会を得、それによって、広告システム全体の環境健全性が確実なものになり、個々のオーダーが最大の露出を占めることがないようになる。
加えて、前述の式を使用することによって、予測値が計算されるとき、ユーザフィーチャ、例えば、年齢や性別など、ユーザの基本情報などのユーザフィーチャ、および広告位置やオーダーIDなどのオーダー情報が、フィーチャとして粗選択シーケンスに直接導入される。オーダー情報は、実質的に、前述の実施形態において述べたプッシュ情報フィーチャの構成部分である。
図5は、予測値の計算の図であり、トレーニングデータのトレーニングを示す。トレーニングデータは、前述の履歴プッシュデータに対応する。本実施形態では、ユーザフィーチャおよび広告フィーチャを離散化するために、01が使用される。例えば、図5の2つのシーケンス、0100および1000は、ユーザの異なる年齢または異なる年齢グループに対応する。10および01は、異なる広告に対応する。年齢*広告は、年齢に対応するフィーチャ列と広告に対応するフィーチャ列とのデカルト積を表す。図5に示されるX*xは、示されていない他のユーザフィーチャまたは広告フィーチャを表す。ある広告の予測値が計算されるとき、通常はただ1つの広告列が現れ、0および1が、対応するユーザがその広告を見、またはクリックするかどうかをそれぞれ表すために使用される。
トレーニングデータ内のカテゴリタグは、履歴広告データ内のユーザが、広告をクリックすることなどのコンバージョン操作を実行するかどうかを表すために使用される。例として、トレーニングデータは、ユーザAが広告Bをクリックするという記録を含む。したがって、図5では、ユーザAが位置するトレーニングデータ行内に、ユーザAの年齢およびユーザAが見る広告が記録されており、ユーザAが位置するトレーニングデータ行内の対応するカテゴリタグが、「1」を使用してユーザAがその広告を見ることを表している。
トレーニングデータは、wおよびσに基づくトレーニングモデルを取得するようにトレーニングされる。wは重みを表し、σは標準偏差を表す。予測値yが計算される。図中の0.02は、一例において計算された予測値yが0.02であることを表す。予測値に対応するデータ行内のカテゴリタグの値が、予測値を表し、予測値は、履歴広告に基づいて取得されたトレーニングモデルがプッシュすることを決定した広告が、クリックされる確率である。
本発明の一実施形態はさらに、コンピュータ記憶媒体であって、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令が、前述の実施形態のプッシュ情報を粗選択するための方法のうちの少なくとも1つの実施、例えば図1および/または図2に示す方法の実施に使用される、コンピュータ記憶媒体を提供する。
コンピュータ記憶媒体は、ランダム記憶媒体RAM、読出し専用記憶媒体ROM、フラッシュメモリFlash、磁気テープ、または光ディスクとすることができ、オプションで、非一時的記憶媒体とすることができる。
本願において提供されるいくつかの実施形態では、開示されたデバイスおよび方法が、他の様式で実現され得ることを理解されたい。上述したデバイス実施形態は、概略にすぎない。例えば、ユニットの分割は、論理機能の分割にすぎず、実際の実装時には別の分割様式であってよい。例えば、複数のユニットもしくは構成要素が、組み合わされてもよく、別のシステムに統合されてもよく、または一部の特徴が、省略されてもよく、実行されなくてもよい。加えて、表示または議論された構成部分間の相互結合、直接結合、または通信接続は、いくつかのインターフェース、デバイス、またはユニットによる間接的な結合または通信接続であってよく、電気的でもよく、機械的でもよく、別の形態のものでもよい。
別々の構成要素として説明した前述のユニットは、物理的に分離されていてもされていなくてもよい。ユニットとして表示した構成要素は、物理的ユニットであってもなくてもよく、1箇所に位置付けられていてもよく、複数のネットワークユニット上に分散されていてもよい。本実施形態の解決策の目的は、実際の必要性に従ってユニットの一部またはすべてを選択することによって実現されてよい。
加えて、本発明の実施形態における機能モジュールが、1つの処理ユニットに統合されてもよく、ユニットの各々が、ユニット単体として使用されてもよく、2つ以上のユニットが、1つのユニットに統合されてもよい。統合されたユニットは、ハードウェアの形態で実装されてもよく、ハードウェアとソフトウェアの機能ユニットの形態で実装されてもよい。
当業者なら、前述の方法実施形態のステップのすべてまたは一部が、プログラム命令に関連のあるハードウェアを使用することによって実現され得ることを、理解できよう。プログラムは、コンピュータ可読記憶媒体内に記憶され得る。プログラムは、実行されると、前述の方法実施形態のステップを実行する。記憶媒体は、モバイル記憶デバイス、読出し専用メモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク、または光ディスクなど、プログラムコードを記憶することの可能なさまざまな媒体を含む。
前述の説明は単に、本発明の具体的実装形態についてのものであるが、本開示の保護範囲を限定することは意図されていない。本開示において開示された技術的範囲内で当業者によって容易に考え出されるどんな変形または置換も、本開示の保護範囲内に含まれるものとする。したがって、本開示の保護範囲は、特許請求の範囲に記載の保護範囲に従うべきである。
110 決定ユニット
120 計算ユニット
130 選択ユニット
210 外部通信インターフェース
220 プロセッサ
230 バス
240 記憶媒体
250 ディスプレイ

Claims (15)

  1. プッシュ情報を粗選択するための方法であって、
    予測値を計算するためのフィーチャ、および前記フィーチャに対応する重みを、前記プッシュ情報の履歴プッシュデータに従って決定するステップと、
    前記フィーチャの標準偏差を計算するステップと、
    前記標準偏差の変動確率を決定するステップと、
    前記重み、前記標準偏差、および前記変動確率に基づいて前記予測値を計算するステップであって、前記標準偏差および前記変動確率が、前記重みを補正するための変動値の計算に使用される、ステップと、
    前記予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択するステップと
    を含む方法。
  2. 前記方法がさらに、
    変動係数を決定するステップであって、前記変動係数が、前記変動値の値範囲を制限するために使用される、ステップ
    を含み、
    前記重み、前記標準偏差、および前記変動確率に基づいて前記予測値を計算する前記ステップが、
    前記重み、前記標準偏差、前記変動確率、および前記変動係数に基づいて前記予測値を計算するステップ
    を含む、請求項1に記載の方法。
  3. 前記方法がさらに、
    安全因子を決定するステップであって、前記安全因子が、前記標準偏差が特定の値であるとき、または前記標準偏差が取得されないときに生じる、前記変動値の異常解を防ぐために使用される、ステップ
    を含み、
    前記重み、前記標準偏差、および前記変動確率に基づいて前記予測値を計算する前記ステップが、
    前記重み、前記標準偏差、前記変動確率、および前記安全因子に基づいて前記予測値を計算するステップ
    を含む、請求項2に記載の方法。
  4. 前記重み、前記標準偏差、前記変動確率、および前記安全因子に基づいて前記予測値を計算する前記ステップが、
    前記予測値yを、以下の式、
    を使用することによって計算するステップ
    を含み、
    上式で、xiがフィーチャiの値であり、wiが前記フィーチャiの重みであり、αが前記変動係数であり、βが前記安全因子であり、σiが前記フィーチャの標準偏差である、
    請求項3に記載の方法。
  5. 予測値を計算するためのフィーチャ、および前記フィーチャに対応する重みを、前記プッシュ情報の履歴プッシュデータに従って決定する前記ステップが、
    前記予測値を計算するためのプッシュ情報フィーチャを決定するステップ、および
    前記予測値を計算するためのユーザフィーチャを決定するステップ
    を含む、
    請求項1から4のいずれか一項に記載の方法。
  6. 前記予測値を計算するためのユーザフィーチャを決定する前記ステップが、
    ユーザフィーチャの信頼度を決定するステップ、および
    前記信頼度に基づいて、前記予測値を計算するためのユーザフィーチャを選択するステップ
    を含む、
    請求項5に記載の方法。
  7. 前記予測値を計算するためのユーザフィーチャを決定する前記ステップが、
    ユーザフィーチャから、前記予測値を計算するためのユーザフィーチャとして1つまたは複数の非処理ユーザフィーチャを選択するステップ
    を含む、
    請求項5に記載の方法。
  8. プッシュ情報を粗選択するための装置であって、決定ユニットと、計算ユニットと、選択ユニットとを備え、
    前記決定ユニットが、予測値を計算するためのフィーチャ、および前記フィーチャに対応する重みを、前記プッシュ情報の履歴プッシュデータに従って決定することを行うように構成され、
    前記計算ユニットが、前記フィーチャの標準偏差を計算することを行うように構成され、
    前記決定ユニットがさらに、前記標準偏差の変動確率を決定することを行うように構成され、
    前記計算ユニットがさらに、前記重み、前記標準偏差、および前記変動確率に基づいて前記予測値を計算することであって、前記標準偏差および前記変動確率が、前記重みを補正するための変動値の計算に使用される、計算することを行うように構成され、
    前記選択ユニットが、前記予測値に基づいて、プリセット条件を満足させるプッシュ情報を選択することを行うように構成される、
    装置。
  9. 前記決定ユニットがさらに、変動係数を決定することを行うように構成され、前記変動係数が、前記変動値の値範囲を制限するために使用され、
    前記計算ユニットが、前記重み、前記標準偏差、前記変動確率、および前記変動係数に基づいて前記予測値を計算することを行うように構成される、
    請求項8に記載の装置。
  10. 前記決定ユニットが、安全因子を決定することを行うように構成され、前記安全因子が、前記標準偏差が特定の値であるとき、または前記標準偏差が取得されないときに生じる、前記変動値の異常解を防ぐために使用され、
    前記計算ユニットが、前記重み、前記標準偏差、前記変動確率、および前記安全因子に基づいて前記予測値を計算することを行うように構成される、
    請求項9に記載の装置。
  11. 前記計算ユニットが、前記予測値yを、以下の式、
    を使用することによって計算することを行うように構成され、
    上式で、xiがフィーチャiの値であり、wiが前記フィーチャiの重みであり、αが前記変動係数であり、βが前記安全因子であり、σiが前記フィーチャの標準偏差である、
    請求項10に記載の装置。
  12. 前記決定ユニットが、前記予測値を計算するためのプッシュ情報フィーチャを決定すること、および前記予測値を計算するためのユーザフィーチャを決定することを行うように構成される、
    請求項8から11のいずれか一項に記載の装置。
  13. 前記決定ユニットが、ユーザフィーチャの信頼度を決定すること、および前記信頼度に基づいて、前記予測値を計算するためのユーザフィーチャを選択することを行うように構成される、
    請求項12に記載の装置。
  14. 前記決定ユニットが、ユーザフィーチャから、前記予測値を計算するためのユーザフィーチャとして1つまたは複数の非処理ユーザフィーチャを選択することを行うように構成される、
    請求項12に記載の装置。
  15. コンピュータ記憶媒体であって、コンピュータ実行可能命令を記憶し、前記コンピュータ実行可能命令が、請求項1から7に記載のプッシュ情報を粗選択するための方法のうちの少なくとも1つの実施に使用される、コンピュータ記憶媒体。
JP2018526889A 2016-01-04 2016-12-27 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体 Active JP6547070B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610006885.5A CN106940703B (zh) 2016-01-04 2016-01-04 推送信息粗选排序方法及装置
CN201610006885.5 2016-01-04
PCT/CN2016/112496 WO2017118328A1 (zh) 2016-01-04 2016-12-27 推送信息粗选排序方法、装置和计算机存储介质

Publications (2)

Publication Number Publication Date
JP2018536937A true JP2018536937A (ja) 2018-12-13
JP6547070B2 JP6547070B2 (ja) 2019-07-17

Family

ID=59273288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018526889A Active JP6547070B2 (ja) 2016-01-04 2016-12-27 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体

Country Status (6)

Country Link
US (1) US20180129964A1 (ja)
EP (1) EP3401798A4 (ja)
JP (1) JP6547070B2 (ja)
KR (1) KR102111223B1 (ja)
CN (1) CN106940703B (ja)
WO (1) WO2017118328A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263959B (zh) * 2018-05-21 2024-01-09 腾讯科技(深圳)有限公司 点击率预估方法、装置、机器设备和计算机可读存储介质
JP7122159B2 (ja) * 2018-05-25 2022-08-19 三菱重工業株式会社 データ処理システム、データ処理方法およびプログラム
CN109145207B (zh) * 2018-08-01 2021-05-18 广东奥博信息产业股份有限公司 一种基于分类指标预测的信息个性化推荐方法及装置
CN109165742A (zh) * 2018-08-28 2019-01-08 北京百度网讯科技有限公司 推荐方法、装置、存储介质和终端设备
CN111130984B (zh) * 2018-10-31 2022-07-05 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN111709766B (zh) * 2020-04-14 2023-08-18 中国农业银行股份有限公司 一种用户行为预测方法、装置、存储介质及电子设备
CN111753201A (zh) * 2020-06-23 2020-10-09 厦门美柚股份有限公司 信息推送方法、装置、终端及介质
CN111815368B (zh) * 2020-07-24 2024-05-03 深圳市欢太科技有限公司 广告推送方法、装置、终端及存储介质
CN113794900B (zh) * 2021-08-31 2023-04-07 北京达佳互联信息技术有限公司 视频处理方法和装置
CN117436709B (zh) * 2023-12-20 2024-03-19 四川宽窄智慧物流有限责任公司 一种跨区域订单数据统筹预警方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008545200A (ja) * 2005-06-28 2008-12-11 チョイスストリーム インコーポレイテッド 広告をターゲット化する統計システムの方法及び装置
US20090089131A1 (en) * 2007-07-09 2009-04-02 Alexandros Moukas Mobile Device Marketing and Advertising Platforms, Methods, and Systems
JP2011028596A (ja) * 2009-07-28 2011-02-10 Milog Co Ltd 広告表示方法
JP2011170666A (ja) * 2010-02-19 2011-09-01 Nec Corp 検索装置
JP2014078995A (ja) * 1999-08-31 2014-05-01 Thomson Licensing ターゲット決めされたビデオ番組編成の配送のための方法および装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6184829B1 (en) * 1999-01-08 2001-02-06 Trueposition, Inc. Calibration for wireless location system
ES2261527T3 (es) * 2001-01-09 2006-11-16 Metabyte Networks, Inc. Sistema, procedimiento y aplicacion de software para publicidad dirigida mediante una agrupacion de modelos de comportamiento, y preferencias de programacion basadas en grupos de modelos de comportamiento.
US20080140481A1 (en) * 2006-12-06 2008-06-12 Josh Todd Gold Method and system for generating advertisement
US20090006368A1 (en) * 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
ES2423949T3 (es) * 2007-12-10 2013-09-25 Fiat Group Automobiles S.P.A. Método para optimizar mapas de calibrado para un algoritmo de estimación de una cantidad de control de un motor de combustión interna
US20100169338A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Pangenetic Web Search System
US20100228636A1 (en) * 2009-03-04 2010-09-09 Google Inc. Risk premiums for conversion-based online advertisement bidding
CN102034186A (zh) * 2009-09-29 2011-04-27 中国移动通信集团四川有限公司 移动通信系统中确定目标用户的装置和方法
US8533043B2 (en) * 2010-03-31 2013-09-10 Yahoo! Inc. Clickable terms for contextual advertising
CN103577413B (zh) * 2012-07-20 2017-11-17 阿里巴巴集团控股有限公司 搜索结果排序方法及系统、搜索结果排序优化方法及系统
CN103970747B (zh) * 2013-01-24 2017-02-15 爱帮聚信(北京)科技有限公司 网络侧计算机对搜索结果进行排序的数据处理方法
CN103106275B (zh) * 2013-02-08 2016-02-10 西北工业大学 基于特征分布信息的文本分类特征筛选方法
CN103559622A (zh) * 2013-07-31 2014-02-05 焦点科技股份有限公司 基于特征的协同过滤推荐方法
CN104424291B (zh) * 2013-09-02 2018-12-21 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104636373A (zh) * 2013-11-11 2015-05-20 腾讯科技(深圳)有限公司 一种信息推送方法及装置
CN104966125B (zh) * 2015-05-06 2018-07-24 同济大学 一种社交网络的物品评分及推荐方法
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105208113A (zh) * 2015-08-31 2015-12-30 北京百度网讯科技有限公司 信息推送的方法和装置
CN107636715B (zh) * 2015-09-09 2021-04-27 谷歌有限责任公司 用于提供内容的系统和方法
CN105205046A (zh) * 2015-09-25 2015-12-30 镇江明泰信息科技有限公司 一种基于语义分析的在线用户推荐系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014078995A (ja) * 1999-08-31 2014-05-01 Thomson Licensing ターゲット決めされたビデオ番組編成の配送のための方法および装置
JP2008545200A (ja) * 2005-06-28 2008-12-11 チョイスストリーム インコーポレイテッド 広告をターゲット化する統計システムの方法及び装置
US20090089131A1 (en) * 2007-07-09 2009-04-02 Alexandros Moukas Mobile Device Marketing and Advertising Platforms, Methods, and Systems
JP2011028596A (ja) * 2009-07-28 2011-02-10 Milog Co Ltd 広告表示方法
JP2011170666A (ja) * 2010-02-19 2011-09-01 Nec Corp 検索装置

Also Published As

Publication number Publication date
EP3401798A1 (en) 2018-11-14
CN106940703B (zh) 2020-09-11
EP3401798A4 (en) 2018-11-21
KR20180072793A (ko) 2018-06-29
JP6547070B2 (ja) 2019-07-17
KR102111223B1 (ko) 2020-05-14
WO2017118328A1 (zh) 2017-07-13
US20180129964A1 (en) 2018-05-10
CN106940703A (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
JP6547070B2 (ja) プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体
US11593817B2 (en) Demand prediction method, demand prediction apparatus, and non-transitory computer-readable recording medium
CN109299356B (zh) 基于大数据的活动推荐方法、装置、电子设备及存储介质
CN107526810B (zh) 建立点击率预估模型的方法及装置、展示方法及装置
CN107093091B (zh) 一种数据处理方法和装置
RU2622850C2 (ru) Метод и сервер для обработки идентификаторов продукта и машиночитаемый носитель данных
CN109598404A (zh) 自动对下发销售任务单进行数据处理的方法和装置
US20230011954A1 (en) Device, method, and system for business plan management
KR20110023750A (ko) 오브젝트 커스터마이제이션 및 관리 시스템
US20210312331A1 (en) Dynamic video content optimization
CN110570271A (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN113743968A (zh) 信息投放方法、装置及设备
CN115809889A (zh) 基于营销效果的智能客群筛选方法、系统、介质及设备
CN112287208A (zh) 用户画像生成方法、装置、电子设备及存储介质
US10083459B2 (en) Methods and apparatus to generate a media rank
CN115757973A (zh) 推荐系统的排序方法、装置、设备及可读存储介质
CN113762305B (zh) 一种脱发类型的确定方法和装置
CN110264306B (zh) 基于大数据的产品推荐方法、装置、服务器及介质
CN108509459B (zh) 数据处理方法和装置
CN113011922B (zh) 相似人群的确定方法、装置、电子设备和存储介质
JP6670572B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6541521B2 (ja) 生成装置、生成方法、生成プログラム、決定装置、決定方法、及び決定プログラム
CN113722602B (zh) 信息推荐方法及装置、电子设备、存储介质
CN113609176B (zh) 一种信息生成方法、装置、设备及存储介质
CN112837079B (zh) 商品销量预测方法、装置、计算机设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190624

R150 Certificate of patent or registration of utility model

Ref document number: 6547070

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250