JP2021502651A - 融合データ処理方法及び情報推薦システム - Google Patents

融合データ処理方法及び情報推薦システム Download PDF

Info

Publication number
JP2021502651A
JP2021502651A JP2020526448A JP2020526448A JP2021502651A JP 2021502651 A JP2021502651 A JP 2021502651A JP 2020526448 A JP2020526448 A JP 2020526448A JP 2020526448 A JP2020526448 A JP 2020526448A JP 2021502651 A JP2021502651 A JP 2021502651A
Authority
JP
Japan
Prior art keywords
fusion
heterogeneous data
model
evaluation index
data source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020526448A
Other languages
English (en)
Other versions
JP7052037B2 (ja
Inventor
ホアン、シュドン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Publication of JP2021502651A publication Critical patent/JP2021502651A/ja
Application granted granted Critical
Publication of JP7052037B2 publication Critical patent/JP7052037B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本発明は、融合データ処理方法及び情報推薦システムを提供する。融合データ処理方法は、以下の内容を備える。情報推薦システムは、複数の異種データソースを取得する。情報推薦システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。情報推薦システムは、融合戦略モデルの損失定量的評価指標を取得する。情報推薦システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。本発明の実施例は、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。

Description

本発明は、機械学習の技術分野に関し、さらに具体的に、融合データ処理方法及び情報推薦システムに関する。
異種データソースの混合配置とは、並べ替えを表示するリスト(検索リスト、推薦リストなど)において、異なる製品目標又はユーザーエクスペリエンスを実現するために、複数のデータソースを1つのリストに融合することを指す。例えば、検索において、自然結果と広告を混合配置して、ユーザーエクスペリエンスを満足する。リスト表示を有する製品において、表示位置が制限されており、複数の異種データソースを適切に融合してグローバルな最適化を実現することは解決しようとする問題である。
本発明の実施形態は、融合データ処理方法及び情報推薦システムを提供する。価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
第一態様において、本発明の実施形態は、融合データ処理方法を提供する。融合データ処理方法は、価値モデルセットと融合戦略モデルを含む情報推薦システムに適用できる。融合データ処理方法は、以下の内容を備える。
複数の異種データソースを取得する。価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。融合戦略モデルの損失定量的評価指標を取得する。各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
第二態様において、本発明の実施形態は、情報推薦システムを提供する。情報推薦システムは、プロセッサと、実行可能なプログラムコードを格納するメモリと、を備え、プログラムコードがプロセッサによって実行されると、プロセッサは、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
第三態様において、本発明の実施形態は、非一時的なコンピューター可読記憶媒体を提供する。非一時的なコンピューター可読記憶媒体はコンピュータープログラムを格納し、コンピュータープログラムがプロセッサによって実行されると、プロセッサは、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
上述したように、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。従って、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
以下、本願の実施形態に係わる図面を簡単に紹介する。
図1−1は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。 図1−2は、本発明の実施形態に係わる情報推薦システムのシステムアーキテクチャーを示すの概略図である。 図2は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。 図3は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。 図4は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。 図5は、本発明の実施形態に係わる情報推薦システムの構造を示す概略図である。 図6は、本発明の実施形態に係わる融合データ処理装置の機能ユニットを示すブロック図である。
当業者が本発明をよりよく理解できるように、以下、添付図面を参照しながら、本発明の実施形態を明確且つ完全に説明する。明らかに、説明された実施形態は、本願の実施形態の一部にすぎず、すべての実施形態ではない。創造的な努力なしに本開示の実施形態に基づいて当業者によって得られる他のすべての実施形態は、本開示の保護範囲に含まれる。
本願の明細書、特許請求の範囲及び図面で使用される用語「第一」、「第二」などは、特定の順序を説明するために用いられなく、異なる対象を区別するために用いられる。用語「含む」、「有する」及びそれらの変形は、非排他的包含を網羅することを意図する。例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品、又は装置は、リストされたステップ又はユニットに限定されず、選択的に、リストされていない他のステップ又はユニットを含むことができ、又は、選択的に、これらのプロセス、方法、製品、又はデバイスに固有する他のステップ又はユニットを含むことができる。
本明細書で言及される「実施形態」という用語は、実施形態に関連して説明される特定の特徴、構造、又は特性が本願の少なくとも1つの実施形態に含まれ得ることを意味する。本明細書の各々の場所に現れるこの用語は、必ず同じ実施形態を指すものではなく、他の実施形態と相互に排他的な独立した又は代替実施形態を指すものでもない。本明細書に記載された実施形態は他の実施形態と組み合わせることができることは、当業者によって明示的および暗黙的に理解される。
図1−1は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。この方法は、情報推薦システムに適用される。情報推薦システムは、価値モデルセット(value-mode set)と融合戦略モデル(fusion-strategy model)を含む。図1−1に示されたように、この方法は、ブロック101の操作から始まる。
ブロック101で、複数の異種データソースを取得する。
ブロック102で、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。
ブロック103で、融合戦略モデルの損失定量的評価指標を取得する。
ブロック104で、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
上述したように、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。従って、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
一実施形態では、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得することは、以下の内容を含む。
異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得する。各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得する。各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定する。各異種データソースの特徴パラメーターと価値モデルを専用の予測器に入力することにより、各異種データソースに対応する統一評価指標を取得する。
一実施形態では、以下のように融合戦略モデルの損失定量的評価指標を取得する。
融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を取得する。推定事前結果と実際事後結果に基づいて、融合戦略モデルの損失定量的評価指標を確定する。
「推定事前結果」とは、現在把握している情報に基づいて、将来に発生できる情況を説明することである。事前結果を推定する目的は、多い正確、有用、可能な結果を生成することに役立ち、入力したデータが不完備、不確実、又は不安定しても、可能な実施例において、予測器、機能パラメータ、目標モデルに基づいて推定事前結果を獲得することができる。
「実際事後結果」とは、特定の状況に関連する証拠を検討した後に獲得した実際の情報を指す。一実装形態では、実際事後結果は、インタラクティブフィードバックされるユーザーの数量と推薦されるユーザーの総数の比率であることができる。
一実施形態では、以下のように融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得する。特徴パラメーターと融合戦略モデルを予め設定された予測器に入力することにより、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
一実装形態では、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得することは、以下の内容を含む。
各異種データソースの統一評価指標に基づいてソートセットを生成する。ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれる。いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なる。
融合戦略モデルの制約条件下で、ソートセットから最適な1つのソートを選択して、複数の異種データソースの融合ソート推薦結果とする。
一実装形態では、制約条件は、例えば、次の中のいずれか1つである。推薦結果には少なくとも1つの自然結果があり、広告の数は予め設定された数以上であり、推薦情報は全て不人気な情報又は全て人気のある情報ではなく、一日内の自然結果の表示比率は予め設定された比率より大きいなどである。
一実装形態では、情報推薦システムは、トレーニングデータベースと複数の価値モデルをさらに含む。情報推薦システムは、トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得するために用いられる。この方法はさらに以下の内容を含む。
トレーニング済みの価値モデル及び対応するデータタイプを獲得する。
獲得したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、価値モデルセットを生成する。
図1−1に示された融合データ処理方法は情報推薦システムに適用される。
一実装形態では、情報推薦システムは第一システム及び第二システムを含む。第一システムはクラウドコンピューティングリソース又はサーバークラスターであることができ、第二システムはサーバークラスターであることができる。図1−1に示された融合データ処理方法は、第一システム、第二システム、第一システム及び第二システムの三者のうちの1つによって実行され、これに対して限定しない。
図1−2は、本発明の実施形態に係わる情報推薦システム100のシステムアーキテクチャーを示すの概略図である。情報推薦システム100の物理的形態は、サーバクラスター(server cluster)及び/又はクラウドコンピューティングリソース(cloud computing resources)であることができ、これは本明細書では限定されない。情報推薦システム100は第一システム10を含む。第一システム10はクラウドコンピューティングリソース又はサーバークラスターであることができる。第一システム10は、価値モデルセット11、融合戦略モデル12及び予測器13を含む。価値モデルセット11及び融合戦略モデル12は、リアルタイムのオンライン推薦タスクを処理するために用いられる。予測器13は、融合戦略モデル12と推薦タスクに関連する参照特徴データを組み合わせて推定事前結果を生成するために用いられる。
一実装形態では、情報推薦システム100は、第二システム20をさらに備える。第二システム20はサーバークラスターであることができる。第一システム10はクラウドコンピューティングリソース又はサーバークラスターであることができる。第二システム20は、トレーニングデータベース21及び複数の価値モデル22を含む。第二システム20は、トレーニングデータベース21のトレーニングデータを定期的に使用して、複数の価値モデル22をトレーニングし、トレーニングされたターゲット価値モデル11を取得し、トレーニングされたターゲット価値モデル11を第一システム10にプッシュして使用する。
一実装形態では、第一システム10はオンラインシステムであることができ、第二システムはオフラインシステムであることができる。
一般的な設計では、2種類の融合ソーティング(fusion sorting)がある。
1.固定位置ソーティング(Fixed-location sorting):検索結果ページには、広告と自然結果を含む2種類のデータソースがある。最初のいくつかの位置は固定広告であり、他の位置は自然結果である。固定位置ソーティングは、個別化とグローバルな最適化を達成し難い欠点がある。
2.人工規則位置分配(Manual-rule location allocation):いくつかの人工介入方法により、異なるデータソースの位置を動的に分配する。例えば、一部のユーザーが広告を嫌い場合、検索結果ページの広告を減らし、これに反すると、検索結果ページの広告を増加する。固定位置ソーティングに比べて、人工規則動的位置分配はいくつかの利点があるが、個人的な経験に依存するので、数次元しか関与できなく、細かく制御できず、グローバルな最適化を達成し難い。
上記を考慮して、本発明の実施形態では、融合データ処理方法を提供する。この方法では、先ず、第一システムは、複数の異種データソースを取得する。次に、第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。その後、第一システムは、融合戦略モデルの損失定量的評価指標を取得する。最後に、第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。第一システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
以下、添付された図面を参照して、本発明の実施形態を説明する。
図2は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。この方法は、第一システムを含む情報推薦システムに適用できる。第一システムは、価値モデルセットと融合戦略モデルを含む。図2に示されたように、融合データ処理方法は、ブロック201の操作から始まる。
ブロック201:第一システムは、複数の異種データソースを取得する。
異種データソース(即ち、異なるデータソース)は、画像、ウェブページアイコン、ウェブページフレームなどを含む。
広義に解釈すると、異種データソースは、異なるデータ構造、アクセス方法、又はフォームの中の少なくとも1つを有する複数のデータソースである。
ブロック202:第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。
価値モデルセットは、複数の価値モデルを含む。第二システムは、サンプルデータに応じて複数の価値モデルをトレーニングすることができる。
ブロック203:第一システムは、融合戦略モデルの損失定量的評価指標を取得する。
損失定量的評価指標は融合戦略モデルの予測品質を評価するために用いられる。
ブロック204:第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
本出願の実施形態において、第一システムは、先ず、複数の異種データソースを取得し、次に、第一システムは価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、次に、第一システムは融合戦略モデルの損失定量的評価指標を取得し、最後に、第一システムは各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。第一システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
一実装形態では、第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得することは、以下の内容を含む。
第一システムは、異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得する。第一システムは、各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得する。第一システムは、各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定する。第一システムは、各異種データソースの特徴パラメーターと価値モデルを専用の予測器に入力することにより、各異種データソースに対応する統一評価指標を取得する。
専用の予測器を特定のユーザーレベルに関連付けるか、特定のユーザーシナリオレベルにさらに関連付けて、専用の予測を実現することができ、精度が高い。
上述したように、本実施形態において、第一システムは、各異種データソースに対応する専用予測器を見つけることができ、専用予測器を使用して、各異種データソースに対応する統一評価指標を確定する。専用予測器はプリセットツールであるので、精度が高く、計算が安定であり、統一評価指標の精度と安定性を向上させる。
一実装形態では、情報推薦システムは、第二システムをさらに含む。第一システムは、以下のように融合戦略モデルの損失定量的評価指標を取得する。
第一システムは、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。第一システムは、第二システムから、融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を受け取る。第一システムは、推定事前結果と実際事後結果に基づいて、融合戦略モデルの損失定量的評価指標を確定する。
予め設定された推薦タスクは、推薦されるターゲットアイテムの推薦タスクである。例えば、ブラウザアプリケーションシナリオでは、第一システムがニュースをプッシュするとき、広告をプッシュすることを必要とする場合、広告の推薦タスクが生成される。
上述したように、本実施形態において、融合戦略モデルの損失定量的評価指標は、推定事前結果と実際事後結果に基づいて確定され、実際のユーザーグループの使用習慣と一致し、精度が高い 。
一実装形態では、第一システムは、以下のように融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
第一システムは、融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得する。第一システムは、特徴パラメーターと融合戦略モデルを予め設定された予測器に入力することにより、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
特徴パラメーターは、ユーザーのポートレート情報(好み、興味、地理位置など)、推薦されるアイテムの情報(キーワード、カテゴリなど)、シナリオ情報(休日、旅行など) を含む。実際事後結果は、インタラクティブフィードバックされるユーザーの数量と推薦されるユーザーの総数の比率であることができる。
例えば、ターゲット推薦タスクの推薦アイテムが100人のユーザーに推薦され、そのうち10人が「はい」をクリックすると、ターゲット推薦タスクの実際事後結果は10/100、つまり0.1である。
本実施形態において、推定事前結果は第一システムの予測器によって取得でき、推定するためにリアルタイムで計算モデルを構築することを必要としなく、計算効率と精度が高い。
一実装形態では、第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得することは、以下の内容を含む。
第一システムは、各異種データソースの統一評価指標に基づいてソートセットを生成する。ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれる。いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なる。第一システムは、融合戦略モデルの制約条件下で、ソートセットから最適な1つのソートを選択して、複数の異種データソースの融合ソート推薦結果とする。
融合戦略モデルには、制約条件と位置競合制御戦略が含まれる。制約条件は、例えば、次の中のいずれか1つである。推薦結果には少なくとも1つの自然結果があり、広告の数は予め設定された数以上であり、推薦情報は全て不人気な情報又は全て人気のある情報ではなく、一日内の自然結果の表示比率は予め設定された比率より大きいなどである。
ソートセットから選択された最適なソートは、融合戦略モデルの制約条件を満たすソートであることができる。
本実施形態において、第一システムは、融合戦略モデルを使用して、予め設定された制約条件に基づいて、複数の候補データソースシーケンスから最適なデータソースシーケンスを選択して、選択精度を向上させる。
一実装形態では、情報推薦システムは、トレーニングデータベースと複数の価値モデルを含む第二システムをさらに含む。第二システムは、トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得するために用いられる。この方法はさらに以下の内容を含む。
第一システムは、第二システムからトレーニング済みの価値モデル及び対応するデータタイプを受信する。第一システムは、受信したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、価値モデルセットを生成する。
本実施形態において、第二システムは、価値モデルを更新し、且つ更新された価値モデルを第一システムにプッシュして使用するようにすることができ、これにより情報推薦システムの安定性を向上させる。
図2に示された実施形態と一致し、図3を参照してください。図3は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。この方法は、情報推薦システムに適用できる。情報推薦システムは、第一システムを含む。第一システムは、価値モデルセットと融合戦略モデルを含む。図3に示されたように、融合データ処理方法は、ブロック301の操作から始まる。
ブロック301:第一システムは、複数の異種データソースを取得する。
ブロック302:第一システムは、異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得する。
ブロック303:第一システムは、各異種データソースに対応する価値モデルが必要とする特徴パラメータを取得する。
ブロック304:第一システムは、各異種データソースに対応する価値モデルに関連付けられた専用予測器を確定する。
ブロック305:第一システムは、各異種データソースの特徴パラメータ及び価値モデルを専用予測器に入力することにより、各異種データソースに対応する統一評価指標を取得する。
ブロック306:第一システムは、融合戦略モデルの損失定量的評価指標を取得する。
ブロック307:第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
本出願の実施形態において、第一システムは、先ず、複数の異種データソースを取得し、次に、第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、次に、第一システムは、融合戦略モデルの損失定量的評価指標を取得し、最後に、第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。第一システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
さらに、第一システムは、各異種データソースに対応する専用予測器を見つけることができ、専用予測器を使用して、各異種データソースに対応する統一評価指標を確定する。専用予測器はプリセットツールであるので、精度が高く、計算が安定であり、統一評価指標の精度と安定性を向上させる。
図2に示された実施形態と一致し、図4を参照してください。図4は、本発明の実施形態に係わる融合データ処理方法を示すフローチャートである。この方法は、情報推薦システムに適用できる。情報推薦システムは、第一システムを含む。第一システムは、価値モデルセットと融合戦略モデルを含む。図4に示されたように、融合データ処理方法は、ブロック401の操作から始まる。
ブロック401:第一システムは、複数の異種データソースを取得する。
ブロック402:第一システムは、異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得する。
ブロック403:第一システムは、各異種データソースに対応する価値モデルが必要とする特徴パラメータを取得する。
ブロック404:第一システムは、各異種データソースに対応する価値モデルに関連付けられた専用予測器を確定する。
ブロック405:第一システムは、各異種データソースの特徴パラメータ及び価値モデルを専用予測器に入力することにより、各異種データソースに対応する統一評価指標を取得する。
ブロック406:第一システムは、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
ブロック407:第一システムは、第二システムから融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を受け取る。
ブロック408:第一システムは、推定事前結果と実際事後結果に基づいて、融合戦略モデルの損失定量的評価指標を確定する。
Sブロック409:第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
本出願の実施形態において、第一システムは、先ず、複数の異種データソースを取得し、次に、第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、次に、第一システムは、融合戦略モデルの損失定量的評価指標を取得し、最後に、第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。第一システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
さらに、第一システムは、各異種データソースに対応する専用予測器を見つけることができ、専用予測器を使用して、各異種データソースに対応する統一評価指標を確定する。専用予測器はプリセットツールであるので、精度が高く、計算が安定であり、統一評価指標の精度と安定性を向上させる。
さらに、融合戦略モデルの損失定量的評価指標は、推定事前結果と実際事後結果に基づいて確定され、実際のユーザーグループの使用習慣と一致し、精度が高い 。
さらに、推定事前結果は第一システムの予測器によって取得でき、推定するためにリアルタイムで計算モデルを構築することを必要としなく、計算効率と精度が高い。
さらに、第一システムは、融合戦略モデルを使用して、予め設定された制約条件に基づいて、複数の候補データソースシーケンスから最適なデータソースシーケンスを選択して、選択精度を向上させる。
図2〜図4に示された実施形態と一致し、図5を参照してください。図5は、本発明の実施形態に係わる情報推薦システムの構造を示す概略図である。1つ以上のアプリケーションとオペレーティングシステムが情報推薦システムで実行される。図5に示されたように、情報推薦システムは、プロセッサ501、メモリ502、通信インターフェース503及び1つ以上のプログラムコードを含む。1つ以上のプログラムコードは、前述の1つ以上のアプリケーションとは異なる。メモリは、1つ以上のプログラムコードを格納するために用いられる。1つ以上のプログラムコードは、プロセッサによって実行され、以下の操作を実行するために用いられる命令を含む。
複数の異種データソースを取得する。価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する。融合戦略モデルの損失定量的評価指標を取得する。各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。
本出願の実施形態において、先ず、複数の異種データソースを取得し、次に、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、次に、融合戦略モデルの損失定量的評価指標を取得し、最後に、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。情報推薦システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
一実施形態では、「価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する」という点で、プログラムの命令は、具体的に以下の操作を実行するために用いられる。
異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得する。各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得する。各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定する。各異種データソースの特徴パラメーターと価値モデルを専用の予測器に入力することにより、各異種データソースに対応する統一評価指標を取得する。
一実施形態では、「融合戦略モデルの損失定量的評価指標を取得する」という点で、プログラムの命令は、具体的に以下の操作を実行するために用いられる。
融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を取得する。推定事前結果と実際事後結果に基づいて、融合戦略モデルの損失定量的評価指標を確定する。
一実施形態では、「融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する」という点で、プログラムの命令は、具体的に以下の操作を実行するために用いられる。
融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得する。特徴パラメーターと融合戦略モデルを予め設定された予測器に入力することにより、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する。
一実装形態では、「各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する」という点で、プログラムの命令は、具体的に以下の操作を実行するために用いられる。
各異種データソースの統一評価指標に基づいてソートセットを生成する。ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれる。いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なる。融合戦略モデルの制約条件下で、ソートセットから最適な1つのソートを選択して、複数の異種データソースの融合ソート推薦結果とする。
一実装形態では、情報推薦システムは、トレーニングデータベースと複数の価値モデルをさらに含む。情報推薦システムは、トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得するために用いられる。プログラムの命令は、具体的に以下の操作を実行するために用いられる。
トレーニング済みの価値モデル及び対応するデータタイプを獲得する。獲得したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、価値モデルセットを生成する。
図6は、本発明の実施形態に係わる融合データ処理装置の機能ユニットを示すブロック図である。融合データ処理装置600は、第一システムを含む情報推薦システムに適用できる。第一システムは、価値モデルセットと融合戦略モデルを含む。融合データ処理装置は、取得ユニット601と、使用ユニット602と、入力処理ユニット603と、を含む。
取得ユニット601は、複数の異種データソースを取得するために用いられる。
使用ユニット602は、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得するために用いられる。
取得ユニット601は、さらに融合戦略モデルの損失定量的評価指標を取得するために用いられる。
入力処理ユニット603は、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得するために用いられる。
本実施形態において、第一システムは、先ず、複数の異種データソースを取得し、次に、第一システムは、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、次に、第一システムは、融合戦略モデルの損失定量的評価指標を取得し、最後に、第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する。第一システムは、価値モデルによって複数のデータソースを調整し、融合戦略モデルによって融合ソートを実行して、制約下での複数の異種データのグローバルな最適な融合ソートの問題を効果的に解決することができる。
一実施形態では、「価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得する」という点で、使用ユニット602は、具体的に、異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得し、各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得し、各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定し、各異種データソースの特徴パラメーターと価値モデルを専用の予測器に入力することにより、各異種データソースに対応する統一評価指標を取得するために用いられる。
一実施形態では、情報推薦システムは、第二システムをさらに含む。「融合戦略モデルの損失定量的評価指標を取得する」という点で、取得ユニット601は、具体的に、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得し、第二システムから融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を受け取り、推定事前結果と実際事後結果に基づいて融合戦略モデルの損失定量的評価指標を確定するために用いられる。
一実施形態では、「融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する」という点で、取得ユニット601は、具体的に、融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得し、特徴パラメーターと融合戦略モデルを予め設定された予測器に入力することにより、融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得するために用いられる。
一実装形態では、「第一システムは、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する」という点で、入力処理ユニット603は、具体的に、各異種データソースの統一評価指標に基づいてソートセットを生成し、融合戦略モデルの制約条件下で、ソートセットから最適な1つのソートを選択して、複数の異種データソースの融合ソート推薦結果とするために用いられる。ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれ、いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なる。
一実装形態では、情報推薦システムは、トレーニングデータベースと複数の価値モデルを含む第二システムをさらに含む。第二システムは、トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得するために用いられる。融合データ処理装置600は、受信ユニット及び生成ユニットをさらに含む。
受信ユニットは、第二システムからトレーニング済みの価値モデル及び対応するデータタイプを受信するために用いられる。
生成ユニットは、受信したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、価値モデルセットを生成するために用いられる。
本発明の装置実施形態で説明される融合データ処理装置は、機能ユニットの形式で現れることに留意されたい。ここで使用する用語「ユニット」とは、可能な限り広い意味で理解されるべきであり、各「ユニット」が定める機能を実現するための対象は、例えば、集積回路(ASIC)、単一回路、1つ又は複数のソフトウェア又はファームウェアプログラムを実行するために用いられるプロセッサ(共有、専用、又はチップセット)及びメモリ、組み合わせ論理回路、及び/又は上記の機能を達成できる他の適切なコンポーネントであることができる。
取得ユニット601は、受信機であることができる。使用ユニット602及び入力処理ユニット603は、プロセッサであることができる。
本開示の実施形態は、さらに非一時的なコンピューター可読記憶媒体を提供する。非一時的なコンピューター可読記憶媒体は、電子データを交換するために用いられるコンピュータープログラムを格納する。コンピュータープログラムが実行されると、コンピューターが上述した方法実施形態に記載されたいかなる方法の一部又は全部のステップを実行することにする。コンピューターは、第一システムを含む。
本発明の実施形態は、さらにコンピュータープログラム製品を提供する。コンピュータープログラム製品は、コンピュータープログラムを記憶した非一時的なコンピュータ可読記憶媒体を含む。コンピュータープログラムは、コンピューターが上述した方法実施形態に記載されたいかなる方法の一部又は全部のステップを実行することにする。コンピュータープログラム製品はソフトウェアインストールパッケージであることができ、コンピューターは第一システムを含む。
簡単に説明するために、上述した方法実施形態は一連の動作組み合わせで説明されているが、当業者であれば、本発明は説明されている動作順序に限定されなく、本発明によれば、特定のステップは他の順序又は同時に実行することができると理解されるべきである。さらに、当業者であれば、本明細書に記載された実施形態は好ましい実施形態であり、関連する動作及びモジュールは必ず本発明にとって必須ではないと理解されるべきである。
上述した実施形態において、各実施形態の説明には各自の重点がある。一実施形態において詳細に説明されていない部分は、他の実施形態の関連する説明を参照することができる。
本発明によって提供される幾つかの実施形態において、開示される装置は、他の形態により実現され得ると理解されるべきである。例えば、上記に説明された装置の実施例は、例示するためのものに過ぎない。例えば、ユニットの分割は、ロジック機能の分割に過ぎず、実際に実現するときに別の分割形態を有してもよい。例えば、複数のユニット又は部品を組み合わせ、又は別のシステムに集積し、又は若干の特徴を無視し、又は実行しなくてもよい。さらに、図示又は検討する相互間の結合や直接結合や通信接続は、いくつかのインタフェース、装置、又はユニットの間接結合や通信接続であってもよいし、電気、機械や他の形態であってもよい。
分離部品として記載されたユニットは、物理的に分離してもよいし、分離しなくてもよい。ユニットとして表示される部品は、物理的なユニットであってもよいし、物理的なユニットではなくておもよい。即ち、一つの箇所に設置してもよいし、複数のネットワークユニットに設置してもよい。実際の要求に応じて一部又は全部のユニットを選択して本実施例の技術方案の目的を実現することができる。
また、本発明に係る各実施例の各機能ユニットは、1つの処理ユニットに統合されてもよいし、物理的に分離された複数のユニットとして存在してもよいし、2つ以上のユニットは1つのユニットに統合してもよい。上述した統合されたユニットは、ハードウェア又はソフトウェア機能ユニットの形式で実現することができる。
統合されたユニットは、ソフトウェアの機能ユニットとして実現され、かつ、独立の製品として販売されたり使用されたりする場合、コンピュータ読み取り可能な記録媒体に記憶されてもよい。この理解によれば、本発明の技術方案について、本質的な部分、又は従来技術に貢献できた部分、又は該技術方案の全部又は一部は、ソフトウェア製品として表現され得る。このコンピュータソフトウェア製品は、記憶媒体に記憶されており、1つのコンピュータ(パソコン、サーバー、又はネットワーク機器などであってもよい)に本発明の各実施例に係る方法の全部又は一部の過程を実行するための複数のコマンドが含まれている。前記した記憶媒体は、USB(ユニバーサルシリアルバス)フラッシュディスク、フラッシュメモリー、読み取り専用メモリ(ROM、Read−Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、リムーバブルハードディスク(removable hard disk)、磁気ディスク又は光ディスクなどの各種のプログラムコードを記憶可能な媒体を含むことができる。
当業者であれば、上述した方法実施形態の全部又は一部のステップは、関連するハードウェアを命令するプログラムによって達成されてもよく、プログラムはコンピューター可読記憶媒体に格納されることができると理解されるべきである。記憶媒体は、フラッシュメモリ、読み取り専用メモリ(ROM、Read−Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)磁気ディスク又は光ディスクなどを含むことができる。

Claims (15)

  1. 価値モデルセットと融合戦略モデルを含む情報推薦システムに適用できる融合データ処理方法であって、
    複数の異種データソースを取得するステップ101と、
    前記価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得するステップ102と、
    前記融合戦略モデルの損失定量的評価指標を取得するステップ103と、
    前記各異種データソースの統一評価指標と前記損失定量的評価指標を前記融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得するステップ104と、
    を備えることを特徴とする融合データ処理方法。
  2. 前記価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得することは、
    異種データソースのデータタイプと価値モデルとの間の対応関係を含む前記価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得すること、
    前記各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得すること、
    前記各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定すること、
    前記各異種データソースの特徴パラメーターと前記価値モデルを前記専用の予測器に入力することにより、前記各異種データソースに対応する統一評価指標を取得すること、
    を備える、
    ことを特徴とする請求項1に記載の融合データ処理方法。
  3. 前記融合戦略モデルの損失定量的評価指標を取得することは、
    前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得すること、
    前記融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を取得すること、
    前記推定事前結果と前記実際事後結果に基づいて、前記融合戦略モデルの損失定量的評価指標を確定すること、
    を備える、
    ことを特徴とする請求項1又は2に記載の融合データ処理方法。
  4. 前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得することは、
    前記融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得すること、
    前記特徴パラメーターと前記融合戦略モデルを予め設定された予測器に入力することにより、前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得すること、
    を備える、
    ことを特徴とする請求項3に記載の融合データ処理方法。
  5. 前記各異種データソースの統一評価指標と前記損失定量的評価指標を前記融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得することは、
    前記各異種データソースの統一評価指標に基づいてソートセットを生成し、前記ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれ、いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なること、
    前記融合戦略モデルの制約条件下で、前記ソートセットから最適な1つのソートを選択して、複数の異種データソースの融合ソート推薦結果とすること、
    を備える、
    ことを特徴とする請求項1〜4のいずれか一項に記載の融合データ処理方法。
  6. 前記制約条件は、推薦結果には少なくとも1つの自然結果があること、広告の数は予め設定された数以上であること、推薦情報は全て不人気な情報又は全て人気のある情報ではないこと、一日内の自然結果の表示比率は予め設定された比率より大きいこと、の中のいずれか1つである、
    ことを特徴とする請求項5に記載の融合データ処理方法。
  7. 前記情報推薦システムはトレーニングデータベースと複数の価値モデルをさらに含み、前記情報推薦システムは、前記トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得し、前記融合データ処理方法は、
    トレーニング済みの価値モデル及び対応するデータタイプを取得するステップと、
    取得したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、前記価値モデルセットを生成するステップと、
    をさらに備える、
    ことを特徴とする請求項1〜6のいずれか一項に記載の融合データ処理方法。
  8. プロセッサ501と、実行可能なプログラムコードを格納するメモリ502と、を備える情報推薦システムであって、
    前記プログラムコードが前記プロセッサによって実行されると、
    前記プロセッサは、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、前記各異種データソースの統一評価指標と前記損失定量的評価指標を前記融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する、
    ことを特徴とする情報推薦システム。
  9. 前記価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得するという点で、
    前記プログラムコードが前記プロセッサによって実行されると、前記プロセッサは、異種データソースのデータタイプと価値モデルとの間の対応関係を含む価値モデルセットを照会することにより、各異種データソースに対応する価値モデルを取得し、前記各異種データソースに対応する価値モデルに必要な特徴パラメーターを取得し、前記各異種データソースに対応する価値モデルに関連付けられた専用の予測器を確定し、前記各異種データソースの特徴パラメーターと前記価値モデルを専用の予測器に入力することにより、前記各異種データソースに対応する統一評価指標を取得する、
    ことを特徴とする請求項8に記載の情報推薦システム。
  10. 前記融合戦略モデルの損失定量的評価指標を取得するという点で、
    前記プログラムコードが前記プロセッサによって実行されると、前記プロセッサは、前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得し、前記融合戦略モデルによって予め設定された推薦タスクを処理した実際事後結果を取得し、前記推定事前結果と前記実際事後結果に基づいて、前記融合戦略モデルの損失定量的評価指標を確定する、
    ことを特徴とする請求項8又は9に記載の情報推薦システム。
  11. 前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得するという点で、
    前記プログラムコードが前記プロセッサによって実行されると、前記プロセッサは、前記融合戦略モデルによって予め設定された推薦タスクを処理するために必要な特徴パラメーターを取得し、前記特徴パラメーターと前記融合戦略モデルを予め設定された予測器に入力することにより、前記融合戦略モデルによって予め設定された推薦タスクを処理した推定事前結果を取得する、
    ことを特徴とする請求項10記載の情報推薦システム。
  12. 前記各異種データソースの統一評価指標と前記損失定量的評価指標を前記融合戦略モデルに入力することにより、前記複数の異種データソースの融合ソート推薦結果を取得するという点で、
    前記プログラムコードが前記プロセッサによって実行されると、前記プロセッサは、各異種データソースの統一評価指標に基づいてソートセットを生成し、前記融合戦略モデルの制約下で、前記ソートセットから最適な1つのソートを選択して、前期複数の異種データソースの融合ソート推薦結果とし、
    前記ソートセットには複数のデータソースシーケンスが含まれ、各データソースシーケンスには複数の異種データソースが含まれ、いかなる2つのデータソースシーケンスの中の異種データソースの順序は異なる、
    ことを特徴とする請求項8〜11のいずれか一項に記載の情報推薦システム。
  13. 前記制約条件は、推薦結果には少なくとも1つの自然結果があること、広告の数は予め設定された数以上であること、推薦情報は全て不人気な情報又は全て人気のある情報ではないこと、一日内の自然結果の表示比率は予め設定された比率より大きいこと、の中のいずれか1つである、
    ことを特徴とする請求項12記載の情報推薦システム。
  14. 前記情報推薦システムはトレーニングデータベースと複数の価値モデルをさらに含み、前記情報推薦システムは、前記トレーニングデータベースのトレーニングデータを介して各価値モデルをトレーニングして、トレーニング済みの価値モデルを取得し、
    前記プログラムコードが前記プロセッサによって実行されると、前記プロセッサは、さらに、前記トレーニング済みの価値モデル及び対応するデータタイプを取得し、取得したトレーニング済みの価値モデル及び対応するデータタイプに基づいて、前記価値モデルセットを生成する、
    ことを特徴とする請求項8〜13のいずれか一項に記載の情報推薦システム。
  15. コンピュータープログラムを格納する非一時的なコンピューター可読記憶媒体であって、
    前記コンピュータープログラムがプロセッサによって実行されると、前記プロセッサは、複数の異種データソースを取得し、価値モデルセットを使用して複数の異種データソースを処理することにより、各異種データソースの統一評価指標を取得し、融合戦略モデルの損失定量的評価指標を取得し、各異種データソースの統一評価指標と損失定量的評価指標を融合戦略モデルに入力することにより、複数の異種データソースの融合ソート推薦結果を取得する、
    ことを特徴とする非一時的なコンピューター可読記憶媒体。
JP2020526448A 2017-12-29 2018-10-17 融合データ処理方法及び情報推薦システム Active JP7052037B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201711468874.XA CN108090208A (zh) 2017-12-29 2017-12-29 融合数据处理方法及装置
CN201711468874.X 2017-12-29
PCT/CN2018/110668 WO2019128394A1 (en) 2017-12-29 2018-10-17 Method for processing fusion data and information recommendation system

Publications (2)

Publication Number Publication Date
JP2021502651A true JP2021502651A (ja) 2021-01-28
JP7052037B2 JP7052037B2 (ja) 2022-04-11

Family

ID=62180497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020526448A Active JP7052037B2 (ja) 2017-12-29 2018-10-17 融合データ処理方法及び情報推薦システム

Country Status (6)

Country Link
US (1) US11061966B2 (ja)
EP (1) EP3506124A1 (ja)
JP (1) JP7052037B2 (ja)
KR (1) KR102358604B1 (ja)
CN (1) CN108090208A (ja)
WO (1) WO2019128394A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090208A (zh) * 2017-12-29 2018-05-29 广东欧珀移动通信有限公司 融合数据处理方法及装置
CN108921624B (zh) * 2018-07-27 2021-10-01 百度在线网络技术(北京)有限公司 广告融合方法、装置、存储介质和终端设备
CN109726747B (zh) * 2018-12-20 2021-09-28 西安电子科技大学 基于社交网络推荐平台的数据融合排序方法
CN110781340B (zh) * 2019-09-27 2023-05-23 上海麦克风文化传媒有限公司 一种推荐系统召回策略的离线评估方法、系统、装置及存储介质
CN110991487B (zh) * 2019-11-07 2022-11-08 天津大学 一种多源监测检测数据的集成耦合模型生成方法
CN110879806A (zh) * 2019-11-25 2020-03-13 北京优奥创思科技发展有限公司 一种数据融合的方法、装置、设备和存储介质
CN110942376B (zh) * 2019-12-02 2023-09-01 上海麦克风文化传媒有限公司 一种音频类产品的实时多召回策略的融合方法
CN112989276A (zh) * 2019-12-12 2021-06-18 北京沃东天骏信息技术有限公司 信息推送系统的评价方法和装置
CN111324594B (zh) * 2020-02-17 2023-08-11 武汉轻工大学 用于粮食加工业的数据融合方法、装置、设备及存储介质
CN111401759B (zh) * 2020-03-20 2022-08-23 支付宝(杭州)信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN112347113B (zh) * 2020-09-16 2021-12-14 北京中兵数字科技集团有限公司 航空数据融合方法、航空数据融合装置和存储介质
CN112507196A (zh) 2020-12-18 2021-03-16 北京百度网讯科技有限公司 融合排序模型的训练方法、搜索排序方法、装置和设备
CN112711626A (zh) * 2020-12-29 2021-04-27 长威信息科技发展股份有限公司 一种多源异构数据统一汇聚方法及系统
CN113761338A (zh) * 2021-01-12 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置和计算机可读存储介质
CN113127467A (zh) * 2021-04-20 2021-07-16 赛诺数据科技(南京)有限公司 基于自定义规则的etl任务失败平台处理方法及系统
CN113515432B (zh) * 2021-06-24 2021-12-10 浙江口碑网络技术有限公司 对象展示方法、装置、计算机设备及计算机可读存储介质
CN113569119A (zh) * 2021-07-02 2021-10-29 中译语通科技股份有限公司 一种基于多模态机器学习的新闻网页正文抽取系统及方法
CN114970667B (zh) * 2022-03-30 2024-03-29 国网吉林省电力有限公司 一种多源异构能源数据融合方法
CN116304974B (zh) * 2023-02-17 2023-09-29 国网浙江省电力有限公司营销服务中心 多渠道数据融合方法及系统
CN116204888B (zh) * 2023-03-01 2023-10-27 联洋国融(北京)科技有限公司 一种基于隐私计算的数据源融合评估方法及系统
CN117216722B (zh) * 2023-11-09 2024-02-27 山东农业大学 基于传感器时序数据多源异构数据融合系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
JP2016177772A (ja) * 2015-12-07 2016-10-06 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2017054257A (ja) * 2015-09-08 2017-03-16 ヤフー株式会社 決定装置、決定方法、及び決定プログラム
WO2017088688A1 (zh) * 2015-11-25 2017-06-01 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
WO2017121258A1 (zh) * 2016-01-12 2017-07-20 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器和存储介质
JP2017207936A (ja) * 2016-05-18 2017-11-24 株式会社ジョルテ 広告情報提供装置および広告情報提供用プログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002087431A1 (en) 2001-05-01 2002-11-07 Structural Bioinformatics, Inc. Diagnosing inapparent diseases from common clinical tests using bayesian analysis
US20070299828A1 (en) * 2006-06-05 2007-12-27 Digital Mountain, Inc. Method and Apparatus for Processing Heterogeneous Data
US20090006368A1 (en) 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
US8478711B2 (en) * 2011-02-18 2013-07-02 Larus Technologies Corporation System and method for data fusion with adaptive learning
CN103782285B (zh) * 2011-09-12 2018-03-06 英特尔公司 对精确用户偏好数据的收集和管理
CN102508859B (zh) * 2011-09-29 2014-10-29 北京亿赞普网络技术有限公司 一种基于网页特征的广告分类方法及装置
CN102592235A (zh) * 2011-12-28 2012-07-18 北京品友互动信息技术有限公司 一种互联网广告投放系统
CN104254851A (zh) * 2012-03-17 2014-12-31 海智网聚网络技术(北京)有限公司 用于向用户推荐内容的方法和系统
CN103729386B (zh) 2012-10-16 2017-08-04 阿里巴巴集团控股有限公司 信息查询系统与方法
US9652797B2 (en) * 2013-01-18 2017-05-16 24/7 Customer, Inc. Intent prediction based recommendation system using data combined from multiple channels
US20150120722A1 (en) * 2013-10-31 2015-04-30 Telefonica Digital Espana, S.L.U. Method and system for providing multimedia content recommendations
CN103995878B (zh) * 2014-05-23 2017-10-27 中国科学技术大学 一种分布式个性化推荐方法及系统
CN105740276B (zh) * 2014-12-10 2020-11-03 深圳市腾讯计算机系统有限公司 适用于商业化搜索的点击反馈模型的估算方法和装置
WO2016201631A1 (en) 2015-06-17 2016-12-22 Yahoo! Inc. Systems and methods for online content recommendation
CN106445954B (zh) * 2015-08-07 2021-02-05 北京奇虎科技有限公司 一种业务对象的展示方法和装置
CN106504011B (zh) * 2015-09-06 2019-11-05 阿里巴巴集团控股有限公司 一种业务对象的展示方法和装置
CN106126727A (zh) * 2016-07-01 2016-11-16 中国传媒大学 一种推荐系统大数据处理方法
CN107122447A (zh) * 2017-04-25 2017-09-01 南京邮电大学 一种基于偏好的多数据源融合的网络搜索系统及控制方法
CN107424043B (zh) 2017-06-15 2021-06-25 北京三快在线科技有限公司 一种产品推荐方法及装置,电子设备
CN107330050A (zh) * 2017-06-28 2017-11-07 达而观信息科技(上海)有限公司 一种个性化推荐方法及系统
CN108090208A (zh) * 2017-12-29 2018-05-29 广东欧珀移动通信有限公司 融合数据处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
JP2017054257A (ja) * 2015-09-08 2017-03-16 ヤフー株式会社 決定装置、決定方法、及び決定プログラム
WO2017088688A1 (zh) * 2015-11-25 2017-06-01 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
JP2016177772A (ja) * 2015-12-07 2016-10-06 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2017121258A1 (zh) * 2016-01-12 2017-07-20 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器和存储介质
JP2017207936A (ja) * 2016-05-18 2017-11-24 株式会社ジョルテ 広告情報提供装置および広告情報提供用プログラム

Also Published As

Publication number Publication date
JP7052037B2 (ja) 2022-04-11
KR102358604B1 (ko) 2022-02-08
US11061966B2 (en) 2021-07-13
US20190205477A1 (en) 2019-07-04
CN108090208A (zh) 2018-05-29
KR20200069352A (ko) 2020-06-16
EP3506124A1 (en) 2019-07-03
WO2019128394A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
JP7052037B2 (ja) 融合データ処理方法及び情報推薦システム
CN109902708B (zh) 一种推荐模型训练方法及相关装置
US10534845B2 (en) System and method for optimizing electronic document layouts
WO2019128426A1 (en) Method for training model and information recommendation system
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
US11522938B2 (en) Feature generation for online/offline machine learning
US11397764B2 (en) Machine learning for digital image selection across object variations
US10402465B1 (en) Content authority ranking using browsing behavior
CN111143686A (zh) 资源推荐方法及装置
CN111708948B (zh) 内容项推荐方法、装置、服务器及计算机可读存储介质
CN113018846A (zh) 结合数据分析和动态渲染的游戏画面处理方法及存储介质
CN110515631B (zh) 应用安装数据包的生成方法、服务器及计算机存储介质
CN104954824A (zh) 一种用于进行视频设置的方法、设备与系统
US9843837B2 (en) Cross-platform analysis
JP2020177695A (ja) 情報提供システム、および情報提供方法
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置
CN112269942B (zh) 一种推荐对象的方法、装置、系统及电子设备
CN111159558B (zh) 一种推荐列表的生成方法、装置和电子设备
JP6601888B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR20200114902A (ko) 카드 이용 정보를 이용하여 고객 프로파일을 생성하기 위한 방법 및 고객 프로파일을 생성하기 위한 장치
CN116186398A (zh) 模板推荐方法、装置、设备及介质
CN114637926A (zh) 内容推荐方法、装置、电子设备及存储介质
JP2022144282A (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN117333235A (zh) 一种模型训练、信息确定方法、装置、设备和存储介质
CN114547116A (zh) 一种数据推送方法、装置、设备和介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220330

R150 Certificate of patent or registration of utility model

Ref document number: 7052037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150