JP2020522061A - サンプル重み設定方法及び装置、電子装置 - Google Patents
サンプル重み設定方法及び装置、電子装置 Download PDFInfo
- Publication number
- JP2020522061A JP2020522061A JP2019564949A JP2019564949A JP2020522061A JP 2020522061 A JP2020522061 A JP 2020522061A JP 2019564949 A JP2019564949 A JP 2019564949A JP 2019564949 A JP2019564949 A JP 2019564949A JP 2020522061 A JP2020522061 A JP 2020522061A
- Authority
- JP
- Japan
- Prior art keywords
- popularity
- sample
- weight
- index
- popularity index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本特許出願は、2017年5月23日に提出され、出願番号が201710370473.4であり、発明の名称が「サンプル重み設定方法及び装置、電子装置」である中国特許出願の優先権を主張し、該出願の全内容が引用により本明細書に組み込まれる。
トレーニングされるサンプルの人気度指標の値を取得することと、
各前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定することと、
全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定することを含む。
トレーニングされるサンプルの人気度指標の値を取得するための人気度指標取得モジュールと、
各前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定するための単一人気度指標重み決定モジュールと、
全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定するためのサンプル重み決定モジュールを備える。
式1と式2では、F(lngj,latj) はj番目のエリアブロックのエリア人気度の値であり、xiはエリアブロックjにおける一つのトレーニングされるサンプルを表し、W(xi) はエリアブロックjにおける一つのトレーニングされるサンプルのサンプルエリア人気度重みを表し、D(lngj,latj) はj番目のエリアブロックに関連付けられているトレーニングサンプルセットを表し、H(F(lngj,latj)) はエリア人気度の単調減少関数を表す。
式3と式4では、F(lngj,latj) はj番目のエリアブロックのエリア人気度の値であり、cは単調傾向を制御する調和パラメータであり、このパラメータの設定はエリア人気度の値の分布を考慮する必要があり、同時にモデルトレーニングのためのauc、MAPなどの指標に基づいて決定することができる。ここで、aucは分類結果を評価する指標であり、分類モデルの評価に用いられ、MAPはランキングを評価する指標である。
ここで、F2(Timej) はj番目の期間のタイム人気度の値であり、cは単調傾向を制御する調和パラメータであり、具体的な設定方法についてはエリア人気度の式における調和パラメータ設定方法を参照する。
ここで、F3avg は全ての期間のエリア人気度の平均値であり、式9に従って計算されてもよく、
式8と式9では、F3(Proj) はj番目のカテゴリのカテゴリ人気度の値であり、xi はカテゴリjにおける一つのトレーニングされるサンプルを表し、W3(xi) はカテゴリjにおける一つのトレーニングされるサンプルのサンプルカテゴリ人気度重みを表し、D(Proj) はj番目のカテゴリに関連付けられているトレーニングサンプルセットを表し、H(F3(Proj)) はカテゴリ人気度の単調減少関数を表す。
ロジスティック回帰の基本的な関係については、
線形境界は式10であり、
ここで、式10では、θはサンプル特徴重みであり、 xは特徴値であり、nはサンプル特徴次元であり、
はサンプルベクトルであり、
はサンプル特徴重みベクトルである。予測関数はサンプルの回帰値に対応する。式12では、yはラベリングされたサンプルラベルであり、ポジティブサンプルのラベルは1であり、ネガティブサンプルのラベルは0である。損失関数の継続的な反復に伴い、モデルが収束するまでサンプル重みが更新され、ポジティブサンプルは1に近く回帰し、ネガティブサンプルは0に近く回帰する。損失関数の形態から分かるように、モデルがサンプルをトラバースして反復する時に、サンプルの重みが大きいほどモデル学習プロセスに対する影響が大きいことで、このようなサンプルはより十分に学習される。したがって、人気度に基づいてサンプルの重みを調整した後、モデルがトレーニングされる時にラベリングが十分に正確ではないサンプルの重要性が減少し、即ち、モデルのトレーニングの精度を向上させるという効果を達成する。
トレーニングされるサンプルの人気度指標の値を取得するための人気度指標取得モジュール400と、
各前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定するための単一人気度指標重み決定モジュール410と、
全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定するためのサンプル重み決定モジュール420を備える。
全ての前記人気度指標に対応する前記単一人気度指標重みの積を決定し、前記積を前記トレーニングされるサンプルのサンプル重みとするための第一のサンプル重み決定ユニット4201、又は、単一人気度指標の重要度に応じて前記人気度指標に対応する少なくとも一つの前記単一人気度指標重みを調整し、全ての前記人気度指標に対応する調整された単一人気度指標重みの積を前記トレーニングされるサンプルのサンプル重みとするための第二のサンプル重み決定ユニット4202を含み、
ここで、前記人気度指標に対応する少なくとも一つの前記単一人気度指標重みを調整することは、
前記トレーニングされるサンプルのサンプル重みに対する調整後の単一人気度指標重みの割合が前記単一人気度指標の重要度に適応するように、少なくとも一つの単一人気度指標重みを調整することを含む。
前記人気度指標がエリア人気度を含む場合、好ましくは、図5に示すように、前記単一人気度指標重み決定モジュール410は第一の単一人気度指標重み決定ユニット4101を含み、前記第一の単一人気度指標重み決定ユニット4101がエリア人気度の単調減少関数に基づいてトレーニングされるサンプルのエリア人気度重みを決定するために用いられる。
Claims (18)
- サンプル重み設定方法であって、
トレーニングされるサンプルの人気度指標の値を取得することと、
各前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定することと、
全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定することを含む、前記サンプル重み設定方法。 - 前記人気度指標は、エリア人気度、タイム人気度、カテゴリ人気度を含むことを特徴とする
請求項1に記載の方法。 - 全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定することは、
全ての前記人気度指標に対応する前記単一人気度指標重みの積を決定し、前記積を前記トレーニングされるサンプルのサンプル重みとすることを含むことを特徴とする
請求項1又は2に記載の方法。 - 全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定することは、
単一人気度指標の重要度に応じて前記人気度指標に対応する少なくとも一つの前記単一人気度指標重みを調整し、前記人気度指標に対応する調整された単一人気度指標重みとすることと、
全ての前記人気度指標に対応する前記調整された単一人気度指標重みの積を前記トレーニングされるサンプルのサンプル重みとすることを含むことを特徴とする
請求項1又は2に記載の方法。 - 前記単一人気度指標の重要度に応じて前記人気度指標に対応する少なくとも一つの前記単一人気度指標重みを調整することは、
前記トレーニングされるサンプルのサンプル重みに対する前記調整された単一人気度指標重みの割合が前記単一人気度指標の重要度に適応するように、前記単一人気度指標の重要度に応じて前記人気度指標に対応する前記単一人気度指標重みを調整することを含むことを特徴とする請求項4に記載の方法。 - 前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定することは、
前記エリア人気度の単調減少関数に基づいて前記トレーニングされるサンプルのエリア人気度重みを決定することを含むことを特徴とする
請求項2に記載の方法。 - 前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定することは、
前記タイム人気度の単調減少関数に基づいて前記トレーニングされるサンプルのタイム人気度重みを決定することを含むことを特徴とする
請求項2に記載の方法。 - 前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定することは、
前記カテゴリ人気度の単調減少関数に基づいて前記トレーニングされるサンプルのカテゴリ人気度重みを決定することを含むことを特徴とする
請求項2に記載の方法。 - サンプル重み設定装置であって、
トレーニングされるサンプルの人気度指標の値を取得するための人気度指標取得モジュールと、
各前記人気度指標の値に基づいて前記トレーニングされるサンプルの前記人気度指標に対応する単一人気度指標重みを決定するための単一人気度指標重み決定モジュールと、
全ての前記人気度指標に対応する前記単一人気度指標重みに基づき、前記トレーニングされるサンプルのサンプル重みを決定するためのサンプル重み決定モジュールを備える、前記サンプル重み設定装置。 - 前記人気度指標は、エリア人気度、タイム人気度、カテゴリ人気度を含むことを特徴とする
請求項9に記載の装置。 - 前記サンプル重み決定モジュールは、
全ての前記人気度指標に対応する前記単一人気度指標重みの積を決定し、前記積を前記トレーニングされるサンプルのサンプル重みとするための第一のサンプル重み決定ユニットを含むことを特徴とする
請求項9又は10に記載の装置。 - 前記サンプル重み決定モジュールは、
前記単一人気度指標の重要度に応じて前記人気度指標に対応する少なくとも一つの前記単一人気度指標重みを調整し、全ての前記人気度指標に対応する前記調整された単一人気度指標重みの積を前記トレーニングされるサンプルのサンプル重みとするための第二のサンプル重み決定ユニットを含むことを特徴とする
請求項9又は10に記載の装置。 - 前記単一人気度指標の重要度に応じて前記人気度指標に対応する前記単一人気度指標重みを調整することは、
前記トレーニングされるサンプルのサンプル重みに対する前記調整された単一人気度指標重みの割合が前記単一人気度指標の重要度に適応するように、前記単一人気度指標の重要度に応じて前記人気度指標に対応する前記単一人気度指標重みを調整することを含むことを特徴とする
請求項12に記載の装置。 - 前記人気度指標がエリア人気度を含む場合、前記単一人気度指標重み決定モジュールはさらに前記エリア人気度の単調減少関数に基づいて前記トレーニングされるサンプルのエリア人気度重みを決定するために用いられることを特徴とする
請求項9に記載の装置。 - 前記人気度指標がタイム人気度を含む場合、前記単一人気度指標重み決定モジュールはさらに前記タイム人気度の単調減少関数に基づいて前記トレーニングされるサンプルのタイム人気度重みを決定するために用いられることを特徴とする
請求項9に記載の装置。 - 前記人気度指標がカテゴリ人気度を含む場合、前記単一人気度指標重み決定モジュールはさらに前記カテゴリ人気度の単調減少関数に基づいて前記トレーニングされるサンプルのカテゴリ人気度重みを決定するために用いられることを特徴とする
請求項9に記載の装置。 - メモリ、プロセッサ及び前記メモリに記憶され、且つ前記プロセッサで実行可能なコンピュータプログラムを備える電子装置であって、前記プロセッサが前記コンピュータプログラムを実行する時に請求項1−8のいずれか一項に記載のサンプル重み設定方法が実現されることを特徴とする前記電子装置。
- コンピュータプログラムを記憶するコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される時に請求項1−8のいずれか一項に記載のサンプル重み設定方法が実現されることを特徴とする前記コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710370473.4A CN107341176B (zh) | 2017-05-23 | 2017-05-23 | 一种样本权重设置方法及装置,电子设备 |
CN201710370473.4 | 2017-05-23 | ||
PCT/CN2017/119844 WO2018214503A1 (zh) | 2017-05-23 | 2017-12-29 | 一种样本权重设置方法及装置、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020522061A true JP2020522061A (ja) | 2020-07-27 |
JP6964689B2 JP6964689B2 (ja) | 2021-11-10 |
Family
ID=60221310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019564949A Active JP6964689B2 (ja) | 2017-05-23 | 2017-12-29 | サンプル重み設定方法及び装置、電子装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20200175023A1 (ja) |
EP (1) | EP3617909A4 (ja) |
JP (1) | JP6964689B2 (ja) |
KR (1) | KR102340463B1 (ja) |
CN (1) | CN107341176B (ja) |
CA (1) | CA3062119A1 (ja) |
WO (1) | WO2018214503A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11809434B1 (en) * | 2014-03-11 | 2023-11-07 | Applied Underwriters, Inc. | Semantic analysis system for ranking search results |
CN107491518B (zh) * | 2017-08-15 | 2020-08-04 | 北京百度网讯科技有限公司 | 一种搜索召回方法和装置、服务器、存储介质 |
CN110309253A (zh) * | 2018-03-01 | 2019-10-08 | 北京京东尚科信息技术有限公司 | 选品方法、装置和计算机可读存储介质 |
CN110309417A (zh) * | 2018-04-13 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 评价因子的权重确定方法和装置 |
US20200065706A1 (en) * | 2018-08-24 | 2020-02-27 | Htc Corporation | Method for verifying training data, training system, and computer program product |
CN109284285B (zh) * | 2018-09-07 | 2024-05-28 | 平安科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及计算机可读存储介质 |
CN110363346B (zh) * | 2019-07-12 | 2024-07-23 | 腾讯科技(北京)有限公司 | 点击率预测方法、预测模型的训练方法、装置及设备 |
CN110472665A (zh) * | 2019-07-17 | 2019-11-19 | 新华三大数据技术有限公司 | 模型训练方法、文本分类方法及相关装置 |
CN113688304A (zh) * | 2020-05-19 | 2021-11-23 | 华为技术有限公司 | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016511906A (ja) * | 2013-03-28 | 2016-04-21 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 商品検索結果の順位付け |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080097821A1 (en) * | 2006-10-24 | 2008-04-24 | Microsoft Corporation | Recommendations utilizing meta-data based pair-wise lift predictions |
CN102831153B (zh) * | 2012-06-28 | 2015-09-30 | 北京奇虎科技有限公司 | 一种选取样本的方法和装置 |
CN104504124B (zh) * | 2014-12-31 | 2017-12-19 | 合一网络技术(北京)有限公司 | 通过视频搜索和播放行为表现出实体热度的方法 |
CN104899368B (zh) * | 2015-05-29 | 2019-04-30 | 浙江宇视科技有限公司 | 基于数据热度的监控布点需求图生成方法及装置 |
CN104915734B (zh) * | 2015-06-25 | 2017-03-22 | 深圳市腾讯计算机系统有限公司 | 基于时间序列的商品热度预测方法和系统 |
CN105653683B (zh) * | 2015-12-30 | 2020-10-16 | 东软集团股份有限公司 | 一种个性化推荐方法及装置 |
CN105787061B (zh) * | 2016-02-29 | 2019-09-20 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 信息推送方法 |
CN106022865A (zh) * | 2016-05-10 | 2016-10-12 | 江苏大学 | 一种基于评分和用户行为的商品推荐方法 |
-
2017
- 2017-05-23 CN CN201710370473.4A patent/CN107341176B/zh active Active
- 2017-12-29 KR KR1020197035385A patent/KR102340463B1/ko active IP Right Grant
- 2017-12-29 US US16/615,830 patent/US20200175023A1/en not_active Abandoned
- 2017-12-29 WO PCT/CN2017/119844 patent/WO2018214503A1/zh unknown
- 2017-12-29 EP EP17911294.1A patent/EP3617909A4/en not_active Withdrawn
- 2017-12-29 CA CA3062119A patent/CA3062119A1/en active Pending
- 2017-12-29 JP JP2019564949A patent/JP6964689B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016511906A (ja) * | 2013-03-28 | 2016-04-21 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 商品検索結果の順位付け |
Also Published As
Publication number | Publication date |
---|---|
KR20200003109A (ko) | 2020-01-08 |
EP3617909A1 (en) | 2020-03-04 |
US20200175023A1 (en) | 2020-06-04 |
CA3062119A1 (en) | 2019-11-22 |
WO2018214503A1 (zh) | 2018-11-29 |
CN107341176B (zh) | 2020-05-29 |
CN107341176A (zh) | 2017-11-10 |
KR102340463B1 (ko) | 2021-12-17 |
JP6964689B2 (ja) | 2021-11-10 |
EP3617909A4 (en) | 2020-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6964689B2 (ja) | サンプル重み設定方法及び装置、電子装置 | |
CN109902708B (zh) | 一种推荐模型训练方法及相关装置 | |
US20200117675A1 (en) | Obtaining of Recommendation Information | |
CN108829808B (zh) | 一种页面个性化排序方法、装置及电子设备 | |
CN107545301B (zh) | 页面展示方法及装置 | |
CN107577736B (zh) | 一种基于bp神经网络的文件推荐方法及系统 | |
EP2960849A1 (en) | Method and system for recommending an item to a user | |
CN110753920A (zh) | 用于优化和模拟网页排序和流量的系统和方法 | |
CN108446297B (zh) | 一种推荐方法及装置,电子设备 | |
CN107463580B (zh) | 训练点击率预估模型方法和装置、点击率预估方法和装置 | |
CN108205775A (zh) | 一种业务对象的推荐方法、装置和客户端 | |
CN106445954B (zh) | 一种业务对象的展示方法和装置 | |
WO2020233432A1 (zh) | 一种信息推荐方法及装置 | |
CN113407854A (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
CN111798280A (zh) | 多媒体信息推荐方法、装置和设备及存储介质 | |
CN114168843A (zh) | 搜索词推荐方法、设备及存储介质 | |
Song | Web service reliability prediction based on machine learning | |
CN109190040A (zh) | 基于协同演化的个性化推荐方法及装置 | |
CN110263973B (zh) | 预测用户行为的方法及装置 | |
CN116739665A (zh) | 信息投放方法、装置、电子设备及存储介质 | |
CN111428125B (zh) | 排序方法、装置、电子设备及可读存储介质 | |
CN113837514A (zh) | 用户满意度的评估方法、装置、计算设备及存储介质 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN114428824A (zh) | Poi重要度确定方法、装置、电子设备及存储介质 | |
Król et al. | Performance of map applications on mobile devices: case study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6964689 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |