JP6249027B2 - 関係データのためのデータモデル生成方法及びシステム - Google Patents
関係データのためのデータモデル生成方法及びシステム Download PDFInfo
- Publication number
- JP6249027B2 JP6249027B2 JP2016040852A JP2016040852A JP6249027B2 JP 6249027 B2 JP6249027 B2 JP 6249027B2 JP 2016040852 A JP2016040852 A JP 2016040852A JP 2016040852 A JP2016040852 A JP 2016040852A JP 6249027 B2 JP6249027 B2 JP 6249027B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- variable
- variables
- entities
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013499 data model Methods 0.000 title claims description 72
- 238000000034 method Methods 0.000 title claims description 48
- 238000009826 distribution Methods 0.000 claims description 180
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001808 coupling effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 235000021170 buffet Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Description
のレストランj(1≦j≦J)に対する評価xijに影響を及ぼし得る特徴は、K個の第1変数のセットU=(u1,u2,u3,…uK)として表され得る。特定の例において、客と、関係する第1変数のセットとの間の関係は、例えば、以下のI×Kの行列で表され得る(I人の客に対してK個の第1変数)。
である。
である。
である。
である。
である。
である。
を初期化する。当業者においては、それぞれのパラメータが確率的な値で初期化されてもよく、それぞれのパラメータに対して実証的な値が初期化されてもよいことを理解されたい。本発明は、この点において、限定されない。
を更新する。例示的な更新方法は、まず、勾配が生じるかもしれないパラメータを得て、その後、従来の勾配の交互上昇を利用するか、又は、2つのパラメータに関するノイズ自然勾配
及び
を0に設定し、そして、更新された
を取得するために方程式を解く。
であり、λtは、所定のステップ長であり、λt=(τ0+t)−κと表され得る。この式において、tは、繰り返し回数を表し、その値は、0以上の整数であり、κは、繰り返し速度を制御するためのパラメータを表し、予め設定された固定値であり、好ましくは、0.5から1の間であり、τ0は、ステップの長さに対するtの値からの影響を調節するためのものであり、これも予め設定された固定値であってもよく、好ましくは、0以上の小さい実数に定められる。
第1カテゴリの複数のエンティティ及び第2カテゴリの複数のエンティティに基づく関係データのためのデータモデルを生成する方法であって、
当該方法は、
前記データモデルを記述する複数の変数を判別することと、
前記複数の変数のそれぞれに対する近似分布を選択することと、
前記データモデルが収束するまで、前記近似分布のパラメータを繰り返し更新することと、を含み、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第1カテゴリの前記エンティティの特徴を表す第1変数のセットと、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第2カテゴリの前記エンティティの特徴を表す第2変数のセットと、を有する、
関係データのためのデータモデルを生成する方法。
前記第1変数及び前記第2変数は、ブール変数であり、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす、前記第1変数と前記第2変数の可変の組合せからの結合の影響を示す第3変数のセット、をさらに含む、
付記1に記載の方法。
前記複数の変数は、
前記第1カテゴリの前記複数のエンティティの中で、前記第1変数のセットからのそれぞれの第1変数を有する、前記第1カテゴリのエンティティのパーセンテージを示す第4変数のセットと、
前記第2カテゴリの前記複数のエンティティの中で、前記第2変数のセットからのそれぞれの第2変数を有する、前記第2カテゴリのエンティティのパーセンテージを示す第5変数のセットと、をさらに含む、
付記1又は2に記載の方法。
前記第1変数及び前記第2変数に対して選択される近似分布は、ベルヌーイ分布を含み、前記第3変数に対して選択される近似分布は、正規分布を含み、前記第4変数及び前記第5変数に対して選択される近似分布は、ベータ分布を含む、
付記3に記載の方法。
前記近似分布のパラメータを繰り返し更新することは、
勾配上昇アルゴリズムを用いて前記近似分布の前記パラメータを繰り返し更新すること、をさらに含む、
付記1又は2に記載の方法。
前記近似分布のパラメータを繰り返し更新することは、
前記第1変数及び前記第2変数に対する前記近似分布の前記パラメータを繰り返し更新することと、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを繰り返し更新することと、をさらに含む、
付記3に記載の方法。
前記近似分布のパラメータを繰り返し更新することは、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを、確率的順序で更新すること、を含む、
付記3に記載の方法。
1つ以上の変数のそれぞれに対する先験的な分布を選択すること、をさらに含み、
前記データモデルの前記収束の条件は、
(1)前記1つ以上の変数のそれぞれの事後的な分布とそれぞれの近似分布との間の差と、
(2)前記第1カテゴリ及び前記第2カテゴリの任意の所定のエンティティに対する、少なくとも前記第1カテゴリと前記第2カテゴリとの所定の前記エンティティ間の関係に影響を及ぼす第1変数及び第2変数の現在の値に基づいて取得される前記第1カテゴリと前記第2カテゴリの前記所定のエンティティ間の関係の尤度と、
の少なくとも一方に基づいて判別される、
付記1に記載の方法。
前記第1カテゴリは、前記第2カテゴリと異なる、
付記1に記載の方法。
第1カテゴリの複数のエンティティ及び第2カテゴリの複数のエンティティに基づく関係データのためのデータモデルを生成する装置であって、
当該装置は、
前記データモデルを記述する複数の変数を判別するように構成された判別ユニットと、
前記複数の変数のそれぞれに対する近似分布を選択するように構成された近似分布選択ユニットと、
前記データモデルが収束するまで、前記近似分布のパラメータを繰り返し更新するように構成された更新ユニットと、を備え、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第1カテゴリの前記エンティティの特徴を表す第1変数のセットと、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第2カテゴリの前記エンティティの特徴を表す第2変数のセットと、を有する、
関係データのためのデータモデルを生成する装置。
前記第1変数及び前記第2変数は、ブール変数であり、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす、前記第1変数と前記第2変数の可変の組合せからの結合の影響を示す第3変数のセット、をさらに含む、
付記10に記載の装置。
前記複数の変数は、
前記第1カテゴリの前記複数のエンティティの中で、前記第1変数のセットからのそれぞれの第1変数を有する、前記第1カテゴリのエンティティのパーセンテージを示す第4変数のセットと、
前記第2カテゴリの前記複数のエンティティの中で、前記第2変数のセットからのそれぞれの第2変数を有する、前記第2カテゴリのエンティティのパーセンテージを示す第5変数のセットと、をさらに含む、
付記10又は11に記載の装置。
前記第1変数及び前記第2変数に対して選択される近似分布は、ベルヌーイ分布を含み、前記第3変数に対して選択される近似分布は、正規分布を含み、前記第4変数及び前記第5変数に対して選択される近似分布は、ベータ分布を含む、
付記12に記載の装置。
前記近似分布のパラメータを繰り返し更新することは、
勾配上昇アルゴリズムを用いて前記近似分布の前記パラメータを繰り返し更新すること、をさらに含む、
付記10又は11に記載の装置。
前記近似分布のパラメータを繰り返し更新することは、
前記第1変数及び前記第2変数に対する前記近似分布の前記パラメータを繰り返し更新することと、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを繰り返し更新することと、をさらに含む、
付記12に記載の装置。
前記近似分布のパラメータを繰り返し更新することは、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを、確率的順序で更新すること、を含む、
付記12に記載の装置。
1つ以上の変数のそれぞれに対する先験的な分布を選択するように構成された選択ユニットをさらに含み、
前記データモデルの前記収束の条件は、
(1)前記1つ以上の変数のそれぞれの事後的な分布とそれぞれの近似分布との間の差と、
(2)前記第1カテゴリ及び前記第2カテゴリの任意の所定のエンティティに対する、少なくとも前記第1カテゴリと前記第2カテゴリとの所定の前記エンティティ間の関係に影響を及ぼす第1変数及び第2変数の現在の値に基づいて取得される前記第1カテゴリと前記第2カテゴリの前記所定のエンティティ間の関係の尤度と、
の少なくとも一方に基づいて判別される、
付記10に記載の装置。
前記第1カテゴリは、前記第2カテゴリと異なる、
付記10に記載の装置。
Claims (10)
- 第1カテゴリの複数のエンティティ及び第2カテゴリの複数のエンティティに基づく関係データのためのデータモデルを生成する装置であって、
当該装置は、
前記データモデルを記述する複数の変数を判別するように構成された判別ユニットと、
前記複数の変数のそれぞれに対する近似分布を選択するように構成された近似分布選択ユニットと、
前記データモデルが収束するまで、前記近似分布のパラメータを繰り返し更新するように構成された更新ユニットと、を備え、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第1カテゴリの前記エンティティの特徴を表す第1変数のセットと、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第2カテゴリの前記エンティティの特徴を表す第2変数のセットと、を有する、
関係データのためのデータモデルを生成する装置。 - 前記第1変数及び前記第2変数は、ブール変数であり、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす、前記第1変数と前記第2変数の可変の組合せからの結合の影響を示す第3変数のセット、をさらに含む、
請求項1に記載の装置。 - 前記複数の変数は、
前記第1カテゴリの前記複数のエンティティの中で、前記第1変数のセットからのそれぞれの第1変数を有する、前記第1カテゴリのエンティティのパーセンテージを示す第4変数のセットと、
前記第2カテゴリの前記複数のエンティティの中で、前記第2変数のセットからのそれぞれの第2変数を有する、前記第2カテゴリのエンティティのパーセンテージを示す第5変数のセットと、をさらに含む、
請求項2に記載の装置。 - 前記第1変数及び前記第2変数に対して選択される近似分布は、ベルヌーイ分布を含み、前記第3変数に対して選択される近似分布は、正規分布を含み、前記第4変数及び前記第5変数に対して選択される近似分布は、ベータ分布を含む、
請求項3に記載の装置。 - 前記近似分布のパラメータを繰り返し更新することは、
勾配上昇アルゴリズムを用いて前記近似分布の前記パラメータを繰り返し更新すること、をさらに含む、
請求項1又は2に記載の装置。 - 前記近似分布のパラメータを繰り返し更新することは、
前記第1変数及び前記第2変数に対する前記近似分布の前記パラメータを繰り返し更新することと、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを繰り返し更新することと、をさらに含む、
請求項3に記載の装置。 - 前記近似分布のパラメータを繰り返し更新することは、
前記第3変数、前記第4変数及び前記第5変数に対する前記近似分布の前記パラメータを、確率的順序で更新すること、を含む、
請求項3に記載の装置。 - 1つ以上の変数のそれぞれに対する先験的な分布を選択するように構成された選択ユニットをさらに含み、
前記データモデルの前記収束の条件は、
(1)前記1つ以上の変数のそれぞれの事後的な分布とそれぞれの近似分布との間の差と、
(2)前記第1カテゴリ及び前記第2カテゴリの任意の所定のエンティティに対する、少なくとも前記第1カテゴリと前記第2カテゴリとの所定の前記エンティティ間の関係に影響を及ぼす第1変数及び第2変数の現在の値に基づいて取得される前記第1カテゴリと前記第2カテゴリの前記所定のエンティティ間の関係の尤度と、
の少なくとも一方に基づいて判別される、
請求項1に記載の装置。 - 前記第1カテゴリは、前記第2カテゴリと異なる、
請求項1に記載の装置。 - 第1カテゴリの複数のエンティティ及び第2カテゴリの複数のエンティティに基づく関係データのためのデータモデルを生成する方法であって、
当該方法は、
前記データモデルを記述する複数の変数を判別することと、
前記複数の変数のそれぞれに対する近似分布を選択することと、
前記データモデルが収束するまで、前記近似分布のパラメータを繰り返し更新することと、を含み、
前記複数の変数は、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第1カテゴリの前記エンティティの特徴を表す第1変数のセットと、
前記第1カテゴリの前記エンティティと前記第2カテゴリの前記エンティティとの間の関係に影響を及ぼす前記第2カテゴリの前記エンティティの特徴を表す第2変数のセットと、を有する、
関係データのためのデータモデルを生成する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510145923.0 | 2015-03-30 | ||
CN201510145923.0A CN106156067B (zh) | 2015-03-30 | 2015-03-30 | 用于为关系数据创建数据模型的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016192204A JP2016192204A (ja) | 2016-11-10 |
JP6249027B2 true JP6249027B2 (ja) | 2017-12-20 |
Family
ID=57246929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016040852A Active JP6249027B2 (ja) | 2015-03-30 | 2016-03-03 | 関係データのためのデータモデル生成方法及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6249027B2 (ja) |
CN (1) | CN106156067B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6540453B2 (ja) * | 2015-10-28 | 2019-07-10 | 株式会社デンソー | 情報提示システム |
JP2018124990A (ja) * | 2017-01-31 | 2018-08-09 | キヤノン株式会社 | モデル生成装置、評価装置、モデル生成方法、評価方法及びプログラム |
CN110390396B (zh) * | 2018-04-16 | 2024-03-19 | 日本电气株式会社 | 用于估计观测变量之间的因果关系的方法、装置和系统 |
US11620555B2 (en) * | 2018-10-26 | 2023-04-04 | Samsung Electronics Co., Ltd | Method and apparatus for stochastic inference between multiple random variables via common representation |
US11232175B2 (en) | 2019-03-28 | 2022-01-25 | Nec Corporation | Method, system, and computer program product for determining causality |
CN115083442B (zh) * | 2022-04-29 | 2023-08-08 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备以及计算机可读存储介质 |
CN116090072B (zh) * | 2023-02-17 | 2023-10-03 | 广东省水利水电第三工程局有限公司 | 基于bim技术的工程施工模型导出系统 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05346915A (ja) * | 1992-01-30 | 1993-12-27 | Ricoh Co Ltd | 学習機械並びにニューラルネットワークおよびデータ分析装置並びにデータ分析方法 |
US20030074234A1 (en) * | 2002-02-06 | 2003-04-17 | Stasny Jeanne Ann | Customer-centered pharmaceutical product and information distribution system |
JP2006099662A (ja) * | 2004-09-30 | 2006-04-13 | Non-Life Insurance Rating Organization Of Japan | 確率的及び工学的な水災評価方法 |
US20070265870A1 (en) * | 2006-04-19 | 2007-11-15 | Nec Laboratories America, Inc. | Methods and systems for utilizing a time factor and/or asymmetric user behavior patterns for data analysis |
CN101308493B (zh) * | 2007-05-18 | 2010-12-08 | 亿览在线网络技术(北京)有限公司 | 实体关系展现方法和系统 |
US8090665B2 (en) * | 2008-09-24 | 2012-01-03 | Nec Laboratories America, Inc. | Finding communities and their evolutions in dynamic social network |
JP5175903B2 (ja) * | 2009-08-31 | 2013-04-03 | アクセンチュア グローバル サービスィズ ゲーエムベーハー | 適応分析多次元処理システム |
JP5375506B2 (ja) * | 2009-10-13 | 2013-12-25 | 新日鐵住金株式会社 | 品質予測装置、品質予測方法、プログラムおよびコンピュータ読み取り可能な記録媒体 |
CN102147273B (zh) * | 2010-01-29 | 2012-11-28 | 大连理工大学 | 一种基于数据的冶金企业高炉煤气动态预测方法 |
JP2012058972A (ja) * | 2010-09-08 | 2012-03-22 | Sony Corp | 評価予測装置、評価予測方法、及びプログラム |
JP5594532B2 (ja) * | 2010-11-09 | 2014-09-24 | ソニー株式会社 | 情報処理装置および方法、情報処理システム、並びに、プログラム |
US8560279B2 (en) * | 2011-02-08 | 2013-10-15 | General Electric Company | Method of determining the influence of a variable in a phenomenon |
JP5645761B2 (ja) * | 2011-06-23 | 2014-12-24 | 登史夫 小林 | 医療データ解析方法、医療データ解析装置およびプログラム |
CN104050162B (zh) * | 2013-03-11 | 2017-10-13 | 富士通株式会社 | 数据处理方法和数据处理装置 |
CN103729432B (zh) * | 2013-12-27 | 2017-01-25 | 河海大学 | 一种引文数据库中主题文献学术影响力的分析与排序方法 |
-
2015
- 2015-03-30 CN CN201510145923.0A patent/CN106156067B/zh active Active
-
2016
- 2016-03-03 JP JP2016040852A patent/JP6249027B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN106156067A (zh) | 2016-11-23 |
JP2016192204A (ja) | 2016-11-10 |
CN106156067B (zh) | 2019-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6249027B2 (ja) | 関係データのためのデータモデル生成方法及びシステム | |
Zhao et al. | A machine learning based trust evaluation framework for online social networks | |
JP6414363B2 (ja) | 予測システム、方法およびプログラム | |
WO2015158308A1 (zh) | 判断用户年龄段的方法及装置 | |
WO2019169704A1 (zh) | 一种数据分类方法、装置、设备及计算机可读存储介质 | |
CN111542844A (zh) | 信息处理设备、信息处理方法和程序 | |
JP6501855B1 (ja) | 抽出装置、抽出方法、抽出プログラム及びモデル | |
CN104199818B (zh) | 一种基于分类的社会化推荐方法 | |
CN109903103B (zh) | 一种推荐物品的方法和装置 | |
JP6311851B2 (ja) | 共クラスタリングシステム、方法およびプログラム | |
CN110909222B (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
KR101567684B1 (ko) | 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 | |
JP2017111733A (ja) | 学習装置、学習方法および学習プログラム | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
US20150120731A1 (en) | Preference based clustering | |
CN115775026B (zh) | 一种基于组织相似度的联邦学习方法 | |
CN116127346A (zh) | 一种不依赖历史信息的密度聚类处理方法、设备及介质 | |
JP6947768B2 (ja) | 推定装置、推定方法および推定プログラム | |
CN112560105B (zh) | 保护多方数据隐私的联合建模方法及装置 | |
CN111177564B (zh) | 一种产品推荐方法及装置 | |
Qian et al. | Three-way decision collaborative recommendation algorithm based on user reputation | |
Guo et al. | Uncovering systematic bias in ratings across categories: A bayesian approach | |
CN117216376A (zh) | 一种基于深度图神经网络的公平感知推荐系统及推荐方法 | |
JP2013218555A (ja) | 情報提供装置、情報提供方法および情報提供プログラム | |
CN115309985A (zh) | 推荐算法的公平性评估方法及ai模型选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6249027 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |