JP6161581B2 - モデルパラメータ推定装置、方法、及びプログラム - Google Patents
モデルパラメータ推定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6161581B2 JP6161581B2 JP2014146172A JP2014146172A JP6161581B2 JP 6161581 B2 JP6161581 B2 JP 6161581B2 JP 2014146172 A JP2014146172 A JP 2014146172A JP 2014146172 A JP2014146172 A JP 2014146172A JP 6161581 B2 JP6161581 B2 JP 6161581B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- vector
- parameter
- pair
- model parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
まず、本実施の形態における原理について説明する。本実施の形態においては、下位問題をシンプレックスへの射影問題に置き換え、射影問題を解き、双対変数、及びモデルパラメータを更新する。図1に示すように、本実施の形態に係るモデルパラメータ推定装置による処理は、「モデルパラメータの推定」と「新規のコンテンツに対するカテゴリ予測」との2つにより構成されている。
次に、本発明の第1の実施の形態に係るモデルパラメータ推定装置の構成について説明する。図6に示すように、本発明の第1の実施の形態に係るモデルパラメータ推定装置100は、入力部10と、演算部20と、出力部90と、を含んで構成されている。
次に、本発明の第1の実施の形態に係るモデルパラメータ推定装置100の作用について説明する。まず、正解データを受け付け、正解データ記憶部32に記憶する。そして、正解データ記憶部32から正解データを読み出すと、モデルパラメータ推定装置100は、図8に示すモデルパラメータ推定処理ルーチンを実行する。また、モデルパラメータ推定処理ルーチンが終了すると、モデルパラメータ推定装置100は、入力部10から分類対象となるコンテンツの特徴ベクトルx^を受け付け、図9に示すカテゴリ分類処理ルーチンを実行する。
本実施の形態におけるモデルパラメータ推定装置に、2種類の公開データを用いた実験例を図10に示す。図10のNews20は、20のカテゴリに属する18,846個の文書のデータである。各文書は、130,088次元の特徴ベクトルとして表現されている。図10のSectorは105のカテゴリに属する9,619個の文書のデータである。各文書は55,197次元の特徴ベクトルとして表現されている。文書の75%をモデルパラメータの値の推定に用い、残りの25%の文書をカテゴリ予測の精度評価に用いている。図10の右の2つのグラフより、本実施の形態に用いるPivоt法では、目的関数値を小さくする最適な双対変数の推定値に短い計算時間で近づくことができる。また、左の2つのグラフより、Pivоt法を用いることにより、高い分類精度を与えるパラメータ値に短い計算時間で近づく傾向があるといえる。なお、図10の左は、評価データに対する性能であり、高いほうが良く、一方図10の右は、目的関数(双対問題)に対する目的値であり、低いほうが良い。
20 演算部
30 モデルパラメータ推定部
32 正解データ記憶部
34 初期化部
36 パラメータ推定部
40 選択部
42 パラメータ更新部
44 判定部
50 モデルパラメータ記憶部
60 カテゴリ予測部
90 出力部
100 モデルパラメータ推定装置
Claims (5)
- コンテンツと前記コンテンツが所属するカテゴリとの複数のペアからなる正解データに含まれる前記ペアを選択する選択部と、
前記選択されたi番目のペアに基づいて、コンテンツが所属するカテゴリを分類するための各カテゴリmに対するモデルパラメータを学習する際に用いる、各カテゴリmに対するi番目のペアのコンテンツの双対変数αi mからなるベクトルα^iを推定するための以下(1)式に示す下位問題が置換される、以下(2)式に示すシンプレックス射影問題を解くために、以下(3)式に従ってベクトルμ^及びパラメータzを計算し、前記計算されたベクトルμ^及びパラメータzに基づいて、前記シンプレックス射影問題を解くことにより、ベクトルβ^を計算し、前記計算されたベクトルβ^に基づいて、以下(4)式に従って、各カテゴリmに対するパラメータδi mからなるベクトルδ^iを計算し、前記計算されたベクトルδ^iに基づいて、各カテゴリmに対する前記双対変数αi mからなるベクトルα^i及び各カテゴリmに対する前記モデルパラメータを更新するパラメータ更新部と、
前記選択部による前記ペアの選択と、前記パラメータ更新部による更新と、を予め定められた収束条件を満たすまで繰り返す繰り返し判定部と、
を含む、モデルパラメータ推定装置。
- 前記パラメータ更新部は、以下(5)式に示す関数φ(θ)についてφ(θ)=0を満たすθを求める求根アルゴリズム、各カテゴリmに対応するパラメータμmを降順に並べ替えて、パラメータμmの部分和を求めるSort法、又は各カテゴリmに対応するパラメータμmの並べ替えを行わずに各カテゴリmに対応するパラメータμmの分割する位置を決定する値を選択し、前記パラメータμmの各々の和を繰り返し計算するPivot法を用いて、前記シンプレックス射影問題を解く請求項1記載のモデルパラメータ推定装置。
- 選択部と、パラメータ更新部と、繰り返し判定部と、を含むモデルパラメータ推定装置における、モデルパラメータ推定方法であって、
前記選択部は、コンテンツと前記コンテンツが所属するカテゴリとの複数のペアからなる正解データに含まれる前記ペアを選択し、
前記パラメータ更新部は、前記選択されたi番目のペアに基づいて、コンテンツが所属するカテゴリを分類するための各カテゴリmに対するモデルパラメータを学習する際に用いる、各カテゴリmに対するi番目のペアのコンテンツの双対変数αi mからなるベクトルα^iを推定するための以下(6)式に示す下位問題が置換される、以下(7)式に示すシンプレックス射影問題を解くために、以下(8)式に従ってベクトルμ^及びパラメータzを計算し、前記計算されたベクトルμ^及びパラメータzに基づいて、前記シンプレックス射影問題を解くことにより、ベクトルβ^を計算し、前記計算されたベクトルβ^に基づいて、以下(9)式に従って、各カテゴリmに対するパラメータδi mからなるベクトルδ^iを計算し、前記計算されたベクトルδ^iに基づいて、各カテゴリmに対する前記双対変数αi mからなるベクトルα^i及び各カテゴリmに対する前記モデルパラメータを更新し、
前記繰り返し判定部は、前記選択部による前記ペアの選択と、前記パラメータ更新部による更新と、を予め定められた収束条件を満たすまで繰り返す
モデルパラメータ推定方法。
- 前記パラメータ更新部が前記シンプレックス射影問題を解くことは、以下(10)式に示す関数φ(θ)についてφ(θ)=0を満たすθを求める求根アルゴリズム、各カテゴリmに対応するパラメータμmを降順に並べ替えて、パラメータμmの部分和を求めるSort法、又は各カテゴリmに対応するパラメータμmの並べ替えを行わずに各カテゴリmに対応するパラメータμmの分割する位置を決定する値を選択し、前記パラメータμmの各々の和を繰り返し計算するPivot法を用いて、前記シンプレックス射影問題を解く請求項3記載のモデルパラメータ推定方法。
- コンピュータを、請求項1又は請求項2記載のモデルパラメータ推定装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014146172A JP6161581B2 (ja) | 2014-07-16 | 2014-07-16 | モデルパラメータ推定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014146172A JP6161581B2 (ja) | 2014-07-16 | 2014-07-16 | モデルパラメータ推定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016024502A JP2016024502A (ja) | 2016-02-08 |
JP6161581B2 true JP6161581B2 (ja) | 2017-07-12 |
Family
ID=55271243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014146172A Active JP6161581B2 (ja) | 2014-07-16 | 2014-07-16 | モデルパラメータ推定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6161581B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4490876B2 (ja) * | 2005-06-01 | 2010-06-30 | 日本電信電話株式会社 | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体 |
JP2013120534A (ja) * | 2011-12-08 | 2013-06-17 | Mitsubishi Electric Corp | 関連語分類装置及びコンピュータプログラム及び関連語分類方法 |
US9720998B2 (en) * | 2012-11-19 | 2017-08-01 | The Penn State Research Foundation | Massive clustering of discrete distributions |
-
2014
- 2014-07-16 JP JP2014146172A patent/JP6161581B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016024502A (ja) | 2016-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11276013B2 (en) | Method and apparatus for training model based on random forest | |
US11468366B2 (en) | Parallel development and deployment for machine learning models | |
Vincent et al. | Sparse group lasso and high dimensional multinomial classification | |
US20180150770A1 (en) | Scalable-effort classifiers for energy-efficient machine learning | |
Dulac-Arnold et al. | Datum-wise classification: a sequential approach to sparsity | |
JP5521881B2 (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
EP3121735A1 (en) | Data mining method and device | |
US9355196B2 (en) | Model estimation device and model estimation method | |
JP6453785B2 (ja) | 回帰分析装置、回帰分析方法および回帰分析プログラム | |
US20200311489A1 (en) | Identifying organisms for production using unsupervised parameter learning for outlier detection | |
Taruttis et al. | A statistical approach to virtual cellular experiments: improved causal discovery using accumulation IDA (aIDA) | |
JP6161581B2 (ja) | モデルパラメータ推定装置、方法、及びプログラム | |
JP6536157B2 (ja) | モデル推定システム、モデル推定方法およびモデル推定プログラム | |
JP6721535B2 (ja) | Lle計算装置、lle計算方法及びlle計算プログラム | |
JP2015038709A (ja) | モデルパラメータ推定方法、装置、及びプログラム | |
JP6059594B2 (ja) | 重み行列更新装置、その動作方法およびコンピュータプログラム | |
US11295229B1 (en) | Scalable generation of multidimensional features for machine learning | |
US10331799B2 (en) | Generating a feature set | |
JP5775425B2 (ja) | 購買データ解析装置、方法、及びプログラム | |
WO2010082885A1 (en) | A method to prevent churn of customers | |
US9489632B2 (en) | Model estimation device, model estimation method, and information storage medium | |
Neme et al. | Self-organizing map formation with a selectively refractory neighborhood | |
JPWO2011016281A1 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
Iredale et al. | An efficient visual assessment of cluster tendency tool for large-scale time series data sets | |
Santos et al. | Applying the self-training semi-supervised learning in hierarchical multi-label methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6161581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |