JP6059594B2 - 重み行列更新装置、その動作方法およびコンピュータプログラム - Google Patents
重み行列更新装置、その動作方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP6059594B2 JP6059594B2 JP2013101922A JP2013101922A JP6059594B2 JP 6059594 B2 JP6059594 B2 JP 6059594B2 JP 2013101922 A JP2013101922 A JP 2013101922A JP 2013101922 A JP2013101922 A JP 2013101922A JP 6059594 B2 JP6059594 B2 JP 6059594B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- record
- weight matrix
- weight
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
訓練データ生成部2は、ラベル付きテキストDB1を入力とし、訓練データDB3を出力とする。
図2に示すように、ラベル付きテキストDB1は、文書の本文(以下、テキスト情報)に対して、文書IDと、文書のカテゴリを示すカテゴリIDなどを付与したレコードを予め格納したDBである。
図3に示すように、訓練データDB3は、複数のレコードを有し、レコードは、事例、訓練事例ともいう。各レコードは、文書の文書ID、カテゴリID、特徴ベクトルを含む。ここで文書ID、カテゴリIDは、ラベル付きテキストDB1の文書ID、カテゴリIDに対応する。特徴ベクトルの次元数は語彙異なり数(種類数)である。たとえばx1が東京という単語に対応し、あるレコードにおいてx1の値が2ということは、当該文書のテキスト情報に東京という単語が2つ含まれているということを表している。特徴ベクトルの要素を素性値ともいう。
図4に示すように、
(S1-1)訓練データ生成部2は、ラベル付きテキストDB1から未処理の文書IDを選択する。以下、これをdという。
推定モデル生成部4は、訓練データDB3を入力とし、推定モデルDB5を出力する。推定モデル生成部4が行う処理に使用する最大の試行回数Tは予め設定されているものとする。
図5に示すように、推定モデルDB5は、上記のように複数のクラスと複数の特徴が定義され、よって、クラスと特徴の組がクラス数と特徴の数の積の数だけ定義されている状況において、各組に対する重みパラメータを保持した重み行列である。列数は訓練データDB3に格納された特徴ベクトルと同じ次元数であり、すなわちMは語彙異なり数(種類数)と一致する。一方、行数はクラス数と一致する。この例では、クラス数を47としている。
(S2-1)推定モデル生成部4は、まず、重み行列の全ての重みパラメータを0に初期化し、試行回数を表す変数tを1に初期化する。
(ただし、|D|は訓練事例集合Dに含まれるレコード数)である。
(S2-5)t≦Tである場合には(S2-2)に戻り、そうでない場合には(S2-6)に進む。
using Word Co-occurence - JTAG. COLING-ACL, pp.409-413, 1998.
参考文献2:Crammer, K. and Singer, Y., \Ultraconservative online algorithms
for multiclass problems", Journal of Machine Learning Research, vol.3, pp.951{991,
2003.
なお、重み行列更新装置(推定モデル生成部4)としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
2…訓練データ生成部
3…訓練データDB
4…推定モデル生成部
5…推定モデルDB
Claims (7)
- 複数の文書に関する複数の特徴ならびに、前記複数の文書を複数のクラスに分ける場合の各クラスが特定され、各文書につき該文書における各特徴の数を有するレコードを備える訓練データDBが設けられている場合に、1つの特徴と1つのクラスからなる組のそれぞれについての重みパラメータを有する重み行列を訓練データDBを用いて更新する重み行列更新装置であって、
対象の各クラス(c)につき、対象以外のクラス(i)に関する重みパラメータからなる重みベクトル(wt (i))と訓練データDBの1つのレコード内の各特徴の数からなる特徴ベクトル(x)の内積から、対象のクラス(c)に関する重みパラメータ値からなる重みベクトル(wt (c))と特徴ベクトル(x)の内積を減算して得られる最大損失を与えるレコードを、前記訓練データDBから選択する手段と、
前記対象の各クラス(c)について、それぞれ最大損失を与えるレコードが追加された訓練事例集合を用いて前記重み行列を更新する手段と
を有することを特徴とする重み行列更新装置。 - 前記選択する手段は、
前記最大損失に対し、クラス(c)をクラス(i)と誤る場合の追加コストを加算し、加算後の最大損失を最大とするようなレコードを選択する
ことを特徴とする請求項1記載の重み行列更新装置。 - 前記選択する手段は、前記訓練データDBにおける1つのクラスについてのレコードを複数のブロックに分割し、各ブロックにおける最大損失を比較することで、当該クラスについて選択すべきレコードを検出する
ことを特徴とする請求項1または2記載の重み行列更新装置。 - 複数の文書に関する複数の特徴ならびに、前記複数の文書を複数のクラスに分ける場合の各クラスが特定され、各文書につき該文書における各特徴の数を有するレコードを備える訓練データDBが設けられている場合に、1つの特徴と1つのクラスからなる組のそれぞれについての重みパラメータを有する重み行列を訓練データDBを用いて更新する重み行列更新装置の動作方法であって、
前記重み行列更新装置が、対象の各クラス(c)につき、対象以外のクラス(i)に関する重みパラメータからなる重みベクトル(wt (i))と訓練データDBの1つのレコード内の各特徴の数からなる特徴ベクトル(x)の内積から、対象のクラス(c)に関する重みパラメータ値からなる重みベクトル(wt (c))と特徴ベクトル(x)の内積を減算して得られる最大損失を与えるレコードを、前記訓練データDBから選択し、
前記重み行列更新装置が、前記対象のクラス(c)について、それぞれ最大損失を与えるレコードが追加された訓練事例集合を用いて前記重み行列を更新する
ことを特徴とする重み行列更新装置の動作方法。 - 前記重み行列更新装置は、
前記最大損失に対し、クラス(c)をクラス(i)と誤る場合の追加コストを加算し、加算後の最大損失を最大とするようなレコードを選択する
ことを特徴とする請求項4記載の重み行列更新装置の動作方法。 - 前記重み行列更新装置は、前記訓練データDBにおける1つのクラスについてのレコードを複数のブロックに分割し、各ブロックにおける最大損失を比較することで、当該クラスについて選択すべきレコードを検出する
ことを特徴とする請求項4または5記載の重み行列更新装置の動作方法。 - 請求項1ないし3のいずれかに記載の重み行列更新装置としてコンピュータを機能させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101922A JP6059594B2 (ja) | 2013-05-14 | 2013-05-14 | 重み行列更新装置、その動作方法およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101922A JP6059594B2 (ja) | 2013-05-14 | 2013-05-14 | 重み行列更新装置、その動作方法およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014222434A JP2014222434A (ja) | 2014-11-27 |
JP6059594B2 true JP6059594B2 (ja) | 2017-01-11 |
Family
ID=52121929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013101922A Active JP6059594B2 (ja) | 2013-05-14 | 2013-05-14 | 重み行列更新装置、その動作方法およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6059594B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101924832B1 (ko) * | 2016-12-29 | 2018-12-05 | 서울대학교 산학협력단 | 정점 분류 장치 및 정점 분류 방법 |
CN108153163A (zh) * | 2018-01-30 | 2018-06-12 | 深圳源广安智能科技有限公司 | 一种智能家居系统 |
CN113283605B (zh) * | 2021-07-26 | 2021-11-09 | 中国科学院自动化研究所 | 基于预训练模型的交叉聚焦损失的溯因推理方法 |
-
2013
- 2013-05-14 JP JP2013101922A patent/JP6059594B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014222434A (ja) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10963783B2 (en) | Technologies for optimized machine learning training | |
KR102039394B1 (ko) | 탐색 장치 및 탐색 방법 | |
JP5943358B2 (ja) | 学習装置、処理装置、予測システム、学習方法、処理方法、およびプログラム | |
CN110287477A (zh) | 实体情感分析方法及相关装置 | |
Duchi et al. | Randomized smoothing for (parallel) stochastic optimization | |
EP3474274A1 (en) | Speech recognition method and apparatus | |
CN112633309A (zh) | 基于贝叶斯优化的查询高效的黑盒对抗攻击 | |
JP6509717B2 (ja) | 事例選択装置、分類装置、方法、及びプログラム | |
JP2021504836A5 (ja) | ||
Zhang et al. | Quadratic optimal control of switched linear stochastic systems | |
US10635078B2 (en) | Simulation system, simulation method, and simulation program | |
US20220108215A1 (en) | Robust and Data-Efficient Blackbox Optimization | |
JP5991317B2 (ja) | 情報処理システム、ネットワーク構造学習装置、リンク強度予測装置、リンク強度予測方法およびプログラム | |
US20150371150A1 (en) | Analysis device, analysis method, and program | |
JP6059594B2 (ja) | 重み行列更新装置、その動作方法およびコンピュータプログラム | |
JP2016006617A (ja) | 学習装置、学習方法及び学習プログラム | |
Raymond et al. | Genetic programming with rademacher complexity for symbolic regression | |
JP7267966B2 (ja) | 情報処理装置及び情報処理方法 | |
Wan et al. | On regression methods for virtual metrology in semiconductor manufacturing | |
KR20210099795A (ko) | 준 지도 학습을 위한 오토인코더 기반 그래프 설계 | |
US20220327394A1 (en) | Learning support apparatus, learning support methods, and computer-readable recording medium | |
US20210012247A1 (en) | Information processing apparatus, information processing method, and program | |
JP6467893B2 (ja) | 情報処理システム、情報処理方法、及び、プログラム | |
US11915120B2 (en) | Flexible parameter sharing for multi-task learning | |
JP2015038709A (ja) | モデルパラメータ推定方法、装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150928 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6059594 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |