JP6210928B2 - 確率モデル生成装置、方法、及びプログラム - Google Patents
確率モデル生成装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6210928B2 JP6210928B2 JP2014088159A JP2014088159A JP6210928B2 JP 6210928 B2 JP6210928 B2 JP 6210928B2 JP 2014088159 A JP2014088159 A JP 2014088159A JP 2014088159 A JP2014088159 A JP 2014088159A JP 6210928 B2 JP6210928 B2 JP 6210928B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- node
- value
- probability
- latent variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本発明の実施の形態の概要について説明する。
次に、階層構造を有する観測情報を解析して、観測情報の潜在構造を抽出するための確率モデルを生成する確率モデル生成装置に、本発明を適用した場合を例にして、本発明の実施の形態を説明する。
(a) Draw topic distributions θd,i,j〜Dir(αd)
(b) Draw symbol distributions φd,k〜Dir(βd)
2. For each depth d=1,...,D, for each node n∈Nd
(a) Choose a topic zn by
case Ad
when I−det : zn:=n
when P−det : zn:=zl
when N−dep : zn〜Cat(θd,0,0)
when P−dep : zn〜Cat(θd,zl,0)
when S−dep : zn〜Cat(θd,0,zm)
when B−dep : zn〜Cat(θd,zl,zm)
(b) Draw a symbol xn〜Cat(φd,zn)
次に、本実施の形態に係る確率モデル生成装置100の作用について説明する。階層構造を有する観測情報と、観測情報の階層構造を表す順序木とが、確率モデル生成装置100に入力されると、図6に示す確率モデル生成処理ルーチンが実行される。
本発明の実施の形態で説明した手法を評価するために、12のデータセットを用いて実験を行った。各データセットは、図9に示される12個のモデルから生成されたものであり、各データセットはL文書、各文書はL文、各文はL単語から成る。つまりデータセットは3層の階層情報を持つL3の単語からなる。上記図9においてMMはMultinomial mixture、LDAはLatent dirichlet allocation、HMMはhiden Markov modelの略であり、d、s、wはそれぞれ文書レベル、文レベル、単語レベルを意味する。各データセットは順序木で与えられる。順序木中で、各単語は自身が所属する文を親として持ち、各文は所属する文書を親として持つ。本発明の実施の形態ではこれを入力とし、確率モデルの自動生成を行う。本実験では、初期モデル候補MとしてA=(P−det,P−det,P−det)なるモデルを与えた。モデルスコア計算部32においてモデル候補集合の確率モデルMのモデルスコアを計算し、モデル候補生成部34において得られたモデルスコアを元に新たなモデル候補集合を生成した。これをモデルスコアが改善されなくなるまで反復した。図10に本実験により生成されたAを示す。なおデータサイズLとモデル候補生成部34の探索幅wをそれぞれL=10,30,50、w=1,3と変化させた。上記図10中の矩形で囲まれた部分は、正解モデルと異なる仮説が生成された事を意味する。上記図10よりLとwを増加させるとより正しい確率モデルを生成され、最終的には全データセットに対して正しい確率モデルを生成できたことが分かる。
2 記憶部
3 演算部
4 出力部
31 初期モデル生成部
32 モデルスコア計算部
33 反復判定部
34 モデル候補生成部
100 確率モデル生成装置
321 モデル候補読込部
322 学習部
323 計算部
341 モデル候補読込部
342 新モデル候補計算部
Claims (4)
- 階層構造を有する観測情報と前記観測情報の階層構造を表現する順序木とを入力として、前記入力された順序木の各節点に対応する、観測変数及び潜在変数を決定するためのモデルパラメータと、各階層について、前記階層の節点に対応する前記潜在変数の、親節点及び兄節点のそれぞれに対応する潜在変数との依存関係を調整するための構造パラメータと、を含む確率モデルを、前記構造パラメータの初期値を用いて、予め定められた方法により複数生成して、初期モデル候補集合とする初期モデル生成部と、
前記生成された初期モデル候補集合又は前回生成されたモデル候補集合に含まれる確率モデルの各々について、前記確率モデルが、前記入力された観測情報と合致する度合いを示すモデルスコアを算出して、スコア集合を生成するモデルスコア計算部と、
前記生成されたスコア集合に基づいて、前記生成された初期モデル候補集合又は前回生成されたモデル候補集合から、前記モデルスコアが上位w個の確率モデルを抽出し、前記抽出された上位w個の確率モデルの各々に対して、前記確率モデルの前記構造パラメータの何れか1つの階層の依存関係を変化させた確率モデルを生成して、モデル候補集合を生成する確率モデル候補生成部と、
前記モデルスコアに関して予め定められた反復終了条件を満たすまで、前記確率モデル候補生成部による前記モデル候補集合の生成、及び前記モデルスコア計算部による前記スコア集合の生成を繰り返し、繰り返しを終了したときに、前記モデルスコアが最も高い確率モデルを出力する反復判定部と、
を含む確率モデル生成装置。 - 前記モデルスコアは、対数周辺尤度の下限値である変分自由エネルギーであって、
前記モデルスコア計算部は、
各節点nについて、前記順序木の頂点の節点から順番に、前記潜在変数の値k毎に、前記節点nの潜在変数znの値がkであるときの、前記節点nの子孫の節点の集合I(n)の観測変数xI(n)の確率In[k]を計算すると共に、前記潜在変数の値k、親節点の潜在変数の値i、及び兄節点の潜在変数の値jの組み合わせ毎に、前記節点nの潜在変数znの値、前記節点nの親節点lの潜在変数zlの値、及び兄節点mの潜在変数zmの値が、前記組み合わせであるときの、前記節点nの弟節点の集合に含まれる各節点の子孫の節点の和集合B(n)の観測変数xB(n)の確率Bn[i,j,k]を計算し、
各節点nについて、前記順序木の葉の節点から順番に、前記潜在変数の値k、及び親節点の潜在変数の値iの組み合わせ毎に、前記節点nの確率In[k]に基づいて、節点nの潜在変数znの値、及び親節点lの潜在変数zlの値が前記組み合わせであるときの、前記節点nの兄節点の集合に含まれる各節点の子孫の節点の和集合F(n)の観測変数xF(n)の確率Fn[i,k]を計算すると共に、前記潜在変数の値k、親節点の潜在変数の値i、及び兄節点の潜在変数の値jの組み合わせ毎に、前記節点nの弟節点tの確率Bt[i,j,k]に基づいて、前記節点nの潜在変数znの値、前記節点nの親節点lの潜在変数zlの値、及び兄節点mの潜在変数zmの値が、前記組み合わせであるときの、前記節点nの子孫の節点を除いた節点の集合O(n)の観測変数xO(n)の確率On[i,j,k]を計算し、
各節点nについて、前記潜在変数の値k、親節点の潜在変数の値i、及び兄節点の潜在変数の値jの組み合わせ毎に、前記節点nの親節点pの確率On[i,j,k]、前記節点nの兄節点sの確率Fn[i,k]、及び前記節点nの確率Bn[i,j,k]に基づいて、前記節点nの潜在変数の値、親節点lの潜在変数zlの値、及び兄節点mの潜在変数zmの値が前記組み合わせとなる確率pn,i,j,kを算出し、
各階層dについて、前記潜在変数の値k、親節点の潜在変数の値i、及び兄節点の潜在変数の値jの組み合わせ毎に、潜在変数zの集合の近似分布q(z)における、前記組み合わせの出現頻度の期待値Eq(z)[cd,i,j,k(z)]を算出し、
各階層dについて、潜在変数の値k、及び観測変数の値vの組み合わせ毎に、潜在変数zの集合の近似分布q(z)における、前記組み合わせの出現頻度の期待値Eq(z)[cd,k,v(z)]を算出し、
各階層dについて、潜在変数の値k、親節点の潜在変数の値i、及び兄節点の潜在変数の値jの組み合わせ毎に、前記組み合わせに対する期待値Eq(z)[cd,i,j,k(z)]及びモデルパラメータαd,kに基づいて、前記組み合わせに対する近似分布のパラメータad,i,j,kを更新し、
各階層dについて、潜在変数の値k、及び観測変数の値vの組み合わせ毎に、前記組み合わせに対する期待値Eq(z)[cd,k,v(z)]及びモデルパラメータβd,vに基づいて、前記組み合わせに対する近似分布のパラメータbd,k,vを更新し、
前記更新された近似分布のパラメータad,i,j,k、bd,k,vに基づいて、前記モデルパラメータαd,k、βd,vを更新することを、前記近似分布のパラメータad,i,j,k、bd,k,vが収束するまで繰り返す学習部と、
前記学習部によって最終的に更新された近似分布のパラメータad,i,j,k、bd,k,vに基づいて、前記モデルパラメータαd,k、βd,vに基づいて、変分自由エネルギーであるモデルスコアを計算する計算部と、
を含む請求項1記載の確率モデル生成装置。 - 初期モデル生成部が、階層構造を有する観測情報と前記観測情報の階層構造を表現する順序木とを入力として、前記入力された順序木の各節点に対応する、観測変数及び潜在変数を決定するためのモデルパラメータと、各階層について、前記階層の節点に対応する前記潜在変数の、親節点及び兄節点のそれぞれに対応する潜在変数との依存関係を調整するための構造パラメータと、を含む確率モデルを、前記構造パラメータの初期値を用いて、予め定められた方法により複数生成して、初期モデル候補集合とし、
モデルスコア計算部が、前記生成された初期モデル候補集合又は前回生成されたモデル候補集合に含まれる確率モデルの各々について、前記確率モデルが、前記入力された観測情報と合致する度合いを示すモデルスコアを算出して、スコア集合を生成し、
確率モデル候補生成部が、前記生成されたスコア集合に基づいて、前記生成された初期モデル候補集合又は前回生成されたモデル候補集合から、前記モデルスコアが上位w個の確率モデルを抽出し、前記抽出された上位w個の確率モデルの各々に対して、前記確率モデルの前記構造パラメータの何れか1つの階層の依存関係を変化させた確率モデルを生成して、モデル候補集合を生成し、
反復判定部が、前記モデルスコアに関して予め定められた反復終了条件を満たすまで、前記確率モデル候補生成部による前記モデル候補集合の生成、及び前記モデルスコア計算部による前記スコア集合の生成を繰り返し、繰り返しを終了したときに、前記モデルスコアが最も高い確率モデルを出力する
確率モデル生成方法。 - 請求項1又は2に記載の確率モデル生成装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014088159A JP6210928B2 (ja) | 2014-04-22 | 2014-04-22 | 確率モデル生成装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014088159A JP6210928B2 (ja) | 2014-04-22 | 2014-04-22 | 確率モデル生成装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015207197A JP2015207197A (ja) | 2015-11-19 |
JP6210928B2 true JP6210928B2 (ja) | 2017-10-11 |
Family
ID=54603941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014088159A Active JP6210928B2 (ja) | 2014-04-22 | 2014-04-22 | 確率モデル生成装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6210928B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11954645B2 (en) * | 2020-03-26 | 2024-04-09 | International Business Machines Corporation | Collaboration participant inclusion |
JP7473389B2 (ja) | 2020-05-14 | 2024-04-23 | 株式会社日立製作所 | 学習モデル生成システム、及び学習モデル生成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5802597B2 (ja) * | 2012-03-30 | 2015-10-28 | エヌ・ティ・ティ・コムウェア株式会社 | 分類装置、分類システム、分類方法及び分類プログラム |
-
2014
- 2014-04-22 JP JP2014088159A patent/JP6210928B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015207197A (ja) | 2015-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241294B (zh) | 基于依赖解析和关键词的图卷积网络的关系抽取方法 | |
CN108681557B (zh) | 基于自扩充表示和相似双向约束的短文本主题发现方法及系统 | |
CN109635273A (zh) | 文本关键词提取方法、装置、设备及存储介质 | |
CN112380319B (zh) | 一种模型训练的方法及相关装置 | |
CN105512277B (zh) | 一种面向图书市场书名的短文本聚类方法 | |
Xu et al. | Exploiting shared information for multi-intent natural language sentence classification. | |
JP6172317B2 (ja) | 混合モデル選択の方法及び装置 | |
Corander et al. | Learning chordal Markov networks by constraint satisfaction | |
CN108664512B (zh) | 文本对象分类方法及装置 | |
Janz et al. | Actively learning what makes a discrete sequence valid | |
CN112559734A (zh) | 简报生成方法、装置、电子设备及计算机可读存储介质 | |
CN117609421A (zh) | 基于大语言模型的电力专业知识智能问答系统构建方法 | |
Hargreaves et al. | Incremental beam manipulation for natural language generation | |
JP6210928B2 (ja) | 確率モデル生成装置、方法、及びプログラム | |
US10510013B2 (en) | Mixed proposal based model training system | |
Shen et al. | Dependency parse reranking with rich subtree features | |
CN114004233B (zh) | 一种基于半训练和句子选择的远程监督命名实体识别方法 | |
JP2016197289A (ja) | パラメタ学習装置、類似度算出装置、方法、及びプログラム | |
JP6320966B2 (ja) | 言語モデル生成装置、方法及びプログラム | |
Steinhardt et al. | Filtering with abstract particles | |
CN107391674B (zh) | 一种新类挖掘方法及装置 | |
Yang et al. | Multiple target machine learning prediction of capacity curves of reinforced concrete shear walls | |
JP6343582B2 (ja) | 言語モデル生成装置、方法及びプログラム | |
JP6230501B2 (ja) | 縮約素性生成装置、情報処理装置、方法、及びプログラム | |
Steinhardt et al. | Reified context models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170912 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6210928 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |