JP6204261B2 - トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム - Google Patents

トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム Download PDF

Info

Publication number
JP6204261B2
JP6204261B2 JP2014093253A JP2014093253A JP6204261B2 JP 6204261 B2 JP6204261 B2 JP 6204261B2 JP 2014093253 A JP2014093253 A JP 2014093253A JP 2014093253 A JP2014093253 A JP 2014093253A JP 6204261 B2 JP6204261 B2 JP 6204261B2
Authority
JP
Japan
Prior art keywords
topic
matrix
position information
document
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014093253A
Other languages
English (en)
Other versions
JP2015210741A (ja
Inventor
結城 遠藤
結城 遠藤
浩之 戸田
浩之 戸田
義昌 小池
義昌 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014093253A priority Critical patent/JP6204261B2/ja
Publication of JP2015210741A publication Critical patent/JP2015210741A/ja
Application granted granted Critical
Publication of JP6204261B2 publication Critical patent/JP6204261B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は時系列テキストデータにおけるトピックのモデリング技術に関する。
マイクロブログなどの普及に伴い、リアルタイム性の高い時系列テキストデータからトピックを抽出し、世の中の話題を捉えることができるトピックモデルの作成が、特にマーケティングなどの分野で重要となってきている。ここでトピックとは、特定の話題に関する情報を意味する。トピックモデルはトピックとテキストデータが含む単語などの文字列との関係を記述するモデル(関数、数式)を表す。
時系列テキストデータにおいてトピックを捉えるトピックモデリングの先行技術としては、LDA(Latent Semantic Analysis)を拡張したもの(非特許文献1)や、NMF(Non−Negative Matrix Factorization)を拡張したもの(非特許文献2)が提案されている。NMFでは、文書と単語の特徴行列を非負制約のもと行列分解し次元圧縮を行うことによってモデルを得てトピックを推定する。非特許文献2では、時間的なトピックの変化量を考慮した制約をNMFに与え、盛り上がっているトピックを推定する。以下にNMFと非特許文献2における手法の概要について述べる。
<NMF>
NMFは文書と単語の特徴行列Xを非負制約のもと分解した二つの行列によって文書を表現する。一方の行列は、行に対応する文書における列に対応するトピックの関係度合を表す文書トピック行列Wである。もう一方の行列は、行に対応するトピックにおける列に対応する単語の関係度合を表すトピック単語行列Hである。NMFでは次式のとおり特徴行列Xを文書トピック行列Wとトピック単語行列Hとに分解する。
Figure 0006204261
上記の式において、i及びjは行列のインデックスを表す。上記のように行列Xを分解するため例えば以下の式ように二乗誤差に基づいて行列Wと行列Hを計算する。
Figure 0006204261
上記の式において、‖X−WH‖Fは「X−WH」のフロベニウスノルムである。
<非特許文献2の手法>
非特許文献2の手法では、上記NMFを拡張することによって時系列テキストデータにおいて盛り上がっているトピックを得る。具体的には次式にもとづいてWとHを計算する。
Figure 0006204261
上記の式において、wiはWのi番目の列ベクトルである。Sはトピックiについて同じ時間帯のwiの和を計算する行列である。WemはWのうち盛り上がりを抽出するトピックと対応する部分行列である。μはハイパーパラメータである。L(SWi)は各時刻におけるトピックの変動が小さい場合大きなペナルティを与える関数である。このペナルティにより時間的に盛り上がっているトピックを抽出することができる。
Diao, Q., Jiang, J., Zhu, F., Lim, E.-P.: Finding bursty topics from microblogs, In Proc. of ACL'12, 2012, pp.536-544. Saha, A. and Sindhwani, V.: Learning evolving and emerging topics in social media: a dynamic nmf approach with temporal regularization, In Proc. of WSDM'12, 2012, pp.693-702. Mei, Q., Cai, D., Zhang, D., Zhai, C.: Topic modeling with network regularization, In Proc. of WWW’08, 2008, pp.101-110. 鈴木潤,磯崎秀樹,「学習誤り最小化に基づく条件付き確率場の学習:言語解析への適用」,言語処理学会第12回年次大会発表論文集,2006,pp.548-551.
しかしながら、非特許文献2に記載のトピックモデルでは、地理的な情報が考慮されていない。例えば、横須賀で音楽のゲリラライブなどのイベントが急遽開催される際、多くのユーザがGPS(Global Positioning System)を用いて取得した位置情報を付与したメッセージをソーシャルメディアに投稿したり、その地名を含むメッセージを投稿したりする。ソーシャルメディアの情報は、このようなイベントなどの地域特有で盛り上がっている話題を多く含む。非特許文献2に記載された手法のように時間的な盛り上がりを考慮するだけでは、上記の盛り上がりの話題を検知することが難しかった。
また、非特許文献3には、テキストに付与された位置情報を考慮したLDAによって、地域特有のトピックを抽出する手法が開示されている。しかしながら、この手法は、位置情報と時間情報の両方が加味されていないため、ある地域で普段から多く投稿されている内容のトピックが抽出される。つまり、ある時刻、地域において局所的に盛り上がっているトピックを抽出できず、前述の例のような突然特定の地域で発生するイベント等に関するトピックを抽出できないという問題がある。
本発明は、上記従来技術の問題点に鑑みて、地理的かつ時間的に盛り上がっているトピック情報を得られるトピックモデルを生成できる技術を提供することを目的とする。
そこで、本発明のトピックモデリング装置は、位置情報と時間情報とに依存したトピックモデルを作成するトピックモデリング装置であって、時系列テキストから位置情報を抽出する位置情報抽出手段と、前記抽出された位置情報に基づき各時系列テキスト間の位置情報に依る類似度を示す位置情報依存行列を計算する位置情報依存行列計算手段と、前記時系列テキストの文書特徴行列を、時間的なトピックの変化量に基づくトピック抽出の制約と、前記位置情報依存行列に基づくトピック抽出の制約とのもとで、行列分解して次元圧縮することにより、テキストとトピックとの関係度合いを示す文書トピック行列並びにトピックと単語との関係度合いを示すトピック単語行列を経時的に算出し、この文書トピック行列並びにトピック単語行列の経時的変化量が規定値以下となる最新の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定するモデル計算手段とを備える。
本発明のトピックモデリング方法は、位置情報と時間情報とに依存したトピックモデルを作成するトピックモデリング装置が実行するトピックモデリング方法であって、時系列テキストから位置情報を抽出するステップと、前記抽出された位置情報に基づき時系列テキスト間の位置情報に依る類似度を示す位置情報依存行列を計算するステップと、前記時系列テキストの文書特徴行列を、時間的なトピックの変化量に基づくトピック抽出の制約と、前記位置情報依存行列に基づくトピック抽出の制約とのもとで、行列分解して次元圧縮することにより、テキストとトピックとの関係度合いを示す文書トピック行列並びにトピックと単語との関係度合いを示すトピック単語行列を経時的に算出し、この文書トピック行列並びにトピック単語行列の経時的変化量が規定値以下となる最新の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定するステップとを有する。
尚、本発明は上記装置の各手段としてコンピュータを機能させるプログラムまたは上記方法のステップをコンピュータに実行させるプログラムの態様とすることもできる。
本発明によれば地理的かつ時間的に盛り上がっているトピック情報を得られるトピックモデルを提供できる。
本発明の実施形態におけるトピックモデリング装置のブロック構成図。 同実施形態におけるトピックモデリング過程のフロー図。 文書特徴行列の一例。 位置情報の抽出過程のフローチャート。 位置情報依存行列の一例。 位置情報依存行列の計算過程のフローチャート。 モデル計算過程のフローチャート。
以下、図面を参照しながら本発明の実施の形態について説明するが本発明はこの実施形態に限定されるものではない。
[概要]
図1に示された本実施形態のトピックモデリング装置1は、従来の時間的な盛り上がりを抽出するNMFにおいて、地理的な盛り上がりを抽出する制約を付与することにより、トピックの地理的かつ時間的な盛り上がりを考慮したトピックモデルを生成する。
[装置の構成]
トピックモデリング装置1は、図1に示されたように、入力部10、単語特徴量計算部20、文書特徴行列計算部30、位置情報抽出部40、位置情報依存行列計算部50、モデル計算部60、出力部70を備える。
上記各機能部10〜70はコンピュータのハードウェアリソースによって実現される。すなわち、トピックモデリング装置1は、少なくとも演算装置(CPU)、記憶装置(メモリ、ハードディスク装置等)、通信インタフェース等のコンピュータに係るハードウェアリソースを備える。そして、これらのハードウェアリソースがソフトウェアリソース(OS、アプリケーション等)と協働することにより各機能部10〜70が実装される。また、各々のコンピュータに機能部10〜70を各々実装させるようにしてもよい。
入力部10は、時系列テキストデータの入力を受け付けるための手段であり、例えば、キーボード、マウス、ディスクドライブ装置等から構成される。時系列テキストデータは、文字列と時刻情報が対応づけられている。さらに、GPSによって計測した位置情報を表すジオタグが存在する場合、ジオタグも対応づけられている。
単語特徴量計算部20は、入力部10から受け付けた時系列テキストデータにおける各テキストの文字列の単語特徴量を計算する。
文書特徴行列計算部30は、前記算出されたテキストの文書における単語特徴量に基づき当該テキストの文書特徴行列を計算する。
位置情報抽出部40は、前記時系列テキストデータにおける各テキストの位置情報を抽出して当該各テキストの位置情報ベクトルを計算する。
位置情報依存行列計算部50は、前記算出された位置情報ベクトルに基づき各テキスト間の位置情報に依る類似度を示す位置情報依存行列を計算する。
モデル計算部60は、前記位置情報依存行列と前記時系列テキストの文書特徴行列とに基づき、位置情報と時間情報とに依存したトピックモデルとして、テキストとトピックとの関係度合を示す文書トピック行列と、トピックと単語との関係度合を示すトピック単語行列とを算出する。
より具体的には、モデル計算部60は、前記文書特徴行列を、時間的なトピックの変化量に基づくトピック抽出の制約と、前記位置情報依存行列に基づくトピック抽出の制約とのもとで、行列分解して次元圧縮することにより、前記文書トピック行列並びにトピック単語行列を経時的に算出する。そして、この文書トピック行列並びにトピック単語行列の経時的変化量が規定値以下となる最新の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定する。
出力部70は、前記決定された文書トピック行列及びトピック単語行列を、位置及び時間に依存したトピックモデルとして、出力する。
[トピックモデリング過程の説明]
以下、図1〜7を参照しながらトピックモデリングの過程について説明する。
S1:入力部10は、入力データとして時系列テキストデータを受け付ける。受け付けた時系列テキストデータは単語特徴量計算部20および位置情報抽出部40へ送られる。
S2:単語特徴量計算部20は入力部10から受け付けた時系列テキストデータにおける各テキストの文字列の単語特徴量を計算する。
本ステップでは、各テキストの文字列を形態素解析器によって名詞・動詞・形容詞などの単語単位に分割した後、出現する単語情報に基づき、テキストの文書diにおける単語wの特徴度を表すfdi,wを計算する。具体的な算出方法としては、以下の式によって算出するTF−IDF等が挙げられる。
Figure 0006204261
上記の式において、TF(di,w)は文書diにおける単語wの出現回数、DF(w)はデータセットにおいて単語wが出現する文書の数、Nはデータセットにおける文書の総数を表す。
上記算出された単語特徴度は文書特徴行列計算部30に送られる。
S3:文書特徴行列計算部30は、上記算出された文書diにおける単語wの特徴度を表すfdi,wに基づき、文書特徴行列を計算する。文書diにおける各々の単語の特徴を表す特徴ベクトルをfdiとすると文書特徴行列Xは次のように定義される。
Figure 0006204261
図3に文書特徴行列Xの一例を示した。この例では、文書1の「横須賀」、「カレー」、「新潟」の特徴量が2、2、0であるので、文書1に対応する行とそれぞれの単語に対応する列に該当する要素が2、2、0とされる。
上記算出された文書特徴行列Xはモデル計算部60によるステップS6に供される。
S4:位置情報抽出部40は、入力部10から受け付けた時系列テキストデータにおける各テキストの位置情報を抽出し、位置情報ベクトルpを計算する。位置情報は、時系列テキストに付与されたジオタグだけでなく、時系列テキストの文字列中の地名(地域名称)を用いて抽出してもよい。
本ステップでの具体的な位置情報抽出処理過程例のフローチャートを図4に示す。時系列テキストデータにおける各テキストの文書d∈Dについて下記の通り処理する。
S401:テキストの文書diにジオタグが付与されているかを判定する。
S402:テキストの文書diにジオタグが付与されている場合、ジオタグの緯度経度情報を位置情報ベクトルpiに代入する。尚、piはベクトルpのi番目の要素を表す。
S403:テキストの文書diにジオタグが付与されていない場合、文書diの文字列中に地名を表す単語が存在するか否かを判定する。地名を表す語の判定方法は、条件付き確率場に基づく係り受け解析手法(非特許文献4)など公知の技術を用いることができる。
S404:テキストの文書diの文字列中に地名を表す単語が存在する場合、ジオコーダを用いて地名を緯度経度情報に変換する。地名が複数ある場合は、例えば乱数を用いてランダムで一つ選択する。そして、この変換によって得られた緯度経度情報を、前述のステップS402に供して、位置情報ベクトルpiに代入する。
S405:テキストの文書diの文字列中に地名を表す単語が存在しない場合、位置情報ベクトルpiにnullを代入する。
全ての時系列テキストについて以上のS401〜S405が実行され、得られた位置情報ベクトルpは位置情報依存行列計算部50に送られる。
S5:位置情報依存行列計算部50は、上記算出された位置情報ベクトルpに基づき、位置情報依存行列Gを計算する。位置情報依存行列Gは、総文書数をmとしたとき、各文書同士の位置情報に基づく類似度を表すm×mの行列である。
図5に位置情報依存行列Gの一例を示した。位置情報に基づく文書1と文書2の類似度は0.02であるため、対応する要素は0.02とされる。
位置情報依存行列Gの計算処理のフローチャートを図6に示す。全てのテキストのペアについて下記の通り処理する。
S501:位置情報依存行列Gi,jに0を代入する。尚、Gi,jは行列Gのi行j例目の要素を表す。
S502:i=jまたは位置情報ベクトルpi=nullまたは位置情報ベクトルpj=nullであるかを判定する。判定がYESであった場合は次のループ処理に移る。
S503:ステップS502の判定がNoであれば、位置情報ベクトルpi,pj間の距離を計算する。位置情報ベクトルpi,pj間の距離disti,jは例えばヒュベニ距離として以下の式により計算できる。
Figure 0006204261
上記の式において、Mは子午線曲率半径、dPは二点間の緯度差、Nは卯西線曲率半径、Pは二点間の平均緯度、dRは二点間の経度差を表す。
S504:上記算出した位置情報ベクトルpi,pj間の距離disti,jを以下の式の演算に供して位置情報依存行列Gを算出する。
Figure 0006204261
上記の式において、σ2は定数であり、位置情報依存行列Gi,jは文書diと文書djの位置情報に基づく類似度を表す。σ2は予め各文書の距離disti,jを用いて計算しておいた分散値を用いることもできる。
全てのテキスト間について以上のS501〜S504が実行され、得られた位置情報依存行列Gはモデル計算部60によるステップS6に供される。
S6:モデル計算部60は、ステップS3で算出された文書特徴行列XとステップS5で算出された位置情報依存行列Gとを用いて、トピックモデルを学習する。
本ステップで学習するトピックモデルは、地理的に盛り上がっているトピックを検出するため、以下の式の値が小さくなるように文書トピック行列Wに制約が与えられる。
Figure 0006204261
上記の式において、Lは各テキストの距離に基づくグラフ構造を表す行列で、例えば以下のラプラシアン行列として計算できる。
Figure 0006204261
上記の式において、Dは総テキスト数をmとしたとき、m×mの行列であり、対角成分に位置情報依存行列Gにおいて対応する行ベクトルの各要素の総和を持ち、その他の成分に0を持つ。この制約は各テキストの位置情報の距離が近いほど、各々が似たトピックを持たせるという性質をもつ。これにより地理的に盛り上がっているトピックを抽出することができる。時間依存の制約と位置依存の制約とを考慮すると、モデル計算部60は次式により文書トピック行列Wとトピック単語行列Hを計算する。
Figure 0006204261
上記の式(1)において、λt及びλgはそれぞれ時間依存の制約とクエリ依存の制約の強さを決めるハイパーパラメータである。
具体的な計算処理の流れとして、文書トピック行列Wとトピック単語行列Hを交互に最適化する方法によって文書トピック行列Wとトピック単語行列Hとを算出する過程のフローチャートを図7に示した。
S601:t=0とし、文書トピック行列Wの初期値W(0)とトピック単語行列Hの初期値H(0)とを定める。初期値の値は任意の値でよく、例えば0から1までのランダムな値で初期化する。
S602:トピック単語行列H(t)を式(1)に供して文書トピック行列W(t+1)を計算する。計算の方法は最急降下法やニュートン法など公知の技術を用いることができる。
S603:文書トピック行列W(t+1)を式(1)に供してトピック単語行列H(t+1)を計算する。計算の方法は最急降下法やニュートン法など公知の技術を用いることができる。
S604:終了条件を満たしたかを判定する。以下に終了条件を例示する。
[終了条件の例1]
t回目のイテレーションで得られた文書トピック行列W(t)及びトピック単語行列H(t)とt+1回目のイテレーションで得られた文書トピック行列W(t+1)及びトピック単語行列H(t+1)における変化量が規定値以下であることを終了条件とする。例えば、t回目のイテレーションで得られた文書トピック行列W(t)及びトピック単語行列H(t)とt+1回目のイテレーションで得られた文書トピック行列W(t+1)及びトピック単語行列H(t+1)における各要素の二乗誤差の和が規定値以下であることを終了条件とする。
[終了条件の例2]
tが所定のイテレーション回数に達したことを終了条件とする。
[終了条件の例3]
終了条件の例1,2の両方を満たすことを終了条件とする。
以上例示した終了条件を満たしていないと判定された場合には、t+1を新たなtとしてステップS602に進む。
一方、終了条件を満たしたと判定された場合には、ステップS6の処理を終了し、算出された文書トピック行列W(t+1),トピック単語行列H(t+1)を、それぞれ文書トピック行列W,トピック単語行列Hとして、出力部70に供する。
S7:出力部70は、ステップS6で算出された文書トピック行列W及びトピック単語行列Hを、位置依存かつ時間依存のトピックモデルとして、出力する。このトピックモデルはモニタ等に出力表示される。
[本実施形態の効果]
以上説明したように、本実施形態のトピックモデリング装置1によれば、位置情報抽出部40によって、時系列テキストから位置情報が抽出される。また、位置情報依存行列計算部50によって、前記抽出された位置情報に基づき時系列テキスト間の位置情報に依る類似度を示す位置情報依存行列Gが算出される。そして、モデル計算部60によって、位置情報依存行列Gと前記時系列テキストの文書特徴行列Xとに基づき、位置情報と時間情報とに依存したトピックモデルとして、テキストとトピックとの関係度合を示す文書トピック行列Wと、トピックと単語との関係度合を示すトピック単語行列Hとが算出される。以上のように、位置情報及び時間情報に依存したトピックモデルが生成されるので、地理的かつ時間的に盛り上がっているトピックを抽出できる。
また、前記時系列テキストに位置情報が含まれていない場合、当該テキストに含まれる地域名称に基づき位置情報が抽出される。したがって、時系列テキストに位置情報が含まれていない場合でも、当該テキストから位置情報を抽出できる。
さらに、位置情報依存行列Gの計算にあたり、各時系列テキストの位置情報間の距離に基づき類似度が算出されることにより、地理的関係がより明確な位置情報依存行列Gが得られる。
そして、ステップS6において、ステップS604の判定が実行されることにより、位置情報及び時間情報に依存したトピックモデルを任意に精度よく取得できる。
[本発明の他の態様]
本発明は、トピックモデリング装置1を構成する上記の機能部10〜70の一部若しくは全てとしてコンピュータを機能させるプログラムで構成しこれを当該コンピュータに実行させることにより実現できる。または、同装置1が実行する上記の過程S1〜S7,S401〜S405,S501〜S504,S601〜S604の一部若しくは全てをコンピュータに実行させるプログラムで構成しこれを当該コンピュータに実行させることにより実現できる。そして、このプログラムをそのコンピュータが読み取り可能な周知の記録媒体(例えば、ハードディスク、フレキシブルディスク、CD−ROM等)に格納して提供できる。または、前記プログラムをインターネットや電子メール等でネットワークを介して提供できる。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更、応用が可能である。
1…トピックモデリング装置
20…単語特徴量計算部
30…文書特徴行列計算部
40…位置情報抽出部
50…位置情報依存行列計算部
60…モデル計算部

Claims (6)

  1. 位置情報と時間情報とに依存したトピックモデルを作成するトピックモデリング装置であって、
    時系列テキストから位置情報を抽出する位置情報抽出手段と、
    前記抽出された位置情報に基づき各時系列テキスト間の位置情報に依る類似度を示す位置情報依存行列を計算する位置情報依存行列計算手段と、
    前記時系列テキストの文書特徴行列を、時間的なトピックの変化量に基づくトピック抽出の制約と、前記位置情報依存行列に基づくトピック抽出の制約とのもとで、行列分解して次元圧縮することにより、テキストとトピックとの関係度合いを示す文書トピック行列並びにトピックと単語との関係度合いを示すトピック単語行列を経時的に算出し、この文書トピック行列並びにトピック単語行列の経時的変化量が規定値以下となる最新の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定するモデル計算手段と
    を備えたことを特徴とするトピックモデリング装置。
  2. 前記モデル計算手段は、前記文書トピック行列並びにトピック単語行列の計算が所定回数に達した時の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定すること
    を特徴とする請求項に記載のトピックモデリング装置。
  3. 前記位置情報抽出手段は、前記時系列テキストに位置情報が含まれていない場合、当該テキストに含まれる地域名称に基づき位置情報を抽出すること
    を特徴とする請求項1または2に記載のトピックモデリング装置。
  4. 前記位置情報依存行列計算手段は、各時系列テキストの位置情報間の距離に基づき前記類似度を算出すること
    を特徴とする請求項1からのいずれか1項に記載のトピックモデリング装置。
  5. 位置情報と時間情報とに依存したトピックモデルを作成するトピックモデリング装置が実行するトピックモデリング方法であって、
    時系列テキストから位置情報を抽出するステップと、
    前記抽出された位置情報に基づき時系列テキスト間の位置情報に依る類似度を示す位置情報依存行列を計算するステップと、
    前記時系列テキストの文書特徴行列を、時間的なトピックの変化量に基づくトピック抽出の制約と、前記位置情報依存行列に基づくトピック抽出の制約とのもとで、行列分解して次元圧縮することにより、テキストとトピックとの関係度合いを示す文書トピック行列並びにトピックと単語との関係度合いを示すトピック単語行列を経時的に算出し、この文書トピック行列並びにトピック単語行列の経時的変化量が規定値以下となる最新の文書トピック行列並びにトピック単語行列を、前記トピックモデルとして、決定するステップと
    を有することを特徴とするトピックモデリング方法。
  6. コンピュータを請求項1からのいずれか1項に記載のトピックモデリング装置を構成する各手段として機能させることを特徴とするトピックモデリングプログラム。
JP2014093253A 2014-04-30 2014-04-30 トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム Active JP6204261B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014093253A JP6204261B2 (ja) 2014-04-30 2014-04-30 トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014093253A JP6204261B2 (ja) 2014-04-30 2014-04-30 トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム

Publications (2)

Publication Number Publication Date
JP2015210741A JP2015210741A (ja) 2015-11-24
JP6204261B2 true JP6204261B2 (ja) 2017-09-27

Family

ID=54612852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014093253A Active JP6204261B2 (ja) 2014-04-30 2014-04-30 トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム

Country Status (1)

Country Link
JP (1) JP6204261B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284286B (zh) * 2018-09-12 2021-04-06 贵州省赤水市气象局 一种从原始数据集中提取有效特征的方法
CN112527964B (zh) * 2020-12-18 2022-07-01 重庆邮电大学 基于多模态流形学习和社交网络特征的微博摘要生成方法
CN112836489B (zh) * 2021-01-25 2024-03-22 浙江工业大学 一种基于互联网服务单词语义权重的文本主题挖掘方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5342574B2 (ja) * 2011-02-08 2013-11-13 日本電信電話株式会社 トピックモデリング装置、トピックモデリング方法、及びプログラム

Also Published As

Publication number Publication date
JP2015210741A (ja) 2015-11-24

Similar Documents

Publication Publication Date Title
Cheng et al. You are where you tweet: a content-based approach to geo-locating twitter users
CN106973244B (zh) 使用弱监督数据自动生成图像字幕的方法和系统
US9785888B2 (en) Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information
Kalyanam et al. Leveraging social context for modeling topic evolution
US20130204835A1 (en) Method of extracting named entity
JP2015230570A (ja) 学習モデル作成装置、判定システムおよび学習モデル作成方法
Marinoni et al. Unsupervised data driven feature extraction by means of mutual information maximization
Igoshev et al. Distance and luminosity probability distributions derived from parallax and flux with their measurement errors-With application to the millisecond pulsar PSR J0218+ 4232
JP2018156473A (ja) 解析装置、解析方法、およびプログラム
JP6204261B2 (ja) トピックモデリング装置、トピックモデリング方法及びトピックモデリングプログラム
Lu et al. Discovering transition phenomena from data of stochastic dynamical systems with Lévy noise
JP5730741B2 (ja) 話題推薦装置及び方法及びプログラム
Koduvely Learning Bayesian Models with R
Doğru et al. Parameter estimation for mixtures of skew Laplace normal distributions and application in mixture regression modeling
Hamiye Beyaztas et al. Robust estimation for linear panel data models
Hariri-Ardebili et al. Taguchi design-based seismic reliability analysis of geostructures
Rogerson Maximum G etis–O rd Statistic Adjusted for Spatially Autocorrelated Data
Chantrasmi et al. Forward and backward uncertainty propagation for discontinuous system response using the Pade-Legendre method
Garg et al. Hierarchical Latin hypercube sampling
Marden et al. Implementation of instrumental variable bounds for data missing not at random
WO2020179378A1 (ja) 情報処理システム、情報処理方法および記録媒体
Sethi et al. Statistical arrival models to estimate missed passage counts at fish weirs
Mannseth et al. On the application of improved symplectic integrators in Hamiltonian Monte Carlo
JP2022185799A (ja) 情報処理プログラム、情報処理方法および情報処理装置
US10652104B1 (en) System for inferring network dynamics and sources within the network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170831

R150 Certificate of patent or registration of utility model

Ref document number: 6204261

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150