JP2005352613A - トピック分析方法及びその装置並びにプログラム - Google Patents
トピック分析方法及びその装置並びにプログラム Download PDFInfo
- Publication number
- JP2005352613A JP2005352613A JP2004170612A JP2004170612A JP2005352613A JP 2005352613 A JP2005352613 A JP 2005352613A JP 2004170612 A JP2004170612 A JP 2004170612A JP 2004170612 A JP2004170612 A JP 2004170612A JP 2005352613 A JP2005352613 A JP 2005352613A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- generation model
- data
- generation
- mixed component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000009826 distribution Methods 0.000 claims abstract description 58
- 238000004458 analytical method Methods 0.000 claims abstract description 47
- 239000000203 mixture Substances 0.000 claims description 37
- 230000014509 gene expression Effects 0.000 claims description 26
- 230000008034 disappearance Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 4
- 230000008033 biological extinction Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 テキストデータ1が時間とともに追加されていくような状況で、該データを順次読み込みつつトピックを検出するものであり、トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習する学習手段21〜2nと、複数の候補となるトピックの生成モデル31〜3nの中で情報量基準に基づいて最適なトピックの生成モデルを選択するモデル選択手段4とを含み、その混合成分としてトピックを検出するようにしている。
【選択図】 図1
Description
tf−idf(wi )=tf(wi )×log(M/df(wi ))
を各要素とするベクトル、
(tf−idf(wi ),…,tf−idf(wN ))
をテキストデータの表現としたりする。これらを構成する際に、予め頻度がしきい値に達しないものは最初から要素に入れないなどの前処理を行うこともあり得る。
F={f(x;a)|a in A}
をパラメトリック確率モデルという。なお、Aはaのとり得る値の集合である。また、データxに基づきパラメータaの値を推測することを推定という。例えば、logf(x;a)をaの関数(対数尤度関数)とみなし、これを最大にするaを推定値とする最尤推定法などが一般的である。
M={f(x;C1,…,Cn,a1,…,an)
=C1*f1(x;a1)+…+Cn*fn(x;an)|ai in Ai,C1+…+Cn=1、 Ci>0 (i=1,…,k)}
によって与えられる確率モデルMを混合モデル、その確率分布を混合分布、線形結合の対象となった元の各分布をコンポーネント、Ciをi番目のコンポーネントの混合比率とよぶ。これは、yを1からnまでの整数を値域とする確率変数とし、
Pr{y=i}=Ci,f(x|y=i)=fi(x;ai)
を満たす確率変数z=(y,x)に対して、yを隠れ変数としてxのみをモデル化したものと同じである。
g(z;C1,……,Cn,a1,……,an)
とする。
ΣEyl[(1−r)(L-l) rlog g(yl|xl)]
の最大化を逐次的に行うものである。
ΣEyl[(1−r)(L-tl)rlog g(xl,yl|yl)]
を最大化するように逐次学習をおこなってもよい。ただし、l番目のデータのタイムスタンプをtlとしている。こうすることによって、データの到着間隔が不ぞろいである場合にも、時間的に最近のデータを重要視し古いデータの影響を軽くするようにコンシスタントに推定が行われる。
(1/(2π)d/2|Σi |)exp[−(1/2)(x−μi )TΣi -1(x−μi )]
で表される。コンポーネントの数はk個あるとし、i番目のコンポーネントの混合比率をξi とする。
(式1*式3+式2*式4)/(式3+式4)
と書くところを、
WA(式1,式2|式3,式4)
として表している。
I(k)=(1/W)Σt=n-W n (−logP(t) (xt |k))/dt
IG(w)=I(t,ti)−(I(mw 、mw + )+I(m’w 、m’w + ))
のように計算する。
I(A,B)=AH(B/A)=A(Blog(B/A)+(A−B)log((A−B)/A))
で表されるものであり、確率的コンプレキシティは、
I(A,B)=AH(B/A)+(1/2)log(A/2π)
で表されるものであり、拡張型確率的コンプレキシティは、
I(A,B)=min{B,A−B}+c(AlogA)1/2
で表されるものである。
(mw +m’w )×(mw +(m’w −m’w +)−(mw −mw + )m’w )×((mw + +m’w + )×(mw −mw + +m’w −m’w + )mw m’w )-1
を用いることもできる。
21〜2n 学習手段
31〜3n モデル(または上位モデル、サブモデル)
4 モデル選択手段
5 トピック形成/消滅判定手段
6 トピック特徴表現抽出手段
8 出力手段
9 サブモデル生成手段
41 サブモデル生成選択手段
Claims (18)
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出するトピック分析装置であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習する学習手段と、
前記生成モデルを格納する記憶手段と、
前記記憶手段に格納された複数の候補となるトピックの生成モデルの中で、情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出する手段とを含むことを特徴とするトピック分析装置。 - 特定の時間のトピックの生成モデルの混合成分と、別の時間のトピック生成モデルの混合成分を比較して、新しいトピックの生成と既存のトピックの消滅を判定するトピック形成消滅判定手段を含むことを特徴とするトピック分析装置。
- トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出して、各トピックを特徴付けるトピック特徴表現抽出手段を含むことを特徴とするトピック分析装置。
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出するトピック分析装置であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習する学習手段と、
前記生成モデルを格納する記憶手段と、
前記記憶手段に格納された複数の候補となるトピックの生成モデルの中で情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出する手段と、
特定の時間のトピックの生成モデルの混合成分と、別の時間のトピック生成モデルの混合成分を比較して、新しいトピックの生成と既存のトピックの消滅を判定するトピック形成消滅判定手段とを含むことを特徴とするトピック分析装置。 - トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出して、各トピックを特徴付けるトピック特徴抽出手段を、更に含むことを特徴とする請求項4記載のトピック分析装置。
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出するトピック分析装置であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習する学習手段と、
前記生成モデルを格納する記憶手段と、
前記記憶手段に格納された複数の候補となるトピックの生成モデルの中で情報量基準に基づいて最適なトピックの生成モデルを選択してその混合成分としてトピックを検出する手段と、
トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出して、各トピックを特徴付けるトピック特徴抽出手段とを含むことを特徴とするトピック分析装置。 - テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出する方法であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で、情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出するステップとを含むことを特徴とするトピック分析方法。 - 特定の時間のトピックの生成モデルの混合成分と、別の時間のトピック生成モデルの混合成分とを比較して、新しいトピックの生成と既存のトピックの消滅を判定するステップを含むことを特徴とするトピック分析方法。
- トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出して、各トピックを特徴付けるステップを含むことを特徴とするトピック分析方法。
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出する方法であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で、情報量基準に基づいて最適なトピックの生成モデルを選択してその混合成分としてトピックを検出するステップと、
特定の時間のトピックの生成モデルの混合成分と別の時間のトピック生成モデルの混合成分を比較して、新しいトピックの生成と既存のトピックの消滅を判定するステップとを含むことを特徴とするトピック分析方法。 - トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出することにより、各トピックを特徴付けるステップを、更に含むことを特徴とする請求項10記載のトピック分析方法。
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出する方法であって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出するステップと、
トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出することにより、各トピックを特徴付けるステップとを含むことを特徴とするトピック分析方法。 - テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出する方法をコンピュータに実行させるためのプログラムであって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で、情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出するステップとを含むことを特徴とするプログラム。 - 特定の時間のトピックの生成モデルの混合成分と、別の時間のトピック生成モデルの混合成分とを比較して、新しいトピックの生成と既存のトピックの消滅を判定するステップを含むことを特徴とする、コンピュータにより読取可能なプログラム。
- トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出して、各トピックを特徴付けるステップを含むことを特徴とする、コンピュータにより読取可能なプログラム。
- テキストデータが時間とともに追加されていくような状況で、該データを順次読み込みつつトピックを検出する方法をコンピュータに実行させるためのプログラムであって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で、情報量基準に基づいて最適なトピックの生成モデルを選択してその混合成分としてトピックを検出するステップと、
特定の時間のトピックの生成モデルの混合成分と別の時間のトピック生成モデルの混合成分を比較して、新しいトピックの生成と既存のトピックの消滅を判定するステップとを含むことを特徴とするプログラム。 - トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出することにより、各トピックを特徴付けるステップを、更に含むことを特徴とする請求項16記載のプログラム。
- テキストデータが時間とともに追加されていくような状況のもとで、該データを順次読み込みつつトピックを検出する方法をコンピュータに実行させるためのプログラムであって、
トピックの生成モデルを混合分布モデルで表現し、データのタイムスタンプに応じて過去のデータほど激しく忘却しながら該トピックの生成モデルをオンラインで学習して、記憶手段に記憶するステップと、
前記記憶手段に記憶された複数の候補となるトピックの前記生成モデルの中で情報量基準に基づいて最適なトピックの生成モデルを選択して、その混合成分としてトピックを検出するステップと、
トピックの生成モデルの各混合成分に対応するトピックの特徴表現を、混合成分のパラメータに基づいて抽出することにより、各トピックを特徴付けるステップとを含むことを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004170612A JP4254623B2 (ja) | 2004-06-09 | 2004-06-09 | トピック分析方法及びその装置並びにプログラム |
US11/147,290 US20050278613A1 (en) | 2004-06-09 | 2005-06-08 | Topic analyzing method and apparatus and program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004170612A JP4254623B2 (ja) | 2004-06-09 | 2004-06-09 | トピック分析方法及びその装置並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005352613A true JP2005352613A (ja) | 2005-12-22 |
JP4254623B2 JP4254623B2 (ja) | 2009-04-15 |
Family
ID=35461938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004170612A Expired - Lifetime JP4254623B2 (ja) | 2004-06-09 | 2004-06-09 | トピック分析方法及びその装置並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050278613A1 (ja) |
JP (1) | JP4254623B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008062910A1 (fr) * | 2006-11-22 | 2008-05-29 | Haruo Hayashi | Dispositif et procédé d'analyse de documents |
WO2009116342A1 (ja) * | 2008-03-18 | 2009-09-24 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
JP2010218032A (ja) * | 2009-03-13 | 2010-09-30 | Fuji Xerox Co Ltd | 議論支援装置及び議論支援プログラム |
JP2012190142A (ja) * | 2011-03-09 | 2012-10-04 | Ntt Docomo Inc | 評価装置および評価方法 |
US8307293B2 (en) | 2009-03-13 | 2012-11-06 | Fuji Xerox Co., Ltd. | Discussion support apparatus, discussion support method, and computer-readable medium |
JP2013011999A (ja) * | 2011-06-28 | 2013-01-17 | Yahoo Japan Corp | トピック変化検出装置及び方法 |
DE102012224488A1 (de) | 2012-01-13 | 2013-07-18 | International Business Machines Corp. | System, Verfahren und Programm zur Entnahme eines themenfremden Teils aus einem Gespräch |
JP2016194912A (ja) * | 2015-03-31 | 2016-11-17 | 日本電気株式会社 | 混合モデルの選択方法及び装置 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080120346A1 (en) * | 2006-11-22 | 2008-05-22 | Anindya Neogi | Purging of stored timeseries data |
JPWO2008087968A1 (ja) * | 2007-01-17 | 2010-05-06 | 日本電気株式会社 | 変化点検出方法および装置 |
CN101296128A (zh) * | 2007-04-24 | 2008-10-29 | 北京大学 | 一种对互联网信息进行异常状态监测的方法 |
US7983902B2 (en) | 2007-08-23 | 2011-07-19 | Google Inc. | Domain dictionary creation by detection of new topic words using divergence value comparison |
US7917355B2 (en) * | 2007-08-23 | 2011-03-29 | Google Inc. | Word detection |
CN101836205A (zh) * | 2007-08-23 | 2010-09-15 | 谷歌股份有限公司 | 域词典创建 |
JP2010033484A (ja) * | 2008-07-31 | 2010-02-12 | Fujitsu Ltd | 宴会場所推薦装置および宴会場所推薦プログラム |
US9892103B2 (en) * | 2008-08-18 | 2018-02-13 | Microsoft Technology Licensing, Llc | Social media guided authoring |
US8676565B2 (en) | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US8694304B2 (en) * | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US9524291B2 (en) | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
JP5804492B2 (ja) * | 2011-03-29 | 2015-11-04 | 日本電気株式会社 | リスク管理装置 |
US9569413B2 (en) * | 2012-05-07 | 2017-02-14 | Sap Se | Document text processing using edge detection |
CN108491414A (zh) * | 2018-02-05 | 2018-09-04 | 中国科学院信息工程研究所 | 一种融合话题特征的新闻内容在线抽取方法及系统 |
US10606954B2 (en) | 2018-02-15 | 2020-03-31 | International Business Machines Corporation | Topic kernelization for real-time conversation data |
US11301629B2 (en) | 2019-08-21 | 2022-04-12 | International Business Machines Corporation | Interleaved conversation concept flow enhancement |
CN112711650B (zh) * | 2019-10-24 | 2024-04-12 | 富驰律法(北京)科技有限公司 | 一种公益诉讼线索挖掘方法及系统 |
US11455555B1 (en) | 2019-12-31 | 2022-09-27 | Meta Platforms, Inc. | Methods, mediums, and systems for training a model |
CN117786543B (zh) * | 2024-02-28 | 2024-05-10 | 沂水友邦养殖服务有限公司 | 一种数字化肉鸡养殖信息存储管理方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
JP3791879B2 (ja) * | 1999-07-19 | 2006-06-28 | 富士通株式会社 | 文書要約装置およびその方法 |
US7028250B2 (en) * | 2000-05-25 | 2006-04-11 | Kanisa, Inc. | System and method for automatically classifying text |
AU2003295562A1 (en) * | 2002-11-14 | 2004-06-15 | Educational Testing Service | Automated evaluation of overly repetitive word use in an essay |
US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US20050108630A1 (en) * | 2003-11-19 | 2005-05-19 | Wasson Mark D. | Extraction of facts from text |
-
2004
- 2004-06-09 JP JP2004170612A patent/JP4254623B2/ja not_active Expired - Lifetime
-
2005
- 2005-06-08 US US11/147,290 patent/US20050278613A1/en not_active Abandoned
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2008062910A1 (ja) * | 2006-11-22 | 2010-03-04 | 春男 林 | 文書解析装置および方法 |
WO2008062910A1 (fr) * | 2006-11-22 | 2008-05-29 | Haruo Hayashi | Dispositif et procédé d'analyse de documents |
JP5397370B2 (ja) * | 2008-03-18 | 2014-01-22 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
WO2009116342A1 (ja) * | 2008-03-18 | 2009-09-24 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
JP2010218032A (ja) * | 2009-03-13 | 2010-09-30 | Fuji Xerox Co Ltd | 議論支援装置及び議論支援プログラム |
US8296363B2 (en) | 2009-03-13 | 2012-10-23 | Fuji Xerox Co., Ltd. | Discussion support apparatus, discussion support method, and computer-readable medium |
US8307293B2 (en) | 2009-03-13 | 2012-11-06 | Fuji Xerox Co., Ltd. | Discussion support apparatus, discussion support method, and computer-readable medium |
JP2012190142A (ja) * | 2011-03-09 | 2012-10-04 | Ntt Docomo Inc | 評価装置および評価方法 |
JP2013011999A (ja) * | 2011-06-28 | 2013-01-17 | Yahoo Japan Corp | トピック変化検出装置及び方法 |
DE102012224488A1 (de) | 2012-01-13 | 2013-07-18 | International Business Machines Corp. | System, Verfahren und Programm zur Entnahme eines themenfremden Teils aus einem Gespräch |
US9002843B2 (en) | 2012-01-13 | 2015-04-07 | International Business Machines Corporation | System and method for extraction of off-topic part from conversation |
JP2016194912A (ja) * | 2015-03-31 | 2016-11-17 | 日本電気株式会社 | 混合モデルの選択方法及び装置 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
CN109783586B (zh) * | 2019-01-21 | 2022-10-21 | 福州大学 | 基于聚类重采样的水军评论检测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4254623B2 (ja) | 2009-04-15 |
US20050278613A1 (en) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4254623B2 (ja) | トピック分析方法及びその装置並びにプログラム | |
Bandekar et al. | Design and analysis of machine learning algorithms for the reduction of crime rates in India | |
Wang et al. | SVStream: A support vector-based algorithm for clustering data streams | |
Iwata et al. | Online multiscale dynamic topic models | |
Kim et al. | Anomaly pattern detection for streaming data | |
US8165979B2 (en) | System and method for resource adaptive classification of data streams | |
CN112235327A (zh) | 异常日志检测方法、装置、设备和计算机可读存储介质 | |
US11977978B2 (en) | Finite rank deep kernel learning with linear computational complexity | |
CN117035073B (zh) | 一种基于分层事件发展模式归纳的未来气象事件预测方法 | |
Piger | Turning points and classification | |
Lynch et al. | Bayesian classification and feature reduction using uniform Dirichlet priors | |
Al-Shalabi | New feature selection algorithm based on feature stability and correlation | |
Basterrech et al. | A Continual Learning System with Self Domain Shift Adaptation for Fake News Detection | |
Sarkar et al. | Symbolization of dynamic data-driven systems for signal representation | |
Last et al. | Discovering useful and understandable patterns in manufacturing data | |
Tüysüzoğlu et al. | Temporal bagging: a new method for time-based ensemble learning | |
Johnpaul et al. | Representational primitives using trend based global features for time series classification | |
Nunes et al. | Concept Drift Detection Based on Typicality and Eccentricity | |
Dierckx et al. | Quantifying news narratives to predict movements in market risk | |
Florez-Larrahondo | Incremental learning of discrete hidden Markov models | |
Yolacan et al. | A framework for studying new approaches to anomaly detection | |
Virani et al. | Algorithms for context learning and information representation for multi-sensor teams | |
Amayri et al. | Infinite Langevin mixture modeling and feature selection | |
Lin et al. | Temporal data mining using Hidden Markov-local polynomial models | |
Cheriyan et al. | Web page prediction using Markov model and Bayesian statistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4254623 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |