JP2007272291A - 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 - Google Patents
潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 Download PDFInfo
- Publication number
- JP2007272291A JP2007272291A JP2006093842A JP2006093842A JP2007272291A JP 2007272291 A JP2007272291 A JP 2007272291A JP 2006093842 A JP2006093842 A JP 2006093842A JP 2006093842 A JP2006093842 A JP 2006093842A JP 2007272291 A JP2007272291 A JP 2007272291A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- latent class
- singular value
- data matrix
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】特異値分解部2は、分析対象DB1から分析対象データ行列Aを読み出して特異値分解を施す。この特異値分解により、分析対象データ行列Aから、関連性の深い成分同士がひとつの次元にまとまった概念空間が生成される。次元圧縮部3は、前記特異値分解の結果に基づいて、大きさが上位の特異値のみを使用して前記分析対象データ行列Aを次元圧縮し、近似行列A'を求める。離散化部4は、近似行列A'の各成分を離散化して離散化近似行列A''を求める。潜在クラス抽出部5は、前記離散化近似行列A''に既知のEMアルゴリズムや確定的アニーリングEMアルゴリズムなどの手法を適用して潜在クラス抽出を行う。
【選択図】図2
Description
A.P. Dempster, N.M. Laird, D.B. Rubin: Maximum likelihood from incomplete data via the EM algorithm, Journal of Royal Statistic Society, Series B39, pp. 1-38, 1976. 上田、中野:確定的アニーリングEMアルゴリズム、信学論D-II、Vol. J80-D-II, No. 1, pp. 267-276, 1997.
(1)多次元行列で表現された分析対象のデータ行列を次元圧縮する次元圧縮手段と、前記次元圧縮により得られた近似行列の各成分を離散化する離散化手段と、前記離散化後の近似行列から潜在クラスを抽出する潜在クラス抽出手段とを含むことを特徴とする。
(2)分析対象のデータ行列を特異値分解する特異値分解手段をさらに含み、次元圧縮手段は、特異値分解の結果に基づいてデータ行列を次元圧縮することを特徴とする。
(3)離散化手段が、特異値の大きい成分ほど存在確率が高くなるように各成分を離散化することを特徴とする。
上記した特徴(1)によれば、分析対象のデータ行列に予め次元圧縮が実施されて近似行列に圧縮され、データ量を削減された後に潜在クラス抽出が行われるので、潜在クラス抽出に要する処理時間を短縮できる。
A=UΣVt (1)
A'= UkΣkVkT (2)
αj=(σj/σ1)×αref (3)
Claims (10)
- 多次元行列で表現された分析対象のデータ行列から潜在クラスを抽出する潜在クラス抽出装置において、
分析対象のデータ行列を次元圧縮する次元圧縮手段と、
前記次元圧縮により得られた近似行列の各成分を離散化する離散化手段と、
前記離散化後の近似行列から潜在クラスを抽出する潜在クラス抽出手段とを含むことを特徴とする潜在クラス抽出装置。 - 分析対象のデータ行列を特異値分解する特異値分解手段をさらに含み、
前記次元圧縮手段は、特異値分解の結果に基づいてデータ行列を次元圧縮することを特徴とする請求項1に記載の潜在クラス抽出装置。 - 前記離散化手段は、特異値の大きい成分ほど存在確率が高くなるように各成分を離散化することを特徴とする請求項2に記載の潜在クラス抽出装置。
- 多次元行列で表現された分析対象のデータ行列から潜在クラスを抽出する潜在クラス抽出方法において、
分析対象のデータ行列を次元圧縮する手順と、
前記次元圧縮により得られた近似行列の各成分を離散化する手順と、
前記離散化後の近似行列から潜在クラスを抽出する手順とを含むことを特徴とする潜在クラス抽出方法。 - 分析対象のデータ行列を特異値分解する手順をさらに含み、
前記データ行列が、特異値分解の結果に基づいて次元圧縮されることを特徴とする請求項4に記載の潜在クラス抽出方法。 - 前記離散化手順では、特異値の大きい成分ほど存在確率が高くなるように各成分が離散化されることを特徴とする請求項5に記載の潜在クラス抽出方法。
- 多次元行列で表現された分析対象のデータ行列から潜在クラスを抽出する潜在クラス抽出プログラムにおいて、
分析対象のデータ行列を次元圧縮する手順と、
前記次元圧縮により得られた近似行列の各成分を離散化する手順と、
前記離散化後の近似行列から潜在クラスを抽出する手順とを、コンピュータに実行させるための潜在クラス抽出プログラム。 - 分析対象のデータ行列を特異値分解する手順をさらに含み、
前記データ行列が、特異値分解の結果に基づいて次元圧縮されることを特徴とする請求項7に記載の潜在クラス抽出プログラム。 - 前記離散化手順では、特異値の大きい成分ほど存在確率が高くなるように各成分が離散化されることを特徴とする請求項8に記載の潜在クラス抽出プログラム。
- 前記請求項7ないし9のいずれかに記載の潜在クラス抽出プログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006093842A JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006093842A JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007272291A true JP2007272291A (ja) | 2007-10-18 |
JP4993339B2 JP4993339B2 (ja) | 2012-08-08 |
Family
ID=38675073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006093842A Active JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4993339B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014352A (ja) * | 2010-06-30 | 2012-01-19 | Ntt Docomo Inc | 需要予測装置及び需要予測方法 |
JP2016031639A (ja) * | 2014-07-29 | 2016-03-07 | 日本電信電話株式会社 | クラスタ抽出装置、クラスタ抽出方法、及びクラスタ抽出プログラム |
JP2020009209A (ja) * | 2018-07-10 | 2020-01-16 | データ・ケーキベーカ株式会社 | マッチング・マインド・マップを生成するデータ分析方法、システム、およびプログラム |
JP2021039580A (ja) * | 2019-09-04 | 2021-03-11 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11296552A (ja) * | 1998-04-13 | 1999-10-29 | Ricoh Co Ltd | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003030222A (ja) * | 2001-07-05 | 2003-01-31 | Internatl Business Mach Corp <Ibm> | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ |
JP2004054847A (ja) * | 2002-07-24 | 2004-02-19 | Ricoh Co Ltd | テキストデータ群生成装置、テキストデータ群生成方法、プログラムおよび記録媒体 |
JP2004326465A (ja) * | 2003-04-24 | 2004-11-18 | Matsushita Electric Ind Co Ltd | 文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置 |
-
2006
- 2006-03-30 JP JP2006093842A patent/JP4993339B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11296552A (ja) * | 1998-04-13 | 1999-10-29 | Ricoh Co Ltd | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003030222A (ja) * | 2001-07-05 | 2003-01-31 | Internatl Business Mach Corp <Ibm> | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ |
JP2004054847A (ja) * | 2002-07-24 | 2004-02-19 | Ricoh Co Ltd | テキストデータ群生成装置、テキストデータ群生成方法、プログラムおよび記録媒体 |
JP2004326465A (ja) * | 2003-04-24 | 2004-11-18 | Matsushita Electric Ind Co Ltd | 文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014352A (ja) * | 2010-06-30 | 2012-01-19 | Ntt Docomo Inc | 需要予測装置及び需要予測方法 |
JP2016031639A (ja) * | 2014-07-29 | 2016-03-07 | 日本電信電話株式会社 | クラスタ抽出装置、クラスタ抽出方法、及びクラスタ抽出プログラム |
JP2020009209A (ja) * | 2018-07-10 | 2020-01-16 | データ・ケーキベーカ株式会社 | マッチング・マインド・マップを生成するデータ分析方法、システム、およびプログラム |
JP2021039580A (ja) * | 2019-09-04 | 2021-03-11 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP7096218B2 (ja) | 2019-09-04 | 2022-07-05 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4993339B2 (ja) | 2012-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yan et al. | On machine learning towards predictive sales pipeline analytics | |
Sweilam et al. | New studies for general fractional financial models of awareness and trial advertising decisions | |
US11620474B2 (en) | Model reselection for accommodating unsatisfactory training data | |
WO2015049797A1 (ja) | データ管理方法、データ管理装置及び記憶媒体 | |
Yan et al. | Sales pipeline win propensity prediction: A regression approach | |
Mansingh et al. | Profiling internet banking users: A knowledge discovery in data mining process model based approach | |
JP4993339B2 (ja) | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 | |
CN109977977B (zh) | 一种识别潜在用户的方法及对应装置 | |
CN111612491A (zh) | 状态分析模型构建方法、分析方法及装置 | |
US20140112549A1 (en) | Pattern extracting apparatus and method | |
CN113763031A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
AU2021204470A1 (en) | Benefit surrender prediction | |
US20170351973A1 (en) | Quantifying creativity in auditory and visual mediums | |
US10885441B2 (en) | Selecting attributes by progressive sampling to generate digital predictive models | |
JP6300572B2 (ja) | データ分析プログラム、及びデータ分析装置 | |
US9619757B2 (en) | Nominal feature transformation using likelihood of outcome | |
JP7092202B2 (ja) | データ解析装置、データ解析方法及びプログラム | |
Pakpahan et al. | Classification of E-Commerce Product Descriptions with The Tf-Idf and Svm Methods | |
Li et al. | iMiner: mining inventory data for intelligent management | |
JP7378271B2 (ja) | 情報処理方法 | |
JP5431633B2 (ja) | 性能チューニングプログラム、該プログラムを記録した記録媒体、性能チューニング装置、および性能チューニング方法 | |
Saini | Data mining tools and challenges for current market trends-a review | |
JP2009237824A (ja) | 情報分析装置、情報分析方法、及び情報分析プログラム | |
US20240104477A1 (en) | Waiting time prediction system, waiting time prediction method, and non-transitory storage medium | |
US20210365522A1 (en) | Storage medium, conversion method, and information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110824 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120425 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120427 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4993339 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |