JP5462748B2 - データ可視化装置、データ変換装置、方法、及びプログラム - Google Patents
データ可視化装置、データ変換装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5462748B2 JP5462748B2 JP2010198043A JP2010198043A JP5462748B2 JP 5462748 B2 JP5462748 B2 JP 5462748B2 JP 2010198043 A JP2010198043 A JP 2010198043A JP 2010198043 A JP2010198043 A JP 2010198043A JP 5462748 B2 JP5462748 B2 JP 5462748B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- observation data
- image
- transformation matrix
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本発明で提案するデータ可視化装置で用いる変換モデルについて説明する。図1は、提案する変換モデルを模式的に表した図である。可視化したい観測データの集合をXとする。観測データは全部でD個存在するとし、d番目の観測データをXd(d = 1, … ,D) と表す。すなわちX = {X1, … ,Xd, … , XD}。
次に、観測データの形式について説明する。以下、本実施の形態では、観測データXdがBag−of−Word(BoW) 形式で表現された離散データである、と仮定して説明する。
次に、トピック画像の形式について説明する。以下、本実施の形態では、簡単のためトピック画像Ydは各ピクセルに一次元の値を持つ場合を例に説明する。
次に、観測データの集合を入力として、トピック画像に変換して出力するデータ可視化装置に、本発明を適用した場合を例にして、第1の発明の実施の形態を説明する。
入力読込部21は、入力部1を介して、可視化したい観測データ(被変換データ) の集合Xの入力を受け付ける。
入力変換部22では、観測データXd をBag−of−Word(BoW)形式で表現する。BoW形式のデータは、例えばトピックモデル(非特許文献1)などの離散データに対する技術で幅広く用いられている。
入力制御部23は、入力読込部21で取得した定数とハイパーパラメータ、および、入力変換部22でBoW形式に変換した観測データを、記憶手段10に記憶する。そして、最適値推定部30による最適値推定処理へ移行する。
次に、主に記憶手段10に保存される情報について、モデルにおけるそれらの意味とともに説明する。
変換モデルの目的は、観測データXが与えられた際に、何らかの意味で最適な変数A とYを求めて変換結果として出力することである。
次に、第1の実施の形態に係るデータ可視化装置の作用について説明する。まず、可視化対象の観測データが入力部1を介してデータ可視化装置に入力され、観測データが、BoW形式でない場合には、BoW形式に変換されてから、記憶手段10に格納される。また、各種の定数が、入力部1を介してデータ可視化装置に入力され、記憶手段10に格納される。
次に、本実施の形態で提案するデータ可視化法を用いた実験の結果について説明する。実験では、NIPS、20−Newsgroups、EachMovieの3種類の実データに対して、データの可視化を行った。
半教師有り学習を用いた場合に、観測データに対して可視化結果として得られたトピック画像について説明する。図8(a),(b)は、20newsデータセットに対して半教師有り学習を用いて可視化を行った場合の結果を示す。D=18,798のデータのうち、Ds=2,000 個のデータに対して、図8(a)に示すように、そのカテゴリに即したトピック画像を事前に準備し、教師トピック画像Ysとして付与した。教師トピック画像では、画像をブロックに分割し、上記図5に示した大カテゴリごとに赤く描画するブロックを変更した。図8(b)に示すように、可視化結果として得られたトピック画像は、上記第1の実施の形態の実験と異なり、ブロック要素が目立つ画像となった。
第3の実施の形態では、上記図1で説明した変換モデルを用いて、トピック画像の集合を、文書データの集合に変換する。
次に、トピック画像の集合を入力として、文書データに変換して出力するデータ変換装置に、本発明を適用した場合を例にして、本発明の第3の実施の形態を説明する。
入力読込部21は、入力部1を介して、トピック画像に関するハイパーパラメータΨ=(ψ1, ..., ψl, ...,ψL)と、変換行列に関するハイパーパラメータμ∈RV, σ∈RV×V との入力を受け付ける。
入力制御部23は、入力読込部21で取得した定数とハイパーパラメータを、記憶手段310に記憶する。そして、データ変換部330によるデータ変換処理へ移行する。
記憶手段310には、文書データ11、定数12、ハイパーパラメータ13、トピック画像14、グラム行列15、変換行列16、及び確率パラメータ17が格納されている。
本実施の形態に係るデータ変換装置では、データ変換部330が記憶手段310に保存された情報を用いて変換行列Aおよびトピック画像Yを生成し、変換行列Aおよびトピック画像Yに基づいて、文書データを生成し、その結果を出力制御部25、出力変換部26を通じて出力部3により出力する。
次に、第3の実施の形態に係るデータ変換装置の作用について説明する。まず、ハイパーパラメータや定数が入力部1を介してデータ変換装置に入力され、記憶手段310に格納される。
2、302 変換モデル部
3 出力部
10、310 記憶手段
22 入力変換部
24 終了判定部
30 最適値推定部
31 対数事後確率計算部
32 微分計算部
33 トピック画像推定部
34 変換行列推定部
35 確率パラメータ推定部
36 ハイパーパラメータ推定部
330 データ変換部
333 トピック画像生成部
334 変換行列生成部
335 確率パラメータ計算部
336 文書データ生成部
Claims (7)
- 離散データの集合を含む観測データの集合を、前記観測データの内容に応じた画像の集合を推定することによって、可視化するデータ可視化装置であって、
可視化対象とする前記観測データの集合、前記観測データの集合に対する画像の集合、前記観測データの集合に含まれる複数種類の離散データの各々が前記観測データの各々において出現する確率を示す確率パラメータ、前記画像の集合を前記確率パラメータに変換するための変換行列、前記変換行列に関するハイパーパラメータ、及び前記画像に関するハイパーパラメータを記憶した記憶手段と、
前記記憶手段に記憶されている、前記観測データの集合、前記観測データの集合に対する前記画像の集合、前記変換行列、前記変換行列に関するハイパーパラメータ、及び前記画像に関するハイパーパラメータに基づいて、前記観測データの集合に対して前記画像の集合及び前記変換行列を最適化させるために予め定められた評価関数により、前記観測データの集合に対する前記画像の集合、及び前記変換行列を推定し、前記記憶手段に更新して格納する最適値推定手段と、
前記最適値推定手段による前記画像の集合及び前記変換行列を推定する処理を繰り返すことで、前記観測データの集合に対する前記画像の集合及び前記変換行列を最適化した場合に、前記記憶手段に記憶されている前記観測データの集合に対する前記画像の集合を出力する可視化処理手段と、
を含むデータ可視化装置。 - 入力された可視化対象データの集合について、前記可視化対象データの各々を、前記離散データの集合を含む前記観測データに変換して、変換した前記観測データの集合を前記記憶手段に格納する入力変換手段を更に含む請求項1記載のデータ可視化装置。
- 前記記憶手段は、前記可視化対象とする前記観測データの集合の一部の観測データの各々に対して予め求められた教師画像の集合を更に記憶し、
前記記憶手段に記憶されている前記画像の集合のうち、前記一部の観測データに対する前記画像の集合を、前記教師画像の集合とした請求項1又は2記載のデータ可視化装置。 - 前記最適値推定手段は、前記観測データの集合に対する前記画像の集合及び前記変換行列の統計値を計算する前記評価関数により、前記画像の集合及び前記変換行列を推定する請求項1〜請求項3の何れか1項記載のデータ可視化装置。
- 前記記憶手段に記憶されている前記変換行列に基づいて、前記変換行列に関するハイパーパラメータを推定すると共に、前記記憶手段に記憶されている前記観測データの集合に対する前記画像の集合に基づいて、前記画像に関するハイパーパラメータを推定し、前記記憶手段に更新して格納するハイパーパラメータ推定手段を更に含み、
前記可視化処理手段は、前記最適値推定手段による前記画像の集合及び前記変換行列を推定する処理、並びに前記ハイパーパラメータ推定手段による前記変換行列に関するハイパーパラメータ及び前記画像に関するハイパーパラメータを推定する処理を繰り返すことで、前記観測データの集合に対する前記画像の集合及び前記変換行列を最適化した場合に、前記記憶手段に記憶されている前記観測データの集合に対する前記画像の集合を出力する請求項1〜請求項4の何れか1項記載のデータ可視化装置。 - 離散データの集合を含む観測データの集合を、前記観測データの内容に応じた画像の集合を推定することによって、可視化するために、
可視化対象とする前記観測データの集合、前記観測データの集合に対する画像の集合、前記観測データの集合に含まれる複数種類の離散データの各々が前記観測データの各々において出現する確率を示す確率パラメータ、前記画像の集合を前記確率パラメータに変換するための変換行列、前記変換行列に関するハイパーパラメータ、及び前記画像に関するハイパーパラメータを記憶した記憶手段と、最適値推定手段と、可視化処理手段とを含むデータ可視化装置におけるデータ可視化方法であって、
前記データ可視化装置は、
前記最適値推定手段によって、前記記憶手段に記憶されている、前記観測データの集合、前記観測データの集合に対する前記画像の集合、前記変換行列、前記変換行列に関するハイパーパラメータ、及び前記画像に関するハイパーパラメータに基づいて、前記観測データの集合に対して前記画像の集合及び前記変換行列を最適化させるために予め定められた評価関数により、前記観測データの集合に対する前記画像の集合、及び前記変換行列を推定し、前記記憶手段に更新して格納するステップと、
前記可視化処理手段によって、前記最適値推定手段による前記画像の集合及び前記変換行列を推定する処理を繰り返すことで、前記観測データの集合に対する前記画像の集合及び前記変換行列を最適化した場合に、前記記憶手段に記憶されている前記観測データの集合に対する前記画像の集合を出力するステップと、
を含んで実行することを特徴とするデータ可視化方法。 - 請求項1〜請求項5の何れか1項に記載のデータ可視化装置を構成する各手段として、コンピュータを機能させることを特徴とするデータ可視化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010198043A JP5462748B2 (ja) | 2010-09-03 | 2010-09-03 | データ可視化装置、データ変換装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010198043A JP5462748B2 (ja) | 2010-09-03 | 2010-09-03 | データ可視化装置、データ変換装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012053848A JP2012053848A (ja) | 2012-03-15 |
JP5462748B2 true JP5462748B2 (ja) | 2014-04-02 |
Family
ID=45907048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010198043A Active JP5462748B2 (ja) | 2010-09-03 | 2010-09-03 | データ可視化装置、データ変換装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5462748B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021716B (zh) * | 2017-12-29 | 2021-12-28 | 西安电子科技大学 | 一种基于径向坐标优化的多维数据可视化方法和装置 |
JP6856557B2 (ja) | 2018-01-22 | 2021-04-07 | 株式会社日立製作所 | 最適化装置及びハイパーパラメータの最適化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5234469B2 (ja) * | 2007-09-14 | 2013-07-10 | 国立大学法人 東京大学 | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム |
JP5382786B2 (ja) * | 2009-05-19 | 2014-01-08 | 国立大学法人 東京大学 | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム |
JP5463873B2 (ja) * | 2009-11-20 | 2014-04-09 | 株式会社デンソーアイティーラボラトリ | マルチメディア分類システム及びマルチメディア検索システム |
JP2011248596A (ja) * | 2010-05-26 | 2011-12-08 | Hitachi Ltd | 画像入り文書の検索システム及び検索方法 |
-
2010
- 2010-09-03 JP JP2010198043A patent/JP5462748B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012053848A (ja) | 2012-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108628971B (zh) | 不均衡数据集的文本分类方法、文本分类器及存储介质 | |
RU2678716C1 (ru) | Использование автоэнкодеров для обучения классификаторов текстов на естественном языке | |
US9792534B2 (en) | Semantic natural language vector space | |
US9811765B2 (en) | Image captioning with weak supervision | |
Lei Ba et al. | Predicting deep zero-shot convolutional neural networks using textual descriptions | |
Dering et al. | A convolutional neural network model for predicting a product's function, given its form | |
JP6231944B2 (ja) | 学習モデル作成装置、判定システムおよび学習モデル作成方法 | |
CN106649853A (zh) | 一种基于深度学习的短文本聚类方法 | |
CN109446430A (zh) | 产品推荐的方法、装置、计算机设备及可读存储介质 | |
Liang et al. | AC-BLSTM: asymmetric convolutional bidirectional LSTM networks for text classification | |
US9348901B2 (en) | System and method for rule based classification of a text fragment | |
CN109271514A (zh) | 短文本分类模型的生成方法、分类方法、装置及存储介质 | |
US20130204835A1 (en) | Method of extracting named entity | |
CN107357895B (zh) | 一种基于词袋模型的文本表示的处理方法 | |
Wong et al. | Feature selection and feature extraction: highlights | |
JP6467893B2 (ja) | 情報処理システム、情報処理方法、及び、プログラム | |
JP5462748B2 (ja) | データ可視化装置、データ変換装置、方法、及びプログラム | |
TW201243627A (en) | Multi-label text categorization based on fuzzy similarity and k nearest neighbors | |
JP6078380B2 (ja) | 文書解析装置、及びプログラム | |
CN115329850A (zh) | 信息比对方法、装置、电子设备及存储介质 | |
JP5533272B2 (ja) | データ出力装置、データ出力方法およびデータ出力プログラム | |
Youpeng et al. | Amvae: Asymmetric multimodal variational autoencoder for multi-view representation | |
Doan et al. | Algorithm selection using performance and run time behavior | |
JP5824430B2 (ja) | スパム特徴算出装置、スパム特徴算出方法、及びプログラム | |
Silva et al. | Active manifold learning with twitter big data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20120608 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121002 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130917 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5462748 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |