JP2010218521A - Relationship data processing method - Google Patents
Relationship data processing method Download PDFInfo
- Publication number
- JP2010218521A JP2010218521A JP2009094404A JP2009094404A JP2010218521A JP 2010218521 A JP2010218521 A JP 2010218521A JP 2009094404 A JP2009094404 A JP 2009094404A JP 2009094404 A JP2009094404 A JP 2009094404A JP 2010218521 A JP2010218521 A JP 2010218521A
- Authority
- JP
- Japan
- Prior art keywords
- data
- dissimilarity
- points
- combination
- mds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、対象間の関連性を表すデータが与えられた場合に、各対象に空間的な座標を与える技術に関する。 The present invention relates to a technique for giving spatial coordinates to each object when data representing the relationship between the objects is given.
多次元尺度構成法(MDS)は、対象間の相互の関連性を表すデータが与えられたときに対象の空間的布置によって関連性を視覚的に表現するデータ解析手法であり、マーケティングや心理学などの分野で応用されている。 Multidimensional Scaling (MDS) is a data analysis method that visually expresses the relationship by spatial arrangement of objects when given data representing the relationship between objects. Marketing and psychology It is applied in such fields.
MDSの手法としては、さまざまなものが考案されているが、特に、関連性が非類似度として表されたときに、非類似度を、対象を表す点の間の距離ととらえ、各点の位置ベクトル間の内積行列の固有値分解により各点の座標を復元する、主座標分析(PCO)と呼ばれる手法に基づくものが、古典的MDSとしてよく知られている。 Various methods of MDS have been devised. In particular, when the relevance is expressed as dissimilarity, the dissimilarity is regarded as the distance between the points representing the object, and A method based on a method called principal coordinate analysis (PCO) that restores the coordinates of each point by eigenvalue decomposition of an inner product matrix between position vectors is well known as classical MDS.
古典的MDSでは、非類似度を距離と対応付けることを特徴とするが、実際扱われる非類似度データには、非対称性を持つなど、距離に直接対応付けられないものも多い。非対称性をもつ非類似度データの例としては、複数の国の間の相互の貿易収支や、マーケティングにおけるブランドスイッチング行列などが挙げられる。このような非対称性をもつデータをも扱えるべくMDSを拡張するためのさまざまな工夫が、これまでに行われてきた。 Classical MDS is characterized by associating dissimilarity with distance, but there are many dissimilarity data that are actually handled, such as having asymmetry, that cannot be directly associated with distance. Examples of dissimilarity data with asymmetry include the mutual trade balance between multiple countries and the brand switching matrix in marketing. Various ideas for extending MDS to handle data having such asymmetry have been made so far.
上述の古典的MDSでは、対象を表す点の位置ベクトルの相互の内積からなる内積行列の固有値を計算することで、各座標軸の重要度を寄与率という形で評価できる利点がある。これにより、寄与率の低い座標軸を省略し、より低次元の空間で対象を近似的に表現した場合の近似の精度を容易に評価することができる。特に実用上、対象は2次元あるいは3次元の空間にプロットして視覚的に表現する場合が多く、そのためには寄与率の高い順に2個あるいは3個の座標軸を選び、他の座標軸を省略すればよいことになる。 The classic MDS described above has an advantage that the importance of each coordinate axis can be evaluated in the form of a contribution rate by calculating the eigenvalue of the inner product matrix consisting of the inner products of the position vectors of the points representing the object. Thereby, it is possible to easily evaluate the accuracy of approximation when the coordinate axis having a low contribution rate is omitted and the object is approximately expressed in a lower dimensional space. In particular, the target is often expressed visually by plotting it in a two-dimensional or three-dimensional space. For this purpose, select two or three coordinate axes in descending order of contribution, and omit the other coordinate axes. It will be good.
一方、非対称性を持つ非類似度データをも扱えるよう、MDSを拡張する従来の技術は、いずれも古典的MDSとは異なる方法でデータを処理し対象を表現するものであった。このため、固有値分解による寄与率の評価が直接できるという上述のような古典的MDSの利点が活かせないという問題点があった。 On the other hand, all of the conventional techniques for extending MDS so that dissimilarity dissimilarity data can be handled are to process data and express objects by a method different from that of classical MDS. For this reason, there is a problem that the advantage of the classical MDS as described above that the contribution rate can be directly evaluated by eigenvalue decomposition cannot be utilized.
本発明は、上で述べた古典的MDSの利点を活かしつつ、非対称性を持つ非類似度データを表現するという課題を解決するものである。 The present invention solves the problem of expressing dissimilarity data having asymmetry while taking advantage of the classic MDS described above.
以上の課題を解決するため、本発明では、与えられた非類似度データに対して、前記非類似度データで表される対象の個数nに応じて(n−1)個以下の座標軸からなる空間における2n個の点の座標を計算する。前記対象それぞれは、第1のグループに属する1個の点と、第2のグループに属する1個の点からなる点の対に対応付けられ、相異なる2個の前記対象の組合せについて、前記組合せを構成する第1の対象に対応付けられた前記第1のグループに属する点から前記組合せを構成する第2の対象に対応付けられた前記第2のグループに属する点までの距離が、前記入力された非類似度データにおける前記第1の対象に対する前記第2の対象の非類似度への単調写像として表され、前記組合せを構成する第1の対象に対応付けられた前記第2のグループに属する点から前記組合せを構成する第2の対象に対応付けられた前記第1のグループに属する点までの距離が、前記入力された非類似度データにおける前記第2の対象に対する前記第1の対象の非類似度への単調写像として表されるよう、前記2n個の点の座標を計算する。 In order to solve the above problems, in the present invention, the given dissimilarity data includes (n-1) or less coordinate axes according to the number n of objects represented by the dissimilarity data. Calculate the coordinates of 2n points in space. Each of the objects is associated with a pair of points consisting of one point belonging to the first group and one point belonging to the second group. A distance from a point belonging to the first group associated with the first object constituting the combination to a point belonging to the second group associated with the second object constituting the combination is the input In the second group associated with the first object constituting the combination, which is represented as a monotonic map to the dissimilarity of the second object with respect to the first object in the dissimilarity data obtained The distance from the point belonging to the point belonging to the first group associated with the second target constituting the combination is the first target with respect to the second target in the input dissimilarity data As expressed as monotonic mapping to dissimilarity, it calculates the coordinates of the 2n number of points.
具体的には以下のようにして計算する。n個の対象i(i=1,…,n)が存在し、相異なる対象i,jの間の非類似度dijが与えられている状況を考える。本発明では、対象iを点Pi(i=1,…,n)
最適化問題の解として得られるものとする。
ここでλi(i=1,…,n)は任意に与えることのできる正の定数である。この最適化問題は、
る内積行列が求まるので、古典的MDSと同様の考え方で点PiおよびQiの座標が求まる。Specifically, the calculation is performed as follows. Consider a situation where there are n objects i (i = 1,..., n), and a dissimilarity d ij between different objects i and j is given. In the present invention, an object i is a point P i (i = 1,..., N).
It shall be obtained as a solution to the optimization problem.
Here, λ i (i = 1,..., N) is a positive constant that can be arbitrarily given. This optimization problem is
Therefore, the coordinates of the points P i and Q i can be obtained in the same way as the classic MDS.
さて、Pi,Qiで表される2n個の点を配置するのに必要な空間の次元の数について以下で考察する。上述の最適化問題を扱うためLagrange未定乗数λij(i≠j)を導入し、以下のLagrange関数Lを考える。
すると以下が得られる。
点は(n−1)次元ユークリッド空間に配置することが可能であることが分かる。Now, the number of dimensions of the space necessary for arranging 2n points represented by P i and Q i will be considered below. By introducing a Lagrange undetermined multiplier λ ij for dealing with the above-mentioned optimization problem (i ≠ j), consider the following Lagrange function L.
Then you get:
It can be seen that the points can be arranged in the (n−1) -dimensional Euclidean space.
非対称な関連性データを扱えるようMDSを拡張する従来の技術と比べると、本発明では古典的MDSと同じように内積行列の固有値分解に基づいて各対象を表す点の座標を求めているため、任意の次元で対象を表した場合の近似の精度が累積寄与率という尺度を通して評価できるという効果がある。また本発明では、全対象を2n個の点で表すが、必要な次元数は、n個の点に対する古典的MDSの場合と同じく最大でn−1である。特に非類似度が距離の公理を満たす場合、各対象を表す2点の座標は同一となり、これを単一の点とみなせば、従来の古典的MDSと全く同じものとなる。このように、本発明は古典的MDSを特殊な場合として包含するものともいえる。 Compared to the conventional technique of extending MDS to handle asymmetric relationship data, the present invention obtains the coordinates of the points representing each object based on the eigenvalue decomposition of the inner product matrix in the same manner as in classical MDS. There is an effect that the accuracy of approximation when an object is represented in an arbitrary dimension can be evaluated through a scale of cumulative contribution rate. In the present invention, all objects are represented by 2n points, but the required number of dimensions is n-1 at the maximum as in the case of classical MDS for n points. In particular, when the dissimilarity satisfies the distance axiom, the coordinates of two points representing each object are the same, and if this is regarded as a single point, it is exactly the same as the conventional classical MDS. Thus, it can be said that the present invention includes classical MDS as a special case.
本発明を実施するための形態を、以下例を挙げながら説明する。 The mode for carrying out the present invention will be described below with reference to examples.
図1は、本発明の第1の実施例におけるシステム構成図である。本システムは、入力装置101、計算機102、出力装置107からなる。入力装置101は、キーボードやマウスなどの、計算機102にデータを入力するための機器である。計算機102は、入力されたデータを処理し結果を出力するためのPCやサーバなどの機器であり、入力インタフェース103、CPU104、メモリ105、出力インタフェース106等からなる。入力インタフェース103は、入力装置101を計算機102に接続するためのインタフェースである。CPU104は、メモリ105に格納されているデータやプログラムを参照し計算などを行う装置である。メモリ105は、入出力データなどのデータやプログラムを格納する装置である。出力インタフェース106は、出力装置107を計算機102に接続するためのインタフェースである。出力装置107は、データ入力を促す画面を表示したり、計算機102が処理した結果を表示したりする、ディスプレイなどの機器である。 FIG. 1 is a system configuration diagram in the first embodiment of the present invention. This system includes an
図2は、メモリ105が格納するデータおよびプログラムを示した構成図である。メモリ105には入力データ201、データ処理プログラム202、出力データ203が格納される。入力データ201は、入力装置101によって入力されるデータであり、その具体例については図4を用いて後述する。データ処理プログラム202は、CPU104が入力データ201を処理してその結果を出力装置107へ出力できるようにするためのプログラムである。出力データ203は、CPU104がデータ処理プログラム202を実行して生成する出力データである。 FIG. 2 is a configuration diagram showing data and programs stored in the memory 105. The memory 105 stores input data 201, a
図3は、データ処理プログラム202の動作を示したフローチャートである。ステップ301では、入力データから対象の数nを特定した後、2n×2n行列Xの(i,j)成分xijを変数とする以下の半正定値計画問題を解き、その解として行列X*を求める。
値行列であることを意味する。dij 2は非類似度データを2乗したものとして入力される入力データ201である。ステップ302では、X*を固有値分解し、点Pi(i=1,…,n)およびQi(i=1,…,n)の座標と固有値、またそれらから生成される値を出力データ203としてメモリ105に格納する。ステップ303では、出力データ203として格納されたデータを出力インタフェース106を通して出力装置107へ出力する。FIG. 3 is a flowchart showing the operation of the
Means a value matrix. d ij 2 is input data 201 that is input as the square of dissimilarity data. In step 302, X * is decomposed into eigenvalues, and the coordinates and eigenvalues of points P i (i = 1,..., N) and Q i (i = 1,..., N), and values generated therefrom are output data. 203 is stored in the memory 105. In step 303, the data stored as the output data 203 is output to the
以下、入力装置101によって入力された具体的な入力データ201から出力データ203を求め、出力装置107へ出力する例について記述する。ここでは、任意に与えられる正の定数λi(i=1,…,n)の値はすべて1とする。Hereinafter, an example in which output data 203 is obtained from specific input data 201 input by the
図4は、入力データ201の元になる非類似度データをそれぞれ2乗して表した例である。この例では対象A、対象B、対象C、対象Dの相互の非類似度が2乗されて表さ
れており、例えば、対象Aの対象Bに対する非類似度は3であり、対象Bの対象Aに対
れる入力データ201は、d12 2=9,d13 2=4,d14 2=5,d21 2=12,d23 2=16,d24 2=5,d31 2=4,d32 2=20,d34 2=25,d41 2=6,d42 2=6,d43 2=15という等式などとして入力される。ここでは、対象A,B,C,Dにそれぞれ1,2,3,4という添字を割り当てて入力データ201を表している。ステップ301では、上記の入力データ201から対象の数を4であると特定し、以下の半正定値計画問題を解く。
s.t.x11+x66−2x16=9,x11+x77−2x17=4,x11+x88−2x18=5,
x22+x55−2x25=12,x22+x77−2x27=16,x22+x88−2x28=5,
x33+x55−2x35=4,x33+x66−2x36=20,x33+x88−2x38=25,
x44+x55−2x45=6,x44+x66−2x46=6,x44+x77−2x47=15,
一般的に半正定値計画問題には計算機を用いて数値的に解くための効率的なアルゴリズムがいくつか知られているので、上記問題は容易に解くことができ、解として以下の行列を得る。
FIG. 4 is an example in which the dissimilarity data that is the source of the input data 201 is expressed by squaring. In this example, the mutual dissimilarities of the target A, the target B, the target C, and the target D are expressed by squaring. For example, the dissimilarity of the target A with respect to the target B is 3, and the target of the target B Vs A
The input data 201 is: d 12 2 = 9, d 13 2 = 4, d 14 2 = 5, d 21 2 = 12, d 23 2 = 16, d 24 2 = 5, d 31 2 = 4, d 32 2 = 20, d 34 2 = 25, d 41 2 = 6, d 42 2 = 6, d 43 2 = 15, etc. Here, the input data 201 is represented by assigning
s. t. x 11 + x 66 -2x 16 = 9, x 11 + x 77 -2x 17 = 4, x 11 + x 88 -2x 18 = 5
x 22 + x 55 -2x 25 = 12, x 22 + x 77 -2x 27 = 16, x 22 + x 88 -2x 28 = 5
x 33 + x 55 -2x 35 = 4, x 33 + x 66 -2x 36 = 20, x 33 + x 88 -2x 38 = 25,
x 44 + x 55 -2x 45 = 6, x 44 + x 66 -2x 46 = 6, x 44 + x 77 -2x 47 = 15,
In general, there are some efficient algorithms for solving semi-definite programming problems numerically using a computer, so the above problem can be easily solved, and the following matrix is obtained as a solution .
次にステップ302では、よく知られている古典的MDSと同様、行列X*をX*=AA′と分解する。ここでA′はAの転置行列を意味する。このようなAは、X*の固有値分解を経て以下のように求まる。
これにより、各対象を表す点Pi,Qi(i=1,2,3,4)の位置ベクトルが以下のように求まる。
に24.4,6.63,2.10,0,0,0,0,0と計算される。Next, in step 302, the matrix X * is decomposed into X * = AA ', as in the well-known classic MDS. Here, A ′ means a transposed matrix of A. Such A is obtained through eigenvalue decomposition of X * as follows.
Thereby, the position vectors of the points P i and Q i (i = 1, 2, 3, 4) representing each object are obtained as follows.
24.4, 6.63, 2.10, 0, 0, 0, 0, 0.
計算機102は、出力データ203を、上記のように計算した点Pi,Qi(i=1,2,3,4)の座標や、計算の過程で得られる行列A,X*などの中間データとして、あるいは図5や図6に示す形態で生成し、出力装置107へ出力する。
図5は、ステップ303において、以上のようにして求められた点Pi,Qi(i=1,2,3,4)の座標のプロットを出力装置107に出力した例である。白丸および黒丸でプロットした点がそれぞれ、点PiおよびQiを表す。ここでは、各座標の第3の成分を省略し、2次元的なプロットを行った例を示しているが、第3の座標を含め、3次元的なプロットを行うものであってもよい。FIG. 5 shows an example in which a plot of the coordinates of the points P i and Q i (i = 1, 2, 3, 4) obtained as described above is output to the
図6は、ステップ303において、X*の固有値とそれによって計算される寄与率および累積寄与率を出力装置107に出力した例である。この例では、第2の座標軸までの累積寄与率が93.7%であり、図5のような2次元プロットを行った場合に省略されている第3の座標軸による寄与率が6.3%であることが表されている。FIG. 6 shows an example in which the eigenvalue of X * , the contribution rate calculated thereby, and the cumulative contribution rate are output to the
図7は、本発明の第2の実施例におけるシステム構成図である。本システムは、クライアント701、サーバ702、ネットワーク706からなる。クライアント701は、PCなどの計算機である。サーバ702は、クライアント701からの要求に応じてサービスを提供する計算機であり、ネットワークインタフェース703、CPU704、メモリ705などからなる。ネットワークインタフェース703は、サーバ702をネットワーク706に接続するための、ネットワークカード等のインタフェースである。CPU704は、メモリ705に格納されているデータやプログラムを参照し計算などを行う装置である。メモリ705は、入出力データなどのデータやプログラムを格納する装置である。ネットワーク706は、LANやインターネットなどであり、スイッチやルータなどの中継機器やケーブルなどからなる。 FIG. 7 is a system configuration diagram in the second embodiment of the present invention. This system includes a
メモリ705が格納するデータおよびプログラムは、実施例1において図2を用いて説明したものと同じであり、データ処理プログラム202の動作も、実施例1において図3を用いて説明したものと同じである。 The data and program stored in the
実施例1では、計算機102が、入力装置101によって入力された入力データ201を処理してその結果を出力データ203として出力装置107に出力したのに対し、本実施例では、サーバ702が、クライアント701から受信した入力データ201を処理してその結果を出力データ203としてクライアント701へ送信する。CPU704が、クライアント701から受信した入力データ201を元にデータ処理プログラムを実行することで出力データ203を求める方法は、実施例1で説明したものと同様である。CPU704は、ステップ303において、出力データ203を、点Pi,Qi(i=1,2,3,4)の座標や、計算の過程で得られる行列A,X*などの中間データとして、あるいは図5や図6に示す形態で生成し、クライアント701へ送信する。In the first embodiment, the
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009094404A JP2010218521A (en) | 2009-03-16 | 2009-03-16 | Relationship data processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009094404A JP2010218521A (en) | 2009-03-16 | 2009-03-16 | Relationship data processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010218521A true JP2010218521A (en) | 2010-09-30 |
Family
ID=42977242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009094404A Pending JP2010218521A (en) | 2009-03-16 | 2009-03-16 | Relationship data processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010218521A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013047394A1 (en) * | 2011-09-26 | 2013-04-04 | 日本電気株式会社 | Device and method for generating linear constraint condition, device for solving positive semidefinite optimization problem, metric learning device, and computer program |
-
2009
- 2009-03-16 JP JP2009094404A patent/JP2010218521A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013047394A1 (en) * | 2011-09-26 | 2013-04-04 | 日本電気株式会社 | Device and method for generating linear constraint condition, device for solving positive semidefinite optimization problem, metric learning device, and computer program |
JPWO2013047394A1 (en) * | 2011-09-26 | 2015-03-26 | 日本電気株式会社 | Linear constraint generation apparatus and method, semi-definite definite optimization problem solving apparatus, metric learning apparatus, and computer program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2016201655B2 (en) | Estimating depth from a single image | |
JP6143893B2 (en) | Fitting a primitive shape to a set of 3D points | |
JP2015148979A5 (en) | ||
US20180074224A1 (en) | Weather data processing apparatus and method using weather radar | |
WO2010027046A1 (en) | Information processing device, information processing method, information storage medium, and program | |
CN112988815A (en) | Method and system for online anomaly detection of large-scale high-dimensional high-speed stream data | |
JP2000003206A (en) | Device for changing object model to be controlled | |
CN109344294B (en) | Feature generation method and device, electronic equipment and computer-readable storage medium | |
JP2024507660A (en) | Two-stage sampling for accelerated deformulation | |
CN111782928B (en) | Information pushing method, device and computer readable storage medium | |
Wang et al. | Bounds of Zagreb indices and hyper Zagreb indices | |
JP2010218521A (en) | Relationship data processing method | |
JPWO2016132684A1 (en) | Impact visualization system, method and program | |
Mahmoudabadi et al. | Directional kriging implementation for gridded data interpolation and comparative study with common methods | |
US20230040195A1 (en) | Three-dimensional point cloud identification device, learning device, three-dimensional point cloud identification method, learning method and program | |
JP2013156691A (en) | Purchase prediction device, method, and program | |
Wang et al. | Parallel ordinal decision tree algorithm and its implementation in framework of MapReduce | |
CN116152383B (en) | Voxel model, image generation method, device and storage medium | |
JP2019109665A (en) | Information processing apparatus, machining time calculation method and machining time calculation program | |
Kohek et al. | Estimation of projection matrices from a sparse set of feature points for 3D tree reconstruction from multiple images | |
WO2023047843A1 (en) | Model generation method, data presentation method, data generation method, inference method, model generation device, data presentation device, data generation device, and inference device | |
JP2013050762A (en) | Line segment and circular arc detection device | |
JP6938052B2 (en) | Analytical method of claims and its equipment | |
CN114880623A (en) | Joint probability distribution calculation method and device, electronic equipment and storage medium | |
CN110046321B (en) | Curve integral calculation method, device, equipment and storage medium |