JP5952226B2 - 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム - Google Patents

情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム Download PDF

Info

Publication number
JP5952226B2
JP5952226B2 JP2013134353A JP2013134353A JP5952226B2 JP 5952226 B2 JP5952226 B2 JP 5952226B2 JP 2013134353 A JP2013134353 A JP 2013134353A JP 2013134353 A JP2013134353 A JP 2013134353A JP 5952226 B2 JP5952226 B2 JP 5952226B2
Authority
JP
Japan
Prior art keywords
conversion
unit
distance
feature amount
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013134353A
Other languages
English (en)
Other versions
JP2015011411A (ja
Inventor
哲 小田
哲 小田
宏樹 熊崎
宏樹 熊崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013134353A priority Critical patent/JP5952226B2/ja
Publication of JP2015011411A publication Critical patent/JP2015011411A/ja
Application granted granted Critical
Publication of JP5952226B2 publication Critical patent/JP5952226B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラムに関する。
近年、一定量以上のデータから規則性やパターンを抽出し、データの認識、分析、判定などの実施を可能とする技術として機械学習技術が注目されている。このような機械学習技術は、例えば、BigDataなどの大容量データに対する処理への適用が期待されている。
このような機械学習では、機械学習のアルゴリズムがパターンの抽出や分析、判定等の処理を行うために、一般にベクトル形式のデータが入力される。ここで、機械学習でデータ処理を行うために、元のデータが持つ様々な特徴をベクトル形式のデータに変換することを特徴量変換と呼ぶ。この特徴量変換においてどのようなベクトルデータを生成するかで機械学習の精度や性質は大きく影響を受ける。
Toby Segaran著, 集合知プログラミング,P.53-P.56,オライリー・ジャパン,2008
しかしながら、従来の技術では、データを特徴量変換してノードに変換し、ノード間の距離を考える場合に、人間があるノードと別のノードが近いと認識している場合であっても、該ノード同士が近くなる特徴量変換のパラメータを特定することが難しかった。
そこで、この発明は、利用者に高度な専門性を求めることなく、妥当な特徴量変換のパラメータを容易かつ効率的に特定することを目的とする。
上述した課題を解決し、目的を達成するため、情報処理装置は、所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付部と、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成部と、前記作成部によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換部と、前記変換部によって変換された特徴量を用いて、ノード間の距離を計算する計算部と、前記計算部によって計算されたノード間の距離と、前記配置受付部によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換部により用いられた変換ルールを出力する出力部と、を備えたことを特徴とする。
また、特徴量変換システムは、所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付部と、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成部と、前記作成部によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換部と、前記変換部によって変換された特徴量を用いて、ノード間の距離を計算する計算部と、前記計算部によって計算されたノード間の距離と、前記配置受付部によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換部により用いられた変換ルールを出力する出力部と、を備えたことを特徴とすることを特徴とする。
また、変換ルール生成方法は、情報処理装置によって実行される変換ルール生成方法であって、所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付工程と、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成工程と、前記作成工程によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換工程と、前記変換工程によって変換された特徴量を用いて、ノード間の距離を計算する計算工程と、前記計算工程によって計算されたノード間の距離と、前記配置受付工程によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換工程により用いられた変換ルールを出力する出力工程と、を含んだことを特徴とすることを特徴とする。
また、変換ルール生成プログラムは、所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付ステップと、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成ステップと、前記作成ステップによって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換ステップと、前記変換ステップによって変換された特徴量を用いて、ノード間の距離を計算する計算ステップと、前記計算ステップによって計算されたノード間の距離と、前記配置受付ステップによって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換ステップにより用いられた変換ルールを出力する出力ステップと、をコンピュータに実行させる。
本願に開示する情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラムは、利用者に高度な専門性を求めることなく、妥当な特徴量変換のパラメータを容易かつ効率的に特定することが可能である。
図1は、第一の実施形態に係る特徴量変換システムの構成の一例を示す図である。 図2は、第一の実施形態に係るサーバ装置の構成を説明するための図である。 図3は、第一の実施形態に係るノードデータ記憶部によって記憶される情報の一例を示す図である。 図4は、第一の実施形態に係る限定データ記憶部によって記憶される情報の一例を示す図である。 図5は、ノードごとの距離計算処理について説明する図である。 図6は、各ノードを距離に反比例する強さのバネで接続した場合のイメージを示す図である。 図7は、第一の実施形態に係るクライアント装置の構成を説明するための図である。 図8は、表示部によって表示される表示例について説明する図である。 図9は、第一の実施形態に係る特徴量変換システムにおける処理の流れを説明するためのシーケンス図である。 図10は、第一の実施形態に係るサーバ装置における次元削減処理について説明するフローチャートである。 図11は、変換ルール生成プログラムを実行するコンピュータを示す図である。
以下に添付図面を参照して、この発明に係る情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラムの実施形態を詳細に説明する。なお、この実施形態によりこの発明が限定されるものではない。
[第一の実施形態]
以下の実施形態では、第一の実施形態に係る特徴量変換システムの構成、第一の実施形態に係るサーバ装置の構成、第一の実施形態に係るクライアント装置の構成および特徴量変換システムによる処理の流れを順に説明し、最後に第一の実施形態による効果を説明する。
[特徴量変換システムの構成]
まず、第一の実施形態に係る特徴量変換システムの構成の一例を説明する。図1は、第一の実施形態に係る特徴量変換システムの構成の一例を示す図である。図1に示すように、第一の実施形態に係る特徴量変換システム100は、ネットワーク30を介して、サーバ装置10と、クライアント装置20とが接続される。なお、図1の例では、サーバ装置10およびクライアント装置20が1台ずつである場合を例として示しているが、これに限定されるものではなく、サーバ装置10が複数台であってもよいし、クライアント装置20が複数台であってもよい。
サーバ装置10は、演算開始の指示を受け付けると、特徴量変換処理を行うにあたって設定可能なパラメータである特徴変換ルール(以下、単に「変換ルール」と記載する場合がある)に基づいて、各ノードが有する特徴量をベクトル形式のデータに変換する特徴量変換処理を行う。そして、サーバ装置10は、特徴量変換処理が行われたノード間の距離を計算し、計算結果と、ユーザが配置したノード間の距離との差分が目標値よりも小さければ、特徴変換ルールをクライアント装置20に送信する。
クライアント装置20は、ユーザの操作により、特徴変換ルールを限定する指定を受け付ける。また、クライアント装置20は、ユーザの操作により、二次元の空間にノードを配置する指示を受け付ける。また、クライアント装置20は、特徴量変換処理が行われたノード間の距離を計算する際に使用される計算方法の指定を受け付ける。また、クライアント装置20は、サーバ装置10の計算結果と、ユーザが配置したノード間の距離との差分を許容する閾値である目標値の指定を受け付ける。そして、クライアント装置20は、ユーザの操作により演算開始の指示を受け付けると、サーバ装置10に対して演算開始を指示するとともに、ユーザに指定された各種パラメータを送信する。その後、クライアント装置20は、サーバ装置10から特徴変換ルールを受信すると、特徴変換ルールを出力する。
[サーバ装置の構成]
次に、図2を用いて、図1に示したサーバ装置10の構成を説明する。図2は、第一の実施形態に係るサーバ装置10の構成を説明するための図である。図2に示すように、サーバ装置10は、通信処理部11、制御部12および記憶部13を有する。
通信処理部11は、接続されるクライアント装置20との間でやり取りする各種情報に関する通信を制御する。例えば、通信処理部11は、クライアント装置20から演算開始指示や各種パラメータを受信する。また、通信処理部11は、クライアント装置20に対して特徴変換ルールを送信する。
記憶部13は、図2に示すように、ノードデータ記憶部13aおよび限定データ記憶部13bを有する。記憶部13は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置などである。
ノードデータ記憶部13aは、特徴量変換処理の処理対象となるデータを記憶する。例えば、ノードデータ記憶部13aは、図3に例示するように、ノードIDと、特徴を表すラベルと、ラベルに対応する値とを記憶する。図3の例を用いて説明すると、ノードデータ記憶部13aは、例えば、ノードIDとして、「やまだたろう」、「やまだはなこ」、「やまだじろう」を記憶し、ラベルとして「身長」、「体重」を記憶する。また、例えば、ノードデータ記憶部13aは、「やまだたろう」の「身長」として、「180」を記憶し、「やまだたろう」の「体重」として、「72」を記憶する。なお、このノードデータ記憶部13aに記憶されるデータは、クライアント装置20から送信されたデータを事前に格納したものであるとする。
限定データ記憶部13bは、クライアント装置20により指定された各種パラメータに関するデータを記憶する。例えば、限定データ記憶部13bは、特徴量変換処理の際に参照される「変換ルール」、各ノード間の距離を計算する方法の種類を示す「距離計算法」を記憶する。なお、限定データ記憶部13bに記憶される情報は、後述する変換ルール限定部22aにより指定されたパラメータ、または、限定されたパラメータの候補または範囲を記憶する。
例えば、図4の例を挙げて説明すると、限定データ記憶部13bは、変換ルールとして、ラベル「身長」、分布の種別「一様分布」、重み付け「5」、距離計算法として「ユークリッド距離」を記憶する。なお、各パラメータの指定ついては、後述するクライアント装置20の構成の説明において詳述する。なお、図4の例では、一つを指定する場合を説明したが、これに限定されるものではなく、例えば、ラベルとして、「身長、体重」などと複数の候補を記憶してもよいし、距離計算法の指定として「ユークリッド距離、コサイン距離」などと複数の候補を記憶してもよいし、また、重み付けの指定として「3〜7」などとは範囲を記憶してもよい。
図2の説明に戻って、制御部12は、ルール生成部12a、特徴量変換部12b、距離計算部12c、次元削減部12d、誤差算出部12eを有する。ここで、制御部12は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路である。
ルール生成部12aは、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する。具体的には、ルール生成部12aは、クライアント装置20の演算開始指示とともに、クライアント装置20の変換ルール限定部22aにより限定された変換ルールの各パラメータを受け付けると、受け付けたパラメータを限定データ記憶部13bに格納する。そして、ルール生成部12aは、後述するクライアント装置20の変換ルール限定部22aによって限定された候補または範囲のなかかから所定のパラメータをランダムに選択し、該所定のパラメータを用いて、変換ルールを作成する。
例えば、特徴を表すラベルが「N」個存在した場合に、i番目のラベルを「L_i」で表し、その重み付けを「W_i」とする。また、重み付けを行う関数を「F」とし、関数Fの定義域を[0,1]とし、値域が[0,∞]であるものとする。このような場合に、ルール生成部12aは、ランダムに「i」を選び、「L_i」を選択する。そして、重み付けの値について、ランダムに「大きい」または「小さい」を選ぶとともに、重み付けを加算または減算する値をランダムに選択する。ここで、大きいが選ばれた場合には、変換ルール限定部22aによって受け付けられた範囲のなかから、今の重み付けの値よりも大きい値を選ぶ。
特徴量変換部12bは、ルール生成部12aによって作成された変換ルールを用いて、各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う。例えば、特徴量変換部12bは、特徴を表すラベルである「身長」の分布が、「一様分布」と指定されており、その後の重み付けが「5」と指定されている場合には、それぞれのノードの身長に対応する値を、最小値が「−5」、最大値が「5」になるよう、線形変換する。また、例えば、特徴量変換部12bは、特徴を表すラベルである「体重」の分布が、正規分布と指定されており、その後の重み付けが、「3」と指定されている場合は、それぞれのノードの体重に対応する値を、平均が0、分散が3になるように正規化する。
距離計算部12cは、特徴量変換部12bによって変換された特徴量を用いて、ノード間の距離を計算する。ここでの距離は、距離空間の定義を満たすものであればなんでもよい。また、距離計算部12cは、ノード数をNとすると、N×(N−1)/2個の距離が計算される。例えば、図5に例示するように、ノードが3つである場合には、3×2/2=3となり、3個の距離が計算される。なお、図5の例では、「やまだたろう」と「やまだはなこ」の距離が「1」であり、「やまだたろう」と「やまだじろう」との距離が「2」であり、「やまだはなこ」と「やまだじろう」との距離が「2」であるものとする。
例えば、距離計算部12cは、n次元ベクトルの距離の一つ、ユークリッド距離が距離計算法として指定された場合には、それぞれのベクトルをX、Yで表し、Tを転置であるとすると、「sqrt((X−Y)×T(X−Y))」でユークリッド距離を計算する。
次元削減部12dは、前述したサーバ装置10の距離計算部12cによって計算されたノード間の距離を用いて、画像上における各ノードの位置を決定する。ここで、次元削減部12dによる具体的な処理について説明する。次元削減部12dは、前述したサーバ装置10の距離計算部12cから、N個のノード間の距離として、N×(N−1)/2個の距離のリストを受け付ける。そして、次元削減部12dは、2次元、もしくは3次元にマップする次元削除処理として、既存の多次元尺度法を改良したアルゴリズムを利用して、各ノードの位置を決定する。
最初に、次元削減部12dは、N個のノードをランダムに配置する。そして、次元削減部12dは、N個のノードを距離に反比例する強さのバネで接続する。例えば、図6に例示するように、「やまだたろう」と「やまだはなこ」の距離が「1」であり、「やまだたろう」と「やまだじろう」との距離が「2」である場合には、「やまだたろう」と「やまだはなこ」とを接続するバネは、「やまだたろう」と「やまだじろう」とを接続するバネと比較して強さが2倍である。
続いて、次元削減部12dは、次の瞬間のノード間の位置を求め、出力部22fに各ノードの座標位置を通知する。そして、次元削減部12dは、指定回数(例えば、10000回)の間、ノード間の位置を求めて、誤差算出部12eに各ノードの座標位置を通知する処理を繰り返し行う。つまり、次元削減部12dは、ノードにかかるバネの力が最小になるようにノードの位置(安定状態)を求める。このため、ランダムなノードの初期配置から開始して、各時点でノードに働く合力を計算し、その力の向きに少しだけノードを移動させるという処理を繰り返す。そして、次元削減部12dは、指定回数処理を繰り返し行った場合には、最終的なN個のノード位置を示す二次元の位置リストを誤差算出部12eに通知する。
誤差算出部12eは、距離計算部12cによって計算されたノード間の距離と、後述する配置指定部22bによって配置されたノード間の距離とを比較し、距離の差分が後述する目標値指定部22dにより指定された目標値より小さい場合には、特徴量変換部12bにより用いられた変換ルールをクライアント装置20の出力部22fに通知する。また、誤差算出部12eは、距離の差分が目標値以上である場合には、ルール生成部12aに再度ランダムに変換ルールを生成する旨を要求する。
[クライアント装置の構成]
次に、図7を用いて、図1に示したクライアント装置10の構成を説明する。図7は、第一の実施形態に係るクライアント装置20の構成を説明するための図である。図7に示すように、クライアント装置20は、通信処理部21、制御部22および記憶部23を有する。
通信処理部21は、接続されるサーバ装置10との間でやり取りする各種情報に関する通信を制御する。例えば、通信処理部21は、サーバ装置10から計算結果を受信する。また、通信処理部21は、サーバ装置10に対して演算開始指示や各種パラメータを送信する。
記憶部23は、図7に示すように、データ記憶部23aを有する。記憶部23は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置などである。データ記憶部23aは、特徴量変換処理の処理対象となるデータであり、前述したサーバ装置10のノードデータ記憶部13aに記憶されるデータと同様のデータである。
制御部22は、変換ルール限定部22a、配置指定部22b、距離計算法指定部22c、目標値指定部22d、演算開始指定部22e、出力部22fを有する。ここで、制御部22は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路である。
変換ルール限定部22aは、前述した特徴量変換部12bにより実行される特徴量変換処理において使用される変換ルールのパラメータの候補または範囲を限定する指示を受け付ける。例えば、変換ルール限定部22aは、パラメータの範囲を限定する指示として、特徴量の種別の候補、分布の種別の候補、および、重みの値の範囲の指定を少なくとも受け付ける。
例えば、変換ルール限定部22aは、データに含まれる特徴を表すラベルと、そのデータが仮定する分布と、その特徴を表すラベルに対する重み付けの範囲の限定を受け付ける。仮定する分布としては、例えば、「一様分布」または「正規分布」などが存在するが、その他、任意の分布を限定することができる。
ここで、図8の表示例を用いて、ユーザによる変換ルールの設定方法について説明する。図8の例では、画面右側において、ラベルとして「身長」、「体重」および「年齢」が表示されており、各ラベルについて、分布の種別が選択可能なプルダウンメニューと、重み付けが設定可能なスライドバーとが表示されており、対応する特徴を強く出すか弱く出すかを自由に設定できる。また、各ラベルには、その特徴を利用するか否かのチェックボックスも表示されている。なお、図8の例では、全てチェックがされているが、チェックを外した場合には、そのラベルについてのパラメータを限定しないことを意味するため、前述したルール生成部12aによりランダムにパラメータが選択されることとなる。
配置指定部22bは、所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、各ノードを配置する。なお、ここでは二次元空間に対する各ノードの配置に関する指示を受け付けて、二次元空間に各ノードを配置する場合を例として説明するが、二次元空間に各ノードを配置する場合に限定されるものではない。例えば、人間が認識可能な次元であればよく、一次元もしくは三次元空間にノードを配置するようにしてもよい。
例えば、図8の左側上部に人が直感的な配置しノードを表示して、位置関係をもとに配置できるようにしてもよいし、ノード間の距離行列が与えられているのならば、それをもとに二次元に次元を圧縮し、これを目標とする配置にしても良い。なお、図8の左側下部には、過去に指定したノードの配置の履歴が表示されている。
距離計算法指定部22cは、前述した距離計算部12cにより実行されるノード間の距離計算処理における計算方法の指定を受け付ける。例えば、距離計算法指定部22cは、距離の計算方法として、「ユークリッド距離」、「コサイン距離」、「ハミング距離」、「Jaccard係数」などが指定可能である。例えば、図8の例では、画面右側上部において、計算方法が選択可能なプロダウンメニューを表示する。なお、図8の例では、「コサイン距離」が選択されている。
目標値指定部22dは、前述した誤差算出部12eにより使用される目標値の指定を受け付ける。例えば、図8の例では、画面右側上部において、目標値が設定可能なスライドバーが表示されており、目標値を大きくするか小さくするかを自由に設定できる。
演算開始指定部22eは、ユーザの操作により演算開始の指示を受け付け、演算開始の指示を受け付けると、演算開始指示をサーバ装置10に対して送信する。また、演算開始指定部22eは、画像が表示された後において、該画像の更新の指示を受け付ける。例えば、図8の例では、画面の右側上部に、「表示の更新」というボタンが表示されており、このボタンをクリックすることで、現在指定されているパラメータを用いて特徴量変換処理や距離計算処理が行われて、画像が更新される。
出力部22fは、誤差算出部12eから受信した変換ルールを出力する。つまり、ユーザが配置指定部22bから指示した各ノードの配置に近いものを実現するための変換ルールのパラメータが出力される。
これにより、高度な専門性を有しない利用者においても、特徴量変換における適切な特徴量変換ルールの自動生成が可能となり、特徴量変換作業の効率向上と容易化、非専門家による作業精度の向上を実現することが可能となる。
[システムによる処理]
次に、図9を用いて、第一の実施形態に係る特徴量変換システム100全体の処理を説明する。図9は、第一の実施形態に係る特徴量変換システム100における処理の流れを説明するためのシーケンス図である。
図9に示すように、クライアント装置20は、各ノードの配置に関する指示を受け付けて、二次元の空間にノードを配置する(ステップS101)。そして、クライアント装置20は、特徴変換処理等に用いられる各種パラメータの設定を受け付ける(ステップS102)。例えば、クライアント装置20は、変換ルールや距離計算法についてユーザからの指定を受け付ける。そして、クライアント装置20は、演算開始指示をユーザから受け付けると、演算開始指示とともに、各種パラメータをサーバ装置10に通知する(ステップS103)。
続いて、サーバ装置10は、クライアント装置20の変換ルール限定部22aによって限定された候補または範囲のなかかから所定のパラメータをランダムに選択し、該所定のパラメータを用いて、特徴変換ルールを生成する(ステップS104)。そして、サーバ装置10は、作成された変換ルールとデータを入力して、特徴ベクトルを取得する(ステップS105)。
そして、サーバ装置10は、ノードごとの距離を計算し(ステップS106)、後に図10を用いて詳述する初回の次元削減処理を実行し(ステップS107)、二次元の位置リストのノードの位置と、配置指定部22bによりユーザに指定されたノードの位置との誤差を評価し、誤差が目標値よりも小さいか否かを判定する(ステップS108)。
この結果、サーバ装置10は、誤差が目標値以上である場合には(ステップS108否定)、ステップS104の処理に戻る。また、サーバ装置10は、誤差が目標値よりも小さい場合には(ステップS108肯定)、特徴変換ルールを送信する(ステップS109)。そして、クライアント装置20は、サーバ装置10から受信した特徴変換ルールを出力する(ステップS110)。
次に、図10を用いて、次元削除処理について説明する。図10は、第一の実施形態に係るサーバ装置における次元削減処理について説明するフローチャートである。
図10に示すように、サーバ装置10の次元削減部12dは、N個のノードをランダムに配置する(ステップS201)。そして、次元削減部12dは、N個のノードを距離に反比例する強さのバネで接続する(ステップS202)。例えば、図6に例示するように、「やまだたろう」と「やまだはなこ」の距離が「1」であり、「やまだたろう」と「やまだじろう」との距離が「2」である場合には、「やまだたろう」と「やまだはなこ」とを接続するバネは、「やまだたろう」と「やまだじろう」とを接続するバネと比較して強さが2倍である。
続いて、次元削減部12dは、次の瞬間のノード間の位置を求める(ステップS203)。ここで求められたノード間の位置に関する情報は、各ノードの座標位置として出力部22fに通知される。そして、次元削減部12dは、ノード間の位置を求める処理を所定回数(例えば、10000回)実行したか判定する(ステップS204)。この結果、次元削減部12dは、所定回数実行していないと判定した場合には(ステップS204否定)、ステップS203に戻り、ノード間の位置を求める処理を繰り返す。また、次元削減部12dは、所定回数実行したと判定した場合には(ステップS204肯定)、処理を終了する。
[第一の実施形態の効果]
上述してきたように、第一の実施形態にかかる特徴量変換システム100では、特徴量変換システム100では、クライアント装置20が、二次元空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する。そして、サーバ装置10が、所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成し、作成された変換ルールを用いて、各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う。続いて、サーバ装置10が、変換された特徴量を用いて、ノード間の距離を計算し、計算されたノード間の距離と、配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、変換ルールを出力する。このため、ユーザが配置したノードに近いものを実現するための変換ルールのパラメータを得ることができる。この結果、利用者に高度な専門性を求めることなく、妥当な特徴量変換のパラメータを容易かつ効率的に特定することが可能である。
第一の実施形態にかかる特徴量変換システム100では、サーバ装置100が、所定のパラメータの候補または範囲を限定する指示を受け付け、受け付けられた候補または範囲のなかから所定のパラメータを選択し、該所定のパラメータを用いて、変換ルールを作成する。このため、限定したパラメータの範囲で、適切に変換ルールを作成することができる。
第一の実施形態にかかる特徴量変換システム100では、所定のパラメータをランダムに選択し、該所定のパラメータを用いて、変換ルールを作成する。このため、ランダムなパラメータに基づいて様々な変換ルールを作成することができる。
第一の実施形態にかかる特徴量変換システム100では、所定のパラメータの範囲を限定する指示として、特徴量の種別の候補、分布の種別の候補、および、重みの値の範囲の指定を少なくとも受け付ける。このため、変換ルールの限定を自由に変更することが可能である。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、変換ルール限定部22aおよび距離計算法指定部22cを統合してもよい。また、上記では、次元削減部12dをサーバ装置10が有している場合を説明したが、クライアント装置20が有していてもよい。また、サーバ装置10が有するルール生成部12a、特徴量変換部12b、距離計算部12c、次元削減部12dおよび誤差算出部12eをクライアント装置20に持たせることにより、クライアント装置20のみで全ての処理を完結して行えるようにしてもよい。
さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
また、上記実施形態において説明したサーバ装置10およびクライアント装置20が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、第一の実施形態に係るサーバ装置10およびクライアント装置20が実行する処理をコンピュータが実行可能な言語で記述した変換ルール生成プログラムを作成することもできる。この場合、コンピュータが変換ルール生成プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる変換ルール生成プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録され変換ルール生成プログラムをコンピュータに読み込ませて実行することにより上記第一の実施形態と同様の処理を実現してもよい。以下に、図2および図6に示したサーバ装置10およびクライアント装置20と同様の機能を実現する変換ルール生成プログラムを実行するコンピュータの一例を説明する。
図11は、変換ルール生成プログラムを実行するコンピュータ1000を示す図である。図11に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。
メモリ1010は、図11に例示するように、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図11に例示するように、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、図11に例示するように、ディスクドライブ1041に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1041に挿入される。シリアルポートインタフェース1050は、図11に例示するように、例えばマウス1051、キーボード1052に接続される。ビデオアダプタ1060は、図11に例示するように、例えばディスプレイ1061に接続される。
ここで、図11に例示するように、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、上記の変換ルール生成プログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1031に記憶される。
また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1031に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、各種処理手順を実行する。
なお、変換ルール生成プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、変換ルール生成プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
10 サーバ装置
11、21 通信処理部
12、22 制御部
12a ルール生成部
12b 特徴量変換部
12c 距離計算部
12d 次元削減部
12e 誤差算出部
13、23 記憶部
13a ノードデータ記憶部
13b 限定データ記憶部
20 クライアント装置
22a 変換ルール限定部
22b 配置指定部
22c 距離計算法指定部
22d 目標値指定部
22e 演算開始指定部
22f 出力部
23a データ記憶部
30 ネットワーク
100 特徴量変換システム

Claims (7)

  1. 所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付部と、
    所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成部と、
    前記作成部によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換部と、
    前記変換部によって変換された特徴量を用いて、ノード間の距離を計算する計算部と、
    前記計算部によって計算されたノード間の距離と、前記配置受付部によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換部により用いられた変換ルールを出力する出力部と、
    を備えたことを特徴とする情報処理装置。
  2. 前記所定のパラメータの候補または範囲を限定する指示を受け付ける限定受付部をさらに備え、
    前記作成部は、前記限定受付部によって受け付けられた候補または範囲のなかから前記所定のパラメータを選択し、該所定のパラメータを用いて、前記変換ルールを作成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記作成部は、前記所定のパラメータをランダムに選択し、該所定のパラメータを用いて、前記変換ルールを作成することを特徴とする請求項2に記載の情報処理装置。
  4. 前記限定受付部は、前記所定のパラメータの範囲を限定する指示として、特徴量の種別の候補、分布の種別の候補、および、重みの値の範囲の指定を少なくとも受け付けることを特徴とする請求項2に記載の情報処理装置。
  5. 所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付部と、
    所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成部と、
    前記作成部によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換部と、
    前記変換部によって変換された特徴量を用いて、ノード間の距離を計算する計算部と、
    前記計算部によって計算されたノード間の距離と、前記配置受付部によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換部により用いられた変換ルールを出力する出力部と、
    を備えたことを特徴とする特徴量変換システム。
  6. 情報処理装置によって実行される変換ルール生成方法であって、
    所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付工程と、
    所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成工程と、
    前記作成工程によって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換工程と、
    前記変換工程によって変換された特徴量を用いて、ノード間の距離を計算する計算工程と、
    前記計算工程によって計算されたノード間の距離と、前記配置受付工程によって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換工程により用いられた変換ルールを出力する出力工程と、
    を含んだことを特徴とする変換ルール生成方法。
  7. 所定の次元で表される空間に対する各ノードの配置に関する指示を受け付けて、該各ノードを配置する配置受付ステップと、
    所定のパラメータを用いて、特徴量を所定の形式のデータに変換する変換ルールを作成する作成ステップと、
    前記作成ステップによって作成された変換ルールを用いて、前記各ノードが有する特徴量を所定の形式のデータに変換する特徴量変換処理を行う変換ステップと、
    前記変換ステップによって変換された特徴量を用いて、ノード間の距離を計算する計算ステップと、
    前記計算ステップによって計算されたノード間の距離と、前記配置受付ステップによって配置されたノード間の距離とを比較し、距離の差分が所定の値より小さい場合には、前記変換ステップにより用いられた変換ルールを出力する出力ステップと、
    をコンピュータに実行させるための変換ルール生成プログラム。
JP2013134353A 2013-06-26 2013-06-26 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム Expired - Fee Related JP5952226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013134353A JP5952226B2 (ja) 2013-06-26 2013-06-26 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013134353A JP5952226B2 (ja) 2013-06-26 2013-06-26 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム

Publications (2)

Publication Number Publication Date
JP2015011411A JP2015011411A (ja) 2015-01-19
JP5952226B2 true JP5952226B2 (ja) 2016-07-13

Family

ID=52304547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013134353A Expired - Fee Related JP5952226B2 (ja) 2013-06-26 2013-06-26 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム

Country Status (1)

Country Link
JP (1) JP5952226B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4274221B2 (ja) * 2006-10-02 2009-06-03 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP5862243B2 (ja) * 2011-11-30 2016-02-16 キヤノンマーケティングジャパン株式会社 情報処理装置、及びその制御方法、プログラム

Also Published As

Publication number Publication date
JP2015011411A (ja) 2015-01-19

Similar Documents

Publication Publication Date Title
JP5755822B1 (ja) 類似度算出システム、類似度算出方法およびプログラム
US9411829B2 (en) Image-based faceted system and method
JP5755823B1 (ja) 類似度算出システム、類似度算出方法およびプログラム
JP7482783B2 (ja) フォント作成装置、フォント作成方法及びフォント作成プログラム
US20200348969A1 (en) Techniques for workflow analysis and design task optimization
JP6378855B1 (ja) 画像検索システム、画像検索方法およびプログラム
EP3333770A1 (en) Matching graph entities in graph data
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
JP2019040335A (ja) 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム
CN110166522A (zh) 服务器识别方法、装置、可读存储介质和计算机设备
JP2013164813A5 (ja) 情報処理装置、及びその制御方法、プログラム
JP5952226B2 (ja) 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム
JP2019028484A (ja) 属性識別装置、属性識別モデル学習装置、方法、及びプログラム
JP6018014B2 (ja) 情報処理装置、特徴量変換システム、表示制御方法及び表示制御プログラム
JP6865705B2 (ja) 画像生成装置、画像生成方法および画像生成プログラム
CN116383714A (zh) 用于斗轮机的设备保护系统及其方法
WO2022183889A1 (zh) 贝叶斯网络结构的生成方法、装置、电子设备和存储介质
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes
Tao et al. Multi-label feature selection method via maximizing correlation-based criterion with mutation binary bat algorithm
WO2022007527A1 (zh) 样本数据标注系统、方法以及相关设备
JP6409463B2 (ja) パターン認識装置、パターン学習装置、パターン学習方法およびパターン学習プログラム
JP2011248680A (ja) 画像処理システム
JP7071213B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP2018032232A (ja) 探索木を用いて量子化するプログラム、装置及び方法
JP2019144939A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150715

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20151001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160609

R150 Certificate of patent or registration of utility model

Ref document number: 5952226

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees