WO2022130498A1

WO2022130498A1 - 類似度算出装置、類似度算出方法、及び、類似度算出プログラム

Info

Publication number: WO2022130498A1
Application number: PCT/JP2020/046743
Authority: WO
Inventors: 郁海森; 弦矢板垣
Original assignee: 三菱電機株式会社
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2022-06-23
Also published as: JPWO2022130498A1; EP4242937A4; US20230237379A1; EP4242937A1; JP7217842B2; CN116569186A

Abstract

類似度算出装置（１）は、類似度算出部（１９）を備え、転移元データ候補（２）と転移先データ（３）とを用いて転移学習を行う。類似度算出部（１９）は、転移元データ候補（２）の特徴量の分布を示す転移元データ分布が有する極値を示す転移元極値を含む転移元極値群と、転移先データ（３）の特徴量の分布を示す転移先データ分布が有する極値を示す転移先極値を含む転移先極値群とに基づいて、転移元データ分布と転移先データ分布との類似度を求める。

Description

類似度算出装置、類似度算出方法、及び、類似度算出プログラム

　本開示は、類似度算出装置、類似度算出方法、及び、類似度算出プログラムに関する。

　ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）機器においてＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を利用するソリューションが増加している。具体例として、（１）空気調和機及び照明等のＩｏＴ家電の制御と、（２）製造装置の故障診断と、（３）製造ラインにおける製品の画像による検品と、（４）ビル等の入門時の動画による不審者侵入検知と、（５）ＥＭＳ（Ｅｎｅｒｇｙ　Ｍａｎａｇｅｍｅｎｔ　Ｓｙｓｔｅｍ）とが挙げられる。
　ＩｏＴ機器毎にＡＩを利用する場合、学習処理に用いる十分な数の訓練データを確保することが困難であることが多い。そこで、少ない訓練データを用いて効率的に学習処理を行う必要がある。少ない訓練データを用いて学習する方法として、転移学習と呼ばれる方法がある。転移学習において、訓練データが収集された環境とは異なる環境における訓練データ及び学習モデルを転移させる。
　転移学習では、転移元を特定するために、転移元の候補の全データに対して転移元になり得るか否かを１つずつ評価する。転移元の候補を転移することが有効であることを示す「正の転移」であることを評価により確認することができた場合、転移元の候補を転移元として決定する。訓練データが画像データである場合、転移元の候補の画像が転移先の画像と十分に類似していることが「正の転移」となることの十分条件となることが多い。
　特許文献１は、画像の類似度を算出する方法として、各画像のカラーヒストグラムを算出して類似度を求める方法と、輝度の勾配方向を特徴量として類似度を求める方法と、入力画像及び学習画像のそれぞれから検出した局所特徴の特徴量が類似する個数を評価値とする方法等、何らかの評価関数を用いて、検索対象画像と検索元画像との類似度を計算する方法を開示している。

特開２０１９－０８７２２９号公報

　特許文献１が開示する手法によれば、計算量が比較的多いという課題がある。

　本開示は、転移学習において、比較的少ない計算量で転移元を求めることを目的とする。

　本開示に係る類似度算出装置は、
　転移元データ候補と転移先データとを用いて転移学習を行う類似度算出装置であって、
　前記転移元データ候補の特徴量の分布を示す転移元データ分布が有する極値を示す転移元極値を含む転移元極値群と、前記転移先データの特徴量の分布を示す転移先データ分布が有する極値を示す転移先極値を含む転移先極値群とに基づいて、前記転移元データ分布と前記転移先データ分布との類似度を求める類似度算出部を備える。

　本開示によれば、転移学習において、比較的少ない計算量で転移元を求めることができる。

実施の形態１に係る類似度算出装置１の構成例。実施の形態１に係る特徴データ分布１０２Ｓの具体例。実施の形態１に係るデータセット１０５の具体例。実施の形態１に係る類似度算出装置１のハードウェア構成例。実施の形態１に係る類似度算出装置１の動作の概要を説明する図。実施の形態１に係る類似度算出装置１の学習フェーズに係る動作を示すフローチャート。実施の形態１に係る類似度算出装置１の学習フェーズに係る動作を説明する図であり、（ａ）は転移元データ候補を示す画像、（ｂ）は（ａ）をグレースケール化した画像、（ｃ）は（ｂ）に対応する特徴データ分布。実施の形態１に係る類似度算出装置１の推論フェーズに係る動作を示すフローチャート。実施の形態１に係る類似度算出装置１の動作を説明する図。実施の形態１の変形例に係る類似度算出装置１のハードウェア構成例。実施の形態２に係る類似度算出装置１の動作の概要を説明する図であり、（ａ）は座標系を変換する前を説明する図、（ｂ）は座標系を変換した後を説明する図。実施の形態２に係る類似度算出装置１の構成例。実施の形態２に係る類似度算出装置１の学習フェーズに係る動作を示すフローチャート。実施の形態２に係る類似度算出装置１の推論フェーズに係る動作を示すフローチャート。実施の形態３に係る類似度算出装置１の動作の概要を説明する図であり、（ａ）は許容範囲がない場合を説明する図、（ｂ）は許容範囲がある場合を説明する図。実施の形態３に係る類似度算出装置１の構成例。実施の形態３に係る類似度算出装置１の動作を説明する図。実施の形態４に係る類似度算出装置１の動作の概要を説明する図であり、（ａ）は許容範囲がない場合を説明する図、（ｂ）は許容範囲がある場合を説明する図。実施の形態４に係る類似度算出装置１の構成例。

　実施の形態の説明及び図面において、同じ要素及び対応する要素には同じ符号を付している。同じ符号が付された要素の説明は、適宜に省略又は簡略化する。図中の矢印はデータの流れ又は処理の流れを主に示している。また、「部」を、「回路」、「工程」、「手順」、「処理」又は「サーキットリー」に適宜読み替えてもよい。

　実施の形態１．
　以下、本実施の形態について、図面を参照しながら詳細に説明する。

＊＊＊構成の説明＊＊＊
　図１は、本実施の形態に係る類似度算出装置１の構成例を示している。類似度算出装置１は、本図に示すように、特徴抽出部１１と、データ分布計算部１２と、極値計算部１３と、グルーピング部１４と、データセット記憶部１５と、モデル作成部１６と、分類器記憶部１７と、モデル決定部１８と、類似度算出部１９と、データ決定部２０とを備える。
　なお、類似度算出装置１は、転移元データ候補２と転移先データ３とを用いて転移学習を行う。また、符号の末尾のＴ及び上付きのｔは転移先データ分布に関するものであることを示し、符号の末尾のＳ及び上付きのｓは転移元データ分布に関するものであることを示す。

　特徴抽出部１１は、転移元データ候補２を用いて転移元データ候補２の特徴量を示す特徴ベクトル１０１Ｓを生成し、転移先データ３を用いて転移先データ３の特徴量を示す特徴ベクトル１０１Ｔを生成する。転移元データ候補２及び転移先データ３それぞれは、他の装置から受信したデータであってもよく、類似度算出装置１が記憶しているデータであってもよい。なお、転移元データ候補２は、転移元データの候補であり、少なくとも１つ存在する。転移先データ３は１つ存在するものとする。特徴抽出部１１が求める特徴量のデータ形式は、ベクトル形式でなくてもよい。なお、特徴ベクトル１０１を特徴ベクトル１０１Ｓ及び特徴ベクトル１０１Ｔの総称とする。特徴ベクトル１０１は具体例として画素値の配列である。
　特徴抽出部１１は、特徴量として、具体例として、主成分分析により転移元データ候補２又は転移先データ３を要約したデータと、転移元データ候補２又は転移先データ３に関する平均値、分散、又は相関係数等の統計量と、ヒストグラム又はフーリエ変換等の（同種）写像を用いて転移元データ候補２又は転移先データ３を変換した値と、回帰分析等を利用して転移元データ候補２又は転移先データ３に対する関数近似を行いその係数又はその変化量である勾配ベクトルとの少なくともいずれかを求める。ヒストグラムという用語は、ヒストグラムにより表現することができるデータを指すこともある。なお、特徴抽出部１１が求める特徴量は、転移元データ候補２又は転移先データ３の特徴を十分に反映しているものとする。

　データ分布計算部１２は、特徴ベクトル１０１Ｓを用いて特徴データ分布１０２Ｓを生成し、特徴ベクトル１０１Ｔを用いて特徴データ分布１０２Ｔを生成する。特徴データ分布１０２Ｓは、転移元データ候補２の特徴量の分布を示し、転移元データ分布とも呼ばれ、少なくとも１つ存在する。転移元データ候補２それぞれは特徴データ分布１０２Ｓそれぞれと１対１で対応している。特徴データ分布１０２Ｔは、転移先データ３の特徴量の分布を示し、転移先データ分布とも呼ばれる。なお、特徴データ分布１０２を特徴データ分布１０２Ｓ及び特徴データ分布１０２Ｔの総称とする。特徴データ分布１０２は、典型的には関数であり、離散分布であっても、連続分布であってもよい。

　極値計算部１３は、特徴データ分布１０２Ｓを用いて極値データ１０３Ｓを求める。極値データ１０３Ｓは、データＩＤ（Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ）^ｓと、極値座標群Ｇ^ｓと、極値の数Ｅ^ｓとから成り、計算結果とも呼ばれる。データＩＤ^ｓは、転移元データ候補２を識別する識別子であり、転移元データＩＤとも呼ばれる。極値座標群Ｇ^ｓは、特徴データ分布１０２Ｓが有する極値の座標から成る集合であり、転移元極値座標群又は転移元極値群とも呼ばれ、少なくとも１つ存在する。特徴データ分布１０２Ｓそれぞれは極値座標群Ｇ^ｓそれぞれと１対１で対応している。極値座標群Ｇ^ｓが含む各極値は転移元極値とも呼ばれる。転移元極値それぞれは、転移元極値それぞれに対応する極値を有する特徴データ分布１０２Ｓに対応する転移元データ候補２を識別する識別子と対応付けられている。極値の数Ｅ^ｓは極値座標群Ｇ^ｓが含む極値の数である。
　また、極値計算部１３は、特徴データ分布１０２Ｔを用いて極値データ１０３Ｔを求める。極値データ１０３Ｔは極値座標群Ｇ^ｔと、極値の数Ｅ^ｔとから成り、計算結果とも呼ばれる。極値座標群Ｇ^ｔは、特徴データ分布１０２Ｔが有する極値の座標から成る集合であり、転移先極値座標群又は転移先極値群とも呼ばれる。極値の数Ｅ^ｔは極値座標群Ｇ^ｔが含む極値の数である。極値データ１０３Ｔは転移先データ３を識別する識別子を含んでもよい。極値の数を極値の数Ｅ^ｓと極値の数Ｅ^ｔとの総称とする。
　極値計算部１３は、転移元データ分布と転移先データ分布とを受け取り、転移元データ分布を用いて転移元データ分布が有する極値を求め、転移先データ分布を用いて転移先データ分布が有する極値を求める。

　特徴データ分布１０２Ｓがｙ＝ｆ^ｓ（ｘ）であり、極値の数Ｅ^ｓがｎである場合、極値座標群Ｇ^ｓが含む各座標（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ）は［数１］のように定義される。［数１］は極値座標群Ｇ^ｓの具体例でもある。なお、極値座標群Ｇ^ｓに含まれる各座標の次元数は２に限られないが、説明の便宜上、当該各座標の次元を２としている。極値座標群Ｇ^ｔは［数１］と同様に定義される。なお、変数ｓを与えられた特徴データ分布１０２Ｓ全てから成る集合Ｓの各元としている。即ち、ｓ∈Ｓである。

　図２は、特徴データ分布１０２Ｓの具体例を示している。本図は、［数１］に示すｎが６である場合における、極値座標群Ｇ^ｓに含まれる各極値の具体例を示している。

　グルーピング部１４は、極値データ１０３Ｓを用いて学習データ１０４を生成し、生成した学習データ１０４をデータセット記憶部１５に保存する。学習データ１０４は訓練データと教師データとを含む。学習データ１０４において、訓練データは極値座標群Ｇ^ｓが含む各極値座標であり、教師データは訓練データである極値座標を有する特徴データ分布１０２Ｓに対応するデータＩＤ^ｓである。教師データはラベルでもある。ラベルは、転移元データ候補２を識別する識別子でもある。
　グルーピング部１４は、学習データ１０４に対応する極値の数Ｅ^ｓにより学習データ１０４を分類した上で学習データ１０４をデータセット記憶部１５に保存する。学習データ１０４に対応する極値の数Ｅ^ｓは、学習データ１０４が含む極値座標を含む極値座標群Ｇ^ｓに含まれる極値の数Ｅ^ｓである。

　データセット記憶部１５は、データセット１０５－１からデータセット１０５－Ｎを記憶し、また、データセット１～Ｎ記憶部とも呼ばれる。Ｎは、極値の数Ｅ^ｓの最大値を示す定数であり、動的に変更されてもよい。データセット１０５－ｎ（１≦ｎ≦Ｎ、ｎは整数）は、極値の数Ｅ^ｓがｎである特徴データ分布１０２Ｓそれぞれに対応する学習データ１０４を元とする集合である。即ち、ｎは極値の数Ｅ^ｓに対応する変数である。なお、データセット１０５－１からデータセット１０５－Ｎの少なくとも一部は空のデータであってもよい。
　転移元極値それぞれは、転移元極値それぞれに対応する極値を有する特徴データ分布１０２Ｓに対応する転移元データ候補２を識別する識別子と対応付けられている。転移元極値それぞれは、転移元極値それぞれを含む転移元極値群が含む転移元極値の数に応じて、データセット１０５の少なくとも１つに属する。データセット１０５は、極値の数が示す値ごとに用意されている。本実施の形態において、データセット１０５それぞれは、データセット１０５それぞれに対応する転移元極値の数に対応する転移元極値を含む。データセット１０５－ｎに対応する転移元極値の数はｎである。転移元極値の数がｎである場合において、転移元極値の数に対応する転移元極値は、ｎ個の転移元極値を有する特徴データ分布１０２Ｓが有する転移元極値である。

　［数２］は、極値の数Ｅ^ｓがｎ（＝｜｛（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ）｝｜）である特徴データ分布１０２Ｓ全てから生成されたデータセット１０５－ｎの具体例を示している。

　ここで、データセット１０５－ｎを集合ｇ_ｎと表現し、極値座標群Ｇ^ｓが含む各座標を（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ）と表現し、データＩＤ^ｓをｃ^ｓと表現している。

　図３は、データセット１０５の具体例を示している。本図の上部に極値座標群Ｇ^ｓが示されており、Ｇ^ｓ１，Ｇ^ｓ２，…，Ｇ^ｓｎは各極値座標群Ｇ^ｓである。ここで、上付きの添え字は、各極値座標群Ｇ^ｓが含む極値座標を有する特徴データ分布１０２Ｓに対応するデータＩＤ^ｓを示すラベルである。また、本図の下部に上部に示される極値座標群Ｇ^ｓに対応するデータセット１０５が示されている。Ｇ^ｓ１及びＧ^ｓｎそれぞれに対応する極値の数Ｅ^ｓは３であるためＧ^ｓ１及びＧ^ｓｎの各要素はデータセット１０５－３が含む各要素に含まれ、Ｇ^ｓ２に対応する極値の数Ｅ^ｓは１であるためＧ^ｓ２の要素はデータセット１０５－１が含む要素に含まれる。

　モデル作成部１６は、データセット１０５を用いて学習を行うことにより学習モデルである分類器１０６を作成する。具体的には、モデル作成部１６は、データセット１０５－ｎをデータセット記憶部１５から取得し、取得したデータセット１０５－ｎを用いて分類器１０６－ｎを作成する。即ち、モデル作成部１６は、極値の数Ｅ^ｓごとに分類器１０６を作成する。なお、データセット１０５－ｎが空である場合、モデル作成部１６は分類器１０６－ｎを作成しなくてもよい。学習モデルである分類器１０６は、データセット１０５それぞれに対応するモデルであって、与えられた座標群に対応する識別子を推定することに用いられるモデルであり、特徴データ分布１０２Ｔの各極値を分類することに用いられるモデルである。具体的には、分類器１０６－ｎは、極値の数Ｅ^ｓがｎである特徴データ分布１０２Ｓそれぞれに対応するクラスに、極値の数Ｅ^ｔがｎである特徴データ分布１０２Ｔの各極値が所属する確率（クラス所属確率）を求める。なお、学習モデルを単にモデルと表現することもある。
　モデル作成部１６は、学習に用いる学習アルゴリズムとして、具体例として、ＫＮＮ（ｋ－ｎｅａｒｅｓｔ　ｎｅｉｇｈｂｏｒ、ｋ近傍法）又はＳＶＣ（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｃｌａｓｓｉｆｉｃａｔｉｏｎ）等を用いる。

　分類器記憶部１７は、分類器１０６－１から分類器１０６－Ｎを記憶し、また、分類器１～Ｎ記憶部とも呼ばれる。分類器１０６－ｎは、極値の数Ｅ^ｓがｎである特徴データ分布１０２Ｓに対応する。

　モデル決定部１８は、類似度算出部１９が用いる分類器１０６を、極値座標群Ｇ^ｔを用いて決定する。具体例として、極値の数Ｅ^ｔがｍ（＝｜｛（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）｝｜）である場合、モデル決定部１８は、分類器記憶部１７から分類器１０６－ｍを取得し、類似度算出部１９が用いる分類器１０６として取得した分類器１０６－ｍを決定する。
　モデル決定部１８は、決定した分類器１０６を含む推論データ１０８を生成する。推論データ１０８は、極値座標群Ｇ^ｔと、極値座標群Ｇ^ｔに対応する分類器１０６とを含む。推論データ１０８－ｍは、極値の数Ｅ^ｔがｍである極値座標群Ｇ^ｔを含む推論データ１０８である。
　モデル決定部１８は、少なくとも１つの学習モデルから、極値座標群Ｇ^ｔが含む極値の数に応じて学習モデルを決定モデルとして決定する。

　類似度算出部１９は、推論データ１０８が含む分類器１０６と極値座標群Ｇ^ｔとを用いて少なくとも１つの特徴データ分布１０２Ｓそれぞれと特徴データ分布１０２Ｔとの類似度を求め、求めた類似度を含む類似度データ１０９を出力する。類似度データ１０９は、データＩＤ^ｓのラベルと、データＩＤ^ｓに対応する類似度とを含む。
　類似度算出部１９は、決定モデルと極値座標群Ｇ^ｔとを用いて類似度を求める。ここで、決定モデルは極値座標群Ｇ^ｓに基づいて生成されている。よって、類似度算出部１９は、特徴データ分布１０２Ｓそれぞれに対応する極値座標群Ｇ^ｓと極値座標群Ｇ^ｔとに基づいて、特徴データ分布１０２Ｓそれぞれと特徴データ分布１０２Ｔとの類似度を求める。

　以下、類似度の具体例を説明する。［数３］は、各（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）のクラス所属確率を推定クラスｃ_ｊごとに示している。ここで、出力は「推定クラス（クラス所属確率）」という形式で表記されている。また、１つの入力に対する出力の数は、極値の数Ｅ^ｓがｍである特徴データ分布１０２Ｓの総数である。

　特徴データ分布１０２Ｔと推定クラスｃ_ｊとの類似度を示すｓｃｏｒｅ（ｃ_ｊ）は、具体例として［数４］のように示される。なお、ｓｃｏｒｅ（ｃ_ｊ）は、転移先データ３の各転移元データ候補２との類似度でもある。

　ここで、ｗ_ｉは各極値（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ）を重視する程度を示す重みパラメータである。

　データ決定部２０は、転移元データ決定部とも呼ばれ、類似度データ１０９及び決定条件に基づいて少なくとも１つの転移元データ候補２から転移元データを決定し、決定した転移元データを含む決定データ４を出力する。決定データ４は、転移元データ候補２を示すラベルと、当該転移元データ候補２に対応する類似度とを含む。決定条件は、データ決定部２０が転移元データ候補２を転移元データと決定する条件である。決定条件は、具体例として、類似度がある閾値以上であることである。データ決定部２０は、決定条件を満たす類似度に対応する転移元データ候補２を転移元データと決定する。
　データ決定部２０は、具体例として、決定条件を満たす類似度に対応するデータＩＤ^ｓを特定し、特定したデータＩＤ^ｓに対応する転移元データ候補２及び類似度を出力する。

　図４は、本実施の形態に係る類似度算出装置１のハードウェア構成例を示している。類似度算出装置１は、コンピュータから成る。類似度算出装置１は、複数のコンピュータから成ってもよい。
　また、類似度算出装置１は、クラウドコンピューティングにおけるサーバ（コンピュータ）において動作させてもよく、エッジコンピューティングにおけるサーバ（コンピュータ）において動作させてもよい。

　類似度算出装置１は、本図に示すように、プロセッサ５１と、メモリ５２と、補助記憶装置５３と、入出力ＩＦ（Ｉｎｔｅｒｆａｃｅ）５４と、通信装置５５と等のハードウェアを備えるコンピュータである。これらのハードウェアは、信号線５９を介して互いに接続されている。

　プロセッサ５１は、演算処理を行うＩＣ（Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）であり、かつ、コンピュータが備えるハードウェアを制御する。プロセッサ５１は、具体例として、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、又はＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）である。
　類似度算出装置１は、プロセッサ５１を代替する複数のプロセッサを備えてもよい。複数のプロセッサは、プロセッサ５１の役割を分担する。

　メモリ５２は、典型的には、揮発性の記憶装置である。メモリ５２は、主記憶装置又はメインメモリとも呼ばれる。メモリ５２は、具体例として、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）である。メモリ５２に記憶されたデータは、必要に応じて補助記憶装置５３に保存される。

　補助記憶装置５３は、典型的には、不揮発性の記憶装置である。補助記憶装置５３は、具体例として、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、又はフラッシュメモリである。補助記憶装置５３に記憶されたデータは、必要に応じてメモリ５２にロードされる。
　メモリ５２と、補助記憶装置５３とは、一体的に構成されていてもよい。

　入出力ＩＦ５４は、入力装置及び出力装置が接続されるポートである。入出力ＩＦ５４は、具体例として、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）端子である。入力装置は、具体例として、キーボード及びマウスである。出力装置は、具体例として、ディスプレイである。

　通信装置５５は、レシーバ及びトランスミッタである。通信装置５５は、具体例として、通信チップ又はＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）である。

　類似度算出装置１の各部は、他の装置等と通信する際に、通信装置５５を適宜用いてもよい。類似度算出装置１の各部は、入出力ＩＦ５４を介してデータを受け付けてもよく、また、通信装置５５を介してデータを受け付けてもよい。

　補助記憶装置５３は、類似度算出プログラムを記憶している。類似度算出プログラムは、類似度算出装置１が備える各部の機能をコンピュータに実現させるプログラムである。類似度算出プログラムは、複数のファイルから成ってもよい。類似度算出プログラムは、メモリ５２にロードされて、プロセッサ５１によって実行される。類似度算出装置１が備える各部の機能は、ソフトウェアにより実現される。

　類似度算出プログラムを実行する際に用いられるデータと、類似度算出プログラムを実行することによって得られるデータと等は、記憶装置に適宜記憶される。類似度算出装置１の各部は、適宜記憶装置を利用する。記憶装置は、具体例として、メモリ５２と、補助記憶装置５３と、プロセッサ５１内のレジスタと、プロセッサ５１内のキャッシュメモリとの少なくとも１つから成る。なお、データと、情報とは、同等の意味を有することもある。記憶装置は、コンピュータと独立したものであってもよい。データセット記憶部１５と分類器記憶部１７とのそれぞれは記憶装置から成る。
　メモリ５２及び補助記憶装置５３の機能は他の記憶装置によって実現されてもよい。

　類似度算出プログラムは、コンピュータが読み取り可能な不揮発性の記録媒体に記録されていてもよい。不揮発性の記録媒体は、具体例として、光ディスク又はフラッシュメモリである。類似度算出プログラムは、プログラムプロダクトとして提供されてもよい。

＊＊＊動作の説明＊＊＊
　類似度算出装置１の動作手順は、類似度算出方法に相当する。また、類似度算出装置１の動作を実現するプログラムは、類似度算出プログラムに相当する。

　類似度算出装置１は、以下の２つの基本的な方針に従って、特徴データ分布１０２Ｓの特徴データ分布１０２Ｔとの類似度を評価する。
　方針（１）：類似度算出装置１は、特徴データ分布１０２Ｓのある極値が特徴データ分布１０２Ｔのある極値と近接している場合に、特徴データ分布１０２Ｓの当該ある極値において特徴データ分布１０２Ｓは特徴データ分布１０２Ｔと部分的に類似しているものとみなす。なお、類似度算出装置１は、特徴データ分布１０２Ｔのある極値と、特徴データ分布１０２Ｓのある極値とがより近い場合に、特徴データ分布１０２Ｓは特徴データ分布１０２Ｔと部分的により類似しているとみなしてもよい。
　方針（２）：類似度算出装置１は、部分的に類似している極値をより多く持つ特徴データ分布１０２Ｓほど類似度を高く算出する。

　図５は、前述の方針（１）及び方針（２）に示す方針を具体的に説明する図である。本図において、２つの特徴データ分布１０２Ｓ（転移元データ分布Ｄ２及び転移元データ分布Ｄ３）と、１つの転移先の特徴データ分布（転移先データ分布Ｄ１）とが示されている。また、丸を用いて極大値が示されており、四角形を用いて極小値が示されており、転移先データ分布Ｄ１の各極値を中心とした円により、各極値に近接している領域が示されている。各近接している領域を近傍領域Ｒ１から近傍領域Ｒ４としている。また、転移元データ分布のある極値が転移先データ分布Ｄ１のある極値と近接している場合に、双方の極値を破線で結んでいる。
　本図より、転移元データ分布Ｄ２の極値は、近傍領域Ｒ１から近傍領域Ｒ４のいずれにおいても転移先データ分布Ｄ１の極値と近接している。一方、転移元データ分布Ｄ３の極値は、近傍領域Ｒ１と、近傍領域Ｒ２と、近傍領域Ｒ４とにおいてのみ転移先データ分布Ｄ１の極値と近接している。つまり、転移元データ分布Ｄ２は部分的に類似している極値を４つ持っており、転移元データ分布Ｄ３は部分的に類似している極値を３つ持っている。従って、転移元データ分布Ｄ２は転移元データ分布Ｄ３と比較して部分的に類似している極値をより多く持っている。そのため、類似度算出装置１は、転移元データ分布Ｄ２に対応する類似度が転移元データ分布Ｄ３に対応する類似度より高くなるように各々の類似度を算出する。

＜学習フェーズ＞
　図６は、類似度算出装置１の学習フェーズにおける動作の一例を示すフローチャートである。図１及び本図を用いて学習フェーズを説明する。

（ステップＳ１０１：特徴抽出処理）
　特徴抽出部１１は、転移元データ候補２を入力として受け取り、受け取った転移元データ候補２を用いて特徴ベクトル１０１Ｓを生成し、生成した特徴ベクトル１０１Ｓを出力する。

（ステップＳ１０２：データ分布計算処理）
　データ分布計算部１２は、特徴ベクトル１０１Ｓを入力として受け取り、受け取った特徴ベクトル１０１Ｓを用いて特徴データ分布１０２Ｓを生成し、生成した特徴データ分布１０２Ｓを出力する。

　図７は、ステップＳ１０１及びステップＳ１０２の具体例を模式的に説明する図である。本図を用いてステップＳ１０１及びステップＳ１０２の具体例を説明する。なお、本図において、転移元データ候補２を示す（ａ）は白黒により表現されているものの、実際にはトラが写っているカラー画像のデータである。
　転移元データ候補２が画像であり、当該画像中の柄又は模様等に特徴がある場合において、特徴抽出部１１は、特徴量として画素値の出現頻度を示すデータを出力してもよい。出現頻度を示すデータは、ヒストグラムによって表すこともできるデータである。特徴抽出部１１は、１枚の画像中に画素値ｘが占める割合の確率を特徴量とする。特徴抽出部１１は、具体例として、カラー画像をグレースケール化した後、カーネル密度推定によって画素値ｘを確率変数とする確率質量関数ｐ（ｘ）を求め、（ｘ，ｐ（ｘ））を特徴ベクトル１０１Ｓとする。（ｂ）は（ａ）をグレースケール化したデータを示している。
　データ分布計算部１２は、（ｘ，ｐ（ｘ））を受け取り、（ｘ，ｐ（ｘ））をスケール変換して特徴データ分布１０２Ｓを求める。（ｃ）は、データ分布計算部１２が求めた特徴データ分布１０２Ｓを示している。
　ここで、特徴ベクトル１０１Ｓである（ｘ，ｐ（ｘ））は特徴データ分布１０２Ｓと捉えることができる。特徴ベクトル１０１Ｓを特徴データ分布１０２Ｓと捉えることができる場合において、データ分布計算部１２は、受け取った特徴ベクトル１０１Ｓをそのまま特徴データ分布１０２Ｓとしてもよく、受け取った特徴ベクトル１０１Ｓをスケール変換したデータを特徴データ分布１０２Ｓとしてもよい。特徴ベクトル１０１Ｓをスケール変換する目的として、後続の処理において特徴データ分布１０２Ｓ同士を比較しやすくすることが挙げられる。スケール変換の具体例として、データ分布計算部１２は、データ分布の最小値から最大値までの範囲を［０，１］の範囲にスケール変換する。

（ステップＳ１０３：極値計算処理）
　極値計算部１３は、特徴データ分布１０２Ｓを入力として受け取り、受け取った特徴データ分布１０２Ｓを用いて極値データ１０３Ｓを生成し、生成した極値データ１０３Ｓを出力する。具体的には、極値計算部１３は、特徴データ分布１０２Ｓから極大値及び極小値それぞれの数と、極大値及び極小値それぞれの座標を示す極値座標群Ｇ^ｓとを求め、求めたデータを極値データ１０３Ｓとして出力する。

（ステップＳ１０４：グルーピング処理）
　グルーピング部１４は、極値データ１０３Ｓを入力として受け取り、受け取った極値データ１０３Ｓが示す極値の数と同数の学習データ１０４を、データセット記憶部１５に保存する。

　類似度算出装置１は、用意された転移元データ候補２の数分、ステップＳ１０１からステップＳ１０４までを繰り返す。

（ステップＳ１０５：モデル作成処理）
　モデル作成部１６は、データセット１０５を入力として受け取り、受け取ったデータセット１０５を用いて学習を行うことにより分類器１０６を作成し、作成した分類器１０６を分類器記憶部１７に保存する。

　図８は、類似度算出装置１の推論フェーズにおける動作の一例を示すフローチャートである。図１及び本図を用いて推論フェーズを説明する。

＜推論フェーズ＞
（ステップＳ１１１：特徴抽出処理）
　特徴抽出部１１は、転移先データ３を入力として受け取り、受け取った転移先データ３を用いて特徴ベクトル１０１Ｔを生成し、生成した特徴ベクトル１０１Ｔを出力する。

（ステップＳ１１２：データ分布計算処理）
　データ分布計算部１２は、特徴ベクトル１０１Ｔを入力として受け取り、受け取った特徴ベクトル１０１Ｔを用いて特徴データ分布１０２Ｔを生成し、生成した特徴データ分布１０２Ｔを出力する。

（ステップＳ１１３：極値計算処理）
　極値計算部１３は、特徴データ分布１０２Ｔを受け取り、受け取った特徴データ分布１０２Ｔを用いて極値データ１０３Ｔを生成し、生成した極値データ１０３Ｔを出力する。

（ステップＳ１１４：モデル決定処理）
　以下、極値の数Ｅ^ｔがｍであるものとして説明する。
　モデル決定部１８は、極値データ１０３Ｔを入力として受け取り、受け取った極値データ１０３Ｔに対応する分類器１０６である分類器１０６－ｍを分類器記憶部１７から取得し、受け取った極値データ１０３Ｔが含む極値座標群Ｇ^ｔと、取得した分類器１０６－ｍとを用いて推論データ１０８－ｍを生成し、生成した推論データ１０８－ｍを出力する。

（ステップＳ１１５：類似度算出処理）
　類似度算出部１９は、推論データ１０８－ｍを入力として受け取り、受け取った推論データ１０８－ｍが含む分類器１０６－ｍと極値座標群Ｇ^ｔとを用いて類似度を求め、類似度データ１０９を出力する。
　具体例として、まず、類似度算出部１９は、受け取った極値座標群Ｇ^ｔから各極値を取り出す。この際、類似度算出部１９は、合計でｍ個の極値座標の組（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）（ｉ＝１，…，ｍ）を作成する。なお、各極値はテストデータでもある。
　次に、類似度算出部１９は、ｍ個のテストデータを一つずつ分類器１０６－ｍに入力し、推定クラスごと、クラス所属確率を求める。推定クラスは、テストデータが所属すると推定されるクラスである。類似度算出部１９は、候補となる各クラスに各テストデータが所属すると推定し、各クラスにおける各テストデータのクラス所属確率を求める。以降、（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）の推定クラスのラベルの集合をＣ^ｔとし、Ｃ^ｔの元をｃ_ｊとする。

　次に、∀ｃ_ｊ∈Ｃ^ｔに対してｓｃｏｒｅ（ｃ_ｊ）を計算し、データＩＤ^ｓのラベルと、データＩＤ^ｓに対応する類似度との組である（ｃ_ｊ，ｓｃｏｒｅ（ｃ_ｊ））を出力する。

（ステップＳ１１６：データ決定処理）
　データ決定部２０は、類似度データ１０９を入力として受け取り、受け取った類似度データ１０９を用いて決定データ４を生成し、生成した決定データ４を出力する。

　図９は、データ決定部２０が転移元データ候補２を特定する具体例を説明する図である。本図において、転移先データ３はトラの画像であり、「転移元データ候補２のラベル（類似度）」という形式により転移元データ候補２の各画像に対応する転移元データ候補２のラベルと類似度とを記載している。また、各画像は実際にはカラー写真である。本例において、データ決定部２０は、０．５を閾値とし、類似度が閾値よりも大きいことを決定条件としている。このとき、決定データ４は、（ｌｅｏｐａｒｄ１，０．９７２）と、（ｃａｔ１，０．８９１）と、（ｔｉｇｅｒ１，０．７７９）と、（ｔｉｇｅｒ２，０．６９７）と、（ｃｈｅｅｔａｈ２，０．５９４）と、（ｃａｔ２，０．５６７）とである。他の画像は類似度が閾値以下であるため、データ決定部２０は他の画像を選択しない。

　以上のように、類似度算出装置１は、１つ以上の転移元データ候補２に基づいて学習を行うことによって分類器１０６を作成し、さらに、１つの転移先データ３に基づいて、作成した分類器１０６を用いて推論を行い、推論の結果に基づいて、転移元データと当該転移元データに対応する類似度とを出力する。

＊＊＊実施の形態１の効果の説明＊＊＊
　以上のように、本実施の形態に係る類似度算出装置１は、具体例として、まず、データ分布計算部１２が、特徴ベクトル１０１Ｓから算出した（ｘ，ｐ（ｘ））を２次元の特徴データ分布１０２Ｓとして出力する。次に、極値計算部１３が、特徴データ分布１０２Ｓが有する極小値及び極大値を算出する。次に、極値座標群Ｇ^ｓの各極値と極値座標群Ｇ^ｔの各極値とがどれだけ近い距離関係であるかを判定する。
　そのため、本実施の形態によれば、特徴ベクトル１０１をそのまま用いる場合と比較して、特徴データ分布１０２を用いるために特徴を示す情報の次元を低くすることができ、さらに、転移先の特徴を有する極値に計算対象を絞るために類似度の計算負荷が低くなる。従って、本実施の形態によれば、比較的短い処理時間で、特徴データ分布１０２そのものを用いた場合に近い類似度を求めることができる。

　また、本実施の形態に係る類似度算出装置１は、特徴データ分布１０２Ｔの極値ごとに、転移元データ候補２に対応するクラスのいずれに所属すると考えられるかを示すクラス所属確率を算出し、各々のクラス所属確率に各々の重みパラメータｗ_ｉを乗じた後に結合して類似度を求める。そのため、本実施の形態によれば、特徴データ分布１０２Ｔの特定の極値に対するｗ_ｉを高く設定（具体例として、ｗ_ｉ＞１）することにより特定の極値の影響を大きくすることができ、また、特定の極値の影響を小さくするためにｗ_ｉを低く設定（具体例として、ｗ_ｉ＜１）することができる。
　従って、本実施の形態によれば、類似度の算出において、ユーザが指定する極値（特徴）を重視した類似度を算出することができる。

　特許文献１が開示する技術では、画像の類似度を評価する際、既存の類似度算出方法を用いており、ユーザは処理負荷等を考慮して所望の類似性を検出することができる適切な方法を選択する必要がある。また、本技術によれば、類似の度合いを制御することが困難である。具体的には、本技術によれば、指紋認証のように環境ノイズのみを考慮する完全一致に近い動作をさせることと、画像セグメンテーション又は行動認識のように個人差及び個体差等を無視してラベル付けするあいまい検索に近い動作をさせること等、単一の評価関数を用いて複数種類の類似性を評価する処理を実施することができない。
　しかしながら、前述の通り、本実施の形態に係る類似度算出装置１によれば、類似度に係る計算負荷は低く、また、重みを活用することにより複数種類の類似性を評価することができる。

＊＊＊他の構成＊＊＊
＜変形例１＞
　特徴データ分布１０２である（ｘ，ｐ（ｘ））は、転移元データ候補２及び転移先データ３の特徴を十分に反映しており、かつ、波形状に近似されていればどのようなものでも構わない。
　具体例として、ｐ（ｘ）に非特許文献１で示されているＢｏＦ（Ｂａｇ－ｏｆ－Ｆｅａｔｕｒｅｓ）を用いる方法がある。ＢｏＦは、画像等の元データから抽出した特徴ベクトル群をクラスタリングし、クラスタリングに係る各クラスＩＤと出現頻度（ヒストグラム）とを生成する手法である。ＢｏＦを用いる場合の具体例として、特徴抽出部１１は、画像を受け取ると、非特許文献２に示されるＨＯＧ（Ｈｉｓｔｏｇｒａｍｓ　ｏｆ　Ｏｒｉｅｎｔｅｄ　Ｇｒａｄｉｅｎｔｓ）又は非特許文献３に示されるＳＩＦＴ（Ｓｃａｌｅｄ　Ｉｎｖａｒｉａｎｃｅ　Ｆｅａｔｕｒｅ　Ｔｒａｎｓｆｏｒｍ）を特徴ベクトル１０１として出力する。その後、データ分布計算部１２は、ＢｏＦを用いてｘにクラスＩＤを設定し、ｐ（ｘ）に当該クラスＩＤに対応するクラスの出現頻度を設定して、特徴データ分布１０２として（ｘ，ｐ（ｘ））を出力する。

［非特許文献１］
　Ｃｓｕｒｋａ，　Ｇ．，　Ｄａｎｃｅ，　Ｃ．Ｒ．，　Ｆａｎ，　Ｌ．，　Ｗｉｌｌａｍｏｗｓｋｉ，　Ｊ．　ａｎｄ　Ｂｒａｙ，　Ｃ．：　Ｖｉｓｕａｌ　Ｃａｔｅｇｏｒｉｚａｔｉｏｎ　ｗｉｔｈ　Ｂａｇｓ　ｏｆ　Ｋｅｙｐｏｉｎｔｓ，　ＥＣＣＶ（Ｅｕｒｏｐｅａｎ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ）　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｗｏｒｋｓｈｏｐ　ｏｎ　Ｓｔａｔｉｓｔｉｃａｌ　Ｌｅａｒｎｉｎｇ　ｉｎ　Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ，　ｐｐ．　１－２２　（２００４）．
［非特許文献２］
　Ｄａｌａｌ，　Ｎ．　ａｎｄ　Ｔｒｉｇｇｓ，　Ｂ．　：　Ｈｉｓｔｏｇｒａｍｓ　ｏｆ　Ｏｒｉｅｎｔｅｄ　Ｇｒａｄｉｅｎｔｓ　ｆｏｒ　Ｈｕｍａｎ　Ｄｅｔｅｃｔｉｏｎ，　２００５　ＩＥＥＥ（Ｉｎｓｔｉｔｕｔｅ　ｏｆ　Ｅｌｅｃｔｒｉｃａｌ　ａｎｄ　Ｅｌｅｃｔｒｏｎｉｃｓ　Ｅｎｇｉｎｅｅｒｓ）　Ｃｏｍｐｕｔｅｒ　Ｓｏｃｉｅｔｙ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ　ａｎｄ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ　（ＣＶＰＲ’０５），　ｖｏｌ．　１，　ｐｐ．　８８６－８９３，　ｄｏｉ：　１０．１１０９／ＣＶＰＲ．２００５．１７７　（２００５）．
［非特許文献３］
　Ｌｏｗｅ，　Ｄ．Ｇ．：　Ｄｉｓｔｉｎｃｔｉｖｅ　Ｉｍａｇｅ　Ｆｅａｔｕｒｅｓ　ｆｒｏｍ　Ｓｃａｌｅ－Ｉｎｖａｒｉａｎｔ　Ｋｅｙｐｏｉｎｔｓ，　Ｉｎｔ．　Ｊ．　Ｃｏｍｐｕｔ．　Ｖｉｓｉｏｎ，　Ｖｏｌ．６０，　Ｎｏ．２，　ｐｐ．９１－１１０　（２００４）．

＜変形例２＞
　転移元データ候補２がセンサ等から取得した多次元時系列データである場合、特徴抽出部１１は、具体例として、複数のサンプリングデータを時系列順に入力し、主成分分析により各サンプリングデータを要約（次元削減）した値を特徴ベクトル１０１Ｓとする。
　本変形例において、データ分布計算部１２は、特徴ベクトル１０１Ｓを時系列順に結合することにより特徴データ分布１０２Ｓを生成してもよい。なお、当該特徴データ分布１０２Ｓは極値が算出可能なデータ分布であるものとする。

＜変形例３＞
　図１０は、本変形例に係る類似度算出装置１のハードウェア構成例を示している。
　類似度算出装置１は、本図に示すように、プロセッサ５１とメモリ５２と補助記憶装置５３との少なくとも１つに代えて、処理回路５８を備える。
　処理回路５８は、類似度算出装置１が備える各部の少なくとも一部を実現するハードウェアである。
　処理回路５８は、専用のハードウェアであってもよく、また、メモリ５２に格納されるプログラムを実行するプロセッサであってもよい。

　処理回路５８が専用のハードウェアである場合、処理回路５８は、具体例として、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（ＡＳＩＣはＡｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）又はこれらの組み合わせである。
　類似度算出装置１は、処理回路５８を代替する複数の処理回路を備えてもよい。複数の処理回路は、処理回路５８の役割を分担する。

　類似度算出装置１において、一部の機能が専用のハードウェアによって実現されて、残りの機能がソフトウェア又はファームウェアによって実現されてもよい。

　処理回路５８は、具体例として、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせにより実現される。
　プロセッサ５１とメモリ５２と補助記憶装置５３と処理回路５８とを、総称して「プロセッシングサーキットリー」という。つまり、類似度算出装置１の各機能構成要素の機能は、プロセッシングサーキットリーにより実現される。
　他の実施の形態に係る類似度算出装置１についても、本変形例と同様の構成であってもよい。

　実施の形態２．
　以下、主に前述した実施の形態と異なる点について、図面を参照しながら説明する。
　本実施の形態の概要を説明する。本実施の形態に係る類似度算出装置１は、学習モデルを作成する際に、特徴データ分布１０２Ｓの極小値及び特徴データ分布１０２Ｔの極大値、又は、特徴データ分布１０２Ｓの極大値及び特徴データ分布１０２Ｔの極小値が誤ってマッチングすることを防ぐことを目的として極値を表現する座標系を変換する。これにより、学習モデルが極大値と極小値とを識別しやすくなる。

　図１１は、極値を表現する座標系を変換するイメージの具体例を示している。本図の（ａ）は座標系を変換する前のイメージを示しており、（ｂ）は、（ａ）に示される極値を高次元空間に射影することにより、極値の座標系を変換した後のイメージを示している。なお、当該高次元空間の次元数は３に限られない。（ｂ）の極大集合は（ａ）に示される極大値が射影された点の集合を示し、極小集合は（ａ）に示される極小値が射影された点の集合を示す。（ａ）における誤マッチングは、転移先データ分布Ｄ１の１つの極小値と転移元データ分布Ｄ３の１つの極大値とが近接していることを示す。誤マッチングに係る極小値と極大値とは、（ｂ）において分離超平面を境界にして明確に分離している。

＊＊＊構成の説明＊＊＊
　図１２は、本実施の形態に係る類似度算出装置１の構成例を示している。類似度算出装置１は、本図に示すように、実施の形態１に係る類似度算出装置１が備える構成要素に加え、座標変換部２１を備える。

　座標変換部２１は、極値データ１０３Ｓを用いて変換座標群Ｃ^ｓを生成し、生成した変換座標群Ｃ^ｓを含む変換極値データ１０７Ｓを出力する。変換極値データ１０７Ｓは、変換座標群Ｃ^ｓと、データＩＤ^ｓと、極値の数Ｅ^ｓとを含み、転移元変換座標群とも呼ばれる。変換座標群Ｃ^ｓは、極値座標群Ｇ^ｓが含む各座標の座標系を変換した座標から成る集合である。極値座標群Ｇ^ｓが含む各座標は変換前転移元極値とも呼ばれる。座標変換部２１は、転移元極値として、変換前転移元極値の次元よりも次元が高い空間に変換前転移元極値を射影した座標を求める。変換座標群Ｃ^ｓは極値座標群Ｇ^ｓの下位概念でもある。変換座標群Ｃ^ｓが含む各座標は転移元極値でもある。
　また、座標変換部２１は、極値データ１０３Ｔを用いて変換座標群Ｃ^ｔを生成し、変換した変換座標群Ｃ^ｔを含む変換極値データ１０７Ｔを出力する。変換極値データ１０７Ｔは、変換座標群Ｃ^ｔと、極値の数Ｅ^ｔとを含み、転移先変換座標群とも呼ばれる。変換座標群Ｃ^ｔは、極値座標群Ｇ^ｔが含む各座標の座標系を変換した座標から成る集合である。極値座標群Ｇ^ｔが含む各座標は変換前転移先極値とも呼ばれる。座標変換部２１は、転移先極値として、変換前転移先極値の次元よりも次元が高い空間に変換前転移先極値を射影した座標を求める。変換座標群Ｃ^ｔは極値座標群Ｇ^ｔの下位概念でもある。変換座標群Ｃ^ｔが含む各座標は転移先極値でもある。

　変換座標群Ｃ^ｓが含む各座標は、［数５］のように定義される。［数５］は変換座標群Ｃ^ｓの具体例でもある。座標変換部２１は、本例において、極値座標群Ｇ^ｓが含む各極大値を１に変換し、極値座標群Ｇ^ｓが含む各極小値を－１に変換し、変換した座標を極値座標群Ｇ^ｓが含む各座標に追加することによって変換座標群Ｃ^ｓを得る。また、本例において変換座標群Ｃ^ｓが含む各極値は（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ，ｚ_ｉ）と表される。変換座標群Ｃ^ｔが含む各座標は、［数５］と同様に定義される。

＊＊＊動作の説明＊＊＊
　実施の形態１に係る類似度算出装置１の動作との差異を主に説明する。

＜学習フェーズ＞
　図１３は、類似度算出装置１の学習フェーズにおける動作の一例を示すフローチャートである。図１２及び本図を用いて学習フェーズを説明する。

（ステップＳ２０１：座標変換処理）
　座標変換部２１は、極値データ１０３Ｓを入力として受け取り、受け取った極値データ１０３Ｓを用いて変換極値データ１０７Ｓを生成し、生成した変換極値データ１０７Ｓを出力する。

（ステップＳ１０４：グルーピング処理）
　本ステップの処理は、実施の形態１の学習フェーズに係るグルーピング処理における極値データ１０３Ｓを変換極値データ１０７Ｓに読み替えた処理である。

＜推論フェーズ＞
　図１４は、類似度算出装置１の推論フェーズにおける動作の一例を示すフローチャートである。図１２及び本図を用いて推論フェーズを説明する。

（ステップＳ２１１：座標変換処理）
　座標変換部２１は、極値データ１０３Ｔを入力として受け取り、受け取った極値データ１０３Ｔを用いて変換極値データ１０７Ｔを生成し、生成した変換極値データ１０７Ｔを出力する。

（ステップＳ１１４：モデル決定処理）
　本ステップの処理は、実施の形態１の推論フェーズに係るモデル決定処理における極値データ１０３Ｔを変換極値データ１０７Ｔに読み替えた処理である。

＊＊＊実施の形態２の効果の説明＊＊＊
　以上のように、本実施の形態に係る類似度算出装置１は、具体例として、特徴データ分布１０２の各極値に対して、各極値が極大値と極小値とのいずれであるかを表すパラメータｚを導入して各極値の座標系を変換することにより、極大値の集合と極小値の集合との間の距離を離す。そのため、本実施の形態に係る類似度算出装置１によれば、転移先の極大値と転移元の極小値、あるいは転移先の極小値と転移元の極大値が誤ってマッチングされるリスクが下がる。
　従って、本実施の形態に係る類似度算出装置１によれば、実施の形態１に係る類似度算出装置１と比較してより高い精度の類似度を求めることができる。

＊＊＊他の構成＊＊＊
＜変形例４＞
　変換座標群Ｃ^ｓの各座標は、［数６］に示すように、ｘ_ｉ ^ｓとｙ_ｉ ^ｓとのそれぞれにｚ_ｉを乗算した形式でもよい。

　［数５］に示すように座標系を変換した場合においても、極大値及び極小値が３次元ユークリッド空間座標系（Ｒ^３）におけるユークリッド距離が少なくとも２の距離をもって配置されることが保証される。
　本変形例では、座標系の変換後において極大値及び極小値がさらに大きい距離をもって配置されやすくするために、ｘ及びｙそれぞれにｚを乗算する。極大値（ｘ_ｉ ^ｓ，ｙ_ｉ ^ｓ）と極小値（ｘ_ｊ ^ｓ，ｙ_ｊ ^ｓ）とが与えられた場合において、座標系の変換後における両者間の距離は［数７］が示す通りになる。

　［数７］について考える。特徴データ分布１０２の変数ｘが［０，１］により正規化されている場合、ｘ≧０である。ｙはヒストグラムであるのでｙ≧０である。よって、ｘ_ｉ ^ｓ－ｘ_ｊ ^ｓ＜ｘ_ｉ ^ｓ＋ｘ_ｊ ^ｓ及びｙ_ｉ ^ｓ－ｙ_ｊ ^ｓ＜ｙ_ｉ ^ｓ＋ｙ_ｊ ^ｓが成り立つ。そのため、極大値及び極小値が少しでも離れていれば、変換後の極大値及び極小値が少なくとも２より離れやすくなることが保証される。
　よって、推論にＳＶＭ（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）のようなアルゴリズムを用いる場合、分離超平面により、極大値と極小値とを識別しやすくなる。
　従って、本変形例によれば、特徴データ分布１０２Ｔの極大値を入力したときに特徴データ分布１０２Ｓの極小値が誤って推論される確率と、特徴データ分布１０２Ｔの極小値を入力したときに特徴データ分布１０２Ｓの極大値が誤って推論される確率とを下げることができる。

　実施の形態３．
　以下、主に前述した実施の形態と異なる点について、図面を参照しながら説明する。
　実施の形態１と本実施の形態との主な差異は、類似度算出の対象となる転移元データ候補２の範囲を広げるために、モデル作成部１６が許容範囲内の極値の数それぞれに対応するデータセット１０５を用いる点である。当該許容範囲はデータセット許容範囲とも呼ばれる。データセット許容範囲は、データセット１０５それぞれに対応する転移元極値の数の周囲の範囲を示す。

　図１５は、モデル作成部１６がモデルを作成する際、許容範囲内の極値の数それぞれに対応するデータセット１０５をモデル作成部１６が選択するイメージの具体例を示している。モデル作成部１６は、データセット１０５に対応する極値の数を基準としてデータセット１０５を選択する。なお、説明の便宜上本図は特徴データ分布１０２に基づいて学習モデルが決定される様子を示しているが、実際には、特徴データ分布１０２Ｔに対応する極値データ１０３Ｔと、特徴データ分布１０２Ｓそれぞれに対応するデータセット１０５とに基づいて学習モデルは決定される。
　本図において、転移先データ分布Ｄ１の極値の数は４であり、転移元データ分布Ｄ２の極値の数は３であり、転移元データ分布Ｄ３の極値の数は５である。（ａ）は許容範囲を考慮せずにモデル作成部１６がデータセット１０５を選択するイメージを示している。（ａ）において転移先データ分布Ｄ１の極値の数と同じ極値の数を有する転移元データ分布がないので、モデル作成部１６はデータセット１０５を選択することができない。一方、（ｂ）は許容範囲を考慮してモデル作成部１６がデータセット１０５を選択するイメージを示している。モデル作成部１６は±１の範囲において極値の数を許容する。転移元データ分布Ｄ２の極値の数及び転移元データ分布Ｄ３の極値の数は共に転移先データ分布Ｄ１の極値の数±１の範囲内であるため、モデル作成部１６は転移元データ分布Ｄ２及び転移元データ分布Ｄ３それぞれに対応するデータセット１０５を選択する。

＊＊＊構成の説明＊＊＊
　図１６は、本実施の形態に係る類似度算出装置１の構成例を示している。本実施の形態に係る類似度算出装置１の実施の形態１に係る類似度算出装置１に対する主な差異は、モデル作成部１６が、データセット１０５の代わりにデータセット群１１１を受け取る点である。データセット群１１１は、複数のデータセット１０５から成る集合である。モデル作成部１６は、複数のデータセット１０５を受け取り、受け取った複数のデータセット１０５を用いてデータセット群１１１を生成してもよい。

　データセット群１１１は、具体例としてデータセット群１１１－（ｎ±ｂ）である。データセット群１１１－（ｎ±ｂ）は、ｎ－ｂからｎ＋ｂまでの範囲内の極値の数それぞれに対応するデータセット１０５から成る集合である。ここで、ｂは許容範囲に対応するパラメータであり、ｂ≧０かつｂ∈Ｚである。なお、ｎ－ｂからｎ＋ｂまでの範囲内のいずれか１つ以上の極値の数に対応するデータセット１０５はなくてもよい。

　［数８］は、データセット群１１１－（ｎ±ｂ）の具体例を示している。各記号の意味は、［数２］と同様である。なお、データセット群１１１－（ｎ±ｂ）を集合ｇ_ｎ±ｂと表現している。
　データセット群１１１は、データセット許容範囲内の極値の数それぞれに対応する転移元極値を含み、また、データセット１０５の下位概念でもある。データセット群１１１－（ｎ±ｂ）において、データセット１０５に対応する転移元極値の数はｎであり、データセット許容範囲はｎ－ｂからｎ＋ｂまでである。

　モデル作成部１６は、データセット１０５－ｎの代わりにデータセット群１１１をデータセット記憶部１５から取得し、取得したにデータセット群１１１を用いて分類器１０６を作成する。モデル作成部１６は、具体例として、データセット群１１１－（ｎ±ｂ）を用いて分類器１０６－ｎを作成する。

＊＊＊動作の説明＊＊＊
　本実施の形態に係る類似度算出装置１の動作を示すフローチャートは、実施の形態１に係る類似度算出装置１の動作を示すフローチャートと同じである。以下、実施の形態１に係る類似度算出装置１の動作との差異を主に説明する。

＜学習フェーズ＞
（ステップＳ１０５：モデル作成処理）
　本処理は、実施の形態１の学習フェーズに係るモデル作成処理におけるデータセット１０５をデータセット群１１１－（ｎ±ｂ）に読み替えた処理である。即ち、モデル作成部１６は、分類器１０６－ｎを作成する際にデータセット群１１１－（ｎ±ｂ）を用いる。

　以降の処理は実施の形態１と同様である。なお、モデル作成部１６は、データセット群１１１－（ｎ±ｂ）を用いて学習した学習モデルを、分類器１０６－ｎとして分類器記憶部１７に保存する。

　なお、訓練データをデータセット群１１１－（ｎ±ｂ）とした場合、分類器１０６－（ｎ－ｂ）から分類器１０６－（ｎ＋ｂ）までの学習において同じ極値座標群Ｇ^ｓ｛（ｘ_ｉ ^ｓ１，ｙ_ｉ ^ｓ１）｝（但し、｜（ｘ_ｉ ^ｓ１，ｙ_ｉ ^ｓ１）｜＝ｎ、ｉ＝１，…，ｎ、ｓ１∈Ｓ）が使われる。そのため、｛（ｘ_ｉ ^ｓ１，ｙ_ｉ ^ｓ１）｝と｛（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）｝との類似度が高い場合、｛（ｘ_ｉ ^ｓ１，ｙ_ｉ ^ｓ１）｝を用いて生成されたいずれの分類器１０６においても、｛（ｘ_ｉ ^ｔ，ｙ_ｉ ^ｔ）｝に対応するクラス所属確率であって、ｓ１に対応するクラスへのクラス所属確率が高くなる。その結果、ｓ１に対応するクラスをｃ_１としたとき、類似度ｓｃｏｒｅ（ｃ_１）の値が高くなる。そのため、学習モデルの学習に使用する訓練データを選定する基準である極値の数に許容範囲を設けても、転移先データ３の各極値を適切に分類することができるものと考えられる。

＊＊＊実施の形態３の効果の説明＊＊＊
　以上のように、本実施の形態に係る類似度算出装置１は、類似度の算出に用いられる学習モデルの学習に使用する訓練データを選定する基準である極値の数に対してデータセット許容範囲を設ける。具体例として、類似度算出装置１は、パラメータｂを導入することよって類似度算出の対象となる転移元データ候補２の候補範囲を広げる。
　そのため、類似度算出装置１は、極値の数は異なるものの特徴データ分布１０２Ｓと特徴データ分布１０２Ｔとが互いに大局的に類似している場合において、両データ分布の類似性を判定することができる。

　図１７は、特徴データ分布１０２Ｓと特徴データ分布１０２Ｔとが大局的に類似している場合における類似度算出装置１の動作を具体的に説明する図である。本図において、転移先データ分布Ｄ１と転移元データ分布Ｄ２とのそれぞれの極値の数は異なるが、ｘの値がいずれであっても両データ分布間でｘの値に対応するｙの値は近接している。即ち、両データ分布は大局的に類似している。また、近傍領域Ｒ５及び近傍領域Ｒ６は転移先データ分布Ｄ１の極値に近接する領域であり、両領域において、転移先データ分布Ｄ１の極値と、転移元データ分布Ｄ２の極値とが近接している。
　類似度算出装置１は、転移先データ分布Ｄ１の極値の近傍に位置する転移元データ分布Ｄ２の極値が多いほど、転移先データ分布Ｄ１に対応するクラスを転移元データ分布Ｄ２に対応するクラスにより高い確率で分類する。

　また、類似度算出装置１は、パラメータｂを用いて類似の度合いを制御することができる。具体例として、類似度算出装置１は、パラメータｂの値が小さいほど完全一致検索に近い動作をし、パラメータｂの値が大きいほどあいまい検索に近い動作をする。

＊＊＊他の構成＊＊＊
＜変形例５＞
　データセット許容範囲には対称性がなくてもよい。具体例として、モデル作成部１６は、分類器１０６－ｎを生成する際に用いるデータセット群１１１として、データセット群１１１－（ｎ±ｂ）の代わりにデータセット群１１１－（ｋ＝ｎ，ｎ＋１，…，ｎ＋ｂ）を用いる。データセット１１１－（ｋ＝ｎ，ｎ＋１，…，ｎ＋ｂ）は、ｎからｎ＋ｂまでの範囲内の極値の数に対応するデータセット１０５である。

＜変形例６＞
　データセット許容範囲は動的に設定されても構わない。
　本変形例の具体例として、データセット１０５として、データセット１０５－１とデータセット１０５－３とデータセット１０５－４のみが求められている場合において、各データセット１０５と、各データセット１０５の両隣それぞれにおいて最も近接している１つずつのデータセット１０５とを選択して各データセット１０５に対応するデータセット群１１１を生成することを考える。このとき、データセット１０５－３を基準とすると、データセット１０５－１とデータセット１０５－４とが最も近接しているデータセット１０５として選択される。このように、モデル作成部１６は、各極値の数に対応するデータセット１０５が存在するか否かを考慮してデータセット１０５を選定してデータセット群１１１を生成してもよい。

　実施の形態４．
　以下、主に前述した実施の形態と異なる点について、図面を参照しながら説明する。
　実施の形態１と本実施の形態との主な差異は、類似度算出の対象となる転移元データ候補２の範囲を広げるために、モデル決定部１８が許容範囲内である極値の数それぞれに対応する分類器１０６を用いる点である。当該許容範囲はモデル許容範囲とも呼ばれる。モデル許容範囲は、転移先極値群が含む転移先極値の数の周囲の範囲を示す。

　図１８は、許容範囲内の極値の数に対応する分類器１０６をモデル作成部１６が選択するイメージの具体例を示している。本図の見方は図１５の見方と同様である。モデル作成部１６は、ある極値の数を基準として少なくとも１つの分類器１０６を選択する。
　本図において、（ａ）は許容範囲を考慮せずにモデル決定部１８が分類器１０６を選択するイメージを示している。（ａ）において、転移先データ分布Ｄ１の極値の数と同じ数の極値の数に対応する分類器１０６がないため、モデル決定部１８は分類器１０６を選択することができない。一方、（ｂ）は許容範囲を考慮してモデル決定部１８が分類器１０６を選択するイメージを示している。（ｂ）において、許容範囲は３以上５以下であり、転移元データ分布Ｄ２及び転移元データ分布Ｄ３それぞれの極値の数は許容範囲内である。そのため、モデル作成部１６は分類器１０６－３及び分類器１０６－５を選択し、特徴データ分布１０２－３に対応する分類器群１１２として、分類器１０６－３と分類器１０６－４と分類器１０６－５とから成る分類器群１１２を生成する。

＊＊＊構成の説明＊＊＊
　図１９は、本実施の形態に係る類似度算出装置１の構成例を示している。本実施の形態に係る類似度算出装置１の実施の形態１に係る類似度算出装置１に対する主な差異は、モデル決定部１８が、分類器１０６－ｍの代わりに分類器群１１２を出力する点である。

　分類器群１１２は、具体例として分類器群１１２－（ｍ±ｄ）である。ここで、ｄは許容範囲に対応するパラメータであり、ｄ≧０かつｄ∈Ｚである。分類器群１１２－（ｍ±ｄ）は、分類器１０６－（ｍ－ｄ）から分類器１０６－（ｍ＋ｄ）までの分類器１０６から成る集合である。なお、ｍ－ｄからｍ＋ｄまで範囲内のいずれか１つ以上の極値の数に対応する分類器１０６はなくてもよい。

　モデル決定部１８は、極値座標群Ｇ^ｔに対応する分類器１０６の代わりに極値座標群Ｇ^ｔに対応する分類器群１１２を生成し、推論データ１０８として、極値座標群Ｇ^ｔと、極値座標群Ｇ^ｔに対応する分類器群１１２とを含むデータを生成する。
　モデル決定部１８は、モデル許容範囲内の転移元極値の数それぞれに対応する学習モデルから成る学習モデル群を決定モデルとして決定する。

　類似度算出部１９は、分類器１０６の代わりに分類器群１１２が含む各分類器１０６を用いて少なくとも１つの特徴データ分布１０２Ｓそれぞれと特徴データ分布１０２Ｔとの類似度を求める。

＜推論フェーズ＞
（ステップＳ１１４：モデル決定処理）
　本処理は実施の形態１の推論フェーズに係るモデル決定処理における分類器１０６－ｍを分類器群１１２－（ｍ±ｄ）に読み替えた処理である。即ち、モデル決定部１８は、分類器１０６－ｍの代わりに分類器群１１２－（ｍ±ｄ）を特定し、特定した分類器群１１２－（ｍ±ｄ）と極値座標群Ｇ^ｔとを含む推論データ１０８を出力する。

（ステップＳ１１５：類似度算出処理）
　類似度算出部１９は、分類器１０６－ｍの代わりに分類器群１１２－（ｍ±ｄ）を用いて類似度を算出する。

　以下、本実施の形態と実施の形態３とを組み合わせた場合における類似度算出処理を具体的に説明する。類似度算出部１９は、クラス所属確率が分類器１０６において重複して出現する可能性があることを考慮し、類似度ｓｃｏｒｅ（ｃ_ｊ）を算出する方法を変更する。分類器１０６－ｋ（ｋ＝ｍ－ｄ，ｍ－ｄ＋１，…，ｍ＋ｄ）を用いた場合における特徴データ分布１０２Ｔのラベルｃ_ｊとの類似度サブスコアｓｃｏｒｅ_ｋ（ｃ_ｊ）を［数９］に示すように定義する。［数９］の記号の説明は、［数４］の記号の説明と同じである。

　類似度算出部１９は、複数の分類器１０６－ｋが同一のラベルに分類することができる場合、当該複数の分類器１０６－ｋそれぞれについて、ｋの値が当該ラベルに対応する極値の数に近いほど重視する。即ち、類似度算出部１９は、ｋの値が当該極値の数に近いサブスコアほど重視して類似度を算出する。

　［数１０］は、類似度ｓｃｏｒｅ（ｃ_ｊ）の具体例を示している。ここで、右辺の上段において、ｋは、ラベルｃ_ｊに分類することができる分類器１０６の中で、類似度算出部１９が最も重視する１つの分類器１０６を特定する変数である。ｋ’は、ｋ以外の値を示し、ラベルｃ_ｊに分類することができる分類器１０６を特定する変数である。ラベルｃ_ｊに分類することができる分類器１０６が分類器１０６－ｋを除いて複数存在する場合に、ｋ’は複数の値から成る。ｆｐ（ｄ）は、具体例として、ｄ＝０で最大となり、かつ、ｄと反比例する値を返す関数である。具体例として、ｆｐ（ｄ）＝１／（１＋ｄ）^２が挙げられる。ここで、ｄはラベルｃ_ｊに対応する極値の数からｋ’の各要素までの距離を示す変数である。なお、ｋ’が複数の値から成る場合に、ｋ’の各要素に対応するｆｐ（ｄ）が用意される。
　具体例として、ラベルｃ_ｊに対応する極値の数がｍであり、かつ、分類器１０６－ｋ（ｋ＝ｍ－ｄ，ｍ－ｄ＋１，…，ｍ＋ｄ）のいずれもラベルｃ_ｊに分類することができる場合を考える。この場合において、ｋ＝ｍであり、ｋ’＝｛ｍ－ｄ，…，ｍ－１，ｍ＋１，…，ｍ＋ｄ｝である。即ち、ｓｃｏｒｅ_ｋ（ｃ_ｊ）は分類器１０６－ｍを用いて求めた類似度であり、ｓｃｏｒｅ_ｋ’（ｃ_ｊ）は分類器１０６－ｍ以外の分類器１０６を用いて求めた類似度を用いて求めた値である。

＊＊＊実施の形態４の効果の説明＊＊＊
　以上のように、本実施の形態に係る類似度算出装置１は、類似度の算出に用いられる学習モデルを選定する基準である極値の数に対してモデル許容範囲を設ける。具体例として、類似度算出装置１は、パラメータｄを導入することによって類似度算出の対象となる転移元データ候補２の範囲を広げる。
　そのため、類似度算出装置１は、実施の形態３に係る類似度算出装置１と同様に、図１７に示すような場合において、両データ分布の類似性を判定することができる。
　また、類似度算出装置１は、パラメータｄを用いて類似の度合いを制御することができる。具体例として、類似度算出装置１は、パラメータｄの値が小さいほど完全一致検索に近い動作をし、パラメータｄの値が大きいほどあいまい検索に近い動作をする。

＊＊＊他の構成＊＊＊
＜変形例７＞
　モデル許容範囲には対称性がなくてもよい。具体例として、モデル決定部１８は、極値の数がｍである特徴データ分布１０２Ｔに対応する分類器群１１２として、分類器群１１２－（ｍ±ｄ）の代わりに分類器群１１２－（ｋ＝ｍ，ｍ＋１，…，ｍ＋ｄ）を決定してもよい。分類器群１１２－（ｋ＝ｍ，ｍ＋１，…，ｍ＋ｄ）は、ｍからｍ＋ｄまでの範囲内の極値の数に対応する分類器１０６から成る分類器群１１２である。

＜変形例８＞
　モデル許容範囲は動的に設定されてもよい。
　本変形例の具体例として、データセット１０５として、データセット１０５－１とデータセット１０５－３とデータセット１０５－４のみが求められている場合において、分類器群１１２として、各データセット１０５に対応する各分類器１０６と、各データセット１０５の両隣それぞれにおいて最も近接している１つずつのデータセット１０５に対応する分類器１０６とを選択する場合を考える。このとき、極値の数として３を基準とすると、分類器１０６－１と分類器１０６－３と分類器１０６－４とが選択される。このように、モデル決定部１８は、各極値の数に対応する分類器１０６が存在するか否かを考慮して分類器１０６を選定してもよい。

＊＊＊他の実施の形態＊＊＊
　前述した各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

　また、実施の形態は、実施の形態１から４で示したものに限定されるものではなく、必要に応じて種々の変更が可能である。フローチャート等を用いて説明した手順は、適宜変更されてもよい。

　１　類似度算出装置、２　転移元データ候補、３　転移先データ、４　決定データ、１１　特徴抽出部、１２　データ分布計算部、１３　極値計算部、１４　グルーピング部、１５　データセット記憶部、１６　モデル作成部、１７　分類器記憶部、１８　モデル決定部、１９　類似度算出部、２０　データ決定部、２１　座標変換部、５１　プロセッサ、５２　メモリ、５３　補助記憶装置、５４　入出力ＩＦ、５５　通信装置、５８　処理回路、５９　信号線、１０１，１０１Ｓ，１０１Ｔ　特徴ベクトル、１０２，１０２Ｓ，１０２Ｔ　特徴データ分布、１０３Ｓ，１０３Ｔ　極値データ、１０４　学習データ、１０５　データセット、１０６　分類器、１０７Ｓ，１０７Ｔ　変換極値データ、１０８　推論データ、１０９　類似度データ、１１１　データセット群、１１２　分類器群、Ｄ１　転移先データ分布、Ｄ２，Ｄ３　転移元データ分布、Ｒ１，Ｒ２，Ｒ３，Ｒ４，Ｒ５，Ｒ６　近傍領域。

Claims

　転移元データ候補と転移先データとを用いて転移学習を行う類似度算出装置であって、
　前記転移元データ候補の特徴量の分布を示す転移元データ分布が有する極値を示す転移元極値を含む転移元極値群と、前記転移先データの特徴量の分布を示す転移先データ分布が有する極値を示す転移先極値を含む転移先極値群とに基づいて、前記転移元データ分布と前記転移先データ分布との類似度を求める類似度算出部を備える類似度算出装置。
　前記転移元データ候補と前記転移元データ分布と前記転移元極値群とのそれぞれは少なくとも１つ存在し、前記転移元データ候補それぞれは前記転移元データ分布それぞれと１対１で対応しており、前記転移元データ分布それぞれは前記転移元極値群それぞれと１対１で対応しており、
　前記類似度算出部は、前記転移元データ分布それぞれに対応する転移元極値群と前記転移先極値群とに基づいて、前記転移元データ分布それぞれと前記転移先データ分布との類似度を求め、
　前記転移元極値それぞれは、前記転移元極値それぞれに対応する極値を有する転移元データ分布に対応する転移元データ候補を識別する識別子と対応付けられており、前記転移元極値それぞれを含む転移元極値群が含む転移元極値の数に応じて、極値の数が示す値ごとに用意されたデータセットの少なくとも１つに属し、
　前記類似度算出装置は、さらに、
　前記データセットそれぞれに対応するモデルであって、与えられた座標群に対応する識別子を推定することに用いられるモデルである学習モデルを作成するモデル作成部と、
　前記学習モデルから、前記転移先極値群が含む転移先極値の数に応じて学習モデルを決定モデルとして決定するモデル決定部と
を備え、
　前記類似度算出部は、前記決定モデルと前記転移先極値群とを用いて前記類似度を求める請求項１に記載の類似度算出装置。
　前記データセットそれぞれは、前記データセットそれぞれに対応する転移元極値の数に対応する転移元極値を含む請求項２に記載の類似度算出装置。
　前記データセットそれぞれは、前記データセットそれぞれに対応する転移元極値の数の周囲の範囲を示すデータセット許容範囲内の極値の数それぞれに対応する転移元極値を含むデータセット群である請求項２に記載の類似度算出装置。
　前記モデル決定部は、前記転移先極値群が含む転移先極値の数の周囲の範囲を示すモデル許容範囲内の転移元極値の数それぞれに対応する学習モデルから成る学習モデル群を決定モデルとして決定する請求項２から４のいずれか１項に記載の類似度算出装置。
　前記類似度算出装置は、さらに、
　前記転移元極値として、前記転移元データ分布それぞれが有する極値である変換前転移元極値の次元よりも次元が高い空間に前記変換前転移元極値を射影した座標を求め、
　前記転移先極値として、前記転移先データ分布が有する極値である変換前転移先極値の次元よりも次元が高い空間に前記変換前転移先極値を射影した座標を求める座標変換部を備える請求項１から５のいずれか１項に記載の類似度算出装置。
　前記類似度算出装置は、さらに、
　決定条件を満たす類似度に対応する転移元データ候補を転移元データと決定するデータ決定部を備える請求項１から６のいずれか１項に記載の類似度算出装置。
　前記類似度算出装置は、さらに、
　前記転移元データ分布と前記転移先データ分布とを受け取り、前記転移元データ分布を用いて前記転移元データ分布が有する極値を求め、前記転移先データ分布を用いて前記転移先データ分布が有する極値を求める極値計算部を備える請求項１から７のいずれか１項に記載の類似度算出装置。
　転移元データ候補と転移先データとを用いて転移学習を行う類似度算出方法であって、
　類似度算出部が、前記転移元データ候補の特徴量の分布を示す転移元データ分布が有する極値を示す転移元極値を含む転移元極値群と、前記転移先データの特徴量の分布を示す転移先データ分布が有する極値を示す転移先極値を含む転移先極値群とに基づいて、前記転移元データ分布と前記転移先データ分布との類似度を求める類似度算出方法。
　コンピュータに転移元データ候補と転移先データとを用いて転移学習を行わせる類似度算出プログラムであって、
　前記コンピュータに、
　前記転移元データ候補の特徴量の分布を示す転移元データ分布が有する極値を示す転移元極値を含む転移元極値群と、前記転移先データの特徴量の分布を示す転移先データ分布が有する極値を示す転移先極値を含む転移先極値群とに基づいて、前記転移元データ分布と前記転移先データ分布との類似度を求めさせる類似度算出プログラム。