WO2024009442A1

WO2024009442A1 - 判定装置、判定方法、および、判定プログラム

Info

Publication number: WO2024009442A1
Application number: PCT/JP2022/026885
Authority: WO
Inventors: 美尋内田
Original assignee: 日本電信電話株式会社
Priority date: 2022-07-06
Filing date: 2022-07-06
Publication date: 2024-01-11

Abstract

判定装置は、認識対象とする物体の画像を学習データとして用いて、入力データを低次元のデータに変換し、低次元のデータに変換したデータを超球体等の多様体上に埋め込み、多様体上からサンプリングして復号したデータが、学習データのようになるように学習する。ここで、判定装置は、データ識別部に、入力されたデータが復号データであると見破られないように、上記の学習を行う。学習後、判定装置は、入力データの画像とその復号データの画像との誤差が所定の閾値よりも大きい場合、入力データは、認識対象の画像のデータではないと判定する。

Description

判定装置、判定方法、および、判定プログラム

　本発明は、入力データが認識対象の画像のデータか否かを判定するための、判定装置、判定方法、および、判定プログラムに関する。

　画像認識等において、入力されたデータが認識対象の画像のデータか否かを判定することが重要である。例えば、人間の表情の認識を行う認識器に、人間以外の動物の画像のデータが入力された場合、誤った認識結果を出力してしまうおそれがある。

　例えば、図１に示すように、入力データの顔部分の表情認識の結果を用いて会議の解析を行うシステムを考える。このシステムに、本来、表情認識の対象ではない犬の顔の画像が入力されると、システムは、犬の顔の画像に表情認識を行い「参加者はポジティブな感情なので、今はいい会議です」という認識結果を出力してしまう。犬は会議の参加者ではないため、上記の出力は意味のない出力となる。

　ここで、従来、入力データが認識対象の画像のデータか否かの判定を行うため、オートエンコーダ（自己符号化器）を用いる技術が提案されている。オートエンコーダは、ニューラルネットワークを使用した次元圧縮のためのアルゴリズムである。

　オートエンコーダが学習した対象物の画像は低次元のデータ空間から復号できる一方で、学習していない対象物の画像は低次元のデータ空間から復号できないと仮定すると、オートエンコーダを認識対象の画像のデータのみで学習すれば、オートエンコーダは認識対象外の画像のデータは復号できないはずである。

　例えば、図２に示す、認識対象外の画像も表現できる28×28次元のデータ空間（ピクセル空間）と、認識対象の画像のみを表現できる低次元のデータ空間（潜在空間）とを考える。この場合、オートエンコーダが学習した対象物（認識対象の物体）の画像は低次元のデータ空間から復号できる一方で、オートエンコーダが学習しなかった対象物（認識対象外の物体）の画像は低次元のデータ空間から復号できない。

　よって、オートエンコーダに認識対象の物体の画像の学習を行うことで、入力データが認識対象の画像のデータか否かを判定できると考えられる。

Paul　Bergmann,　et　al.,　"　MVTec　AD　A　Comprehensive　Real-World　Dataset　for　Unsupervised　Anomaly　Detection",　Proceedings　of　the　IEEE/CVF　conference　on　computer　vision　and　pattern　recognition.　2019. Goodfellow,　Ian,　et　al.,　"Generative　Adversarial　Nets",　Advances　in　neural　information　processing　systems　27　(2014). Yutong　Zheng,　et　al.,　"Ring　loss:　Convex　Feature　Normalization　for　Face　Recognition",　Proceedings　of　the　IEEE　conference　on　computer　vision　and　pattern　recognition.　2018.

　しかし、上記の従来技術は、「現実世界のデータは当該データ空間よりも低次元のデータ空間で表せる」という多様体仮説に基づいて上記の判定を試みている。言い換えれば、認識対象の画像のデータを必要最低限の次元数で表すことができれば、上記の判定を行うことができるはずである。しかし、認識対象の画像のデータを表すための必要最低限の次元数を見つけることは困難である。そのため、入力データが認識対象の画像のデータか否かの判定精度が低くなってしまうという問題があった。

　そこで、前記した問題を解決し、入力データが認識対象の画像のデータか否かの判定精度を向上させることを課題とする。

　前記した課題を解決するため、本発明は、入力データを前記入力データよりも低次元のデータに変換する符号化部と、前記符号化部により変換されたデータを多様体上に埋め込む埋め込み部と、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する復号部とを有するオートエンコーダと、認識対象とする物体の画像を学習データとして用いて、前記復号部により復号されたデータが前記データの元になった入力データに近づき、かつ、入力されたデータが前記復号されたデータか否かを識別するデータ識別部に、前記入力されたデータが復号されたデータであると識別されないように、前記符号化部および前記復号部の学習を行う学習部と、学習後の前記符号化部により変換された後、前記多様体埋め込み部により多様体上に埋め込まれ、学習後の前記復号部により復号されたデータの画像と、前記データの元となった入力データの画像との誤差を評価する誤差評価部と、評価した前記誤差が所定の閾値よりも大きい場合、前記入力データは、前記認識対象の画像のデータではないと判定する判定処理部と、前記判定結果を出力する出力処理部と、を備えることを特徴とする。

　本発明によれば、入力データが認識対象の画像のデータか否かの判定精度を向上させることができる。

図１は、表情認識を活用した会議解析システムの例を示す図である。図２は、データ空間（ピクセル空間）と、低次元のデータ空間（潜在空間）の例を説明する図である。図３は、オートエンコーダの入力データとその復号データの例を示す図である。図４は、判定装置の構成例を示す図である。図５は、判定装置の学習時の処理手順の例を示す図である。図６は、判定装置の判定時の処理手順の例を示す図である。図７は、比較例と判定装置の判定精度をAUROCで評価した結果を示す図である。図８は、プログラムを実行するコンピュータを示す図である。

　以下、図面を参照しながら、本発明を実施するための形態（実施形態）について説明する。本発明は、本実施形態に限定されない。

　まず、図３を用いて、オートエンコーダに、入力データの画像の認識（例えば、入力データの画像のカテゴリラベルの予測）機能を付加した技術の問題点を説明する。例えば、従来技術では認識対象（例えば、人物の顔）の画像で学習を行っても、認識対象外（例えば、犬の顔）の画像も比較的精度よく復号できてしまうことがある。例えば、オートエンコーダが人物の顔の画像で学習を行った場合、図３に示すように、犬の顔の画像も比較的精度よく復号できてしまうことがある。その結果、従来技術では、入力データが認識対象の画像のデータか否かを精度よく判定できないという問題があった。

　このような問題が発生する原因としては、認識対象のデータを表すための必要最低限の次元数を見つけることが困難であるという問題がある。

　この問題を解決するため、本実施形態の判定装置は、入力データを符号化したデータを多様体上に埋め込み、その多様体上からサンプリングしたデータを復号する。ここで、判定装置が、多様体からサンプリングしても認識対象外の画像のデータが復号できてしまう可能性もある。

　そこで、判定装置は、認識対象の画像のデータを用いて以下のような学習を行う。例えば、判定装置は、入力されたデータが、復号データか元のデータかを精度よく識別するようデータ識別部を学習する。また、判定装置は、多様体からサンプリングしたデータから生成した復号データが、上記のデータ識別部により復号データであると識別されないよう学習する。

　これにより、判定装置は、認識対象の画像のデータに関し、多様体からサンプリングしたデータから元のデータにそっくりな復号データを生成することができる。その結果、認識対象外の画像のデータの復号誤差（元のデータと復号データとの誤差）は、認識対象の画像のデータの復号誤差よりも大きくなる。したがって、判定装置は、入力データが認識対象の画像のデータか否かを精度よく判定することができる。

［構成例］
　次に、図４を用いて、判定装置１０の構成例を説明する。判定装置１０は、入力データが認識対象のデータか否かの判定を行う。判定装置１０は、入出力部１１、記憶部１２および制御部１３を備える。

［入出力部］
　入出力部１１は、判定装置１０が各種情報の入力を受け付けたり、出力したりする際のインタフェースを司る。例えば、入出力部１１は、制御部１３の学習データ（認識対象の物体の画像のデータ）、制御部１３の判定対象のデータ等の入力を受け付ける。また、入出力部１１は、制御部１３による処理結果を出力する。例えば、入出力部１１は、制御部１３における判定の結果（入力データが認識対象の画像のデータか否かの判定結果）を出力する。

［記憶部］
　記憶部１２は、制御部１３が動作する際に用いる各種情報やプログラム、制御部１３が動作した結果得られた各種情報を記憶する。ここで、記憶部１２は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置等である。

　記憶部１２は、例えば、入出力部１１経由で入力された学習データを記憶する。また、記憶部１２は、例えば、制御部１３により学習された符号化部１３１および復号部１３３のパラメータ等を記憶する。

［制御部］
　制御部１３は、判定装置１０全体の制御を司る。制御部１３は、オートエンコーダ１３０、データ識別部１３４、学習部１３５、誤差評価部１３６、判定処理部１３７、および、出力処理部１３８を備える。上記の各部の機能は、例えば、判定装置１０のＣＰＵが、判定装置１０の記憶部に記憶されるプログラムを実行することにより実現される。

［オートエンコーダ］
　オートエンコーダ１３０は、入力データの符号化を行った後、符号化したデータを多様体上に埋め込み、多様体上からサンプリングしたデータを復号する。このオートエンコーダ１３０は、符号化部１３１、多様体埋め込み部１３２、および、復号部１３３を備える。

［符号化部］
　符号化部１３１は、入力データの符号化を行う。例えば、符号化部１３１は、入力データを当該入力データよりも低次元のデータに変換する。この符号化部１３１は、復号部１３３により出力される復号データが、当該復号データの元になったデータ（元のデータ）に一致するように学習部１３５により学習される。また、符号化部１３１は、データ識別部１３４に、復号部１３３から出力されるデータが復号データであると識別されないように、学習部１３５により学習される。

［多様体埋め込み部］
　多様体埋め込み部１３２は、符号化部１３１により変換されたデータ（低次元のデータ）を多様体上に埋め込む。例えば、多様体埋め込み部１３２は、符号化部１３１から学習データの低次元のデータを受け取ると、当該データを多様体上に埋め込む。この多様体は、例えば、超球面である。

　なお、多様体埋め込み部１３２は、学習等により符号化部１３１に装備されてもよい。例えば、上記の多様体埋め込み部１３２が装備された符号化部１３１により、データを超球面に埋め込む場合、非特許文献３に記載の技術を用いて、符号化部１３１の出力のL2ノルムが超球面の半径Rになるようにする。

　この場合、例えば、学習部１３５は、以下の式（１）に示す損失L_ringができるだけ小さくなるよう符号化部１３１を学習する。なお、xは符号化部１３１に入力されるデータであり、f（x）は符号化部１３１により出力されるデータ（特徴ベクトル）である。

　また、符号化部１３１は、符号化部１３１の出力のL2ノルムが、半径Rになるように正規化してもよい。この場合、符号化部１３１は、以下の式（２）に基づき、特徴ベクトルの長さ（||f（x）||）が半径Rと一致するように正規化する。

［復号部］
　復号部１３３は、低次元のデータを元の次元のデータに復号する。例えば、復号部１３３は、符号化部１３１により低次元のデータに変換された後、多様体埋め込み部１３２より多様体上に埋め込まれたデータを元の次元のデータに復号する。

　復号部１３３は、復号データが、当該復号データの元データに一致するように学習部１３５により学習される。また、復号部１３３は、復号部１３３から出力されるデータがデータ識別部１３４により復号データであると識別されないように学習部１３５により学習される。

　なお、復号部１３３は、当該復号部１３３の学習の過程において、符号化部１３１により出力され、多様体埋め込み部１３２に多様体に埋め込まれたデータだけでなく、多様体上のランダムな座標（例えば、図５に示す追加座標）のデータも復号する。

［データ識別部］
　データ識別部１３４は、入力されたデータが、復号部１３３により出力されたデータ（復号データ）か否かを識別する。このデータ識別部１３４は、入力されたデータが復号データか否かを精度よく識別するように、学習部１３５により学習される。例えば、復号部１３３により出力された復号データとその元データとを学習データとして用いて、データ識別部１３４が入力されたデータが復号データか否かを精度よく識別するよう学習される。

［学習部］
　学習部１３５は、認識対象とする物体の画像を学習データとして用いて、符号化部１３１および復号部１３３の学習を行う。例えば、学習部１３５は、復号部１３３が復号したデータが当該データの元になった入力データ（元データ）に近づくように、符号化部１３１および復号部１３３の学習を行う。

　また、学習部１３５は、データ識別部１３４を用いた符号化部１３１および復号部１３３の学習も行う。例えば、学習部１３５は、データ識別部１３４に対し、復号部１３３から出力されるデータが復号データか否かを精度よく識別するように学習を行う。また、学習部１３５は、符号化部１３１および復号部１３３に対し、復号部１３３から出力されるデータが復号データであるとデータ識別部１３４に識別されないように学習を行う。

　学習部１３５は、例えば、以下のようにして、データ識別部１３４、符号化部１３１および復号部１３３を学習する。

・データ識別部１３４：復号データか元データかを識別するための損失項（L_disc）をできるだけ小さくするよう学習する。

・符号化部１３１：復号データを元データに近づけ(L_recon)、かつ、低次元データを多様体上に埋め込み(L_manifold)、かつ、データ識別部１３４をだます(-L_disc)ため、以下の式（３）の損失関数L_encをできるだけ小さくするよう学習する。

・復号部１３３：復号データを元データに近づけ(L_recon)、データ識別部１３４をだます(-L_disc)よう、以下の式（４）の損失関数L_decをできるだけ小さくするよう学習する。

　学習部１３５は、例えば、上記のデータ識別部１３４の学習と、符号化部１３１および復号部１３３の学習とを交互に実行する。

　学習部１３５が、上記の学習を行うことにより、復号部１３３は、認識対象の物体の画像のデータについて、元データとそっくりな復号データを生成するようになる。

［誤差評価部］
　誤差評価部１３６は、復号部１３３により復号されたデータ（復号データ）の画像と、当該データの元となった入力データ（元データ）の画像との誤差を評価する。例えば、誤差評価部１３６は、復号データの画像と元データの画像との平均二乗誤差を算出する。

［判定処理部］
　判定処理部１３７は、誤差評価部１３６により評価された、復号データの画像と元データの画像との誤差が所定の閾値よりも大きいか否かを判定する。そして、判定処理部１３７が、上記の誤差が所定の閾値よりも大きいと判定した場合、元データ（入力データ）は、認識対象の画像のデータではないと判定する。一方、判定処理部１３７が、上記の誤差が所定の閾値以下であると判定した場合、入力データは、認識対象の画像のデータであると判定する。

［出力処理部］
　出力処理部１３８は、判定処理部１３７による入力データが認識対象の画像のデータか否かの判定の結果を出力する。

　このような判定装置１０によれば、入力データが認識対象の画像のデータか否かを精度よく判定することができる。

［処理手順の例］
［学習時における処理手順の例］
　次に、図５を用いて判定装置１０の学習時における処理手順の例を説明する。学習データは、例えば、認識対象とする物体の画像のデータである。

　判定装置１０の符号化部１３１は、学習データの入力を受け付けると、当該データを低次元のデータに変換する（Ｓ１：符号化）。そして、多様体埋め込み部１３２は、Ｓ１で変換されたデータを多様体に埋め込む（Ｓ２：多様体埋め込み）。その後、復号部１３３は、Ｓ２で多様体に埋め込まれたデータを元の次元のデータに復号する（Ｓ３：復号）。また、復号部１３３は、多様体上の追加座標（ノイズ）を復号する（Ｓ３：復号）。

　そして、データ識別部１３４は、入力されたデータが、元データか復号されたデータかを識別（判定）する（Ｓ４：データ識別）。

　学習部１３５は、上記のＳ１～Ｓ４の処理において、復号部１３３が復号したデータが元データに近づくように、符号化部１３１および復号部１３３の学習を行う。

　また、学習部１３５は、データ識別部１３４が復号部１３３から出力されるデータが元データか復号されたデータかを精度よく識別するように、データ識別部１３４の学習を行う。まさらに、学習部１３５は、データ識別部１３４に、復号部１３３から出力されるデータが復号されたデータであると識別されないように、符号化部１３１および復号部１３３の学習を行う。

［判定時における処理手順の例］
　次に、図６を用いて、上記の学習後の判定装置１０の処理手順（判定時の処理手順）の例を説明する。

　まず、判定装置１０の符号化部１３１は、判定対象のデータ（入力データ）を受け付けると、当該データを低次元のデータに変換する（Ｓ１１：符号化）。そして、多様体埋め込み部１３２は、Ｓ１１で変換されたデータを多様体上に埋め込む（Ｓ１２：多様体埋め込み）。その後、復号部１３３は、Ｓ１２で多様体上埋め込まれたデータを元の次元のデーに復号する（Ｓ１３：復号）。

　Ｓ１３の後、誤差評価部１３６は、Ｓ１３で復号されたデータの画像と、当該復号データの元データの画像との誤差を評価する（Ｓ１４：誤差評価）。そして、判定処理部１３７は、誤差評価部１３６により評価された誤差が所定の閾値よりも大きいか否かを判定する。そして、判定処理部１３７が、上記の誤差が所定の閾値よりも大きいと判定した場合、元データ（入力データ）は、認識対象の画像のデータではないと判定する。一方、判定処理部１３７が、上記の誤差が所定の閾値以下であると判定した場合、入力データは、認識対象の画像のデータであると判定する（Ｓ１５：判定処理）。そして、出力処理部１３８は、Ｓ１５の判定結果を出力する（Ｓ１６：出力処理）。

　判定装置１０が上記の処理を行うことにより、入力データが認識対象の画像のデータか否かを精度よく判定することができる。

［実験結果］
　次に、図７を用いて判定装置１０の判定精度の実験結果を説明する。本実験において、判定装置１０は、Fashion　MNIST(ファッションの画像)を学習データとして用いて学習した。その後、判定装置１０は、Fashion　MNISTおよびMNIST(手描きの数字の画像)の入力を受け付けると、入力データとその復号データとの誤差により、当該入力データがファッションの画像か否かを判定した。判定精度の評価には、AUROC（チャンスレート=0.5。1に近いほど良い性能）を用いた。比較例として、ナイーブなVAE（変分オートエンコーダ）を用いた。

　図７に示すように、本実施形態の判定装置１０によれば、比較例よりもAUROCの値が向上することが確認できた。このことから、本実施形態の判定装置１０によれば、入力データが認識対象の画像のデータか否かを精度よく判定できることが確認できた。

［システム構成等］
　また、図示した各部の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、ＣＰＵ及び当該ＣＰＵにて実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

　また、前記した実施形態において説明した処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

［プログラム］
　前記した判定装置１０は、パッケージソフトウェアやオンラインソフトウェアとしてプログラム（判定プログラム）を所望のコンピュータにインストールさせることによって実装できる。例えば、上記のプログラムを情報処理装置に実行させることにより、情報処理装置を判定装置１０として機能させることができる。ここで言う情報処理装置にはスマートフォン、携帯電話機やＰＨＳ（Personal　Handyphone　System）等の移動体通信端末、さらには、ＰＤＡ（Personal　Digital　Assistant）等の端末等がその範疇に含まれる。

　図８は、判定プログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ（Read　Only　Memory）１０１１及びＲＡＭ（Random　Access　Memory）１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記の判定装置１０が実行する各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、判定装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid　State　Drive）により代替されてもよい。

　また、上述した実施形態の処理で用いられるデータは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続される他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　１０　判定装置
　１１　入出力部
　１２　記憶部
　１３　制御部
　１３０　オートエンコーダ
　１３１　符号化部
　１３２　多様体埋め込み部
　１３３　復号部
　１３４　データ識別部
　１３５　学習部
　１３６　誤差評価部
　１３７　判定処理部
　１３８　出力処理部

Claims

　入力データを前記入力データよりも低次元のデータに変換する符号化部と、前記符号化部により変換されたデータを多様体上に埋め込む埋め込み部と、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する復号部とを有するオートエンコーダと、
　認識対象とする物体の画像を学習データとして用いて、前記復号部により復号されたデータが前記データの元になった入力データに近づき、かつ、入力されたデータが前記復号されたデータか否かを識別するデータ識別部に、前記入力されたデータが復号されたデータであると識別されないように、前記符号化部および前記復号部の学習を行う学習部と、
　学習後の前記符号化部により変換された後、前記多様体埋め込み部により多様体上に埋め込まれ、学習後の前記復号部により復号されたデータの画像と、前記データの元となった入力データの画像との誤差を評価する誤差評価部と、
　評価した前記誤差が所定の閾値よりも大きい場合、前記入力データは、前記認識対象の画像のデータではないと判定する判定処理部と、
　前記判定結果を出力する出力処理部と、
　を備えることを特徴とする判定装置。
　前記学習部は、
　前記復号部により復号されたデータと、前記データの元となった入力データとを用いて、前記データ識別部において、入力されたデータが、前記復号されたデータか否かを精度よく識別するよう、前記データ識別部を学習する
　ことを特徴とする請求項１に記載の判定装置。
　前記多様体は、超球面である
　ことを特徴とする請求項１に記載の判定装置。
　入力データを前記入力データよりも低次元のデータに変換する符号化部と、前記符号化部により変換されたデータを多様体上に埋め込む埋め込み部と、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する復号部と、入力されたデータが、前記復号されたデータか否かを識別するデータ識別部とを備える判定装置が、
　認識対象とする物体の画像を学習データとして用いて、前記復号部により復号されたデータが前記データの元になった入力データに近づき、かつ、前記データ識別部に、前記入力されたデータが復号されたデータであると識別されないように、前記符号化部および前記復号部の学習を行う工程と、
　学習後の前記符号化部により、入力データを前記低次元のデータに変換する工程と、
　前記埋め込み部により、前記符号化部により変換されたデータを多様体上に埋め込む工程と、
　学習後の前記復号部により、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する工程と、
　学習後の前記復号部により復号されたデータの画像と、前記データの元となった入力データの画像との誤差を評価する工程と、
　評価した前記誤差が所定の閾値よりも大きい場合、前記入力データは、前記認識対象の画像のデータではないと判定する工程と、
　前記判定の結果を出力する工程と、
　を含むことを特徴とする判定方法。
　入力データを前記入力データよりも低次元のデータに変換する符号化部と、前記符号化部により変換されたデータを多様体上に埋め込む埋め込み部と、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する復号部と、入力されたデータが、前記復号されたデータか否かを識別するデータ識別部とを備えるコンピュータに、
　認識対象とする物体の画像を学習データとして用いて、前記復号部により復号されたデータが前記データの元になった入力データに近づき、かつ、前記データ識別部に、前記入力されたデータが復号されたデータであると識別されないように、前記符号化部および前記復号部の学習を行う工程と、
　学習後の前記符号化部により、入力データを前記低次元のデータに変換する工程と、
　前記埋め込み部により、前記符号化部により変換されたデータを多様体上に埋め込む工程と、
　学習後の前記復号部により、前記埋め込み部により埋め込まれたデータを元の次元のデータに復号する工程と、
　学習後の前記復号部により復号されたデータと、前記データの元となった入力データとの誤差を評価する工程と、
　評価した前記誤差が所定の閾値よりも大きい場合、前記入力データは、前記認識対象の画像のデータではないと判定する工程と、
　前記判定の結果を出力する工程と、
　を実行させるための判定プログラム。