JP7416400B2

JP7416400B2 - 識別補助データ生成技術及び識別情報抽出技術

Info

Publication number: JP7416400B2
Application number: JP2019190852A
Authority: JP
Inventors: 和邦古原
Original assignee: National Institute of Advanced Industrial Science and Technology AIST
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2024-01-17
Anticipated expiration: 2039-10-18
Also published as: JP2021068004A

Description

本発明は、複数の対象からユニークな識別情報を抽出するための技術に関する。

個体その他の対象から、対象毎に固有の固定されたディジタル値（０又は１といった離散値。なお、複数のディジタル値の系列を含めベクトルと呼ぶ。なお、その特性から固定値とも呼ぶ）を抽出するために、一般的には、対象特有の何らかのアナログ値を読み出して、当該アナログ値に対して設定されている閾値との比較によって、０又は１を決定する。

例えば、０以上１以下のアナログ値に対して閾値０．５が設定されていると仮定する。この場合、閾値０．５付近のアナログ値が測定される特定の対象について、ノイズがプラスである場合には閾値０．５以上のアナログ値が測定されて「１」が抽出されるが、ノイズがマイナスである場合には閾値０．５未満のアナログ値が測定されて「０」が抽出されるようになってしまう。このような場合には、固有の固定されたディジタル値が得られない。同様に、複数の対象について、「０」又は「１」の一方のみに偏った変換がなされても、「固有の」固定されたディジタル値を得られないので、避けるべきである。

このような状況において固有の固定されたディジタル値を得るための技術としては、以下のようなものがある。
（１）何度も読み取りを行い、多数決などの方法により固定値を決定する技術（例えば、特許文献１及び２など）
（２）固定値を抽出する対象の読取りパターン毎に個別の補助データ（ヘルパーデータ）を事前に計算、保持しておき、誤り訂正時にその情報を使う技術。ヘルパーデータとしては、抽出パターンにランダムな符号語を排他的論理和したものや、抽出パターンを誤り訂正時に使用するシンドロームに変換したものなどがあり、これらの方法はファジー抽出器（Fuzzy Extractor）とも呼ばれる。（例えば非特許文献１）
（３）ノイズの多い軸や値、対象全体を通して読み取った値が偏っている軸や値を使わないようにする技術（例えば特許文献３）

（１）の技術は、読取り時に一時的に生じるノイズを訂正するには有効であるが、パターンの変形、傷、劣化などにより恒久的に加わったノイズは訂正できない。また、読取り時に一時的に生じるノイズに対しても、読み取り値の平均がノイズの分散以上にしきい値から離れていなければ有効な対策とはならない。

（２）の技術は、ヘルパーデータによる補正を行うが、この補正値は読み取り対象毎に異なるため、読み取り対象のＩＤが事前に分かっている場合など、読み取り対象が事前に特定できており、その対象が本物であるか否かを検証する際には有効な方法となる。しかし、対象に対応する補助データが分からない状態から、そのＩＤや暗号鍵などの固定値を抽出する場合には使えない。なお、全ての補助データを試すという方法も可能であるが、識別に要する時間が、対象の候補数に比例して長くなるという問題がある。

（３）の技術は、読取り対象毎に使わない軸を決める場合、対象にＩＤを付けるか、固定値抽出時に全数探索等を行わなければならない問題がある。読取り対象毎ではなく、全ての対象で使わない軸を決める場合、対象の数が増えると全ての対象でエラーとなる軸、または、全ての対象でエラーが小さくなる軸の割合が小さくなるため、いくつかの対象に対してはエラーが小さくなっているにも関わらずその軸を使わなかったり、いくつかの対象に対してはエラーが大きくなっているにも関わらずその軸を残すことになりエラーを取り切れなくなるという問題がある。

その他、テンプレートとのマッチングを行う方法や、電子透かしを用いる方法など様々な技術が存在しているが、それらは、多数の対象にＩＤ等が付いていない状況や電子透かしを埋め込むために対象を変更したり加工したりできない状況において、対象そのものから固定値を確実に抽出するのには、必ずしも有効ではない。

特開２０１８－１７５７６２号公報特開平１１－２８８４６５号公報日本特許第６３０５５７９号公報

Y. Dodis, R. Ostrovsky, L. Reyzin, A. Smith. Fuzzy Extractors: How to Generate Strong Keys from Biometrics and Other Noisy Data. SIAM J. Comput. 38(1): 97-139 (2008)

従って、本発明の目的は、一側面として、対象から固有のデータを確実に抽出できるようにするための新規な技術を提供することである。

本発明の第１の態様に係る情報処理方法は、（Ａ）複数の対象の各々を表す入力ベクトルを取得するステップと、（Ｂ）入力ベクトルを包含する空間を複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップとを含む。

本発明の第２の態様に係る情報処理方法は、（Ｃ）複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、（Ｄ）上記ベクトルを包含する空間を複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて、特定の対象を表すベクトルを評価することで、特定の対象を識別するベクトルを生成するステップとを含む。

一側面によれば、対象から固有のデータを確実に抽出できるようになる。

図１は、第１の実施の形態におけるシステムの概要を示す図である。図２は、第１の実施の形態に係る情報処理装置の処理フローを示す図である。図３は、二次元空間の一例を示す図である。図４は、超曲面の一例を示す図である。図５は、超曲面生成処理の処理フローを示す図である。図６は、超曲面の一例を示す図である。図７は、度数偏り調整処理の処理フローを示す図である。図８は、超曲面の一例を示す図である。図９は、類似性調整処理の処理フローを示す図である。図１０は、超曲面の一例を示す図である。図１１は、距離調整処理の処理フローを示す図である。図１２は、超曲面生成処理の処理フローを示す図である。図１３は、適応的距離調整処理の処理フローを示す図である。図１４は、目標値の設定について説明するための図である。図１５は、類似性再判定処理の処理フローを示す図である。図１６は、適切な超曲面を用いて評価された対象の位置を示す図である。図１７は、第１の実施の形態に係る検出装置の処理フローを示す図である。図１８は、第２乃至４の実施の形態におけるシステムの概要を示す図である。図１９は、第２の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。図２０は、第２の実施の形態に係る検出装置の処理フローを示す図である。図２１は、第３の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。図２２は、第３の実施の形態に係る検出装置の処理フローを示す図である。図２３は、第４の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。図２４は、第４の実施の形態に係る検出装置の処理フローを示す図である。図２５は、コンピュータ装置のブロック構成図である。

［実施の形態１］
図１に、第１の実施の形態に係るシステム概要を示す。例えば生産場所、採取場所、登録場所などに設置される情報処理装置１００と、例えば流通経路上に設置される複数の検出装置２００とが、例えばインターネットなどのネットワークを介して接続するようになっている。

図１で示すように、複数の対象（図１ではＡ乃至Ｄなど）を生産、採取、登録などする場面において、情報処理装置１００では、当該複数の対象に対して測定などを行った上で、複数の対象の各々を識別するユニークなデータ（以下では、固定値ベクトルと呼ぶ）を生成するための変換関数として、測定データなどを表す空間を複数の対象の各々を異なる部分空間に含まれるように分割する超曲面を生成し、当該超曲面のパラメータを検出装置２００に配信する。

検出装置２００は、例えば対象の流通経路上で、特定の対象について測定などを行った上で、情報処理装置１００から配信された超曲面のパラメータを用いて測定データなどに対して評価を行うことで、特定の対象を識別するユニークな固定値ベクトルを生成する。固定値ベクトルが得られれば、当該固定値ベクトルをＩＤとして用いることで例えば生産等に関するデータなど属性データを別途抽出できるようになる。

情報処理装置１００は、測定部１１０と、第１データ格納部１２０と、パラメータ生成部１３０と、第２データ格納部１４０と、登録部１５０と、配信部１６０と、対象ＤＢ１７０とを有する。

測定部１１０は、対象に対する所定の測定を行い、測定データを第１データ格納部１２０に格納する。なお、測定部１１０は、測定だけではなく、測定データに対する特徴抽出などの追加的な処理を行って、その処理結果を第１データ格納部１２０に格納するようにしてもよい。パラメータ生成部１３０は、第１データ格納部１２０に格納されているデータを用いて、要件を満たす超曲面を生成し、当該超曲面のパラメータを第２データ格納部１４０に格納する。

登録部１５０は、第２データ格納部１４０に格納されている超曲面のパラメータを用いて、第１データ格納部１２０に格納されている測定データなどを評価して、各対象について固定値ベクトルを生成すると共に、各対象の属性データ（例えば生産場所、生産時刻その他）を対応付けて、対象ＤＢ１７０に格納する。なお、パラメータ生成部１３０によって各対象の固定値ベクトルが生成されて第２データ格納部１４０に格納されている場合には、第２データ格納部１４０に格納されている各対象の固定値ベクトルを読み出す場合もある。配信部１６０は、第２データ格納部１４０に格納されている超曲面のパラメータを、検出装置２００に配信する。

検出装置２００は、測定部２１０と、測定データ格納部２２０と、抽出部２３０と、後処理部２４０と、設定部２５０と、パラメータ格納部２６０とを有する。

設定部２５０は、情報処理装置１００から配信された超曲面のパラメータを、パラメータ格納部２６０に格納する。オフラインで超曲面のパラメータを受け取った場合にも同様にパラメータ格納部２６０に格納する。

測定部２１０は、情報処理装置１００における測定部１１０と同じ処理を行って、処理結果を測定データ格納部２２０に格納する。抽出部２３０は、測定データ格納部２２０に格納された測定データなどを、パラメータ格納部２６０に格納されている超曲面のパラメータを用いて評価し、特定の対象を識別するユニークな固定値ベクトルを生成する。後処理部２４０は、固定値ベクトルをＩＤとして用いて、当該ＩＤに対応付けられている属性データを取得するなどの処理を行う。

次に、情報処理装置１００の処理の内容を図２乃至図１６を用いて詳細に説明する。

まず、測定部１１０は、各対象ｉに対して所定の測定を行って、測定結果に基づき、Ｌ１次元のベクトルＸiを生成し、第１データ格納部１２０に格納する（図２：ステップＳ１）。

ここで、対象は全部でＬ３個あるものとする。また、測定部１１０は、単なる測定ではなく、測定データに対して所定の特徴抽出などの処理を行うようにしてもよい。そして、Ｌ３個ある対象のうちｉ番目の対象に対して、Ｌ１次元のベクトルＸi＝（ｘ₁，ｘ₂，．．．，ｘ_L1）が生成される。

説明を分かりやすくするため、Ｌ３＝４且つＬ１＝２の例を図３に示しておく。Ｌ１＝２なので、図３に示すようにベクトルＸiは２次元の空間、すなわち平面上で表される。ここでは、対象１のベクトルＸ₁＝（ｘ₁，ｘ₂）＝（０．５，１）、対象２のベクトルＸ₂＝（ｘ₁，ｘ₂＝（１，０．５）、対象３のベクトルＸ₃＝（ｘ₁，ｘ₂）＝（０，０．５）、対象４のベクトルＸ₄＝（ｘ₁，ｘ₂）＝（０．５，０）であるものとする。

この例では、図３の平面において、いずれの軸についても、０．５を閾値として、それ以上であれば「１」、それ未満であれば「０」を割り当てるものとする（以下、これを実現する関数をround()と表すものとする）。図３の平面において、このような閾値のラインを二点鎖線で表しているが、対象１乃至４はそれぞれ閾値のライン上に載っている。このため、少しでも測定結果にノイズがあると、「０」と「１」とが入れ替わってしまい、検出誤りが生ずることになる。

本実施の形態では、Ｌ１次元の空間をｎ個の部分空間に分割するための超曲面を生成する。各軸の値を０又は１の２種類に分類する場合、ｎとユニークな超曲面の数Ｌ２との関係は、ｎ＝２^L2で表される。Ｌ２＝log₂Ｌ３以上であり、ｎ≧Ｌ３である。Ｌ２が大きいほど、ノイズ耐性が高い。

図３の例では、例えば図４のような超曲面ｙ₁及びｙ₂（平面の場合には直線）を生成することを目指す。図４の例では、Ｌ２＝２、ｎ＝４であり、２本の点線で表される超曲面ｙ₁及びｙ₂を生成する。そして、各対象は、これらの超曲面で分割された４つの部分空間Ａ乃至Ｄのうち互いに異なるものに含まれるようになっている。

以下、このような超曲面に対応する関数をｆ（）と表し、ｆ（）の出力範囲を０以上１以下とする。また、二値化、量子化又は離散化の閾値を０．５、すなわちｆ（）の出力の小数点第一位を四捨五入する関数round()をｆ（）に適用し、round(f())を行うものとして説明するが、当然それ以外の場合にも拡張可能である。

図２の処理の説明に戻って、次に、パラメータ生成部１３０は、対象の個数Ｌ３に応じて空間を分割する超曲面数Ｌ２等を設定する（ステップＳ３）。上で述べたとおりの関係があるので、これに従ってＬ２等が決定される。また、パラメータ生成部１３０は、超曲面についてのカウンタｊを１に初期化する（ステップＳ５）。

そして、パラメータ生成部１３０は、超曲面生成処理を実行する（ステップＳ７）。この超曲面生成処理については、後に詳細に説明する。生成された超曲面のパラメータは、第２データ格納部１４０に格納される。

その後、パラメータ生成部１３０は、カウンタｊを１インクリメントして、ｊがＬ２以下であるか否かを判断する（ステップＳ１１）。この条件を満たす場合には、まだ超曲面を生成するので、処理はステップＳ７に戻る。

一方、ｊがＬ２を超えるようになると、登録部１５０は、生成されたパラメータに係る超曲面で、各ベクトルＸiを評価して、対象ｉの固定値ベクトルＺiを生成し、属性データと共に対象ＤＢ１７０に登録する（ステップＳ１３）。なお、固定値ベクトルＺiについては、ｊ番目の超曲面が決まるたびにＺiのｊ番目の値を求め、または、ｊ番目の超曲面が決まる際に同時に定まったＺiのｊ番目の値を、対象ＤＢ１７０において対応する場所に登録してもよい。後に固定値ベクトルＺiから属性データを抽出するためである。

ここでは、Ｌ２個の超曲面を表す関数ｆ₁乃至ｆ_L2の集合Ｆ（）＝（ｆ₁()，ｆ₂()，．．．，ｆ_L2()）を用いて、ベクトルＹi＝（ｙ_i,1，ｙ_i,2，．．．，ｙ_i,L2）＝Ｆ（Ｘi）＝（ｆ₁(Ｘi)，ｆ₂(Ｘi)，．．．，ｆ_L2(Ｘi)）を算出し、さらに各要素ｙ_i,jについてround()を適用することで離散化し、固定値ベクトルＺiを生成する。

さらに、配信部１６０は、生成された超曲面のパラメータを、第２データ格納部１４０から読み出して、所定の検出装置２００に配信する（ステップＳ１５）。なお、配信ではなく、オフラインで配布するようにしてもよいし、検出装置２００の製造部門に送信して、検出装置２００の製造段階でパラメータ格納部２６０に記録するようにしてもよい。

このような処理を行うことで、対象にはＩＤ等を付すことなく、検出装置２００において固定値ベクトルを確実に抽出することができるようになる。

次に、図５乃至図１６を用いて、超曲面生成処理について詳細を説明する。

まず、パラメータ生成部１３０は、全ベクトルＸiを写像するｊ番目の超曲面を表す関数ｆj()をランダムに生成する（図５：ステップＳ２１）。

そして、パラメータ生成部１３０は、ｆ_j()に対して度数偏り調整処理を実行する（ステップＳ２３）。この度数偏り調整処理については、図６及び図７を用いて説明する。

図２に対して図３とは異なり図６に示すような超曲面を表す点線ｙ₁＝０．５及びｙ₂＝０．５が生成されたものとする。ここで、超曲面を表す点線ｙ_j＝０．５は、y_j＝ｆ_j（ｘ₁，ｘ₂）＝０．５を満たす（ｘ₁，ｘ₂）であり、ｆ₁（ｘ₁，x₂）は、点線ｙ₁＝０．５より右上にある点を、「１」に分類される、０．５以上の値に写像し、点線ｙ₁＝０．５より左下にある点を、「０」に分類される、０．５未満の値に写像する。同様に、ｆ₂（ｘ₁，ｘ₂)は、点線ｙ₂＝０．５より左上にある点を「０」に分類される、０．５未満の値に写像し、点線ｙ₂＝０．５より右下にある点を、「１」に分類される、０．５以上の値に写像する。

このような場合、点線ｙ₁＝０．５の左右で対象の数は２個ずつだが、点線ｙ₂＝０．５については、その左上の領域（round(ｙ₂)＝０の領域）に４つの対象が含まれるのに対して、右下の領域（round(ｙ₂)＝１の領域）には０個となってしまう。すなわち、超曲面で分割される部分空間において対象の分布に偏りがある。

このような場合、例えば、超曲面のパラメータ（直線ｙ₂＝ｆ₂（Ｘi）＝ｆ₂（ｘ₁，ｘ₂）＝ａｘ₁＋ｂ₂＝ｃのパラメータａ、ｂ及びｃ）をそれぞれ＋又は－方向に変化させて、例えば図６の例では、点線ｙ₂＝０．５を平行に左上方向に移動させれば、分布の偏りを是正できる。

より具体的には、点線ｙ₂＝０．５に近い対象２及び４が点線ｙ₂＝０．５の右下に属し、対象１及び３が点線ｙ₂＝０．５の左上に属するように点線ｙ₂＝０．５を移動させれば、分布が均等化される。

対象２及び４は、Ｘ₂＝（１，０．５）、Ｘ₄＝（０．５，０）であるから、ｙ_2,2＝ｆ₂（Ｘ₂）＝ａ＋０．５ｂ＋ｃとなるので、round（ｙ_2,2）が０から１に変わるように、ｂよりａ及びｂに重みをつけてａ、ｂ及びｃをいずれも増加する方向に変更する。同様に、ｙ_2,4＝ｆ₂（Ｘ₄）＝０．５ａ＋ｃとなるので、round（ｙ_2,4）が０から１に変わるように、ａよりｃに重みをつけてａ及びｃを増加させる方向に変更する。

このような例を念頭にして、図７に示す度数偏り調整処理を実行する。

まず、パラメータ生成部１３０は、ローカルなカウンタcounterを０に初期化する（ステップＳ５１）。

また、パラメータ生成部１３０は、ｆ_j（）を各ベクトルＸiに適用して、Ｙ^T _jベクトルを生成する（ステップＳ５３）。以下に示すＹ^T _jベクトルは、Ｙの転置行列のｊ行目のベクトルを表し、Ｙはｙ_i,j＝ｆ_j(Ｘi）をｉ行ｊ列目の要素とするＬ３行Ｌ２列の２次元行列である。
Ｙ^T _j＝（ｙ_1,j，ｙ_2,j，．．．，ｙ_L3,j）＝（ｆ_j（Ｘ₁），ｆ_j（Ｘ₂），．．．，ｆ_j（Ｘ_L3））

その後、パラメータ生成部１３０は、Ｙ^T _jベクトルの各要素を閾値に応じて０と１とのいずれかに分けて、０と１の度数を計数し、度数差biasを算出する（ステップＳ５５）。

図６の例では、Ｙ^T ₂ベクトルは（０，０，０，０）となるので、bias＝｜４－０｜＝４となる。ここでスカラー値ｗに対して、｜ｗ｜は、ｗの絶対値を表す。

そして、パラメータ生成部１３０は、度数差biasが、予め定められた閾値bias_threshold2より小さいか否かを判断する（ステップＳ５７）。完全に均一の分布にするのであれば度数差bias＝０であるから、bias_threshold2＝１となる。この要件を満たす場合には、呼び出し元の処理に戻る。

一方、度数差biasが、予め定められた閾値bias_threshold2以上であれば、パラメータ生成部１３０は、度数差biasが、予め定められたもう一つの閾値bias_threshold1より大きいか否かを判断する（ステップＳ５９）。あまりに度数差biasが大きい場合には、今回の超曲面は許容できないので、ステップＳ５９の要件を満たす場合には、パラメータ生成部１３０は、今回の超曲面を破棄して（ステップＳ６７）、呼び出し元の処理に戻る。

一方、度数差biasが、予め定められた閾値bias_threshold1未満であれば、パラメータ生成部１３０は、ローカルなカウンタcounterを１インクリメントして（ステップＳ６１）、counterの値が、予め定められた閾値bias_threshold3を超えたか否かを判断する（ステップＳ６３）。bias_threshold3回、パラメータの変更を行ってもステップＳ５７の要件を満たすことができない場合には、今回の超曲面は適切ではない。従って、ステップＳ６３の要件を満たす場合には、処理はステップＳ６７に移行する。

一方、counterの値が、予め定められた閾値bias_threshold3以下であれば、パラメータ生成部１３０は、ｆ_j（）を表す各パラメータを度数差biasが小さくなる方向に変化させる（ステップＳ６５）。その後、処理はステップＳ５３に戻る。

このようにすれば、追加した超曲面で空間を区切った場合における度数偏りを適切に是正できる。

図５の処理の説明に戻って、ステップＳ２３の後に、パラメータ生成部１３０は、今回の超曲面が破棄されたか否かを判断する（ステップＳ２５）。破棄された場合には、処理はステップＳ２１に戻って、超曲面の生成から再開する。一方、破棄されなかった場合、パラメータ生成部１３０は、類似性調整処理を実行する（ステップＳ２７）。この類似性調整処理については、図８及び図９を用いて説明する。

図２に対して図３とは異なり図８に示すような超曲面を表す点線ｙ₁＝０．５及びｙ₂＝０．５が生成されたものとする。ここで、超曲面を表す点線ｙ_j＝０．５は、y_j＝ｆ_j（ｘ₁，ｘ₂）＝０．５を満たす（ｘ₁，ｘ₂）であり、ｆ₁（ｘ₁，x₂）は、点線ｙ₁＝０．５より右上にある点を、「１」に分類される、０．５以上の値に写像し、点線ｙ₁＝０．５より左下にある点を、「０」に分類される、０．５未満の値に写像する。同様に、ｆ₂（ｘ₁，ｘ₂)は、点線ｙ₂＝０．５より左にある点を「０」に分類される、０．５未満の値に写像し、点線ｙ₂＝０．５より右にある点を、「１」に分類される、０．５以上の値に写像する。

この場合、ｙ₁とｙ₂とを単独で判断すると、ｙ₁で分けられる２つの領域で対象の数は２個ずつであり、同様に、ｙ₂で分けられる２つの領域で対象の数は２個ずつであるから、度数差biasで判断すれば問題は無い。しかし、２つの超曲面により空間全体を分割することにより得られる部分空間のそれぞれに対象が含まれるのではなく、対象１及び２が同じ部分空間に含まれ、対象３及び４が同じ部分空間に含まれるようになってしまっている。すなわち、偏った分布が形成されている。

この問題を解消するには、超曲面間の類似度を考慮すればよい。ここでは、今回の超曲面について計算されたＹ^T _jベクトルと、既にｊ₂番目として設定されている他の超曲面についてのＹ^T _j2ベクトルとの類似度Similarityを、超曲面間の類似度として以下のように定義する。
Similarity（Ｙ^T _j，Ｙ^T _j2）＝２・max（ＨＤ（Ｙ^T _j，Ｙ^T _j2），Ｌ３－ＨＤ（Ｙ^T _j，Ｙ^T _j2））／Ｌ３－１

ｍａｘ（Ａ，Ｂ）は、ＡとＢとのうち大きい方の値を出力する関数である。ＨＤ（Ｙ^T _j，Ｙ^T _j2）は、Ｙ^T _jベクトルと、Ｙ^T _j2ベクトルのうち、round()を適用した場合に値が一致しない要素数である。図８の例では、ｙ₁が既設定の超曲面とするとＹ^T _j2ベクトルはround()を適用すると（１，１，０，０）となり、ｙ₂が今回の超曲面とするとＹ^T _jベクトルもround()を適用すると（１，１，０，０）となるので、ＨＤ（Ｙ^T _j，Ｙ^T _j2）＝０となる。よって、Similarityは、２・max（０，４－０）／４－１＝１となる。

なお、類似度Similarityについては、各ベクトルの要素値が０又は１については上で述べたような関数を用いても良く、実数である場合には、コサイン類似度を採用するようにしてもよい。コサイン類似度は、ベクトルＶ１とＶ２について、Ｖ１・Ｖ２／（｜Ｖ１｜｜Ｖ２｜）の絶対値である。なお、Ｖ１・Ｖ２はＶ１とＶ２の内積を表しており、｜Ｖ｜は、ベクトルの各要素の値の自乗和の平方根を表す。

このような類似度を用いた類似性調整処理について、図９を用いて説明する。

まず、パラメータ生成部１３０は、既設定の各超曲面ｆ_j2（）を各ベクトルＸ_iに適用して、ｊ₂それぞれについてＹ^T _j2ベクトルを生成する（ステップＳ７１）。また、パラメータ生成部１３０は、ローカルなカウンタcounterを０に初期化する（ステップＳ７３）。

そして、パラメータ生成部１３０は、全てのｊ₂（＜ｊ）について、Ｙ^T _jベクトルとＹ^T _j2ベクトルとの類似度Similarityを算出して、当該類似度Similarityが、予め定められた閾値sim_threshold1未満であるか否かを判断する（ステップＳ７５）。ステップＳ７５の要件を満たしている場合には問題が無いので、処理は呼び出し元の処理に戻る。

一方、ステップＳ７５の要件を満たしていない、すなわち既設定の超曲面の一つでもその類似度Similarityが閾値sim_threshold1を超えている場合には、パラメータ生成部１３０は、全てのｊ₂（＜ｊ）について算出された、Ｙ^T _jベクトルとＹ^T _j2ベクトルとの類似度Similarityが、予め定められた閾値sim_threshold2を超えている否かを判断する（ステップＳ７７）。これは、どの既設定の超曲面とも類似度があまりに高い場合には、超曲面の調整を行わずに破棄するためである。

よって、ステップＳ７７の条件を満たす場合には、パラメータ生成部１３０は、今回の超曲面を破棄する（ステップＳ８７）。そして、処理は呼び出し元の処理に戻る。

一方、ステップＳ７７の条件を満たしていない場合には、パラメータ生成部１３０は、ローカルなカウンタcounterを１インクリメントして、このcounterの値が、予め定められた閾値sim_threshold3を超えているか否かを判断する（ステップＳ８１）。sim_threshold3回、パラメータの変更を行ってもステップＳ７５の要件を満たすことができない場合には、今回の超曲面は適切ではない。従って、ステップＳ８１の要件を満たす場合には、処理はステップＳ８７に移行する。

一方、ステップＳ８１の要件を満たしていない場合には、パラメータ生成部１３０は、ｆ_j（）を表すパラメータを、類似度Similarityが小さくなる方向に変化させる（ステップＳ８３）。

より具体的には、Ｙ^T _jベクトルとＹ^T _j2ベクトルの要素（対象）のうちround()を適用した場合に一致する要素（対象）であって閾値（＝０．５）に近い要素（対象）から順番に、例えばその要素値にround()を適用した場合に値が反転することで類似度Similarityが閾値sim_threshold1より小さくなる数だけ、要素ｉ（対象ｉ）を選択する。そして、選択した要素ｉについて、ｆ_j（）及びround()を適用した場合に、値が反転するように超曲面のパラメータを調整する。

図８の例で、今回の超曲面がｙ₂であるとすると、対象１及び４がｙ₂に近いので選択され、Ｘ₁＝（０．５，１）、Ｘ₄＝（０．５，０）でround(ｙ_1,2)＝round(ｆ₂（Ｘ₁）)＝１であり、round(ｙ_4,2)＝round(ｆ₂（Ｘ₄）)＝０であるので、それぞれ０と１に反転するように超曲面のパラメータを調整する。そうすると、round(Ｙ^T ₂ベクトル)は（０，１，０，１）となる。round(Ｙ^T _j2ベクトル)は（１，１，０，０）であるから、ＨＤ（Ｙ^T _j，Ｙ^T _j2）＝２であり、類似度Similarityは、２・max（２，４－２）／４－１＝０となるので、類似度Similarityは下がる。

なお、対象１のＸ₁をｆ₂（ｘ₁，ｘ₂）で写像すると、ｙ_1,2＝ｆ₂（ｘ₁，ｘ₂）＝ａｘ₁＋ｂｘ₂＋ｃ＝０．５ａ＋ｂ＋ｃであるので、ａよりｂ及びｃに重みをつけてａ、ｂ及びｃいずれも減少させる方向で変化させる。また、対象４のＸ₂をｆ₂（ｘ₁，ｘ₂）で写像すると、ｙ_4,2＝ｆ₂（ｘ₁，ｘ₂）＝ａｘ₁＋ｂｘ₂＋ｃ＝０．５ａ＋ｃであるので、ａよりｃに重みをつけてａ及びｃを増加させる方向で変化させる。

そして、パラメータ生成部１３０は、変更後のパラメータに係る関数ｆ_j（）を各Ｘ_iに適用して、新たなＹ^T _jベクトルを生成する（ステップＳ８５）。そして、処理はステップＳ７５に戻る。

以上のような処理を行うことで、個々の対象がいずれか１つの異なる部分空間に含まれるように超曲面が調整されるようになる。

図５の処理の説明に戻って、ステップＳ２７の後に、パラメータ生成部１３０は、今回の超曲面が破棄されたか否かを判断する（ステップＳ２９）。破棄された場合には、処理はステップＳ２１に戻る。一方、破棄されなかった場合には、パラメータ生成部１３０は、距離調整処理を実行する（ステップＳ３１）。距離調整処理については、図１０及び図１１を用いて説明する。

距離調整処理では、閾値として取り扱われる超曲面付近に当該超曲面による対象の写像先が存在しているとノイズによってround()の結果が変わってしまう可能性があるので、閾値（超曲面）と対象の写像先との距離を広げるように超曲面のパラメータを変更するものである。

例えば、図２に対して図３とは異なり図１０に示すような超曲面を表す点線ｙ₁＝０．５及びｙ₂＝０．５が生成されたものとする。このような超曲面で空間を分割することで得られる部分空間のいずれかにいずれかの１つの対象が含まれているが、対象１及び４が点線ｙ₂＝０．５にとても近い。このような場合には、矢印で示すように点線ｙ₂＝０．５を回転させれば、対象１及び４が点線ｙ₂＝０．５から離れるので好ましい。

図１１に、距離調整処理の処理フローを示す。

まず、パラメータ生成部１３０は、ローカルなカウンタcounterを０に初期化する（ステップＳ９１）。そして、パラメータ生成部１３０は、超曲面の関数ｆ_j（）を表すパラメータを、Ｙ^T _jベクトルの各要素と閾値との差が大きくなるように変化させる（ステップＳ９３）。

図１０の例では、対象１についてはｙ_1,2が０．５より小さいため、ｙ_1,2がより小さくなる方向にパラメータを修正し、対象４についてはｙ_4,2が０．５より大きいため、ｙ_4,2がより大きくなる方向にパラメータを修正する。

より具体的には、対象１のＸ₁をｆ₂（）で写像すると、ｙ_1,2＝ｆ₂（Ｘ₁）＝ａｘ₁＋ｂｘ₂＋ｃ＝０．５ａ＋ｂ＋ｃであるので、ａよりｂ及びｃに重みをつけてａ、ｂ及びｃいずれも減少させる方向で変化させる。また、対象４のＸ₄をｆ₂（）で写像すると、ｙ_4,2＝ｆ₂（Ｘ₄）＝ａｘ₁＋ｂｘ₂＋ｃ＝０．５ａ＋ｃであるので、ａよりｃに重みをつけてａ及びｃを増加させる方向で変化させる。

なお、パラメータの修正を行うと、他の対象の写像先が閾値（超曲面）に近づくこともあるので、そのような場合には、他の対象の写像先についても閾値（超曲面）から離れるようにパラメータを変更する。

そして、パラメータ生成部１３０は、変更後の関数ｆ_j（）を各Ｘ_iに適用して、新たなＹ^T _jベクトルを生成する（ステップＳ９５）。

そうすると、パラメータ生成部１３０は、Ｙ^T _jベクトルにおいて全ての又は一定数以上の要素と閾値との差が所定値以上離れているか否かを判断する（ステップＳ９７）。｜ｙ_i,j－０．５｜が所定値以上であるか否かを判断するものである。全ての要素なのか、一定数以上の要素なのかについては、予め設定しておくものとする。

ステップＳ９７の要件を満たしている場合には、好ましい超曲面が生成できたことになるので、パラメータ生成部１３０は、今回の超曲面の関数ｆ_j（）を要件充足と設定する（ステップＳ１０１）。そして処理は、呼び出し元の処理に戻る。

一方、ステップＳ９７の要件を満たしていない場合には、パラメータ生成部１３０は、ローカルなカウンタcounterを１インクリメントし（ステップＳ９９）、counterの値が閾値dis_thresholdを超えたか否かを判断する（ステップＳ１０３）。counterの値が閾値dis_threshold以下である場合には、処理はステップＳ９３に戻る。一方、counterの値が閾値dis_thresholdを超えた場合には、呼び出し元の処理に戻る。

このような処理を行うことで、全ての対象又は一定数以上の対象の写像先が閾値（超曲面）から十分離れるように調整できる。なお、この要件を満たすことができない場合でも、これ以降の処理を行うことで、今回の超曲面を活用できる場合もある。

図５の処理の説明に戻って、ステップＳ３１の後に、パラメータ生成部１３０は、今回の超曲面に対して要件充足が設定されたか否かを判断する（ステップＳ３３）。要件充足が設定されていれば、次の超曲面を生成するために、端子Ｃを介して呼び出し元の処理（図２）に戻る。一方、要件充足が設定されていなければ、端子Ａを介して、図１２の処理に移行する。

図１２の処理の説明に移行して、パラメータ生成部１３０は、適応的距離調整処理を実行する（ステップＳ３５）。この適応的距離調整処理については、図１３及び図１４を用いて説明する。

適応的距離調整処理は、超曲面からなかなか離れない対象の集合がある場合に、round()を適用した後の度数分布が大幅に変わらない範囲で、当該集合に含まれる対象のround()後の値が反転するように超曲面のパラメータを変更するものである。例えば、ｍ個程度の対象のround()後の値を０から１に反転させ、ｍ個程度の対象のround()後の値を１から０個に変えるものである。０から１に反転させる個数と１から０に反転させる個数は厳密に同じでなくても良い。

図１３に適応的距離調整処理の処理フローを示す。

まず、パラメータ生成部１３０は、ローカルなカウンタcounterを０に初期化する（ステップＳ１１１）。また、パラメータ生成部１３０は、｜ｆ_j（Ｘ_i）－０．５｜が一定値以下となる対象ｉの集合Ｓを特定する（ステップＳ１１３）。これによって今回の超曲面からなかなか離れない対象ｉの集合を特定する。

そして、パラメータ生成部１３０は、集合Ｓに含まれる対象ｉに対して目標値Ｃ_i,jを算出する（ステップＳ１１５）。

目標値は、１－round(ｆ_j（Ｘ_i）)に設定する。これは、図１４に模式的に示すように、ｆ_j（Ｘ_i）が０．５より小さい場合には、round(ｆ_j（Ｘ_i）)＝０であるから、目標値Ｃ_i,jは１になる。すなわち、ｆ_j（Ｘ_i）が０．５以上となるようにパラメータを変更させる。

一方、ｆ_j（Ｘ_i）が０．５より大きい場合には、round(ｆ_j（Ｘ_i）)＝１であるから、目標値Ｃ_i,jは０になる。すなわち、ｆ_j（Ｘ_i）が０．５を下回るようにパラメータを変更させる。

ここまでの処理は、適応的距離調整処理の前提処理であり、ステップＳ１１７以降の処理を行っても集合Ｓ及び目標値Ｃ_i,jを変更しない。

そして、パラメータ生成部１３０は、超曲面の関数ｆ_j（）を表すパラメータを、Ｙ^T _jベクトルにおいて、集合Ｓに含まれる対象ｉについての要素値と目標値Ｃ_i,jとの差が小さくなるように、且つ、それ以外の対象の要素値と閾値との差が大きくなるように変化させる（ステップＳ１１７）。この処理は、基本的にステップＳ９３と同様であるが、一部の対象に係る要素については、目標値との差を小さくするという方向が異なっている。

そして、パラメータ生成部１３０は、新たな超曲面の関数ｆ_j（）を各Ｘ_iに適用して、新たなＹ^T _jベクトルを生成する（ステップＳ１１９）。

そうすると、パラメータ生成部１３０は、Ｙ^T _jベクトルにおいて全ての又は一定数以上の要素と閾値との差が所定値以上離れているか否かを判断する（ステップＳ１２１）。本ステップはステップＳ９７と同様である。

ステップＳ１２１の要件を満たしている場合には、次の処理を行うべく、呼び出し元の処理に戻る。

一方、ステップＳ１２１の要件を満たしていない場合には、パラメータ生成部１３０は、ローカルなカウンタcounterを１インクリメントし（ステップＳ１２３）、counterの値が閾値dis_thresholdを超えたか否かを判断する（ステップＳ１２５）。counterの値が閾値dis_threshold以下である場合には、処理はステップＳ１１７に戻る。一方、counterの値が閾値dis_thresholdを超えた場合には、パラメータ生成部１３０は、今回の超曲面を破棄する（ステップＳ１２７）。そして、呼び出し元の処理に戻る。

このようにすれば、度数分布をほぼ維持した上で、距離についての要件を満たすことができるようになる。但し、適応的距離調整処理を行うと、類似性調整処理で得られた状態がもはや崩れている可能性がある。

図１２の処理の説明に戻って、ステップＳ３５の後に、パラメータ生成部１３０は、今回の超曲面が破棄されたか否かを判断する（ステップＳ３７）。今回の超曲面が破棄されている場合には、端子Ｂを介して図５のステップＳ２１に戻る。

一方、今回の超曲面が破棄されていない場合には、パラメータ生成部１３０は、類似性再判定処理を実行する（ステップＳ３９）。類似性再判定処理については、図１５を用いて説明する。

パラメータ生成部１３０は、全てのｊ₂（＜ｊ）について、Ｙ^T _jベクトルとＹ^T _j2ベクトルとの類似度Similarityを算出して、当該類似度Similarityが、予め定められた閾値sim_threshold1未満であるか否かを判断する（ステップＳ１３１）。これはステップＳ７５と同様である。この要件を満たしている場合には問題が無いので、処理は呼び出し元の処理に戻る。

一方、ステップＳ１３１の要件を満たしていない、すなわち既設定の超曲面の一つでもその類似度Similarityが閾値sim_threshold1を超えている場合には、パラメータ生成部１３０は、今回の超曲面を破棄する（ステップＳ１３３）そして、呼び出し元の処理に戻る。

図１２の処理の説明に戻って、ステップＳ３９の後に、パラメータ生成部１３０は、今回の超曲面は破棄されたか否かを判断する（ステップＳ４１）。破棄された場合には、端子Ｂを介して図５のステップＳ２１に戻る。

一方、今回の超曲面が破棄されていない場合には、今回の超曲面を採用するので、呼び出し元の処理に戻る。

以上のような超曲面生成処理を実行することで、Ｌ２個の超曲面を適切に生成できる。

なお、上で述べた超曲面生成処理は一例であって、様々な変形が可能である。特に、超曲面を一つずつ追加する処理例を示したが、複数の超曲面を一度に生成して、それらについて類似性調整処理などを行っても良い。度数偏り調整処理、類似性再判定処理、距離調整処理などを直列的に実行してその都度パラメータを変更しているが、これらの処理の要件を満たしているか否かをまとめて判定して、その結果に基づきパラメータの変更を一度に行うようにしてもよい。

なお、上で述べた超曲面生成処理において、ｊ＝１の場合には、類似性調整処理及び類似性再判定処理は行われない。

図４に好ましい超曲面ｙ₁及びｙ₂の例を示したが、より具体的には、これらの超曲面は閾値＝０．５であるから、ｙ₁＝０．５＝ｘ₂＋ｘ₁－０．５であり、ｙ₂＝０．５＝ｘ₂－ｘ₁＋０．５となる。ｙ₁のパラメータは、ａ＝１、ｂ＝１、ｃ＝－０．５である。ｙ₂のパラメータは、ａ＝－１、ｂ＝１、ｃ＝０．５である。

そして、このようなｙ₁及びｙ₂を用いて、対象１乃至４の入力ベクトルＸ₁乃至Ｘ₄を評価すれば、図１６に示すようになる。すなわち、対象１には固定値ベクトルＺ₁＝（１，１）が算出され、対象２には固定値ベクトルＺ₂＝（１，０）が算出され、対象３には固定値ベクトルＺ₃＝（０，１）が算出され、対象４には固定値ベクトルＺ₄＝（０，０）が算出される。これによって、対象１乃至４の測定結果などから得られる入力ベクトルＸ₁乃至Ｘ₄のみから、対象の各々を識別するユニークなベクトルが得られるようになる。

次に、検出装置２００の処理内容について、図１７を用いて説明する。

まず、測定部２１０は、特定の対象に対して所定の測定を行って、測定結果に基づき、Ｌ１次元のベクトルＸを生成し、測定データ格納部２２０に格納する（図１７：ステップＳ２０１）。測定部２１０は、情報処理装置１００の測定部１１０と同じ処理を行う。

抽出部２３０は、情報処理装置１００から配信され且つパラメータ格納部２６０に格納されているパラメータに係る超曲面で、ベクトルＸを評価して、対象の固定値ベクトルを生成する（ステップＳ２０３）。

パラメータ格納部２６０には、ｆ_j（）（１≦ｊ≦Ｌ２）のパラメータが格納されているので、Ｙ’＝（ｙ₁，ｙ₂，．．．，ｙ_L2）＝（ｆ₁（Ｘ），ｆ₂（Ｘ），．．．，ｆ_L2（Ｘ））を算出し、ｙ_jのそれぞれについてround()を適用することで、固定値ベクトルＺが得られる。

抽出部２３０は、この固定値ベクトルを後処理部２４０に出力し、後処理部２４０は、例えばネットワーク３００を介して情報処理装置１００における対象ＤＢ１７０などから、固定値ベクトルに対応する属性データを抽出し、属性データなどに関連する処理を実行する（ステップＳ２０５）。

このように、本実施の形態では、パラメータ格納部２６０に格納されているパラメータに係る超曲面は、どの対象についても同一の超曲面であり、個々の対象に対してＩＤ等を付することなく、固定値ベクトルを得ることができるようになる。

［実施の形態２］
第１の実施の形態でも十分なノイズ耐性を有しているが、誤り訂正機能を追加するようにしてもよい。

本実施の形態では、例えば図１８に示すように、情報処理装置１００ｂは、誤り訂正データ生成部１８０及び第３データ格納部１９０をさらに有し、配信部１６０の代わりに超曲面のパラメータと誤り訂正データとを配信する配信部１６０ｂを有する。

また、各検出装置２００ｂは、誤り訂正データ格納部２７０をさらに有し、設定部２５０及び抽出部２３０の代わりに、パラメータ格納部２６０に超曲面のパラメータを格納すると共に誤り訂正データ格納部２７０に誤り訂正データを格納する設定部２５０ｂと、誤り訂正機能を有する抽出部２３０ｂとを有する。

次に、情報処理装置１００ｂの誤り訂正データ生成部１８０の処理内容について、図１９を用いて説明する。この処理は、例えば、図２のステップＳ１５の前又は後に実行する。

まず、誤り訂正データ生成部１８０は、生成された超曲面に基づき、各対象ｉの固定値ベクトルＺiを生成する（ステップＳ３０１）。このステップは、図２のステップＳ１３における処理の一部と同じである。

すなわち、超曲面を表す関数ｆ₁乃至ｆ_L2の集合Ｆ（）＝（ｆ₁()，ｆ₂()，．．．，ｆ_L2()）を用いて、ベクトルＹi＝（ｙ_i,1，ｙ_i,2，．．．，ｙ_i,L2）＝Ｆ（Ｘi）＝（ｆ₁(Ｘi)，ｆ₂(Ｘi)，．．．，ｆ_L2(Ｘi)）を算出する。さらに、このベクトルＹiの各要素ｙ_i,jについてround()を適用することで離散化し、固定値ベクトルＺiを生成する。

そして、誤り訂正データ生成部１８０は、各固定値ベクトルＺiに対して、誤り訂正のための冗長データを生成する（ステップＳ３０３）。具体的には、ＢＣＨ符号、ＲＳ符号、ＬＤＰＣ符号、ターボ符号などの既存の誤り訂正符号に従い、Ｚiを情報シンボルとする組織符号の冗長データを生成する。

例えば、Ｘi＝（０．５，０．５）に対して固定値ベクトルＺi＝（１，１）が得られた場合には、Ｚiに対して所定の誤り訂正符号に従って、冗長データＺ_r,i＝（０，０，１，０，１，０，０）を生成する。

そして、誤り訂正データ生成部１８０は、入力ベクトルＸiを入力とし、その冗長データＺ_r,iを教師データとする機械学習を実施し、学習済みモデルを生成する（ステップＳ３０５）。例えばニューラルネットワークに基づく所定のモデルを用意して既存のアルゴリズムによって学習を行うことで学習済みモデルを生成する。誤り訂正データ生成部１８０は、学習済みモデルのパラメータを、第３データ格納部１９０に格納する。

配信部１６０ｂは、第３データ格納部１９０に格納されている学習済みモデルのパラメータを、各検出装置２００ｂに配信する（ステップＳ３０７）。このデータについても、オフラインで配布するようにしてもよい。

これに対して、検出装置２００ｂでは、図２０に示すような処理を実行する。

まず、測定部２１０は、特定の対象に対して所定の測定を行って、測定結果に基づき、Ｌ１次元のベクトルＸを生成し、測定データ格納部２２０に格納する（ステップＳ３１１）。このステップは、図１７のステップＳ２０１と同じである。

抽出部２３０ｂは、情報処理装置１００ｂから配信され且つパラメータ格納部２６０に格納されているパラメータに係る超曲面で、ベクトルＸを評価して、対象の固定値ベクトルを生成する（ステップＳ３１３）。このステップは、図１７のステップＳ２０３と同じである。

さらに、抽出部２３０ｂは、誤り訂正データ格納部２７０に格納されている学習済みモデルのパラメータから学習済みモデルを構築して、ベクトルＸに対する冗長データを生成する（ステップＳ３１５）。

そして、抽出部２３０ｂは、固定値ベクトル及び冗長データで誤り訂正処理を行って、最終的な固定値ベクトルを生成する（ステップＳ３１７）。

例えば、上で述べた例と同じ対象についてステップＳ３１３でＸ＝（０．４，０．６）が得られて、固定値ベクトルＺ＝（１，０）が得られたとしても、ステップＳ３１５で冗長データ（１，０，１，０，１，０，０）又はそれに近いデータが得られれば、誤り訂正処理にて、Ｚ＝（１，１）に訂正できるようになる。

なお、ステップＳ３１７の後に、図１７におけるステップＳ２０５のような処理を行うようにしてもよい。

以上のような誤り訂正データを検出装置２００ｂに配布しておくことにより、検出装置２００ｂにおける測定に対するノイズ耐性が高くなる。

［実施の形態３］
第２の実施の形態とは異なる態様で誤り訂正データを生成し、それを用いた誤り訂正処理を行ってもよい。

本実施の形態に係る誤り訂正データ生成部１８０の処理内容について、図２１を用いて説明する。この処理は、例えば、図２のステップＳ１５の前又は後に実行する。但し、Ｌ２は冗長性を持たせ長めに設定する。

まず、誤り訂正データ生成部１８０は、生成された超曲面に基づき、各対象ｉの固定値ベクトルＺiを生成する（ステップＳ３２１）。このステップは、図２のステップＳ１３における処理の一部と同じである。

そして、誤り訂正データ生成部１８０は、固定値ベクトルの各要素ｉについて、当該要素ｉ以外の要素の値を入力とし、当該要素ｉの値を教師データとする機械学習を実施し、学習済みモデルを生成する（ステップＳ３２３）。例えばニューラルネットワークに基づく所定のモデルを用意して既存のアルゴリズムによって学習を行うことで学習済みモデルを生成する。誤り訂正データ生成部１８０は、学習済みモデルのパラメータを、第３データ格納部１９０に格納する。

ここで、固定値ベクトルＺi＝（ａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇ，ｈ，ｋ）（ａ乃至ｋは全て１又は０）が得られたとすると、第１の要素「ａ」を教師データとして、残りの要素「ｂ，ｃ，ｄ，ｅ，ｆ，ｇ，ｈ，ｋ」を入力とする機械学習を行って、学習済みモデルｇ₁を生成する。また、第２の要素「ｂ」を教師データとして、残りの要素「ａ，ｃ，ｄ，ｅ，ｆ，ｇ，ｈ，ｋ」を入力とする機械学習を行って、学習済みモデルｇ₂を生成する。同様にして、Ｌ２＝９番目の要素「ｋ］を教師データとし、残りの要素「ａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇ，ｈ」を入力とする機械学習を行って、学習済みモデルｇ₉を生成する。

なお、これは一例であって、複数の要素を教師データとし、当該複数の要素の残りの要素を入力とするようにしてもよい。例えば、「ａ，ｂ，ｃ」を教師データとして、残りの要素「ｄ，ｅ，ｆ，ｇ，ｋ」を入力とする機械学習を行い、「ｄ，ｅ，ｆ」を教師データとして、残りの要素「ａ，ｂ，ｃ，ｇ，ｈ，ｋ」を入力とする機械学習を行い、「ｇ，ｈ，ｋ」を教師データとし、残りの「ａ，ｂ，ｃ，ｄ，ｅ，ｆ」を入力とする機械学習を行う、といったように変形することも可能である。要するに、複数の学習済みモデルを生成して、それらを用いて全ての要素を相補的に推測できるようにする。

そして、配信部１６０ｂは、第３データ格納部１９０に格納されている学習済みモデルのパラメータを、各検出装置２００ｂに配信する（ステップＳ３２５）。このデータについても、オフラインで配布するようにしてもよい。

これに対して、検出装置２００ｂにおける処理を図２２に示す。

まず、測定部２１０は、特定の対象に対して所定の測定を行って、測定結果に基づき、Ｌ１次元のベクトルＸを生成し、測定データ格納部２２０に格納する（ステップＳ３３１）。このステップは、図１７のステップＳ２０１と同じである。

また、抽出部２３０ｂは、パラメータ格納部２６０に格納されているパラメータに係る超曲面に基づき、ベクトルＸから、対象の第１評価ベクトルを生成する（ステップＳ３３３）。

本実施の形態では、パラメータ格納部２６０には、ｆ_j（）（１≦ｊ≦Ｌ２）のパラメータが格納されているので、Ｙ’＝（ｙ₁，ｙ₂，．．．，ｙ_L2）＝（ｆ₁（Ｘ），ｆ₂（Ｘ），．．．，ｆ_L2（Ｘ））を算出し、これを初期的な第１評価ベクトルとして用いる。

さらに、抽出部２３０ｂは、誤り訂正データ格納部２７０に格納されている複数の学習済みモデルのパラメータから複数の学習済みモデルを構築し、第１評価ベクトルに対して当該複数の学習済みモデルを適用して、第２評価ベクトルを生成する（ステップＳ３３５）。

例えば、第１評価ベクトルがＹ’＝［０．９，０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６］が得られたとすると、上の例では、ｇ₁（０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６）、ｇ₂（０．９，０．５，０．３，０．８，０．５，０．７，０．１，０．６）、．．．ｇ₉（０．９，０．１，０．５，０．３，０．８，０．５，０．７，０．１）を計算する。そうすると、例えば、第２評価ベクトルＹ”＝（０．８，０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６）が得られる。

そして、抽出部２３０ｂは、第１評価ベクトルと第２評価ベクトルとから、候補ベクトルを生成する（ステップＳ３３７）。ここでは、第１評価ベクトルと第２評価ベクトルの同一要素について閾値との差が大きい方を採用するか、同一要素の間の任意の値（予め定められたルールに従って決定される値。例えば実験的に定める。）を採用する関数Ｇ₂（Ｙ’，Ｙ”）を適用する。

例えば、Ｙ’＝［０．９，０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６］で、Ｙ”＝（０．８，０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６）が得られた場合、異なる値は第１要素だけである。ここでは、０．９と０．８のうち、例えば閾値０．５との差が大きい方である「０．９」を採用する。そうすると、Ｙ'''＝（０．９，０．１，０．５，０．３，０．８，０．５，０．７，０．１，０．６）が得られる。

そうすると、抽出部２３０ｂは、候補ベクトルＹ'''の全要素が閾値から所定値以上離れているか否かを判断する（ステップＳ３３９）。例えば、各要素について、｜要素値－閾値｜≧所定値であるか否かを判断する。

この要件を満たしていない場合には、抽出部２３０ｂは、候補ベクトルを新たな第１評価ベクトルに設定する（ステップＳ３４１）。そして、処理はステップＳ３３５に戻って、新たな第１評価ベクトルから新たな第２評価ベクトルを生成する。

一方、ステップＳ３３９の要件を満たす場合には、抽出部２３０ｂは、候補ベクトルに対して離散化処理（round()）を行い、最終的な固定値ベクトルを生成する（ステップＳ３４３）。

なお、ステップＳ３４３の後に、図１７におけるステップＳ２０５のような処理を行うようにしてもよい。

以上のような誤り訂正データを検出装置２００ｂに配布する場合でも、検出装置２００ｂにおける測定に対するノイズ耐性が高くなる。

なお、ステップＳ３３９の要件を複数回チェックしても要件を満たさない場合には、エラーを出力するなどしても良い。

［実施の形態４］
第２及び３の実施の形態とは異なる態様で誤り訂正データを生成し、それを用いた誤り訂正処理を行ってもよい。

本実施の形態に係る誤り訂正データ生成部１８０の処理内容について、図２３を用いて説明する。この処理は、例えば、図２のステップＳ１５の前又は後に実行する。

まず、誤り訂正データ生成部１８０は、生成された超曲面に基づき、各対象ｉの固定値ベクトルＺiを生成する（ステップＳ３５１）。このステップは、図２のステップＳ１３における処理の一部と同じである。

配信部１６０ｂは、この固定値ベクトルＺiそのものを誤り訂正データとして、各検出装置２００ｂに配信する（ステップＳ３５３）。Ｚiについては全ての対象ｉ（１≦ｉ≦Ｌ３）について各検出装置２００ｂに送信してもよいし、本実施の形態以外の実施の態様において誤り訂正能力が低い対象のみに限定して各検出装置２００ｂに配信し、他の実施の形態の誤り訂正方式と組み合わせても良い。

このデータについても、オフラインで配布するようにしてもよい。

これに対して、検出装置２００ｂでは、図２４に示すような処理を実行する。

まず、測定部２１０は、特定の対象に対して所定の測定を行って、測定結果に基づき、Ｌ１次元のベクトルＸを生成し、測定データ格納部２２０に格納する（ステップＳ３６１）。このステップは、図１７のステップＳ２０１と同じである。

そして、抽出部２３０ｂは、情報処理装置１００ｂから配信され且つパラメータ格納部２６０に格納されているパラメータに係る超曲面で、ベクトルＸを評価して、対象の候補ベクトルを生成する（ステップＳ３６３）。このステップは、図１７のステップＳ２０３と同じであるが、以下で誤り訂正のための処理を行うので候補ベクトルとして示している。

その後、抽出部２３０ｂは、誤り訂正データ格納部２７０に格納されている固定値ベクトルと候補ベクトルとを比較して、候補ベクトルに最も近い固定値ベクトルを特定して、出力する（ステップＳ３６５）。

このような処理を行うようにしても、確実に対象の固定値ベクトルを得ることができるようになる。また、Ｘi自体を保存するよりデータサイズを削減でき、Ｘiに特徴が無いようなランダムなデータに対してもデータサイズを削減できる。

以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、処理フローは一例であって、処理結果が変わらない限り、ステップの順番入れ替えや複数ステップの並列実行を行うようにしてもよい。

なお、上で述べた情報処理装置１００及び１００ｂ並びに検出装置２００及び２００ｂの少なくとも一部は、コンピュータ装置であって、図２５に示すように、メモリ２５０１とＣＰＵ（Central Processing Unit）２５０３とハードディスク・ドライブ（ＨＤＤ：Hard Disk Drive）２５０５と表示装置２５０９に接続される表示制御部２５０７とリムーバブル・ディスク２５１１用のドライブ装置２５１３と入力装置２５１５とネットワークに接続するための通信制御部２５１７とがバス２５１９で接続されている。なお、ＨＤＤはソリッドステート・ドライブ（ＳＳＤ：Solid State Drive）などの記憶装置でもよい。オペレーティング・システム（ＯＳ：Operating System）及び本発明の実施の形態における処理を実施するためのアプリケーション・プログラムは、ＨＤＤ２５０５に格納されており、ＣＰＵ２５０３により実行される際にはＨＤＤ２５０５からメモリ２５０１に読み出される。ＣＰＵ２５０３は、アプリケーション・プログラムの処理内容に応じて表示制御部２５０７、通信制御部２５１７、ドライブ装置２５１３を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ２５０１に格納されるが、ＨＤＤ２５０５に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク２５１１に格納されて頒布され、ドライブ装置２５１３からＨＤＤ２５０５にインストールされる。インターネットなどのネットワーク及び通信制御部２５１７を経由して、ＨＤＤ２５０５にインストールされる場合もある。このようなコンピュータ装置は、上で述べたＣＰＵ２５０３、メモリ２５０１などのハードウエアとＯＳ及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。

なお、上で述べたような処理を実行することで用いられるデータは、処理途中のものであるか、処理結果であるかを問わず、メモリ２５０１又はＨＤＤ２５０５等の記憶装置に格納される。

以上述べた実施の形態をまとめると以下のようになる。

本実施の形態の第１の態様に係る情報処理方法は、（Ａ）複数の対象の各々を表す入力ベクトルを取得するステップと、（Ｂ）入力ベクトルを包含する空間を複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップとを含む。

このような性質を有する超曲面を生成して保持しておくことにより、対象にＩＤ等が付されていない状況や対象を変更したり加工したりできない状況においても、後の抽出フェーズ（又は検出フェーズ）において、対象から固有のデータを確実に抽出できるようになる。

なお、上記情報処理方法は、（Ｃ）生成された複数の超曲面のパラメータを、複数の対象の少なくともいずれかに対して当該対象を識別するユニークなベクトルを生成する装置に出力するステップをさらに含むようにしてもよい。このような装置に超曲面のパラメータを出力しておけば、当該装置で対象を識別するユニークなベクトルを生成できるようになり、当該ユニークなベクトルを基に属性データの抽出その他の後処理を容易にできるようになる。

さらに、上記情報処理方法は、（Ｄ）上記ユニークなベクトルの誤り訂正のためのデータを生成し、上記装置に出力するステップをさらに含むようにしてもよい。上記装置における測定におけるノイズにより適切に対処できるようになる。

なお、上で述べた複数の超曲面を生成するステップにおいて、複数の超曲面又は複数の超曲面のうち一定数以上の超曲面が、複数の対象の各々を表す入力ベクトルを当該超曲面で写像した点と閾値との距離が所定値以上離れるように生成されるようにしてもよい。ノイズ耐性が高まる。

さらに、上で述べた複数の超曲面を生成するステップにおいて、複数の超曲面が、互いの類似度が閾値未満であるように生成されるようにしてもよい。分布の偏りを是正できるようになる。

さらに、上で述べた誤り訂正のためのデータを生成する処理が、（ｄ１）複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップと、（ｄ２）上記ユニークなベクトルの各々に対して、誤り訂正符号による冗長データを生成するステップと、（ｄ３）複数の対象の各々を表す入力ベクトルを入力とし、当該対象についてのユニークなベクトルに対する冗長データを出力とするモデルに対して機械学習を実行し、学習済みモデルを生成するステップとを含むようにしてもよい。既によく知られている誤り訂正符号を活用するものである。

また、上で述べた誤り訂正のためのデータを生成する処理が、（ｄ４）複数の対象の各々を表す入力ベクトルを、生成された複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップと、（ｄ５）複数の対象の各々を識別するユニークなベクトルにおける一部の要素を出力とし、当該ユニークなベクトルにおける上記一部の要素以外の要素を入力とするモデルに対して機械学習を実行し、上記ユニークなベクトルの全ての要素を推測できるように複数の学習済みモデルを生成するステップとを含むようにしてもよい。このようにすれば、対象を識別するユニークなベクトルを相補的に復元するための学習済みモデルが得られるようになる。

さらに、上で述べた誤り訂正のためのデータを生成する処理が、（ｄ６）複数の対象の各々を表す入力ベクトルを、生成された複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップを含むようにしてもよい。対象の個数分のユニークなベクトルが誤り訂正データとして生成されるためデータサイズは大きくなる場合があるが、誤り訂正データ生成のための処理負荷は低い。

本実施の形態の第２の態様に係る情報処理方法は、（Ａ）複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、（Ｂ）上記ベクトルを包含する空間を複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて、特定の対象を表すベクトルを評価することで、特定の対象を識別するベクトルを生成する生成ステップとを含む。

このように、上記のような性質を有する超曲面のデータを予め得ておけば、対象にＩＤ等が付されていない状況においても、対象から固有のデータを確実に抽出できる。そして、生成されたベクトルを用いれば、例えば、対応付けられた属性データなどを取得して、様々な処理を行うことができるようになる。

なお、上記情報処理方法は、（Ｃ）予め保持している、誤り訂正のためのデータを用いて、生成された上記ベクトルに対する誤り訂正処理を行うステップをさらに含むようにしてもよい。

例えば、誤り訂正のためのデータが、ある対象を表す入力ベクトルを入力とし、当該ある対象についての、誤り訂正符号による冗長データを出力とする機械学習の学習済みモデルである場合、上で述べた誤り訂正処理が、（ｃ１）特定の対象を表す入力ベクトルから、学習済みモデルにより、誤り訂正符号による冗長データを生成するステップと、（ｃ２）誤り訂正符号に基づき、特定の対象を識別するベクトルと生成された冗長データとから、特定の対象を識別する訂正後のベクトルを生成するステップとを含むようにしてもよい。このような学習済みモデルを用いることで誤り訂正のための冗長データを復元でき、既によく知られている誤り訂正符号を活用して対象を識別するベクトルの誤りを訂正できるようになる。

また、誤り訂正のためのデータが、複数の対象の各々を識別するユニークなベクトルである場合、上で述べた誤り訂正処理が、（ｃ３）複数の対象の各々を識別するユニークなベクトルのうち、特定の対象を識別するベクトルと最も近いユニークなベクトルを特定するステップを含むようにしてもよい。

さらに、誤り訂正のためのデータが、ある対象のためのベクトルにおける一部の要素を出力とし、当該ある対象のためのベクトルにおける上記一部の要素以外の要素を入力とし、ある対象のためのベクトルの全ての要素を推測できるように複数生成された学習済みモデルである場合、上で述べた生成ステップが、（ｂ１）複数の超曲面により入力ベクトルを変換することで得られる第１ベクトルから、上記学習済みモデルにより、第２ベクトルを生成する第１ステップと、（ｂ２）第１ベクトルと第２ベクトルとの要素毎の比較に基づき、候補となるベクトルを生成する第２ステップと、（ｂ３）候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となるか判定する第３ステップと、（ｂ４）候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となる場合には、候補となるベクトルの各要素に対して離散化処理を実行するステップと、（ｂ５）候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値未満である場合には、候補となるベクトルを第１ベクトルとして、第１ステップ乃至第３ステップを実行するステップとを含むようにしてもよい。

以上述べた情報処理方法をコンピュータに実行させるためのプログラムを作成することができて、そのプログラムは、様々な記憶媒体に記憶される。

また、上で述べたような情報処理方法を実行する情報処理装置は、１台のコンピュータで実現される場合もあれば、複数台のコンピュータで実現される場合もあり、それらを合わせて情報処理システム又は単にシステムと呼ぶものとする。

１００，１００ｂ情報処理装置
１１０測定部
１２０第１データ格納部
１３０パラメータ生成部
１４０第２データ格納部
１５０登録部
１６０，１６０ｂ配信部
１７０対象ＤＢ
１８０誤り訂正データ生成部
１９０第３データ格納部
２００，２００ｂ検出装置
２１０測定部
２２０測定データ格納部
２３０，２３０ｂ抽出部
２４０後処理部
２５０設定部
２６０パラメータ格納部
２７０誤り訂正データ格納部

Claims

複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップと、
前記ユニークなベクトルの各々に対して、誤り訂正符号による冗長データを生成するステップと、
前記複数の対象の各々を表す入力ベクトルを入力とし、当該対象についての前記ユニークなベクトルに対する冗長データを出力とするモデルに対して機械学習を実行し、学習済みモデルを生成するステップと、
を含むプログラム。
複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップと、
前記複数の対象の各々を識別する前記ユニークなベクトルにおける一部の要素を出力とし、当該ユニークなベクトルにおける前記一部の要素以外の要素を入力とするモデルに対して機械学習を実行し、前記ユニークなベクトルの全ての要素を推測できるように複数の学習済みモデルを生成するステップと、
を含むプログラム。
複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップ
を含むプログラム。
複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、
前記特定の対象を表すベクトルを、前記ベクトルを包含する空間を前記複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて評価することで、前記特定の対象を識別するベクトルを生成する生成ステップと、
を、コンピュータに実行させるためのプログラム。
予め保持している、誤り訂正のためのデータを用いて、生成された前記ベクトルに対する誤り訂正処理を行うステップ
を前記コンピュータにさらに実行させる請求項４記載のプログラム。
前記誤り訂正のためのデータが、ある対象を表す入力ベクトルを入力とし、当該ある対象についての、誤り訂正符号による冗長データを出力とする機械学習の学習済みモデルである場合、
前記誤り訂正処理が、
前記特定の対象を表す入力ベクトルから、前記学習済みモデルにより、前記誤り訂正符号による冗長データを生成するステップと、
前記誤り訂正符号に基づき、前記特定の対象を識別するベクトルと生成された前記冗長データとから、前記特定の対象を識別する訂正後のベクトルを生成するステップと、
を含む請求項５記載のプログラム。
前記誤り訂正のためのデータが、前記複数の対象の各々を識別するユニークなベクトルである場合、
前記誤り訂正処理が、
前記複数の対象の各々を識別するユニークなベクトルのうち、前記特定の対象を識別するベクトルと最も近いユニークなベクトルを特定するステップ
を含む請求項５記載のプログラム。
誤り訂正のためのデータが、
ある対象のためのベクトルにおける一部の要素を出力とし、当該ある対象のためのベクトルにおける前記一部の要素以外の要素を入力とし、前記ある対象のためのベクトルの全ての要素を推測できるように複数生成された学習済みモデルである場合、
前記生成ステップが、
前記複数の超曲面により前記入力ベクトルを変換することで得られる第１ベクトルから、前記学習済みモデルにより、第２ベクトルを生成する第１ステップと、
前記第１ベクトルと前記第２ベクトルとの要素毎の比較に基づき、候補となるベクトルを生成する第２ステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となるか判定する第３ステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となる場合には、前記候補となるベクトルの各要素に対して前記離散化処理を実行するステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値未満である場合には、前記候補となるベクトルを前記第１ベクトルとして、前記第１ステップ乃至第３ステップを実行するステップと、
を含む請求項４記載のプログラム。
複数の対象に含まれる特定の対象を表すベクトルを取得する手段と、
前記特定の対象を表すベクトルを、前記ベクトルを包含する空間を前記複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて評価することで、前記特定の対象を識別するベクトルを生成する手段と、
を有する情報処理システム。