JP5862413B2 - 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 - Google Patents

情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 Download PDF

Info

Publication number
JP5862413B2
JP5862413B2 JP2012075195A JP2012075195A JP5862413B2 JP 5862413 B2 JP5862413 B2 JP 5862413B2 JP 2012075195 A JP2012075195 A JP 2012075195A JP 2012075195 A JP2012075195 A JP 2012075195A JP 5862413 B2 JP5862413 B2 JP 5862413B2
Authority
JP
Japan
Prior art keywords
conversion rule
conversion
information
binary string
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012075195A
Other languages
English (en)
Other versions
JP2013206193A (ja
JP2013206193A5 (ja
Inventor
真一 白川
真一 白川
真喜子 此島
真喜子 此島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012075195A priority Critical patent/JP5862413B2/ja
Priority to US13/717,149 priority patent/US9116898B2/en
Publication of JP2013206193A publication Critical patent/JP2013206193A/ja
Publication of JP2013206193A5 publication Critical patent/JP2013206193A5/ja
Application granted granted Critical
Publication of JP5862413B2 publication Critical patent/JP5862413B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法に関する。
従来、データベースに登録された複数のデータから、入力されたクエリデータとの類似度や関連の強さが所定の条件を満たすデータを検索する技術が知られている。このような技術の一例として、各データ間の類似度や関連の強さを特徴量ベクトルの多次元空間における距離で示し、クエリデータとの距離が閾値以内となるデータや、クエリデータに近い方から所定の数のデータを選択する近傍検索の技術が知られている。
図8は、従来の近傍検索を説明するための図である。例えば、近傍検索を実行する情報処理装置は、図8中の白丸で示すように、検索対象となるデータの特徴量ベクトルを記憶する。そして、情報処理装置は、図8中(A)で示すクエリデータを取得すると、クエリデータと特徴量ベクトルとの距離を算出し、図8中(B)に示すように、クエリデータとの距離が所定の範囲内となるデータをクエリデータの近傍データとする。
ここで、データベースに多数のデータが登録されている際に、データベースに登録された全てのデータとクエリデータとの距離を算出した場合は、近傍検索に要する計算コストが増大する。このため、特徴量ベクトル空間のインデックスをあらかじめ作成したり、特定の特徴量ベクトルからの距離を利用したインデックスを用いて、検索対象とするデータを限定することで、近傍検索を実行するための計算コストを削減する技術が知られている。しかし、これらの方法は、特徴量ベクトルの次元数が増大すると、計算コストを削減することができなくなる。
そこで、検索処理における計算コストを削減するため、検索結果の厳密性を緩和し、クエリデータに対して近似的な類似データの集合を取得することで、検索処理を高速化する方法が知られている。例えば、バイナリ列同士の一致検索やハミング距離の計算は、ベクトル間の距離の計算よりも高速に行える。そこで、特徴量ベクトル間の距離関係を保ちつつ特徴量ベクトルをバイナリ列に変換し、クエリデータを変換したバイナリ列との一致検索やハミング距離を計算することで、計算コストを削減する方法が知られている。
以下、このような特徴量ベクトルをバイナリ列に変換する方法の一例について説明する。図9は、バイナリ化による検索処理を説明するための図である。なお、図9に示す例では、図9中の白丸で示す特徴量ベクトルを、2桁のバイナリ列に変換する方法について説明する。
例えば、情報処理装置は、図9中の白丸で示す特徴量ベクトルを記憶する。ここで、情報処理装置は、射影関数を適用し、図9中の点線よりも上の範囲に含まれる特徴量ベクトルについては、バイナリ列の一桁目を「1」とし、点線よりも下の範囲に含まれる特徴量ベクトルについては、バイナリ列の一桁目を「0」とする。また、情報処理装置は、図9中の実線よりも右の範囲に含まれる特徴量ベクトルについては、バイナリ列の二桁目を「1」とし、実線よりも左の範囲に含まれる特徴量ベクトルについては、バイナリ列の二桁目を「0」とする。
この結果、各特徴量ベクトルは、「01」、「11」、「00」、「10」のいずれかに変換される。そして、情報処理装置は、図9中(C)に示すように、クエリデータを変換したバイナリ列が「11」となる場合は、ハミング距離が「0」となるバイナリ列、すなわちバイナリ列が「11」となる特徴量ベクトルをクエリデータの近傍データとする。
特許第2815045号公報 特開2006−277407号公報 特開2007−249339号公報
M. Datar, N. Immorlica, P. Indyk, and V. S. Mirrokni: Locality-sensitive hashing scheme based on p-stable distributions, Proceedings of the twentieth annual symposium on Computational Geometry (SCG '04), pp.253-262 (2004) M. Charikar: Similarity estimation techniques from rounding algorithms, Proceedings of the 34th Symposium on Theory of Computing (STOC '02), pp.380-388 (2002) Y. Weiss, A. Torralba, and R. Fergus: Spectral hashing, Advances in Neural Information Processing Systems 21 (NIPS '08) (2008) B. Kulis and T. Darrell: Learning to hash with binary reconstructive embeddings, Advances in Neural Information Processing Systems 22 (NIPS '09) (2009) M. Norouzi and D. Fleet: Minimal Loss hashing for compact binary codes, Proceedings of the 28th International Conference on Machine Learning (ICML '11) (2011) D. G. Lowe: Distinctive image features from scale-invariant keypoints, Internal Journal of Computer Vision, Vol.60, No.2, pp.91-110 (2004) H. Bay, A. Ess, T. Tuytelaars, L. V. Gool: SURF: Speeded up robust features, Computer Vision and Image Understanding (CVIU), Vol.110, No.3, pp.346-359 (2008) K. Kira and L. A. Rendell: A practical approach to feature selection, Proceedings of the 9th International Workshop on Machine Learning, pp.249-256 (1992) R. Gilad-Bachrachy, A. Navotz, and N. Tishby: Margin based feature selection - theory and algorithms, Proceedings of the 21st International Conference on Machine Learning (ICML '04), pp.43-50 (2004)
ここで、特徴量ベクトルをバイナリ列に変換した際に検索精度を保つためには、元の特徴量ベクトル間の距離関係を保ちつつバイナリ列に変換することが重要である。しかしながら、上述した特徴量ベクトルをバイナリ列に変換する技術では、閾値処理を用いて連続値の特徴量ベクトルを不連続なバイナリ列に変換するので、特徴量ベクトルの距離関係を保ちつつバイナリ列に変換する変換関数の最適化が困難であるという問題がある。
1つの側面では、本発明は、検索対象となるデータ集合ごとに、変換関数を容易に最適化することを目的とする。
1つの側面では、特徴量ベクトルを所定のビット長のバイナリ列に変換するコンピュータに、特徴量ベクトルを所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成させる情報変換規則生成プログラムである。また、情報変換規則生成プログラムは、コンピュータに、生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを第1ビット長を有する複数の第1バイナリ列に変換させる。また、情報変換規則生成プログラムは、特定の複数の特徴量ベクトルの関係に関する関係情報と、複数の第1バイナリ列とに基づき第1の変換規則により変換されるバイナリ列における各ビットの距離反映度を算出させる。また、情報変換規則生成プログラムは、算出した距離反映度と第1の変換規則とに基づき第2の変換規則を生成させる
1実施形態では、検索対象となるデータごとに、変換関数を容易に最適化できる。
図1は、実施例1に係る検索システムの機能構成を説明するための図である。 図2は、生体認証の一例を説明するための図である。 図3は、検索対象データベース記憶部が記憶する情報の一例を説明するための図である。 図4は、バイナリデータベース記憶部が記憶する情報の一例を説明するための図である。 図5は、変換規則を生成する処理の流れを説明するためのフローチャートである。 図6は、変換関数の重要度を算出する処理の流れを説明するためのフローチャートである。 図7は、情報変換プログラムを実行するコンピュータの一例を説明するための図である。 図8は、従来の近傍検索を説明するための図である。 図9は、実数ベクトルのバイナリ化による検索処理を説明するための図である。
以下に添付図面を参照して本願に係る情報変換プログラム、情報変換装置および情報変換方法について説明する。
以下の実施例1では、図1を用いて、情報変換装置を有する検索システムの一例を説明する。図1は、実施例1に係る検索システムを説明するための図である。図1に示すように、検索システム1は、クライアント装置2、情報変換装置10、情報検索装置20を有する。
また、情報変換装置10は、学習データ記憶部11、変換規則生成部12、重要度算出部13、変換規則決定部14を有する。また、情報検索装置20は、検索対象データベース記憶部21、バイナリ変換部23、バイナリデータベース記憶部22、検索処理部24を有する。
図1に示す検索システム1は、クライアント装置2からクエリデータを受信すると、検索対象データベース記憶部21から、クエリデータの近傍データを検索する。そして、検索システム1は、クエリデータの近傍に類似するデータが登録されているか否かをクライアント装置2へ通知するシステムである。具体的には、検索システム1は、情報変換装置10が生成した変換規則を用いて、情報検索装置20が検索対象となるデータをバイナリ列に変換し、変換後のバイナリ列を用いて、クエリデータの近傍データを検索する。
ここで、検索システム1が検索対象とするデータは、例えば、画像や音声などのデータであり、指紋のパターンや静脈のパターンを用いた生体認証における生体データである。すなわち、検索システム1は、クライアント装置2に入力された利用者の生体データをクエリデータとして受信すると、利用者の生体データが登録されているか否かを判別するシステムである。
なお、画像や音声の特徴量は様々なものが提案されているが、検索システム1は、特定の特徴量に依存するものではないため、任意の特徴量を用いることができる。例えば、画像の特徴量として一般的に用いられているSIFT特徴量やSURF特徴量などを用いることもできる。これらの特徴量は画像中の局所的な情報を特徴量ベクトルとして用いることで、隠れや変動に対してロバストな特徴量であることが知られているが、このような特徴量を示す任意の形式の特徴量ベクトルを用いてよい。
図2は、生体認証の一例を説明するための図である。なお、図2に示す例では、利用者のID(Identification)等の情報が入力されず、利用者のIDを用いた生体データの絞込みを行わないIDレスの1:N認証における処理を示す。図2に示すように、検索システム1は、複数の利用者が登録した登録生体データを複数記憶する。
そして、検索システム1は、クライアント装置2からクエリデータとして、生体データを受信すると、入力された生体データの特徴量を示す特徴量ベクトルを抽出し、抽出した特徴量ベクトルと類似する特徴量ベクトルを有する登録生体データを検索する。すなわち、検索システム1は、クエリデータを入力した利用者の登録生体データが登録されているか否かを判別する。
また、検索システム1は、特徴量ベクトルを所定のビット長のバイナリ列に変換する変換規則を生成し、生成した変換規則を用いて、登録生体データの特徴量ベクトルをバイナリ列に変換する。また、検索システム1は、クエリデータとして入力された生体データにおける特徴量ベクトルを所定のビット長のバイナリ列に変換し、登録生体データの特徴量ベクトルを変換したバイナリ列とのハミング距離を算出する。そして、検索システム1は、ハミング距離が所定の閾値以下となる登録生体データを検索対象の候補として抽出する。その後、情報検索装置1は、検索した登録生体データとクエリデータとして入力された生体データとの厳密なマッチング処理を実行し、実行結果をクライアント装置2に出力する。
このように、検索システム1は、検索対象となる登録生体データの特徴を示す特徴量ベクトルを所定のバイナリ列に変換し、クエリデータの特徴量ベクトルを変換したバイナリ列とのハミング距離を算出することにより、検索対象とするデータの絞込みを行う。そして、検索システム1は、絞り込んだデータとクエリデータとのマッチングを行うことで、生体認証におけるマッチングを行う。
なお、入力された生体データや登録生体データが画像である場合には、特徴量ベクトルは、例えば、画像中の特定領域における隆線の方向や長さ、勾配、隆線の終端や分岐などの特徴的な点の密度や座標の数値をベクトル化したものとなる。また、入力された生体データや登録生体データが音声である場合には、特徴量ベクトルは、例えば、周波数成分の分布、強度、ピーク値などの数値をベクトル化したものとなる。
以下、情報変換装置10が実行する処理、および情報検索装置20が実行する処理について説明する。まず、情報変換装置10が実行する処理について説明する。情報変換装置10は、学習データ記憶部11が記憶する学習データを用いて、特徴量ベクトルを所定のビット長のバイナリ列に変換する変換規則を生成する。
具体的には、学習データ記憶部11は、学習データとして、利用者ごとに、複数の特徴量ベクトルを記憶する。ここで、学習データ記憶部11が記憶する特徴量ベクトルは、後述する検索対象データベース記憶部21が記憶する特徴量ベクトルの一部である。すなわち、学習データ記憶部11は、検索システム1に登録された登録生体データの特徴量ベクトルの一部を記憶する。
また、学習データ記憶部11は、検索対象データベース記憶部21が記憶する特徴量ベクトルのうち、複数の利用者によって登録された生体データの特徴量ベクトルを記憶する。なお、以下の説明においては、同一の利用者によって登録された複数の特徴量ベクトルを同一のクラスに属する特徴量ベクトルと記載する。すなわち、学習データ記憶部11は、あるクラスに属する特徴量ベクトルと、他のクラスに属する特徴量ベクトルを記憶する。
変換規則生成部12は、特徴量ベクトルを所定のビット長よりも長いビット長のバイナリ列に変換する変換規則を生成する。例えば、変換規則生成部12は、情報検索装置20が「M」ビットのバイナリ列を用いた検索処理を行う場合は、特徴量ベクトルを1ビットの値に変換する変換関数を「N」個生成する。ここで、「M」と「N」は、M<Nを満たす整数である。そして、変換規則生成部12は、生成した「N」個の変換関数を重要度算出部13に送信する。
また、変換規則生成部12は、変換規則決定部14からM個の変換関数を受信する。すると、変換規則生成部12は、新たにN−M個の変換関数を生成し、受信したM個の変換関数と、新たに生成したN−M個の変換関数とを重要度算出部13に送信する。
ここで、変換規則生成部12が生成する変換関数について説明する。例えば、変換規則生成部12は、N次元のパラメータベクトルwと、オフセットパラメータbとの組をN個生成する。そして、変換規則生成部12は、以下の式(1)で示す変換関数をN個生成する。
なお、式(1)中の太字のuとは、変換後のバイナリ列uにおけるi番目のビットであり、太字のxは、特徴量ベクトルである。また、以下の式(1)中のthr()は閾値関数であり、カッコ内に含まれる値が0以上であれば「1」に変換し、値が負の値であれば「0」に変換する関数である。
Figure 0005862413
すなわち、変換規則生成部12は、iの値が「1」から「N」までのN個の式(1)を生成し、生成したN個の変換関数を重要度算出部13へ送信する。なお、変換規則生成部12は、乱数等を用いて、対応するビット(添え字のiの値)ごとに異なる値のパラメータベクトルwとオフセットパラメータbとを生成する。
重要度算出部13は、変換規則生成部12からN個の変換関数を受信すると、学習データ記憶部11が記憶する特徴量ベクトルを取得し、各特長量ベクトルについて式(1)を算出することで、Nビットのバイナリ列uを生成する。例えば、重要度算出部13は、あるひとつの特徴量ベクトルについて、パラメータベクトルwとオフセットパラメータbを用いて、式(1)を計算し、バイナリ列uの1ビット目のビットuの値を算出する。そして、重要度算出部13は、他のパラメータベクトルw〜wとオフセットパラメータb〜bを用いて、バイナリ列uの他のビットu〜uの値を算出する。
そして、重要度算出部13は、学習データ記憶部11が記憶する特徴量ベクトルの距離関係に応じて、バイナリ列uの各ビットu〜uの重要度を算出する。すなわち、情報変換装置10は、バイナリ列uの各ビットu〜uの重要度を算出することで、特徴量ベクトルを各ビットu〜uに変換するN個の変換関数の重要度を評価する。
ここで、重要度算出部13がバイナリ列uの各ビットu〜uの重要度を算出する方法は、変換前の特徴量ベクトル同士の距離関係を適切に保持するものであれば、任意の手法を用いることができる。例えば、重要度算出部13は、非特許文献8で示されるRELIEFや、非特許文献9で示されるSimbaと呼ばれる手法を用いて、各ビットu〜uの重要度を算出することができる。
以下、重要度算出部13がバイナリ列uの各ビットu〜uの重要度を算出する処理の一例として、特徴量ベクトルが所属するクラスに応じて、バイナリ列uの各ビットu〜uの重要度を算出する処理について説明する。まず、重要度算出部13は、変換規則生成部12から受信した変換関数を用いて、学習データ記憶部11が記憶する特徴量ベクトルを、Nビットのバイナリ列に変換する。
そして、重要度算出部13は、1つのバイナリ列をバイナリ列uとしてサンプリングし、以下の式(2)を用いて、バイナリ列uと他のバイナリ列との重み付きハミング距離を算出する。ここで、式(2)中のsとは、ビットuの重要度であり、例えば、初期状態においては、全てのビットu〜uに対して「1」が設定される。また、式(2)中のvとは、バイナリ列uとの比較対象となるバイナリ列である。
Figure 0005862413
そして、重要度算出部13は、以下の式(3)を用いて、バイナリ列uのビットuの重要度を更新する。ここで、nearhit(u)とは、バイナリ列uの変換元となる特徴量ベクトルと同じクラスの特徴量ベクトルを変換元とするバイナリ列のうち、重み付きハミング距離が最も近いバイナリ列のi番目のビット値である。また、nearmiss(u)とは、バイナリ列uの変換元となる特徴量ベクトルとは異なるクラスの特徴量ベクトルを変換元とするバイナリ列のうち、重み付きハミング距離が最も近いバイナリ列のi番目のビット値である。
Figure 0005862413
ここで、同じクラスの特徴量ベクトルは、同一利用者の生体データである。そこで、重要度算出部13は、式(2)および式(3)を用いて、同じクラスの特徴量ベクトルを変換したバイナリ列間のハミング距離が短くなる場合は、変換関数の重要度を向上させる。また、異なるクラスの特徴量ベクトルは、異なる利用者の生体データである。このため、異なるクラスの特徴量ベクトルをバイナリ列に変換した際は、ハミング距離が遠くなるほうが良い。このため、重要度算出部13は、式(2)および式(3)を用いて、異なるクラスの特徴量ベクトルを変換したバイナリ列間のハミング距離が短くなる場合は、変換関数の重要度を低下させる。
また、重要度算出部13は、式(2)および式(3)を用いて、所定の回数だけ各ビットの重要度s〜sを更新する。そして、重要度算出部13は、所定の回数だけ各ビットの重要度s〜sを更新した場合は、更新後の重要度s〜sを変換規則決定部14に通知する。また、重要度算出部13は、変換規則生成部12から受信した変換関数を変換規則決定部14に通知する。
このように、重要度算出部13は、特徴量ベクトルの距離関係や特徴量ベクトルが所属するクラスに応じて、重要度s〜sを更新するので、変換元の特徴量ベクトルの距離関係を保持する変換規則を生成することができる。なお、重要度算出部13は、クラスを考慮せずとも、変換元の特徴量ベクトルの距離関係に応じて、重要度s〜sを更新した場合は、変換元の特徴量ベクトルの距離関係を保持する変換関数の重要度を向上させるので、適切な変換規則を生成することができる。
変換規則決定部14は、特徴量ベクトルを所定の長さのバイナリ列に変換するように、重要度算出部13が算出した重要度に応じて、変換規則生成部12が生成した変換規則を修正する。具体的には、変換規則決定部14は、重要度算出部13が算出した重要度s〜sを受信する。すると、変換規則決定部14は、受信した重要度s〜sを比較し、重要度が大きい順にM個のビットを選択する。そして、変換規則決定部14は、特徴量ベクトルを選択したビットに変換したM個の変換関数を識別する。すなわち、変換規則決定部14は、特徴量ベクトル同士の距離関係を上手くバイナリ化したM個の変換関数を識別する。
また、変換規則決定部14は、所定の回数だけ、重要度の選択を行ったか否かを判別し、所定の回数だけ重要度の選択を行っていないと判別した場合は、識別したM個の変換関数を変換規則生成部12に通知する。一方、変換規則決定部14は、所定の回数だけ重要度の選択を行ったと判別した場合は、識別したM個の変換関数を情報検索装置20に送信する。
なお、変換規則決定部14は、異なる手法を用いて変換関数を選択してもよい。例えば、変換規則決定部14は、重要度が所定の閾値を超えたビットを選択し、特徴量ベクトルを選択したビットに変換した変換関数を識別する。そして、変換規則決定部14は、識別した変換関数の数がM個に達するまで、変換規則生成部12と重要度算出部13に、変換関数の生成と重要度の算出とを実行させる。その後、変換規則決定部14は、識別したM個の変換関数を情報検索装置20に送信する。
次に、情報検索装置20が実行する処理について説明する。検索対象データベース記憶部21は、検索対象となるデータ、すなわち、登録生体データの特徴量ベクトルを記憶する。具体的には、検索対象データベース記憶部21は、登録生体データの特徴量ベクトルと、登録生体データを登録した利用者の識別子であるデータIDとを対応付けて記憶する。つまり、検索対象データベース記憶部21は、特徴量ベクトルを所属するクラスごとに記憶する。
ここで、図3を用いて、検索対象データベース記憶部21が記憶する情報の一例について説明する。図3は、検索対象データベース記憶部が記憶する情報の一例を説明するための図である。例えば、図3に示す例では、検索対象データベース記憶部21は、データID「1」と複数の特徴量ベクトルとして、太字の「a」、「b」、「c」を対応付けて記憶する。なお、図3では省略したが、検索対象データベース記憶部21は、データID「1」と対応付けて、他の特徴量ベクトルを記憶する。また、検索対象データベース記憶部21は、他のデータIDと対応付けた特徴量ベクトルを記憶する。
図1に戻って、バイナリデータベース記憶部22は、所定の変換関数を用いて特徴量ベクトルを変換した記号列であって、バイナリ記号とワイルドカード記号とを含む記号列とデータIDとを対応付けて記憶する。以下、図4を用いて、バイナリデータベース記憶部22が記憶する情報の一例について説明する。
図4は、バイナリデータベース記憶部が記憶する情報の一例を説明するための図である。例えば、図4に示す例では、バイナリデータベース記憶部22は、データID「1」と対応付けて、Mビットのバイナリ列「01110100110…」を記憶する。なお、図4では記載を省略したが、バイナリデータベース記憶部22は、データID「1」と対応付けて、他にも複数の記号列を記憶する。すなわち、バイナリデータベース記憶部22は、検索対象データベース記憶部21が記憶する特徴量ベクトルを、後述するバイナリ変換部23が情報変換装置10から受信した変換関数を用いて変換したMビットのバイナリ列を、データIDごとに記憶する。
図1に戻って、バイナリ変換部23は、情報変換装置10の変換規則決定部14から変換数を受信した場合は、受信した変換関数を用いて、検索対象データベース記憶部21が記憶する特徴量ベクトルを、Mビットのバイナリ列に変換する。そして、バイナリ変換部23は、変換後のバイナリ列を、変換元の特徴量ベクトルと対応付けられたデータIDと対応付けて、バイナリデータベース記憶部22に格納する。
検索処理部24は、クライアント装置2からクエリデータを受信すると、受信したクエリデータの特徴量を示す特徴量ベクトルを抽出し、抽出した特徴量ベクトルを所定の変換関数でMビットのバイナリ列に変換する。そして、検索処理部24は、バイナリデータベース記憶部22が記憶するバイナリ列のうち、ハミング距離が所定の値以下となるバイナリ列、すなわち、クエリデータの近傍候補となる特徴量ベクトルのバイナリ列を検索する。
その後、検索処理部24は、検索したバイナリ列の変換元である特徴量ベクトルを検索対象データベース記憶部21から取得する。そして、検索処理部24は、取得した特徴量ベクトルに、クエリデータから抽出した特徴量ベクトルと一致する特徴量ベクトルや、ユークリッド距離が所定の閾値以下となる特徴量ベクトルが存在する場合は、以下の処理を実行する。すなわち、検索処理部24は、クエリデータが登録生体データに一致する旨をクライアント装置2へ送信する。
一方、検索処理部24は、取得した特徴量ベクトルに、クエリデータから抽出した特徴量ベクトルと一致する特徴量ベクトルや、ユークリッド距離が所定の閾値以下となる特徴量ベクトルが存在しない場合は、以下の処理を実行する。すなわち、検索処理部24は、クエリデータが登録生体データに一致しない旨をクライアント装置2へ送信する。この結果、クライアント装置2は、クエリデータを入力した利用者の生体認証を行うことができる。
例えば、変換規則生成部12、重要度算出部13、変換規則決定部14、バイナリ変換部23、検索処理部24とは、電子回路である。ここで、電子回路の例として、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路、またはCPU(Central Processing Unit)やMPU(Micro Processing Unit)などを適用する。
また、学習データ記憶部11、検索対象データベース記憶部21、バイナリデータベース記憶部22とは、RAM(Random Access Memory)、フラッシュメモリ(flash memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。
次に、図5を用いて、情報変換装置10が変換規則を生成する処理について説明する。図5は、変換規則を生成する処理の流れを説明するためのフローチャートである。まず、情報変換装置10は、終了条件の入力を受付ける(ステップS101)。例えば、情報変換装置10は、終了条件として、処理を繰り返す回数の設定を取得する。
次に、情報変換装置10は、Nビット分の変換関数を生成する(ステップS102)。そして、情報変換装置10は、各ビットの重要度s〜sを算出する(ステップS103)。次に、情報変換装置10は、ステップS103の処理で算出した各ビットの重要度s〜sに基づいて、Nビット分の変換関数からMビット分の変換関数を選択する(ステップS104)。
次に、情報変換装置10は、ステップS101にて受付けた終了条件を満たしているか否かを判別する(ステップS105)。そして、情報変換装置10は、終了条件を満たしていない場合は(ステップS105否定)、N−Mビット分の変換関数を新たに生成する(ステップS106)。そして、情報変換装置10は、ステップS106にて新たに生成したN−Mビット分の変換関数と、ステップS104にて選択したMビット分の変換関数を用いて、ステップS103の処理を実行する。
一方、情報変換装置10は、終了条件を満たした場合は(ステップS105肯定)、ステップS104にて選択したMビット分の変換関数を変換規則として情報検索装置20に出力し(ステップS107)、処理を終了する。
次に、図6を用いて、重要度算出部13が各ビットの重要度、すなわち、変換関数の重要度を算出する処理の流れについて説明する。図6は、変換関数の重要度を算出する処理の流れを説明するためのフローチャートである。なお、図6の処理は、図5に示すステップS103の処理と対応する。
まず、重要度算出部13は、学習用データとして、検索対象データベース記憶部21が記憶する特徴量ベクトルの一部をあらかじめ取得し、学習データ記憶部11に格納しておく(ステップS201)。この際、重要度算出部13は、複数のクラスに属する特徴量ベクトルを取得する。
次に、重要度算出部13は、各ビットの重要度s〜sをそれぞれ「1」に初期化する(ステップS202)。次に、重要度算出部13は、変換規則生成部12からNビット分の変換関数を取得すると、学習データ記憶部11に記憶された特徴量ベクトルの1つを学習データとしてランダムに選択する(ステップS203)。そして、重要度算出部13は、学習データについて式(2)および式(3)を計算し、各ビットの重要度s〜sをそれぞれ更新する(ステップS204)。
次に、重要度算出部13は、繰り返し回数が終了条件を満たしているか否かを判別する(ステップS205)。そして、重要度算出部13は、繰り返し回数が終了条件を満たしていると判別した場合は(ステップS205肯定)、重要度s〜sを変換規則決定部14に出力し(ステップS206)、処理を終了する。一方、重要度算出部13は、繰り返し回数が終了条件を満たしていないと判別した場合は(ステップS205否定)、ステップS203の処理を再度実行する。
[実施例1の効果]
上述したように、情報変換装置10は、特徴量ベクトルをビット長Nのバイナリ列に変換する変換規則を生成する。そして、情報変換装置10は、生成した変換規則を用いて、特徴量ベクトルをバイナリ列に変換し、特徴量ベクトルの距離関係に応じて、各ビットの重要度を算出する。
その後、情報変換装置10は、算出した重要度に応じて、特徴量ベクトルをビット長Mのバイナリ列に変換するように、変換規則を修正する。その後、情報検索装置20は、情報変換装置10が修正した変換規則を用いて、特徴量ベクトルをビット長Mのバイナリ列に変換する。この結果、検索システム1は、検索対象となるデータごとに最適な変換関数を生成することができる。
また、情報変換装置10は、特徴量ベクトルを1ビットのバイナリ列に変換する変換関数をN個生成し、生成したN個の変換関数を用いて、特徴量ベクトルをNビットのバイナリ列に変換する。そして、情報変換装置10は、Nビットのバイナリ列の各ビットについて重要度を算出し、算出した重要度に応じて、生成したN個の変換関数からM個の変換関数を選択する。
すなわち、情報変換装置10は、特徴量ベクトルを検索処理に求められるビット数よりも多いビットに変換する変換関数を生成し、生成した変換関数のうち、特徴量ベクトルの距離関係を保持するような変換を行う変換関数のみを選択する。この結果、情報変換装置10は、従来の比較して、短いビット数で特徴量ベクトルの距離関係を保持することができる。また、情報変換装置10は、短いビット数で特徴量ベクトルの距離関係を保持するバイナリ列を生成できるので、情報検索装置20における検索処理の速度を向上させることができる。
また、情報変換装置10は、同じクラスに所属する特徴量ベクトルから変換されたバイナリ列間のハミング距離を小さくするような変換規則を生成することができる。この結果、情報検索装置20におけるハミング距離を用いた検索処理の精度を向上させることができる。
また、情報変換装置10は、生成したN個の変換関数から、重要度が高いほうから順にM個の変換関数を選択する。この結果、情報変換装置10は、特徴量ベクトルをより正確にバイナリ列に変換する変換規則を生成することができる。
また、情報変換装置10は、以下の処理を繰り返し実行する。すなわち、情報変換装置10は、M個の変換関数を選択した後に、N−M個の変換関数を新たに生成し、選択したM個の変換関数と、N−M個の変換関数とを用いて、再度Nビットのバイナリ列を生成し、生成したバイナリ列の各ビットの重要度を算出する。そして、情報変換装置10は、算出した重要度に応じて、新たにM個の変換関数を選択する。
この結果、情報変換装置10は、重要度が他の変換関数よりも高くなる変換関数を、多くの変換関数の中から選択することができる。このため、情報変換装置10は、より精密な変換規則を生成することができる。
また、情報変換装置10は、重要度が所定の閾値を超えた変換関数をM個選択するまで、新たな変換関数の生成と、重要度の算出とを繰り返し実行する。このため、情報変換装置10は、重要度が他の変換関数よりも高くなる変換関数を、多くの変換関数の中から選択し、より精密な変換規則を生成することができる。
また、情報変換装置10は、ランダムに生成したsパラメータベクトルとオフセットパラメータとを用いて、変換関数を生成するので、特徴量ベクトル空間を適切にバイナリ化する変換関数を生成することができる。
また、情報変換装置10は、同じクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離と、異なるクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離との差分に基づいて、重要度を算出する。
例えば、情報変換装置10は、式(2)および式(3)を用いて、同じクラスの特徴量ベクトルを変換したバイナリ列間のハミング距離が短くなる場合は、変換関数の重要度を向上させる。また、情報変換装置10は、式(2)および式(3)を用いて、異なるクラスの特徴量ベクトルを変換したバイナリ列間のハミング距離が短くなる場合は、変換関数の重要度を低下させる。
この結果、情報変換装置10は、特徴量ベクトルをバイナリ列に変換する際に、各特徴量ベクトルの距離関係と、各特徴量ベクトルが所属するクラスを反映させる変換規則を生成することができる。このため、情報変換装置10は、情報検索装置20における検索処理の処理速度を低下させることなく、検索精度を向上させることができる。
また、情報検索装置20は、情報変換装置10が生成した変換規則を用いて、検索対象となる特徴量ベクトルをバイナリ列に変換する。また、情報検索装置20は、クエリデータから抽出した特徴量ベクトルをバイナリ列に変換する。そして、情報検索装置20は、検索対象となる特徴量ベクトルを変換したバイナリ列と、クエリデータから抽出した特徴量ベクトルを変換したバイナリ列とのハミング距離を用いて、クエリデータの近傍に位置する特徴量ベクトルを検索する。
ここで、ハミング距離の算出処理は、特徴量ベクトル同士のユークリッド距離の算出処理よりも高速に実行することができる。このため、情報検索装置20は、検索処理の処理速度を向上させることができる。また、情報検索装置20は、情報変換装置10がN個の変換関数から重要度に応じて選択したM個の変換関数を用いて、特徴量ベクトルをバイナリ列に変換する。この結果、情報検索装置20は、検索精度を低下させることなく、検索処理を高速に行うことができる。
これまで本発明の実施例について説明したが実施例は、上述した実施例以外にも様々な異なる形態にて実施されてよいものである。そこで、以下では実施例2として本発明に含まれる他の実施例を説明する。
(1)選択する変換関数について
上述した情報変換装置10は、特徴量ベクトルを重要度が高いビットに変換した変換関数を選択した。しかし、実施例はこれに限定されるものではなく、例えば、情報変換装置10は、重要度が高いことが明確であるビットに変換する変換関数を必ず選択してもよい。例えば、情報変換装置10は、検索対象となる特徴量ベクトルの種別に応じて、有効な変換関数が知られている場合には、この変換関数を必ず変換規則に含めてよい。また、例えば、情報変換装置10は、有効な変換関数による変換結果のビットの重要度に、他の重要度よりも高い初期値を設定してもよい。
また、情報変換装置10は、変換規則の選択においては、重要度が高いビットに変換する変換関数を重複して選択してもよい。このような処理を実行した場合は、情報変換装置10は、特徴量ベクトルの位置関係を強調したバイナリ列を生成する変換規則を生成することができる。この結果、情報検索装置20がクエリデータの近傍検索を行う際に、検索結果として得られる特徴量ベクトルの数が少なくなる。このため、情報変換装置10は、情報検索装置20がクエリデータとのマッチングを行う際の計算量を削減し、検索処理の処理速度を向上させることができる。
また、情報変換装置10は、特徴量ベクトルを1ビットに変換する変換関数をN個生成し、各ビットの重要度に応じて、N個の変換関数からM個の変換関数を選択することで、特徴量ベクトルをMビットのバイナリ列に変換する変換規則を生成した。しかし、実施例はこれに限定されるものではない。
例えば、情報変換装置10は、特徴量ベクトルを1ビットのバイナリ列に変換する変換関数だけではなく、複数ビットのバイナリ列に変換する変換関数を生成する。この際、情報変換装置10は、生成したすべての変換関数で特徴量ベクトルをバイナリ列に変換した際に、特徴量ベクトルを、検索処理に用いるバイナリ列のビット長よりも長いビット長のバイナリ列に変換できるようにする。そして、情報変換装置10は、生成した複数の変換関数から、各ビットの重要度に応じて、検索処理に用いるビット長のバイナリ列に変換する分の変換関数を選択することとしてもよい。
例えば、情報変換装置10は、特徴量ベクトルを1ビットのバイナリ列に変換する変換関数、特徴量ベクトルを2ビットのバイナリ列に変換する変換関数、特徴量ベクトルを3ビットのバイナリ列に変換する変換関数をそれぞれ複数生成する。そして、情報変換装置10は、検索処理に用いるバイナリ列のビット長が15ビットである場合は、以下のように変換関数を選択してもよい。例えば、情報変換装置10は、特徴量ベクトルを1ビットのバイナリ列に変換する1つの変換関数と、2ビットのバイナリ列に変換する1つの変換関数と、3ビットのバイナリ列に変換する4つの変換関数を選択してもよい。
(2)実施形態について
上述した情報変換装置10は、情報検索装置20とは独立した装置である。しかし、実施例はこれに限定されるものではなく、例えば、情報検索装置20に情報変換装置10の機能を含めることとしてもよい。また、情報変換装置10は、情報検索装置20のバイナリ変換部23が実行する機能を有し、稼働中の情報検索装置が記憶する特徴量ベクトルについて、変換規則を生成し、生成した変換規則を用いてバイナリ列を生成する処理を実行してもよい。
(3)数式について
情報変換装置10が重要度を算出するために使用した数式は、あくまで一例であり、情報変換装置10は、任意の形式の数式を用いることができる。すなわち、情報変換装置10は、特徴量ベクトルの距離関係や、特徴量ベクトルが所属するクラスの別をバイナリ列に投影できる変換関数の重要度を向上させることができるのであれば、任意の数式を用いることとしてもよい。また、上述した変換関数は、あくまで一例であり、情報変換装置10は、他のパラメータを含む変換関数を用いてもよい。また、情報変換装置10は、パラメータや変換行列等、生成する変換関数の形式を統一する必要はなく、各ビットを生成する変換関数の形式がそれぞれ異なっていてもよい。
(4)プログラム
ところで、実施例1に係る情報変換装置10は、ハードウェアを利用して各種の処理を実現する場合を説明した。しかし、実施例はこれに限定されるものではなく、あらかじめ用意されたプログラムを情報変換装置10が有するコンピュータで実行することによって実現するようにしてもよい。そこで、以下では、図7を用いて、実施例1に示した情報変換装置10と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図7は、情報変換プログラムを実行するコンピュータの一例を説明するための図である。
図7に例示されたコンピュータ100は、ROM(Read Only Memory)110、HDD(Hard Disk Drive)120、RAM(Random Access Memory)130、CPU(Central Processing Unit)140がバス160で接続される。また、図11に例示されたコンピュータ100は、パケットを送受信するためのI/O(Input Output)150を有する。
HDD120は、変換対象となる特徴量ベクトルを記憶する特徴量ベクトルテーブル121を記憶する。また、RAM130には、情報変換プログラム131があらかじめ保持される。CPU140が情報変換プログラム131をRAM130から読み出して実行することによって、図11に示す例では、情報変換プログラム131は、情報変換プロセス141として機能するようになる。なお、情報変換プロセス141は、図1に示した変換規則生成部12、重要度算出部13、変換規則決定部14と同様の機能を発揮する。
なお、本実施例で説明した情報変換プログラムは、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD−ROM(Compact Disc Read Only Memory)、MO(Magneto Optical Disc)、DVD(Digital Versatile Disc)などのコンピュータで読取可能な記録媒体に記録される。また、このプログラムは、コンピュータによって記録媒体から読み出されることによって実行することもできる。
1 検索システム
2 クライアント装置
10 情報変換装置
11 学習データ記憶部
12 変換規則生成部
13 重要度算出部
14 変換規則決定部
20 情報検索装置
21 検索対象データベース記憶部
22 バイナリデータベース記憶部
23 バイナリ変換部
24 検索処理部

Claims (10)

  1. 特徴量ベクトルを所定のビット長のバイナリ列に変換するコンピュータに、
    特徴量ベクトルを前記所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成し、
    前記生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換し、
    前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換規則により変換されるバイナリ列における各ビットの距離反映度を算出し、
    前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する
    処理を実行させることを特徴とする情報変換規則生成プログラム。
  2. 前記情報変換規則生成プログラムは、
    前記第1の変換規則を生成する場合は、前記第1の変換規則として、前記特徴量ベクトルを1ビットまたは複数ビットのバイナリ列に変換する変換関数を、前記所定のビット長よりも長い前記第1ビット長のバイナリ列を変換する分だけ生成し、
    前記第2の変換規則を生成する場合は、前記算出した距離反映度に応じて、前記所定のビット長のバイナリ列に変換する分の変換関数を、前記生成した変換関数から選択する
    処理を前記コンピュータに実行させることを特徴とする請求項1に記載の情報変換規則生成プログラム。
  3. 前記情報変換規則生成プログラムは、前記生成した第1の変換規則を用いて変換したバイナリ列の各ビットから、前記算出した距離反映度が高い方から順に前記所定のビット長分のビットを識別し、前記特徴量ベクトルを当該識別したビットに変換する変換関数を選択する処理を前記コンピュータに実行させることを特徴とする請求項2に記載の情報変換規則生成プログラム。
  4. 前記情報変換規則生成プログラムは、前記選択した変換関数に新たな変換関数を追加して新たな変換規則を生成し、前記新たに生成した変換規則を用いて前記特定の複数の特徴量ベクトルを複数のバイナリ列に変換し、前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数のバイナリ列と、に応じて前記バイナリ列における各ビットの距離反映度を算出し、前記算出した距離反映度に応じて、前記特徴量ベクトルを前記所定のビット長のバイナリ列に変換するように前記新たに生成した変換規則を修正する処理を所定の回数だけ前記コンピュータに繰り返し実行させることを特徴とする請求項2または3に記載の情報変換規則生成プログラム。
  5. 前記情報変換規則生成プログラムは、前記新たに生成した変換規則を用いて変換したバイナリ列の各ビットから、前記算出した距離反映度が所定の閾値を越えたビットを識別し、前記特徴量ベクトルを当該識別したビットに変換する変換関数を選択するとともに、前記所定のビット長のバイナリ列に変換する分の変換関数を選択するまで、前記新たな変換関数を生成する処理と、前記距離反映度を算出する処理とを前記コンピュータに繰り返し実行させることを特徴とする請求項4に記載の情報変換規則生成プログラム。
  6. 前記情報変換規則生成プログラムは、ランダムに生成したパラメータベクトルとオフセットパラメータとを用いて、前記変換関数を生成する処理を前記コンピュータに実行させることを特徴とする請求項25のいずれか1つに記載の情報変換規則生成プログラム。
  7. 前記情報変換規則生成プログラムは、前記距離反映度を算出する場合は、同じクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離と、異なるクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離との差分に基づいて、前記バイナリ列における各ビットの距離反映度を算出する処理を前記コンピュータに実行させることを特徴とする請求項16のいずれか1つに記載の情報変換規則生成プログラム。
  8. 前記情報変換規則生成プログラムは、
    前記第2の変換規則又は修正した変換規則を用いて前記特徴量ベクトルを前記所定のビット長のバイナリ列に変換し、
    クライアントが入力したクエリデータの特徴量ベクトルから変換したバイナリ列と、前記第2の変換規則または前記修正した変換規則を用いて特徴量ベクトルを変換したバイナリ列とのハミング距離を用いて、クエリデータの近傍に位置する特徴量ベクトルを検索する
    処理を前記コンピュータに実行させることを特徴とする請求項17のいずれか1つに記載の情報変換規則生成プログラム。
  9. 特徴量ベクトルを所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成する第1の生成部と、
    前記第1の生成部が生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換する第1の変換部と、
    前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換部が変換した前記第1の変換規則により変換される第1バイナリ列における各ビットの距離反映度を算出する算出部と、
    前記算出部が前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する第2の生成部と、
    を有することを特徴とする情報変換規則生成装置。
  10. 特徴量ベクトルを所定のビット長のバイナリ列に変換する情報変換規則生成装置が、
    特徴量ベクトルを前記所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成し、
    前記生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換し、
    前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換規則により変換される第1バイナリ列における各ビットの距離反映度を算出し、
    前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する
    処理を実行することを特徴とする情報変換規則生成方法。
JP2012075195A 2012-03-28 2012-03-28 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 Expired - Fee Related JP5862413B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012075195A JP5862413B2 (ja) 2012-03-28 2012-03-28 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法
US13/717,149 US9116898B2 (en) 2012-03-28 2012-12-17 Information conversion device, computer-readable recording medium, and information conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012075195A JP5862413B2 (ja) 2012-03-28 2012-03-28 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法

Publications (3)

Publication Number Publication Date
JP2013206193A JP2013206193A (ja) 2013-10-07
JP2013206193A5 JP2013206193A5 (ja) 2014-11-27
JP5862413B2 true JP5862413B2 (ja) 2016-02-16

Family

ID=49236471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012075195A Expired - Fee Related JP5862413B2 (ja) 2012-03-28 2012-03-28 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法

Country Status (2)

Country Link
US (1) US9116898B2 (ja)
JP (1) JP5862413B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206187A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
JP6413743B2 (ja) * 2014-12-16 2018-10-31 富士通株式会社 暗号処理装置、暗号処理方法、及び暗号処理プログラム
JP6364387B2 (ja) * 2015-08-17 2018-07-25 日本電信電話株式会社 特徴量生成装置、方法、及びプログラム
JP6657764B2 (ja) * 2015-10-16 2020-03-04 富士通株式会社 情報変換方法、情報処理装置、及び情報変換プログラム
JP6607061B2 (ja) 2016-02-05 2019-11-20 富士通株式会社 情報処理装置、データ比較方法、およびデータ比較プログラム
JP7011152B2 (ja) * 2017-08-30 2022-01-26 富士通株式会社 生体画像処理装置、生体画像処理方法、及び生体画像処理プログラム
US11630817B2 (en) * 2018-12-28 2023-04-18 Yahoo Assets Llc Method and system for data indexing and reporting
US11625429B2 (en) 2020-01-31 2023-04-11 Walmart Apollo, Llc Image searching using a full-text search engine
US20220012538A1 (en) 2020-07-07 2022-01-13 Nec Laboratories America, Inc. Compact representation and time series segment retrieval through deep learning

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2815045B2 (ja) 1996-12-16 1998-10-27 日本電気株式会社 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
US6774917B1 (en) 1999-03-11 2004-08-10 Fuji Xerox Co., Ltd. Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video
JP2002288687A (ja) * 2001-03-22 2002-10-04 Olympus Optical Co Ltd 特徴量算出装置および方法
JP4349160B2 (ja) 2004-03-05 2009-10-21 日本電気株式会社 画像類似度算出システム、画像検索システム、画像類似度算出方法および画像類似度算出用プログラム
JP2006277407A (ja) 2005-03-29 2006-10-12 Sanyo Electric Co Ltd 照合方法および照合装置
US20070036400A1 (en) 2005-03-28 2007-02-15 Sanyo Electric Co., Ltd. User authentication using biometric information
JP4937607B2 (ja) 2006-03-14 2012-05-23 富士通株式会社 生体認証方法及び生体認証装置
US7941442B2 (en) * 2007-04-18 2011-05-10 Microsoft Corporation Object similarity search in high-dimensional vector spaces
GB0800364D0 (en) 2008-01-09 2008-02-20 Mitsubishi Electric Inf Tech Feature-based signatures for image identification
US8195689B2 (en) * 2009-06-10 2012-06-05 Zeitera, Llc Media fingerprinting and identification system
JP5206218B2 (ja) * 2008-08-20 2013-06-12 富士通株式会社 指紋画像取得装置、指紋認証装置、指紋画像取得方法及び指紋認証方法
US8738595B2 (en) * 2011-11-22 2014-05-27 Navteq B.V. Location based full text search

Also Published As

Publication number Publication date
US20130262488A1 (en) 2013-10-03
JP2013206193A (ja) 2013-10-07
US9116898B2 (en) 2015-08-25

Similar Documents

Publication Publication Date Title
JP5862413B2 (ja) 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法
JP2013206187A (ja) 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
Lin et al. A general two-step approach to learning-based hashing
JP6004016B2 (ja) 情報変換方法、情報変換装置および情報変換プログラム
WO2020143320A1 (zh) 文本词向量获取方法、装置、计算机设备及存储介质
Huang et al. Object-location-aware hashing for multi-label image retrieval via automatic mask learning
Cao et al. Deep priority hashing
JP5193518B2 (ja) パターン探索装置及びその方法
WO2014068990A1 (ja) 関連性判定装置、同上用持続的有形コンピュータ読み取り媒体、及び関連性判定方法
US8972415B2 (en) Similarity search initialization
CN107402960B (zh) 一种基于语义语气加权的倒排索引优化算法
JP2019101927A (ja) 学習システム及び画像検索システム
JP5676692B2 (ja) 機械学習装置、機械学習方法、およびプログラム
JP4985724B2 (ja) 単語認識プログラム、単語認識方法、単語認識装置
JP4967705B2 (ja) クラスタ生成装置およびクラスタ生成プログラム
US9792561B2 (en) Learning method, information conversion device, and recording medium
Duan et al. Minimizing reconstruction bias hashing via joint projection learning and quantization
CN116881471B (zh) 一种基于知识图谱的大语言模型微调方法及装置
KR20220110620A (ko) 유사도 검색을 위한 신경 해싱
CN111783088A (zh) 一种恶意代码家族聚类方法、装置和计算机设备
WO2019171537A1 (ja) 意味推定システム、方法およびプログラム
JP5791666B2 (ja) ビジュアルキーワードの動的生成装置
US10936901B2 (en) Information processing device and non-transitory computer readable recording medium
JP5490859B2 (ja) ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法
WO2019171538A1 (ja) 意味推定システム、方法およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141010

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151214

R150 Certificate of patent or registration of utility model

Ref document number: 5862413

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees