JP5862413B2 - 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 - Google Patents
情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 Download PDFInfo
- Publication number
- JP5862413B2 JP5862413B2 JP2012075195A JP2012075195A JP5862413B2 JP 5862413 B2 JP5862413 B2 JP 5862413B2 JP 2012075195 A JP2012075195 A JP 2012075195A JP 2012075195 A JP2012075195 A JP 2012075195A JP 5862413 B2 JP5862413 B2 JP 5862413B2
- Authority
- JP
- Japan
- Prior art keywords
- conversion rule
- conversion
- information
- binary string
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 334
- 238000000034 method Methods 0.000 title claims description 56
- 239000013598 vector Substances 0.000 claims description 182
- 238000004364 calculation method Methods 0.000 claims description 52
- 230000009466 transformation Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 107
- 238000003860 storage Methods 0.000 description 32
- 238000013500 data storage Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 11
- 230000010365 information processing Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Description
上述したように、情報変換装置10は、特徴量ベクトルをビット長Nのバイナリ列に変換する変換規則を生成する。そして、情報変換装置10は、生成した変換規則を用いて、特徴量ベクトルをバイナリ列に変換し、特徴量ベクトルの距離関係に応じて、各ビットの重要度を算出する。
上述した情報変換装置10は、特徴量ベクトルを重要度が高いビットに変換した変換関数を選択した。しかし、実施例はこれに限定されるものではなく、例えば、情報変換装置10は、重要度が高いことが明確であるビットに変換する変換関数を必ず選択してもよい。例えば、情報変換装置10は、検索対象となる特徴量ベクトルの種別に応じて、有効な変換関数が知られている場合には、この変換関数を必ず変換規則に含めてよい。また、例えば、情報変換装置10は、有効な変換関数による変換結果のビットの重要度に、他の重要度よりも高い初期値を設定してもよい。
上述した情報変換装置10は、情報検索装置20とは独立した装置である。しかし、実施例はこれに限定されるものではなく、例えば、情報検索装置20に情報変換装置10の機能を含めることとしてもよい。また、情報変換装置10は、情報検索装置20のバイナリ変換部23が実行する機能を有し、稼働中の情報検索装置が記憶する特徴量ベクトルについて、変換規則を生成し、生成した変換規則を用いてバイナリ列を生成する処理を実行してもよい。
情報変換装置10が重要度を算出するために使用した数式は、あくまで一例であり、情報変換装置10は、任意の形式の数式を用いることができる。すなわち、情報変換装置10は、特徴量ベクトルの距離関係や、特徴量ベクトルが所属するクラスの別をバイナリ列に投影できる変換関数の重要度を向上させることができるのであれば、任意の数式を用いることとしてもよい。また、上述した変換関数は、あくまで一例であり、情報変換装置10は、他のパラメータを含む変換関数を用いてもよい。また、情報変換装置10は、パラメータや変換行列等、生成する変換関数の形式を統一する必要はなく、各ビットを生成する変換関数の形式がそれぞれ異なっていてもよい。
ところで、実施例1に係る情報変換装置10は、ハードウェアを利用して各種の処理を実現する場合を説明した。しかし、実施例はこれに限定されるものではなく、あらかじめ用意されたプログラムを情報変換装置10が有するコンピュータで実行することによって実現するようにしてもよい。そこで、以下では、図7を用いて、実施例1に示した情報変換装置10と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図7は、情報変換プログラムを実行するコンピュータの一例を説明するための図である。
2 クライアント装置
10 情報変換装置
11 学習データ記憶部
12 変換規則生成部
13 重要度算出部
14 変換規則決定部
20 情報検索装置
21 検索対象データベース記憶部
22 バイナリデータベース記憶部
23 バイナリ変換部
24 検索処理部
Claims (10)
- 特徴量ベクトルを所定のビット長のバイナリ列に変換するコンピュータに、
特徴量ベクトルを前記所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成し、
前記生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換し、
前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換規則により変換されるバイナリ列における各ビットの距離反映度を算出し、
前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する
処理を実行させることを特徴とする情報変換規則生成プログラム。 - 前記情報変換規則生成プログラムは、
前記第1の変換規則を生成する場合は、前記第1の変換規則として、前記特徴量ベクトルを1ビットまたは複数ビットのバイナリ列に変換する変換関数を、前記所定のビット長よりも長い前記第1ビット長のバイナリ列を変換する分だけ生成し、
前記第2の変換規則を生成する場合は、前記算出した距離反映度に応じて、前記所定のビット長のバイナリ列に変換する分の変換関数を、前記生成した変換関数から選択する
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の情報変換規則生成プログラム。 - 前記情報変換規則生成プログラムは、前記生成した第1の変換規則を用いて変換したバイナリ列の各ビットから、前記算出した距離反映度が高い方から順に前記所定のビット長分のビットを識別し、前記特徴量ベクトルを当該識別したビットに変換する変換関数を選択する処理を前記コンピュータに実行させることを特徴とする請求項2に記載の情報変換規則生成プログラム。
- 前記情報変換規則生成プログラムは、前記選択した変換関数に新たな変換関数を追加して新たな変換規則を生成し、前記新たに生成した変換規則を用いて前記特定の複数の特徴量ベクトルを複数のバイナリ列に変換し、前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数のバイナリ列と、に応じて前記バイナリ列における各ビットの距離反映度を算出し、前記算出した距離反映度に応じて、前記特徴量ベクトルを前記所定のビット長のバイナリ列に変換するように前記新たに生成した変換規則を修正する処理を所定の回数だけ前記コンピュータに繰り返し実行させることを特徴とする請求項2または3に記載の情報変換規則生成プログラム。
- 前記情報変換規則生成プログラムは、前記新たに生成した変換規則を用いて変換したバイナリ列の各ビットから、前記算出した距離反映度が所定の閾値を越えたビットを識別し、前記特徴量ベクトルを当該識別したビットに変換する変換関数を選択するとともに、前記所定のビット長のバイナリ列に変換する分の変換関数を選択するまで、前記新たな変換関数を生成する処理と、前記距離反映度を算出する処理とを前記コンピュータに繰り返し実行させることを特徴とする請求項4に記載の情報変換規則生成プログラム。
- 前記情報変換規則生成プログラムは、ランダムに生成したパラメータベクトルとオフセットパラメータとを用いて、前記変換関数を生成する処理を前記コンピュータに実行させることを特徴とする請求項2〜5のいずれか1つに記載の情報変換規則生成プログラム。
- 前記情報変換規則生成プログラムは、前記距離反映度を算出する場合は、同じクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離と、異なるクラスに属する特徴量ベクトルから変換したバイナリ列同士のハミング距離のうち最も小さいハミング距離との差分に基づいて、前記バイナリ列における各ビットの距離反映度を算出する処理を前記コンピュータに実行させることを特徴とする請求項1〜6のいずれか1つに記載の情報変換規則生成プログラム。
- 前記情報変換規則生成プログラムは、
前記第2の変換規則又は修正した変換規則を用いて前記特徴量ベクトルを前記所定のビット長のバイナリ列に変換し、
クライアントが入力したクエリデータの特徴量ベクトルから変換したバイナリ列と、前記第2の変換規則または前記修正した変換規則を用いて特徴量ベクトルを変換したバイナリ列とのハミング距離を用いて、クエリデータの近傍に位置する特徴量ベクトルを検索する
処理を前記コンピュータに実行させることを特徴とする請求項1〜7のいずれか1つに記載の情報変換規則生成プログラム。 - 特徴量ベクトルを所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成する第1の生成部と、
前記第1の生成部が生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換する第1の変換部と、
前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換部が変換した前記第1の変換規則により変換される第1バイナリ列における各ビットの距離反映度を算出する算出部と、
前記算出部が前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する第2の生成部と、
を有することを特徴とする情報変換規則生成装置。 - 特徴量ベクトルを所定のビット長のバイナリ列に変換する情報変換規則生成装置が、
特徴量ベクトルを前記所定のビット長よりも長い第1ビット長のバイナリ列に変換する第1の変換規則を生成し、
前記生成した第1の変換規則を用いて、特定の複数の特徴量ベクトルを前記第1ビット長を有する複数の第1バイナリ列に変換し、
前記特定の複数の特徴量ベクトルの関係に関する関係情報と、前記複数の第1バイナリ列とに基づき、前記第1の変換規則により変換される第1バイナリ列における各ビットの距離反映度を算出し、
前記算出した距離反映度と、前記第1の変換規則とに基づき第2の変換規則を生成する
処理を実行することを特徴とする情報変換規則生成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012075195A JP5862413B2 (ja) | 2012-03-28 | 2012-03-28 | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 |
US13/717,149 US9116898B2 (en) | 2012-03-28 | 2012-12-17 | Information conversion device, computer-readable recording medium, and information conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012075195A JP5862413B2 (ja) | 2012-03-28 | 2012-03-28 | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013206193A JP2013206193A (ja) | 2013-10-07 |
JP2013206193A5 JP2013206193A5 (ja) | 2014-11-27 |
JP5862413B2 true JP5862413B2 (ja) | 2016-02-16 |
Family
ID=49236471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012075195A Expired - Fee Related JP5862413B2 (ja) | 2012-03-28 | 2012-03-28 | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9116898B2 (ja) |
JP (1) | JP5862413B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206187A (ja) * | 2012-03-28 | 2013-10-07 | Fujitsu Ltd | 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム |
JP6413743B2 (ja) * | 2014-12-16 | 2018-10-31 | 富士通株式会社 | 暗号処理装置、暗号処理方法、及び暗号処理プログラム |
JP6364387B2 (ja) * | 2015-08-17 | 2018-07-25 | 日本電信電話株式会社 | 特徴量生成装置、方法、及びプログラム |
JP6657764B2 (ja) * | 2015-10-16 | 2020-03-04 | 富士通株式会社 | 情報変換方法、情報処理装置、及び情報変換プログラム |
JP6607061B2 (ja) | 2016-02-05 | 2019-11-20 | 富士通株式会社 | 情報処理装置、データ比較方法、およびデータ比較プログラム |
JP7011152B2 (ja) * | 2017-08-30 | 2022-01-26 | 富士通株式会社 | 生体画像処理装置、生体画像処理方法、及び生体画像処理プログラム |
US11630817B2 (en) * | 2018-12-28 | 2023-04-18 | Yahoo Assets Llc | Method and system for data indexing and reporting |
US11625429B2 (en) | 2020-01-31 | 2023-04-11 | Walmart Apollo, Llc | Image searching using a full-text search engine |
US20220012538A1 (en) | 2020-07-07 | 2022-01-13 | Nec Laboratories America, Inc. | Compact representation and time series segment retrieval through deep learning |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2815045B2 (ja) | 1996-12-16 | 1998-10-27 | 日本電気株式会社 | 画像特徴抽出装置,画像特徴解析装置,および画像照合システム |
US6774917B1 (en) | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
JP2002288687A (ja) * | 2001-03-22 | 2002-10-04 | Olympus Optical Co Ltd | 特徴量算出装置および方法 |
JP4349160B2 (ja) | 2004-03-05 | 2009-10-21 | 日本電気株式会社 | 画像類似度算出システム、画像検索システム、画像類似度算出方法および画像類似度算出用プログラム |
JP2006277407A (ja) | 2005-03-29 | 2006-10-12 | Sanyo Electric Co Ltd | 照合方法および照合装置 |
US20070036400A1 (en) | 2005-03-28 | 2007-02-15 | Sanyo Electric Co., Ltd. | User authentication using biometric information |
JP4937607B2 (ja) | 2006-03-14 | 2012-05-23 | 富士通株式会社 | 生体認証方法及び生体認証装置 |
US7941442B2 (en) * | 2007-04-18 | 2011-05-10 | Microsoft Corporation | Object similarity search in high-dimensional vector spaces |
GB0800364D0 (en) | 2008-01-09 | 2008-02-20 | Mitsubishi Electric Inf Tech | Feature-based signatures for image identification |
US8195689B2 (en) * | 2009-06-10 | 2012-06-05 | Zeitera, Llc | Media fingerprinting and identification system |
JP5206218B2 (ja) * | 2008-08-20 | 2013-06-12 | 富士通株式会社 | 指紋画像取得装置、指紋認証装置、指紋画像取得方法及び指紋認証方法 |
US8738595B2 (en) * | 2011-11-22 | 2014-05-27 | Navteq B.V. | Location based full text search |
-
2012
- 2012-03-28 JP JP2012075195A patent/JP5862413B2/ja not_active Expired - Fee Related
- 2012-12-17 US US13/717,149 patent/US9116898B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20130262488A1 (en) | 2013-10-03 |
JP2013206193A (ja) | 2013-10-07 |
US9116898B2 (en) | 2015-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5862413B2 (ja) | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 | |
JP2013206187A (ja) | 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム | |
Lin et al. | A general two-step approach to learning-based hashing | |
JP6004016B2 (ja) | 情報変換方法、情報変換装置および情報変換プログラム | |
WO2020143320A1 (zh) | 文本词向量获取方法、装置、计算机设备及存储介质 | |
Huang et al. | Object-location-aware hashing for multi-label image retrieval via automatic mask learning | |
Cao et al. | Deep priority hashing | |
JP5193518B2 (ja) | パターン探索装置及びその方法 | |
WO2014068990A1 (ja) | 関連性判定装置、同上用持続的有形コンピュータ読み取り媒体、及び関連性判定方法 | |
US8972415B2 (en) | Similarity search initialization | |
CN107402960B (zh) | 一种基于语义语气加权的倒排索引优化算法 | |
JP2019101927A (ja) | 学習システム及び画像検索システム | |
JP5676692B2 (ja) | 機械学習装置、機械学習方法、およびプログラム | |
JP4985724B2 (ja) | 単語認識プログラム、単語認識方法、単語認識装置 | |
JP4967705B2 (ja) | クラスタ生成装置およびクラスタ生成プログラム | |
US9792561B2 (en) | Learning method, information conversion device, and recording medium | |
Duan et al. | Minimizing reconstruction bias hashing via joint projection learning and quantization | |
CN116881471B (zh) | 一种基于知识图谱的大语言模型微调方法及装置 | |
KR20220110620A (ko) | 유사도 검색을 위한 신경 해싱 | |
CN111783088A (zh) | 一种恶意代码家族聚类方法、装置和计算机设备 | |
WO2019171537A1 (ja) | 意味推定システム、方法およびプログラム | |
JP5791666B2 (ja) | ビジュアルキーワードの動的生成装置 | |
US10936901B2 (en) | Information processing device and non-transitory computer readable recording medium | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
WO2019171538A1 (ja) | 意味推定システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141010 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5862413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |