JP6756648B2 - 生成装置、生成方法および生成プログラム - Google Patents
生成装置、生成方法および生成プログラム Download PDFInfo
- Publication number
- JP6756648B2 JP6756648B2 JP2017051953A JP2017051953A JP6756648B2 JP 6756648 B2 JP6756648 B2 JP 6756648B2 JP 2017051953 A JP2017051953 A JP 2017051953A JP 2017051953 A JP2017051953 A JP 2017051953A JP 6756648 B2 JP6756648 B2 JP 6756648B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- similarity
- image
- distributed representation
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 57
- 238000004364 calculation method Methods 0.000 claims description 45
- 239000006185 dispersion Substances 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 description 52
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔1.情報提供装置が提供する処理について〕
まず、図1を用いて、生成装置の一例となる情報提供装置が実行する生成処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。なお、以下の説明では、情報提供装置10が実行する処理として、分散表現を用いた画像検索を様にするため、画像の類似性を反映させた分散表現を生成する生成処理と、生成処理によって生成した分散表現を用いて、画像の検索を行う検索処理とについて説明する。なお、以下の説明では、情報提供装置10が各情報の分散表現を「生成」する処理について説明するが、かかる処理は、各データに対応する適切な分散表現の値を適宜「学習」することで、分散表現を「生成」する処理であるものとする。
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、利用者端末100と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数の利用者端末100と通信可能であってよい。
ここで、画像の外見的な特徴量のみならず、撮像された撮像対象の内容に応じた画像検索を容易にするため、撮像された撮像対象の内容を示す特徴量を生成し、生成した特徴量に応じて画像を分類する技術が考えられる。例えば、画像に撮像された撮像対象の内容を示すタグ情報を画像のメタ情報として保持し、メタ情報の一致度に応じて撮像対象の特徴量に基づいた分散表現を生成する技術が考えられる。
ここで、情報提供装置10は、各画像間の類似度を算出する際、分散表現の生成目的に応じた任意の基準により、各画像の類似度を算出してよい。例えば、情報提供装置10は、色味、ピクセル、エッジ等といった各種の構造的(外見的)な類似性に基づいて、第1類似度および第2類似度を算出してもよい。また、情報提供装置10は、各画像の意味的な類似度(すなわち、セマンティックな類似度)を算出してもよい。
また、情報提供装置10は、各画像に対応する検索クエリの内容をメタ情報として採用してもよい。例えば、情報提供装置10は、ウェブ検索を行う検索サーバ等(図示は、省略)から、利用者Uが入力した検索クエリと、その検索クエリが入力された際に、検索結果として表示された画像の中から利用者Uが選択した画像とを示す検索ログを取得する。そして、情報提供装置10は、分散表現の生成対象となる各画像について、その画像が利用者Uによって選択された際に利用者Uが入力した検索クエリをメタ情報として特定する。
ここで、情報提供装置10は、第1画像に紐付けられる複数種別の情報と第2画像に紐付けられる複数種別の情報との種別ごとの類似度に基づいて、第1類似度を算出し、第1画像に紐付けられる複数種別の情報と第3画像に紐付けられる複数種別の情報との種別ごとの類似度に基づいて、第2類似度を算出してもよい。すなわち、情報提供装置10は、複数種別の情報を含むメタ情報が画像に紐付けられている場合、メタ情報全体としての類似度に基づいて第1類似度や第2類似度を算出してもよく、種別ごとの類似度に基づいた第1類似度や第2類似度を算出してもよい。
ここで、情報提供装置10は、第1画像〜第3画像を選択する場合、分散表現の生成対象となる画像から、全ての組み合わせについて、第1画像〜第3画像を選択すればよい。また、情報提供装置10は、第1画像と同じ分野(クラス)に属する画像等、第1画像との類似度が所定の閾値を超える情報を故意に選択することで、その分野に属する画像間の相対的な類似度を分散表現空間上に落とし込んでもよい。
また、情報提供装置10は、従来のトリプレットロスの学習手法と、上述した生成処理とを組み合わせて実行してもよい。例えば、情報提供装置10は、第1画像との類似度が第1閾値以上となる第4画像と、第1画像との類似度が第2閾値以下となる第5画像とを選択する。このような場合、情報提供装置10は、第1画像の分散表現と第4画像の分散表現とが類似し、かつ、第1画像の分散表現と第5画像の分散表現とが類似しないように、各画像の分散表現を生成する。
ここで、情報提供装置10は、正解ペアの分散表現が類似し、不正解ペアの分散表現が類似しなくなるように、分散表現を生成するのであれば、任意の手法により分散表現を生成してよい。例えば、情報提供装置10は、第1画像の分散表現と第2画像の分散表現との差が、第1画像の分散表現と第3画像の分散表現との差よりも少なくなるように、各分散表現を生成してもよい。
次に、図1を用いて、情報提供装置10が実行する生成処理の一例について説明する。まず、情報提供装置10は、処理対象となる画像からランダムに第1画像P1、第2画像P2、および第3画像P3を選択し、各画像のメタ情報M1〜M3を取得する(ステップS1)。このような場合、情報提供装置10は、メタ情報同士の類似度を算出し、算出した類似度を比較する(ステップS2)。例えば、情報提供装置10は、メタ情報M1とメタ情報M2との類似度S1(すなわち、第1類似度)、およびメタ情報M1とメタ情報M3との類似度S2(すなわち、第2類似度)を算出し、算出した類似度S1および類似度S2を比較する。
続いて、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
続いて、図6を用いて、情報提供装置10が実行する生成処理の流れについて説明する。図6は、実施形態に係る情報提供装置が実行する生成処理の流れの一例を示すフローチャートである。なお、情報提供装置10は、図6に示す処理を、任意の単位で、任意のタイミングにより実行可能である。
上記では、情報提供装置10による生成処理や検索処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する提供処理や付与処理のバリエーションについて説明する。
上述した例では、情報提供装置10は、画像間の意味的および構造的な類似度を相対的に反映させた分散表現を生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、静止画像や動画像等といった画像以外にも、音楽、映画、ニュース記事、各種の投稿、ウェブコンテンツ等、任意の情報間の意味的および構造的な類似度を相対的に反映させた分散表現を生成してもよい。このような場合、情報提供装置10は、例えば、音楽の作曲家、作詞内容、演奏時間、演奏日時、映画の監督、出演者、上映時間、ニュース記事や投稿内容の要約等をメタ情報として採用してもよい。
記憶部30に登録された各データベース31、32は、外部のストレージサーバに保持されていてもよい。また、情報提供装置10は、検索処理を実現するフロントエンドサーバと、生成処理を実現するバックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、図2に示す受付部45および検索部46が配置され、バックエンドサーバには、選択部41、算出部42、比較部43、および生成部44が配置される。
上述した例では、情報提供装置10は、第1類似度が第2類似度よりも大きい場合は、第2情報を正解データとし、それ以外の場合には、第3情報を正解データとした。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、第1類似度が第2類似度と等しい場合には、第2情報や第3情報を選択しなおしてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述した実施形態に係る情報提供装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、情報提供装置10は、第1情報と第2情報との間の類似度である第1類似度と、第1情報と第3情報との間の類似度である第2類似度とを算出する。そして、情報提供装置10は、第1類似度と第2類似度との関係性に基づいて、第2画像および第3画像の分散表現のうちいずれか1方が第1画像の分散表現と類似し、他方が類似しないように、各画像の分散表現を生成する。例えば、情報提供装置10は、第1類似度が第2類似度よりも大きい場合は、第1情報の分散表現と第2情報の分散表現とが類似し、かつ第1情報の分散表現と第3情報の分散表現とが類似しないように、各分散表現を生成する。また、情報提供装置10は、第2類似度が第1類似度よりも大きい場合は、第1情報の分散表現と第3情報の分散表現とが類似し、かつ第1情報の分散表現と第2情報の分散表現とが類似しないように、各分散表現を生成する。
20 通信部
30 記憶部
31 画像データベース
32 分散表現データベース
40 制御部
41 選択部
42 算出部
43 比較部
44 生成部
45 受付部
46 検索部
100 利用者端末
Claims (17)
- 第1情報に紐付けられる情報と第2情報に紐付けられる情報との間の類似度に基づく第1類似度と、前記第1情報に紐付けられる情報と第3情報に紐付けられる情報との間の類似度に基づく第2類似度とを算出する算出部と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成部と
を有することを特徴とする生成装置。 - 前記算出部は、前記第1情報に紐付けられる複数種別の情報と前記第2情報に紐付けられる複数種別の情報との種別ごとの類似度に基づいて、前記第1類似度を算出し、前記第1情報に紐付けられる複数種別の情報と前記第3情報に紐付けられる複数種別の情報との種別ごとの類似度に基づいて、前記第2類似度を算出する
ことを特徴とする請求項1に記載の生成装置。 - 前記算出部は、前記種別ごとの類似度を優先度が高い順に結合させることで、所定の桁数の前記第1類似度および前記第2類似度を算出する
ことを特徴とする請求項2に記載の生成装置。 - 前記算出部は、前記第1情報に紐付けられる情報と前記第2情報に紐付けられる情報との意味または表記の類似度に基づいて、前記第1類似度を算出し、前記第1情報に紐付けられる情報と前記第3情報に紐付けられる情報との意味または表記の類似度に基づいて、前記第2類似度を算出する
ことを特徴とする請求項1〜3のうちいずれか1つに記載の生成装置。 - 前記算出部は、前記第1情報が利用者により選択された際に当該利用者が入力した検索クエリと、前記第2情報が利用者により選択された際に当該利用者が入力した検索クエリとの類似度に基づいて、前記第1類似度を算出し、前記第1情報が利用者により選択された際に当該利用者が入力した検索クエリと、前記第3情報が利用者により選択された際に当該利用者が入力した検索クエリとの類似度に基づいて、前記第2類似度を算出する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の生成装置。 - 前記算出部は、前記検索クエリのうち、トークンの量が所定の閾値を超える検索クエリの類似度に基づいて、前記第1類似度および前記第2類似度を算出する
ことを特徴とする請求項5に記載の生成装置。 - 第1情報と第2情報との構造的な類似度および前記第1情報と前記第2情報との意味的な類似度とに基づく第1類似度と、第1情報と第3情報との構造的な類似度および前記第1情報と前記第3情報との意味的な類似度とに基づく第2類似度とを算出する算出部と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成部と
を有することを特徴とする生成装置。 - 前記生成部は、前記第1類似度が前記第2類似度よりも大きい場合は、前記第1情報の分散表現と前記第2情報の分散表現とが類似し、かつ前記第1情報の分散表現と前記第3情報の分散表現とが類似しないように、各分散表現を生成する
ことを特徴とする請求項1〜7のうちいずれか1つに記載の生成装置。 - 第2類似度が第1類似度よりも大きい場合は、前記第1情報の分散表現と前記第3情報の分散表現とが類似し、かつ前記第1情報の分散表現と前記第2情報の分散表現とが類似しないように、各分散表現を生成する
ことを特徴とする請求項1〜8のうちいずれか1つに記載の生成装置。 - 前記第2情報および前記第3情報として、前記第1情報との類似度が所定の閾値を超える情報を選択する第1選択部
を有し、
前記算出部は、前記第1情報と、前記第1選択部により選択された前記第2情報および前記第3情報とから、前記第1類似度および前記第2類似度を算出する
ことを特徴とする請求項1〜9のうちいずれか1つに記載の生成装置。 - 前記第1情報との類似度が第1閾値以上となる第4情報と、前記第1情報との類似度が第2閾値以下となる第5情報とを選択する第2選択部
を有し、
前記算出部は、前記第1情報ないし前記第5情報のうち3つの情報を含む全ての組について、前記第1類似度および前記第2類似度を算出し、
前記生成部は、前記第1情報の分散表現と前記第4情報の分散表現とが類似し、かつ、第1情報の分散表現と第5情報の分散表現とが類似しないように、第1情報、第4情報および第5情報の分散表現を生成し、その後、前記算出部が前記組ごとに算出した第1類似度および前記第2類似度に基づいて、当該組に含まれる第1情報ないし前記第5情報の分散表現を生成する
ことを特徴とする請求項1〜10のうちいずれか1つに記載の生成装置。 - 前記生成部は、前記第1情報の分散表現と前記第2情報の分散表現との差が、前記第1情報の分散表現と前記第3情報の分散表現との差よりも少なくなるように、各分散表現を生成する
ことを特徴とする請求項1〜11のうちいずれか1つに記載の生成装置。 - 前記算出部は、画像である前記第1情報と画像である前記第2情報との間の前記第1類似度と、当該第1情報と画像である前記第3情報との間の前記第2類似度とを算出する
ことを特徴とする請求項1〜12のうちいずれか1つに記載の生成装置。 - 生成装置が実行する生成方法であって、
第1情報に紐付けられる情報と第2情報に紐付けられる情報との間の類似度に基づく第1類似度と、前記第1情報に紐付けられる情報と第3情報に紐付けられる情報との間の類似度に基づく第2類似度とを算出する算出工程と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成工程と
を含むことを特徴とする生成方法。 - 第1情報に紐付けられる情報と第2情報に紐付けられる情報との間の類似度に基づく第1類似度と、前記第1情報に紐付けられる情報と第3情報に紐付けられる情報との間の類似度に基づく第2類似度とを算出する算出手順と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成手順と
をコンピュータに実行させることを特徴とする生成プログラム。 - 生成装置が実行する生成方法であって、
第1情報と第2情報との構造的な類似度および前記第1情報と前記第2情報との意味的な類似度とに基づく第1類似度と、第1情報と第3情報との構造的な類似度および前記第1情報と前記第2情報との意味的な類似度とに基づく第2類似度とを算出する算出工程と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成工程と
を含むことを特徴とする生成方法。 - 第1情報と第2情報との構造的な類似度および前記第1情報と前記第2情報との意味的な類似度とに基づく第1類似度と、第1情報と第3情報との構造的な類似度および前記第1情報と前記第2情報との意味的な類似度とに基づく第2類似度とを算出する算出手順と、
前記第1類似度と前記第2類似度との関係性に基づいて、前記第2情報および前記第3情報の分散表現のうちいずれか一方が前記第1情報の分散表現と類似し、他方が類似しないように、各分散表現を生成する生成手順と
をコンピュータに実行させることを特徴とする生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017051953A JP6756648B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017051953A JP6756648B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018156333A JP2018156333A (ja) | 2018-10-04 |
JP6756648B2 true JP6756648B2 (ja) | 2020-09-16 |
Family
ID=63715647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017051953A Active JP6756648B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法および生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6756648B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10977525B2 (en) | 2019-03-29 | 2021-04-13 | Fuji Xerox Co., Ltd. | Indoor localization using real-time context fusion of visual information from static and dynamic cameras |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5414334B2 (ja) * | 2009-04-10 | 2014-02-12 | 株式会社日立製作所 | 擬似文書検索システム及び擬似文書検索方法 |
EP3796235A1 (en) * | 2014-12-17 | 2021-03-24 | Google LLC | Generating numeric embeddings of images |
JP6201079B2 (ja) * | 2015-08-28 | 2017-09-20 | 株式会社日立製作所 | 監視システムおよび監視方法 |
-
2017
- 2017-03-16 JP JP2017051953A patent/JP6756648B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018156333A (ja) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10394878B2 (en) | Associating still images and videos | |
US10664515B2 (en) | Task-focused search by image | |
Fu et al. | Robust subjective visual property prediction from crowdsourced pairwise labels | |
Joia et al. | Uncovering representative groups in multidimensional projections | |
JP6767342B2 (ja) | 検索装置、検索方法および検索プログラム | |
JP5794036B2 (ja) | 画像検索装置、画像検索方法、およびプログラム | |
US9928466B1 (en) | Approaches for annotating phrases in search queries | |
JP6321845B1 (ja) | 付与装置、付与方法および付与プログラム | |
JP6756648B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP2002342360A (ja) | 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 | |
CN110431550B (zh) | 用于识别可视叶页面的方法和系统 | |
JP6310529B1 (ja) | 検索装置、検索方法および検索プログラム | |
JP6705763B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP2020047126A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7257553B2 (ja) | 化粧品製品推奨のための方法及び装置 | |
Souza Cabral et al. | Combining multiple metadata types in movies recommendation using ensemble algorithms | |
JP6613942B2 (ja) | 情報出力システム、情報出力方法および情報出力プログラム | |
Özkan et al. | An image-based recommender system based on image annotation | |
JP7372278B2 (ja) | 算出装置、算出方法及び算出プログラム | |
JP6998349B2 (ja) | 学習装置、学習方法、および学習プログラム | |
JP7161002B1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2020004054A (ja) | 出力装置、出力方法および出力プログラム | |
JP7023132B2 (ja) | 選択装置、選択方法および選択プログラム | |
JP6942028B2 (ja) | 比較装置、比較方法および比較プログラム | |
JP2002269143A (ja) | 情報フィルタリングシステムとそのフィルタリング方法、及び情報フィルタリングプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20170417 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200303 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6756648 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |