JP6742186B2 - 決定装置、決定方法、及び決定プログラム - Google Patents
決定装置、決定方法、及び決定プログラム Download PDFInfo
- Publication number
- JP6742186B2 JP6742186B2 JP2016148750A JP2016148750A JP6742186B2 JP 6742186 B2 JP6742186 B2 JP 6742186B2 JP 2016148750 A JP2016148750 A JP 2016148750A JP 2016148750 A JP2016148750 A JP 2016148750A JP 6742186 B2 JP6742186 B2 JP 6742186B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- information
- ranking
- target
- occupancy rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 67
- 230000008569 process Effects 0.000 claims description 31
- 241000282326 Felis catus Species 0.000 description 134
- 230000006870 function Effects 0.000 description 28
- 238000012545 processing Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 20
- 241000282472 Canis lupus familiaris Species 0.000 description 11
- 101100444028 Drosophila melanogaster Dso2 gene Proteins 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000010365 information processing Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Description
〔1.検索処理〕
図1及び図2を用いて、実施形態に係る検索処理の一例について説明する。図1及び図2は、実施形態に係る検索処理の一例を示す図である。具体的には、図1は、後述する検索の対象となる画像群の各々における対象の占有率の推定の一例を示す図である。図1に示す検索装置100は、画像における対象の占有率を出力(推定)する学習器(モデル)を用いて、検索の対象となる画像群の各々における対象の占有率を推定する。
次に、図3を用いて、実施形態に係る検索装置100の構成について説明する。図3は、実施形態に係る検索装置100の構成例を示す図である。図3に示すように、検索装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、検索装置100は、検索装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば検索システム1に含まれる端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、学習情報記憶部121と、画像情報記憶部122と、一覧情報記憶部123と、占有率情報記憶部124とを有する。
実施形態に係る学習情報記憶部121は、学習に関する各種情報を記憶する。例えば、図4では、学習情報記憶部121は、所定の学習処理により生成された学習器LEに関する学習情報(モデル)を記憶する。図4に、実施形態に係る学習情報記憶部121の一例を示す。図4に示す学習情報記憶部121は、「重み(wij)」を記憶する。
実施形態に係る画像情報記憶部122は、画像に関する各種情報を記憶する。図5に、実施形態に係る画像情報記憶部122の一例を示す。例えば、画像情報記憶部122には、検索対象となる画像が記憶される。図5に示す画像情報記憶部122は、「画像ID」、「画像」、「タグ」といった項目を有する。
実施形態に係る一覧情報記憶部123は、画像における対象の占有率等に関する各種情報を記憶する。例えば、一覧情報記憶部123は、対象ごとに画像における対象の占有率等に関する各種情報を記憶する。図6は、実施形態に係る一覧情報記憶部の一例を示す図である。図6に示す例においては、一覧情報記憶部123は、一覧情報LT11や一覧情報LT21といった含まれる対象ごとに情報(テーブル)を記憶する。例えば、一覧情報LT11や一覧情報LT21は、「画像ID」や「占有率(%)」といった項目を有する。
実施形態に係る占有率情報記憶部124は、画像における対象の占有率等に関する各種情報を記憶する。例えば、占有率情報記憶部124は、対象ごとに占有率の最適値に関する各種情報を記憶する。図7は、実施形態に係る占有率情報記憶部の一例を示す図である。図7に示す例においては、占有率情報記憶部124は、「対象」、「占有率(%)」、「クリック率順位」といった項目を有する。
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、検索装置100内部の記憶装置に記憶されている各種プログラム(決定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
例えば、取得部131は、各種情報を取得する。例えば、取得部131は、画像を取得する。例えば、取得部131は、画像情報記憶部122から画像を取得する。図1では、取得部131は、画像情報記憶部122から画像IM11〜IM15等を取得する。なお、取得部131は、外部の情報処理装置から画像IM11〜IM15等を取得してもよい。
学習部132は、種々の情報を学習する。また、学習部132は、学習により種々の情報を生成する。例えば、学習部132は、学習器(モデル)を学習する。言い換えると、学習部132は、学習を行うことにより学習器(モデル)を生成する。例えば、学習部132は、学習器LEを学習する。例えば、学習部132は、画像と当該画像における所定の対象の占有率との組み合わせにより学習器を学習する。また、学習部132は、所定の評価関数を最小化するように学習器を学習する。なお、学習部132が行う学習処理の詳細は後述する。
推定部133は、各種情報を推定する。例えば、推定部133は、入力画像に応じて当該入力画像中における所定の対象の占有率を出力する学習器と、取得部131により取得された画像とに基づいて、取得部131により取得された画像における所定の対象の占有率を推定する。例えば、推定部133は、所定のデータ(教師データ)により学習されたニューラルネットワークである学習器に基づいて、取得部131により取得された画像における所定の対象の占有率を推定する。例えば、推定部133は、画像と当該画像中における所定の対象の占有率との組み合わせにより学習されたニューラルネットワークである学習器に基づいて、取得部131により取得された画像における所定の対象の占有率を推定する。例えば、推定部133は、畳み込み処理及びプーリング処理を行うニューラルネットワークである学習器に基づいて、取得部131により取得された画像における所定の対象の占有率を推定する。
抽出部134は、種々の情報を抽出する。例えば、抽出部134は、画像情報記憶部122や一覧情報記憶部123から画像に関する情報を抽出する。例えば、抽出部134は、画像情報記憶部122や一覧情報記憶部123に記憶された所定の画像群から条件を満たす画像を抽出する。図2では、抽出部134は、クエリ「猫」に対応する画像を抽出する。
決定部135は、種々の情報を決定する。例えば、決定部135は、各画像におけるクエリに対応する対象のサイズに関する情報に基づいて、各画像のランキングを決定する。例えば、決定部135は、各画像における対象のサイズに関する情報と、各画像のサイズに関する情報とに基づく各画像における対象の占有率に関する情報に応じて、各画像のランキングを決定する。例えば、決定部135は、対象に応じて変動する占有率に関する情報に基づいて、各画像のランキングを決定する。例えば、決定部135は、推定部133により推定された複数の画像の各々におけるクエリに対応する対象の占有率に基づいて、複数の画像のランキングを決定する。
提供部136は、外部の情報処理装置へ各種情報を提供する。例えば、提供部136は、決定部135により決定された複数の画像のランキングに基づく情報を提供する。図2では、提供部136は、決定したランキングに基づいた検索結果をユーザU1に提供する。例えば、提供部136は、画像IM15を1位とし、画像IM19を2位とし、画像IM17を3位とし、画像IM11を4位とするランキングに基づいた表示順の検索結果をユーザU1が利用する端末装置10に提供する。例えば、提供部136は、決定したランキングに基づいた検索結果を端末装置10に送信する。
ここで、図8を用いて、実施形態に係る検索装置100による占有率の推定処理の手順について説明する。図8は、実施形態に係る画像における対象の占有率の推定の一例を示すフローチャートである。
次に、図9を用いて、実施形態に係る検索装置100によるランキングの決定処理の手順について説明する。図9は、実施形態に係るランキングの決定の一例を示すフローチャートである。
ここで、検索装置100の学習部132における学習処理について、図10及び図11を用いて説明する。図10及び図11は、実施形態に係る学習処理の一例を示す図である。
ここで、図12を用いて、実施形態に係る検索装置100による学習処理の手順について説明する。図12は、実施形態に係る学習処理の一例を示すフローチャートである。
上述したように、検索装置100は、種々の情報を適宜用いて画像のランキングを決定してもよい。例えば、検索装置100は、各画像のランキングにおける各画像間の占有率の多様性に応じて、各画像のランキングを決定してもよい。この点について、図13を用いて、実施形態に係る検索装置100によるランキングの決定について説明する。図13は、実施形態に係るランキングの決定の一例を示す図である。
上述してきたように、実施形態に係る検索装置100は、取得部131と、決定部135とを有する。取得部131は、画像検索におけるクエリを取得する。決定部135は、
各画像におけるクエリに対応する対象(実施形態においては「猫」。以下、同じ)のサイズに関する情報に基づいて、各画像のランキングを決定する。
上述してきた実施形態に係る検索装置100は、例えば図14に示すような構成のコンピュータ1000によって実現される。図14は、検索装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
100 検索装置(決定装置)
121 学習情報記憶部
122 画像情報記憶部
123 一覧情報記憶部
124 占有率情報記憶部
130 制御部
131 取得部
132 学習部
133 推定部
134 抽出部
135 決定部
136 提供部
10 端末装置
N ネットワーク
Claims (11)
- 画像検索におけるクエリを取得する取得部と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報であって、前記対象に応じて変動する占有率に関する情報に応じて、前記各画像のランキングを決定する決定部と、
を備え、
前記決定部は、
前記対象の検索結果としてユーザに提供された画像であって、前記ユーザにより選択された画像における前記対象の占有率に応じて決定される占有率に関する情報に基づいて、前記各画像のランキングを決定する
ことを特徴とする決定装置。 - 画像検索におけるクエリを取得する取得部と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報に応じて、前記各画像のランキングを決定する決定部と、
を備え、
前記決定部は、
前記各画像のランキングにおける前記各画像間の占有率の多様性に応じて、前記各画像のランキングを決定する
ことを特徴とする決定装置。 - 前記決定部は、
前記対象に応じて変動する占有率に関する情報に基づいて、前記各画像のランキングを決定する
ことを特徴とする請求項2に記載の決定装置。 - 前記決定部は、
前記各画像のランキングにおいて連続する前記各画像の占有率の差が所定の条件を満たすように、前記各画像のランキングを決定する
ことを特徴とする請求項2または請求項3に記載の決定装置。 - 前記決定部は、
前記各画像に前記対象以外の対象が含まれるか否かに応じて、前記各画像のランキングを決定する
ことを特徴とする請求項1〜4のいずれか1項に記載の決定装置。 - 前記決定部は、
前記各画像に文字情報が含まれるか否かに応じて、前記各画像のランキングを決定する
ことを特徴とする請求項1〜5のいずれか1項に記載の決定装置。 - 前記決定部により決定された前記各画像のランキングに基づく情報を提供する提供部、
をさらに備えることを特徴とする請求項1〜6のいずれか1項に記載の決定装置。 - コンピュータが実行する決定方法であって、
画像検索におけるクエリを取得する取得工程と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報であって、前記対象に応じて変動する占有率に関する情報に応じて、前記各画像のランキングを決定する決定工程と、
を含み、
前記決定工程は、
前記対象の検索結果としてユーザに提供された画像であって、前記ユーザにより選択された画像における前記対象の占有率に応じて決定される占有率に関する情報に基づいて、前記各画像のランキングを決定する
ことを特徴とする決定方法。 - 画像検索におけるクエリを取得する取得手順と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報であって、前記対象に応じて変動する占有率に関する情報に応じて、前記各画像のランキングを決定する決定手順と、
をコンピュータに実行させ、
前記決定手順は、
前記対象の検索結果としてユーザに提供された画像であって、前記ユーザにより選択された画像における前記対象の占有率に応じて決定される占有率に関する情報に基づいて、前記各画像のランキングを決定する
ことを特徴とする決定プログラム。 - コンピュータが実行する決定方法であって、
画像検索におけるクエリを取得する取得工程と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報に応じて、前記各画像のランキングを決定する決定工程と、
を含み、
前記決定工程は、
前記各画像のランキングにおける前記各画像間の占有率の多様性に応じて、前記各画像のランキングを決定する
ことを特徴とする決定方法。 - 画像検索におけるクエリを取得する取得手順と、
各画像における前記クエリに対応する対象のサイズに関する情報と、前記各画像のサイズに関する情報とに基づく前記各画像における前記対象の占有率に関する情報に応じて、前記各画像のランキングを決定する決定手順と、
をコンピュータに実行させ、
前記決定手順は、
前記各画像のランキングにおける前記各画像間の占有率の多様性に応じて、前記各画像のランキングを決定する
ことを特徴とする決定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016148750A JP6742186B2 (ja) | 2016-07-28 | 2016-07-28 | 決定装置、決定方法、及び決定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016148750A JP6742186B2 (ja) | 2016-07-28 | 2016-07-28 | 決定装置、決定方法、及び決定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018018339A JP2018018339A (ja) | 2018-02-01 |
JP6742186B2 true JP6742186B2 (ja) | 2020-08-19 |
Family
ID=61081882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016148750A Active JP6742186B2 (ja) | 2016-07-28 | 2016-07-28 | 決定装置、決定方法、及び決定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6742186B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05242160A (ja) * | 1992-02-27 | 1993-09-21 | Matsushita Electric Ind Co Ltd | 画像特徴抽出装置、画像照合装置および画像検索装置 |
JP4444633B2 (ja) * | 2003-11-12 | 2010-03-31 | 日本電信電話株式会社 | 画像分類装置、画像分類方法、および、プログラム |
JP2011081763A (ja) * | 2009-09-09 | 2011-04-21 | Sony Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
US8660378B2 (en) * | 2010-02-10 | 2014-02-25 | Panasonic Corporation | Image evaluating device for calculating an importance degree of an object and an image, and an image evaluating method, program, and integrated circuit for performing the same |
US8494983B2 (en) * | 2010-11-16 | 2013-07-23 | Microsoft Corporation | Object-sensitive image search |
JP5121917B2 (ja) * | 2010-12-21 | 2013-01-16 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
JP5496119B2 (ja) * | 2011-01-21 | 2014-05-21 | 三菱電機株式会社 | プログラマブル表示器用画面データ編集装置 |
-
2016
- 2016-07-28 JP JP2016148750A patent/JP6742186B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018018339A (ja) | 2018-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110969516B (zh) | 一种商品推荐方法及装置 | |
US10282462B2 (en) | Systems, method, and non-transitory computer-readable storage media for multi-modal product classification | |
CN109063163B (zh) | 一种音乐推荐的方法、装置、终端设备和介质 | |
CN110276406B (zh) | 表情分类方法、装置、计算机设备及存储介质 | |
CN110555469B (zh) | 处理交互序列数据的方法及装置 | |
US20170200066A1 (en) | Semantic Natural Language Vector Space | |
US10733480B2 (en) | Custom Auto Tagging of Multiple Objects | |
JP2017062781A (ja) | 深層cnnプーリング層を特徴として用いる、類似度に基づく重要な対象の検知 | |
Wang et al. | Multi-objective path finding in stochastic networks using a biogeography-based optimization method | |
CN113609337A (zh) | 图神经网络的预训练方法、训练方法、装置、设备及介质 | |
CN112380427B (zh) | 基于迭代图注意力网络的用户兴趣预测方法及电子装置 | |
Khan et al. | Comparative analysis on Facebook post interaction using DNN, ELM and LSTM | |
JP6985059B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
US10891513B2 (en) | System and method for cascading image clustering using distribution over auto-generated labels | |
JP6679683B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6742186B2 (ja) | 決定装置、決定方法、及び決定プログラム | |
JP6826389B2 (ja) | 推定装置、推定方法、及び推定プログラム | |
CN102236652B (zh) | 一种信息的分类方法和装置 | |
JP2021149681A (ja) | 判定装置、判定方法及び判定プログラム | |
JP6910873B2 (ja) | 特定装置および特定方法 | |
CN113408546B (zh) | 基于相互全局上下文注意力机制的单样本目标检测方法 | |
JP6782577B2 (ja) | 抽出装置、抽出方法、及び抽出プログラム | |
Holmquist et al. | Evidential deep learning for class-incremental semantic segmentation | |
JP7198900B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
CN104317912B (zh) | 基于邻域与距离度量学习的图像语义自动标注方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200630 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200728 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6742186 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |