JP7057324B2 - 認識装置、プログラム及び構築装置 - Google Patents
認識装置、プログラム及び構築装置 Download PDFInfo
- Publication number
- JP7057324B2 JP7057324B2 JP2019128574A JP2019128574A JP7057324B2 JP 7057324 B2 JP7057324 B2 JP 7057324B2 JP 2019128574 A JP2019128574 A JP 2019128574A JP 2019128574 A JP2019128574 A JP 2019128574A JP 7057324 B2 JP7057324 B2 JP 7057324B2
- Authority
- JP
- Japan
- Prior art keywords
- feature information
- query
- unit
- image
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・認識対象の画像を一枚撮影。まず局所特徴量で認識結果候補を絞る。
・候補物品のDB(データベース、以下同様)画像の画像差分をとり、差異領域を出す。
・対象画像から差異領域に当たる部分を割り出し、歪み・色を補正する。
・対象画像の差異領域と、各候補のDB画像の差異領域の画像差分をとり、差の小さい方を認識結果とする。
ステップS1では、DBとしての第一蓄積部7及び第二蓄積部8を構築してから、ステップS2へと進む。当該DB構築の詳細に関しては、図2の各ステップの説明を終えてから後述する。図2の各ステップの説明においては、当該DB構築がなされている前提で、第一蓄積部7及び第二蓄積部8等に関する説明を行う。
ステップS2では、撮影部1が認識対象である商品を被写体として撮影した画像(クエリ画像)を得て、この画像を第一取得部2及び第二取得部4へと出力してから、ステップS3へと進む。撮影部1はハードウェアとしてはデジタルカメラで構成されることができ、認識装置10を利用するユーザがこのカメラとしての撮影部1を操作して撮影することにより、ステップS2において商品の画像を得ることができる。
ステップS3では、撮影部1で得た画像を第一取得部2が解析することにより第一特徴情報を取得し、この取得した第一特徴情報を第一検索部3へと出力してから、ステップS4へと進む。
Distinctive Image Features from Scale-Invariant Keypoints、David G. Lowe、2014
ステップS4では、第一検索部3が、第一取得部2で得た第一特徴情報をクエリとして、検索用DBである第一蓄積部7に対して検索を行うことにより、第一検索結果を得て、この第一検索結果を第二取得部4、第二検索部5及び特定部6へと出力してから、ステップS5へと進む。
例えば、図3の情報(合計の商品数が5)を記憶している第一蓄積部7を検索する場合、図3と同様の表記でクエリの第一特徴情報(BoVW)を表現することにより、第一検索結果の例として以下の例EX-1及びEX-2が挙げられる。この例EX-1及びEX-2は、以降の説明においても適宜、説明例として利用する。
(EX-1)…クエリとしての第一特徴情報が[D,E]であった場合、図3の1つの商品aのみが閾値判定で類似していると判定され、商品名aと、その類似度と、紐づいた類似候補群名Iと、が第一検索結果として得られる。
(EX-2)…クエリとしての第一特徴情報が[A,B,D]であった場合、図3の4つの商品a,b,c,dが閾値判定で類似していると判定され、この4つのそれぞれの商品名と、それぞれの類似度と、それぞれに紐づいた類似候補群名と、が第一検索結果として得られる。
ステップS5では、第一検索部3で得られた第一検索結果に含まれる商品名が1つのみであることにより、第一検索結果において商品が一意に特定されたか否かを特定部6が判定し、一意に特定されている場合はステップS9へと進み、一意に特定されていない場合(第一検索結果に含まれる商品名が複数の場合)はステップS6へと進む。
上記のステップS5で肯定判断を得てから到達するステップS9では、特定部6が、第一検索部3で得られた第一検索結果に含まれる1つのみの商品名を、認識装置10における最終的な認識結果として出力して、且つ、この認識結果を提示部9がユーザに対して提示して、図2のフローは終了する。ここで、提示部9での提示態様については、後述するステップS8での提示部9による認識結果の提示処理と同様に、ディスプレイ表示等の任意態様を用いることができる。
ステップS5からステップS9に到達する例として、第一検索結果が前述の例EX-1が挙げられる。この場合、第一検索結果が1つのみの商品名aを含むことにより、ステップS5で肯定判定を得てステップS9へと進み、ステップS9で最終的な認識結果を「商品a」として特定部6が出力する。
一方、ステップS5からステップS6へ到達する例としては、第一検索結果が前述の例EX-2である場合が該当する。すなわち例EX-2の場合、第一検索結果に含まれる商品名はa,b,c,dの4つであるため、ステップS5で否定判定を得てステップS6へと進むこととなる。
ステップS6では、第一検索部3で得た第一検索結果を参照することにより最も多く含まれる類似候補群名を求めたうえで、第二取得部4が、この最多の類似候補群名に応じた種類の判別手法で用いる第二特徴情報を撮影部1で得た撮影画像から取得して、この第二特徴情報を第二検索部5へと出力してから、ステップS7へと進む。
例えば、第一検索結果が前述の例EX-2であり、商品名a,b,c,dの4つを含むことでステップS6に到達した場合、図3に示されるように第一検索結果の4つの商品名a,b,c,dにはそれぞれ、類似候補群名として「Iのみ」、「I及びIIの両方」、「IIのみ」、「IIのみ」が紐づいていることから、これらの集計結果は「Iが2回」及び「IIが3回」となり、最多の類似候補群名はIIとなる。従ってこの場合、類似候補群名I,IIに関して図4の判別手法を第二取得部4が予め記憶しているものとすると、ステップS6において第二取得部4では、最多の類似候補群名IIに対応する判別手法の「文字認識」を画像に適用して、認識結果としてのテキストを第二特徴情報として取得することとなる。
ステップS7では、第二取得部4で得た最多の類似候補群名に対応する種類の第二特徴情報をクエリとして、第二検索部5が検索用DBである第二蓄積部8に対して、第一検索結果に含まれる各商品に関して記憶されているリファレンスの第二特徴情報を検索したうえで、クエリ第二特徴情報と検索されたリファレンス第二特徴情報との類似度を求めることにより、第二検索結果を得て、この第二検索結果を特定部6へと出力してから、ステップS8へと進む。すなわち、第二検索結果は、クエリの第二特徴情報と、第一検索結果の各商品のリファレンスの第二特徴情報と、の間の類似度を、第一検索結果の各商品に関して列挙した情報で構成される。例えば、上記の例EX-2の場合、第二検索結果は、4つの商品a,b,c,dに関して第二特徴情報で計算された4つの類似度を列挙した情報となる。
第一検索結果に列挙されている各商品に関して、第一検索結果での最多の類似候補群に対応する判別手法で用いられる種別の第二特徴情報をリファレンスとして、第二蓄積部8を参照して探したが、1つ以上の商品(「第二特徴情報非保存商品」と呼ぶ)に関して当該種別でのリファレンスとしての第二特徴情報が第二蓄積部8に保存されていなかった場合、第二検索部5では自身においてこの1つ以上の第二特徴情報非保存商品におけるリファレンスとしての第二特徴情報を取得したうえで、クエリの第二特徴情報との間で類似度を計算して、第二検索結果を得るようにすればよい。
第二検索結果の例として、前述の例EX-2の場合(第一検索結果で類似判定された商品がa,b,c,dの4つであって、最多の類似候補群がIIであり対応する判別手法及び第二特徴情報が文字認識及びテキストの場合)は、次の通りとなる。前提として、この例EX-2において、第二取得部4では撮影部1で得た画像(クエリ画像)に文字認識を適用して、クエリとしての第二特徴情報をテキストTq="ダークローズ"として得たものとする。この場合、第二検索部5では、第二蓄積部8を検索することで、商品a,b,c,dに関して類似候補群IIに対応する種別であるテキストとしての第二特徴情報を探す。
商品aに関する類似候補群IIの第二特徴情報であるテキストは第II蓄積部8-II(図7)に保存されていないので、第二検索部5では商品aの画像Paを第二蓄積部8より取得したうえで、この画像Paに対して自身で文字認識を行い、テキストTa="ディープコーラル"を取得する。
ステップS8では、特定部6が、第一検索部3で得た第一検索結果と、第二検索部5で得た第二検索結果と、の両方を加味することで、クエリ画像(撮影部1で得た画像)に対するリファレンスの各商品の類似度を総合スコアとして算出することにより、クエリ画像の最終的な認識結果を得て提示部9に出力し、提示部9ではこの認識結果をユーザに対して提示したうえで、図2のフローは終了する。
s[i]=w1*s1[i]+w2*s2[i] …(1)
例えば、前述の例EX-2に基づく第二検索結果の例に対応する、特定部6での最終的な認識結果の例として、第一検索結果では商品a,b,c,dが得られたがそのスコアに大差はなく、第二検索結果では商品cのみがテキスト一致(Tc=Tq="ダークローズ")により他の商品a,b,dよりも顕著に高いスコアとなることで、最終的な認識結果として、商品cがクエリ画像に最類似である、という結果を得ることができる。
以上、図1及び図2に示される一実施形態に係る認識装置10によれば、以下の2段階の検索によって、全体として大規模な多数のリファレンス商品が存在し、且つ、一部のリファレンス商品群では細かな差異を有するものが存在する場合であっても、効率的に、クエリ画像の商品の認識結果を得ることができる。
以下、ステップS1に関して後述するとしていた、DBとしての第一蓄積部7及び第二蓄積部8の構築の詳細を、説明する。図8は、第一蓄積部7及び第二蓄積部8を構築する、一実施形態に係る構築装置の機能ブロック図である。構築装置20は、第一蓄積部7を構築する第一構築部11と、この構築された第一蓄積部7の情報を参照することによって第二蓄積部8を構築する第二構築部12と、を備える。第一構築部11はDB取得部21及び群付与部22を備え、第二構築部12は手法受付部23及び性能評価部24を備える。
DB取得部21は、既存DB30を参照することによってDB情報を取得し、必要な場合には適宜、このDB情報を補完したうえで、群付与部22へと出力する。既存DB30は、既に構築されている多数の商品に関するDBであり、各商品に関して、その商品名(商品ID)と、当該商品の画像と、当該商品の画像より認識装置10の第一取得部2で取得されるのと同種類の画像特徴情報であるリファレンスとしての第一特徴情報と、を紐づけたものを、DB情報として記憶している。既存DB30で記憶されるこのDB情報に関しては、予め自動及び/又は管理者等のマニュアル入力により、用意しておけばよい。
群付与部22は、DB取得部21から得られるDB情報の各商品に対して、1つ以上の類似候補群名をさらに紐づけることにより、第一蓄積部7で記憶しておくべきDB情報(模式例として前述の図3)を作成し、この作成されたDB情報を第一蓄積部7に出力する。第一蓄積部7は群付与部22で類似候補群名が付与されたDB情報を受け取って保存することにより、DBとしての第一蓄積部7が構築される。
手法受付部23では、認識装置10の第二取得部4、第二検索部5及び第二蓄積部8において利用される第二特徴情報を定めるための、所定の判別手法及びこの判別手法で利用される画像特徴情報(第二特徴情報)の種別の指定を、管理者等によるマニュアル入力として受け付けて、この指定された判別手法等を性能評価部24へと出力する。
(手法M2)…判別手法として文字認識(及び認識されたテキストの一致度の評価)を、ここで用いる第二特徴情報として画像に対して文字認識により抽出されるテキストを用いる。この際、商品に記載されている全てのテキストではなく、弁別性能の高い一部のテキスト(例えば、商品種別によらず共通に現れるテキスト以外の、個別商品に特化したテキスト)だけをリファレンスの第二特徴情報として、管理者等が予め登録しておくようにしてもよい。また、個別商品に特化したテキストを自動検出する例として、文字認識したうえで、得られるテキスト全部のうち、特定カテゴリ(色、数量、地名、型番、食品における味など)に該当するものだけを抜粋して、クエリ及びリファレンスの第二特徴情報としてもよい。特定カテゴリに該当するテキストの抜粋は、形態素解析などの自然言語処理分野での既存手法を利用すればよい。前述の図7は、文字認識したテキストのうち「色」のカテゴリに該当するものを第二特徴情報とする例となっている。(図7の例はまた、個別商品に特化したテキストが「色」に関するものであった例でもある。)全テキストの中から抜粋する特定カテゴリが異なる場合、互いに異なる文字認識の手法として定義しておけばよい。(例えば色に関する文字認識と、数量に関する文字認識は、別の手法として定義しておくことができる。)色に関する文字認識では、色としてありうる単語を予め辞書として登録しておき、一般的な文字認識手法で得られた認識結果に対し、辞書に近い単語があれば補正(例えば、認識結果「フルー」を辞書登録された「ブルー」に補正する)を行うことで、ノイズ等があったとしてもより確実に色情報を認識できるようにしてよい。数量に関する文字認識も同様に、数量としてあり得る表記を辞書登録したうえで認識(及び補正)すればよい。
(手法M4)…判別手法として、画像に撮影されている商品のスケール(大きさ)がクエリ及びリファレンスで閾値判定により同一スケールであると判定できるか、という手法を用い、ここで用いる第二特徴情報として、画像から抽出される商品のスケールを用いる。
(手法M5)…判別手法として畳み込みニューラルネットワークやサポートベクトルマシン等の機械学習を用い、第二特徴情報はこの機械学習での特徴情報(あるいは種別判定結果)を用いる。
性能評価部24は、構築されている第一蓄積部7のDB情報を読み込み、その類似候補群ごとに、手法受付部23で受け付けた複数の判別手法のそれぞれについて、当該類似候補群に属する商品を弁別する性能を評価し、弁別性能が最良となる判別手法(及び対応する第二特徴情報の種別)を当該類似候補群に紐づけたDB情報を第二蓄積部8へと出力する。ここで、性能評価部24では、各類似候補群に判別手法等を紐づけたうえでさらに、各類似候補群に属する商品に関して、紐づけられた判別手法等に対応するリファレンスとしての第二特徴情報も紐づけることでDB情報を作成して、第二蓄積部8へと出力する。
性能評価部24では、各類似候補群に関して具体的に以下の(第1手順)~(第3手順)のようにして弁別性能の評価を行うことができる。
すなわち、各商品には第一蓄積部7でのDB情報において1枚のリファレンス画像が用意されているが、弁別性能評価に用いるデータとしては1枚では足りないため、また、実際に撮影した際の商品の見え方や写り方の変化も考慮した弁別性能評価を可能とするため、第1手順として、この1枚のリファレンス画像に対して所定の加工を施すことでさらにn枚の画像を用意する。
第2手順では、類似候補群の各々に属する全画像(類似候補群に属する各商品のリファレンス画像と第1手順でこれを加工等して得られる画像との全て)ごとに、手法受付部23で受け付けた判別手法ごとの第二特徴情報を取得したうえで、この第二特徴情報を用いてクラスタリングを行い、クラスタリング結果を得る。すなわち、第2手順において得られるクラスタリング結果は、類似候補群ごと、且つ、判別手法ごと、となる。ここで、類似候補群ごと及び判別手法ごとのいずれのクラスタリングにおいても、クラスタ数は、当該類似候補群に属する商品の数としてクラスタリング結果を得るようにする。(ここで、「商品の数」とは第1手順で加工処理等により増やした画像の数ではない。例えば商品aに関してn+1枚の画像を用意する例を挙げたが、このn+1枚の画像に対応する商品はaの1つのみであり、このn+1枚の画像に対してカウントされる商品数は1である。)
・類似候補群Iに属する全画像を、各画像の特徴量を手法M1の特徴量(カラーヒストグラム)としてクラスタリングした結果R-I-1
・類似候補群Iに属する全画像を、各画像の特徴量を手法M2の特徴量(テキスト)としてクラスタリングした結果R-I-2
・類似候補群Iに属する全画像を、各画像の特徴量を手法M3の特徴量(BoVW)としてクラスタリングした結果R-I-3
・類似候補群IIに属する全画像を、各画像の特徴量を手法M1の特徴量(カラーヒストグラム)としてクラスタリングした結果R-II-1
・類似候補群IIに属する全画像を、各画像の特徴量を手法M2の特徴量(テキスト)としてクラスタリングした結果R-II-2
・類似候補群IIに属する全画像を、各画像の特徴量を手法M3の特徴量(BoVW)としてクラスタリングした結果R-II-3
第3手順では、類似候補群ごとに、第2手順で得た判別手法ごとのクラスタリング結果を評価し、当該類似候補群に属する商品の弁別性能が最も高い判別手法を、当該類似候補群に対して紐づけることで、性能評価部24での最終的な出力結果を得る。ここで、判別手法ごとの弁別性能の評価は、以下の(第3-1手順)~(第3-5手順)のように行えばよい。ここでは説明例として、当該判別手法によるクラスタリング結果を得た類似候補群にはm個(m種類)の商品p-1,p-2,…,p-mが属しているものとする。(従って、この説明例ではクラスタリング結果のクラスタ数もmである。)
弁別性能を評価するためのm種類の商品p-1,p-2,…,p-mの所定の評価順番を決定して、第3-2手順へ進む。ここでは説明のために一般性を失うことなくこの順番、すなわち、i番目(i=1,2,…,m)には商品p-iを評価するものとする。
(第3-2手順)
評価対象であるi番目(i=1,2,…,m)の商品p-iに関して、クラスタリング結果のm個のクラスタの中から、商品p-iの画像(第1手順で用意した商品p-iの元画像又はこれを加工等した画像、あるいは加工ではなく撮影で得た場合は撮影画像)の属する割合(クラスタ内の全画像数に対する商品p-iの画像数の割合)が最大となるクラスタを、商品p-iのクラスタC-iとして決定して、(第3-3手順)へ進む。
商品p-iの弁別性能の評価指標として、そのF値(値をF(p-i)とする)を求めてから、(第3-4手順)へと進む。ここで、F値に関しては既知のように、適合率と再現率との調和平均として求めることができる。既知のように、適合率及び再現率は以下のように求めることができる。
適合率=(クラスタC-iに属する商品p-iの画像数)/(クラスタC-iに属する画像総数)
再現率=(クラスタC-iに属する商品p-iの画像数)/(商品p-iの画像総数)
(第3-4手順)
(第3-1手順)で定めた順番に従って全ての商品p-i(i=1,2,…,m)に関して、現段階のi番目において、(第3-2手順)及び(第3-3手順)を実施してそのF値であるF(p-i)を既に求めたか否かを判断する。(すなわち、現段階i番目が最後のm番目であるか否かを判断する。)全て求めていれば(第3-5手順)に進み、求めていない商品があれば、現段階i番目をその次の(i+1)番目に更新したうえで、(第3-2手順)に戻る。
以上、m回繰り返されて求められた各商品p-i(i=1,2,…,m)の評価指標としてのF値F(p-i)の平均値(求めたm個での平均値)を、当該判別手法の評価性能の指標として求める。
・類似候補群Iを手法M1,M2,M3でそれぞれクラスタリングした3つの結果R-I-1,R-I-2,R-I-3のうち、手法M1(カラーヒストグラム)によるクラスタリング結果R-I-1が最良の弁別性能を実現していると評価されたため、類似候補群Iに手法M1を紐づける。
・類似候補群IIを手法M1,M2,M3でそれぞれクラスタリングした3つの結果R-II-1,R-II-2,R-II-3のうち、手法M2(文字認識)によるクラスタリング結果R-II-2が最良の弁別性能を実現していると評価されたため、類似候補群IIに手法M2を紐づける。
以上のようにして、ステップS1(図2)において構築装置20により第一蓄積部7及び第二蓄積部8をDBとして構築しておくことで、ステップS2~S9において認識装置10による画像に撮影されている商品の認識が可能となる。ここで、既に「認識装置10による総括的な効果」として説明した通り、認識装置10では検索を1段階目と2段階目とで実施することで効率的な認識が可能となり、且つ、この認識に用いるDBに関しても、以下の点により、既に稼働している商品検索システムなどの既存システム(既存DB30)を効率的に利用して構築装置20によって構築することが可能である。
・既存システムのDB上の登録データを直接には増やさない方式でDB構築が可能であるため、類似品が存在しない認識対象に関しては、既存システムに余計な遅延を追加しない。すなわち、1段階目の検索において2段階目につなげるための類似候補群の紐づけはあるが、検索対象や検索要素は既存システムと同じであり1段階目の検索の際に類似候補群は用いないため、1段階目で検索終了する(図2のステップS9に至る)商品の検索速度に悪影響を及ぼすことがない。
・2段階目の検索では、類似品グループごとに弁別性の高い方法を選別して使用するため、1つの手法に固定する従来手法と比べて、より実態に合った方法で差異の比較が可能となる。
・第一検索結果の一部が、その時選択された判別方法が推奨されるグループ(最多の類似候補群)に入っていなくても、候補から外すことなく認識を継続できる。具体的にこの継続は、前述した「ステップS7での第二検索部5による追加処理」によって可能となる。
20…構築装置、11…第一構築部、21…DB取得部、22…群付与部、12…第二構築部、23…手法受付部、24…性能評価部
Claims (14)
- クエリ対象を撮影したクエリ画像よりクエリ第一特徴情報を取得する第一取得部と、
複数のリファレンス対象の各々についてリファレンス第一特徴情報及び類似候補群を紐づけて記憶している第一蓄積部に対して、前記クエリ第一特徴情報を用いて検索を行うことにより、リファレンス第一特徴情報が類似していると判定されるリファレンス対象及び紐づいた類似候補群を列挙した情報を含む第一検索結果を得る第一検索部と、
前記第一検索結果に含まれる類似候補群の中から最適類似候補群を選択し、当該最適類似候補群に応じた種別のクエリ第二特徴情報を、クエリ対象を撮影したクエリ画像より取得する第二取得部と、
リファレンス対象の各々について、前記第一蓄積部で紐づけられている類似候補群に応じた種別のリファレンス第二特徴情報を紐づけて記憶している第二蓄積部に対して、前記クエリ第二特徴情報を用いて、前記第一検索結果に列挙されるリファレンス対象に関して検索を行い、リファレンス対象ごとの類似度を列挙した情報を含む第二検索結果を得る第二検索部と、
前記第一検索結果及び/又は前記第二検索結果に基づいて、前記クエリ画像に撮影されているクエリ対象に関する特定結果を得る特定部と、を備えることを特徴とする認識装置。 - 前記第一検索結果おいて前記類似していると判定されるリファレンス対象が1つのみであった場合には、前記特定部では当該1つのみのリファレンス対象を特定結果として得て、前記第二取得部における取得する処理と前記第二検索部における検索する処理とが省略されることを特徴とする請求項1に記載の認識装置。
- 前記第一蓄積部では、複数のリファレンス対象がそのリファレンス第一特徴情報を用いてクラスタリングされた結果における所属クラスタとして、複数のリファレンス対象の各々についての類似候補群を記憶していることを特徴とする請求項1または2に記載の認識装置。
- 前記第二蓄積部では、前記第一蓄積部で紐づけられることにより各類似候補群に属するリファレンス対象同士を、所定の弁別性能をもって判別することが可能であると判定される画像特徴情報として、類似候補群に応じた種別のリファレンス第二特徴情報を記憶していることを特徴とする請求項1ないし3のいずれかに記載の認識装置。
- 前記第二取得部では、前記第一検索結果に含まれる類似候補群のうち最多のものとして前記最適類似候補群を選択することを特徴とする請求項1ないし4のいずれかに記載の認識装置。
- 前記第一取得部では、クエリ対象を撮影したクエリ画像の一定時間に渡る映像より、一定期間以上継続してトラッキング可能な情報として、クエリ第一特徴情報を得ることを特徴とする請求項1ないし5のいずれかに記載の認識装置。
- 前記第二検索部では、前記第一検索結果に列挙されるリファレンス対象に関して検索を行った際に、前記第二蓄積部において前記最適類似候補群に応じた種別のリファレンス第二特徴情報が記憶されていないリファレンス対象が存在する場合には、当該リファレンス対象の画像を取得して解析することにより、前記最適類似候補群に応じた種別のリファレンス第二特徴情報を取得することを特徴とする請求項1ないし6のいずれかに記載の認識装置。
- 前記第二取得部では、前記第一検索結果に基づいて、前記第一取得部において前記クエリ第一特徴情報を取得するのに用いたクエリ画像のうち、クエリ対象が撮影されている範囲を推定し、当該範囲をトリミングした画像を用いることにより、前記クエリ第二特徴情報を取得することを特徴とする請求項1ないし7のいずれかに記載の認識装置。
- 前記第二取得部では、前記推定されるクエリ対象が撮影されている範囲を、前記第一検索結果でのクエリ第一特徴情報のうち、重複して複数のリファレンス第一特徴情報とマッチしていると判定されるものに基づいて推定することを特徴とする請求項8に記載の認識装置。
- 前記第二取得部では、前記第一検索結果に基づいて、前記第一取得部において前記クエリ第一特徴情報を取得するのに用いたクエリ画像のうち、クエリ対象が撮影されている範囲を推定し、当該範囲が適切に撮影されることを促す所定メッセージをユーザに対して通知し、当該所定メッセージを受けたユーザが撮影を行うことで得られたクエリ画像を用いることにより、前記クエリ第二特徴情報を取得することを特徴とする請求項1ないし7のいずれかに記載の認識装置。
- 前記特定部による前記第一検索結果及び/又は前記第二検索結果に基づく特定結果が絞り切れていないと判定される場合の構成として、
前記第二検索結果に含まれる下位類似候補群の中から最適下位類似候補群を選択し、当該最適下位類似候補群に応じた種別のクエリ第三特徴情報を、クエリ対象を撮影したクエリ画像より取得する第三取得部と、
リファレンス対象の各々について、紐づけられている下位類似候補群に応じた種別のリファレンス第三特徴情報を紐づけて記憶している第三蓄積部に対して、前記クエリ第三特徴情報を用いて、前記第二検索結果に列挙されるリファレンス対象に関して検索を行い、リファレンス対象ごとの類似度を列挙した情報を含む第三検索結果を得る第三検索部と、をさらに備え、
前記特定部は、前記第一検索結果及び/又は前記第二検索結果と、前記第三検索結果と、に基づいて、前記クエリ画像に撮影されているクエリ対象に関する特定結果を得ることを特徴とする請求項1ないし10のいずれかに記載の認識装置。 - 前記第二取得部で取得されうる、前記最適類似候補群に応じた種別のクエリ第二特徴情報の種別の1つに、クエリ画像から文字認識したテキストより特定カテゴリに該当するものを抜粋した情報が含まれることを特徴とする請求項1ないし11のいずれかに記載の認識装置。
- コンピュータを請求項1ないし12のいずれかに記載の認識装置として機能させることを特徴とするプログラム。
- 請求項1ないし12のいずれかに記載の認識装置において検索される、第一蓄積部に記憶される第一データベース情報と第二蓄積部に記憶される第二データベース情報とを構築する構築装置であって、
既に構築されているデータベース情報として、リファレンス対象の各々についてその画像から取得されるリファレンス第一特徴情報が紐づけられたデータベース情報を取得し、複数のリファレンス対象を、そのリファレンス第一特徴情報を用いてクラスタリングした結果における所属クラスタとして、複数のリファレンス対象の各々についての類似候補群を決定することにより、リファレンス対象の各々についてリファレンス第一特徴情報と類似候補群とを紐づけることによって前記第一データベース情報を構築する第一構築部と、
前記第一データベース情報において紐づけられることで各類似候補群に属するリファレンス対象の画像に対して、所定の複数種類の画像判別手法にそれぞれ対応する複数種類の画像特徴情報を用いてそれぞれクラスタリングを行うことで、得られるクラスタリング結果のうち属するリファレンス対象の弁別性能が最良判定されるものを決定し、
各類似候補群に属するリファレンス対象について、当該最良判定されたクラスタリング結果に対応する種類の画像特徴情報をリファレンス第二特徴情報として紐づけることによって、前記第二データベース情報を構築する第二構築部と、を備えることを特徴とする構築装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019128574A JP7057324B2 (ja) | 2019-07-10 | 2019-07-10 | 認識装置、プログラム及び構築装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019128574A JP7057324B2 (ja) | 2019-07-10 | 2019-07-10 | 認識装置、プログラム及び構築装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021015363A JP2021015363A (ja) | 2021-02-12 |
JP7057324B2 true JP7057324B2 (ja) | 2022-04-19 |
Family
ID=74531421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019128574A Active JP7057324B2 (ja) | 2019-07-10 | 2019-07-10 | 認識装置、プログラム及び構築装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7057324B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150161178A1 (en) | 2009-12-07 | 2015-06-11 | Google Inc. | Distributed Image Search |
US20180341803A1 (en) | 2017-05-23 | 2018-11-29 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
-
2019
- 2019-07-10 JP JP2019128574A patent/JP7057324B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150161178A1 (en) | 2009-12-07 | 2015-06-11 | Google Inc. | Distributed Image Search |
US20180341803A1 (en) | 2017-05-23 | 2018-11-29 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
JP2018198056A (ja) | 2017-05-23 | 2018-12-13 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021015363A (ja) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aguilar et al. | Grab, pay, and eat: Semantic food detection for smart restaurants | |
US10671853B2 (en) | Machine learning for identification of candidate video insertion object types | |
US9042659B2 (en) | Method and system for fast and robust identification of specific product images | |
US8750602B2 (en) | Method and system for personalized advertisement push based on user interest learning | |
KR101289085B1 (ko) | 객체 기반 영상 검색시스템 및 검색방법 | |
US20130101209A1 (en) | Method and system for extraction and association of object of interest in video | |
CN111061890B (zh) | 一种标注信息验证的方法、类别确定的方法及装置 | |
CN104679818B (zh) | 一种视频关键帧提取方法及系统 | |
CN106446015A (zh) | 一种基于用户行为偏好的视频内容访问预测与推荐方法 | |
CN108710916B (zh) | 图片分类的方法及装置 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
JP7183753B2 (ja) | リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム | |
CN108647703B (zh) | 一种基于显著性的分类图像库的类型判断方法 | |
CN113591850A (zh) | 基于计算机视觉鲁棒性目标检测的两阶段商标检测法 | |
JP7057324B2 (ja) | 認識装置、プログラム及び構築装置 | |
CN113705310A (zh) | 特征学习的方法、目标物体的识别方法和对应装置 | |
CN110580297A (zh) | 基于菜品图像的商户及菜品匹配方法、装置、电子设备 | |
CN116684528A (zh) | 一种视频彩铃不同视角的推荐方法 | |
CN115983873A (zh) | 一种基于大数据的用户数据分析管理系统及方法 | |
CN113780487B (zh) | 图片分类方法、存储介质及电子设备 | |
CN115049962A (zh) | 视频服饰检测方法、装置及设备 | |
Liu et al. | Video retrieval based on object discovery | |
CN110580299A (zh) | 生成对象的推荐语的配图的方法、系统、设备及存储介质 | |
CN114419391A (zh) | 目标图像识别方法及装置、电子设备及可读存储介质 | |
JP2006221525A (ja) | オブジェクト検索システムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7057324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |