JP2023095609A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2023095609A
JP2023095609A JP2021211600A JP2021211600A JP2023095609A JP 2023095609 A JP2023095609 A JP 2023095609A JP 2021211600 A JP2021211600 A JP 2021211600A JP 2021211600 A JP2021211600 A JP 2021211600A JP 2023095609 A JP2023095609 A JP 2023095609A
Authority
JP
Japan
Prior art keywords
image processing
recommendation
image
processing device
captured image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021211600A
Other languages
English (en)
Other versions
JP7258117B1 (ja
Inventor
満 中澤
Mitsuru Nakazawa
高志 友岡
Takashi Tomooka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Priority to JP2021211600A priority Critical patent/JP7258117B1/ja
Priority to US18/088,044 priority patent/US20230209171A1/en
Application granted granted Critical
Publication of JP7258117B1 publication Critical patent/JP7258117B1/ja
Publication of JP2023095609A publication Critical patent/JP2023095609A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

【課題】具体的な撮像方向を指示できる画像処理装置、画像処理方法及びプログラムを提供する。【解決手段】対象物を示す撮像画像を受け入れる受入手段と、前記撮像画像に基づき前記対象物の特徴点を抽出することで前記対象物の認識を行う認識手段と、前記対象物の種類に基づき撮像方向の推奨を行う推奨手段と、前記認識の結果と前記推奨の結果とに基づき前記対象物に係る撮像方向の指示を行う指示手段と、を有する画像処理装置またはその方法及びプログラム。【選択図】図1

Description

本発明は、画像の撮像に関する指示を行う画像処理装置、画像処理方法及びプログラムに関する。
ユーザ間での商品などの売買を仲介する、いわゆるC2C(Customer to Customer)マーケットプレイスサービス等の電子商取引サービスが広く利用されている。電子商取引サービスでは、ユーザは商品の撮像画像を掲示する場合がある。ところが、同一の商品であってもユーザごとに撮影の巧拙があることに起因して商品の売れ行きに差が生じる場合がある。
特開2021-077131号公報
特許文献1には、SNSに投稿された複数の画像の構図に関する評価を学習する学習手段と、ユーザによって操作される端末において撮像される画像を解析して特徴情報を抽出する抽出手段と、ユーザの操作によって構図が暫定的に指定されると、抽出された特徴情報に基づき、構図に従って撮影された画像に対してSNSにおいて与えられると推測される評価を表す情報をユーザに通知する通知手段とを有する構図アドバイスシステムが開示されている。
そこでこのような構図のアドバイスを行うことで、商品の写真について適切と評価される構図を指示することが考えられる。しかしながら特許文献1に開示の技術では、ユーザが構図を変更しながら撮像(構図の確定)を行ってアドバイスを得る必要があり、具体的にどのような構図から撮像することが妥当であるのか、その指示が分かりにくい。
本発明は上記実情に鑑みて為されたもので、具体的な撮像方向を指示できる画像処理装置、及びプログラムを提供することを、その目的の一つとする。
上記従来例の問題点を解決する本発明の一態様は画像処理装置であって、対象物を示す撮像画像を受け入れる受入手段と、前記撮像画像に基づき前記対象物の特徴点を抽出することで前記対象物の認識を行う認識手段と、前記対象物の種類に基づき撮像方向の推奨を行う推奨手段と、前記認識の結果と前記推奨の結果とに基づき前記対象物に係る撮像方向の指示を行う指示手段と、を有する画像処理装置である。
本発明によると、具体的な撮像方向を指示できる。
本発明の実施の態様に係る画像処理装置の構成例を表すブロック図である。 本発明の実施の態様に係る画像処理装置が利用するデータベースの内容例を表す説明図である。 本発明の実施の態様に係る画像処理装置の例を表す機能ブロック図である。 本発明の実施の態様に係る画像処理装置が設定する仮想包囲体の例を表す説明図である。 本発明の実施の態様に係る画像処理装置の動作例を表すフローチャート図である。 本発明の実施の態様に係る画像処理装置が表示する画面例を表す説明図である。 本発明の実施の態様に係る画像処理装置が設定する仮想包囲体のもう一つの例を表す説明図である。
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る画像処理装置1は、例えばスマートフォン等のカメラ機能を有する情報処理装置によって実現でき、図1に例示するように、制御部11,記憶部12,操作部13,表示部14,通信部15、及び撮像部16を含んで構成される。またこの画像処理装置1は、サーバ装置2に対して、ネットワークを介して通信可能に接続されてもよい。
この制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されたプログラムに従って動作する。本実施の形態の例では、この制御部11は、ユーザの指示に従って撮像部16を制御し、被写体である対象物の撮像画像を受け入れる。ここで、撮像画像を受け入れるとは、撮像部16によって対象物を撮像して得られた撮像画像をプレビュー画像としてRAM等の揮発性メモリに一時的に格納することを指してよく、撮像部16によって対象物を撮像して得られた撮像画像を記憶部12に記録することを指してもよい。さらに制御部11は、上記受け入れた撮像画像に基づき対象物の認識を行い、この認識の結果に基づき被写体である対象物の撮像方向の指示を行う。この制御部11の動作例については後に述べる。
本実施の形態において、撮像方向とは、撮像機能を有する装置(カメラなど)のアングルおよびポジションの情報を示す。例として、後述のxy表面からの仰角が大きい場合、その撮像方向は、ハイアングルおよびハイポジションを示すものと解される。なお、本明細書において、撮像方向は単に方向とも表記され得る。
記憶部12は、メモリデバイスやディスクデバイス等であり、制御部11によって実行されるプログラムを格納する。このプログラムは、コンピュータ可読かつ非一時的な記録媒体に格納されて提供され、この記憶部12に複写されたものであってもよい。
操作部13は、表示部14に重ね合わせて配されたタッチパネル等であり、ユーザの操作を受け入れて、当該操作の内容を表す情報を、制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って画像を表示する。
通信部15は、ネットワークや、携帯電話回線網を介して通信を行うためのインタフェースであり、例えばネットワークを介して受信されるデータを制御部11に出力し、また制御部11から入力される指示に従って、データを、ネットワークを介して外部のサーバ等に宛てて送出する。撮像部16は、カメラ等であり、撮像した撮像画像を逐次的に、制御部11に出力する。
本実施の形態では、この画像処理装置1と通信可能に接続されるサーバ装置2は、画像処理装置1から、画像処理装置1で撮像され、記録された撮像画像のアップロードを受け入れる。またこのサーバ装置2は、画像処理装置1から撮像の対象となる対象物の種類を特定する情報(対象物の名称、あるいは対象物の形状などを表す情報)を受け入れて、当該対象物を撮像するに適切とされる方向を表す情報を提供する。
適切な方向の情報を提供する処理を実現する方法の一例として、本実施の形態では、図2に例示するように、サーバ装置2に、予め対象物の名称等の情報に関連付けて、当該対象物の撮像に適切とされる方向の情報(推奨方向情報と呼ぶ)を記録したデータベースを格納しておく。この推奨方向情報は、例えばサーバ装置2がいわゆるC2Cマーケットプレイスサービスを提供するものである場合、当該対象物と同じ名称(同じ商品名)の商品が提供された際の撮像画像の方向と、当該商品についての過去の売れ行きから統計的に、あるいは人為的に決定しておけばよい。
またこの推奨方向情報は、対象物の高さ方向をζ軸とし、対象物の正面方向から撮像方向(カメラが配される方向)のζ軸周りの角度をθ、原点(対象物に外接する六面体の底面(対象物底面と一致する)の中心でよい)からの仰角方向をφとした(θ,φ)で表すことができる。
そしてサーバ装置2は、画像処理装置1から撮像の対象となる対象物を特定する情報とともに推奨方向情報の要求を受けると、当該要求に応答し、受け入れた情報で特定される対象物の名称等の情報に関連付けられた推奨方向情報を取得し、当該取得した推奨方向情報を、要求元の画像処理装置1へ送出する。
次に、本実施の形態の制御部11の動作について説明する。本実施の形態において制御部11は、記憶部12に格納されたプログラムを実行することで、図3に例示するように、受入部21(受入手段に相当)と、記録部22と、認識部23(認識手段に相当)と、指示部24(指示手段に相当)と、推定部25(推定手段に相当)とを機能的に含む構成を実現する。また、この制御部11は、推奨部27(推奨手段に相当)をさらに機能的に含む構成を実現してもよい。なお、各手段または各ステップの構成は、各部の構成を適宜、組み合わせたものであってよく、その態様に制限はない。
ユーザは、机などの平面上に撮像の対象となる対象物を配し、画像処理装置1(例えばスマートフォン)を操作して、このプログラムを起動する。以下、撮像部16は、カメラで撮像した撮像画像を逐次的に出力する。
受入部21は、撮像部16から入力される、撮像部16にて撮像された撮像画像を逐次的に受け入れる。受入部21は、この撮像画像を、表示部14に表示出力することとしてもよい。
記録部22は、ユーザの意思入力に応じて、受入部21が最後に受け入れた撮像画像を記憶部12に撮影画像として記録する。
認識部23は、受入部21が受け入れた撮像画像、または記録部22が記録した撮像画像を処理の対象(以下処理対象画像と呼ぶ)として、当該処理対象画像に撮像された対象物を認識する。具体的にこの認識部23は、処理対象画像が三次元空間を撮像したものと仮定して、仮想的な三次元座標(XYZ直交座標)を設定する。
すなわち認識部23は、処理対象画像から所定の特徴点(Scale-Invariant Feature Transform(SIFT)等で得られる画像特徴点でよい)を抽出して、対象物が配されている平面を検出し、この平面上の一点を原点とし、平面に平行にXY直交座標を決定する。例えば認識部23は、Y座標の正の方向を、座標の決定処理の際に最後に撮像された処理対象画像のカメラの視線方向を上記平面に射影した方向とし、X座標の正の方向を上記Y座標に直交し、Y座標の正の方向を見たとき、右方向となるように設定する。また認識部23は、上記平面の法線方向をZ座標正の方向として、仮想的なXYZ直交座標(ワールド座標と呼ぶ)を設定する。もっともこの座標の設定方法は一例であり、他の方法が採用されてもよい。
さらに認識部23は、処理対象画像から対象物に関する所定の特徴点を抽出し、対象物が撮像されている範囲(例えば対象物に外接する直方体)をバウンディング・ボックスとして特定する。つまり認識部23は、このバウンディング・ボックスとなる多面体の頂点座標の組を特定して取得する。なお認識部23は、この直方体を、その底面が上記平面と一致するよう設定し、この直方体の底面の中心(ワールド座標系で表される)を原点とし、ワールド座標のX,Y,Z軸にそれぞれ平行なx′,y′,z軸となる座標系を仮に設定する。そして認識部23は、バウンディング・ボックスとなった多面体の一つの面を所定の方法で正面方向として選択し、上記仮に設定した座標系のx′,y′軸をz軸周りに回転して、y′軸が正面方向の法線方向(かつその正の方向がバウンディング・ボックスの正面から対象物に向かう向き)となるように設定して、当該回転角βを得る。認識部23は、この回転角βだけ回転した後のx′,y′軸の方向をそれぞれx,y軸とし、対象物に関するxyz直交座標系(対象物座標系)を設定する。
ここで正面方向を選択する方法としては、例えばバウンディング・ボックスの面のうち、最初に取得された撮像画像の撮像方向に最も近く、かつ最も大きい面を正面とする方法や、ユーザにより人為的に正面を選択させる方法などがあるが、対象物の正面方向を定めることができれば、これらの例に限られるものではない。
また認識部23は、予め登録されている物体の参照用の商品画像と比較する等の処理により、対象物の名称(対象物が商品であれば商品名)等を認識してもよい。認識部23は、対象物の認識の結果に基づき対象物の形状を決定してよい。
また認識部23は、対象物の認識を行うことで対象物の種類に係る識別を行うこととしてもよい。本実施の形態における識別とは、例として、対象物の認識により得られた対象物の特徴点(特徴量に相当)に基づいて、当該特徴量を入力として、機械学習モデル等で実現される分類器を用いて対象物の分類を取得することであってよい。この対象物の識別は、また、画像検索の態様をとってもよいし、対象物の特徴点に基づくパターンマッチングの態様をとってもよく、その態様に制限はない。
これらのワールド座標系や対象物座標系の設定、あるいは名称等の認識を行う処理は、一般的なAR(Augmented Reality)処理モジュール(例えば米国アップル社の提供するARKitや、米国グーグル社のARCoreなど)の物体認識機能を利用して、あるいは、機械学習(https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.htmlに記載の処理、ないしArsalan Mousavian, et al., 3D Bounding Box Estimation Using Deep Learning and Geometry, arXiv:1612.00496v2などに記載の処理など)によって実現できるものであるので、ここでの詳しい説明は省略する。なお、本実施の形態において、対象物を配する机などの平面には、物体認識の支援を目的としてARマーカー等のパターン画像が呈示されてもよい。例えばARマーカーを形成したシートを机上に配し、その上に対象物を置いて撮像することとしてもよい。
指示部24は、認識部23による、撮像された対象物の認識の結果に基づいて、当該対象物に係る撮像方向をユーザに対し指示する。本実施の形態の例では、この指示部24は、図3に例示したように、オブジェクト設定部241と、推奨方向取得部242と、指示表示部243とを含む。
オブジェクト設定部241は、認識部23が得た、撮像された対象物を取り囲むバウンディング・ボックスに外接、または当該バウンディング・ボックスを内包する、所定形状の仮想的な包囲体(仮想包囲体)を設定する。ここで、仮想包囲体とは、例として、ARオブジェクトなどのXRオブジェクトに相当する。なお、本実施形態では、当該バウンディング・ボックスに外接する、または当該バウンディング・ボックスを内包するよう仮想包囲体を設定する場合について例示するが、対象物の、当該対象物上にある特徴点の部分を内包するよう仮想包囲体を設定すればよく、その態様に制限はない。
一例として指示部24は、認識部23により決定された対象物の形状に基づき、仮想包囲体の形状を決定し設定してもよい。例として、対象物が矩形の箱状を有する場合、指示部24は、この対象物の形状を仮想的に拡大した矩形の仮想包囲体を設定してよい。また別の例として、対象物が扁平の形状をなす場合、指示部24は、半球状ではなく扁平な矩形の仮想包囲体を設定してもよい。なお、指示部24は、所定のデータベース等を参照することで、対象物の名称または種別に基づいて予め定められた形状の情報を取得し、当該取得した情報で特定される形状の仮想包囲体を設定してもよい。
例えばこのオブジェクト設定部241は、図4に例示するように、対象物(T)を撮像した処理対象画像に対し、中心を対象物座標系の原点とし、認識部23が設定したバウンディング・ボックス(B)に外接する半球(r)を仮想的に設定し、さらにこの半球の半径を所定の比率で拡大した半球(R)を設定する。なお、対象物の特徴点又はバウンディング・ボックス(B)を直接的に内包するよう当該半球(R)を設定してよい。
オブジェクト設定部241は、例として、さらにこの仮想包囲体の表面である半球表面を複数の面オブジェクトに分割して、各面オブジェクトを表す座標の情報を得る。ここで半球表面とは、半球(R)を指す。また、ここで面オブジェクトのそれぞれは平面であってもよく、その場合半球表面は近似的に複数の面オブジェクト(メッシュに相当)に分割され、各面オブジェクトを表す座標の情報はそれぞれの頂点の座標の値(対象物座標系での値でよい)となる。この分割の方法は特に限定はされず、有限要素法を用いたメッシュ分割の方法や、Catmull-Clark分割(OpenSubDivライブラリなどを利用して実現できる)など、適宜な方法を採用すればよい。この例では、上記複数の面オブジェクトが、本発明における複数の仮想的なオブジェクトに相当する。なお、分割により得られる面オブジェクトの形状やサイズは一定でなくてもよく、互いに異なる形状やサイズのメッシュを含む複数の面オブジェクトに分割されてもよい。
また推奨方向取得部242は、認識部23が取得した対象物の名称の情報(対象物の種類を特定する情報)をサーバ装置2へ送出し、サーバ装置2に対して推奨方向情報を要求する。サーバ装置2が当該要求に応答して推奨方向情報を送出すると、推奨方向取得部242は当該推奨方向情報を受け入れる。
あるいは、この推奨方向取得部242は、認識部23が取得した対象物の種類を特定する情報などに基づいて後に説明する推奨部27が出力する当該推奨方向情報を受け入れる。
指示表示部243は、オブジェクト設定部241が仮想的なオブジェクト(仮想包囲体)の設定を行い、推奨方向取得部242が推奨方向情報を受け入れると、受入部21が撮像画像を受け入れるごとに、当該撮像画像に仮想包囲体を重ね合わせて表示する。
この指示表示部243は、受入部21が撮像画像を受け入れるごとに、認識部23が設定したワールド座標系の、当該撮像画像における各軸方向を決定する。この処理は、特徴点の追跡の処理によって行うことができ、上述のAR処理モジュール等を利用して行うことができる。また指示表示部243は、このワールド座標系に基づいて対象物座標系を設定する(原点のワールド座標系での座標及びxy座標軸のXY座標系に対する回転角βを用いる)。
そして指示表示部243は、推奨方向取得部242が受け入れた推奨方向情報に基づいて、上記仮想包囲体上の一部の領域を強調して表示する。一例としてこの表示指示部243は、推奨方向取得部242が受け入れた推奨方向情報に基づいて、仮想的なオブジェクトである上記面オブジェクトのうち少なくとも一つの面オブジェクトを特定する。具体的な特定方法の例として、この指示表示部243は、仮想的なオブジェクトである上記面オブジェクトのうち、その法線方向(面オブジェクトが曲面であればそれに外接する六面体のうち最も広い面の法線に平行な方向)であって、対象物座標系の原点から遠ざかる方向(面方向と呼ぶ)を表す角度の情報が、推奨方向情報に最も近い面オブジェクトを特定する。
ここで面方向を表す角度の情報は、推奨方向情報と比較可能な方法で定める。ここでは対象物座標系において面方向に平行で、対象物座標系の原点を通る線分の、対象物座標系のz軸周りの角度θ′と、原点を含むxy面からの仰角φ′とで表しておく。
なお、推奨方向取得部242がサーバ装置2から取得した推奨方向情報が複数ある場合は、指示表示部243は、それぞれに最も近い方向の面オブジェクトを特定する。
指示表示部243は、指示の内容である撮像方向と対応する方向情報に基づいて特定した面オブジェクトを強調して表示する。換言すると、指示表示部243は、上記生成した複数の面オブジェクトのうち、当該推奨方向情報に基づいて特定した面オブジェクトと、そうでない面オブジェクトとを互いに区別可能な態様で、受入部21が受け入れた撮像画像に重ね合わせて表示する。例えば、指示表示部243は、推奨方向情報に基づいて特定した面オブジェクトと、そうでない面オブジェクトとのそれぞれを、互いに異なる色で塗りつぶし、撮像画像に半透明合成する。
推定部25は、受入部21が受け入れた撮像画像に基づき撮像方向の推定を行う。この推定部25は、認識部23が設定した対象物座標系(xyz直交座標系)のy座標とカメラの視線方向(画像の面に対する法線方向)との角度差α(z軸周りの回転角)と、xy平面からのカメラの視線方向の角度(仰角)βとを得る。つまり、この推定は、カメラ座標系と対象物座標系との変換パラメータを取得することで行うことができる。また推定部25は、推定を行うことで、受け入れた撮像画像が指示部24による指示の内容である撮像方向と略一致しているか否か判定してもよい。
推奨部27は、画像処理装置1の制御部11により機能的に実現されてもよいし、サーバ装置2に含まれてもよい。推奨部27は、指示部24から受け入れた対象物の種類に基づいて、撮像方向を推奨する処理を行う。本実施の形態において、この撮像方向の推奨の処理では、推奨部27は、対象物の種類に基づき推奨方向(推奨される撮像方向)を決定し、推奨方向情報を決定してデータベース(推奨した撮像方向を記録するデータベース)を更新する。そして当該決定した推奨方向の情報を、指示部24に出力する。サーバ装置2に推奨部27が含まれる場合は、ネットワークを介して、画像処理装置1の制御部11に推奨方向の情報を出力することとなる。
なお、ここで対象物の種類は、既に述べたように対象物の商品名の情報であってもよいし、対象物の商品カテゴリの情報であってもよい。この対象物の種類の情報は、対象物をユーザが識別するために有用な情報であればその態様に制限はない。本実施の形態では、指示部24が、この推奨部27が出力する推奨方向の情報に基づき撮影方向の指示を行う。換言すると、指示部24は、推奨部27により、推奨すべき推奨方向となった撮影方向を、ユーザに対し対象物に係る撮像方向として指示する。
推奨部27は、認識部23による対象物の種類に係る識別の結果に基づき撮影方向を推奨する処理を行ってよい。
また推奨部27は、対象物の種類が共通する対象物に係る過去の撮像画像のそれぞれの撮像方向に基づき、受入部21が受け入れた撮像画像に係る対象物の撮影方向を推奨する処理を行ってもよい。ここで「対象物の種類が共通する対象物に係る過去の撮像画像」とは、例として、過去の対象物と対応付けてアップロードされた撮像画像であってもよいし、所定のデータベースに参照可能に蓄積された撮影画像であってもよい。ここで、過去の対象物とは、例として、過去にC2Cマーケットプレイス等の電子商取引サービスにおいて過去に出品された商品を指してよい。なお、過去の撮像画像のそれぞれの撮像方向は、過去の撮像画像に付随するメタデータが示す撮像方向であってよく、過去の撮像画像に係る既知または慣用の画像認識技術に基づき推定された撮像方向であってもよい。
また推奨部27は、例として、対象物の種類が共通する対象物に係る過去の撮像画像のそれぞれの撮像方向のうち、所定の取引履歴を有する対象物に係る撮像画像の撮像方向に基づいて推奨の処理を行ってもよい。ここで「所定の取引履歴を有する対象物」とは、例えば、出品及び取引成立を経て実際に電子商取引が行われた商品を指す。つまり、推奨部27は、適切な撮影方向に基づく撮像画像のアップロードが取引成立の一要因として判断され得る過去の対象物(商品)に係る撮像方向を、推奨方向情報が示す推奨方向として決定してもよい。
また推奨部27は、対象物の種類が共通する対象物に係る過去の撮像画像のそれぞれの撮像方向のうち、上記「所定の取引履歴」として、出品から取引成立までの経過時間に基づいて選択された取引履歴を有する対象物に係る撮像画像の撮像方向に基づき推奨の処理を行ってよい。ここで推奨部27は、例えば出品から取引成立までの経過時間の短い順に上位の所定件数の取引履歴を選択してもよい。なお、本実施の形態において利用される電子商取引の履歴を含む各種情報は、電子商取引サービスを管理するサーバ装置2に問い合わせることで取得してもよいし、所定のデータベースに蓄積されたデータを参照することで取得してもよい。
また推奨部27は、商品ページの閲覧数に基づいて推奨の処理を行ってもよい。例えば推奨部27は、対象物の種類が共通する商品(あるいはその外形状が共通する商品であってもよい)に係る過去の撮像画像のそれぞれの撮像方向のうち、当該商品の撮像画像が掲載された商品ページの閲覧数が上位の所定順位までのうちにある商品ページの当該商品の撮像画像の撮像方向と対応する、対象物の撮像画像に係る撮像方向に基づき推奨の処理を行ってもよい。ここで商品ページは電子商取引サービスにおいてウェブ上で表示される商品ページに相当し、当該商品ページには、サムネイル画像等の代表される画像として、商品の撮像画像が含まれるものとする。本実施の形態において閲覧数は、電子商取引サービスにおいてユーザが当該商品ページを指定しその商品の詳細等を閲覧した数であってもよいし、電子商取引サービスにおいてユーザが当該商品ページにおいて撮像画像を指定(クリック等)した数であってもよい。なお、本実施の形態において利用される商品ページに係る各種閲覧数は、電子商取引サービスを管理するサーバ装置2に問い合わせることで取得してもよいし、所定のデータベースにおいて蓄積されたデータを参照することで取得してもよい。
[動作]
本実施の形態の一例に係る画像処理装置1は以上の構成を備えており、次のように動作する。なお、以下の例では、サーバ装置2がいわゆるC2Cマーケットプレイスサービス等の電子商取引サービスを提供するものであり、ユーザが当該C2Cマーケットプレイスサービスに出品する商品について、ユーザが撮像した撮像画像のアップロードを受け入れるものとする。
またこのサーバ装置2は、商品となる対象物ごとに、当該対象物の名称等の情報に関連付けて、当該対象物の撮像に適切とされる方向を表す推奨方向情報が少なくとも一つ記録されているものとし、画像処理装置1から撮像の対象となる対象物を特定する情報とともに推奨方向情報の要求を受けると、当該要求に応答し、受け入れた情報で特定される対象物の名称等の情報に関連付けられた推奨方向情報を取得して、当該取得した推奨方向情報を、要求元の画像処理装置1へ送出するものとする。
なお、上述の通り、商品ごとの推奨方向情報は、過去に当該商品と同じ種類の商品が提供された際に用いられた撮像画像に係る撮像方向と、その売れ行きの情報とから統計的に、比較的売れ行きがよいと判断される方向を表すものとする。ここで、上述のC2Cマーケットブレイス等において、対象物を商品として出品する際にアップロードされる商品画像である撮像画像は、当該撮像方向を示す情報がメタデータとして付されていてよい。このとき、商品や対象物の種類に応じた推奨される撮像方向は、その商品やその種類の対象物に対応付けてアップロードされた撮像画像に付随する撮像方向を示す情報に基づき、決定される。
ユーザは、机などの平面上に出品する商品を配しておく。そしてユーザはスマートフォンを操作して、当該スマートフォンを画像処理装置1として機能させるためのプログラムを起動する。これにより当該スマートフォンが画像処理装置1として動作することとなる。
画像処理装置1は、その撮像部16で撮像した画像を撮像画像として、逐次的に表示部14に表示する。また画像処理装置1は、撮像画像を処理対象画像として、当該処理対象画像から所定の特徴点を抽出して、対象物が配されている平面(机の面)を検出する。
また画像処理装置1は、当該検出した平面上の一点を原点として、当該平面内にXY直交座標を設定し、さらに当該平面の法線方向をZ座標の方向として、仮想的なXYZ直交座標系であるワールド座標系を設定する。このワールド座標系は、処理終了まで回転等の変更を行わない。
さらに画像処理装置1は、処理対象画像から対象物に関する所定の特徴点を抽出して、撮像されている対象物に外接する直方体をバウンディング・ボックスとして特定する。画像処理装置1は、当該バウンディング・ボックスとなった多面体の一つの面を、既に述べた例のような方法で正面方向として選択し、当該正面方向の面を法線方向とするy軸と、上記平面内にあって、y軸に直交するx軸と、Z軸に平行なz軸とを規定して、対象物に関するxyz直交座標系(対象物座標系)を設定する。
画像処理装置1は、そして、予め登録されている物体の撮像画像と比較する等の処理により、対象物の商品名を取得する。
その後、画像処理装置1は、図5に例示する処理を開始し、先に取得した対象物の商品名をサーバ装置2へ送出し、サーバ装置2に対して推奨方向情報を要求する(S11)。そして画像処理装置1は、サーバ装置2が当該要求に応答して送出した推奨方向情報を取得する(S12)。
画像処理装置1は、撮像画像が取得されると、当該撮像画像内に撮像された対象物を取り囲むバウンディング・ボックスに外接、または当該バウンディング・ボックスを内包する、半球状の仮想的な包囲体(仮想包囲体)を設定する(S13)。
画像処理装置1は、ステップS13で設定した半球の表面を、複数の面オブジェクトに分割する(S14)。ここでは各面オブジェクトは平面であるものとし、各面オブジェクトの形状と位置は、対象物座標系で表現しておく。
画像処理装置1は、以下、撮像画像を受け入れるごとに(S15)、特徴点のトラッキング等の方法で、当該撮像画像におけるワールド座標系の各軸方向を決定する(S16)。
また画像処理装置1は、ここで決定したワールド座標系に対応する対象物座標系上で、視点から遠い順に、面オブジェクトを描画する(S17)。このとき画像処理装置1は、ステップS12で取得した推奨方向情報が表す方向ごとに、当該方向に最も近い法線方向にある面オブジェクトを特定する。当該推奨方向情報が表す方向に基づいて特定した少なくとも一つの面オブジェクトと、そうでない(特定していない)面オブジェクトとを互いに異なる色で塗りつぶした矩形として描画する。
そして画像処理装置1は、当該描画した面オブジェクトの画像を、ステップS15で受け入れた撮像画像に半透明合成して、表示する(S18)。
これによりユーザは、図6に例示するように、球面状に配された複数の面オブジェクトのうち、色の異なっている方向が推奨される方向であるとして認識できる。この例では、推奨方向情報が表す方向とは異なる方向から撮像画像が取得されている間は、図6(a)に例示するように、他の方向に推奨方向情報が表す方向を表す面オブジェクト(P)が表示される。またユーザが、方向を調整して、推奨方向情報が表す方向から撮像画像が取得されるようになると、図6(b)に例示するように、推奨方向情報が表す方向に近い方向にある面オブジェクトの色が、対象物に重ね合わせて表示された状態となる。ユーザはこれを参照して、撮影画像の記録のための意思入力(シャッター操作など)を行ってよい。なお、この入力に応じて画像処理装置1が記録する撮像画像には、仮想包囲体などの画像の合成は行わない。
なお、図6の例では、図示を見やすくするため、対象物の奥側にある面オブジェクトの図示を省略しているが、実際には奥側の面オブジェクトも描画されていてよい。さらに図6の例では、半球を緯度方向に4分割しているが、この分割数は2以上の整数であれば任意であり、さらに多くの分割がされていてもよい。経度方向についても同様に、分割数は2以上の整数であれば任意である。
画像処理装置1は、ユーザによる意思入力を受け入れると、その時点で撮像部16が撮像している撮像画像を記憶部12に格納する。また画像処理装置1は、この格納した撮像画像を、ユーザの指示によりサーバ装置2へ商品の撮像画像としてアップロードする。
このように本実施の形態によると、表示部14に表示された画像を参照しつつ、他の部分と色の異なる面オブジェクトを通じて対象物を見ることとなる方向で撮像を行うことが可能となり、具体的な撮像方向の指示が実現される。またこれにより適切な方向として設定された方向での撮像が可能となる。
[仮想包囲体形状の変形例]
また本実施の形態において仮想包囲体の形状は、上述のような半球体に限られない。仮想包囲体は、例えば図7に例示するような六角柱や八角柱などの多角柱形状であってもよいし、サッカーボールのような、多角形を組み合わせた形状であってもよい。図7の例では、六角柱(H)形状の例を示している。
さらに仮想包囲体を複数の面オブジェクトに分割する場合に、分割された面オブジェクトは、互いに異なる形状のものを含んでもよい。なお、柱状体のように、比較的広い面を有する仮想包囲体においては、面オブジェクトへの分割方法によっては、互いに同じ方向の法線を有する複数の面オブジェクトへ分割されてしまう場合も考えられる。なお、既に述べたように、ここでの複数の面オブジェクトのそれぞれは、矩形であっても、三角形であってもよく、また必ずしもそれぞれが同一の面積を呈する必要はなく、その幾何学的特徴および面積に制限はない。
そこで、画像処理装置1は、仮想包囲体を面オブジェクトへの分割した後、互いに同じ方向の法線を有する複数の面オブジェクトがある場合には、当該同じ方向の法線を有する複数の面オブジェクトを一つの面オブジェクトとしてグループ化してもよい。つまり、画像処理装置1は、推奨方向情報に含まれる方向の方向に最も近い法線を有する面オブジェクトを選択したとき、当該選択した面オブジェクトと同じ方向の法線を有する他の面オブジェクトがある場合には、当該他の面オブジェクトも選択されたものとして扱う。
また、ここまでの説明ではサーバ装置2がデータベースを保持しており、画像処理装置1からの要求に応じて、適切と判断される方向の情報を提供していたが、本実施の形態はこれに限られない。
すなわち本実施の形態の別の例では、画像処理装置1の記憶部12に、対象物の名称等の情報に関連付けて、当該対象物の撮像に適切とされる方向を表す推奨方向情報を記録したデータベースを格納しておくこととしてもよい。
この場合、画像処理装置1は、対象物の名称を送出して推奨方向情報を取得する代わりに、記憶部12に格納されたデータベースから、認識された対象物の名称に対応する推奨方向情報を取得して、方向の指示の処理に利用する。
1 画像処理装置、2 サーバ装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部、16 撮像部、21 受入部、22 記録部、23 認識部、24 指示部、241 オブジェクト設定部、242 推奨方向取得部、243 指示表示部,25 推定部,27 推奨部。

Claims (10)

  1. 対象物を示す撮像画像を受け入れる受入手段と、
    前記撮像画像に基づき前記対象物の特徴点を抽出することで前記対象物の認識を行う認識手段と、
    前記対象物の種類に基づき撮像方向の推奨を行う推奨手段と、
    前記認識の結果と前記推奨の結果とに基づき前記対象物に係る撮像方向の指示を行う指示手段と、を有する画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記認識手段は、前記認識を行うことで前記種類に係る識別を行い、
    前記推奨手段は、前記識別の結果に基づき前記推奨を行う画像処理装置。
  3. 請求項1または2に記載の画像処理装置であって、
    前記推奨手段は、前記種類が共通する前記対象物に係る過去の前記撮像画像のそれぞれの撮像方向に基づき前記推奨を行う画像処理装置。
  4. 請求項3に記載の画像処理装置であって、
    前記推奨手段は、前記種類が共通する前記対象物に係る過去の前記撮像画像のそれぞれの撮像方向のうち、所定の取引履歴を有する前記対象物に係る前記撮像画像の撮像方向に基づき前記推奨を行う画像処理装置。
  5. 請求項4に記載の画像処理装置であって、
    前記推奨手段は、出品から取引成立までの経過時間に基づいて選択される、前記所定の取引履歴を有する前記対象物に係る前記撮像画像の撮像方向に基づき前記推奨を行う画像処理装置。
  6. 請求項1から5のいずれかに記載の画像処理装置であって、
    前記推奨手段は、前記種類が共通する対象物に係る過去の撮像画像のそれぞれの撮像方向のうち、当該撮像画像が掲載されている商品ページの閲覧数に基づいて選択された撮像画像の撮像方向と対応する前記対象物の前記撮像画像に係る撮像方向に基づき前記推奨を行う画像処理装置。
  7. 請求項1から5のいずれかに記載の画像処理装置であって、
    前記認識の結果に基づき前記特徴点を内包する仮想包囲体を、前記対象物に重ね合わせて表示し、前記指示の内容である撮影方向と対応する領域を前記仮想包囲体上で強調して表示する表示手段を、さらに有する画像処理装置。
  8. 請求項7に記載の画像処理装置であって、
    前記仮想包囲体は、複数の面オブジェクトを含み、
    前記表示手段は、前記指示の内容である撮影方向と対応する前記面オブジェクトを強調して表示する画像処理装置。
  9. 対象物を示す撮像画像を受け入れるステップと、
    前記撮像画像に基づき前記対象物の特徴点を抽出することで前記対象物の認識を行うステップと、
    前記対象物の種類に基づき撮像方向の推奨を行うステップと、
    前記認識の結果と前記推奨の結果とに基づき前記対象物に係る撮像方向の指示を行うステップと、をコンピュータのプロセッサに実行させる画像処理方法。
  10. コンピュータを、
    対象物を示す撮像画像を受け入れる受入手段と、
    前記撮像画像に基づき前記対象物の特徴点を抽出することで前記対象物の認識を行う認識手段と、
    前記対象物の種類に基づき撮像方向の推奨を行う推奨手段と、
    前記認識の結果と前記推奨の結果とに基づき前記対象物に係る撮像方向の指示を行う指示手段と、として機能させるプログラム。


JP2021211600A 2021-12-24 2021-12-24 画像処理装置、画像処理方法及びプログラム Active JP7258117B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021211600A JP7258117B1 (ja) 2021-12-24 2021-12-24 画像処理装置、画像処理方法及びプログラム
US18/088,044 US20230209171A1 (en) 2021-12-24 2022-12-23 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021211600A JP7258117B1 (ja) 2021-12-24 2021-12-24 画像処理装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP7258117B1 JP7258117B1 (ja) 2023-04-14
JP2023095609A true JP2023095609A (ja) 2023-07-06

Family

ID=85980416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021211600A Active JP7258117B1 (ja) 2021-12-24 2021-12-24 画像処理装置、画像処理方法及びプログラム

Country Status (2)

Country Link
US (1) US20230209171A1 (ja)
JP (1) JP7258117B1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013128251A (ja) * 2011-12-19 2013-06-27 Nikon Corp 撮像装置およびプログラム
JP2013165366A (ja) * 2012-02-10 2013-08-22 Sony Corp 画像処理装置、画像処理方法及びプログラム
JP2014007619A (ja) * 2012-06-26 2014-01-16 Casio Comput Co Ltd 撮影支援装置及びプログラム
JP2019164421A (ja) * 2018-03-19 2019-09-26 株式会社リコー 画像検索装置、印刷物、画像検索方法及び画像検索プログラム
JP2021077131A (ja) * 2019-11-11 2021-05-20 株式会社ウフル 構図アドバイスシステム、構図アドバイス方法、ユーザ端末、プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013128251A (ja) * 2011-12-19 2013-06-27 Nikon Corp 撮像装置およびプログラム
JP2013165366A (ja) * 2012-02-10 2013-08-22 Sony Corp 画像処理装置、画像処理方法及びプログラム
JP2014007619A (ja) * 2012-06-26 2014-01-16 Casio Comput Co Ltd 撮影支援装置及びプログラム
JP2019164421A (ja) * 2018-03-19 2019-09-26 株式会社リコー 画像検索装置、印刷物、画像検索方法及び画像検索プログラム
JP2021077131A (ja) * 2019-11-11 2021-05-20 株式会社ウフル 構図アドバイスシステム、構図アドバイス方法、ユーザ端末、プログラム

Also Published As

Publication number Publication date
JP7258117B1 (ja) 2023-04-14
US20230209171A1 (en) 2023-06-29

Similar Documents

Publication Publication Date Title
US10755485B2 (en) Augmented reality product preview
CN104346834B (zh) 信息处理设备和位置指定方法
CN111787242B (zh) 用于虚拟试衣的方法和装置
KR102120046B1 (ko) 오브젝트를 표시하는 방법
JP5886242B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
CN113220251B (zh) 物体显示方法、装置、电子设备及存储介质
JP5442721B2 (ja) 形状の不変量アフィン認識方法及びデバイス
US10445856B2 (en) Generating and displaying an actual sized interactive object
US10325402B1 (en) View-dependent texture blending in 3-D rendering
US11436453B2 (en) Using augmented reality to perform complex print jobs
CN111815781A (zh) 增强现实数据呈现方法、装置、设备和计算机存储介质
CN111508033A (zh) 相机参数确定方法、图像处理方法、存储介质及电子装置
CN112884556A (zh) 一种基于混合现实的店铺展示方法、系统、设备和介质
US20160042233A1 (en) Method and system for facilitating evaluation of visual appeal of two or more objects
CN116452745A (zh) 手部建模、手部模型处理方法、设备和介质
CN116524088B (zh) 珠宝虚拟试戴方法、装置、计算机设备和存储介质
Marelli et al. Faithful fit, markerless, 3D eyeglasses virtual try-on
JP7258117B1 (ja) 画像処理装置、画像処理方法及びプログラム
EP3177005B1 (en) Display control system, display control device, display control method, and program
LU502672B1 (en) A method for selecting scene points, distance measurement and a data processing apparatus
JP2013258583A (ja) 撮像画像表示装置、撮像画像表示方法、プログラム
JP7439042B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5767151B2 (ja) 情報表示装置
CN112418980A (zh) 基于ar的商品展示系统、方法、设备及存储介质
TW202240466A (zh) 區位顯示系統及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220816

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230404

R150 Certificate of patent or registration of utility model

Ref document number: 7258117

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150