JP2010113716A - 比較ショッピングのためのビデオマッチングの方法 - Google Patents

比較ショッピングのためのビデオマッチングの方法 Download PDF

Info

Publication number
JP2010113716A
JP2010113716A JP2009252717A JP2009252717A JP2010113716A JP 2010113716 A JP2010113716 A JP 2010113716A JP 2009252717 A JP2009252717 A JP 2009252717A JP 2009252717 A JP2009252717 A JP 2009252717A JP 2010113716 A JP2010113716 A JP 2010113716A
Authority
JP
Japan
Prior art keywords
images
image
user
matching
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009252717A
Other languages
English (en)
Other versions
JP5544142B2 (ja
Inventor
Maurice Chu
チュー モーリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2010113716A publication Critical patent/JP2010113716A/ja
Application granted granted Critical
Publication of JP5544142B2 publication Critical patent/JP5544142B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47FSPECIAL FURNITURE, FITTINGS, OR ACCESSORIES FOR SHOPS, STOREHOUSES, BARS, RESTAURANTS OR THE LIKE; PAYING COUNTERS
    • A47F7/00Show stands, hangers, or shelves, adapted for particular articles or materials
    • A47F7/19Show stands, hangers, or shelves, adapted for particular articles or materials for garments
    • A47F2007/195Virtual display of clothes on the wearer by means of a mirror, screen or the like

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Processing (AREA)

Abstract

【課題】コンピュータによって実施される比較ショッピングのためのビデオマッチングの方法を提供する。
【解決手段】単一のカメラの前において第1の衣服、宝飾品、又はその他の装身具を着用するユーザの、第1の連続する画像を記録し、第1の連続する画像を記憶し、単一のカメラの前において第2の衣服、宝飾品、又はその他の装身具を着用するユーザの、第2の連続する画像を記録し、第2の連続する画像を記憶し、第1の連続する画像から第3の連続する画像を作成するために、マッチングアルゴリズムに従い、第1の連続する画像内における、第2の連続する画像内の各画像毎にマッチする画像を識別し、ユーザが、第1と第2の衣服、宝飾品、又はその他の装身具を着用した場合にどのように見えるかを容易に比較することを可能にするめに、第2の連続する画像と第3の連続する画像とを相互に近接させてユーザに表示する。
【選択図】図1A

Description

本発明は、コンピュータによって実施される比較ショッピングのためのビデオマッチングの方法に関し、より詳細には、画像と連続する画像からの類似の身体および頭部のポーズとを確実にマッチングする方法に関する。
衣服、宝飾品、又はその他の装身具の買い物は、オンラインでも実際の店舗でも行われ得るよくある行動である。実際の店舗でよく行われるのは、興味のある商品を求めて在庫を調べ、比較のために数点選択し、もしあれば、どれを購入すべきか決めるためにそれらを試着することである。買物客は、着用可能な商品を、それらがどれほど実際に適合するかによって、またその買物客が他人に知覚してほしい自分自身のイメージにどれほど適合するかによって評価する。すなわち買物客は、衣服が自分の身体に適合するかどうかだけでなく、衣服が自分のスタイルに適合するかどうかもチェックする。
特に衣類の場合、買物客は、通常、試着室で複数の衣服を比較したがる。最新の感知技術は、この経験を増強することができる。更衣室の中には、買物客が持ち込んだ際に(RFID読取装置等によって)衣服を識別し、その衣服の価格や代替の色、及び、サイズに関する追加情報、すなわち、買物客が商品をオンラインでブラウジングするときに見ることのできる類の情報を提供する。試着室における他の技術の中には、買物客の動きを記録し、その買物客にビデオを再生するビデオカメラが含まれる。
過去には、試着の際のユーザを見せるための技術(例えば、ユーザが第2の衣服、又は、宝飾品を着用している間に、第1の衣服、又は、宝飾品を着用した画像を見せるなど)が開発されている。さらに、2つの記録された動画像列(video sequences)をマッチングする技術も開発されている。非特許文献1などを参照されたい。
サンド(Sand)及びテラー(Teller)、「ビデオマッチング(Video Matching)」、ACMトランザクション・オン・グラフィックス(TOG)、2004年、第22巻、第3号、p.592−599
本発明は、コンピュータによって実施される比較ショッピングのためのビデオマッチングの方法を提供することを目的としている。
本発明の第1の態様は、コンピュータによって実施される比較ショッピングのためのビデオマッチングの方法であって、単一のカメラの前において第1の衣服、宝飾品、又はその他の装身具を着用するユーザの、第1の連続する画像を記録し、第1の連続する画像を記憶し、単一のカメラの前において第2の衣服、宝飾品、又はその他の装身具を着用するユーザの、第2の連続する画像を記録し、第2の連続する画像を記憶し、第1の連続する画像から第3の連続する画像を作成するために、マッチングアルゴリズムに従い、第1の連続する画像内における、第2の連続する画像内の各画像毎にマッチする画像を識別し、ユーザが、第1と第2の衣服、宝飾品、又はその他の装身具を着用した場合にどのように見えるかを容易に比較することを可能にするめに、第2の連続する画像と第3の連続する画像とを相互に近接させてユーザに表示する、ことを含む。
本発明の第2の態様は、第1の態様の方法であって、表示することは、第1のユーザ入力装置に応答して第2連続する画像及び第3の連続する画像の位置を調整するように、ユーザが制御し得る、ことを含む。
本発明の第3の態様は、第1の態様の方法であって、表示することは、衣類又は宝飾品を着用したユーザのものである、第2の連続する画像とマッチングされた複数の追加の連続する画像を、第2の連続する画像及び第3の連続する画像と近接させて表示する、ことを更に含む。
本発明の第4の態様は、第1の態様の方法であって、第1の連続する画像及び第2の連続する画像を記録することは、第1及び第2の衣服又は宝飾品を試着するのに使用される鏡の前で行われる、ことを含む。
バッチモードで2つの事前に記録された動画像列を確実にマッチングするプロセスの例を示す図である。 準リアルタイムモードで事前に記録された動画像列をライブ動画像列に確実にマッチングするプロセスの例を示す図である。 衣類比較システムの卓上実施形態を示す図である。 衣類比較システムの試着室実施形態を示す図である。 一実施形態による衣類比較システムのユーザインターフェースの一部を示す図である。 一実施形態による衣類比較システムのユーザインターフェースの一部を示す図である。 いくつかの実施形態で使用されるコンピュータを示す図である。 マッチングの滑らかさを改善するためのいくつかの実施形態で使用されるパス符号化技術を示す図である。
小売店の買い物比較では、顧客が一連の衣料品、宝飾品、又はその他の装身具(眼鏡、サングラス、ハンドバッグなど)を繰返し試着して、それらを着用した場合に他と比べてどのように見えるか査定することが、必要とされる。買物客は、複数の帽子やイヤリングを比較しようとする場合、鏡を向いて異なる商品を様々なやり方で支え、それらがどのように見えるか査定する。本発明の各実施形態は、このプロセスを改善するシステム及び方法を提供する。
考察を以下のように整理する。まず、一実施形態の概要を簡単に説明する。次にシステムを、関連プロセス及びユーザインターフェースを含めて、より詳細に説明する。次いで、各実施形態で使用されるビデオマッチングアルゴリズムの詳細を論じる。最後に、様々な代替の実施形態を論じる。
簡単にするために、以下の考察においては、「商品」、「衣類」、「宝飾品」、及び「装身具」の各用語を区別なく使用する。同様に、「買物客」及び「ユーザ」の各用語も区別なく使用し、単数形女性代名詞を使用する。「ポーズ」という用語は、本明細書で使用する場合、ユーザが特定の衣服を着用しているときの体位や姿勢といった特定の身体構成としてのユーザを意味する。例えば、ポーズは、鏡やディスプレイに対するユーザの角度位置を指すものとすることもできる。またポーズは、脚を上げる、腕を上げる、座る、頭部を向けるといった、ユーザの身ぶりを指すものとすることもできる。「準リアルタイム」という用語は、本明細書で使用する場合、自動化データ処理又はネットワーク伝送によって、表示又はフィードバック及び制御などのために、イベントの発生と処理データの使用との間に遅延が導入されることを意味する。一般に、本明細書で使用する場合、準リアルタイムは、人間操作性での予想及び要件に見合うように、1秒未満の長さとする。
例えば、準リアルタイム表示は、イベント又は状況を、現在時刻から処理時間を引いた時刻に存在したものとして描写する。
準リアルタイムとリアルタイムの区別は様々であり、遅延は、伝送の種類及び速度に依存する。
一実施形態によれば、買物客は、カルバンクライン(Calvin Klein:登録商標)の首飾りなど、第1の商品を着用して鏡の前でビデオに記録される。次いで買物客は、ティファニー(Tiffany:登録商標)の首飾りなど、第2の商品を試着し、記録される。この時点で買物客は、システムを使用して、それら2回の試着時の自分を比較することができる。カルバンクライン(登録商標)の試着を第1の連続する画像とする。システムは、その第1の連続する画像(sequence)を、ティファニー(登録商標)の首飾りを着けて記録された第2の連続する画像と対照して分析し、類似のフレームをマッチングする。これにより、(第1の連続する画像からのフレームを「再編集」したものからなる)第3の連続する画像が作成される。システムに結合されたディスプレイ上には、第2の連続する画像と第3の連続する画像が近接して見えるようにユーザに再生される。
特に、システムは2つの記録された連続する画像をマッチングすることから、買物客が腕を上げる、頭部を回すといったポーズもマッチングされる。よって、ユーザが、第1の連続する画像において自分の腕時計を持ち上げて首飾りと比較し、第2の連続する画像においても同様に比較した場合、再生時には、これら2つのマッチングポーズが、第1の連続する画像内のその類似のポーズが発生した時間位置に関わらず、第2の連続する画像におけるタイミングに合わせて同時に表示される。
システムは、連続する画像内の各位置を迅速に飛ばし読みするためのユーザインターフェース装置(つまみやスクリーンタッチ制御など)を含むことができる。実施形態の中には、比較ショッピングの開始前に、2回を超える試着を記録させてもよい。別の実施形態では、第2の連続する画像は、事前に記録されるのではなく、ライブ動画像列である。第1の連続する画像からの記録画像が、第2の連続する画像のライブビデオの現在の画像と準リアルタイムでマッチングされる。この概要の次に、システムを、関連プロセス及びユーザ対話の観点からより詳細に説明する。
図1Aに、小売店衣類試着システム(バッチモード)において事前に記録された動画像列を確実にマッチングするプロセスの例を示す。プロセス100Aでは、まず初めに第1の連続する画像を記録し(ステップ110)、次にこれら画像が記憶される(ステップ120)。これら基本ステップを繰り返して、第2の連続する画像が記録され(ステップ130)、第2の連続する画像が記憶される(ステップ140)。次に、第2の連続する画像に最も近くマッチするように、第1の連続する画像からのフレームを再編集することによって、第3の連続する画像が作成される(ステップ150)。最後に、第2の連続する画像と第3の連続する画像とが、相互に近接して見えるように表示される(ステップ160)。
記録(ステップ110及びステップ130)は、コンピュータ処理のための連続するディジタル画像を生成することのできる、1台のビデオカメラを用いて行うことができる。記憶(ステップ120及びステップ140)は、任意のコンピュータ可読記憶媒体において行うことができる。
プロセス100Aのあるステップから別のステップへの流れは、典型的には、ユーザなどからの1つ又は複数の入力によって決定される。例えば、プロセス100Aを実行するシステムでは、記録の開始/停止をトリガし、再生をトリガするための1つ又は複数のユーザ入力装置を、提供してもよい。実施形態によっては、視覚アルゴリズムが身ぶり又はその他の合図を検出し、記録の開始/停止をトリガし、再生をトリガする、ことも可能である。
図1Bに、小売店衣類試着システムにおいて事前に記録された動画像列を、ライブ動画像列に対して確実にマッチングする代替プロセスの例を示す。プロセス100Bでは、まず初めに、第1の連続する画像を記録し(ステップ110B)、次に、これらの画像が記憶される(ステップ120B)。次いで、ライブ動画像列から画像が取り込まれる(ステップ130B)。次いで、取り込まれた画像に最適にマッチする第1の連続する画像内の画像が探索される(ステップ140B)。第1の連続する画像からのマッチする画像と、ライブビデオからの取り込み画像とが、相互に近接して見えるように表示される(ステップ150B)。最後に、ライブ動画像列から、新しい画像の取り込み(ステップ130B)に戻って、これらプロセスが繰り返される。
実施形態によっては、プロセス100Aとプロセス100Bが同時に実行される。より具体的には、ステップ110〜ステップ120とステップ110B〜ステップ120Bを同一のステップ(単一の記録シーケンス)とすることができ、次いで、プロセス100Bのステップ130B〜ステップ150Bを、プロセス100Aのステップ130〜ステップ140の間に行うことができる。
図2A〜2Bに、衣類比較システムの2つの実施形態を示す。より具体的には、図2Aには、卓上実施形態が示され、図2Bには、試着室実施形態が示されている。2つの実施形態の主要な違いは、システムの様々な部分の構成及びサイズにある。これらの実施形態は、どちらも、図1Aのバッチマッチングプロセス又は図1Bの準リアルタイムマッチングプロセスを用いて実施し得ることに留意されたい。
次に、各実施形態を論じる。各実施形態毎に、各図の各要素を論じ、次いで各要素の相互接続を論じる。最後に、システムの用法を、プロセス100Aとプロセス100Bとを参照し、両実施形態について一括して論じる。
図2Aは、衣類比較のためのシステム200の卓上実施形態である。システム200は、鏡202、ディスプレイ204、カメラ206、入力装置208、及び、コンピュータ210を含む。説明のために、鏡202には、ユーザ220の鏡像が示されている。次に、各構成要素の相互接続について説明する(相互接続は図示されていないことに留意されたい)。カメラ206、ディスプレイ204、及び、入力装置208は、コンピュータ210と通信するように結合されている。一実施形態では、システム200の卓上実施形態は、例えば宝石店のカウンタなど、小売店内の陳列棚の上に置かれるような設計、及び、サイズとされる。このような実施形態では、コンピュータ210を含むすべての要素が単一のハウジング内に含まれ得る。加えて、カメラ206の位置を、必要に応じて、鏡202に映るものを最適に取り込むように調節することもできる。別の実施形態では、入力装置208は、ユーザがそれを回して2つのマッチングされた連続する画像をスクロールさせるための、つまみとすることができる。
図2Bは、衣類比較のためのシステム240の試着室実施形態である。図2Aと図2Bとでの類似の構成要素には、参照しやすいように、同じ番号が指定されている。多くの場合これらの構成要素は、2つの実施形態で異なる寸法とされる。システム240は、鏡202、ディスプレイ204、カメラ206、(遠隔制御装置250上の)入力装置208及びコンピュータ210を含む。この場合もやはり、説明のために、鏡202には、ユーザ220の鏡像が示されている。図2Aの場合と同様に、各要素間の相互接続は、図示されていない。一実施形態では、ディスプレイ204及び鏡202は、台、又は、スタンド(不図示)上に取り付けられている。遠隔制御装置250は、有線方式でも無線方式でもよい。加えて、カメラ206の位置を、必要に応じて、鏡202に映るものを最適に取り込むように調節することもできる。
システム240(又はシステム200)の一実施形態では、遠隔制御装置、又は、他の直接のユーザ入力装置は、必須ではない。ユーザが近づくと、システム240は、カメラ206、及び、コンピュータ210上で実行されるソフトウェアとして実施された画像分析アルゴリズムを使用して、ユーザが近くにいることを検出し、第1の連続する画像、すなわちマッチング画像の記録を開始する。ユーザが離れると、システム240はこれを検出し、記録を停止する。次回ユーザが近づくと、ユーザは検出され、第2の、すなわちマッチングするための連続する画像として再度記録される。今度は、鏡202と近接して見えるディスプレイ204が、プロセス100Bが使用されている場合には、ユーザの現在のポーズにマッチする第1の連続する画像からの画像の表示を開始する。このような実施形態は、異なるユーザの検出を処理するために、タイムアウト、人物認識ソフトウェア、顔認識ソフトウェア、及び/又は、店員ユーザ入力装置を含んでいてもよい。加えて、複数の前の試着の表示をサポートするユーザ入力自由の実施形態では、すべての前の試着連続画像を、現在の試着、最近の試着のみ、及び/又は、コンピュータ210に事前ロードされた店舗構成設定や、店員用の入力装置といった、異なる入力による他のオプションと同時に表示することもできる。
本考察の残りの部分では、図2Aの卓上実施形態を中心に論じるが、各概念は、図2Bの実施形態にも同様に適用され得ることを理解すべきである。実施形態によっては、鏡202は、カメラ206からのライブ出力を表示し、よって鏡のように働くコンピュータディスプレイなどのディスプレイで置き換えられる。
図1Aのプロセス100Aを、図2Aに示すシステム200の実施形態の状況で考察する。この例では、買物客は、第1の衣服を着けてシステム200の前に立ち、又は、座ることができる。この例では帽子を使用する。入力装置208を押す、ディスプレイ204上のタッチスクリーン制御など、1つ又は複数のユーザインターフェース要素により、コンピュータ210上で第1の連続する画像の記録(ステップ110)の開始をトリガすることができる。実施形態によっては、この記録は、コンピュータ210によるカメラ206からの画像の処理に基づき、動き検出又は位置検出によりトリガされてもよい。買物客は、入力装置208を押すなど、ユーザインターフェース要素を使用し、記録を停止することができる。この時点で、第1の連続する画像が記録される。記録プロセスの間、買物客は、異なるポーズに対応する画像がシステムによって取り込まれるように、頭部を上下左右に回す、両手を様々なポーズで動かすなど、自分の位置を変えることができることに留意されたい。実施形態によっては、記録(ステップ110)及び記憶(ステップ120)は、(連続する画像全体が記録されるまで待ってから記憶するのではなく)同時に行われてもよい。この後ディスプレイ204は、図3Aのように見えるはずであり、図3Aには、第1の連続する画像(マッチング連続画像ともいう)の1フレーム302を含むディスプレイ204が示されている。
次のユーザ入力で、第2の連続する画像の記録及び記憶(ステップ130及びステップ140)をトリガすることができる。この後、ディスプレイ204は、各連続するフレームの1フレームを並べて表示する、図3Bのように見えるはずである。この例では、2つの連続する画像には、2つの異なる帽子(先のとがった帽子とドーム形の帽子)を試着していた買物客が映っていることに留意されたい。次に、プロセス100Aは、ユーザ入力に応答して、又は、第2の連続する画像304の記録完了時に自動的に、2つの試着をマッチングし(ステップ150)、並べて表示する(ステップ160)。ステップ150及びステップ140Bで使用されるアルゴリズム及び技法について後述する。
例えば、一実施形態では、ディスプレイ204は、タッチスクリーンを備え、(i)新しいセッションの開始(新しい買物客がプロセス100Aを再開するなど)、(ii)連続する画像の記録の開始/停止、マッチングのトリガ(ステップ150)、及び(iii)再生位置調整(物理入力装置208に置き換わることができる)のための、ユーザインターフェース入力を提供する。
次にいくつかの特徴及び実施形態について論じる。
2つの連続する画像を、全く異なる時刻に、あるいは異なる店舗でさえも記録することができ、両システムともが、先に記憶された連続する画像にアクセスすることができる場合、店舗間での比較が可能になる。
記録プロセスの間、買物客は、様々なポーズをとることができる。すなわち、マッチング(ステップ150)では、異なるポーズを有する2つの連続する画像に、それら2つの連続する画像の間で、ユーザがカメラから見て異なる位置(左/右/上/下、すなわち変換)にいる場合でさえも適応する。
実施形態によっては、2つを超える連続する画像にわたる記録及びマッチングをサポートする。このような実施形態は、プロセス100Aを変更し、2つを超える連続する画像の記録を行わせ、プロセス100Aを変更してマッチング(ステップ150)する前に、1ステップを追加し、そこでマッチング/再生のために2つのビデオが選択される。
実施形態によっては、複数の連続する画像のうち、基礎連続画像に対するマッチングをサポートする。これらの実施形態は、すべて基礎連続画像に対してマッチングされる複数の連続する画像を、近接して見えるように再生することができる。さらに、基礎連続画像は、ライブビデオからの取り込み画像とすることができる。
実施形態によっては、身ぶり又はカメラからのその他の視覚的合図を検出することによって、明示的なユーザ対話なしで、プロセス100A又はプロセス100Bのフローをトリガすることができる。例えば、一実施形態では、カメラの視界内の人の存在を、記録開始のトリガとすることができ、視界内の人の不在を、記録停止のトリガとすることができる。また、人の動きを、マッチングプロセス及びマッチングされた連続する画像の再生のトリガとすることも可能である。
図4に、各実施形態で使用されるコンピュータ210をより詳細に示す。コンピュータ210は、プロセッサ402、メモリ404、記憶装置410、ディスプレイ204、ならびに2つの入力装置、すなわちキーボード450及びポインティングデバイス460を含む。記憶装置410は、衣類比較システム440を含む。ネットワークリソース及びコンピュータ210のその他の通信リソースは、簡潔にするために図示していない。コンピュータ210は、衣類比較システム440、図2A、図2Bのシステム200に示すような、連続する画像の記録及び再生を行うための関連するハードウェアをサポートするように適切に変更され、かつ/又は、プログラムされた任意の市販のコンピュータとすることができる。衣類比較システム440は、図1Aのプロセス100Aを実施し、プロセッサ402を制御し、コンピュータ210及びシステム200の各構成要素を調整するための命令として、任意のコンピュータ可読記憶媒体に記憶されていてもよい。図示の入力装置(キーボード450及びポインティングデバイス460)は、例示にすぎず、図2A、図2Bに示すように、ディスプレイ204をタッチスクリーンディスプレイとすることや、入力装置208(つまみなど)、遠隔制御装置250、カメラからの視覚的合図の検出などといった、他の入力装置も可能である。所望の実施形態に応じて、コンピュータ210は、そのような入力装置に結合されるはずである。
次に、いくつかの実施形態で使用される、マッチングアルゴリズムを論じる。
本発明の実施形態で使用されるマッチングアルゴリズムについて説明する。従来の比較ショッピングのための画像マッチング法の中には、身体部分/衣類マッチング及び衣類対人物の抽出を中心としているものもある。加えて、このような技法の多くは、複数のカメラを必要とする。
本発明の各実施形態は、身体ポーズを決定するステップを省き、代わりに、2つのフレーム間の距離尺度を策定することにより、画像を全体として比較する。一実施形態では、画素差の二乗の和であるL2距離尺度を使用して、画像フレームが比較される。具体的には、(それぞれ1つの連続する画像からの)2つの画像I1とI2の間のL2距離dが以下の式1によって与えられる。
Figure 2010113716
言い換えると、I1内の各画素の値が、I2内の対応する画素の値から差し引かれ、次いでその差が二乗され、すべての画素(P)にわたって合計される。
一実施形態では、前述のマッチングは、ステップ150で、最小の差を有する2つのフレームを選択することによって用いられる。具体的には、第1の(マッチング)連続する画像a,b,…mと、第2の(基礎)連続する画像A,B,…Zと、を考える。第2の連続する画像内の第1の画像と、並べて表示される第3の連続する画像内の第1の画像と、を参照すると、a…mのそれぞれとAとの間のL2距離を比較し、最小距離の画像が選択される。第2の連続する画像内のすべての画像について同様の比較を行い、m,a,c,d,d,d,…とのようになる、第2の連続する画像と同じ長さになるはずの、第3の連続する画像を生成する。
L2距離の並進不変変形(translation invariant modification)を式2で示す。
Figure 2010113716
式中、ΔxとΔyとはx方向とy方向の画素オフセットである。ΔxとΔyがその範囲に並び得る値の集合は、以下のように実施形態によって異なる。
1)最大固定不変量の総当たり法、例えば、全方向に±50画素を検査してその範囲内の最適マッチを探索する、
2)有向探索法、例えば、8つの隣接する1画素変換すべてを検査し、次いで、それら8画素のうちの最適画素の周りの8画素すべてを検査し、以下同様に最大固定距離及び/又は有界計算時間に至るまで検査する、
3)様々なより大きい変換を試し次いでその変換を微調整するように、様々なΔxとΔyの値を、勾配降下しながら探索する。
変換を可能にすると、マッチング品質が向上するが、連続する画像間のマッチング画像を探索する計算コストも増大する。
一実施形態では、並進不変処理を伴うL2距離が、ステップ150のマッチングとして使用される。マッチングは、前述の、より単純なL2変形例について説明したのと同様に行われるはずである。
上記2つの手法は、第3の連続する画像のビデオ再生の滑らかさを強調するものではない。第1の連続する画像は、第2の連続する画像に最適にマッチするように再編集されているため、並列再生全体を理想的とは言えないものにする、大量のジッタ又はその他のアーチファクト(artifact)が生じ得る。あるいは言い換えると、式1又は式2で与えられるような、最適なマッチングフレームは、第3の連続する画像におけるフレーム間ジッタが大きすぎるために、滑らかなビデオ再生をもたらさないこともある。したがって、実施形態によっては、滑らかさに対処するために、マッチングをさらに改善する。
このような実施形態の1つを、いくつかの実施形態でマッチングの滑らかさを改善するのに使用されるパス符号化技術を、図5を参照して説明する。図5には、画像a,b,c,…mを有する第1の連続する画像500(マッチングともいう)と、画像A,B,C,…Zを有する第2の連続する画像510(基礎ともいう)が含まれている。
異なる連続する画像のフレーム間の距離を、d(a,A)、d(a,B)、…d(m,A)、…d(m,Z)とし、図5の各円形ノード上に示す。連続する画像内の距離を、d(a,a)、d(a,b)、d(a,c)などとする。これらは、各円形ノードをつなぐパス上に示されている。パスの距離は、これらの距離を合計することにより計算することができる。図5に戻ると、2つのパス例の一部がパス520(細線)とパス530(太線)として示されており、それぞれに距離尺度が付されている。その場合最善のパスは、合計距離が最小のパスである。
使用される距離式は、式1又は式2のL2距離、又は変形されたL2距離、あるいは、エントロピ、相互情報量、及び/又は、クルバック−リブラ(Kullback−Leibler)距離等の、1つ又は複数の他の距離尺度とすることができる。実施形態の中には、連続する画像内比較に、連続する画像間比較とは異なる距離尺度が使用され、例えば、連続する画像内比較にはL2距離、連続する画像間比較には並進不変L2が使用されるものもある。実施形態によっては、距離に重みづけして、連続する画像内と連続する画像間の距離の影響を変えることもできる。
N通りの可能なパスのうち(N=第2の(基礎)連続する画像内の画像数、M=第1の(マッチング)連続する画像)内の画像数)、解は、ビタビアルゴリズム及びO(N×M2)時間内に識別される最短パスを使用したシーケンス−復号問題として、再定式化することができる。次いで、パス520など、結果として生じるパスを使用して、プロセス100Aのステップ150における第3の連続する画像が構築される。
プロセス100Bの場合には、ステップ140Bは、前述の距離関数を利用して、第1の連続する画像内の画像との最適マッチ画像を決定することができる。実施形態によっては、プロセス100Aが同時に行われている場合、ステップ140Bで決定されるマッチを再利用することができ、よって、ステップ150における第3の連続する画像を、ステップ140Bにおいて同時に生成することもできる。次に、本発明のいくつかの別の実施形態を論じる。
システム200の実施形態は、比較ショッピングのシステム及びプロセスのための特注の一体型ハウジングとして、単一のベンダから供給することができる。別の実施形態は、一般に利用できるコンピュータ、カメラ、ディスプレイ、鏡といった、市販の部品で組み立てられ、ユーザインターフェースを提供し、プロセス100を実施するための独自の衣類比較システム440と併せて使用される。
鏡が全く除かれている実施形態の中には、単一のディスプレイが使用されるものもある。このような実施形態では、プロセス100の記録ステップの間、ディスプレイは、カメラが取り込んでいる準リアルタイム画像を表示する。次いで、表示するステップでは、単一のディスプレイを使用して、2つの連続する画像が再生される。この実施形態は、衣類比較システム440の家庭版や、市販のコンピュータを使用して自宅で1つ又は複数の基礎連続画像を事前記録するのに、より適し得る。例えば、このような実施形態の1つでは、(カメラが内蔵された)アップル社製MacBook(登録商標)といった家庭用ラップトップコンピュータを使用して、買物客は、すでに所有している複数の洋服を着用した自分自身を記録することもできる。記録された基礎連続画像は、店舗システムからアクセス可能なネットワーク記憶装置や、ユーザが店舗に持ち込む着脱可能なSDカードといったコンピュータ可読記憶媒体に記憶させることもできる。買物客が、異なる店舗で複数の試着を記録し(この場合もやはり、記録されたセッションを衣類比較システム440からアクセス可能なネットワーク記憶装置に記憶させる)、又は、買物客が各店舗に持ち込んだコンピュータ可読記憶媒体上に記録する場合には、単一ディスプレイ実施形態の「逆方向の」変形も役立ち得る。その場合、家庭用コンピュータで、前に記録された連続する画像を使用して、プロセス100の残りのステップを実施することもできる。
前述のような実施形態では、それぞれに異なる用途がある。「順方向の」変形は、ユーザが購入しようとする新しいものが、すでに所有しているものと比べてどうか(似すぎている、引き立たないなど)を判断しようとしている場合に、特に有用である。逆方向の変形は、5件のブティックでウェディングドレスを試着するなど、複数の店舗にわたる相互比較に有用である。
以上を要約すると、一実施形態の概要を首飾りの例を使用して論じた。次いで、1つのプロセスと2つのシステム実施形態を、ユーザ対話を参照してより詳細に説明した。具体的には、小さな衣類、宝飾品及び服飾付属品の比較ショッピングにより適する卓上実施形態について説明したものであり、試着室実施形態は、服装一式といった大きな衣類の比較ショッピングにより適する。次いで、各実施形態で使用される画像マッチングアルゴリズムの詳細を論じた。具体的には、画像と類似の身体及び頭部のポーズとを確実にマッチングするためのL2距離尺度及び並進不変について論じた。結果として生じる連続する画像の再生に際して、滑らかさを改善し、ジッタを回避する変更を、このような連続する画像を探索する高速アルゴリズムと共に論じた。最後に、様々な代替の実施形態について論じた。
100A プロセス
100B プロセス
200 システム
240 システム
450 キーボード
460 ポインティングデバイス
500 第1の連続する画像
510 第2の連続する画像

Claims (4)

  1. コンピュータによって実施される比較ショッピングのためのビデオマッチングの方法であって、
    単一のカメラの前において第1の衣服、宝飾品、又はその他の装身具を着用するユーザの、第1の連続する画像を記録し、
    前記第1の連続する画像を記憶し、
    前記単一のカメラの前において第2の衣服、宝飾品、又はその他の装身具を着用する前記ユーザの、第2の連続する画像を記録し、
    前記第2の連続する画像を記憶し、
    前記第1の連続する画像から第3の連続する画像を作成するために、マッチングアルゴリズムに従い、前記第1の連続する画像内における、前記第2の連続する画像内の各画像毎にマッチする画像を識別し、
    前記ユーザが、前記第1と前記第2の衣服、宝飾品、又はその他の装身具を着用した場合にどのように見えるかを容易に比較することを可能にするめに、前記第2の連続する画像と前記第3の連続する画像とを相互に近接させて前記ユーザに表示する、
    ことを含む方法。
  2. 前記表示することは、第1のユーザ入力装置に応答して前記第2連続する画像及び前記第3の連続する画像の位置を調整するように、ユーザが制御し得る、請求項1に記載の方法。
  3. 前記表示することは、衣類又は宝飾品を着用した前記ユーザのものである、前記第2の連続する画像とマッチングされた複数の追加の連続する画像を、前記第2の連続する画像及び前記第3の連続する画像と近接させて表示する、
    ことを更に含む、請求項1に記載の方法。
  4. 前記第1の連続する画像及び前記第2の連続する画像を記録することは、前記第1及び第2の衣服又は宝飾品を試着するのに使用される鏡の前で行われる、請求項1に記載の方法。
JP2009252717A 2008-11-05 2009-11-04 比較ショッピングのためのビデオマッチングのプログラム Expired - Fee Related JP5544142B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/265,437 2008-11-05
US12/265,437 US8311339B2 (en) 2008-11-05 2008-11-05 Method to robustly match images with similar body and head pose from image sequence

Publications (2)

Publication Number Publication Date
JP2010113716A true JP2010113716A (ja) 2010-05-20
JP5544142B2 JP5544142B2 (ja) 2014-07-09

Family

ID=42131483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009252717A Expired - Fee Related JP5544142B2 (ja) 2008-11-05 2009-11-04 比較ショッピングのためのビデオマッチングのプログラム

Country Status (3)

Country Link
US (1) US8311339B2 (ja)
JP (1) JP5544142B2 (ja)
KR (1) KR101597362B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019189961A (ja) * 2018-04-20 2019-10-31 緯創資通股▲ふん▼有限公司Wistron Corporation インタラクティブな衣服及びアクセサリのフィッティング方法及びその表示システム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9489040B2 (en) * 2010-07-19 2016-11-08 Smart Technologies Ulc Interactive input system having a 3D input space
WO2012054983A1 (en) * 2010-10-29 2012-05-03 Luxottica Retail Australia Pty Ltd Eyewear selection system
WO2012085902A1 (en) * 2010-12-22 2012-06-28 Pick'ntell Ltd. Apparatus and method for communicating with a mirror camera
US20130016078A1 (en) * 2011-07-14 2013-01-17 Kodali Nagendra B Multi-perspective imaging systems and methods
CN103514545B (zh) * 2012-06-28 2017-12-29 联想(北京)有限公司 图像处理方法以及电子设备
US10602765B2 (en) 2013-02-04 2020-03-31 Nagendra B. Kodali System and method of processing produce
US9173431B2 (en) 2013-02-04 2015-11-03 Nagendra B. Kodali System and method of de-stemming produce
US9185930B2 (en) 2013-02-04 2015-11-17 Nagendra B. Kodali System and method of processing produce
KR20160012646A (ko) 2014-07-25 2016-02-03 삼성전자주식회사 영상 표시 장치 및 그 제어 방법
IT201600095426A1 (it) * 2016-09-22 2018-03-22 Ovs S P A Apparato per l’offerta in vendita di merci
TWI625687B (zh) * 2016-11-01 2018-06-01 緯創資通股份有限公司 互動式服飾試穿方法及其顯示系統與電腦可讀取記錄媒體
CN110134603B (zh) * 2019-05-15 2021-10-26 东华大学 嵌入式系统不同参数运行效果对比系统
US11386301B2 (en) 2019-09-06 2022-07-12 The Yes Platform Cluster and image-based feedback system
KR102326902B1 (ko) * 2020-01-10 2021-11-17 (주)내스타일 멀티 포즈를 지원하는 이미지 기반 자세보존 가상피팅 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125903A (ja) * 1999-10-22 2001-05-11 Real World Computing Partnership データ系列検索装置,方法および記録媒体
JP2002207802A (ja) * 2000-12-19 2002-07-26 Shima Seiki Mfg Ltd アパレル製品販売支援方法および装置ならびに試着室
JP2005189918A (ja) * 2003-12-24 2005-07-14 Seiko Epson Corp 情報収集方法、情報収集プログラムおよび情報収集装置
US20080151092A1 (en) * 2005-03-01 2008-06-26 Nissi Vilcovsky Devices, Systems and Methods of Capturing and Displaying Appearances

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1668561A2 (en) * 2003-09-30 2006-06-14 Exxonmobil Upstream Research Company Copr-Urc Characterizing connectivity in reservoir models using paths of least resistance
GB2407724B (en) * 2003-10-31 2005-10-12 Hewlett Packard Development Co Image stabilization
CN101010560B (zh) * 2004-06-29 2012-08-08 索尼株式会社 信息处理设备和方法、以及信息处理系统
KR20060037999A (ko) * 2004-10-29 2006-05-03 주식회사 팬택 코디네이션 제공 단말기 및 그 제공 방법
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125903A (ja) * 1999-10-22 2001-05-11 Real World Computing Partnership データ系列検索装置,方法および記録媒体
JP2002207802A (ja) * 2000-12-19 2002-07-26 Shima Seiki Mfg Ltd アパレル製品販売支援方法および装置ならびに試着室
JP2005189918A (ja) * 2003-12-24 2005-07-14 Seiko Epson Corp 情報収集方法、情報収集プログラムおよび情報収集装置
US20080151092A1 (en) * 2005-03-01 2008-06-26 Nissi Vilcovsky Devices, Systems and Methods of Capturing and Displaying Appearances

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019189961A (ja) * 2018-04-20 2019-10-31 緯創資通股▲ふん▼有限公司Wistron Corporation インタラクティブな衣服及びアクセサリのフィッティング方法及びその表示システム

Also Published As

Publication number Publication date
US8311339B2 (en) 2012-11-13
US20100111426A1 (en) 2010-05-06
KR101597362B1 (ko) 2016-02-24
JP5544142B2 (ja) 2014-07-09
KR20100050411A (ko) 2010-05-13

Similar Documents

Publication Publication Date Title
JP5544142B2 (ja) 比較ショッピングのためのビデオマッチングのプログラム
US8036416B2 (en) Method and apparatus for augmenting a mirror with information related to the mirrored contents and motion
JP6806127B2 (ja) 検索システム、検索方法、及びプログラム
RU2668408C2 (ru) Устройства, системы и способы виртуализации зеркала
Giovanni et al. Virtual try-on using kinect and HD camera
US7948481B2 (en) Devices, systems and methods of capturing and displaying appearances
US10380603B2 (en) Assessing personality and mood characteristics of a customer to enhance customer satisfaction and improve chances of a sale
JP2011253344A (ja) 購買行動分析装置、購買行動分析方法、およびプログラム
CN102201099A (zh) 基于运动的交互式购物环境
US20110085700A1 (en) Systems and Methods for Generating Bio-Sensory Metrics
KR20210088600A (ko) 전시 영역 상태 인식 방법, 장치, 전자 디바이스 및 기록 매체
US20170148089A1 (en) Live Dressing Room
JP6145850B2 (ja) 人物行動分析装置、人物行動分析システムおよび人物行動分析方法
US20130202267A1 (en) Interactive video reflection shopping aid
KR20210131415A (ko) 인터렉티브 방법, 장치, 디바이스 및 기록 매체
Lobo Intelli-mirror: An augmented reality based IoT system for clothing and accessory display
JP2019530989A (ja) 物品販売提供するための装置
Shadrach et al. Smart virtual trial room for apparel industry
US20190066197A1 (en) System and Method for Clothing Promotion
US20220253808A1 (en) Virtual environment
WO2016043102A1 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP6354232B2 (ja) 販売促進装置、販売促進方法及びプログラム
WO2019192455A1 (zh) 门店系统、物品搭配方法、装置及电子设备
JP6928984B1 (ja) 商品提案システム、商品提案方法及び商品提案プログラム
WO2017091220A1 (en) Live dressing room

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140512

R150 Certificate of patent or registration of utility model

Ref document number: 5544142

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees