JP2019133620A - イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム - Google Patents

イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2019133620A
JP2019133620A JP2018120577A JP2018120577A JP2019133620A JP 2019133620 A JP2019133620 A JP 2019133620A JP 2018120577 A JP2018120577 A JP 2018120577A JP 2018120577 A JP2018120577 A JP 2018120577A JP 2019133620 A JP2019133620 A JP 2019133620A
Authority
JP
Japan
Prior art keywords
image
harmony
product
search
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018120577A
Other languages
English (en)
Other versions
JP6527275B1 (ja
Inventor
ジョンウ キム
Jonu Kim
ジョンウ キム
ヘジン パク
Hyejin Park
ヘジン パク
グンヒ チョウ
Geun Hee Cho
グンヒ チョウ
ヒョンジュン キム
Hyun Jun Kim
ヒョンジュン キム
ジョンテク キム
Jonteku Kim
ジョンテク キム
スングォン チェ
Seungkwon Choe
スングォン チェ
サンヨン キム
Sangyeon Kim
サンヨン キム
テギョン キム
Tae Kyoung Kim
テギョン キム
ジョンユン チェー
Jungyun Choi
ジョンユン チェー
サンヒョン イ
Sang Hyun Lee
サンヒョン イ
サンジン チェー
Seongjin Choi
サンジン チェー
ジンヒ チェー
Jinhee Choi
ジンヒ チェー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Application granted granted Critical
Publication of JP6527275B1 publication Critical patent/JP6527275B1/ja
Publication of JP2019133620A publication Critical patent/JP2019133620A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 イメージ内の複数の客体の調和を基盤とした調和検索方法およびシステムを提供する。【解決手段】 本発明の実施形態に係る調和検索方法は、人物に適用可能なアイテムのための客体間の調和を示す抽象的な表現を含む調和キーワードを定義し、このような抽象的な表現を含むキーワードを利用することにより、検索者が意図する調和に対応するイメージを検索して提供することができる。【選択図】 図3

Description

以下の説明は、イメージ内の複数の客体の調和を基盤とした調和検索方法およびシステムに関し、より詳細には、人物に適用可能なアイテムのための客体間の調和(coordination)を示す抽象的な表現を含む調和キーワードを定義し、このような抽象的な表現を含むキーワードを利用することにより、検索者が意図する調和に対応するイメージを検索して提供することが可能な調和検索方法および前記調和検索方法を実行するコンピュータ装置、コンピュータと結合して前記調和検索方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されたコンピュータプログラムとその記録媒体に関する。
オンラインを利用したインターネット上の各種ポータルサイトや、法人または個人のウェブサイトには、広告などのような多様な情報データを掲載して広報することのできる多様な方式の情報提供ウィンドウが提供されている。
インターネットで提供される情報データは、TVや新聞、ラジオなどの媒体と同じように、機能や効果的な側面において巨大な収益マーケットを形成している。さらに、ポータルサイトや各種情報を提供するウェブサイトなどは、情報データから得られる収入が高い比重を占めているという実情がある。
インターネットのウェブサイトに掲載される情報データは、バナーや動画形態、またはユーザが視聴覚的に認識することのできる多様な形態で提供される。このような情報データは、ウェブサイトのメインページやサブページで指定された情報提供ウィンドウに単に掲載される広報や、検索語やキーワードに対する情報データとしての検索関連商品などに分けられる。
情報データを提供する技術の一例として、特許文献1「インターネットを利用したウェブサイト広告連動方法」には、広告主が希望する広告を掲載するために、あるウェブサイトと広告契約を結んだ後、広告の連動に提携している複数のウェブサイトを選択することにより、希望する広告を希望するウェブサイトに同時に連動させる技術が開示されている。
このような情報データを提供する従来技術では、検索者の意図を判定し、判定された検索者の意図に適合した情報データを提供するために多様な方式を利用して検索者に検索結果を提供する。例えば、「レディースジーンズ」というキーワードに対する検索結果として、「レディースジーンズ」と関連のある多様な情報データ(一例として、レディースジーンズを販売するインターネットサイトに関する情報、レディースジーンズ商品に関するイメージ情報など)を提供する。
一方、検索者が入力するキーワードは、一例として「スクールック」や「20代レディースコーデ」のような抽象的な表現を含むこともある。また、このような抽象的な表現は、1つのアイテムに関する情報だけでなく、むしろ、人物に適用可能な多数のアイテムまたは客体の調和に対する検索者の意図(または好み)を含むこともある。例えば、上述したキーワード「20代レディースコーデ」は、「レディースジーンズ」のような個別のアイテムに関する情報だけでなく、20代の女性が着用および/または適用することのできる多様な衣類、バック、アクセサリ、ヘアスタイル、メイクなどのような多数のアイテム、さらには多数のアイテムと該当の20代レディースとの調和に関する情報を要求するかもしれない。他の例として、上述したキーワード「スクールック」も、個別のアイテムに関する情報よりは、モデルが着用および/または適用することのできる多様な衣類、バック、アクセサリ、ヘアスタイル、メイクなどのような多数のアイテム、さらには多数のアイテムと該当のモデルとの調和に関する情報を要求するかもしれない。この場合、「20代レディースコーデ」に関する情報データを提供するにあたり、単なる「レディースジーンズ」商品のイメージや「レディースジーンズ」を着用したモデルの下半身イメージの表示、または「レディースジーンズ」を着用したマネキンイメージの表示は、検索者の意図を十分に反映できないかもしれないという問題が懸念される。
韓国公開特許公報第10−2010−0004312号
人物に適用可能なアイテムのための客体間の調和を示す抽象的な表現を含む調和キーワードを定義し、このような抽象的な表現を含むキーワードを利用することにより、検索者が意図する調和に対応するイメージを検索して提供することのできる調和検索方法および前記調和検索方法を実行するコンピュータ装置、コンピュータと結合して前記調和検索方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されたコンピュータプログラムとその記録媒体を提供する。
人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む複数の調和キーワードを定義する段階、イメージ内で人物が表現された程度に応じて予め定義された点数別に分類された調和学習イメージに基づいてディープラーニング(deep learning)モデルが入力されたイメージの点数を算出するように学習させる段階、入力された検索語に対応する検索結果を抽出する段階、前記入力された検索語が調和キーワードを含む場合、前記抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別する段階、前記学習されたディープラーニングモデルに基づいて前記識別されたイメージそれぞれの点数を算出する段階、前記算出された点数に基づいて前記識別されたイメージのうちから少なくとも1つのイメージを抽出する段階、および前記抽出された検索結果のうちの少なくとも一部と前記抽出された少なくとも1つのイメージを含む検索結果ページを提供する段階を含むことを特徴とする、調和検索方法を提供する。
コンピュータと結合して前記調和検索方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納された、コンピュータプログラムを提供する。
前記調和検索方法をコンピュータに実行させるためのプログラムが記録されていることを特徴とする、コンピュータで読み取り可能な記録媒体を提供する。
コンピュータ装置であって、コンピュータで読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサにより、人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む複数の調和キーワードを定義し、イメージ内で人物が表現された程度に応じて予め定義された点数別に分類された調和学習イメージに基づいてディープラーニングモデルが入力されたイメージの点数を算出するように学習させ、入力された検索語に対応する検索結果を抽出し、前記入力された検索語が調和キーワードを含む場合、前記抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別し、前記学習されたディープラーニングモデルに基づいて前記識別されたイメージそれぞれの点数を算出し、前記算出された点数に基づいて前記識別されたイメージのうちから少なくとも1つのイメージを抽出し、前記抽出された検索結果のうちの少なくとも一部と前記抽出された少なくとも1つのイメージを含む検索結果ページを提供することを特徴とする、コンピュータ装置を提供する。
人物に適用可能なアイテムのための客体間の調和を示す抽象的な表現を含む調和キーワードを定義し、このような抽象的な表現を含むキーワードを利用することにより、検索者が意図する調和に対応するイメージを検索して提供することができる。
検索者が意図する調和に対応する調和イメージに含まれた複数の客体のうちの少なくとも一部の個別の客体に関する情報をさらに提供することができる。
本発明の一実施形態における、ネットワーク環境の例を示した図である。 本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。 本発明の一実施形態における、調和検索方法の実行のために適用可能な過程の例を示した図である。 本発明の一実施形態における、ディープラーニングモデルの学習のための点数別のイメージ定義の例を示した図である。 従来技術における、キーワード「コートコーデ」に対応する検索結果ページの一部を示した図である。 本発明の一実施形態における、キーワード「コートコーデ」に対応する検索結果の一部を示した図である。 本発明の一実施形態における、調和イメージに含まれた個別アイテムに関する情報を抽出する例を示した図である。 本発明の一実施形態における、特定の調和イメージに対して同一販売者の関連商品に対する検索結果および他の販売者の類似商品に対する検索結果を提供する例を示した図である。 本発明の一実施形態における、コーデビューの例を示した図である。 本発明の一実施形態における、検索結果の提供および検索結果でコーデビューアを提供する過程の例を示した図である。 本発明の一実施形態における、調和検索方法の例を示したフローチャートである。 本発明の一実施形態における、検索者によって選択された調和イメージに対するビューア機能を提供する例を示した図である。 本発明の一実施形態における、CNNベースのイメージ特性分類過程の例を示した図である。
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
本発明の実施形態に係る調和検索方法は、以下で説明される電子機器やサーバのようなコンピュータ装置によって実現されてよい。このとき、コンピュータ装置には、本発明の一実施形態に係るコンピュータプログラムがインストールおよび駆動されてよく、コンピュータ装置は、駆動するコンピュータプログラムの制御にしたがって本発明の実施形態に係る調和検索方法を実行してよい。上述したコンピュータプログラムは、コンピュータ装置と結合して調和検索方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されてよい。
図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されることはない。また、図1のネットワーク環境は、本実施形態に適用可能な環境のうちの1つの例を説明したものに過ぎず、本実施形態に適用可能な環境が図1のネットワーク環境に限定されることはない。
複数の電子機器110、120、130、140は、コンピュータ装置によって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン(smart phone)、携帯電話、ナビゲーション、PC(personal computer)、ノート型パンコン、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットなどがある。一例として、図1では、電子機器1(110)の例としてスマートフォンの形状を示しているが、本発明の実施形態において、電子機器1(110)は、実質的に無線または有線通信方式を利用してネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータ装置のうちの1つを意味してよい。
実施形態において通信方式は限定されず、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を活用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター−バスネットワーク、ツリーまたは階層的(hierarchical)ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
サーバ150、160それぞれは、電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供するコンピュータ装置または複数のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続する複数の電子機器110、120、130、140にサービス(一例として、ソーシャルネットワークサービス、メッセージングサービス、検索サービス、メールサービス、コンテンツ提供サービスなど)を提供するシステムであってよい。
図2は、本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。上述した複数の電子機器110、120、130、140それぞれやサーバ150、160それぞれは、図2に示されたコンピュータ装置200によって実現されてよく、一実施形態に係る調和検索方法は、このようなコンピュータ装置200によって実現される調和検索システムによって実行されてよい。
このようなコンピュータ装置200は、図2に示すように、メモリ210、プロセッサ210、通信インタフェース230、および入力/出力インタフェース240を含んでよい。メモリ210は、コンピュータで読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永久大容量記憶装置(permanent mass storage device)を含んでよい。ここで、ROMとディスクドライブのような永久大容量記憶装置は、メモリ210とは区分される別の永久記憶装置としてコンピュータ装置200に含まれてもよい。また、メモリ210には、オペレーティングシステムと、少なくとも1つのプログラムコードが格納されてよい。このようなソフトウェア構成要素は、メモリ210とは別のコンピュータで読み取り可能な記録媒体からメモリ210にロードされてよい。このような別のコンピュータで読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD−ROMドライブ、メモリカードなどのコンピュータで読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータで読み取り可能な記録媒体ではない通信インタフェース230を通じてメモリ210にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク170を介して受信されるファイルによってインストールされるプログラムに基づいてコンピュータ装置200のメモリ210にロードされてよい。
プロセッサ220は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ210または通信インタフェース230によって、プロセッサ220提供されてよい。例えば、プロセッサ220は、メモリ210のような記録装置に格納されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信インタフェース230は、ネットワーク170を介してコンピュータ装置200が他の装置(一例として、上述した記録装置)と互いに通信するための機能を提供してよい。一例として、コンピュータ装置200のプロセッサ220がメモリ210のような記録装置に格納されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース230の制御にしたがってネットワーク170を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データ、ファイルなどが、ネットワーク170を経てコンピュータ装置200の通信インタフェース230を通じてコンピュータ装置200に受信されてもよい。通信インタフェース230を通じて受信した信号や命令、データなどは、プロセッサ220やメモリ210に伝達されてよく、ファイルなどは、コンピュータ装置200がさらに含むことのできる格納媒体(上述した永久記憶装置)に格納されてよい。
入力/出力インタフェース240は、入力/出力装置250とのインタフェースのための手段であってよい。例えば、入力装置は、マイクやキーボード、またはマウスなどの装置を、出力装置は、ディスプレイやスピーカのような装置を含んでよい。他の例として、入力/出力インタフェース240は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置250は、コンピュータ装置200と1つの装置で構成されてもよい。
また、他の実施形態において、コンピュータ装置200は、図2の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、コンピュータ装置200は、上述した入力/出力装置250のうちの少なくとも一部を含むように実現されてもよいし、トランシーバやデータベースなどのような他の構成要素をさらに含んでもよい。
図3は、本発明の一実施形態における、調和検索方法の実行のために適用可能な過程の例を示した図である。図3に示すように、本実施形態に係る調和検索方法は、調和イメージの判定および抽出過程310、イメージ内の調和商品の抽出過程320、類似商品の推薦過程330、および感性調和タグの付着過程340を含んでよい。このような過程は、上述したコンピュータ装置200によって実現および実行されてよい。
調和イメージの判定および抽出過程310は、ディープラーニングモデルを学習させる第1過程と、学習させたディープラーニングモデルを利用して入力されたイメージの点数を算出する第2過程を含んでよい。
先ず、第1過程において、ディープラーニングモデルの学習には、人物に適用可能なアイテムのための客体間の調和を示す抽象的な表現を含む調和キーワード、そしてこのような調和キーワードに適合するイメージと要素、および/または調和キーワードに適合しないイメージと要素が活用されてよい。例えば、表1は、「〜コーデ(coordi)」、「〜ファッション(fashion)」、「〜ルック(look)」のように、人物と人物に着用および/または適用されることのできる衣類、バック、アクセサリ、ヘアスタイル、メイクなどのような多数のアイテムとの調和を示す抽象的な表現を含む調和キーワードを予め定義した例を示している。
Figure 2019133620
このような表1の調和キーワードは1つの例に過ぎず、調和キーワードは多様に拡張されて活用されてもよい。例えば、入力されたキーワード「コートコーデ」に対し、「メンズコートコーデ」と「レディースコートコーデ」の両方が対応されてもよい。他の例として、入力されたキーワード「ニットコーデ」に対し、「メンズニットコーデ」と「レディースニットコーデ」の両方が対応されてもよい。
また、第1過程では、個別のイメージに点数を付与するための条件が予め定義されてよく、予め定義された条件に基づいて予め分類された学習イメージが学習データとして生成されてよい。
例えば、図4は、本発明の一実施形態における、ディープラーニングモデルの学習のための点数別のイメージ定義の例を示している。より具体的に、図4は、検索者の意図に適合した調和イメージを提供するためのコーデビューを提供するために、調和イメージに付与することが可能な点数を6点から1点まで設定し、それぞれの点数を付与するための条件(一例として、身体表示の程度および/または全身イメージの程度)に適したイメージの例を示している。また、図4は、3点以上(3点から6点まで)が付与されたイメージがコーデビューに表示されることが可能であると説明している。コーデビューについては、以下でさらに詳しく説明する。
また、学習イメージには、コーデビューへの活用に適切でないイメージと要素がさらに活用されることもある。例えば、コーデビューでは、テキストが挿入されているイメージやマネキンイメージ、ハンガーにかかっている衣類イメージや人物(一例として、モデル)と商品アイテムがイメージの主な要素ではないイメージ、人物と商品アイテムを明確に識別するのが困難なイメージ(一例として、コントラストが予め設定された値以下のイメージ)のようなイメージが、適切でないイメージと要素を学習するために使用されてよい。
このようなディープラーニングモデルとしては、一例として、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)のようなディープラーニングアルゴリズムが活用されてよい。CNNは、データから自動で特徴を学習する代表的アルゴリズムであって、主にイメージ認識に使用される。第1過程では、一例として、CNNに、予め点数が付与された学習イメージと、対応する点数を入力し、CNNが学習イメージの特徴と点数を互いに関連させることができるように学習させてよい。
上述した第2過程では、学習されたディープラーニングモデル(一例として、上述したCNN)に点数を付与しようとするイメージを入力することにより、ディープラーニングモデルが入力されたイメージの点数を算出するようにしてよい。このとき、第2過程では、算出された点数と入力されたイメージを連係することにより、入力されたイメージがコーデビューに表示可能なイメージなのかを判定および抽出することが可能となる。
検索者が入力する検索語に対応して提供可能な検索結果は、相当に多数のイメージを含むようになる。本実施形態では、上述したように、ディープラーニングモデルを活用して検索結果と関連して抽出されるイメージそれぞれの点数を抽出することにより、コーデビューに表示可能なイメージを迅速に判定および抽出することができ、点数に応じて整列することができる。
点数やモデルは上記の例に限定されず、様々な実施形態が通常の技術者に容易に理解されるであろう。例えば、付与するための点数の段階は、実施形態によっては、条件別に多様な段階に調節することが可能であってもよい(一例として、10種類の条件に応じて1〜10点が付与されてもよい)。ディープラーニングモデルについても、イメージを分析/分類することが可能なモデルであれば、CNNに限定されることなく、多様なモデルのうちの何れかが活用されてよい。
図5は、従来技術における、キーワード「コートコーデ」に対応する検索結果ページの一部を示した図であり、図6は、本発明の一実施形態における、キーワード「コートコーデ」に対応する検索結果の一部を示した図である。
図5の検索結果510は、キーワード「コートコーデ」に対して適切でないイメージが表示された例を示している。例えば、図5の第1イメージ520は、図4で説明した条件によると1点に対応するイメージであり、第2イメージ530は、個別のアイテムを表示しただけのイメージであり、第3イメージ540は、図4で説明した条件によると1点に対応するイメージである。このようなイメージ520〜540はすべて、「コートコーデ」のように人物と人物が着用する商品アイテムとの調和のための検索者の意図には適合しないイメージである。3点以上に対応するイメージが検索結果に含まれることもあるが、これは該当のイメージが偶然に含まれただけであって、システムの判定に基づいて抽出されたものではない。
これに対して、図6の検索結果610は、キーワード「コートコーデ」に対して適切なイメージが表示された例を示している。例えば、図6のイメージ620〜650はすべて、図4で説明した条件によると、コーデビューに表示可能な点数である3点以上の点数が付与されたイメージである。キーワード「コートコーデ」に対する検索結果が6点のイメージを多数含む場合には、本実施形態に係るシステムは、キーワード「〜コーデ」に適合する6点から全身イメージだけを抽出して表示してもよい。
このように、本実施形態では、検索者の検索語によって抽出された検索結果のイメージそれぞれに対してディープラーニングモデルに基づいて点数を付与し、点数に応じてイメージを選択および/または整列して提供することができる。これは、本実施形態のイメージ判定および抽出が、検索語に基づいた検索の過程だけに限定されるのではなく、調和キーワードを含む検索語に基づいて抽出されたイメージから調和キーワードにより一層適合するイメージを選別する過程であることを意味する。したがって、本実施形態によると、人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む調和キーワードに対し、検索者の意図により一層適合したイメージを判定および抽出して提供することが可能となる。
再び図3を参照すると、イメージ内の調和商品の抽出過程320は、イメージ内の多様な商品アイテムを抽出する過程を含んでよい。例えば、表1に示されたキーワード「20代結婚式ルック」が含まれた検索語を入力した検索者は、「20代結婚式ルック」に関するイメージを見たいという意図だけでなく、希望する調和イメージに含まれたアイテム(一例として、衣類、バック、アクセサリなど)を購買したい意図も含んでいるかもしれない。このために、本実施形態では、一例として、従来技術に係る図5の第2イメージ530のように検索語に対する個別アイテムを提供するのではなく、人物と人物に適用された商品アイテムとの調和による調和イメージを提供し、調和イメージに含まれた商品アイテムそれぞれに対する検索結果を調和イメージと共に提供してよい。
これにより、本実施形態では、検索者が調和イメージに含まれた個別の商品アイテムに対しても容易にアクセスして購買が成立するような機能および/またはサービスを提供することができる。言い換えれば、本実施形態に係る機能および/またはサービスは、検索者の意図に適合する調和イメージで該当の好みの調和と連係する個別の商品アイテムを提供するものであって、このような機能および/またはサービスが、単に特定の個別アイテムに関する情報を提供したり、特定の商品提供者の商品アイテムに関する情報を提供したり、互いに類似する商品アイテムに関する情報を提供したりすることが可能であり、また、単に特定のイメージに含まれた商品アイテムに関する情報を提供する機能やサービスとは差別化されるものであるということは、通常の技術者であれば容易に理解することができるであろう。
また、類似調和商品の推薦過程330は、イメージ内の多様な商品アイテムと類似の商品アイテムを検索し、検索された商品アイテムに関する情報を提供する過程を含んでよい。一例として、類似の商品アイテムは、調和イメージを登録した商品提供者ではなく、他の商品提供者の商品アイテムの中から検索されてよい。
図7は、本発明の一実施形態における、調和イメージに含まれた個別アイテムに関する情報を抽出する例を示した図である。一般的に、調和イメージは、特定の商品提供者によって登録されたイメージである。例えば、検索者が選択した調和イメージAが商品提供者Bによって登録されたイメージであるとする。この場合、コンピュータ装置200は、イメージ内の調和商品の抽出過程320において、調和イメージAに含まれた商品提供者Bの商品アイテムを識別してよく、識別された商品提供者Bの商品アイテムに関する情報(または検索結果)を検索者に提供してよい。また、これとは別に、商品提供者Bではなく、他の商品提供者Cの商品アイテムのうち、調和イメージAに含まれた商品アイテムと類似する商品アイテムに関する情報(または検索結果)を検索者にさらに提供してもよい。
図8は、本発明の一実施形態における、特定の調和イメージに対し、同一販売者の関連商品に対する検索結果および他の販売者の類似商品に対する検索結果を提供する例を示した図である。図8は、図6で第1イメージ620が選択されることにより、選択された第1イメージ620と関連タグ(#着痩せ、#トレンド、#女性らしい)とを共に表示した例810と、第1イメージ620に含まれた商品アイテムに関する情報(または検索結果)を表示した例820、および第1イメージ620に含まれた商品アイテムと類似する商品アイテムに関する情報(または検索結果)を表示した例830をそれぞれ示している。言い換えれば、図6および図8は、検索者の調和キーワードを含む検索語に対して個別の検索結果を表示するだけでなく、調和キーワードに適合する調和イメージの表示と、表示された調和イメージのうちの検索者によって選択された調和イメージに含まれる個別の商品アイテムに対する検索結果とを表示する段階的検索を行う様子を示している。また、このような段階的検索により、本実施形態は、検索者の意図に適合した「調和」と、選択された「調和」に含まれた商品アイテムに関する情報を提供することにより、検索者が希望する「調和」から、互いに連係する商品アイテムの集合に関する情報を提供することができるようになる。例えば、例820や例830に表示された情報は、検索者の検索語と連係する情報だけでなく、検索者が意図する「調和」と連係する情報であってよい。
図9は、本発明の一実施形態における、コーデビューの例を示した図である。図9は、図8で説明した例810〜830を連結した1つのページをコーデビューとして提供するコーデビューアの例を示している。このようなコーデビューは、関連コーデキーワードを表示するための領域および/または同一販売者(対応する調和イメージを登録した商品提供者)が登録した他のイメージを表示するための領域をさらに含んでもよい。コーデビューが含む調和イメージや個別の商品アイテムに関する情報、類似の商品アイテムに関する情報、関連コーデキーワード、および同一販売者が登録した他のイメージそれぞれは、対応するページへのリンクを含んでよい。例えば、調和イメージは、調和イメージと共に登録された商品アイテムの販売ページへのリンクを含んでよい。他の例として、個別の商品アイテムに関する情報は、対応する個別の商品アイテムの販売ページへのリンクを含んでよい。また他の例として、類似商品アイテムに関する情報は、他の販売者の商品販売ページへのリンクを含んでよい。さらに他の例として、関連コーデキーワードは、該当のキーワードを検索語としたときの検索結果を提供するためのページへのリンクを含んでよい。
再び図3を参照すると、感性調和タグの付着過程340は、調和キーワードを含む検索語に対する検索結果を抽出するための前処理過程であってよい。このようなイメージに対する調和タグは、商品提供者によって手動で設定されてもよいし、コンピュータ装置200によって自動で設定されてもよい。このために、コンピュータ装置200は、上述したディープラーニングモデルとは異なる用途として学習される第2ディープラーニングモデルを含んでよい。例えば、コンピュータ装置200は、定義された複数の調和キーワードに対応するように予め分類されたタグ学習イメージに基づいて第2ディープラーニングモデルが入力されたイメージのタグを抽出するように第2ディープラーニングモデルを学習させてよい。この後、コンピュータ装置200は、商品提供者によって登録された商品イメージそれぞれを学習された第2ディープラーニングモデルに入力し、入力されたイメージに対応する調和タグを取得してよい。コンピュータ装置200は、決定されたタグを、対応する商品イメージに対して設定および格納してよい。この場合、コンピュータ装置200は、上述したイメージのうちから、調和商品の抽出過程320で入力された調和キーワードとタグ(イメージに対して設定された調和タグ)とを比較することにより、調和キーワードに対応する商品イメージを抽出することが可能となる。
図10は、本発明の一実施形態における、検索結果の提供および検索結果でコーデビューアを提供する過程の例を示した図である。図10の第1ページ1010は、統合検索によって調和キーワードとして定義された「デートルック」が入力された場合、検索結果に対する多様なカテゴリのうちの1つ(図10の例では、ショッピングカテゴリ)を利用して本来の検索結果の代わりに調和イメージが表示された例を示している。調和キーワードとして定義されたキーワードではなく他のキーワードが入力される場合、ショッピングカテゴリには、図5で説明した従来技術のように、個別の商品アイテムのための検索結果が表示されてよい。これと同じように、第2ページ1020は、ショッピング検索によって調和キーワードとして定義された「デートルック」が入力された場合、ショッピング検索結果の代わりに調和イメージが表示された例を示している。この場合にも、調和キーワードとして定義されたキーワードではなく他のキーワードが入力される場合、図5で説明した従来技術のように、個別の商品アイテムのための検索結果が表示されてよい。検索者が表示された調和イメージのうちから1つを選択する場合、検索者には、図9で説明したコーデビューアによってコーデビューが提供されてよい。
図11は、本発明の一実施形態における、調和検索方法の例を示したフローチャートである。本実施形態に係る調和検索方法は、上述したコンピュータ装置200によって実行されてよい。例えば、コンピュータ装置200のプロセッサ220は、メモリ210が含むオペレーティングシステムのコードや、少なくとも1つのプログラムのコードによる制御命令(instruction)を実行するように実現されてよい。ここで、プロセッサ220は、コンピュータ装置200に格納されたコードが提供する制御命令にしたがってコンピュータ装置200が図11の方法が含む段階1110〜1170を実行するように、コンピュータ装置200を制御してよい。
段階1110で、コンピュータ装置200は、人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む複数の調和キーワードを定義してよい。例えば、表1では、ファッションに関する抽象的な表現(一例として、「〜コーデ」、「〜ファッション」、「〜ルック」)を含む調和キーワードが定義された例について説明した。例えば、コンピュータ装置200は、調和キーワードを入力するためのユーザインタフェースを管理者に提供してよく、管理者から入力されたキーワードを調和キーワードとして設定および格納することによって複数の調和キーワードを定義してよい。
段階1120で、コンピュータ装置200は、イメージ内で人物が表現された程度に応じて予め定義された点数別に分類された調和学習イメージに基づいてディープラーニングモデルが入力されたイメージの点数を算出するように学習させてよい。例えば、図4では、イメージ内で人物が表現された程度に応じて条件別に1点から6点までの点数を付与する例について説明した。例えば、ディープラーニングモデルには、点数と条件による学習イメージが入力されてよく、ディープラーニングモデルは、イメージの特徴を分析および抽出して対応する点数および条件と連係させることによって点数および条件によるイメージの特徴を分類してよい。
段階1130で、コンピュータ装置200は、入力された検索語に対応する検索結果を抽出してよい。例えば、コンピュータ装置200は、検索語を利用して検索結果を抽出するための多様な検索方法のうちの少なくとも1つ以上を利用することによって入力された検索語に対応する検索結果を抽出してよい。
段階1140で、コンピュータ装置200は、調和キーワードを利用した検索が要請される場合、抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別してよい。例えば、コンピュータ装置200は、商品提供者によって登録される商品アイテムの商品イメージそれぞれにタグを設定して格納してよい。このとき、コンピュータ装置200は、検索の要請と関連する調和キーワードとタグとを比較することにより、調和キーワードに対応する商品イメージを人物に適用可能なアイテムの販売と関連するイメージとして抽出してよい。例えば、調和キーワードを利用した検索の要請は、検索者が調和キーワードを含む検索語を入力して検索を要請すること、あるいは検索者がページ上に表示された調和キーワードを選択して検索を要請することを含んでよい。
商品イメージにタグを設定することは、上述したように、商品提供者によって手動で行われてもよいが、コンピュータ装置200によって自動で行われてもよい。例えば、コンピュータ装置200は、段階1110で定義された複数の調和キーワードに対応するように分類された複数のタグ学習イメージを利用し、段階1120で学習されたディープラーニングモデルとは異なる第2ディープラーニングモデルを学習させてよい。この場合、コンピュータ装置200は、第2ディープラーニングモデルが入力されたイメージのタグを出力するように学習させてよい。また、コンピュータ装置200は、学習された第2ディープラーニングモデルに登録される商品イメージそれぞれのタグを決定してよい。上述したように、第2ディープラーニングモデルは、タグ学習イメージを分析して抽出した特徴を対応する調和キーワードと連係させてよく、入力される商品イメージの特徴を抽出して商品イメージを特定の調和キーワードとして分類してよい。この場合、商品イメージが分類された調和キーワードが、該当の商品イメージのタグとして追加されてよい。商品提供者が登録された商品イメージにタグを設定した場合にも、コンピュータ装置200が第2ディープラーニングモデルを利用して追加のタグを商品イメージにさらに設定してもよい。コンピュータ装置200は、第2ディープラーニングモデルによって決定されたタグを、対応する商品イメージに対して設定および格納してよい。このような商品イメージに対して設定されたタグを利用することにより、コンピュータ装置200は、段階1140で抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別することが可能となる。
段階1150で、コンピュータ装置200は、学習されたディープラーニングモデルによって識別されたイメージそれぞれの点数を算出してよい。段階1120を参照しながら上述したように、ディープラーニングモデルは、入力されるイメージの点数を算出するように学習され、コンピュータ装置200は、識別されたイメージそれぞれを順に学習されたディープラーニングモデルに入力することで識別されたイメージそれぞれの点数を算出してよい。
段階1160で、コンピュータ装置200は、算出された点数に基づき、識別されたイメージのうちから少なくとも1つのイメージを抽出してよい。少なくとも1つのイメージを抽出する方式は、多様な実施形態を含んでよい。一実施形態として、コンピュータ装置200は、予め設定された点数以上のイメージだけを抽出してよい。他の実施形態として、コンピュータ装置200は、算出された点数に基づいて識別されたイメージを整列した後、上位から予め設定された個数のイメージを抽出してもよい。
段階1170で、コンピュータ装置200は、抽出された検索結果のうちの少なくとも一部と抽出された少なくとも1つのイメージを含む検索結果ページを生成および提供してよい。
一実施形態として、コンピュータ装置200は、商品販売関連の検索結果を表示するための商品関連領域を含むように検索結果ページを生成するが、抽出された検索結果のうちの商品関連領域に対応する検索結果の代わりに、抽出された少なくとも1つのイメージを商品関連領域に表示するように検索結果ページを生成してよい。一例として、図10では、調和キーワードを含む検索に対し、検索結果ページのショッピングカテゴリとして、キーワード検索結果ではなく、抽出された調和イメージを表示した例について説明した。
他の実施形態として、コンピュータ装置200は、入力された検索語が含む調和キーワードと関連する調和検索結果を表示するための領域を別に含み、別の領域に抽出された少なくとも1つのイメージを表示するように検索結果ページを生成してもよい。例えば、調和検索の結果として抽出されたイメージを表示するための別のカテゴリが検索結果ページに含まれてよい。
また他の実施形態として、抽出された少なくとも1つのイメージを商品関連領域とは別の領域すべてに表示してもよい。一例として、抽出された少なくとも1つのイメージが商品関連領域とは別の領域すべてに重複的に表示されてよい。他の例として、抽出されたイメージのうちの一部は商品関連領域に表示し、残りは別の領域に表示してもよい。
図12は、本発明の一実施形態における、検索者によって選択された調和イメージに対するビューア機能を提供する例を示した図である。図12の段階1210および1220は、図11を参照しながら説明した段階1170以後に選択的に実行されてよい。
段階1210で、コンピュータ装置200は、検索結果ページで抽出された少なくとも1つのイメージが選択される場合、選択されたイメージで人物に適用されたアイテムを識別してよい。
一実施形態として、コンピュータ装置200は、調和イメージおよび調和イメージに含まれた商品アイテムに関する情報を関連付けて商品提供者から登録されてよい。例えば、コンピュータ装置200は、商品提供者から特定の調和と関連する代表イメージ(および/またはサブイメージ)が登録され、登録された代表イメージ(および/またはサブイメージ)に含まれた商品アイテムに関する情報を、登録された代表イメージ(および/またはサブイメージ)と関連付けて登録するためのページを商品提供者に提供してよい。コンピュータ装置200は、代表イメージ(および/またはサブイメージ)が検索結果ページにおいて調和イメージとして表示されて検索者によって選択された場合、代表イメージ(および/またはサブイメージ)と関連付いて登録された商品アイテムを、選択されたイメージで人物に適用されたアイテムとして識別してよい。
他の実施形態として、コンピュータ装置200は、選択されたイメージおよび選択されたイメージを登録した商品提供者の商品アイテムのイメージを分析および比較し、選択されたイメージで人物に適用された商品提供者の商品アイテムを識別してよい。例えば、コンピュータ装置200は、検索結果ページで選択されたイメージAと、イメージAを登録した商品提供者Bの商品である商品アイテムCの商品イメージDとを比較してよい。このとき、イメージ分析の結果に基づき、イメージAで人物に適用されたアイテムと商品イメージDに示された商品アイテムCが同じアイテムであると分析された場合、コンピュータ装置200は、商品アイテムCをイメージAで人物に適用された商品提供者の商品アイテムとして識別してよい。
このように、コンピュータ装置200は、選択されたイメージを登録した商品提供者の商品アイテムを識別することができる。例えば、コンピュータ装置200は、選択されたイメージおよび選択されたイメージを登録した商品提供者の商品アイテムのイメージを分析および比較することにより、選択されたイメージで人物に適用された商品提供者の商品アイテムを識別してよい。他の実施形態として、コンピュータ装置200は、選択されたイメージを登録した商品提供者ではない他の商品提供者の商品アイテムだけを識別してもよい。例えば、コンピュータ装置200は、選択されたイメージおよび選択されたイメージを登録した商品提供者ではない他の商品提供者の商品アイテムのイメージを分析および比較することにより、選択されたイメージで人物に適用されたイメージと関連する他の商品提供者の商品アイテムを識別してよい。また他の実施形態として、コンピュータ装置は、同一商品提供者の商品アイテムと他の商品提供者の商品アイテムである2種類の商品アイテムをそれぞれ識別してもよい。図7〜図9は、このような2種類の商品アイテムをそれぞれ識別した例を示している。
段階1220で、コンピュータ装置200は、選択されたイメージと識別されたアイテムに関する情報を含んで構成されたページに対するビューア機能を提供してよい。例えば、図9をでは、選択されたイメージと識別されたアイテムに関する情報を含んで構成されたページを提供するコーデビューアの例について説明した。
イメージからアイテムを識別する技術についても、CNNのようなディープラーニングモデルを利用してよい。例えば、コンピュータ装置200は、CNNベースの客体検出アルゴリズムに基づいてイメージ内のローカリゼーションを処理してよい。このために、CNNベースの客体検出アルゴリズムは、特定の主題(例えば、ファッションなど)に適合するファイン−チューニング(fine−tuning)方式に基づいてCNNを学習させてよく、R−CNN(Regions with Convolutional Neural Network)ベースの分類モデルを利用してイメージから特定の主題のアイテムに適合する客体を探し出してよい。客体検出のための事前訓練モデル(Pre−trained Model)は、イメージと関連するデータセットによって学習させたCNN学習モデルを適用するが、CNN学習モデルをファッションにさらに適合したファイン−チューニングのための分類モデルを再生成して適用してよい。ここで、ローカリゼーションは、イメージ内から探し出そうとするファッションアイテムに該当する客体に関する位置と予め定義されたラベルを検索する過程を意味してよい。コンピュータ装置200は、ローカリゼーションのためにCNNベースの客体検出アルゴリズムを適用するが、これはCNN内部で候補ROIを内在して計算するため、より迅速にローカリゼーションを実行することが可能となる。
客体に対する分類性能を向上させるために、ファッションアイテムにさらに適合するように事前訓練モデルを再構成してよい。言い換えれば、ファイン−チューニングのために詳細なカテゴリを適用した事前訓練モデルを再生成することができ、既存の事前訓練モデルをファッションデータセットに基づいて再学習(re−training)することができる。このとき、コンピュータ装置200は、イメージに対するファッションカテゴリのデータセットを利用して学習させたCNNベースの客体検出アルゴリズムを適用することにより、イメージに含まれたファッションアイテム(商品アイテム)に対するローカリゼーションと属性学習(attribute learning)を実行してよい。
例えば、コンピュータ装置200は、イメージが入力された場合、CNNベースの客体検出アルゴリズムに基づいて入力されたイメージ内に存在するファッションアイテムの位置を探し出し、各位置に該当する客体属性を分類してよい。このとき、客体の位置とは、ローカリゼーションの結果を意味し、客体属性とは、客体の属性学習に対する結果であって、カラー、テクスチャ、カテゴリに対する結果を含んでよい。コンピュータ装置200は、イメージから検出された客体に対する属性学習を利用して該当の客体の特徴を抽出してカテゴリを分類してよい。例えば、ファッションアイテムの特性属性、すなわち、カラー、テクスチャ、カテゴリを基盤としてモデリングされたCNNを適用することにより、イメージから検出された客体の特徴を正確に抽出および分類することが可能となる。属性学習は、特定のファッションカテゴリに適合する多様な属性を定義して学習に適用したものである。カラーやテクスチャ、およびカテゴリ属性に対するデータセットを構成し、該当の属性の特性をもつデータを、CNNアルゴリズムを適用して学習させてよい。カラーとテクスチャ属性は、それぞれ1つずつ、カテゴリとは関係なく共通する学習モデルを生成してよい。ファッションアイテムに対する分類構造は階層的構造を有するが、これはカテゴリ属性側面から見るときに、ファッションカテゴリは共通の特性を共有する。例えば、ワンピースは、トップ(Top)とスカート(Skirts)の属性を両方持ち合わせた場合である。このように、ファッションカテゴリは、詳細カテゴリに分けるほど、互いに共通する特性を持ち合わせる場合が極めて多くなる。したがって、それぞれのカテゴリに対して区別される特性を格納するように設計する必要があり、階層的構造を有するように構成される必要がある。一例として、ローカリゼーションに応じた分類結果は上位レベルを意味してよく、カテゴリ属性は下位レベルを意味してよい。
他の実施形態として、コンピュータ装置200は、商品提供者によって登録されるイメージのうち、一定の点数以上の調和イメージに対してコーデビューのようなページを予め生成しておいてもよい。この場合、検索結果ページで特定の調和イメージが選択される場合、前記調和イメージと対応して生成されたページがコーデビューアによって検索者に提供されてよい。
図13は、本発明の一実施形態における、CNNベースのイメージ特性分類過程の例を示した図である。図13を参照すると、コンピュータ装置200は、イメージ1300が入力されると、ローカリゼーションのためのCNNモデル(上位レベル)1310と属性学習のためのCNNモデル(下位レベル)1320を順に適用してよい。コンピュータ装置200は、イメージ1300内にファッションアイテムに該当する客体が存在する場合には、CNNモデル(上位レベル)1310によるローカリゼーション過程において上位概念のファッションラベルと位置(ROI)を探し出してよい。この後、コンピュータ装置200は、属性学習CNNモデル(下位レベル)1320内でイメージ1300から検出された客体のラベルにマッチングするカテゴリ属性モデルと各カラー/テクスチャ属性モデルを適用するCNN過程を経た後、最終的に各客体のカラー/テクスチャ/カテゴリに対する3つの分類結果を取得してよい。属性学習CNNモデル(下位レベル)1320を適用した分類の中間過程、すなわち、CNNのソフト−マックスレイヤ(Soft−max Layer)(classifier)の直ぐ前レイヤであるフル連結レイヤ(Fully Connected Layer)から、最終分類結果と同じようにそれぞれ3つの特徴(カラー、テクスチャ、カテゴリ)を抽出してよい(Deep Feature)。
したがって、コンピュータ装置200は、ファッションアイテムのデータセットが適用されたCNN学習モデルを適用することにより、イメージからファッションアイテムに該当する客体を探し出し、該当の客体の特徴を正確に抽出することが可能となる。コンピュータ装置200は、このようにイメージから抽出された特徴に基づいて調和イメージに含まれた商品アイテムを識別することができる。例えば、イメージ間の比較によって商品アイテムを識別する実施形態の場合には、それぞれのイメージから抽出される特徴を互いに比較し、同一および/または類似に応じて商品アイテムを識別することができる。
このように、本発明の実施形態によると、人物に適用可能なアイテムのための客体間の調和を示す抽象的な表現を含む調和キーワードを定義し、このような抽象的な表現を含むキーワードを利用することにより、検索者が意図する調和に対応するイメージを検索して提供することができる。また、検索者が意図する調和に対応する調和イメージに含まれた複数の客体のうちの少なくとも一部の個別客体に関する情報をさらに提供することができる。
上述したシステムまたは装置は、ハードウェア構成要素、またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)および前記OS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを格納、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置、コンピュータ格納媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で格納されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータで読み取り可能な記録媒体に格納されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータで読み取り可能な媒体に記録されてよい。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含んでよい。媒体は、コンピュータによって実行可能なプログラムを継続して格納するものであっても、実行またはダウンロードのために臨時で格納するものであってもよい。また、媒体は、単一または複数個のハードウェアが結合した形態の多様な記録手段または格納手段であってよいが、あるコンピュータシステムに直接接続する媒体に限定されてはならず、ネットワーク上に分散存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD−ROMおよびDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含んでプログラム命令語が格納されるように構成されたものであってよい。また、他の媒体の例として、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給ないし流通するサイト、サーバなどで管理する記録媒体ないし格納媒体が挙げられてもよい。プログラム命令の例には、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを利用してコンピュータによって実行されることの可能な高級言語が含まれる。
以上のように、実施形態を、限定された実施形態と図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
110、120、130、140:電子機器
150、160:サーバ
170:ネットワーク

Claims (19)

  1. 人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む複数の調和キーワードを利用する調和検索方法であって、前記調和検索方法は、イメージ内で人物が表現された程度に応じて予め定義された点数別に分類された調和学習イメージに基づいてディープラーニングモデルが入力されたイメージの点数を算出するように学習しているコンピュータ装置により実行され、前記調和検索方法は、
    入力された検索語に対応する検索結果を抽出する段階、
    前記入力された検索語が調和キーワードを含む場合、前記抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別する段階、
    前記学習されたディープラーニングモデルを利用して前記識別されたイメージそれぞれの点数を算出する段階、
    前記算出された点数に基づき、前記識別されたイメージのうちから少なくとも1つのイメージを抽出する段階、および
    前記抽出された検索結果のうち少なくとも一部の検索結果と前記抽出された少なくとも1つのイメージとを含む検索結果ページを提供する段階
    を含むことを特徴とする、調和検索方法。
  2. 前記検索結果ページを提供する段階は、
    商品販売関連の検索結果を表示するための商品関連領域を含むように前記検索結果ページを生成する場合において、前記抽出された検索結果のうちで前記商品関連領域に対応する検索結果の代わりに、前記抽出された少なくとも1つのイメージを前記商品関連領域に表示するように前記検索結果ページを生成することを特徴とする、請求項1に記載の調和検索方法。
  3. 前記検索結果ページを提供する段階は、
    前記入力された検索語が含む調和キーワードと関連する調和検索結果を表示するための別の領域を含み、前記別の領域に前記抽出された少なくとも1つのイメージを表示するように前記検索結果ページを生成することを特徴とする、請求項1または2に記載の調和検索方法。
  4. 前記検索結果ページから前記抽出された少なくとも1つのイメージが選択される場合、前記選択されたイメージで人物に適用されたアイテムを識別する段階、および
    前記選択されたイメージと前記識別されたアイテムに関する情報を含んで構成されたページに対するビューア機能を提供する段階
    をさらに含むことを特徴とする、請求項1または3に記載の調和検索方法。
  5. 調和イメージおよび前記調和イメージに含まれた商品アイテムに関する情報の関連付けを登録する段階
    をさらに含み、
    前記アイテムを識別する段階は、
    前記選択されたイメージと関連付けて登録された商品アイテムに関する情報に基づき、前記選択されたイメージで人物に適用されたアイテムを識別することを特徴とする、請求項4に記載の調和検索方法。
  6. 前記アイテムを識別する段階は、
    前記選択されたイメージおよび前記選択されたイメージを登録した商品提供者の商品アイテムのイメージを分析および比較し、前記選択されたイメージで人物に適用された前記商品提供者の商品アイテムを識別することを特徴とする、請求項4に記載の調和検索方法。
  7. 前記アイテムを識別する段階は、
    前記選択されたイメージおよび前記選択されたイメージを登録した商品提供者ではない他の商品提供者の商品アイテムのイメージを分析および比較し、前記選択されたイメージで人物に適用されたイメージと関連する他の商品提供者の商品アイテムを識別することを特徴とする、請求項4に記載の調和検索方法。
  8. 商品提供者によって登録される商品アイテムの商品イメージそれぞれにタグを設定および格納する段階
    をさらに含み、
    前記アイテムの販売と関連するイメージを識別する段階は、
    前記入力された検索語が含む調和キーワードとタグとの比較によって前記調和キーワードに対応する商品イメージを抽出することを特徴とする、請求項1〜7のうちのいずれか一項に記載の調和検索方法。
  9. 前記タグを設定および格納する段階は、
    前記定義された複数の調和キーワードに対応するように分類された複数のタグ学習イメージに基づき、第2ディープラーニングモデルが入力されたイメージのタグを出力するように学習させる段階、
    前記学習された第2ディープラーニングモデルに基づき、前記登録される商品イメージそれぞれに対するタグを決定する段階、および
    前記決定されたタグを対応する商品イメージに対して設定および格納する段階
    を含むことを特徴とする、請求項8に記載の調和検索方法。
  10. 請求項1〜9のうちのいずれか一項に記載の調和検索方法をコンピュータに実行させるコンピュータプログラム。
  11. コンピュータ装置であって、
    コンピュータで読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
    を含み、
    前記少なくとも1つのプロセッサにより、
    人物に適用可能なアイテムのための複数の客体間の調和を示す抽象的な表現を含む複数の調和キーワードを定義し、
    イメージ内で人物が表現された程度に応じて予め定義された点数別に分類された調和学習イメージに基づいてディープラーニングモデルが入力されたイメージの点数を算出するように学習させ、
    入力された検索語に対応する検索結果を抽出し、
    前記入力された検索語が調和キーワードを含む場合、前記抽出された検索結果と連係するイメージのうちで人物に適用可能なアイテムの販売と関連するイメージを識別し、
    前記学習されたディープラーニングモデルを利用して前記識別されたイメージそれぞれの点数を算出し、
    前記算出された点数に基づき、前記識別されたイメージのうちから少なくとも1つのイメージを抽出し、
    前記抽出された検索結果のうちの少なくとも一部と前記抽出された少なくとも1つのイメージを含む検索結果ページを提供すること
    を特徴とする、コンピュータ装置。
  12. 前記少なくとも1つのプロセッサにより、
    商品販売関連の検索結果を表示するための商品関連領域を含むように前記検索結果ページを生成する場合において、前記抽出された検索結果のうちで前記商品関連領域に対応する検索結果の代わりに、前記抽出された少なくとも1つのイメージを前記商品関連領域に表示するように前記検索結果ページを生成することを特徴とする、請求項11に記載のコンピュータ装置。
  13. 前記少なくとも1つのプロセッサにより、
    前記入力された検索語が含む調和キーワードと関連する調和検索結果を表示するための別の領域を含み、前記別の領域に前記抽出された少なくとも1つのイメージを表示するように前記検索結果ページを生成することを特徴とする、請求項11または12に記載のコンピュータ装置。
  14. 前記少なくとも1つのプロセッサにより、
    前記検索結果ページで前記抽出された少なくとも1つのイメージが選択される場合、前記選択されたイメージで人物に適用されたアイテムを識別し、
    前記選択されたイメージと前記識別されたアイテムに関する情報を含んで構成されたページに対するビューア機能を提供すること
    を特徴とする、請求項11〜13のうちのいずれか一項に記載のコンピュータ装置。
  15. 前記少なくとも1つのプロセッサにより、
    調和イメージおよび前記調和イメージに含まれた商品アイテムに関する情報の関連付けを登録する段階、
    前記選択されたイメージと関連付けて登録された商品アイテムに関する情報に基づき、前記選択されたイメージで人物に適用されたアイテムを識別することを特徴とする、請求項14に記載のコンピュータ装置。
  16. 前記少なくとも1つのプロセッサにより、
    前記選択されたイメージおよび前記選択されたイメージを登録した商品提供者の商品アイテムのイメージを分析および比較し、前記選択されたイメージで人物に適用された前記商品提供者の商品アイテムを識別することを特徴とする、請求項14に記載のコンピュータ装置。
  17. 前記少なくとも1つのプロセッサにより、
    前記選択されたイメージおよび前記選択されたイメージを登録した商品提供者ではない他の商品提供者の商品アイテムのイメージを分析および比較し、前記選択されたイメージで人物に適用されたイメージと関連する他の商品提供者の商品アイテムを識別することを特徴とする、請求項14に記載のコンピュータ装置。
  18. 前記少なくとも1つのプロセッサにより、
    商品提供者によって登録される商品アイテムの商品イメージそれぞれにタグを設定および格納し、
    前記入力された検索語が含む調和キーワードとタグとの比較によって前記調和キーワードに対応する商品イメージを抽出することを特徴とする、請求項11〜17のうちのいずれか一項に記載のコンピュータ装置。
  19. 前記少なくとも1つのプロセッサにより、
    前記定義された複数の調和キーワードに対応するように分類された複数のタグ学習イメージに基づいて第2ディープラーニングモデルが入力されたイメージのタグを出力するように学習させ、
    前記学習された第2ディープラーニングモデルに基づいて前記登録される商品イメージそれぞれに対するタグを決定し、
    前記決定されたタグを対応する商品イメージに対して設定および格納すること
    を特徴とする、請求項18に記載のコンピュータ装置。
JP2018120577A 2018-01-31 2018-06-26 イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム Active JP6527275B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180012204A KR102043440B1 (ko) 2018-01-31 2018-01-31 이미지 내 복수의 객체들의 조화에 기반한 조화 검색 방법 및 시스템
KR10-2018-0012204 2018-01-31

Publications (2)

Publication Number Publication Date
JP6527275B1 JP6527275B1 (ja) 2019-06-05
JP2019133620A true JP2019133620A (ja) 2019-08-08

Family

ID=66730752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018120577A Active JP6527275B1 (ja) 2018-01-31 2018-06-26 イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム

Country Status (2)

Country Link
JP (1) JP6527275B1 (ja)
KR (1) KR102043440B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022153197A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報処理装置、情報処理方法及び情報処理プログラム
JP2022153195A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報表示装置、情報表示方法及び情報表示プログラム
JP2022153196A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報処理装置、情報処理方法及び情報処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114821030B (zh) * 2022-04-11 2023-04-04 苏州振旺光电有限公司 行星图像处理方法、系统以及装置
KR20240084192A (ko) * 2022-12-06 2024-06-13 삼성전자주식회사 이미지가 표시되는 캘린더 ui를 제공하는 전자 장치 및 그 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010016281A1 (ja) * 2008-08-08 2010-02-11 株式会社ニコン 検索支援システム、検索支援方法及び検索支援プログラム
JP2016071610A (ja) * 2014-09-30 2016-05-09 富士フイルム株式会社 コーディネート提案装置及び方法
WO2016152277A1 (ja) * 2015-03-25 2016-09-29 富士フイルム株式会社 リコメンド装置、リコメンドシステム、リコメンド方法、及びプログラム
JP2017220019A (ja) * 2016-06-07 2017-12-14 日本電信電話株式会社 画像検索装置、方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070077908A (ko) * 2006-01-25 2007-07-30 성희찬 인터넷 쇼핑몰의 운영방법
KR20110020104A (ko) * 2009-08-21 2011-03-02 유앤코드 주식회사 코디 검색 시스템 및 서비스 제공 방법
KR101818716B1 (ko) * 2011-09-27 2018-01-15 네이버 주식회사 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체
KR101768521B1 (ko) * 2016-05-02 2017-08-17 네이버 주식회사 이미지에 포함된 객체에 대한 정보 데이터를 제공하는 방법 및 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010016281A1 (ja) * 2008-08-08 2010-02-11 株式会社ニコン 検索支援システム、検索支援方法及び検索支援プログラム
JP2016071610A (ja) * 2014-09-30 2016-05-09 富士フイルム株式会社 コーディネート提案装置及び方法
WO2016152277A1 (ja) * 2015-03-25 2016-09-29 富士フイルム株式会社 リコメンド装置、リコメンドシステム、リコメンド方法、及びプログラム
JP2017220019A (ja) * 2016-06-07 2017-12-14 日本電信電話株式会社 画像検索装置、方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022153197A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報処理装置、情報処理方法及び情報処理プログラム
JP2022153195A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報表示装置、情報表示方法及び情報表示プログラム
JP2022153196A (ja) * 2021-03-29 2022-10-12 株式会社Zozo 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP6527275B1 (ja) 2019-06-05
KR20190092910A (ko) 2019-08-08
KR102043440B1 (ko) 2019-11-08

Similar Documents

Publication Publication Date Title
US11216861B2 (en) Color based social networking recommendations
US10242396B2 (en) Automatic color palette based recommendations for affiliated colors
US10963744B2 (en) Cognitive automated and interactive personalized fashion designing using cognitive fashion scores and cognitive analysis of fashion trends and data
US10043109B1 (en) Attribute similarity-based search
EP3267362B1 (en) Machine learning image processing
US10402917B2 (en) Color-related social networking recommendations using affiliated colors
US10861077B1 (en) Machine, process, and manufacture for machine learning based cross category item recommendations
US10360623B2 (en) Visually generated consumer product presentation
JP6527275B1 (ja) イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム
US9607010B1 (en) Techniques for shape-based search of content
US20200342320A1 (en) Non-binary gender filter
US20180181569A1 (en) Visual category representation with diverse ranking
US20160284007A1 (en) Information processing apparatus, information processing method, and recording medium
CN111784455A (zh) 一种物品推荐方法及推荐设备
KR20210098884A (ko) 사용자의 체형 및 구매 이력을 이용하여 패션 아이템 추천 서비스를 제공하는 방법
US9830534B1 (en) Object recognition
US11037071B1 (en) Cross-category item associations using machine learning
Zhao et al. Neo-fashion: A data-driven fashion trend forecasting system using catwalk analysis
CN111292168B (zh) 数据处理方法、装置及设备
US20210110464A1 (en) Visual search, discovery and attribution system
CN111767420A (zh) 一种生成服饰搭配数据的方法和装置
CN108764232B (zh) 标签位置获取方法及装置
Chi et al. UbiShop: Commercial item recommendation using visual part-based object representation
KR20200058343A (ko) 쇼핑 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램
US20230214894A1 (en) Curated collections from multiple input sources

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180626

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20180626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190509

R150 Certificate of patent or registration of utility model

Ref document number: 6527275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250