JP2022506493A - イメージの彩色完成方法、その装置及びそのコンピュータプログラム、並びに人工神経網学習方法、その装置及びそのコンピュータプログラム - Google Patents

イメージの彩色完成方法、その装置及びそのコンピュータプログラム、並びに人工神経網学習方法、その装置及びそのコンピュータプログラム Download PDF

Info

Publication number
JP2022506493A
JP2022506493A JP2021523890A JP2021523890A JP2022506493A JP 2022506493 A JP2022506493 A JP 2022506493A JP 2021523890 A JP2021523890 A JP 2021523890A JP 2021523890 A JP2021523890 A JP 2021523890A JP 2022506493 A JP2022506493 A JP 2022506493A
Authority
JP
Japan
Prior art keywords
image
hue
question
region
colored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021523890A
Other languages
English (en)
Other versions
JP7328331B2 (ja
Inventor
カン,サンミン
チャン,ジェヒョク
Original Assignee
ネイバーウェブトゥーン リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ネイバーウェブトゥーン リミテッド filed Critical ネイバーウェブトゥーン リミテッド
Publication of JP2022506493A publication Critical patent/JP2022506493A/ja
Application granted granted Critical
Publication of JP7328331B2 publication Critical patent/JP7328331B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

イメージ内の色相未知領域に係わる質疑、及び該質疑に対する返答に基づき、イメージの彩色を完成させる方法は、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成する段階と、人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成する段階と、第1色相質疑、第1色相質疑に対する第1返答、及び第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成する段階と、を含むのである。

Description

本発明は、イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる方法、その装置及びそのコンピュータプログラムと、イメージ内の色相未知領域のうち少なくとも一部領域を彩色し、前記未知領域において、前記一部領域を除いた残り領域の色相に係わる質疑を生成する人工神経網を学習させる方法、その装置及びそのコンピュータプログラムと、に関する。
コンピュータを始めとする多様なスマート機器の普及により、現代においては、オンライン網を利用したサービス、特に、オンラインを介してコンテンツを提供するサービスが提供されている。
オンラインにおいて漫画コンテンツを提供するウェブトゥーンサービスが、そのようなサービスの代表的な例示である。
従来技術によれば、そのような漫画コンテンツ制作のために、制作者が全ての場面を個別的に作成した。しかし、今日、そのような方式によるコンテンツ制作速度は、オンラインコンテンツ市場の拡大速度、及びそれによるユーザ数の増加速度に追いつけず、円滑なコンテンツ供給を妨害する要素として作用する。
従って、さらに効率的なウェブトゥーンコンテンツ制作方法の必要性がイッシューになっている。
本発明は、オンラインコンテンツをさらに効率的に制作することを可能にするものである。
特に、本発明は、ウェブトゥーンのようなユーザの彩色が必要なコンテンツ制作において、ユーザが彩色に使用する時間を節減させることにより、コンテンツをさらに迅速に時間内に制作させるものである。
また本発明は、ユーザによらないイメージの自動彩色において、さらに正確な彩色を介し、ユーザ修正による作業時間を節減させるものである。
さらに、本発明は、ユーザによらないイメージの自動彩色において、色相が確かではない部分の色相をユーザに質疑することにより、自動彩色の短所を補完するものである。
本発明の一実施形態による、イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる方法は、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成する段階と、前記人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成する段階と、前記第1色相質疑、前記第1色相質疑に対する第1返答、及び前記第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成する段階と、を含んでもよい。
前記イメージの彩色を完成させる方法は、前記第二次イメージを生成する段階後、前記人工神経網を利用し、前記第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成する段階と、前記人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成する段階と、前記第一次イメージ、前記第2色相質疑、前記第2色相質疑に対する第2返答、及び前記第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成する段階と、をさらに含んでもよい。
前記第1返答は、前記第1色相質疑に対応するユーザの入力に基づいても決定され、前記第2返答は、前記第2色相質疑に対応する前記ユーザの入力に基づいても決定される。
前記人工神経網は、前記第二次イメージ内の少なくとも1つの色相未知領域それぞれに係わる未知の程度を生成し、前記第2色相質疑を生成する段階は、前記第二次イメージ内の少なくとも1つの色相未知領域において、前記未知の程度が所定条件を満足する未知領域の色相に係わる質疑を、第2色相質疑として生成することができる。
前記イメージの彩色を完成させる方法は、第2時点における第二次イメージを、前記第2時点以前の第1時点における第三次イメージと同一に生成し、前記第2中間イメージを生成する段階、前記第2色相質疑を生成する段階、及び前記第三次イメージを生成する段階を反復して遂行し、全領域が彩色された完成イメージを生成することができる。
前記人工神経網は、第1領域が彩色されていない入力イメージと、前記第1領域が彩色された出力イメージとの対応関係を学習した神経網でもある。
前記人工神経網は、前記入力イメージと、前記入力イメージの彩色された第2領域に係わる第3色相質疑と、前記第3色相質疑に対する第3返答と、前記出力イメージと、前記出力イメージに係わる第4色相質疑との対応関係をさらに学習した神経網でもある。このとき、該第2領域は、前記入力イメージの前記第3色相質疑及び前記第3返答によって彩色された領域でもある。
本発明の一実施形態による、イメージ内の色相未知領域のうち少なくとも一部領域を彩色し、前記未知領域において、前記一部領域を除いた残り領域の色相に係わる質疑を生成する人工神経網を学習させる方法は、第1領域が彩色されていない入力イメージ、及び前記入力イメージにおいて、前記第1領域が第1色相に彩色された出力イメージを利用し、前記第1領域と前記第1色相との対応関係が反映されるように、前記人工神経網を学習させる第1学習段階と、前記入力イメージ、前記入力イメージの彩色された第2領域に係わる第3色相質疑、前記第3色相質疑に対する第3返答、前記出力イメージ、及び前記出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、前記人工神経網を学習させる第2学習段階と、を含んでもよい。
前記第3返答は、前記入力イメージの前記第2領域の平均色相に基づいても決定される。
本発明の一実施形態による、イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる装置において、前記装置は、プロセッサを含み、前記プロセッサは、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成し、前記人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成し、前記第1色相質疑、前記第1色相質疑に対する第1返答、及び前記第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成することができる。
前記プロセッサは、前記人工神経網を利用し、前記第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成し、前記人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成し、前記第一次イメージ、前記第2色相質疑、前記第2色相質疑に対する第2返答、及び前記第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成することができる。
前記第1返答は、前記第1色相質疑に対応するユーザの入力に基づいても決定され、前記第2返答は、前記第2色相質疑に対応する前記ユーザの入力に基づいても決定される。
前記人工神経網は、前記第二次イメージ内の少なくとも1つの色相未知領域それぞれに係わる未知の程度を生成し、前記プロセッサは、前記第二次イメージ内の少なくとも1つの色相未知領域において、前記未知の程度が所定条件を満足する未知領域の色相に係わる質疑を、第2色相質疑として生成することができる。
前記プロセッサは、第2時点における第二次イメージを、前記第2時点以前の第1時点における第三次イメージと同一に生成し、前記第2中間イメージを生成する段階、前記第2色相質疑を生成する段階、及び前記第三次イメージを生成する段階を反復して遂行し、全領域が彩色された完成イメージを生成することができる。
前記人工神経網は、第1領域が彩色されていない入力イメージと、前記第1領域が彩色された出力イメージとの対応関係を学習した神経網でもある。
前記人工神経網は、前記入力イメージと、前記入力イメージの彩色された第2領域に係わる第3色相質疑と、前記第3色相質疑に対する第3返答と、前記出力イメージと、前記出力イメージに係わる第4色相質疑との対応関係をさらに学習した神経網でもある。このとき、前記第2領域は、前記入力イメージの前記第3色相質疑及び前記第3返答によって彩色された領域でもある。
本発明の一実施形態による、イメージ内の色相未知領域のうち少なくとも一部領域を彩色し、前記未知領域において、前記一部領域を除いた残り領域の色相に係わる質疑を生成する人工神経網を学習させる装置において、前記装置は、プロセッサを含み、前記プロセッサは、第1領域が彩色されていない入力イメージ、及び前記入力イメージにおいて、前記第1領域が第1色相に彩色された出力イメージを利用し、前記第1領域と前記第1色相との対応関係が反映されるように、前記人工神経網を学習させ、前記入力イメージ、前記入力イメージの彩色された第2領域に係わる第3色相質疑、前記第3色相質疑に対する第3返答、前記出力イメージ、及び前記出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、前記人工神経網を学習させることができる。
前記第3返答は、前記入力イメージの前記第2領域の平均色相に基づいても決定される。
本発明によれば、オンラインコンテンツをさらに効率的に制作することができる。特に、ウェブトゥーンのようなユーザの彩色が必要なコンテンツ制作において、ユーザが彩色に使用する時間を節減させることにより、該コンテンツをさらに迅速に時間内に制作することができるようにする。
また、ユーザによらないイメージの自動彩色において、さらに正確な彩色を介し、ユーザ修正による作業時間を節減させることができ、さらには、色相が確かではない部分の色相をユーザに質疑することにより、自動彩色の短所を補完することができる。
本発明の一実施形態によるネットワーク環境の例を図示した図面である。 本発明の一実施形態において、ユーザ端末100及びサーバ200の内部構成について説明するためのブロック図である。 プロセッサ212によって学習された例示的な人工神経網の構造について説明するための図面である。 第一次イメージの例示を図示した図面である。 プロセッサ212が、図4の第一次イメージから生成した第1中間イメージの例示を図示した図面である。 本発明の一実施形態による、プロセッサ212が、図4の第一次イメージから生成した第1色相質疑の例示を図示した図面である。 ユーザが、ユーザ端末100に入力した第1返答の例示を図示した図面である。 第二次イメージの例示を図示した図面である。 全領域の彩色された完了した完成イメージの例示を図示した図面である。 プロセッサ212が完成イメージを生成する過程について説明するための図面である。 本発明の一実施形態による、プロセッサ212が入力イメージから完成イメージを生成する一連の過程において生成されるイメージ及び返答を図示した図面である。 本発明の一実施形態による、サーバ200によって遂行されるイメージの彩色を完成させる方法について説明するためのフローチャートである。 本発明の一実施形態による、サーバ200によって遂行される人工神経網学習方法について説明するためのフローチャートである。
本発明の一実施形態による、イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる方法は、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成する段階と、前記人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成する段階と、前記第1色相質疑、前記第1色相質疑に対する第1返答、及び前記第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成する段階と、を含んでもよい。
後述する本発明に係わる詳細な説明は、本発明が実施されうる特定実施形態を例示として図示する添付図面を参照する。そのような実施形態は、当業者が、本発明を実施するにおいて十分になりうるように詳細に説明される。本発明の多様な実施形態は、互いに異なるが、相互排他的である必要はないということが理解されなければならない。例えば、本明細書に記載されている特定の形状、構造及び特性は、本発明の精神と範囲とを外れずに、一実施形態から他の実施形態に変更されても具現される。また、それぞれの実施形態内の個別構成要素の位置または配置も、本発明の精神と範囲とを外れずに変更されうると理解されなければならない。従って、後述する詳細な説明は、限定的な意味としてなされるものではなく、本発明の範囲は、特許請求の範囲の請求項が請求する範囲、及びそれと均等な全ての範囲を包括するものであると受け止められなければならない。図面において、類似した参照符号は、さまざまな側面にわたり、同一であるか、あるいは類似した構成要素を示す。
以下においては、本発明が属する技術分野において当業者が、本発明を容易に実施することができるようにするために、本発明のさまざまな実施形態について、添付された図面を参照して詳細に説明する。
図1は、本発明の一実施形態によるネットワーク環境の例を図示した図面である。
図1のネットワーク環境は、複数のユーザ端末101,102,103,104、サーバ200及びネットワーク300を含む例を示している。そのような図1は、発明の説明のための一例であり、ユーザ端末数やサーバ数も、図1のように限定されるものではない。
複数のユーザ端末101,102,103,104は、ユーザ操作により、彩色を完成させようとするイメージをサーバ200に伝送し、サーバ200から彩色と係わる質疑、一部分が彩色されたイメージ、及び彩色が完了されたイメージを受信することができる。
複数のユーザ端末101,102,103,104は、コンピュータ装置で具現される固定型端末や移動型端末でもある。複数のユーザ端末101,102,103,104の例えば、スマートフォン、携帯電話、ナビゲーション、コンピュータ、ノート型パソコン、デジタル放送用端末、PDA(personal digital assistant)、PMP(portable
multimedia player)、タブレットPC(personal computer)などがある。
複数のユーザ端末101,102,103,104は、無線または有線の通信方式を利用し、ネットワーク300を介し、複数のユーザ端末101,102,103,104相互間、及び/またはサーバ200と通信することができる。
一方、複数のユーザ端末101,102,103,104の通信方式は、制限されるものではなく、ネットワーク300が含むい通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を活用する通信方式だけではなく、機器間の近距離無線通信も含まれる。
例えば、ネットワーク300は、PAN(personal
area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area
network)、WAN(wide area network)、BBN(broadband network)、インターネットのようなネットワークのうち1以上の任意ネットワークを含んでもよい。
また、ネットワーク300は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター・バスネットワーク、ツリーネットワークまたは階層的(hierarchical)ネットワークなどを含むネットワークトポロジーのうち、任意の1以上を含んでもよいが、それらに制限されるものではない。
以下においては、説明の便宜のために、複数のユーザ端末101,102,103,104をユーザ端末100と命名して説明する。
サーバ200は、前述のユーザ端末100から、彩色しようとするイメージを受信し、学習された人工神経網を利用し、イメージを彩色することができる。また、サーバ200は、イメージ彩色過程において、イメージ内の色相未知領域に係わる質疑を生成し、ユーザ端末100に伝送することもできる。それに係わる詳細な説明は、後述する。
サーバ200は、ネットワーク300を介し、ユーザ端末100に、命令、コード、ファイル、コンテンツ、サービスなどを提供するコンピュータ装置、または複数のコンピュータ装置によっても具現される。
図2は、本発明の一実施形態において、ユーザ端末100及びサーバ200の内部構成について説明するためのブロック図である。
ユーザ端末100とサーバ200は、メモリ111,211、プロセッサ112,212、通信モジュール113,213及び入出力インターフェース114,214を含んでもよい。
メモリ111,211は、コンピュータで読み取り可能な記録媒体であり、RAM(random
access memory)、ROM(read
only memory)、及びディスクドライブのような非消滅性大容量記録装置(permanent mass storage device)を含んでもよい。
また、メモリ111,211には、オペレーションシステム(OS)と、少なくとも1つのプログラムコード(一例として、ユーザ端末100にインストールされ、サーバ200とのデータ送受信を介してイメージを彩色するプログラムのためのコード)とが保存されうる。
そのようなソフトウェア構成要素は、ドライブメカニズム(drive
mechanism)を利用し、メモリ111,211とは別途のコンピュータで読み取り可能な記録媒体からもローディングされる。そのような別途のコンピュータで読み取り可能な記録媒体は、フロッピィードライブ、ディスク、テープ、DVD(digital
versatile disc)/CD-ROM(compact
disc read only memory)ドライブ、メモリカードのようなコンピュータで読み取り可能な記録媒体を含んでもよい。
他の実施形態において、該ソフトウェア構成要素は、コンピュータで読み取り可能な記録媒体ではなく、通信モジュール113,213を介し、メモリ111,211にローディングされうる。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システム(一例として、前述のサーバ200)が、ネットワーク300を介して提供するファイルによってインストールされるプログラムに基づき、メモリ111,211にもローディングされる。
プロセッサ112,212は、基本的な算術、ロジック及び入出力演算を行うことにより、コンピュータプログラムの命令を処理するようにも構成される。該命令は、メモリ111,211または通信モジュール113,213により、プロセッサ112,212にも提供される。例えば、プロセッサ112,212は、メモリ111,211のような記録装置に保存されたプログラムコードによって受信される命令を実行するようにも構成される。
通信モジュール113,213は、ネットワーク300を介し、ユーザ端末100とサーバ200とが互いに通信するための機能を提供することができ、他のユーザ端末(図示せず)、または他のサーバ(図示せず)と通信するための機能を提供することができる。一例として、ユーザ端末100のプロセッサ112が、メモリ111のような記録装置に保存されたプログラムコードによって生成した要請が、通信モジュール113の制御により、ネットワーク300を介し、サーバ200に伝達することができる。逆に、サーバ200のプロセッサ212の制御によって提供される制御信号、命令、コンテンツ、ファイルなどが、通信モジュール213とネットワーク300とを経て、ユーザ端末100の通信モジュール113を介し、ユーザ端末100にも受信される。
入出力インターフェース114,214は、入出力装置115とのインターフェースのための手段でもある。このとき、入力装置は、例えば、キーボードまたはマウスのような装置を含み、出力装置は、イメージを表示するためのディスプレイのような装置を含んでもよい。他の例として、入出力インターフェース114,214は、タッチスクリーンのように、入力と出力とのための機能が一つに統合された装置とのインターフェースのための手段でもある。
また、他の実施形態において、ユーザ端末100及びサーバ200は、図2の構成要素よりさらに多くの構成要素を含むのである。しかし、ほとんどの従来技術的構成要素を明確に図示する必要性はない。例えば、ユーザ端末100は、前述の入出力装置115のうち少なくとも一部を含むように具現されるか、あるいはトランシーバ(transceiver)、GPS(global positioning system)モジュール、カメラ、各種センサ、データベースのような他の構成要素をさらに含んでもよい。
本発明の一実施形態による、サーバ200のプロセッサ212は、人工神経網を利用し、イメージ内の色相未知領域に係わる色相を決定するか、あるいは色相未知領域に係わる質疑を生成することができる。
本発明において「人工神経網」は、彩色が完了されていないイメージを彩色するために学習された神経網であり、マシンラーニング(machine learning)技法またはディープラーニング(deep
learning)技法によって学習されたものでもある。
図3は、プロセッサ212によって学習された例示的な人工神経網の構造について説明するための図面である。
本発明の一実施形態による人工神経網は、合成積神経網(CNN:convolutional neural network)モデルによる神経網でもある。このとき、CNNモデルは、複数の演算レイヤ(convolutional layer、pooling layer)を交互に実行し、最終的には、入力データの特徴抽出に使用される階層モデルでもある。
本発明の一実施形態によるプロセッサ212は、学習データを、指導学習(supervised learning)技法によって処理し、神経網モデルを構築したり学習させたりすることができる。このとき、学習データには、第1領域が彩色されていない入力イメージ、入力イメージで彩色された第2領域に係わる第3色相質疑、そのような第3色相質疑に対する返答、入力イメージにおいて、第1領域が彩色された出力イメージ、及び出力イメージの色相が彩色されていない領域の色相に係わる質疑である第4色相質疑を含んでもよい。従って、プロセッサ212は、彩色しようとする領域が彩色されていないイメージと、当該領域が彩色されたイメージと、を含む学習データに基づき、人工神経網を学習させることができる。そのような学習データに基づいて学習された人工神経網は、後述する第1中間イメージ及び/または第2中間イメージの生成にも使用される。
また、プロセッサ212は、イメージ内において、すでに彩色された領域の彩色に使用された色相質疑と、それに対する返答と、イメージ内の他の領域に係わる色相質疑と、を含む学習データに基づき、人工神経網を学習させることができる。そのような学習データに基づいて学習された人工神経網は、後述する出力イメージに係わる第4色相質疑の生成にも使用される。
図3には、プロセッサ212が学習データを利用して構築した神経網モデルの例示的な構造が図示されている。プロセッサ212は、学習データに含まれる入力イメージ、入力イメージの彩色された第2領域に係わる第3色相質疑、及び第3色相質疑に対する第3返答それぞれの特徴値を抽出するためのコンボリューションレイヤ(convolution layer)と、抽出された特徴値を結合し、特徴マップを構成するプーリングレイヤ(pooling layer)と、を生成することができる。
また、プロセッサ212は、生成された特徴マップを結合し、入力イメージ内の色相未知領域それぞれに係わる未知の程度を推定し、入力イメージ内の少なくとも一部領域に係わる色相を決定し、入力イメージ内の他の一部領域に係わる質疑を生成する準備を行うフリーコネクティッドレイヤ(fully connected layer)を生成することができる。
最後に、プロセッサ212は、入力イメージ内の未知領域それぞれに係わる未知の程度、入力イメージ内の少なくとも一部領域に係わる色相、及び入力イメージ内の他の一部領域に係わる質疑を含むアウトプットレイヤ(output layer)を算出することができる。
図3に図示された例示においては、入力イメージが5X7形態のブロックに分けられ、コンボリューションレイヤ生成に、5X3形態の単位ブロックが使用され、プーリングレイヤ生成に、1X4形態または1X2形態の単位ブロックが使用されるように図示されているが、それらは、例示的なものであり、本発明の思想は、それらに限定されるものではない。従って、各レイヤ生成に使用されるイメージブロックの大きさは、多様にも設定される。
そのような人工神経網は、前述のメモリ211に、人工神経網を構成する少なくとも1つのノードの係数、ノードの加重値、及び人工神経網を構成する複数のレイヤとの関係を定義する関数係数の形態によっても保存される。ここで、人工神経網の構造も、メモリ211に、ソースコード及び/またはプログラムの形態によっても保存されるということは、言うまでもない。
プロセッサ212が、学習データを利用し、前述の神経網を学習させる過程についてさらに詳細に説明すれば、プロセッサ212は、第1領域が彩色されていない入力イメージ、及びそのような入力イメージにおいて、第1領域が第1色相に彩色された出力イメージを利用し、第1領域と第1色相との対応関係が反映されるように、人工神経網を学習(以下、第1学習)させることができる。このとき、該入力イメージと該出力イメージは、いずれも学習データに、1つのトレーニングセット(training set)として含まれるイメージでもある。また、該第1領域は、入力イメージ内において彩色されていない任意領域を意味しうる。
換言すれば、プロセッサ212は、彩色が完了されたイメージと、彩色が完了されていないイメージとを利用し、所定の形態特徴と、所定の色相とが対応するように、人工神経網を学習させることができる。
なお、本発明において、人工神経網をー学習させること」は、人工神経網を構成する少なくとも1つのノードの係数、ノードの加重値、及び/または人工神経網を構成する複数のレイヤとの関係を定義する関数係数を更新することを意味しうる。
プロセッサ212は、入力イメージ、入力イメージの彩色された第2領域に係わる第3色相質疑、第3色相質疑に対する第3返答、入力イメージにおいて、第1領域が第1色相に彩色された出力イメージ、及び出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、人工神経網を学習(以下、第2学習)させることができる。このとき、該入力イメージ、該第3色相質疑、該出力イメージ及び該第4色相質疑は、いずれも学習データに、1つのトレーニングセットとして含まれるのである。一方、プロセッサ212は、入力イメージの第2領域の平均色相に基づき、第3返答を決定することができる。
換言すれば、プロセッサ212は、少なくとも一部がさらに彩色されたイメージの色相未知領域に係わる質疑と、少なくとも一部があまり彩色されていないイメージの彩色された領域の彩色に使用された質疑、及びそれらに対する返答を対応させるように、人工神経網を学習させることができる。
まお、前述の第1学習と第2学習は、説明の便宜のために、先後関係を区分したものに過ぎず、プロセッサ212により、第2学習が第1学習より先行しても遂行され、第1学習と第2学習とが同時にも遂行される。
以下においては、以上で説明された人工神経網が、プロセッサ212によって学習されていることを前提に、プロセッサ212がイメージの彩色を完成させる方法について説明する。
本発明の一実施形態によるプロセッサ212は、彩色しようとするイメージを獲得することができる。例えば、プロセッサ212は、前述のユーザ端末100から、彩色しようとする第一次イメージを受信することもでき、サーバ200内のメモリ211から、彩色しようとする第一次イメージを読み取ることもできる。
本発明において、「彩色しようとするイメージ」、「第一次イメージ」または「入力イメージ」は、少なくとも一部領域が彩色されておらず、彩色されていない領域に彩色が必要なイメージを意味しうる。例えば、彩色しようとするイメージは、アウトライン(または、スケッチ)だけを含むイメージであり、彩色された領域を全く含まないイメージでもある。
図4は、第一次イメージの例示を図示した図面である。
前述のように、第一次イメージは、少なくとも一部領域が彩色されておらず、彩色が必要なイメージを意味しうる。そのような第一次イメージは、図4に図示されているように、漫画の一場面でもあり、ポスター、イラストのような多種のイメージでもある。以下においては、説明の便宜のために、図4に図示されたイメージを第一次イメージの例示として使用して説明する。
本発明の一実施形態によるプロセッサ212は、前述の人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成することができる。
前述のように、人工神経網は、彩色が完了されたイメージと、彩色が完了されていないイメージと、を利用し、所定形態特徴と所定色相とが対応するようにも学習される。従って、プロセッサ212は、そのような人工神経網を利用し、第一次イメージの少なくとも一部領域を彩色することができる。
図5は、プロセッサ212が、図4の第一次イメージから生成した第1中間イメージの例示を図示した図面である。
プロセッサ212は、図5に図示されているように、図4の第一次イメージの一部領域311,312が彩色された第1中間イメージを生成することができる。
本発明の一実施形態によるプロセッサ212は、第一次イメージを複数の領域に区分し、各領域が、複数の色相それぞれに彩色される確率を算出することができる。例えば、プロセッサ212は、第一次イメージから、輪郭線成分を検出し、該輪郭線を基準に、第一次イメージを複数領域に区分し、各領域が、複数の色相それぞれに彩色される確率を算出することができる。
プロセッサ212は、各領域が、複数の色相それぞれに彩色される確率を算出するにおいて、前述の人工神経網を使用することができる。例えば、プロセッサ212は、領域312につき、当該領域312が青色に彩色される確率を95%と、赤色に彩色される確率を13%と、緑色に彩色される確率を32%と算出することができる。
プロセッサ212は、特定領域に特定色相を彩色する確率が、所定の臨界確率以上である場合、当該領域を、当該色相で彩色すると決定することができる。例えば、該臨界確率が90%であり、領域312が青色に彩色される確率が95%である場合、プロセッサ212は、領域312を青色で彩色するように決定することができる。
ただし、前述の色相種類及び臨界確率は、例示的なものであり、本発明の思想は、それに限定されるものではない。
選択的実施形態において、プロセッサ212は、各領域が複数の色相それぞれに彩色される確率に基づき、各領域に係わる色相未知程度を算出することができる。例えば、プロセッサ212は、最も高い彩色確率を有する色相の確率に対応するように、当該領域の色相未知程度を算出することができる。ここで、プロセッサ212は、全部または一部の色相の彩色確率平均値に対応するように、当該領域の色相未知程度を算出することもできるということは、言うまでもない。算出された色相未知程度は、前述の第1中間イメージを生成するのにも使用され、後述する第1色相質疑を生成するのにも使用される。
プロセッサ212は、人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成することができる。例えば、プロセッサ212は、第一次イメージ内の複数の領域のうち、いずれか1つの領域を選択する方式により、質疑を生成することができる。
図6は、本発明の一実施形態による、プロセッサ212が、図4の第一次イメージから生成した第1色相質疑の例示を図示した図面である。
例えば、プロセッサ212が領域321が色相未知領域であると判断した場合、プロセッサ212は、図6のような質疑イメージを生成することができる。
プロセッサ212によって生成された質疑イメージは、前述のユーザ端末100に伝達され、ユーザに対する返答要請にも使用される。
ユーザは、質疑イメージを参照し、当該領域321の色相に対する返答、すなわち、第1返答をユーザ端末100に入力することができる。例えば、ユーザは、複数の色相のうちいずれか1つの色相を選択する方式により、第1返答をユーザ端末100に入力することができる。ユーザ端末100に入力された第1返答は、サーバ200に伝送され、後述する第二次イメージ生成にも使用される。
図7は、ユーザが、ユーザ端末100に入力した第1返答の例示を図示した図面である。
例えば、プロセッサ212が、図6のような質疑イメージを生成し、ユーザ端末100に伝送した場合、ユーザは、質疑対象になる領域321の色相を、図7のように選択することができる。ユーザによって選択された色相、すなわち、第1返答は、前述のように、サーバ200に伝送され、第二次イメージ生成にも使用される。
なお、本発明の一実施形態によるプロセッサ212は、前述のように、第一次イメージ内の各領域が、複数の色相それぞれに彩色される確率に基づき、各領域に係わる色相未知程度を算出することができる。プロセッサ212は、第一次イメージ内の少なくとも1つの色相未知領域のうち、算出された未知の程度が所定条件を満足する色相未知領域を選択し、選択された領域の色相に係わる質疑を第1色相質疑として生成することができる。例えば、プロセッサ212は、色相未知程度が最大である領域を選択し、当該領域の色相に係わる質疑を、第1色相質疑として生成することができる。
本発明の一実施形態によるプロセッサ212は、前述の過程によって生成された第1色相質疑、ユーザ端末100から受信した第1色相質疑に対する第1返答、及び第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成することができる。
例えば、プロセッサ212は、第一次イメージを含むレイヤ、第1色相質疑に対応し、第1返答によって彩色される領域の情報を含むレイヤ、第1返答に対応して彩色される領域の彩色情報を含むレイヤ、及び第1中間イメージを含むレイヤそれぞれを生成することができる。また、プロセッサ212は、生成されたレイヤを併合することにより、第二次イメージを生成することができる。
このとき、プロセッサ212は、前述のレイヤ間の加重値を反映させて併合することもでき、レイヤ間の優先順位を反映させて併合することもできる。該加重値または該優先順位は、人工神経網によっても決定される。
図8は、第二次イメージの例示を図示した図面である。
図8に図示されているように、、図5ないし図7で説明された過程により、第二次イメージ内の一部領域311,312,321が彩色され、残り一部領域331,332,333,334,335は、彩色されていない状態でもある。
本発明の一実施形態によるプロセッサ212は、図4ないし図8で説明された方法を図8の第二次イメージに対して反復的に遂行することにより、図9のように全領域311,312,321,331,332,333,334,335が彩色された完成イメージを生成することができる。
以下においては、図10を参照し、プロセッサ212が完成イメージを生成する過程についてさらに説明する。
第一次イメージから第二次イメージを生成する過程
本発明の一実施形態によるプロセッサ212は、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成することができる(図5参照)。
また、プロセッサ212は、人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成することができる(図6参照)。
プロセッサ212によって生成された質疑(または、質疑イメージ)は、前述のユーザ端末100に伝達され、ユーザに対す返答要請にも使用される。ユーザ端末100に入力された第1返答は、サーバ200に伝送され、第二次イメージ生成にも使用される(図7参照)。
本発明の一実施形態によるプロセッサ212は、前述の過程によって生成された第1色相質疑、ユーザ端末100から受信した第1色相質疑に対する第1返答、及び第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成することができる。
例えば、プロセッサ212は、第一次イメージを含むレイヤ、第1色相質疑に対応し、第1返答によって彩色される領域の情報を含むレイヤ、第1返答に対応して彩色される領域の彩色情報を含むレイヤ、及び第1中間イメージを含むレイヤそれぞれを生成することができる。また、プロセッサ212は、生成されたレイヤを併合することにより、第二次イメージを生成することができる(図8参照)。
このとき、プロセッサ212は、前述のレイヤ間の加重値を反映させて併合することもでき、レイヤ間の優先順位を反映させて併合することもできる。該加重値または該優先順位は、人工神経網によっても決定される。
第二次イメージから第三次イメージを生成する過程
本発明の一実施形態によるプロセッサ212は、人工神経網を利用し、第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成することができる。例えば、プロセッサ212は、図8に図示された第二次イメージにおいて、彩色されていない領域である領域331がさらに彩色された第2中間イメージを生成することができる。
また、プロセッサ212は、人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成することができる。例えば、プロセッサ212は、図8に図示された第二次イメージで彩色されていない領域である領域334に係わる第2色相質疑を生成することができる。
プロセッサ212によって生成された質疑(または、質疑イメージ)は、前述のユーザ端末100に伝達され、ユーザに対する返答要請にも使用される。ユーザ端末100に入力された第2返答は、サーバ200に伝送され、第三次イメージ生成にも使用される。
本発明の一実施形態によるプロセッサ212は、第一次イメージ、前述の過程によって生成された第2色相質疑、ユーザ端末100から受信した第2色相質疑に対する第2返答、及び第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成することができる。
例えば、プロセッサ212は、第一次イメージを含むレイヤ、第2色相質疑に対応し、第2返答によって彩色される領域の情報を含むレイヤ、第2返答に対応して彩色される領域の彩色情報を含むレイヤ、及び第2中間イメージを含むレイヤそれぞれを生成することができる。また、プロセッサ212は、生成されたレイヤを併合することにより、第三次イメージを生成することができる。
このとき、プロセッサ212は、前述のレイヤ間の加重値を反映させて併合することもでき、レイヤ間の優先順位を反映させて併合することもできる。該加重値または該優先順位は、人工神経網によっても決定されることでもある。
完成イメージを生成する過程
本発明の一実施形態によるプロセッサ212は、生成された第三次イメージにつき、前述の過程を反復して遂行することにより、全領域が彩色された完成イメージを生成することができる。例えば、プロセッサ212は、第2時点における第二次イメージを、第2時点以前の第1時点における第三次イメージと同一に生成することができる。換言すれば、プロセッサ212は、以前時点の第三次イメージを、現在時点の第二次イメージと見なすことができる。
次に、プロセッサ212は、そのような第二次イメージにつき、前述の第2中間イメージを生成する過程、第2色相質疑を生成する過程、及び第三次イメージを生成する過程を反復して遂行することにより、図9のように、全領域311,312,321,331,332,333,334,335が彩色された完成イメージを生成することができる。
なお、本発明の一実施形態によるプロセッサ212は、前述の反復遂行の回数を、所定臨界回数未満に設定することができる。例えば、プロセッサ212は、反復遂行の回数を5回にで設定することができる。
設定された臨界反復回数条件の充足は、プロセッサ212が、人工神経網の出力に基づき、特定領域を自動的に彩色するか否かということを決定する臨界確率、及び/または色相未知領域に係わる色相質疑を行うか否かということを決定する所定条件を適切に調節することによっても達成される。
図11は、本発明の一実施形態による、プロセッサ212が、入力イメージから完成イメージを生成する一連の過程において生成されるイメージ及び返答を図示した図面である。
説明の便宜のために、t=1である時点において、入力イメージ(または、第一次イメージ)が入力され、1単位で時点が増大すると仮定する。
前述の仮定下において、t=1である時点において、本発明の一実施形態によるプロセッサ212は、第一次イメージに係わる第1色相質疑イメージを生成することができ、それに対する第1返答を獲得することができる。プロセッサ212は、第一次イメージ、第1色相質疑、第1色相質疑に対する第1返答、及び第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成することができる。
t=2である時点において、本発明の一実施形態によるプロセッサ212は、生成された第二次イメージに係わる第2色相質疑イメージを生成することができ、それに対する第2返答を獲得することができる。プロセッサ212は、第一次イメージ、第2色相質疑、第2色相質疑に対する第2返答、及び第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成することができる。
t=3である時点において、本発明の一実施形態によるプロセッサ212は、t=2である時点において、おける第三次イメージを第二次イメージにして、そのような第二次イメージに係わる第2色相質疑イメージを生成することができ、それに対する第2返答を獲得することができる。プロセッサ212は、第一次イメージ、第2色相質疑、第2色相質疑に対する第2返答、及び第2中間イメージのうち少なくとも一つに基づき、新たな第三次イメージを生成することができる。
プロセッサ212は、そのような第二次イメージにつき、前述の第2中間イメージを生成する段階、第2色相質疑を生成する段階、及び第三次イメージを生成する段階を反復して遂行することにより、図9のように、全領域311,312,321,331,332,333,334,335が彩色された完成イメージを生成することができる。
なお、プロセッサ212は、第2色相質疑内容がそれ以上存在しない場合、前述の反復を中断することができる。例えば、プロセッサ212は、t=6である時点の質疑イメージのように、質疑に何らの内容が含まれていない場合、イメージの彩色が完成されたと判断し、前述の反復遂行を中断することができる。
そのように、本発明は、イメージ彩色において、ユーザの努力を軽減させることができる。
図12は、本発明の一実施形態による、サーバ200によって行われるイメージの彩色を完成させる方法について説明するためのフローチャートである。以下においては、図1ないし図11を共に参照して説明するが、図1ないし図11で説明された内容と重複する内容の説明は、省略する。
本発明の一実施形態によるサーバ200は、人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージ(図5参照)を生成することができる(S81)。
また、サーバ200は、人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑(図6参照)を生成し、第1色相質疑に対する返答(図7参照)を獲得することができる(S82)。それについてさらに詳細に説明すれば、サーバ200によって生成された質疑(または、質疑イメージ)は、前述のユーザ端末100に伝達され、ユーザに対する返答要請にも使用される。ユーザ端末100に入力された第1返答は、サーバ200に伝送され、後述する第二次イメージの生成にも使用される。
本発明の一実施形態によるサーバ200は、前述の過程によって生成された第1色相質疑、ユーザ端末100から受信した第1色相質疑に対する第1返答、及び第1中間イメージのうち少なくとも一つに基づき、第二次イメージ(図8参照)を生成することができる(S83)。
例えば、サーバ200は、第一次イメージを含むレイヤ、第1色相質疑に対応し、第1返答によって彩色される領域の情報を含むレイヤ、第1返答に対応して彩色される領域の彩色情報を含むレイヤ、及び第1中間イメージを含むレイヤそれぞれを生成することができる。また、サーバ200は、生成されたレイヤを併合することにより、第二次イメージを生成することができる。
このとき、サーバ200は、前述のレイヤ間の加重値を反映させて併合することもでき、レイヤ間の優先順位を反映させて併合することもできる。該加重値または該優先順位は、人工神経網によっても決定される。
本発明の一実施形態によるサーバ200は、人工神経網を利用し、第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成することができる(S84)。例えば、サーバ200は、図8に図示された第二次イメージにおいて、彩色されていない領域である領域331がさらに彩色された第2中間イメージを生成することができる。
また、サーバ200は、人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成し、第2色相質疑に対する返答を獲得することができる(S85)。例えば、サーバ200は、図8に図示された第二次イメージにおいて、彩色されていない領域である領域334に係わる第2色相質疑を生成することができる。
段階S82と同様に、サーバ200によって生成された質疑(または、質疑イメージ)は、前述のユーザ端末100に伝達され、ユーザに対する返答要請にも使用される。ユーザ端末100に入力された第2返答は、サーバ200にも伝送される。
本発明の一実施形態によるサーバ200は、第一次イメージ、前述の過程によって生成された第2色相質疑、ユーザ端末100から受信した第2色相質疑に対する第2返答、及び第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成することができる(S86)。
例えば、サーバ200は、第一次イメージを含むレイヤ、第2色相質疑に対応し、第2返答によって彩色される領域の情報を含むレイヤ、第2返答に対応して彩色される領域の彩色情報を含むレイヤ、及び第2中間イメージを含むレイヤそれぞれを生成することができる。また、サーバ200は、生成されたレイヤを併合することにより、第三次イメージを生成することができる。
このとき、サーバ200は、前述のレイヤ間の加重値を反映させて併合することもでき、レイヤ間の優先順位を反映させて併合することもできる。該加重値または該優先順位は、人工神経網によっても決定される。
本発明の一実施形態によるサーバ200は、第三次イメージに彩色されていない領域が存在するか否かということを確認することができる(S87)。そのような確認は、第三次イメージに係わる質疑が、内容を含むか否かということを確認することによっても遂行される。例えば、第三次イメージに係わる質疑が何らの内容を含まない場合、第三次イメージにおいて、彩色されていない領域が存在しないと判断することができる。サーバ200は、第三次イメージにおいて、彩色されていない領域が存在しない場合、彩色を終了させることができる。
一方、サーバ200は、第三次イメージにおいて、彩色されていない領域が存在する場合、第三次イメージにつき、段階S84ないし段階S87の過程を反復して遂行することにより、彩色を完了させることができる。例えば、サーバ200は、第2時点における第二次イメージを、第2時点以前の第1時点における第三次イメージと同一に生成することができる。換言すれば、サーバ200は、以前時点の第三次イメージを、現在時点の第二次イメージと見なし、段階S84ないしS87を反復的に遂行することができる。
なお、本発明の一実施形態によるサーバ200は、前述の反復遂行の回数を、所定の臨界回数未満に設定することができる。例えば、サーバ200は、反復遂行の回数を、5回に設定することができる。
設定された臨界反復回数条件の充足は、サーバ200が人工神経網の出力に基づき、特定領域を自動的に彩色するか否かということを決定する臨界確率、及び/または色相未知領域に係わる色相質疑を行うか否かということを決定する所定条件を適切に調節することによっても達成される。
図13は、本発明の一実施形態による、サーバ200によって遂行される人工神経網学習方法について説明するためのフローチャートである。
本発明の一実施形態によるサーバ200は、第1領域が彩色されていない入力イメージ、及びそのような入力イメージにおいて、第1領域が第1色相に彩色された出力イメージを利用し、第1領域と第1色相との対応関係が反映されるように、人工神経網を学習(第1学習)させることができる(S91)。このとき、入力イメージと出力イメージは、いずれも学習データに、1つのトレーニングセットとして含まれるイメージでもある。また、該第1領域は、該入力イメージ内において、彩色されていない任意の領域を意味しうる。換言すれば、サーバ200は、彩色が完了されたイメージと、彩色が完了されていないイメージとを利用し、所定形態特徴と所定色相とが対応するように、人工神経網を学習させることができる。
次に、サーバ200は、入力イメージ、入力イメージの彩色された第2領域に係わる第3色相質疑、第3色相質疑に対する第3返答、入力イメージにおいて、第1領域が第1色相に彩色された出力イメージ、及び出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、人工神経網を学習(第2学習)させることができる(S92)。このとき、入力イメージ、第3色相質疑、出力イメージ及び第4色相質疑は、いずれも学習データに、1つのトレーニングセットとして含まれるものでもある。なお、サーバ200は、入力イメージの第2領域の平均色相に基づき、第3返答を決定することができる。
換言すれば、サーバ200は、少なくとも一部がさらに彩色されたイメージの色相未知領域に係わる質疑と、少なくとも一部があまり彩色されていないイメージの彩色された領域の彩色に使用された質疑と、それに対する返答とを対応させるように、人工神経網を学習させることができる。
本発明の他の実施形態において、前述のイメージ彩色完成方法及び/または人工神経網学習方法は、ユーザ端末100、及び/またはユーザ端末100のプロセッサ112によっても行われる。
そのような場合、ユーザの入力は、ユーザ端末100の入出力装置115及び入出力インターフェース114を介しても獲得される。例えば、ユーザは、ユーザ端末100の出力装置(図示せず)に表示された質疑イメージを参照し、当該領域321の色相に対する返答、すなわち、第1返答を入出力装置115を介して入力することができ、入力された返答は、プロセッサ112による第二次イメージ生成にも使用される。
以上で説明された装置は、ハードウェア構成要素、ソフトウェア構成要素、並びに/またはハードウェア構成要素及びソフトウェア構成要素の組み合わせによっても具現される。例えば、本実施形態で説明された装置及び構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital
signal processor)、マイクロコンピュータ、FPGA(field programmable
gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令(instruction)を実行して応答することができる他のいかなる装置のように、1以上の汎用コンピュータまたは特殊目的コンピュータを利用しても具現される。処理装置は、オペレーションシステム、及びオペレーションシステム上で遂行される1以上のソフトウェアアプリケーションを実行することができる。また、該処理装置は、ソフトウェア実行に応答し、データにアクセスしたり、データを保存・操作・処理及び生成したりすることもできる。理解の便宜のために、該処理装置は、1個が使用されるようにも説明されるが、当該技術分野において当業者であるならば、該処理装置が複数個の処理要素(processing element)、及び/または複数類型の処理要素を含んでもよいということが分かるであろう。例えば、該処理装置は、複数個のプロセッサ、または1つのプロセッサ及び1つのコントローラを含んでもよい。また、並列プロセッサ(parallel processor)のような他の処理構成(processing
configuration)も可能である。
該ソフトウェアは、コンピュータプログラム(computer
program)、コード(code)、命令、またはそれらのうち1以上の組み合わせを含んでもよく、所望次第に動作するように、該処理装置を構成するか、あるいは独立的または結合的に(collectively)該処理装置に命令を与えることができる。該ソフトウェア及び/または該データは、該処理装置によって解釈されるか、あるいは該処理装置に命令またはデータを提供するために、ある類型の機械、構成要素(component)、物理的装置、仮想装置(virtual equipment)、コンピュータ記録媒体または装置、あるいは伝送される信号波(signal wave)に永久的または一時的にも具体化(embody)される。該ソフトウェアは、ネットワークに連結されたコンピュータシステム上に分散され、分散された方法によって保存されたり実行されたりもする。該ソフトウェア及び該データは、1以上のコンピュータ読み取り可能記録媒体にも保存される。
本実施形態による方法は、多様なコンピュータ手段を介しても遂行されるプログラム命令形態に具現され、コンピュータ読み取り可能媒体にも記録される。該コンピュータ読み取り可能媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含んでもよい。該媒体に記録されるプログラム命令は、本実施形態のために特別に設計されて構成されたものでもあり、コンピュータソフトウェア当業者に公知されて使用可能なものでもある。該コンピュータ読み取り可能記録媒体の例には、ハードディスク、フロッピィーディスク及び磁気テープのような磁気媒体(magnetic media);CD-ROM、DVDのような光記録媒体(optical
media);フロプティカルディスク(floptical disk)のような磁気・光媒体(magneto-optical media);及びROM、RAM、フラッシュメモリのようなプログラム命令を保存して実行させるように特別に構成されたハードウェア装置が含まれる。該プログラム命令の例には、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用し、コンピュータによって実行されうる高級言語コードを含む。前述のハードウェア装置は、本実施形態の動作を遂行するために、1以上のソフトウェアモジュールとして作動するようにも構成されるが、その逆も同様である。
以上のように、本実施形態が、たとえ限定された実施形態と図面とによって説明されたにしても、当該技術分野で当業者であるならば、前述の記載から、多様な修正及び変形が可能であろう。例えば、説明された技術が、説明された方法と異なる順序によって遂行され、かつ/または説明されたシステム、構造、装置、回路のような構成要素が、説明された方法と異なる形態で結合されたり、組み合わされたりするか、あるいは他の構成要素または均等物によって代置されたり置換されたりしても、適切な結果が達成されうる。
従って、他の具現、他の実施形態、及び特許請求の範囲と均等なものなども、特許請求の範囲の範疇に属するのである。

Claims (19)

  1. イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる方法において、
    人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成する段階と、
    前記人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成する段階と、
    前記第1色相質疑、前記第1色相質疑に対する第1返答、及び前記第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成する段階と、を含む、イメージの彩色完成方法。
  2. 前記イメージの彩色を完成させる方法は、
    前記第二次イメージを生成する段階後、
    前記人工神経網を利用し、前記第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成する段階と、
    前記人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成する段階と、
    前記第一次イメージ、前記第2色相質疑、前記第2色相質疑に対する第2返答、及び前記第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成する段階と、をさらに含む、請求項1に記載のイメージの彩色完成方法。
  3. 前記第1返答は、前記第1色相質疑に対応するユーザの入力に基づいて決定され、
    前記第2返答は、前記第2色相質疑に対応する前記ユーザの入力に基づいて決定される、請求項2に記載のイメージの彩色完成方法。
  4. 前記人工神経網は、
    前記第二次イメージ内の少なくとも1つの色相未知領域それぞれに係わる未知の程度を生成し、
    前記第2色相質疑を生成する段階は、
    前記第二次イメージ内の少なくとも1つの色相未知領域において、前記未知の程度が所定条件を満足する未知領域の色相に係わる質疑を、第2色相質疑として生成する、請求項2に記載のイメージの彩色完成方法。
  5. 前記イメージの彩色を完成させる方法は、
    第2時点における第二次イメージを、前記第2時点以前の第1時点における第三次イメージと同一に生成し、前記第2中間イメージを生成する段階、前記第2色相質疑を生成する段階、及び前記第三次イメージを生成する段階を反復して遂行し、全領域が彩色された完成イメージを生成する、請求項2に記載のイメージの彩色完成方法。
  6. 前記人工神経網は、
    第1領域が彩色されていない入力イメージと、前記第1領域が彩色された出力イメージとの対応関係を学習した神経網である、請求項1に記載のイメージの彩色完成方法。
  7. 前記人工神経網は、
    前記入力イメージと、前記入力イメージの彩色された第2領域に係わる第3色相質疑と、前記第3色相質疑に対する第3返答と、前記出力イメージと、前記出力イメージに係わる第4色相質疑との対応関係をさらに学習した神経網であり、
    前記第2領域は、
    前記入力イメージの前記第3色相質疑及び前記第3返答によって彩色された領域である、請求項6に記載のイメージの彩色完成方法。
  8. イメージ内の色相未知領域のうち少なくとも一部領域を彩色し、前記未知領域において、前記一部領域を除いた残り領域の色相に係わる質疑を生成する人工神経網を学習させる方法において、
    第1領域が彩色されていない入力イメージ、及び前記入力イメージにおいて、前記第1領域が第1色相に彩色された出力イメージを利用し、前記第1領域と前記第1色相との対応関係が反映されるように、前記人工神経網を学習させる第1学習段階と、
    前記入力イメージ、前記入力イメージの彩色された第2領域に係わる第3色相質疑、前記第3色相質疑に対する第3返答、前記出力イメージ、及び前記出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、前記人工神経網を学習させる第2学習段階と、を含む、人工神経網学習方法。
  9. 前記第3返答は、
    前記入力イメージの前記第2領域の平均色相に基づいて決定される、請求項8に記載の人工神経網学習方法。
  10. コンピュータを利用し、請求項1ないし9のうちいずれか1項に記載の方法を遂行するために、媒体に保存されたコンピュータプログラム。
  11. イメージ内の色相未知領域に係わる質疑、及び前記質疑に対する返答に基づき、前記イメージの彩色を完成させる装置において、前記装置は、プロセッサを含み、前記プロセッサは、
    人工神経網を利用し、第一次イメージ内の少なくとも1つの未彩色領域が彩色された第1中間イメージを生成し、
    前記人工神経網を利用し、第一次イメージ内の少なくとも1つの色相未知領域に係わる第1色相質疑を生成し、
    前記第1色相質疑、前記第1色相質疑に対する第1返答、及び前記第1中間イメージのうち少なくとも一つに基づき、第二次イメージを生成する、イメージの彩色完成装置。
  12. 前記プロセッサは、
    前記人工神経網を利用し、前記第二次イメージ内の少なくとも1つの未彩色領域が彩色された第2中間イメージを生成し、
    前記人工神経網を利用し、第二次イメージ内の少なくとも1つの色相未知領域に係わる第2色相質疑を生成し、
    前記第一次イメージ、前記第2色相質疑、前記第2色相質疑に対する第2返答、及び前記第2中間イメージのうち少なくとも一つに基づき、第三次イメージを生成する、請求項11に記載のイメージの彩色完成装置。
  13. 前記第1返答は、前記第1色相質疑に対応するユーザの入力に基づいて決定され、
    前記第2返答は、前記第2色相質疑に対応する前記ユーザの入力に基づいて決定される、請求項12に記載のイメージの彩色完成装置。
  14. 前記人工神経網は、
    前記第二次イメージ内の少なくとも1つの色相未知領域それぞれに係わる未知の程度を生成し、
    前記プロセッサは、
    前記第二次イメージ内の少なくとも1つの色相未知領域において、前記未知の程度が所定条件を満足する未知領域の色相に係わる質疑を、第2色相質疑として生成する、請求項12に記載のイメージの彩色完成装置。
  15. 前記プロセッサは、
    第2時点における第二次イメージを、前記第2時点以前の第1時点における第三次イメージと同一に生成し、前記第2中間イメージを生成する段階、前記第2色相質疑を生成する段階、及び前記第三次イメージを生成する段階を反復して遂行し、全領域が彩色された完成イメージを生成する、請求項12に記載のイメージの彩色完成装置。
  16. 前記人工神経網は、
    第1領域が彩色されていない入力イメージと、前記第1領域が彩色された出力イメージとの対応関係を学習した神経網である、請求項11に記載のイメージの彩色完成装置。
  17. 前記人工神経網は、
    前記入力イメージと、前記入力イメージの彩色された第2領域に係わる第3色相質疑と、前記第3色相質疑に対する第3返答と、前記出力イメージと、前記出力イメージに係わる第4色相質疑との対応関係をさらに学習した神経網であり、
    前記第2領域は、
    前記入力イメージの前記第3色相質疑及び前記第3返答によって彩色された領域である、請求項16に記載のイメージの彩色完成装置。
  18. イメージ内の色相未知領域のうち少なくとも一部領域を彩色し、前記未知領域において、前記一部領域を除いた残り領域の色相に係わる質疑を生成する人工神経網を学習させる装置において、前記装置は、プロセッサを含み、
    前記プロセッサは、
    第1領域が彩色されていない入力イメージ、及び前記入力イメージにおいて、前記第1領域が第1色相に彩色された出力イメージを利用し、前記第1領域と前記第1色相との対応関係が反映されるように、前記人工神経網を学習させ、
    前記入力イメージ、前記入力イメージの彩色された第2領域に係わる第3色相質疑、前記第3色相質疑に対する第3返答、前記出力イメージ、及び前記出力イメージに係わる第4色相質疑の対応関係がさらに反映されるように、前記人工神経網を学習させる、人工神経網学習装置。
  19. 前記第3返答は、
    前記入力イメージの前記第2領域の平均色相に基づいて決定される、請求項18に記載の人工神経網学習装置。
JP2021523890A 2018-11-02 2019-08-20 イメージの彩色完成方法、その装置及びそのコンピュータプログラム、並びに人工神経網学習方法、その装置及びそのコンピュータプログラム Active JP7328331B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020180133842A KR102171269B1 (ko) 2018-11-02 2018-11-02 이미지의 채색 완성 방법, 장치 및 컴퓨터 프로그램과 인공 신경망 학습 방법, 장치 및 컴퓨터 프로그램
KR10-2018-0133842 2018-11-02
PCT/KR2019/010556 WO2020091207A1 (ko) 2018-11-02 2019-08-20 이미지의 채색 완성 방법, 장치 및 컴퓨터 프로그램과 인공 신경망 학습 방법, 장치 및 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
JP2022506493A true JP2022506493A (ja) 2022-01-17
JP7328331B2 JP7328331B2 (ja) 2023-08-16

Family

ID=70462288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021523890A Active JP7328331B2 (ja) 2018-11-02 2019-08-20 イメージの彩色完成方法、その装置及びそのコンピュータプログラム、並びに人工神経網学習方法、その装置及びそのコンピュータプログラム

Country Status (4)

Country Link
US (1) US11887224B2 (ja)
JP (1) JP7328331B2 (ja)
KR (1) KR102171269B1 (ja)
WO (1) WO2020091207A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102235293B1 (ko) * 2020-08-18 2021-04-02 (주)에스프레소미디어 카툰 스타일라이저 제공 시스템 및 방법
KR102247662B1 (ko) * 2021-01-29 2021-05-03 주식회사 아이코드랩 만화의 스케치 이미지를 자동으로 채색하기 위한 장치 및 방법
KR102527900B1 (ko) * 2021-02-10 2023-05-02 네이버웹툰 유한회사 스케치 이미지에 대한 자동 채색 모델 관리 방법 및 그 장치
KR102477798B1 (ko) * 2022-01-27 2022-12-15 주식회사 위딧 웹툰 캐릭터 채색 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130055116A1 (en) * 2011-08-25 2013-02-28 Microsoft Corporation Theme variation engine
EP2803039A1 (fr) 2012-01-13 2014-11-19 Wisimage Procédé et dispositif de coloration de cheveux
CN103177446B (zh) * 2013-03-13 2016-03-30 北京航空航天大学 基于邻域和非邻域平滑先验的图像前景精准提取方法
KR20150034058A (ko) * 2013-09-25 2015-04-02 삼성전자주식회사 영상 분석에 기초한 애니메이션 컨텐츠 생성 방법 및 그 장치
US10346710B2 (en) * 2016-09-29 2019-07-09 Datacolor Inc. Multi-agent training of a color identification neural network
US10916001B2 (en) * 2016-11-28 2021-02-09 Adobe Inc. Facilitating sketch to painting transformations

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FERRET編集部: "AIが線画を自動でカラーイラストにしてくれる!線画自動着色ツール「PaintsChainer」の使い方を解説", FERRET [ONLINE], JPN7022002441, 31 January 2018 (2018-01-31), ISSN: 0004787840 *
米辻泰山: "線画自動着色サービス「PaintsChainer」について", 映像情報メディア学会誌, vol. 第72巻第3号, JPN6022021242, 1 May 2018 (2018-05-01), JP, pages 47 - 51, ISSN: 0004787839 *

Also Published As

Publication number Publication date
KR102171269B1 (ko) 2020-10-28
US20210248795A1 (en) 2021-08-12
JP7328331B2 (ja) 2023-08-16
KR20200054355A (ko) 2020-05-20
WO2020091207A1 (ko) 2020-05-07
US11887224B2 (en) 2024-01-30

Similar Documents

Publication Publication Date Title
JP2022506493A (ja) イメージの彩色完成方法、その装置及びそのコンピュータプログラム、並びに人工神経網学習方法、その装置及びそのコンピュータプログラム
JP6829327B2 (ja) 変換方法、装置、コンピューターデバイス及び記憶媒体
US20210398331A1 (en) Method for coloring a target image, and device and computer program therefor
US10539881B1 (en) Generation of hotspot-containing physical design layout patterns
US20210303988A1 (en) Multi-model training pipeline in distributed systems
US20230267686A1 (en) Subdividing a three-dimensional mesh utilizing a neural network
US11409928B2 (en) Configurable digital twin
CN115066694A (zh) 计算图优化
WO2020070758A2 (en) Systems and methods for simulation of humans by human twin
US11275661B1 (en) Test generation of a distributed system
KR102401112B1 (ko) UX-bit를 이용한 정책망을 포함하는 자동 디자인 생성 인공신경망 장치 및 방법
CN114841309A (zh) 数据处理方法、装置以及电子设备
US20190005169A1 (en) Dynamic Design of Complex System-of-Systems for Planning and Adaptation to Unplanned Scenarios
CN114091589A (zh) 模型训练方法、装置、电子设备及介质
CN117201308A (zh) 网络资源分配方法、系统、存储介质及电子设备
US20210287131A1 (en) Machine learning model accuracy fairness
WO2024051146A1 (en) Methods, systems, and computer-readable media for recommending downstream operator
US20230153612A1 (en) Pruning complex deep learning models based on parent pruning information
CN107688582B (zh) 资源推荐模型的获取方法及装置
US10650581B1 (en) Sketch-based 3D fluid volume generation using a machine learning system
CN114528893A (zh) 机器学习模型训练方法、电子设备及存储介质
KR102551873B1 (ko) 레이블링 하기 위한 데이터를 선택적으로 추출하기 위한 방법, 이를 수행하는 서비스서버 및 컴퓨터-판독가능 매체
US20240045662A1 (en) Software code verification using call graphs for autonomous systems and applications
US11544430B2 (en) Advanced model mapping and simulations
WO2024001344A1 (zh) 基于云计算技术的目标函数求解方法、装置和计算设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210430

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220830

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230509

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230803

R150 Certificate of patent or registration of utility model

Ref document number: 7328331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150