JP2022106296A - Hdrイメージ生成装置および方法 - Google Patents

Hdrイメージ生成装置および方法 Download PDF

Info

Publication number
JP2022106296A
JP2022106296A JP2022001194A JP2022001194A JP2022106296A JP 2022106296 A JP2022106296 A JP 2022106296A JP 2022001194 A JP2022001194 A JP 2022001194A JP 2022001194 A JP2022001194 A JP 2022001194A JP 2022106296 A JP2022106296 A JP 2022106296A
Authority
JP
Japan
Prior art keywords
image
feature vector
neural network
hdr
learned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022001194A
Other languages
English (en)
Other versions
JP7256566B2 (ja
Inventor
フン スンウ ミュン
Myung Hoon Sunwoo
デ リ ビョン
Byeong Dae Lee
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajou University Industry Academic Cooperation Foundation
Original Assignee
Ajou University Industry Academic Cooperation Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajou University Industry Academic Cooperation Foundation filed Critical Ajou University Industry Academic Cooperation Foundation
Publication of JP2022106296A publication Critical patent/JP2022106296A/ja
Application granted granted Critical
Publication of JP7256566B2 publication Critical patent/JP7256566B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06T5/92
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • G06T5/60
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】HDRイメージを生成するための装置及び方法を提供する。【解決手段】HDRイメージ生成装置100は、原本イメージに含まれた各ピクセルの明るさの値が特定値以上の領域を含む第1イメージ及び原本イメージにおいて特定値以上の領域を除いた残りの領域を含む第2イメージを生成する入力イメージ生成部110と、第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて第1イメージおよび第2イメージから原本イメージのダイナミックレンジを拡張させたHDRイメージを生成するHDRイメージ生成部120と、を含む。【選択図】図1

Description

開示される実施形態は、HDRイメージを生成するための技術に関する。
HDR(High Dynamic Range)は、人が目で見ることを最大限に近く再現するためにイメージの最も明るい所から最も暗い所まで明るさの範囲を拡張する技術である。しかし、HDRイメージを生成するためには、HDR専用機器で撮影をしなければならないという限界が存在する。このような限界を克服するために一部においては、単一LDR(Low Dynamic Range)イメージでHDRイメージを具現しようとする試みが多数行われていた。その中で代表的な方法として、同じ場面を互いに異なる露出で撮影し、撮影された複数のLDRイメージを併合してHDRイメージを生成する方法が紹介される。しかし、このような方法は、複雑なパラメータが必要であり、互いに異なる露出で撮影したイメージは、原本イメージの情報の一部が欠落する問題点が存在する。
このような問題を解決するために、最近は、ディープラーニング(Deep Learning)を用いてHDRイメージを生成する方法が活発に研究されている。HDRイメージ生成技術の最近の研究動向によると、LDRイメージ1枚をディープラーニングネットワークに入力してHDRイメージを作る方式、ディープラーニングを介して互いに異なる露出値を有するLDRイメージを生成した後、これを併合してHDRを具現する方式、End to End方式でディープラーニングネットワークのみを用いてLDRイメージをHDRイメージとして具現する方式などのディープラーニングを介してLDRイメージをHDRイメージとして生成する方法が脚光を浴びている。
しかし、ディープラーニングを用いてHDRイメージを生成する技術も、生成されたHDRイメージの明るさの値の範囲が均一でないという問題を持っている。したがって、ディープラーニングを用いてHDRイメージを生成する技術に関連する従来技術が存在するにもかかわらず、依然として改善された方式のHDRイメージ生成方法が必要となる。
しかし、ディープラーニングを用いてHDRイメージを生成する技術も、生成されたHDRイメージの明るさの値の範囲が均一でないという問題を持っている。
韓国登録特許公報第10-11926490号
開示される実施形態は、HDRイメージを生成するための装置および方法を提供するためのものである。
一実施形態によるHDRイメージ生成方法は、原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成するステップと、第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するステップと、を含み、前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習される。
前記第1イメージおよび前記第2イメージを生成するステップは、前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成するステップと、前記マスクを用いて前記原本イメージをマスキング(Masking)して前記第1イメージを生成するステップと、前記第1イメージの明るさを反転させて前記第2イメージを生成するステップと、を含み得る。
前記マスクを生成するステップは、下記式1を用いて前記マスクを生成し得る。
[式1]
Figure 2022106296000002
このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、各ピクセルの明るさの値に基づいて決定されたしきい値である。
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定され得る。
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含み得る。
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1イメージについての第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2イメージについての第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習され得る。
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
一実施形態によるHDRイメージ生成装置は、原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成する入力イメージ生成部と、第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するHDRイメージ生成部と、を含み、前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習される。
前記入力イメージ生成部は、前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、前記マスクで前記原本イメージをマスキング(Masking)して前記第1イメージを生成し、前記第1イメージの明るさを反転させて前記第2イメージを生成し得る。
前記入力イメージ生成部は、下記式1を用いて前記マスクを生成し得る。
[式1]
Figure 2022106296000003
このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値である。
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定され得る。
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
前記第3神経網は、第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含み得る。
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習され得る。
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
開示される実施形態によると、別個に学習された神経網を用いて原本イメージのうち、明るい領域はより明るく、暗い領域はより暗くなるように生成されたイメージに基づいてHDRイメージを生成し得るため、従来技術と比較して明るさの値の範囲が均等に拡張されたHDRイメージを生成し得る。
一実施形態によるHDRイメージ生成装置を説明するためのブロック図。
一実施形態による入力イメージ生成部によって第1イメージおよび第2イメージが生成される過程を説明するための図面。
一実施形態による事前学習されたモデルの構造を説明するための図面。
一実施形態によるHDRイメージ生成方法を説明するための流れ図(フローチャート)。
一実施形態によるコンピューティング装置を含むコンピューティング環境を例示して説明するためのブロック図。
以下、図面を参照して一実施形態の具体的な実施形態を説明する。以下の詳細な説明は、本明細書における記述された方法、装置および/またはシステムについての包括的な理解を助けるために提供される。しかし、これは例示に過ぎず、本発明はこれに限定されない。
一実施形態を説明するにおいて、本発明に係る公知技術についての具体的な説明が一実施形態の要旨を不必要に曖昧にすることができると判断される場合には、その詳細な説明を省略する。そして、後述される用語は、本発明における機能を考慮して定義された用語として、これは使用者、運用者の意図または慣例などによって変わることができる。したがって、その定義は、本明細書の全般にわたる内容に基づいてなされるべきである。詳細な説明で使用される用語は、単に一実施形態を記述するためのものであり、決して限定的ではならない。明確に他に使用されない限り、単数形態の表現は、複数形態の意味を含む。本説明において、「含み」または「備え」のような表現は、ある特性、数字、ステップ、動作、要素、これらの一部または組み合せを示すためのものであり、記述されたもの以外に1つまたはそれ以上の他の特性、数字、ステップ、動作、要素、これらの一部または組み合せの存在または可能性を排除するように解釈されてはならない。
図1は、一実施形態によるHDRイメージ生成装置100を説明するためのブロック図である。
図1を参照すると、一実施形態によるHDRイメージ生成装置100は、入力イメージ生成部110およびHDRイメージ生成部120を含む。
以下の実施形態において、各構成は、以下に記述されたもの以外に異なる機能および能力を有し得、以下に記述されていないもの以外にも追加の構成を含み得る。
また、以下の実施形態において、入力イメージ生成部110およびHDRイメージ生成部120は、物理的に区分された1つ以上の装置を用いて具現されるか、または1つ以上のプロセッサまたは1つ以上のプロセッサおよびソフトウェアの結合によって具現でき、図示された例とは異なり、具体的動作において明確に区分されないことがある。
入力イメージ生成部110は、原本イメージ201に含まれた各ピクセルの明るさの値に基づいて原本イメージ201において明るさの値が特定値以上の領域を含む第1イメージ203および原本イメージ201において特定値以上の領域を除いた残りの領域を含む第2イメージ205を生成する。
図2は、一実施形態による入力イメージ生成部110によって第1イメージ203および第2イメージ205が生成される過程を説明するための図面である。
図2を参照すると、一実施形態による入力イメージ生成部110は、原本イメージ201をマスキング(Masking)して第1イメージ203および第2イメージ205を生成し得る。
一実施形態によるHDRイメージ生成装置100は、原本イメージ201のうち、明るい領域は第1神経網310に、原本イメージ201のうち、暗い領域は第2神経網320に用い得る。
すなわち、HDRイメージ生成装置100は、HDRイメージを生成する前に原本イメージ201のうち、相対的に明るい領域と暗い領域を先決的に区分する必要がある。
したがって、一実施形態による入力イメージ生成部110は、図2のように、原本イメージ201のうち、明るい領域と暗い領域を区分するための方法としてマスキング技法を用い得る。
具体的に、一実施形態による入力イメージ生成部110は、原本イメージ201の各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、マスクで原本イメージ201をマスキングして第1イメージ203を生成し、第1イメージ203の明るさを反転させて前記第2イメージ205を生成し得る。
但し、一実施形態による入力イメージ生成部110が算出されたマスクを用いて第1イメージ203を生成し得る。
これを考慮すると、入力イメージ生成部110は、同じ概念で(1-マスク)で原本イメージ201をマスキングし、原本イメージ201のうち、相対的に暗い領域である第2イメージ205を生成し得る。
一実施形態によると、このときのマスクは、下記式1を用いて生成され得る。
[式1]
Figure 2022106296000004
このとき、P(i、j)は、原本イメージ201の(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値を示す。
一実施形態によると、入力イメージ生成部110は、原本イメージ201の特性を考慮して第1イメージ203および第2イメージ205を生成するために、マスクのしきい値は、原本イメージ201の各ピクセルの明るさの平均値に基づいて設定され得る。
具体的に、しきい値は、原本イメージ201の各ピクセルの明るさの平均値と事前設定されたパラメータ値を加えて調節できる。
一方、一実施形態による入力イメージ生成部110は、イメージ分割に係る従来技術に比べ、算出されたマスクを用いて柔らかな境界を有する第1イメージ203および第2イメージ205を生成し得る。
図3は、一実施形態による事前学習されたモデル300の構造を説明するための図面である。
事前学習されたモデル300は、第1神経網310、第2神経網320および第3神経網330を含む。
但し、図3のように、一実施形態による事前学習されたモデル300は、第1神経網310、第2神経網320、第3神経網330および第4神経網340を含み得る。
一方、HDRイメージ生成部120は、事前学習されたモデル300を用いてHDRイメージを生成する。
具体的に、HDRイメージ生成部120は、第1神経網310、第2神経網320および第3神経網330を含む事前学習されたモデル300を用いて第1イメージ203および第2イメージ205から原本イメージ201のダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成する。
このとき、第1神経網310は、第1イメージ203に基づいて明るさの値が増加される方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習される。
第2神経網320は、第2イメージ205に基づいて明るさの値を減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習される。
第3神経網330は、第3イメージおよび前記第4イメージに基づいてHDRイメージを生成するように事前学習される。
一実施形態によると、第3神経網330は、第3イメージおよび第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、抽出された第3特徴ベクトルに基づいてHDRイメージを生成するように学習され得る。
一実施形態によると、第4神経網340は、原本イメージ201についてのサブサンプリング(Sub-Sampling)を行い、原本イメージ201についての特徴ベクトルを生成するように事前学習され得る。
具体的に、第1神経網310は、第1イメージ203についての第1特徴ベクトルを抽出し、第1イメージ203についての第1特徴ベクトルおよび原本イメージ201についての特徴ベクトルに基づいて第3イメージを生成し得る。
第2神経網320は、第2イメージ205についての第2特徴ベクトルを抽出し、第2イメージ205についての第2特徴ベクトルおよび原本イメージ201についての特徴ベクトルに基づいて第4イメージを生成するように事前学習され得る。
すなわち、第1神経網310および第2神経網320は、原本イメージ201についての特徴ベクトルを考慮して第3イメージおよび第4イメージを生成するように事前学習され得る。
これにより、第1神経網310および第2神経網320は、出力された第3イメージおよび第4イメージに原本イメージ201の特性が欠落することを防止できる。
また、一実施形態によると、第1神経網310は、第1イメージ203にコンボルーション演算を行い、前記第1イメージ203についての第1特徴ベクトルを出力する第1コンボルーション層および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み得る。
一実施形態によると、第2神経網320は、第2イメージ205にコンボルーション演算を行い、前記第2イメージ205についての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
すなわち、第1神経網310は、第1コンボルーション層を介して第1特徴ベクトルを出力し、出力された第1特徴ベクトルの元素値に最大プーリングを行う第1プーリング層によって第1イメージ203の明るさの値が増加する方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され得る。
同様に、第2神経網320は、第2コンボルーション層を介して第2特徴ベクトルを出力し、出力された第2特徴ベクトルの元素値の間に最小プーリングを行う第2プーリング層を介して第2イメージ205の明るさの値が減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され得る。
すなわち、一実施形態によるHDRイメージ生成部120は、従来技術に比べ、明るさの範囲がより広いHDRイメージを生成するために、第1神経網310を介して原本イメージ201のうち、明るい領域の明るさの値が増加される方向に明るさの範囲が拡張された第3イメージと原本イメージ201のうち、暗い領域の明るさの値が減少される方向に明るさの範囲が拡張された第4イメージに基づいてHDRイメージを生成し得る。
ここで、第1イメージ203と第2イメージ205の明るさの範囲が拡張されるということは、第1イメージ203の明るい部分はより明るく、第2イメージ205の暗い部分はより暗く変化することを意味し得る。
図4は、一実施形態によるHDRイメージ生成方法を説明するための流れ図(フローチャート)である。
図4に示された方法は、図1に示されたHDRイメージ生成装置100によって行われ得る。
図4を参照すると、HDRイメージ生成装置100は、原本イメージ201に含まれた各ピクセルの明るさの値に基づいて原本イメージ201において明るさの値が特定値以上の領域を含む第1イメージ203および原本イメージ201において特定値以上の領域を除いた残りの領域を含む第2イメージ205を生成する(ステップ410)。
以後、HDRイメージ生成装置100は、第1神経網310、第2神経網320および第3神経網330を含む事前学習されたモデル300を用いて第1イメージ203および第2イメージ205から前記原本イメージ201のダイナミックレンジを拡張させたHDRイメージを生成する(ステップ420)。
このとき、第1神経網310は、第1イメージ203に基づいて明るさの値が増加される方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習される。
第2神経網320は、第2イメージ205に基づいて明るさの値を減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習される。
第3神経網330は、第3イメージおよび第4イメージに基づいてHDRイメージを生成するように事前学習される。
前記示された図4においては、前記方法を複数のステップに分けて記載しているが、少なくとも一部のステップは、順序を変えて行われるか、他のステップと結合されて一緒に行われるか、省略されるか、詳細ステップに分けて行われるか、または図示されていない1つ以上のステップが付加されて行われ得る。
図5は、一実施形態によると、コンピューティング装置12を含むコンピューティング環境10を例示して説明するためのブロック図である。図示された実施形態において、各コンポーネントは、以下に記述されるものに加えて異なる機能および能力を有し得、以下に記述されないものに加えて追加のコンポーネントを含み得る。
図示されたコンピューティング環境10は、コンピューティング装置12を含む。一実施形態において、コンピューティング装置12は、HDRイメージ生成装置100に含まれた1つ以上のコンポーネントであり得る。
コンピューティング装置12は、少なくとも1つのプロセッサ14、コンピュータ読み取り可能な格納媒体16および通信バス18を含む。プロセッサ14は、コンピューティング装置12をして前述した例示的な実施形態によって動作させることができる。例えば、プロセッサ14は、コンピュータ読み取り可能な格納媒体16に格納された1つ以上のプログラムを実行し得る。前記1つ以上のプログラムは、1つ以上のコンピュータ実行可能な命令語を含み得、前記コンピュータ実行可能な命令語は、プロセッサ14によって実行される場合、コンピューティング装置12をして例示的な実施形態による動作を実行させるように構成できる。
コンピュータ読み取り可能な格納媒体16は、コンピュータ実行可能な命令語ないしプログラムコード、プログラムデータおよび/または他の適した形態の情報を格納するように構成される。コンピュータ読み取り可能な格納媒体16に格納されたプログラム20は、プロセッサ14によって実行可能な命令語の集合を含む。一実施形態において、コンピュータ読み取り可能な格納媒体16は、メモリ(ランダムアクセスメモリのような揮発性メモリ、不揮発性メモリ、またはこれらの適切な組み合せ)、1つ以上の磁気ディスク格納デバイス、光学ディスク格納デバイス、フラッシュメモリデバイス、その他、コンピューティング装置12によってアクセスされ、欲しい情報を格納できる他の形態の格納媒体、またはこれらの適した組み合せであり得る。
通信バス18は、プロセッサ14、コンピュータ読み取り可能な格納媒体16を含み、コンピューティング装置12の他の様々なコンポーネントを相互接続する。
コンピューティング装置12は、また1つ以上の入出力装置24のためのインターフェースを提供する1つ以上の入出力インターフェース22および1つ以上のネットワーク通信インターフェース26を含み得る。入出力インターフェース22およびネットワーク通信インターフェース26は、通信バス18に接続される。入出力装置24は、入出力インターフェース22を介してコンピューティング装置12の他のコンポーネントに接続され得る。例示的な入出力装置24は、ポインティング装置(マウスまたはトラックパッドなど)、キーボード、タッチ入力装置(タッチパッドまたはタッチスクリーンなど)、音声または音入力装置、様々な種類のセンサー装置および/または撮影装置のような入力装置、および/またはディスプレー装置、プリンター、スピーカーおよび/またはネットワークカードのような出力装置を含み得る。例示的な入出力装置24は、コンピューティング装置12を構成する一コンポーネントとしてコンピューティング装置12の内部に含まれ得、コンピューティング装置12とは区別される別の装置としてコンピューティング装置12と接続され得る。
以上、代表的な実施形態により、本発明について具体的に説明したが、本発明が属する技術分野における通常の知識を有する者は、前述した実施形態について本発明の範疇から逸脱しない範囲内で様々な変形が可能であることを理解するであろう。したがって、本発明の権利の範囲は、説明された実施形態に限定されて定められてはならず、後述する特許請求の範囲だけでなく、この特許請求の範囲と均等なものなどによって定められるべきである。
10:コンピューティング環境
12:コンピューティング装置
14:プロセッサ
16:コンピュータ読み取り可能な格納媒体
18:通信バス
20:プログラム
22:入出力インターフェース
24:入出力装置
26:ネットワーク通信インターフェース
100:HDRイメージ生成装置
110:入力イメージ生成部
120:HDRイメージ生成部
201:原本イメージ
203:第1イメージ
205:第2イメージ
300:事前学習されたモデル
310:第1神経網
320:第2神経網
330:第3神経網
340:第4神経網

Claims (18)

  1. 原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成するステップと、
    第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するステップと、を含み、
    前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、
    前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、
    前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習されるHDRイメージ生成方法。
  2. 前記第1イメージおよび前記第2イメージを生成するステップは、
    前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成するステップと、
    前記マスクを用いて前記原本イメージをマスキング(Masking)して前記第1イメージを生成するステップと、
    前記第1イメージの明るさを反転させて前記第2イメージを生成するステップと、を含む請求項1に記載のHDRイメージ生成方法。
  3. 前記マスクを生成するステップは、下記式1を用いて前記マスクを生成する請求項2に記載のHDRイメージ生成方法。
    [式1]
    Figure 2022106296000005
    (このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値)
  4. 前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定される請求項3に記載のHDRイメージ生成方法。
  5. 前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、
    前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含む請求項1に記載のHDRイメージ生成方法。
  6. 前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項1に記載のHDRイメージ生成方法。
  7. 前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含む請求項1に記載のHDRイメージ生成方法。
  8. 前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1イメージについての第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、
    前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2イメージについての第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習される請求項7に記載のHDRイメージ生成方法。
  9. 前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項7に記載のHDRイメージ生成方法。
  10. 原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成する入力イメージ生成部と、
    第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するHDRイメージ生成部と、を含み、
    前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、
    前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、
    前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習されるHDRイメージ生成装置。
  11. 前記入力イメージ生成部は、
    前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、前記マスクで前記原本イメージをマスキング(Masking)して前記第1イメージを生成し、前記第1イメージの明るさを反転させて前記第2イメージを生成する請求項10に記載のHDRイメージ生成装置。
  12. 前記入力イメージ生成部は、下記式1を用いて前記マスクを生成する請求項11に記載のHDRイメージ生成装置。
    [式1]
    Figure 2022106296000006
    (このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値)
  13. 前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定される請求項12に記載のHDRイメージ生成装置。
  14. 前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、
    前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含む請求項10に記載のHDRイメージ生成装置。
  15. 前記第3神経網は、第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項10に記載のHDRイメージ生成装置。
  16. 前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含む請求項10に記載のHDRイメージ生成装置。
  17. 前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、
    前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習される請求項16に記載のHDRイメージ生成装置。
  18. 前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項16に記載のHDRイメージ生成装置。
JP2022001194A 2021-01-06 2022-01-06 Hdrイメージ生成装置および方法 Active JP7256566B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0001617 2021-01-06
KR1020210001617A KR102374069B1 (ko) 2021-01-06 2021-01-06 Hdr 이미지 생성 장치 및 방법

Publications (2)

Publication Number Publication Date
JP2022106296A true JP2022106296A (ja) 2022-07-19
JP7256566B2 JP7256566B2 (ja) 2023-04-12

Family

ID=80814373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022001194A Active JP7256566B2 (ja) 2021-01-06 2022-01-06 Hdrイメージ生成装置および方法

Country Status (3)

Country Link
US (1) US20220215516A1 (ja)
JP (1) JP7256566B2 (ja)
KR (1) KR102374069B1 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233738B2 (en) * 2007-07-30 2012-07-31 Dolby Laboratories Licensing Corporation Enhancing dynamic ranges of images
TWI497320B (zh) * 2011-11-14 2015-08-21 Novatek Microelectronics Corp 色調對應方法及影像處理裝置
KR101926490B1 (ko) 2013-03-12 2018-12-07 한화테크윈 주식회사 이미지 처리 장치 및 방법
CN110832541B (zh) * 2017-06-28 2022-10-04 华为技术有限公司 图像处理装置和方法
US10757320B2 (en) * 2017-12-28 2020-08-25 Waymo Llc Multiple operating modes to expand dynamic range
EP3776474A1 (en) * 2018-04-09 2021-02-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings
US10936912B2 (en) * 2018-11-01 2021-03-02 International Business Machines Corporation Image classification using a mask image and neural networks

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ENDO, YUKI ET AL.: "Deep reverse tone mapping", 2017 ACM TRANSACTIONS ON GRAPHICS, vol. Vol. 36, No. 6, Article 177, JPN6023008850, November 2017 (2017-11-01), US, ISSN: 0005007476 *
森脇 健太 他: "GANを用いた単一画像からのハイダイナミックレンジ画像の生成", 情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM), JPN6023008851, 31 October 2018 (2018-10-31), JP, pages 1 - 8, ISSN: 0005007475 *

Also Published As

Publication number Publication date
JP7256566B2 (ja) 2023-04-12
US20220215516A1 (en) 2022-07-07
KR102374069B1 (ko) 2022-03-11

Similar Documents

Publication Publication Date Title
US20210232806A1 (en) Image processing method and device, processor, electronic equipment and storage medium
US20230080693A1 (en) Image processing method, electronic device and readable storage medium
CN112995544A (zh) 根据单输入生成多曝光帧的系统和方法
KR20210139450A (ko) 이미지 디스플레이 방법 및 디바이스
CN112602088B (zh) 提高弱光图像的质量的方法、系统和计算机可读介质
US20210097650A1 (en) Image processing method, storage medium, image processing apparatus, learned model manufacturing method, and image processing system
KR102287407B1 (ko) 이미지 생성을 위한 학습 장치 및 방법과 이미지 생성 장치 및 방법
KR102095443B1 (ko) 구조텐서를 이용한 딥러닝 기반의 영상 개선 방법 및 장치
CN110751593A (zh) 一种图像虚化处理方法及装置
CN112561777A (zh) 图像添加光斑的方法及装置
Conde et al. Perceptual image enhancement for smartphone real-time applications
Wu et al. Reflectance-guided histogram equalization and comparametric approximation
CN115294055A (zh) 图像处理方法、装置、电子设备和可读存储介质
KR102229034B1 (ko) 표정 관련 정보 생성 장치와 방법 및 표정 생성 장치
Chen et al. CERL: A unified optimization framework for light enhancement with realistic noise
Zheng et al. Windowing decomposition convolutional neural network for image enhancement
CN113642359B (zh) 人脸图像生成方法、装置、电子设备及存储介质
US11232616B2 (en) Methods and systems for performing editing operations on media
JP2022106296A (ja) Hdrイメージ生成装置および方法
WO2015033431A1 (ja) アノテーション装置及びアノテーションシステム
CN115908120A (zh) 图像处理方法和电子设备
US20220335250A1 (en) Methods and apparatuses for fine-grained style-based generative neural networks
CN115375909A (zh) 一种图像处理方法及装置
US11423308B1 (en) Classification for image creation
CN114422721A (zh) 成像方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230324

R150 Certificate of patent or registration of utility model

Ref document number: 7256566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150