JP6841888B2 - 映像処理装置及び映像処理方法 - Google Patents

映像処理装置及び映像処理方法 Download PDF

Info

Publication number
JP6841888B2
JP6841888B2 JP2019181278A JP2019181278A JP6841888B2 JP 6841888 B2 JP6841888 B2 JP 6841888B2 JP 2019181278 A JP2019181278 A JP 2019181278A JP 2019181278 A JP2019181278 A JP 2019181278A JP 6841888 B2 JP6841888 B2 JP 6841888B2
Authority
JP
Japan
Prior art keywords
boundary
filter
video
shadow
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019181278A
Other languages
English (en)
Other versions
JP2020173771A (ja
Inventor
亨俊 林
亨俊 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2020173771A publication Critical patent/JP2020173771A/ja
Application granted granted Critical
Publication of JP6841888B2 publication Critical patent/JP6841888B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • G06T15/60Shadow generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2215/00Indexing scheme for image rendering
    • G06T2215/12Shadow map, environment map

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Description

本発明は、映像処理装置及びその映像処理方法に関し、より詳細には、入力映像に対するエンハンス処理を行う映像処理装置及びその映像処理方法に関する。
電子技術の発達により、多様な電子機器が開発及び普及されている。特に、家庭内、事務所、公共の場など様々な場所で利用されるディスプレイ装置は、ここ数年間で持続的な発展を遂げている。
近来は、高解像度の映像サービスに対する要求が大幅に増加している。このような要求により、ディスプレイ機器の解像度が高まるにつれて、イメージのディテールを向上させるための技術は持続的に開発されている。特に、圧縮過程で損なわれたディテールや、イメージを拡大する過程でぼやけたイメージを鮮明にするためのディテール向上技術の開発が求められている。
特開2009−302761号公報 韓国特許出願公開第2011−0001425号公報 米国特許出願公開第2009/0316024号明細書 特開2014−123247号公報
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、映像から客体の境界(boundary)を正確に検出し、検出された境界にシャドーイング(shadowing)を適用して映像のディテール(detail)を向上させる映像処理装置及びその映像処理方法を提供することにある。
以上のような目的を達成するための本発明の一実施形態に係る映像処理装置は、少なくとも一つのプロセッサと、プログラムコードを保存するメモリとを含み、前記プロセッサは、前記プログラムコードを実行することにより、入力映像のフィルタリングに基づいて臨界範囲の信号をシャドウ(shadow)で獲得し、異なる方向性に関連する複数の境界検出フィルタを前記入力映像に適用して境界情報を獲得し、前記境界情報によって識別される領域に前記シャドウを適用して前記入力映像から出力映像を獲得するプロセッサとを含む。
この場合、前記プロセッサは、前記入力映像を二次微分フィルタでフィルタリングして出力信号を獲得し、獲得された前記出力信号で負の信号をクリッピングして前記シャドウを獲得してよい。
ここで、前記獲得されたシャドウは、前記入力映像内に含まれた客体のうち第1臨界値未満のピクセル値を有する客体の内部境界、又は前記入力映像内に含まれた客体のうち前記第1臨界値より大きい第2臨界値以上のピクセル値を有する客体の外部境界のうち、少なくとも一方に対応してよい。
なお、前記境界情報は、前記境界領域の位置情報及び強度情報を含み、前記プロセッサは、前記位置情報に基づいて前記境界領域を識別し、前記識別された境界領域に対応する強度情報を前記識別された境界領域に対応するシャドウに適用し、前記強度情報の適用されたシャドウを前記識別された境界領域に挿入してよい。
なお、前記プロセッサは、前記入力映像に二次微分フィルタを適用して前記シャドウを獲得し、前記複数の境界検出フィルタのサイズは前記二次微分フィルタより大きくてよい。
なお、前記プロセッサは、前記入力映像に含まれたピクセルブロックに前記複数の境界検出フィルタをそれぞれ適用して複数のフィルタ出力値を獲得し、前記複数のフィルタ出力値のうちの一つに基づいて前記ピクセルブロックに対する境界情報を獲得してよい。
なお、前記プロセッサは、前記複数のフィルタ出力値のうち最小の負数値の大きさ又は最大の絶対値に基づいて、前記ピクセルブロックに対する境界情報を獲得してよい。
なお、前記プロセッサは、前記複数のフィルタ出力値のうち、前記最小の負数値の大きさ又は前記最大の絶対値に臨界値を適用してノーマライジングし、前記ノーマライジングによって獲得された加重値を前記獲得されたシャドウに適用して前記出力映像を獲得してよい。
なお、前記プロセッサは、前記シャドウを適用する境界領域の特性に基づいて、前記複数の境界検出フィルタの数又はサイズのうち少なくとも一方を決定してよい。
なお、前記複数の境界検出フィルタは、第1方向のライン単位で同一のフィルタ係数が重複する第1フィルタ、第2方向のライン単位で同一のフィルタ係数が重複する第2フィルタ、第3方向のライン単位で同一のフィルタ係数が重複する第3フィルタ及び第4方向のライン単位で同一のフィルタ係数が重複する第4フィルタを含んでよい。
なお、前記複数の境界検出フィルタの数がN個である場合、n番目の境界検出フィルタの方向性は、数式n番目の境界検出フィルタの角度=180*(n−1)/Nを通じて算出されてよい。
なお、ディスプレイを更に含み、前記プロセッサは、前記出力映像を出力するように前記ディスプレイを制御し、前記出力映像は、4K UHD(Ultra High Definition)映像又は8K UHD映像であってよい。
一方、本発明の一実施形態に係る映像処理装置の映像処理方法は、入力映像のフィルタリングに基づいて臨界範囲の信号をシャドウで獲得するステップと、異なる方向性に関連する複数の境界検出フィルタを前記入力映像に適用して境界情報を獲得するステップと、前記境界情報によって識別される領域に前記シャドウを適用して前記入力映像から出力映像を獲得するステップとを含む。
この場合、前記臨界範囲の信号をシャドウで獲得するステップは、前記入力映像を二次微分フィルタでフィルタリングして出力信号を獲得し、獲得された前記出力信号で負の信号をクリッピングして前記シャドウを獲得してよい。
ここで、前記獲得されたシャドウは、前記入力映像内に含まれた客体のうち第1臨界値未満のピクセル値を有する客体の内部境界、又は前記入力映像内に含まれた客体のうち前記第1臨界値より大きい第2臨界値以上のピクセル値を有する客体の外部境界のうち、少なくとも一方に対応してよい。
なお、前記境界情報は、前記境界領域の位置情報及び強度情報を含み、前記出力映像を獲得するステップは、前記位置情報に基づいて前記境界領域を識別し、前記識別された境界領域に対応する強度情報を前記識別された境界領域に対応するシャドウに適用し、前記強度情報の適用されたシャドウを前記識別された境界領域に挿入してよい。
なお、前記臨界範囲の信号をシャドウで獲得するステップは、前記入力映像に二次微分フィルタを適用して前記シャドウを獲得し、前記複数の境界検出フィルタのサイズは前記二次微分フィルタより大きくてよい。
なお、前記境界情報を獲得するステップは、前記入力映像に含まれたピクセルブロックに前記複数の境界検出フィルタをそれぞれ適用して複数のフィルタ出力値を獲得し、前記複数のフィルタ出力値のうちの一つに基づいて前記ピクセルブロックに対する境界情報を獲得してよい。
なお、前記境界情報を獲得するステップは、前記複数のフィルタ出力値のうち最小の負数値の大きさ又は最大の絶対値に基づいて、前記ピクセルブロックに対する境界情報を獲得してよい。
なお、本発明の一実施形態に係る電子装置のプロセッサによって実行される場合、前記電子装置が動作を行うようにするコンピュータ命令を保存する非一時的なコンピュータ読み取り可能な媒体において、前記動作は、入力映像のフィルタリングに基づいて臨界範囲の信号をシャドウで獲得するステップと、異なる方向性に関連する複数の境界検出フィルタを前記入力映像に適用して境界情報を獲得するステップと、前記境界情報によって識別される領域に前記シャドウを適用して前記入力映像から出力映像を獲得するステップとを含む。
以上説明したように、本発明によれば、高解像度の映像から客体の境界を正確に検出してシャドーイングを適用することにより、ノイズ(noise)の増幅を最小化しつつ客体の輪郭のみをくっきりとさせて映像の鮮明度を向上させることができる。
本発明の一実施形態に係る映像処理装置の実現例を説明するための図である。 本発明の一実施形態に係る映像処理装置の構成を示すブロック図である。 本発明の理解を促すための二次微分信号の特性を説明するための図である。 本発明の一実施形態に係るラプラシアンフィルタの多様な例示を示す図である。 本発明の一実施形態に係るラプラシアンフィルタ適用方法を説明するための図である。 本発明の一実施形態に係るフィルタの出力を説明するための図である。 本発明の一実施形態に係る複数の境界検出フィルタを説明するための図である。 本発明の別の実施形態に係る複数の境界検出フィルタを説明するための図である。 本発明の別の実施形態に係る複数の境界検出フィルタを説明するための図である。 本発明の一実施形態に係る入力映像の一例を示す図である。 本発明の一実施形態に係る二次微分映像を示す図である。 本発明の一実施形態に係るシャドウ映像を示す図である。 本発明の一実施形態に係る出力映像を示す図である。 本発明の一実施形態に係る境界検出効果を説明するための図である。 本発明の一実施形態に係る境界検出効果を説明するための図である。 本発明の一実施形態に係る境界検出効果を説明するための図である。 本発明の一実施形態に係る映像処理方法の一実現例を説明するための図である。 本発明の別の実施形態に係る映像処理装置の一実現例を示す図である。 本発明の一実施形態に係るシャドウ挿入効果を説明するための図である。 本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。 本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。 本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。 本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。 本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。 本発明の一実施形態に係る映像処理方法を説明するためのフローチャートである。
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。
本明細書で使われる用語について概略に説明し、本発明について具体的に説明する。
本発明の実施形態で使われる用語は、本発明における機能を考慮しつつ可能な限り、現在広く使われる一般的な用語を選択しているが、それは、当分野に携わる技術者の意図又は判例、新たな技術の出現などによって変わることがある。なお、特定の場合は、出願人が任意に選定した用語もあり、この場合は該当する発明の説明部分で詳細にその意味を記載する。よって、本発明で使われる用語は、単なる用語の名称はなく、その用語のもつ意味と本発明の全般に亘る内容に基づいて定義されるべきである。
第1、第2などの用語は、様々な構成要素を説明するうえで使われてよいが、構成要素は用語によって限定されてはならない。用語は、一つの構成要素を別の構成要素から区別する目的としてのみ使われる。
単数の表現は、文脈上明白にそうでないことを意味しない限り、複数の表現を含む。本出願において、「含む」又は「構成される」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものが存在することを指定するためのものであって、一つ又はそれ以上の別の特徴や数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものの存在又は付加可能性を予め排除しないと理解されるべきである。
A又はBのうち少なくとも一つという表現は、「A」又は「B」、又は「A及びB」のうちいずれか一つを示すものとして理解されるべきである。
本発明において、「モジュール」或いは「部」は、少なくとも一つの機能や動作を行い、ハードウェア又はソフトウェアで実現されたり、ハードウェアとソフトウェアとの結合で実現されてよい。なお、複数の「モジュール」或いは複数の「部」は、特定のハードウェアで実現される必要がある「モジュール」或いは「部」を除いては、少なくとも一つのモジュールで一体化されて少なくとも一つのプロセッサ(図示せず)で実現されてよい。
以下では、添付の図を参照し、本発明の実施形態に対して本発明の属する技術分野で通常の知識を有する者が容易に実施できるように詳細に説明する。しかし、本発明は、複数の異なる形態で実現されてよく、ここにおいて説明する実施形態に限定されない。そして、図面において、本発明を明確に説明するために、発明と関係のない部分は省略しており、明細書の全体を通して類似する部分については、類似する図面符号を付する。
図1は、本発明の一実施形態に係る映像処理装置の実現例を説明するための図である。
映像処理装置100は、図1に示すように、テレビ又はセットトップボックスで実現されてよいが、それに限定されるものではなく、スマートフォン、タブレットパソコン、ノートパソコン、HMD(Head Mounted Display)、NED(Near Eye Display)、LFD(Large Format Display)、Digital Signage(デジタル看板)、DID(Digital Information Display)、ビデオウォール(video wall)、プロジェクタディスプレイ、カメラ、カムコーダ、プリンタなどのように、映像処理及び/又はディスプレイ機能を備えた装置なら、限定されることなく適用可能である。
映像処理装置100は、多様な圧縮映像又は様々な解像度の映像を受信することができる。例えば、映像処理装置100は、MPEG(Moving Picture Experts Group)(例えば、MP2、MP4、MP7など)、JPEG(joint photographic coding experts group)、AVC(Advanced Video Coding)、H.264、H.265、HEVC(High Efficiency Video Codec)などで圧縮された形態で映像を受信することができる。又は、映像処理装置100は、SD(Standard Definition)、HD(High Definition)、Full HD、Ultra HD映像のうち、何れか一つの映像を受信することができる。
一実施形態によって、映像処理装置100がUHD TVで実現されるとしても、UHDコンテンツそのものが不足するために、SD(Standard Definition)、HD(High Definition)、Full HDなどの映像(以下、低解像度の映像という)が入力される場合が多い。この場合、入力された低解像度の映像をUHD映像(以下、高解像度の映像という)に変換して利用することができる。しかし、映像の変換過程で映像のテクスチャ(texture)又はエッジがぼやけて(Blur)ディテールが低下するという問題がある。例えば、バウンダリーは、視聴者にくっきり見えないおそれがある。
別の実施形態によって、高解像度の映像が入力されるとしても、映像圧縮及び解凍などの過程でディテールが損なわれる問題があった。デジタル映像は、画素数が増加するにつれてより多くのデータを必要とするようになり、大容量のデータを圧縮するようになる場合、圧縮によるディテール低下は避けられないためである。ディテールの低下は、原本映像に関連する圧縮解凍(Decompression)が映像の圧縮段階で行われた後に増加するイメージの歪曲を含むことがある。
一方、映像には、様々な形態のエッジが存在するが、一例として、複数の方向を有する複雑な(complex)エッジと、方向が明確な真っすぐな(straight)エッジの二種類に区分することができる。とりわけ、主に客体の境界(boundary)やテキスト等で示す方向が明確な真っすぐなエッジは、映像を視聴するユーザに最優先的に認知される要素であるため、真っすぐなエッジのエンハンス(Enhancement)又はプレゼンテーション(presentation)に特化した処理は、映像でディテールの形状(appearance)又はクォリティー(quality)を向上させる重要な技術である。
それにより、以下では、方向が明確な真っすぐなエッジを正確に検出してシャドーイング効果を適用することにより、映像のディテールを向上させる多様な実施形態について説明する。
図2は、本発明の一実施形態に係る映像処理装置の構成を示すブロック図である。図2によると、映像処理装置100は、入力部110及びプロセッサ120を含む。
入力部110は、様々なタイプのコンテンツを入力される。例えば、入力部110は、AP基盤のWi−Fi(Wireless LANネットワーク)、ブルートゥース(登録商標(Bluetooth))、Zigbee、有/無線LAN(Local Area Network)、WAN(Wide Area Network)、イーサネット(登録商標(Ethernet))、IEEE 1394、HDMI(登録商標(High−Definition Multimedia Interface))、USB(Universal Serial Bus)、MHL(Mobile High−Definition Link)、AES/EBU(Audio Engineering Society/European Broadcasting Union)、オプティカル(Optical)、コアキシャル(Coaxial)などのような通信方式を通じて外部装置(例えば、ソース装置)、外部保存媒体(例えば、USBメモリ)、外部サーバ(例えば、ウェブハード)等からストリーミング又はダウンロード方式で映像信号を入力されることができる。ここで、映像信号は、SD(Standard Definition)、HD(High Definition)、Full HD又はUltra HD映像のうち、何れか一つのデジタル映像信号であってよいが、それに限定されるものではない。
プロセッサは、映像処理装置100の動作全般を制御する。
一実施形態によって、プロセッサ120は、デジタル映像信号を処理するデジタルシグナルプロセッサ(digital signal processor(DSP))、マイクロプロセッサ(microprocessor)、AI(Artificial Intelligence)プロセッサ、TCON(Time
controller)で実現されてよい。ただし、それに限定されるものではなく、中央処理装置(central processing unit(CPU))、MCU(Micro Controller Unit)、MPU(Micro Processing Unit)、コントローラ(controller)、アプリケーションプロセッサ(Application Processor(AP))、又はコミュニケーションプロセッサ(Communication Processor(CP))、ARMプロセッサのうち、一つ又はそれ以上を含むか、当該用語で定義されてよい。なお、プロセッサ140は、プロセッシングアルゴリズムが内蔵されたSoC(System on Chip)、LSI(Large Scale Integration)で実現されてよく、FPGA(Field Programmable Gate Array)形態で実現されてよい。
一実施形態によると、プロセッサ120は、少なくとも一つのCPUを含んでよい。一実施形態によると、プロセッサ120は、少なくとも一つのプロセッサを含んでよい。例えば、一つのプロセッサは、少なくとも一つのメモリから命令(instructions)及びデータを読み込む(read)ことができる。例えば、少なくとも一つのメモリは、実行可能な命令を含むプログラムコードを保存することができる。一実施形態によると、プログラムコードは、少なくとも一つのプロセッサが図14のロジックを行うようにすることができる。
プロセッサ120は、入力映像を映像処理して出力映像を獲得する。ここで、入力映像は、SD(Standard Definition)、HD(High Definition)、Full HD映像などであってよい。
具体的に、プロセッサ120は、入力映像から境界映像を検出し、検出された境界領域にシャドウを挿入(又は、検出された境界領域をシャドウ処理)して出力映像を獲得することができる。ここで、出力映像は、UHD(Ultra High Definition)映像、特に、4K(3840x2160) UHD映像又は8K(7680x4320) UHD映像であってよく、それに限定されるものではない。一例によって、入力映像に対してシャドウ処理前に様々な前処理が行われてよいが、以下では説明の便宜のために、入力映像と前処理された映像とを区分せずに、入力映像と称する。なお、本発明の一実施形態に係るシャドウ処理は、メモリ(図示せず)に予め保存された映像に対して行われてよいが、以下では説明の便宜のために入力映像に限定する。
一方、以下では、説明の便宜のために、シャドウを獲得(又は、生成)する方法を先に説明し、入力映像から含まれた境界に対する情報、即ち、境界情報を獲得する方法について説明する。しかし、実現例によって、シャドウの生成及び境界情報の獲得は、並列的に行われるか、何れか一つが別の一つの前に行われることができる。
本発明の一実施形態によると、プロセッサ120は、入力映像に基づいてシャドウを生成し、生成されたシャドウを境界領域に適用して出力映像を獲得することができる。
<シャドウの生成>
一実施形態によってプロセッサ120は、入力映像をフィルタリングし、フィルタリングされた信号から臨界範囲の信号をシャドウで獲得することができる。ここで、フィルタリングされた信号とは、入力映像に適用されるフィルタの出力信号であってよく、フィルタリングされたデータ又はフィルタリングされた値などの用語と称されてよい。
通常、入力映像に一次又は二次エッジ検出フィルタを適用すると、エッジの強度及びエッジの方向情報(勾配に垂直方向)を含むフィルタリングされた信号を獲得することができるようになる。ここで、一次エッジ検出フィルタとは、一次微分信号に基づいてエッジを検出するフィルタを意味し、二次エッジ検出フィルタとは、二次微分信号に基づいてエッジを検出するフィルタを意味する。エッジは、空間的に隣接するピクセル値が急激に変化する領域を意味することができる。例えば、エッジは、映像の輝度の低い値から高い値に、又は、高い値から低い値に急激に変化する領域であってよい。
図3Aに示すように、一次微分信号はエッジ部分で負の値又は正の値を有する一方で、二次微分信号はエッジ部分で符号が入れ替わる零交差(zero crossing)の特性を有するようになる。具体的に、二次微分信号は、エッジ部分で入力信号の減少傾向が強くなるか増加傾向が弱くなる場合は負の値を、逆に、入力信号の減少傾向が弱くなるか増加傾向が強くなり始める場合は正の値を有するようになる。即ち、二次微分信号は、暗い客体の内部境界では正の値、外部境界では負の値を有し、明るい客体の外部境界では正の値、内部境界では負の値を有するようになる。
本発明の一実施形態によると、プロセッサ120は、このような二次微分信号の特性に基づいてシャドウを生成することができる。例えば、プロセッサ120は、二次微分信号で正又は負の信号、即ち正(+)の値又は負(−)の値を有する信号に基づいてシャドウを生成することができる。
一実施形態によって、プロセッサ120は、入力映像に二次微分フィルタを適用してフィルタの出力から負(−)の値を有する信号に基づいてシャドウを生成することができる。例えば、二次微分フィルタは、ラプラシアンフィルタ(Laplacian Filter)で実現されてよい。ラプラシアンフィルタは、フィルタの中心から左右(又は、上下左右)が対称となり、係数の和が0であり、中心から離れるほど値が減少して符号が正数から負数に変わる形態を有してよい。即ち、中心係数は0を含むノンネガティブ(non−negative)数であってよい。このように、中心係数が正数であるラプラシアンフィルタの出力は、二次微分信号の反対になる符号を有するようになる。それにより、プロセッサ120は、二次微分信号を利用するようになる場合、二次微分信号に含まれた正の信号の符号を反転してシャドウを生成することができる。場合によって、プロセッサ120は、ラプラシアンフィルタの出力のうち、負の信号を変形(又はコンディショニング)してシャドウを生成することができる。ここで、変形(又は、コンディショニング)とは、負の信号に加重値を適用するか、予め設定された大きさの信号を引いたり足す作業であってよい。
図3Bは、本発明の一実施形態に係るラプラシアンフィルタの多様な例示を示す図である。即ち、ラプラシアンフィルタは、n*nの二次元形態であってよいが、二次元ピクセル領域に適用されてよい。図3Bにおいては、3*3のラプラシアンフィルタを示している。この場合、シャドウ生成に用いられるフィルタは、後述の境界検出の際に用いられるフィルタのサイズより小さく実現されてよいが、それに限定されるものではない。例えば、フィルタのサイズは、一次元フィルタで係数の数、nを意味することができる。
一方、入力映像にラプラシアンフィルタを適用するとは、入力映像にラプラシアンフィルタを畳み込む(convolution)ことを意味することができる。畳み込みは、加重値を有するフィルタを用いた映像処理技法として、入力映像のピクセル値とフィルタに含まれた対応する加重値(又は、係数)をそれぞれ掛け算した後、その和を獲得する技法を意味する。それにより、畳み込みは、通常、プロダクトの和を意味することができる。各プロダクトから被乗数(multiplicand)は、入力信号及びフィルタ係数から獲得されてよい。
ここで、フィルタをマスク、ウィンドウ又はカーネルともいう。即ち、図3Bに示すラプラシアンフィルタに含まれた数値が加重値(対応するピクセルをどのくらい利用するかを示す数値)であってよい。
図3Cは、本発明の一実施形態に係るラプラシアンフィルタ適用方法を説明するための図である。図3Cに示すように、P7が現在処理中のピクセルである場合、P7を中心ピクセルとしてラプラシアンフィルタを適用することができる。この場合、P7に対応する畳み込みP7C値は、P1*0+P2*(−1)+P3*0+P6*(−1)+P7*4+P8*(−1)+P11*0+P12*(−1)+P13*0の演算値で求めることができる。残りのピクセル値に対応する畳み込み値も同様の方式の演算を通じて求められるようになる。ただし、映像の角に位置するピクセル(例えば、P1ないしP5、P6、P11、P16、P21など)は、フィルタを適用するための周辺のピクセルが不足するようになる。この場合、元々の映像に縁(例えば、ピクセル値0)を追加して映像を大きくして作った次のフィルタを適用するか、元々の映像の外部境界と同じ色を有するピクセルを追加した次のピクセルを適用することができる。
図4は、本発明の一実施形態に係るフィルタの出力を説明するための図である。
図3Bに示すように、ラプラシアンフィルタは、二次元(2−dimentional)であってよいが、図4では、説明の便宜のため、一次元信号に一次元フィルタを適用するものとして示している。図3Cにおいて、例えば、入力イメージに対して16の入力サンプルが存在し、9の出力値が存在する。フィルタは、ノンゼロ値5個を含む9個の値を有する。例えば、出力値は、シャドウを獲得するか、バウンダリー領域を識別するのに用いられるフィルタ出力になってよい。
図4は、図3Bに示すフィルタで一番目のフィルタ{−1、2、−1}を一次元信号に適用した場合のフィルタの出力値を示す図である。図4に示すcase#0及び#1でフィルタの出力412、422を見ると、入力信号411、421の減少傾向が強くなるか増加傾向が弱くなる場合には正の値を、逆に、入力信号411、421の減少傾向が弱くなるか増加傾向が強くなり始める場合には負の値を有するようになる。即ち、中心係数が正数のラプラシアンフィルタを利用するようになると、二次微分信号と反対符号を有する出力を獲得することができるようになる。この場合、プロセッサ120は、中心係数が正数のラプラシアンフィルタ出力から負の値を有する信号を用いてシャドウを獲得することができるようになる。
本発明の一実施形態によると、プロセッサ120は、シャドウを生成するために入力信号を与えた範囲に制限して出力信号を生成するクリッピング関数を用いることができる。例えば、プロセッサ120は、入力映像Iにラプラシアンフィルタfを適用した後、負数部分のみをクリッピングしてシャドウSを生成する。それは、下記のように、数式1で表されてよい。
(数式1)
S=min{0,fI}
数式1において、*は畳み込みを意味することができ、畳み込み結果が0と比較された後、最小値が数式1の結果になり得る。それにより、S値は負数値になれない。
図4に示すcase#0及び#1で、ラプラシアンフィルタの出力のうち負の値に基づいて獲得されたシャドウ413、423を入力信号411、421に適用するようになると、図4に示すような出力信号414、424を獲得することができるようになる。例えば、入力信号411、421のピクセル値(又は、階調値)に負数値のシャドウ413、423が足され、それにより、出力信号414、424でシャドウ413、423の足されたピクセル領域のピクセル値(又は、階調値)は、入力信号411、421のピクセル値(又は、階調値)より小さい値を有するようになる。ただし、それは理解を促すために説明されたものであって、本発明の一実施形態によると、生成されたシャドウは、後述のように、境界情報に基づいて入力映像に適用されてよい。
一方、本発明の別の実施形態によると、プロセッサ120は、ディープラーニング基盤の人工神経網(又は、深層人工神経網)、即ち、学習ネットワークモデルを用いてシャドウを生成することができる。学習ネットワークモデルは、入力映像に対して連続的な合成倍演算を通じてユーザの望む出力データを得ることができるように設計され、数多くの映像を学習するシステム形態で実現されてよい。例えば、エッジ検出フィルタに含まれた係数(又は、パラメータ)又はフィルタのサイズのうち少なくとも一つが適切なシャドウ映像を出力するように学習されてよい。一例として、学習ネットワークモデルは映像が入力されると、入力映像の特性に基づいて強度の調整されたシャドウを含む映像(以下、シャドウ映像)を出力するように学習されてよい。別の例として、学習ネットワークモデルは、入力映像及びシャドウ映像(例えば、二次微分信号に基づいて生成されたシャドウ映像)が入力されると、入力映像の特性に基づいて強度の調整されたシャドウを含むシャドウ映像を出力するように学習されてよい。ここで、入力映像の特性は映像の解像度、タイプ、エッジ領域分布、テクスチャ領域の分布、色相分布など、入力映像に関連する多様な映像特性を含んでよい。
例えば、学習ネットワークモデルは、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、LSTM(Long Short Term Memory Network)、GRU(Gated Recurrent Units)又はGAN(Generative Adversarial Networks)のうち、少なくとも一つのDNN(Deep Neural Network)モデルで実現されてよい。
<境界検出>
プロセッサ120は、シャドウ生成とは別に、入力映像で含まれた境界に対する情報、即ち、境界情報を獲得することができる。本発明において、境界(Boundary)とは、方向性が明確で真っすぐなエッジ、及び/又は方向性が明確で臨界値以上の厚さを有するエッジを意味することから、方向が複雑なエッジとは区分することができる。例えば、境界は、客体又はテキストなどの境界になってよい。例えば、真っすぐなエッジは方向性が同じバウンダリー検出フィルタが隣接するピクセルブロックに対して高い値を有する場合に識別され得る。複雑なエッジは、方向性が異なるバウンダリー検出フィルタが隣接するピクセルブロックに対して高い値を有する場合に識別され得る。
このように、境界を検出する理由は、方向が明確で真っすぐなエッジにのみシャドーイングを適用するためである。8k映像のような高解像度の映像で方向が明確で真っすぐなエッジ、即ち、境界に対するシャドーイングは画質を向上させることができるが、方向が複雑なエッジまでシャドーイングを適用するようになると、ノイズが増加して逆に画質を悪化させるおそれがあるためである。それにより、シャドーイングの追加又は挿入のための適切なエッジを決定することが重要である。
境界情報は、境界として検出されたピクセルに対する位置(position)情報(又は、座標情報)、強度(magnitude)情報又は方向(direction)情報のうち、少なくとも一つを含む情報であってよい。一例によって、境界情報は、マップ(map)又はテーブル(table)のうち少なくとも一つの形態で実現されてよい。例えば、境界情報は、各ピクセルブロックに対応する強度情報がピクセルブロック単位の行列形態で配列される構造を有してよい。本明細書で「ピクセルブロック(pixel block)」は、少なくとも一つのピクセルを含む隣接するピクセルの集合を意味し、「領域(region)」は、映像の一部分を指す用語として少なくとも一つのピクセルブロック又はピクセルブロックの集合を意味することができる。
具体的に、プロセッサ120は、入力映像に異なる方向性に関連する複数の境界検出フィルタを適用して境界情報を獲得することができる。ここで、境界検出フィルタは、n次微分フィルタ(例えば、一次又は二次微分フィルタ)で実現されてよい。例えば、プロセッサ120は、境界検出のために二次微分フィルタであるラプラシアンフィルタを利用することができる。ただし、それに限定されるものではなく、場合によって、ロバーツフィルタ(Roberts Filter)、ソーベルフィルタ(Sobel Filter)、方向フィルタ(Directional Filter)、傾斜フィルタ(Grandient Filter)、差フィルタ(Difference Filter)又はプレヴィットフィルタ(Prewitte Filter)のうち少なくとも一つが用いられてよい。例えば、プレヴィットフィルタ(又はカーネル)は、水平エッジの検出のための一次微分フィルタであり、3*3マトリックスで配列された9のフィルタ係数を含むことができる。マトリックスの一番目のロー(又は行)は[1 1 1]を含み、二番目のローは[0 0 0]を含み、三番目のローは[−1 −1 −1]を含んでよい。ただそ、境界検出の際に、シャドウの生成時に用いられるフィルタと同じタイプのフィルタを用いることが望ましい。例えば、シャドウ生成時に二次微分フィルタを用いて境界検出の際に一次微分フィルタを利用する場合、検出された境界の位置がシャドウ生成から検出されるエッジ位置と差が生じるためである。ただし、必ずしも一致する領域にシャドウを適用しない場合、シャドウ生成に用いられるフィルタと異なるタイプのフィルタを用いて境界を検出することも可能である。
以下では、説明の便宜のために、ラプラシアンフィルタを用いて境界を検出する場合を想定して説明する。
ピクセル数の多い高解像度の映像では、検出すべきエッジを成すピクセルの数も増加するようになる。それにより、エッジ検出のためのフィルタのサイズも増加するようになる。例えば、圧縮された低解像度の入力映像を高解像度のディスプレイに拡大して出力する場合、入力映像に含まれたエッジも拡大するが、このような拡大映像からエッジ検出のためには、対応する大きいサイズのフィルタを利用しなければならない。それにより、境界検出に用いられるラプラシアンフィルタは、上述のシャドウ生成に用いられるラプラシアンフィルタより大きいサイズであってよい。例えば、5*5以上(又は、7*7以上)のサイズであってよいが、それに限定されるものではない。本発明の一実施形態によると、シャドウ生成の際には、小さいエッジ単位で検出してシャドウを生成するようになると、より自然なシャドウ生成が可能であるため、シャドウ生成時には境界検出の際より小さいフィルタを用いてシャドウを生成することができる。
一例によって、複数の境界検出フィルタの数がNである場合、n番目の境界検出フィルタは180*(n−1)/N角度の方向性を有してよい。ここで、複数の境界検出フィルタは、4以上であってよい。例えば、複数の境界検出フィルタは、第1方向のライン単位で同じフィルタ係数が重複する(又は、繰り返される)第1フィルタ、第2方向のライン単位で同じフィルタ係数が重複する(又は、繰り返される)第2フィルタ、第3方向のライン単位で同じフィルタ係数が重複する(又は、繰り返される)第3フィルタ、第4方向のライン単位で同じフィルタ係数が重複する(又は、繰り返される)第4フィルタを含んでよい。ただし、フィルタのサイズが大きくなるにつれ、複雑なエッジと真っすぐなエッジとを区分する性能が低下するおそれがある。それにより、本発明では、フィルタのサイズに比例して異なる方向性を有する複数のフィルタを追加して方向性が明確な真っすぐなエッジ、即ち、境界を正確に検出することができる。
図5は、本発明の一実施形態に係る複数の境界検出フィルタを説明するための図である。図5は、一実施形態によって複数の境界検出フィルタが4つであり、複数の境界検出フィルタのサイズが5*5サイズであると想定しているが、それに限定されるものではない。なお、複数の境界検出フィルタは、対応する方向にラプラシアンフィルタの形態を有し、対応する方向の垂直方向に係数{−19、6、26、6、−29}が繰り返される対称構造の二次元フィルタであると想定しているが、それに限定されるものではない。
この場合、n番目の境界検出フィルタが180*(n−1)/N角度の方向性を有するように実現すると、図示のように、第1境界検出フィルタG(1)は0度の方向性を有し、第2境界検出フィルタG(2)は180*(2−1)/4=45度の方向性を有する。同様に、第3境界検出フィルタG(3)、第4境界検出フィルタG(4)は、それぞれ90度及び135度の方向性を有する。このように、4つの境界検出フィルタを用いる場合、
Figure 0006841888
(+及び×)の方向性を有するエッジを検出することができるようになる。例えば、0度、45度、90度、135度、180度、225度、270度、315度の方向のエッジを検出することができるようになる。
この場合、第2ないし第4境界検出フィルタは、第1境界検出フィルタを対応する角度の分回転させて獲得することができる。それにより、第1境界検出フィルタのみがメモリ(図示せず)に保存されていても、第2ないし第4境界検出フィルタを獲得することができるようになる。ただし、実施形態によって、第1ないし第4境界検出フィルタが全てメモリ(図示せず)に保存されることができる。
図6A及び図6Bは、本発明の別の実施形態に係る複数の境界検出フィルタを説明するための図である。
図6Aは、複数の境界検出フィルタが8つの二次微分フィルタである実施形態を示す。複数の境界検出フィルタは、対応する方向にラプラシアンフィルタの形態を有するように実現されてよいが、それに限定されるものではない。
この場合、n番目の境界検出フィルタが180*(n−1)/N角度の方向性を有するように実現すると、図示のように、第1境界検出フィルタG(1)は0度の方向性を有し、第2境界検出フィルタG(2)は180*(2−1)/8=22.5度の方向性を有する。同様に、第3ないし第8境界検出フィルタG(3)、G(4)、G(5)、G(6)、G(7)、G(8)は、それぞれ45度及び67.5度、90度、112.5度、135度、157.5度の方向性を有する。即ち、図5に示す実施形態に比べて、22.5度、67.5度、112.5度、157.5度の方向性を有するフィルタが追加されてよい。このように、8つの境界検出フィルタを用いる場合、
Figure 0006841888
の方向性を有するエッジを検出することができるようになる。例えば、0度、22.5度、45度、67.5度、90度、112.5度、135度、157.5度、180度、202.5度、225度、247.5度、270度、292.5度、315度、337.5度の方向のエッジを検出することができるようになる。
この場合、第2ないし第8境界検出フィルタは、第1境界検出フィルタを対応する角度の分回転させて獲得することができる。それにより、第1境界検出フィルタのみがメモリ(図示せず)に保存されているとしても、第2ないし第8境界検出フィルタを獲得することができるようになる。ただし、実施形態によって、第1ないし第8境界検出フィルタが全てメモリ(図示せず)に保存されることができる。
一方、フィルタの係数のうち、中央に位置する中心係数は検出しようとする境界領域の厚さに応じて異なってよい。例えば、中心係数が大きい数値ほど細いエッジを検出することができる。それにより、プロセッサ120は検出しようとする境界の厚さに基づいて対応する係数を有するフィルタを適用することができる。
図6Bは、複数の境界検出フィルタが8つの一次微分フィルタである実施形態を示す。
図6Aの図示と類似するように、8つのフィルタG(1)ないしG(8)のそれぞれは、0度、22.5度、45度、67.5度、90度、112.5度、135度及び157.5度の方向性を有する。なお、図6Aと同様に、
Figure 0006841888
の方向性を有するエッジを検出することができるようになる。例えば、0度、22.5度、45度、67.5度、90度、112.5度、135度、157.5度、157度、180度、202.5度、225度、247.5度、270度、292.5度、315度、337.5度の方向のエッジを検出することができるようになる。
例えば、図6A及び図6Bに示す境界検出フィルタのサイズは、図5に示す境界検出フィルタのサイズより大きい場合であり、この場合、図5に示す境界検出フィルタより太いエッジを検出することができるようになる。ただし、フィルタのサイズが大きくなるにつれて複雑なエッジと真っすぐなエッジとを区分する性能が低下するおそれがあるため、図6A及び図6Bに示すように、図5に比べて異なる方向性を有する複数のフィルタが追加的に用いられてよい。
本発明の一実施形態によると、プロセッサ120は検出しようとする境界領域の特性に応じて異なるサイズのフィルタを適用することができる。
一例として、プロセッサ120は、第1臨界値以上の厚さを有するエッジのにみシャドウを適用しようとする場合、当該厚さに対応するサイズの第1フィルタを利用することができる。
別の例として、プロセッサ120は、第1臨界値未満かつ第2臨界値以上の厚さを有するエッジにのみシャドウを適用しようとする場合、当該厚さに対応するサイズの第2フィルタを利用することができる。
更に別の例として、プロセッサ120は、第2臨界値未満の厚さを有するエッジにのみシャドウを適用しようとする場合、当該厚さに対応するサイズの第3フィルタを利用することができる。ここで、第2フィルタのサイズは第1フィルタのサイズより小さく、第3フィルタのサイズは第2フィルタのサイズより小さくてよい。この場合、第1フィルタは、周波数ドメインで相対的に低周波帯域信号(例えば、厚いエッジ)をフィルタリングするローパスフィルタであってよく、第2フィルタは、中間帯域信号(例えば、中間厚さのエッジ)をフィルタリングする帯域通過フィルタ、第3フィルタは、高周波帯域信号(例えば、細いエッジ)をフィルタリングする高周波フィルタであってよい。
一方、プロセッサ120は、ピクセルブロックに複数の境界検出フィルタをそれぞれ適用して複数のフィルタ出力値を獲得し、複数のフィルタ出力値のうち少なくとも一つに基づいてピクセルブロックに対する境界情報を獲得することができる。ピクセルブロックに境界検出フィルタを適用する方法は、図3Bに示すような畳み込み方式と同様であるため、詳細な説明は、省略する。ここで、複数のフィルタ出力値は、映像に含まれた境界の強度、位置情報、又は方向情報のうち少なくとも一つを含んでよい。
複数の境界検出フィルタの方向性が異なるため、各ピクセルブロックごとに複数のフィルタ出力値が異なるようになる。例えば、プロセッサ120が二次微分フィルタを用いる場合、第1ピクセルブロックの場合、第1境界検出フィルタの出力値が最も小さい負数値を含み、第2ピクセルブロックの場合、第2境界検出フィルタの出力値が最も小さい負数値を含んでよい。即ち、当該ピクセルブロックに含まれたエッジの方向性と最も類似する方向性を有する境界検出フィルタの出力値が最も小さい負数値を含んでよい。
一実施形態によって、プロセッサ130が中心係数が正数である二次微分フィルタ、例えば、ラプラシアンフィルタを用いて境界を検出する場合、複数のフィルタ出力値のうち最も大きい負数値の大きさに基づいて境界情報を獲得することができる。それは、上述のように、二次微分フィルタの出力値は境界領域で符号が入れ替わる零交差特性を有し、本発明の一実施形態に係るシャドウは、二次微分フィルタの出力値のうち負の値に基づいて生成されているためである。それにより、検出された境界は、生成されたシャドウ領域のうち、少なくとも一部と一致してよい。なお、複数のフィルタ出力値のうち最も小さい負数値を用いる理由は、各ピクセルブロックに含まれた境界の方向性に応じて各二次微分フィルタの出力値の大きさが異なることがあるためである。即ち、当該ピクセルブロックに含まれたエッジの方向性と最も類似する方向性を有する二次微分フィルタの出力値が最も小さい負数値になってよい。
このような過程は、以下の数式2のように、max関数を用いて表されてよい。
(数式2)
=max{0,−(G[n]*I)}
ここで、Boは、複数のフィルタ出力値のうち最も小さい負数値の大きさ、G[n]はn番目のフィルタ、Iは入力イメージ、G[n]*Iは、畳み込みによって決定されるn番目のフィルタの出力値であってよい。例えば、数値上、−10は−9より小さい値になってよい。
一例によって、プロセッサ120は、複数のフィルタ出力値のうち最も小さい負数値の大きさBoをノーマライジングして境界情報を獲得することができる。例えば、プロセッサ120は、以下のような数式3に基づいてBoを変換して境界マップBを獲得することができる。
(数式3)
Figure 0006841888
数式3に示すように、複数のフィルタ出力値のうち最も小さい負数値の大きさBoから臨界値Thを引いた値と1にmin関数を適用すると、0と1との間の値にノーマライジングされた境界マップBを獲得することができる。このように獲得された境界マップBは、シャドウに対する加重値(weight)として適用されてよい。即ち、強度が臨界値(Threshold)以下に低い強度は加重値を0とし、強度が高まるにつれてそれに比例して加重値が大きくなる境界マップBを獲得することができる。
この場合、臨界値と勾配値は予め定義された固定値であるか、映像の特性、映像のタイプ、境界の強度、シャドウのタイプ又はシャドウの強度のうち、少なくとも一つに応じて可変する値であってよい。例えば、臨界値は、検出しようとする境界の強度に応じて異なってよい。一例として、強い強度の境界を検出しようとする場合、臨界値を相対的に小さい値に設定し、弱い強度の境界を検出しようとする場合、臨界値を相対的に大きい値に設定することができる。勾配(slope)値は最も小さい負数値の大きさBoと境界情報Bが比例する程度を調節することができる。それにより、加重値を強度に比例して相対的に大きく調整しようとする場合、勾配値を大きい値に設定し、加重値を強度に比例して相対的に小さく調整しようとする場合、勾配値を小さい値に設定することができる。
別の実施形態により、プロセッサ130が一次微分フィルタを用いて境界を検出する場合、複数のフィルタ出力値のうち、最大の絶対値に基づいて境界情報を獲得することができる。一次微分フィルタの出力値は、図3Aに示すように客体の内部及び外部境界を区分することができなくなる。それにより、二次微分フィルタの出力値と違って、シャドウの生成された境界領域を正確に検出することができなくなることがあるが、境界領域を広く検出してシャドウを挿入しようとする場合には、一次微分フィルタを用いて境界領域を検出することも可能である。
以下の数式4は、複数の一次微分フィルタの出力値のうち、最大の絶対値に基づいて境界情報を獲得する過程を数式で表したものである。
(数式4)
Mag=max{|G[i]|}
一例によって、プロセッサ120は、複数のフィルタ出力値のうち、最大の絶対値をノーマライジングして境界情報を獲得することができる。例えば、複数のフィルタ出力値G(i)のうち、最大の絶対値max{|G[i]|}に臨界値を適用して範囲が0から1までの境界情報Bを獲得することができる。
以下の数式5は、複数のフィルタ出力値のうち、最大の絶対値が獲得される過程を数式で表したものである。
(数式5)
Mag=max{|G[i]|}
以下の数式6は、複数のフィルタ出力値のうち、最大の絶対値を有する出力値をノーマライジングして境界情報を獲得する過程を数式で表したものである。
Figure 0006841888
数式6は、数式3においてBoがMagに置き換えられたものであるため、詳細な説明は省略する。
一方、上述の実施形態では、複数のフィルタ出力値のうち、最も小さい負数値の大きさ又は最大の絶対値に基づいてピクセルブロックに対する境界情報を獲得するものとして説明しているが、それに限定されるものではない。例えば、二次微分フィルタ(ラプラシアンフィルタ)の場合、複数のフィルタ出力値のうち、負数値の平均の大きさを用いて、一次微分フィルタの場合、複数のフィルタ値の平均値に基づいてピクセルブロックに対する境界情報を獲得することもできる。又は、最も小さい負数値(又は、正数値)の大きさ又は最大の絶対値に任意の加重値を掛け算して境界情報を獲得することもできる。
プロセッサ120は、境界情報によって入力映像にシャドウを適用して出力映像を獲得することができる。ここで、境界情報は、境界領域の位置情報を含むことができる。即ち、プロセッサ120は、シャドウが生成された数多くのエッジ領域のうち、境界情報によって識別される境界領域にのにみシャドウを挿入することができる。
なお、境界情報は、境界領域の強度情報を含むことができる。この場合、プロセッサ120は、位置情報に基づいて境界領域を識別し、識別された境界領域に対応する強度情報を識別された境界領域に対応するシャドウに適用し、強度情報の適用されたシャドウを識別された境界領域に挿入することができる。
なお、境界情報は、境界領域の方向情報又は大きさ情報のうち、少なくとも一つを含んでよい。この場合、プロセッサ120は、方向情報又は大きさ情報のうち、少なくとも一つに基づいて境界領域の強度に異なる加重値を適用することができる。
一実施形態によって、プロセッサ120は、獲得されたシャドウSに境界情報(即ち、境界マップB)を加重値として掛け算した後、加重値の適用されたシャドウを入力映像Iに足し算することで、出力映像を獲得することができる。この過程は、以下の数式7で表してよい。
(数式7)
O=I+B*S
一方、本発明の別の実施形態によると、プロセッサ120は、境界領域の特性に基づいてシャドウ又は境界強度のうち、少なくとも一つの強度を更に調整してよい。
一例として、プロセッサ120は、境界領域の強度又は方向のうち少なくとも一つに基づいてシャドウ又は境界強度のうち、少なくとも一つに更なる加重値を適用することができる。この場合、プロセッサ120は、境界領域の強度又は方向のうち、少なくとも一つに基づいて異なる加重値を適用することができる。
別の例として、プロセッサ120は、境界領域と他境界領域との間の距離(又は、密集度)又は境界領域に隣接する領域の特性のうち、少なくとも一つに基づいてシャドウ又は境界強度のうち、少なくとも一つに更なる加重値を適用することができる。この場合、プロセッサ120は、境界領域と他境界領域との間の距離(又は、密集度)又は境界領域に隣接する領域の特性のうち、少なくとも一つに基づいて異なる加重値を適用することができる。
更に別の例として、プロセッサ120は、境界領域のサイズ又は対応のうち、少なくとも一つに基づいてシャドウ又は境界強度のうち、少なくとも一つに更なる加重値を適用することができる。例えば、プロセッサ120は、テキスト及び建物などの客体の境界に相互異なる加重値を適用することができる。又は、プロセッサ120は、絶対的(例えば、臨界値基準)又は相対的に大きい境界と異なるサイズの境界に相互異なる加重値を適用することができる。
上述のように、プロセッサ120は、フィルタの大きさ、フィルタの係数、臨界値(数式3、5)又は勾配値(数式3、5)のうち、少なくとも一つを調整してシャドーイングを適用しようとする境界領域を検出することができる。
別の実施形態によると、上述の境界領域検出も、ディープラーニング基盤の人工神経網(又は、深層人工神経網)、即ち、学習ネットワークモデルを用いて行われてよい。例えば、学習ネットワークモデルは、入力映像からシャドウ挿入に適した境界領域を検出するように、複数の境界検出フィルタの係数、サイズ又は大きさのうち、少なくとも一つが学習されてよい。
更に別の実施形態によると、上述のシャドウ生成及び境界検出が全て学習ネットワークモデルを用いて行われてよい。例えば、学習ネットワークモデルは、シャドウ生成に用いられるエッジ検出フィルタの係数、サイズ又は大きさのうち、少なくとも一つが学習され、シャドウ挿入に適した境界領域を検出するように複数の境界検出フィルタの係数、サイズ又は大きさのうち、少なくとも一つが学習されてよい。この場合、学習ネットワークモデルは、シャドウ生成のための第1学習ネットワークモデル及び境界情報獲得のための第2学習ネットワークモデルを含んでよい。プロセッサ120は、第1学習ネットワークモデルの出力及び第2学習ネットワークモデルの出力を掛け算して出力映像を獲得することができる。ただし、更に別の実施形態によると、上述のシャドウ生成、境界検出及びシャドウ挿入が全て学習ネットワークモデルを用いて行われてよい。即ち、入力映像が学習ネットワークモデルに入力されると、シャドウの挿入された出力映像が学習ネットワークモデルから出力されてよい。場合によって、第1学習ネットワークモデル及び第2学習ネットワークモデルは、パラメータを相互交換して学習を行うことも可能である。
上述の実施形態では、本発明の一実施形態に係るシャドウ挿入処理についてのみ説明しているが、雑音除去処理、シャープニング(sharpening)、テクスチャ処理、スケーリングなど、他の映像処理が更に行われてよい。一例として、プロセッサ120は、境界検出前に雑音除去処理を行うことができる。通常、映像を圧縮する過程、伝送する過程などで雑音が発生する。雑音除去処理を行う理由は、雑音によって映像の画質を低下させるだけでなく、上述の境界検出など、他の映像処理効果も低下するおそれがあるためである。一実施形態によって、プロセッサ120は、ノンローカルフィルタリング(non−local filtering)及び自己相似(self−similarity)を用いた方式、ローパスフィルタリングによるスムージング(smoothing)フィルタなどを用いて、雑音除去処理を行うことができる。
一方、シャドウ挿入処理は、実施形態によって映像のスケーリング前又は後で行われてよい。例えば、低解像度の映像を高解像度の映像に拡大するスケーリングの後に上述の映像処理を行うか、圧縮映像をデコーディングする過程で上述の映像処理を行った後スケーリングを行うこともできる。
図7Aないし図7Dは、本発明の一実施形態に係る映像処理方法を説明するための図である。
図7Aに示すような入力映像に二次微分フィルタ、例えば、中心係数が正数であるラプラシアンフィルタを適用すると、図7Bのようなフィルタ出力を獲得することができるようになる。
この場合、フィルタ出力は、図7Bに示すように、暗い客体である「円」の内部境界では負の値711を、外部境界では正の値712を有するようになる。なお、フィルタ出力は、明るい客体であるテキストの
Figure 0006841888
の外部境界では負の値721を、明るい客体の内部境界には正の値722を有するようになる。それは、ラプラシアンフィルタによる二次微分値が図3に示すように、暗い客体の内部境界では負の値を、外部境界では正の値を有し、明るい客体の外部境界では負の値を、明るい客体の内部境界では正の値を有するようになるためである。
続いて、図7Cに示すように、フィルタ出力(図7B)で負の値711、721のみを用いてシャドウを生成することができる。例えば、プロセッサ120は、入力信号を与えられた範囲に制限して出力信号を生成するクリッピング関数を用いて負の値を有する領域を識別することができる。この場合、負の値を有する領域は、暗い客体の内部境界又は明るい客体の外部境界のうち、少なくとも一つになってよい。図7Cによると、円(暗い客体)の内部境界及び
Figure 0006841888
の外部境界を暗くするシャドウが生成されていることを確認することができる。
生成されたシャドウ(図7C)を入力映像に足して図7Dのような出力映像を獲得することができる。図7Dを参照すると、入力映像対比テキストの輪郭がくっきりとなり、鮮明度が向上していることを確認することができる。
図8A及び図8Bは、本発明の一実施形態に係る境界検出効果を説明するための図である。
図8Aは、図7Aに示すような入力映像に相互異なる8つの方向性(例えば、図6A又は図6B)を有するラプラシアンフィルタを適用して境界を検出した結果を示している。図示のように、異なる方向を有するフィルタは、対応する方向に対する境界は検出に成功する一方、他の方向に対する境界は検出に失敗していることを確認することができる。なお、中心係数が正数であるラプラシアンフィルタを用いているため、客体の内部境界及び外部境界に対して相互異なる符号(正数、負数)の値を有することを確認することができる。
図8Bは、一実施形態によって各ピクセル領域から獲得された複数の境界検出値のうち、最も小さい負数値又は最も大きい正数値に基づいて全ての方向に対して一括的な形態の境界を推定した結果を示している。例えば、図8Aに示す各フィルタの出力値のうち、最も小さい負数値を用いる場合、暗い客体(円領域)の内部境界及び
Figure 0006841888
を検出することができ、最も大きい正数値を用いる場合、暗い客体(円領域)の外部境界及び
Figure 0006841888
を検出することができるため、図8Bに示すような境界検出結果を獲得することができるようになる。
図8Cは、図8Bの境界検出結果でシャドウ効果を挿入するための負数領域(暗い領域)のみを抽出して示したものである。ここで、抽出された負数領域は
Figure 0006841888
又は暗い客体(円領域)の内部境界になってよい。
図9は、本発明の一実施形態に係る映像処理方法の一実現例を説明するための図である。図9においては、シャドウ生成及び境界検出のために、ラプラシアンフィルタを用いることを想定しているが、それに限定されるわけではない。
図9によると、プロセッサ120は、入力映像Iにシャドウ生成のための第1ラプラシアンフィルタf及び境界検出のための第2ラプラシアンフィルタF[i]をそれぞれ適用することができる(911、921)。ここで、第1ラプラシアンフィルタfは、第2ラプラシアンフィルタF[i]より小さく実現されてよい。なお、第2ラプラシアンフィルタF[i]は、異なる方向性を有する複数のフィルタを含んでよい。
プロセッサ120は、第1ラプラシアンフィルタfの出力、即ち、二次微分信号で負数部分をクリッピングしてシャドウSを生成することができる(921)。この過程は、上述の数式1のように表されてよい。なお、プロセッサ120は、第2ラプラシアンフィルタF[i]の出力F[i]*Iに基づいて境界を推定することができる(922)。具体的に、プロセッサ120は、異なる方向性に関連する複数のフィルタ出力値のうち、最も小さい負数値の大きさBoに基づいて境界を推定することができる。この過程は、上述の数式2のように表されてよい。
続いて、プロセッサ120は、複数のフィルタ出力値のうち最も小さい負数値の大きさBoに臨界値Thを適用して境界情報B(例えば、境界マップ)、言い換えると、加重値(weight)を獲得することができる(923)。この過程を通じて、強度が臨界値以下に低い強度は加重値を0とし、強度が高まるにつれてそれに比例して加重値が高くなるようにすることができる。この過程は、上述の数式3のように表されてよい。
その後、プロセッサ120は、生成されたシャドウSと獲得された境界情報Bとを掛け算して出力映像を獲得することができる。例えば、プロセッサ120は、シャドウマップに含まれた各ピクセルデータを境界マップで対応する位置の各ピクセルデータと掛け算して出力映像を獲得することができる。この場合、境界情報Bが0である領域には、シャドウSが適用されなくなり、境界情報Bが0以上の領域にはシャドウSが適用されるため、結果的に本発明の一実施形態に係る境界領域にのみシャドウが適用されるようになる。
図10は、本発明の別の実施形態に係る映像処理装置の一実現例を示す図である。図10によると、映像処理装置100’は、入力部110、プロセッサ120、メモリ130、ディスプレイ140、出力部150及びユーザインターフェース160を含む。図10に示す構成のうち、図2に示す構成と重なる構成については、詳細な説明を省略する。
メモリ130は、プロセッサ120はと電気的に接続され、本発明の多様な実施形態のために必要なデータを保存することができる。メモリ130は、データを保存する用途に応じて、映像処理装置100’にエンベデッドされたメモリ形態で実現されたり、映像処理装置100’に着脱可能なメモリ形態で実現されてよい。例えば、映像処理装置100’の駆動のためのデータの場合、映像処理装置100’にエンベデッドされたメモリに保存され、映像処理装置100’の拡張機能のためのデータの場合、映像処理装置100に着脱可能なメモリに保存されてよい。一方、映像処理装置100’にエンベデッドされたメモリの場合、揮発性メモリ(例えば、DRAM(dynamic RAM)、SRAM(static RAM)、又はSDRAM(synchronous dynamic RAM)など)、非揮発性メモリ(non−volatile Memory)(例:OTPROM(one time programmable ROM)、PROM(programmable ROM)、EPROM(erasable and programmable ROM)、EEPROM(electrically erasable and programmable ROM)、mask ROM、flash ROM、フラッシュメモリ(例:NAND flash又はNOR flashなど)、ハードドライブ、又はソリッドステートドライブ(solid state drive(SSD))のうち、少なくとも一つで実現されてよい。なお、映像処理装置100’に着脱可能なメモリの場合、メモリカード(例えば、CF(compact flash)、SD(secure Digital)、Micro−SD(Micro secure Digital)、Mini−SD(mini secure Digital)、xD(extreme Digital)、MMC(multi−media card)など)、USBポートに接続可能な外部メモリ(例えば、USBメモリ)などのような形態で実現されてよい。
一実施形態によって、メモリ130は、外部装置(例えば、ソース装置)、外部保存媒体(例えば、USB)、外部サーバ(例えば、ウェブハード)等から受信された映像を保存することができる。ここで、映像は、デジタル動画であってよいが、それに限定されるものではない。
本発明の一実施形態によると、メモリ130は、本発明に係る多様な動作で生成されるデータを保存する単一メモリで実現されてよい。
ただし、本発明の別の実施形態によると、メモリ130は、第1ないし第3メモリを含むように実現されてよい。
第1メモリは、入力部110を介して入力された映像のうち少なくとも一部を保存することができる。特に、第1メモリは、入力された映像フレームのうち少なくとも一部の領域を保存することができる。この場合、少なくとも一部の領域は、本発明の一実施形態に係る映像処理を行ううえで必要な領域であってよい。一実施形態によって、第1メモリはNラインメモリで実現されてよい。例えば、Nラインメモリは、縦方向に17ライン相当の容量を有するメモリであってよいが、それに限定されるものではない。例えば、1080p(1,920×1,080の解像度)のFull HD映像が入力される場合、Full HD映像で17ラインの映像領域のみが第1メモリに保存される。このように、第1メモリは、Nラインメモリで実現され、入力された映像フレームのうち、一部の領域のみが映像処理のために保存される理由は、ハードウェア的な限界によって第1メモリのメモリ容量が制限されているためである。
第2メモリは、シャドウ映像、境界情報などを保存するためのメモリとして、本発明の多様な実施形態によって多様なサイズのメモリで実現されてよい。例えば、本発明の一実施形態によって生成されたシャドウ映像を保存する場合、当該シャドウ映像を保存するのに適したサイズで実現されてよい。
第3メモリは、映像処理(例えば、シャドウ挿入処理)された出力映像が保存されるメモリとして、多様な実施形態によって多様なサイズのメモリで実現されてよい。第3メモリは、入力映像の大きさと同じか大きいサイズで実現されてよい。別の実施形態によって、第1メモリのサイズに対応する映像単位で映像を出力するか、ピクセルライン単位で出力するなどの場合には、当該映像保存のための適したサイズで実現されてよい。ただし、第1メモリ又は第2メモリに出力映像がオーバーライトされるか、出力映像が保存されずに直ちにディスプレイされる形態で実現される場合などには、第3メモリは必要としなくてよい。
ディスプレイ140は、自発光素子を含むディスプレイ又は非自発光素子及びバックライトを含むディスプレイで実現されてよい。例えば、LCD(Liquid Crystal Display)、OLED(Organic Light Emitting Diodes)ディスプレイ、LED(Light Emitting Diodes)、PDP(Plasma Display Panel)、QLED(Quantum dot light−emitting Diodes)などのような多様なディスプレイで実現されてよい。ディスプレイ160内には、a−si TFT、LTPS(low temperature poly
silicon) TFT、OTFT(organic TFT)などのような形態で実現され得る駆動回路、バックライトユニットなども含まれてよい。一方、ディスプレイ140は、タッチセンサと組み合わせられたタッチスクリーン、フレキシブルディスプレイ(flexible display)、ローラブル(rollable display)、三次元ディスプレイ(3D display)、複数のディスプレイモジュールが物理的に接続されたディスプレイなどで実現されてよい。プロセッサ120は、本発明の多様な実施形態によって処理された出力映像を出力するようにディスプレイ140を制御することができる。
出力部150は、音響信号を出力する。例えば、出力部150は、プロセッサ140で処理されたデジタル音響信号をアナログ音響信号に変換して増幅して出力することができる。例えば、出力部150は、少なくとも一つのチャネルを出力できる、少なくとも一つのスピーカユニット、D/Aコンバータ、オーディオアンプ(audio amplifier)などを含んでよい。一例として、出力部150は、多様なマルチチャネル音響信号を出力するように実現されてよい。この場合、プロセッサ120は、入力映像のエンハンス処理に対応するように入力された音響信号をエンハンス処理して出力するように出力部150を制御することができる。例えば、プロセッサ120は、入力された2チャネル音響信号を仮想のマルチチャネル(例えば、5.1チャネル)音響信号に変換するか、映像処理装置100’の置かれた位置を認識して空間に最適化された立体音響信号として処理するか、入力映像のタイプ(例えば、コンテンツジャンル)に応じて最適化された音響信号を提供することができる。
ユーザインターフェース160は、ボタン、タッチパッド、マウス及びキーバードのような装置で実現されるか、上述のディスプレイ機能及び操作入力機能も併せて実行可能なタッチスクリーン、リモコン送受信部などで実現されてよい。リモコン送受信部は、赤外線通信、ブルートゥース通信又はWi−Fi通信のうち、少なくとも一つの通信方式を通じて外部遠隔制御装置からリモコン信号を受信するか、リモコン信号を送信することができる。一例として、本発明の一実施形態に係るシャドウ挿入処理は、ユーザ設定メニューを通じて選択されてよく、この場合、リモコン送受信部を介してシャドウ挿入処理のためのユーザ命令を受信することもできる。
映像処理装置100’は、実現例によって、チューナ及び復調部を更に含んでよい。チューナ(図示せず)は、アンテナを介して受信されるRF(Radio Frequency)放送信号のうち、ユーザによって選択されたチャネル又は予め保存された全チャネルをチューニングしてRF放送信号を受信することができる。復調部(図示せず)は、チューナで変換されたデジタルIF信号(DIF)を受信して復調し、チャネル復号化などを行うこともできる。一実施形態によって、チューナを介して受信された入力映像は、復調部(図示せず)を介して処理された後、本発明の一実施形態に係るシャドウ処理のためにプロセッサ120に提供されてよい。
図11は、本発明の一実施形態に係るシャドウ挿入効果を説明するための図である。図11は、レンガで構成された壁を撮影した映像が入力された際、その入力映像(input image)を従来の方法で処理した場合(previous method)と、本発明の一実施形態によって処理された場合(proposed method)とをそれぞれ表す。
図11によると、入力映像にはレンガの間の太いエッジの他にも、レンガの表面の細いエッジが存在する。従来の技術によると、太いエッジ及び細いエッジに対応する周波数信号を同時に増幅させることにより、鮮明度の向上とともにノイズが増加するおそれがある。一方、本発明によると、太いエッジに対してシャドウを挿入して従来の技術対比ノイズ増幅が少なく、ディテール向上効果に優れていることを確認することができる。
図12Aないし図12Dは、本発明の多様な実施形態で開示したバウンダリーエンハンス技術の実施可否を判断することができる方法を説明するための図である。
図12Aは、入力映像の一例を示したものである。図12Aに示すように、入力映像は中央から縁に進むにつれて太い円形から細い円形に変化するパターン映像になってよい。例えば、中央の円形は、数十のピクセルの厚さからなる厚いエッジであり、最も外郭にある円形は一ピクセル厚さの細いエッジになってよい。
図12Bは、入力映像に含まれたエッジのうち、第1臨界値の未満の厚さを有するエッジを検出した映像を示したものである。例えば、プロセッサ120は、第1サイズのラプラシアンフィルタを用いて第1臨界値未満の厚さを有するエッジを検出することができる。
図12Cは、入力映像に含まれたエッジのうち、第2臨界値未満の厚さを有するエッジを検出した映像を示したものである。ここで、第2臨界値は、第1臨界値より大きい値であってよい。例えば、プロセッサ120は、第1サイズより小さい第2サイズのラプラシアンフィルタを用いて、第2臨界値未満の厚さを有するエッジを検出することができる。
図12Dは、入力映像に含まれたエッジのうち、第1臨界値以上第2臨界値未満の厚さを有するエッジを検出した映像を示したものである。例えば、プロセッサ120は、第2サイズより大きく第1サイズより小さい第3サイズのラプラシアンフィルタを用いて、第1臨界値以上第2臨界値未満の厚さを有するエッジを検出することができる。
ただし、別の実施形態によると、固定した大きさのフィルタ(例えば、図6A)を用いてエッジを検出した後、数式3の臨界値を調整して相互異なる強度のエッジを検出することもできる。
図12Bないし図12Dに示す映像によると、映像の中央領域で8つの方向に不連続の領域(暗い領域)が形成されたことを確認することができるが、それは、異なる方向性を有する8つのフィルタ(例えば、図6A)を用いて、エッジを検出することを意味することができる。即ち、図12Aに示す入力映像に対する出力映像が、図12Bないし図12Dに示すような形状を有する場合、本発明の実施形態のうちの一つを用いた場合と判断することができる。
図13は、本発明の多様な実施形態で開示した内容の実施可否を判断することができる方法を説明するための図である。
図13は、入力映像1310、出力映像1320及び差映像1330を順次に示したものである。差映像は、入力映像と出力映像を比較し、ピクセル値の差を示す映像を意味する。入力映像1310及び出力映像1320を比較して獲得された差映像1330を見ると、暗いエッジ位置で負数値を含んでいることを確認することができる。それは、客体の境界(例えば、暗い客体の内部境界)にシャドウを挿入したものであるため、本発明の一実施形態のいずれかを用いた場合と班d何することができる。
図14は、本発明の一実施形態に係る映像処理方法を説明するためのフローチャートである。
図14に示す映像処理方法によると、入力映像が受信されると、入力映像のフィルタリングに基づいて臨界範囲の信号をシャドウで獲得する(S1410)。
続いて、異なる方向性に関連する複数の境界検出フィルタを入力映像に適用して境界情報を獲得する(S1420)。
その後、入力映像において、境界情報によって識別される領域にシャドウを適用して出力映像を獲得する(S1430)。ここで、出力映像は、4K USB(Ultra HIgh Difinition)映像又は8K UHD映像であってよい。
なお、シャドウを獲得するステップS1410においては、入力映像を二次微分フィルタでフィルタリングして二次微分信号を獲得し、二次微分信号で正の信号又は負の信号をクリッピングしてシャドウを獲得することができる。
この場合、獲得されたシャドウは、入力映像内に含まれた客体のうち、第1臨界値未満のピクセル値を有する客体の内部境界又は入力映像内に含まれた客体のうち、第1臨界値より大きい第2臨界値以上のピクセル値を有する客体の外部境界のうち、少なくとも一つに対応してよい。
なお、境界情報は、境界領域の位置情報及び強度情報を含み、出力映像を獲得するステップS1430においては、位置情報に基づいて境界領域を識別し、識別された境界領域に対応する強度情報を識別された境界領域に対応するシャドウに適用し、強度情報の適用されたシャドウを識別された境界領域に挿入してよい。
なお、シャドウを獲得するステップS1410においては、入力映像に二次微分フィルタを適用してシャドウを獲得することができる。この場合、境界情報を獲得するステップS1420においては、入力映像に二次微分フィルタより大きいサイズの複数の境界検出フィルタを適用して境界情報を獲得することができる。
なお、境界情報を獲得するステップS1420においては、入力映像に含まれたピクセルブロックに複数の境界検出フィルタをそれぞれ適用し、複数のフィルタ出力値を獲得し、複数のフィルタ出力値のうちの一つに基づいてピクセルブロックに対する境界情報を獲得することができる。
なお、境界情報を獲得するステップS1420においては、複数のフィルタ出力値のうち、最も小さい負数値の大きさ又は最大の絶対値に基づいて、ピクセルブロックに対する境界情報を獲得することができる。
なお、出力映像を獲得するステップS1430においては、複数のフィルタ出力値のうち、最も小さい負数値の大きさ又は最大の絶対値のうち、少なくとも一つに臨界値を適用してノーマライジングし、ノーマライジングによって獲得された加重値を獲得されたシャドウに適用して出力映像を獲得することができる。
なお、境界情報を獲得するステップS1420においては、シャドウを適用する境界領域の特性に基づいて複数の境界検出フィルタの数又はサイズのうち、少なくとも一つを決定してよい。
一方、複数の境界検出フィルタの数がN個である場合、n番目の境界検出フィルタの方向性は180*(n−1)/Nのような数式を通じて算出されてよい。
上述の多様な実施形態によると、高解像度の映像から客体の境界を正確に検出してシャドウを適用することができる。それにより、映像のノイズの増幅を最小化して客体の輪郭のみをくっきりして映像の鮮明度を向上させることができる。
本発明の多様な実施形態は、映像処理装置だけでなく、セットトップボックスのような映像受信装置、テレビジョンのようなディスプレイ装置など、映像処理が可能な全ての電子装置に適用できる。
一方、上述の本発明の多様な実施形態に係る方法は、従来の映像処理装置に設置可能なアプリケーション形態で実現されてよい。又は、上述の本発明の多様な実施形態に係る方法は、ディープラーニング基盤の人工神経網(又は、深層人工神経網)、即ち、学習ネットワークモデルを用いて行われてよい。
なお、上述の本発明の多様な実施形態に係る方法は、従来の映像処理装置に対するソフトウェアアップグレード、又はハードウェアアップグレードのみで実現されてよい。
なお、上述の本発明の多様な実施形態は、映像処理装置に備えられたエンベデッドサーバ、又は映像処理装置の外部サーバを介して行われることも可能である。
一方、本発明の一実施形態によると、以上で説明された多様な実施形態は、機器(machine)(例えば、コンピュータ)で読み取れる保存媒体(machine−readable storage media)に保存された命令語を含むソフトウェアで実現されてよい。機器は、保存媒体から保存された命令語を呼び出し、呼び出された命令語に応じて動作が可能な装置として、開示された実施形態に係る映像処理装置(例えば、映像処理装置A)を含んでよい。命令がプロセッサによって実行される場合、プロセッサが直接、又はプロセッサの制御下に別の構成要素を用いて命令語に該当する機能を行うことができる。命令は、コンパイラー又はインタープリターによって生成又は実行されるコードを含んでよい。機器で読み取れる保存媒体は、非一時的(non−transitory)保存媒体の形態で提供されてよい。ここで、「非一時的」とは、保存媒体が信号(signal)を含まずに、実在(tangible)することを意味するだけで、データが保存媒体に半永久的又は一時的に保存されることを区分しない。
なお、本発明の一実施形態によると、以上で説明された多様な実施形態に係る方法は、コンピュータプログラム製品(computer program product)に含まれて提供されてよい。コンピュータプログラム製品は、商品として販売者及び購入者の間に取引されてよい。コンピュータプログラム製品は、機器で読み取れる保存媒体(例えば、compact disc read only memory(CD−ROM))の形態で、又は、アプリケーションストア(例えば、プレイストアTM)を通じてオンラインで配布されてよい。オンライン配布の場合に、コンピュータプログラム製品の少なくとも一部は、製造社のサーバ、アプリケーションストアのサーバ、又は中継サーバのメモリのような保存媒体に少なくとも一次保存されたり、一時的に生成されてよい。
なお、上述の多様な実施形態に係る構成要素(例えば、モジュール又はプログラム)のそれぞれは、単数又は複数の個体で構成されてよく、上述の当該サブ構成要素のうちの一部のサブ構成要素が省略されたり、又は、他のサブ構成要素が多様な実施形態に更に含まれてよい。代替的に又は追加的に、一部の構成要素(例えば、モジュール又はプログラム)は、一つの個体で統合され、統合される前のそれぞれの当該構成要素によって行われる機能を同一又は類似するように行うことができる。多様な実施軽形態に係るモジュール、プログラム又は他の構成要素によって行われる動作は、順次に、並列的に、繰り返し、又はヒューリスティックに行われるか、少なくとも一部の動作が他の順で行われるか、省略されるか、又は他の動作が追加されてよい。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明は以上の実施形態に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的趣旨の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

Claims (15)

  1. 少なくとも一つのプロセッサと、
    プログラムコードを保存するメモリと
    を含み、
    前記プロセッサは、
    前記プログラムコードを実行することにより、
    入力映像の二次微分フィルタによるフィルタリングに基づいて臨界範囲に対応するシャドウを獲得し、
    異なる方向性に関連する複数の境界検出フィルタを前記入力映像に適用して境界情報を獲得し、
    前記境界情報によって識別される境界領域に前記入力映像から獲得したシャドウを適用して前記入力映像から出力映像を獲得する映像処理装置。
  2. 前記プロセッサは、
    前記入力映像を二次微分フィルタでフィルタリングして出力信号を獲得し、獲得された前記出力信号で正又は負の信号をクリッピングして前記シャドウを獲得することを特徴とする請求項1に記載の映像処理装置。
  3. 前記獲得されたシャドウは、
    前記入力映像内に含まれた客体のうち第1臨界値未満のピクセル値を有する客体の内部境界、又は
    前記入力映像内に含まれた客体のうち前記第1臨界値より大きい第2臨界値以上のピクセル値を有する客体の外部境界のうち、少なくとも一方に対応することを特徴とする請求項1に記載の映像処理装置。
  4. 前記境界情報は、前記境界領域の位置情報及び強度情報を含み、
    前記プロセッサは、
    前記位置情報に基づいて前記境界領域を識別し、前記識別された境界領域に対応する強度情報を前記識別された境界領域に対応するシャドウに適用し、前記強度情報の適用されたシャドウを前記識別された境界領域に挿入することを特徴とする請求項1−3のうち何れか1項に記載の映像処理装置。
  5. 前記プロセッサは、
    前記入力映像に二次微分フィルタを適用して前記シャドウを獲得し、
    前記複数の境界検出フィルタのサイズは前記二次微分フィルタより大きいことを特徴とする請求項1に記載の映像処理装置。
  6. 前記プロセッサは、
    前記入力映像に含まれたピクセルブロックに前記複数の境界検出フィルタをそれぞれ適用して複数のフィルタ出力値を獲得し、前記複数のフィルタ出力値のうちの一つに基づいて前記ピクセルブロックに対する境界情報を獲得することを特徴とする請求項1−5のうち何れか1項に記載の映像処理装置。
  7. 前記プロセッサは、
    前記複数のフィルタ出力値のうち最小の負数値の大きさ又は最大の絶対値に基づいて、前記ピクセルブロックに対する境界情報を獲得することを特徴とする請求項6に記載の映像処理装置。
  8. 前記プロセッサは、
    前記複数のフィルタ出力値のうち、前記最小の負数値の大きさ又は前記最大の絶対値に臨界値を適用してノーマライジングし、前記ノーマライジングによって獲得された加重値を前記獲得されたシャドウに適用して前記出力映像を獲得することを特徴とする請求項7に記載の映像処理装置。
  9. 前記プロセッサは、
    前記シャドウを適用する境界領域の特性に基づいて、前記複数の境界検出フィルタの数又はサイズのうち少なくとも一方を決定することを特徴とする請求項1−8のうち何れか1項に記載の映像処理装置。
  10. 前記複数の境界検出フィルタは、
    第1方向のライン単位で同一のフィルタ係数が重複する第1フィルタ、第2方向のライン単位で同一のフィルタ係数が重複する第2フィルタ、第3方向のライン単位で同一のフィルタ係数が重複する第3フィルタ及び第4方向のライン単位で同一のフィルタ係数が重複する第4フィルタを含むことを特徴とする請求項1に記載の映像処理装置。
  11. 前記複数の境界検出フィルタの数がN個である場合、n番目の境界検出フィルタの方向性は、下記の数式
    n番目の境界検出フィルタの角度=180*(n−1)/N
    を通じて算出されることを特徴とする請求項1−10のうち何れか1項に記載の映像処理装置。
  12. ディスプレイを更に含み、
    前記プロセッサは、
    前記出力映像を出力するように前記ディスプレイを制御し、
    前記出力映像は、
    4K UHD(Ultra High Definition)映像又は8K UHD映像であることを特徴とする請求項1−11のうち何れか1項に記載の映像処理装置。
  13. 映像処理装置の映像処理方法において、
    入力映像の二次微分フィルタによるフィルタリングに基づいて臨界範囲に対応するシャドウを獲得するステップと、
    異なる方向性に関連する複数の境界検出フィルタを前記入力映像に適用して境界情報を獲得するステップと、
    前記境界情報によって識別される境界領域に前記入力映像から獲得したシャドウを適用して前記入力映像から出力映像を獲得するステップと
    を含む映像処理方法。
  14. 前記臨界範囲の信号をシャドウで獲得するステップは、
    前記入力映像を二次微分フィルタでフィルタリングして出力信号を獲得し、獲得された前記出力信号で正又は負の信号をクリッピングして前記シャドウを獲得することを特徴とする請求項13に記載の映像処理方法。
  15. 請求項13又は14に記載の映像処理方法を電子装置のコンピュータに実行させるコンピュータプログラム。
JP2019181278A 2019-04-05 2019-10-01 映像処理装置及び映像処理方法 Active JP6841888B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190040076A KR102661879B1 (ko) 2019-04-05 2019-04-05 영상 처리 장치 및 그 영상 처리 방법
KR10-2019-0040076 2019-04-05

Publications (2)

Publication Number Publication Date
JP2020173771A JP2020173771A (ja) 2020-10-22
JP6841888B2 true JP6841888B2 (ja) 2021-03-10

Family

ID=67841019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019181278A Active JP6841888B2 (ja) 2019-04-05 2019-10-01 映像処理装置及び映像処理方法

Country Status (6)

Country Link
US (1) US11024016B2 (ja)
EP (1) EP3719741B1 (ja)
JP (1) JP6841888B2 (ja)
KR (2) KR102661879B1 (ja)
CN (1) CN111798474A (ja)
WO (1) WO2020204277A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348793B (zh) * 2020-11-05 2023-04-25 中国电子科技集团公司第二十九研究所 一种自动识别并计算天线方向图凹坑的方法
CN113240724B (zh) * 2021-05-14 2022-03-25 长江存储科技有限责任公司 厚度检测方法及相关产品
CN113222864B (zh) * 2021-06-09 2022-09-27 广州计量检测技术研究院 基于限幅滤波的图像边缘去噪方法及装置、设备
KR102423052B1 (ko) * 2022-02-08 2022-07-22 주식회사 써니웨이브텍 개용 표시 장치 및 이의 구동 방법
CN115546073B (zh) * 2022-11-29 2023-04-07 昆明理工大学 地砖图像阴影去除方法、装置、计算机设备及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4433438A (en) 1981-11-25 1984-02-21 The United States Of America As Represented By The Secretary Of The Air Force Sobel edge extraction circuit for image processing
JP2004077927A (ja) 2002-08-20 2004-03-11 Fuji Xerox Co Ltd 画像形成処理装置及びその画像形成処理方法
US7847863B2 (en) * 2005-06-10 2010-12-07 Intel Corporation Enhancing sharpness in video images
JP5147287B2 (ja) 2006-05-23 2013-02-20 パナソニック株式会社 画像処理装置、画像処理方法、プログラム、記録媒体および集積回路
JP2008017906A (ja) 2006-07-11 2008-01-31 Ziosoft Inc 画像処理方法および画像処理プログラム
KR100736356B1 (ko) 2006-08-25 2007-07-06 엠텍비젼 주식회사 이미지의 에지 검출 장치 및 그 방법, 선명도 강조 장치 및그 방법, 이를 수행하는 프로그램이 기록된 기록 매체
JP2009302761A (ja) 2008-06-11 2009-12-24 Canon Inc 画像処理装置
JP5407462B2 (ja) 2009-03-19 2014-02-05 富士通株式会社 画像出力装置、輪郭強調装置及び輪郭強調方法
KR101094752B1 (ko) 2009-06-30 2011-12-16 호서대학교 산학협력단 에이치에스아이 색정보의 통계적 모델을 이용한 차선 분류방법
KR20110121261A (ko) 2010-04-30 2011-11-07 (주)임베디드비전 흑백 영상 데이터에서 이동 객체의 투영 음영 제거 방법
JP5744510B2 (ja) 2010-12-28 2015-07-08 キヤノン株式会社 画像処理方法
JP6021557B2 (ja) 2012-09-28 2016-11-09 株式会社Pfu 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
JP5995704B2 (ja) 2012-12-21 2016-09-21 三菱電機株式会社 画像処理装置及び画像処理方法並びにプログラム及び記録媒体
WO2015053352A1 (ja) 2013-10-10 2015-04-16 シャープ株式会社 表示装置及び超解像処理方法
JP2015154415A (ja) 2014-02-18 2015-08-24 富士通株式会社 動画符号化装置、動画符号化方法及び動画符号化プログラム
JP6473608B2 (ja) 2014-11-27 2019-02-20 三星ディスプレイ株式會社Samsung Display Co.,Ltd. 画像処理装置、画像処理方法、及びプログラム
KR101870084B1 (ko) 2017-07-10 2018-06-22 극동대학교 산학협력단 그림자의 수직경계선을 이용한 원격탐사영상의 그림자 제거방법
KR102351083B1 (ko) 2017-08-30 2022-01-13 삼성전자주식회사 디스플레이 장치 및 그 영상 처리 방법

Also Published As

Publication number Publication date
KR20200117650A (ko) 2020-10-14
WO2020204277A1 (en) 2020-10-08
US11024016B2 (en) 2021-06-01
EP3719741B1 (en) 2023-07-12
CN111798474A (zh) 2020-10-20
JP2020173771A (ja) 2020-10-22
US20200320669A1 (en) 2020-10-08
EP3719741A1 (en) 2020-10-07
KR20240058071A (ko) 2024-05-03
KR102661879B1 (ko) 2024-04-29

Similar Documents

Publication Publication Date Title
JP6841888B2 (ja) 映像処理装置及び映像処理方法
CN106331850B (zh) 浏览器直播客户端、浏览器直播系统及浏览器直播方法
EP3087730B1 (en) Method for inverse tone mapping of an image
US20160217552A1 (en) Video super-resolution by fast video segmentation for boundary accuracy control
JP6978542B2 (ja) 電子装置及びその制御方法
WO2019057041A1 (zh) 用于实现图像增强的方法、装置和电子设备
US9519996B2 (en) Virtual view generating method and apparatus
US11836890B2 (en) Image processing apparatus and image processing method thereof
CN107622504B (zh) 用于处理图片的方法和装置
CN112866803B (zh) 电子装置及其控制方法
WO2019090580A1 (en) System and method for image dynamic range adjusting
CN105678717A (zh) 动态视频图像清晰度强化方法及装置
CN110070482B (zh) 图像处理方法、装置和计算机可读存储介质
CN113132786A (zh) 一种用户界面显示方法、装置及可读存储介质
US11436442B2 (en) Electronic apparatus and control method thereof
KR20200080926A (ko) 영상 처리 장치 및 그 영상 처리 방법
US11727540B2 (en) Image sharpening
CN111815535B (zh) 图像处理方法、装置、电子设备和计算机可读介质
US11373340B2 (en) Display apparatus and controlling method thereof
KR20210108027A (ko) 전자 장치 및 그 제어 방법
EP3686836A1 (en) Image processing apparatus, image processing method, and computer-readable recording medium
US11961214B2 (en) Electronic apparatus and image processing method thereof
KR20240034010A (ko) 전자 장치 및 그 영상 처리 방법
KR20220158525A (ko) 전자 장치 및 그 영상 처리 방법
KR20200079697A (ko) 영상 처리 장치 및 그 영상 처리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191001

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191001

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20191029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201124

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201124

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201202

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20201208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210218

R150 Certificate of patent or registration of utility model

Ref document number: 6841888

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250