JP7387917B2

JP7387917B2 - コンテンツに基づく画像処理

Info

Publication number: JP7387917B2
Application number: JP2022562034A
Authority: JP
Inventors: チンイーホ; ディーアムノンシルヴァースタイン
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2020-04-13
Filing date: 2021-03-19
Publication date: 2023-11-28
Anticipated expiration: 2041-03-19
Also published as: WO2021211257A1; KR20230141956A; KR102585573B1; JP2023511226A; DE112021002288T5; JP2024037722A; US20230020964A1; CN115428009B; US11488285B2; KR20220151713A; US20210319536A1; CN115428009A

Description

本開示は、画像を処理する回路に関し、より具体的には、画像内のコンテンツに基づいて画像のセグメントを異なって鮮鋭化することに関する。

画像センサによってキャプチャされた又は他のデータソースから受信された画像データは多くの場合、更なる処理又は消費の前に、画像処理パイプラインにおいて処理される。例えば、ＲＡＷ画像データは、ビデオエンコーダなどの後続の構成要素に提供される前に、補正、フィルタリング、あるいは修正がなされることがある。キャプチャされた画像データの補正又は強調を行うために、様々な構成要素、ユニットステージ、又はモジュールが用いられ得る。

このような画像処理パイプラインは、他のシステムリソースを消費することなく、キャプチャされた画像データに対する補正又は強調を好都合に実行できるように構成され得る。多くの画像処理アルゴリズムは、中央処理装置（Central Processing Unit、ＣＰＵ）上でソフトウェアプログラムを実行することにより実行し得るが、ＣＰＵ上のこのようなプログラムの実行は、ＣＰＵのバンド幅及び他の周辺装置リソースを著しく消費するとともに電力消費も増大させる。よって、画像処理パイプラインは多くの場合、１つ以上の画像処理アルゴリズムを実行するための専用のものとして、ＣＰＵとは別個のハードウェア構成要素として実装される。

画像処理パイプラインは多くの場合、鮮鋭化プロセス又は平滑化プロセスを含む。これらのプロセスは、画像全体にわたって一様に適用される１つ以上の調整パラメータを使用して実施される。このため、画像内のコンテンツの１つ以上のセグメントは、最終画像の外観に悪影響を及ぼすように平滑化又は鮮鋭化されることがある。

同様に、トーンマッピング、ホワイトバランス、及びノイズ低減などの他の画像処理プロセスも通常、画像全体にわたって一様に適用される１つ以上の調整パラメータを使用して実施される。このため、画像内のコンテンツの１つ以上のセグメントは、最終画像の外観に悪影響を及ぼすように処理され得る。

いくつかの実施形態は、画像のセグメント内のコンテンツのカテゴリを識別するコンテンツマップを使用して、コンテンツ係数を決定するコンテンツ画像処理回路を含む画像プロセッサに関する。コンテンツ画像処理回路は、コンテンツ係数回路と、コンテンツ係数回路に結合されたコンテンツ修正回路とを含む。コンテンツ係数回路は、画像内のコンテンツの識別されたカテゴリと、画像内の画素のテクスチャ値又は画像内の画素のクロマ値の少なくとも１つとに従って、画像の画素に関連付けられたコンテンツ係数を決定する。テクスチャ値は、画像内のテクスチャに基づく、画素に関連付けられたコンテンツのカテゴリの尤度を示す。クロマ値は、画像の色情報に基づく、画素に関連付けられたコンテンツのカテゴリの尤度を示す。コンテンツ修正回路は、コンテンツ係数回路からコンテンツ係数を受信する。コンテンツ修正回路は、少なくともコンテンツ係数を画素の輝度画素値のバージョンに適用することにより、画素の輝度画素値の鮮鋭化済みバージョンを生成する。

いくつかの実施形態では、コンテンツマップは、コンテンツマップを生成するために画像のバージョンに対して機械学習演算を実行するニューラルプロセッサ回路によって生成される。

いくつかの実施形態では、コンテンツマップは、画像に対してダウンスケーリングされる。コンテンツ係数回路は、コンテンツマップをアップサンプリングすることによりコンテンツ係数を決定し得る。コンテンツマップは、（１）コンテンツマップ内の格子点に関連付けられたコンテンツ係数を取得することと、（２）コンテンツマップが画像のサイズに一致するまで拡大されたとき、画素を取り囲む格子点に関連付けられたコンテンツ係数を補間することとによって、アップサンプリングされ得る。

いくつかの実施形態では、コンテンツ係数は、尤度値に従って重み付けされる。尤度値は、画像内のコンテンツの識別されたカテゴリ、テクスチャ値、及びクロマ値のうちの１つに基づく。

いくつかの実施形態では、画像の輝度バージョンは、第１の情報と、第１の成分の周波数成分よりも低い周波数成分を含む第２の情報とに分割されたとき、輝度画素値は画像の第１の情報に含まれる。

いくつかの実施形態では、画像プロセッサは、コンテンツ画像処理回路に結合されたバイラテラルフィルタを含む。バイラテラルフィルタは、輝度画素値のバージョンを生成する。

いくつかの実施形態では、コンテンツ修正回路は、コンテンツ係数が閾値を上回るとき、コンテンツ係数を輝度画素値のバージョンと乗算することにより、コンテンツ係数を輝度画素値のバージョンに適用する。コンテンツ修正回路は、コンテンツ係数が閾値未満であることに応じて、コンテンツ係数に基づいて輝度画素値のバージョンをブレンディングすることにより、コンテンツ係数を輝度画素値のバージョンに適用する。

いくつかの実施形態では、コンテンツマップは、コンテンツマップ内の格子点に対応する画像の画素に適用される鮮鋭化の量を示すヒートマップである。

一実施形態に係る、電子デバイスの概要図である。一実施形態に係る、電子デバイスの構成要素を示すブロック図である。一実施形態に係る、画像信号プロセッサを用いて実装される画像処理パイプラインを示すブロック図である。一実施形態に係る、多重バンドノイズ低減回路を含む画像処理パイプラインの一部分を示すブロック図である。一実施形態に係る、画像信号プロセッサにコンテンツマップを提供するニューラルプロセッサ回路を示すブロック図である。一実施形態に係る、ニューラルプロセッサ回路の例示的な入力画像である。一実施形態に係る、図６Ａの入力画像に基づくコンテンツマップである。一実施形態に係る、第１のコントラスト強調ステージ回路の構成要素を示すブロック図である。一実施形態に係る、コンテンツ画像処理回路の構成要素を示すブロック図である。一実施形態に係る、テクスチャモデルを示すプロットである。一実施形態に係る、クロマモデルを示すプロットである。一実施形態に係る、コンテンツマップをアップサンプリングする方法を示す図である。一実施形態に係る、画像のセグメント内のコンテンツに基づいて画像の１つ以上の画素を鮮鋭化する方法を示すフローチャートである。

種々の非限定的な実施形態を単に例示を目的として、図で示し、詳細な説明において説明する。

ここで、添付図面に実施例が示される実施形態への詳細な参照が行われる。以下の詳細な説明では、説明される様々な実施形態の完全な理解を提供するために数多くの具体的な詳細が記載されている。しかし、説明する実施形態は、これらの具体的な詳細なしに実施され得る。他の例では、周知の方法、手順、構成要素、回路、及びネットワークは、実施形態の態様を不必要に不明瞭にしないよう詳細には説明されていない。

本開示の実施形態は、コンテンツマップによって示されるセグメント内のコンテンツに基づいて画像のセグメントを鮮鋭化することに関する。画像の画素又はセグメントに対するコンテンツ係数は、画素又はセグメントに関連付けられたコンテンツの識別されたカテゴリのうちの１つ以上に基づいて決定される。コンテンツ係数はまた、テクスチャ値のセット及び／又はクロマ値のセットに基づいて調整され得る。テクスチャ値は、コンテンツの識別されたカテゴリのうちの１つの尤度を示し、画像内のテクスチャに基づく。クロマ値は、コンテンツの識別されたカテゴリのうちの１つの尤度を示し、画像の色情報に基づく。コンテンツ係数は、画素又はセグメントに適用され、輝度値の鮮鋭化済みバージョンを生成する。

例示的な電子デバイス
電子デバイス、このようなデバイス用のユーザインターフェース、及びこのようなデバイスの使用に関連するプロセスの実施形態が説明される。いくつかの実施形態では、デバイスは、パーソナルデジタルアシスタント（ＰＤＡ）機能及び／又は音楽プレーヤ機能などの他の機能も含む、携帯電話などのポータブル通信デバイスである。ポータブル多機能デバイスの例示的な実施形態としては、カリフォルニア州クパチーノのＡｐｐｌｅＩｎｃ．からのｉＰｈｏｎｅ（登録商標）、ｉＰｏｄＴｏｕｃｈ（登録商標）、ＡｐｐｌｅＷａｔｃｈ（登録商標）、及びｉＰａｄ（登録商標）のデバイスが挙げられるが、これらに限定されない。ウェアラブル、ラップトップ、又はタブレットコンピュータなどの他のポータブル電子デバイスは、任意選択的に使用される。いくつかの実施形態では、デバイスは、ポータブル通信デバイスではないが、ポータブル使用のために設計されていないデスクトップコンピュータ又は他のコンピューティングデバイスである。いくつかの実施形態では、開示されている電子デバイスは、タッチ感知面（例えば、タッチスクリーンディスプレイ及び／又はタッチパッド）を含み得る。図１に関連して以下に説明する例示的な電子デバイス（例えば、デバイス１００）は、ユーザ入力を受け取るためのタッチ感知面を含み得る。電子デバイスは、物理キーボード、マウス、及び／又はジョイスティックなどの、１つ以上の他の物理ユーザインターフェースデバイスも含み得る。

図１は、一実施形態に係る、電子デバイス１００の概要図である。デバイス１００は、「ホーム」ボタン又はメニューボタン１０４などの、１つ以上の物理ボタンを含み得る。メニューボタン１０４は、例えば、デバイス１００上で実行されるアプリケーションのセット内の任意のアプリケーションへナビゲートするために使用される。いくつかの実施形態では、メニューボタン１０４は、メニューボタン１０４上の指紋を識別する指紋センサを含む。指紋センサを使用して、メニューボタン１０４上の指が、デバイス１００をロック解除するために記憶された指紋と一致する指紋を有するかを判定し得る。あるいは、いくつかの実施形態では、メニューボタン１０４は、タッチスクリーン上に表示されるグラフィカルユーザインターフェース（Graphical User Interface、ＧＵＩ）内のソフトキーとして実装される。

いくつかの実施形態では、デバイス１００は、タッチスクリーン１５０、メニューボタン１０４、デバイスの電源をオン／オフし、デバイスをロックするためのプッシュボタン１０６、音量調整ボタン１０８、加入者識別モジュール（Subscriber Identity Module、ＳＩＭ）カードスロット１１０、ヘッドセットジャック１１２、及びドッキング／充電用外部ポート１２４を含む。プッシュボタン１０６は、ボタンを押下して押下状態を既定の時間間隔保ち続けることにより、デバイスの電源をオン／オフし、ボタンを押下して既定の時間間隔が経過する前にボタンを放すことにより、デバイスをロックし、及び／又はデバイスをロック解除し若しくはロック解除処理を開始するために、用いられ得る。代替の実施形態では、デバイス１００は、マイクロフォン１１３を介して、いくつかの機能をアクティブ化又は非アクティブ化するための口頭入力もまた受け入れる。デバイス１００は、メモリ（１つ以上のコンピュータ可読記憶媒体を含むことができる）、メモリコントローラ、１つ以上の中央処理装置（ＣＰＵ）、周辺機器インターフェース、ＲＦ回路、オーディオ回路、スピーカ１１１、マイクロフォン１１３、入出力（Input/Output、Ｉ／Ｏ）サブシステム、及び他の入力又は制御デバイスを含むがこれらに限定されない、様々な構成要素を含む。デバイス１００は、１つ以上の画像センサ１６４と、１つ以上の近接センサ１６６と、１つ以上の加速度計１６８とを含むことができる。デバイス１００は、２つ以上の種類の画像センサ１６４を含み得る。各種類は、２つ以上の画像センサ１６４を含んでもよい。例えば、１つの種類の画像センサ１６４はカメラであり得、別の種類の画像センサ１６４は、顔認識のために使用され得る赤外線センサであり得る。追加又は代替として、画像センサ１６４は、異なるレンズ構成に関連付けられ得る。例えば、デバイス１００は、一方が広角レンズを有し、他方が望遠レンズを有する後方画像センサを含んでもよい。デバイス１００は、環境光センサ、ドットプロジェクタ、及び投光イルミネータなど、図１に示されていない構成要素を含み得る。

デバイス１００は、電子デバイスの単なる一例に過ぎず、デバイス１００は、上記に列挙したものより多い又は少ない構成要素を有し得、それらの構成要素の一部は、１つの構成要素として組み合わせられるか、又は別の構成若しくは配置を有し得る。上記に列挙したデバイス１００の様々な構成要素は、１つ以上の信号処理回路及び／又は特定用途向け集積回路（Application Specific Integrated circuit、ＡＳＩＣ）を含む、ハードウェア、ソフトウェア、ファームウェア、又はそれらの組み合わせで具現化される。図１の構成要素は概して、タッチスクリーン１５０と同じ側に位置するものとして示されているが、１つ以上の構成要素は、デバイス１００の反対側に位置してもよい。例えば、デバイス１００の前面は、顔認識のための赤外線画像センサ１６４と、デバイス１００の前面カメラとしての別の画像センサ１６４とを含み得る。デバイス１００の背面はまた、デバイス１００の後方カメラとして追加の２つの画像センサ１６４を含み得る。

図２は、一実施形態に係る、デバイス１００の構成要素を示すブロック図である。デバイス１００は、画像処理を含む様々な演算を実行し得る。この目的及び他の目的のために、デバイス１００は、他の構成要素の中でもとりわけ、画像センサ２０２、システムオンチップ（System-ON-a Chip、ＳＯＣ）構成要素２０４、システムメモリ２３０、永続ストレージ（例えば、フラッシュメモリ）２２８、方位センサ２３４、及びディスプレイ２１６を含むことができる。図２に示すような構成要素は、単なる例示に過ぎない。例えば、デバイス１００は、図２に示されていない他の構成要素（スピーカ又はマイクロフォンなど）を含んでもよい。更に、いくつかの構成要素（方位センサ２３４など）は、デバイス１００から省略され得る。

画像センサ２０２は、画像データをキャプチャするための構成要素である。画像センサ２０２の各々は、画像データをキャプチャするための構成要素であり、例えば、相補型金属酸化膜半導体（Complementary Metal-Oxide-Semiconductor、ＣＭＯＳ）アクティブ画素センサ、カメラ、ビデオカメラ、又は他のデバイスとして具現化され得る。画像センサ２０２は、更なる処理のためにＳＯＣ構成要素２０４に送信されるＲＡＷ画像データを生成する。いくつかの実施形態では、ＳＯＣ構成要素２０４によって処理された画像データは、ディスプレイ２１６上に表示され、システムメモリ２３０、永続ストレージ２２８に記憶され、又は、ネットワーク接続を介してリモートコンピューティングデバイスに送信される。画像センサ２０２によって生成されるＲＡＷ画像データは、ベイヤカラーフィルタ配列（Color Filter Array、ＣＦＡ）パターン（以降、「ベイヤパターン」とも呼ばれる）とすることができる。画像センサ２０２はまた、画像感知構成要素（例えば、画素）が画像をキャプチャするのを支援する光学的構成要素及び機械的構成要素を含み得る。光学的構成要素及び機械的構成要素は、絞り、レンズシステム、及び画像センサ２０２の焦点距離を制御するアクチュエータを含み得る。

動きセンサ２３４は、デバイス１００の動きを感知するための構成要素又は構成要素のセットである。動きセンサ２３４は、デバイス１００の方位及び／又は加速度を示すセンサ信号を生成し得る。センサ信号は、デバイス１００をオンにする、又はディスプレイ２１６上に表示された画像を回転させるなどの、様々な演算のためにＳＯＣ構成要素２０４に送信される。

ディスプレイ２１６は、ＳＯＣ構成要素２０４によって生成される画像を表示するための構成要素である。ディスプレイ２１６は、例えば、液晶ディスプレイ（Liquid Crystal Display、ＬＣＤ）デバイス又は有機発光ダイオード（Organic Light Emitting Diode、ＯＬＥＤ）デバイスを含み得る。ＳＯＣ構成要素２０４から受信したデータに基づいて、ディスプレイ１１６は、メニュー、選択された動作パラメータ、画像センサ２０２によってキャプチャされＳＯＣ構成要素２０４によって処理された画像、及び／又はデバイス１００のユーザインターフェース（図示せず）から受信した他の情報などの、様々な画像を表示し得る。

システムメモリ２３０は、ＳＯＣ構成要素２０４によって実行するための命令、及びＳＯＣ構成要素２０４によって処理されたデータを記憶するための構成要素である。システムメモリ２３０は、例えば、ダイナミックランダムアクセスメモリ（Dynamic Random Access Memory、ＤＲＡＭ）、シンクロナスＤＲＡＭ（Synchronous DRAM、ＳＤＲＡＭ）、ダブルデータレート（ＤｏｕｂｌｅＤａｔａＲａｔｅ、ＤＤＲ、ＤＤＲ２、ＤＤＲ３など）ＲＡＭＢＵＳＤＲＡＭ（ＲＤＲＡＭ）、スタティックＲＡＭ（Static RAM、ＳＲＡＭ）、又はそれらの組み合わせを含む、任意の種類のメモリとして具現化され得る。いくつかの実施形態では、システムメモリ２３０は、画素データ若しくは他の画像データ、又は統計データを様々なフォーマットで記憶し得る。

永続ストレージ２２８は、データを不揮発的に記憶するための構成要素である。永続ストレージ２２８は、電源がなくてもデータを保持する。永続ストレージ２２８は、読み出し専用メモリ（Read-Only Memory、ＲＯＭ）、フラッシュメモリ、又は他の不揮発性ランダムアクセスメモリデバイスとして具現化され得る。永続ストレージ２２８は、デバイス１００のオペレーティングシステム及び様々なソフトウェアアプリケーションを記憶する。永続ストレージ２２８はまた、回帰モデル、ランダムフォレストモデル、カーネルＳＶＭなどのサポートベクターマシン（Support Vector Machine、ＳＶＭ）や、畳み込みネットワークネットワーク（convolutional neural networks、ＣＮＮ）、再帰型ニューラルネットワーク（recurrent neural network、ＲＮＮ）、オートエンコーダ、及び長・短期記憶（Long Short Term Memory、ＬＳＴＭ）などの人工ニューラルネットワーク（Artificial Neural Network、ＡＮＮ）などの１つ以上の機械学習モデルを記憶し得る。機械学習モデルは、ニューラルプロセッサ回路２１８及びデバイス１００の様々なソフトウェアアプリケーション又はセンサとともに作動する独立モデルであり得る。機械学習モデルは、ソフトウェアアプリケーションの一部であってもよい。機械学習モデルは、顔認識、画像分類、オブジェクト分類、概念分類、及び情報分類、発話認識、機械翻訳、音声認識、音声コマンド認識、テキスト認識、テキスト及びコンテキスト分析、他の自然言語の処理、予測や推奨などの様々なタスクを実行し得る。

デバイス１００に記憶された様々な機械学習モデルは、デバイス１００が使用されるときにデバイス１００が機械学習モデルを強化するか又はトレーニングし続けることを可能にするように、完全にトレーニングされてもよく、トレーニングされなくてもよく、又は部分的にトレーニングされてもよい。機械学習モデルの演算には、モデルをトレーニングする際に使用される様々な計算と、モデルを使用して実行時に結果を決定することとを含む。例えば、ある場合では、デバイス１００は、ユーザの顔画像をキャプチャし、デバイス１００をロック又はロック解除するために使用される機械学習モデルを改善し続けるために画像を使用する。

ＳＯＣ構成要素２０４は、１つ以上の集積回路（Integrated Circuit、ＩＣ）チップとして具現化され、様々なデータ処理プロセスを実行する。ＳＯＣ構成要素２０４は、他の副構成要素の中でもとりわけ、画像信号プロセッサ（Image Signal Processor、ＩＳＰ）２０６、中央処理装置（Central Processor Unit、ＣＰＵ）２０８、ネットワークインターフェース２１０、動きセンサインターフェース２１２、ディスプレイコントローラ２１４、グラフィックプロセッサユニット（Graphics Processor、ＧＰＵ）２２０、メモリコントローラ２２２、ビデオエンコーダ２２４、ストレージコントローラ２２６、ニューラルプロセッサ回路２１８、及びこれらの副構成要素を接続するバス２３２を含むことができる。ＳＯＣ構成要素２０４は、図２に示される副構成要素よりも多い又は少ない副構成要素を含んでもよい。

ＩＳＰ２０６は、画像処理パイプラインの様々なステージを実行する回路である。いくつかの実施形態では、ＩＳＰ２０６は、画像センサ２０２からＲＡＷ画像データを受信し、そのＲＡＷ画像データをＳＯＣ構成要素２０４の他の副構成要素又はデバイス１００の構成要素によって使用可能な形態に処理し得る。ＩＳＰ２０６は、図３を参照して以下に詳細に説明するように、画像変換演算、水平スケーリング及び垂直スケーリング、色空間変換、並びに／又は画像安定化変換などの、様々な画像操作演算を実行し得る。

ＣＰＵ２０８は、任意の好適な命令セットアーキテクチャを使用して具現化してもよく、その命令セットアーキテクチャで定義された命令を実行するように構成されてもよい。ＣＰＵ２０８は、ｘ８６、ＰｏｗｅｒＰＣ、ＳＰＡＲＣ、ＲＩＳＣ、ＡＲＭ、若しくはＭＩＰＳ命令セットアーキテクチャ（Instruction Set Architectures、ＩＳＡ）、又は任意の他の好適なＩＳＡなどの様々なＩＳＡのいずれかを使用する汎用プロセッサ又は組み込み型プロセッサであってもよい。単一のＣＰＵを図２に示すが、ＳＯＣ構成要素２０４は、複数のＣＰＵを含み得る。マルチプロセッサシステムでは、必ずしもそうとは限らないが、ＣＰＵの各々は通常、同一のＩＳＡを共通して実装してもよい。

グラフィック処理ユニット（Graphics Processing Unit、ＧＰＵ）２２０は、グラフィックデータに対して演算を実行するためのグラフィック処理回路である。例えば、ＧＰＵ２２０は、フレームバッファに表示されることになるオブジェクト（例えば、フレーム全体に対して画素データを含むもの）をレンダリングし得る。ＧＰＵ２２０は、グラフィック演算の一部又は全てを実行するように、グラフィックソフトウェア又は特定のグラフィック演算のハードウェア高速化を実行し得る１つ以上のグラフィックプロセッサを含んでもよい。

ニューラルプロセッサ回路２１８は、ニューラルプロセッサ回路２１８の入力データに対して機械学習演算を実行するプログラム可能な回路である。機械学習演算は、機械学習モデルをトレーニングするための、及びトレーニングされた機械学習モデルに基づいて推定又は予測を実行するための異なる計算を含み得る。ニューラルプロセッサ回路２１８は、乗算、加算、及び累算を含む計算に基づいて、様々な機械学習演算を実行する回路である。このような計算は、例えば、入力データ及びカーネルデータのテンソル積及び畳み込みなどの様々な種類のテンソル乗算を実行するように編成され得る。ニューラルプロセッサ回路２１８は、ニューラルネットワーク演算に関連するリソース集約的な演算からＣＰＵ２０８を解放しつつ、これらの演算を高速かつ電力的に効率的に実行する構成可能回路である。ニューラルプロセッサ回路２１８は、センサインターフェース２１２、画像信号プロセッサ２０６、永続ストレージ２２８、システムメモリ２３０、又はネットワークインターフェース２１０若しくはＧＰＵ２２０などの他のソースから入力データを受信し得る。ニューラルプロセッサ回路２１８の出力は、様々な演算のために、画像信号プロセッサ２０６、システムメモリ２３０、又はＣＰＵ２０８などのデバイス１００の様々な構成要素に提供され得る。

ネットワークインターフェース２１０は、１つ以上のネットワークを介してデータをデバイス１００と他のデバイス（例えば、キャリアデバイス又はエージェントデバイス）との間で交換することを可能にする副構成要素である。例えば、ビデオ又は他の画像データは、ネットワークインターフェース２１０を介して他のデバイスから受信され、後続の処理及び表示のために（例えば、図３に関して後述するような画像信号プロセッサ２０６へのバックエンドインターフェースを介して）システムメモリ２３０に記憶され得る。ネットワークは、ローカルエリアネットワーク（Local Area Network、ＬＡＮ）（例えば、イーサネット又は企業ネットワーク）及びワイドエリアネットワーク（Wide Area Network、ＷＡＮ）を含み得るが、これらに限定されない。ネットワークインターフェース２１０を介して受信した画像データは、ＩＳＰ２０６による画像処理プロセスにかけられ得る。

動きセンサインターフェース２１２は、動きセンサ２３４とインターフェースするための回路である。動きセンサインターフェース２１２は、動きセンサ２３４からセンサ情報を受信し、このセンサ情報を処理して、デバイス１００の方位又は動きを判定する。

ディスプレイコントローラ２１４は、ディスプレイ２１６上に表示されることになる画像データを送信するための回路である。ディスプレイコントローラ２１４は、ＩＳＰ２０６、ＣＰＵ２０８、グラフィックプロセッサ、又はシステムメモリ２３０から画像データを受信し、ディスプレイ２１６上に表示するために好適なフォーマットに画像データを処理する。

メモリコントローラ２２２は、システムメモリ２３０と通信するための回路である。メモリコントローラ２２２は、ＳＯＣ構成要素２０４のＩＳＰ２０６、ＣＰＵ２０８、ＧＰＵ２２０、又はデータをシステムメモリ２３０から読み出して他の副構成要素に処理させることができる。メモリコントローラ２２２はまた、ＳＯＣ構成要素２０４の様々な副構成要素から受信したデータをシステムメモリ２３０に書き込み得る。

ビデオエンコーダ２２４は、ビデオデータを永続ストレージ１２８に記憶するために好適なフォーマットにエンコードするための、又はネットワークを介した別のデバイスへの伝送のためにデータをネットワークインターフェース２１０に渡すハードウェア、ソフトウェア、ファームウェア、又はそれらの組み合わせである。

いくつかの実施形態では、ＳＯＣ構成要素２０４の１つ以上の副構成要素又はこれらの副構成要素のいくつかの機能性は、ニューラルプロセッサ回路２１８、ＩＳＰ２０６、ＣＰＵ２０８、又はＧＰＵ２２０上で実行されるソフトウェア構成要素によって実行され得る。このようなソフトウェア構成要素は、システムメモリ２３０、永続ストレージ２２８、又はネットワークインターフェース２１０を介してデバイス１００と通信する別のデバイスに記憶され得る。

画像データ又はビデオデータは、ＳＯＣ構成要素２０４内の様々なデータ経路を介して流れることができる。一実施例では、ＲＡＷ画像データは、画像センサ２０２から生成され、ＩＳＰ２０６によって処理され、次に、バス２３２及びメモリコントローラ２２２を介してシステムメモリ２３０に送信され得る。画像データがシステムメモリ２３０に記憶された後で、画像データは、エンコードするためにビデオエンコーダ２２４によって、又は表示するためにディスプレイ１１６によって、バス２３２を介してアクセスされ得る。

別の実施例では、画像データは、画像センサ２０２以外のソースから受信される。例えば、ビデオデータは、ワイヤド又はワイヤレスネットワークを介してＳＯＣ構成要素２０４に、ストリーミングされるか、ダウンロードされるか、あるいは通信され得る。画像データは、ネットワークインターフェース２１０を介して受信され、メモリコントローラ２２２を介してシステムメモリ２３０に書き込まれ得る。次に、画像データは、図３を参照して以下に詳細に説明するように、ＩＳＰ２０６によってシステムメモリ２３０から取得され、１つ以上の画像処理パイプラインステージを介して処理され得る。次に、画像データは、システムメモリ２３０に戻され、又は、ビデオエンコーダ２２４、ディスプレイコントローラ２１４（ディスプレイ２１６上に表示するために）、若しくは永続ストレージ２２８に記憶するためにストレージコントローラ２２６に送信され得る。

例示的な画像信号処理パイプライン
図３は、一実施形態に係る、ＩＳＰ２０６を用いて実施される画像処理パイプラインを示すブロック図である。図３の実施形態では、ＩＳＰ２０６は、ＲＡＷ画像データを受信するために、１つ以上の画像センサ２０２Ａ～２０２Ｎ（以下、まとめて「画像センサ２０２」と呼ぶか、又は個別に「画像センサ２０２」とも呼ぶ）を含む画像センサシステム２０１に結合される。画像センサシステム２０１は、画像センサ２０２を個別に制御する１つ以上のサブシステムを含み得る。場合によっては、各画像センサ２０２は独立して動作することができ、他の場合では、画像センサ２０２は、いくつかの構成要素を共有することができる。例えば、一実施形態では、２つ以上の画像センサ２０２は、画像センサの機械的構成要素（例えば、各画像センサの焦点距離を変化させるアクチュエータ）を制御する同じ回路基板を共有してもよい。画像センサ２０２の画像感知構成要素は、ＩＳＰ２０６に異なる形態でＲＡＷ画像データを提供し得る異なる種類の画像感知構成要素を含み得る。例えば、一実施形態では、画像感知構成要素は、自動焦点合わせのために使用される複数の焦点画素と、画像をキャプチャするために使用される複数の画像画素とを含み得る。別の実施形態では、画像感知画素は、自動焦点合わせの目的と画像キャプチャの目的の両方に使用されてもよい。

ＩＳＰ２０６は、作成、キャプチャ又は受信から出力まで画像情報を処理するステージのセットを含み得る画像処理パイプラインを実施する。ＩＳＰ２０６は、他の構成要素の中でもとりわけ、センサインターフェース３０２、中央制御モジュール３２０、フロントエンドパイプラインステージ３３０、バックエンドパイプラインステージ３４０、画像統計モジュール３０４、スケーラ３２２、バックエンドインターフェース３４２、出力インターフェース３１６、及び自動焦点合わせ回路３５０Ａ～３５０Ｎ（以下、まとめて「自動焦点合わせ回路３５０」と呼ぶか、又は個別に「自動焦点合わせ回路３５０」と呼ぶ）を含み得る。ＩＳＰ２０６は、図３に示されていない他の構成要素を含むことができ、又は、図３に示す１つ以上の構成要素を省略することができる。

１つ以上の実施形態では、ＩＳＰ２０６の異なる構成要素は、画像データを異なるレートで処理する。図３の実施形態では、フロントエンドパイプラインステージ３３０（例えば、ＲＡＷ処理ステージ３０６及びリサンプリング処理ステージ３０８）は、画像データを初期レートで処理することができる。したがって、様々な異なる技法、調整、修正、又は他の処理演算は、これらのフロントエンドパイプラインステージ３３０によって初期レートで実行される。例えば、フロントエンドパイプラインステージ３３０がクロックサイクルごとに２つの画素を処理する場合、ＲＡＷ処理ステージ３０６の演算（例えば、ブラックレベル補償、ハイライトリカバリ、及び不良画素補正）は、画像データの２つの画素を同時に処理し得る。対照的に、１つ以上のバックエンドパイプラインステージ３４０は、画像データを初期データレート未満の異なる速度で処理することができる。例えば、図３の実施形態では、バックエンドパイプラインステージ３４０（例えば、ノイズ処理ステージ３１０、カラー処理ステージ３１２、及び出力リスケーリングモジュール３１４）は、低減したレート（例えば、クロックサイクルごとに１画素）で処理され得る。

画像センサ２０２によってキャプチャされたＲＡＷ画像データは、異なる方法でＩＳＰ２０６の異なる構成要素に送信され得る。一実施形態では、焦点画素に対応するＲＡＷ画像データは、自動焦点合わせ回路３５０に送信され得、一方、画像画素に対応するＲＡＷ画像データは、センサインターフェース３０２に送信され得る。別の実施形態では、両方の種類の画素に対応するＲＡＷ画像データは、自動焦点合わせ回路３５０とセンサインターフェース３０２の両方に同時に送信され得る。

自動焦点合わせ回路３５０は、各画像センサ２０２の適切な焦点距離を決定するためにＲＡＷ画像データを分析するハードウェア回路を含み得る。一実施形態では、ＲＡＷ画像データは、画像合焦に特化した画像感知画素から送信されてくるデータを含み得る。別の実施形態では、画像キャプチャ画素からのＲＡＷ画像データもまた、自動焦点合わせの目的のために使用され得る。自動焦点合わせ回路３５０は、適切な焦点距離を決定するデータを生成するために様々な画像処理演算を実行し得る。画像処理演算は、自動焦点合わせの目的に使用されるデータを生成するためのクロッピング、ビニング、画像補償、スケーリングを含み得る。自動焦点合わせ回路３５０によって生成された自動焦点合わせデータは、画像センサ２０２の焦点距離を制御するために画像センサシステム２０１にフィードバックされ得る。例えば、画像センサ２０２は、画像センサの焦点距離を変更するために、画像センサのレンズシステムに関連付けられたアクチュエータに送信されるコマンド信号を決定する、自動焦点合わせデータを分析する制御回路を含み得る。自動焦点合わせ回路３５０によって生成されたデータはまた、他の画像処理の目的のためにＩＳＰ２０６の他の構成要素に送信され得る。例えば、データの一部は、自動露出に関する情報を決定するために画像統計モジュール３０４に送信され得る。

自動焦点合わせ回路３５０は、画像統計モジュール３０４、センサインターフェース３０２、フロントエンドモジュール３３０及びバックエンドモジュール３４０などの他の構成要素とは別個の個々の回路であってもよい。これにより、ＩＳＰ２０６は、他の画像処理パイプラインから独立して自動焦点合わせ分析を実行することができる。例えば、ＩＳＰ２０６は、画像センサ２０２Ｂからの画像データの下流画像処理を実行すると同時に、自動焦点合わせ回路３５０Ａを使用して画像センサ２０２Ａの焦点距離を調整するために、画像センサ２０２ＡからのＲＡＷ画像データを分析することができる。一実施形態では、自動焦点合わせ回路３５０の数は、画像センサ２０２の数に対応し得る。言い換えれば、各画像センサ２０２は、画像センサ２０２の自動焦点合わせ専用の、対応する自動焦点合わせ回路を有し得る。デバイス１００は、１つ以上の画像センサ２０２がアクティブに使用されていない場合でも、異なる画像センサ２０２に対して自動焦点合わせを実行し得る。これは、デバイス１００が１つの画像センサ２０２から別の画像センサ２０２に切り替わるときに、２つの画像センサ１０２間のシームレスな移行を可能にする。例えば、一実施形態では、デバイス１００は、写真及び画像の処理のためのデュアルバックカメラシステムとして広角カメラ及び望遠カメラを含み得る。デバイス１００は、デュアルカメラのうちの１つによってキャプチャされた画像を表示することができ、２つのカメラを時々切り替えることができる。２つ以上の自動焦点合わせ回路３５０が自動焦点合わせデータを画像センサシステム２０１に連続的に提供し得るので、表示される画像は、第２の画像センサ２０２がその焦点距離を調整するのを待つことなく、１つの画像センサ２０２によってキャプチャされた画像データから別の画像センサによってキャプチャされた画像データにシームレスに移行し得る。

異なる画像センサ２０２によってキャプチャされたＲＡＷ画像データはまた、センサインターフェース３０２に送信され得る。センサインターフェース３０２は、画像センサ２０２からＲＡＷ画像データを受信して、ＲＡＷ画像データをパイプライン内の他のステージによって処理可能な画像データに処理する。センサインターフェース３０２は、画像データサイズを縮小させるために画像クロッピング、ビニング、又はスケーリングなどの様々な前処理演算を実行することができる。いくつかの実施形態では、画素は、画像センサ２０２からセンサインターフェース３０２にラスタ順に（例えば、水平に、１行ごとに）送信される。パイプライン内の後続のプロセスも、ラスタ順に実行することができ、結果もまた、ラスタ順に出力することができる。図３に１つの画像センサ及び１つのセンサインターフェース３０２のみが示されているが、２つ以上の画像センサがデバイス１００に設けられている場合、各画像センサからのＲＡＷ画像データを処理するために、対応する数のセンサインターフェースをＩＳＰ２０６に設けることができる。

フロントエンドパイプラインステージ３３０は、ＲＡＷカラードメイン又はフルカラードメインで画像データを処理する。フロントエンドパイプラインステージ３３０は、ＲＡＷ処理ステージ３０６及びリサンプリング処理ステージ３０８を含み得るが、これらに限定されない。ＲＡＷ画像データは、例えば、ベイヤＲＡＷフォーマットとすることができる。ベイヤＲＡＷ画像フォーマットでは、（全ての色に対するものではなく）特定の色に対して特定の値を有する画素データが、各画素に与えられる。画像キャプチャセンサでは、画像データは、典型的には、ベイヤパターンで提供される。ＲＡＷ処理ステージ３０６は、画像データをベイヤーＲＡＷフォーマットで処理することができる。

ＲＡＷ処理ステージ３０６によって実行される演算は、センサ線形化、ブラックレベル補償、固定パターンノイズ低減、不良画素補正、ＲＡＷノイズフィルタリング、レンズシェーディング補正、ホワイトバランスゲイン、及びハイライトリカバリを含むが、これらに限定されない。センサ線形化は、他の処理のために非線形画像データを線形空間にマッピングすることを指す。ブラックレベル補償は、画像データの各色成分（例えば、Ｇｒ、Ｒ、Ｂ、Ｇｂ）に対してデジタルゲイン、オフセット、及びクリップを独立して提供することを指す。固定パターンノイズ低減は、入力画像からダークフレームを減算し、そして異なるゲインを画素に乗算することにより、オフセット固定パターンノイズ及びゲイン固定パターンノイズを除去することを指す。不良画素補正は、不良画素を検出し、次に不良画素値を置き換えることを指す。ＲＡＷノイズフィルタリングは、輝度が類似の隣接した画素を平均化することにより、画像データのノイズを低減することを指す。ハイライトリカバリは、他のチャネルからクリップされた（又は、ほぼクリップされた）画素に対して画素値を推定することを指す。レンズシェーディング補正は、レンズの光学的中心からの距離にほぼ比例した光度の減少を補償するために画素ごとのゲインを適用することを指す。ホワイトバランスゲインは、全ての色成分（例えば、ベイヤフォーマットのＧｒ、Ｒ、Ｂ、Ｇｂ）に対してホワイトバランスのためのデジタルゲイン、オフセット及びクリップを独立して提供することを指す。ＩＳＰ２０６の構成要素は、ＲＡＷ画像データをフルカラードメインの画像データに変換することができ、したがって、ＲＡＷ処理ステージ３０６は、ＲＡＷ画像データに加えて又はその代わりに、フルカラードメインの画像データを処理することができる。

リサンプリング処理ステージ３０８は、様々な演算を実行して、ＲＡＷ処理ステージ３０６から受信した画像データを変換、リサンプリング、又はスケーリングする。リサンプリング処理ステージ３０８によって実行される演算は、デモザイク演算、画素ごと色補正演算、ガンママッピング演算、色空間変換、及びダウンスケーリング又はサブバンド分割を含み得るが、これらに限定されない。デモザイク演算は、ＲＡＷ画像データから欠落した色サンプルを（例えば、ベイヤパターンに）変換又は補間して、画像データをフルカラードメインに出力することを指す。デモザイク演算は、フルカラー画素を得るための補間されたサンプルに対する指向性ローパスフィルタリングを含み得る。画素ごと色補正演算は、各色チャネルの相対ノイズ標準偏差に関する情報を用いて画素ごとに色補正を実行して、画像データ内のノイズを増幅することなしに色を補正するプロセスを指す。ガンママッピングは、画像データを入力画像データ値から出力データ値に変換して、ガンマ補正を実行することを指す。ガンママッピングの目的のために、各画素の異なる色成分又は色チャネルに対するルックアップテーブル（又は画素値を別の値にインデックス付けする他の構造）（例えば、Ｒ、Ｇ、及びＢの色成分に対する別個のルックアップテーブル）を使用することができる。色空間変換は、入力画像データの色空間を異なるフォーマットに変換することを指す。一実施形態では、リサンプリング処理ステージ３０８は、更なる処理のためにＲＧＧフォーマットをＹＣｂＣｒフォーマットに変換する。一実施形態では、リサンプリング処理ステージ３０８は、更なる処理のためにＲＢＤフォーマットをＲＧＢフォーマットに変換する。

中央制御モジュール３２０は、ＩＳＰ２０６内の他の構成要素の動作の全体を制御して連係させることができる。中央制御モジュール３２０は、ＩＳＰ２０６の他の構成要素の開始及び停止を制御するために、様々な動作パラメータをモニターすること（例えば、クロックサイクル、メモリ待ち時間、サービスの品質、及び状態情報をログ記録すること）、ＩＳＰ２０６の他の構成要素の制御パラメータを更新又は管理すること、及びセンサインターフェース３０２とインターフェースすることを含むが、これらに限定されない動作を実行する。例えば、中央制御モジュール３２０は、他の構成要素がアイドル状態にある間に、ＩＳＰ２０６内の他の構成要素のプログラム可能なパラメータを更新することができる。プログラム可能なパラメータを更新した後で、中央制御モジュール３２０は、ＩＳＰ２０６のこれらの構成要素を、１つ以上の動作又はタスクを実行するように、実行状態にし得る。中央制御モジュール３２０はまた、リサンプリング処理ステージ３０８の前、その間、又はその後に、画像データを記憶する（例えば、図２のシステムメモリ２３０に書き込むことにより）ように、ＩＳＰ２０６の他の構成要素に命令し得る。このようにして、リサンプリング処理ステージ３０８からの画像データ出力を、バックエンドパイプラインステージ３４０を介して処理することに加えて又はその代わりに、ＲＡＷカラードメインフォーマット又はフルカラードメインフォーマットのフル解像度の画像データを記憶することができる。

画像統計モジュール３０４は、様々な演算を実行して、画像データに関連付けられた統計情報を収集する。統計情報を収集するための演算は、センサ線形化、パターン化不良画素の置き換え、ＲＡＷ画像データのサブサンプリング、非パターン化不良画素の検出及び置き換え、ブラックレベル補償、レンズシェーディング補正、逆ブラックレベル補償を含み得るが、これらに限定されない。このような演算のうちの１つ以上を実行した後で、３Ａ統計（オートホワイトバランス（Auto White Balance、ＡＷＢ）、自動露出（Auto Exposure、ＡＥ）、ヒストグラム（例えば、２Ｄカラー若しくは成分）などの統計情報、及び任意の他の画像データ情報を収集又は追跡することができる。いくつかの実施形態では、特定の画素の値又は画素値のエリアは、先行する演算がクリップされた画素を識別する場合、特定の統計データの収集から除外してもよい。図３に１つの統計モジュール３０４のみが示されているが、複数の画像統計モジュールがＩＳＰ２０６に含まれていてもよい。例えば、各画像センサ２０２は、個々の画像統計ユニット３０４に対応し得る。このような実施形態では、各統計モジュールは、同じ又は異なる画像データに対して異なる情報を収集するように、中央制御モジュール３２０によってプログラムすることができる。

スケーラ３２２は、画像データを受信し、画像のダウンスケーリングされたバージョンを生成する。したがって、スケーラ３２２は、ニューラルプロセッサ回路２１８などの様々な構成要素に解像度の低減された画像を提供することができる。スケーラ３２２は、図３ではＲＡＷ処理ステージ３０６に結合されているが、スケーラ３２２は、画像信号プロセッサ２０６の他の構成要素から入力画像を受信するように結合されていてもよい。

バックエンドインターフェース３４２は、画像センサ１０２以外の画像ソースから画像データを受信し、それをＩＳＰ２０６の他の構成要素に転送して処理させる。例えば、画像データは、ネットワーク接続を介して受信され、システムメモリ２３０に記憶され得る。バックエンドインターフェース３４２は、システムメモリ２３０に記憶された画像データを取り出して、それをバックエンドパイプラインステージ３４０に提供して処理させる。バックエンドインターフェース３４２によって実行される多くの演算のうちの１つは、取り出された画像データをバックエンド処理ステージ３４０によって利用することができるフォーマットに変換することである。例えば、バックエンドインターフェース３４２は、ＲＧＢ、ＹＣｂＣｒ４：２：０、又はＹＣｂＣｒ４：２：２にフォーマットされた画像データをＹＣｂＣｒ４：４：４カラーフォーマットに変換することができる。

バックエンドパイプラインステージ３４０は、特定のフルカラーフォーマット（例えば、ＹＣｂＣｒ４：４：４又はＲＧＢ）に従って画像データを処理する。いくつかの実施形態では、バックエンドパイプラインステージ３４０の構成要素は、更なる処理の前に、画像データを特定のフルカラーフォーマットに変換することができる。バックエンドパイプラインステージ３４０は、他のステージの中でもとりわけ、ノイズ処理ステージ３１０及びカラー処理ステージ３１２を含むことができる。バックエンドパイプラインステージ３４０は、図３に示されていない他のステージを含むことができる。

ノイズ処理ステージ３１０は、様々な演算を実行して、画像データ内のノイズを低減する。ノイズ処理ステージ３１０によって実行される演算は、色空間変換、ガンマ／デガンママッピング、時間的フィルタリング、ノイズフィルタリング、ルマ鮮鋭化、及びクロマノイズ低減を含むが、これらに限定されない。色空間変換は、画像データを１つの色空間フォーマットから別の色空間フォーマットに変換（例えば、ＲＧＢフォーマットをＹＣｂＣｒフォーマットに変換）することができる。ガンマ／デガンマ演算は、画像データを入力画像データ値から出力データ値に変換して、ガンマ補正又は逆ガンマ補正を実行する。時間的フィルタリングは、前にフィルタリングされた画像フレームを用いてノイズをフィルタリングして、ノイズを低減する。例えば、前の画像フレームの画素値に、現在の画像フレームの画素値を組み合わせる。ノイズフィルタリングは、例えば、空間的ノイズフィルタリングを含むことができる。ルマ鮮鋭化は、画素データのルマ値を鮮鋭化することができ、一方、クロマ抑制は、クロマをグレー（例えば、色がない）に減衰させることができる。いくつかの実施形態では、ルマ鮮鋭化及びクロマ抑制は、空間ノイズフィルタリングと同時に実行され得る。ノイズフィルタリングの度合（aggressiveness）は、画像の異なる領域に対して異なって判定されてもよい。空間的ノイズフィルタリングは、時間的フィルタリングを実行する時間ループの一部に含まれてもよい。例えば、前の画像フレームは、処理されることになる次の画像フレームに対する基準フレームとして記憶される前に、時間的フィルタ及び空間的ノイズフィルタによって処理されてもよい。他の実施形態では、空間的ノイズフィルタリングは、時間的フィルタリング用の時間ループの一部として含まれなくてもよい（例えば、空間的ノイズフィルタは、画像フレームが基準画像フレームとして記憶された後にそれに適用されてもよく、よって、基準フレームは空間的にフィルタリングされていない）。

カラー処理ステージ３１２は、画像データ内の色情報を調整することに関連付けられた様々な演算を実行することができる。カラー処理ステージ３１２で実行される演算は、局所的なトーンマッピング、ゲイン／オフセット／クリップ、色補正、３次元カラールックアップ、ガンマ変換、及び色空間変換を含むが、これらに限定されない。局所的なトーンマッピングは、画像をレンダリングするときに更なる制御を提供するために、局所的なトーンカーブを空間的に変化させることを指す。例えば、トーンカーブの２次元格子（中央制御モジュール３２０によってプログラミングすることができる）は、平坦に変化するトーンカーブが画像にわたって生成されるように、双線形補間がなされてもよい。いくつかの実施形態では、局所的なトーンマッピングはまた、例えば、画像内のシャドウの青色を暗くすると同時に、空をより青くするために使用することができる、空間的に変化し、かつ光度が変化する色補正行列を適用してもよい。デジタルゲイン／オフセット／クリップは、画像データの色チャネル又は色成分ごとに提供されてもよい。色補正は、色補正変換行列を画像データに適用することができる。３Ｄカラールックアップは、拡張型トーンマッピング、色空間変換、及び他の色変換を実行するために、色成分出力値（例えば、Ｒ、Ｇ、Ｂ）の３次元アレイを利用してもよい。ガンマ変換は、例えば、ガンマ補正、トーンマッピング、又はヒストグラムマッチングを実行するために、入力画像データ値を出力データ値にマッピングすることにより、実行することができる。色空間変換は、ある色空間から別の色空間へ（例えば、ＲＧＢからＹＣｂＣｒに）画像データを変換するために実行されてもよい。他の処理技法もまた、ブラック及びホワイト変換、セピアトーン変換、ネガティブ変換、又はソラリゼーション変換を含む、他の特殊画像効果を実行するように、カラー処理ステージ３１２の一部として実行されてもよい。

出力リスケーリングモジュール３１４は、ＩＳＰ２０６が画像データを処理しているとき、その実行中（ｏｎｔｈｅｆｌｙ）に歪みをリサンプリング、変換及び補正することができる。出力リスケーリングモジュール３１４は、各画素の分数入力座標を計算し、そしてこの分数座標を使用して多相リサンプリングフィルタを介して出力画素を補間することができる。分数入力座標は、（例えば、単純な水平スケーリング変換及び垂直スケーリング変換を介した）画像のリサイジング又はクロッピング、（例えば、非分離行列変換を介した）画像の回転及びせん断、（例えば、追加の深度変換を介した）パースペクティブワーピング及び（例えば、ロールシャッタに起因する）画像データのキャプチャの間に画像センサにおける変化を原因とするストリップに区分的に適用される画素ごとのパースペクティブ分割、並びに（例えば、補間された放射状ゲインテーブルをインデックス付けするために光学的中心からの放射状距離を計算し、そしてレンズの放射状歪みを原因とする座標に放射状撹乱を適用することを介した）幾何学的歪み補正など、出力座標の様々な考えられる変換から生成され得る。

出力リスケーリングモジュール３１４は、出力リスケーリングモジュール３１４で画像データが処理される際に、画像データに変換を適用することができる。出力リスケーリングモジュール３１４は、水平スケーリング構成要素及び垂直スケーリング構成要素を含むことができる。設計の垂直部分は、垂直フィルタによって必要とされる「サポート」を保持するために、一連の画像データラインバッファを実装することができる。ＩＳＰ２０６をストリーミングデバイスとすることができるので、フィルタに使用可能なのは、有限長のラインからなるスライディングウィンドウ内の画像データのラインのみであり得る。入ってくるラインのための場所を空けるためにラインが破棄されると、そのラインは、利用できなくなり得る。出力リスケーリングモジュール３１４は、前のラインの計算された入力Ｙ座標を統計的にモニターし、それを使用して、垂直サポートウィンドウ内に保持するラインの最適なセットを計算することができる。各後続のラインに対して、出力リスケーリングモジュールは、垂直サポートウィンドウの中心に関する推量を自動的に生成することができる。いくつかの実施形態では、出力リスケーリングモジュール３１４は、画像フレームのキャプチャ中のセンサの動きによって生じたアーチファクト及び動きを補正するために、入力画像データと出力画像データとの間の画素ごとのパースペクティブ変換を実行するデジタル微分解析器（Digital Difference Analyzer、ＤＤＡ）ステッパとしてエンコードされた区分的パースペクティブ変換のテーブルを実装することができる。出力リスケーリングは、図１及び２に関して上述したように、出力インターフェース３１６を介してデバイス１００の様々な他の構成要素に画像データを提供することができる。

様々な実施形態では、構成要素３０２～３５０の機能性は、図３に示す画像処理パイプライン内のこれらの機能性ユニットの順序によって暗示された順序とは異なる順序で実行されてもよく、又は図３に示すものとは異なる機能性構成要素によって実行されてもよい。更に、図３に記載のような様々な構成要素は、ハードウェア、ファームウェア、又はソフトウェアの様々な組み合わせで具現化することができる。

多重バンドノイズ低減回路に関連する例示的なパイプライン
図４は、一実施形態に係る、多重バンドノイズ低減（Multiple Band Noise Reduction、ＭＢＮＲ）回路４２０を含む画像処理パイプラインの一部分を示すブロック図である。図４の実施形態では、ＭＢＮＲ回路４２０は、他の構成要素の中でもとりわけ、スケーラ４１０及びサブバンドスプリッタ回路４３０も含むリサンプリング処理ステージ３０８の一部である。リサンプリング処理ステージ３０８は、スケーリング、ノイズ低減、及びサブバンド分割を再帰的に実行する。

再帰的処理の結果として、リサンプリング処理ステージ３０８は、元の入力画像４０２から導出された一連の高周波成分画像データＨＦ（Ｎ）及び低周波成分画像データＬＦ（Ｎ）を出力する。ここで、Ｎは、元の入力画像４０２に対して実行されたダウンサンプリングのレベルを表す。例えば、ＨＦ（０）及びＬＦ（０）は、それぞれ、元の入力画像４０２から分割された高周波成分画像データ及び低周波成分画像データを表し、ＨＦ（１）及びＬＦ（１）は、それぞれ、入力画像４０２の第１のダウンスケーリングされたバージョンから分割された高周波成分画像データ及び低周波成分画像データを表す。

ＭＢＮＲ回路４２０は、入力画像４０２の多重バンドに対してノイズ低減を実行する回路である。入力画像４０２は、まず、ノイズ低減のためにマルチプレクサ４１４を介してＭＢＮＲ回路４２０に渡される。元の入力画像４０２のノイズ低減バージョン４２２は、ＭＢＮＲ回路４２０によって生成され、サブバンドスプリッタ４３０に供給される。サブバンドスプリッタ４３０は、元の入力画像４０２のノイズ低減バージョン４２２を高周波成分画像データＨＦ（０）と低周波成分画像データＬＦ（０）とに分割する。高周波成分画像データＨＦ（０）は、サブバンド処理パイプライン４４８に渡され、次にサブバンドマージャ３５２に渡される。対照的に、低周波数成分画像ＬＦ（０）はデマルチプレクサ４４０を通過し、スケーラ４１０によるダウンスケーリングのためにリサンプリング処理ステージ３０８にフィードバックされる。

スケーラ４１０は、スケーラ４１０に供給される低周波数成分画像ＬＦ（０）のダウンスケーリングされたバージョン４１２を生成し、それをノイズ低減のためにマルチプレクサ４１４を介してＭＢＮＲ回路４２０に渡す。ＭＢＮＲ回路４２０は、ノイズ低減を実行して、ダウンスケーリング画像４１２のノイズ低減バージョン４３２を生成し、それをサブバンドスプリッタ４３０に送り、処理された低周波画像データＬＦ（０）を高周波成分画像データＨＦ（１）と低周波成分画像データＬＦ（１）とに再び分割する。高周波成分画像データＨＦ（１）はサブバンド処理パイプライン４４８に送られ、次にサブバンドマージャ３５２に送られ、一方、低周波成分画像データＬＦ（１）は再びスケーラ４１０にフィードバックされて、リサンプリング処理ステージ３０８内でのプロセスを繰り返す。高周波成分画像データＨＦ（Ｎ）及び低周波成分画像データＬＦ（Ｎ）を生成する処理は、サブバンドスプリッタ４３０による最終レベルのバンド分割が行われるまで繰り返される。バンド分割の最終レベルに達すると、低周波成分画像データＬＦ（Ｎ）は、デマルチプレクサ４４０及びマルチプレクサ４４６を介して、サブバンド処理パイプライン４４８及びサブバンドマージャ３５２に渡される。

上述したように、ＭＢＮＲ回路４２０は、入力画像４０２及び入力画像４０２のダウンスケーリングされた低周波数バージョンに対してノイズ低減を実行する。これは、ＭＢＮＲ回路４２０が元の入力画像４０２の多重バンドに対してノイズ低減を実行することを可能にする。しかしながら、サブバンド分割及びスケーリングなしでは、ＭＢＮＲ回路４２０によって実行され得る入力画像４０２に対するノイズ低減は単一パスのみであることに留意されたい。

サブバンドマージャ３５２は、処理済み高周波成分画像データＨＦ（Ｎ）’と処理済み低周波成分画像データＬＦ（Ｎ）’とをマージして、処理済みＬＦ（Ｎ－１）’を生成する。処理済みＬＦ（Ｎ－１）’は、処理済みＬＦ（Ｎ－２）’を生成するために、処理済みＨＦ（Ｎ－１）’とマージするためにデマルチプレクサ４５０及びマルチプレクサ４４６を介してサブバンドマージャ３５２にフィードバックされる。処理済み高周波数成分画像データと処理済み低周波数成分データとをマージする処理は、サブバンドマージャ３５２がデマルチプレクサ４５０を介して出力される入力画像の処理済みバージョン４５４を生成するまで繰り返される。

第１のコントラスト強調ステージ４５０及び第２のコントラスト強調ステージ４５２は、画像のセグメントに関連付けられたコンテンツに基づいて、画像データのセグメントに対して鮮鋭化演算又は平滑化演算を実行する。第１のコントラスト強調ステージ４５０は、サブバンド処理パイプライン４４８の構成要素であり、入力画像４０２に対してダウンスケーリングされた高周波成分画像データＨＦ（Ｎ）に対して鮮鋭化演算を実行する。一方、第２のコントラスト強調ステージ４５２は、入力画像４０２と同じ空間サイズを有するフル解像度画像データであり得るサブバンドマージャ３５２の出力に対して鮮鋭化を実行する。第１及び第２のコントラスト強調ステージ４５０、４５２は、図７を参照して更に説明される。

コンテンツマップに関連する例示的なパイプライン
図５は、一実施形態に係る、ニューラルプロセッサ回路２１８による画像信号プロセッサ２０６へのコンテンツマップ５０４（本明細書では「セグメンテーションマップ」とも呼ばれる）の提供を示すブロック図である。画像信号プロセッサ２０６は、ニューラルプロセッサ回路２１８に入力画像５０２を提供する。入力画像５０２は、元の入力画像４０２と比較して同じであっても異なっていてもよい。入力画像５０２に基づいて、ニューラルプロセッサ回路２１８はコンテンツマップ５０４を生成し、コンテンツマップ５０４を画像信号プロセッサ２０６に提供する。例えば、コンテンツマップ５０４は、コントラスト強調ステージ４５０、４５２に送られる。

図２を参照して前に説明したように、ニューラルプロセッサ回路２１８は機械学習され得る。したがって、ニューラルプロセッサ回路２１８は、入力画像５０２に対して１つ以上の機械学習演算を実行することにより、コンテンツマップ５０４を決定し得る。いくつかの実施形態では、入力画像５０２は、元の入力画像４０２と比較して（例えば、スケーラ３２２によって提供される）解像度の低減された画像である。画像の解像度を低減することにより、コンテンツマップ５０４を生成するための処理時間を短縮することができる。しかしながら、コンテンツマップ５０４の解像度は典型的に、入力画像５０２の解像度と同じ又は同様であるので、コンテンツマップ５０４は、元の入力画像４０２に対してダウンスケーリングされ得る。例示的な入力画像６０２が図６Ａに提供され、例示的なコンテンツマップ６０４が図６Ｂに提供される。コンテンツマップ６０４は、画像６０２内の草５０６と人５０８を識別する。

コンテンツの各セグメントは、コンテンツの１つ以上の所定のカテゴリに関連付けられ得る。コンテンツマップ５０４は、アップスケーリングプロセス中に使用される複数の格子点を有する格子に関連付けられ得る。コンテンツマップ５０４は、フルスケール画像と同じサイズであってよい。いくつかの実施形態では、様々な処理を容易にするために、格子点の数は、鮮鋭化対象のフルスケール画像内の画素の数よりも少ない。１つ以上の実施形態では、マップの各格子点は、コンテンツのカテゴリ（本明細書では「コンテンツカテゴリ」とも呼ばれる）に関連付けることができ、以下で図１１を参照して詳細に説明するように、フルスケール画像内の近くの画素のコンテンツ係数を決定するために使用することができる。

コンテンツマップ５０４におけるコンテンツカテゴリの例は、異なる所望のコンテンツ係数を有する。異なるコンテンツカテゴリは、肌、葉、草、及び空を含んでもよい。他のカテゴリ（例えば、肌）に対して、特定のカテゴリ（例えば、葉及び草）を鮮鋭化することが一般に望ましい。１つ以上の実施形態では、ニューラルプロセッサ回路２１８は、様々な機械学習アルゴリズムを使用してトレーニングされて、入力画像５０２の異なるセグメントを分類して、入力画像５０２中のコンテンツのコンテンツカテゴリを識別し、次に、これは画像信号プロセッサ２０６によって使用されて、以下で図８を参照して詳細に説明するように、異なるセグメントに適用されるべき鮮鋭化の程度を示す異なるコンテンツ係数で入力画像５０２の異なるセグメントを鮮鋭化する。

他の実施形態では、ニューラルプロセッサ回路２１８は、コンテンツマップ５０４としてヒートマップを生成するように、様々な機械学習アルゴリズムを使用してトレーニングされる。ヒートマップは、異なるセグメントに関連付けられたコンテンツカテゴリを示すのではなく、入力画像５０２の異なるセグメントにおける望ましい鮮鋭化の程度を直接示す。

コントラスト強調ステージ回路の例
図７は、一実施形態に係る、第１のコントラスト強調ステージ回路４５０の構成要素を示すブロック図である。第１のコントラスト強調ステージ回路４５０は、輝度情報Ｙに対して、コンテンツに基づく画像鮮鋭化及び平滑化を実行して、輝度情報の鮮鋭化済みバージョンＹ’を生成する。輝度情報Ｙは、入力画像４０２の輝度成分のみを含む画像を指し、鮮鋭化済み輝度情報Ｙ’は、出力画像の輝度成分のみを含む画像を指す。第１のコントラスト強調ステージ回路４５０は、他の構成要素の中でもとりわけ、画像シャープナ７０２、コンテンツ画像処理７０４、及び加算回路７０６を含み得る。第２のコントラスト強調ステージ回路４５２は、輝度画像がフル入力画像４０２に対してダウンスケーリングされていないことを除いて、第１のコントラスト強調ステージ回路４５０と実質的に同じ構造を有し、したがって、簡潔さのために、本明細書ではその詳細な説明は省略される。

画像シャープナ７０２は、輝度情報Ｙに対してコントラスト強調（例えば、鮮鋭化）を実行し、出力デルタＹを生成する回路である。デルタＹは、Ｙのマスクを表す。例えば、デルタＹは、アンシャープマスキングプロセスの結果である。１つ以上の実施形態では、画像シャープナ７０２は、輝度情報Ｙに対して処理を実行するバイラテラルフィルタ又はハイパス周波数フィルタとして具現化されている。したがって、例えば、デルタＹは画像の高周波成分であり得る。デルタＹは、第１のコントラスト強調ステージ４５０の下流の構成要素によって更に調整される。

コンテンツ画像処理７０４は、コンテンツマップによって識別されるコンテンツカテゴリ及びこのような分類の尤度に基づいてデルタＹを調整する回路である。コンテンツ画像処理７０４は、輝度情報Ｙ及びコンテンツマップ５０４を受信し、図８に関して更に説明するように、コンテンツカテゴリに基づく所望の鮮鋭化の程度に応じて、デルタＹに対して増加又は減少した調整済みデルタＹ’を生成する。

いくつかの実施形態では、加算回路７０６は、コンテンツ画像処理７０４からの調整済みデルタＹ’を輝度情報Ｙに加算して、鮮鋭化済み輝度情報Ｙ’を生成する。いくつかの実施形態では、加算回路７０６は、調整済みデルタＹ’を輝度情報Ｙの低周波数成分に加算する（例えば、ここで、低周波数成分＝Ｙ－デルタＹとする）。いくつかの画素に対して、調整済みデルタＹ’は正であり、それによって、加算回路７０６における加算は、画像の関連するセグメントの鮮鋭化をもたらす。負である調整済みデルタＹ’を有する画素に対して、加算回路７０６は、アルファぼかしのようなぼかし演算を実行する。以下で更に説明されるように、デルタＹは、輝度情報Ｙの低周波数成分でアルファぼかしされ得る。これは、ぼかしが低周波数成分に制限されることをもたらし得る。これは、デルタＹ’が大きな負の値を含む場合に発生し得る画像アーチファクトを防止し得る。

＜コンテンツ画像処理回路の例＞
図８は、一実施形態に係る、コンテンツ画像処理７０４の構成要素を示すブロック図である。図７を参照して前述したように、コンテンツ画像処理７０４は、画像内のコンテンツに基づいて鮮鋭化演算及び平滑化演算を実行する。コンテンツ画像処理７０４は、他の構成要素の中でもとりわけ、テクスチャ回路８０２と、クロマ回路８０４と、コンテンツ係数回路８０６と、コンテンツ修正回路８１０とを含み得る。

コンテンツ係数回路８０６は、入力画像内の画素に対するコンテンツ係数を決定する。コンテンツ係数は、入力画像内の各画素に対して決定され得る。コンテンツ係数は、コンテンツマップ内の１つ以上の値に基づくものであり、画素に適用されるべき鮮鋭化の量を示す。コンテンツ係数はまた、テクスチャ回路８０２からの１つ以上のテクスチャ値及び／又はクロマ回路８０４からのクロマ値に基づくものであり得る。

前述したように、コンテンツマップのコンテンツカテゴリは、コンテンツ係数に関連付けられ得る。例えば、各コンテンツカテゴリに対してコンテンツ係数が予め定められている。コンテンツマップが画像と同じ解像度を有する場合、画素に対するコンテンツ係数は、コンテンツマップ内の対応する位置の情報を参照することにより取得され得る。コンテンツマップが画像と比較してダウンスケーリングされている場合、コンテンツマップのアップスケーリングされたバージョン内の近くの画素からコンテンツ係数を補間し得るように、コンテンツマップは、入力画像のサイズに一致するようにアップスケーリングされ得る。複数の格子点を有する格子は、入力画像上に重ねられてもよく、格子点に関連付けられた情報は、フル画像内の画素の情報を補間によって決定するために使用され得る。例えば、フル画像の画素位置がコンテンツマップ内の格子点と合致していない（例えば、画素が格子点のセットの間に位置する）場合、画素のコンテンツ係数は、画素に最も近い（例えば、取り囲んでいる）格子点のコンテンツ係数を補間することにより決定され得る。格子点間の画素のコンテンツ係数を決定するためのコンテンツマップのアップサンプリングは、図１１に関して更に説明される。

いくつかの実施形態では、コンテンツ係数は、尤度値に従って重み付けされる。例えば、画素のコンテンツ係数Ｑは、初期コンテンツ係数Ｑ₀に尤度値を乗算することにより決定される。
Ｑ＝（Ｑ₀）^*（尤度値）（１）
ここで、初期コンテンツ係数Ｑ₀は、特定のコンテンツカテゴリに関連付けられたコンテンツ係数である。尤度値は、以下でテクスチャ回路８０２及びクロマ回路８０４を参照して説明するように、画素のコンテンツカテゴリ、画素のテクスチャ値及び／又はクロマ値に基づくことができる。いくつかの実施形態では、尤度値は、以下のような尤度モデルによって決定される。
（尤度値）＝Ｃ₁＋Ｃ₂ ^*（テクスチャ値）＋Ｃ₃ ^*（クロマ値）（２）
ここで、Ｃ₁、Ｃ₂、Ｃ₃は所定の定数（例えば、調整パラメータ）である。所定の定数は、コンテンツマップ内のコンテンツカテゴリに基づく値を有し得る。いくつかの実施形態では、尤度モデルは、テクスチャ値及びクロマ値に関する多項式関数である。尤度モデルは、分類の精度に関するモデルを表し、経験的に又は機械学習プロセスによって決定され得る。

テクスチャ回路８０２は、コンテンツマップ５０４によって識別されたコンテンツカテゴリが、テクスチャ情報に基づいて訂正された尤度を表すテクスチャ値を決定する回路である。１つ以上の実施形態では、テクスチャ値は、１つ以上のエッジ検出演算を入力画像に適用することにより決定される。例えば、Ｓｏｂｅｌフィルタ又はハイパス周波数フィルタなどのエッジ検出方法を輝度入力画像に適用して、入力画像の画素位置におけるエッジ値を取得する。エッジ値が決定された後、テクスチャモデルにエッジ値を適用することにより、格子点に対するテクスチャ値が決定され得る。テクスチャ回路８０２は、異なるコンテンツカテゴリに対応する複数の異なるテクスチャモデルを記憶し得る。テクスチャモデルの例には、葉のテクスチャモデル、空のテクスチャモデル、草のテクスチャモデル、及び肌のテクスチャモデルが含まれる。例示的な葉のテクスチャモデルは以下で図９に関して説明される。

クロマ回路８０４は、コンテンツマップ５０４によって識別されるコンテンツカテゴリが、クロマ情報に基づいて訂正された尤度を表すクロマ値を決定する回路である。クロマ値は、画像の色情報（例えば、Ｃｂ値及びＣｒ値）に基づく。クロマ回路８０４は、異なるコンテンツカテゴリに対して異なるクロマモデルを記憶し得る。クロマモデルの例は、葉のクロマモデル、空のクロマモデル、草のクロマモデル、及び肌のクロマモデルを含む。クロマモデルは、手動で決定されてもよく、又は機械学習技法によって決定されてもよい。例示的な空のクロマモデルは以下で図１０に関して説明される。

コンテンツ修正回路８１０は、コンテンツ係数回路８０６からコンテンツ係数を受信し、画像シャープナ７０２からデルタＹ値を受信する。コンテンツ修正回路８１０は、コンテンツ係数をデルタＹ値に適用してデルタＹ’値を生成する。例えば、画素のコンテンツ係数が所定の閾値（例えば、０）を上回る場合、コンテンツ修正回路８１０は、画素のコンテンツ係数を画素のデルタＹ値に乗算するなど、鮮鋭化演算を実行する。画素のコンテンツ係数が所定の閾値を下回る場合、コンテンツ修正回路８１０は、コンテンツ係数に基づいてデルタＹ’をブレンディングすることにより平滑化演算を実行することができる。例えば、アルファブレンディングは以下の式に従って実行される。
Ｙ’＝（１－アルファ）^*Ｙ＋アルファ^*（Ｙ－デルタＹ）（３）
かつ、
Ｙ’＝Ｙ＋デルタＹ’ （４）
したがって、
デルタＹ’＝－（アルファ）^*（デルタＹ）（５）。
ここで、アルファ＝｜Ｑ｜^*スケールとし、アルファは０と１の間の値とする。スケールは、所定の正の定数とする。｜Ｑ｜^*スケール＞１となるように｜Ｑ｜が十分に大きい場合、アルファは１になるようにクリップされることに留意されたい。

図９は、一実施形態に係る、テクスチャモデルを示すプロットである。画素（又は格子が使用される場合は格子点）がコンテンツマップによって「葉」として分類されている場合、例えば、テクスチャ値は、画素（又は格子が使用される場合は格子点）のエッジ値を図９のモデルに適用することにより決定され得る。ｘ軸は入力エッジ値を表し、Ｙ軸は出力テクスチャ値を表す。テクスチャ値の範囲は０～１とする。画素のエッジ値が高閾値を上回る場合、テクスチャ値は１とし、エッジ値が低閾値を下回る場合、テクスチャ値は０とする。テクスチャ値は、低閾値と高閾値との間のエッジ値に対して０から１まで線形に増加する。低閾値及び高閾値の値は、経験的に決定され得る。例えば、閾値は、葉について典型的なエッジ値に従って設定される。したがって、エッジ値が高閾値を上回ることは、画素又は格子点が、葉に対応する高いテクスチャを有する領域にあることを示し得る。同様に、エッジ値が低閾値を下回ることは、画素又は格子点が、葉に対応しない平坦なテクスチャを有する領域にあることを示し得る。例えば、式２によれば、高いテクスチャ値は、画素のコンテンツが葉である尤度が高いことを示す（Ｃ₂が正であると仮定する）。

異なるカテゴリに対して、対応するテクスチャモデルは、異なるテクスチャパラメータ（例えば、異なる低閾値、異なる高閾値、及び／又は異なる勾配、及び／又は１と０の反転）によって表され得る。「草」のカテゴリについては、低閾値及び高閾値は、「葉」のカテゴリの閾値よりも高くてもよい。いくつかのカテゴリは、テクスチャが複雑であるときよりもテクスチャが平坦であるときに正しい可能性が高い。このようなカテゴリでは、テクスチャ値の１と０が反転され得る。例えば、「空」のテクスチャモデルは、エッジ値がより低い（例えば、低閾値を下回る）ときに１の値を有し得、エッジ値がより高い（例えば、高閾値を上回る）ときに０の値を有し得る。すなわち、テクスチャが平坦である入力画像の領域にある画素は、「空」であることを示す可能性が高い。いくつかの実施形態では、１と０の値を反転させる代わりに、式２における所定の定数は、コンテンツカテゴリに基づいて変化する。例えば、「肌」又は「空」などのカテゴリについて、Ｃ₂は、画素のコンテンツが「肌」又は「空」である尤度が低いことを高いテクスチャ値が示すように、負であり得る。

図１０は、一実施形態に係る、クロマモデルを示すプロットである。図１０のクロマモデルは、「空」のモデルを表し得る。画素又は格子点がコンテンツマップによって「空」として分類されている場合、クロマ回路８０４は、画素又は格子点についてのＣｂ値とＣｒ値の組み合わせがエリア１０１０、１０２０及び１０３０のうちの１つの範囲内に入るかどうかを判定する。ｘ軸は入力Ｃｂ値を表し、Ｙ軸は入力Ｃｒ値を表す。楕円は、「空」の色範囲を表すプロット図の右上隅に位置する。画素又は格子点のＣｂ値／Ｃｒ値がエリア１０１０内の内側楕円内にある場合、クロマ値は１であり、これは、（例えば、Ｃ₃が正である式２に従って）、画素又は格子点が「空」に対応する尤度が高いことを示し得る。Ｃｂ値／Ｃｒ値がエリア１０３０内の外側楕円の外側にある場合、クロマ値は０であり、これは、（例えば、Ｃ３が正である式２に従って）、画素又は格子点が「空」に対応する可能性が低いことを示す。Ｃｂ値／Ｃｒ値がエリア１０２０内の内側楕円と外側楕円との間にある場合、クロマ値は０と１との間であり得る（例えば、クロマ値は、内側楕円のエッジからの距離が増加するにつれて増加する）。楕円の位置及びサイズは、経験的に、又は統計学的モデルによって決定することができる。いくつかの実施形態では、楕円形の代わりに、正方形、三角形、又は円形などの他の形状を使用することができる。

異なるカテゴリに対して、対応するクロマモデルは、異なるクロマパラメータ（例えば、楕円の中心、半径、角度、傾き、及び外部／内部楕円の比）によって表され得る。例えば、「葉」のクロマモデルは通常緑色であり、したがって、「葉」カテゴリのクロマパラメータは緑色に対応するＣｂ値／Ｃｒ値をカバーし、一方、「空」カテゴリのクロマパラメータは青色に対応するＣｂ値／Ｃｒ値をカバーする。別の例では、クロマパラメータは、一般に、カテゴリに関連付けられていない色に従って選択される。例えば、「葉」は一般に青色を含まない。したがって、クロマモデルは、Ｃｂ値／Ｃｒ値が青色に対応する場合、低い値を出力するように構成され得る。

格子点を使用した補間の例
図１１は、一実施形態に係る、コンテンツマップをアップサンプリングする方法を示す図である。コンテンツマップが入力画像よりも低い解像度を有する場合、画像内の画素とコンテンツマップ内の画素とは１対１で対応していない。よって、コンテンツマップのアップスケーリングを実行することができる。このようなアップスケーリングを実行する１つの方法は、入力画像１１０２の上に重ねられた複数の格子点を有する格子の使用によるものである。格子点は、入力画像１１０２内の画素よりもまばらであり得る。このような場合、格子点のコンテンツ係数を使用して、より高い解像度の入力画像１１０２のコンテンツ係数を決定することができる。

入力画像１１０２上に重ねられた格子が格子点１～４を有し、入力画像１１０２が格子点１～４の間に位置する画素１１０４を含む例をとると、画素１１０４に対するコンテンツ係数Ｑ（画素）は、格子点から画素１１０４までの空間距離を考慮して、格子点１～４に関連付けられたコンテンツ係数Ｑ（１）～Ｑ（４）に対して双線形補間を実行することにより決定され得る。

１つ以上の実施形態では、画素１１０４のＱ（画素）を決定するためのコンテンツ係数Ｑ（１）～Ｑ（４）は、入力画像１１０２の画素１１０４のテクスチャパラメータ及びクロマパラメータを使用して決定される。コンテンツマップによって示される格子点１～４のカテゴリが使用されるが、これらのカテゴリに対する尤度値（式（２）を参照して上述した）は、格子点のエッジ値及びＣｂ値／Ｃｒ値ではなく、画素１１０４のエッジ値及びＣｂ値／Ｃｒ値を使用して決定される。例えば、格子点１が「肌」として分類されている場合、画素１１０４のテクスチャは、「肌」に対応するテクスチャパラメータを有するテクスチャモデルに適用され、画素１１０４のＣｂ値／Ｃｒ値は、式（１）に従ってＱ（１）を取得するために、「肌」に対応するクロマパラメータを有するクロマモデルに適用される。同様に、格子点２が「葉」として分類されている場合、画素１１０４のエッジ値は、「葉」に対応するテクスチャパラメータを有するテクスチャモデルに適用され、画素１１０４のＣｂ値／Ｃｒ値は、式（１）に従ってＱ（２）を取得するために、「葉」に対応するクロマパラメータを有するクロマモデルに適用される。格子点３、４について同様のプロセスを繰り返した後、双線形補間によりＱ（画素）を求める。

他の実施形態では、コンテンツ係数Ｑ（１）～Ｑ（４）は、画素のテクスチャ値及びＣｂ値／Ｃｒ値の代わりに格子点のテクスチャ値及びＣｂ値／Ｃｒ値を使用することにより得られる。

コンテンツに基づく画像鮮鋭化の例示的な方法
図１２は、一実施形態に係る、画像のセグメント内のコンテンツに基づいて画像の１つ以上の画素を鮮鋭化する方法を示すフローチャートである。本方法のステップは、異なる順序で実行されてもよく、本方法は、異なる、追加の、又はより少ないステップを含んでもよい。

入力画像の輝度画素値を受信する（１２０２）。コンテンツマップを受信する（１２０４）。コンテンツマップは、画像のセグメント内のコンテンツのカテゴリを識別する。コンテンツマップは、コンテンツマップを生成するために画像のバージョンに対して少なくとも１つの機械学習演算を実行するニューラルプロセッサ回路によって生成され得る。コンテンツマップによって識別されるカテゴリは、肌、葉、草、又は空を含んでもよい。いくつかの実施形態では、コンテンツマップは、画像の画素に適用されるべき鮮鋭化の量を示すヒートマップである。

画像内の画素に関連付けられたコンテンツ係数を決定する（１２０６）。コンテンツ係数は、入力画像内の識別されたコンテンツのカテゴリと、画像内の画素のテクスチャ値又は画像内の画素のクロマ値の少なくとも１つとに従って決定される。テクスチャ値は、画像内のテクスチャに基づく、画素に関連付けられたコンテンツのカテゴリの尤度を示す。クロマ値は、画像の色情報に基づく、画素に関連付けられたコンテンツのカテゴリの尤度を示す。

いくつかの実施形態では、コンテンツマップは、入力画像に対してダウンスケーリングされる。これらの実施形態では、コンテンツ係数は、コンテンツマップをアップサンプリングすることにより決定され得る。コンテンツマップは、コンテンツマップの上に重ねられた格子点のコンテンツ係数を取得し、次に、格子点のコンテンツ係数を補間して入力画像内の画素のコンテンツ係数を取得することによりアップサンプリングされ得る。

少なくともコンテンツ係数を画素の輝度画素値のバージョンに適用することにより、画素の輝度画素値の鮮鋭化済みバージョンを生成する（１２０８）。輝度画素値のバージョンは、バイラテラルフィルタ又はハイパスフィルタによって生成され得る。いくつかの実施形態では、コンテンツ係数は、コンテンツ係数が閾値を上回ることに応じて、コンテンツ係数を輝度画素値のバージョンと乗算することにより、輝度画素値のバージョンに適用される。コンテンツ係数が閾値を下回る場合、コンテンツ修正回路は、負のパラメータで乗算された輝度画素値のバージョンを適用する。

本明細書に説明する教示は、画像内の各画素に対するコンテンツ係数を生成することに関する。コンテンツ係数は、コンテンツマップを介して識別される画像内のコンテンツに基づく。本明細書の教示は、画像鮮鋭化という文脈で説明されているが、これは便宜上のものである。本明細書に説明する教示は、ノイズ低減、トーンマッピング、及びホワイトバランスプロセスなどの他の画像処理プロセスにも適用することができる。例えば、ノイズ低減のために、コンテンツ係数をノイズ標準偏差に適用（例えば、乗算）することができる。

特定の実施形態及び用途が例示及び記載されてきたが、本発明は、本明細書に開示される厳密な構造及び構成要素に限定されず、本開示の趣旨及び範囲から逸脱することなく、当業者には明らかであろう様々な修正、変更、及び変形が、本明細書に開示される方法及び装置の構成、動作、並びに詳細になされてもよいことを理解されたい。

Claims

画像の輝度画素値と、前記画像のセグメント内のコンテンツのカテゴリを識別するコンテンツマップとを受信するように構成されたコンテンツ画像処理回路を備える画像処理用の装置であって、前記コンテンツ画像処理回路が、
前記画像内のコンテンツの前記識別されたカテゴリと、前記画像の画素のテクスチャ値又は前記画素のクロマ値の少なくとも１つとに従って、前記画素に関連付けられたコンテンツ係数を決定するように構成されたコンテンツ係数回路であって、前記テクスチャ値は、前記画像内のテクスチャに基づく、前記画素に関連付けられたコンテンツのカテゴリの尤度を示し、前記クロマ値は、前記画像の色情報に基づく、前記画素に関連付けられたコンテンツの前記カテゴリの尤度を示す、コンテンツ係数回路と、
前記コンテンツ係数を受信するために前記コンテンツ係数回路に結合されており、少なくとも前記コンテンツ係数を前記画素の輝度画素値のバージョンに適用することにより、前記画素の輝度画素値の鮮鋭化済みバージョンを生成するように構成されたコンテンツ修正回路であって、前記コンテンツ修正回路が、（ｉ）前記コンテンツ係数が閾値を上回ることに応じて、鮮鋭化演算を実行することと、（ｉｉ）前記コンテンツ係数が前記閾値を下回ることに応じて、平滑化演算を実行することとにより、前記コンテンツ係数を前記輝度画素値の前記バージョンに適用するように構成されている、コンテンツ修正回路と、
を含む、画像処理用の装置。
前記コンテンツマップが、前記コンテンツマップを生成するために前記画像のバージョンに対して機械学習演算を実行するように構成されたニューラルプロセッサ回路によって生成される、請求項１に記載の装置。
前記コンテンツマップが、前記画像に対してダウンスケーリングされる、請求項１に記載の装置。
前記コンテンツ係数回路が、前記コンテンツマップをアップサンプリングすることにより、前記コンテンツ係数を決定するように構成されている、請求項３に記載の装置。
前記コンテンツマップが、
前記コンテンツマップが前記画像のサイズに一致するまで拡大されたとき、前記画素を取り囲む前記コンテンツマップ内の格子点に関連付けられたコンテンツ係数を取得することと、
前記画素に関連付けられた前記コンテンツ係数を取得するために前記コンテンツ係数を補間することと
によりアップサンプリングされる、請求項４に記載の装置。
前記コンテンツ係数が、尤度値に従って重み付けされ、前記尤度値が、前記画像内の前記コンテンツの前記識別されたカテゴリ、前記テクスチャ値、及び前記クロマ値のうちの１つに基づく、請求項１に記載の装置。
前記輝度画素値は、前記画像が第１の情報と、前記第１の情報の周波数成分よりも低い周波数成分を含む第２の情報とに分割されたとき、前記画像の前記第１の情報に含まれる、請求項１に記載の装置。
前記コンテンツ画像処理回路に結合されたバイラテラルフィルタを更に備え、前記バイラテラルフィルタが、前記輝度画素値の前記バージョンを生成するように構成されている、請求項１に記載の装置。
前記鮮鋭化演算が、前記コンテンツ係数を前記輝度画素値の前記バージョンと乗算することを含み、前記平滑化演算が、前記コンテンツ係数に基づいて前記輝度画素値の前記バージョンをブレンディングすることを含む、請求項１に記載の装置。
前記コンテンツマップが、前記コンテンツマップ内の格子点に対応する前記画像の画素に適用されるべき鮮鋭化の量を示すヒートマップである、請求項１に記載の装置。
画像の輝度画素値を受信することと、
前記画像のセグメント内のコンテンツのカテゴリを識別するコンテンツマップを受信することと、
前記画像内のコンテンツの前記識別されたカテゴリと、前記画像の画素のテクスチャ値又は前記画素のクロマ値の少なくとも１つとに従って、前記画素に関連付けられたコンテンツ係数を決定することであって、前記テクスチャ値は、前記画像内のテクスチャに基づく、前記画素に関連付けられたコンテンツのカテゴリの尤度を示し、前記クロマ値は、前記画像の色情報に基づく、前記画素に関連付けられたコンテンツの前記カテゴリの尤度を示す、ことと、
少なくとも前記コンテンツ係数を前記画素の輝度画素値のバージョンに適用することにより、前記画素の輝度画素値の鮮鋭化済みバージョンを生成することであって、前記コンテンツ係数を前記画素の輝度画素値のバージョンに適用することが、（ｉ）前記コンテンツ係数が閾値を上回ることに応じて、鮮鋭化演算を実行することと、（ｉｉ）前記コンテンツ係数が前記閾値を下回ることに応じて、平滑化演算を実行することと、
を含む、方法。
ニューラルプロセッサ回路によって前記コンテンツマップを生成することを更に含み、前記ニューラルプロセッサ回路が、前記コンテンツマップを生成するために前記画像のバージョンに対して機械学習演算を実行する、請求項１１に記載の方法。
前記コンテンツマップが、前記画像に対してダウンスケーリングされる、請求項１１に記載の方法。
前記コンテンツ係数を決定することが、前記コンテンツマップをアップサンプリングすることを含む、請求項１３に記載の方法。
前記コンテンツマップをアップサンプリングすることが、
前記コンテンツマップが前記画像のサイズに一致するまで拡大されたとき、前記画素を取り囲む前記コンテンツマップ内の格子点に関連付けられたコンテンツ係数を取得することと、
前記画素に関連付けられた前記コンテンツ係数を取得するために前記コンテンツ係数を補間することと
を含む、請求項１４に記載の方法。
機械学習アルゴリズムを画像に実行することにより、前記画像のセグメント内のコンテンツのカテゴリを識別するコンテンツマップを生成するように構成されたニューラルプロセッサ回路と、
前記ニューラルプロセッサ回路に結合されたコンテンツ画像処理回路と、を含む電子デバイスであって、前記コンテンツ画像処理回路が、前記画像の輝度画素値及び前記コンテンツマップを受信するように構成され、前記コンテンツ画像処理回路が、
前記画像内のコンテンツの前記識別されたカテゴリと、前記画像の画素のテクスチャ値又は前記画素のクロマ値の少なくとも１つとに従って、前記画素に関連付けられたコンテンツ係数を決定するように構成されたコンテンツ係数回路であって、前記テクスチャ値は、前記画像内のテクスチャに基づく、前記画素に関連付けられたコンテンツのカテゴリの尤度を示し、前記クロマ値は、前記画像の色情報に基づく、前記画素に関連付けられたコンテンツの前記カテゴリの尤度を示す、コンテンツ係数回路と、
前記コンテンツ係数を受信するために前記コンテンツ係数回路に結合されており、少なくとも前記コンテンツ係数を前記画素の輝度画素値のバージョンに適用することにより、前記画素の輝度画素値の鮮鋭化済みバージョンを生成するように構成されたコンテンツ修正回路であって、前記コンテンツ修正回路が、（ｉ）前記コンテンツ係数が閾値を上回ることに応じて、鮮鋭化演算を実行することと、（ｉｉ）前記コンテンツ係数が前記閾値を下回ることに応じて、平滑化演算を実行することにより、前記コンテンツ係数を前記輝度画素値のバージョンに適用するように構成されている、コンテンツ修正回路と、
を含む、電子デバイス。
前記コンテンツマップが、前記画像に対してダウンスケーリングされる、請求項１６に記載の電子デバイス。
前記コンテンツ係数回路が、前記コンテンツマップをアップサンプリングすることにより、前記コンテンツ係数を決定するように構成されている、請求項１７に記載の電子デバイス。
前記コンテンツマップが前記画像のサイズに一致するまで拡大されたとき、前記画素を取り囲む格子点に関連付けられたコンテンツ係数を取得することと、
前記画素に関連付けられた前記コンテンツ係数を取得するために前記コンテンツ係数を補間することと
によりアップサンプリングされる、請求項１８に記載の電子デバイス。
前記コンテンツ画像処理回路に結合されたバイラテラルフィルタを更に備え、前記バイラテラルフィルタが、前記輝度画素値の前記バージョンを生成するように構成されている、請求項１６に記載の電子デバイス。