JP2022505303A

JP2022505303A - Ｍｌベースのアップスケーリングのためのフレーム処理

Info

Publication number: JP2022505303A
Application number: JP2021521273A
Authority: JP
Inventors: ミャオチージュー; 芳和高島
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2018-10-18
Filing date: 2019-10-16
Publication date: 2022-01-14
Anticipated expiration: 2039-10-16
Also published as: KR20210054556A; WO2020081772A1; JP7416774B2; US10931853B2; US20210168263A1; EP3844706A4; KR20210056376A; KR102550342B1; EP3844708A4; JP2022505275A; US20200126183A1; US11252301B2; JP2023139008A; CN112868045A; KR102596182B1; KR102649544B1; EP3844706A1; WO2020081776A1; JP2022505293A; US20200128151A1

Abstract

出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理は、入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出すること；各ボクシングエッジ領域の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって抽出されたボクシングエッジ領域を拡張すること；パディングされたエッジ領域をアップスケーリングしてアップスケーリングされたパディングエッジ領域を生成すること；アップスケーリングされたパディングエッジ領域の各々をアップスケーリング係数が掛けられるアップスケーリングの前のボクシングエッジ領域の各々のサイズに対応するサイズにトリミングすること；トリミングされたエッジ領域を出力画像のエッジに挿入すること；及び入力画像の非エッジ領域をアップスケーリングしてアップスケーリングされた非エッジ領域を出力画像に挿入することを含む。
【選択図】図２

Description

〔関連出願の相互参照〕
[0001] 本出願は、２０１８年１０月１８日に出願された「動画のための機械学習ベースの単一画像アップスケーリングアプリケーション（Ｍａｃｈｉｎｅ－ＬｅａｒｎｉｎｇＢａｓｅｄＳｉｎｇｌｅＩｍａｇｅＵｐｓｃａｌｉｎｇＡｐｐｌｉｃａｔｉｏｎｆｏｒＭｏｔｉｏｎＰｉｃｔｕｒｅｓ）」という名称の同時係属中の米国仮特許出願第６２／７４７，４５３号の米国特許法第１１９条（ｅ）に基づく優先権の利益を主張するものである。上記関連出願の開示は、引用により本明細書に組み入れられる。

[0002] 本開示は、フレーム処理に関し、具体的には、機械学習ベース（ＭＬベース）のアップスケーリングのためのフレーム処理に関する。

[0003] 機械学習（ＭＬ）を用いて、画像の超解像アップスケーリングを実行することができる。しかしながら、従来のＭＬベースのアップスケーリングプロセスは、画像が後処理中に挿入されるボクシングエッジ（例えば、レターボックス、ピラーボックス、ウィンドウボックス）を含むときに、いくつかの問題がある。したがって、このようなボクシングエッジを有する画像が従来のＭＬベースのアップスケーリングによって処理されるときに、アップスケーリングによって、画像のエッジに沿ってアーチファクトが生じる場合があり、これにより、最終出力においてクリア及び／又はシャープなエッジの損失を招く場合がある。

[0004] 本開示は、ＭＬベースのトレーニングプロセスの前に入力のフレームエッジを処理することを提供するものである。

[0005] 一実装形態では、出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のための方法を開示する。前記方法は、前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出するステップと、前記ボクシングエッジ領域の各々の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記抽出されたボクシングエッジ領域を拡張するステップと、前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成するステップと、前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングするステップと、前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入するステップと、前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入するステップと、を含む。

[0006] 一実装形態では、前記ボクシングエッジ領域の各々の周囲に余分の画素を追加することは、前記ボクシングエッジ領域の各々の周囲に前記余分の画素をパディングする方法を決定するステップと、前記ボクシングエッジ領域の各々の周囲に前記余分の画素の小領域を追加するステップと、を含む。一実装形態では、小領域を追加するステップは、前記小領域毎にタイプを決定するステップを含む。一実装形態では、前記小領域の第１のタイプは、前記アクティブピクチャエリア内に完全に存在する画素を有する前記小領域を含む。一実装形態では、前記方法は、更に、前記小領域が前記第１のタイプであると判断されたときに、前記ボクシングエッジ領域の各々を前記小領域の方向に拡張するステップを含む。一実装形態では、前記小領域の第２のタイプは、前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のエッジ上に存在する少なくとも１つの画素を有する前記小領域を含む。一実装形態では、前記方法は、更に、前記小領域が前記第２のタイプであると判断されたときに、前記エッジ上でバタフライ画像を使用して、前記ボクシングエッジ領域を拡張するステップを含む。一実装形態では、前記小領域の第３のタイプは、前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のコーナー上に存在する少なくとも１つの画素を有する前記小領域を含む。一実装形態では、前記方法は、更に、前記小領域が前記第３のタイプであると判断されたときに、前記コーナー上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するステップを含む。

[0007] 別の実装形態では、出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のためのシステムを開示する。前記システムは、前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出するように構成されるエッジ領域抽出部と、各ボクシングエッジ領域の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記ボクシングエッジ領域の各々を拡張するように構成されるエッジ領域拡張部であって、前記エッジ領域拡張部は、前記パディングされたエッジ領域をアップスケーリングプロセッサに送って、前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成する、エッジ領域拡張部と、前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングするように構成されるエッジ領域トリミング部と、前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入するように構成されるエッジ領域充填部と、前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入するように構成される非エッジ領域充填部と、を含む。

[0008] 一実装形態では、前記エッジ領域拡張部は、前記ボクシングエッジ領域の各々の周囲に前記余分の画素の小領域を追加することによって、前記ボクシングエッジ領域の各々の周囲に前記余分の画素を追加する。一実装形態では、小領域を追加することは、前記小領域毎にタイプを決定することを含む。一実装形態では、前記小領域の第１のタイプは、前記アクティブピクチャエリア内に完全に存在する画素を有する前記小領域を含む。一実装形態では、前記エッジ領域拡張部は、前記小領域が前記第１のタイプであると判断されたときに、前記ボクシングエッジ領域の各々を前記小領域の方向に拡張するように構成される。一実装形態では、前記小領域の第２のタイプは、前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のエッジ上に存在する少なくとも１つの画素を有する前記小領域を含む。一実装形態では、前記エッジ領域拡張部は、前記小領域が前記第２のタイプであると判断されたときに、前記エッジ上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するように構成される。一実装形態では、前記小領域の第３のタイプは、前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のコーナー上に存在する少なくとも１つの画素を有する前記小領域を含む。一実装形態では、前記エッジ領域拡張部は、前記小領域が前記第３のタイプであると判断されたときに、前記コーナー上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するように構成される。

[0009] 更に別の実装形態では、出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のためのコンピュータプログラムを記憶する非一時的コンピュータ可読記憶媒体を開示する。前記コンピュータプログラムは実行可能命令を含み、前記実行可能命令は、コンピュータに、前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出することと、前記ボクシングエッジ領域の各々の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記抽出されたボクシングエッジ領域を拡張することと、前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成することと、前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングすることと、前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入することと、前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入することと、を行わせる。

[0010] 一実装形態では、コンピュータに、前記抽出されたボクシングエッジ領域を拡張させる前記実行可能命令は、実行可能命令を含み、前記実行可能命令は、コンピュータに、前記ボクシングエッジ領域の各々の周囲に前記余分の画素をパディングする方法を決定することと、前記余分の画素の小領域を追加することと、を行わせる。

[0011] 本開示の態様を一例として示す本明細書からは、他の特徴及び利点も明らかになるはずである。

[0012] 同じ部分を同じ参照数字によって示す添付図面を検討することにより、本開示の詳細をその構造及び動作の両方に関して部分的に収集することができる。

レターボックスエッジを示す図である。ピラーボックスエッジを示す図である。ウィンドウボックスエッジを示す図である。本開示の一実装形態による、ＭＬベースのアップスケーリングプロセスにおけるフレーム処理のためのプロセスを示すフロー図である。本開示の一実装形態による、図２に示すフレーム処理プロセスのパディングプロセスを示す詳細フロー図である。本開示の一実装形態による、ＭＬベースのアップスケーリングプロセスにおけるフレーム処理のためのプロセスを示すフローチャートである。本開示の一実装形態による、図４に示すフレーム処理プロセスのパディングプロセスを示す詳細フローチャートである。本開示の一実装形態によるフレーム処理システムを示すブロック図である。本開示の一実装形態による、コンピュータシステム及びユーザの図である。本開示の一実装形態による、フレーム処理アプリケーションをホストするコンピュータシステムを示す機能ブロック図である。

[0023] 上記のように、従来のＭＬベースのアップスケーリングプロセスは、画像が後処理中に挿入されるボクシングエッジを含むときに、いくつかの問題がある。例えば、このようなボクシングエッジを有する画像が従来のＭＬベースのアップスケーリングによって処理されるときに、アップスケーリングプロセスによって、画像のエッジに沿ってアーチファクトが生じる場合があり、これにより、最終出力においてクリア及び／又はシャープなエッジの損失を招く場合がある。図１Ａ、図１Ｂ及び図１Ｃは、ボクシングエッジの例を示す。図１Ａはレターボックスエッジ１００を示し、図１Ｂはピラーボックスエッジ１１０を示し、図１Ｃはウィンドウボックスエッジ１２０を示す。

[0024] 従来のプロセスの上記の問題に対処するために、本開示のいくつかの実装形態は、ＭＬベースのトレーニングプロセスの前に入力のフレームエッジを処理することを提供するものである。

[0025] これらの説明を読んだ後には、様々な実装及び用途における本開示の実施方法が明らかになるであろう。本明細書では本開示の様々な実装について説明するが、これらの実装は、限定ではなく一例として提示するものにすぎないと理解されたい。したがって、様々な実装についての詳細な説明は、本開示の範囲又は外延を限定するものとして解釈すべきではない。

[0026] 図２は、本開示の一実装形態による、ＭＬベースのアップスケーリングプロセスにおけるフレーム処理のためのプロセス２００を示すフロー図である。図２に示す実装形態では、フレーム処理プロセス２００は、入力画像のエッジを処理して、画像がＭＬベースのアップスケーリングプロセスによって処理されるときに、画像のエッジに沿ってアーチファクトを実質的に低減することを含む。図２は、また、フレーム処理プロセスと従来のＭＬベースのアップスケーリングプロセスとの比較を示す。

[0027] 左側に示す従来のＭＬベースのアップスケーリングプロセスでは、ボクシングエッジ領域２１０の周囲に余分のパディング画素を追加しない。したがって、画像がＭＬベースのアップスケーリングプロセスによって処理されるときに、アップスケーリングによって、画像のエッジに沿ってアーチファクト２１２が生じ、これにより、最終出力においてクリア及び／又はシャープなエッジの損失を招く場合がある。これに対して、図２の右側に示すプロセスは、ＭＬベースのアップスケーリングの前に実行されるフレーム処理プロセスを含む。

[0028] 図２に示す実装形態では、ＭＬベースのアップスケーリングプロセスの前に、入力画像のアクティブピクチャエリア２０６からボクシングエッジ領域２０２を検出して抽出する（２０４）。フレーム処理プロセスの一実装形態では、次に、抽出されたボクシングエッジ領域２０２の周囲に余分のパディング／画素を追加してパディングされたエッジ領域２２０を生成することによって、抽出されたボクシングエッジ領域２０２を拡張する。余分のパディング／画素をどのように追加するかについての詳細は、図３に示す。

[0029] 図２に示す実装形態では、パディングされたエッジ領域２２０をＭＬベースのアップスケーリングプロセッサ（例えば、ニューラルネットワーク）に送って、アップスケーリングされたパディングエッジ領域２２２を生成する。一実装形態では、アップスケーリングされたパディングエッジ領域２２２を、アップスケーリング係数が掛けられるアップスケーリングプロセスの前の元の領域２０２のサイズに対応するサイズにトリミングする。したがって、トリミングによって、エッジにアーチファクトがないきれいなエッジ領域２２４を生成する。次に、トリミングされてきれいになったエッジ領域２２４を、アップスケーリングされた出力画像として、出力画像に挿入する。

[0030] 一実装形態では、以下のステップ、すなわち、（１）入力画像のアクティブピクチャエリアからボクシングエッジ領域を検出して抽出するステップと、（２）ボクシングエッジ領域をパディングするステップと、（３）パディングされたボクシングエッジ領域をアップスケーリングするステップと、（４）アップスケーリングされたボクシングエッジ領域を元の領域のサイズにトリミングするステップと、（５）トリミングされたボクシングエッジ領域を出力画像に挿入するステップとを、入力画像のアクティブピクチャエリアのエッジの全てに対して繰り返す。更に、残りの非エッジ領域を抽出し、アップスケーリングし、出力画像に挿入して、アップスケーリングされた出力画像を完成する。

[0031] 図３は、本開示の一実装形態による、図２に示すフレーム処理プロセスのパディングプロセス２２２を示す詳細フロー図である。図３に示す実装形態は、抽出されたボクシングエッジ領域３０２を、追加のパディング／画素領域（Ｂ及びＣ領域）でパディングして、パディングされた領域３２０を生成することを示す。

[0032] 一実装形態では、抽出されたボクシングエッジ領域３０２に追加されるべき追加のパディング／画素領域は、８つの小領域（例えば、２つの側部、上部及び下部、及び４つのコーナー）を含む。この実装形態では、８つの小領域は、３つのタイプのパッド設計（例えば、Ａ、Ｂ、Ｃ）に分類される。

[0033] 一例では、タイプＡのパッド設計は、アクティブピクチャエリア３００内に存在する小領域のために使用される。したがって、タイプＡのパッド設計は、画像エリアを４方向に拡張することによって形成される。図３では、タイプＡのパッド設計は、左の小領域、下の小領域、及び左下コーナーの小領域のために使用される。したがって、パディングされた領域３２０は、画像エリアを４方向に拡張することによって、それらの小領域（すなわち、左の小領域、下の小領域、及び左下コーナーの小領域）を形成することを示している。

[0034] 別の例では、タイプＢのパッド設計は、アクティブピクチャエリア３００内に存在するのではなく、エッジ（例えば、左、右、上、又は下）に存在する小領域のために使用される。したがって、タイプＢのパッド設計は、エッジ上でバタフライ画像を使用して形成される。一実装形態では、バタフライ画像は、抽出されたボクシングエッジ領域３０２とタイプＢのパッド領域との間の線（例えば、線３２２又は線３２４）においてミラーイメージである画像を意味する。

[0035] 図３では、タイプＢのパッド設計は、アクティブピクチャエリア３００内に存在せず且つコーナーのいずれにも存在しない、上の小領域及び右の小領域のために使用される。したがって、パディングされた領域３２０は、エッジ上でバタフライ画像を使用して、それらの小領域（すなわち、上の小領域及び右の小領域）を形成することを示している。

[0036] 別の例では、タイプＣのパッド設計は、アクティブピクチャエリア３００内に存在するのではなく、コーナー（例えば、左上コーナー、右上コーナー、左下コーナー、又は右下コーナー）に存在する小領域のために使用される。したがって、タイプＣのパッド設計は、コーナー点上でバタフライ画像を使用して形成される。図３では、タイプＣのパッド設計は、アクティブピクチャエリア３００内に存在せず且つコーナーに存在する、左上コーナーの小領域、右上コーナーの小領域、及び右下コーナーの小領域のために使用される。したがって、パディングされた領域３２０は、コーナー点上でバタフライ画像を使用して、それらの小領域（すなわち、左上コーナーの小領域、右上コーナーの小領域、及び右下コーナーの小領域）を形成することを示している。

[0037] 図４は、本開示の一実装形態による、ＭＬベースのアップスケーリングプロセスにおけるフレーム処理のためのプロセス４００を示すフローチャートである。図４に示す実装形態では、フレーム処理プロセス４００は、ブロック４１０において、入力画像のアクティブピクチャエリア内のボクシングエッジ領域の位置を検出することを含む。ブロック４２０において、アクティブピクチャエリアから、検出されたボクシングエッジ領域を抽出する。次に、ブロック４３０において、抽出されたボクシングエッジ領域の周囲に余分のパディング／画素を追加してパディングされたエッジ領域を生成することによって、抽出されたボクシングエッジ領域を拡張する。余分のパディング／画素をどのように追加するかについての詳細は、図５に示すフローチャートに示す。

[0038] 図４に示す実装形態では、ブロック４４０において、パディングされたエッジ領域をＭＬベースのアップスケーリングプロセッサ（例えば、ニューラルネットワーク）に送って、アップスケーリングされたパディングエッジ領域を生成する。ブロック４５０において、アップスケーリングされたパディングエッジ領域を、アップスケーリング係数が掛けられるアップスケーリングプロセスの前の元の領域のサイズに対応するサイズにトリミングする。したがって、トリミングによって、エッジにアーチファクトがないきれいなエッジ領域を生成する。次に、ブロック４６０において、トリミングされてきれいになったエッジ領域を、アップスケーリングされた出力画像として、出力画像のエッジに挿入する。

[0039] 一実装形態では、ブロック４７０において、入力画像の全てのエッジ領域を処理したかどうかを判断する。ブロック４７０において、エッジ領域の全てを処理したわけではないと判断した場合、次のエッジ領域に対してステップ４１０～４６０を繰り返す。一方で、ブロック４７０において、全てのエッジ領域を処理したと判断した場合、ブロック４８０において、非エッジ領域を抽出し、アップスケーリングし、出力画像に挿入することによって、プロセス４００を続行する。

[0040] 図５は、本開示の一実装形態による、図４に示すフレーム処理プロセスのパディングプロセス４３０を示す詳細フローチャートである。図５に示す実装形態では、ブロック５００において、対象エッジ領域の周囲に画素をパディングする方法を最初に決定する。一実装形態では、対象エッジ領域（すなわち、図３に示すボクシングエッジ領域３０２）の周囲にパディングするべき画素を、複数の小領域にグループ化する。

[0041] 図５に示す実装形態では、パディングするべき画素を、３つの小領域にグループ化する。ブロック５１０において、対象エッジ領域の周囲にパディングするべき各小領域が、アクティブピクチャエリア（例えば、図３の３００）内に存在する第１のタイプ（例えば、図３のタイプＡ）であるかどうかを判断するためにチェックする。次に、小領域がアクティブピクチャエリア内に存在する場合、ブロック５１２において、画像エリアを小領域の方向に拡張する。

[0042] 一方で、ブロック５２０において、小領域がアクティブピクチャエリアの外側であると判断されるが、エッジに存在する場合（例えば、図３のタイプＢ）、ブロック５２２において、エッジ上でバタフライ画像を使用して、画像エリアをパディングする。上記のように、タイプＢのパッド設計は、アクティブピクチャエリア内に存在せず且つコーナーのいずれにも存在しない、上の小領域及び右の小領域のために使用される。

[0043] 一方で、ブロック５３０において、小領域がアクティブピクチャエリアの外側であると判断されるが、コーナーに存在する場合（例えば、図３のタイプＣ）、ブロック５３２において、コーナー点上でバタフライ画像を使用して、画像エリアをパディングする。上記のように、タイプＣのパッド設計は、アクティブピクチャエリア内に存在せず且つコーナーに存在する、左上コーナーの小領域、右上コーナーの小領域、及び右下コーナーの小領域のために使用される。

[0044] ブロック５４０において、処理すべき小領域が更に存在すると判断した場合、ブロック５５０において、プロセスは次の小領域に進んで、ブロック５１０に戻る。そうでない場合には、プロセスを終了する。

[0045] 図５のプロセス５００のブロック５１０、５２０、５３０を特定の順序で設計しているが、これらのブロックは、プロセス５００の結果に影響を及ぼすことなく、任意の順序で実行することができる。

[0046] 図６は、本開示の一実装形態によるフレーム処理システム６００を示すブロック図である。図６に示す実装形態では、フレーム処理システム６００は、ボクシングエッジ領域抽出部６１０と、エッジ領域拡張部６２０と、エッジ領域トリミング部６４０と、エッジ領域充填部６５２及び非エッジ領域充填部６５４を含む領域充填部６５０とを含む。

[0047] 図６に示す実装形態では、エッジ領域抽出部６１０は、入力画像のアクティブピクチャエリア内のボクシングエッジ領域の位置を検出して、アクティブピクチャエリアからエッジ領域を抽出するように構成される。エッジ領域拡張部６２０は、各領域の周囲に余分のパディング／画素を追加してパディングされたエッジ領域を生成することによって、エッジ領域の各々を拡張するように構成される。上記のように、余分のパディング／画素をどのように追加するかについての詳細は、図５に示すフローチャートに示す。

[0048] 図６に示す実装形態では、パディングされたエッジ領域をＭＬベースのアップスケーリングプロセッサ（例えば、ニューラルネットワーク６３０）に送って、アップスケーリングされたパディングエッジ領域を生成する。エッジ領域トリミング部６４０は、アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられるアップスケーリングプロセスの前の元の領域のサイズに対応するサイズにトリミングするように構成される。したがって、トリミングによって、エッジにアーチファクトがないきれいなエッジ領域を生成する。エッジ領域充填部６５２は、トリミングされてきれいになったエッジ領域を出力画像のエッジに挿入するように構成される。更に、非エッジ領域充填部６５４は、非エッジ領域をアップスケーリングして、アップスケーリングされた非エッジ領域を出力画像に挿入して、アップスケーリングされた出力画像を完成するように構成される。

[0049] 一実装形態では、フレーム処理システム６００は、１又は２以上のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲート／ロジックアレイ（ＦＰＧＡ）、又はその他の等価集積又はディスクリート論理回路を含むハードウェアで全体が構成されるシステムである。別の実装形態では、フレーム処理システム６００は、ハードウェアとソフトウェアの組み合わせで構成される。

[0050] 図７Ａは、本開示の一実装形態による、コンピュータシステム７００及びユーザ７０２の図である。ユーザ７０２は、コンピュータシステム７００を使用して、アップスケーリングプロセスにおけるフレーム処理のためのアプリケーションを実装する。

[0051] コンピュータシステム７００は、図７Ｂのフレーム処理アプリケーション７９０を記憶して実行する。更に、コンピュータシステム７００は、ソフトウェアプログラム７０４と通信することができる。ソフトウェアプログラム７０４は、強調色再生アプリケーションのためのソフトウェアコードを含むことができる。ソフトウェアプログラム７０４は、以下で更に説明するように、ＣＤ、ＤＶＤ又はストレージドライブなどの外部媒体にロードすることができる。

[0052] 更に、コンピュータシステム７００は、ネットワーク７８０に接続することができる。ネットワーク７８０は、様々な異なるアーキテクチャ、例えば、クライアント－サーバアーキテクチャ、ピアツーピアネットワークアーキテクチャ、又は他のタイプのアーキテクチャにおいて接続することができる。例えば、ネットワーク７８０は、強調色再生アプリケーション内で使用されるエンジン及びデータを協調させるサーバ７８５と通信することができる。また、ネットワークは、異なるタイプのネットワークとすることができる。例えば、ネットワーク７８０は、インターネット、ローカルエリアネットワーク又はローカルエリアネットワークの任意の変形、ワイドエリアネットワーク、メトロポリタンエリアネットワーク、イントラネット又はエクストラネット、又は無線ネットワークとすることができる。

[0053] 図７Ｂは、本開示の一実装形態による、フレーム処理アプリケーション７９０をホストするコンピュータシステム７００を示す機能ブロック図である。コントローラ７１０はプログラマブルプロセッサであり、コンピュータシステム７００及びそのコンポーネントの動作を制御する。コントローラ７１０は、メモリ７２０又は内蔵コントローラメモリ（図示せず）から（例えば、コンピュータプログラムの形で）命令をロードして、これらの命令を実行してシステムを制御する。その実行において、コントローラ７１０は、フレーム処理アプリケーション７９０にソフトウェアシステムを提供して、例えば、強調色再生アプリケーション内のエンジン及びデータ抽出部の作成及び構成を可能にする。代替的に、このサービスは、コントローラ７１０又はコンピュータシステム７００において別個のハードウェアコンポーネントとして実装することができる。

[0054] メモリ７２０は、コンピュータシステム７００の他のコンポーネントによって使用するためにデータを一時的に記憶する。一実装形態では、メモリ７２０はＲＡＭとして実装される。一実装形態では、メモリ７２０は、また、フラッシュメモリ及び／又はＲＯＭなどの長期又は永久メモリを含む。

[0055] ストレージ７３０は、コンピュータシステム７００の他のコンポーネントによって使用するために、データを一時的に又は長期間にわたって記憶する。例えば、ストレージ７３０は、フレーム処理アプリケーション７９０によって使用されるデータを記憶する。一実装形態では、ストレージ７３０は、ハードディスクドライブである。

[0056] メディアデバイス７４０は、リムーバブルメディアを受け入れて、挿入されたメディアに対してデータの読み出し及び／又は書き込みを行う。一実装形態では、例えば、メディアデバイス７４０は、光ディスクドライブである。

[0057] ユーザインターフェイス７５０は、コンピュータシステム７００のユーザからユーザ入力を受け取ってユーザ７０２に情報を提示するためのコンポーネントを含む。一実装形態では、ユーザインターフェイス７５０は、キーボード、マウス、オーディオスピーカ、及びディスプレイを含む。コントローラ７１０は、ユーザ７０２からの入力を使用して、コンピュータシステム７００の動作を調整する。

[0058] Ｉ／Ｏインターフェイス７６０は、１又は２以上のＩ／Ｏポートを含み、外部記憶又は補足装置（例えば、プリンタ又はＰＤＡ）などの対応するＩ／Ｏデバイスに接続する。一実装形態では、Ｉ／Ｏインターフェイス７６０のポートは、ＵＳＢポート、ＰＣＭＣＩＡポート、シリアルポート、及び／又はパラレルポートなどのポートを含む。別の実装形態では、Ｉ／Ｏインターフェイス７６０は、外部装置と無線で通信するための無線インターフェイスを含む。

[0059] ネットワークインターフェイス７７０は、イーサネット接続をサポートするＲＪ－４５又は「Ｗｉ－Ｆｉ」インターフェイス（８０２．１１を含むが、これに限定されるわけではない）などの有線及び／又は無線ネットワーク接続を含む。

[0060] コンピュータシステム７００は、コンピュータシステムに典型的な追加のハードウェア及びソフトウェア（例えば、電力、冷却、オペレーティングシステム）を含むが、これらのコンポーネントは、簡略化のために、図７Ｂに具体的に示されていない。他の実装形態では、コンピュータシステムの異なる構成を使用することができる（例えば、異なるバス又はストレージ構成又はマルチプロセッサ構成）。

[0061] 開示した実装についての本明細書の説明は、当業者が本開示を実施又は利用できるように行ったものである。当業者には、これらの実装の多数の修正が容易に明らかになると思われ、また本明細書で定義した原理は、本開示の趣旨又は範囲から逸脱することなく他の実装にも適用することができる。したがって、本開示は、本明細書に示す実装に限定されることを意図するものではなく、本明細書で開示した原理及び新規の特徴と一致する最も広い範囲が与えられるべきである。

[0062] 本開示の様々な実装は、電子ハードウェア、コンピュータソフトウェア、又はこれらの技術の組み合わせの形で実現される。いくつかの実装は、１又は２以上のコンピュータ装置により実行される１又は２以上のコンピュータプログラムを含む。一般に、コンピュータ装置は、１又は２以上のプロセッサ、１又は２以上のデータ記憶構成要素（例えば、ハードディスクドライブ及びフロッピーディスクドライブ、ＣＤ－ＲＯＭドライブ、及び磁気テープドライブなどの揮発性又は不揮発性メモリモジュール及び持続的な光学及び磁気記憶装置）、１又は２以上の入力装置（例えば、ゲームコントローラ、マウス及びキーボード）、及び１又は２以上の出力装置（例えば、ディスプレイ装置）を含む。

[0063] コンピュータプログラムは、通常、持続的な記憶媒体に記憶され、実行時にメモリにコピーされる実行可能なコードを含む。少なくとも１つのプロセッサが、所定の順序でメモリからプログラム命令を取り出すことによって、コードを実行する。プログラムコードの実行中には、コンピュータは、入力及び／又は記憶装置からデータを受け取り、データに対して処理を実行し、これにより得られたデータを出力及び／又は記憶装置に供給する。

[0064] 当業者であれば、本明細書で説明した様々な例示的なモジュール及び方法ステップを電子ハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせとして実装することができると理解するであろう。このハードウェアとソフトウェアの互換性を明確に示すために、本明細書では、様々な例示的なモジュール及び方法ステップについて、一般にこれらの機能面から説明した。このような機能をハードウェア又はソフトウェアのいずれとして実装するかは、特定の用途及びシステム全体に課せられる設計制約に依存する。当業者であれば、説明した機能を各特定の用途のために様々な方法で実装することができるが、このような実装の決定を、本開示の範囲からの逸脱を引き起こすものとして解釈すべきではない。また、モジュール又はステップ内の機能のグループ化は、説明を容易にするためのものである。本開示から逸脱することなく、特定の機能を１つのモジュール又はステップから別のモジュール又はステップへ移すことができる。

[0065] 上記の各実施例の全ての特徴が、本開示の特定の実装において必ずしも必要というわけではない。更に、本明細書で提示した説明及び図面は、本開示が広く意図する主題を表すものであると理解されたい。更に、本開示の範囲は、当業者にとって明らかになり得る他の実装を完全に含み、したがって、本開示の範囲は、添付の特許請求の範囲以外のものによって限定されるものではないと理解されたい。

１００レターボックスエッジ
１１０ピラーボックスエッジ
１２０ウィンドウボックスエッジ
２００フレーム処理プロセス
２０２ボクシングエッジ領域
２０４ボクシングエッジ領域を検出して抽出する
２０６アクティブピクチャエリア
２１０ボクシングエッジ領域
２１２アーチファクト
２２０パディングされたエッジ領域
２２２アップスケーリングされたパディングエッジ領域／パディングプロセス
３００アクティブピクチャエリア
３０２抽出されたボクシングエッジ領域
３２０パディングされた領域
３２２，３２４線
４００フレーム処理プロセス
４１０ボクシングエッジ領域の位置を検出
４２０アクティブピクチャエリアから領域を抽出
４３０領域の周囲に余分のパディングを追加することによってエリアを拡張
４４０ＭＬベースのアップスケーリングを適用
４５０アップスケーリングされた画像から実際の領域を、元の領域のサイズに対応するサイズでトリミング
４６０トリミングされてきれいになったエッジ領域を出力画像のエッジに挿入
４７０全てのエッジ領域を処理したか？
４８０非エッジ領域を抽出し、アップスケーリングし、出力画像に挿入
５００対象エッジ領域の周囲に画素をパディングする方法を決定
５１０小領域がアクティブピクチャエリア内に存在するか？
５１２小領域の方向に拡張
５２０エッジか？
５２２エッジ上でバタフライ画像を使用して小領域をパディング
５３０コーナーか？
５３２コーナー点上でバタフライ画像を使用して小領域をパディング
５４０判断すべき小領域が更に存在するか？
５５０次の小領域に進む
６００フレーム処理システム
６１０エッジ領域抽出部
６２０エッジ領域拡張部
６３０ニューラルネットワーク
６４０エッジ領域トリミング部
６５０領域充填部
６５２エッジ領域充填部
６５４非エッジ領域充填部
７００コンピュータシステム
７０２ユーザ
７０４ソフトウェアプログラム
７１０コントローラ
７２０メモリ
７３０ストレージ
７４０メディアデバイス
７５０ユーザインターフェイス
７６０Ｉ／Ｏインターフェイス
７７０ネットワークインターフェイス
７８０ネットワーク
７８５サーバ
７９０フレーム処理アプリケーション

Claims

出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のための方法であって、前記方法は、
前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出するステップと、
前記ボクシングエッジ領域の各々の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記抽出されたボクシングエッジ領域を拡張するステップと、
前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成するステップと、
前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングするステップと、
前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入するステップと、
前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入するステップと、
を含むことを特徴とする方法。
前記ボクシングエッジ領域の各々の周囲に余分の画素を追加することは、
前記ボクシングエッジ領域の各々の周囲に前記余分の画素をパディングする方法を決定するステップと、
前記ボクシングエッジ領域の各々の周囲に前記余分の画素の小領域を追加するステップと、
を含む、
ことを特徴とする、請求項１に記載の方法。
小領域を追加するステップは、前記小領域毎にタイプを決定するステップを含むことを特徴とする、請求項２に記載の方法。
前記小領域の第１のタイプは、
前記アクティブピクチャエリア内に完全に存在する画素を有する前記小領域を含む、
ことを特徴とする、請求項３に記載の方法。
更に、
前記小領域が前記第１のタイプであると判断されたときに、前記ボクシングエッジ領域の各々を前記小領域の方向に拡張するステップ、
を含む、
ことを特徴とする、請求項４に記載の方法。
前記小領域の第２のタイプは、
前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のエッジ上に存在する少なくとも１つの画素を有する前記小領域を含む、
ことを特徴とする、請求項３に記載の方法。
更に、
前記小領域が前記第２のタイプであると判断されたときに、前記エッジ上でバタフライ画像を使用して、前記ボクシングエッジ領域を拡張するステップ、
を含む、
ことを特徴とする、請求項６に記載の方法。
前記小領域の第３のタイプは、
前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のコーナー上に存在する少なくとも１つの画素を有する前記小領域を含む、
ことを特徴とする、請求項３に記載の方法。
更に、
前記小領域が前記第３のタイプであると判断されたときに、前記コーナー上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するステップ、
を含む、
ことを特徴とする、請求項８に記載の方法。
出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のためのシステムであって、前記システムは、
前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出するように構成されるエッジ領域抽出部と、
各ボクシングエッジ領域の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記ボクシングエッジ領域の各々を拡張するように構成されるエッジ領域拡張部であって、
前記エッジ領域拡張部は、前記パディングされたエッジ領域をアップスケーリングプロセッサに送って、前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成する、エッジ領域拡張部と、
前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングするように構成されるエッジ領域トリミング部と、
前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入するように構成されるエッジ領域充填部と、
前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入するように構成される非エッジ領域充填部と、
を含むことを特徴とするシステム。
前記エッジ領域拡張部は、前記ボクシングエッジ領域の各々の周囲に前記余分の画素の小領域を追加することによって、前記ボクシングエッジ領域の各々の周囲に前記余分の画素を追加することを特徴とする、請求項１０に記載のシステム。
小領域を追加することは、前記小領域毎にタイプを決定することを含むことを特徴とする、請求項１１に記載のシステム。
前記小領域の第１のタイプは、
前記アクティブピクチャエリア内に完全に存在する画素を有する前記小領域を含む、
ことを特徴とする、請求項１２に記載のシステム。
前記エッジ領域拡張部は、更に、前記小領域が前記第１のタイプであると判断されたときに、前記ボクシングエッジ領域の各々を前記小領域の方向に拡張するように構成されることを特徴とする、請求項１３に記載のシステム。
前記小領域の第２のタイプは、
前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のエッジ上に存在する少なくとも１つの画素を有する前記小領域を含む、
ことを特徴とする、請求項１２に記載のシステム。
前記エッジ領域拡張部は、更に、前記小領域が前記第２のタイプであると判断されたときに、前記エッジ上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するように構成されることを特徴とする、請求項１５に記載のシステム。
前記小領域の第３のタイプは、
前記アクティブピクチャエリア内に存在するのではなく、前記パディングされたエッジ領域のうちの１つの領域のコーナー上に存在する少なくとも１つの画素を有する前記小領域を含む、
ことを特徴とする、請求項１２に記載のシステム。
前記エッジ領域拡張部は、前記小領域が前記第３のタイプであると判断されたときに、前記コーナー上でバタフライ画像を使用して、前記ボクシングエッジ領域の各々を拡張するように構成されることを特徴とする、請求項１７に記載のシステム。
出力画像を生成するためのＭＬベースのアップスケーリングプロセスにおける入力画像のフレーム処理のためのコンピュータプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記コンピュータプログラムは実行可能命令を含み、前記実行可能命令は、コンピュータに、
前記入力画像のアクティブピクチャエリアのエッジからボクシングエッジ領域を検出して抽出することと、
前記ボクシングエッジ領域の各々の周囲に余分の画素を追加してパディングされたエッジ領域を生成することによって、前記抽出されたボクシングエッジ領域を拡張することと、
前記パディングされたエッジ領域をアップスケーリングして、アップスケーリングされたパディングエッジ領域を生成することと、
前記アップスケーリングされたパディングエッジ領域の各々を、アップスケーリング係数が掛けられる前記アップスケーリングの前の前記ボクシングエッジ領域の各々のサイズに対応するサイズにトリミングすることと、
前記トリミングされたエッジ領域を前記出力画像の前記エッジに挿入することと、
前記入力画像の非エッジ領域をアップスケーリングして、前記アップスケーリングされた非エッジ領域を前記出力画像に挿入することと、
を行わせる、
ことを特徴とする非一時的コンピュータ可読記憶媒体。
コンピュータに、前記抽出されたボクシングエッジ領域を拡張させる前記実行可能命令は、実行可能命令を含み、前記実行可能命令は、コンピュータに、
前記ボクシングエッジ領域の各々の周囲に前記余分の画素をパディングする方法を決定することと、
前記余分の画素の小領域を追加することと、
を行わせる、
ことを特徴とする、請求項１９に記載の非一時的コンピュータ可読記憶媒体。