JP4697249B2 - Information processing apparatus and method, and program - Google Patents

Information processing apparatus and method, and program Download PDF

Info

Publication number
JP4697249B2
JP4697249B2 JP2008071639A JP2008071639A JP4697249B2 JP 4697249 B2 JP4697249 B2 JP 4697249B2 JP 2008071639 A JP2008071639 A JP 2008071639A JP 2008071639 A JP2008071639 A JP 2008071639A JP 4697249 B2 JP4697249 B2 JP 4697249B2
Authority
JP
Japan
Prior art keywords
resolution
code stream
editing
baseband data
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008071639A
Other languages
Japanese (ja)
Other versions
JP2009194887A (en
Inventor
淳哉 荒木
和寿 保坂
隆浩 福原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008071639A priority Critical patent/JP4697249B2/en
Priority to US12/353,479 priority patent/US8243824B2/en
Publication of JP2009194887A publication Critical patent/JP2009194887A/en
Application granted granted Critical
Publication of JP4697249B2 publication Critical patent/JP4697249B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、スケーラブルに符号化されたコードストリームの編集処理をより容易に行うことができるようにした情報処理装置および方法、並びにプログラムに関する。   The present invention relates to an information processing apparatus and method, and a program, and more particularly, to an information processing apparatus and method, and a program that can more easily edit a code stream that is encoded in a scalable manner.

近年、映画の製作、配給、および上映において、フィルムの代わりにデジタルデータを用いるデジタルシネマの普及が推進されており、米国映画配給主要会社7社で構成されるDCI(Digital Cinema Initiative)等の標準化団体により、規格の仕様の策定が行われている。   In recent years, in the production, distribution, and screening of movies, the spread of digital cinema using digital data instead of film has been promoted, and standardization such as DCI (Digital Cinema Initiative) composed of seven major US movie distribution companies The specification of the standard is being developed by the organization.

例えば、DCIで策定されたDCI規格では、画像の解像度として4K(4,096×2,160画素)と2K(2,048×1,080画素)の2つが定義され、映像圧縮には、複数の解像度で復号することができるように(スケーラブルに)符号化するJPEG2000(Joint Photographic Experts Group 2000)が利用されることが決められている(例えば、特許文献1参照)。   For example, in the DCI standard established by DCI, two image resolutions of 4K (4,096 × 2,160 pixels) and 2K (2,048 × 1,080 pixels) are defined, and video compression can be decoded at a plurality of resolutions. JPEG2000 (Joint Photographic Experts Group 2000) for encoding (scalably) in this way is determined to be used (see, for example, Patent Document 1).

デジタルシネマ制作のワークフローにおいて、フィルムからスキャンされた画像は、Tiff(Tagged Image File Format)やDpx(Digital Picture Exchange)などの画像フォーマットで取り込まれ、非圧縮(ベースバンド)のデジタルデータ(ベースバンドデータ)にデータ化される。このベースバンドデータは、マスタデータとして管理され、ノイズ除去等の編集処理が施される。   In digital cinema production workflows, images scanned from film are captured in image formats such as Tiff (Tagged Image File Format) and Dpx (Digital Picture Exchange), and uncompressed (baseband) digital data (baseband data ). This baseband data is managed as master data and subjected to editing processing such as noise removal.

図1は、編集処理の様子の例を示す図である。   FIG. 1 is a diagram illustrating an example of a state of editing processing.

図1に示されるように、映画フィルムをスキャンして得られたフレーム画像10には、例えば、スキャンしたフィルムに付着した埃やゴミ、またはフィルムの傷等によってノイズ成分が含まれる場合ある。拡大図11は、フレーム画像10の、ノイズ成分を含む範囲10Aを拡大したものである。その拡大図11に示されるように、図1の例の場合、フレーム画像10には、フィルムに付着した埃によるノイズ12が発生している。デジタルシネマ制作のワークフローにおいては、このようなノイズ成分の除去処理(編集処理)が行われる。   As shown in FIG. 1, the frame image 10 obtained by scanning a motion picture film may contain a noise component due to, for example, dust or dirt attached to the scanned film, or scratches on the film. FIG. 11 is an enlarged view of the range 10A including the noise component of the frame image 10. As shown in the enlarged view 11, in the example of FIG. 1, noise 12 due to dust attached to the film is generated in the frame image 10. In a digital cinema production workflow, such noise component removal processing (editing processing) is performed.

しかしながら、解像度が4Kのように非常に高解像度になると、データ量が非常に大きくなるので、ベースバンドデータをマスタデータとすると、保存に必要な記憶容量、転送に必要なネットワーク帯域、並びに、各種処理の負荷や処理時間等が増大してしまう。   However, if the resolution is very high, such as 4K, the amount of data becomes very large. Therefore, if the baseband data is master data, the storage capacity required for storage, the network bandwidth required for transfer, and various Processing load, processing time, etc. will increase.

そこで、データ量を低減させるために、例えばJPEG2000のような所定の圧縮方式で圧縮された圧縮データ(コードストリーム)をマスタデータとする方法が考えられる。上述したようにJPEG2000は、スケーラブル符号化方式の1つであるので、4Kと2Kのように複数の解像度に対応する。   Therefore, in order to reduce the amount of data, a method of using compressed data (code stream) compressed by a predetermined compression method such as JPEG 2000 as master data can be considered. As described above, JPEG2000 is one of the scalable encoding schemes, and therefore supports a plurality of resolutions such as 4K and 2K.

特開2006−311327号公報JP 2006-311327 A

しかしながら、この場合も、ノイズ除去等の編集処理は、マスタデータが最高解像度で復号されてから施されていた。例えば、各フレーム画像の解像度が4Kの場合、JPEG2000方式で圧縮されたデジタルデータ(JPEG2000データ)であるマスタデータは、解像度4Kで復号され、解像度4Kの各フレーム画像が復元され、ノイズ除去等の編集処理は、その解像度4Kのベースバンドの各フレーム画像に対して行われていた。   However, also in this case, editing processing such as noise removal is performed after the master data is decoded at the highest resolution. For example, when the resolution of each frame image is 4K, master data that is digital data (JPEG2000 data) compressed by the JPEG2000 system is decoded at a resolution of 4K, each frame image at a resolution of 4K is restored, noise removal, etc. The editing process has been performed on each frame image of the 4K resolution baseband.

このように、スケーラブル符号化されたデータは、スケーラブルでない符号化方式で符号化されたデータの場合と同様に最高解像度で復号されてから編集処理が施されていた。従って、スケーラブル符号化されたデータも、スケーラブルでない符号化方式で符号化されたデータの場合と同様に、高解像度化によりデータ量が増大すると、復号処理の負荷や処理時間が大幅に増大し、これにより、編集処理の負荷や処理時間も大幅に増大してしまう恐れがあった。   As described above, the scalable-coded data is subjected to the editing process after being decoded at the highest resolution as in the case of the data encoded by the non-scalable encoding method. Therefore, similarly to the case of the data encoded by the non-scalable encoding method, the data of the scalable encoding increases the data amount due to the increase in the resolution, so that the load and the processing time of the decoding process greatly increase. As a result, the load and processing time of the editing process may increase significantly.

本発明はこのような問題を解決するためのものであり、低解像度のベースバンドデータを用いて編集箇所を特定し、その特定された編集箇所を編集するようにすることにより、スケーラブルに符号化されたコードストリームの編集処理を、より容易に行うことができるようにするものである。   The present invention is for solving such a problem, and specifies an edit part using low-resolution baseband data, and edits the specified edit part, thereby enabling scalable encoding. The code stream editing process can be performed more easily.

本発明の一側面は、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置であって、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定手段と、前記第1の解像度のコードストリームの、前記設定手段により設定された前記編集領域の部分前記第1の解像度で復号された前記第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータを作成する第1の作成手段と、前記第1の作成手段により作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行う編集手段と、前記編集手段により編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成する第2の作成手段と、前記第1の解像度のコードストリームの前記編集領域の部分を、前記第2の作成手段により作成された前記部分コードストリームに置換するコードストリーム置換手段とを備える情報処理装置である。 One aspect of the present invention is an information processing apparatus that processes a code stream of the first resolution, in which data of a first resolution is encoded in a scalable manner, and the code stream of the first resolution is Decoding at a second resolution lower than the first resolution, setting means for setting an editing area for editing using the obtained baseband data of the second resolution, and the first resolution creating a code stream, a baseband data portion of said first of said first resolution decoded by resolution of the editing area set by the setting means, the partial baseband data of the first resolution first and creation means, an editing means for performing editing processing with respect to the first of said first created by creating means the resolution of the partial baseband data, said editing means Partial baseband data of the edited first resolution and scalably encoded and a second generating means for generating partial code stream is a code stream of the editing area, said first resolution codestream An information processing apparatus comprising: a code stream replacing unit that replaces a part of an editing area with the partial code stream created by the second creating unit .

前記第1の作成手段は、前記第2の解像度のベースバンドデータより、前記編集領域の部分を抽出する第1の抽出手段と、前記第1の解像度のコードストリームより、前記編集領域の部分を抽出する第2の抽出手段と、前記第2の抽出手段により抽出された前記第1の解像度のコードストリームの前記編集領域の部分を復号する復号手段と、前記第1の抽出手段により抽出された前記第2の解像度のベースバンドデータの前記編集領域の部分、並びに、前記復号手段により前記第1の解像度のコードストリームの前記編集領域の部分が復号されて得られた前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を逆ウェーブレット変換することにより、前記第1の解像度の部分ベースバンドデータを作成する逆ウェーブレット変換手段とを備えることができる。   The first creation means includes a first extraction means for extracting a portion of the editing area from the baseband data of the second resolution, and a portion of the editing area from the code stream of the first resolution. A second extracting means for extracting; a decoding means for decoding a portion of the editing area of the code stream of the first resolution extracted by the second extracting means; and a second extracting means for extracting by the first extracting means Each of the first resolution obtained by decoding the portion of the editing area of the baseband data of the second resolution and the portion of the editing area of the code stream of the first resolution by the decoding means. The inverse wavelet transform that creates the partial baseband data of the first resolution by performing inverse wavelet transform on the portion of the edit region of the subband of the high frequency component. Can and means.

前記編集手段は、前記第1の解像度の部分ベースバンドデータに含まれるノイズ成分を除去する編集を行うことができる。   The editing means can perform editing to remove a noise component included in the partial baseband data of the first resolution.

前記第2の作成手段は、編集された前記第1の解像度の部分ベースバンドデータを第1の解像度でウェーブレット変換するウェーブレット変換手段と、前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を符号化する第1の符号化手段と、前記設定手段により得られた前記第2の解像度のベースバンドデータの前記編集領域の部分を、前記ウェーブレット変換手段によるウェーブレット変換処理により得られた前記第1の解像度の低周波成分のサブバンドに含まれる前記第2の解像度のベースバンドデータの前記編集領域の部分に置換するベースバンドデータ置換手段と、前記編集領域の部分が置換された前記第2の解像度のベースバンドデータを符号化する第2の符号化手段とを備えることができる。 The second creation means is obtained by wavelet transform means for wavelet transforming the edited partial baseband data of the first resolution at the first resolution, and wavelet transform processing by the wavelet transform means. A first encoding unit that encodes a portion of the edit region of each high-frequency component subband having a resolution of 1, and a portion of the edit region of the baseband data of the second resolution obtained by the setting unit; Is replaced with the part of the editing area of the baseband data of the second resolution included in the subband of the low frequency component of the first resolution obtained by the wavelet transform processing by the wavelet transform means Substitution means and baseband data of the second resolution in which the portion of the editing area is replaced It may include a second coding means for coding.

前記第2の作成手段は、編集された前記第1の解像度の部分ベースバンドデータを第1の解像度でウェーブレット変換するウェーブレット変換手段と、前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を符号化する第1の符号化手段と、前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第2の解像度のベースバンドデータの前記編集領域の部分を符号化する第2の符号化手段とを備えることができる。   The second creation means is obtained by wavelet transform means for wavelet transforming the edited partial baseband data of the first resolution at the first resolution, and wavelet transform processing by the wavelet transform means. Baseband data of the second resolution obtained by the first encoding means for encoding the portion of the edit area of the subband of each high-frequency component of the resolution of 1 and the wavelet transform processing by the wavelet transform means And a second encoding means for encoding the part of the editing area.

本発明の一側面は、また、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置の情報処理方法であって、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定し、前記第1の解像度のコードストリームの、設定された前記編集領域の部分前記第1の解像度で復号された前記第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータを作成し、作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行い、編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成し、前記第1の解像度のコードストリームの前記編集領域の部分を、作成された前記部分コードストリームに置換するステップを含む情報処理方法である。 One aspect of the present invention is also an information processing method for an information processing apparatus that processes a code stream having the first resolution, in which data having the first resolution is encoded in a scalable manner. Is decoded at a second resolution lower than the first resolution, and an editing area for editing is set using the obtained baseband data at the second resolution, 1 resolution codestream a baseband data of the set portion of the editing area decoded by the first resolution first resolution, to create a partial baseband data of the first resolution performs an editing process on the partial baseband data of the created first resolution, encoded in scalable partial baseband data edited the first resolution, before Create a partial code stream is a code stream of the editing area, a part of the editing area of the first resolution code stream, an information processing method comprising the step of replacing the partial code stream created.

本発明の一側面は、さらに、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理するプログラムにおいて、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定ステップと、前記第1の解像度のコードストリームの、前記設定ステップの処理により設定された前記編集領域の部分前記第1の解像度で復号された前記第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータを作成する第1の作成ステップと、前記第1の作成ステップの処理により作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行う編集ステップと、前記編集ステップの処理により編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成する第2の作成ステップと、前記第1の解像度のコードストリームの前記編集領域の部分を、前記第2の作成ステップの処理により作成された前記部分コードストリームに置換するコードストリーム置換ステップとをコンピュータに実行させるプログラムである。 According to another aspect of the present invention, in the program for processing the first resolution code stream in which the first resolution data is scalable and encoded, the first resolution code stream is converted into the first resolution code stream. A setting step of setting an editing area to be edited using the baseband data of the second resolution obtained by decoding at a second resolution lower than the resolution of the first resolution, and the code of the first resolution creating a stream, the setting is baseband data set portion of the editing area by the processing of the first said decoded by the resolution of the first resolution step, the partial baseband data of the first resolution first generating step and the editing process to the first of said first created by the processing steps for creating resolution partial baseband data An editing step of performing a second creation step of encoding the partial baseband data of the first resolution which has been edited by the processing of the editing step to a scalable, to create a partial code stream is a code stream of the editing area A code stream replacement step of causing a computer to execute a code stream replacement step of replacing a part of the editing area of the code stream of the first resolution with the partial code stream created by the processing of the second creation step .

本発明の他の側面は、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置であって、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定手段と、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、前記設定手段により設定された前記編集領域の部分を抽出する抽出手段と、前記抽出手段により抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行う編集手段と、前記編集手段により前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化する符号化手段と、前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータが前記符号化手段によりスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集手段により前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換する置換手段とを備える情報処理装置である。 Another aspect of the present invention is an information processing apparatus that processes a code stream of the first resolution, in which data of the first resolution is encoded in a scalable manner, and the code stream of the first resolution is Decoding means at a second resolution lower than the first resolution, and using the obtained baseband data at the second resolution, setting means for setting an edit area for editing; and the first included in the resolution of the code stream, from the code stream of the sub-band of each high-frequency component of the first resolution, and extracting means for extracting a portion of the editing area set by the setting unit, extracted by the extraction means In addition, the editing area portion of the sub-band code stream of each high-frequency component of the first resolution, and the editing of the baseband data of the second resolution And editing means for performing editing processing with respect to each portion of the band, and coding means for coding scalably baseband data of the portion of the editing area is edited second resolution by said editing means, said A portion of the second resolution code stream of the first resolution code stream and the second resolution baseband data obtained by editing the portion of the editing area are encoded in a scalable manner by the encoding means. The second resolution code stream is replaced, and the edit area portion of the sub-band code stream of each high frequency component of the first resolution included in the first resolution code stream is further replaced. the knitting of the code stream of the sub-band of each high-frequency component of the first resolution the editing process is performed by said editing means An information processing apparatus and a replacement means for replacing the portion of the region.

前記編集手段は、前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して、ノイズ成分を除去する編集を行うことができる。   The editing means, for each of the editing area portion of the substream code stream of each high-frequency component of the first resolution, and each of the editing area portion of the baseband data of the second resolution, Editing that removes noise components can be performed.

前記編集手段は、前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分を、所定の他のコードストリームと置換することにより、前記ノイズ成分を除去することができる。   The editing means can remove the noise component by replacing a part of the editing area of the substream code stream of each high-frequency component of the first resolution with a predetermined other code stream.

本発明の他の側面は、また、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置の情報処理方法であって、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定し、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、設定された前記編集領域の部分を抽出し、抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行い、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化し、前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータがスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換するステップを含む情報処理方法である。 Another aspect of the present invention is also an information processing method of an information processing apparatus for processing a code stream of the first resolution, in which data of the first resolution is encoded in a scalable manner. Decoding the resolution code stream at a second resolution lower than the first resolution, and using the obtained baseband data at the second resolution to set an editing area to be edited, A portion of the set editing area is extracted from the substream code stream of each high frequency component of the first resolution included in the code stream of the first resolution, and each of the extracted first resolutions is extracted. Edit processing is performed on each of the edit region portion of the high-frequency component subband code stream and the edit region portion of the baseband data of the second resolution. The baseband data of the second resolution in which the part of the editing area is edited is scalablely encoded, and the part of the code stream of the second resolution of the code stream of the first resolution is the editing area. The baseband data of the second resolution, which is edited from the second resolution, is replaced with the codestream of the second resolution that is encoded in a scalable manner, and further included in the codestream of the first resolution. The part of the edit area of the subband code stream of each high frequency component of 1 resolution is the part of the edit area of the code stream of the subband of each high frequency component of the first resolution subjected to the editing process. It is the information processing method including the step to replace with.

本発明の他の側面は、さらに、第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理するプログラムにおいて、前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定ステップと、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、前記設定ステップの処理により設定された前記編集領域の部分を抽出する抽出ステップと、前記抽出ステップの処理により抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行う編集ステップと、前記編集ステップの処理により前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化する符号化ステップと、前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータが前記符号化ステップの処理によりスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集ステップの処理により前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換する置換ステップとをコンピュータに実行させるプログラムである。 According to another aspect of the present invention, in the program for processing the code stream of the first resolution in which the data of the first resolution is encoded in a scalable manner, the code stream of the first resolution is Decoding at a second resolution lower than the first resolution, and using the obtained baseband data at the second resolution, a setting step for setting an editing area to be edited; An extraction step for extracting a portion of the editing area set by the processing of the setting step from a substream code stream of each high-frequency component of the first resolution included in the code stream; and by the processing of the extraction step The portion of the editing area of the extracted sub-band codestream of each high-frequency component of the first resolution, and the second solution Scalable and editing step, the baseband data processed by the editing area the second resolution part is edited in the editing step for editing processing on the respective part of the editing area of the baseband data degrees The second resolution base stream data obtained by editing the portion of the editing area, the encoding step of encoding the first resolution code stream, and the second resolution code stream portion of the first resolution code stream. Substitution of the second resolution code stream encoded in a scalable manner by the process of the encoding step , and further, sub-frequency of each high-frequency component of the first resolution included in the first resolution code stream. band code stream, a portion of the editing area, the editing process is performed by processing in the editing step And a first resolution program for executing the substitution step to the computer to replace the portion of the editing area of the code stream of the sub-band of the radio frequency components.

本発明の一側面においては、第1の解像度のコードストリームが、第1の解像度よりも低解像度の第2の解像度で復号され、得られた第2の解像度のベースバンドデータを用いて、編集を行う編集領域が設定され、第1の解像度のコードストリームの、設定された編集領域の部分第1の解像度で復号された第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータが作成され、作成された第1の解像度の部分ベースバンドデータに対して編集処理が行われ、編集された第1の解像度の部分ベースバンドデータがスケーラブルに符号化され、編集領域のコードストリームである部分コードストリームが作成され、第1の解像度のコードストリームの編集領域の部分が、作成された部分コードストリームに置換される。 In one aspect of the present invention, a code stream having a first resolution is decoded at a second resolution lower than the first resolution, and editing is performed using the obtained baseband data having the second resolution. set editing area for, the first resolution code stream, a baseband data of the first resolution is part of the set editing area decoded by the first resolution, the portion of the first resolution Baseband data is created, editing processing is performed on the created partial baseband data of the first resolution, the edited partial baseband data of the first resolution is scalable and encoded, A partial code stream that is a code stream is created, and the portion of the editing area of the first resolution code stream is replaced with the created partial code stream.

本発明の他の側面においては、第1の解像度のコードストリームが、第1の解像度よりも低解像度の第2の解像度で復号され、得られた第2の解像度のベースバンドデータを用いて、編集が行われる編集領域が設定され、第1の解像度のコードストリームに含まれる、第1の解像度の各高周波成分のサブバンドのコードストリームより、設定された編集領域の部分が抽出され、抽出された第1の解像度の各高周波成分のサブバンドのコードストリームの編集領域の部分、並びに、第2の解像度のベースバンドデータの編集領域の部分のそれぞれに対して編集処理が行われ、編集領域の部分が編集された第2の解像度のベースバンドデータがスケーラブルに符号化され、第1の解像度のコードストリームの、第2の解像度のコードストリームの部分が、編集領域の部分が編集された第2の解像度のベースバンドデータがスケーラブルに符号化された第2の解像度のコードストリームに置換され、さらに、第1の解像度のコードストリームに含まれる、第1の解像度の各高周波成分のサブバンドのコードストリームの、編集領域の部分が、編集処理が行われた第1の解像度の各高周波成分のサブバンドのコードストリームの編集領域の部分に置換される。 In another aspect of the present invention, a first resolution code stream is decoded at a second resolution lower than the first resolution, and the obtained second resolution baseband data is used. An editing area to be edited is set, and a portion of the set editing area is extracted and extracted from the substream code stream of each high frequency component of the first resolution included in the code stream of the first resolution. In addition, an editing process is performed on each of the editing region portion of the subband code stream of each high-frequency component of the first resolution and the editing region portion of the baseband data of the second resolution, The baseband data of the second resolution whose portion is edited is encoded in a scalable manner, and the codestream of the second resolution of the codestream of the first resolution is encoded. The second resolution baseband data in which the portion of the editing area is edited is replaced with the second resolution code stream encoded in a scalable manner, and further included in the first resolution code stream. The edit region portion of the substream code stream of each high frequency component of the first resolution is replaced with the edit region portion of the substream code stream of each high frequency component of the first resolution subjected to the editing process. The

ネットワークとは、少なくとも2つの装置が接続され、ある装置から、他の装置に対して、情報の伝達をできるようにした仕組みをいう。ネットワークを介して通信する装置は、独立した装置どうしであっても良いし、1つの装置を構成している内部ブロックどうしであっても良い。   The network is a mechanism in which at least two devices are connected and information can be transmitted from one device to another device. The devices that communicate via the network may be independent devices, or may be internal blocks that constitute one device.

また、通信とは、無線通信および有線通信は勿論、無線通信と有線通信とが混在した通信、即ち、ある区間では無線通信が行われ、他の区間では有線通信が行われるようなものであっても良い。さらに、ある装置から他の装置への通信が有線通信で行われ、他の装置からある装置への通信が無線通信で行われるようなものであっても良い。   The communication is not only wireless communication and wired communication, but also communication in which wireless communication and wired communication are mixed, that is, wireless communication is performed in a certain section and wired communication is performed in another section. May be. Further, communication from one device to another device may be performed by wired communication, and communication from another device to one device may be performed by wireless communication.

本発明によれば、情報を処理することができる。特に、スケーラブルに符号化されたコードストリームの編集処理を、より容易に行うことができるようにするものである。   According to the present invention, information can be processed. In particular, the editing processing of a code stream encoded in a scalable manner can be performed more easily.

図2は、本発明を適用した画像処理装置の主な構成例を示すブロック図である。図2に示される画像処理装置100は、画像データの各フレーム画像よりノイズを除去する装置である。   FIG. 2 is a block diagram showing a main configuration example of an image processing apparatus to which the present invention is applied. An image processing apparatus 100 shown in FIG. 2 is an apparatus that removes noise from each frame image of image data.

処理される画像データは、デジタルシネマ制作のワークフローにおいて映画フィルムの各コマをスキャンして得られた解像度4K(4,096×2,160画素)の各画像をフレーム画像とする動画像データであり、JPEG2000方式によりスケーラブルに圧縮されている。つまり、この画像データ(コードストリーム)は、復号することにより、少なくとも、4Kまたは2K(2,048×1,080画素)の解像度でベースバンドの画像が得られるようにスケーラブルに圧縮されている(解像度を選択することができる)。JPEG2000方式では、ウェーブレット変換が採用されており、画像の周波数成分が高周波成分と低周波成分に再帰的に分解されるので、復号時には、複数段階の中から任意の解像度でベースバンドの画像を得ることができる。   The image data to be processed is moving image data in which each image with a resolution of 4K (4,096 × 2,160 pixels) obtained by scanning each frame of a movie film in a digital cinema production workflow is a frame image. It is compressed in a scalable manner. In other words, this image data (code stream) is compressed in a scalable manner so that a baseband image can be obtained with a resolution of at least 4K or 2K (2,048 × 1,080 pixels) by decoding (select resolution). be able to). In the JPEG2000 system, wavelet transform is adopted, and the frequency component of the image is recursively decomposed into a high frequency component and a low frequency component, so that at the time of decoding, a baseband image is obtained at an arbitrary resolution from a plurality of stages. be able to.

画像処理装置100は、このスケーラブル符号化されたコードストリームに対して、各フレームの画像から、図1を参照して説明したような、スキャンの際にフィルムに付着した埃やフィルムの傷等によるノイズ成分の除去を行う。このとき、画像処理装置100は、そのノイズ成分の除去を、解像度2Kで復号したフレーム画像(低解像度の画像)で行うことにより、復号処理、ノイズ除去処理、および再符号化処理等の各処理の負荷を低減させ、処理時間を短縮させる。   The image processing apparatus 100 uses, for this scalable encoded code stream, from the image of each frame, as described with reference to FIG. 1, due to dust attached to the film during scanning, film scratches, or the like. Remove noise components. At this time, the image processing apparatus 100 performs each process such as a decoding process, a noise removing process, and a re-encoding process by performing removal of the noise component on a frame image (low-resolution image) decoded at a resolution of 2K. Reduces the processing load.

画像処理装置100は、主な構成として、2Kスケーラブルデコード部101、ノイズ除去部102、2K再エンコード部103、および2Kコードストリーム置換部104を有する。   The image processing apparatus 100 includes a 2K scalable decoding unit 101, a noise removal unit 102, a 2K re-encoding unit 103, and a 2K code stream replacement unit 104 as main components.

2Kスケーラブルデコード部101は、画像処理装置100に入力されたコードストリームを復号し、解像度2Kでベースバンドのフレーム画像を得る。JPEG2000方式においては、画像データは上述したようにウェーブレット変換によって低周波成分が再帰的に分離され、周波数帯毎に符号化される。従って、2Kスケーラブルデコード部101に入力される1フレーム画像分のコードストリーム150Aは、図3Aに示されるように、解像度4Kの画像を垂直方向および水平方向にそれぞれ1回ずつウェーブレット変換して得られる、水平方向および垂直方向に低周波成分のサブバンド(2K(4KLL))が符号化された部分コードストリームである2KS151A、水平方向に高周波成分であり、かつ、垂直方向に低周波成分のサブバンド(4KHL)が符号化された部分コードストリームである4KSHL152、水平方向に低周波成分であり、かつ、垂直方向に高周波成分のサブバンド(4KLH)が符号化された部分コードストリームである4KSLH153、並びに、水平方向および垂直方向に高周波成分のサブバンド(4KHH)が符号化された部分コードストリームである4KSHH154により構成される。   The 2K scalable decoding unit 101 decodes the code stream input to the image processing apparatus 100, and obtains a baseband frame image with a resolution of 2K. In the JPEG2000 system, as described above, low-frequency components of image data are recursively separated by wavelet transform, and are encoded for each frequency band. Accordingly, the code stream 150A for one frame image input to the 2K scalable decoding unit 101 is obtained by performing wavelet transform on an image with a resolution of 4K once each in the vertical direction and the horizontal direction, as shown in FIG. 3A. 2KS151A, which is a partial code stream in which a low-frequency component subband (2K (4KLL)) is encoded in the horizontal direction and the vertical direction, a high-frequency component in the horizontal direction, and a low-frequency component subband in the vertical direction 4KSHL152 which is a partial code stream in which (4KHL) is encoded, 4KSLH153 which is a partial code stream in which a low-frequency component in the horizontal direction and a subband (4KLH) in the high-frequency component are encoded in the vertical direction, and A partial code stream in which high-frequency component subbands (4KHH) are encoded in the horizontal and vertical directions. It consists of a certain 4KSHH154.

ウェーブレット変換においては、画像データは、高周波成分と低周波成分に分離された後、2分の1にダウンサンプリングされる。つまり、この2KS151Aを復号して得られるベースバンド(2K)の画像が解像度2Kの画像となる。2Kスケーラブルデコード部101は、このコードストリーム150Aより2KS151Aを抽出し、その2KS151Aを復号して逆ウェーブレット変換することにより、解像度2Kの画像のベースバンドデータを得る。   In the wavelet transform, the image data is separated into a high frequency component and a low frequency component and then down-sampled by half. That is, a baseband (2K) image obtained by decoding 2KS151A is an image with a resolution of 2K. The 2K scalable decoding unit 101 extracts 2KS 151A from the code stream 150A, decodes the 2KS 151A, and performs inverse wavelet transform to obtain baseband data of an image with a resolution of 2K.

なお、通常の場合、ウェーブレット変換は複数回再帰的に繰り返されるので、2KS151Aに相当するウェーブレット係数は、さらに複数のサブバンドに分離されて符号化されている。つまり、2Kスケーラブルデコード部101は、これらの各サブバンドのコードストリームを全て抽出して復号し、逆ウェーブレット変換する。   In a normal case, the wavelet transform is recursively repeated a plurality of times, so that the wavelet coefficients corresponding to 2KS151A are further separated into a plurality of subbands and encoded. That is, the 2K scalable decoding unit 101 extracts and decodes all of these subband code streams, and performs inverse wavelet transform.

ノイズ除去部102は、2Kスケーラブルデコード部101において得られた解像度2Kのベースバンドのフレーム画像についてノイズ除去を行う。ノイズ除去部102には、2Kスケーラブルデコード部101より、図3Bに示されるような、解像度2Kのフレーム画像のベースバンドデータである2KBB151Bが供給される。ノイズ除去部102は、例えばエッジ検出や前後のフレーム画像の同じ位置の画像との比較等により、この2KBB151Bからノイズ成分を検出し、そのノイズ成分を含むように除去処理を行う編集領域を設定する。ノイズ除去部102は、さらに、その編集領域に対して、例えば、フィルタ処理や前後のフレーム画像の同じ位置の画像や他の画像との置き換え等の編集処理を行い、ノイズを除去する。   The noise removing unit 102 removes noise from the baseband frame image having a resolution of 2K obtained by the 2K scalable decoding unit 101. The noise removing unit 102 is supplied with 2 KBB 151B, which is baseband data of a 2K resolution frame image, as shown in FIG. 3B, from the 2K scalable decoding unit 101. The noise removal unit 102 detects a noise component from the 2KBB 151B, for example, by edge detection or comparison with images at the same position of the preceding and following frame images, and sets an editing region for performing removal processing so as to include the noise component. . Further, the noise removing unit 102 removes noise by performing, for example, an editing process such as a filtering process or replacement of an image at the same position in the previous and subsequent frame images with another image on the editing area.

ノイズ除去の編集処理が終了すると、ノイズ除去部102は、ノイズが除去された解像度2Kのフレーム画像のベースバンドデータを2K再エンコード部103に供給する。つまり、図3Cに示されるように、図3Bにおいて編集領域に設定された部分画像155Aが編集(ノイズ除去)され、部分画像155Bとされた画像2KBB151Cがノイズ除去部102より2K再エンコード部103に供給される。   When the noise removal editing process ends, the noise removal unit 102 supplies the 2K re-encoding unit 103 with the baseband data of the 2K resolution frame image from which the noise has been removed. That is, as shown in FIG. 3C, the partial image 155A set in the editing area in FIG. 3B is edited (noise removal), and the image 2KBB 151C that is the partial image 155B is transferred from the noise removal unit 102 to the 2K re-encoding unit 103. Supplied.

2K再エンコード部103は、ノイズ除去部102においてノイズが除去された解像度2Kのベースバンドデータである2KBB151CをJPEG2000方式で再度符号化する。2Kコードストリーム置換部104は、画像処理装置100に入力されたコードストリームの、解像度2Kの部分を、2K再エンコード部103において得られたコードストリームと置換し、解像度2Kにおいてノイズが除去されたコードストリームを生成し、それを画像処理装置100の外部に出力する。   The 2K re-encoding unit 103 re-encodes 2 KBB 151C, which is baseband data having a resolution of 2K, from which noise has been removed by the noise removing unit 102, using the JPEG2000 method. The 2K code stream replacement unit 104 replaces the 2K resolution portion of the code stream input to the image processing apparatus 100 with the code stream obtained by the 2K re-encoding unit 103, and the code from which noise has been removed at the 2K resolution. A stream is generated and output to the outside of the image processing apparatus 100.

つまり、2Kコードストリーム置換部104は、図3Dに示されるように、図3Aに示されるコードストリーム150Aの2KS151Aを、2K再エンコード部103より供給された、ノイズが除去された解像度2Kの画像をJPEG2000方式で符号化して得られたコードストリームである2KS151Dに置換し、解像度2Kにおいてノイズが除去されたコードストリーム150Bを生成し、出力する。   That is, as shown in FIG. 3D, the 2K code stream replacement unit 104 converts the 2KS 151A of the code stream 150A shown in FIG. 3A into an image with a resolution of 2K from which noise has been removed, supplied from the 2K re-encoding unit 103. A code stream 150B from which noise has been removed at a resolution of 2K is generated and output by replacing with 2KS151D which is a code stream obtained by encoding with the JPEG2000 system.

このような、ノイズ成分をフレーム画像より除去する画像処理の流れの例を、図4のフローチャートを参照して説明する。   An example of the flow of image processing for removing such noise components from the frame image will be described with reference to the flowchart of FIG.

画像処理が開始されると、ステップS101において、2Kスケーラブルデコード部101は、入力されたコードストリームより、2K解像度のコードストリームを抽出し、復号する。ステップS102において、ノイズ除去部102は、2K解像度のベースバンドデータでノイズ成分を除去する編集処理を行う。ステップS103において、2K再エンコード部103は、ノイズ成分が除去された2K解像度のベースバンドデータを、JPEG2000方式により、スケーラブルに再符号化し、2KS151Aと同様に符号化された2KS151Dを生成する。ステップS104において、2Kコードストリーム置換部104は、画像処理装置100に入力されたコードストリームの、2K解像度のコードストリームを、ノイズ成分を除去したものと置き換え、解像度2Kにおいてノイズ成分が除去されたコードストリーム150Bを出力し、画像処理を終了する。   When image processing is started, in step S101, the 2K scalable decoding unit 101 extracts a 2K resolution code stream from the input code stream and decodes it. In step S102, the noise removing unit 102 performs an editing process for removing noise components with 2K resolution baseband data. In step S103, the 2K re-encoding unit 103 re-encodes 2K resolution baseband data from which noise components have been removed, in a scalable manner using the JPEG2000 method, and generates 2KS 151D encoded in the same manner as 2KS 151A. In step S104, the 2K code stream replacement unit 104 replaces the 2K resolution code stream of the code stream input to the image processing apparatus 100 with one from which the noise component has been removed, and the code from which the noise component has been removed at the resolution 2K. The stream 150B is output and the image processing ends.

なお、この画像処理は、画像処理装置100に入力される画像データの各フレーム画像について行われる。   This image processing is performed for each frame image of the image data input to the image processing apparatus 100.

以上のように、画像処理装置100は、フレーム画像の本来の解像度4Kよりも低い解像度2Kでノイズ成分を除去する編集処理を行う。これにより、画像処理装置100は、コードストリームを解像度4Kで復号し、ノイズ成分を除去し、再エンコードする場合と比べて、この編集処理に伴う、コードストリームの復号、ノイズ成分の除去、およびベースバンドデータの再符号化等の各処理の負荷、処理時間、およびデータ保持に必要なメモリ容量等を低減させることができる。つまり、画像処理装置100は、解像度4Kで編集処理を行う場合よりも、より容易に編集処理を行うことができる。   As described above, the image processing apparatus 100 performs editing processing for removing noise components at a resolution 2K lower than the original resolution 4K of the frame image. As a result, the image processing apparatus 100 decodes the code stream with a resolution of 4K, removes the noise component, and re-encodes the code stream, removes the noise component, and performs the base associated with the editing process. It is possible to reduce the load of each process such as re-encoding of band data, the processing time, and the memory capacity necessary for data retention. That is, the image processing apparatus 100 can perform editing processing more easily than when editing processing is performed at a resolution of 4K.

以上においては、解像度2Kにおいてノイズ成分を除去するように説明したが、さらに、解像度4Kに含まれるノイズ成分も除去するようにしてもよい。   In the above description, the noise component is removed at the resolution 2K. However, the noise component included in the resolution 4K may also be removed.

図5は、本発明を適用した画像処理装置の他の構成例を示すブロック図である。図5に示される画像処理装置200は、図2の画像処理装置100と同様に、画像データの各フレーム画像よりノイズを除去する装置である。ただし、解像度4Kで作成されたフレーム画像に含まれるノイズ成分(フィルムの埃や傷等の画像)は、一般的に、フレーム画像が解像度4Kでウェーブレット変換されたときの各高周波成分のサブバンドにも含まれる。そこで、画像処理装置200は、さらに、その解像度4Kの各高周波成分のサブバンドに含まれるノイズ成分も除去する。その際、画像処理装置200は、解像度2Kの画像においてノイズ検出を行って編集領域を設定し、その編集領域のみ解像度4K相当のベースバンドの画像を復元し、ノイズ成分の除去を行うようにする。   FIG. 5 is a block diagram showing another configuration example of the image processing apparatus to which the present invention is applied. An image processing apparatus 200 shown in FIG. 5 is an apparatus that removes noise from each frame image of image data, similarly to the image processing apparatus 100 of FIG. However, noise components (images such as film dust and scratches) included in a frame image created at a resolution of 4K are generally subbands of each high-frequency component when the frame image is wavelet transformed at a resolution of 4K. Is also included. Therefore, the image processing apparatus 200 further removes noise components included in the subbands of the respective high frequency components having a resolution of 4K. At this time, the image processing apparatus 200 performs noise detection on the image of resolution 2K to set an editing area, restores a baseband image corresponding to resolution 4K only in the editing area, and removes noise components. .

画像処理装置200は、図5に示されるように、編集領域設定部201、部分ベースバンドデータ作成部202、ノイズ除去部203、部分コードストリーム作成部204、およびコードストリーム置換部205を有する。   As illustrated in FIG. 5, the image processing apparatus 200 includes an editing area setting unit 201, a partial baseband data creation unit 202, a noise removal unit 203, a partial code stream creation unit 204, and a code stream replacement unit 205.

編集領域設定部201は、画像処理装置100の場合と同様に、解像度2Kのベースバンドデータを生成し、そのベースバンドデータにおいて、ノイズ成分の検出を行い、検出したノイズ成分を含むように編集領域の設定を行う。編集領域設定部201は、2Kスケーラブルデコード部211および編集領域特定部212を有する。   As in the case of the image processing apparatus 100, the editing area setting unit 201 generates baseband data with a resolution of 2K, detects a noise component in the baseband data, and edits the editing area so as to include the detected noise component. Set up. The editing area setting unit 201 includes a 2K scalable decoding unit 211 and an editing area specifying unit 212.

図6Aに示されるように、画像処理装置200に入力されるコードストリーム250Aは、解像度4Kのフレーム画像をJPEG2000方式で符号化したものであり、その解像度4Kのフレーム画像を垂直方向および水平方向にそれぞれ1回ずつウェーブレット変換して得られる、水平方向および垂直方向に低周波成分のサブバンド(2K(4KLL))が符号化された部分コードストリームである2KS251A、水平方向に高周波成分であり、かつ、垂直方向に低周波成分のサブバンド(4KHL)が符号化された部分コードストリームである4KSHL252A、水平方向に低周波成分であり、かつ、垂直方向に高周波成分のサブバンド(4KLH)が符号化された部分コードストリームである4KSLH253A、並びに、水平方向および垂直方向に高周波成分のサブバンド(4KHH)が符号化された部分コードストリームである4KSHH254Aにより構成される。   As shown in FIG. 6A, a code stream 250A input to the image processing apparatus 200 is obtained by encoding a 4K resolution frame image in the JPEG2000 system, and the 4K resolution frame image in the vertical and horizontal directions. 2KS251A, which is a partial code stream in which a subband (2K (4KLL)) of a low frequency component is encoded in the horizontal direction and the vertical direction, each obtained by performing wavelet transform once, is a high frequency component in the horizontal direction, and 4KSHL252A, which is a partial code stream in which a low-frequency component subband (4KHL) is encoded in the vertical direction, a low-frequency component in the horizontal direction, and a high-frequency component subband (4KLH) in the vertical direction is encoded Partial code stream 4KSLH253A and high-frequency component subbands (4KHH) in the horizontal and vertical directions Constituted by 4KSHH254A is encoded partial code stream.

一般的には、ウェーブレット変換は再帰的に繰り返されるので、2KS251Aは、さらに複数のサブバンドに分離されて符号化されている。   In general, since wavelet transform is recursively repeated, 2KS 251A is further separated into a plurality of subbands and encoded.

2Kスケーラブルデコード部211は、図2の2Kスケーラブルデコード部101と同様に、画像処理装置200に入力されたコードストリーム250Aより2KS251Aを抽出して復号し、逆ウェーブレット変換を行って、図6Bに示されるように、解像度2Kのフレーム画像のベースバンドデータである2KBB251B(すなわち、解像度4Kのウェーブレット変換により得られる低周波成分のサブバンド)を生成する。   Similar to the 2K scalable decoding unit 101 in FIG. 2, the 2K scalable decoding unit 211 extracts and decodes 2KS 251A from the code stream 250A input to the image processing apparatus 200, performs inverse wavelet transform, and performs the process shown in FIG. 6B. As described above, 2 KBB 251 B (that is, a low-frequency component subband obtained by wavelet transform with a resolution of 4K) that is baseband data of a frame image with a resolution of 2K is generated.

編集領域特定部212は、その解像度2Kのフレーム画像のベースバンドデータにおいて、例えば、エッジ検出や前後のフレーム画像との対比等の所定の処理により、ノイズ成分の検出を行い、その検出したノイズ成分を含むように編集領域を設定する。図6Bは、2KBB251Bの部分画像255Aが編集領域に設定されている例を示している。   The edit area specifying unit 212 detects a noise component in the baseband data of the frame image with the resolution of 2K, for example, by a predetermined process such as edge detection or comparison with the previous and next frame images, and the detected noise component Set the edit area to include FIG. 6B shows an example in which a partial image 255A of 2 KBB 251B is set in the editing area.

部分ベースバンドデータ作成部202は、編集領域設定部201において設定された編集領域の画像のベースバンドデータ(部分ベースバンドデータ)を、解像度4Kのフレーム画像において作成する。部分ベースバンドデータ作成部202は、2K編集領域抽出部221、4K編集領域抽出部222、デコード部223、およびIDWT(Inverse Discrete Wavelet Transform)部224を有する。   The partial baseband data creation unit 202 creates baseband data (partial baseband data) of an image in the editing area set by the editing area setting unit 201 in a frame image with a resolution of 4K. The partial baseband data creation unit 202 includes a 2K editing region extraction unit 221, a 4K editing region extraction unit 222, a decoding unit 223, and an IDWT (Inverse Discrete Wavelet Transform) unit 224.

2K編集領域抽出部221は、編集領域特定部212より取得された、編集領域を示す座標情報に基づいて、2Kスケーラブルデコード部211において生成された解像度2Kのフレーム画像のベースバンドデータより、編集領域のデータを抽出する。   Based on the coordinate information indicating the editing area acquired from the editing area specifying unit 212, the 2K editing area extracting unit 221 uses the editing area based on the baseband data of the 2K resolution frame image generated by the 2K scalable decoding unit 211. Extract the data.

なお、以下において、解像度2Kのフレーム画像のベースバンドデータ(解像度4Kのウェーブレット変換により得られる低周波成分のサブバンド)より抽出された部分ベースバンドデータを解像度2Kの部分ベースバンドデータと称し、その部分ベースバンドデータのコードストリームを解像度2Kの部分コードストリームと称する。   In the following, partial baseband data extracted from baseband data of a frame image with a resolution of 2K (a subband of a low-frequency component obtained by wavelet transform with a resolution of 4K) is referred to as partial baseband data with a resolution of 2K. A code stream of partial baseband data is referred to as a partial code stream having a resolution of 2K.

4K編集領域抽出部222は、編集領域特定部212より取得された、編集領域を示す座標情報に基づいて、画像処理装置200に入力されたコードストリームに含まれる解像度4Kの高周波成分の各サブバンドのコードストリームより、編集領域のデータを抽出する。このとき、4K編集領域抽出部222は、符号化や復号の処理単位であるコードブロック単位でデータ抽出を行う。つまり、4K編集領域抽出部222は、編集領域を含むコードブロックのデータを抽出する。各コードブロックの符号列の長さは、パケットヘッダに記載されているため、4K編集領域抽出部222は、パケットヘッダを解析することで、コードブロック単位の符号列へのアクセスが可能である。   Based on the coordinate information indicating the editing area acquired from the editing area specifying unit 212, the 4K editing area extracting unit 222 uses each subband of the high-frequency component with resolution 4K included in the code stream input to the image processing device 200. Edit area data is extracted from the code stream. At this time, the 4K editing area extraction unit 222 performs data extraction in units of code blocks that are units of encoding and decoding. That is, the 4K editing area extraction unit 222 extracts code block data including the editing area. Since the length of the code string of each code block is described in the packet header, the 4K editing area extraction unit 222 can access the code string in code block units by analyzing the packet header.

また、このとき、4K編集領域抽出部222は、ウェーブレット変換の画像境界のオーバーラップを考慮し、例えば図7に示されるように、編集領域より抽出範囲を広げるようにしてもよい。図7の例の場合、4K編集領域抽出部222は、編集領域271を含むコードブロック272−1乃至コードブロック272−8とともに、その周囲のコードブロック273−1乃至コードブロック273−12のうち、そのサブバンドに対応する方向に隣接するコードブロック(すなわち、そのサブバンドにおいて、ウェーブレット変換の際にコードブロック272−1乃至コードブロック272−8のいずれかに影響を与えるコードブロック)も適宜抽出する。なお、その場合、2K編集領域抽出部221においても、4K編集領域抽出部222に合わせて抽出範囲を広げる。もちろん、この抽出範囲の拡大は任意の大きさで行うことができ、4K編集領域抽出部222が、周囲2コードブロック以上の範囲に拡大するようにしてもよい。   At this time, the 4K editing area extraction unit 222 may take into account the overlap of the image boundary of the wavelet transform, and may expand the extraction range from the editing area, for example, as shown in FIG. In the case of the example in FIG. 7, the 4K editing area extracting unit 222 includes the code block 272-1 to code block 272-8 including the editing area 271 and the surrounding code blocks 273-1 to 273-12. A code block adjacent in the direction corresponding to the subband (that is, a code block that affects any of the code blocks 272-1 to 272-8 in the wavelet transform in the subband) is also extracted as appropriate. . In this case, the 2K editing area extraction unit 221 also expands the extraction range according to the 4K editing area extraction unit 222. Of course, this extraction range can be expanded to an arbitrary size, and the 4K editing area extraction unit 222 may be expanded to a range of two or more surrounding code blocks.

以下において、解像度4Kのフレーム画像の部分画像のベースバンドデータを解像度4Kの部分ベースバンドデータと称し、その部分ベースバンドデータのコードストリームを解像度4Kの部分コードストリームと称する。   Hereinafter, the baseband data of a partial image of a frame image with a resolution of 4K is referred to as partial baseband data with a resolution of 4K, and the code stream of the partial baseband data is referred to as a partial codestream of a resolution of 4K.

また、以下において、解像度4Kのフレーム画像のウェーブレット変換により得られる高周波成分の各サブバンドより抽出された部分ベースバンドデータを解像度4Kのサブバンドの部分ベースバンドデータと称し、その部分ベースバンドデータのコードストリームを解像度4Kのサブバンドの部分コードストリームと称する。   In the following, partial baseband data extracted from each subband of a high-frequency component obtained by wavelet transform of a frame image with a resolution of 4K is referred to as partial baseband data of a subband with a resolution of 4K. The code stream is referred to as a subband partial code stream having a resolution of 4K.

デコード部223は、4K編集領域抽出部222において抽出された解像度4Kのサブバンドの部分コードストリームをそれぞれ復号する。   The decoding unit 223 decodes the 4K resolution subband partial code streams extracted by the 4K editing region extraction unit 222, respectively.

つまり、図6Cに示されるように、2K編集領域抽出部221は、2KBB251Bより部分画像255Aのデータ(ウェーブレット係数)を抽出する。また、図6Cに示されるように、4K編集領域抽出部222は、4KSHL252Aから、部分画像255Aと空間的に対応する部分コードストリームをコードブロック単位で抽出し、デコード部223は、そのコードストリームを復号し、部分ウェーブレット係数256Aを得る。同様に、図6Cに示されるように、4K編集領域抽出部222およびデコード部223により、4KSLH253Aから部分画像255Aと空間的に対応する部分コードストリームがコードブロック単位で抽出されて復号され部分ウェーブレット係数257Aが得られ、4KSHH254Aから部分画像255Aと空間的に対応する部分コードストリームがコードブロック単位で抽出されて復号され部分ウェーブレット係数258Aが得られる。   That is, as illustrated in FIG. 6C, the 2K editing area extraction unit 221 extracts the data (wavelet coefficient) of the partial image 255A from 2KBB 251B. 6C, the 4K editing area extraction unit 222 extracts a partial code stream spatially corresponding to the partial image 255A from the 4KSHL 252A in units of code blocks, and the decoding unit 223 extracts the code stream. The partial wavelet coefficient 256A is obtained by decoding. Similarly, as shown in FIG. 6C, the partial code stream spatially corresponding to the partial image 255A is extracted from the 4KSLH 253A by the 4K editing region extraction unit 222 and the decoding unit 223, and is decoded and decoded. 257A is obtained, and a partial code stream spatially corresponding to the partial image 255A is extracted from the 4KSHH 254A in units of code blocks and decoded to obtain a partial wavelet coefficient 258A.

IDWT部224は、それらの部分画像255A、並びに、部分ウェーブレット係数256A乃至部分ウェーブレット係数258A(部分ウェーブレット係数255A乃至部分ウェーブレット係数258A)を逆ウェーブレット変換し、編集領域の解像度4Kの部分ベースバンドデータ261A(図6D)を作成する。   The IDWT unit 224 performs inverse wavelet transform on the partial image 255A and the partial wavelet coefficient 256A to the partial wavelet coefficient 258A (partial wavelet coefficient 255A to partial wavelet coefficient 258A), and partial baseband data 261A having a resolution of 4K in the editing area. (FIG. 6D) is created.

ノイズ除去部203は、図2のノイズ除去部102と同様に、その部分ベースバンドデータ261Aより所定の方法でノイズ成分を除去する編集処理を行い、ノイズ成分が除去された部分ベースバンドデータ261B(図6E)を得る。   The noise removing unit 203 performs an editing process for removing a noise component from the partial baseband data 261A by a predetermined method in the same manner as the noise removing unit 102 in FIG. 2, and the partial baseband data 261B ( FIG. 6E) is obtained.

部分コードストリーム作成部204は、ノイズ成分を除去した解像度4Kの部分ベースバンドデータをJPEG2000方式で符号化し、解像度4Kの部分コードストリームを作成する。部分コードストリーム作成部204は、4KDWT部231、4K再エンコード部232、2Kベースバンド置換部233、および2K再エンコード部234を有する。   The partial code stream creation unit 204 encodes the partial baseband data with a resolution of 4K from which the noise component has been removed by the JPEG2000 system, and creates a partial code stream with a resolution of 4K. The partial code stream creation unit 204 includes a 4KDWT unit 231, a 4K re-encoding unit 232, a 2K baseband replacement unit 233, and a 2K re-encoding unit 234.

4KDWT(4K Discrete Wavelet Transform)部231は、ノイズ除去部203において生成されたノイズ成分が除去された、解像度4Kの部分ベースバンドデータ261Bを垂直方向および水平方向に1回ずつウェーブレット変換する。4K再エンコード部232は、そのウェーブレット変換により得られる高周波成分のサブバンドをそれぞれ再符号化する。つまり、4K再エンコード部232は、図6Fに示される解像度4Kのサブバンドの、部分コードストリーム256B、部分コードストリーム257B、および部分コードストリーム258Bを生成する。   A 4KDWT (4K Discrete Wavelet Transform) unit 231 performs wavelet transform on the partial baseband data 261B having a resolution of 4K, from which the noise component generated by the noise removing unit 203 has been removed, once in the vertical and horizontal directions. The 4K re-encoding unit 232 re-encodes each of the high-frequency component subbands obtained by the wavelet transform. That is, the 4K re-encoding unit 232 generates the partial code stream 256B, the partial code stream 257B, and the partial code stream 258B of the 4K resolution subband illustrated in FIG. 6F.

なお、4K再エンコード部232は、符号化の際のコードブロックの分割を、元の解像度4Kのフレーム画像のコードストリームと同じ位置で行う。また、ウェーブレット変換のオーバーラップのためにデコードしたコードブロックは、編集領域に含まれておらず、データがノイズ除去前後で変わっていないため、改めて符号化する必要はない。また、不可逆符号化でレート制御が必要な場合、4K再エンコード部232は、コードブロックに含むコーディングパス数を、画像処理装置200に入力されたコードストリームのコードブロックと同じにする。画像処理装置200に入力されたコードストリームのコードブロックに含まれるコーディングパス数は、そのコードストリームのパケットヘッダから取得することができる。   The 4K re-encoding unit 232 divides the code block at the time of encoding at the same position as the code stream of the original 4K frame image. In addition, the code block decoded for the overlap of the wavelet transform is not included in the editing area, and the data does not change before and after the noise removal, so that it is not necessary to encode again. When rate control is necessary for lossy encoding, the 4K re-encoding unit 232 sets the number of coding passes included in the code block to be the same as the code block of the code stream input to the image processing apparatus 200. The number of coding passes included in the code block of the code stream input to the image processing apparatus 200 can be obtained from the packet header of the code stream.

2Kベースバンド置換部233は、2Kスケーラブルデコード部211において生成された解像度2Kのベースバンドデータ251B(図6B)の編集領域の部分画像255Aのデータを、4KDWT部231において得られた垂直方向および水平方向に低周波成分のウェーブレット係数255B(図6F)に置換する。2K再エンコード部234は、その解像度2Kのフレーム画像のベースバンドデータをJPEG2000方式で再符号化(画像処理装置200に入力されるコードストリームの場合と同様の構成となるように、さらに再帰的にウェーブレット変換し、得られた係数を所定の方式で符号化)し、ノイズ成分が除去された解像度2Kのフレーム画像のコードストリーム251C(図6F)を生成する。このとき、不可逆符号化でレート制御が必要な場合は、2K再エンコード部234は、4K再エンコード部232の場合と同様に、画像処理装置200に入力されたコードストリームのパケットヘッダのコーディングパス数を参照し、値を合わせる。   The 2K baseband replacement unit 233 uses the vertical and horizontal data obtained in the 4KDWT unit 231 as the data of the partial image 255A in the editing area of the baseband data 251B (FIG. 6B) with the resolution of 2K generated by the 2K scalable decoding unit 211. Replace with wavelet coefficients 255B (FIG. 6F) of low frequency components in the direction. The 2K re-encoding unit 234 re-encodes the baseband data of the 2K resolution frame image using the JPEG2000 method (recursively so as to have the same configuration as the code stream input to the image processing apparatus 200). Wavelet transform is performed, and the obtained coefficients are encoded by a predetermined method), and a code stream 251C (FIG. 6F) of a 2K resolution frame image from which noise components are removed is generated. At this time, if rate control is necessary for irreversible encoding, the 2K re-encoding unit 234 performs the number of coding passes in the packet header of the code stream input to the image processing apparatus 200 as in the case of the 4K re-encoding unit 232. Refer to and adjust the values.

コードストリーム置換部205は、画像処理装置200に入力されたコードストリーム250Aの、解像度2Kのフレーム画像のコードストリーム251Aを、2K再エンコード部234において生成されたコードストリーム251Cに置き換える。また、コードストリーム置換部205は、コードストリーム250Aの4KSHL252Aの編集領域の部分コードストリームを部分コードストリーム256Bに置き換える。さらに、コードストリーム置換部205は、コードストリーム250Aの4KSLH253Aの編集領域の部分コードストリームを部分コードストリーム257Bに置き換える。また、コードストリーム置換部205は、コードストリーム250Aの4KSHH254Aの編集領域の部分コードストリームを部分コードストリーム258Bに置き換える。つまり、コードストリーム置換部205は、図6Gに示されるような、ノイズ成分が除去されたコードストリーム250Bを生成し、画像処理装置200の外部に出力する。   The code stream replacement unit 205 replaces the code stream 251A of the 2K resolution frame image of the code stream 250A input to the image processing apparatus 200 with the code stream 251C generated by the 2K re-encoding unit 234. Further, the code stream replacement unit 205 replaces the partial code stream in the edit area of 4KSHL 252A of the code stream 250A with the partial code stream 256B. Further, the code stream replacement unit 205 replaces the partial code stream in the edit area of 4KSLH 253A of the code stream 250A with the partial code stream 257B. Further, the code stream replacement unit 205 replaces the partial code stream in the edit area of 4KSHH 254A of the code stream 250A with the partial code stream 258B. That is, the code stream replacement unit 205 generates a code stream 250B from which noise components are removed as illustrated in FIG. 6G and outputs the code stream 250B to the outside of the image processing apparatus 200.

なお、このとき、コードストリームの、置き換えられた部分は、各コードブロックの符号長やゼロビットプレーン数が変化する場合がある。つまり、置き換えられる前と後でこれらの情報が変化する場合がある。その場合、コードストリーム置換部205は、その置き換えられた部分のパケットヘッダ内の符号長やゼロビットプレーン数の情報もあわせて書き換える。   At this time, in the replaced portion of the code stream, the code length of each code block and the number of zero bit planes may change. That is, the information may change before and after the replacement. In that case, the code stream replacement unit 205 also rewrites the information of the code length and the number of zero bit planes in the packet header of the replaced part.

なお、ここで、ゼロビットプレーン数とは、全ての係数ビットの値が0であるビットプレーンが最上位ビット(MSB:Most Significant Bit)側に幾つあるかを表したものである。ウェーブレット変換により得られたウェーブレット係数は、コードブロック毎に符号化されるが、この符号化の際に、そのコードブロックの各係数は、1ビット毎、つまり位毎に分割されて、各位毎にビットプレーンとしてまとめられる。つまり、ビットプレーンは、あるコードブロックの各係数の互いに同一の位のビット(係数ビット)の集合である。このように各係数の各位に形成されるビットプレーンにおいて、その位より上位の全ての係数ビットの値が0であるビットプレーンを、特にゼロビットプレーンと称する。つまり、ゼロビットプレーン数とは、このようなゼロビットプレーンが、係数の最上位ビットから連続する数を示す。   Here, the number of zero bit planes represents the number of bit planes in which all coefficient bit values are 0 on the most significant bit (MSB) side. The wavelet coefficient obtained by the wavelet transform is encoded for each code block. At the time of encoding, each coefficient of the code block is divided for each bit, that is, for each position, and for each position. Grouped as a bit plane. That is, the bit plane is a set of bits (coefficient bits) at the same position of each coefficient of a certain code block. In this way, in the bit plane formed at each position of each coefficient, a bit plane in which the values of all coefficient bits higher than that position are 0 is specifically referred to as a zero bit plane. That is, the number of zero bit planes indicates the number of such zero bit planes continuing from the most significant bit of the coefficient.

置き換えられたコードブロックでは、置き換える前と後で各係数の値が変化することにより、値が1の、最も上位のビットの位が変化する可能性がある。つまり、置き換えによって、そのコードブロックのゼロビットプレーン数が変化する可能性がある。このゼロビットプレーン数の情報は、コードストリームのパケットヘッダ内に記述されるので、少なくともこのようにゼロビットプレーン数が変化した場合は、コードストリームのパケットヘッダ内の情報も更新させる必要がある。もちろん、ゼロビットプレーン数の変化の有無に関わらず、置き換えが行われたコードブロックについてはゼロビットプレーン数を算出し、パケットヘッダの情報を更新させるようにしてもよい。   In the replaced code block, the value of each coefficient may change before and after the replacement, so that the position of the most significant bit having a value of 1 may change. That is, the number of zero bit planes of the code block may change due to the replacement. Since the information on the number of zero bit planes is described in the packet header of the code stream, it is necessary to update the information in the packet header of the code stream at least when the number of zero bit planes changes in this way. Of course, regardless of whether or not the number of zero bit planes has changed, the number of zero bit planes may be calculated for the replaced code block, and the information in the packet header may be updated.

このような、ノイズ成分をフレーム画像より除去する画像処理の流れの例を、図8のフローチャートを参照して説明する。   An example of the flow of image processing for removing such noise components from the frame image will be described with reference to the flowchart of FIG.

画像処理が開始されると、ステップS201において、編集領域設定部201は、編集領域設定処理を行い、2K解像度で編集領域を設定する。ステップS202において、部分ベースバンドデータ作成部202は、部分ベースバンドデータ作成処理を行い、編集領域のベースバンドデータ(編集領域を含むコードブロックのベースバンドデータ)を作成する。ステップS203において、ノイズ除去部203は、作成された部分ベースバンドデータに対してノイズ成分を除去する編集処理を行う。ステップS204において、部分コードストリーム作成部204は、部分コードストリーム作成処理を行い、ノイズ成分を除去した部分ベースバンドデータをJPEG2000方式で符号化し、部分コードストリームを作成する。   When image processing is started, in step S201, the editing area setting unit 201 performs editing area setting processing and sets an editing area at 2K resolution. In step S202, the partial baseband data creation unit 202 performs partial baseband data creation processing to create baseband data in the editing area (baseband data of a code block including the editing area). In step S203, the noise removing unit 203 performs an editing process for removing noise components on the created partial baseband data. In step S204, the partial code stream creation unit 204 performs a partial code stream creation process, encodes the partial baseband data from which the noise component has been removed, using the JPEG2000 method, and creates a partial code stream.

ステップS205において、コードストリーム置換部205は、画像処理装置200に入力されたコードストリームの解像度4Kの各サブバンドについて、4K再エンコード部232より供給された部分コードストリームに対応する部分を特定し、その部分のコードストリーム(つまりノイズ成分を含むコードストリーム)を、4K再エンコード部232より供給された部分コードストリーム(つまりノイズ成分が除去されたコードストリーム)に置換する。また、ステップS206において、コードストリーム置換部205は、画像処理装置200に入力されたコードストリームの解像度2K以下の各サブバンドのコードストリーム(つまりノイズ成分を含むコードストリーム)を、2K再エンコード部234より供給されたコードストリーム(つまりノイズ成分が除去されたコードストリーム)に置換する。さらに、コードストリーム置換部205は、ステップS207において、置換したコードブロックを含むパケットのヘッダ内の、符号長およびゼロビットプレーン数に関する情報を更新する。   In step S205, the code stream replacement unit 205 identifies a portion corresponding to the partial code stream supplied from the 4K re-encoding unit 232 for each subband having a resolution of 4K of the code stream input to the image processing apparatus 200. The partial code stream (that is, the code stream including the noise component) is replaced with the partial code stream (that is, the code stream from which the noise component is removed) supplied from the 4K re-encoding unit 232. In step S <b> 206, the code stream replacement unit 205 converts the code stream of each subband with a resolution of 2K or less (that is, a code stream including a noise component) of the code stream input to the image processing apparatus 200 into the 2K re-encoding unit 234. It replaces with the code stream supplied more (that is, the code stream from which the noise component is removed). Further, in step S207, the code stream replacement unit 205 updates information regarding the code length and the number of zero bit planes in the header of the packet including the replaced code block.

ステップS207の処理が終了すると、画像処理が終了される。なお、この画像処理は、画像処理装置200に入力される画像データの各フレーム画像について行われる。   When the process of step S207 ends, the image processing ends. This image processing is performed for each frame image of the image data input to the image processing apparatus 200.

次に、図9のフローチャートを参照して、図8のステップS201において実行される編集領域設定処理の流れの例を説明する。   Next, an example of the flow of the edit area setting process executed in step S201 in FIG. 8 will be described with reference to the flowchart in FIG.

編集領域設定処理が開始されるとステップS211において、2Kスケーラブルデコード部211は、解像度2Kのコードストリームを復号し、逆ウェーブレット変換を行い、解像度2Kのフレーム画像のベースバンドデータを得る。編集領域特定部212は、ステップS212において、解像度2Kのフレーム画像のベースバンドデータでノイズを検出し、ステップS213において、そのノイズ検出結果に基づいて、編集領域を特定し、その座標情報を2K編集領域抽出部221および4K編集領域抽出部222に供給する。ステップS213の処理が終了すると、編集領域設定処理は終了され、図8のステップS201に処理が戻され、ステップS202以降の処理が実行される。   When the editing area setting process is started, in step S211, the 2K scalable decoding unit 211 decodes the 2K resolution code stream, performs inverse wavelet transform, and obtains baseband data of the 2K resolution frame image. In step S212, the edit area specifying unit 212 detects noise from the baseband data of the frame image having a resolution of 2K. In step S213, the edit area specifying unit 212 specifies an edit area based on the noise detection result, and the coordinate information is 2K edited. This is supplied to the area extraction unit 221 and the 4K editing area extraction unit 222. When the process of step S213 ends, the editing area setting process ends, the process returns to step S201 in FIG. 8, and the processes after step S202 are executed.

次に、図10のフローチャートを参照して、図8のステップS202において実行される部分ベースバンドデータ作成処理の流れの例を説明する。   Next, an example of the flow of partial baseband data creation processing executed in step S202 of FIG. 8 will be described with reference to the flowchart of FIG.

部分ベースバンドデータ作成処理が開始されると、ステップS221において、2K編集領域抽出部221は、解像度2Kのフレーム画像のベースバンドデータから、編集領域を含むコードブロックのデータ(解像度2Kの部分ベースバンドデータ)を抽出する。ステップS222において、4K編集領域抽出部222は、解像度4Kのフレーム画像のコードストリームから、編集領域を含むコードブロックのデータ(解像度4Kのサブバンドの部分コードストリーム)を抽出する。ステップS223において、デコード部223は、ステップS222の処理において抽出された解像度4Kのサブバンドの部分コードストリームを復号する。ステップS224において、IDWT部224は、ステップS221の処理により抽出された解像度2Kの部分ベースバンドデータ、および、ステップS223の処理により復号されて得られた解像度4Kのサブバンドの部分ベースバンドデータを用いて逆ウェーブレット変換し、解像度4Kの部分ベースバンドデータを生成する。ステップS224の処理が終了すると、部分ベースバンド作成処理は終了され、図8のステップS202に処理が戻され、ステップS203以降の処理が実行される。   When the partial baseband data creation processing is started, in step S221, the 2K editing area extraction unit 221 selects code block data (partial baseband with 2K resolution) including the editing area from the baseband data of the 2K resolution frame image. Data). In step S222, the 4K editing area extracting unit 222 extracts code block data (subband partial code stream of 4K resolution) including the editing area from the code stream of the 4K resolution frame image. In step S223, the decoding unit 223 decodes the subcode partial code stream of resolution 4K extracted in the process of step S222. In step S224, the IDWT unit 224 uses the partial baseband data of resolution 2K extracted by the processing of step S221 and the partial baseband data of subband of resolution 4K obtained by decoding by the processing of step S223. And inverse wavelet transform to generate partial baseband data with a resolution of 4K. When the process of step S224 ends, the partial baseband creation process ends, the process returns to step S202 of FIG. 8, and the processes after step S203 are executed.

次に、図11のフローチャートを参照して、図8のステップS204において実行される部分コードストリーム作成処理の流れの例を説明する。   Next, an example of the flow of the partial code stream creation process executed in step S204 of FIG. 8 will be described with reference to the flowchart of FIG.

部分コードストリーム作成処理が開始されると、ステップS231において、4KDWT部231は、ノイズ成分が除去された、解像度4Kの部分ベースバンドデータを垂直方向および水平方向に1回ずつウェーブレット変換する。ステップS232において、4K再エンコード部232は、ステップS231の処理により生成された解像度4Kのサブバンドの部分ベースバンドデータを符号化する。ステップS233において、2Kベースバンド置換部233は、2Kスケーラブルデコード部211において得られた解像度2Kのフレーム画像のベースバンドデータの、編集領域の部分ベースバンドデータを、ステップS231の処理により得られた解像度2Kの部分ベースバンドデータ(ノイズ成分が除去されたベースバンドデータ)に置換する。ステップS234において、2K再エンコード部234は、ステップS233において置換が行われた解像度2Kのフレーム画像のベースバンドデータを符号化する。ステップS234の処理が終了すると、部分コードストリーム作成処理は終了され、図8のステップS204に処理が戻され、ステップS205以降の処理が実行される。   When the partial code stream creation processing is started, in step S231, the 4KDWT unit 231 performs wavelet transform on the partial baseband data with a resolution of 4K from which noise components have been removed once in the vertical direction and in the horizontal direction. In step S232, the 4K re-encoding unit 232 encodes the partial baseband data of the 4K resolution subband generated by the process of step S231. In step S233, the 2K baseband replacement unit 233 obtains the partial baseband data in the editing area of the baseband data of the frame image having the resolution of 2K obtained in the 2K scalable decoding unit 211 by using the resolution obtained by the processing in step S231. Replacement with 2K partial baseband data (baseband data from which noise components have been removed). In step S234, the 2K re-encoding unit 234 encodes the baseband data of the frame image with the resolution of 2K that has been replaced in step S233. When the process of step S234 ends, the partial code stream creation process ends, the process returns to step S204 in FIG. 8, and the processes after step S205 are executed.

以上のように、画像処理装置200は、ノイズ成分の検出を、本来の解像度4Kよりも低い解像度2Kで行い、ノイズ成分を含む部分のみ解像度4Kで復号し、編集処理を行う。これにより、画像処理装置200は、フレーム画像全体のコードストリームを解像度4Kで復号し、ノイズ成分を除去し、再エンコードする場合と比べて、この編集処理に伴う、コードストリームの復号、ノイズ成分の除去、およびベースバンドデータの再符号化等の各処理の負荷、処理時間、およびデータ保持に必要なメモリ容量等を低減させることができる。つまり、画像処理装置200は、フレーム画像全体を解像度4Kで復号し、編集処理を行う場合よりも、より容易に編集処理を行うことができる。   As described above, the image processing apparatus 200 detects a noise component at a resolution 2K lower than the original resolution 4K, decodes only a portion including the noise component at a resolution 4K, and performs an editing process. As a result, the image processing apparatus 200 decodes the code stream of the entire frame image at a resolution of 4K, removes the noise component, and re-encodes the code stream associated with this editing process, compared with the case of re-encoding. It is possible to reduce the load of each process such as the removal and re-encoding of the baseband data, the processing time, the memory capacity necessary for data holding, and the like. That is, the image processing apparatus 200 can perform the editing process more easily than when the entire frame image is decoded at a resolution of 4K and the editing process is performed.

なお、以上においては、解像度2Kのサブバンド(2K)は全体を置換するように説明したが、これに限らず、解像度2Kのサブバンド(2K)についても、編集領域(編集領域を含むコードブロック)についてのみ置換するようにしてもよい。   In the above description, the subband (2K) having a resolution of 2K has been described as being replaced as a whole. However, the present invention is not limited to this. ) May only be replaced.

図12は、本発明を適用した画像処理装置の、さらに他の構成例を示すブロック図である。なお、図12において、図5と同様の処理を行うブロックについては同一の符号を付してある。図12に示される画像処理装置300は、図2の画像処理装置100と同様に、画像データの各フレーム画像よりノイズを除去する装置であり、図5の画像処理装置200と基本的に同様の構成を有し、同様の処理を行うが、画像処理装置200の部分コードストリーム作成部204およびコードストリーム置換部205のそれぞれの代わりに、部分コードストリーム作成部304およびコードストリーム置換部305を有する。   FIG. 12 is a block diagram showing still another configuration example of the image processing apparatus to which the present invention is applied. In FIG. 12, blocks that perform the same processing as in FIG. An image processing apparatus 300 shown in FIG. 12 is an apparatus that removes noise from each frame image of image data, like the image processing apparatus 100 of FIG. 2, and is basically the same as the image processing apparatus 200 of FIG. Although having the configuration and performing the same processing, a partial code stream creating unit 304 and a code stream replacing unit 305 are provided instead of the partial code stream creating unit 204 and the code stream replacing unit 205 of the image processing apparatus 200.

図5の部分コードストリーム作成部204が、ノイズが除去された解像度2Kのフレーム画像のコードストリームを生成するのに対して、部分コードストリーム作成部304は、解像度2Kの、編集領域を含むコードブロックの部分コードストリームを生成し、コードストリーム置換部305に供給する。   The partial code stream creation unit 204 in FIG. 5 generates a code stream of a frame image with a resolution of 2K from which noise has been removed, whereas the partial code stream creation unit 304 has a code block that includes an editing area with a resolution of 2K. Are generated and supplied to the code stream replacement unit 305.

部分コードストリーム作成部304は、4KDWT部231および4K再エンコード部232の他に2K再エンコード部334を有する。2K再エンコード部334は、4KDWT部231において解像度4Kの部分ベースバンドデータがウェーブレット変換されて得られた解像度2Kの部分ベースバンドデータを、画像処理装置300に入力されるコードストリームの場合と同様のサブバンド構成となるように、さらに再帰的にウェーブレット変換し、得られた係数を所定の方式で符号化し(JPEG2000方式で符号化し)、解像度2Kの部分コードストリームを作成する。つまり、部分コードストリーム作成部304は、解像度4Kの各サブバンドの部分コードストリームと解像度2Kの部分コードストリームをコードストリーム置換部305に供給する。   The partial code stream creation unit 304 includes a 2K re-encoding unit 334 in addition to the 4KDWT unit 231 and the 4K re-encoding unit 232. The 2K re-encoding unit 334 is similar to the case of the code stream input to the image processing apparatus 300, with the 4KDWT unit 231 performing partial waveband conversion on the partial baseband data having the resolution of 4K. The wavelet transform is further recursively performed so as to have a subband configuration, and the obtained coefficients are encoded by a predetermined method (encoded by the JPEG2000 method) to create a partial code stream having a resolution of 2K. That is, the partial code stream creation unit 304 supplies the code stream replacement unit 305 with a partial code stream of each subband having a resolution of 4K and a partial code stream having a resolution of 2K.

なお、2K再エンコード部334の詳細な構成および処理については後述する。   The detailed configuration and processing of the 2K re-encoding unit 334 will be described later.

コードストリーム置換部305は、画像処理装置300に入力されたコードストリームのノイズ成分を含む部分を、部分コードストリーム作成部304より供給された、ノイズ成分が除去された解像度4Kの各サブバンドの部分コードストリームと解像度2Kの部分コードストリームに置換し、画像処理装置300の外部に出力する。   The code stream replacement unit 305 supplies the part including the noise component of the code stream input to the image processing apparatus 300 to each subband of resolution 4K from which the noise component has been removed supplied from the partial code stream generation unit 304. The code stream is replaced with a partial code stream having a resolution of 2K, and is output to the outside of the image processing apparatus 300.

画像処理装置300に入力されるコードストリーム350Aは、図13Aに示されるように、解像度2Kのコードストリームである2KS351A、解像度4Kのサブバンドのコードストリームである4KSHL352A、4KSLH353A、および4KSHH354Aにより構成される。そして、図13Bに示されるように、2Kスケーラブルデコード部211によって解像度2Kのフレーム画像のベースバンドデータである2KBB351Bが作成され、編集領域特定部212によってノイズ成分を含む編集領域が設定される(図13Bの部分画像355A)。   As shown in FIG. 13A, the code stream 350A input to the image processing apparatus 300 includes 2KS351A that is a 2K resolution code stream, 4KSHL352A, 4KSLH353A, and 4KSHH354A that are 4K resolution subband codestreams. . Then, as shown in FIG. 13B, 2KBB 351B, which is baseband data of a 2K resolution frame image, is created by the 2K scalable decoding unit 211, and an editing region including a noise component is set by the editing region specifying unit 212 (FIG. 13B). 13B partial image 355A).

図13Cに示されるように、2K編集領域抽出部221により、解像度2Kの部分画像355Aが抽出され、4K編集領域抽出部222により、解像度2Kの部分画像355Aに空間的に対応する解像度4Kの各サブバンドの部分コードストリームが抽出されてデコード部223によりそれらが復号され、解像度4Kの各サブバンドの部分ウェーブレット係数356A、部分ウェーブレット係数357A、および部分ウェーブレット係数358Aが生成される。IDWT部224は、それらの部分ベースバンドデータを逆ウェーブレット変換し、解像度4Kの部分ベースバンドデータ361A(図13D)を生成する。   As shown in FIG. 13C, the 2K editing area extraction unit 221 extracts a partial image 355A with a resolution of 2K, and the 4K editing area extraction unit 222 extracts each of the 4K resolutions corresponding spatially to the partial image 355A with a resolution of 2K. The subband partial code streams are extracted and decoded by the decoding unit 223, and the partial wavelet coefficient 356A, the partial wavelet coefficient 357A, and the partial wavelet coefficient 358A of each subband having a resolution of 4K are generated. The IDWT unit 224 performs inverse wavelet transform on the partial baseband data to generate partial baseband data 361A (FIG. 13D) with a resolution of 4K.

ノイズ除去部203は、この解像度4Kの部分ベースバンドデータ361Aについてノイズ成分を除去する(図13Eの解像度4Kの部分ベースバンドデータ361B)。   The noise removing unit 203 removes a noise component from the partial baseband data 361A having a resolution of 4K (partial baseband data 361B having a resolution of 4K in FIG. 13E).

4KDWT部231は、この解像度4Kの部分ベースバンドデータ361Bを垂直方向および水平方向に1回ずつウェーブレット変換する。4K再エンコード部232は、そのウェーブレット変換により得られた解像度4Kの各サブバンドの部分ウェーブレット係数を符号化し、2K再エンコード部334は、そのウェーブレット変換により得られた解像度2Kの部分ベースバンドデータを、画像処理装置300に入力されるコードストリームの場合と同様のサブバンド構成となるように、JPEG2000方式で符号化する。これらの処理により、図13Fに示されるように、解像度2Kの部分コードストリーム355B、解像度4Kの部分コードストリーム356B、解像度4Kの部分コードストリーム357B、および、解像度4Kの部分コードストリーム358Bが生成される。なお、実際には、部分コードストリーム355Bは、ウェーブレット変換によりサブバンド毎に分割される。   The 4KDWT unit 231 performs wavelet transform on the partial baseband data 361B having a resolution of 4K once in the vertical direction and once in the horizontal direction. The 4K re-encoding unit 232 encodes the partial wavelet coefficients of each subband of 4K resolution obtained by the wavelet transformation, and the 2K re-encoding unit 334 obtains the partial baseband data of resolution 2K obtained by the wavelet transformation. Then, encoding is performed according to the JPEG2000 system so as to have the same subband configuration as that of the code stream input to the image processing apparatus 300. By these processes, as shown in FIG. 13F, a partial code stream 355B having a resolution of 2K, a partial code stream 356B having a resolution of 4K, a partial code stream 357B having a resolution of 4K, and a partial code stream 358B having a resolution of 4K are generated. . In practice, partial code stream 355B is divided into subbands by wavelet transform.

コードストリーム置換部305は、座標情報に基づいてこれらの部分コードストリームを、それぞれに空間的に対応する位置のコードストリームと置換し、図13Gに示されるように、ノイズを含む部分コードストリームが、ノイズが除去された部分コードストリームで置換されたコードストリーム350Bが生成されて出力される。   Based on the coordinate information, the code stream replacement unit 305 replaces these partial code streams with code streams at spatially corresponding positions, and as shown in FIG. A code stream 350B replaced with the partial code stream from which noise is removed is generated and output.

なお、コードストリーム置換部305は、必要に応じて、データを置換した部分のパケットヘッダに含まれる符号長やゼロビットプレーン数に関する情報を更新する。   Note that the code stream replacement unit 305 updates information regarding the code length and the number of zero bit planes included in the packet header of the data replaced part as necessary.

図14は、図12の2K再エンコード部334の詳細な構成例を示すブロック図である。図14に示されるように、2K再エンコード部334は、置換コードブロック特定部371、ベースバンド領域抽出部372、DWT(Discrete Wavelet Transform)部373、およびエンコード部374を有する。   FIG. 14 is a block diagram illustrating a detailed configuration example of the 2K re-encoding unit 334 in FIG. As illustrated in FIG. 14, the 2K re-encoding unit 334 includes a replacement code block specifying unit 371, a baseband region extracting unit 372, a DWT (Discrete Wavelet Transform) unit 373, and an encoding unit 374.

置換コードブロック特定部371は、4KDWT部231より供給された部分ベースバンドデータに基づいて、画像処理装置300に入力されるコードストリームの、置き換えの対象となる部分をコードブロック単位で特定する。   Based on the partial baseband data supplied from the 4KDWT unit 231, the replacement code block specifying unit 371 specifies the part to be replaced in the code stream input to the image processing apparatus 300 in units of code blocks.

例えば、図15Aに示される画像380が2Kスケーラブルデコード部211より出力された解像度2Kの画像であり、右上左下の斜線模様で示される領域381がノイズ除去等の画像処理が行われた部分とする。このような解像度2Kのベースバンドデータに対して、2K再エンコード部334は、ウェーブレット変換し、得られた係数をサブバンド毎にコードブロック単位で符号化する。   For example, an image 380 shown in FIG. 15A is a 2K resolution image output from the 2K scalable decoding unit 211, and an area 381 indicated by a hatched pattern in the upper right and lower left is a portion where image processing such as noise removal has been performed. . The 2K re-encoding unit 334 performs wavelet transform on such baseband data with a resolution of 2K, and encodes the obtained coefficients in units of code blocks for each subband.

領域381の部分ベースバンドデータをウェーブレット変換すると、例えば、図15Bの、右上左下の斜線模様で示される係数382−1乃至係数382−10のように、サブバンド毎のウェーブレット係数が得られるが、このサブバンド毎の係数の範囲がコードブロック単位より狭い場合、係数382−1乃至係数382−10の符号化に、その周囲の係数も必要になる。例えば、図15Bにおいて、右下左上の斜線模様で示されるコードブロック383−1乃至コードブロック383−4のように、最下位サブバンドにおいて、コードブロックが係数382−1乃至係数382−4より大きいとする。   When the partial baseband data in the region 381 is subjected to wavelet transform, for example, wavelet coefficients for each subband are obtained like coefficients 382-1 to 382-10 indicated by the hatched pattern in the upper right and lower left of FIG. When the range of the coefficients for each subband is narrower than the code block unit, the surrounding coefficients are also required for encoding the coefficients 382-1 to 382-10. For example, in FIG. 15B, the code block is larger than the coefficient 382-1 to the coefficient 382-4 in the lowermost subband, such as the code block 383-1 to the code block 383-4 indicated by the hatched pattern in the upper right and lower left. And

上述したように符号化および復号は、このコードブロック単位で行われるので、この場合、コードブロック383−1乃至コードブロック383−4の範囲に含まれる係数全てに、係数382−1乃至係数382−4の変化の影響が及ぶことになる。つまり、ベースバンドレベルにおいては、図15Aに示されるように、右下左上の斜線模様で示される領域384のデータに影響が及ぶことになる。   As described above, encoding and decoding are performed in units of this code block. In this case, all the coefficients included in the range of the code block 383-1 to the code block 383-4 are included in the coefficients 382-1 to 382. 4 changes will be affected. That is, at the baseband level, as shown in FIG. 15A, the data in the region 384 indicated by the hatched pattern at the upper right and lower left is affected.

つまり、領域381のデータを置換するためには、領域384のデータを全て置換する必要がある。このように、符号化・復号時の処理データ単位(コードブロック)の制限により、各サブバンドのコードストリームの置換処理にもそれぞれ処理データ単位の制限が発生する。   That is, in order to replace the data in the area 381, it is necessary to replace all the data in the area 384. As described above, due to the restriction of the processing data unit (code block) at the time of encoding / decoding, the restriction of the processing data unit also occurs in the replacement process of the code stream of each subband.

そこでまず、置換コードブロック特定部371は、各サブバンドにおいて、符号化により4KDWT部231より供給された部分ベースバンドデータ(図15の例の場合、領域381)をウェーブレット変換して得られる係数(図15Bの例の場合、係数382−1乃至係数382−10)の影響を受けるコードブロック(置換コードブロック)を特定する。   Therefore, first, the replacement code block specifying unit 371 performs coefficient (wavelet transform) on the partial baseband data (region 381 in the example of FIG. 15) supplied from the 4KDWT unit 231 by encoding in each subband. In the example of FIG. 15B, a code block (replacement code block) affected by the coefficients 382-1 to 382-10) is specified.

つまり、置換コードブロック特定部371は、最下位のサブバンドにおいて、4KDWT部231より供給された部分ベースバンドデータをウェーブレット変換して得られる係数を含むコードブロックを特定し、さらに、その最下位のコードブロックに対応するコードブロック(その最下位のコードブロックを用いて逆ウェーブレット変換されるコードブロック)を、上位の各サブバンドにおいて特定する。   That is, the replacement code block specifying unit 371 specifies a code block including a coefficient obtained by wavelet transforming the partial baseband data supplied from the 4KDWT unit 231 in the lowest subband, and further, the lowest code. A code block corresponding to the code block (a code block subjected to inverse wavelet transform using the lowest code block) is specified in each upper subband.

置換コードブロック特定部371は、その特定したコードブロックの情報をベースバンド領域抽出部372に供給する。ベースバンド領域抽出部372は、置換コードブロック特定部371より供給された置換コードブロックの情報に基づいて、2Kスケーラブルデコード部211より供給される解像度2Kのベースバンドデータの、その置換コードブロックに対応する領域を特定し、その領域のデータを抽出する。ベースバンド領域抽出部372は、抽出した解像度2Kの部分ベースバンドデータをDWT部373に供給する。DWT部373は、ベースバンド領域抽出部372より供給された解像度2Kの部分ベースバンドデータをウェーブレット変換し、得られた係数をエンコード部374に供給する。エンコード部374は、DWT部373より供給された係数データを符号化し、解像度2Kの部分コードストリームを生成し、それをコードストリーム置換部305(図12)に供給する。   The replacement code block specifying unit 371 supplies information of the specified code block to the baseband region extracting unit 372. The baseband region extraction unit 372 corresponds to the replacement code block of the baseband data of 2K resolution supplied from the 2K scalable decoding unit 211 based on the information of the replacement code block supplied from the replacement code block specifying unit 371. The area to be identified is specified, and the data of the area is extracted. The baseband region extraction unit 372 supplies the extracted partial baseband data with a resolution of 2K to the DWT unit 373. The DWT unit 373 performs wavelet transform on the partial baseband data with a resolution of 2K supplied from the baseband region extraction unit 372, and supplies the obtained coefficient to the encoding unit 374. The encoding unit 374 encodes the coefficient data supplied from the DWT unit 373, generates a partial code stream with a resolution of 2K, and supplies it to the code stream replacement unit 305 (FIG. 12).

以上のような、ノイズ成分をフレーム画像より除去する画像処理の流れの例を、図16のフローチャートを参照して説明する。   An example of the flow of image processing for removing noise components from the frame image as described above will be described with reference to the flowchart of FIG.

ステップS301乃至ステップS303の各処理は、図8のステップS201乃至ステップS203の各処理と同様に実行される。ステップS304において、部分コードストリーム作成部304は、部分コードストリーム作成処理を行い、ノイズ成分を除去した部分ベースバンドデータをJPEG2000方式で符号化し、部分コードストリームを作成する。   Each process of step S301 thru | or step S303 is performed similarly to each process of step S201 thru | or step S203 of FIG. In step S304, the partial code stream creation unit 304 performs a partial code stream creation process, encodes the partial baseband data from which noise components have been removed, using the JPEG2000 method, and creates a partial code stream.

ステップS305において、コードストリーム置換部305は、画像処理装置200に入力されたコードストリームの解像度4Kの各サブバンドについて、ステップS304の処理により生成された解像度4Kの各サブバンドの部分コードストリームに空間的に対応する部分を特定し、その部分(つまりノイズ成分を含むコードストリーム)を、ステップS304の処理により生成された解像度4Kの各サブバンドの部分コードストリーム(つまりノイズ成分が除去されたコードストリーム)に置換する。また、ステップS306において、コードストリーム置換部305は、画像処理装置200に入力されたコードストリームの解像度2K以下の各サブバンドについて、ステップS304の処理により生成された解像度2K以下の各サブバンドの部分コードストリームに空間的に対応する部分を特定し、その部分(つまりノイズ成分を含むコードストリーム)を、ステップS304の処理により生成された解像度2K以下の各サブバンドの部分コードストリーム(つまりノイズ成分が除去されたコードストリーム)に置換する。さらに、コードストリーム置換部305は、ステップS307において、置換したコードブロックを含むパケットのヘッダ内の、符号長およびゼロビットプレーン数に関する情報を更新する。   In step S305, the code stream replacement unit 305 performs space for each subband of the 4K resolution generated by the process of step S304 for each subband of the 4K resolution input to the image processing apparatus 200. The corresponding part (that is, the code stream including the noise component) is identified as the partial code stream (that is, the code stream from which the noise component has been removed) of each subband having the resolution of 4K generated by the process of step S304. ). Further, in step S306, the code stream replacement unit 305, for each subband having a resolution of 2K or less of the code stream input to the image processing apparatus 200, a portion of each subband having a resolution of 2K or less generated by the process of step S304. A portion spatially corresponding to the code stream is specified, and the portion (that is, the code stream including the noise component) is determined as the partial code stream (that is, the noise component is included in each subband having a resolution of 2K or less generated by the process of step S304. (Removed code stream). Further, in step S307, the code stream replacement unit 305 updates information regarding the code length and the number of zero bit planes in the header of the packet including the replaced code block.

ステップS307の処理が終了すると、画像処理が終了される。なお、この画像処理は、画像処理装置300に入力される画像データの各フレーム画像について行われる。   When the process of step S307 ends, the image processing ends. This image processing is performed for each frame image of the image data input to the image processing apparatus 300.

次に、図17のフローチャートを参照して、図16のステップS304において実行される部分コードストリーム作成処理の流れの例を説明する。   Next, an example of the flow of the partial code stream creation process executed in step S304 in FIG. 16 will be described with reference to the flowchart in FIG.

部分コードストリーム作成処理が開始されると、ステップS311において、4KDWT部231は、ノイズ成分が除去された、解像度4Kの部分ベースバンドデータを垂直方向および水平方向に1回ずつウェーブレット変換する。ステップS312において、4K再エンコード部232は、ステップS311の処理により生成された解像度4Kの各サブバンドの部分ベースバンドデータを符号化する。ステップS313において、2K再エンコード部334は、ステップS311の処理により生成された解像度2Kの部分ベースバンドデータを、画像処理装置300に入力されるコードストリームの場合と同様の構成となるように、さらに再帰的にウェーブレット変換し、得られた係数を所定の方式で符号化する。ステップS313の処理が終了すると、部分コードストリーム作成処理は終了され、図16のステップS304に処理が戻され、ステップS305以降の処理が実行される。   When the partial code stream creation processing is started, in step S311, the 4KDWT unit 231 performs wavelet transform once on the partial baseband data with a resolution of 4K from which noise components have been removed in the vertical direction and the horizontal direction. In step S312, the 4K re-encoding unit 232 encodes the partial baseband data of each subband having a resolution of 4K generated by the process of step S311. In step S313, the 2K re-encoding unit 334 further sets the partial baseband data with the resolution of 2K generated by the process of step S311 to have the same configuration as that of the code stream input to the image processing apparatus 300. The wavelet transform is recursively performed, and the obtained coefficient is encoded by a predetermined method. When the process of step S313 ends, the partial code stream creation process ends, the process returns to step S304 of FIG. 16, and the processes after step S305 are executed.

次に、図18のフローチャートを参照して、図17のステップS313において実行される2K再エンコード処理の流れの例を説明する。   Next, an example of the flow of 2K re-encoding processing executed in step S313 in FIG. 17 will be described with reference to the flowchart in FIG.

2K再エンコード処理が開始されると、ステップS321において、置換コードブロック特定部371は、ステップS311の処理により生成された解像度2Kの部分ベースバンドデータの、解像度2Kのフレーム画像のベースバンドにおける位置を、所定回数再帰的にウェーブレット変換したときの各サブバンドにおいて特定する。すなわち、置換コードブロック特定部371は、解像度2Kのフレーム画像のベースバンドを所定回数再帰的にウェーブレット変換したときの各サブバンドの、編集の影響を受ける領域を特定する。ウェーブレット変換や符号化の条件が一定であれば、ベースバンドデータの各データと、そのベースバンドデータをウェーブレット変換して得られる各ウェーブレット係数の位置関係は一定である。したがって、その場合、置換コードブロック特定部371は、例えば変換表や変換式等のルール情報を予め用意しておき、そのルール情報を用いることにより、フレーム画像のベースバンドにおける、部分ベースバンドデータの位置(すなわち、編集領域の位置)から、その編集領域に対応する各サブバンドの係数の領域を、実際にウェーブレット変換をせずに容易に求めることができる。   When the 2K re-encoding process is started, in step S321, the replacement code block specifying unit 371 determines the position of the partial baseband data with the resolution 2K generated by the process at step S311 in the baseband of the frame image with the resolution 2K. In each subband when the wavelet transform is recursively performed a predetermined number of times. That is, the replacement code block specifying unit 371 specifies a region affected by editing of each subband when the baseband of the frame image of 2K resolution is recursively wavelet transformed a predetermined number of times. If the conditions of wavelet transform and encoding are constant, the positional relationship between each data of baseband data and each wavelet coefficient obtained by wavelet transforming the baseband data is constant. Therefore, in that case, the replacement code block specifying unit 371 prepares rule information such as a conversion table and a conversion formula in advance, and uses the rule information to thereby determine the partial baseband data in the baseband of the frame image. From the position (that is, the position of the editing area), the area of the coefficient of each subband corresponding to the editing area can be easily obtained without actually performing wavelet transform.

ステップS322において、置換コードブロック特定部371は、さらに、ステップS321において求めた、編集領域に対応する各サブバンドの係数の領域に基づいて、編集の影響を受ける置換コードブロックを特定する。つまり、置換コードブロック特定部371は、最下位のサブバンドにおいて、ステップS321において求めた係数を含むコードブロックを特定し、そのコードブロックに対応するコードブロックを各サブバンドにおいて特定する。ステップS321において各サブバンドの係数の位置が特定されれば、その位置情報によって、目的の置換コードブロックの位置は特定される。したがって、置換コードブロック特定部371は、例えば変換表や変換式等のルール情報を予め用意し、そのルール情報に基づいて、置換コードブロックを容易に求めることができる。   In step S322, the replacement code block specifying unit 371 further specifies a replacement code block affected by editing based on the coefficient region of each subband corresponding to the editing region obtained in step S321. That is, the replacement code block specifying unit 371 specifies the code block including the coefficient obtained in step S321 in the lowest subband, and specifies the code block corresponding to the code block in each subband. If the position of the coefficient of each subband is specified in step S321, the position of the target replacement code block is specified by the position information. Therefore, the replacement code block specifying unit 371 can prepare rule information such as a conversion table and a conversion formula in advance, and can easily obtain a replacement code block based on the rule information.

上述したように、置換コードブロック特定部371は、ウェーブレット変換や符号化の条件を固定化することにより、所定のルールに基づいて、編集領域に対応する置換コードブロック(編集の影響を受けるコードブロック)を特定することができる。したがって、置換コードブロック特定部371は、ノイズが除去された部分ベースバンドデータの位置から置換コードブロックを特定する、例えば変換表や変換式等のルール情報を予め用意し、ステップS321およびステップS322の処理を一度の変換で行うようにしてもよい。   As described above, the replacement code block specifying unit 371 fixes the wavelet transform and encoding conditions, thereby replacing the replacement code block corresponding to the editing area (the code block affected by editing) based on a predetermined rule. ) Can be specified. Therefore, the replacement code block specifying unit 371 prepares in advance rule information such as a conversion table and a conversion formula for specifying a replacement code block from the position of the partial baseband data from which noise has been removed, and in steps S321 and S322. The processing may be performed with a single conversion.

置換コードブロックが特定されると、ベースバンド領域抽出部372は、ステップS323において、解像度2Kのベースバンドデータにおいて、特定された置換コードブロックを含む領域を抽出する。ベースバンド領域抽出部372は、特定された置換コードブロックに対応する範囲を、解像度2Kのベースバンドデータにおいて求め、ステップS301の処理において生成された解像度2Kのベースバンドデータから、その範囲のデータを抽出する。   When the replacement code block is specified, the baseband region extraction unit 372 extracts a region including the specified replacement code block in the baseband data of 2K resolution in step S323. The baseband region extraction unit 372 obtains a range corresponding to the identified replacement code block in the baseband data with 2K resolution, and extracts data in the range from the baseband data with 2K resolution generated in the process of step S301. Extract.

ステップS324において、DWT部373は、ステップS323において抽出された部分ベースバンドデータを所定回数再帰的にウェーブレット変換する。ステップS325において、エンコード部374は、ステップS324において得られたウェーブレット係数を所定の方式で符号化する。   In step S324, the DWT unit 373 recursively wavelet transforms the partial baseband data extracted in step S323 a predetermined number of times. In step S325, the encoding unit 374 encodes the wavelet coefficient obtained in step S324 by a predetermined method.

以上のように、画像処理装置300は、ノイズ成分の検出を、本来の解像度4Kよりも低い解像度2Kで行い、ノイズ成分を含む部分のみ解像度4Kで復号し、編集処理を行う。これにより、画像処理装置300は、フレーム画像全体のコードストリームを解像度4Kで復号し、ノイズ成分を除去し、再エンコードする場合と比べて、この編集処理に伴う、コードストリームの復号、ノイズ成分の除去、およびベースバンドデータの再符号化等の各処理の負荷、処理時間、およびデータ保持に必要なメモリ容量等を低減させることができる。つまり、画像処理装置300は、フレーム画像全体を解像度4Kで復号し、編集処理を行う場合よりも、より容易に編集処理を行うことができる。   As described above, the image processing apparatus 300 detects a noise component at a resolution 2K lower than the original resolution 4K, decodes only a portion including the noise component at a resolution 4K, and performs an editing process. As a result, the image processing apparatus 300 decodes the code stream of the entire frame image at a resolution of 4K, removes the noise component, and re-encodes the code stream associated with the editing process and the noise component. It is possible to reduce the load of each process such as the removal and re-encoding of the baseband data, the processing time, the memory capacity necessary for data holding, and the like. That is, the image processing apparatus 300 can perform the editing process more easily than when the entire frame image is decoded at a resolution of 4K and the editing process is performed.

なお、この画像処理装置300の場合、画像処理装置200の場合と比べて、置換するデータ量を低減させることができ、編集処理や置換等の処理により生じる画像の変化を低減させることができる。画像に含まれるノイズ成分の量等によっては、画像処理装置200の場合よりも編集処理等の各処理の負荷や処理時間を低減させたり、データ保持に必要なメモリ量を低減させたりすることができる。   In the case of this image processing apparatus 300, compared to the case of the image processing apparatus 200, the amount of data to be replaced can be reduced, and changes in the image caused by processing such as editing processing and replacement can be reduced. Depending on the amount of noise components included in the image, the load and processing time of each processing such as editing processing may be reduced or the amount of memory required for data retention may be reduced as compared with the case of the image processing apparatus 200. it can.

また、以上においては、解像度4Kのサブバンドのノイズ成分を除去するために、解像度4Kで復号するように説明したが、これに限らず、例えば、解像度4Kのサブバンドに含まれるノイズ成分は、コードストリームのまま除去するようにしてもよい。   Further, in the above description, in order to remove the noise component of the subband of 4K resolution, it has been described that the decoding is performed at the resolution of 4K. However, the present invention is not limited to this. For example, the noise component included in the subband of resolution 4K The code stream may be removed as it is.

図19は、本発明を適用した画像処理装置の、さらに他の構成例を示すブロック図である。なお、図19において、図5と同様の処理を行うブロックについては同一の符号を付してある。図19に示される画像処理装置400は、図2の画像処理装置100と同様に、画像データの各フレーム画像よりノイズを除去する装置である。ただし、画像処理装置400は、解像度2Kにおいてベースバンドデータを用いてノイズ成分を検出し、そのノイズ成分を除去する編集処理を行うとともに、解像度4Kのサブバンドに含まれるノイズ成分を、コードストリームのまま編集し、除去する。   FIG. 19 is a block diagram showing still another configuration example of the image processing apparatus to which the present invention is applied. In FIG. 19, the same reference numerals are assigned to blocks that perform the same processing as in FIG. An image processing apparatus 400 shown in FIG. 19 is an apparatus that removes noise from each frame image of image data, like the image processing apparatus 100 of FIG. However, the image processing apparatus 400 detects a noise component using baseband data at a resolution of 2K, performs an editing process for removing the noise component, and converts a noise component included in a subband of a resolution of 4K into a code stream. Edit and remove.

画像処理装置400は、図5の編集領域設定部201の他に、4K編集領域抽出部402、ノイズ除去部403、2K再エンコード部404、およびコードストリーム置換部405を有する。   The image processing apparatus 400 includes a 4K editing area extracting unit 402, a noise removing unit 403, a 2K re-encoding unit 404, and a code stream replacing unit 405 in addition to the editing area setting unit 201 in FIG.

画像処理装置400に入力されるコードストリーム450Aは、図20Aに示されるように、解像度2Kのコードストリームである2KS451A、解像度4Kのサブバンドのコードストリームである4KSHL452A、4KSLH453A、および4KSHH454Aにより構成される。そして、図17Bに示されるように、2Kスケーラブルデコード部211によって解像度2Kのフレーム画像のベースバンドデータである2KBB451Bが作成され、編集領域特定部212によってノイズ成分を含む編集領域が設定される(図20Bの部分画像455A)。   As shown in FIG. 20A, the code stream 450A input to the image processing apparatus 400 includes 2KS451A that is a 2K resolution codestream, 4KSHL452A, 4KSLH453A, and 4KSHH454A that are 4K resolution subband codestreams. . Then, as shown in FIG. 17B, 2KBB 451B, which is baseband data of a 2K resolution frame image, is created by the 2K scalable decoding unit 211, and an editing region including a noise component is set by the editing region specifying unit 212 (FIG. 17B). 20B partial image 455A).

4K編集領域抽出部402は、図5の4K編集領域抽出部222と同様の処理を行い、画像処理装置400に入力されたコードストリームから、編集領域特定部212によって特定された編集領域を含むコードブロックを抽出し、それをノイズ除去部403の4Kノイズ除去部412に供給する。つまり、図20の例の場合、図20Cに示されるように、4K編集領域抽出部402は、解像度2Kの部分画像455Aに空間的に対応する解像度4Kのサブバンドの部分コードストリーム456A、部分コードストリーム457A、および部分コードストリーム458Aを抽出する。   The 4K editing area extraction unit 402 performs the same processing as the 4K editing area extraction unit 222 in FIG. 5, and includes a code including the editing area specified by the editing area specifying unit 212 from the code stream input to the image processing apparatus 400. The block is extracted and supplied to the 4K noise removing unit 412 of the noise removing unit 403. That is, in the case of the example of FIG. 20, as illustrated in FIG. 20C, the 4K editing area extraction unit 402 performs a partial code stream 456A of a subband of 4K resolution corresponding to a partial image 455A of 2K resolution, and a partial code. A stream 457A and a partial code stream 458A are extracted.

なお、この画像処理装置400においては、解像度4Kのサブバンドのノイズ成分は、コードストリームのまま除去されるので(逆ウェーブレット変換されないので)、図7に示されるように、編集領域を含まない周囲のコードブロックの抽出は不要である。   In this image processing apparatus 400, since the noise component of the subband of 4K resolution is removed as it is in the code stream (since it is not subjected to inverse wavelet transform), as shown in FIG. No code block extraction is required.

ノイズ除去部403は、編集領域特定部212において検出されたノイズ成分を除去する編集処理を行う。ノイズ除去部403は、2Kノイズ除去部411および4Kノイズ除去部412を有する。   The noise removing unit 403 performs an editing process for removing the noise component detected by the editing area specifying unit 212. The noise removal unit 403 includes a 2K noise removal unit 411 and a 4K noise removal unit 412.

2Kノイズ除去部411は、2Kスケーラブルデコード部211において生成された解像度2Kのフレーム画像のベースバンドデータの、編集領域特定部212において特定された編集領域について、例えばフィルタ処理や置換処理等の所定の画像編集処理によりノイズ成分の除去を行い、ノイズ成分が除去された解像度2Kのフレーム画像のベースバンドデータ(図20Dの2KBB451C)を2K再エンコード部404に供給する。つまり、図20Dの2KBB451Cに含まれる部分画像455Bは、部分画像455Aよりノイズ成分を除去したものである。   The 2K noise removal unit 411 performs predetermined processing such as filter processing or replacement processing on the editing region specified by the editing region specifying unit 212 of the baseband data of the 2K resolution frame image generated by the 2K scalable decoding unit 211. The noise component is removed by the image editing process, and the baseband data (2KBB451C in FIG. 20D) of the 2K resolution frame image from which the noise component has been removed is supplied to the 2K re-encoding unit 404. That is, the partial image 455B included in 2KBB 451C in FIG. 20D is obtained by removing noise components from the partial image 455A.

4Kノイズ除去部412は、4K編集領域抽出部402により抽出された、編集領域を含むコードブロックの、解像度4Kのサブバンドの部分コードストリームからノイズ成分を除去する(図20Dの部分コードストリーム456B乃至部分コードストリーム458B)。4Kノイズ除去部412は、例えば、4K編集領域抽出部402より供給された部分コードストリームを、前後のフレーム画像の空間的に対応する部分コードストリームと置換したり、または、周辺のコードブロックから複製した部分コードストリームと置換したりしてノイズ成分を除去する。このノイズ成分の除去方法は、コードストリームのまま行うことができる方法であれば任意である。   The 4K noise removing unit 412 removes noise components from the partial code stream of the subband of 4K resolution of the code block including the editing area extracted by the 4K editing area extracting unit 402 (partial code streams 456B to 456B in FIG. 20D). Partial code stream 458B). For example, the 4K noise removal unit 412 replaces the partial code stream supplied from the 4K editing area extraction unit 402 with a partial code stream spatially corresponding to the preceding and succeeding frame images, or duplicates from a surrounding code block. The noise component is removed by replacing the partial code stream. The noise component removal method is arbitrary as long as it can be performed as it is in the code stream.

2K再エンコード部404は、2Kノイズ除去部411においてノイズ成分が除去された解像度2Kのフレーム画像のベースバンドデータをJPEG2000方式により符号化し、解像度2Kのフレーム画像のコードストリーム(図20Eの2KS451D)をコードストリーム置換部405に供給する。この符号化により、図20Dの部分画像455Bは、図20Eの部分コードストリーム455Cに変換される。なお、実際には、部分コードストリーム455Cは、ウェーブレット変換によりサブバンド毎に分割される。   The 2K re-encoding unit 404 encodes the baseband data of the 2K resolution frame image from which the noise component has been removed by the 2K noise removing unit 411 according to the JPEG2000 system, and generates a code stream (2KS451D in FIG. 20E) of the 2K resolution frame image. This is supplied to the code stream replacement unit 405. By this encoding, the partial image 455B in FIG. 20D is converted into a partial code stream 455C in FIG. 20E. In practice, partial code stream 455C is divided into subbands by wavelet transform.

コードストリーム置換部405は、画像処理装置400に入力されたコードストリームの解像度2Kのフレーム画像のコードストリームを、2K再エンコード部404より供給されたデータに置換し、さらに、画像処理装置400に入力されたコードストリームの解像度4Kのサブバンドのコードストリームのうち、編集領域に空間的に対応する部分を含むコードブロックを、4Kノイズ除去部412より供給されたデータに置換し、画像処理装置400の外部に出力する。   The code stream replacement unit 405 replaces the code stream of the 2K resolution frame image of the code stream input to the image processing device 400 with the data supplied from the 2K re-encoding unit 404, and further inputs the code stream to the image processing device 400. In the substream code stream having a resolution of 4K, the code block including a portion spatially corresponding to the editing area is replaced with the data supplied from the 4K noise removing unit 412. Output to the outside.

つまり、コードストリーム置換部405より出力されるコードストリーム450Bは、図20Fに示されるように、ノイズ成分が除去された解像度2Kの部分コードストリーム455Cを有する、解像度2Kのフレーム画像のコードストリーム451D、ノイズ成分が除去された解像度4Kのサブバンドの部分コードストリーム456Bを有する、解像度4Kのサブバンドのコードストリームである4KSHL452B、ノイズ成分が除去された解像度4Kのサブバンドの部分コードストリーム457Bを有する、解像度4Kのサブバンドのコードストリームである4KSLH453B、および、ノイズ成分が除去された解像度4Kのサブバンドの部分コードストリーム458Bを有する、解像度4Kのサブバンドのコードストリームである4KSHH454Bにより構成される。   That is, the code stream 450B output from the code stream replacement unit 405 includes a code stream 451D of a 2K resolution frame image having a partial code stream 455C of 2K resolution from which noise components are removed, as shown in FIG. 20F. 4KSHL452B, which is a 4K resolution subband code stream 456B with a noise component removed, and 4KSHL 452B, a 4K resolution subband code stream 457B with noise component removed, 4KSLH 453B, which is a 4K resolution subband code stream, and 4KSHH 454B, which is a 4K resolution subband code stream having a sub code stream 458B of 4K resolution from which noise components have been removed. Ri made.

なお、コードストリーム置換部405は、必要に応じて、データを置換した部分のパケットヘッダに含まれる符号長やゼロビットプレーン数に関する情報を更新する。   Note that the code stream replacement unit 405 updates information regarding the code length and the number of zero bit planes included in the packet header of the part where the data is replaced, as necessary.

このような、ノイズ成分をフレーム画像より除去する画像処理の流れの例を、図21のフローチャートを参照して説明する。   An example of the flow of image processing for removing such noise components from the frame image will be described with reference to the flowchart of FIG.

画像処理が開始されると、ステップS401において、編集領域設定部201は、編集領域設定処理を行い、2K解像度で編集領域を設定する。なお、この編集領域設定処理の詳細は、図9のフローチャートを参照して説明した場合と同様であるので、その説明を省略する。ステップS402において、4K編集領域抽出部402は、解像度4Kのサブバンドのコードストリームから、編集領域に空間的に対応する部分の部分コードストリームを抽出する。   When image processing is started, in step S401, the editing area setting unit 201 performs editing area setting processing and sets an editing area at 2K resolution. The details of the editing area setting process are the same as those described with reference to the flowchart of FIG. In step S <b> 402, the 4K editing area extraction unit 402 extracts a partial code stream of a portion spatially corresponding to the editing area from a subband code stream with a resolution of 4K.

ステップS403において、ノイズ除去部403は、ノイズ除去処理を行い、画像よりノイズ成分を除去する。   In step S403, the noise removal unit 403 performs noise removal processing to remove noise components from the image.

ステップS404において、2K再エンコード部404は、2Kノイズ除去部411によりノイズが除去された解像度2Kのフレーム画像のベースバンドデータをJPEG2000方式により符号化する。   In step S404, the 2K re-encoding unit 404 encodes the baseband data of the 2K resolution frame image from which noise has been removed by the 2K noise removal unit 411, using the JPEG2000 method.

ステップS405において、コードストリーム置換部405は、画像処理装置400に入力されるコードストリームの解像度4Kの各サブバンドについて、ステップS403の処理によりノイズが除去された部分コードストリームに対応する部分を特定し、その部分(つまりノイズ成分を含むコードストリーム)を、ステップS403の処理によりノイズが除去された部分コードストリームに置換する。また、ステップS406において、コードストリーム置換部405は、画像処理装置400に入力されるコードストリームの解像度2K以下の各サブバンドのコードストリーム(つまりノイズ成分を含むコードストリーム)を、ステップS404の処理により符号化されて生成された解像度2Kのフレーム画像のコードストリーム(つまりノイズ成分が除去されたコードストリーム)に置換する。さらに、コードストリーム置換部405は、ステップS407において、置換したコードブロックを含むパケットのヘッダ内の、符号長およびゼロビットプレーン数に関する情報を適宜更新する。   In step S405, the code stream replacement unit 405 identifies a portion corresponding to the partial code stream from which noise has been removed by the processing in step S403, for each subband of resolution 4K of the code stream input to the image processing apparatus 400. The portion (that is, the code stream including the noise component) is replaced with the partial code stream from which noise has been removed by the process of step S403. In step S406, the code stream replacement unit 405 converts the code stream input to the image processing apparatus 400 to a substream code stream having a resolution of 2K or less (that is, a code stream including a noise component) by the process in step S404. It is replaced with a code stream of a frame image having a resolution of 2K generated by encoding (that is, a code stream from which noise components have been removed). Further, in step S407, the code stream replacement unit 405 appropriately updates information regarding the code length and the number of zero bit planes in the header of the packet including the replaced code block.

ステップS407の処理が終了すると、画像処理が終了される。なお、この画像処理は、画像処理装置400に入力される画像データの各フレーム画像について行われる。   When the process of step S407 ends, the image processing ends. This image processing is performed for each frame image of the image data input to the image processing apparatus 400.

次に、図22のフローチャートを参照して、図21のステップS403において実行されるノイズ除去処理の流れの例を説明する。   Next, an example of the flow of the noise removal process executed in step S403 in FIG. 21 will be described with reference to the flowchart in FIG.

ノイズ除去処理が開始されると、ステップS411において、2Kノイズ除去部411は、解像度2Kのフレーム画像のベースバンドデータの、ステップS401の処理において設定された編集領域のノイズ成分を除去する。ステップS412において、4Kノイズ除去部412は、ステップS402の処理により抽出された解像度4Kの各サブバンドの部分コードストリームのノイズ成分を、他のデータと置換することにより、コードストリームのまま除去する。   When the noise removal process is started, in step S411, the 2K noise removal unit 411 removes the noise component in the editing area set in the process in step S401 from the baseband data of the frame image with 2K resolution. In step S412, the 4K noise removal unit 412 removes the noise component of the partial code stream of each subband of resolution 4K extracted by the process in step S402 with other data, and removes the code stream as it is.

ステップS412の処理が終了されると、ノイズ除去処理が終了され、処理が図21のステップS403に戻され、ステップS404以降の処理が実行される。   When the process of step S412 is completed, the noise removal process is terminated, the process returns to step S403 in FIG. 21, and the processes after step S404 are executed.

以上のように、画像処理装置400は、ノイズ成分の検出を、本来の解像度4Kよりも低い解像度2Kで行い、解像度4Kのサブバンドに含まれるノイズ成分は、復号せずにコードストリームのまま除去する編集処理を行う。これにより、画像処理装置400は、フレーム画像全体のコードストリームを解像度4Kで復号し、ノイズ成分を除去し、再エンコードする場合と比べて、この編集処理に伴う、コードストリームの復号、ノイズ成分の除去、およびベースバンドデータの再符号化等の各処理の負荷、処理時間、およびデータ保持に必要なメモリ容量等を低減させることができる。つまり、画像処理装置400は、フレーム画像全体を解像度4Kで復号し、編集処理を行う場合よりも、より容易に編集処理を行うことができる。   As described above, the image processing apparatus 400 detects a noise component at a resolution 2K lower than the original resolution 4K, and removes the noise component included in the subband of the resolution 4K as a code stream without decoding. Edit processing to be performed. As a result, the image processing apparatus 400 decodes the code stream of the entire frame image at a resolution of 4K, removes the noise component, and re-encodes the code stream associated with the editing process and the noise component. It is possible to reduce the load of each process such as the removal and re-encoding of the baseband data, the processing time, the memory capacity necessary for data holding, and the like. That is, the image processing apparatus 400 can perform the editing process more easily than when the entire frame image is decoded at a resolution of 4K and the editing process is performed.

なお、この画像処理装置400の場合、画像処理装置200や画像処理装置300の場合と比べて、解像度4Kのサブバンドについての復号処理や符号化処理を省略することができる。これにより、画像処理装置400は、画像処理装置200や画像処理装置300の場合よりも編集処理等の各処理の負荷や処理時間を低減させたり、データ保持に必要なメモリ量を低減させたりすることができる。ただし、画像処理装置400は、解像度4Kのサブバンドのノイズ成分をコードストリームのまま除去するので、画像処理装置200や画像処理装置300の方が、画像処理装置400よりもより正確にノイズ成分を除去することができる。   In the case of the image processing apparatus 400, as compared with the case of the image processing apparatus 200 and the image processing apparatus 300, the decoding process and the encoding process for the subband of 4K resolution can be omitted. As a result, the image processing apparatus 400 can reduce the load and processing time of each process such as editing processing and the amount of memory required for data retention, as compared with the image processing apparatus 200 and the image processing apparatus 300. be able to. However, since the image processing apparatus 400 removes the noise component of the subband having a resolution of 4K as the code stream, the image processing apparatus 200 and the image processing apparatus 300 can more accurately remove the noise component than the image processing apparatus 400. Can be removed.

以上においては、編集処理の例としてノイズ成分を除去する場合について説明したが、編集処理の内容は、これに限らず、スケーラブルに符号化されたデータを編集する処理であればどのような処理であっても良い。例えば、フレーム画像に合成用画像や文字を合成させる処理であってもよい。つまり、以上においては画像処理装置について説明したが、本発明は、スケーラブルに符号化されたデータを処理する装置であれば、画像処理装置以外にも適用することができる。   In the above, the case of removing a noise component has been described as an example of the editing process. However, the content of the editing process is not limited to this, and any process can be used as long as it is a process for editing scalable encoded data. There may be. For example, a process of combining a frame image with a composition image or characters may be used. That is, although the image processing apparatus has been described above, the present invention can be applied to apparatuses other than image processing apparatuses as long as they are apparatuses that process scalable encoded data.

また、編集処理されるデータは、スケーラブルに符号化されたデータであれば何でもよく、例えば音声データ等、画像データ以外であってもよい。さらに、以上においては、JPEG2000方式でデータを圧縮するように説明したが、データをスケーラブルに符号化する方式であれば、例えばMPEG(Moving Picture Experts Group)方式、H.264/AVC方式、ウェーブレット変換を利用者各種符号化・復号方式等、どのような符号化・復号方式を用いるようにしてもよい。   The data to be edited may be any data that is encoded in a scalable manner, and may be data other than image data such as audio data. Furthermore, in the above description, the data is compressed using the JPEG2000 method. However, if the data is encoded in a scalable manner, for example, the MPEG (Moving Picture Experts Group) method, the H.264 / AVC method, the wavelet transform Any coding / decoding method such as various user coding / decoding methods may be used.

以上においては、編集領域が1箇所である場合を例に説明したが、この編集領域は、ノイズ成分の数だけ設定することができ、1フレーム画像に複数設定されても良い。また、1フレーム画像編集領域を複数設定する場合、各編集領域を1つずつ処理するようにしてもよいし、複数の編集領域に対する処理を、並列に実行させるようにしてもよい。例えば、1つの編集領域において得られた処理結果や中間データ等を、他の編集領域に対する処理に利用するようにしてもよい。   In the above, the case where there is one editing area has been described as an example, but this editing area can be set as many as the number of noise components, and a plurality of editing areas may be set in one frame image. Further, when a plurality of 1-frame image editing areas are set, each editing area may be processed one by one, or processing for a plurality of editing areas may be executed in parallel. For example, a processing result or intermediate data obtained in one editing area may be used for processing for another editing area.

また、以上においては、解像度として4Kと2Kを例に説明したが、解像度4Kは高解像度の一例であり、解像度2Kは低解像度の一例であり、各解像度は任意である。つまり、本発明は、高解像度のスケーラブル符号化されたデータを、低解像度で処理することができればよく、例えば、3段階以上で復号可能なデータを、最低解像度でノイズ検出し、最高解像度の部分画像でノイズ除去処理を行うようにしてもよい。   In the above description, 4K and 2K have been described as examples of the resolution. However, the resolution 4K is an example of high resolution, the resolution 2K is an example of low resolution, and each resolution is arbitrary. That is, the present invention only needs to be able to process high-resolution scalable encoded data at low resolution. For example, noise that can be decoded in three or more stages is detected at the minimum resolution, and the highest resolution portion is detected. You may make it perform a noise removal process with an image.

さらに、以上においては、画像処理をフレーム画像単位で繰り返すように説明したが、これに限らず、画像処理を繰り返す単位を、フレーム画像より小さくしても良いし、複数フレーム画像を1度の画像処理で処理するようにしてもよい。   Further, in the above description, the image processing is repeated for each frame image. However, the present invention is not limited to this, and the unit for repeating the image processing may be smaller than the frame image, or a plurality of frame images may be converted into one image. You may make it process by a process.

また、以上においては、説明の便宜上、符号化処理の際の量子化処理、および、復号処理の際の逆量子化処理を省略して説明したが、これに限らず、符号化の際に量子化を行い、復号の際に逆量子化を行うようにしてももちろんよい。   In the above description, for convenience of explanation, the quantization process at the time of the encoding process and the inverse quantization process at the time of the decoding process have been omitted. However, the present invention is not limited to this. Of course, the quantization may be performed and the inverse quantization may be performed at the time of decoding.

上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図23に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。   The series of processes described above can be executed by hardware or can be executed by software. In this case, for example, it may be configured as a personal computer as shown in FIG.

図23において、パーソナルコンピュータ500のCPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記憶されているプログラム、または記憶部513からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。   In FIG. 23, a CPU (Central Processing Unit) 501 of the personal computer 500 performs various processes according to a program stored in a ROM (Read Only Memory) 502 or a program loaded from a storage unit 513 to a RAM (Random Access Memory) 503. Execute the process. The RAM 503 also appropriately stores data necessary for the CPU 501 to execute various processes.

CPU501、ROM502、およびRAM503は、バス504を介して相互に接続されている。このバス504にはまた、入出力インタフェース510も接続されている。   The CPU 501, ROM 502, and RAM 503 are connected to each other via a bus 504. An input / output interface 510 is also connected to the bus 504.

入出力インタフェース510には、キーボード、マウスなどよりなる入力部511、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部512、ハードディスクなどより構成される記憶部513、モデムなどより構成される通信部514が接続されている。通信部514は、インターネットを含むネットワークを介しての通信処理を行う。   The input / output interface 510 includes an input unit 511 including a keyboard and a mouse, a display including a CRT (Cathode Ray Tube) and an LCD (Liquid Crystal Display), an output unit 512 including a speaker, and a hard disk. A communication unit 514 including a storage unit 513 and a modem is connected. The communication unit 514 performs communication processing via a network including the Internet.

入出力インタフェース510にはまた、必要に応じてドライブ515が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア521が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部513にインストールされる。   A drive 515 is connected to the input / output interface 510 as necessary, and a removable medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately mounted, and a computer program read from them is It is installed in the storage unit 513 as necessary.

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。   When the above-described series of processing is executed by software, a program constituting the software is installed from a network or a recording medium.

この記録媒体は、例えば、図23に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc - Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア521により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM502や、記憶部513に含まれるハードディスクなどで構成される。   For example, as shown in FIG. 23, the recording medium is distributed to distribute a program to a user separately from the apparatus main body, and includes a magnetic disk (including a flexible disk) on which a program is recorded, an optical disk ( It only consists of removable media 521 consisting of CD-ROM (compact disc-read only memory), DVD (including digital versatile disc), magneto-optical disc (including MD (mini disc)), or semiconductor memory. Rather, it is composed of a ROM 502 on which a program is recorded and a hard disk included in the storage unit 513, which is distributed to the user in a state of being pre-installed in the apparatus main body.

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。   In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.

また、本明細書において、システムとは、複数のデバイス(装置)により構成される装置全体を表わすものである。   Further, in this specification, the system represents the entire apparatus constituted by a plurality of devices (apparatuses).

なお、以上において、1つの装置として説明した構成を分割し、複数の装置として構成するようにしてもよい。逆に、以上において複数の装置として説明した構成をまとめて1つの装置として構成されるようにしてもよい。また、各装置の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置の構成の一部を他の装置の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。   In the above, the configuration described as one device may be divided and configured as a plurality of devices. Conversely, the configurations described above as a plurality of devices may be combined into a single device. Of course, configurations other than those described above may be added to the configuration of each device. Furthermore, if the configuration and operation of the entire system are substantially the same, a part of the configuration of a certain device may be included in the configuration of another device. That is, the embodiment of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the gist of the present invention.

編集処理の様子の例を示す図である。It is a figure which shows the example of the mode of an edit process. 本発明を適用した画像処理装置の主な構成例を示すブロック図である。It is a block diagram which shows the main structural examples of the image processing apparatus to which this invention is applied. 編集処理におけるデータの様子の例を説明する図である。It is a figure explaining the example of the mode of the data in an edit process. 画像処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of an image process. 本発明を適用した画像処理装置の、他の構成例を示すブロック図である。It is a block diagram which shows the other structural example of the image processing apparatus to which this invention is applied. 編集処理におけるデータの様子の、他の例を説明する図である。It is a figure explaining the other example of the mode of the data in an edit process. 抽出するコードブロックの範囲の例を説明する図である。It is a figure explaining the example of the range of the code block to extract. 画像処理の流れの、他の例を説明するフローチャートである。It is a flowchart explaining the other example of the flow of an image process. 編集領域設定処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of an edit area | region setting process. 部分ベースバンドデータ作成処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of a partial baseband data creation process. 部分コードストリーム作成処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of a partial code stream creation process. 本発明を適用した画像処理装置の、さらに他の構成例を示すブロック図である。FIG. 12 is a block diagram illustrating still another configuration example of an image processing apparatus to which the present invention has been applied. 編集処理におけるデータの様子の、さらに他の例を説明する図である。It is a figure explaining the further another example of the mode of the data in an edit process. 図12の2K再エンコード部の詳細な構成例を示すブロック図である。It is a block diagram which shows the detailed structural example of the 2K re-encoding part of FIG. コードブロックの様子の例を説明する図である。It is a figure explaining the example of the mode of a code block. 画像処理の流れの、さらに他の例を説明するフローチャートである。It is a flowchart explaining the further another example of the flow of an image process. 部分コードストリーム作成処理の流れの、他の例を説明するフローチャートである。It is a flowchart explaining the other example of the flow of a partial code stream creation process. 2K再エンコード処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of 2K re-encoding process. 本発明を適用した画像処理装置の、さらに他の構成例を示すブロック図である。FIG. 12 is a block diagram illustrating still another configuration example of an image processing apparatus to which the present invention has been applied. 編集処理におけるデータの様子の、さらに他の例を説明する図である。It is a figure explaining the further another example of the mode of the data in an edit process. 画像処理の流れの、さらに他の例を説明するフローチャートである。It is a flowchart explaining the further another example of the flow of an image process. ノイズ除去処理の流れの例を説明するフローチャートである。It is a flowchart explaining the example of the flow of a noise removal process. 本発明を適用したパーソナルコンピュータの構成例を示すブロック図である。It is a block diagram which shows the structural example of the personal computer to which this invention is applied.

符号の説明Explanation of symbols

100 画像処理装置, 101 2Kスケーラブルデコード部, 102 ノイズ除去部, 103 2K再エンコード部, 104 2Kコードストリーム置換部, 200 画像処理装置, 201 編集領域設定部, 202 部分ベースバンドデータ作成部, 203 ノイズ除去部, 204 部分コードストリーム作成部, 205 コードストリーム置換部, 211 2Kスケーラブルデコード部, 212 編集領域特定部, 221 2K編集領域抽出部, 222 4K編集領域抽出部, 223 デコード部, 224 IDWT部, 231 4KDWT部, 232 4K再エンコード部, 233 2Kベースバンド置換部, 234 2K再エンコード部, 300 画像処理装置, 304 部分コードストリーム作成部, 305 コードストリーム置換部, 334 2K再エンコード部, 371 置換コードブロック特定部, 372 ベースバンド領域抽出部, 373 DWT部, 374 エンコード部, 400 画像処理装置, 402 4K編集領域抽出部, 403 ノイズ除去部, 404 2K再エンコード部, 405 コードストリーム置換部, 411 2Kノイズ除去部, 412 4Kノイズ除去部   DESCRIPTION OF SYMBOLS 100 Image processing apparatus, 101 2K scalable decoding part, 102 Noise removal part, 103 2K re-encoding part, 104 2K code stream replacement part, 200 Image processing apparatus, 201 Editing area setting part, 202 Partial baseband data preparation part, 203 Noise Removing unit, 204 partial code stream creating unit, 205 code stream replacing unit, 211 2K scalable decoding unit, 212 editing region specifying unit, 221 2K editing region extracting unit, 222 4K editing region extracting unit, 223 decoding unit, 224 IDWT unit, 231 4KDWT unit, 232 4K re-encoding unit, 233 2K baseband replacement unit, 234 2K re-encoding unit, 300 image processing device, 304 partial code stream creation unit, 305 code stream Replacement unit, 334 2K re-encoding unit, 371 replacement code block identification unit, 372 baseband region extraction unit, 373 DWT unit, 374 encoding unit, 400 image processing device, 402 4K editing region extraction unit, 403 noise removal unit, 404 2K re-encoding unit, 405 code stream replacement unit, 411 2K noise removal unit, 412 4K noise removal unit

Claims (12)

第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置であって、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定手段と、
前記第1の解像度のコードストリームの、前記設定手段により設定された前記編集領域の部分前記第1の解像度で復号されたベースバンドデータである、第1の解像度の部分ベースバンドデータを作成する第1の作成手段と、
前記第1の作成手段により作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行う編集手段と、
前記編集手段により編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成する第2の作成手段と、
前記第1の解像度のコードストリームの前記編集領域の部分を、前記第2の作成手段により作成された前記部分コードストリームに置換するコードストリーム置換手段と
を備える情報処理装置。
An information processing apparatus for processing a code stream of the first resolution in which data of a first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. Setting means for setting;
A partial baseband data having a first resolution is generated, in which a portion of the editing area set by the setting unit of the code stream having the first resolution is baseband data decoded at the first resolution. A first creation means;
Editing means for performing editing processing on the partial baseband data of the first resolution created by the first creating means ;
Second creation means for scalablely coding the partial baseband data of the first resolution edited by the editing means and creating a partial code stream that is a code stream of the editing area;
An information processing apparatus comprising: a code stream replacing unit that replaces a portion of the editing area of the code stream of the first resolution with the partial code stream created by the second creating unit .
前記第1の作成手段は、
前記第2の解像度のベースバンドデータより、前記編集領域の部分を抽出する第1の抽出手段と、
前記第1の解像度のコードストリームより、前記編集領域の部分を抽出する第2の抽出手段と、
前記第2の抽出手段により抽出された前記第1の解像度のコードストリームの前記編集領域の部分を復号する復号手段と、
前記第1の抽出手段により抽出された前記第2の解像度のベースバンドデータの前記編集領域の部分、並びに、前記復号手段により前記第1の解像度のコードストリームの前記編集領域の部分が復号されて得られた前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を逆ウェーブレット変換することにより、前記第1の解像度の部分ベースバンドデータを作成する逆ウェーブレット変換手段と
を備える請求項1に記載の情報処理装置。
The first creation means includes:
First extraction means for extracting a portion of the editing area from the baseband data of the second resolution;
Second extraction means for extracting a portion of the editing area from the code stream of the first resolution;
Decoding means for decoding the portion of the editing area of the code stream of the first resolution extracted by the second extraction means;
The part of the editing area of the baseband data of the second resolution extracted by the first extracting unit and the part of the editing area of the code stream of the first resolution are decoded by the decoding unit. Inverse wavelet transform means for creating partial baseband data of the first resolution by performing inverse wavelet transform on the portion of the editing region of the subband of each high-frequency component of the first resolution obtained. Item 4. The information processing apparatus according to Item 1.
前記編集手段は、前記第1の解像度の部分ベースバンドデータに含まれるノイズ成分を除去する編集を行う
請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, wherein the editing unit performs editing to remove a noise component included in the partial baseband data having the first resolution.
前記第2の作成手段は、
編集された前記第1の解像度の部分ベースバンドデータを第1の解像度でウェーブレット変換するウェーブレット変換手段と、
前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を符号化する第1の符号化手段と、
前記設定手段により得られた前記第2の解像度のベースバンドデータの前記編集領域の部分を、前記ウェーブレット変換手段によるウェーブレット変換処理により得られた前記第1の解像度の低周波成分のサブバンドに含まれる前記第2の解像度のベースバンドデータの前記編集領域の部分に置換するベースバンドデータ置換手段と、
前記編集領域の部分が置換された前記第2の解像度のベースバンドデータを符号化する第2の符号化手段と
を備える請求項1に記載の情報処理装置。
The second creation means includes:
Wavelet transforming means for wavelet transforming the edited partial baseband data of the first resolution at the first resolution;
First encoding means for encoding a portion of the editing area of a subband of each high-frequency component of the first resolution obtained by wavelet transform processing by the wavelet transform means;
The portion of the editing area of the baseband data of the second resolution obtained by the setting means is included in the subband of the low frequency component of the first resolution obtained by the wavelet transform processing by the wavelet transform means. Baseband data replacement means for replacing the portion of the editing area of the baseband data of the second resolution to be
The information processing apparatus according to claim 1, further comprising: a second encoding unit that encodes the baseband data of the second resolution in which the part of the editing area is replaced.
前記第2の作成手段は、
編集された前記第1の解像度の部分ベースバンドデータを第1の解像度でウェーブレット変換するウェーブレット変換手段と、
前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第1の解像度の各高周波成分のサブバンドの前記編集領域の部分を符号化する第1の符号化手段と、
前記ウェーブレット変換手段によるウェーブレット変換処理により得られた、前記第2の解像度のベースバンドデータの前記編集領域の部分を符号化する第2の符号化手段と
を備える請求項1に記載の情報処理装置。
The second creation means includes:
Wavelet transforming means for wavelet transforming the edited partial baseband data of the first resolution at the first resolution;
First encoding means for encoding a portion of the editing area of a subband of each high-frequency component of the first resolution obtained by wavelet transform processing by the wavelet transform means;
2. The information processing apparatus according to claim 1, further comprising: a second encoding unit that encodes a portion of the editing area of the baseband data of the second resolution obtained by the wavelet transform process by the wavelet transform unit. .
第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置の情報処理方法であって、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定し、
前記第1の解像度のコードストリームの、設定された前記編集領域の部分前記第1の解像度で復号された前記第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータを作成し、
作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行い、
編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成し、
前記第1の解像度のコードストリームの前記編集領域の部分を、作成された前記部分コードストリームに置換する
ステップを含む情報処理方法。
An information processing method of an information processing apparatus for processing a code stream of the first resolution in which data of a first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. Set,
Of the first resolution code stream, a baseband data of the set portion of the editing area decoded by the first resolution a first resolution, the partial baseband data of the first resolution make,
An editing process is performed on the generated partial baseband data of the first resolution,
The edited partial baseband data of the first resolution is encoded in a scalable manner to create a partial code stream that is a code stream of the editing area,
An information processing method including a step of replacing a portion of the editing area of the code stream of the first resolution with the generated partial code stream.
第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理するプログラムにおいて、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定ステップと、
前記第1の解像度のコードストリームの、前記設定ステップの処理により設定された前記編集領域の部分前記第1の解像度で復号された前記第1の解像度のベースバンドデータである、第1の解像度の部分ベースバンドデータを作成する第1の作成ステップと、
前記第1の作成ステップの処理により作成された前記第1の解像度の部分ベースバンドデータに対して編集処理を行う編集ステップと、
前記編集ステップの処理により編集された前記第1の解像度の部分ベースバンドデータをスケーラブルに符号化し、前記編集領域のコードストリームである部分コードストリームを作成する第2の作成ステップと、
前記第1の解像度のコードストリームの前記編集領域の部分を、前記第2の作成ステップの処理により作成された前記部分コードストリームに置換するコードストリーム置換ステップと
をコンピュータに実行させるプログラム。
In a program for processing a code stream of the first resolution in which data of the first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. A setting step to set;
Said first resolution code stream, a baseband data portion of said first of said first decoded by a resolution of the editing area set by the processing of said setting step, the first resolution A first creation step of creating partial baseband data of
An editing step of performing an editing process on the partial baseband data of the first resolution created by the process of the first creating step ;
A second creation step of scalablely coding the partial baseband data of the first resolution edited by the processing of the editing step and creating a partial code stream that is a code stream of the editing area;
A program that causes a computer to execute a code stream replacement step of replacing a portion of the edit area of the code stream of the first resolution with the partial code stream created by the processing of the second creation step .
第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置であって、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定手段と、
前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、前記設定手段により設定された前記編集領域の部分を抽出する抽出手段と、
前記抽出手段により抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行う編集手段と、
前記編集手段により前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化する符号化手段と、
前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータが前記符号化手段によりスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集手段により前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換する置換手段と
を備える情報処理装置。
An information processing apparatus for processing a code stream of the first resolution in which data of a first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. Setting means for setting;
Extraction means for extracting a portion of the editing area set by the setting means from a code stream of a subband of each high-frequency component of the first resolution included in the code stream of the first resolution;
For each of the editing region portion of the subband codestream of each high-frequency component of the first resolution extracted by the extracting means and the editing region portion of the baseband data of the second resolution. Editing means for performing editing processing,
Encoding means for encoding in a scalable baseband data of the portion of the editing area is edited second resolution by said editing means,
The second resolution baseband data obtained by editing the edit area portion of the code stream portion of the second resolution of the first resolution code stream is encoded by the encoding means in a scalable manner. A portion of the editing area of the substream code stream of each high-frequency component of the first resolution included in the code stream of the first resolution. An information processing apparatus comprising: a replacing unit that replaces a part of the code stream of the subband of each high-frequency component of the first resolution subjected to the editing process by the editing unit.
前記編集手段は、前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して、ノイズ成分を除去する編集を行う
請求項8に記載の情報処理装置。
The editing means, for each of the editing area portion of the substream code stream of each high-frequency component of the first resolution, and each of the editing area portion of the baseband data of the second resolution, The information processing apparatus according to claim 8, wherein editing is performed to remove a noise component.
前記編集手段は、前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分を、所定の他のコードストリームと置換することにより、前記ノイズ成分を除去する
請求項9に記載の情報処理装置。
The said editing means removes the said noise component by replacing the part of the said edit area | region of the code stream of the subband of each high frequency component of the said 1st resolution with a predetermined other code stream. The information processing apparatus described.
第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理する情報処理装置の情報処理方法であって、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定し、
前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、設定された前記編集領域の部分を抽出し、
抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行い、
前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化し、
前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータがスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換する
ステップを含む情報処理方法。
An information processing method of an information processing apparatus for processing a code stream of the first resolution in which data of a first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. Set,
Extracting the set edit area from the subband codestream of each high frequency component of the first resolution included in the codestream of the first resolution,
Editing processing is performed on each of the editing area portion of the extracted subband code stream of each high-frequency component of the first resolution and the editing area portion of the baseband data of the second resolution. Done
The baseband data of the second resolution in which a part of the editing area is edited is encoded in a scalable manner,
The second resolution codestream portion of the first resolution codestream portion, the second resolution baseband data in which the edit area portion is edited, and the second resolution baseband data are scalable. And the editing region portion of the substream code stream of each high-frequency component of the first resolution included in the code stream of the first resolution. The information processing method includes a step of replacing the editing region portion of the substream code stream of each high-frequency component of the first resolution that has been performed.
第1の解像度のデータがスケーラブルに符号化された、前記第1の解像度のコードストリームを処理するプログラムにおいて、
前記第1の解像度のコードストリームを、前記第1の解像度よりも低解像度の第2の解像度で復号し、得られた前記第2の解像度のベースバンドデータを用いて、編集を行う編集領域を設定する設定ステップと、
前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームより、前記設定ステップの処理により設定された前記編集領域の部分を抽出する抽出ステップと、
前記抽出ステップの処理により抽出された前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分、並びに、前記第2の解像度のベースバンドデータの前記編集領域の部分のそれぞれに対して編集処理を行う編集ステップと、
前記編集ステップの処理により前記編集領域の部分が編集された前記第2の解像度のベースバンドデータをスケーラブルに符号化する符号化ステップと、
前記第1の解像度のコードストリームの、前記第2の解像度のコードストリームの部分を、前記編集領域の部分が編集された前記第2の解像度のベースバンドデータが前記符号化ステップの処理によりスケーラブルに符号化された前記第2の解像度のコードストリームに置換し、さらに、前記第1の解像度のコードストリームに含まれる、前記第1の解像度の各高周波成分のサブバンドのコードストリームの、前記編集領域の部分を、前記編集ステップの処理により前記編集処理が行われた前記第1の解像度の各高周波成分のサブバンドのコードストリームの前記編集領域の部分に置換する置換ステップと
をコンピュータに実行させるプログラム。
In a program for processing a code stream of the first resolution in which data of the first resolution is encoded in a scalable manner,
An editing area in which the code stream of the first resolution is decoded at a second resolution lower than the first resolution and editing is performed using the obtained baseband data of the second resolution. A setting step to set;
An extraction step of extracting a portion of the editing area set by the setting step from a substream code stream of each high-frequency component of the first resolution included in the code stream of the first resolution;
Each of the editing area portion of the subband code stream of each high frequency component of the first resolution extracted by the processing of the extraction step, and each of the editing area portion of the baseband data of the second resolution. An editing step for performing an editing process on
An encoding step for scalablely encoding the baseband data of the second resolution in which a portion of the editing area is edited by the processing of the editing step ;
The code stream portion of the second resolution of the code stream of the first resolution and the baseband data of the second resolution obtained by editing the portion of the editing area are made scalable by the processing of the encoding step. The editing region of the substream code stream of each high-frequency component of the first resolution, which is replaced with the encoded code stream of the second resolution and further included in the code stream of the first resolution And a replacement step of causing the computer to execute a replacement step of replacing the portion of the editing region with the portion of the editing region of the subband codestream of each high-frequency component of the first resolution that has been subjected to the editing processing by the processing of the editing step. .
JP2008071639A 2008-01-16 2008-03-19 Information processing apparatus and method, and program Expired - Fee Related JP4697249B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008071639A JP4697249B2 (en) 2008-01-16 2008-03-19 Information processing apparatus and method, and program
US12/353,479 US8243824B2 (en) 2008-01-16 2009-01-14 Information processing apparatus and method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008006531 2008-01-16
JP2008006531 2008-01-16
JP2008071639A JP4697249B2 (en) 2008-01-16 2008-03-19 Information processing apparatus and method, and program

Publications (2)

Publication Number Publication Date
JP2009194887A JP2009194887A (en) 2009-08-27
JP4697249B2 true JP4697249B2 (en) 2011-06-08

Family

ID=41076443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008071639A Expired - Fee Related JP4697249B2 (en) 2008-01-16 2008-03-19 Information processing apparatus and method, and program

Country Status (1)

Country Link
JP (1) JP4697249B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378542A (en) * 2013-08-14 2015-02-25 腾讯科技(深圳)有限公司 Media content processing method and device and terminal device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002135781A (en) * 2000-10-25 2002-05-10 Canon Inc Image encoding apparatus, image decoding apparatus methods for them and recording medium
JP2004194152A (en) * 2002-12-13 2004-07-08 Ricoh Co Ltd Image processing apparatus, program, storage medium, and image editing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002135781A (en) * 2000-10-25 2002-05-10 Canon Inc Image encoding apparatus, image decoding apparatus methods for them and recording medium
JP2004194152A (en) * 2002-12-13 2004-07-08 Ricoh Co Ltd Image processing apparatus, program, storage medium, and image editing method

Also Published As

Publication number Publication date
JP2009194887A (en) 2009-08-27

Similar Documents

Publication Publication Date Title
TWI436286B (en) Method and apparatus for decoding image
JP6351040B2 (en) Method, program and computer system for signal processing and inheritance in layered signal quality hierarchy
CN102263950B (en) Encoding device, encoding method, decoding device, and decoding method
JP4409276B2 (en) Multiresolution video display method and video encoder
JP4124792B2 (en) Encoding method, decoding method, encoding device, and decoding device
JP2009532978A (en) Encoding / decoding method and apparatus using extended macroblock skip mode
JP2005304035A (en) Coating method and apparatus for supporting motion scalability
JP6883219B2 (en) Coding device and coding method, and system
RU2555226C2 (en) Encoding signal into scalable bitstream and decoding said bitstream
JP2012060261A (en) Image processing apparatus and method
JP2002034043A (en) Method and device for coding and recording medium
CN101742309B (en) Image decoding apparatus and image decoding method
US7120306B2 (en) Image processing method and image coding apparatus utilizing the image processing method
JP2004242271A (en) Moving picture encoding method, moving picture decoding method, moving picture encoder, and moving picture decoder
US8243824B2 (en) Information processing apparatus and method
JP6013547B2 (en) Image coding apparatus and image coding method
JP4697249B2 (en) Information processing apparatus and method, and program
JP4835855B2 (en) Apparatus, method and program for moving picture encoding, and apparatus method and program for moving picture decoding
JP4841504B2 (en) Image coding apparatus and method
JP5419795B2 (en) Image coding apparatus and program
JP2006074130A (en) Image decoding method, image decoding apparatus, and imaging apparatus
JP2002344732A (en) Image expansion method for conversion code, program and recording medium
JP2013121032A (en) Image processing apparatus and method
US6704452B1 (en) Method, apparatus and recording medium for image decoding
JP2005223852A (en) Image-encoding device and method, and image-decoding device and method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110214

LAPS Cancellation because of no payment of annual fees