JP4539754B2

JP4539754B2 - 情報処理装置及び情報処理方法

Info

Publication number: JP4539754B2
Application number: JP2008103981A
Authority: JP
Inventors: 博志水野; 勉一ノ瀬
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2008-04-11
Filing date: 2008-04-11
Publication date: 2010-09-08
Anticipated expiration: 2028-04-11
Also published as: EP2109320A2; CN101557490A; EP2109320A3; CN101557490B; US20090257736A1; JP2009260435A

Description

本発明は、情報処理装置及び情報処理方法に関し、特に、ビデオデータの特徴情報を抽出し、処理時間を短縮させた効率的な符号化処理を可能とする情報処理装置及び情報処理方法に関する。

従来、光ディスク等の記録メディアの作成現場において使用されるオーサリング装置は、ビデオデータ、オーディオデータ等に対してそれぞれ例えばＭＰＥＧ（Moving Picture Experts Group）規格を用いたエンコード処理（圧縮符号化処理）を施す。そして、オーサリング装置は、各エンコード処理の結果得られる各エンコードデータを多重化し、この多重ストリームを記録メディアに記録する。

このようなオーサリング装置は、記録メディアに記録可能なビット量をビデオデータ、オーディオデータ等にそれぞれ配分し、配分されたビット量に納まるように、各データに対してエンコード処理を施す。

ビデオデータのエンコード手法として、いわゆる「２パスエンコード」が知られている（例えば特許文献１参照。）。２パスエンコードは、仮の（事前の）エンコード処理と、本番のエンコード処理とからなる手法である。

以下、仮のエンコード処理を１パス目のエンコード処理と称し、本番のエンコード処理を２パス目のエンコード処理と称し、２パスエンコードの概略について説明する。

エンコーダは、符号化対象の一連のビデオデータに対して、エンコード条件が一定に保持された１パス目のエンコード処理を施す。このとき、１パス目のエンコード処理の際に得られる各種データ、例えば発生ビット量をフレーム単位で順次検出する。

次に、エンコーダは、このようにして検出されたフレーム毎の発生ビット量に基づいて、ビデオデータを構成する各フレームのそれぞれに対してビットの配分を行う。すなわち、２パス目のエンコード処理で利用される目標ビット量をフレーム単位で設定する。

さらに、エンコーダは、２パス目のエンコード処理で利用されるピクチャータイプの割り当てを行う。ピクチャータイプの割り当てとは、各フレームのそれぞれに対してエンコードタイプを割り当てることを示す。

具体的には、ＭＰＥＧでは、Ｉピクチャ（Intra-Picture）、Ｐピクチャ（Predictive-Picture）、及びＢピクチャ（Bidirectionally Predictive-Picture）のうちのいずれかのエンコードタイプで、各フレームのそれぞれがエンコードされる。Ｉピクチャとは、１フレーム分の画像データを他のフレームの画像データを利用することなくそのままエンコードするといったエンコードタイプを指す。すなわち、Ｉピクチャとは、フレーム内エンコード処理といったエンコードタイプを指す。また、ＰピクチャとＢピクチャとは、フレーム間エンコード処理といったエンコードタイプを指す。すなわち、Ｐピクチャとは、基本的には、１フレーム分の画像データと、それより時間的に先行するＩピクチャまたはＰピクチャの予測フレームの画像データとの差分（予測誤差）を求め、その差分をエンコードするといったエンコードタイプを指す。また、Ｂピクチャとは、基本的には、１フレーム分の画像データと、時間的に先行または後行するＩピクチャ若しくはＰピクチャの予測フレームの画像データとの差分（予測誤差）を求め、その差分をエンコードするといったエンコードタイプを指す。

従って、ピクチャータイプの割り当てとは、各フレームのそれぞれを、Ｉピクチャ、Ｐピクチャ、及びＢピクチャといった３つのエンコードタイプのうちのいずれかに割り当てることを指す。換言すると、ピクチャータイプの割り当てとは、各ＧＯＰ（Group Of Picture）構造の設定であるとも言える。

このようにして、１パス目のエンコード処理後に、その処理結果を利用して目標ビット量の設定やピクチャータイプの割り当てがフレーム単位で行われる。

次に、フレーム毎のピクチャータイプと目標ビット量とを少なくとも含むエンコード条件が設定されて、そのエンコード条件に従った２パス目のエンコード処理が実行される。

すなわち、エンコーダは、１パス目と同一のビデオデータに対して２パス目のエンコード処理を施し、その結果得られるエンコードビデオデータを出力する。詳細には、エンコーダは、ビデオデータを構成する各フレームのデータを、割り当てられたピクチャータイプで、かつ、目標ビット量のデータとなるように順次エンコードしていく。その結果、Ｉ，Ｂ，Ｐピクチャのうちの何れかのエンコードフレームデータが連続配置されて形成されるビットストリームが、エンコードビデオデータとして、エンコーダから出力される。

また、その他のビデオデータのエンコード手法としては、例えば特許文献２及び特許文献３にも開示されている。

特許文献２に開示されている手法とは、次の第１の処理乃至第３の処理がその順番で実行される手法である。すなわち、第１の処理とは、ビデオデータの全区間に対して１パス目のエンコード処理を施す処理である。第２の処理とは、そのビデオデータのうちの一部の特定区間のみに対して２パス目のエンコード処理を施す処理である。第３の処理とは、１パス目のエンコードビデオデータのうちの特定区間のデータのみを、２パス目のエンコードビデオデータに置き換え、その結果得られるデータを最終的なエンコードビデオデータとして出力するという処理である。

また、特許文献３に開示されている手法とは次の手法である。すなわち、１パス目のエンコードビデオデータのうちのビット量を削っても問題ない区間の割当量を減らして、その分のビット量を問題が発生する他の区間に割り当てるように目標ビット量を設定し、その目標ビット量に従って２パス目のエンコード処理を行う、という手法が特許文献３に開示されている。
また、特許文献４には、記録メディアに用意された容量を効率的に使ってエンコードビデオデータを作成できるようにする技術が開示されている。具体的に、１パス目のエンコード処理の結果得られる第１のエンコードビデオデータからピクチャタイプと困難度とがフレーム単位で検出され、その検出結果に基づいて第２のエンコード条件を設定し、その第２のエンコード条件に従った２パス目のエンコード処理をビデオデータに施す、という手法が開示されている。

このようにエンコード処理には、ビット量演算等に高い負荷を必要とする。このため、例えば、Blu-Ray（商標）で採用されているコーデックの１つであるMPEG-4 AVC（H.264/AVC）で符号化する場合、DVD（Digital Versatile Disc）で採用されていたMPEG-2に比べて演算処理負荷が高いためにエンコード処理時間が長くなってしまう。

これを補うためにエンコード処理を分散させて並列処理を行うことでエンコード処理時間を短くする手法がある。例えば、同一条件のエンコード用ＰＣ（Personal Computer）を複数台用意し、エンコード用ＰＣ台数分に素材を均等に割り振り、並列処理を実行することにより、H.264/AVCエンコードを効率的に処理し、エンコード時間を短縮させることができる。
特開平１１−００４４４５号公報特開平１１−３４６３６５号公報特許第３２５３９７１号公報特開２００６−７４４６１号公報

ところで、そのエンコード処理を分散させて並列処理を行う場合の、符号化対象のビデオデータにおける分割ポイントは、符号化処理のプリプロセスとして、画質に影響を与えないポイントを検索して決定しておく必要がある。

しかしながら、ＡＶＣコーデック等の演算負荷の高い画像圧縮を単体または複数の処理装置で圧縮する従来のオーサリング装置では、ビデオデータの取り込みと、それに伴うビデオデータ記録装置の制御と、ビデオデータのプリプロセス／圧縮処理は、それぞれ別々に行っていた。その結果、分散エンコード処理を行った場合でも、リアルタイムで圧縮可能な他のコーデック圧縮処理装置に比べて数倍（例えば、実時間の３倍）の処理時間を要していた。

本発明は、このような従来の実情に鑑みて提案されたものであり、符号化処理のプリプロセスとして、符号化対象のビデオデータの特徴を抽出し、処理時間を短縮化した効率のよい符号化処理が可能な情報処理装置及び情報処理方法を提供することを目的とする。

上述した課題を解決するため、本発明における情報処理装置は、ビデオデータが記録された記録媒体の再生を制御するとともに、符号化対象データを取り込むデータ取り込み部と、上記符号化対象データを受信し、符号化処理の前処理として、該符号化対象データの少なくとも分割可能点を含む特徴点を抽出する特徴抽出部と、上記符号化対象データを格納する格納部と、上記特徴抽出部において抽出した上記特徴点についての情報を記憶する記憶部と、上記符号化対象データを所定数の分割データに分割する分割部と、上記分割データを分割符号化データに符号化する複数の符号化部とを備え、上記分割部は、上記複数の符号化部の総数と、上記特徴点についての情報とに基づき、上記符号化対象データを該複数の符号化部の総数で割った等分点に近似する該特徴点を、該各符号化部に略均等に割り当て可能な分割点として決定し、該各符号化部に上記分割データを割り当てる。

また、本発明における情報処理方法は、ビデオデータが記録された記録媒体の再生を制御するとともに、符号化対象データを取り込むデータ取り込み工程と、上記符号化対象データを受信し、符号化処理の前処理として、該符号化対象データの少なくとも分割可能点を含む特徴点を抽出する特徴抽出工程と、上記符号化対象データを格納する格納工程と、上記特徴抽出工程にて抽出した上記特徴点についての情報を記憶する記憶工程と、上記符号化対象データを所定数の分割データに分割する分割工程と、上記分割データを複数の符号化装置を用いて分割符号化データに分散符号化する分散符号化工程とを有し、上記分割工程では、上記複数の符号化装置の総数と、上記特徴点についての情報とに基づき、上記符号化対象データを該複数の符号化装置の総数で割った等分点に近似する該特徴点を、該各符号化装置に略均等に割り当て可能な分割点として決定し、該各符号化装置に上記分割データを割り当てる。

本発明によれば、符号化対象となるビデオデータをハードディスクドライブ等の高速・ランダムアクセス可能な記録媒体に記録しながら、少なくとも分割ポイント候補を含む特徴情報を抽出するようにしているので、オーサリング操作における符号化の処理時間を短縮させることができる。

以下、本発明の具体的な実施の形態について、図面を参照しながら詳細に説明する。ここでは、先ずオーサリング装置の全体構成を説明し、続いてビデオデータのエンコードを並列処理する情報処理システムについて、特徴のあるエンコード前処理（プリプロセス）を含めて説明する。

図１は、本実施の形態に係る情報処理装置が適用される、スタジオ側に設置されるオーサリング装置（以下、「スタジオ側オーサリング装置」という。）の一構成例を示す図である。

このスタジオ側オーサリング装置１０は、メニュー信号処理装置１１乃至オーサリングアプリケーション実行装置１８がネットワーク１９を介して相互に接続され、さらに、ダウンローダ１６にはライタ２０を介してＤＬＴ（Digital Linear Tape）２１、ＨＤＤ（Hard Disk Drive）２２、及びネットワーク２３が接続されて構成されている。

スタジオ側オーサリング装置１０は、図示しない光ディスクに記録させる多重ストリームをファイルとして生成し、ＤＬＴ２１、ＨＤＤ２２、及びネットワーク２３のうちの少なくとも１つに記憶させる。なお、ネットワーク２３にデータを記憶させるとは、ネットワーク２３に接続された他の装置、例えば後述する図Ａのプラント側オーサリング装置１０１に対してネットワーク２３を介してデータを転送し、そのデータを他の装置に保持（記憶）させることを指す。

このスタジオ側オーサリング装置１０において、メニュー信号処理装置１１は、オーサリングアプリケーション実行装置１８により制御されて動作を切り換え、例えば図示しないビデオテープレコーダ等から供給されるメニュー画面のビデオデータに対してエンコード処理を施し、その結果得られるエンコードビデオデータをファイルサーバ１７に記憶する。

サブタイトル信号処理装置１２は、オーサリングアプリケーション実行装置１８により制御されて動作を切り換え、例えば図示しないビデオテープレコーダ等から供給されるタイトル等のビデオデータに対してエンコード処理を施し、その結果得られるエンコードビデオデータをファイルサーバ１７に記憶する。

オーディオ信号処理装置１３は、オーサリングアプリケーション実行装置１８により制御されて動作を切り換え、例えば図示しないビデオテープレコーダ等から供給されるオーディオデータに対してエンコード処理を施し、その結果得られるエンコードオーディオデータをファイルサーバ１７に記憶する。

ビデオ信号処理装置１４は、オーサリングアプリケーション実行装置１８の制御により、図示しない光ディスクに記録する編集対象(データ)のうち、主データとなるビデオデータに対してエンコード処理を施し、その結果得られるエンコードビデオデータをファイルサーバ１７に記憶する。なお、このビデオ信号処理装置１４の詳細な構成例については、図８を参照して後述する。

マルチプレクサ１５は、オーサリングアプリケーション実行装置１８の制御により、ファイルサーバ１７に記憶されている、上述したエンコードオーディオデータやエンコードビデオデータのそれぞれを多重化し、その結果得られる多重ストリームをファイルとして生成する。なお、以下、このようなファイルを多重化ストリームファイルと称する。

マルチプレクサ１５により生成された多重化ストリームファイルは、ネットワーク１９を介してダウンローダ１６に供給される。ダウンローダ１６は、この多重化ストリームファイルを、ライタ２０を介して、ＤＬＴ２１、ＨＤＤ２２、及びネットワーク２３のうちの少なくとも１つに記憶する。

このようにして、ＤＬＴ２１、ＨＤＤ２２、及びネットワーク２３のうちの少なくとも１つに記憶された多重化ストリームファイルは、ディスクイメージデータとして、例えば後述する図３のプラント側オーサリング装置３０に供給される。プラント側オーサリング装置３０は、この多重化ストリームファイルを、例えば光ディスクに記録させる。すなわち、多重化ストリームファイルが記録された光ディスクの原盤３４が、プラント側オーサリング装置３０により作成される。なお、プラント側オーサリング装置３０のさらなる説明については後述する。

ファイルサーバ１７は、例えば、ネットワーク管理機能をもつコンピュータと高速アクセス可能なディスクアレイにより構成される。ファイルサーバ１７は、上述したように、メニュー信号処理装置１１、サブタイトル信号処理装置１２、オーディオ信号処理装置１３、及びビデオ信号処理装置１４のそれぞれから、ネットワーク１９を介して供給されるエンコードビデオデータやエンコードオーディオデータのそれぞれを記憶する。また、ファイルサーバ１７は、マルチプレクサ１５等の要求に応動して、記憶されているエンコードビデオデータやエンコードオーディオデータを、ネットワーク１９を介してマルチプレクサ１５等に出力する。

オーサリングアプリケーション実行装置１８は、例えば、オーサリングアプリケーションソフトウエアを実行可能なコンピュータにより構成される。オーサリングアプリケーションソフトウエアとは、このスタジオ側オーサリング装置１０全体の動作を制御するためのソフトウエアを指す。すなわち、オーサリングアプリケーション実行装置１８は、例えば、オペレータにより設定された各種条件に従って、ビデオ信号処理装置１４やダウンローダ１６等に編集リストを通知することにより、各装置に処理対象を通知し、それぞれの動作を制御する。また、オーサリングアプリケーション実行装置１８は、図示しない光ディスクに記録可能なデータ量から、オーディオデータ及びビデオデータに割り当てるデータ量を計算し、この計算したデータ量を符号化ファイルにより、各装置に通知する。

また、このオーサリングアプリケーション実行装置１８は、ビデオ信号について、オペレータの設定したチャプター情報をビデオ信号処理装置１４に通知する。ここで、チャプターとは、強制的にフレーム内符号化処理により符号化処理するフレームであり、光ディスク装置では、このチャプターを目標にトラックジャンプして記録内容を確認することができるようになっている。

さらに、このオーサリングアプリケーション実行装置１８は、ビデオ信号について、ＧＯＰ（Group Of Pictures）の最大ピクチャー数、各ＧＯＰにおける符号化処理の配列等をビデオ信号処理装置１４に通知する。また、オーサリングアプリケーション実行装置１８は、マルチアングルの処理対象についても、ビデオ信号処理装置１４に通知する。なお、マルチアングルとは、複数のビデオ素材を時分割多重化して光ディスクに記録することにより、ユーザの選択に応じて、例えば列車の走行シーン等を異なる撮影箇所から視聴することを可能にした処理を指す。

このようにして、オーサリングアプリケーション実行装置１８は、上述した情報を他の符号化に必要な情報と共に、符号化ファイルによりビデオ信号処理装置１４に通知する。なお、以下、オーサリングアプリケーション実行装置１８により制御されるメニュー信号処理装置１１乃至ダウンローダ１６のそれぞれを、スタジオ側オーサリング装置１０の内部装置という。

ここで、図２のフローチャートを参照して、スタジオ側オーサリング装置１０の処理例について説明する。

ステップＳ１において、オーサリングアプリケーション実行装置１８は、オペレータの操作に従ってビデオ信号処理装置１４等各内部装置に対して編集リストを通知することにより、編集対象を、ビデオ信号処理装置１４等各内部装置に通知する。

なお、編集対象とは例えば、ビデオ信号処理装置１４の処理対象のビデオデータを少なくとも含み、その他必要に応じて、オーディオ信号処理装置１３の処理対象のオーディオデータ、サブタイトル信号処理装置１２の処理対象のビデオデータ、及びメニュー信号処理装置１１の処理対象のビデオデータのうちの任意の数の任意の種類のデータを含む、いわゆる素材（データ）を指す。

ステップＳ２において、オーサリングアプリケーション実行装置１８は、エンコード処理に必要な各種情報を、ビデオ信号処理装置１４等各内部装置に通知する。

なお、ここでは例えば、ステップＳ２の処理で通知される各種情報は一括して所定のファイルに含められ、そのファイルがビデオ信号処理装置１４等各内部装置に通知されるものとする。以下、このようなファイルを、符号化ファイルと称する。

具体的には例えば、ステップＳ２において、オーサリングアプリケーション実行装置１８は、編集対象がこれから記録される、光ディスク等が記録可能なデータ量を取得する。次に、オーサリングアプリケーション実行装置１８は、そのデータ量に基づいて、編集対象を構成する各データに割り当てるデータ量をそれぞれ計算する。そして、オーサリングアプリケーション実行装置１８は、計算された各データ量のそれぞれを符号化ファイルに含めて、各内部装置のうちの対応する内部装置にそれぞれ通知する。例えば、オーサリングアプリケーション実行装置１８は、ビデオ信号処理装置１４の処理対象のビデオデータ、すなわち、編集対象のうちのメニューやタイトルを除くビデオデータに割り当てるデータ量（以下、「ビデオデータに割り当て可能なデータ量」という。）を、符号化ファイルに含めてビデオ信号処理装置１４に通知する。

また、例えば、ステップＳ２において、オーサリングアプリケーション実行装置１８は、編集対象のうちのメニューやタイトルを除くビデオデータについて、オペレータにより設定されたチャプターの時間情報（以下、「アクセス（チャプター）ポイント」という。）を符号化ファイルに含めてビデオ信号処理装置１４に通知する。光ディスク等を取り扱うことが可能な装置は、このチャプターを目標にしてトラックジャンプして記録内容を確認することができる。

また、例えば、ステップＳ２において、オーサリングアプリケーション実行装置１８は、編集対象のうちのメニューやタイトルを除くビデオデータについて、ＧＯＰの最大表示ピクチャー数（例えば１５ピクチャー）や、各ＧＯＰにおけるエンコード処理の配列等を符号化ファイルに含めてビデオ信号処理装置１４に通知する。

さらに、例えば、ステップＳ２において、オーサリングアプリケーション実行装置１８は、必要に応じて、マルチアングルの処理対象も符号化ファイルに含めてビデオ信号処理装置１４に通知する。

またさらに、例えば、ステップＳ２において、オーサリングアプリケーション実行装置１８は、必要に応じて、「光ディスクのディスク容量」、「ＶＴＲの開始および終了時刻」等も符号化ファイルに含めてビデオ信号処理装置１４に通知する。

このようなステップＳ２の処理により、エンコード処理に必要な各種情報を含む符号化ファイルが各内部装置にそれぞれ供給されると、処理はステップ３に進む。

ステップＳ３において、ビデオ信号処理装置１４等各内部装置のそれぞれは、この符号化ファイルに含まれる各種情報に基づいて、編集対象のうちの対応するデータをエンコードし、その結果得られる各エンコードデータのそれぞれをファイルサーバ１７に記憶する。

ステップＳ４において、マルチプレクサ１５は、ステップＳ３の処理でファイルサーバ１７に記憶された各エンコードデータのそれぞれを多重化することで、多重化ストリームファイルを生成し、ダウンローダ１６に供給する。

ステップＳ５において、ダウンローダ１６は、この多重化ストリームファイルを、ライタ２０を介して、ＤＬＴ２１、ＨＤＤ２２、及びネットワーク２３のうちの少なくとも１つに記憶させる。

以上のようにして、スタジオ側オーサリング装置１０の処理は終了となる。

次に図３を参照して、プラント側のオーサリング装置について説明する。図３は、プラント側に設置されるオーサリング装置（以下、「プラント側オーサリング装置」という。）の一構成例を示すブロック図である。この図３に示すように、プラント側オーサリング装置３０は、例えば、プリマスタリング装置３１と、フォーマッタ３２と、カッティング装置３３から構成されている。以下、図４のフローチャートを参照して、このプラント側オーサリング装置の処理例について説明する。

ステップＳ１１において、プリマスタリング装置３１は、図１のダウンローダ１６から出力され、ＤＬＴ２１、ＨＤＤ２２、又はネットワーク２３の何れかを経由して供給されたディスクイメージデータ（後述する図８のエンコードビデオデータＤ２を含む多重化ストリームファイル）を取得する。

次に、ステップＳ１２において、プリマスタリング装置３１は、取得したディスクイメージデータを、外部から与えられるコピープロテクションデータを用いて暗号化し、その結果得られる暗号化データをフォーマッタ３２に供給する。

ステップＳ１３において、フォーマッタ３２は、供給された暗号化データに対して、信号のレベル変換処理等の各種処理を施し、その結果得られる信号をカッティング装置３３に供給する。

ステップＳ１４において、カッティング装置３３は、フォーマッタ３２から供給される信号をもとに、マスターディスク３４（ディスクイメージデータが記録された光ディスクの原盤３４）を作成する。

このようにして、プラント側オーサリング装置３０の処理は終了する。

ところで、従来より、エンコード処理を効率的に処理させるために、エンコーダを複数用意し、エンコーダの台数分にビデオデータを均等に分割して、並列処理を実行する分散エンコード処理が採用されている。この分散エンコード処理によれば、複雑多岐にわたる計算処理に伴う処理時間を短縮させることが可能となり、効率的なオーサリング操作を実現することができる。

このような分散エンコード処理を行う場合、上述したように、用意したエンコーダの台数分にビデオデータを均等に配分することができるように、ビデオデータ上に分割ポイントを定め、その分割ポイントにおいてビデオデータを分割することが必要となる。しかしながら、ビデオデータの如何なる部位でも分割ポイントとすることができるわけではなく、画質に影響を与えない部位を分割ポイントとしなければならない。そして、その画質に影響を与えない分割ポイントを決定するにあたって、エンコード処理を実行する前にプリプロセスとして、画質に影響を与えずに分割可能な分割ポイント候補を検索しておくことが必要となる。

また、例えば、符号化対象のビデオデータが２−３プルダウンで収録されている場合等には、ビデオデータに繰り返し画像が含まれており、限られたディスク容量を効率的に使用するために、分割ポイント候補の検出と同様にプリプロセスとして、その繰り返し画像パターンを検出しておき、エンコード処理において繰り返し画像を間引いて処理することが好ましい。

一方で、ＡＶＣコーデック等の演算負荷の高い画像圧縮を単体または複数のエンコード処理装置を用いて圧縮する従来のオーサリング装置では、ビデオデータの取り込みと、それに伴うビデオデータ記録装置の制御と、ビデオデータの分割ポイント候補検出やプルダウンパターン検出等のプリプロセス／圧縮処理を、それぞれ別々に行う必要があった。このような従来のオーサリング装置では、リアルタイムで圧縮が可能なコーデック圧縮処理装置に比べて実時間で数倍（およそ３倍）の処理時間を要していた。

そこで、本実施の形態に係る情報処理装置では、ビデオデータの取り込み時にＶＴＲを制御しながら、処理対象であるビデオデータの特徴、すなわち、少なくとも分割ポイント候補の検出を含む符号化対象のビデオデータの特徴の抽出を行うようにしている。そして、抽出したこれらの特徴情報をデータサーバに格納しておき、符号化処理に際しての条件設定において、これらの情報を参照にして効率的にエンコードを実行できるようにしている。

以下では、先ず、本実施の形態に係る情報処理装置を適用したビデオデータ取り込み装置の構成および処理例を説明し、次に、ビデオデータ取り込み時に抽出した特徴情報をエンコード処理に活用する方法について説明する。

図５は、ビデオデータ取り込み装置の一構成例を示すブロック図である。本実施の形態に係る情報処理装置においては、ビデオデータの取り込み時に、再生装置を制御してビデオデータを確認しながら、ビデオデータの特徴を抽出するようになっている。すなわち、この図５に示されるビデオデータ取り込み装置４０は、主コントローラ４１による制御に基づき、ビデオテープレコーダ（ＶＴＲ）４７から送信されたビデオデータを、ビデオデータ入出力インタフェース４６を介して取り込み、後述するビデオデータの特徴抽出処理を経て、ビデオデータサーバ４８に格納する。また、このビデオデータ取り込み装置４０においては、主コントローラ４１の制御のもと、ビデオデータから抽出された特徴情報を、ネットワーク４９を介して補助データサーバ５０に記録するようになっている。以下、さらに詳細に説明する。

主コントローラ４１は、このビデオデータ取り込み装置４０に割り当てられた計算機により構成され、ビデオデータ取り込み装置４０全体の動作を制御する。

具体的には、例えば、図５に示すように、主コントローラ４１は、グラフィックユーザインタフェース（ＧＵＩ：Graphical User Interface）４２の管理により、図示しないオペレータの操作を受け付け、このＧＵＩ４２により管理されるＶＴＲコントロール部４３、データキャプチャコントロール部４４、分割ポイント／プルダウン検出部４５の動作を制御する。これにより、主コントローラ４１は、ＶＴＲ４７から送信される符号化対象のビデオデータを取り込むとともに、ビデオデータの特徴を抽出し、この符号化対象のビデオデータをビデオデータ入出力インタフェース４６を介して、ビデオデータサーバ４８に格納する。また、主コントローラ４１は、取り込まれたビデオデータから抽出された特徴情報を、ネットワーク４９を介して補助データサーバ５０に記録する。

具体的には、主コントローラ４１のＧＵＩ４２は、ＶＴＲコントロール部４３のＶＴＲコントロールプログラム、データキャプチャコントロール部４４のデータキャプチャコントロールプログラム、分割ポイント／プルダウン検出部４５の分割ポイント／プルダウン検出プログラムの３つのプログラムを管理している。

また、ＶＴＲコントロール部４３は、図示しないオペレータのＧＵＩ４２を介した操作を受け付け、ＶＴＲ４７の再生操作を制御する。オペレータによるビデオデータについての時間情報、すなわちスタートポイント（スタートタイムコード）と終了ポイント（エンドタイムコード）の設定がＧＵＩ４２を介してなされると、ＶＴＲコントロール部４３がその時間情報に基づいて、ＶＴＲ４７の早送り、又は巻き戻し等の再生制御処理を行う。そして、このＶＴＲコントロール部４３における処理に基づいて、データキャプチャコントロール部４４によりビデオデータ入出力インタフェース４６を経由して主コントローラ４１内部にビデオデータが取り込まれる。データキャプチャコントロール部４４は、このように、ＶＴＲコントロール部４３によるＶＴＲ４７の再生制御のもと、符号化対象となる所望のビデオデータをビデオデータ入出力インタフェース４６を介して取り込む。

また、分割ポイント／プルダウン検出部４５は、上述のようにして主コントローラ４１内部に取り込まれたビデオデータに関し、特徴情報の抽出・検出を行う。具体的には、少なくとも、分散エンコード処理を行うに際して、画質に影響を与えずにビデオデータを分割することができる分割ポイント候補の検出を行う。また、特徴情報としてはその他に、例えば２−３プルダウン処理されたビデオデータ等に存在する画像のリピートパターンに関する特徴抽出を行う。

このような構成を有する、本実施の形態に係る情報処理装置におけるビデオデータ取り込み装置は具体的に以下のような処理を実行する。

すなわち、このビデオデータ取り込み装置４０の主コントローラ４１上におけるＶＴＲコントロール部４３が、オペレータによるＧＵＩ４２を介した取り込み開始ポイント及び取り込み終了ポイントの設定に基づきＶＴＲを制御して、取り込むビデオデータを決定すると、ビデオキャプチャコントロール部４４が、ビデオデータ入出力インタフェース４６を介してビデオデータを取り込む。

ＶＴＲコントロール部４３及びデータキャプチャコントロール部４４により、ビデオデータが主コントローラ内部に取り込まれると、取り込まれたビデオデータは分割ポイント／プルダウン検出部４５に移行され、特徴が抽出される。また、一方で、分割ポイント／プルダウン検出部４５には移行せずに、ビデオデータサーバ４８に取り込むためだけの符号化対象ビデオデータがビデオデータ入出力インタフェースに出力される。したがって、データキャプチャコントロール部４４が分割ポイント／プルダウン検出部４５に送信するビデオデータは、特徴抽出するためだけに送られるデータであり、これにより、処理時間の遅延を回避することができる。

この分割ポイント／プルダウン検出部４５においては、少なくとも、分散エンコード処理を行うに際して、画質に影響を与えずにビデオデータを分割することができる分割ポイント候補の特徴が抽出・検出される。また、この分割ポイント／プルダウン検出部４５において、分割ポイント検出と共に、特徴情報として、その符号化対象ビデオデータの繰り返し画像パターンに関する特徴の抽出が行われる。具体的には、符号化対象ビデオパターンが２−３プルダウンされた素材である場合には、そのリピートフレームが出現するパターンも検出する。なお、繰り返し画像パターンは、必ずしも２−３プルダウン処理されたビデオデータに存在する画像パターンについてだけではなく、２−３プルダウン処理のされていないビデオデータの繰り返し画像パターンも含む。

このようにして、ビデオデータ取り込み時に、分割ポイント候補と、例えば２−３プルダウンの繰り返し画像パターン等の特徴情報が検出されると、これらの特徴情報はネットワーク４９上に接続された補助データサーバ５０に格納される。一方で、データキャプチャコントロール部４４からは、ビデオデータサーバ４８に格納するためのデータが、分割ポイント／プルダウン検出部４５に出力するデータとは別に送信され、ビデオデータ入出力インタフェース４６を介してビデオデータサーバ４８に格納される。そして、格納されたビデオデータは、スタジオ側オーサリング装置１０のビデオ信号処理装置１４において、エンコード処理に供される。このエンコード処理の詳細な説明については、後述する。

本実施の形態に係る情報処理装置では、多岐に及ぶエンコード処理に伴う処理時間を短縮させるために、ビデオデータを複数の単位に分割してそれぞれ単位を個別のエンコーダに割り当てて圧縮を行う分散エンコード処理の方法を採用する。そして、その分散処理において必要となる分割ポイントの検出を、上述したように、符号化対象となるビデオデータの取り込み時に行うようにしている。

すなわち、ビデオデータの取り込み時に、オペレータによるＧＵＩ４０の操作の基づきＶＴＲ４７を制御しながら、分割ポイント／プルダウン検出部４５において、ビデオデータの分割ポイント候補と、例えば２−３プルダウンの繰り返し画像パターンを抽出するようにしている。

ここで、分割ポイント候補について、図６を参照にして説明する。図６は、分割ポイント候補と分割ポイントに関する概念図である。

分割ポイントは、ビデオデータのどの部位でもよいというわけではなく、画質に影響を与えないポイントを、分散エンコード処理のプリプロセスとして検索して決定しておく必要がある。具体的な分割ポイントの一例としては、ビデオデータにおけるシーンチェンジのポイントを挙げることができる。

シーンチェンジのポイントは、シーンの切れ目となる部分であり、この部分において分割し、その前後のフレームを異なるエンコーダによってエンコード処理させたとしても、画質への影響は非常に少ない。そして、このシーンチェンジのポイントでは、一般的に大きな輝度変化が現れることが知られており、そのシーンチェンジを検出することは、前のシーンと後のシーンとを比較し、その前後のシーンの輝度変化を確認することによって容易に検出することができる。

したがって、このシーンチェンジポイントを分割ポイント候補と定め、その前後のシーンの輝度変化を抽出することで、画質に影響を与えない分割ポイント候補を容易に検出することができる。このようにして、輝度変化を利用することで、スタートポイントから終了ポイントまでのビデオデータについて、分割ポイント候補の検出を行う。

図６においては、シーンチェンジのポイントを分割ポイント候補として定め、上述のようにして輝度変化を利用することによって検出した、複数の分割ポイント候補が示されている。分散エンコード処理においては、この分割ポイント候補を参照にして、ネットワークを介して設置されているエンコーダの総数に応じて、略等間隔となるように分割し、そのポイントを分割ポイントとする。また、図６に示されるように、各分割ポイント間がネットワークを介して接続された各エンコーダが処理する分割処理区間となる。

次に、符号化対象のビデオパターンにおける繰り返し画像パターンに関する特徴抽出について、具体的に、２−３プルダウン処理されたビデオデータのプルダウンパターン（リピートパターン）検出を例に挙げて説明する。

本実施の形態に係る情報処理装置においては、上述した分割ポイント候補の検出と共に、処理対象となるビデオデータに繰り返し画像パターンが存在する場合には、その繰り返し画像パターンも特徴情報として抽出するようにしている。例えば、符号化処理対象のビデオデータが、２−３プルダウン処理されたものである場合には、２−３プルダウンのリピートパターンの抽出・検出を行うようにしている。以下、符号化対象ビデオデータにおける繰り返し画像パターンに関して、２−３プルダウン処理されたビデオデータにおけるリピートパターンを例に挙げて説明する。

ここで、２−３プルダウン処理とは、２４コマ／秒で構成されているデータを、３０フレーム／秒で構成されるＮＴＳＣ方式のテレビ・ビデオ信号に変換するために、同じフィールド画像を周期的に繰り返す処理をいう。プルダウンのパターンの位相は、ＮＴＳＣ方式のビデオデータへの変換時に決定されるが、多くの場合はパターンが規則的に変換されている。なお、ビデオデータの１フレームは、２フィールドで構成されるが、そのうちの第１フィールド（1st field）をトップフィールド（top_field）とし、第２フィールド（2nd field）をボトムフィールド（bottom_field）とする。

図７は、２−３プルダウン処理されたビデオデータの概念図である。プルダウンデータを考慮せずにエンコード処理を行うと、図６中のＢパターン及びＤパターンで複製されたフィールドデータ、すなわち繰り返し画像パターンもエンコード処理されてしまうため、ディスクサイズを大きくロスすることとなる。限られたディスク容量を効率的に使用するには、コピーされたフィールドを間引いてエンコードすることが求められる。そのため、エンコードする際には、プルダウンパターンについての特徴を検出しておき、その特徴情報をエンコードの際に利用可能なように格納しておく必要がある。

本実施の形態に係る情報処理装置においては、上述したように、プルダウンパターンをビデオデータ取り込み時に検出するようにしている。そして、その検出したプルダウンパターン情報を補助データサーバ５０に格納しておく。これにより、エンコード処理時において、そのパターン情報に基づいて繰り返しのフィールドを間引いて処理し、ビデオデータの圧縮作業の効率を高めると共に、限られたディスク容量を効率的に使用できるようにしている

具体的に、２−３プルダウン処理されたビデオデータのうちのコピーフィールドの検出方法の一例としては、例えば、取り込まれた符号化対象ビデオデータについて、その前後のフレームを比較し、現在のフレームと１つ前のフレームの、トップフィールド及びボトムフィールドの差分をもとにして、リピートフレームが出現するパターンを検出するようにする。なお、この検出方法は一例であり、これに限られるものではない。

以上のように、ビデオデータ取り込み装置４０の分割ポイント／プルダウン検出部４５においては、符号化対象のビデオデータの少なくとも分割ポイント候補を含む特徴情報が抽出される。また、上述したように、ビデオデータの特徴としては、さらにビデオデータ上の繰り返し画像パターン、例えば、２−３プルダウン処理されたビデオデータにおけるリピートパターンに関する情報も抽出される。そして、抽出された情報はネットワーク４９を介して補助データサーバ５０に記録される。また、一方でビデオデータは、ビデオデータ入出力インタフェース４６を介してビデオデータサーバ４７に格納され、エンコード処理へと進む。そして、複数のエンコーダを用いてエンコード処理する際には、このビデオデータ取り込み時に抽出した特徴に基づいて、エンコーダの総数に応じたビデオデータの分割を行い、各エンコーダで分散エンコード処理を行うようにしている。また、そのエンコード処理においては、２−３プルダウンのコピーフィールドを間引いて、処理を行うようにしている。

従来の、ＡＶＣコーデック等の演算負荷の高い画像圧縮を単体または複数の処理装置で圧縮するオーサリング装置等では、ビデオデータの取り込みと、それに伴うビデオデータ記録装置の制御と、ビデオデータのプリプロセス／圧縮処理を、それぞれ別々に実行する必要があり、多大な処理時間を要していた。

これに対し、上述したように、エンコード処理のプリプロセスとして、ＶＴＲを制御しながら、ビデオデータの取り込みと同時に分割ポイント候補や繰り返し画像パターンを検出する、本実施の形態に係る情報処理装置を好適に用いたオーサリング装置によれば、従来のオーサリング装置等に比べて、オーサリング作業工程におけるビデオデータ圧縮作業の処理時間を大幅に短縮させることができる。

また、繰り返し画像パターンに関する情報も、その符号化対象ビデオデータの取り込み時に、すなわちエンコード処理のプリプロセスとして抽出するようにしているので、処理時間の短縮化を図ることができるとともに、無駄のない効率的なエンコード処理を行うことができる。

次に、以上のようにして、特徴抽出しながら取り込まれたビデオデータの具体的な符号化処理について、抽出した情報の利用方法も含め、図８〜１０を参照にしながら説明する。

図８は、スタジオ側オーサリング装置１０のうちのビデオ信号処理装置１４の構成例を示すブロック図である。この図８に示すように、ビデオ信号処理装置１４は、例えば、主コントローラ６０、エンコーダ６７、及びモニタ装置６９から構成される。また、このビデオ信号処理装置１４には、ネットワーク１９を介して、ビデオデータサーバ４８と、圧縮データサーバ７０が接続されている。

上述したように、図２のフローチャートにおけるステップＳ１の処理で、編集リストがオーサリングアプリケーション実行装置１８からビデオ信号処理装置１４に供給される。具体的には、上述したビデオデータ取り込み装置４０にビデオデータが取り込まれると、分割ポイント候補及び２−３プルダウンのリピートパターンの特徴情報が検出され、このビデオデータはビデオデータサーバ４８に格納される。そして、ビデオデータサーバ４８は、オーサリングアプリケーション実行装置１８により通知された編集リストに従って、ビデオ信号処理装置１４に入力ビデオデータファイルを提供し、処理対象のビデオデータＤ１をエンコーダ６７に出力する。また同時に、編集リストは、ビデオ信号処理装置１４の主コントローラ６０に供給される。

エンコーダ６７は、オーサリングアプリケーション実行装置１８から主コントローラ６０を介して通知される各種エンコード条件に従って動作を切り換え、ビデオデータサーバ４８から出力されるビデオデータＤ１に対して、例えばＭＰＥＧの手法によるエンコード処理を施す。このとき、各種エンコード条件の設定が主コントローラ６０により可変制御されることにより、エンコーダ６７からの発生ビット量が制御されるようになされている。

また、エンコーダ６７は、このエンコード処理の結果を主コントローラ６０に通知する。これにより、主コントローラ６０は、エンコーダ６７のエンコード処理で使用されたピクチャータイプや、そのエンコード処理における発生ビット量をフレーム単位で検出することができる。

さらに、エンコーダ６７は、本実施の形態において適用される２パスエンコードが行われる場合、１パス目と２パス目の何れのエンコード処理も実行する。

具体的に説明すると、例えば、エンコーダ６７は、２パス目のエンコード処理で利用されるエンコード条件を事前に設定するために、１パス目のエンコード処理、例えば後述する図１０のフローチャートにおけるステップＳ５９の処理の一部であるエンコード処理を実行する。エンコーダ６７は、この１パス目のエンコード処理においては、自分自身の内部処理でピクチャータイプを割り振り、その割り振ったピクチャータイプを利用してビデオデータＤ１に対して１パス目のエンコード処理を施す。そして、その１パス目のエンコード処理の結果に基づき、例えば各フレームのピクチャータイプや発生ビット量等をエンコードマネージャ６２に通知する。

一方、エンコーダ６７は、２パス目のエンコード処理、例えば後述する図１０のフローチャートのステップＳ６１のエンコード処理においては、次のような処理を実行する。すなわち、エンコーダ６７は、主コントローラ６０により設定された各フレーム単位のピクチャータイプと目標ビット量とを指定して、２パス目のエンコード処理をビデオデータＤ１に対して施し、その結果得られるエンコードビデオデータＤ２を、ネットワーク１９を介して圧縮データサーバ７０に記憶させる。このとき、エンコーダ６７は、圧縮データサーバ７０に記憶されたエンコードビデオデータＤ２のデータ量等を主コントローラ６０に通知する。

なお、２パスエンコード処理の詳細については、図１０のフローチャートを用いて後述する。

モニタ装置６９は、例えばディスプレイ装置等で構成され、圧縮データサーバ７０に記録されたエンコードビデオデータＤ２を、デコードコントロール部６６で伸張したビデオデータに対応する映像を表示する。すなわち、主コントローラ６０の制御に基づいて、デコードコントロール部６６が圧縮データサーバ７０に記録されたエンコードビデオデータＤ２を伸張すると、その結果得られるビデオ信号をモニタ装置６９に供給する。モニタ装置６９は、供給されたビデオ信号に対応する映像、すなわち、エンコードビデオデータＤ２に対応する映像を表示する。

これにより、オペレータは、エンコーダ６７の処理結果をモニタ装置６９で必要に応じて確認することができる。すなわち、ビデオ信号処理装置１４は、モニタ装置６９を利用して、エンコーダ６７の処理結果のプレビューを行うことができる。さらに、オペレータは、このプレビュー結果に基づいて主コントローラ６０をＧＵＩ６１を介して操作することで、各種エンコードの詳細な条件を細かく変更することができる。

主コントローラ６０は、例えば、このビデオ信号処理装置１４に割り当てられたコンピュータにより構成される。主コントローラ６０は、オーサリングアプリケーション実行装置１８との間でネットワーク１９を介するデータ通信を行うことで、このビデオ信号処理装置１４全体の動作を制御する。

ここで、本実施の形態に係る情報処理装置を適用したオーサリング装置のビデオ信号処理装置１４では、上述したように、符号化対象のビデオデータを複数の単位に分割し、それぞれの単位を複数のエンコーダに割り当てて符号化を行う分散エンコード処理を採用している。このように、分散エンコード処理を採用することにより、多岐にわたる符号化処理に伴う処理時間を大幅に短縮させることができるようになっている。

図９は、分割したビデオデータを複数のエンコーダに割り当ててエンコード処理を行う分散エンコード処理を採用したビデオ信号分散処理装置の一構成例を示すブロック図である。この図９に示すように、ビデオ信号分散処理装置１４’は、主コントローラ６０’と、この主コントローラ６０’とネットワーク１９を介して接続されているリモートエンコーダ６７_１〜６７_ｎとから構成されている。また、主コントローラ６０’には、ネットワーク１９を介して、取り込まれた符号化対象ビデオデータを格納しているビデオデータサーバ４８と、各リモートエンコーダがそれぞれ処理したエンコードビデオデータＤ２を格納する圧縮データサーバ７０とが接続されている。

また、このビデオ信号分散処理装置１４’の主コントローラ６０’内には、エンコードリモートコントロール部６５’が構成されている。このエンコードリモートコントロール部７１は、ネットワーク１９を介して接続された各リモートエンコーダ６７_１〜６７_ｎのエンコード処理を制御する。

そして、この図９に示すビデオ信号分散処理装置１４’の主コントローラ６０’と主コントローラ６０’内のエンコードリモートコントロール部６５’が、図８のビデオ信号処理装置１４における主コントローラ６０と主コントローラ６０内のエンコードコントロール部６５にそれぞれ相当する。すなわち、主コントローラ６０’が、オーサリングアプリケーション実行装置１８との間でネットワーク１９を介するデータ通信を行うことで、このリモートエンコーダ６７_１〜６７_ｎを含めて、ビデオ信号分散処理装置１４’全体の動作を制御する。

したがって、図８には１つのエンコーダ６７しか図示していないが、図９に示すように複数のリモートエンコーダ６７_１〜６７_ｎがネットワークを介して接続されているものと同様であると解釈できることから、以下では、分散エンコード処理を図８のビデオ信号処理装置１４を用いて行う例について説明を続ける。

ビデオ信号処理装置１４の主コントローラ６０には、例えば図８に示されるように、グラフィカルユーザーインターフェース（ＧＵＩ：Graphical User Interface）６１、エンコードマネージャ６２、ウェイトコントロール部６３、マルチパスコントロール部６４、エンコードコントロール部６５、及びデコードコントロール部６６が設けられている。

すなわち、主コントローラ６０は、オーサリングアプリケーション実行装置１８からの制御とオペレータの操作とのそれぞれをＧＵＩ６１の管理により受け付け、また、このＧＵＩ６１により管理されるエンコードマネージャ６２及びエンコードコントロール部６５によりエンコーダ６７の動作を制御する。

これにより、主コントローラ６０は、符号化ファイルに基づいて各種エンコードの詳細な条件の設定を更新することができる。また、例えばこのようにして設定あるいは更新された各種エンコード条件に従ったエンコード処理を、エンコーダ６７が処理対象のビデオデータＤ１に対して施すことを制御する。さらに、エンコーダ６７から通知されたエンコード処理の結果を受け取り、そのエンコード処理の結果をオーサリングアプリケーション実行装置１８に通知する。

このようにして、主コントローラ６０は、オーサリングアプリケーション実行装置１８から通知される編集リストに従って、ビデオデータサーバ４８内のビデオデータファイルを制御し、所望とする編集対象を再生する。なお、以下、他の内部装置に供給される符号化ファイルと区別するために、ビデオ信号処理装置１４に供給される符号化ファイルを、符号化ファイルＶＥＮＣ．ＸＭＬと称する。

分散エンコード処理を採用している当該ビデオ信号処理装置１４においては、ウェイトコントロール部６３が主コントローラ６０に設けられている。ウェイトコントロール部６３は、オーサリングアプリケーション実行装置１８から通知される符号化ファイルＶＥＮＣ．ＸＭＬに従って、エンコード処理のビットレート条件を各エンコーダ６７（リモートエンコーダ６７_１〜６７_ｎ）単位で決定し、このエンコード処理条件による最大割り当てデータサイズ等の制御データをマルチパスコントロール部６４に通知する。マルチパスコントロール部６４は、符号化処理におけるビット配分の設定と、設定した条件をオペレータのＧＵＩ６１を介した操作に応動して変更する。

マルチパスコントロール部６４は、例えば、オーサリングアプリケーション実行装置１８から通知される符号化ファイルＶＥＮＣ．ＸＭＬに従って、各種エンコード条件を設定し、このエンコード条件に対応する制御データをエンコードコントロール部６５に通知する。このとき、マルチパスコントロール部６４は、例えば、オペレータによるＧＵＩ６１の操作に応じて、各種エンコード条件の設定を変更することができる。

マルチパスコントロール部６４が設定するエンコード条件としては、例えば、１パス目のエンコード処理で利用される第１のエンコード条件と、２パス目のエンコード処理で利用される第２のエンコード条件とが該当する。第１のエンコード条件の中には、例えば、エンコーダ６７が１パス目のエンコード処理を実行する際にその内部処理でピクチャータイプを設定するために必要な各種条件等が含まれる。一方、第２のエンコード条件の中には、例えば、２パス目のエンコード処理で利用される各フレームのそれぞれのピクチャータイプや目標ビット量等が含まれる。

エンコードコントロール部６５は、マルチパスコントロール部６４より通知される制御ファイルに従って、各エンコーダ６７（リモートエンコーダ６７_１〜６７_ｎ）の符号化処理を制御する。また、各エンコード処理に要する難易度のデータをフレーム単位で各エンコーダ６７（リモートエンコーダ６７_１〜６７_ｎ）に通知するとともに、圧縮データサーバ７０に圧縮されたエンコードビデオデータＤ２を記録する。

また、エンコードコントロール部６５は、例えば、後述する２パスエンコードが実行される場合には、次のような処理を実行する。

すなわち、エンコードコントロール部６５は、オーサリングアプリケーション実行装置１８から通知される制御ファイルに従って、エンコーダ６７の１パス目と２パス目のそれぞれのエンコード処理を制御する。

また、エンコードコントロール部６５は、エンコーダ６７による１パス目のエンコード処理の結果から、エンコード処理に要する困難度とピクチャータイプとのそれぞれをフレーム単位で検出し、その検出結果をマルチパスコントロール部６４に通知する。マルチパスコントロール部６４は、通知されたフレーム毎の困難度とピクチャータイプとを利用して、２パス目のエンコード処理で利用される第２のエンコード条件を設定する。なお、困難度については後述する。

さらに、エンコードコントロール部６５は、エンコーダ６７の最終的な２パス目のエンコード処理の結果得られたエンコードビデオデータＤ２を、ネットワーク１９を介して圧縮データサーバ７０に記憶させることを制御する

以上、本実施の形態に係る情報処理装置を適用したオーサリング装置のビデオ信号処理装置１４の構成例について説明した。

次に、図１０のフローチャートを参照にして、本実施の形態に係る情報処理装置により実行される処理について、上述したビデオ信号処理装置１４における２パスエンコード処理を含め、説明する。なお、本実施の形態に係る情報処理装置は、上述したように、エンコード処理時間を短縮させるため、ビデオデータを複数の単位に分割し、それぞれの単位を個別の計算装置に割り当てて圧縮を行う、いわゆる分散エンコード処理を行う。

ステップＳ５０の処理では、ビデオデータ取り込み装置４０において、ビデオデータの取り込み開始操作が行われる。ビデオデータ取り込み装置４０の主コントローラ４１上のＧＵＩ４２において、オペレータによる時間情報、すなわちスタートポイント（スタートタイムコード）と終了ポイント（エンドタイムコード）の設定がなされると、ＶＴＲコントロール部４３がその時間情報に基づいて、ＶＴＲ４７の早送り、又は巻き戻し等の再生制御処理を行う。そして、ＶＴＲコントロール部４３における処理に基づいて、データキャプチャコントロール部４４によりビデオデータ入出力インタフェース４６を経由して主コントローラ４１内部にビデオデータが取り込まれる。

次に、ステップＳ５１において、エンコード処理のプリプロセスとして、取り込まれた符号化対象ビデオデータの分割ポイントの検出及び記録が行われる。ビデオデータ入出力インタフェース４６を経由して主コントローラ４１に取り込まれた符号化対象ビデオデータは、その主コントローラ４１内部に存在する分割ポイント／プルダウン検出部４５に送信され、その分割ポイント／プルダウン検出部４５において、分割エンコード処理を行うための分割ポイント候補の検出が行われる。

分割エンコード処理を行うに際し、その分割ポイントは、ビデオデータのどの部位でもよいというわけではなく、画質に影響を与えない部位を分割ポイントとして分割する必要がある。例えば、分割ポイントの一例としては、ビデオデータにおけるシーンチェンジのポイントを挙げることができる。以下では、シーンチェンジのポイントを分割ポイントとして検出する例について説明する。

シーンチェンジのポイントでは、一般的に大きな輝度変化が現れる。このことから、前のシーンと後のシーンとを比較し、その前後のシーンの輝度変化を確認することによってシーンチェンジを検出することができる。したがって、このシーンチェンジポイントを分割ポイント候補とし、その前後のシーンの輝度変化を抽出することで、分割ポイント候補を容易に検出することができる。

このようにして、スタートポイントから終了ポイントまでのビデオデータについて、分割ポイント候補の検出を行う。

そして、取り込まれた符号化対象ビデオデータについての分割ポイント候補を検出すると、この分割ポイント候補に関する情報は、ビデオデータ取り込み装置４０とネットワーク４９を介して接続された補助データサーバ５０に記録される。

次に、ステップＳ５２において、取り込まれた符号化対象ビデオデータが、２−３プルダウンにより伸張されたデータであるか否かを判定する。取り込まれたビデオデータが２−３プルダウンされた素材であった場合（ステップＳ５２においてＹＥＳの場合）には、ステップＳ５３に進む。

具体的には、ステップＳ５２において、取り込まれたビデオデータが２−３プルダウンされた素材であった場合、ステップＳ５３において、プルダウンパターンの検出及び記録が行われる。すなわち、このステップＳ５３では、例えば、取り込まれたビデオデータについて、その前後のフレームを比較し、現在のフレームと１つ前のフレームの、トップフィールド及びボトムフィールドの差分をもとにして、リピートフレームが出現するパターンを検出する。このようにして検出された２−３プルダウンパターンは、分割ポイント候補に関する情報と共に、ネットワーク４９に接続された補助データサーバ５０に記録され、ステップＳ５４に進む。

一方、ステップＳ５２において、取り込まれビデオデータが、２−３プルダウンされた素材ではない場合（ステップ５２においてＮＯの場合）には、そのままステップＳ５４に進む。なお、上述の例では、２−３プルダウン処理に伴う繰り返し画像パターンの検出について説明したが、これに限られるものではない。すなわち、２−３プルダウン処理されていないビデオデータであった場合でも、繰り返し画像パターンが存在する場合には同様にして、その繰り返し画像パターン、すなわち特徴を抽出することができる。

ステップＳ５４では、上記ステップによる分割ポイント候補及び２−３プルダウンパターンの検出が終了した非圧縮の状態のビデオデータの書き込みが行われる。具体的には、このビデオデータは、ビデオデータ取り込み装置４０のビデオデータ入出力インタフェース４６を介してビデオデータサーバ４８に記録され、ステップＳ５５に進む。このようにして、本実施の形態に係る情報処理装置は、このようにしてビデオデータサーバ４８に記録されたビデオデータＤ１をビデオ信号処理装置１４においてエンコード処理していく。

ステップＳ５５においては、ビデオデータＤ１のエンコード処理に先立ち、エンコード条件の入力設定を行う。具体的には、ビデオデータサーバ４８からビデオ信号処理装置１４の主コントローラ４１にビデオデータＤ１が供給されると、主コントローラ４１は、オーサリングアプリケーション実行装置１８から供給された符号化ファイルＶＥＮＣ．ＸＭＬから、編集対象のビデオデータＤ１のエンコード処理に必要な各種情報を取得する。

例えば、ステップＳ５５の処理では、符号化ファイルＶＥＮＣ．ＸＭＬに含まれる上述した各種情報のうちの、「アクセス（チャプター）ポイント」、「ディスク容量」、「ＶＴＲの開始および終了時刻」、「ビデオデータＤ１に割り当て可能なデータ量」等の情報が取得される。また、本実施の形態に係る情報処理装置のおいては、分散エンコード処理を採用していることから、使用可能なリモートエンコーダ６７_１〜６７_ｎの総数ｎに関する情報も取得される。

ステップＳ５５においてエンコード処理に必要な各種の情報が取得されると、次にステップＳ５６に進む。

ステップＳ５６では、分散エンコード処理を行うに際しての、分割数及び分割ポイントの決定を行う。本実施の形態に係る情報処理装置においては、上述したように、エンコード処理時間を短縮させるためにビデオデータを複数の単位に分割し、それぞれの単位を複数の個別のエンコーダに割り当ててエンコード処理を行う分散処理を採用している。この分散エンコード処理にあたって、ビデオデータサーバ４８から供給された符号化対象ビデオデータを分割するために、ステップＳ５１にて検出し、補助データサーバ５０に記録したビデオデータの分割ポイント候補に関する情報を参照にして、ビデオデータＤ１を分割する。

すなわち、ステップＳ５５において、図示しない初期設定処理で登録したリモートエンコーダの識別名またはＩＰＡｄｄｒｅｓｓ情報から取得した、分散エンコード処理において使用可能なリモートエンコーダの総数ｎに関する情報を取得すると、図６に示したような各リモートエンコーダ６７_１〜６７_ｎに略等間隔となるような分割ポイントを、補助データサーバ５０に記録されている分割ポイント候補に関する情報を参照しながら決定していく。

このように、本実施の形態に係る情報処理装置においては、エンコード処理のプリプロセスとして抽出したビデオデータの特徴情報を参照にして、エンコードの条件を設定していく。これにより、このエンコードの段階において特徴情報を抽出していた従来のオーサリング処理装置に比べて、その特徴抽出処理をプリプロセスとして既に行っていることから、エンコード処理時間の大幅な短縮化を図ることができる。

次に、ステップＳ５７において、エンコード処理を実行するビデオデータＤ１が、２−３プルダウンで伸張されたデータであるか否かを判定する。そして、ビデオデータＤ１が、２−３プルダウンデータである場合（ステップＳ５７においてＹＥＳの場合）には、ステップＳ５８に進む。

ステップＳ５８においては、２−３プルダウンデータであるビデオデータＤ１のうちから、コピーフィールドを間引く処理を行う。その際、ステップＳ５３にてエンコード処理のプリプロセスとして検出し、補助データサーバ５０に記録したビデオデータＤ１のプルダウンパターンに関する情報を参照することによって処理を行う。

このように、ステップＳ５８においては、限られたディスク容量を効率的に使用するために、ビデオデータの取り込み時にプリプロセスとして検出し、記録した情報に基づいて、２−３プルダウンのコピーされたフィールドを間引く。そして、その間引いたビデオデータをエンコードするようにしている。本実施の形態に係る情報処理装置は、このように、エンコードを実行する際には、２−３プルダウンパターンに関する情報が確定していることから、従来のオーサリング装置に比べて、処理時間の短縮化を図ることができるとともに、ディスク容量の無駄を省き、効率的なエンコード処理が行えるようになっている。

以上のようにして、２−３プルダウンデータにおけるコピーフィールドを間引く処理を行うと、次にステップＳ５９に進む。また、ステップＳ５７において、エンコード処理を実行するビデオデータが２−３プルダウンで伸張されたデータではない場合（ステップＳ５７においてＮＯの場合）には、そのままステップＳ５９に進む。

ステップＳ５９においては、ビデオ信号分散処理装置１４における主コントローラ６０は、ネットワーク１９で接続された各エンコーダ６７（６７_１〜６７_ｎ）を制御し、ステップＳ５５の処理で取得された各種情報により設定される第１のエンコード条件に従った１パス目のエンコード処理を、編集対象のビデオデータＤ１に対して施す。そして、その結果得られる第１のエンコードビデオデータから、エンコード処理に要する困難度とピクチャータイプとのそれぞれをフレーム単位で検出する。

具体的には、ステップＳ５６において略等間隔に分割した編集対象のビデオデータＤ１が各エンコーダ６７（６７_１〜６７_ｎ）に出力されると、各エンコーダ６７（６７_１〜６７_ｎ）は、このビデオデータＤ１を構成する各フレームのそれぞれのピクチャータイプを設定する。すなわち、各エンコーダ６７（６７_１〜６７_ｎ）は、主コントローラ６０からの指示により指定されたフレームをＩピクチャに設定する。さらに、各エンコーダ６７（６７_１〜６７_ｎ）は、ステップＳ５５の処理で取得されたシーンチェンジに関する情報に基づき、その前後のフレームの相関関係からシーンチェンジと判定されたフレームを強制的にＩピクチャに設定する。そして、各エンコーダ６７（６７_１〜６７_ｎ）は、Ｉピクチャに設定されたフレームから、次のＩピクチャの直前のフレームまでのフレーム群をクローズＧＯＰとして設定していく処理を実行する。

また、各エンコーダ６７（６７_１〜６７_ｎ）は、このようにして設定されたピクチャータイプを使用して、ビデオデータＤ１を構成する各フレームのそれぞれに対して、固定量子化ステップによる１パス目のエンコード処理を順次施していく。そして、各エンコーダ６７（６７_１〜６７_ｎ）は、その際に発生するビット量、すなわち、各フレームのそれぞれがエンコードされた際の発生ビット量のそれぞれを、主コントローラ６０に通知するとともに、各フレームのピクチャータイプを主コントローラ６０に通知する。

主コントローラ６０は、各エンコーダ６７（６７_１〜６７_ｎ）からのこの通知により、困難度とピクチャータイプとのそれぞれをフレーム単位で検出する。すなわち、主コントローラ６０は、各エンコーダ６７（６７_１〜６７_ｎ）から通知された各フレームのピクチャータイプを、そのまま各フレームのピクチャータイプとして検出する。また、主コントローラ６０は、各エンコーダ６７（６７_１〜６７_ｎ）から通知された各フレームの発生ビット量のそれぞれを、各フレームのそれぞれの困難度として検出（測定）する。

ここで、本明細書でいう困難度とは、固定量子化ステップによるエンコード処理が編集対象のビデオデータＤ１に対して施された際の、エンコード処理後の各フレームのそれぞれのデータ量を指す。

すなわち、フレーム間エンコード処理（ＰまたはＢピクチャのエンコードタイプ）においては動きの激しい部分で予測フレームからの予測誤差（差分）が大きくなり、その分、画質劣化を低減させるために多くのデータが必要となる。また、フレーム内符号化処理（Ｉピクチャのエンコードタイプ）においては、高周波数成分が多い場合に、ディスクリートコサイン変換処理により高次の係数データが発生することにより、その分、画質劣化を低減させるために多くのデータ量が必要となる。したがって、固定量子化ステップによるエンコード処理がビデオデータＤ１に対して施された場合、画質劣化を低減させるための多くのデータ量を要する部分（フレーム）において、多くのデータ量が検出されることになる。以上のことから、固定量子化ステップによるエンコード処理が編集対象のビデオデータＤ１に対して施された結果得られるエンコードビデオデータＤ２を構成する各フレームのデータのそれぞれのデータ量が、各フレームのそれぞれについての困難度を指すことになる。

このようなステップＳ５９の一連の処理が終了すると、処理はステップＳ６０に進む。ステップＳ６０においては、主コントローラ６０は、ステップＳ５９の処理によりフレーム単位で検出された困難度とピクチャータイプとを用いてビット配分計算処理を実行し、目標ビット量をフレーム単位で設定する。

ここで、ビット配分計算処理とは、例えば、ステップＳ５９の処理で検出された各フレームの困難度とピクチャータイプとを用いて、編集対象のビデオデータＤ１に対して２パス目のエンコード処理が施された場合に得られるエンコードビデオデータＤ２全体の目標ビット量を、各フレームのそれぞれに割り振るための計算処理をいう。

すなわち、ステップＳ６０において、主コントローラ６０は、ビデオデータＤ１（エンコードビデオデータＤ２）に対して実際に割り当て可能な総ビット量TOTAL_SUPPLYを計算する。

TOTAL_SUPPLY=TOTAL_BYTES−TOTAL_HEADER・・・（１）

式（１）において、TOTAL_BYTESは、ステップＳ５５の処理で取得された「ビデオデータＤ１に割り当て可能なデータ量」を示し、ネットワーク１９上のファイルサーバ１７に記録されるエンコードビデオデータＤ２全体の目標データ量に相当する。また、TOTAL_HEADERは、エンコードビデオデータＤ２のうちのヘッダー等の付随的なデータのデータ量を示しており、ＧＯＰの総数により特定されるデータ量である。

したがって、主コントローラ６０は、この式（１）の演算処理により、エンコードビデオデータＤ２のうちの付随的なデータを除いたデータに対して割り当て可能なデータ量を、ビデオデータＤ１に対して実際に割り当て可能な総ビット量TOTAL_SUPPLYとして計算することになる。

次に、主コントローラ６０は、ビデオデータＤ１に対して実際に割り当て可能な総ビット量TOTAL_SUPPLYを、各エンコード処理単位（エンコードユニット）のそれぞれに分配する。なお、以下、このようにして分配された各エンコードユニットのそれぞれのデータ量を、対応するエンコードユニットの目標ビット量といい、SUPPLY_BYTESと記述する。

また、主コントローラ６０は、各エンコードユニットのそれぞれについて、対応するエンコードユニットに属する各フレームの困難度（ステップＳ５９の処理で検出された困難度）の総和を演算する。なお、以下、各フレームの困難度をDIFと記述し、また、各困難度DIFの総和をDIF_SUMと記述する。

続いて、主コントローラ６０は、各エンコードユニットのそれぞれについて、ＧＯＰ単位のビット配分を行うための評価関数を計算する。ここでの評価関数は、例えば次の式（２）で表される。

Y= BX・・・（２）

式（２）において、Ｙは、演算対象のエンコードユニットの目標ビット量SUPPLY_BYTESを示し、Ｘは、演算対象のエンコードユニットに属する各フレームの困難度DIFの総和DIF_SUMを示している。

主コントローラ６０は、このようにして式（２）の評価関数を設定すると、換言すると、式（２）の評価関数における係数Ｂを演算すると、各エンコードユニットのそれぞれについて、この係数Ｂを用いる次の式（３）の演算処理を順次実行していく。

ＧＯＰ＿ＴＧＴ＝Ｂ×ＧＯＰ＿ＤＩＦ＿ＳＵＭ・・・（３）

なお、式（３）において、GOP_DIF_SUMは、演算対象のＧＯＰに属する各フレームの困難度DIFの総和を示している。また、GOP_TGTは、演算対象のＧＯＰの目標ビット量を示している。

すなわち、演算対象のＧＯＰの目標ビット量GOP_TGTとは、演算対象のＧＯＰが含まれるエンコードユニットの目標ビット量SUPPLY_BYTESの中から、演算対象のＧＯＰの困難度GOP_DIF_SUMに応じて演算対象のＧＯＰに配分された分のデータ量を指す。

主コントローラ６０は、対象のＧＯＰの目標ビット量GOP_TGTを、対象のＧＯＰに属する各フレームのそれぞれに割り振る処理を各ＧＯＰのそれぞれについて実行することで、各フレームの目標ビット量をそれぞれ設定する。

以上の一連の処理が、ステップＳ６０において実行されるビット配分計算処理である。このように、ステップＳ６０のビット配分計算処理では、１パス目のエンコード処理結果（ステップＳ５９の処理結果）を基準にして、２パス目のエンコード処理で利用される第２のエンコード条件のひとつである、目標ビット量が設定される。

このようにして、ステップＳ６０の処理が終了すると、次にステップＳ６１に進む。ステップＳ６１においては、主コントローラ６０は、ステップＳ６０のビット配分計算処理により設定されたフレーム毎の目標ビット量と、ステップＳ５９の処理で検出された各フレームのピクチャータイプとを少なくとも含む第２のエンコード条件を設定し、エンコード処理を実行する（２パス目のエンコード処理を実行する）。

次に、ステップＳ６２において、主コントローラ６０は、この第２のエンコード条件に従った２パス目のエンコード処理が編集対象のビデオデータＤ１に対して施された場合に得られるはずの第２のエンコードビデオデータＤ２のプレビュー処理を実行することによって、画質のチェックを行う。

ステップＳ６２におけるプレビュー処理とは、例えば下記の一連の処理をいう。すなわち、上述したように、ビデオデータサーバ４８が、オペレータのＧＵＩ６１の操作に基づく主コントローラ６０の制御に応動して、編集対象のビデオデータＤ１を各エンコーダ６７（６７_１〜６７_ｎ）に供給する。各エンコーダ６７（６７_１〜６７_ｎ）が、第２のエンコード条件に従ってこのビデオデータＤ１を一旦エンコードし、その結果得られるエンコードビデオデータＤ２をネットワーク１９に出力せずに再デコードして、その結果得られるビデオ信号をモニタ装置６９に供給する。モニタ装置６９は、このビデオ信号に対応する映像を表示する。すなわち、第２のエンコード条件に従った２パス目のエンコード処理が編集対象のビデオデータＤ１に対して施された場合に得られるはずの第２のエンコードビデオデータＤ２に対応する映像が、モニタ装置６９にプレビュー映像として表示される。

このようにして、２パス目のエンコード処理によるエンコードビデオデータＤ２のプレビュー処理を行い、画質チェックを行うと、次にステップＳ６３に進む。

ステップＳ６３において、主コントローラ６０は、オペレータの画質評価が「ＯＫ」であるか否かを判定する。すなわち、オペレータは、ステップＳ６２の処理により、モニタ装置６９に表示されるプレビュー映像、すなわち、エンコードビデオデータＤ２に対応する映像の画質の評価を行い、その評価結果を、ＧＵＩ６１を操作することで主コントローラ６０に入力させる。例えば、オペレータが画質に満足して、ＧＵＩ６１を操作して２パス目のエンコード処理の開始を指示すると、ステップＳ６３において、オペレータの画質評価が「ＯＫ」であると判定されて（ステップＳ６３においてＹＥＳの場合）、処理はステップＳ６６に進む。

ステップＳ６６においては、主コントローラ６０は、２パス目のエンコード処理によりエンコードビデオデータＤ２を、ネットワーク１９を介して圧縮データサーバ７０に記憶させとともに、２パス目のエンコード処理の結果をオーサリングアプリケーション実行装置１８に通知する等の後処理を実行する。このようにして、ステップＳ６６において後処理が完了すると、エンコード処理は終了する。

これに対して、オペレータが、ステップＳ６２のプレビュー処理によりモニタ装置６９に表示されているプレビュー映像、すなわち、圧縮データサーバ７０に記憶される前のエンコードビデオデータＤ２に対応する映像の画質に満足せず、例えば、ＧＵＩ６１を操作して変更・修正の処理を選択すると、ステップＳ６３において、オペレータの画質評価が「ＯＫ」ではないと判定され（ステップＳ６３においてＮＯの場合）、処理はステップＳ６４に進む。

ステップＳ６４においては、主コントローラ６０は、２パス目のエンコード処理におけるパラメータの変更を行う。

具体的には、主コントローラ６０は、オペレータによるＧＵＩ６１の操作に応動して、部分的にエンコード条件を変更することにより、部分的に画質を変更する処理を行う。また、主コントローラ６０は、上述のステップＳ６０と同様のビット配分計算処理を再実行することで、その修正又は変更したいビデオデータＤ１の一部の目標ビット量の設定を更新する。なお、このステップＳ６４におけるビット配分計算処理では、直前のエンコード条件の変更に伴う部分的な画質変更の結果を利用する。

このようにして、ステップＳ６４において、修正又は変更したい一部のビデオデータのエンコード条件等を変更すると、ステップＳ６５に進み、そのエンコード条件を更新した一部のビデオデータについて２パス目（エンコード条件によっては１パス目から）のエンコード処理による部分再エンコード処理を施す。

この部分再エンコードは、変更・修正したい部分を含む、図６に示される分割処理区間を単位として行われる。そして、その部分エンコードした分割処理区間を入れ替えて圧縮データを結合させる。

ここで、部分エンコード処理に際しての処理単位についてより詳細に説明する。本エンコーダは、部分エンコードの際の利便性を考慮して、一定の間隔でバッファの占有量を制限する機能を持っている。この機能により、別々にエンコードされたストリームを結合した場合でも、接合ポイントでバッファ占有量の破綻が生じないようになっている。この一定間隔で挿入されるバッファリセットポイントをＲＡＰ（Ramdam Access Point）という。

上述してきたような、複数のエンコードを利用して分散エンコード処理を行う場合における最も効率がよい分割エンコード単位は、データ入れ替え区間を包含する最短のＲＡＰ間である。しかしながら、このＲＡＰ間における再エンコードでは、ストリームの連結を考慮したバッファ占有量制御機能が働くために、発生ビット量が抑えられ、その結果として画質の低下が発生してしまうこととなる。したがって、本実施の形態における情報処理装置においては、この画質低下の問題を回避するために、本エンコーダでは、やり直しを行う部分エンコードの区間を、上述したＲＡＰの最少区間ではなく、変更・修正区間を包含する分散エンコードの区間としている。すなわち、符号化対象ビデオデータの取り込み時に抽出した特徴情報としての分割可能な分割ポイント候補を参照にして決定した分割ポイントの単位で、部分エンコード処理を行うこととしている。これにより、変更・修正する部分エンコード処理の前の画質と同等の画質を実現することができ、画質低下の問題を解決することが可能となる。

ステップＳ６５において、上述した部分エンコード処理を施すと、ステップＳ６２に戻り、それ以降の処理が繰り返される。

以上、本実施の形態に係る情報処理装置の処理例について説明した。このように、本実施の形態に係る情報処理装置は、分散エンコード処理を実行するにあたり、プリプロセスとして、符号化対象のビデオデータの取り込み時に、例えば、シーンチェンジとなる部分を分割ポイント候補として検出し、さらに、２−３プルダウン処理されたビデオデータ等における繰り返し画像パターンを検出し、これらの検出したビデオデータの特徴情報を補助データサーバ５０に記録するようにしている。

従来のオーサリング装置等では、これらの分割ポイント候補や繰り返し画像パターンを、エンコード条件の設定時に、または２パスエンコード処理が実行される場合には難易度測定時に自動検出していた。すなわち、従来のオーサリング装置では、ビデオデータの取り込みと、それに伴うビデオデータ記録装置の制御と、ビデオデータのプリプロセス／圧縮処理を、それぞれ別々に行う必要があり、リアルタイムでの圧縮することができずに多大な処理時間を要していた。

これに対し、本実施の形態に係る情報処理装置によれば、分割ポイント候補に関する情報や、また繰り返し画像パターン等に関する特徴情報を、エンコード処理のプリプロセスとしてビデオデータの取り込み時に再生装置を制御しながら検出し、特徴抽出したビデオデータをビデオデータサーバに記録するとともに、検出した情報を補助データサーバに記録するようにしている。これにより、取り込んだビデオデータＤ１をリアルタイムで効率的にエンコード処理することができ、従来のオーサリング装置等に比して、数倍速い時間でオーサリング処理を施すことが可能となる。また、限られたディスク容量内において、無駄のない効率的なエンコード処理を、短い処理時間で実行することができる。

ここで、上述した一連の処理は、ハードウエアにより実行させることもできるが、ソフトウェアにより実行させることができる。

このように、ソフトウェアにより実行させる場合、図１のスタジオ側オーサリング装置１０全体、又はその一部分は、例えば図１１に示されるようなコンピュータとして構成することができる。なお、スタジオ側オーサリング装置１０の一部分とは、例えば、図５のビデオデータ取り込み装置４０全体のときもあるし、またはそのビデオデータ取り込み装置４０一部分、例えば、主コントローラ４１等のときもある。

図１１において、ＣＰＵ（Central Processing Unit）１０１は、ＲＯＭ（Read Only Memory）１０２に記録されているプログラム、又は記憶部１０８からＲＡＭ（Random Access Memory）１０３にロードされたプログラムに従って各種の処理を実行する。ＲＡＭ１０３にはまた、ＣＰＵ１０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

例えば、図５の主コントローラ４１が図１１のコンピュータで構成される場合、ＶＴＲコントロール部４３、データキャプチャコントロール部４４、分割ポイント／プルダウン検出部４５等は、ＣＰＵ１０１が実行するプログラムとして構成することができる。

ＣＰＵ１０１、ＲＯＭ１０２、及びＲＡＭ１０３は、バス１０４を介して相互に接続されている。このバス１０４にはまた、入出力インタフェース１０５も接続されている。入出力インタフェース１０５には、入力部１０６、出力部１０７、記憶部１０８、及び通信部１０９が接続されている。

入力部１０６は、例えば、出力部１０７の表示部も兼ねたタッチパネル、キーボード、受光部を含むリモートコントローラ、マウスなどの入力機器で構成される。

出力部１０７は、例えばディスプレイ等の表示部単体、スピーカやヘッドフォン出力端子等の音声出力部単体、または、それらの組合せで構成される。

記憶部１０８は、例えばハードディスクなどで構成される。また、通信部１０９は、例えばモデム、ターミナルアダプタ、無線通信機器などより構成され、他の情報処理装置との間の通信を制御する。例えば、図５の主コントローラ４１が、図１１のコンピュータで構成される場合、通信部１０９は、ネットワーク４９を介する補助データサーバ５０との間の通信を制御する。

入出力インタフェース１０５にはまた、必要に応じてドライブ１１０が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなるリムーバブル記録媒体１１１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部１０８にインストールされる。

ところで、上述した一連の処理もソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。

このようなプログラムを含む記録媒体は、図１１に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク（フロッピディスクを含む）、光ディスク（ＣＤ−ＲＯＭ(Compact Disk-Read Only Memory)、ＤＶＤ(Digital Versatile Disk)を含む）、光磁気ディスク（ＭＤ（Mini-Disk）を含む）、もしくは半導体メモリ等よりなるリムーバブル記録媒体（パッケージメディア）１１１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているＲＯＭ１０２や、記憶部１０８に含まれるハードディスクなどで構成される。

以上説明したように、符号化対象のビデオデータの取り込み時に、当該ビデオデータの少なくとも分割ポイント候補に関する特徴情報を抽出し、その特徴情報を格納しておき、エンコード処理条件設定において、その格納されていた特徴情報を参照にして、分散エンコード処理に伴うビデオデータの分割ポイントを決定するようにしている。これにより、ビデオデータの取り込みと、ビデオデータのプリプロセス／圧縮処理とを別々に行っていた従来のオーサリング処理装置に比べて、大幅に処理時間の短縮化を図ることができる。

また、同様に、ビデオデータの取り込み時に符号化処理にプリプロセスとして、上述した分割ポイント候補だけではなく、繰り返し画像パターンに関する特徴情報も抽出するようにしているので、処理時間の短縮化を図るとともに、限られたディスク容量において、効率的な符号化処理を実現することができる。

なお、本発明は、上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。

例えば、上述した一連の処理もソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータにネットワークや記録媒体からインストールされる。または、各種のプログラムをインストールすることで各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等にインストールされる。

また、このようなプログラムを含む記録媒体は、装置本体とは別に、ユーザにプログラムを提供するために配布されるものである。例えば、プログラムが記録されている磁気ディスク（フロッピディスクを含む）、光ディスク（CD-ROM,DVDを含む）、光磁気ディスク（ＭＤを含む）、半導体メモリ等よりなるリムーバブル記録媒体（パッケージメディア）である。また、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているＲＯＭや、ハードディスクなどで構成されてもよい。

なお、本明細書において、フローチャートを用いて説明した各ステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

本実施の形態に係る情報処理装置が適用されるスタジオ側オーサリング装置の構成例を示すブロック図である。スタジオ側オーサリング装置の処理例を示すフローチャートである。プラント側オーサリング装置の構成例を示すブロック図である。プラント側オーサリング装置の処理例を示すフローチャートである。本実施の形態に係る情報処理装置が適用されるビデオデータ取り込み装置の構成例を示すブロック図である。エンコード処理対象のビデオデータにおける分割ポイント候補と分割ポイント、並びに分割処理区間を説明するための概念図である。２−３プルダウン処理されたビデオデータについて説明するための概念図である。オーサリング装置のうちのビデオ信号処理装置の構成例を示すブロック図である。ビデオデータを分散してエンコードする場合のビデオ信号分散処理装置の構成例を示すブロック図である。本実施の形態に係る情報処理装置の処理例を示すフローチャートである。本実施の形態に係る情報処理装置の構成例を示すブロック図である。

符号の説明

１０スタジオ側オーサリング装置、１１メニュー信号処理装置、１２サブタイトル信号処理装置、１３オーディオ信号処理装置、１４ビデオ信号処理装置、１５マルチプレクサ、１６ダウンローダ、１７ファイルサーバ、１８オーサリングアプリケーション実行装置、１９ネットワーク、２０ライタ、２１ＤＬＴ、２２ＨＤＤ、２３ネットワーク、３０プラント側オーサリング装置、３１プリマスタリング、３２フォーマッタ、３３カッティング装置、３４マスターディスク（原盤）、４０ビデオデータ取り込み装置、４１主コントローラ、４２ＧＵＩ、４３ＶＴＲコントロール部、４４データキャプチャコントロール部、４５分割ポイント／プルダウン検出部、４６ビデオデータ入出力インタフェース、４７ＶＴＲ、４８ビデオデータサーバ、４９ネットワーク、５０補助データサーバ、６０，６０’ 主コントローラ、６１ＧＵＩ、６２エンコードマネージャ、６３ウェイトコントロール部、６４マルチパスコントロール部、６５エンコードコントロール部、６５’ エンコードリモートコントロール部、６６デコードコントロール部、６７エンコーダ、６７_１〜６７_ｎリモートエンコーダ、６８ＩｎｆｏＤＢ、６９モニタ装置、７０圧縮データサーバ

Claims

ビデオデータが記録された記録媒体の再生を制御するとともに、符号化対象データを取り込むデータ取り込み部と、
上記符号化対象データを受信し、符号化処理の前処理として、該符号化対象データの少なくとも分割可能点を含む特徴点を抽出する特徴抽出部と、
上記符号化対象データを格納する格納部と、
上記特徴抽出部において抽出した上記特徴点についての情報を記憶する記憶部と、
上記符号化対象データを所定数の分割データに分割する分割部と、
上記分割データを分割符号化データに符号化する複数の符号化部とを備え、
上記分割部は、上記複数の符号化部の総数と、上記特徴点についての情報とに基づき、上記符号化対象データを該複数の符号化部の総数で割った等分点に近似する該特徴点を、該各符号化部に略均等に割り当て可能な分割点として決定し、該各符号化部に上記分割データを割り当てる情報処理装置。
上記特徴抽出部は、さらに、上記符号化対象データにおける繰り返し画像パターンを検出し、
上記記憶部は、上記分割可能点についての情報と共に、上記繰り返し画像パターンについての情報を記憶し、
上記複数の符号化部は、上記繰り返し画像パターンについての情報に基づいて、繰り返し画像を間引いて符号化する請求項１記載の情報処理装置。
上記ビデオデータは、２−３プルダウン処理されたビデオデータである請求項２記載の情報処理装置。
上記分割可能点は、上記符号化対象データにおけるシーンチェンジポイントである請求項１乃至３の何れか１項記載の情報処理装置。
ビデオデータが記録された記録媒体の再生を制御するとともに、符号化対象データを取り込むデータ取り込み工程と、
上記符号化対象データを受信し、符号化処理の前処理として、該符号化対象データの少なくとも分割可能点を含む特徴点を抽出する特徴抽出工程と、
上記符号化対象データを格納する格納工程と、
上記特徴抽出工程にて抽出した上記特徴点についての情報を記憶する記憶工程と、
上記符号化対象データを所定数の分割データに分割する分割工程と、
上記分割データを複数の符号化装置を用いて分割符号化データに分散符号化する分散符号化工程とを有し、
上記分割工程では、上記複数の符号化装置の総数と、上記特徴点についての情報とに基づき、上記符号化対象データを該複数の符号化装置の総数で割った等分点に近似する該特徴点を、該各符号化装置に略均等に割り当て可能な分割点として決定し、該各符号化装置に上記分割データを割り当てる情報処理方法。