JP2014127747A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2014127747A JP2014127747A JP2012281172A JP2012281172A JP2014127747A JP 2014127747 A JP2014127747 A JP 2014127747A JP 2012281172 A JP2012281172 A JP 2012281172A JP 2012281172 A JP2012281172 A JP 2012281172A JP 2014127747 A JP2014127747 A JP 2014127747A
- Authority
- JP
- Japan
- Prior art keywords
- value
- identification information
- moving image
- image data
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
【課題】 処理負荷を大幅に増加させずに、動画データの結合を可能とする。
【解決手段】 動画データをフレーム内符号化により符号化する符号化手段と、各フレームを識別する第1の識別情報と符号化タイプを識別する第2の識別情報とを含み、可変長符号化された付加情報を生成する手段であって、隣接フレーム間で値が重複しないように第1の識別情報を設定し、第1の値及び第2の値のうち符号長が長い方の第1の値を第2の識別情報に設定する生成手段と、符号化された動画データに付加情報を付加したストリームを記録する記録手段と、記録された二つのストリームを結合する結合手段と、二つのストリームの境界部で連続する2フレームの第1の識別情報が同じ値であった場合、一方のフレームの第2の識別情報を第2の値に変更し、一方のフレームの第1の識別情報を第1の値の符号長と第2の値の符号長の差の分だけ長い符号長の値に変更する制御手段とを備える。
【選択図】 図12
【解決手段】 動画データをフレーム内符号化により符号化する符号化手段と、各フレームを識別する第1の識別情報と符号化タイプを識別する第2の識別情報とを含み、可変長符号化された付加情報を生成する手段であって、隣接フレーム間で値が重複しないように第1の識別情報を設定し、第1の値及び第2の値のうち符号長が長い方の第1の値を第2の識別情報に設定する生成手段と、符号化された動画データに付加情報を付加したストリームを記録する記録手段と、記録された二つのストリームを結合する結合手段と、二つのストリームの境界部で連続する2フレームの第1の識別情報が同じ値であった場合、一方のフレームの第2の識別情報を第2の値に変更し、一方のフレームの第1の識別情報を第1の値の符号長と第2の値の符号長の差の分だけ長い符号長の値に変更する制御手段とを備える。
【選択図】 図12
Description
本発明は画像処理装置に関し、特に、符号化された動画データを処理する装置に関する。
従来、動画データをH.264方式に従い符号化し、符号化された動画データをMP4ファイル形式で記録媒体に記録する装置が知られている(特許文献1参照)。H.264方式において、シーケンスパラメータセット、ピクチャパラメータセット、及びスライスヘッダは可変長符号化(VLC)により符号化される。可変長符号化においては、情報源シンボルの発生確率に応じて決められた長さの符号後が各シンボルに割り当てられる。
また、H.264においては、IDRピクチャが用意されており、IDRピクチャを飛び越えた参照は禁止されている。H.264方式では、IDRピクチャの識別情報(ID)としてidr_pic_idが規定されている。idr_pic_idはスライスヘッダに含まれ、そこにはVLCにより符号化された値が格納される。また、H.264方式では、ストリームの互換性保証のため、隣接するIDRピクチャのidr_pic_idが異なる値に設定されることが必要となる。動画データを全てこのIDRピクチャにより符号化することにより、符号化された状態で、フレーム単位での結合編集が容易になる。
前述のように、各フレームがIDRピクチャとして符号化された動画データを結合する場合を考える。結合を行った結果、結合境界の前後の連続した2フレームのidr_pic_idが同じ値となることがある。この場合、何れか一方を違う値に変更する必要がある。
しかしながら、後に続くIDRピクチャのidr_pic_idの値によっては、idr_pic_idのビット数が違ってしまうことがある。例えば、idr_pic_idを変更することにより、ビット数が増加する場合がある。そのため、結合部分以降のストリームの全てのビットについて、2ビットずつ後方にシフトする必要があり、編集システムにとって大きな処理負荷となっていた。
本発明は前述の問題点に鑑み、処理負荷を大幅に増加させること無く、動画データの結合を可能とすることを目的とする。
本発明は、フレーム内符号化とフレーム間符号化のいずれかの符号化タイプを用いることが可能な符号化方式に従って動画データを符号化する手段であって、入力された動画データの各フレームをフレーム内符号化により符号化する符号化手段と、前記符号化された動画データの各フレームを識別するための第1の識別情報と、前記符号化された動画データの符号化タイプを識別するための第2の識別情報とを含み、前記第1の識別情報と前記第2の識別情報とが可変長符号化により符号化された付加情報を生成する手段であって、隣接するフレーム間で同じ値とならないように前記第1の識別情報の値を設定すると共に、それぞれが前記フレーム内符号化のタイプを示す、第1の値及び、前記第1の値よりも符号長が短い第2の値のうち、前記第1の値を前記第2の識別情報に設定する生成手段と、前記符号化された動画データの各フレームに前記生成手段により生成された付加情報を付加し、前記付加情報が付加された動画データのストリームを記録媒体に記録する記録手段と、前記記録媒体に記録された二つの前記動画データのストリームを結合し、結合された動画データのストリームを生成する結合手段と、前記結合された動画データのストリームにおける前記二つのストリームの境界部分の前後に連続する2フレームの前記第1の識別情報の値を検出し、この検出結果に応じて前記結合された動画データのストリームにおける付加情報を変更する制御手段とを備え、前記制御手段は、前記境界部分の前後に連続する2フレームの前記第1の識別情報が同じ値であった場合、前記2フレームのうちの少なくとも一方のフレームの前記第2の識別情報を前記第2の値に変更し、前記少なくとも一方のフレームの第1の識別情報を、前記第1の値の符号長と前記第2の値の符号長の差の分だけ長い符号長の値に変更する。
本発明によれば、処理負荷を大幅に増加させること無く、動画データの結合が可能になる。
以下、本発明の実施形態について図面を参照しながら説明する。
図1は、本発明の実施形態に係る画像処理装置100の構成例を示すブロック図である。
図1において、入力部101は、動画データや音声データを取得して出力する。本実施形態では、入力部101はデータ処理装置100の外部から供給された動画データや音声データを入力する。しかし、入力部101を撮像部やマイクロフォンを含む構成とし、撮像部で撮影された動画やマイクにより収集された音声データをそれぞれ取得する構成としてもよい。
信号処理部102は、記録時においては、入力部101により入力された動画データや音声データをH.264(MPEG4 AVC)方式に従って符号化して、その情報量を圧縮する。また、動画データや音声データを記録するために必要な処理を行う。また、信号処理部102は、再生時においては、再生された動画データや音声データを復号し、その情報量を伸張する。信号処理部102は、記録時において、符号化された動画データや音声データの符号量(データ量)の情報を制御部102に出力する。
メモリ103は、動画データや音声データを記憶する。データ処理装置100の各ブロックは、メモリ103に対してアクセスすることにより、必要な動画データや音声データを処理する。メモリ103は、動画データや音声データの他に、ファイルシステムの情報や、動画ファイルの管理情報など、各種の情報を記憶し、更に、制御部106による制御のためのワークメモリ等の役割を果たす。
メディアデータ管理部104は、記録時においては、後述の様に、MP4ファイルにて規定された各種の情報を生成し、再生時には、再生された管理情報を処理し、その内容を制御部106に知らせる。表示部105は、入力または再生された動画、或いは、メニュー情報などの各種の情報を表示する。
制御部106は、操作入力部107からの入力に応じてデータ処理装置100の動作全体を制御する。制御部106はマイクロコンピュータやメモリ等を含み、不図示のROMに記憶されたプログラムに従ってデータ処理装置100を制御する。操作入力部107は、ユーザにより操作可能な各種のスイッチを含み、ユーザによる各種の指示などを受け付けて制御部106へ通知する。また、操作入力部107は、電源スイッチや記録の開始、停止を指示するためのスイッチ、データ処理装置100のモードを切り替えるためのスイッチ等を含む。
記録再生部108は、記録媒体109に動画データや音声データ、或いは、各種の情報を記録すると共に、記録媒体109からこれらのデータを再生する。記録再生部108は、記録時においては、メモリ103に蓄積された管理情報や動画データ、或いは音声データを記、後述の様なファイル形式で録媒体109に記録する。記録再生部106は、再生時においては、記録媒体109から動画ファイルの管理情報や動画データ、音声データを再生し、メモリ103に記憶する。本実施形態では、記録媒体109はハードディスク(HDD)、フラッシュメモリカード等、ランダムアクセス可能な記録媒体である。
記録再生部108は、記録媒体109に記録する動画ファイルや、各種の情報を、FAT(File Allocation Table)等のファイルシステムに従い、ファイルとして管理する。また、不図示の装着、排出機構により、データ処理装置100に対して記録媒体109を容易に装着、排出することができるように構成するが、データ処理装置100に記録媒体109が内蔵される構成でもよい。
制御部106は、記録媒体109に動画ファイルの書き込み、読み出しを行う場合、記録再生部108を制御して、記録媒体109からファイルシステムデータ(管理データ)を再生してメモリ103に記憶する。このファイルシステムデータは、記録媒体109に記録されたデータのファイル名やファイルのサイズ、データの記録アドレスなどを示すデータであり、ファイルを管理するための管理情報である。制御部106は、読み出したファイルシステムデータに従ってファイルの書き込み、読み出しを制御する。制御部106は、記録媒体109へのファイルの書き込みに応じて、メモリ103に記憶されたファイルシステムデータを更新し、更新したファイルシステムデータを、記録再生部108により記録媒体109に記録する。また、制御部106は、後述のように、記録媒体109に記録された動画データの結合処理を行う。出力部110は、再生された動画データや音声データを外部機器部出力する。
次に、本実施形態で扱う情報ファイルについて説明する。図2は本実施形態で扱う動画ファイルの構成を表している。動画ファイル201は、動画データや音声データなどの情報データを格納するための第1の領域202を含む。また、動画ファイル201は、第1の領域202に格納された動画データの位置や、音声データの位置に関する位置情報を含む、メタデータが格納される第2の領域を含む。
この様なファイル形式で動画データを記録するフォーマットとして、MP4ファイルフォーマットが知られている。本実施形態では、MP4ファイル形式に従い、動画ファイルを記録する。MP4ファイルにおいては、第1の領域がmdatボックスに対応し、第2の領域がmoov領域に対応する。
MP4ファイルはボックスと呼ばれる単位で構成される。一つのボックスは、box−size,box−type,box−dataの領域を含む。box−sizeにはこのボックスのデータ長(サイズ)の情報が格納される。box−typeにはbox−dataに格納されるデータ種別を示す情報が格納される。box−dataには実データが格納される。box−typeは32ビットの固定長のデータ領域である。box−dataは可変長の領域である。box−sizeが32ビットであるため、一つのボックスのサイズは通常0xFFFFFFFFバイト以下である。
図2の動画ファイルは、FileTypeBox(ftyp),MediaDataBox(mdat),MovieBox(moov)の三つのボックスから構成される。ftyp、mdat、moovの各ボックスは、最上位の階層である。
ftypは、box−typeがftypであり、ファイルの互換性に関する情報が格納されるボックスである。ftypに記述されたbox−dataに基づいて、MP4ファイルに格納された動画データや音声データの符号化方式等を判別することができる。
mdatは、box−typeがmdatであり、動画データや音声データの各サンプルが格納されるボックスである。符号化された動画データや音声データは、それぞれチャンクという単位に分割されて格納される。動画ファイル201では、動画データの1チャンクが複数のビデオサンプルから構成される例を示す。
moovは、box−typeがmoovであり、動画データや音声データに関するメタデータが格納されるボックスである。moovのbox−dataには、動画データや音声データのチャンクのファイル先頭からのオフセットを示すチャンクオフセット、各チャンクのサンプル数、サンプルサイズなどの情報が格納される。moovは、mvhdと1以上のtrakを含む。trakボックスは、1以上のビデオトラック、ビデオ、オーディオトラックを定義する情報である。
trakはtkhdを含む。stsdには、ビデオデータの解像度や符号化パラメータに関する情報が格納される。sttsには、ビデオデータのサンプリング周波数情報が格納される。stscには、チャンク当たりに格納されるサンプル数の情報が格納される。stszには、サンプルサイズ情報が格納される。stcoには、各チャンクへのファイル先頭からのオフセット情報が格納される。stsc、stsz、stcoは、ビデオデータ(動画データ)における各チャンクにアクセスするためのデータとして使用される。
次に、動画の記録処理について説明する。本実施形態では、動画データをH.264方式に従って符号化する。H.264方式では、フレーム内符号化とフレーム間符号化とを用いて符号化をすることが可能であるが、本実施形態では、各フレームをH.264方式におけるIDRピクチャとして符号化して記録する。また、符号化処理の単位としてスライスを用いる。各スライスにはスライスヘッダ(付加情報)が付加される。スライスヘッダを図3に示す。本実施形態では、1スライスを1フレームとする。
図3のスライスヘッダは可変長符号化により符号化される。VLCの各値に対して割り当てられた符号語は図4に示す通りである。図3において、slice_typeはスライスの符号化タイプを示す情報(第2の識別情報)が格納される。IDRピクチャを示すスライスタイプはIスライスである。H.264では、図5に示すように、Iスライスを示す値として、予め設定された値7(符号長が7ビット、第1の値)と値2(符号長が3ビット、第2の値)の何れかを設定することが可能である。本実施形態では、動画データを記録する場合に、slice_typeの値として7(符号長が7ビット)を設定して記録する。即ち、Iスライスを示す二つの値のうち、符号長が長い方の値がslice_typeに設定されて記録される。
また、本実施形態では、各フレームをIDRピクチャとして符号化する。スライスヘッダには、各IDRピクチャを識別するためのidr_pic_id(第1の識別情報)が含まれる。また、H.264では、前述のように、ストリームの互換性保証のため、隣接するIDRピクチャのidr_pic_idが異なる値に設定されることが必要となる。そのため、隣接するフレーム間で、idr_pic_idの値が同じ値にならないように、idr_pic_idの値を設定する。具体的には、値1(符号長が3ビット)と値2(符号長が3ビット)を1フレームおきに交互に設定する。
記録待機状態において、操作入力部107より記録開始の指示を受けると、制御部106は、記録再生部108に対し、新たに動画ファイルを作成するように指示する。そして、信号処理部102に対し、動画データの符号化を開始するように指示する。信号処理部102は、入力された動画データの各フレームをIDRピクチャとして符号化し、符号化された動画データをメモリ103に順次記憶する。信号処理部102は、符号化された動画データのスライスヘッダを生成し、動画データに多重することにより動画データのストリームを生成する。また、制御部106は、動画データの符号化処理に伴い、信号処理部102からの発生符号量などの情報をメモリ103に記憶する。制御部106は、記録再生部108に対し、メモリ103に記憶された動画データのストリームを記録する様に指示する。記録再生部108は、動画データを、図2におけるmdatボックスに順次格納し、記録媒体109に記録する。
このように動画データの記録が継続される。制御部106は、操作入力部107より記録停止の指示があったか否かを判別し、記録停止の指示が無い場合にはそのまま記録を続ける。また、記録停止の指示があると、制御部106は、信号処理部102による動画データの符号化を停止する。そして、制御部106は、メディアデータ管理部104に対し、直前に記録されたデータのメタデータを生成するように指示する。
メディアデータ管理部104は、MP4ファイル形式で決められた各メタデータを生成する。制御部106は、記録再生部108に対し、メタデータをmoovボックスに格納して記録するように指示する。記録再生部108は、メタデータをメモリ103から読み出し、動画ファイルのmoovに格納して記録媒体109に記録する。
次に、動画の編集処理について説明する。図1の画像処理装置100は、記録媒体109に記録された二つの動画データ(動画ファイル)を符号化された状態で結合し、新たな動画ファイルを記録する機能を持つ。
図6は、結合される動画データを示す図である。図6において、動画データA601の最後に動画データB602の先頭を結合するものとする。また、図6の四角は1フレームを示し、その中の数値は各フレームに付加されるidr_pic_idの値を示している。動画データA601の最後のフレームには、idr_pic_idとして値1が付加され、動画データB602の先頭フレームにはidr_pic_idとして値2が付加されている。これら二つの動画データを結合し、新たに動画データC603を生成する場合、動画データA601と動画データB602の境界部分604の前後のフレームに付加されるidr_pic_idの値が共に1となってしまう。
そこで、本実施形態では、このように結合部分の前後のフレームに付加されるidr_pic_idの値が重複した場合に、境界部分の直前または直後のフレームに付加するidr_pic_idの値を変更する。更に、このとき、スライスヘッダに含まれるslice_typeの値を後述のように変更することで、結合部分以降のストリームにおいて、ビットシフトが発生しないようにする。
図7は動画データの結合処理を示すフローチャートである。ユーザは操作入力部107を操作して、記録媒体109に記録された複数の動画ファイルから、何れか二つの動画ファイルを指定する。そして、ユーザは、先に再生される方の動画ファイルを指定した後、結合を指示する。このように、動画ファイルの結合が指示された場合に、図7の処理が実行される。なお、図7の処理は、制御部106が各部を制御することにより実行される。
制御部106は、記録再生部108に対し、ユーザにより指定された結合対象の動画ファイルのftypとmoovを読み出すように指示する。記録再生部108は、指定された動画ファイルのftypとmoovを読み出し、メモリ103に記憶する。制御部106は、メモリ103に記憶されたmoovを確認する(S701)。そして、制御部106は、これら二つの動画ファイルに格納された動画データのストリームを結合可能であるか否かを判別する(S702)。
制御部106は、ftypに基づいて、動画コンテンツとして互換性があるか否かを判別する。また、制御部106は、moovにおけるtrak,stsd,stssに基づいて、動画データの解像度(画素数)や符号化形式、フレームレートなどを比較し、これらが同じであるか否かを判別する。本実施形態では、記録される動画データの符号化形式や解像度、フレームレートは全て共通としているが、解像度やフレームレートをユーザの指示により変更可能としてもよい。制御部106は、比較結果に基づいて、二つの動画データを結合可能であるか否かを判別する。
二つの動画データを結合可能でないと判別した場合、制御部106は、表示部105に対し、警告画面を表示して処理を終了する(S710)。
一方、結合可能であると判別した場合、制御部106は、記録再生部108に対し、結合後の動画ファイルを作成する様に指示する。記録再生部108は、結合後の動画ファイルを記録媒体109に作成する(S703)。次に、制御部109は、結合対象の二つの動画ファイルそれぞれのmoovに基づいて、結合後の動画ファイルのmoovを作成し、作成したmoovをメモリ103に記憶する(S704)。
具体的な処理は以下の通りである。なお、以下の説明では、結合対象の二つの動画ファイルのうち、先に再生される前半の動画ファイルをMP4(A)とし、後に再生される後半ファイルをMP4(B)、結合後の動画ファイルをMP4(C)として説明する。まず、ftypについては、MP4(A)のものをそそまま使用する。mvhdについては、MP4(A)のものをベースに、コンテンツ再生時間に、MP4(B)の再生時間を加算して補正する。tkhdについては、MP4(A)のものをベースに、ビデオデータ再生時間に、MP4(B)の再生時間を加算して補正する。stsd、sttsについては、MP4(A)のものをそそまま使用する。stsc、stszについては、それぞれ、MP4(A)の後にMP4(B)の情報を追記する。stcoについては、MP4(A)の後にMP4(B)の情報を追加し、動画データを記録した後で変更する。このようにmoovを生成した後、制御部106は、このmoovを結合後の動画ファイルに格納するように、記録再生部108に指示する。記録再生部108は、moovをメモリ103から読み出し、記録媒体109に作成した結合後の動画ファイルに格納して記録する。結合後の動画ファイルMP4(C)におけるmoovの生成手順を図8に示す。
続いて、制御部106は、前半の動画ファイルMP4(A)の動画データ(ストリーム)を、結合後の動画ファイルMP4(C)のmdatに記録するように、記録再生部108に指示する(S706)。この処理は、動画ファイルMP4(A)のmdatに格納されている動画データのストリームを、結合後の動画ファイルMP4(C)のmdatの先頭からの位置にコピーする処理である。このように前半の動画ファイルを結合後の動画ファイルMP4(C)に記録した後、制御部106は、結合後の動画ファイルのstcoを変更する。結合後の動画ファイルMP4(C)のmdatに対する、前半の動画ファイルMP4(A)の動画データの記録手順を図9に示す。
次に、制御部106は、前半の動画ファイルMP4(A)の最終フレームのスライスへだと、後半の動画ファイルMP4(B)の動画データの先頭フレームのスライスヘッダを読み出すように記録再生部108に指示する。記録再生部108は、動画ファイルMP4(A)の最終フレームのスライスヘッダと、MP4(B)の先頭フレームのスライスヘッダを読みだして、メモリ103に記憶する。
制御部106は、メモリ103に記憶された、動画ファイルMP4(A)の最終フレームのスライスヘッダと、MP4(B)の先頭フレームのスライスヘッダに格納された、idr_pic_idの値を検出する。そして、これらの連続する二つのフレームに付加されたidr_pic_idの値が同じであるか否かを判別する(S707)。
二つのフレームに付加されたidr_pic_idの値が異なっている場合、制御部106は、そのまま動画データを結合しても規則に反しないと判断する。そして、制御部106は、後半の動画ファイルMP4(B)の動画データ(ストリーム)を、結合後の動画ファイルMP4(C)のmdatに記録するように、記録再生部108に指示する(S708)。この処理は、動画ファイルMP4(B)のmdatに格納されている動画データのストリームを、結合後の動画ファイルMP4(C)のmdatの先頭からの位置にコピーする処理である。このように後半の動画ファイルを結合後の動画ファイルMP4(C)に記録した後、制御部106は、結合後の動画ファイルのstcoを変更する。結合後の動画ファイルMP4(C)のmdatに対する、後半の動画ファイルMP4(B)の動画データの記録手順を図10に示す。
一方、結合時の境界部分の前後の連続する二つのフレームに付加されたidr_pic_idの値が同じであった場合、制御部106は、後半の動画ファイルの先頭フレームのスライスヘッダにおけるslice_typeとidr_pic_idの値を変更する(S709)。idr_pic_idはVLCにより符号化されているので、idr_pic_idの変更によりビット幅(データ長)が変わることがある。そこで、本実施形態では、slice_typeを変更することにより、idr_pic_idの変更によるビット幅の変動分を相殺する。
slice_typeは、idr_pic_idと同じくVLCにより符号化されて記述されている。IDRピクチャを示すスライスタイプはIスライスであり、7(符号長が7ビット)以外に2(符号長が3ビット)を設定することができる。前述のように、本実施形態では、動画データの記録時に、slice_typeとして値7を設定している。
そこで、制御部106は、後半の動画データの先頭フレームのslice_typeの値を7から2に変更する。これにより、slice_typeの符号語は7ビットから3ビットに変更され、4ビット分データ長が短くなる。そして、この短くなった4ビット分のデータを、変更後のidr_pic_idに割り当てる。
図11は、元のidr_pic_idから、符号語として4ビット増加後に取り得る値を示している。図11に示すように、元のidr_pic_idの値が1または2の場合、7−14の何れかの値に変更される。また、元のidr_pic_idの値が0の場合、3−6のいずれかの値に変更される。本実施形態では、動画データの記録時に、idr_pic_idとして値1と2を1フレームおきに交互に付加しているため、7−14の何れかの値、例えば、値7に変更する。これにより、結合時の境界部分の前後の2フレーム、及び、後半の動画データの先頭フレームと2フレーム目の間で、idr_pic_idとして同じ値が付加されてしまうことがない。
このようにslice_typeとidr_pic_idの値を変更した後、制御部106は、後半の動画ファイルMP4(B)の動画データ(ストリーム)を、結合後の動画ファイルMP4(C)のmdatに記録するように、記録再生部108に指示する(S708)。
このように、slice_typeとidr_pic_idの値を変更することにより、後半の動画データのストリームにおけるデータの位置がずれることが無く、動画の結合による負荷を大幅に削減することが可能となる。
図12に、slice_typeとidr_pic_idを変更した場合のスライスヘッダの様子を示す。図12に示すように、slice_typeを2から7に変更し、idr_pic_idを1から7に変更することにより、slice_typeからidr_pic_idの範囲内でビットシフトが発生しない。
なお、本実施形態では、二つの動画ファイルにおける、一方の動画データの最終フレームと他方の動画データの先頭フレームとを結合する処理について説明した。これ以外にも、例えば、一方の動画ファイルの再生終了フレーム(アウト点)と、他方の動画ファイルの再生開始フレーム(イン点)とをユーザが指定し、このアウト点とイン点において、二つの動画ファイルを結合する構成としてもよい。この場合も、同様に、境界部分の連続した2フレームにおいて、idr_pic_idの値が重複した場合に、slice_typeとidr_pic_idを変更する。
また、本実施形態では、境界部分の連続した2フレームのうち、後半の動画データの先頭フレームのslice_typeとidr_pic_idを変更したが、前半の動画データの最終フレームのslice_typeとidr_pic_idを変更する構成としてもよい。この場合、境界部分の連続した2フレームのidr_pic_idの値が重複せず、且つ、前半の動画データの最終フレームと、その一つ前のフレームのidr_pic_idが重複しないように、前半の動画データの最終フレームのidr_pic_idを決める。
即ち、二つの動画データを結合した場合の境界部分の連続した2フレームのidr_pic_idが同じ値であった場合、これら2フレームの少なくとも一方に付加されるスライスヘッダのslice_typeとidr_pic_idを別の値に変更する。この場合、他方のフレームについては、slice_typeとidr_pic_idの値を変更しない。
また、本実施形態では、動画データの記録時に、idr_pic_idとして、値1(第3の値)と値2(第4の値)をフレーム毎に交互に付加したが、これ以外の値を付加することも可能である。
(その他の実施形態)
前述した本発明の実施形態における記録装置を構成する各手段、並びに記録方法の各工程は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
前述した本発明の実施形態における記録装置を構成する各手段、並びに記録方法の各工程は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図5に示すフローチャートに対応したプログラム)を、システムまたは装置に直接、または遠隔から供給する場合も含む。そして、そのシステムまたは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスクなどがある。さらに、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する方法がある。そして、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、その他の方法として、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、その他の方法として、まず記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
Claims (8)
- フレーム内符号化とフレーム間符号化のいずれかの符号化タイプを用いることが可能な符号化方式に従って動画データを符号化する手段であって、入力された動画データの各フレームをフレーム内符号化により符号化する符号化手段と、
前記符号化された動画データの各フレームを識別するための第1の識別情報と、前記符号化された動画データの符号化タイプを識別するための第2の識別情報とを含み、前記第1の識別情報と前記第2の識別情報とが可変長符号化により符号化された付加情報を生成する手段であって、隣接するフレーム間で同じ値とならないように前記第1の識別情報の値を設定すると共に、それぞれが前記フレーム内符号化のタイプを示す、第1の値及び、前記第1の値よりも符号長が短い第2の値のうち、前記第1の値を前記第2の識別情報に設定する生成手段と、
前記符号化された動画データの各フレームに前記生成手段により生成された付加情報を付加し、前記付加情報が付加された動画データのストリームを記録媒体に記録する記録手段と、
前記記録媒体に記録された二つの前記動画データのストリームを結合し、結合された動画データのストリームを生成する結合手段と、
前記結合された動画データのストリームにおける、前記二つのストリームの境界部分の前後に連続する2フレームの前記第1の識別情報の値を検出し、検出された前記第1の識別情報の値に応じて前記結合された動画データのストリームにおける付加情報を変更する制御手段とを備え、
前記制御手段は、前記境界部分の前後に連続する2フレームの前記第1の識別情報が同じ値であった場合、前記2フレームのうちの少なくとも一方のフレームの前記第2の識別情報を前記第2の値に変更し、前記少なくとも一方のフレームの第1の識別情報を、前記第1の値の符号長と前記第2の値の符号長の差の分だけ長い符号長の値に変更することを特徴とする画像処理装置。 - 前記記録手段は、前記動画データのストリームをファイルとして前記記録媒体に記録し、前記結合手段は、前記記録媒体に記録された二つのファイルを結合することを特徴とする請求項1に記載の画像処理装置。
- 前記結合手段は、一方の動画データのストリームから指定された再生終了フレームと、他方の動画データのストリームから指定された再生開始フレームとを結合することを特徴とする請求項1に記載の画像処理装置。
- 前記生成手段は、符号長が同じ第3の値と第4の値をフレーム毎に交互に前記第1の識別情報として設定することを特徴とする請求項1に記載の画像処理装置。
- 前記制御手段は、前記境界部分の前後に連続する2フレームの前記第1の識別情報が互いに異なる値であった場合は、前記2フレームの前記第1の識別情報と前記第2の識別情報とを変更しないようにすることを特徴とする請求項1に記載の画像処理装置。
- フレーム内符号化とフレーム間符号化のいずれかの符号化タイプを用いることが可能な符号化方式に従って符号化された動画データの各フレームに前記付加情報が付加された動画データのストリームであって、
前記動画データの各フレームがフレーム内符号化により符号化され、
前記付加情報が、前記符号化された動画データの各フレームを識別するための第1の識別情報と、前記符号化された動画データの符号化タイプを識別するための第2の識別情報とを含み、前記第1の識別情報と前記第2の識別情報とが可変長符号化により符号化され、隣接するフレーム間で同じ値とならないように前記第1の識別情報の値が設定され、それぞれが前記フレーム内符号化のタイプを示す、第1の値及び、前記第1の値よりも符号長が短い第2の値のうち、前記第1の値が前記第2の識別情報に設定されている、前記動画データのストリームを処理する画像処理装置において、
前記記録媒体に記録された二つの前記動画データのストリームを結合し、結合された動画データのストリームを生成する結合手段と、
前記結合された動画データのストリームにおける前記二つのストリームの境界部分の前後に連続する2フレームの前記第1の識別情報の値を検出し、検出された前記第1の識別情報の値に応じて前記結合された動画データのストリームにおける付加情報を変更する制御手段とを備え、
前記制御手段は、前記境界部分の前後に連続する2フレームの前記第1の識別情報が同じ値であった場合、前記2フレームのうちの少なくとも一方のフレームの前記第2の識別情報を前記第2の値に変更し、前記少なくとも一方のフレームの第1の識別情報を、前記第1の値の符号長と前記第2の値の符号長の差の分だけ長い符号長の値に変更することを特徴とする画像処理装置。 - フレーム内符号化とフレーム間符号化のいずれかの符号化タイプを用いることが可能な符号化方式に従って動画データを符号化する手段であって、入力された動画データの各フレームをフレーム内符号化により符号化する符号化ステップと、
前記符号化された動画データの各フレームを識別するための第1の識別情報と、前記符号化された動画データの符号化タイプを識別するための第2の識別情報とを含み、前記第1の識別情報と前記第2の識別情報とが可変長符号化により符号化された付加情報を生成する手段であって、隣接するフレーム間で同じ値とならないように前記第1の識別情報の値を設定すると共に、それぞれが前記フレーム内符号化のタイプを示す、第1の値及び、前記第1の値よりも符号長が短い第2の値のうち、前記第1の値を前記第2の識別情報に設定する生成ステップと、
前記符号化された動画データの各フレームに前記生成ステップにより生成された付加情報を付加し、前記付加情報が付加された動画データのストリームを記録媒体に記録する記録ステップと、
前記記録媒体に記録された二つの前記動画データのストリームを結合し、結合された動画データのストリームを生成する結合ステップと、
前記結合された動画データのストリームにおける前記二つのストリームの境界部分の前後に連続する2フレームの前記第1の識別情報の値を検出し、検出された前記第1の識別情報の値に応じて前記結合された動画データのストリームにおける付加情報を変更する制御ステップとを備え、
前記制御ステップは、前記境界部分の前後に連続する2フレームの前記第1の識別情報が同じ値であった場合、前記2フレームのうちの少なくとも一方のフレームの前記第2の識別情報を前記第2の値に変更し、前記少なくとも一方のフレームの第1の識別情報を、前記第1の値の符号長と前記第2の値の符号長の差の分だけ長い符号長の値に変更することを特徴とする画像処理装置。 - フレーム内符号化とフレーム間符号化のいずれかの符号化タイプを用いることが可能な符号化方式に従って符号化された動画データの各フレームに前記付加情報が付加された動画データのストリームであって、
前記動画データの各フレームがフレーム内符号化により符号化され、
前記付加情報が、前記符号化された動画データの各フレームを識別するための第1の識別情報と、前記符号化された動画データの符号化タイプを識別するための第2の識別情報とを含み、前記第1の識別情報と前記第2の識別情報とが可変長符号化により符号化され、隣接するフレーム間で同じ値とならないように前記第1の識別情報の値が設定され、それぞれが前記フレーム内符号化のタイプを示す、第1の値及び、前記第1の値よりも符号長が短い第2の値のうち、前記第1の値が前記第2の識別情報に設定されている、前記動画データのストリームを処理する画像処理方法において、
前記記録媒体に記録された二つの前記動画データのストリームを結合し、結合された動画データのストリームを生成する結合ステップと、
前記結合された動画データのストリームにおける前記二つのストリームの境界部分の前後に連続する2フレームの前記第1の識別情報の値を検出し、検出された前記第1の識別情報の値に応じて前記結合された動画データのストリームにおける付加情報を変更する制御ステップとを備え、
前記制御ステップは、前記境界部分の前後に連続する2フレームの前記第1の識別情報が同じ値であった場合、前記2フレームのうちの少なくとも一方のフレームの前記第2の識別情報を前記第2の値に変更し、前記少なくとも一方のフレームの第1の識別情報を、前記第1の値の符号長と前記第2の値の符号長の差の分だけ長い符号長の値に変更することを特徴とする画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012281172A JP2014127747A (ja) | 2012-12-25 | 2012-12-25 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012281172A JP2014127747A (ja) | 2012-12-25 | 2012-12-25 | 画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014127747A true JP2014127747A (ja) | 2014-07-07 |
Family
ID=51406963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012281172A Pending JP2014127747A (ja) | 2012-12-25 | 2012-12-25 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014127747A (ja) |
-
2012
- 2012-12-25 JP JP2012281172A patent/JP2014127747A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7458736B2 (ja) | 表示装置 | |
JP6628117B2 (ja) | 再生装置、再生方法 | |
WO2014208346A1 (ja) | 再生装置、再生方法、および記録媒体 | |
WO2014208345A1 (ja) | 再生装置、再生方法、および記録媒体 | |
JP4737003B2 (ja) | 編集装置、編集方法、編集プログラムおよび編集システム | |
WO2007129524A1 (ja) | 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム | |
KR101515551B1 (ko) | 데이터 처리장치 및 그 제어방법, 및 기억매체 | |
JP5917123B2 (ja) | 記録装置 | |
TWI420514B (zh) | A reproducing apparatus, a reproducing method, a recording apparatus, a recording method, a program, and a data structure | |
JP5848594B2 (ja) | 記録装置 | |
JP6049410B2 (ja) | 画像処理装置および画像処理方法 | |
JP2014127747A (ja) | 画像処理装置 | |
JP2014036402A (ja) | 記録装置及び記録方法 | |
WO2014208347A1 (ja) | 再生装置、再生方法、および記録媒体 | |
JP5624658B2 (ja) | データ処理装置、方法および制御プログラム | |
JP6112852B2 (ja) | 記録装置、記録方法およびプログラム | |
JP6071399B2 (ja) | 画像処理装置及び画像処理装置の制御方法 | |
JP6218489B2 (ja) | 画像処理装置 | |
JP6049369B2 (ja) | 画像処理装置及び画像処理装置の制御方法 | |
JP2014060499A (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2006121415A (ja) | 動画符号化装置 | |
JP2015153440A (ja) | 情報処理装置、情報記録装置、情報記録媒体、および情報処理方法、並びにプログラム |