JP2007081466A - Image processing apparatus and method - Google Patents

Image processing apparatus and method Download PDF

Info

Publication number
JP2007081466A
JP2007081466A JP2005262755A JP2005262755A JP2007081466A JP 2007081466 A JP2007081466 A JP 2007081466A JP 2005262755 A JP2005262755 A JP 2005262755A JP 2005262755 A JP2005262755 A JP 2005262755A JP 2007081466 A JP2007081466 A JP 2007081466A
Authority
JP
Japan
Prior art keywords
data
moving image
still image
audio data
still
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005262755A
Other languages
Japanese (ja)
Inventor
Tokuyo Murata
篤洋 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005262755A priority Critical patent/JP2007081466A/en
Publication of JP2007081466A publication Critical patent/JP2007081466A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology of generating audio attached still picture movie by attaching proper audio data extracted from a moving picture file recorded on a recording medium to a still picture movie. <P>SOLUTION: An image processing apparatus disclosed herein includes: a reproducing means that reproduces a still picture file and the moving picture file from the recording medium recorded with the still picture file including still picture data and the moving picture file including a moving picture stream comprising moving picture data and the audio data; and generating means (401 to 404) that generate new moving picture stream by using the still picture data and the audio data in the moving picture file. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、画像処理装置及び方法に関する。   The present invention relates to an image processing apparatus and method.

近年、DVDなどの大容量記録媒体を利用したデジタルビデオカメラが普及している。このようなデジタルビデオカメラは、動画像撮影機能と静止画撮影機能をもつものが一般的である。例えば、動画像はMPEG方式、静止画像はJPEG方式で符号化してDVDに記録される。   In recent years, digital video cameras using a large-capacity recording medium such as a DVD have become widespread. Such digital video cameras generally have a moving image shooting function and a still image shooting function. For example, a moving image is encoded by the MPEG method and a still image is encoded by the JPEG method and recorded on a DVD.

しかし、DVD再生機器には動画像のデコーダしか搭載していないものも多く、そのような再生機器では静止画像をデコードすることができず、ユーザは静止画を利用することが出来ない。   However, many DVD playback devices have only a moving picture decoder, and such playback devices cannot decode still images, and users cannot use still images.

上記問題を解決する手段として、静止画像データをMPEG方式のIピクチャに変換して動画ストリーム(以下、静止画ムービー)として新たに記録する方法が知られている(特許文献1参照)。   As means for solving the above problem, there is known a method in which still image data is converted into an MPEG I picture and newly recorded as a moving image stream (hereinafter, still image movie) (see Patent Document 1).

特開2004―201170号公報JP 2004-201170 A

ところが、前記特許文献1は、静止画像データから映像のみの動画像データ(静止画ムービー)を作成し記録する手段を開示しており、音声データを付加する手段は開示していない。   However, Patent Document 1 discloses means for creating and recording moving image data (still image movie) of only video from still image data, and does not disclose means for adding audio data.

本発明は、前記静止画ムービーに、前記記録媒体に記録された動画ファイルから抽出した適切な音声データを付加して、音声付静止画ムービーを作成することを目的とする。   An object of the present invention is to create a still image movie with audio by adding appropriate audio data extracted from a moving image file recorded on the recording medium to the still image movie.

本発明の画像処理装置は、静止画像データを含む静止画ファイルと、動画像データと音声データとからなる動画ストリームを含む動画ファイルとが記録された記録媒体から前記静止画ファイルと前記動画ファイルとを再生する再生手段と、前記静止画像データと前記動画ファイル中の音声データとを用いて新たな動画ストリームを生成する生成手段とを有することを特徴とする。
また、本発明の画像処理方法は、静止画像データを含む静止画ファイルと、動画像データと音声データとからなる動画ストリームを含む動画ファイルとが記録された記録媒体を用いた画像処理方法であって、前記静止画像データと前記動画ファイル中の音声データとを用いて新たな動画ストリームを生成する生成ステップを有することを特徴とする。
The image processing apparatus according to the present invention includes the still image file and the moving image file from a recording medium on which a still image file including still image data and a moving image file including a moving image stream including moving image data and audio data are recorded. And a generating means for generating a new moving picture stream using the still image data and the audio data in the moving picture file.
The image processing method of the present invention is an image processing method using a recording medium in which a still image file including still image data and a moving image file including a moving image stream including moving image data and audio data are recorded. A generating step of generating a new moving image stream using the still image data and the audio data in the moving image file.

静止画像データに適切な音声データを容易に付加することができるので、音声付静止画ムービーとして視聴することが可能となる。また、音声付静止画ムービーは記録媒体に記録することが可能であり、静止画再生手段を備えていない再生装置においても再生が可能である。   Since appropriate audio data can be easily added to still image data, it can be viewed as a still image movie with audio. In addition, the still image movie with sound can be recorded on a recording medium, and can be reproduced by a reproducing apparatus that does not include the still image reproducing means.

以下に、この発明の最良の実施形態を例示的に詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。   Hereinafter, exemplary embodiments of the present invention will be described in detail by way of example. However, the constituent elements described in this embodiment are merely examples, and are not intended to limit the scope of the present invention only to them.

図1は、本発明の実施形態によるデジタルビデオカメラ(画像処理装置)の構成例を示すブロック図である。図1において、101は撮像部、102はマイク(マイクロフォン)、103は記録系回路であり、撮像部101及びマイク102より得られた画像データ、音声データを圧縮、符号化する。104はディスクI/F(インターフェース)であり、記録系回路103から出力されたデータを所定の形式にフォーマット化し、ファイルデータとして光ディスク105に対して記録再生する。106は後述する音声付静止画ムービーを作成するための編集系回路、107はディスクI/F104を介してディスク105からデータファイルを再生する再生系回路である。108,109はそれぞれ画像データ、音声データの出力端子である。110は撮像部101、再生系回路107から出力される画像データに係る画像を表示するLCD(液晶表示器)である。111はデジタルビデオカメラの動作を制御するシステムコントロール部(以下シスコン)、112は電源スイッチ、記録トリガ、再生スイッチ、停止スイッチあるいは再生リストの編集スイッチなどを含む操作部である。   FIG. 1 is a block diagram illustrating a configuration example of a digital video camera (image processing apparatus) according to an embodiment of the present invention. In FIG. 1, reference numeral 101 denotes an image pickup unit, 102 denotes a microphone (microphone), and 103 denotes a recording system circuit, which compresses and encodes image data and audio data obtained from the image pickup unit 101 and the microphone 102. Reference numeral 104 denotes a disk I / F (interface), which formats data output from the recording system circuit 103 into a predetermined format and records / reproduces the file data on / from the optical disk 105. Reference numeral 106 denotes an editing system circuit for creating a still image movie with sound, which will be described later. Reference numeral 107 denotes a playback system circuit for reproducing a data file from the disc 105 via the disc I / F 104. Reference numerals 108 and 109 denote image data and audio data output terminals, respectively. Reference numeral 110 denotes an LCD (liquid crystal display) that displays an image related to image data output from the imaging unit 101 and the reproduction system circuit 107. Reference numeral 111 denotes a system control unit (hereinafter referred to as a system controller) for controlling the operation of the digital video camera, and 112 denotes an operation unit including a power switch, a recording trigger, a playback switch, a stop switch, or a playlist editing switch.

次に、通常の記録モードにおける動作について説明する。操作部112により動画撮影モードがセットされ、記録トリガにより記録開始が指示されると、シスコン111は記録系回路103を制御して記録を開始する。記録系回路103は撮像部101及びマイク102より得られた画像データ及び音声データを符号化し、所定の形式にてディスクI/F104に出力する。ディスクI/F104は所定のファイル形式に従うヘッダなどの付加情報を付加して記録系回路103から出力されるデータ列をフォーマット化し、ディスク105に対して記録する。   Next, the operation in the normal recording mode will be described. When the moving image shooting mode is set by the operation unit 112 and recording start is instructed by the recording trigger, the syscon 111 controls the recording system circuit 103 to start recording. The recording system circuit 103 encodes image data and audio data obtained from the imaging unit 101 and the microphone 102 and outputs them to the disk I / F 104 in a predetermined format. The disk I / F 104 adds additional information such as a header according to a predetermined file format to format the data string output from the recording system circuit 103 and records it on the disk 105.

また、操作部112により静止画撮影モードがセットされ、記録トリガにより静止画撮影が指示されると、シスコン111は記録系回路103を制御して記録を開始する。記録系回路103は撮像部101より得られた画像データを符号化し、所定の形式にてディスクI/F104に出力する。ディスクI/F104は所定のファイル形式に従うヘッダなどの付加情報を付加して記録系回路103から出力されるデータ列をフォーマット化し、ディスク105に対して記録する。   When the still image shooting mode is set by the operation unit 112 and the still image shooting is instructed by the recording trigger, the syscon 111 controls the recording system circuit 103 to start recording. The recording system circuit 103 encodes the image data obtained from the imaging unit 101 and outputs the encoded image data to the disk I / F 104 in a predetermined format. The disk I / F 104 adds additional information such as a header according to a predetermined file format to format the data string output from the recording system circuit 103 and records it on the disk 105.

図2は記録系回路103及びその周辺回路の要部構成例を示す図である。図2において、撮像部101からの画像データは画像信号処理部201に出力される。画像処理部201は撮像部101からの画像データに対して符号化フォーマットに従うサブサンプルなどの処理を施し、画像データ符号化部202に出力する。画像データ符号化部202は画像信号処理部201からの画像データをMPEG2あるいはJPEGの規格に従って符号化し、データ符号化処理部206に出力する。また、画像データ符号化部202は一つのデータファイルの代表画像を示すサムネイル画像データを生成し、データ符号化処理部206に出力する。   FIG. 2 is a diagram showing a configuration example of a main part of the recording system circuit 103 and its peripheral circuits. In FIG. 2, the image data from the imaging unit 101 is output to the image signal processing unit 201. The image processing unit 201 performs processing such as sub-sample according to the encoding format on the image data from the imaging unit 101 and outputs the processed data to the image data encoding unit 202. The image data encoding unit 202 encodes the image data from the image signal processing unit 201 according to the MPEG2 or JPEG standard, and outputs the encoded image data to the data encoding processing unit 206. Further, the image data encoding unit 202 generates thumbnail image data indicating a representative image of one data file and outputs the thumbnail image data to the data encoding processing unit 206.

また、マイクロフォン102からの音声データは音声信号処理部203に出力される。音声信号処理部203はマイクロフォン102からの音声データをデジタルデータに変換し、更に、ノイズ抑圧や増幅等の処理を施し、音声データ符号化部204に出力する。音声データ符号化部204は音声信号処理部203からの音声データをMPEG2の規格に従って符号化し、データ符号化処理部206に出力する。   Also, audio data from the microphone 102 is output to the audio signal processing unit 203. The audio signal processing unit 203 converts the audio data from the microphone 102 into digital data, further performs processing such as noise suppression and amplification, and outputs the processed data to the audio data encoding unit 204. The audio data encoding unit 204 encodes the audio data from the audio signal processing unit 203 in accordance with the MPEG2 standard, and outputs it to the data encoding processing unit 206.

データ符号化処理部206は符号化された画像データと音声データとを、MPEG2トランスポートストリーム、或いは、JPEGファイルの形式に変換し、ディスクI/F104に出力する。   The data encoding processing unit 206 converts the encoded image data and audio data into an MPEG2 transport stream or JPEG file format, and outputs the converted data to the disk I / F 104.

また、メタデータ生成部205は、撮影日時などの撮影情報を示すメタデータを生成し、データ符号化処理部206に出力する。データ符号化処理部206は、これらのメタデータを動画像、音声データファイル或いは静止画ファイルのヘッダあるいはフッタに記録するよう配置し、ディスクI/F104に出力する。   Further, the metadata generation unit 205 generates metadata indicating shooting information such as shooting date and time and outputs the metadata to the data encoding processing unit 206. The data encoding processing unit 206 arranges these metadata so as to be recorded in the header or footer of the moving image, audio data file, or still image file, and outputs them to the disk I / F 104.

本実施形態のデジタルビデオカメラにおいては、記録開始のトリガから記録停止のトリガの間に撮影、入力された動画像データ、音声データを一つの動画ファイルとして記録する。また、静止画撮影時には、1回の静止画撮影指示にて撮影した1画面の画像データを静止画ファイルとして記録する。   In the digital video camera of the present embodiment, moving image data and audio data captured and input between a recording start trigger and a recording stop trigger are recorded as one moving image file. Further, at the time of still image shooting, the image data of one screen shot by one still image shooting instruction is recorded as a still image file.

そして、データ符号化処理部206はメタデータ生成部205からのメタデータ及び、画像データ符号化部202からのサムネイル画像データを各ファイルのヘッダあるいはフッタに格納する。ヘッダにはこの他、ファイル名なども記録される。   The data encoding processing unit 206 stores the metadata from the metadata generation unit 205 and the thumbnail image data from the image data encoding unit 202 in the header or footer of each file. In addition, a file name and the like are recorded in the header.

次に、通常の再生時の動作について説明する。操作部112により再生モードがセットされると、シスコン111は再生系回路107を制御して、ディスク105に記録されているデータファイルのサムネイル画像をLCD110に表示する。ユーザはLCD110に表示されたサムネイルを確認し、操作部112を操作して再生を希望するファイルを選択する。シスコン111は再生すべきファイルが指定されると、再生系回路107を制御して再生中のファイルに関するメタデータの情報をLCD110に表示する。   Next, the operation during normal playback will be described. When the playback mode is set by the operation unit 112, the system controller 111 controls the playback system circuit 107 to display a thumbnail image of the data file recorded on the disc 105 on the LCD 110. The user confirms the thumbnail displayed on the LCD 110 and operates the operation unit 112 to select a file desired to be reproduced. When a file to be reproduced is designated, the syscon 111 controls the reproduction system circuit 107 to display metadata information regarding the file being reproduced on the LCD 110.

再生系回路107はディスクI/F104を介してディスク105より指定されたファイルを再生し、そのファイル内の画像データ、音声データを復号して出力端子108,109より出力すると共に、再生された画像をLCD110に表示する。   The reproduction system circuit 107 reproduces a file designated from the disk 105 via the disk I / F 104, decodes image data and audio data in the file, outputs them from the output terminals 108 and 109, and reproduces the reproduced image. Is displayed on the LCD 110.

図3は再生系回路107及びその周辺回路の構成例を示す図である。図3において、ディスクI/F104により再生されたデータはデータ復号処理部302に出力される。データ復号処理部302は再生されたデータ列より画像データ、音声データを検出し、更に、ファイルのヘッダ、フッタよりメタデータを検出する。そして、画像データを画像データ復号部303に出力する。   FIG. 3 is a diagram showing a configuration example of the reproduction system circuit 107 and its peripheral circuits. In FIG. 3, the data reproduced by the disc I / F 104 is output to the data decoding processing unit 302. The data decoding processing unit 302 detects image data and audio data from the reproduced data sequence, and further detects metadata from the file header and footer. Then, the image data is output to the image data decoding unit 303.

画像データ復号部303はデータ復号処理部302から出力された画像データを復号し、画像出力部305に出力する。画像出力部305は復号された画像データを外部モニタやその他外部機器にて処理するのに適した形式に変換し、出力端子108及びLCD110に出力する。   The image data decoding unit 303 decodes the image data output from the data decoding processing unit 302 and outputs the decoded image data to the image output unit 305. The image output unit 305 converts the decoded image data into a format suitable for processing by an external monitor or other external device, and outputs it to the output terminal 108 and the LCD 110.

音声データ復号部304はデータ復号処理部302から出力された音声データを復号し、音声出力部306に出力する。音声出力部306は復号された音声信号を外部機器にて処理するのに適した形式に変換し、出力端子109に出力する。   The audio data decoding unit 304 decodes the audio data output from the data decoding processing unit 302 and outputs it to the audio output unit 306. The audio output unit 306 converts the decoded audio signal into a format suitable for processing by an external device, and outputs it to the output terminal 109.

次に、本実施形態による音声付静止画ムービー作成機能について説明する。ここで述べる静止画ムービーとは、前述のように、複数の静止画像データをMPEG(Moving Picture Experts Group)方式のIピクチャに変換し、新たな動画像データとして扱えるようにしたものである。Iピクチャは、フレーム符号化ピクチャであり、そのフレーム画像だけで符号化する画像である。   Next, the function of creating a still image movie with sound according to the present embodiment will be described. As described above, the still picture movie described here is obtained by converting a plurality of still picture data into MPEG (Moving Picture Experts Group) type I pictures and handling them as new moving picture data. An I picture is a frame-encoded picture, and is an image that is encoded using only the frame image.

本実施形態では、静止画像に最も関連性があると予想される動画ファイルから音声データを抽出し、前記静止画ムービー作成の際に付加する手段を備えている。   In the present embodiment, there is provided means for extracting audio data from a moving image file that is expected to be most relevant to a still image and adding it when creating the still image movie.

以下、音声データの抽出方法及び音声付静止画ムービー作成の処理について説明する。
図4は、図1における編集系回路106及びその周辺回路の構成例を示す図である。ユーザが操作部112を操作して音声付静止画ムービーの作成を実行するか、シスコン111があるタイミング(例えば、ファイナライズ時)において音声付静止画ムービーを作成すべきであると判断した場合は、次の処理を指示する。すなわち、編集系回路106で音声付静止画ムービーの作成が行われる。
Hereinafter, a method for extracting audio data and a process for creating a still image movie with audio will be described.
FIG. 4 is a diagram showing a configuration example of the editing system circuit 106 and its peripheral circuits in FIG. If the user operates the operation unit 112 to create a still image movie with audio or determines that the syscon 111 should create a still image movie with audio at a certain timing (for example, at the time of finalization) Instructs the next process. That is, the editing circuit 106 creates a still image movie with sound.

シスコン111は編集系回路106を制御し、音声付静止画ムービーの作成を実行する。まず、データ解析部401により、ディスク105に記録されている静止画像データの解析を行う。このとき、データ解析部401は、静止画像データに付加したメタデータから静止画像撮影時刻情報を読み取り内部メモリに記録する。これを全ての静止画像データにおいて行う。   The syscon 111 controls the editing system circuit 106 to create a still image movie with sound. First, the data analysis unit 401 analyzes still image data recorded on the disc 105. At this time, the data analysis unit 401 reads still image shooting time information from the metadata added to the still image data and records it in the internal memory. This is performed for all still image data.

次に、データ解析部401は、前記静止画像撮影時刻と同時刻あるいはその近傍の時刻に撮影された動画像ファイルがディスク105に記録されているか否かを検出する。これにより、静止画像と動画像の関連付けが行われる。なお、どの範囲までを近傍の時刻に撮影されたものであると捉えるかは、操作部112をユーザが操作して時間の範囲を設定することができるものとする。   Next, the data analysis unit 401 detects whether or not a moving image file shot at the same time as the still image shooting time or a time close thereto is recorded on the disc 105. Thereby, the association between the still image and the moving image is performed. Note that it is possible to set a time range by operating the operation unit 112 by the user to determine which range is taken at a nearby time.

上記手段において、静止画像に関連付けられる動画像が存在しない場合は、その静止画像を静止画ムービーに含めるか否かをユーザは操作部112により選択する。静止画ムービーに含める場合は無音としても良いし、別の手段により音楽や効果音などを付加しても良い。   In the above means, when there is no moving image associated with the still image, the user selects whether or not to include the still image in the still image movie by the operation unit 112. When included in a still image movie, the sound may be silenced, or music or sound effects may be added by other means.

このように関連付けられる動画像ファイルがディスク105に存在した場合、データ解析部401はその関連した動画像ファイルをディスクI/F104を介してディスク105より再生し、音声抽出部402に出力する。音声抽出部402では、再生された動画ファイルより各静止画像に関連付けられた音声データを抽出する。音声の抽出箇所は自動でも手動でも良い。自動の場合は、音声抽出部402がランダムに音声を予め定められた所定時間分抽出する。   When a moving image file associated in this way exists on the disc 105, the data analysis unit 401 reproduces the related moving image file from the disc 105 via the disc I / F 104 and outputs it to the audio extraction unit 402. The audio extraction unit 402 extracts audio data associated with each still image from the reproduced moving image file. The voice extraction location may be automatic or manual. In the case of automatic, the voice extraction unit 402 randomly extracts voice for a predetermined time.

また、同一の動画ファイルに関連付けられた静止画ファイルが複数存在する場合は、それらの静止画像を静止画ムービーとして再生する時間分の音声をまとめて抽出することを可能とする。例えば、静止画1枚当たりの再生時間が3秒であり、同一の動画に関連付けられた静止画が3枚であった場合、3秒×3枚=9秒の連続した音声データを動画像ファイルから抽出する。   In addition, when there are a plurality of still image files associated with the same moving image file, it is possible to collectively extract the audio for the time for reproducing those still images as a still image movie. For example, if the playback time per still image is 3 seconds and there are 3 still images associated with the same movie, 3 seconds × 3 = 9 seconds of continuous audio data is a moving image file. Extract from

図5は、関連付けの様子を示す図である。以下、図5を例に説明する。ディスクに、3つの動画像I〜IIIと5枚(5画面)の静止画(1)〜(5)が記録されている。データ解析部401では、自動的に静止画像の撮影時間と同時刻あるいはその近傍で撮影された動画像を静止画像に関連付ける。図5の場合、静止画像(1)は動画像I、静止画像(2)と(3)は動画像II、動画像(4)は静止画像IIIに関連付けられる。その後、前述の音声抽出部402によって、関連付けの行われた動画ファイルから音声データを抽出することになる。静止画像(5)は、撮影時間と同時刻あるいはその近傍において撮影された動画像が存在しないため関連付けは行われない。従って、静止画像(5)を静止画ムービーに含めないか、音声無し静止画として静止画ムービーに含めるか、あるいは新たな音声データ(音楽や効果音等)を付加して静止画ムービーに含めるかを、ユーザの選択設定によって決められる。   FIG. 5 is a diagram showing a state of association. Hereinafter, FIG. 5 will be described as an example. Three moving images I to III and five (5 screens) still images (1) to (5) are recorded on the disc. The data analysis unit 401 automatically associates a moving image captured at the same time as or in the vicinity of the still image capturing time with the still image. In the case of FIG. 5, the still image (1) is associated with the moving image I, the still images (2) and (3) are associated with the moving image II, and the moving image (4) is associated with the still image III. After that, the audio extraction unit 402 extracts audio data from the associated moving image file. The still image (5) is not associated because there is no moving image taken at the same time as the shooting time or in the vicinity thereof. Therefore, whether the still image (5) is not included in the still image movie, is included in the still image movie as a still image without sound, or is added to the still image movie by adding new audio data (music, sound effects, etc.) Is determined by the user's selection setting.

上述の手段において、動画ファイルより抽出された音声データは音声付静止画ムービー作成部404に出力される。一方、データ解析部401はフォーマット変換部403に静止画像を出力する。フォーマット変換部403では、JPEGの静止画像をMPEG方式のIピクチャ形式に変換する。変換後のデータは、音声付静止画ムービー作成部404に出力される。   In the above-described means, the audio data extracted from the moving image file is output to the still image movie creating unit 404 with audio. On the other hand, the data analysis unit 401 outputs a still image to the format conversion unit 403. The format converter 403 converts a JPEG still image into an MPEG I picture format. The converted data is output to the still image movie creation unit 404 with sound.

音声付静止画ムービー作成部404では、音声抽出部402より出力された音声データとフォーマット変換部403により出力されたIピクチャ変換後の静止画データを合成し、新規動画ストリーム(音声付静止画ムービー)を作成する。音声付静止画ムービー作成部404は、上記の音声データとIピクチャをMPEG形式に符号化し、新規動画ストリームを生成する。   In the still image movie creation unit 404 with audio, the audio data output from the audio extraction unit 402 and the still image data after I picture conversion output from the format conversion unit 403 are synthesized, and a new moving image stream (still image movie with audio is added). ). The audio-added still image movie creation unit 404 encodes the audio data and the I picture in the MPEG format to generate a new moving image stream.

新規動画ストリーム(音声付静止画ムービー)は、記録系回路103に出力される。記録系回路103は、最終的に新規動画ストリームを含む動画ファイルをディスク105に記録する。   A new moving image stream (a still image movie with audio) is output to the recording circuit 103. The recording circuit 103 finally records a moving image file including a new moving image stream on the disc 105.

また、前述した実施形態は、動画フォーマット、静止画フォーマットとしてそれぞれMPEG、JPEGを例に説明しているが、これらのフォーマットだけに限定するものでないことは言うまでもない。   In the above-described embodiment, MPEG and JPEG are described as examples of the moving image format and the still image format, respectively. Needless to say, the format is not limited to these formats.

また、前述した実施形態は、光ディスクを記録媒体として用いているが、それに限定するものではない。ハードディスクや半導体メモリなどの記録媒体にも、この発明を適用することが可能である。   In the above-described embodiment, an optical disk is used as a recording medium, but the present invention is not limited to this. The present invention can also be applied to recording media such as hard disks and semiconductor memories.

以上のように、本実施形態によれば、記録媒体に対して画像データを記録する記録手段と、前記記録媒体に記録された画像データの再生手段と、前記記録媒体に記録された動画像と静止画像から音声付静止画ムービーを生成する手段を備える構成とした。記録媒体には、静止画像データを含む静止画ファイルと、動画像データと音声データとからなる動画ストリームを含む動画ファイルとが記録されている。このように、動画ファイルと静止画ファイルが記録された1つの記録媒体から、記録(撮影)時刻といった撮影情報から動画ファイルと静止画ファイルの関連付けができる。そして、その動画ファイルから音声データを抽出する。そして、静止画像データをMPEG方式のIピクチャに変換し、抽出した音声データを付加することにより、新たな動画ストリーム(音声付静止画ムービー)を作成することが可能である。また、前記静止画ムービーを同一記録媒体に記録することも可能である。   As described above, according to the present embodiment, a recording unit that records image data on a recording medium, a reproducing unit for image data recorded on the recording medium, and a moving image recorded on the recording medium A configuration is provided that includes means for generating a still image movie with sound from a still image. The recording medium records a still image file including still image data and a moving image file including a moving image stream including moving image data and audio data. As described above, the moving image file and the still image file can be associated from the shooting information such as the recording (shooting) time from one recording medium in which the moving image file and the still image file are recorded. Then, audio data is extracted from the moving image file. Then, it is possible to create a new moving image stream (a still image movie with audio) by converting still image data into an MPEG I picture and adding the extracted audio data. The still picture movie can also be recorded on the same recording medium.

本実施形態によれば、静止画ムービーに最適な音声を容易に付加することで、音声付静止画ムービーとして視聴することが可能となる。また、音声付静止画ムービーは記録媒体に記録することが可能であり、静止画再生手段を備えていない再生機器においても再生が可能である。また、1つの記録媒体に記録された動画像と静止画像から、音声付静止画ムービーを容易に生成、記録できる。   According to the present embodiment, it is possible to view a still image movie with sound by easily adding the optimum sound to the still image movie. In addition, the still image movie with sound can be recorded on a recording medium, and can be reproduced on a reproduction device that does not include a still image reproduction unit. In addition, a still image movie with sound can be easily generated and recorded from a moving image and a still image recorded on one recording medium.

なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。   The above-described embodiments are merely examples of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed in a limited manner. That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.

本発明の実施形態によるデジタルビデオカメラの構成例を示す図である。It is a figure which shows the structural example of the digital video camera by embodiment of this invention. 記録系回路の構成例を示す図である。It is a figure which shows the structural example of a recording system circuit. 再生系回路の構成例を示す図である。It is a figure which shows the structural example of the reproduction | regeneration system circuit. 編集系回路の構成例を示す図である。It is a figure which shows the structural example of an edit type | system | group circuit. 動画像と静止画像の関連付けの様子を示す図である。It is a figure which shows the mode of the correlation of a moving image and a still image.

符号の説明Explanation of symbols

101 撮像部
102 マイクロフォン
103 記録系回路
104 ディスクI/F
105 ディスク
106 編集系回路
107 再生系回路
108 映像出力端子
109 音声出力端子
110 LCD
111 システムコントロール部
112 操作部
401 データ解析部
402 音声抽出部
403 フォーマット変換部
404 音声付静止画ムービー作成部
101 Imaging unit 102 Microphone 103 Recording system circuit 104 Disc I / F
105 Disc 106 Editing system circuit 107 Playback system circuit 108 Video output terminal 109 Audio output terminal 110 LCD
111 system control unit 112 operation unit 401 data analysis unit 402 audio extraction unit 403 format conversion unit 404 still image movie creation unit with audio

Claims (9)

静止画像データを含む静止画ファイルと、動画像データと音声データとからなる動画ストリームを含む動画ファイルとが記録された記録媒体から前記静止画ファイルと前記動画ファイルとを再生する再生手段と、
前記静止画像データと前記動画ファイル中の音声データとを用いて新たな動画ストリームを生成する生成手段と
を有することを特徴とする画像処理装置。
Reproducing means for reproducing the still image file and the moving image file from a recording medium on which a still image file including still image data and a moving image file including a moving image stream including moving image data and audio data are recorded;
An image processing apparatus comprising: a generating unit that generates a new moving image stream using the still image data and the audio data in the moving image file.
前記生成手段は、前記記録媒体に記録された複数の前記動画ファイルのうち、前記静止画像データと関連性を持つ動画ファイル中の音声データを用いて前記新たな動画ストリームを生成することを特徴とする請求項1記載の画像処理装置。   The generating means generates the new moving image stream using audio data in a moving image file having a relationship with the still image data among the plurality of moving image files recorded on the recording medium. The image processing apparatus according to claim 1. 前記生成手段は、前記記録媒体に記録された複数の静止画像データとそれぞれに関連性を持つ動画ファイル中の音声データとを用いて前記新たな動画ストリームを生成することを特徴とする請求項2記載の画像処理装置。   3. The generation unit generates the new moving image stream using a plurality of still image data recorded on the recording medium and audio data in a moving image file associated with each of the still image data. The image processing apparatus described. 前記生成手段は、前記動画ファイル及び前記静止画ファイルの記録時刻情報を用いて前記関連性の有無を判別することを特徴とする請求項2又は3記載の画像処理装置。   The image processing apparatus according to claim 2, wherein the generation unit determines the presence / absence of the association using recording time information of the moving image file and the still image file. 前記動画ファイル中の動画像データ及び音声データは所定の符号化形式で符号化されており、前記生成手段は、前記静止画像データ及び前記音声データを前記所定の符号化形式で符号化することにより新たな動画ストリームを生成することを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。   The moving image data and audio data in the moving image file are encoded in a predetermined encoding format, and the generation unit encodes the still image data and the audio data in the predetermined encoding format. The image processing apparatus according to claim 1, wherein a new moving image stream is generated. 前記生成手段は、1画面の前記静止画像データについて前記動画ファイル中の音声データから所定期間の音声データを抽出し、前記抽出された所定期間の音声データと前記1画面の静止画像データとから前記所定期間の動画ストリームを生成することを特徴とする請求項1〜5のいずれか1項に記載の画像処理装置。   The generating means extracts audio data for a predetermined period from audio data in the moving image file for the still image data for one screen, and the audio data for the predetermined period and the still image data for the one screen are extracted from the extracted audio data for the predetermined period. The image processing apparatus according to claim 1, wherein a moving image stream for a predetermined period is generated. さらに、前記生成手段により生成された新たな動画ストリームを含む動画ファイルを前記記録媒体に記録する記録手段を有することを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。   The image processing apparatus according to claim 1, further comprising a recording unit that records a moving image file including a new moving image stream generated by the generating unit on the recording medium. 前記生成手段は、前記静止画像データをMPEG方式のIピクチャに変換し、前記新たな動画ストリームを生成することを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the generation unit converts the still image data into an MPEG I picture and generates the new moving image stream. 静止画像データを含む静止画ファイルと、動画像データと音声データとからなる動画ストリームを含む動画ファイルとが記録された記録媒体を用いた画像処理方法であって、
前記静止画像データと前記動画ファイル中の音声データとを用いて新たな動画ストリームを生成する生成ステップを有することを特徴とする画像処理方法。
An image processing method using a recording medium in which a still image file including still image data and a moving image file including a moving image stream including moving image data and audio data are recorded,
An image processing method comprising a generation step of generating a new moving image stream using the still image data and audio data in the moving image file.
JP2005262755A 2005-09-09 2005-09-09 Image processing apparatus and method Pending JP2007081466A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005262755A JP2007081466A (en) 2005-09-09 2005-09-09 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005262755A JP2007081466A (en) 2005-09-09 2005-09-09 Image processing apparatus and method

Publications (1)

Publication Number Publication Date
JP2007081466A true JP2007081466A (en) 2007-03-29

Family

ID=37941358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005262755A Pending JP2007081466A (en) 2005-09-09 2005-09-09 Image processing apparatus and method

Country Status (1)

Country Link
JP (1) JP2007081466A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011078063A (en) * 2009-10-02 2011-04-14 Nikon Corp Image reproducing apparatus
JP2011147032A (en) * 2010-01-15 2011-07-28 Olympus Imaging Corp Image/sound recording system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011078063A (en) * 2009-10-02 2011-04-14 Nikon Corp Image reproducing apparatus
JP2011147032A (en) * 2010-01-15 2011-07-28 Olympus Imaging Corp Image/sound recording system

Similar Documents

Publication Publication Date Title
JP4883100B2 (en) VIDEO RECORDING METHOD AND DEVICE, VIDEO REPRODUCTION METHOD AND DEVICE, AND RECORDING MEDIUM
JP4355659B2 (en) Data processing device
KR101295430B1 (en) Image recording apparatus, image reproducing apparatus, image recording method, and image reproducing method
JP4958758B2 (en) Recording apparatus, reproducing apparatus, recording method, reproducing method, and program
JP2010081457A (en) Information recording/reproducing apparatus and video camera
JP2006157893A (en) Imaging device
JP2009147549A (en) Moving image recording apparatus, moving image reproducing apparatus and program
TW200847780A (en) Video motion menu generation in a low memory environment
JP2009225361A (en) Recording device and recording method, and editing device and editing method
US8437390B2 (en) Imaging apparatus
JP2007081466A (en) Image processing apparatus and method
JP2007200409A (en) Image pickup device, recording device, and recording method
JP3922559B2 (en) Image editing method and image editing apparatus
JP2008097727A (en) Animation-reproducing device
JP2007104405A (en) Apparatus, method and program for processing video data with sound
JP2006005610A (en) Panoramic video recording and reproducing device
US20090040382A1 (en) Camera apparatus and still image generating method of camera apparatus
JP2007281727A (en) Recording device and recording method
JP2004040518A (en) Imaging recorder and reproducing device
JP5274232B2 (en) Video recording apparatus and control method thereof
JP4401690B2 (en) Video camera
JP5621645B2 (en) Video storage device and video storage control method
JP2010141717A (en) Image recording reproducing device
JP2004318991A (en) Recording and reproducing device
JP2010015640A (en) Information processing apparatus, information processing method, and program