JP5499605B2 - Image playback device - Google Patents
Image playback device Download PDFInfo
- Publication number
- JP5499605B2 JP5499605B2 JP2009230365A JP2009230365A JP5499605B2 JP 5499605 B2 JP5499605 B2 JP 5499605B2 JP 2009230365 A JP2009230365 A JP 2009230365A JP 2009230365 A JP2009230365 A JP 2009230365A JP 5499605 B2 JP5499605 B2 JP 5499605B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- sound
- unit
- reproduction
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Description
本発明は、静止画像、動画像及び音声を再生可能な画像再生装置に関するものである。 The present invention relates to an image reproducing apparatus capable of reproducing still images, moving images, and sounds.
記録媒体に記録されている静止画像及び音声を含む動画像を再生する再生装置であって、静止画像を動画像の所定撮影時点に対して関連付け、この所定撮影時点を示す管理情報を記録し、この管理情報に基づいて動画像の中から所定部分を抽出し、静止画像の再生を行いつつ、動画像の所定部分に対応する音声の再生を行う再生装置が提案されている(例えば、特許文献1参照)。 A playback device that plays back a moving image including a still image and sound recorded on a recording medium, associating the still image with a predetermined shooting point of the moving image, and recording management information indicating the predetermined shooting point, There has been proposed a playback device that extracts a predetermined portion from a moving image based on this management information, plays back a sound corresponding to the predetermined portion of the moving image while playing a still image (for example, Patent Documents). 1).
ところで、特許文献1記載の再生装置では、静止画像が撮影された時間を所定撮影時点とし、この所定撮影時点に記録された動画像の中の所定部分を抽出する。そして、静止画像を再生する際に、抽出された動画像の所定部分に対応する音声も同時に再生する。
By the way, in the playback apparatus described in
しかしながら、例えば異なる時間(異なる日)に撮影された複数の静止画像を所定時間間隔で順次再生表示する場合では、各静止画像が撮影された時間を所定撮影時点とし、この所定撮影時点に記録された動画像に対応する音声をそれぞれ順次再生すると、音声が途切れ途切れになり、滑らかさに欠ける場合があった。また、所定撮影時点以外に記録された動画像の一部分を静止画像に関連する部分として抽出することができないため、所定撮影時点以外に記録された動画像に対応する音声を静止画像の再生と同時に再生することができなかった。 However, for example, when a plurality of still images taken at different times (different days) are sequentially reproduced and displayed at predetermined time intervals, the time at which each still image was taken is set as a predetermined shooting time and recorded at the predetermined shooting time. When the sound corresponding to each moving image is sequentially played back, the sound is interrupted and sometimes lacks smoothness. In addition, since a part of the moving image recorded at a time other than the predetermined shooting time cannot be extracted as a portion related to the still image, the sound corresponding to the moving image recorded at a time other than the predetermined shooting time is simultaneously reproduced with the reproduction of the still image. Could not play.
本発明の目的は、静止画像を再生表示する際に、動画像に含まれている音の中から該静止画像と共に再生する最適な再生音を抽出することができる画像再生装置を提供することである。 An object of the present invention is to provide an image reproduction apparatus capable of extracting an optimum reproduction sound to be reproduced together with the still image from the sounds included in the moving image when reproducing and displaying the still image. is there.
本発明の画像再生装置は、記録媒体に記録されている動画像、前記動画像と共に記録される音、及び前記動画像と関連付けられた静止画像をそれぞれ再生する再生部と、前記記録媒体に記録されている前記静止画像の中から、前記再生部により再生する静止画像を選択する選択部と、前記選択部により選択された前記静止画像の画像解析を行う解析部と、前記解析部による解析結果に基づいて、前記記録媒体に記録されている前記音の中から前記再生部により再生する再生音を抽出する抽出部と、前記選択部により選択された前記静止画像及び前記抽出部により抽出された前記再生音の、前記再生部による再生を制御する再生制御部と、テーマ毎に関連付けられた参照画像、及び前記参照画像と関連付けられた参照音を登録する登録部とを備え、前記抽出部は、前記登録部に登録されている前記参照画像及び前記参照音の中から、前記解析部による解析結果に基づき抽出された参照画像及び参照音の少なくとも一方に基づいて、前記再生音を抽出することを特徴とする。 Image reproducing apparatus of the present invention, moving images recorded on the recording medium body, a reproducing unit sound is recorded together with the moving image, and a still image associated with the moving image reproducing, respectively, said recording medium body from among the still images recorded on the a selection unit for selecting a more still image to be reproduced to the reproduction unit, an analysis unit for performing image analysis of the selected the still image by the selection unit, the analyzing unit based on the analysis result by the out of the recording medium body the sound recorded in an extraction unit for extracting a reproduced sound more reproduction to the reproduction unit, the still image and said selected by the selection unit of the reproduced sound extracted by the extracting unit, a reproduction control section for controlling the reproduction by the reproducing unit, a reference image associated with each theme, and registration unit for registering a reference sound associated with the reference image Be equipped The extraction unit performs the reproduction based on at least one of the reference image and the reference sound extracted based on the analysis result by the analysis unit from the reference image and the reference sound registered in the registration unit. It is characterized by extracting sound .
本発明の画像再生装置によれば、静止画像を再生表示する際に、動画像に含まれている音の中から該静止画像と共に再生する最適な再生音を抽出することができる。 According to the image reproduction apparatus of the present invention, when reproducing and displaying a still image, it is possible to extract the optimum reproduction sound to be reproduced together with the still image from the sounds included in the moving image.
以下、図面を参照して、本発明の実施の形態に係る画像再生装置について説明する。なお、本実施の形態に係る画像再生装置とは、記録媒体等に記録されている静止画像または動画像(音声と共に記録されている連続静止画像を含む)を再生表示するための液晶パネル等の画像表示部、及び記録媒体等に記録されている音を再生するためのスピーカ等の音声再生部を備えたものであり、例としてノートパソコンやデスクトップパソコン等のパーソナルコンピュータ(以下、PCという。)が挙げられる。 Hereinafter, an image reproduction apparatus according to an embodiment of the present invention will be described with reference to the drawings. The image reproducing apparatus according to the present embodiment is a liquid crystal panel for reproducing and displaying still images or moving images (including continuous still images recorded together with sound) recorded on a recording medium or the like. An image display unit and a sound reproduction unit such as a speaker for reproducing sound recorded on a recording medium or the like are provided. As an example, a personal computer (hereinafter referred to as a PC) such as a notebook personal computer or a desktop personal computer. Is mentioned.
図1は、実施の形態に係る画像再生装置2のシステム構成を示すブロック図である。図1に示すように、画像再生装置2は、制御部4、記録媒体6、画像表示部8、音声再生部10、操作部12、解析部14、及び登録部16を備えて構成されている。制御部4は、CPU等により構成され、画像再生装置2の各部を統括的に制御する。この実施の形態では、画像表示部8に静止画像を再生表示する際に、音声再生部10において再生する再生音を抽出し、静止画像及び再生音の再生を制御する。
FIG. 1 is a block diagram showing a system configuration of an image reproduction apparatus 2 according to the embodiment. As shown in FIG. 1, the image reproduction device 2 includes a control unit 4, a
記録媒体6は、画像再生装置2に設けられたカードスロット(図示せず)に着脱可能に装着される可搬性を有する記録媒体であり、例えば、CFカード、SDカード、スマートメディア等が用いられる。記録媒体6には、静止画像、音声を含む動画像、及び静止画像や動画像に付加されている撮影日時等の撮影に関する情報等が記録されている。また、動画像が記録されている間に撮像された静止画像については、その動画像との関連付けを示す情報(例えば、動画像のファイル名)が付加されており、記録媒体6には、この動画像との関連付けを示す情報も、静止画像と共に記録されている。その他の動画像についても例えばユーザー操作等により静止画像との関連付けが可能であり、静止画像を画像表示部8に再生表示する際に音声再生部10において再生される再生音は、関連付けされた動画像に含まれる音声から抽出される。
The
画像表示部8は、記録媒体6に記録されている静止画像や動画像、後述する登録部16に登録されている登録画像等をそれぞれ再生表示する。音声再生部10は、記録媒体6に記録されている動画像に含まれている音声、登録部16に登録されている登録音等をそれぞれ再生する。操作部12は、ユーザーにより操作される操作部材、例えば、キーボードやポインティングデバイス等を備えて構成されている。解析部14は、画像表示部8に再生表示する静止画像及び該静止画像に関連付けられ、記録媒体6に記録されている動画像の解析を行う。
The
登録部16には、画像表示部8に静止画像を再生表示すると同時に音声再生部10により再生される再生音を抽出する際に基準となる登録画像及び登録音が、テーマ毎に関連付けられて登録されている。登録画像は、予め登録されており、例えばカメラ等により既に記録されている静止画像または動画像の中のフレームを登録画像としてユーザー操作により登録することができる。また、登録音は、予め登録されており、例えばカメラ等により動画像と共に既に記録されている音、録音可能な装置により録音された音、または各種テーマ(シーン)に関するキーワード(例えばテーマ「お祭り」に対してキーワード「ワッショイ」、テーマ「パーティー」に対してキーワード「乾杯」等)を登録音としてユーザー操作により登録することができる。なお、カメラ等により登録画像として登録するための静止画像を撮像し、登録画像として登録することもでき、カメラ等により登録画像及び登録音として登録するための動画像及び音を同時に記録し、登録画像及び登録音として互いに関連付けて登録することもできる。また、テーマにおいてはユーザーが操作部12を介して作成することができ、一の登録画像や一の登録音を複数のテーマに関連付けることもできる。
In the
次に、図2に示すフローチャートを参照して、この実施の形態に係る画像再生装置2において画像表示部8に静止画像を再生表示すると同時に音声再生部10により再生する再生音を抽出する際の処理について説明する。
Next, referring to the flowchart shown in FIG. 2, when reproducing the still image on the
なお、この実施の形態においては、図3に示すように、子供の画像(顔を含む画像)A、お祭りに関連する神輿の画像B、浴衣の画像C及び団扇の画像Dがテーマ「お祭り」の登録画像として登録部16に予め登録されているものとする。また、画像Aの子供の声、祭囃子の音、ワッショイ等のお祭りを連想させるキーワードがテーマ「お祭り」の登録音として登録部16に予め登録されているものとする。
In this embodiment, as shown in FIG. 3, the theme “Festival” includes a child image (image including a face) A, a shrine image B related to a festival, a yukata image C, and a fan image D. It is assumed that the registered image is registered in advance in the
まず、ユーザーにより操作部12を介して、記録媒体6に記録されている静止画像の中から画像表示部8により再生表示する静止画像が選択されると、制御部4は、選択された静止画像を記録媒体6から取得する(ステップS10)。この実施の形態では、図4に示すような神輿をバックに、浴衣を着用し、団扇を手にした子供の静止画像Eが選択されたものとする。
First, when a still image to be reproduced and displayed by the
次に、制御部4は、ステップS10において取得した静止画像Eを解析部14において画像解析させる(ステップS11)。即ち、静止画像Eの顔認識、顔識別、物認識、シーン(テーマ)認識等を行う。静止画像Eから、一人の人物が存在し(顔認識)、その人物は「子供」であり(顔識別)、その子供の手には「団扇」(物認識)、子供の背後には「神輿」(物認識)があり、子供には「浴衣」(物認識)が着せられており、「団扇」、「神輿」及び「浴衣」から「お祭り」(シーン認識)であることが解析される。
Next, the control unit 4 causes the
次に、制御部4は、ステップS11において解析部14により解析された解析結果に基づいて、登録部16に登録されている登録画像の中から参照画像を抽出する(ステップS12)。即ち、登録部16に登録されているすべての登録画像の中から、静止画像Eから解析された「子供」「団扇」「神輿」「浴衣」「お祭り」に関連する画像(この実施の形態では、画像A〜D)を参照画像として抽出する。
Next, the control unit 4 extracts a reference image from the registered images registered in the
次に、制御部4は、静止画像Eと関連付けられている所定の動画像を構成する全フレームの中から、ステップS12において抽出した参照画像A〜Dに関連するフレーム(参照画像A〜Dに類似するフレーム、または参照画像A〜Dを含むフレーム)を含むフレーム領域を少なくとも1つ抽出する(ステップS13)。所定の動画像は、静止画像が撮像された時間を含む時間帯に記録された動画像、ユーザーにより指定操作された動画像、静止画像の撮像時間から予め設定された時間前までに記録された動画像、及び静止画像の撮像時間から予め設定された時間後まで記録された動画像等のことである。予め設定される時間前及び時間後は、独立して変更及び設定可能であり、例えば、前日及び2日後等の日単位、数時間前及び数時間後等の時間単位に設定可能である。なお、この実施の形態では、図5に示すように、静止画像Eの撮像時t3に同一のカメラで記録されていた動画像M(時間t1からt2まで記録)が所定の動画像として静止画像Eに関連付けられているものとし、参照画像A〜Dに関連するフレームとしてフレームf1〜f3を含むフレーム領域F1〜F3が抽出されたものとする。また、この実施の形態では、静止画像Eに対応するフレームf2を含むフレーム領域F2が抽出されたか否かに拘らず、フレーム領域F2以外のフレーム領域F1,F3が必ず抽出されるように設定されているものとする。 Next, the control unit 4 selects a frame (reference image A to D) related to the reference image A to D extracted in step S12 from all the frames constituting the predetermined moving image associated with the still image E. At least one frame region including a similar frame or a frame including the reference images A to D is extracted (step S13). The predetermined moving image was recorded from a moving image recorded in a time zone including a time when the still image was captured, a moving image designated and operated by the user, and a predetermined time before the still image capturing time. A moving image and a moving image recorded from a still image capturing time to a preset time. The time before and after the preset time can be changed and set independently. For example, the time can be set in a day unit such as the previous day and two days later, or in a time unit such as several hours before and after several hours. In this embodiment, as shown in FIG. 5, the moving image M (recorded from time t 1 to t 2 ) recorded by the same camera at the time t 3 of capturing the still image E is a predetermined moving image. still image and those associated with the E, the frame region F 1 to F 3 including the frame f 1 ~f 3 is assumed to have been extracted as a frame associated with the reference image A~D as. In this embodiment, the frame regions F 1 and F 3 other than the frame region F 2 are always extracted regardless of whether or not the frame region F 2 including the frame f 2 corresponding to the still image E is extracted. It is assumed that it is set to
次に、制御部4は、ステップS13において抽出されたフレーム領域F1〜F3に対応する音を再生音として抽出する(ステップS14)。即ち、所定の動画像を構成する全フレームの中から抽出されたフレーム領域F1〜F3が記録された時に録音された音を抽出する。 Next, the control unit 4 extracts sounds corresponding to the frame regions F 1 to F 3 extracted in step S13 as reproduction sounds (step S14). That is, the sound recorded when the frame regions F 1 to F 3 extracted from all the frames constituting the predetermined moving image are recorded is extracted.
一方、制御部4は、ステップS11において解析部14により解析された解析結果に基づいて、登録部16に登録されている登録音の中から参照音も抽出する(ステップS15)。即ち、登録部16に登録されているすべての登録音の中から、静止画像Eから解析された「子供」「団扇」「神輿」「浴衣」「お祭り」に関連する音(この実施の形態では、子供の声、祭囃子の音、ワッショイ等のキーワード)を参照音として抽出する。
On the other hand, the control unit 4 also extracts a reference sound from the registered sounds registered in the
次に、制御部4は、静止画像Eと関連付けられている所定の動画像に含まれる音の中から、ステップS15において抽出した参照音に関連する音(参照音に類似する音、または参照音を含む音)を再生音として抽出する(ステップS16)。このとき、ステップS14において抽出された再生音と同一の再生音が抽出される場合もあり、異なる再生音が抽出される場合もある。なお、人物の声に関しては参照音の声紋等、環境音や音楽に関しては参照音の特徴量(周波数の時間変化、周波数の周期性、周波数の継続性、周波数レベルの時間的長さ、周波数方向と時間的方向との組み合わせ)から類似性を判別し、参照音と類似する再生音を抽出する。また、この実施の形態では、制御部4が静止画像の撮像時間と同一の時間に録音された音以外の音が再生音として必ず抽出されるように設定されている。 Next, the control unit 4 selects a sound related to the reference sound extracted in step S15 from the sounds included in the predetermined moving image associated with the still image E (a sound similar to the reference sound or a reference sound). Are extracted as reproduced sounds (step S16). At this time, the same reproduced sound as the reproduced sound extracted in step S14 may be extracted, or a different reproduced sound may be extracted. For human voices, the voiceprint of the reference sound, for environmental sounds and music, the reference sound features (frequency change over time, frequency periodicity, frequency continuity, time length of frequency level, frequency direction) And the temporal direction), the similarity is determined, and the reproduced sound similar to the reference sound is extracted. In this embodiment, the control unit 4 is set such that sounds other than the sound recorded at the same time as the still image capturing time are always extracted as the reproduced sound.
そして、制御部4は、静止画像Eを画像表示部8に再生表示すると同時に、ステップS14及びS16において抽出された再生音を音声再生部10において再生する(ステップS17)。複数の再生音が抽出された場合には、録音された時間が早い順、録音された時間が静止画像Eの撮像時間に近い順、またはランダムに再生音を再生する。
And the control part 4 reproduces | regenerates and displays the still image E on the
ユーザーにより1つの静止画像Eが選択された場合には、静止画像Eが画像表示部8に表示されている間、再生音を音声再生部10において繰り返し再生する。また、ユーザーにより複数の静止画像が選択され、かつ静止画像の再生表示時間が設定されていない場合には、再生音を音声再生部10において再生している間、静止画像Eを画像表示部8に表示する。即ち、静止画像Eの表示を開始したとき、再生音の再生も開始し、再生音の再生を終了したとき、静止画像Eの表示を終了し、次の静止画像の表示を開始する。この場合には、選択された静止画像のそれぞれにおいて、関連付けられた動画像中の音の中から再生音をそれぞれ抽出し、再生する。したがって、静止画像の再生表示時間はそれぞれ異なり、抽出される再生音が多い場合には静止画像の再生表示時間は長くなり、抽出される再生音が少ない場合には静止画像の再生表示時間は短くなる。
When one still image E is selected by the user, the reproduction sound is repeatedly reproduced in the
また、ユーザーにより複数の静止画像が選択され、かつ個々の静止画像の再生表示時間が所定時間に設定されている場合には、静止画像Eを表示する所定時間の間、録音された時間が早い順、録音された時間が静止画像Eの撮像時間に近い順、またはランダムに再生音を再生する。そして、所定時間後、静止画像Eの表示及び再生音の再生を終了し、次の静止画像の表示を開始する。この場合にも、選択された静止画像のそれぞれにおいて、関連付けられた動画像中の音の中から再生音をそれぞれ抽出し、再生する。したがって、抽出された再生音の再生時間が所定時間より短い場合には、再生音を繰り返し再生し、再生音の再生時間が所定時間より長い場合には、再生音を所定時間に短縮して再生する。なお、再生音の一部が再生される場合において、静止画像Eの撮像時間と同一の時間に録音された再生音以外の再生音を必ず再生するように設定されている。 In addition, when a plurality of still images are selected by the user and the reproduction display time of each still image is set to a predetermined time, the recorded time is earlier during the predetermined time for displaying the still image E. In order, the recorded sound is played back in order of recording time of the still image E, or randomly. Then, after a predetermined time, the display of the still image E and the playback of the playback sound are terminated, and the display of the next still image is started. Also in this case, for each selected still image, the reproduction sound is extracted from the sound in the associated moving image and reproduced. Therefore, when the playback time of the extracted playback sound is shorter than the predetermined time, the playback sound is repeatedly played back. When the playback sound playback time is longer than the predetermined time, the playback sound is shortened to the predetermined time and played back. To do. Note that when a part of the playback sound is played back, the playback sound other than the playback sound recorded at the same time as the still image E is captured is set to be played back.
また、ユーザーにより複数の静止画像が選択された場合において、静止画像のそれぞれに対して再生音をそれぞれ抽出するのでなく、選択された複数の静止画像に対する共通の再生音を抽出することもできる。この場合には、解析部14による解析結果から複数の静止画像に共通のテーマ、人物または物を見出し、共通のテーマ、人物または物に基づいて複数の静止画像に共通の参照画像及び参照音を抽出する。そして、複数の静止画像の少なくとも1つと関連付けられている動画像に含まれる音の中から、参照音に関連する音を複数の静止画像に対する共通の再生音として抽出する。共通の再生音は、複数の静止画像を順次再生している間、再生され、静止画像が切り換わる時に切り換えられることはない。
In addition, when a plurality of still images are selected by the user, it is also possible to extract common reproduction sounds for a plurality of selected still images, instead of extracting reproduction sounds for each of the still images. In this case, a common theme, person or thing is found in a plurality of still images from the analysis result by the
なお、テーマ「お祭り」を例に挙げて説明したが、例えば図3に示すように、登録部16にはテーマ「お祭り」以外のテーマ「自動車レース」、「航空ショー」、「家族旅行」等が存在し、様々な登録画像(画像A,G〜N等)及び登録音が登録されている。なお、子供の画像Aは、複数のテーマ「お祭り」「自動車レース」「航空ショー」の登録画像として登録部16に登録されている。以下、テーマ「お祭り」以外のテーマ「自動車レース」、「航空ショー」、「家族旅行」を例に挙げて、再生音を抽出する際の処理について説明する。
Although the theme “festival” has been described as an example, as shown in FIG. 3, for example, the
まず、テーマ「自動車レース」について説明する。テーマ「自動車レース」には、子供の画像A、レーシングカーの画像G、レース用のバイクの画像H、チェッカーフラグの画像I等が登録画像として、画像Aの中の子供の声、エグゾーストノイズの音等が登録音として登録部16に予め登録されている。ユーザーにより静止画像(レーシングカーをバックにした子供の静止画像)が選択されると、制御部4は、静止画像を解析部14において解析させる。即ち、選択された静止画像から、一人の人物が存在し(顔認識)、その人物は「子供」であり(顔識別)、その子供の背後には「レーシングカー」(物認識)があり、「レーシングカー」から「自動車レース」(シーン認識)であることが解析される。次に、制御部4は、登録部16に登録されているすべての登録画像の中から、解析された「子供」「レーシングカー」「自動車レース」に関連する画像を参照画像として抽出する。次に、制御部4は、関連付けられている所定の動画像の中から、参照画像に関連するフレーム領域を抽出し、抽出されたフレーム領域に対応する音を再生音として抽出する。一方、制御部4は、解析部14による解析結果に基づいて、登録部16に登録されているすべての登録音の中から、解析された「子供」「レーシングカー」「自動車レース」に関連する音(この実施の形態では、子供の声、エグゾーストノイズの音等)を参照音として抽出する。そして、関連付けられている所定の動画像に含まれる音の中から、参照音に関連する音を再生音として抽出する。
First, the theme “car racing” will be described. The theme “car race” includes a child image A, a racing car image G, a racing motorcycle image H, a checker flag image I, etc. as registered images. Sounds and the like are registered in advance in the
次に、テーマ「航空ショー」について説明する。テーマ「航空ショー」には、子供の画像A、飛行機の画像J等が登録画像として、画像Aの中の子供の声、ジェットエンジンの音等が登録音として登録部16に予め登録されている。まず、ユーザーにより静止画像(飛行機をバックにした子供の静止画像)が選択されると、制御部4は、静止画像を解析部14において解析させる。即ち、選択された静止画像から、一人の人物が存在し(顔認識)、その人物は「子供」であり(顔識別)、その子供の背後には「飛行機」(物認識)があり、「飛行機」から「航空ショー」(シーン認識)であることが解析される。次に、制御部4は、登録部16に登録されているすべての登録画像の中から、解析された「子供」「飛行機」「航空ショー」に関連する画像を参照画像として抽出する。次に、制御部4は、関連付けられている所定の動画像の中から、参照画像に関連するフレーム領域を抽出し、抽出されたフレーム領域に対応する音を再生音として抽出する。一方、制御部4は、解析部14による解析結果に基づいて、登録部16に登録されているすべての登録音の中から、解析された「子供」「飛行機」「航空ショー」に関連する音(この実施の形態では、子供の声、ジェットエンジンの音等)を参照音として抽出する。そして、関連付けられている所定の動画像に含まれる音の中から、参照音に関連する音を再生音として抽出する。
Next, the theme “Air Show” will be described. In the theme “air show”, a child image A, an airplane image J, and the like are registered in the
なお、画像解析する際、レーシングカーや飛行機の色、形状、ナンバー等を解析し、選択された静止画像の中のレーシングカーまたは飛行機と登録画像の中のレーシングカーまたは飛行機とが同一の場合のみ、該登録画像を参照画像として抽出することもできる。 When analyzing the image, analyze the color, shape, number, etc. of the racing car or airplane, and only if the racing car or airplane in the selected still image is the same as the racing car or airplane in the registered image The registered image can be extracted as a reference image.
次に、テーマ「家族旅行」について説明する。テーマ「家族旅行」には、家族の画像K、テーマパークのキャラクターの画像L、テーマパークのアトラクションの画像N等が登録画像として、家族の声、パレード音楽等が登録音として登録部16に予め登録されている。まず、ユーザーにより静止画像(テーマパークのキャラクターを囲んだ家族の静止画像)が選択されると、制御部4は、静止画像を解析部14において解析させる。即ち、選択された静止画像から、複数の人物が存在し(顔認識)、それら複数の人物はユーザーの「家族」であり(顔識別)、中央には「テーマパークのキャラクター」(物認識)が存在し、「家族」「テーマパークのキャラクター」から「家族旅行」(シーン認識)であることが解析される。次に、制御部4は、登録部16に登録されているすべての登録画像の中から、解析された「家族」「テーマパークのキャラクター」「家族旅行」に関連する画像を参照画像として抽出する。次に、制御部4は、関連付けられている所定の動画像の中から、参照画像に関連するフレーム領域を抽出し、抽出されたフレーム領域に対応する音を再生音として抽出する。一方、制御部4は、解析部14による解析結果に基づいて、登録部16に登録されているすべての登録音の中から、解析された「家族」「テーマパークのキャラクター」「家族旅行」に関連する音(この実施の形態では、家族の声、パレード音楽等)を参照音として抽出する。そして、関連付けられている所定の動画像に含まれる音の中から、参照音に関連する音を再生音として抽出する。
Next, the theme “family trip” will be described. For the theme “family trip”, the family image K, the theme park character image L, the theme park attraction image N, etc. are registered images, and the family voice, parade music, etc. are registered in the
この実施の形態に係る画像再生装置2によれば、静止画像を再生表示する際に、動画像に含まれている音の中から該静止画像と共に再生する最適な再生音を自動で抽出及び再生することができる。また、静止画像を再生表示する際に最適な再生音を再生することができるため、動画像再生時と同様の臨場感で静止画像を鑑賞することができる。 According to the image reproduction device 2 according to this embodiment, when reproducing and displaying a still image, the optimum reproduction sound to be reproduced together with the still image is automatically extracted and reproduced from the sounds included in the moving image. can do. In addition, since the optimum reproduction sound can be reproduced when the still image is reproduced and displayed, the still image can be viewed with a sense of presence similar to that of moving image reproduction.
なお、この実施の形態においては、参照画像及び参照音に基づいて再生音を抽出しているが、参照音を抽出することなく参照画像のみから再生音を抽出してもよく、参照画像を抽出することなく参照音のみから再生音を抽出してもよい。 In this embodiment, the reproduction sound is extracted based on the reference image and the reference sound. However, the reproduction sound may be extracted from only the reference image without extracting the reference sound, and the reference image is extracted. The reproduced sound may be extracted from only the reference sound without doing so.
また、この実施の形態においては、参照画像に関連する動画像のフレーム領域を抽出し、フレーム領域に対応する音を再生音として抽出しているが、参照画像に関連する動画像の1つのフレームを抽出し、抽出されたフレームに対応する音を含む音領域を再生音として抽出することもできる。 In this embodiment, the frame region of the moving image related to the reference image is extracted, and the sound corresponding to the frame region is extracted as the reproduction sound. However, one frame of the moving image related to the reference image is extracted. And a sound region including a sound corresponding to the extracted frame can be extracted as a reproduced sound.
なお、上記実施形態では、図2のステップS13において、静止画Eが撮像された時間を含む時間帯に記録された動画像Mから、静止画E(参照画像A〜D)に関連するフレーム領域F1〜F3を抽出するものとしているが、これに限らず、既述したように、静止画Eの記録時間以外に記録された動画像(図6に示すように、動画像M2の前後の動画像M1,M3)から、関連するフレーム領域F2,F3を抽出するようにしても良い。
In the above embodiment, in step S13 in FIG. 2, the frame region related to the still image E (reference images A to D) from the moving image M recorded in the time zone including the time when the still image E was captured. Although F 1 to F 3 are extracted, the present invention is not limited to this, and as described above, a moving image recorded outside the recording time of the still image E (as shown in FIG. 6, before and after the moving image M 2 Related frame regions F 2 and F 3 may be extracted from the moving
2…画像表示装置、4…制御部、6…記録媒体、8…画像表示部、10…音声再生部、12…操作部、14…解析部、16…登録部。 DESCRIPTION OF SYMBOLS 2 ... Image display apparatus, 4 ... Control part, 6 ... Recording medium, 8 ... Image display part, 10 ... Sound reproduction part, 12 ... Operation part, 14 ... Analysis part, 16 ... Registration part.
Claims (8)
前記記録媒体に記録されている前記静止画像の中から、前記再生部により再生する静止画像を選択する選択部と、
前記選択部により選択された前記静止画像の画像解析を行う解析部と、
前記解析部による解析結果に基づいて、前記記録媒体に記録されている前記音の中から前記再生部により再生する再生音を抽出する抽出部と、
前記選択部により選択された前記静止画像及び前記抽出部により抽出された前記再生音の、前記再生部による再生を制御する再生制御部と、
テーマ毎に関連付けられた参照画像、及び前記参照画像と関連付けられた参照音を登録する登録部とを備え、
前記抽出部は、前記登録部に登録されている前記参照画像及び前記参照音の中から、前記解析部による解析結果に基づき抽出された参照画像及び参照音の少なくとも一方に基づいて、前記再生音を抽出することを特徴とする画像再生装置。 A playback unit for playing back a moving image recorded on a recording medium, a sound recorded together with the moving image, and a still image associated with the moving image;
A selection unit for selecting a still image to be reproduced by the reproduction unit from the still images recorded on the recording medium;
An analysis unit that performs image analysis of the still image selected by the selection unit;
Based on the analysis result by the analysis unit, an extraction unit that extracts a reproduction sound to be reproduced by the reproduction unit from the sound recorded on the recording medium;
A reproduction control unit for controlling reproduction by the reproduction unit of the still image selected by the selection unit and the reproduction sound extracted by the extraction unit;
A reference image associated with each theme, and a registration unit for registering a reference sound associated with the reference image,
The extraction unit is configured to generate the reproduction sound based on at least one of a reference image and a reference sound extracted based on an analysis result by the analysis unit from the reference image and the reference sound registered in the registration unit. An image reproducing apparatus characterized by extracting the image.
前記解析結果に基づき前記参照音が抽出された場合には、前記参照音に類似する前記再生音を抽出することを特徴とする請求項1記載の画像再生装置。 When the reference image is extracted based on the analysis result, the playback sound corresponding to the frame region of the moving image similar to the reference image is extracted;
The analysis in the case where the reference sound is extracted based on the result, the image reproducing apparatus according to claim 1, wherein the extracting the reproduced sound which is similar to the reference sound.
前記抽出部は、前記解析部による前記複数の静止画像の解析結果に基づいて少なくとも1つの前記再生音を抽出し、
前記再生制御部は、前記複数の静止画像を再生している間、前記再生音を再生することを特徴とする請求項1または請求項2に記載の画像再生装置。 The selection unit selects a plurality of the still images,
The extraction unit extracts at least one reproduction sound based on the analysis result of the plurality of still images by the analysis unit;
The reproduction control unit, while playing the plurality of still images, the image reproducing apparatus according to claim 1 or claim 2, characterized in that for reproducing the reproduced sound.
前記抽出部により抽出された前記再生音が前記所定時間より短い場合には、前記静止画像を再生している間、前記再生音を繰り返し再生し、
前記抽出部により抽出された前記再生音が前記所定時間より長い場合には、前記静止画像を再生している間、前記再生音を所定条件に基づいて前記所定時間に短縮し再生することを特徴とする請求項1〜請求項4の何れか一項に記載の画像再生装置。 The reproduction control unit reproduces the still image selected by the selection unit for a predetermined time,
When the reproduction sound extracted by the extraction unit is shorter than the predetermined time, the reproduction sound is reproduced repeatedly while the still image is being reproduced,
When the reproduction sound extracted by the extraction unit is longer than the predetermined time, the reproduction sound is shortened to the predetermined time and reproduced based on a predetermined condition while the still image is being reproduced. The image reproducing device according to any one of claims 1 to 4 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009230365A JP5499605B2 (en) | 2009-10-02 | 2009-10-02 | Image playback device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009230365A JP5499605B2 (en) | 2009-10-02 | 2009-10-02 | Image playback device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011078063A JP2011078063A (en) | 2011-04-14 |
JP5499605B2 true JP5499605B2 (en) | 2014-05-21 |
Family
ID=44021501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009230365A Expired - Fee Related JP5499605B2 (en) | 2009-10-02 | 2009-10-02 | Image playback device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5499605B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4221308B2 (en) * | 2004-01-15 | 2009-02-12 | パナソニック株式会社 | Still image reproduction device, still image reproduction method and program |
JP2007081466A (en) * | 2005-09-09 | 2007-03-29 | Canon Inc | Image processing apparatus and method |
-
2009
- 2009-10-02 JP JP2009230365A patent/JP5499605B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011078063A (en) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9014537B2 (en) | Information processing apparatus and method, and program | |
US20160099023A1 (en) | Automatic generation of compilation videos | |
JP4683116B2 (en) | Information processing apparatus, information processing method, information processing program, and imaging apparatus | |
EP1865426A2 (en) | Information processing apparatus, information processing method, and computer program | |
US8126309B2 (en) | Video playback apparatus and method | |
JP2007097047A (en) | Contents editing apparatus, contents editing method and contents editing program | |
JP2007060060A (en) | Reproduction system, reproducing apparatus, reproducing method, information processing apparatus, information processing method, and program | |
JP2010045765A (en) | Reproducing apparatus | |
JP2007101945A (en) | Apparatus, method, and program for processing video data with audio | |
JP5050445B2 (en) | Movie playback apparatus and movie playback method | |
JP4120378B2 (en) | Surveillance system and program | |
US8712211B2 (en) | Image reproduction system and image reproduction processing program | |
JP5499605B2 (en) | Image playback device | |
JP2010134507A5 (en) | ||
JP2004023661A (en) | Recorded information processing method, recording medium, and recorded information processor | |
JP2006208483A (en) | Device, method, and program for assisting survey of interesting matter of listener, and recording medium | |
JP7451999B2 (en) | Recording device, video system, recording method, and program | |
JP2009283020A (en) | Recording apparatus, reproducing apparatus, and program | |
JP2007258934A (en) | Information processing apparatus and information processing method | |
JP7133367B2 (en) | MOVIE EDITING DEVICE, MOVIE EDITING METHOD, AND MOVIE EDITING PROGRAM | |
KR101748576B1 (en) | Apparatus and method for segmenting video data in mobile communication teminal | |
JP4353084B2 (en) | Video reproduction method, apparatus and program | |
KR20080016265A (en) | Repeatedly playbackable video guest book system and method performed in the system | |
JP2010081531A (en) | Video processor and method of processing video | |
CN112233647A (en) | Information processing apparatus and method, and computer-readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5499605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |