JPH10243351A - Video reproducing device - Google Patents

Video reproducing device

Info

Publication number
JPH10243351A
JPH10243351A JP9042637A JP4263797A JPH10243351A JP H10243351 A JPH10243351 A JP H10243351A JP 9042637 A JP9042637 A JP 9042637A JP 4263797 A JP4263797 A JP 4263797A JP H10243351 A JPH10243351 A JP H10243351A
Authority
JP
Japan
Prior art keywords
video
signal
moving image
reproduction
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9042637A
Other languages
Japanese (ja)
Other versions
JP3877371B2 (en
Inventor
Osamu Hori
修 堀
Toshimitsu Kaneko
子 敏 充 金
Hisashi Aoki
木 恒 青
Susumu Kubota
田 進 窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP04263797A priority Critical patent/JP3877371B2/en
Publication of JPH10243351A publication Critical patent/JPH10243351A/en
Application granted granted Critical
Publication of JP3877371B2 publication Critical patent/JP3877371B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To enable video reproduction while detecting video features in a digital image containing a moving image and a sound, and automatically controlling reproducing speed corresponding to this video feature. SOLUTION: This reproducing device is provided with a signal separating means 1 for separating an inputted video signal into a moving image signal and an audio signal for displaying the desired image by performing the ordinary reproduction, fast forward reproduction and rewind reproduction of digital video signal containing the moving image signal and the audio signal, video feature extracting means 5 for extracting the feature of any one of moving image signal and audio signal separated by the signal separating means 1, and fast forward video reproducing means 10 for generating out the fast forward reproduced video signal while synchronizing the moving image signal and the audio signal while performing prescribed work processing to the video of scene, where the video feature exists, based on the video feature extracted by the video feature extracting means 5, at least.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えばビデオテー
プレコーダ(VTR―Video Tape Recorder ―)または
DVD(Digital Versatile Disc)装置等のように映像
を再生する装置に係り、特に動画像と音声とを含んでデ
ィジタル記録された映像情報における記録上の特徴を抽
出してその特徴に見合うように動画または音声の再生速
度を制御することのできる映像再生装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a device for reproducing video such as a video tape recorder (VTR-Video Tape Recorder) or a DVD (Digital Versatile Disc) device, and more particularly to a device for reproducing moving images and sounds. The present invention relates to a video reproducing apparatus capable of extracting a recording characteristic of digitally recorded video information and controlling a reproduction speed of a moving image or an audio to match the characteristic.

【0002】[0002]

【従来の技術】一般に、動画像と音声とを含む映像情報
は、ビデオテープやDVD等の記録媒体を用いて記録す
ることができ、上記VTRやDVD装置等の再生装置を
用いて再生することが可能となっている。このような映
像再生装置においては、通常の再生速度による再生モー
ドに加えて、最低でも倍速から数百倍速までの高速再生
速度による早送り再生モードと、高速逆転による早戻し
再生モードとの2つのモードが、通常設けられている。
2. Description of the Related Art In general, video information including moving images and audio can be recorded on a recording medium such as a video tape or a DVD, and reproduced using a reproducing apparatus such as the VTR or the DVD apparatus. Is possible. In such a video playback apparatus, in addition to a playback mode at a normal playback speed, there are at least two modes: a fast-forward playback mode with a high-speed playback speed from at least double speed to several hundred times speed, and a fast-reverse playback mode with high-speed reverse rotation. Is usually provided.

【0003】このような従来の映像再生装置では、早送
り再生モードに際して音声は無音にして動画像のみ再生
するのが一般的である。また、機種によっては倍速また
は3倍速程度の早送り再生モードを時短モードとして設
定し、この時短モードの際のみに、動画像を倍速または
3倍速程度の速さで再生すると共に、音声は所定の時間
例えば3秒間再生すると次の所定時間例えば3秒間をカ
ットし、これを繰り返すことにより音声のみは跳び跳び
に再生するものも、提案されている。
In such a conventional video reproducing apparatus, it is general that in a fast-forward reproduction mode, no sound is produced and only a moving image is reproduced. Also, depending on the model, a fast forward playback mode of about double speed or about 3 times speed is set as a time saving mode. Only in this time saving mode, a moving image is played back at about twice or about 3 times speed, and audio is played for a predetermined time. For example, there has been proposed an apparatus that cuts a next predetermined time, for example, 3 seconds when reproduced for 3 seconds, and repeats this to reproduce only a sound in a jumping manner.

【0004】また、従来の映像再生装置においては、早
送り再生モードで映像を再生する際に、装置の設計時に
予め設定された一定の速度により動画像を再生するもの
が一般的であった。機種によっては再生速度を可変とす
るものも提案されているが、その方法としては速度設定
ダイヤル等により再生速度を設定し、検索すべき映像場
面等を検索可能な程度にまで検索者の好みで再生速度を
遅らせるようにしており、あくまでもマニュアル操作に
よって再生速度の調整を行なっていた。
Further, in a conventional video reproducing apparatus, when reproducing a video in the fast-forward reproduction mode, a moving image is generally reproduced at a constant speed preset at the time of designing the apparatus. Depending on the model, it is proposed to make the playback speed variable, but as a method, the playback speed is set with a speed setting dial etc., and the searcher's preference to the extent that the video scene etc. to be searched can be searched. The playback speed was slowed down, and the playback speed was adjusted manually only.

【0005】[0005]

【発明が解決しようとする課題】しなしながら、上述し
た従来の映像再生装置においては、早送り再生が無音の
ままで行なわれているため、映像の内容を把握するのが
困難であり、また、映像に同期させて音声を再生する
と、再生音声が余りに高速であるため映像内の人物が何
を言っているか分からなかった。また、倍速または3倍
速程度の再生速度により音声を細切れにして部分的に再
生する再生装置では、意味のある音声部分のみ飛び飛び
に再生されている場合はまだしも、意味のある音声部分
が再生されずに意味のない音声部分が不規則に再生され
た場合には内容を完全に把握できない場合があった。
However, in the conventional video reproducing apparatus described above, since the fast-forward reproduction is performed with no sound, it is difficult to grasp the contents of the video. When playing audio in synchronization with the video, it was not possible to know what the person in the video was saying because the playback audio was too fast. Also, in a reproducing apparatus that cuts out audio at a reproduction speed of about double speed or triple speed and partially reproduces the audio, if only a significant audio portion is discretely reproduced, a significant audio portion is not reproduced yet. When an insignificant audio part is reproduced irregularly, the contents may not be completely understood.

【0006】また、一定の速度でしかもある程度の高速
で映像が再生されるだけの早送り機能だと動きの速い部
分で視認性が悪く内容を効果的に把握することが難しい
という問題があった。マニュアル操作により再生速度を
必要に応じて可変とする映像再生装置においては、検索
者が常時画面を注視して検索場面を探さなくてはなら
ず、応答性は向上するものの再生速度を可変に設定しな
がら検索を続けなくてはならないという煩雑さがあっ
た。
In addition, if the fast-forward function is used to reproduce a video at a constant speed and at a certain high speed, there is a problem that visibility is poor in a fast-moving portion and it is difficult to effectively grasp the contents. In a video playback device that changes the playback speed as needed by manual operation, the searcher must constantly look at the screen and search for the search scene, and although the responsiveness improves, the playback speed is set variably. However, there was a trouble that the search had to be continued.

【0007】本発明は上記問題点に鑑み、動画像と音声
を含むディジタル映像の場面における音声の有音部分や
動画像が大幅に変化する部分等の映像特徴を検出し、こ
の映像特徴に応じて自動的に再生速度を調整しながら映
像の再生を行なうことのできる映像再生装置を提供する
ことを目的としている。
SUMMARY OF THE INVENTION In view of the above problems, the present invention detects video features such as a sound portion of a sound and a portion where a moving image greatly changes in a digital video scene including a moving image and a sound, and responds to the video feature. It is an object of the present invention to provide a video reproducing apparatus capable of reproducing a video while automatically adjusting a reproducing speed.

【0008】[0008]

【課題を解決するための手段】上記課題を解決するた
め、請求項1に係る映像再生装置は、動画像信号と音声
信号とを含むディジタル映像信号を通常再生、早送り再
生および逆回し再生することにより所望の映像を表示す
る映像再生装置において、入力された前記ディジタル映
像信号を動画像信号と音声信号とに分離する信号分離手
段と、前記信号分離手段により分離された動画像信号と
音声信号のうちの少なくとも一方の特徴を抽出する映像
特徴抽出手段と、前記映像特徴抽出手段により抽出され
た映像特徴に基づいて前記映像特徴が存在する場面の映
像に所定の加工を行ないながら前記動画像信号と前記音
声信号との何れか一方に同期させつつ早送り再生映像信
号を生成して出力する早送り映像再生手段と、を少なく
とも備えることを特徴としている。
According to a first aspect of the present invention, there is provided a video reproducing apparatus for performing a normal reproduction, a fast forward reproduction, and a reverse reproduction of a digital video signal including a moving image signal and an audio signal. In a video reproducing apparatus for displaying a desired video according to the following, a signal separating means for separating the input digital video signal into a moving image signal and an audio signal, and a moving image signal and an audio signal separated by the signal separating means. A video feature extraction unit for extracting at least one of the features, and the video signal while performing a predetermined process on a video of a scene where the video feature exists based on the video feature extracted by the video feature extraction unit. Fast-forward video playback means for generating and outputting a fast-forward playback video signal while synchronizing with one of the audio signals. It is set to.

【0009】請求項2に係る映像再生装置は、請求項1
に記載の映像再生装置において、前記映像特徴抽出手段
が、前記信号分離手段により分離された前記音声信号に
おける無音部分の開始時点から終了時点までの所定範囲
を音声特徴として抽出する音声特徴抽出手段により構成
されると共に、前記早送り映像再生手段が、前記信号分
離手段により分離された動画像信号を所定の速度で再生
して早送り動画像信号を出力する動画像再生手段と、前
記音声特徴抽出手段により抽出された無音部分を除去し
て少なくとも有音部分を含む音声再生信号を加工すると
共に前記早送り動画像信号の再生速度にこの音声再生信
号を同期させて同期音声信号を出力する音声再生手段
と、前記同期音声信号と前記早送り動画像信号とを合成
して早送り再生映像信号を出力する合成手段と、を備え
ることを特徴としている。
[0009] According to a second aspect of the present invention, there is provided a video reproducing apparatus.
In the video reproduction device described in the above, the video feature extraction means, by the audio feature extraction means to extract a predetermined range from the start time to the end time of the silent part in the audio signal separated by the signal separation means as audio features The fast-forward video playback means, wherein the fast-forward video playback means plays back the video signal separated by the signal separation means at a predetermined speed and outputs a fast-forward video signal, and the audio feature extraction means Audio playback means for processing the audio playback signal including at least the voiced portion by removing the extracted silent portion and synchronizing the audio playback signal with the playback speed of the fast-forward moving image signal to output a synchronized audio signal; Synthesizing means for synthesizing the synchronous audio signal and the fast-forward moving image signal and outputting a fast-forward playback video signal, That.

【0010】また、請求項3に係る映像再生装置は、請
求項2に記載の映像再生装置において、前記音声再生手
段が、前記音声特徴抽出手段により抽出された無音部分
を除去して有音部分を連続させる音声信号加工手段と、
加工された音声再生信号を前記動画像再生手段により再
生された早送り動画像信号の再生速度に同期させる同期
手段と、を含むことを特徴としている。
According to a third aspect of the present invention, in the video reproducing apparatus according to the second aspect, the audio reproducing unit removes a silent portion extracted by the audio feature extracting unit to generate a sound portion. Signal processing means for making
And a synchronizing means for synchronizing the processed audio reproduction signal with the reproduction speed of the fast-forward moving image signal reproduced by the moving image reproducing means.

【0011】また、請求項4に係る映像再生装置は、請
求項3に記載の映像再生装置において、前記音声再生手
段が、前記加工手段により加工されて現在再生中の前記
音声再生信号の再生を打ち切って、その次に加工された
音声再生信号を前記早送り動画像信号の再生速度に同期
させて再生するように構成されていることを特徴として
いる。
According to a fourth aspect of the present invention, in the video reproducing apparatus according to the third aspect, the audio reproducing means reproduces the audio reproducing signal which is currently reproduced by the processing means. It is characterized in that it is configured to stop and reproduce the next processed audio reproduction signal in synchronization with the reproduction speed of the fast-forward moving image signal.

【0012】また、請求項5に係る映像再生装置は、請
求項3に記載の映像再生装置において、前記音声再生手
段が、前記加工手段により加工されて現在再生中の前記
音声再生信号による再生音を徐々に小音量にすると共
に、次に加工された音声再生信号に重ね合わせて再生な
がらこの次抽出の音声再生信号による再生音の音量を徐
々に高くするように構成されていることを特徴としてい
る。
According to a fifth aspect of the present invention, in the video reproducing apparatus according to the third aspect, the audio reproducing means reproduces a reproduced sound by the audio reproducing signal which is currently reproduced by the processing means. And gradually reduce the volume of the reproduced sound by the next extracted audio reproduction signal while superimposing it on the next processed audio reproduction signal. I have.

【0013】また、請求項6に係る映像再生装置は、請
求項3に記載の映像再生装置において、前記音声再生手
段が、前記早送り再生映像信号が撮影された方向とは時
間的に逆方向に再生されたときに、再生されている映像
に同期させて加工された前記音声再生信号の先頭から順
方向に再生するように構成されていることを特徴として
いる。
According to a sixth aspect of the present invention, in the video reproducing apparatus according to the third aspect, the audio reproducing means is arranged so as to be temporally opposite to a direction in which the fast-forward reproduced video signal is photographed. When reproduced, the audio reproduction signal processed in synchronization with the reproduced video is reproduced in the forward direction from the beginning.

【0014】また、請求項7に係る映像再生装置は、請
求項3に記載の映像再生装置において、前記同期手段
が、前記音声再生手段により再生された前記音声再生信
号の再生速度に同期させながら前記動画像再生手段によ
り再生された早送り再生動画像信号の再生速度を決定し
て前記合成手段に出力することを特徴としている。
According to a seventh aspect of the present invention, in the video reproducing apparatus according to the third aspect, the synchronization means synchronizes with a reproduction speed of the audio reproduction signal reproduced by the audio reproduction means. It is characterized in that a reproduction speed of a fast-forward reproduced moving image signal reproduced by the moving image reproducing means is determined and output to the synthesizing means.

【0015】さらに、請求項8に係る映像再生装置は、
請求項1に記載の映像再生装置において、前記映像特徴
抽出手段が、前記信号分離手段により分離された前記動
画像信号を複数の静止画像であるフレームに分割するフ
レーム分割手段と、このフレーム分割手段により分割さ
れたフレーム間における変化量を検出するフレーム間変
化量検出手段と、を含む動画特徴抽出手段より構成され
ると共に、前記早送り映像再生手段が、前記フレーム間
変化量検出手段により検出された前記フレーム間の変化
量に応じて前記フレームの齣送り速度を変化させること
により動画像信号の再生速度を変更して早送り再生映像
信号を再生する動画像再生手段より構成されることを特
徴としている。
Further, the video reproducing apparatus according to claim 8 is
2. The video reproducing apparatus according to claim 1, wherein the video feature extracting unit divides the moving image signal separated by the signal separating unit into a plurality of still image frames, and the frame dividing unit. And an inter-frame change amount detecting means for detecting an inter-frame change amount between the frames divided by the moving image feature extracting means, and the fast-forward video reproducing means is detected by the inter-frame change amount detecting means. It is characterized by comprising moving picture reproducing means for changing the exposure feed rate of the frame in accordance with the amount of change between the frames, thereby changing the reproduction speed of the moving picture signal and reproducing the fast-forward reproduction video signal. .

【0016】また、請求項9に係る映像再生装置は、請
求項8に記載の映像再生装置において、前記フレーム間
変化量検出手段は、圧縮符号化された映像データから動
きの変化量を求めるように構成されていることを特徴と
している。
According to a ninth aspect of the present invention, in the video reproducing apparatus of the eighth aspect, the inter-frame change amount detecting means determines a change amount of motion from the compression-encoded video data. It is characterized by being constituted.

【0017】さらに、請求項10に係る映像再生装置
は、請求項8に記載の映像再生装置において、前記動画
像再生手段が、前記フレーム分割手段により分割された
動画像におけるフレームと指定された参照画像との間の
類似度を求める類似度検出手段と、検出されたフレーム
および参照画像間の類似度に基づいてこの類似度が高い
ほど再生速度を遅くすると共に類似度が低いほど再生速
度を速く再生するように再生速度を調整する速度調整手
段と、この速度調整手段により調整された再生速度に基
づいて前記フレーム分割手段より送られてきた動画像信
号の早送り再生速度を変更する動画像再生速度変更手段
と、を備えることを特徴としている。
Further, according to a tenth aspect of the present invention, in the video reproducing apparatus according to the eighth aspect, the moving image reproducing means is configured such that the moving image reproducing means is designated as a frame in the moving image divided by the frame dividing means. A similarity detecting means for obtaining a similarity between the image and a similarity between the detected frame and the reference image, wherein the higher the similarity, the lower the reproduction speed and the lower the similarity, the higher the reproduction speed. Speed adjusting means for adjusting a reproducing speed so as to reproduce, and a moving image reproducing speed for changing a fast-forward reproducing speed of the moving image signal sent from the frame dividing means based on the reproducing speed adjusted by the speed adjusting means. And changing means.

【0018】また、請求項11に係る映像再生装置は、
請求項8に記載の映像再生装置において、前記フレーム
間変化量検出手段が、動画像信号における変化量が変化
する量である加速度を求める加速度検出手段を備えるこ
とを特徴としている。
Further, the video reproducing apparatus according to claim 11 is
9. The video reproducing apparatus according to claim 8, wherein said inter-frame change amount detecting means includes an acceleration detecting means for obtaining an acceleration which is an amount by which a change amount in a moving image signal changes.

【0019】また、請求項12に係る映像再生装置は、
請求項8に記載の映像再生装置において、前記フレーム
間変化量検出手段が、前記動画像の中から背景と動きの
ある物体とを分離する背景・動き分離手段と、分離され
た背景と動きのある物体との相対速度の変化量を求める
背景・動き間相対速度検出手段と、を備えることを特徴
としている。
Further, the video reproducing apparatus according to claim 12 is
9. The video reproducing apparatus according to claim 8, wherein the inter-frame change amount detecting unit separates a background and a moving object from the moving image, and a background / motion separating unit. Background / motion relative speed detecting means for obtaining a change amount of a relative speed with respect to a certain object.

【0020】[0020]

【発明の実施の形態】以下、本発明に係る映像再生装置
の好適な実施形態について添付図面を参照しながら詳細
に説明する。まず、本発明の最も基本的な概念を示す第
1実施形態に係る映像再生装置について、図1を参照し
ながら説明する。図1において、映像再生装置は、動画
像信号および音声信号を含むディジタル映像信号を入力
してこのディジタル映像信号を動画像信号と音声信号と
に分離する信号分離手段1と、この信号分離手段1によ
り分離された動画像信号と音声信号のうちの少なくとも
一方の映像特徴を抽出する映像特徴抽出手段5と、前記
映像特徴抽出手段5により抽出された映像特徴に基づい
て、前記映像特徴が存在する場面の映像に所定の加工処
理を行ないながら前記動画像信号と前記音声信号とを同
期させつつ早送り再生映像信号を生成して出力する早送
り映像再生手段10と、を備えている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of a video reproducing apparatus according to the present invention will be described below in detail with reference to the accompanying drawings. First, a video reproducing apparatus according to a first embodiment showing the most basic concept of the present invention will be described with reference to FIG. In FIG. 1, a video reproducing apparatus includes a signal separating unit 1 for inputting a digital video signal including a moving image signal and an audio signal and separating the digital video signal into a moving image signal and an audio signal. Video feature extraction means 5 for extracting at least one video feature of a moving image signal and an audio signal separated by the above, and the video feature exists based on the video feature extracted by the video feature extraction means 5 A fast-forward video playback unit 10 for generating and outputting a fast-forward playback video signal while synchronizing the moving image signal and the audio signal while performing predetermined processing on a video of a scene.

【0021】この明細書においては、映像とは動画像と
音声とが複合されたものであると定義して用いるので、
映像特徴とは、動画像が例えば急激に変化することによ
り他の部分とは著しく異なった部分である動画像特徴
と、音声が無音状態または有音状態が継続する部分や例
えば映像中の山場により歓声等が急激に高まった部分で
ある音声特徴と、の両者を含んだものとして定義する。
したがって、前記映像特徴抽出手段5は、前記信号分離
手段1により分離された前記音声信号における無音部分
の開始時点から終了時点までの所定範囲を音声特徴とし
て抽出する音声特徴抽出手段6と、前記信号分離手段1
により分離された前記動画像信号を複数の静止画像であ
るフレームに分割して分割されたフレーム間における変
化量を検出する動画特徴抽出手段6と、の少なくとも何
れか一方を備えている。
In this specification, a video is defined and used as a composite of a moving image and a sound.
A video feature is a video feature that is a part that is significantly different from other parts due to a sudden change in the moving image, for example, and a part where the sound is in a silent state or a sound state or a mountain in the video, for example. It is defined as including both a voice feature, which is a part where cheers and the like have rapidly increased.
Therefore, the video feature extraction unit 5 includes an audio feature extraction unit 6 that extracts a predetermined range from a start time to an end time of a silent part in the audio signal separated by the signal separation unit 1 as an audio feature, Separation means 1
And a moving image feature extraction unit 6 for dividing the moving image signal separated into a plurality of still images into frames and detecting a change amount between the divided frames.

【0022】また、早送り映像再生手段10は、前記動
画特徴抽出手段6が動画特徴を供給する場合にはその動
画特徴に基づいて再生速度等を変化させて動画像の早送
り再生を行なう動画像再生手段11と、前記音声特徴抽
出手段7が音声特徴を供給する場合にはその音声特徴に
基づいて音声信号に所定の加工を加えると共に前記動画
像再生手段11の出力する動画像の早送り再生信号に同
期させて音声再生信号を出力する音声再生手段12と、
早送り再生された動画像と再生された音声とを合成する
合成手段18と、を備えている。
When the moving image feature extracting means 6 supplies moving image characteristics, the fast-forward image reproducing means 10 changes the reproduction speed and the like based on the moving image characteristics to perform fast-forward reproduction of moving images. When the audio feature extracting means 7 supplies the audio feature, the audio signal is subjected to predetermined processing based on the audio feature, and the audio signal is processed by a fast-forward reproduction signal of the moving image output by the moving image reproducing means 11. An audio playback unit 12 that outputs an audio playback signal in synchronization with the audio playback unit 12;
Synthesizing means 18 for synthesizing the fast-forward reproduced moving image and the reproduced sound.

【0023】本発明の基本概念は上述したように、映像
の特徴を抽出して映像の早送り再生の際にこの特徴を用
いるものであるので、映像特徴としての音声特徴を抽出
する第2実施形態に係る映像再生装置について説明す
る。図2において、映像特徴抽出手段5は、信号分離手
段1により分離された音声信号における音声特徴を抽出
する音声特徴抽出手段7より構成されており、また、早
送り映像再生手段10を構成する音声再生手段12は抽
出された前記音声特徴としての無音部分を除去して少な
くとも有音部分を含む音声再生信号を加工する音声信号
加工手段13と、前記動画像再生手段11より出力され
る早送り動画像信号の再生速度にこの音声再生信号を同
期させて同期音声信号を出力する同期手段14とを備え
ている。
As described above, the basic concept of the present invention is to extract features of a video and use this feature at the time of fast-forward playback of the video. Therefore, the second embodiment for extracting audio features as video features The video playback device according to the above will be described. In FIG. 2, the video feature extraction means 5 comprises an audio feature extraction means 7 for extracting audio features in the audio signal separated by the signal separation means 1, and the audio reproduction constituting the fast-forward video reproduction means 10. Means 12 for removing an extracted silent part as an audio feature to process an audio reproduction signal including at least a sound part, and a fast-forward moving image signal output from the moving image reproducing means 11 And a synchronizing means 14 for synchronizing the audio reproduction signal with the reproduction speed and outputting a synchronous audio signal.

【0024】また、映像特徴としての動画特徴を抽出す
る第3実施形態に係る映像再生装置について、図3を参
照しながら説明する。前記映像特徴抽出手段5は、前記
信号分離手段1により分離された前記動画像信号を複数
の静止画像であるフレームに分割するフレーム分割手段
20と、このフレーム分割手段20により分割されたフ
レーム間における変化量を検出するフレーム間変化量検
出手段21と、を含む動画特徴抽出手段6より構成され
ている。フレーム間変化量検出手段21は、圧縮符号化
された映像データから動きの変化量を求めるように構成
されていても良いし、動画像信号における変化量が変化
する量である加速度を求める加速度検出手段22を備え
ていても良い。また、フレーム間変化量検出手段21
は、前記動画像の中から背景と動きのある物体とを分離
する背景・動き分離手段(図示されず)と、分離された
背景と動きのある物体との相対速度の変化量を求める背
景・動き間相対速度検出手段23と、を備えるように構
成しても良い。
A video reproducing apparatus according to a third embodiment for extracting a moving image feature as a video feature will be described with reference to FIG. The video feature extracting unit 5 includes: a frame dividing unit 20 that divides the moving image signal separated by the signal separating unit 1 into a plurality of still image frames; The moving image feature extracting means 6 includes an inter-frame change amount detecting means 21 for detecting a change amount. The inter-frame change amount detecting means 21 may be configured to calculate the change amount of the motion from the compression-encoded video data, or may detect the acceleration which is the amount by which the change amount in the moving image signal changes. Means 22 may be provided. The inter-frame change amount detecting means 21
Is a background / motion separating means (not shown) for separating a background and a moving object from the moving image, and a background / motion for calculating a relative speed change amount between the separated background and the moving object. And an inter-movement relative speed detecting means 23.

【0025】また、早送り映像再生手段10は、前記フ
レーム間変化量検出手段21により検出された前記フレ
ーム間の変化量に応じて前記フレームの齣送り速度を変
化させることにより動画像信号の再生速度を変更して早
送り再生映像信号を再生する動画像再生手段11を備え
ており、この動画像再生手段11は、前記フレーム分割
手段20により分割された動画像におけるフレームと指
定された参照画像との間の類似度を求める類似度検出手
段25と、検出されたフレームと参照画像との類似度に
基づいてこの類似度が高いほど再生速度を遅くすると共
に類似度が低いほど再生速度を速く再生するように再生
速度を調整する速度調整手段26と、この速度調整手段
26により調整された再生速度に基づいて前記フレーム
分割手段20より送られてきた動画像信号の早送り再生
速度を変更する動画像再生速度変更手段27と、を備え
ている。
The fast-forward video reproducing means 10 changes the exposure speed of the frame in accordance with the amount of change between the frames detected by the inter-frame change amount detecting means 21 to thereby reproduce the moving image signal. And a moving image reproducing means 11 for reproducing a fast-forward reproduction video signal by changing the frame rate. The moving image reproducing means 11 is provided with a frame in the moving image divided by the frame dividing means 20 and a designated reference image. A similarity detecting means 25 for calculating the similarity between the frames, and based on the similarity between the detected frame and the reference image, the higher the similarity, the slower the reproduction speed and the lower the similarity, the higher the reproduction speed. Adjusting means 26 for adjusting the playback speed as described above and the frame dividing means 20 based on the playback speed adjusted by the speed adjusting means 26. Is a moving image reproduction speed changing unit 27 for changing the fast-forward playback speed of the moving image signal has been provided with a.

【0026】上記第1ないし第3実施形態に係る映像再
生装置を、音声特徴抽出において更に具体化した第4実
施形態に係る映像再生装置を図4ないし図9を参照しな
がら詳細に説明する。図4は、この第4実施形態に係る
映像再生装置のシステム構成を示すブロック図である。
図4において、映像再生装置の基本システムは、動画像
データを蓄積する動画像データベース31と、この動画
像データベース31に蓄積された動画像データの音声部
分を解析して所定範囲の音声を分割する音声解析部32
と、この音声解析部32の結果から音声と動画像の対応
関係をテーブル情報として生成する動画像解析部33
と、分割された音声と動画像の同期をとってそれぞれを
再生する音声再生部34および動画像再生部35と、ユ
ーザのオペレーションを受け付ける入力部36と、すべ
ての機器を制御する制御部37と、映像データを表示お
よび音を鳴らす表示部38とより構成されている。
The video reproducing apparatus according to the fourth embodiment, in which the video reproducing apparatus according to the first to third embodiments is further embodied in audio feature extraction, will be described in detail with reference to FIGS. FIG. 4 is a block diagram showing a system configuration of the video reproducing apparatus according to the fourth embodiment.
In FIG. 4, the basic system of the video reproducing apparatus analyzes a moving image database 31 for storing moving image data and an audio portion of the moving image data stored in the moving image database 31 to divide a predetermined range of sound. Voice analysis unit 32
And a moving image analyzing unit 33 for generating a correspondence between a sound and a moving image from the result of the sound analyzing unit 32 as table information.
A sound reproducing unit 34 and a moving image reproducing unit 35 for synchronizing and reproducing the divided sound and the moving image, an input unit 36 for receiving a user operation, and a control unit 37 for controlling all devices. And a display unit 38 for displaying video data and sounding.

【0027】音声特徴抽出としての音声の分割は、図5
に示すように、音声のパワー(音声の大きさ)を見るこ
とによって無音部の開始点t2 およびt4 と終了点t3
およびt5 とを検知する。音声があると判断された有音
部分30は分割され、その情報を動画像データベース3
1に格納する。音声を分割すると同時に音声が存在する
映像フレームとの対応関係を動画像分析部33において
計算し、対応表としてその情報を動画像データベース3
1に格納する。表示部38を用いてユーザが映像を鑑賞
しているときに、入力部36(キーボード、シャトル、
ボタン、リモートコントローラ等)からの指示により映
像を早送りすることができる。
The segmentation of speech as speech feature extraction is shown in FIG.
As shown in the figure, the start points t2 and t4 and the end point t3 of the silent part are obtained by looking at the power of the voice (the volume of the voice).
And t5 are detected. The sound portion 30 determined to have sound is divided and the information is stored in the moving image database 3.
1 is stored. At the same time as the sound is divided, the moving image analyzing unit 33 calculates the correspondence between the sound and the video frame in which the sound exists, and stores the information as a correspondence table in the moving image database
1 is stored. When the user is watching the video using the display unit 38, the input unit 36 (keyboard, shuttle,
The video can be fast-forwarded by an instruction from a button, a remote controller, or the like.

【0028】次に、映像を早送りしながら音声を再生す
る方法の一例を説明する。図6に示すように、ある区間
の映像を2倍速で再生する場合、普通は音声も2倍速で
再生する必要がある。しかし、早送りを行なうフレーム
中に、例えば音声が発せられた有音部30が3つ存在し
無音部39も同数程度存在する場合、無音部39を省い
て音声を図6(b)のように縮めることができる。しか
し、無音部39が十分多くない場合は図6(c)のよう
に音声は重なってしまうことになる。そこで、動画像解
析部33において作成された音声の分割された所定範囲
の開始点に対応する映像フレームの対応表を用いて早送
り再生において分割された音声の再生を開始するタイミ
ングを計算する。
Next, an example of a method of reproducing a sound while fast-forwarding an image will be described. As shown in FIG. 6, when a video in a certain section is reproduced at 2 × speed, it is usually necessary to reproduce audio at 2 × speed. However, if there are, for example, three voiced portions 30 and the same number of silent portions 39 in which a voice is emitted in a frame in which fast-forwarding is performed, the voiceless portions 39 are omitted and the voice is output as shown in FIG. Can shrink. However, if there are not enough silences 39, the voices will overlap as shown in FIG. Therefore, the timing for starting the reproduction of the divided audio in the fast-forward reproduction is calculated using the correspondence table of the video frames corresponding to the start points of the divided predetermined range of the audio created in the moving image analysis unit 33.

【0029】次に、制御部37を用いて映像と音声を同
時に再生を開始する。そのとき、映像は2倍速で再生
し、音声はそのままの速度で無音部を取り除いて第1の
分割音声の再生を開始する。このとき、制御部37は対
応表を身ながら第2の分割音声を再生するタイミングに
きたとき、第1の分割音声の再生を打ち切って、第2の
音声の再生を開始する。以後同様に、第3の分割音声を
再生するタイミングがきたときには、第2の分割音声を
打ち切って第3の分割音声を再生する。次々に第5の分
割音声の再生と第4の分割音声の途中打ち切りを繰り返
すことによって、聞きとれる音声で再生が可能になる。
無音部39が多数あって、打ち切る必要がない場合は、
その分割音声を打ち切らずに次の分割音声のタイミング
まで音声再生部34は音声を再生しない。
Next, reproduction of video and audio is started simultaneously using the control unit 37. At this time, the video is played back at double speed, and the audio starts removing the silence at the same speed and starts playing back the first divided audio. At this time, when it is time to reproduce the second divided sound while holding the correspondence table, the control unit 37 terminates reproduction of the first divided sound and starts reproduction of the second sound. Thereafter, similarly, when the timing to reproduce the third divided sound comes, the second divided sound is terminated and the third divided sound is reproduced. By repeating the reproduction of the fifth divided sound and the discontinuation of the fourth divided sound halfway one after another, it becomes possible to reproduce the audible sound.
If there is a lot of silence 39 and it is not necessary to terminate it,
The audio reproduction unit 34 does not reproduce the audio until the timing of the next divided audio without aborting the divided audio.

【0030】さらに、音がとぎれて聞こえにくい場合が
あるので、別のモードを入力部36(例えばマウス)に
より選択して設定することにより、音声を完全に打ち切
ることなく次の分割音声が始まった時には前の音声を徐
々に小さくして音を重ねて再生することもできる。ユー
ザに同時に2つの音を聞かせることにより、話されてい
る言葉またはその他の音を継続して聞かせることができ
る。人間の聴覚は、小さくなっていく方の音声が前の分
割音声であり、普通に聞こえてくる方の音声が新しく開
始された音声であると認識できるので、同時にふたつの
音声を聞き分けることができる。音を小さくさせる傾向
はあらかじめ入力部36から設定するパラメータでコン
トロールできるので急に小さくするものやほとんど小さ
くならないものなどが選べる。
Further, since the sound may be interrupted and difficult to hear, by selecting and setting another mode using the input unit 36 (for example, a mouse), the next divided sound is started without completely stopping the sound. Sometimes, the previous sound can be gradually reduced and the sound can be superimposed and reproduced. By letting the user hear two sounds at the same time, the spoken word or other sound can be heard continuously. The human auditory sense can recognize two voices at the same time because the smaller voice is the previous split voice and the voice that is heard normally is the newly started voice. . The tendency to reduce the sound can be controlled by a parameter set in advance from the input unit 36, so that a sound that suddenly decreases or a sound that hardly decreases can be selected.

【0031】図7に示すように、順方向44の音声再生
の場合は、分割音声の有音部41、42および43の先
頭が早送りの映像フレームの再生速度45に同期して再
生される。また、図8に示すように、映像の逆早送り5
4の場合には映像フレームは逆方向に再生されるが、分
割された音声と映像の対応表を用いて、分割された有音
部51、52および53の音声の終了点と音声の開始点
に対応する映像フレームとの対応関係を入れ替えて、音
声は順方向54に再生する。これにより、映像と音声と
はほぼ同期がとれて、しかも音声が充分明瞭に理解でき
る程度の再生が可能となる。再生方法は順方向に再生し
たときと同様に次に分割された音声を再生するタイミン
グがきた時に、モードによって、前の音声を打ち切る
か、小さくするかの選択を行ない、次の音声を再生す
る。
As shown in FIG. 7, in the case of sound reproduction in the forward direction 44, the heads of the sound portions 41, 42 and 43 of the divided sound are reproduced in synchronization with the reproduction speed 45 of the fast-forward video frame. Also, as shown in FIG.
In the case of No. 4, the video frame is reproduced in the reverse direction. However, using the correspondence table of the divided audio and video, the audio end point and the audio start point of the divided sound parts 51, 52 and 53 are used. The sound is reproduced in the forward direction 54 by exchanging the correspondence relationship with the video frame corresponding to. As a result, the video and the audio are substantially synchronized, and the reproduction can be performed to the extent that the audio can be sufficiently clearly understood. The playback method is similar to that when playing back in the forward direction, and when it comes to the time to play back the next divided sound, depending on the mode, select whether to cut off the previous sound or reduce it, and play the next sound .

【0032】図9に示すように、入力部36においてモ
ードを選び音声優先で映像を再生する場合、分割された
有音部61、62および63の音声の先頭と末尾までに
該当する映像フレームと前または後の無音部64、6
5、66および67に対応する映像フレームを対応表か
ら選び、分割された音声に同期させて映像を早送り再生
する。たとえば、音声61に該当するのは映像フレーム
F1〜F20であるが、その直後の無音部65に対応す
るフレームF21〜F30の映像フレームも合わせて音
声再生時間内に早送りして映像再生する。これにより音
声を明瞭に聞き取ることができ、2倍速程度の早送りに
より映像も確認することができる。
As shown in FIG. 9, when a mode is selected in the input unit 36 and the video is reproduced with priority given to the audio, the video frames corresponding to the head and the end of the audio of the divided sound parts 61, 62 and 63 are added. Silence 64, 6 before or after
The video frames corresponding to 5, 66 and 67 are selected from the correspondence table, and the video is fast-forward reproduced in synchronization with the divided audio. For example, although the video frames F1 to F20 correspond to the audio 61, the video frames of frames F21 to F30 corresponding to the silence section 65 immediately thereafter are also fast forwarded within the audio reproduction time to reproduce the video. As a result, the voice can be heard clearly, and the video can be confirmed by fast-forwarding at about twice the speed.

【0033】次に、前記第3実施形態と同様に、映像特
徴を動画特徴により抽出して早送りの速度を画面の変化
の度合いで制御する第5実施形態に係る映像再生装置に
ついて説明する。図7は第5実施形態に係る映像再生装
置のシステム構成を示すブロック図である。このシステ
ムは、動画像を格納する動画像データベース71と、前
記動画像のフレーム間の変化を参照画像と比較して動画
像を解析する動画像解析部72と、動画像解析結果によ
って動画像データベース71から動画像フレームを選択
して同期再生する制御部75と、選択された動画像を再
生する映像再生部76と、動画像再生のモードを選択し
または参照画像を指定するための入力部77と、動画像
を表示する表示部78とから構成されており、前記動画
像解析部72は、動画像のフレーム間の変化と与えられ
た参照画像を格納する参照画像記憶部73と、動画像フ
レームと参照画像とを比較計算する映像比較部74と、
を備えている。
Next, a description will be given of a video reproducing apparatus according to a fifth embodiment in which video characteristics are extracted from moving image characteristics and the speed of fast-forwarding is controlled by the degree of screen change, as in the third embodiment. FIG. 7 is a block diagram illustrating a system configuration of a video playback device according to the fifth embodiment. The system includes a moving image database 71 for storing moving images, a moving image analyzing unit 72 for analyzing a moving image by comparing a change between frames of the moving image with a reference image, and a moving image database based on a moving image analysis result. A control unit 75 for selecting a moving image frame from 71 and synchronously reproducing the same, a video reproducing unit 76 for reproducing the selected moving image, and an input unit 77 for selecting a moving image reproducing mode or designating a reference image And a display unit 78 for displaying a moving image. The moving image analyzing unit 72 includes a reference image storage unit 73 for storing a change between frames of the moving image and a given reference image, and a moving image A video comparing unit 74 for comparing and calculating the frame and the reference image;
It has.

【0034】前記入力部77からのモードの指定で映像
再生の早送りの指示命令が入り、動画像データベース7
1の所望の格納場所から動画像フレームが動画像解析部
72へ転送され前後の映像フレームの動きの変化量が計
算される。例えば、図11に示すように、相撲の力士同
士が立ち会っている動画像フレーム81と、次の瞬間の
映像フレームとが比較される。次のフレームが同じく立
ち会いの動画像フレーム82の場合には、映像の変化量
は少なく、取り組みがはじまれば動画像フレーム83は
少し変化する。また、電光掲示板の取組表の動画像フレ
ーム84に場面が切り替われば2つの映像フレームの変
化量は大きくなる。変化量としては、動画像フレームの
画素ごとの輝度変化量の和または、色相の変化量の和を
とり、映像がMPEG(Moving Picture Experts Group
―カラー動画像蓄積用符号化方式の標準化作業を進める
組織により標準化が行なわれている符号化方式―)で圧
縮されている場合は変化量として動き補償ベクトルの長
さの和などが利用できる。変化量が多いか少ないかの情
報は、制御部75に送られ、変化量が多い場合には再生
を遅くし、変化量が少ない場合には再生速度を速くす
る。その命令が動画像再生部76に送られ、動画像デー
タベース71から対応するデータを取得し、表示部78
に映像が表示される。
When the mode is designated from the input unit 77, a fast-forward instruction for video reproduction is input, and the moving image database 7
The moving image frame is transferred to the moving image analysis unit 72 from one desired storage location, and the amount of change in the movement of the video frame before and after is calculated. For example, as shown in FIG. 11, a video frame 81 in which sumo wrestlers are present and a video frame at the next moment are compared. When the next frame is the attended moving image frame 82, the change amount of the video is small, and the moving image frame 83 changes slightly when the approach is started. Further, if the scene is switched to the moving image frame 84 in the action table of the electric bulletin board, the change amount between the two video frames becomes large. As the amount of change, the sum of the amount of change in luminance or the amount of change in hue of each pixel of the moving image frame is calculated, and the moving image is represented by the Moving Picture Experts Group (MPEG).
-If the image is compressed by the encoding method standardized by an organization that performs the standardization work of the color moving image storage encoding method-), the sum of the lengths of the motion compensation vectors can be used as the amount of change. Information on whether the amount of change is large or small is sent to the control unit 75. If the amount of change is large, the reproduction is slowed down, and if the amount of change is small, the reproduction speed is increased. The command is sent to the moving image reproducing unit 76, the corresponding data is obtained from the moving image database 71, and the display unit 78
Is displayed on the screen.

【0035】図12は変化量に応じて再生スピードを制
御する例で、最上段に示す動画像の変化量に対して、中
段に示すように、再生スピードを反転させて制御した例
である。下段では段階的な閾値でスピードを変えた例で
ある。変化量に応じて変化させる再生スピードの設定方
法は種々考えられる。例えば、変化量に対して反比例さ
せた再生スピードや静止部だけは一定の長さにして再生
するようにスピードを制御する方法などである。また、
極端に変化が激しい部分では再生速度が極端に遅くなっ
たり、極端に変化の少ない部分では再生速度が極端に速
くなったりすることがあるので、再生スピードの上限や
下限を設定しておいて再生を行なう方法も考えられる。
FIG. 12 shows an example in which the reproduction speed is controlled in accordance with the amount of change. In the example shown in FIG. 12, the reproduction speed is inverted with respect to the amount of change in the moving image shown in the uppermost part, as shown in the middle part. The lower stage shows an example in which the speed is changed with a stepwise threshold. Various methods of setting the reproduction speed to be changed according to the change amount can be considered. For example, there is a method of controlling the reproducing speed in inverse proportion to the amount of change or controlling the speed so that only the stationary portion is reproduced with a fixed length. Also,
Playback speed may be extremely slow in extremely rapidly changing parts, or extremely fast in parts with extremely little change. It is also conceivable to perform the method.

【0036】入力部77からの指示により、動画像デー
タベース71から動画像の静止フレームが呼び出され表
示部78に表示される。入力部77の例えばマウスを用
いて参照画像を指定すると、参照画像は動画像解析部7
2に送られて参照画像記憶部73に蓄えられる。入力部
77で選択されるモードによって動画像の再生が起動さ
れる。動画像データベース71から読み出された映像フ
レームが、動画像解析部72に送られ、参照画像記憶部
73の参照画像と比較される。前記動画像解析部72の
フレーム比較部74で類似度が計算される。例えば、類
似度は上述した動画像の変化量の逆数で代表される。図
13はその類似度の変化を示した図で、その情報は制御
部75に送られ、その情報に基づいて再生スピードを制
御し、類似度が高い場合は再生を遅く類似度が低い場合
は早く再生を制御する。その再生スピードの制御が、図
10に示されている。類似度がある閾値よりも低い場合
は映像を再生しないようにもできる。映像の無再生の部
分は無限大に再生スピードが速いと解釈すれば時間的に
飛び越した再生となる。
In response to an instruction from the input unit 77, a still frame of a moving image is called from the moving image database 71 and displayed on the display unit 78. When a reference image is designated using, for example, a mouse of the input unit 77, the reference image is
2 and stored in the reference image storage unit 73. The reproduction of the moving image is started according to the mode selected by the input unit 77. The video frame read from the moving image database 71 is sent to the moving image analysis unit 72 and compared with the reference image in the reference image storage unit 73. The degree of similarity is calculated by the frame comparison unit 74 of the moving image analysis unit 72. For example, the similarity is represented by the reciprocal of the change amount of the moving image described above. FIG. 13 is a diagram showing the change in the similarity. The information is sent to the control unit 75, and the reproduction speed is controlled based on the information. If the similarity is high, the reproduction is slow, and if the similarity is low, the reproduction is slow. Control playback early. The control of the reproduction speed is shown in FIG. If the similarity is lower than a certain threshold, the video may not be reproduced. If the non-playback portion of the video is interpreted as having an infinitely high playback speed, the playback will skip over time.

【0037】図14の動画像の変化量が変化する量を求
めると加速度が得られる。これは、動画像が速い動きか
ら遅い動きへまたは遅い動きから速い動きへ変化する部
分でカットのように映像が急に変化する部分を含む。こ
のような加速度に応じて再生スピードを制御することに
よって映像の内容が切り替わる部分を拾い見することが
できる。この図14においては、加速度の絶対値によっ
て再生スピードが制御されている。加速度が0の場合
は、再生スピードが無限大となり映像フレームが読み飛
ばされることになる。
When the amount of change of the moving image shown in FIG. 14 is obtained, the acceleration can be obtained. This includes a portion where a moving image changes from a fast motion to a slow motion or from a slow motion to a fast motion, and includes a portion where an image suddenly changes like a cut. By controlling the reproduction speed in accordance with such acceleration, it is possible to pick up a portion where the contents of the video are switched. In FIG. 14, the reproduction speed is controlled by the absolute value of the acceleration. When the acceleration is 0, the reproduction speed becomes infinite and the video frame is skipped.

【0038】以上の説明においては、動画像全体の変化
量に応じて動画像の再生スピードを制御する方法を述べ
てきたが、動画像には被写体と背景が含まれているた
め、背景と被写体とが異なる動きをしている場合には、
これらを分離することが可能である。その方法の1つ
に、オプィカルフローと呼ばれる小領域の動きの変化を
表す量を求め、その動きをクラスタリングすることによ
り、背景と被写体を分離できる(例えば、COMPUTER GRA
PHICS AND IMAGE PROCESSING, pp.301-315, VOL.9,1979
など)。分離されたそれぞれの変化量を求めその変化量
の差が大きいほど再生スピードを遅くし、小さいほど再
生スピードを大きくすることにより、被写体が激しく動
いている場合のみ詳しく映像を鑑賞することが可能とな
る。
In the above description, a method of controlling the reproduction speed of a moving image according to the amount of change in the entire moving image has been described. However, since the moving image includes the subject and the background, the background and the subject are controlled. If they are moving differently,
It is possible to separate them. As one of the methods, a background and a subject can be separated by obtaining an amount representing a change in movement of a small area called an optical flow and clustering the movement (for example, COMPUTER GRA).
PHICS AND IMAGE PROCESSING, pp.301-315, VOL.9,1979
Such). By determining the amount of change in each of the separated areas, the playback speed is slower as the difference between the changes is larger, and the playback speed is larger as the difference is smaller, so that it is possible to view the image in detail only when the subject is moving violently Become.

【0039】[0039]

【発明の効果】本発明によれば、早送りをした場合でも
音声を聞き取ることができ、内容をより明瞭に理解する
ことが可能になり、短い時間で映像の内容を把握するこ
とができる。また、映像の変化に応じて再生スピードを
制御するため、スポーツなどで動きのない場面では速く
再生がなされ、時間的に冗長な場面を早見することがで
きる。また、動きの激しい場面では再生速度が緩慢にな
るのでじっくり映像の鑑賞を行なうことができる。
According to the present invention, the voice can be heard even when fast-forwarding, the contents can be understood more clearly, and the contents of the video can be grasped in a short time. In addition, since the reproduction speed is controlled in accordance with a change in the video, the reproduction is performed quickly in a scene where there is no movement in sports or the like, and a temporally redundant scene can be quickly viewed. In addition, in a scene where the movement is intense, the reproduction speed becomes slow, so that it is possible to carefully watch the video.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の基本概念である第1実施形態に係る映
像再生装置の構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a video playback device according to a first embodiment, which is a basic concept of the present invention.

【図2】音声特徴抽出の基本概念である第2実施形態に
係る映像再生装置を示すブロック図である。
FIG. 2 is a block diagram showing a video playback device according to a second embodiment, which is a basic concept of audio feature extraction.

【図3】動画特徴抽出の基本概念である第3実施形態に
係る映像再生装置を示すブロック図である。
FIG. 3 is a block diagram showing a video playback device according to a third embodiment, which is a basic concept of moving image feature extraction.

【図4】本発明の第4実施形態に係る映像再生装置のシ
ステム構成を示すブロック図である。
FIG. 4 is a block diagram illustrating a system configuration of a video playback device according to a fourth embodiment of the present invention.

【図5】第4実施形態における映像特徴抽出としての音
声の分割を説明する特性図である。
FIG. 5 is a characteristic diagram illustrating audio division as a video feature extraction in a fourth embodiment.

【図6】第4実施形態における分割音声から無音部を取
り除き2倍の早送りに同期させて音声を結合した例を示
す特性図である。
FIG. 6 is a characteristic diagram illustrating an example in which a silent portion is removed from a divided voice according to a fourth embodiment and voices are combined in synchronization with double fast-forward.

【図7】第4実施形態における順方向の早送りのときの
音声の再生例を示す特性図である。
FIG. 7 is a characteristic diagram showing an example of sound reproduction at the time of fast forward in the fourth embodiment.

【図8】第4実施形態における逆方向の早送りのときの
音声の再生例を示す特性図である。
FIG. 8 is a characteristic diagram showing an example of audio reproduction at the time of fast-forwarding in the reverse direction in the fourth embodiment.

【図9】第4実施形態において音声に同期させて動画像
を再生する例を示す(a)特性図および(b)図表であ
る。
FIG. 9A is a characteristic diagram and FIG. 9B is a chart showing an example of reproducing a moving image in synchronization with audio in the fourth embodiment.

【図10】本発明の第5実施形態に係る映像再生装置の
システム構成を示すブロック図である。
FIG. 10 is a block diagram illustrating a system configuration of a video playback device according to a fifth embodiment of the present invention.

【図11】第5実施形態における前後のフレームの変化
例を示す説明図である。
FIG. 11 is an explanatory diagram showing an example of a change in front and rear frames in the fifth embodiment.

【図12】第5実施形態における動画像の変化量と再生
スピードの関係を示す特性図である。
FIG. 12 is a characteristic diagram showing a relationship between a change amount of a moving image and a reproduction speed in a fifth embodiment.

【図13】第5実施形態における参照画像との類似度と
再生スピードの関係を示す特性図である。
FIG. 13 is a characteristic diagram illustrating a relationship between a similarity to a reference image and a reproduction speed according to the fifth embodiment.

【図14】第5実施形態における加速度と再生スピード
の関係を示す特性図である。
FIG. 14 is a characteristic diagram showing a relationship between acceleration and reproduction speed in a fifth embodiment.

【符号の説明】[Explanation of symbols]

1 信号分離手段 5 映像特徴抽出手段 6 動画特徴抽出手段 7 音声特徴抽出手段 10 早送り映像再生手段 11 動画像再生手段 12 音声再生手段 13 音声信号加工手段 14 同期手段 18 合成手段 20 フレーム分割手段 21 フレーム間変化量検出手段 25 類似度検出手段 26 速度調整手段 27 動画像再生速度変更手段 REFERENCE SIGNS LIST 1 signal separation means 5 video feature extraction means 6 video feature extraction means 7 audio feature extraction means 10 fast-forward video playback means 11 moving image playback means 12 audio playback means 13 audio signal processing means 14 synchronization means 18 synthesis means 20 frame division means 21 frames Inter-variation detecting means 25 similarity detecting means 26 speed adjusting means 27 moving image reproducing speed changing means

───────────────────────────────────────────────────── フロントページの続き (72)発明者 窪 田 進 神奈川県川崎市幸区小向東芝町1 株式会 社東芝研究開発センター内 ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Susumu Kubota 1 Toshiba R & D Center, Komukai Toshiba-cho, Saiwai-ku, Kawasaki-shi, Kanagawa

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】動画像信号と音声信号とを含むディジタル
映像信号を通常再生、早送り再生および逆回し再生する
ことにより所望の映像を表示する映像再生装置におい
て、 入力された前記ディジタル映像信号を動画像信号と音声
信号とに分離する信号分離手段と、 前記信号分離手段により分離された動画像信号と音声信
号のうちの少なくとも一方の特徴を抽出する映像特徴抽
出手段と、 前記映像特徴抽出手段により抽出された映像特徴に基づ
いて、前記映像特徴が存在する場面の映像に所定の加工
処理を行ないながら前記動画像信号と前記音声信号との
何れか一方に同期させつつ早送り再生映像信号を生成し
て出力する早送り映像再生手段と、 を少なくとも備えることを特徴とする映像再生装置。
1. A video reproducing apparatus for displaying a desired video by reproducing a digital video signal including a moving image signal and an audio signal in a normal reproduction, a fast forward reproduction, and a reverse reproduction. A signal separating unit that separates into an image signal and an audio signal, a video feature extracting unit that extracts at least one of a moving image signal and an audio signal separated by the signal separating unit, and the video feature extracting unit. Based on the extracted video features, a fast-forward playback video signal is generated while synchronizing with one of the moving image signal and the audio signal while performing predetermined processing on a video of a scene where the video feature exists. And a fast-forward video reproducing means for outputting the video.
【請求項2】前記映像特徴抽出手段は、前記信号分離手
段により分離された前記音声信号における無音部分の開
始時点から終了時点までの所定範囲を音声特徴として抽
出する音声特徴抽出手段により構成されると共に、 前記早送り映像再生手段は、前記信号分離手段により分
離された動画像信号を所定の速度で再生して早送り動画
像信号を出力する動画像再生手段と、前記音声特徴抽出
手段により抽出された無音部分を除去して少なくとも有
音部分を含む音声再生信号を加工すると共に前記早送り
動画像信号の再生速度にこの音声再生信号を同期させて
同期音声信号を出力する音声再生手段と、前記同期音声
信号と前記早送り動画像信号とを合成して早送り再生映
像信号を出力する合成手段と、を備えることを特徴とす
る請求項1に記載の映像再生装置。
2. The image feature extracting means comprises an audio feature extracting means for extracting a predetermined range from a start point to an end point of a silent part in the audio signal separated by the signal separating means as an audio feature. The fast-forward video playback unit is configured to play back the video signal separated by the signal separation unit at a predetermined speed and output a fast-forward video signal, and the audio feature extraction unit extracts the video signal. A sound reproducing means for processing a sound reproduction signal including at least a sound part by removing a silent part and synchronizing the sound reproduction signal with a reproduction speed of the fast-forward moving image signal to output a synchronous sound signal; 2. A video signal as claimed in claim 1, further comprising: a synthesizing means for synthesizing a signal and said fast-forward moving image signal to output a fast-forward playback video signal. Image reproduction device.
【請求項3】前記音声再生手段は、前記音声特徴抽出手
段により抽出された無音部分を除去して有音部分を連続
させる音声信号加工手段と、加工された音声再生信号を
前記動画像再生手段により再生された早送り動画像信号
の再生速度に同期させる同期手段と、を含むことを特徴
とする請求項2に記載の映像再生装置。
3. An audio signal processing means for removing a silent part extracted by the audio feature extraction means to make a sound part continuous and an audio signal processing means for converting the processed audio reproduction signal into a moving image reproducing means. 3. A video reproducing apparatus according to claim 2, further comprising: a synchronizing means for synchronizing with a reproduction speed of the fast-forward moving image signal reproduced by the control unit.
【請求項4】前記音声再生手段は、前記加工手段により
加工されて現在再生中の前記音声再生信号の再生を打ち
切って、その次に加工された音声再生信号を前記早送り
動画像信号の再生速度に同期させて再生するように構成
されていることを特徴とする請求項3に記載の映像再生
装置。
4. The audio reproduction means, wherein the reproduction of the audio reproduction signal which is processed by the processing means and which is currently being reproduced is terminated, and the next processed audio reproduction signal is reproduced at a reproduction speed of the fast-forward moving image signal. The video reproducing apparatus according to claim 3, wherein the video reproducing apparatus is configured to reproduce in synchronization with the video data.
【請求項5】前記音声再生手段は、前記加工手段により
加工されて現在再生中の前記音声再生信号による再生音
を徐々に小音量にすると共に、次に加工された音声再生
信号に重ね合わせて再生しながらこの次に加工された音
声再生信号による再生音の音量を徐々に高くするように
構成されていることを特徴とする請求項3に記載の映像
再生装置。
5. The sound reproducing means, wherein the sound reproduced by the sound reproduction signal which is processed by the processing means and which is being reproduced at present is gradually reduced in volume and superimposed on the next processed sound reproduction signal. 4. The video reproducing apparatus according to claim 3, wherein a volume of a reproduced sound by the next processed audio reproduction signal is gradually increased while reproducing.
【請求項6】前記音声再生手段は、前記早送り再生映像
信号が撮影された方向とは時間的に逆方向に再生された
ときに、再生されている映像に同期させて加工された前
記音声再生信号の先頭から順方向に再生するように構成
されていることを特徴とする請求項3に記載の映像再生
装置。
6. The audio playback means processed in synchronization with a video being played when the fast-forward playback video signal is played back in a direction temporally opposite to a direction in which the video was shot. 4. The video reproducing apparatus according to claim 3, wherein the video reproducing apparatus is configured to reproduce the signal in a forward direction from the head of the signal.
【請求項7】前記同期手段は、前記音声再生手段により
再生された前記音声再生信号の再生速度に同期させなが
ら前記動画像再生手段により再生された早送り再生動画
像信号の再生速度を決定して前記合成手段に出力するこ
とを特徴とする請求項3に記載の映像再生装置。
7. The synchronizing means determines a reproduction speed of a fast-forward reproduction moving image signal reproduced by the moving image reproduction means while synchronizing with a reproduction speed of the audio reproduction signal reproduced by the audio reproduction means. 4. The video reproducing apparatus according to claim 3, wherein the image is output to the synthesizing unit.
【請求項8】前記映像特徴抽出手段は、前記信号分離手
段により分離された前記動画像信号を複数の静止画像で
あるフレームに分割するフレーム分割手段と、このフレ
ーム分割手段により分割されたフレーム間における変化
量を検出するフレーム間変化量検出手段と、を含む動画
特徴抽出手段より構成されると共に、 前記早送り映像再生手段は、前記フレーム間変化量検出
手段により検出された前記フレーム間の変化量に応じて
前記フレームの齣送り速度を変化させることにより動画
像信号の再生速度を変更して早送り再生映像信号を再生
する動画像再生手段より構成されることを特徴とする請
求項1に記載の映像再生装置。
8. The image feature extracting means includes: a frame dividing means for dividing the moving image signal separated by the signal separating means into a plurality of still images, and a frame dividing means for dividing the moving image signal into a plurality of still images. And an inter-frame change amount detecting means for detecting a change amount in the moving image feature extracting means, and the fast-forward video reproducing means, the inter-frame change amount detected by the inter-frame change amount detecting means. 2. A moving image reproducing means for changing a reproduction speed of a moving image signal by changing an exposure feed speed of the frame in accordance with the moving image reproducing means to reproduce a fast-forward reproduced video signal. Video playback device.
【請求項9】前記フレーム間変化量検出手段は、圧縮符
号化された映像データから動きの変化量を求めるように
構成されていることを特徴とする請求項8に記載の映像
再生装置。
9. The video reproducing apparatus according to claim 8, wherein said inter-frame change amount detecting means is configured to obtain a motion change amount from the compression-encoded video data.
【請求項10】前記動画像再生手段は、前記フレーム分
割手段により分割された動画像におけるフレームと指定
された参照画像との間の類似度を求める類似度検出手段
と、検出されたフレームおよび参照画像間の類似度に基
づいてこの類似度が高いほど再生速度を遅くすると共に
類似度が低いほど再生速度を速く再生するように再生速
度を調整する速度調整手段と、この速度調整手段により
調整された再生速度に基づいて前記フレーム分割手段よ
り送られてきた動画像信号の早送り再生速度を変更する
動画像再生速度変更手段と、を備えることを特徴とする
請求項8に記載の映像再生装置。
10. A moving image reproducing means, comprising: a similarity detecting means for calculating a similarity between a frame in a moving image divided by the frame dividing means and a designated reference image; Speed adjusting means for adjusting the reproducing speed such that the higher the similarity, the lower the reproducing speed and the lower the similarity, the higher the reproducing speed, based on the similarity between the images; 9. The video playback device according to claim 8, further comprising: a video playback speed changing unit that changes a fast-forward playback speed of the video signal sent from the frame dividing unit based on the playback speed.
【請求項11】前記フレーム間変化量検出手段は、動画
像信号における変化量が変化する量である加速度を求め
る加速度検出手段を備えることを特徴とする請求項8に
記載の映像再生装置。
11. The video reproducing apparatus according to claim 8, wherein said inter-frame change amount detecting means includes an acceleration detecting means for obtaining an acceleration which is an amount by which a change amount in a moving image signal changes.
【請求項12】前記フレーム間変化量検出手段は、前記
動画像の中から背景と動きのある物体とを分離する背景
・動き分離手段と、分離された背景と動きのある物体と
の相対速度の変化量を求める背景・動き間相対速度検出
手段と、を備えることを特徴とする請求項8に記載の映
像再生装置。
12. An inter-frame change amount detecting means for separating a background and a moving object from the moving image, a relative speed between the separated background and the moving object. 9. The video reproducing apparatus according to claim 8, further comprising: a background / motion relative speed detecting means for obtaining a change amount of the moving image.
JP04263797A 1997-02-26 1997-02-26 Video playback device Expired - Fee Related JP3877371B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04263797A JP3877371B2 (en) 1997-02-26 1997-02-26 Video playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04263797A JP3877371B2 (en) 1997-02-26 1997-02-26 Video playback device

Publications (2)

Publication Number Publication Date
JPH10243351A true JPH10243351A (en) 1998-09-11
JP3877371B2 JP3877371B2 (en) 2007-02-07

Family

ID=12641537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04263797A Expired - Fee Related JP3877371B2 (en) 1997-02-26 1997-02-26 Video playback device

Country Status (1)

Country Link
JP (1) JP3877371B2 (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336591A (en) * 1997-06-05 1998-12-18 Nec Corp Image sound decoder with control function for sound reproduction time
EP1024444A2 (en) 1999-01-28 2000-08-02 Kabushiki Kaisha Toshiba Image information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
JP2006279939A (en) * 2005-03-03 2006-10-12 Fuji Photo Film Co Ltd Image extraction device, image extraction method, and image extraction program
JP2007235572A (en) * 2006-03-01 2007-09-13 Sony Corp Image processing device and method, program recording medium, and program
JP2007300477A (en) * 2006-05-01 2007-11-15 Sony Corp Image processing apparatus, method, and program
JP2008187324A (en) * 2007-01-29 2008-08-14 Sony Corp Image processor, image processing method, and program
WO2009025121A1 (en) 2007-08-21 2009-02-26 Sony Corporation Information presentation device and information presentation method
JP2009159094A (en) * 2007-12-25 2009-07-16 Canon Inc Imaging apparatus
US20100322594A1 (en) * 2009-06-19 2010-12-23 National Taiwan University Video Playback System And Method
US8005279B2 (en) 2005-03-22 2011-08-23 Osaka University Capsule endoscope image display controller
JP2013541901A (en) * 2010-09-17 2013-11-14 トムソン ライセンシング Semantic-based trick mode playback method in video system
KR20140067446A (en) * 2012-11-26 2014-06-05 에스케이텔레콤 주식회사 Apparatus and method for playback speed control by importance of frames in the video
JP2014137676A (en) * 2013-01-16 2014-07-28 Ricoh Co Ltd Position information acquisition device and image display system
US9866922B2 (en) 2010-03-31 2018-01-09 Thomson Licensing Trick playback of video data

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336591A (en) * 1997-06-05 1998-12-18 Nec Corp Image sound decoder with control function for sound reproduction time
EP1024444A2 (en) 1999-01-28 2000-08-02 Kabushiki Kaisha Toshiba Image information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
JP2006279939A (en) * 2005-03-03 2006-10-12 Fuji Photo Film Co Ltd Image extraction device, image extraction method, and image extraction program
US8005279B2 (en) 2005-03-22 2011-08-23 Osaka University Capsule endoscope image display controller
JP4720544B2 (en) * 2006-03-01 2011-07-13 ソニー株式会社 Image processing apparatus and method, program recording medium, and program
JP2007235572A (en) * 2006-03-01 2007-09-13 Sony Corp Image processing device and method, program recording medium, and program
JP2007300477A (en) * 2006-05-01 2007-11-15 Sony Corp Image processing apparatus, method, and program
JP2008187324A (en) * 2007-01-29 2008-08-14 Sony Corp Image processor, image processing method, and program
JP2009049796A (en) * 2007-08-21 2009-03-05 Sony Corp Information presenting device and information presenting method
WO2009025121A1 (en) 2007-08-21 2009-02-26 Sony Corporation Information presentation device and information presentation method
US8804038B2 (en) 2007-08-21 2014-08-12 Sony Coporation Information presentation device and information presentation method
JP2009159094A (en) * 2007-12-25 2009-07-16 Canon Inc Imaging apparatus
US20100322594A1 (en) * 2009-06-19 2010-12-23 National Taiwan University Video Playback System And Method
US8364026B2 (en) * 2009-06-19 2013-01-29 National Taiwan University Video playback system and method
US9866922B2 (en) 2010-03-31 2018-01-09 Thomson Licensing Trick playback of video data
US11418853B2 (en) 2010-03-31 2022-08-16 Interdigital Madison Patent Holdings, Sas Trick playback of video data
JP2013541901A (en) * 2010-09-17 2013-11-14 トムソン ライセンシング Semantic-based trick mode playback method in video system
US9438876B2 (en) 2010-09-17 2016-09-06 Thomson Licensing Method for semantics based trick mode play in video system
KR20140067446A (en) * 2012-11-26 2014-06-05 에스케이텔레콤 주식회사 Apparatus and method for playback speed control by importance of frames in the video
JP2014137676A (en) * 2013-01-16 2014-07-28 Ricoh Co Ltd Position information acquisition device and image display system

Also Published As

Publication number Publication date
JP3877371B2 (en) 2007-02-07

Similar Documents

Publication Publication Date Title
JP4599244B2 (en) Apparatus and method for creating subtitles from moving image data, program, and storage medium
JP4717060B2 (en) Recording / reproducing apparatus, recording / reproducing method, recording medium storing recording / reproducing program, and integrated circuit used in recording / reproducing apparatus
JP4297010B2 (en) Information processing apparatus, information processing method, and program
KR100403238B1 (en) Intelligent fast-forward video system
JP3877371B2 (en) Video playback device
JP2002125199A (en) Frame information description method, frame information generating device and method, video reproducing device and method, and recording medium
JP2001202698A (en) Audio and video reproducing device
EP1531474A1 (en) Video signal playback apparatus and method
KR0176961B1 (en) Video cd reproduction device with search mode of caption screen
JP3642019B2 (en) AV content automatic summarization system and AV content automatic summarization method
JPH0934477A (en) Karaoke device
JP2002084505A (en) Apparatus and method for shortening video reading time
JP2005033714A (en) Information signal reproducing apparatus, information signal reproducing method, information signal processing apparatus and information signal processing method
US6868224B1 (en) Method and apparatus for providing multimedia playback
JP2007097015A (en) Reproducing apparatus, recording and reproducing apparatus, data processing method, and program thereof
JP3848144B2 (en) Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program
EP0898422A2 (en) Audio signal decompressing apparatus
JP2001103401A (en) Signal reproducing method and signal reproducing device
JPH0879674A (en) Moving picture retrieval system
JP4086886B2 (en) Movie playback apparatus, movie playback method and computer program thereof
JP2003023607A (en) Reproducing device
JP2004088530A (en) Moving picture audio data storage management apparatus and editing method
JP4333653B2 (en) Reproduction method and reproduction apparatus
JP2009032039A (en) Retrieval device and retrieval method
JP2008154258A (en) Motion picture playback apparatus, motion picture playback method and computer program therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061031

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees