JP2003348528A - Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program - Google Patents

Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program

Info

Publication number
JP2003348528A
JP2003348528A JP2002147886A JP2002147886A JP2003348528A JP 2003348528 A JP2003348528 A JP 2003348528A JP 2002147886 A JP2002147886 A JP 2002147886A JP 2002147886 A JP2002147886 A JP 2002147886A JP 2003348528 A JP2003348528 A JP 2003348528A
Authority
JP
Japan
Prior art keywords
representative image
image
frame
video
change amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002147886A
Other languages
Japanese (ja)
Inventor
Yukinori Minamida
幸紀 南田
Yukinobu Taniguchi
行信 谷口
Haruhiko Kojima
治彦 児島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002147886A priority Critical patent/JP2003348528A/en
Publication of JP2003348528A publication Critical patent/JP2003348528A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To select a frame in which the motion of an object in a video easy to recognize and no camera shaking is present in order to create a representative image from the video in a video database system, a video indexing means or a digital video editing system. <P>SOLUTION: An image change amount in a video block is calculated by an image change amount calculating means 111, and a frame in which the image change amount is minimum is calculated by an image change amount minimum frame calculating means 112. The frame in which the image change amount becomes minimum is found to detect an image having a high possibility of a characteristic attitude to become a node of the motion when positively moving a figure or an animal. Then, with the found frame in which the image change amount becomes minimum as a reference, a representative image candidate selecting means 113 selects candidates of the representative image in the video block. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は,映像データベース
システム,映像索引付けシステム,デジタル映像編集シ
ステムなどにおいて,映像から代表画像を作成するため
に,映像中の被写体の動きが分かりやすく,ぶれのない
フレームを選択する方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video database system, a video indexing system, a digital video editing system, and the like, in which a representative image is created from a video. It relates to a method of selecting a frame.

【0002】[0002]

【従来の技術】近年,計算機およびハードディスク装置
などのランダムアクセス記憶装置の高速化や低廉化によ
り,映像を計算機読み取り可能なデジタルデータに変換
してランダムアクセス記憶装置に記録して取り扱うこと
が広く行われるようになってきている。このような,い
わゆる映像のデジタル化による方法で映像を取り扱うこ
とには,動画像を磁気テープ等に記録して取り扱う方法
に較べて様々な利点がある。
2. Description of the Related Art In recent years, with the increase in speed and cost of random access storage devices such as computers and hard disk devices, it has become widely practiced to convert video into computer-readable digital data and record and handle the data in the random access storage device. Is becoming increasingly common. There are various advantages to handling video by a method based on so-called video digitization as compared with a method of recording and handling moving images on a magnetic tape or the like.

【0003】利点の一つは,映像の内容にもとづいて索
引を作成する「映像の索引付け」が好適に適用できるこ
とである。映像の索引は,映像のある区間の内容を表す
ラベルと,該映像区間の区間情報の組である。映像区間
の区間情報は,映像区間の開始位置と終了位置によって
表される。また,開始位置と区間の長さによっても表さ
れる。開始位置だけで表される場合もある。映像中の位
置は,映像の先頭からの経過時間や,映像の先頭フレー
ムからの通算フレーム番号などで表される。映像区間の
長さは,経過時間や,フレーム数などで表される。映像
の索引を使うことにより,映像全体を見ることなく,所
望の映像区間を選び,即座にランダムアクセス記憶装置
から所望の映像区間を呼び出して閲覧することができ
る。
One of the advantages is that "video indexing" for creating an index based on the content of a video can be suitably applied. The video index is a set of a label indicating the content of a certain section of the video and section information of the video section. The section information of the video section is represented by the start position and the end position of the video section. It is also indicated by the start position and the length of the section. In some cases, only the start position is indicated. The position in the video is represented by the elapsed time from the top of the video, the total frame number from the top frame of the video, and the like. The length of the video section is represented by an elapsed time, the number of frames, or the like. By using the index of a video, a desired video section can be selected without immediately viewing the entire video, and the desired video section can be immediately called from the random access storage device and browsed.

【0004】映像区間内容を表すラベルには様々なもの
があるが,視覚的に示すために,映像区間中のあるフレ
ームの縮小画像を該映像区間のラベルとして用いること
が多い。このとき,該縮小画像を該映像区間の代表画像
と呼ぶ。なお,1映像区間の代表画像は1枚に限る必要
はなく,複数枚でもよい。また,映像から抽出した1枚
のフレームまたは複数枚のフレームを加工して代表画像
を作成してもよい。また,代表画像は静止画に限定され
るものではなく,例えば,動画をその映像区間を代表す
るラベルとして用いてもよい。したがって,動画をラベ
ルとして用いる場合も代表画像と呼ぶこととする。
There are various labels representing the contents of a video section, but a reduced image of a certain frame in the video section is often used as a label for the video section for visual indication. At this time, the reduced image is called a representative image of the video section. Note that the number of representative images in one video section need not be limited to one, but may be plural. Also, a representative image may be created by processing one frame or a plurality of frames extracted from a video. Further, the representative image is not limited to a still image, and for example, a moving image may be used as a label representing the video section. Therefore, the case where a moving image is used as a label is also referred to as a representative image.

【0005】映像の索引付けを自動的に行う方法も様々
なものが提案されている。例えば,映像区間を自動的に
抽出する方法としては,映像が時間的に急激に変化する
部分であるいわゆるシーンチェンジによって映像を区切
る方法がある。また,映像区間の代表画像を抽出する方
法としては,映像区間の先頭フレームを選択する方法
や,先頭から一定時間経過した時点のフレームを選択す
る方法がある。
Various methods have been proposed for automatically indexing videos. For example, as a method of automatically extracting a video section, there is a method of separating a video by a so-called scene change, which is a portion where the video changes rapidly with time. Further, as a method of extracting a representative image of a video section, there are a method of selecting a first frame of the video section and a method of selecting a frame at a time when a predetermined time has elapsed from the top.

【0006】映像製作業者や放送事業者など様々な業者
は,自社の所有する映像をデジタル化して索引付けする
ことにより,膨大な映像を管理したり,顧客への映像販
売サービスを提供する試みを検討しているところであ
る。
[0006] Various manufacturers such as video producers and broadcasters have attempted to manage a huge amount of videos and provide video sales services to customers by digitizing and indexing the videos owned by the companies. We are considering it.

【0007】[0007]

【発明が解決しようとする課題】ところで,上記の映像
区間の代表画像は,映像区間の内容を最もよく表す静止
画像であることが望ましい。しかしながら,映像区間の
先頭フレームや,先頭から一定時間経過した時点のフレ
ームを選択する従来の方法では,必ずしも映像区間の内
容を最もよく表す静止画像とはならず,この点が大きな
問題となっていた。
Incidentally, it is desirable that the representative image of the video section is a still image that best represents the contents of the video section. However, the conventional method of selecting the first frame of a video section or a frame at a time after a certain time has elapsed from the top does not always result in a still image that best represents the content of the video section, and this point is a major problem. Was.

【0008】例えば,ゴルフの一場面で人物がゴルフク
ラブをスウィングする映像区間では,スウィングの瞬間
が代表画像としてふさわしいであろう。しかし,上記従
来方法はスウィングの瞬間のフレームを選択する作用を
持たないため,スウィングと無関係な,ただ人物が立っ
ているだけのフレームや,風景だけが映っているフレー
ムを代表画像として選択してしまう可能性がある。その
ような代表画像から,その映像区間にスウィングの映像
があると知ることは困難である。
For example, in a video section in which a person swings a golf club in one scene of golf, the instant of the swing may be appropriate as a representative image. However, since the above-mentioned conventional method does not have an effect of selecting a frame at the moment of a swing, a frame which is irrelevant to the swing and in which only a person stands or a frame in which only a landscape is reflected is selected as a representative image. May be lost. It is difficult to know from such a representative image that there is a swing image in the image section.

【0009】また,動きが速い被写体を撮影した映像で
は,被写体がぶれることがある。ぶれ画像は代表画像と
してふさわしくないが,上記従来方法は,被写体がぶれ
ているかどうかを判断する作用がないため,ぶれの激し
いフレームを代表画像として選択してしまう可能性があ
るという問題がある。
[0009] Further, in a video image of a fast-moving subject, the subject may be blurred. Although a blurred image is not suitable as a representative image, the conventional method has no effect of determining whether or not a subject is blurred, and thus has a problem that a frame with severe blurring may be selected as a representative image.

【0010】これら代表画像選択における問題を解決す
るために,特開平9−93527号公報には,映像を再
生しながら最も適切なフレームを人手によって選択する
方法が示されている。しかし,この方法によれば適切な
代表画像は得られるが,人的コストがかかるという問題
がある。また,映像を再生しながら人手によって選択す
るために,時間がかかるという問題もある。
In order to solve the problem in selecting a representative image, Japanese Patent Laid-Open No. 9-93527 discloses a method of manually selecting the most appropriate frame while reproducing a video. However, according to this method, although an appropriate representative image can be obtained, there is a problem that human cost is required. In addition, there is also a problem that it takes time to manually select while reproducing the video.

【0011】本発明は,上記従来方法の問題点を解決す
るためのものであり,映像区間の中から,自動的に被写
体の動きが分かり易く,ぶれのないフレームを代表画像
として選択する方法もしくは選択しやすくする方法を提
供することを目的とする。
An object of the present invention is to solve the problem of the above-mentioned conventional method. A method of automatically selecting a frame in which movement of a subject is easy to understand and has no blur from a video section as a representative image. The aim is to provide a way to make selection easier.

【0012】[0012]

【課題を解決するための手段】本発明では,人物や動物
が能動的に動く場合の動きを観察し,動きの節目で一瞬
静止したり,あるいは動きが極小になることに着目し
た。このように,動きが一瞬静止するか極小になる時点
を,以後,「動き谷間」と称する。例えば,人物がゴル
フクラブをスウィングする一連の動きは,ゴルフクラブ
を振り上げる動作と,振り下ろす動作に分解でき,その
境目が節目となり,動き谷間となる。この例に限らず,
多くの場合,人物や動物の能動的な動きは,連続する単
純な動作に分解でき,それらの単純な動作の境目で動き
谷間となる。もっとも,単純な動作に分解できず,節目
が無いような動きもあり得るが,生物が節目無く,緩急
のリズムもなく動き続けることには無理が伴い,そのよ
うな動きは多くないと考えられる。
SUMMARY OF THE INVENTION In the present invention, the movement of a person or an animal in the case of active movement is observed, and attention is paid to the fact that the movement or the movement is momentarily stopped at a turning point of the movement. Such a point at which the movement stops for a moment or becomes a minimum is hereinafter referred to as a "motion valley". For example, a series of movements of a person swinging a golf club can be decomposed into a swinging-up operation and a swinging-down operation of the golf club, and the boundary becomes a turning point and a movement valley. Not limited to this example,
In many cases, the active movement of a person or an animal can be broken down into a series of simple movements, and at the boundaries of these simple movements, movement valleys occur. Although it cannot be broken down into simple movements, some movements may be seamless, but it is considered impossible for organisms to continue to move without any breaks and without slow rhythms. .

【0013】本発明では,また,人物や動物などの能動
的な動きの中の動き谷間における姿勢に,該人物や動物
などの動きがよく表われていることに着目した。例えば
人物がゴルフクラブをスウィングする動きの節目である
ところのゴルフクラブを振り上げた直後であって,かつ
振り下ろす直前の姿勢は,これからゴルフクラブを振り
下ろそうとしていることが如実にわかる姿勢となってい
る。この例に限らず,人物や動物の能動的な動きの中の
動き谷間は,連続する単純な動作の境目であって,ある
動作の終点であると同時にある動作の起点でもあり,特
徴的な姿勢をとることが多い。動き谷間における姿勢が
必ず特徴的であるとは限らないとしても,動き谷間以外
の場所と較べると,特徴的である可能性は高いと考えら
れる。
In the present invention, attention has been paid to the fact that the movement of the person or the animal is well represented in the posture in the movement valley in the active movement of the person or the animal. For example, the position immediately after swinging the golf club, which is the turning point of the swinging motion of the golf club, and immediately before swinging down the golf club is a posture that clearly shows that the golf club is about to swing down. ing. Not limited to this example, the valley in the active movement of a person or an animal is a boundary between continuous simple movements, an end point of a certain movement and a starting point of a certain movement. I often take a posture. Even if the posture in the moving valley is not always characteristic, it is considered that there is a high possibility that the posture is characteristic as compared with a place other than the moving valley.

【0014】動き谷間では,動きの主体が静止するかも
しくは動きが緩やかになるので,ビデオカメラなどによ
って撮影した場合のぶれは小さい。動きの緩急の尺度と
しては,隣接フレーム間で画素の輝度変化量を用いるこ
とができ,機械的に計算が可能である。
In a moving valley, the main body of the motion is stationary or the motion is slow, so that the blurring when photographing with a video camera or the like is small. As a measure of the degree of movement, the amount of change in the luminance of pixels between adjacent frames can be used, and can be calculated mechanically.

【0015】以上の考察に基づき,本発明の第1は,映
像の変化量が時間的に極小になる時点のフレームを基準
として代表画像候補を選択することを特徴とする。
Based on the above considerations, the first aspect of the present invention is characterized in that a representative image candidate is selected on the basis of a frame at a point in time when the amount of change in video becomes temporally minimal.

【0016】また,本発明の第2は,上記フレームを基
準とする場合の典型的な例として,映像の変化量が時間
的に極小になる時点のフレームを代表画像候補とするこ
とを特徴とする。
The second aspect of the present invention is characterized in that, as a typical example in the case where the above-mentioned frame is used as a reference, the frame at the time when the amount of change in the image becomes temporally minimal is set as a representative image candidate. I do.

【0017】静止画で動きを表す方法として,動く被写
体の異なる時刻における複数の像を1枚の画像に写す,
いわゆるストロボ画像がある。このストロボ画像の利用
に着目し,本発明の第3は,映像の変化量が時間的に極
小になる時点のフレームを基準として,その前後の複数
枚のフレームを加工してストロボ画像を構成し,代表画
像候補とすることを特徴とする。
As a method of expressing motion by a still image, a plurality of images of a moving subject at different times are copied into one image.
There is a so-called strobe image. Focusing on the use of this strobe image, the third aspect of the present invention is to construct a strobe image by processing a plurality of frames before and after the frame at the time when the amount of change in the image becomes minimal in time. , Representative image candidates.

【0018】ところで,映像の画像変化量は,被写体の
動きによってのみ発生するものではなく,カメラワーク
(カメラの平行移動,回転,ズーミング)によっても発
生する。そこで,映像からカメラワークを推定し,カメ
ラワークを打ち消すように映像を変換し,変換後の映像
に対して画像変化量を計算すれば,画像変化量に被写体
の動きがよく反映されるようになる。
By the way, the amount of change in the image of a video does not occur only due to the movement of a subject, but also due to camera work (translation, rotation, zooming of a camera). Therefore, by estimating the camera work from the video, converting the video to cancel the camera work, and calculating the image change amount for the converted video, the movement of the subject is reflected well in the image change amount. Become.

【0019】本発明の第4は,映像からカメラワーク
(カメラの平行移動,回転,ズーミング)を推定し,カ
メラワークによる見かけ上の被写体の動きを打ち消すよ
うに該映像を変換し,変換後の映像に対して上記発明を
適用することを特徴とする。
A fourth aspect of the present invention is to estimate camera work (translation, rotation, and zooming of a camera) from an image, convert the image so as to cancel an apparent movement of a subject due to the camera work, and convert the image. The present invention is characterized in that the invention is applied to a video.

【0020】本発明の第5は,本発明の第1の方法によ
って代表画像候補を選択し,所定の手続きによって該代
表画像候補の各々の代表画像としての適切さを求め,該
適切さに基づいて該代表画像候補の中から代表画像を選
択することを特徴とする。
According to a fifth aspect of the present invention, a representative image candidate is selected by the first method of the present invention, and an appropriateness of each representative image candidate is determined as a representative image by a predetermined procedure. A representative image is selected from the representative image candidates.

【0021】本発明の第6は,上記本発明の第5のもの
において,代表画像の適切さを求める際に,次の数式
(1)に示す凹みXに基づき,|X−θx |がより小さ
いものに,より大きな適切さを与えることを特徴とす
る。
According to a sixth aspect of the present invention, in the fifth aspect of the present invention, when determining the appropriateness of the representative image, | X−θ x | is calculated based on the dent X shown in the following equation (1). It is characterized by giving greater relevance to smaller ones.

【0022】[0022]

【数3】 (Equation 3)

【0023】ここで,fは映像の変化量を時間tの関数
として表したものであり,θx はある定数であり,
1 ,t2 は着目している極小点の両隣でfが極大とな
る時刻を表す。
Where f is the amount of change in the image as a function of time t, θ x is a constant,
t 1 and t 2 represent the times when f is maximum on both sides of the minimum point of interest.

【0024】本発明の第7は,上記本発明の第5のもの
において,代表画像の適切さを求める際に,f(t1
/f(t0 )がより大きいものに,より大きな適切さを
与え,かつ,f(t2 )/f(t0 )がより大きいもの
に,より大きな適切さを与えることを特徴とする。ここ
で,t0 は,着目している極小点の時刻を表す。
According to a seventh aspect of the present invention, in the fifth aspect of the present invention, f (t 1 )
/ F to those (t 0) Gayori large, giving greater relevance, and, f (t 2) / f (t 0) Gayori the larger, characterized in providing a greater relevance. Here, t 0 represents the time of the minimum point of interest.

【0025】[0025]

【発明の実施の形態】以下,本発明の実施形態を詳細に
説明する。最初に,本発明の代表画像選択方法を用い
て,映像の索引付けを行う処理の第1の実施形態を例を
挙げて説明する。
Embodiments of the present invention will be described below in detail. First, a first embodiment of a process for indexing a video using the representative image selection method of the present invention will be described with an example.

【0026】図1は,本実施形態を実現するための映像
索引作成装置の構成例を示す。映像索引作成装置1は,
与えられた映像の各映像区間における代表画像を選択し
て,それをもとに映像の索引を作成するものであり,C
PUおよびメモリ等からなる情報処理装置11と,表示
装置12と,キーボードやマウス等の入力装置13と,
ハードディスクその他の記憶装置14から構成される。
記憶装置14には,予め処理対象となる映像がデジタル
データ化され,格納されているものとする。
FIG. 1 shows an example of the configuration of a video index creation device for realizing this embodiment. The video indexing device 1
A representative image in each video section of a given video is selected, and a video index is created based on the selected representative image.
An information processing device 11 including a PU and a memory, a display device 12, an input device 13 such as a keyboard and a mouse,
It comprises a hard disk and other storage devices 14.
It is assumed that a video to be processed is digitized and stored in the storage device 14 in advance.

【0027】情報処理装置11は,映像区間の画像変化
量を計算する画像変化量計算手段111と,画像変化量
が極小となるフレームを求める画像変化量極小フレーム
算出手段112と,画像変化量が極小となるフレームを
基準として映像区間の代表画像の候補を選択する代表画
像候補選択手段113と,選択した映像区間の代表画像
の候補の中から代表画像を選択する代表画像選択手段1
14とを備える。
The information processing apparatus 11 includes an image change amount calculating unit 111 for calculating an image change amount in a video section, an image change amount minimum frame calculating unit 112 for obtaining a frame in which the image change amount is minimum, and an image change amount Representative image candidate selecting means 113 for selecting a representative image candidate of a video section with reference to a minimum frame, and representative image selecting means 1 for selecting a representative image from representative image candidates of the selected video section.
14.

【0028】図2は,本実施形態における代表画像選択
処理のフローチャートである。本処理は,デジタル化さ
れた映像を入力とし,その索引として,代表画像と映像
区間の組を出力するものである。
FIG. 2 is a flowchart of a representative image selection process according to the present embodiment. This processing is to input a digitized video and output a set of a representative image and a video section as an index.

【0029】まず,ステップS201では,情報処理装
置11が記憶装置14からデジタル化された映像を読み
込み,入力映像を映像区間に分割する。映像区間に分割
する方法は,映像が時間的に急激に変化するいわゆるシ
ーンチェンジによって分割する方法が好適に適用できる
が,この方法に限らず他の方法でもよい。分割の結果,
該入力映像がn個の映像区間に分割されたものとする。
各映像区間を記憶するには,映像の中での開始位置と終
了位置を記憶しておけば足りる。映像の中の位置は,映
像の先頭からの経過時間でもよいし,映像の先頭フレー
ムから数えた通算フレーム番号などでもよい。
First, in step S201, the information processing device 11 reads a digitized video from the storage device 14, and divides the input video into video sections. As a method of dividing into video sections, a method of dividing by a so-called scene change in which a video changes abruptly in time can be suitably applied, but is not limited to this method, and another method may be used. As a result of the division,
It is assumed that the input video is divided into n video sections.
In order to store each video section, it is sufficient to store the start position and the end position in the video. The position in the video may be an elapsed time from the top of the video, a total frame number counted from the top frame of the video, or the like.

【0030】次に,ステップS202では,変数Nに映
像区間の個数nを代入し,ステップS203では,変数
iに1を代入する。ステップS204において,変数i
の値と変数Nの値とを比較し,i≦Nであれば,ステッ
プS205へ進み,そうでなければ処理を終了する。こ
の条件分岐によってループを制御する。ループの中で
は,i回目のループでi番目の映像区間に着目し,処理
を行う。
Next, in step S202, the number n of video sections is substituted for a variable N, and in step S203, 1 is substituted for a variable i. In step S204, the variable i
Is compared with the value of the variable N. If i ≦ N, the process proceeds to step S205; otherwise, the process ends. The loop is controlled by this conditional branch. In the loop, the processing is performed by focusing on the i-th video section in the i-th loop.

【0031】ステップS205では,i番目の映像区間
の各フレームについて画像変化量fを計算し,結果を配
列Fに格納する。画像変化量fは,例えば,隣り合うフ
レーム間で,次の式(2)によって算出する。
In step S205, the image change amount f is calculated for each frame of the i-th video section, and the result is stored in the array F. The image change amount f is calculated by, for example, the following equation (2) between adjacent frames.

【0032】[0032]

【数4】 (Equation 4)

【0033】ただし,I1 ,I2 は隣り合う2フレーム
の画像とする。xs ,xe ,ys ,ye は予め定めた定
数で,xs ≦x≦xe ,ys ≦y≦ye なる点(x,
y)により画面内の矩形領域を定義し,該矩形領域内の
画素について,画像の輝度値の差の絶対値を合計し,画
像変化量fを求める。画像変化量は,画素の輝度値の差
の絶対値の合計に限らず,色ヒストグラムなどの他の量
を用いてもよい。また,画像変化量計算の対象となる画
素は,画面全体でもよい。
However, I 1 and I 2 are images of two adjacent frames. xs, xe, ys, ye are predetermined constants, and the points (x, x) satisfying xs ≦ x ≦ xe, ys ≦ y ≦ ye
y), a rectangular area in the screen is defined, and for the pixels in the rectangular area, the absolute values of the differences between the luminance values of the images are summed to obtain the image change amount f. The image change amount is not limited to the sum of the absolute values of the differences between the luminance values of the pixels, but may be another amount such as a color histogram. Further, the pixel to be subjected to the image change amount calculation may be the entire screen.

【0034】該映像区間の先頭フレームを第1フレーム
として,第1フレームと第2フレームの変化量をF
[1]に代入し,第2フレームと第3フレームの変化量
をF[2]に代入し,以下順に同様に代入する。つま
り,第kフレームと第k+1フレームの変化量をF
[k]に代入する。なお,ここでいうフレーム番号は該
映像区間の先頭から数えたフレーム番号であり,映像の
先頭から数えたフレーム番号とは一致しない。また,本
実施形態では,配列Fの添字が1から始るよう記述する
が,1から始まる必要はない。
Assuming that the first frame of the video section is the first frame, the amount of change between the first frame and the second frame is F
[1], the change amount of the second frame and the third frame is substituted for F [2], and so on. That is, the change amount between the k-th frame and the (k + 1) -th frame is represented by F
Substitute [k]. Note that the frame number here is a frame number counted from the beginning of the video section, and does not match the frame number counted from the beginning of the video. In the present embodiment, the subscript of the array F is described to start from 1, but need not start from 1.

【0035】次に,ステップS206では,配列Fか
ら,F[t]が極小となる添字tを求め,配列TMIN
に格納する。極小点を求める方法については後述する。
なお,ノイズの影響を軽減するために,極小を求める前
に,Fに記憶した画像変化量の系列に,平滑化処理を施
してもよい。
Next, in step S206, a subscript t at which F [t] is minimized is obtained from the array F, and
To be stored. A method for obtaining the minimum point will be described later.
Note that, in order to reduce the influence of noise, a smoothing process may be performed on the series of image change amounts stored in F before obtaining the minimum.

【0036】今,説明のために着目している映像区間
が,図3に示すように人物がゴルフクラブをスウィング
する場面であると仮定する。該映像区間には,図3に概
略を示すように,人物がゴルフクラブをスウィングして
ゴルフボールを打ち,その後カメラが人物の顔にズーム
アップするような場面が収められているものとする。該
映像区間はae枚のフレームから構成されているとす
る。
Assume now that the video section of interest for the sake of explanation is a scene in which a person swings a golf club as shown in FIG. As shown schematically in FIG. 3, the video section includes a scene in which a person swings a golf club and hits a golf ball, and then the camera zooms up to the face of the person. It is assumed that the video section is composed of ae frames.

【0037】図4は,該映像区間の画像変化量をグラフ
に表したものであり,図4のグラフは横軸が添字tを表
し,縦軸がFの値を表し,線401が第tフレームにお
けるFの値F[t]を表す。横軸は,フレーム番号と解
釈しても良い。図4では,Fの値がt=a2およびt=
a4のとき極小になり,t=a1およびt=a3のとき
Fの値が極大になっている例を表している。
FIG. 4 is a graph showing the amount of image change in the video section. In the graph of FIG. 4, the horizontal axis represents the suffix t, the vertical axis represents the value of F, and the line 401 represents the t-th. Represents the value F [t] of F in the frame. The horizontal axis may be interpreted as a frame number. In FIG. 4, the values of F are t = a2 and t = a2.
An example is shown in which the value of F becomes a maximum when a4 and the value of F becomes a maximum when t = a1 and t = a3.

【0038】図5は,上記着目している映像区間の中の
複数枚のフレームを並べて示したものである。図5の5
01は,該映像区間の第1フレーム(先頭フレーム),
502は該映像区間の第a1フレーム,503は該映像
区間の第a2フレーム,504は該映像区間の第a3フ
レーム,505は該映像区間の第a4フレーム,506
は該映像区間の第aeフレーム(最終フレーム)である
とする。
FIG. 5 shows a plurality of frames arranged in the video section of interest. 5 in FIG.
01 is the first frame (head frame) of the video section,
502 is the a1 frame of the video section, 503 is the a2 frame of the video section, 504 is the a3 frame of the video section, 505 is the a4 frame of the video section, 506
Is the ae frame (final frame) of the video section.

【0039】ここで,該映像区間の例において,極値を
とるtの値と,該映像区間の被写体の動きとの関係を図
4と図5を対照させて説明する。図5において,該映像
区間の被写体である人物は,第1フレーム501から第
a2フレーム503にかけてゴルフクラブを振り上げて
いる。第a1フレーム502で振り上げる速さが極大と
なり,その結果,図4のように画像変化量も第a1フレ
ームにおいて,すなわちt=a1において,極大となっ
ている。第a1フレーム502では,ゴルフクラブの移
動速度が速く,ぶれが大きい。また,第a2フレーム5
03は,振り上げ動作から振り下ろし動作に移行する境
目であり,一時的に動きが小さくなっている。その結
果,図4のように画像変化量も第a2フレームにおい
て,すなわちt=a2において,極小となっている。
Here, in the example of the video section, the relationship between the value of t, which takes an extreme value, and the movement of the subject in the video section will be described with reference to FIGS. In FIG. 5, the person who is the subject in the video section swings the golf club from the first frame 501 to the a2 frame 503. In the a1st frame 502, the swinging speed is a maximum, and as a result, as shown in FIG. 4, the image change amount is also a maximum in the a1st frame, that is, at t = a1. In the a1st frame 502, the moving speed of the golf club is fast and the shake is large. Also, the a2 frame 5
Numeral 03 indicates a transition from the swing-up operation to the swing-down operation, and the movement is temporarily reduced. As a result, as shown in FIG. 4, the image change amount is also minimal in the a2 frame, that is, at t = a2.

【0040】また,図5において,該人物は第a2フレ
ーム503から第a3フレーム504にかけて,ゴルフ
クラブを振り下ろし,ボールを打撃している。第a3フ
レーム504で振り下ろす速さが極大となり,その結
果,図4のように画像変化量も第a3フレームにおい
て,すなわちt=a3において,極大となっている。第
a3フレーム504では,ゴルフクラブの移動速度が速
く,ぶれが大きい。また,図5の第a4フレーム505
において,該人物は振り切った腕を下ろし始め,一時的
に動きが小さくなっている。その結果,図4に示す画像
変化量も第a4フレーム505において,すなわち,t
=a4において,極小となっている。
In FIG. 5, the person swings down the golf club and hits the ball from the a2 frame 503 to the a3 frame 504. The speed of swinging down in the a3 frame 504 is maximum, and as a result, the image change amount is also maximum in the a3 frame, that is, at t = a3 as shown in FIG. In the a3rd frame 504, the moving speed of the golf club is high and the shake is large. The a4th frame 505 in FIG.
In, the person starts to lower his arm, and his movement is temporarily reduced. As a result, the image change amount shown in FIG.
= A4, it is minimal.

【0041】また,図5において,該人物は,第a4フ
レーム505から第aeフレーム506にかけて腕を下
ろしている。該人物の動作の節目であるところの,ゴル
フクラブの振り上げ動作から振り下ろし動作に移行する
境目,およびゴルフクラブの振り切りから腕を下ろす境
目が,図4に示す画像変化量の極小として表れている。
In FIG. 5, the person has his arms down from the a4th frame 505 to the aeth frame 506. The boundary between the swinging motion of the golf club and the swinging down motion, and the boundary between the swinging down of the golf club and the lowering of the arm, which are the milestones of the motion of the person, appear as the minimum image change amount shown in FIG. .

【0042】次に,ステップS207では,ステップS
206で求められたF[t]の極小点の個数を変数Mに
代入する。ステップS208では,変数Mの値と0とを
比較し,M>0であれば,ステップS209へ進み,そ
うでなければ,ステップS214へ進む。
Next, at step S207, step S
The number of the minimum points of F [t] obtained in 206 is substituted for a variable M. In step S208, the value of the variable M is compared with 0. If M> 0, the process proceeds to step S209; otherwise, the process proceeds to step S214.

【0043】ステップS209では,ステップS206
で求めたF[t]の極小点におけるM枚のフレームを基
準として,代表画像の候補をL枚選択する。この選択の
方法は種々のものがあり得るが,例えば,該極小点にお
けるフレームのそれぞれを代表画像候補としてもよい。
このとき,L=Mとなる(後述する第2の実施形態)。
また,該極小点から予め定めた一定時間前または後のフ
レームを代表画像候補としてもよい。また,該極小点の
前後で予め定めた一定時間置きに現れる複数フレームを
代表画像候補としてもよい。また,ある極小点から次の
極小点までの動画像を代表画像としてもよい。
In step S209, step S206
Based on the M frames at the minimum point of F [t] obtained in the above, L representative image candidates are selected. There may be various selection methods. For example, each of the frames at the minimum point may be used as a representative image candidate.
At this time, L = M (second embodiment described later).
A frame before or after a predetermined time from the minimum point may be set as a representative image candidate. Also, a plurality of frames appearing at predetermined time intervals before and after the minimum point may be set as representative image candidates. Further, a moving image from a certain minimum point to the next minimum point may be set as the representative image.

【0044】次に,ステップS210では,選択したL
枚の代表画像候補を表示装置12に表示する。これに対
し,操作者は表示されたフレームを吟味し,該映像区間
の代表画像としてふさわしいものを1枚選択し,入力装
置13によって選択したものを指定する。
Next, in step S210, the selected L
The representative image candidates are displayed on the display device 12. On the other hand, the operator examines the displayed frame, selects one suitable image as the representative image of the video section, and specifies the selected image using the input device 13.

【0045】ステップS211では,情報処理装置11
は,入力装置13から,操作者によって選択された1枚
のフレームを入力し,そのフレーム番号を変数Sに代入
する。入力の方法は,マウスなどによって表示されたフ
レームを指し示す方法でもよいし,命令文によってフレ
ーム番号を入力する方法でもよいし,フレームにラベル
を付け,命令文によってラベルを入力する方法でもよ
い。
In step S211, the information processing apparatus 11
Inputs one frame selected by the operator from the input device 13 and substitutes the frame number for a variable S. The input method may be a method of pointing to a frame displayed by a mouse or the like, a method of inputting a frame number by a command, or a method of attaching a label to a frame and inputting a label by a command.

【0046】ステップS212では,選択されたフレー
ムの縮小画像を作成し,該映像区間の位置と組にして,
該映像区間の索引として記憶装置14に出力する。該映
像区間の位置は,該映像の先頭フレームからの経過時間
でもよいし,該映像の先頭フレームからの通算フレーム
番号でもよい。
In step S212, a reduced image of the selected frame is created, paired with the position of the video section, and
The index is output to the storage device 14 as an index of the video section. The position of the video section may be the elapsed time from the top frame of the video or the total frame number from the top frame of the video.

【0047】ステップS213では,変数iの値に1を
加え,その後,ステップS204へ進み,同様に次の映
像区間に着目して,処理を進める。
In step S213, 1 is added to the value of the variable i, and thereafter, the process proceeds to step S204, and the process is similarly performed focusing on the next video section.

【0048】上記ステップS208において,M>0で
ない場合は,ステップS214により,変数Sに先頭フ
レーム番号1を代入し,ステップS212へ進む。この
ステップS214は,画像変化量Fに極値がなかった場
合の処理であり,この場合,代表画像の候補が得られな
いので,映像区間の先頭フレームを代表画像としてい
る。必要であれば別の方法で代表画像を求めてもよい。
すなわち,本実施形態では,映像区間の先頭フレームを
代表画像とする方法を用いたが,例えば特開平9−93
527号公報に示されている方法などを用いてもよい。
ステップS204で変数iがNを越え,ループから脱出
すると,該映像の全映像区間の索引が,記憶装置14に
蓄積されていることになる。
In step S208, if M> 0 is not satisfied, the head frame number 1 is substituted for the variable S in step S214, and the flow advances to step S212. This step S214 is a process when there is no extreme value in the image change amount F. In this case, since a representative image candidate cannot be obtained, the first frame of the video section is set as the representative image. If necessary, the representative image may be obtained by another method.
That is, in the present embodiment, the method of using the first frame of the video section as the representative image is used.
For example, a method disclosed in Japanese Patent No. 527 may be used.
When the variable i exceeds N in step S204 and escapes from the loop, the indexes of all video sections of the video are stored in the storage device 14.

【0049】本実施形態により出力された索引の例を図
6に示す。図6に示すように,映像区間通番毎に,代表
画像と区間情報の組が映像の索引として記憶装置14に
格納される。
FIG. 6 shows an example of an index output according to the present embodiment. As shown in FIG. 6, a set of a representative image and section information is stored in the storage device 14 as a video index for each video section serial number.

【0050】本実施形態では,予め映像全体が記憶装置
14に格納されていることを前提としたが,情報処理装
置11にビデオ入力装置を接続し,ビデオデッキやビデ
オカメラやテレビ放送などから映像を入力し,逐次的に
処理し,本発明を適用してもよい。
In the present embodiment, it is assumed that the entire video is stored in the storage device 14 in advance. However, a video input device is connected to the information processing device 11, and a video deck, a video camera, a May be input and processed sequentially to apply the present invention.

【0051】また,本実施形態では,画像変化量の極小
を求めるために,映像区間全体の画像変化量を配列Fに
記憶するという手順を説明したが,配列の全体を格納せ
ずに,一時には連続する数フレームの画像変化量だけを
記憶し,逐次的に極小か否かを判定するという手順でも
よい。
In this embodiment, the procedure of storing the image change amount of the entire video section in the array F in order to find the minimum of the image change amount has been described. Sometimes, only the image change amount of several consecutive frames is stored, and it is possible to sequentially determine whether or not the change is minimal.

【0052】また,本実施形態では,1映像区間に対し
て1枚の代表画像を選択する方法を示したが,1映像区
間に対して複数枚の代表画像を選択してもよい。
In this embodiment, a method of selecting one representative image for one video section has been described. However, a plurality of representative images may be selected for one video section.

【0053】また,本実施形態では,映像区間の候補の
中から操作者の操作により代表画像を選択する方法を示
したが,操作者の選択によらず,代表画像候補の全てを
代表画像にしてもよいし,例えば,フレーム番号が最も
若い候補を代表画像に選択するというようにしてもよ
い。あるいは,何らかの評価尺度を導入し,操作者の操
作によらず,最も評価の高い候補を代表画像に選択して
もよい。
In this embodiment, the method of selecting a representative image from the candidates of the video section by the operation of the operator has been described. However, regardless of the selection of the operator, all the representative image candidates are set as the representative images. Alternatively, for example, a candidate having the youngest frame number may be selected as the representative image. Alternatively, some evaluation scale may be introduced, and the candidate with the highest evaluation may be selected as the representative image regardless of the operation of the operator.

【0054】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第1の実施形態の説明であ
る。
The above is an explanation of the first embodiment of the processing for indexing a video using the representative image selection method of the present invention.

【0055】次に,本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第2の実施形態を説明す
る。図7は,本発明の第2の実施形態による代表画像選
択処理のフローチャートである。
Next, a description will be given of a second embodiment of processing for indexing a video using the representative image selection method of the present invention. FIG. 7 is a flowchart of a representative image selection process according to the second embodiment of the present invention.

【0056】前述した第1の実施形態では,図2に示す
ステップS209において,画像変化量F[t]の極小
点におけるM枚のフレームを基準として,代表画像の候
補をL枚選択するのに対し,第2の実施形態において
は,図7のステップS309において,画像変化量F
[t]が極小となるフレームを代表画像候補として選択
する。その他の処理(ステップS301〜S308,S
310〜ステップS314)は,第1の実施形態と同様
であるので説明は省略する。
In the first embodiment described above, in step S209 shown in FIG. 2, it is necessary to select L representative image candidates based on M frames at the minimum point of the image change amount F [t]. On the other hand, in the second embodiment, in step S309 of FIG.
A frame in which [t] is minimal is selected as a representative image candidate. Other processing (steps S301 to S308, S
Steps S <b> 310 to S <b> 314 are the same as in the first embodiment, and a description thereof will not be repeated.

【0057】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第2の実施形態の説明であ
る。
The above is the description of the second embodiment of the process of indexing a video using the representative image selection method of the present invention.

【0058】次に,本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第3の実施形態を説明す
る。第3の実施形態は,第1の実施形態に,ストロボ画
像作成の処理を加えたものである。図8は,この第3の
実施形態による代表画像選択処理のフローチャートであ
る。
Next, a description will be given of a third embodiment of the processing for indexing a video using the representative image selection method according to the present invention. The third embodiment is obtained by adding a strobe image creation process to the first embodiment. FIG. 8 is a flowchart of the representative image selection processing according to the third embodiment.

【0059】第3の実施の形態では,代表画像としてス
トロボ画像を作成する。このストロボ画像変形処理は,
図2のフローチャートのステップS208〜S212,
S214の部分を,図8のフローチャートのステップS
408〜S413で置きかえるものである。その他の処
理は,第1の実施形態と同じであるので,該ストロボ画
像作成処理部分についてのみ,図8のフローチャートに
基づいて第3の実施形態を説明する。
In the third embodiment, a strobe image is created as a representative image. This strobe image transformation process
Steps S208 to S212 in the flowchart of FIG.
Step S214 is replaced by step S214 in the flowchart of FIG.
408 to S413. Other processes are the same as those of the first embodiment, and therefore, the third embodiment will be described with reference to the flowchart of FIG.

【0060】第3の実施形態においては,F[t]の極
小点の個数を変数Mに代入した後(ステップS40
7),ステップS408において変数Mの値と0とを比
較し,M>0であれば,ステップS409へ進み,そう
でなければ,ステップS413へ進む。
In the third embodiment, after the number of the minimum points of F [t] is substituted for the variable M (step S40).
7) In step S408, the value of the variable M is compared with 0. If M> 0, the process proceeds to step S409; otherwise, the process proceeds to step S413.

【0061】ステップS409では,ステップS406
で求めたF[t]の極小点のそれぞれについて,前後の
複数フレームからストロボ画像を作成する。例えば,予
め定数p,q,rを定め,ある極小点のフレームよりp
r秒前,(p−1)r秒前,…,2r秒前,r秒前,0
秒前,r秒後,2r秒後,…,(q−1)r秒後,qr
秒後のフレーム(p+q+1)枚を抽出し,ストロボ画
像を作成する。pかqのどちらかは0でもよい。M個の
極小点について,M枚のストロボ画像を作成し,これら
を代表画像候補とする。
In step S409, step S406
For each of the minimum points of F [t] obtained in the above, a strobe image is created from a plurality of frames before and after. For example, constants p, q, and r are determined in advance, and p is calculated from a frame at a certain minimum point.
r seconds ago, (p-1) r seconds ago, ..., 2 r seconds ago, r seconds ago, 0
Seconds before, after r seconds, after 2r seconds, ..., after (q-1) r seconds, qr
Secondly, (p + q + 1) frames are extracted to create a strobe image. Either p or q may be 0. M strobe images are created for the M minimum points, and these are used as representative image candidates.

【0062】次に,ステップS410では,作成したM
枚のストロボ画像を表示装置12に表示する。この表示
に対して,操作者は表示されたストロボ画像を吟味し,
該映像区間の代表画像としてふさわしいものを1枚選ん
で指定する。
Next, in step S410, the created M
The strobe images are displayed on the display device 12. In response to this display, the operator examines the displayed strobe image,
One suitable image is selected and designated as a representative image of the video section.

【0063】ステップS411では,情報処理装置11
は,入力装置13から操作者が指定した1枚のストロボ
画像を選択する。入力の方法は,マウスなどによって表
示されたフレームを指し示す方法でもよいし,ストロボ
画像にラベルを付け,命令文によってラベルを入力する
方法でもよい。
In step S411, the information processing device 11
Selects one strobe image specified by the operator from the input device 13. The input method may be a method of pointing a frame displayed by a mouse or the like, or a method of attaching a label to a strobe image and inputting the label by a command statement.

【0064】ステップS412では,該選択されたスト
ロボ画像と,該映像区間の位置とを組にして,該映像区
間の索引として記憶装置14に出力する。該映像区間の
位置は,該映像の先頭フレームからの経過時間でもよい
し,該映像の先頭フレームからの通算フレーム番号でも
よい。ステップS412の後は,ステップS414へ進
み,変数iの値に1を加算し,ステップS404に進
む。
In step S412, the selected strobe image and the position of the video section are paired and output to the storage device 14 as an index of the video section. The position of the video section may be the elapsed time from the top frame of the video or the total frame number from the top frame of the video. After step S412, the process proceeds to step S414, where 1 is added to the value of the variable i, and the process proceeds to step S404.

【0065】ステップS408において,M>0でない
場合には,ステップS413へ進み,i番目の映像区間
の先頭フレームと該映像区間の位置とを組にして,該映
像区間の索引として記憶装置14に出力する。このステ
ップS413は,画像変化量Fに極値がなかった場合の
処理であり,本実施形態では,映像区間の先頭フレーム
を代表画像とする方法を用いたが,別の方法で代表画像
を求めてもよい。例えば特開平9−93527号公報に
示されている方法などを用いることもできる。ステップ
S413の後はステップS414へ進む。その他の処理
は第1の実施形態と同様であるので説明は省略する。
If M> 0 is not satisfied in step S408, the process proceeds to step S413, where the head frame of the i-th video section and the position of the video section are paired and stored in the storage device 14 as an index of the video section. Output. This step S413 is processing in the case where there is no extreme value in the image change amount F. In the present embodiment, the method of using the first frame of the video section as the representative image is used, but the representative image is obtained by another method. You may. For example, a method disclosed in JP-A-9-93527 can be used. After step S413, the process proceeds to step S414. Other processes are the same as in the first embodiment, and a description thereof will be omitted.

【0066】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第3の実施形態の説明であ
る。
The above is the description of the third embodiment of the process of indexing a video using the representative image selection method of the present invention.

【0067】次に,本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第4の実施形態を説明す
る。図9および図10は,この第4の実施形態による代
表画像選択処理のフローチャートである。
Next, a description will be given of a fourth embodiment of the processing for indexing a video using the representative image selection method according to the present invention. FIGS. 9 and 10 are flowcharts of the representative image selection process according to the fourth embodiment.

【0068】第4の実施形態の処理は,第1の実施形態
に,カメラの動きを打ち消すように画像を変形する処理
(ステップS505〜S511)を加えたものである。
この画像変形処理は,図2のフローチャートのステップ
S205を,ステップS505〜S511で置きかえる
ものである。その他の部分の処理(ステップS501〜
S504,S512〜S522)は,図2に示す第1の
実施形態における処理と同じであるので,該画像変形処
理部分についてのみ,第4の実施形態を説明する。
The processing according to the fourth embodiment is obtained by adding processing (steps S505 to S511) for deforming an image so as to cancel the movement of the camera to the first embodiment.
This image transformation process replaces step S205 in the flowchart of FIG. 2 with steps S505 to S511. Processing of other parts (steps S501 to S501)
Steps S504, S512 to S522) are the same as the processing in the first embodiment shown in FIG. 2, and therefore, the fourth embodiment will be described only for the image deformation processing part.

【0069】第4の実施形態では,ステップS504に
おいて変数iとNを比較して,i≦Nである場合,ステ
ップS505において,i番目の映像区間の全フレーム
を入力する。先頭フレームから順にI1 ,I2 ,…,I
aeと呼ぶことにする。次に,ステップS506では,変
数jに1を代入する。
In the fourth embodiment, the variable i is compared with N in step S504, and if i ≦ N, all frames in the i-th video section are input in step S505. I 1 , I 2 ,..., I
Let's call it ae . Next, in step S506, 1 is substituted for a variable j.

【0070】ステップS507では,j番目のフレーム
j と,j+1番目のフレームIj+ 1 から,カメラ移動
のパラメータを抽出し,該2フレーム間でどのようにカ
メラが動いたかを推定する。この推定には,例えば特開
平11−225310号公報に開示されている方法を用
いる。特開平11−225310号公報に開示されてい
るカメラ移動の推定方法は,カメラのパン,チルト,ズ
ームによって,被写体の点が画像上で式(3)のように
見かけ上動くと仮定している。
In step S507, parameters for camera movement are extracted from the j-th frame I j and the (j + 1) -th frame I j + 1 , and how the camera has moved between the two frames is estimated. For this estimation, for example, a method disclosed in JP-A-11-225310 is used. The method of estimating camera movement disclosed in Japanese Patent Application Laid-Open No. H11-225310 assumes that a point of a subject moves apparently on an image as shown in Expression (3) due to panning, tilting, and zooming of the camera. .

【0071】 (x′,y′)=(ax″+b,ay″+c) …(3) 式(3)は,ある被写体の点が,あるフレームAでは画
像上の座標(x′,y′)に投影されており,別のフレ
ームBでは座標(x″,y″)に投影されているときの
関係式を表している。この見かけ上の点の移動が,被写
体は不動で,カメラの移動によって起きたものとする
と,未知数a,b,cはフレームAからフレームBまで
の間のカメラの動きを記述しており,カメラパラメータ
と呼ばれる。特開平11−225310号公報によれ
ば,平均二乗誤差を最小化することにより,カメラパラ
メータa,b,cの値を決定できる。上記ステップS5
07では,フレームIj からフレームIj+1 までの間の
カメラ移動のカメラパラメータを求め,aj ,bj ,c
j とする。
(X ′, y ′) = (ax ″ + b, ay ″ + c) (3) Equation (3) indicates that a point of a certain subject has coordinates (x ′, y ′) on an image in a certain frame A ), And in another frame B, a relational expression when projected at coordinates (x ″, y ″). Assuming that the apparent movement of the point is caused by the movement of the camera while the subject is stationary, the unknowns a, b, and c describe the movement of the camera from frame A to frame B. Called parameters. According to JP-A-11-225310, the values of the camera parameters a, b, and c can be determined by minimizing the mean square error. Step S5 above
In 07 obtains the camera parameters of the camera motion between the frame I j to frame I j + 1, a j, b j, c
j .

【0072】ステップS508では,求めたカメラパラ
メータを用いて,フレームIj から,フレームIj+1
でのカメラの動きを打ち消すようにフレームIj+1 を変
形し,I′j+1 とする。上記の方法で求めたカメラパラ
メータaj ,bj ,cj を用いれば,次の式(4)を用
いて,フレームIj+1 上の点(x,y)から,フレーム
j 上での点(x′,y′)を求めることができる。
In step S508, using the obtained camera parameters, the frame I j + 1 is deformed so as to cancel the movement of the camera from the frame I j to the frame I j + 1 to obtain I ′ j + 1 . . Using the camera parameters a j , b j , and c j obtained by the above method, the following equation (4) is used to calculate the point (x, y) on the frame I j + 1 on the frame I j . (X ', y') can be obtained.

【0073】 (x′,y′)=(aj x+bj ,aj y+cj ) …(4) 次に,ステップS509では,画像Ij と画像I′j+1
の画像変化量を求め,F[j]に代入する。その後,ス
テップS510では,変数jの値に1を加える。
[0073] (x ', y') = (a j x + b j, a j y + c j) ... (4) Then, in step S509, the image I j and the image I 'j + 1
Is obtained and substituted into F [j]. Then, in step S510, 1 is added to the value of the variable j.

【0074】ステップS511では,変数jの値と該i
番目の映像区間のフレーム数aeとを比較し,j>ae
−1であれば,画像変形処理を終了して,図2のステッ
プS206と同様の処理を行うステップS512へ進
む。j>ae−1でなければ,ステップS507へ進み
ループを構成する。このループで,該i番目の映像区間
のフレームI2 からフレームIaeまでの画像変化量を配
列Fに格納する。
In step S511, the value of variable j and the value of i
J> ae
If the value is -1, the image transformation process is terminated, and the process proceeds to step S512 where the same process as step S206 in FIG. 2 is performed. If j> ae−1 is not satisfied, the process proceeds to step S507 to form a loop. In this loop, stores the image change from frame I 2 of the i-th image segment until frame I ae in sequence F.

【0075】画像変形処理が終了すると,この映像区間
であたかもカメラが不動であったかのような画像変化量
Fを得ることができる。このことによって,カメラの動
きに影響されずに,画像変化量に被写体の動きがよく反
映されるようになる。
When the image deformation processing is completed, an image change amount F can be obtained in this video section as if the camera had not moved. As a result, the movement of the subject is well reflected in the image change amount without being affected by the movement of the camera.

【0076】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第4の実施形態の説明であ
る。
The above is an explanation of the fourth embodiment of the processing for indexing a video using the representative image selection method of the present invention.

【0077】次に,本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第5の実施形態を説明す
る。図11および図12は,この第5の実施形態による
代表画像選択処理のフローチャートである。
Next, a description will be given of a fifth embodiment of processing for indexing a video using the representative image selection method according to the present invention. FIGS. 11 and 12 are flowcharts of a representative image selection process according to the fifth embodiment.

【0078】第5の実施形態の処理は,第1の実施形態
に,代表画像候補から代表画像を機械的に選択する処理
を加えたものである。この代表画像選択処理は,図2の
フローチャートのステップS210からステップS21
1までの処理の部分を,図11および図12のステップ
S610からステップS621までの処理に置きかえる
ものである。その他の部分の処理(ステップS601〜
S609,S622〜S624)は,第1の実施形態と
同じであるので,この代表画像選択処理についての部分
のみ,図11および図12のフローチャートに基づいて
第5の実施形態を説明する。
The processing of the fifth embodiment is obtained by adding processing of mechanically selecting a representative image from representative image candidates to the first embodiment. This representative image selection processing is performed in steps S210 to S21 in the flowchart of FIG.
1 is replaced with the processing from step S610 to step S621 in FIGS. 11 and 12. Processing of other parts (steps S601 to S601)
Steps S609, S622 to S624) are the same as those in the first embodiment. Therefore, only the part relating to the representative image selection processing will be described with reference to the flowcharts in FIGS.

【0079】第5の実施形態では,ステップS609に
おいてF[t]の極小値を基準として代表画像候補L枚
を選択した後,ステップS610では,配列Fから,F
[t]が極大となる添字tを求め,配列TMAXに格納
する。F[t]の極大を求める方法は,F[t]の符号
を変えれば,極小を求める問題に帰着できる。
In the fifth embodiment, after selecting L representative image candidates in step S609 based on the minimum value of F [t], in step S610, F
The subscript t at which [t] is maximized is obtained and stored in the array TMAX. The method of finding the maximum of F [t] can be reduced to the problem of finding the minimum by changing the sign of F [t].

【0080】以下の変数SとPMAXは,代表画像とし
ての適切さが最大である代表画像候補を探すために用い
る。ステップS611では,変数SにTMIN[1]を
代入し,ステップS612では,変数PMAXに0を代
入する。また,ステップS613では,変数kに1を代
入する。
The following variables S and PMAX are used to search for a representative image candidate that is most appropriate as a representative image. In step S611, TMIN [1] is substituted for the variable S, and in step S612, 0 is substituted for the variable PMAX. In step S613, 1 is substituted for the variable k.

【0081】ステップS614では,TMAX[h]<
TMIN[k]かつTMIN[k]<TMAX[h+
1]なるhが存在するかどうかを検査する。系列の最
初,最後において,hが存在しない場合があり得る。条
件を満たすhが存在する場合には,代表画像としての適
切さを評価するために,ステップS615へ進む。条件
を満たすhが存在しない場合には,代表画像としての適
切さの評価をスキップし,ステップS620へ進む。
In step S614, TMAX [h] <
TMIN [k] and TMIN [k] <TMAX [h +
1] is checked for the existence of h. At the beginning and end of the sequence, h may not exist. If there is h that satisfies the condition, the process proceeds to step S615 to evaluate the suitability as a representative image. If there is no h that satisfies the condition, the evaluation of the suitability as the representative image is skipped, and the process proceeds to step S620.

【0082】ステップS615では,ステップS614
で求めたhの値を変数Hに代入する。次に,ステップS
616では,TMAX[H]≦t≦TMAX[H+1]
である領域から,t=TMIN[k]における凹みX
を,式(1)によって求め,変数Pに1−|X−θx
の値を格納する。Xは,区間TMAX[h]≦t≦TM
AX[h+1]におけるFの凹みの度合いを表す。Xが
0に近いならば,該区間は静止状態に近く動き特徴が乏
しいとみなすことができるし,Xが0.5に近いか0.
5より大きいならば,該区間は動いてばかりで動き特徴
に乏しいとみなすことができる。中間の適当な値θx
近いほど,該区間は動き特徴に富んでいるとみなせるの
で,1−|X−θx |を代表画像としての適切さとす
る。θx は,例えば0.25とする。
At step S615, step S614
Is substituted into the variable H. Next, step S
In 616, TMAX [H] ≦ t ≦ TMAX [H + 1]
From the region that is, the dent X at t = TMIN [k]
Is obtained by the equation (1), and 1− | X−θ x |
Store the value of. X is the section TMAX [h] ≦ t ≦ TM
AX [h + 1] represents the degree of F depression. If X is close to 0, the section is close to a stationary state and can be considered to have poor motion characteristics, and if X is close to 0.5 or 0.
If it is greater than 5, the section can only be considered moving and poor in motion characteristics. Closer to the middle of the appropriate value theta x, since the compartment between can be regarded as rich in movement feature, 1- | X-θ x | a and appropriateness of the representative image. θ x is, for example, 0.25.

【0083】ステップS617では,Pの値とPMAX
の値とを比較する。Pが,PMAXに記憶されている適
切さより大きい場合には,ステップS618へ進み,P
MAXの値を置きかえる。そうでない場合には,ステッ
プS620へ進む。
In step S617, the value of P and PMAX
To the value of. If P is larger than the appropriateness stored in PMAX, the process proceeds to step S618, where P
Replace the value of MAX. Otherwise, the process proceeds to step S620.

【0084】ステップS618では,SにTMIN
[k]の値を代入し,ステップS619では,PMAX
にPの値を代入する。ステップS620では,変数kに
k+1の値を代入する。
In step S618, SMIN is set to TMIN.
The value of [k] is substituted, and in step S619, PMAX
To the value of P. In step S620, the value of k + 1 is substituted for the variable k.

【0085】次に,ステップS621では,変数kの値
とMの値とを比較し,k>MでなければステップS61
4へ戻り,次の代表画像候補について代表画像としての
適切さの評価を行う。k>Mであればループを脱出し,
ステップS622へ進む。ステップS622へ進むと,
変数Sには,代表画像としての適切さが最も大である代
表画像候補のフレーム番号が一つ格納されている。以降
の処理は,図2のステップS212以降の処理と同様で
ある。
Next, in step S621, the value of the variable k is compared with the value of M. If k> M is not satisfied, step S61 is executed.
Then, the process returns to step 4 to evaluate the suitability of the next representative image candidate as a representative image. If k> M, escape the loop,
Proceed to step S622. Proceeding to step S622,
The variable S stores one frame number of a representative image candidate having the highest suitability as a representative image. Subsequent processing is the same as the processing after step S212 in FIG.

【0086】例外的な場合として,ステップS614に
おけるhの存在の検査で,一度も条件が成立しなかった
場合には,初期値である最若番の代表画像候補のフレー
ム番号がSに格納され,これを代表画像とするようにな
っているが,これに限らず,他の方法で代表画像を決定
してもよい。
As an exceptional case, if the condition is not satisfied even in the inspection of the existence of h in step S614, the frame number of the youngest representative image candidate which is the initial value is stored in S. , Is used as the representative image. However, the present invention is not limited to this, and the representative image may be determined by another method.

【0087】また,本実施形態では,代表画像としての
適切さが最大である代表画像候補を一つ選択するように
なっているが,適切さが大きいものを優先的に複数枚選
択するようにしてもよい。
Further, in the present embodiment, one representative image candidate having the maximum suitability as a representative image is selected. However, a plurality of representative images having higher suitability are preferentially selected. You may.

【0088】また,式(1)の分母を変更し,Xを次の
ように定義しても,本質的に違いはなく,本発明は有効
に適用できる。
Further, even if the denominator of equation (1) is changed and X is defined as follows, there is essentially no difference, and the present invention can be applied effectively.

【0089】[0089]

【数5】 (Equation 5)

【0090】ここで,max(a,b)は,a,bのう
ち大きい方の値をとる関数とする。
Here, max (a, b) is a function that takes the larger value of a and b.

【0091】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第5の実施形態の説明であ
る。
The above is an explanation of the fifth embodiment of the processing for indexing a video using the representative image selection method of the present invention.

【0092】次に,本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第6の実施形態を説明す
る。図13および図14は,この第6の実施形態による
代表画像選択処理のフローチャートである。
Next, a description will be given of a sixth embodiment of the processing for indexing a video using the representative image selection method according to the present invention. FIGS. 13 and 14 are flowcharts of the representative image selection process according to the sixth embodiment.

【0093】第6の実施形態の処理は,第5の実施形態
の代表画像としての適切さを評価する処理において,図
12のフローチャートのステップS616に相当する処
理の部分を,図14に示すステップS716の処理で置
き換えたもので,画像変化量の極小値とその両隣の極大
値との比率により代表画像としての適切さを評価するよ
うにしたものである。この処理以外(ステップS701
〜S715,S717〜S724)は,第5の実施形態
と同じであるので,当該処理についてのみ,図13およ
び図14のフローチャートに基づいて説明する。
In the processing of the sixth embodiment, the processing corresponding to step S616 in the flowchart of FIG. 12 in the processing of evaluating the suitability as a representative image of the fifth embodiment is replaced with the steps shown in FIG. It is replaced by the processing of S716, and the suitability as a representative image is evaluated based on the ratio between the minimum value of the image change amount and the maximum value on both sides thereof. Other than this processing (step S701)
To S715, S717 to S724) are the same as those in the fifth embodiment, and therefore only this process will be described with reference to the flowcharts in FIGS.

【0094】第6の実施形態では,hの値を変数Hに格
納した後(ステップS715),ステップS716にお
いて,TMAX[H]≦t≦TMAX[H+1]である
領域から,t=TMIN[k]における代表画像として
の適切さを求め,変数Pに格納する。Pを求めるには,
例えば, P=p1 21 =F[TMAX[H]]/F[TMIN[k]] p2 =F[TMAX[H+1]]/F[TMIN
[k]] とする。Pは線形である必要はなく,例えば, P=0 …p1 <θ1 またはp2 <θ2 のとき P=p1 2 …otherwise のように非線型でもよい。θ1 ,θ2 は,予め定めた閾
値とする。ステップS716は,t=TMIN[k]に
おける極小値が,その両隣の極大値にくらべて十分小さ
いかどうかを評価する処理で,小さいほどPの値は大き
くなる。次に,ステップS717へ進むが,以降の処理
は,図12のステップS617以降の処理と同様であ
る。
In the sixth embodiment, after the value of h is stored in the variable H (step S715), in step S716, from the area where TMAX [H] ≦ t ≦ TMAX [H + 1], t = TMIN [k ] Is determined as a representative image and stored in a variable P. To find P,
For example, P = p 1 p 2 p 1 = F [TMAX [H]] / F [TMIN [k]] p 2 = F [TMAX [H + 1]] / F [TMIN
[K]]. P need not be linear, and may be non-linear, such as P = p 1 p 2 ... Other when P = 0... P 11 or p 22 . θ 1 and θ 2 are predetermined thresholds. Step S716 is a process of evaluating whether or not the local minimum value at t = TMIN [k] is sufficiently smaller than the local maximum values on both sides. The smaller the value, the larger the value of P. Next, the process proceeds to step S717, and the subsequent processing is the same as the processing after step S617 in FIG.

【0095】以上が本発明の代表画像選択方法を用いて
映像の索引付けを行う処理の第6の実施形態の説明であ
る。この発明を用いることにより,操作者が目視により
判断し代表画像を選択するというステップを経なくて
も,機械的な処理によって代表画像の選択が可能とな
る。なお,前記第5の実施形態と第6の実施形態で,代
表画像としての適切さを評価するそれぞれの処理を個別
に用いる例を示したが,両者を同時に用いてもよい。そ
のためには例えば,P=p1 2 Xなどとして,代表画
像としての適切さに,p1 ,p2 ,Xを共に反映させる
ようにする。
The above is the description of the sixth embodiment of the processing for indexing a video using the representative image selection method of the present invention. By using the present invention, it is possible to select a representative image by mechanical processing, without going through the step of visually selecting and selecting a representative image by an operator. In the fifth and sixth embodiments, examples have been described in which each process for evaluating the suitability as a representative image is used individually, but both processes may be used simultaneously. For this purpose, for example, P = p 1 p 2 X, etc., so that both p 1 , p 2 , and X are reflected in the appropriateness as the representative image.

【0096】また,着目している極小点と,その隣の極
大点との距離が所定の閾値より離れている場合や,所定
の閾値より近い場合には,このような極小点が代表画像
として選ばれにくくするように,Pに,0などの特に低
い値を設定するようにしてもよい。
When the distance between the minimum point of interest and the next maximum point is larger than a predetermined threshold value or is smaller than a predetermined threshold value, such a minimum point is regarded as a representative image. A particularly low value such as 0 may be set for P to make it difficult to select.

【0097】そのほか,Xやp1 やp2 に定数をかけた
り,加えたり,単調増加関数によって変換するなど,意
味を変えないような操作をほどこしてもよいし,他の評
価尺度と組み合わせて用いてもよいことはいうまでもな
い。
In addition, operations that do not change the meaning, such as multiplying or adding a constant to X, p 1, or p 2 , or converting with a monotonically increasing function, may be performed, or combined with other evaluation scales. It goes without saying that it may be used.

【0098】ここで,配列に格納された数列F[t]の
極小点を求める処理の方法の一例を図15のフローチャ
ートに基づいて説明する。この処理は図2のステップS
206の詳細にあたる。本処理の開始時には,着目して
いる映像区間iの画像変化量の系列が配列Fに格納され
ている。当該映像区間のフレーム数はaeであるとす
る。したがって,配列Fの要素数はae−1である。
Here, an example of a method of processing for finding the minimum point of the sequence F [t] stored in the array will be described with reference to the flowchart of FIG. This processing corresponds to step S in FIG.
206 corresponds to the details. At the start of this processing, a sequence of image change amounts of the video section i of interest is stored in the array F. It is assumed that the number of frames in the video section is ae. Therefore, the number of elements of the array F is ae-1.

【0099】まず,ステップS801では,配列TMI
Nを初期化する。ステップS802では,変数mに1を
代入し,ステップS803では,変数Dに0を代入す
る。変数Dは,直前のFの挙動を格納する変数であり,
値1が増加を表し,値−1が減少を表す。値0はどちら
でもないことを表す。
First, in step S801, the array TMI
Initialize N. In step S802, 1 is substituted for a variable m, and in step S803, 0 is substituted for a variable D. The variable D is a variable that stores the behavior of the immediately preceding F,
A value of 1 indicates an increase and a value of -1 indicates a decrease. A value of 0 indicates neither.

【0100】次に,ステップS804では,変数gに1
を代入する。変数gは,当該映像区間iのフレームを走
査するためのフレーム番号を格納する変数である。
Next, in step S804, the variable g is set to 1
Is assigned. The variable g is a variable that stores a frame number for scanning the frame of the video section i.

【0101】ステップS805では,F[g+1]とF
[g]を比較し,F[g+1]>F[g]であれば,す
なわち,Fが増加していれば,ステップS806へ進
む。そうでなければ,ステップS812へ進む。
In step S805, F [g + 1] and F [g + 1]
[G] is compared, and if F [g + 1]> F [g], that is, if F is increasing, the process proceeds to step S806. Otherwise, the process proceeds to step S812.

【0102】ステップS806では,変数Dの値が−1
かを判断する。変数Dの値が−1であれば,Fが直前で
は減少しており,現在増加しているので,Fがt=gに
おいて極小値をとると判定し,ステップS807へ進
む。そうでなければ,ステップS809へ進む。
In the step S806, the value of the variable D is -1.
Judge. If the value of the variable D is -1, since F has decreased immediately before and is currently increasing, it is determined that F has a minimum value at t = g, and the process proceeds to step S807. Otherwise, the process proceeds to step S809.

【0103】ステップS807では,TMIN[m]に
フレーム番号gの値を代入する。これは,m番目に見つ
かった極小値を配列TMINに格納する処理である。ス
テップS807に到達したということは,着目している
フレームにおいて,系列Fが昇順になっており,その前
は,降順かどちらでもない状態であったのであるから,
降順から昇順に変化した点とみなすことができる。した
がって,ここを極小点として抽出する。続いて,ステッ
プS808では,変数mにm+1の値を代入する。
In step S807, the value of the frame number g is substituted for TMIN [m]. This is a process of storing the minimum value found at the m-th position in the array TMIN. Reaching step S807 means that the sequence F is in ascending order in the frame of interest, and before that, it is in a state of neither descending order,
It can be regarded as a point changed from descending order to ascending order. Therefore, this is extracted as a minimum point. Subsequently, in step S808, the value of m + 1 is substituted for the variable m.

【0104】ステップS809では,変数Dに1を代入
する。また,ステップS810では,変数gにg+1の
値を代入する。
In step S809, 1 is substituted for a variable D. In step S810, the value of g + 1 is substituted for the variable g.

【0105】次に,ステップS811では,変数gの値
とae−2の値とを比較し,g≧ae−2であれば手続
きを終了する。g≧ae−2でなければ,ステップS8
05へ戻り,次のフレームについて処理を行う。
Next, in step S811, the value of the variable g is compared with the value of ae-2, and if g ≧ ae-2, the procedure ends. If not g ≧ ae-2, step S8
Returning to step 05, processing is performed for the next frame.

【0106】上記ステップS805で,F[g+1]>
F[g]でないと判断した場合には,ステップS812
において,F[g+1]の値とF[g]の値とを比較
し,F[g+1]<F[g]であれば,ステップS81
3へ進み,そうでなければ,ステップS810へ進む。
ステップS813では,変数Dに−1を代入し,その後
にステップS810に進む。本手続きが終了すると,系
列Fが極小となるフレーム番号が配列TMINに格納さ
れており,極小点の数はm−1個である。
In step S805, F [g + 1]>
If it is determined that it is not F [g], step S812
In step S81, the value of F [g + 1] is compared with the value of F [g], and if F [g + 1] <F [g], the process proceeds to step S81.
Go to step S3, otherwise go to step S810.
In step S813, -1 is substituted for the variable D, and thereafter, the process proceeds to step S810. When this procedure is completed, the frame number at which the sequence F becomes the minimum is stored in the array TMIN, and the number of the minimum points is m-1.

【0107】通例,系列が降順から昇順へ変化する点を
極小点というが,系列が降順である区間と昇順である区
間の間に値が一定である区間が存在する場合,これを極
小点とみなすか否かは実施者が任意に定義してよい。本
実施形態は,これを極小点とみなすという定義に基づき
構成されている。また,これを極小点とみなすとすれ
ば,この値が一定である区間のどの1点を極小点とみな
すかは,実施者が任意に定義してよい。本実施形態で
は,この値が一定である区間の末尾を極小点とみなすと
いう定義に基づき構成されている。
Usually, the point at which the sequence changes from descending to ascending order is referred to as a minimum point. If there is a section having a constant value between the section in which the series is descending and the section in which the series is ascending, this is referred to as the minimum point. Whether or not to consider it may be arbitrarily defined by the practitioner. The present embodiment is configured based on the definition that this is regarded as a minimum point. If this point is regarded as the minimum point, the implementer may arbitrarily define which one point in the section where this value is constant is regarded as the minimum point. The present embodiment is configured based on the definition that the end of the section in which this value is constant is regarded as the minimum point.

【0108】以上の処理は,コンピュータとソフトウェ
アプログラムとによって実現することができ,そのプロ
グラムは,コンピュータが読み取り可能な可搬媒体メモ
リ,半導体メモリ,ハードディスク等の適当な記録媒体
に格納して,そこから読み出すことによりコンピュータ
に実行させることができる。
The above processing can be realized by a computer and a software program, and the program is stored in an appropriate recording medium such as a portable medium memory, a semiconductor memory, and a hard disk which can be read by a computer. By reading from the computer.

【0109】[0109]

【発明の効果】本発明を用いて映像区間から代表画像を
抽出すれば,被写体の動きをよく表す代表画像を選択で
きるようになる。また,本発明に示す方法によって,代
表画像候補の中から適切な代表画像を自動的に選択する
こともでき,この場合には,操作者の目視と判断を介さ
なくても代表画像を選択することが可能となる。
According to the present invention, when a representative image is extracted from a video section, a representative image that well represents the movement of a subject can be selected. In addition, by the method according to the present invention, an appropriate representative image can be automatically selected from the representative image candidates. In this case, the representative image is selected without the operator's visual observation and judgment. It becomes possible.

【0110】このようにして選択した代表画像を用いて
映像の索引を作成すれば,映像の内容の理解しやすい索
引が作成できるという効果がある。
If an index of a video is created using the representative image selected in this way, there is an effect that an index in which the contents of the video can be easily understood can be created.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明を実施する装置の構成例を示す図であ
る。
FIG. 1 is a diagram showing a configuration example of an apparatus for implementing the present invention.

【図2】第1の実施形態による代表画像選択処理のフロ
ーチャートである。
FIG. 2 is a flowchart of a representative image selection process according to the first embodiment.

【図3】処理の対象となる映像区間の例を示す図であ
る。
FIG. 3 is a diagram illustrating an example of a video section to be processed;

【図4】映像区間の画像変化量を表すグラフを示す図で
ある。
FIG. 4 is a diagram showing a graph representing an image change amount in a video section.

【図5】画像変化量と映像区間の対応関係を表す図であ
る。
FIG. 5 is a diagram illustrating a correspondence relationship between an image change amount and a video section.

【図6】映像索引の例を示す図である。FIG. 6 is a diagram illustrating an example of a video index.

【図7】第2の実施形態による代表画像選択処理のフロ
ーチャートである。
FIG. 7 is a flowchart of a representative image selection process according to the second embodiment.

【図8】第3の実施形態による代表画像選択処理のフロ
ーチャートである。
FIG. 8 is a flowchart of a representative image selection process according to the third embodiment.

【図9】第4の実施形態による代表画像選択処理のフロ
ーチャートである。
FIG. 9 is a flowchart of a representative image selection process according to a fourth embodiment.

【図10】第4の実施形態による代表画像選択処理のフ
ローチャートである。
FIG. 10 is a flowchart of a representative image selection process according to a fourth embodiment.

【図11】第5の実施形態による代表画像選択処理のフ
ローチャートである。
FIG. 11 is a flowchart of a representative image selection process according to a fifth embodiment.

【図12】第5の実施形態による代表画像選択処理のフ
ローチャートである。
FIG. 12 is a flowchart of a representative image selection process according to a fifth embodiment.

【図13】第6の実施形態による代表画像選択処理のフ
ローチャートである。
FIG. 13 is a flowchart of a representative image selection process according to a sixth embodiment.

【図14】第6の実施形態による代表画像選択処理のフ
ローチャートである。
FIG. 14 is a flowchart of a representative image selection process according to a sixth embodiment.

【図15】極小点を求める処理のフローチャートであ
る。
FIG. 15 is a flowchart of a process for obtaining a minimum point.

【符号の説明】 1 映像索引作成装置 11 情報処理装置 12 表示装置 13 入力装置 14 記憶装置 111 画像変化量計算手段 112 画像変化量極小フレーム算出手段 113 代表画像候補選択手段 114 代表画像選択手段 401 第tフレームにおける画像変化量(F[t]) 501〜506 第1〜第aeフレーム[Explanation of symbols] 1 Video indexing device 11 Information processing device 12 Display device 13 Input device 14 Storage device 111 Image variation calculation means 112 Image change minimal frame calculating means 113 Representative image candidate selection means 114 Representative image selection means 401 Image change amount in t-th frame (F [t]) 501-506 1st-aeth frame

───────────────────────────────────────────────────── フロントページの続き (72)発明者 児島 治彦 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 ND12 NS01 UU40 5C052 AA01 AB02 AB04 AC08 DD04 EE03 5C053 FA14 GB05 HA29 KA01 KA24 LA06 LA11 5L096 CA02 FA00 GA19 HA04    ────────────────────────────────────────────────── ─── Continuation of front page    (72) Inventor Haruhiko Kojima             2-3-1 Otemachi, Chiyoda-ku, Tokyo Sun             Within the Telegraph and Telephone Corporation F term (reference) 5B075 ND12 NS01 UU40                 5C052 AA01 AB02 AB04 AC08 DD04                       EE03                 5C053 FA14 GB05 HA29 KA01 KA24                       LA06 LA11                 5L096 CA02 FA00 GA19 HA04

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 映像区間の中の代表画像を選択する方法
であって,映像区間の画像変化量を計算するステップ
と,前記画像変化量が極小となるフレームを求めるステ
ップと,前記画像変化量が極小となるフレームを基準と
して前記映像区間の代表画像の候補を選択するステップ
とを有することを特徴とする代表画像選択方法。
1. A method for selecting a representative image in a video section, comprising: calculating an image change amount in a video section; obtaining a frame in which the image change amount is minimal; Selecting a candidate of a representative image of the video section based on a frame having a minimum value.
【請求項2】 前記映像区間の代表画像の候補を選択す
るステップでは,画像変化量が極小となるフレームを前
記映像区間の代表画像の候補とすることを特徴する請求
項1記載の代表画像選択方法。
2. The representative image selection method according to claim 1, wherein in the step of selecting a representative image candidate of the video section, a frame having a minimum image change amount is set as a candidate of the representative image of the video section. Method.
【請求項3】 前記映像区間の代表画像の候補を選択す
るステップは,画像変化量が極小となるフレームを基準
として複数フレームを選択するステップと,選択された
複数フレームからストロボ画像を作成するステップと,
作成したストロボ画像を前記映像区間の代表画像の候補
とするステップとを有することを特徴とする請求項1記
載の代表画像選択方法。
3. The step of selecting a candidate of a representative image of the video section includes the steps of selecting a plurality of frames based on a frame having a minimal image change amount, and forming a strobe image from the selected plurality of frames. When,
Setting the created strobe image as a candidate for a representative image of the video section.
【請求項4】 前記映像区間の画像変化量を計算するス
テップは,入力映像からカメラ移動パラメータを推定す
るステップと,前記カメラ移動パラメータを用いてカメ
ラ移動を打ち消すように入力画像の各フレームを変形す
るステップとを有することを特徴とする請求項1記載の
代表画像選択方法。
4. The step of calculating an image change amount in the video section includes the steps of estimating a camera movement parameter from an input video, and transforming each frame of the input image so as to cancel the camera movement using the camera movement parameter. 2. The method according to claim 1, further comprising the step of:
【請求項5】 前記映像区間の代表画像の候補を選択す
るステップにより選択した代表画像の候補の各々につい
て,所定の評価基準により代表画像としての適切さを求
めるステップと,求めた代表画像としての適切さに基づ
いて前記代表画像候補の中から代表画像を選択するステ
ップとを有することを特徴とする請求項1記載の代表画
像選択方法。
5. A step of obtaining appropriateness as a representative image by a predetermined evaluation criterion for each of the representative image candidates selected in the step of selecting a representative image candidate in the video section; Selecting a representative image from the representative image candidates based on adequacy.
【請求項6】 前記代表画像としての適切さを求めるス
テップでは,fを画像変化量,t1 ,t2 を該代表画像
候補のフレームの両隣でfが極大となるフレーム番号,
θx を所定の定数として,値X, 【数1】 を求め,|X−θx |の値がより小さいものに,より大
きな代表画像としての適切さを与えることを特徴とする
請求項5記載の代表画像選択方法。
6. In the step of determining the suitability as a representative image, f represents an image change amount, t 1 and t 2 represent frame numbers at which f is maximum on both sides of the representative image candidate frame,
When θ x is a predetermined constant, the value X, Look, | X-θ x | of what value is smaller, the representative image selection method according to claim 5, wherein providing the appropriateness of a larger representative image.
【請求項7】 前記代表画像としての適切さを求めるス
テップでは,fを画像変化量,t0 を該代表画像候補の
フレーム番号,t1 ,t2 を該代表画像候補のフレーム
の両隣でfが極大となるフレーム番号として,f
(t1 )/f(t0 )の値がより大きいものに,より大
きな代表画像としての適切さを与え,f(t2 )/f
(t0 )の値がより大きいものに,より大きな代表画像
としての適切さを与えることを特徴とする請求項5記載
の代表画像選択方法。
7. In the step of determining the suitability as a representative image, f represents an image change amount, t 0 represents a frame number of the representative image candidate, and t 1 and t 2 represent f 2 on both sides of the representative image candidate frame. Is the maximum frame number
A larger value of (t 1 ) / f (t 0 ) is given greater suitability as a representative image, and f (t 2 ) / f
6. A representative image selecting method according to claim 5, wherein a value having a larger value of (t 0 ) is given a greater suitability as a representative image.
【請求項8】 映像区間の中の代表画像を選択する代表
画像選択装置であって,映像区間の画像変化量を計算す
る手段と,前記画像変化量が極小となるフレームを求め
る手段と,前記画像変化量が極小となるフレームを基準
として前記映像区間の代表画像の候補を選択する手段と
を備えることを特徴とする代表画像選択装置。
8. A representative image selecting device for selecting a representative image in a video section, comprising: means for calculating an image change amount in a video section; means for obtaining a frame in which the image change amount is minimal; Means for selecting a candidate of a representative image of the video section based on a frame having a minimal image change amount.
【請求項9】 前記映像区間の代表画像の候補を選択す
る手段は,画像変化量が極小となるフレームを前記映像
区間の代表画像の候補とすることを特徴する請求項8記
載の代表画像選択装置。
9. The representative image selection unit according to claim 8, wherein said means for selecting a candidate of a representative image of the video section sets a frame having a minimum image change amount as a candidate of a representative image of the video section. apparatus.
【請求項10】 前記映像区間の代表画像の候補を選択
する手段は,画像変化量が極小となるフレームを基準と
して複数フレームを選択する手段と,選択された複数フ
レームからストロボ画像を作成する手段と,作成したス
トロボ画像を,前記映像区間の代表画像の候補とする手
段とを備えることを特徴とする請求項8記載の代表画像
選択装置。
10. A means for selecting a representative image candidate in the video section, means for selecting a plurality of frames based on a frame having a minimal image change amount, and means for creating a strobe image from the selected plurality of frames. 9. The representative image selection device according to claim 8, further comprising: a unit that sets the created strobe image as a candidate for a representative image of the video section.
【請求項11】 前記映像区間の画像変化量を計算する
手段は,入力映像からカメラ移動パラメータを推定する
手段と,前記カメラ移動パラメータを用いてカメラ移動
を打ち消すように入力画像の各フレームを変形する手段
とを備えることを特徴とする請求項8記載の代表画像選
択装置。
11. A means for calculating an image change amount in a video section, comprising: means for estimating a camera movement parameter from an input video, and transforming each frame of the input image so as to cancel camera movement using the camera movement parameter. 9. The representative image selection device according to claim 8, further comprising:
【請求項12】 前記映像区間の代表画像の候補を選択
する手段により選択した代表画像の候補の各々につい
て,所定の評価基準により代表画像としての適切さを求
める手段と,求めた代表画像としての適切さに基づいて
前記代表画像候補の中から代表画像を選択する手段とを
備えることを特徴とする請求項8記載の代表画像選択装
置。
12. A means for determining the suitability of each representative image selected by the means for selecting a representative image of the video section as a representative image based on a predetermined evaluation criterion. 9. The representative image selecting apparatus according to claim 8, further comprising: means for selecting a representative image from the representative image candidates based on suitability.
【請求項13】 前記代表画像としての適切さを求める
手段は,fを画像変化量,t1 ,t2 を該代表画像候補
のフレームの両隣でfが極大となるフレーム番号,θx
をある定数として,値X, 【数2】 を求め,|X−θx |の値がより小さいものに,より大
きな代表画像としての適切さを与えることを特徴とする
請求項12記載の代表画像選択装置。
13. The means for determining the suitability as a representative image includes f representing an image change amount, t 1 and t 2 representing frame numbers at which f is a maximum on both sides of the representative image candidate frame, and θ x
Is a constant, the value X, Look, | X-θ x | of what value is smaller, the representative image selection apparatus according to claim 12, wherein providing the appropriateness of a larger representative image.
【請求項14】 前記代表画像としての適切さを求める
手段は,fを画像変化量,t0 を該代表画像候補のフレ
ーム番号,t1 ,t2 を該代表画像候補のフレームの両
隣でfが極大となるフレーム番号として,f(t1 )/
f(t0 )の値がより大きいものにより大きな代表画像
としての適切さを与え,f(t2 )/f(t0 )の値が
より大きいものにより大きな代表画像としての適切さを
与えることを特徴とする請求項12記載の代表画像選択
装置。
14. The means for determining the suitability as a representative image includes f representing an image change amount, t 0 representing a frame number of the representative image candidate, and t 1 and t 2 representing f at both sides of the frame of the representative image candidate. Is the maximum frame number, f (t 1 ) /
f (t 0) value gives the appropriateness of a large representative image by what is more large, f (t 2) / f (t 0) of the value that gives the appropriateness of a large representative image by a larger one 13. The representative image selection device according to claim 12, wherein:
【請求項15】 請求項1から請求項7までのいずれか
1項に記載の代表画像選択方法をコンピュータに実行さ
せるための代表画像選択プログラム。
15. A representative image selection program for causing a computer to execute the representative image selection method according to any one of claims 1 to 7.
【請求項16】 請求項1から請求項7までのいずれか
1項に記載の代表画像選択方法をコンピュータに実行さ
せるためのプログラムを記録したことを特徴とする代表
画像選択プログラムの記録媒体。
16. A recording medium for a representative image selection program, wherein a program for causing a computer to execute the representative image selection method according to any one of claims 1 to 7 is recorded.
JP2002147886A 2002-05-22 2002-05-22 Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program Pending JP2003348528A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002147886A JP2003348528A (en) 2002-05-22 2002-05-22 Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002147886A JP2003348528A (en) 2002-05-22 2002-05-22 Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program

Publications (1)

Publication Number Publication Date
JP2003348528A true JP2003348528A (en) 2003-12-05

Family

ID=29766718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002147886A Pending JP2003348528A (en) 2002-05-22 2002-05-22 Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program

Country Status (1)

Country Link
JP (1) JP2003348528A (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086478A1 (en) * 2004-03-04 2005-09-15 Seiko Epson Corporation Moving image data processing
JP2005352718A (en) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> Representative image selection device, representative image selection method and representative image selection program
JP2006217046A (en) * 2005-02-01 2006-08-17 Olympus Corp Video index image generator and generation program
JP2006279939A (en) * 2005-03-03 2006-10-12 Fuji Photo Film Co Ltd Image extraction device, image extraction method, and image extraction program
JP2007288608A (en) * 2006-04-18 2007-11-01 Sharp Corp Method for preparing thumbnail and moving picture data reproducing apparatus
WO2008155974A1 (en) * 2007-06-20 2008-12-24 Olympus Corporation Image extraction apparatus, image extraction program, and image extraction method
JP2009296344A (en) * 2008-06-05 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method of processing video, program, and computer-readable recoding medium
JP2010028773A (en) * 2008-07-24 2010-02-04 Canon Inc Image processing apparatus, image processing method and program
JP2010109592A (en) * 2008-10-29 2010-05-13 Canon Inc Information processing apparatus and control method for the same
JP2010118868A (en) * 2008-11-12 2010-05-27 Canon Inc Information processor and control method thereof
US7783115B2 (en) 2004-12-14 2010-08-24 Fujifilm Corporation Apparatus and method for setting degrees of importance, apparatus and method for representative image selection, apparatus and method for printing-recommended image selection, and programs therefor
JP2011008676A (en) * 2009-06-29 2011-01-13 Olympus Corp Image extraction device, image extraction method and image extraction program
JP2017130134A (en) * 2016-01-22 2017-07-27 カシオ計算機株式会社 Image processing apparatus, image processing method, and program
US9899061B2 (en) 2013-12-27 2018-02-20 Fuji Xerox Co., Ltd. Representative frame selecting system and non-transitory computer readable medium
JP2019068173A (en) * 2017-09-29 2019-04-25 大日本印刷株式会社 Image selection device, image output device, image selection method, image output method, and image output system

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086478A1 (en) * 2004-03-04 2005-09-15 Seiko Epson Corporation Moving image data processing
JPWO2005086478A1 (en) * 2004-03-04 2008-01-24 セイコーエプソン株式会社 Video data processing
JP2005352718A (en) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> Representative image selection device, representative image selection method and representative image selection program
US7783115B2 (en) 2004-12-14 2010-08-24 Fujifilm Corporation Apparatus and method for setting degrees of importance, apparatus and method for representative image selection, apparatus and method for printing-recommended image selection, and programs therefor
JP2006217046A (en) * 2005-02-01 2006-08-17 Olympus Corp Video index image generator and generation program
JP2006279939A (en) * 2005-03-03 2006-10-12 Fuji Photo Film Co Ltd Image extraction device, image extraction method, and image extraction program
JP4504322B2 (en) * 2005-03-03 2010-07-14 富士フイルム株式会社 Image extraction apparatus, image extraction method, and image extraction program
JP2007288608A (en) * 2006-04-18 2007-11-01 Sharp Corp Method for preparing thumbnail and moving picture data reproducing apparatus
JP4744345B2 (en) * 2006-04-18 2011-08-10 シャープ株式会社 Thumbnail creation method and moving picture data playback device
EP2157789A1 (en) * 2007-06-20 2010-02-24 Olympus Corporation Image extracting apparatus, image extracting program, and image extracting method
JP2009005020A (en) * 2007-06-20 2009-01-08 Olympus Corp Image extracting apparatus, and image extracting program
WO2008155974A1 (en) * 2007-06-20 2008-12-24 Olympus Corporation Image extraction apparatus, image extraction program, and image extraction method
EP2157789A4 (en) * 2007-06-20 2013-10-02 Olympus Corp Image extracting apparatus, image extracting program, and image extracting method
JP2009296344A (en) * 2008-06-05 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method of processing video, program, and computer-readable recoding medium
JP2010028773A (en) * 2008-07-24 2010-02-04 Canon Inc Image processing apparatus, image processing method and program
JP2010109592A (en) * 2008-10-29 2010-05-13 Canon Inc Information processing apparatus and control method for the same
JP2010118868A (en) * 2008-11-12 2010-05-27 Canon Inc Information processor and control method thereof
US8866900B2 (en) 2008-11-12 2014-10-21 Canon Kabushiki Kaisha Information processing apparatus and method of controlling same
JP2011008676A (en) * 2009-06-29 2011-01-13 Olympus Corp Image extraction device, image extraction method and image extraction program
US9899061B2 (en) 2013-12-27 2018-02-20 Fuji Xerox Co., Ltd. Representative frame selecting system and non-transitory computer readable medium
JP2017130134A (en) * 2016-01-22 2017-07-27 カシオ計算機株式会社 Image processing apparatus, image processing method, and program
JP2019068173A (en) * 2017-09-29 2019-04-25 大日本印刷株式会社 Image selection device, image output device, image selection method, image output method, and image output system
JP7102700B2 (en) 2017-09-29 2022-07-20 大日本印刷株式会社 Image output device
JP2022121584A (en) * 2017-09-29 2022-08-19 大日本印刷株式会社 Image output method and image output system
JP7396399B2 (en) 2017-09-29 2023-12-12 大日本印刷株式会社 Image output method and image output system

Similar Documents

Publication Publication Date Title
JP4181473B2 (en) Video object trajectory synthesis apparatus, method and program thereof
JP2003348528A (en) Representative image selection method, representative image selection apparatus, representative image selection program and recording medium for representative image selection program
US11758082B2 (en) System for automatic video reframing
JP4700892B2 (en) Image matching
JP4968259B2 (en) Image high resolution device, image high resolution method and program
US7477289B2 (en) Image processing apparatus and method, and image pickup apparatus
JP2001285695A (en) Mobile body tracking method and device therefor
JP2008518331A (en) Understanding video content through real-time video motion analysis
JP3131560B2 (en) Moving image information detecting device in moving image processing system
JP5163429B2 (en) Motion vector detection apparatus, processing method thereof, and program
JP2006276948A (en) Image processing device, image processing method, image processing program, and recording medium storing image processing program
JP2006244074A (en) Moving object close-up frame detection method and program, storage medium storing program, moving object close-up shot detection method, moving object close-up frame or shot detection method and program, and storage medium storing program
JP2010244207A (en) Moving object tracking device, moving object tracking method, and moving object tracking program
KR20100103776A (en) Image processor, animation reproduction apparatus, and processing method and program for the processor and apparatus
JPH10126721A (en) Dynamic image retrieving information generating device
KR20050097936A (en) Efficient predictive image parameter estimation
JP2000348159A (en) Picture composite processing method, image pickup device, picture contraction processing method, and recording medium
JP4199214B2 (en) Movie generation device, movie generation method, movie generation program
JP7027776B2 (en) Movement vector calculation method, device, program, and movement vector calculation method including noise reduction processing.
JP2010114596A (en) Motion vector detection apparatus, motion vector processing method and program
US7522189B2 (en) Automatic stabilization control apparatus, automatic stabilization control method, and computer readable recording medium having automatic stabilization control program recorded thereon
JP4743601B2 (en) Moving image processing device
JP6854629B2 (en) Image processing device, image processing method
JP4380308B2 (en) Face area detection method and apparatus, program, and computer-readable storage medium storing face area detection program
JP3727768B2 (en) Computer image display method and display device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070320

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070320

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070522