JP2013533669A - Video summary instruction metadata storage - Google Patents
Video summary instruction metadata storage Download PDFInfo
- Publication number
- JP2013533669A JP2013533669A JP2013512654A JP2013512654A JP2013533669A JP 2013533669 A JP2013533669 A JP 2013533669A JP 2013512654 A JP2013512654 A JP 2013512654A JP 2013512654 A JP2013512654 A JP 2013512654A JP 2013533669 A JP2013533669 A JP 2013533669A
- Authority
- JP
- Japan
- Prior art keywords
- video
- time series
- digital video
- stored
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/87—Regeneration of colour television signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
ディジタルビデオ撮影装置で撮影されたディジタルビデオ時系列に関するビデオサマリを格納する方法であって、複数個のビデオフレームを有するディジタルビデオ時系列をディジタルビデオ撮影装置で撮影するステップと、そのディジタルビデオ時系列をプロセッサ可アクセスメモリ内に格納するステップと、格納済ディジタルビデオ時系列から一群のビデオフレームに相応するキービデオ断片を1個又は複数個特定するステップと、キービデオ断片同士を結合させることでビデオサマリを生成するステップと、そのビデオサマリに相応するビデオフレーム群を指し示すメタデータをその格納済ディジタルビデオ時系列に関連付けて格納することでプロセッサ可アクセスメモリにおけるビデオメモリの格納先を特定するステップと、を有する方法を提供する。 A method for storing a video summary relating to a digital video time series photographed by a digital video photographing apparatus, the step of photographing a digital video time series having a plurality of video frames by a digital video photographing apparatus, and the digital video time series In a processor-accessible memory, identifying one or more key video fragments corresponding to a group of video frames from a stored digital video time series, and combining the key video fragments A step of generating a summary; and a step of specifying a storage location of the video memory in the processor-accessible memory by storing metadata indicating a video frame group corresponding to the video summary in association with the stored digital video time series, and Have To provide a method.
Description
本発明はディジタルビデオ処理、特にディジタルビデオサマリを生成する方法に関する。 The present invention relates to digital video processing, and more particularly to a method for generating a digital video summary.
スチル画像に加えビデオ画像の撮影も可能なディジタル撮影装置は多々あるが、ディジタルビデオコンテンツの管理は面倒な作業になりがちである。これは、ビデオコンテンツの視覚的象徴としてビデオ画像内冒頭フレームのサムネイル画像が一般に使用されているからである。サムネイル画像ではビデオコンテンツを十分に推し量るのが難しいので、得られたビデオ画像にどのような出来事が写っているかを知るためそのビデオ画像全体を視聴せざるを得なくなる場合がある。ユーザは、長々しいビデオ画像全体を視聴することよりはそのビデオ画像の簡潔なサマリを視聴することの方を好むものである。 Although there are many digital photographing devices that can take still images as well as video images, managing digital video content tends to be a tedious task. This is because the thumbnail image of the first frame in the video image is generally used as a visual symbol of the video content. Since it is difficult to estimate the video content sufficiently with a thumbnail image, there are cases where it is necessary to view the entire video image in order to know what event is reflected in the obtained video image. Users prefer to watch a concise summary of the video image rather than watching the entire lengthy video image.
ディジタルビデオには共有に関わる現実的な問題もある。多くのディジタル撮影装置で記録速度が30乃至60フレーム/secの速度であり、空間解像度が1920×1080画素以上であるため、圧縮してもかなりのデータ量になってしまい短めのビデオ画像でも実際上共有できないことである。 Digital video also has practical problems related to sharing. In many digital photographing devices, the recording speed is 30 to 60 frames / sec and the spatial resolution is 1920 × 1080 pixels or more, so even if it is compressed, a considerable amount of data is obtained. It cannot be shared.
ビデオ編集ソフトウェアを用いたビデオ画像のマニュアル操作で、より容易に共有可能な短縮版(サマリ)を作成することも可能である。しかし、マニュアルでのビデオ編集は長々しく面倒な作業になることが多く、大抵のユーザにとって苦痛なものである。他方、自動ビデオサマリ生成アルゴリズム、即ち撮影で得られたビデオ画像を解析してそのサマリを生成するアルゴリズムも存在している。しかし、ビデオ画像の解析によるサマリ生成時にそのビデオ画像を復号する必要があるため、そうしたアルゴリズムは非常に複雑なものとなる。即ち、その種のアルゴリズムをディジタル撮影装置上で実行し、撮影で得られたばかりのビデオ画像に相応するサマリを即座に視聴に供することができない。撮影で得られたビデオ画像の迅速な確認及び共有を可能とする上で、この短所は妨げとなっている。 It is also possible to create a shortened version (summary) that can be shared more easily by manual operation of video images using video editing software. However, manual video editing is often a lengthy and tedious task and is painful for most users. On the other hand, there is an automatic video summary generation algorithm, that is, an algorithm for analyzing a video image obtained by shooting and generating the summary. However, since the video image needs to be decoded when the summary is generated by analyzing the video image, such an algorithm is very complicated. That is, when such an algorithm is executed on a digital photographing device, a summary corresponding to the video image just obtained by photographing cannot be immediately viewed. This disadvantage is hindered in allowing quick confirmation and sharing of video images obtained by shooting.
このように、ディジタル撮影装置内でビデオサマリを生成することが可能なシステム及び方法を提供すること、特にビデオ撮影終了からディジタル撮影装置上でのビデオサマリ生成までにかかる時間が短い技術を提供することが望まれている。 Thus, it is possible to provide a system and method capable of generating a video summary in a digital photographing apparatus, and in particular, to provide a technique that requires a short time from the end of video photographing to the generation of a video summary on the digital photographing apparatus. It is hoped that.
ここに、本発明に係る方法は、ディジタルビデオ撮影装置で撮影されたディジタルビデオ時系列に関するビデオサマリを格納する方法であって、
複数個のビデオフレームを有するディジタルビデオ時系列をディジタルビデオ撮影装置で撮影するステップと、
そのディジタルビデオ時系列をプロセッサ可アクセスメモリ内に格納するステップと、
格納済ディジタルビデオ時系列から一群のビデオフレームに相応するキービデオ断片を1個又は複数個特定するステップと、
キービデオ断片同士を結合させることでビデオサマリを生成するステップと、
そのビデオサマリに相応するビデオフレーム群を指し示すメタデータをその格納済ディジタルビデオ時系列に関連付けて格納することでプロセッサ可アクセスメモリにおけるビデオメモリの格納先を特定するステップと、
を有する。
Here, the method according to the present invention is a method for storing a video summary relating to a digital video time series shot by a digital video shooting device,
Photographing a digital video time series having a plurality of video frames with a digital video photographing device;
Storing the digital video time series in a processor accessible memory;
Identifying one or more key video fragments corresponding to a group of video frames from a stored digital video time series;
Generating a video summary by combining key video fragments;
Identifying the storage location of the video memory in the processor-accessible memory by storing metadata indicating a video frame group corresponding to the video summary in association with the stored digital video time series; and
Have
本発明には、ビデオサマリがメタデータとしてディジタルビデオファイル内に格納されているので、ビデオサマリを符号化して別ファイル化する必要がない、という利点がある。そのビデオサマリは、ビデオサマリを指し示すメタデータを理解できるスマートなビデオプレーヤでは簡便に利用でき、そうでないビデオプレーヤでは無視されることとなる。 The present invention has the advantage that since the video summary is stored as metadata in the digital video file, it is not necessary to encode the video summary into a separate file. The video summary can be conveniently used by smart video players that can understand the metadata that points to the video summary and ignored by video players that do not.
更に、ビデオサマリが元々のディジタルビデオ時系列に関連付けて同じディジタルビデオファイルに格納される形態には、そのディジタルビデオ時系列をコピーするときや共有化するときにビデオサマリも共にコピー乃至共有化される、という利点がある。 Furthermore, in a form in which the video summary is stored in the same digital video file in association with the original digital video time series, the video summary is copied or shared together when the digital video time series is copied or shared. There is an advantage that.
以下、本発明の好適な実施形態のうち、概ねソフトウェアプログラムとして実施されるものについて詳細に説明する。本件技術分野で習熟を積まれた方々(いわゆる当業者)には自明な通り、そうしたソフトウェアと等価なものをハードウェアで実現することもできる。画像操作アルゴリズム及びシステムは周知であるので、以下の説明では、本発明に係るシステム及び方法を構成し又はそれと直に連携するアルゴリズム及びシステムに的を絞っている。そうしたアルゴリズム及びシステムの別例や、関連する画像信号の生成乃至処理用ハードウェア乃至ソフトウェアについては、本件技術分野で既知のシステム、アルゴリズム、部材及び要素から選択できるので、具体的な図示や説明を省略する。本発明のシステムに関する以下の説明を参照すれば、本発明の実施に役立つが具体的な図示、示唆及び説明を欠くソフトウェアも、従来技術やいわゆる当業者の常識に従い実現することができよう。 In the following, a preferred embodiment of the present invention will be described in detail with respect to what is generally implemented as a software program. As obvious to those skilled in the present technical field (so-called persons skilled in the art), it is also possible to realize hardware equivalent to such software. Since image manipulation algorithms and systems are well known, the following description focuses on algorithms and systems that make up or work directly with the systems and methods of the present invention. Other examples of such algorithms and systems, and related image signal generation or processing hardware or software can be selected from systems, algorithms, members, and elements known in this technical field. Omitted. With reference to the following description of the system of the present invention, software that is useful for the implementation of the present invention but lacks specific illustrations, suggestions, and descriptions may also be implemented in accordance with the prior art and what is commonly known by those skilled in the art.
また、本発明に係る方法を実行するためのコンピュータプログラムは、磁気ディスク(例.ハードディスク,フロッピーディスク)、磁気テープ等の磁気記録媒体、光ディスク、光テープ、機械可読バーコード等の光記録媒体、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)等の固体電子記憶デバイスをはじめとするコンピュータ可読記録媒体、即ち本発明に係る方法が体現されるよう1台又は複数台のコンピュータを制御するコンピュータプログラムの格納に使用可能な諸有形デバイス乃至媒体に格納することができる。 A computer program for executing the method according to the present invention includes a magnetic disk (eg, hard disk, floppy disk), a magnetic recording medium such as a magnetic tape, an optical recording medium such as an optical disk, an optical tape, and a machine-readable barcode. Computer readable recording media including solid state electronic storage devices such as random access memory (RAM), read only memory (ROM), ie, a computer controlling one or more computers to embody the method of the present invention It can be stored in various tangible devices or media that can be used to store programs.
本発明は、本願記載の実施形態同士を組み合わせた構成をも包含する。「具体例」等との記載があるなら、その構成は本発明の実施形態のうち少なくとも1個で採用されうるものである。ある個所で「一実施形態」「具体例」と称したものと別の個所で「一実施形態」「具体例」と称したものとが同一であるとは限らない。反面、明示のある場合やいわゆる当業者にとり自明な場合以外はそれらが相互排他的な関係になるとも限らない。「方法」「諸方法」等といった単複の別には要旨限定的な意味合いはない。語「又は」は、明示がある場合や文脈上当然な場合を除き非排他的な意味合いで使用されているので、その点に留意されたい。 The present invention also includes a configuration in which the embodiments described in the present application are combined. If there is a description such as “specific example”, the configuration can be adopted in at least one of the embodiments of the present invention. What is referred to as “one embodiment” or “specific example” in one place is not necessarily the same as what is referred to as “one embodiment” or “specific example” in another place. On the other hand, they may not be mutually exclusive unless explicitly stated or obvious to a person skilled in the art. There is no meaning limited to the gist, except for “method”, “methods” and the like. It should be noted that the word “or” is used in a non-exclusive sense unless explicitly stated or contextually.
イメージングデバイス、それに付随する信号取得/処理回路、ディスプレイ等を備えたディジタルカメラは周知であるので、以下の説明では本発明に係る方法及び装置を構成し又はそれと直に連携する要素に的を絞ることにする。本願にて具体的に図示、説明されていない要素は本件技術分野で既知のものから選べばよい。説明してある実施形態のうち一部はソフトウェアの形態を採っている。本発明のシステムに関する以下の説明を参照すれば、本発明の実施に役立つが具体的な図示、示唆及び説明を欠くソフトウェアも、従来技術やいわゆる当業者の常識に従い実現することができよう。 Since digital cameras with imaging devices, associated signal acquisition / processing circuits, displays, etc. are well known, the following description focuses on the elements that make up or directly cooperate with the method and apparatus according to the present invention. I will decide. Elements not specifically shown or described in the present application may be selected from those known in the present technical field. Some of the described embodiments take the form of software. With reference to the following description of the system of the present invention, software that is useful for the implementation of the present invention but lacks specific illustrations, suggestions, and descriptions may also be implemented in accordance with the prior art and what is commonly known by those skilled in the art.
ディジタルカメラに関する以下の説明はいわゆる当業者にとり理解しやすいものであろう。自明な通り、これから説明する構成にはコスト低減、機能追加、カメラ性能向上等を目的とし様々な変形を施すことが可能である。 The following description of the digital camera will be easily understood by those skilled in the art. As is obvious, the configuration described below can be modified in various ways for the purpose of cost reduction, function addition, camera performance improvement, and the like.
図1に、本発明の一実施形態に係りビデオ撮影が可能なディジタルカメラ10を有するディジタル写真システムのブロック構成を示す。好ましくも、このカメラ10は電池駆動式でその携帯が可能であり、小型であるため撮影時や画像リビュー時にユーザが容易に手に持つことができる。カメラ10による撮影で得られたディジタル画像はファイル化され画像メモリ30内に格納される。なお、本願では、「ディジタル画像」「ディジタル画像ファイル」等の語を、スチル画像かビデオ画像かを問わず種々のディジタル画像乃至そのファイルを包含する意味で使用している。
FIG. 1 shows a block configuration of a digital photo system having a
本実施形態のディジタルカメラ10はビデオ撮影機能及びスチル撮影機能を併有している。本発明は、ビデオしか撮影できないディジタルビデオカメラの形態や、ディジタル音楽プレーヤ(例.MP3プレーヤ)、携帯電話、GPS受信機、携帯情報端末(PDA)その他の機能を併有する形態でも実施することができる。
The
ディジタルカメラ10にはレンズ4及びそれに付随する可調絞り及び可調シャッタ6が備わっている。本実施形態ではレンズ4がズームレンズであり、それを制御する手段としてズーム/合焦モータドライバ8が設けられている。レンズ4は図示しない光景からの光をイメージセンサ14上、具体的には単一チップ型のカラーCCDイメージセンサやカラーCMOSイメージセンサの上に合焦させる。このレンズ4は、センサ14上に光景の像を発生させうる光学系の一種である。本発明は、このほか、固定焦点長レンズを有しその焦点が可変又は固定の光学系を使用する形態でも実施することができる。
The
イメージセンサ14の出力はアナログ信号プロセッサ(ASP)及びアナログディジタル(A/D)コンバータ16にてディジタルデータに変換されバッファメモリ18内に一時的に格納される。メモリ18内に一時格納された画像データはファームウェアメモリ28内の埋込ソフトウェアプログラム、例えばファームウェアに従いプロセッサ20によって操作される。本実施形態では、ソフトウェアプログラムを恒久的に保持するROM型のメモリ28が使用されているが、その内容修正が可能なメモリ例えばフラッシュEPROMをメモリ28として使用する形態でも、本発明を実施することができる。後者なら、有線インタフェース38やワイヤレスモデム50を介し外部装置を接続し、その接続を通じメモリ28内のソフトウェアプログラムを更新することや、イメージセンサ校正データ、ユーザ設定データ等、カメラ電源オフ時でも失いたくないデータの格納にメモリ28を使用することができる。また、図示しないが、本実施形態ではプロセッサ20にプログラムメモリが付設されており、メモリ28内のソフトウェアプログラムはそこにコピーされた上でプロセッサ20により実行される。
The output of the
ご理解頂ける通り、このプロセッサ20には様々な機能が備わっている。それらの機能の実現には、1個又は複数個のプログラマブルプロセッサ例えばディジタル信号プロセッサ(DSP)、1個又は複数個のカスタム回路例えばディジタルカメラ向けカスタム集積回路(IC)、それらプログラマブルプロセッサ及びカスタム回路の組合せ等を使用することができる。同じくご理解頂ける通り、図1に示した諸部材の一部又は全てを共通データバス経由でプロセッサ20に接続することもできる。例えば、プロセッサ20、バッファメモリ18、画像メモリ30及びファームウェアメモリ28の間を共通データバスで接続する構成にするとよい。
As can be understood, the
処理された画像データは画像メモリ30内に格納される。自明な通り、このメモリ30は、リムーバブルフラッシュメモリカード、内蔵フラッシュメモリチップ、磁気メモリ、光学メモリ等をはじめ、いわゆる当業者にとり既知の諸形態を採りうる。メモリ30を、内蔵フラッシュメモリチップ,リムーバブルフラッシュメモリカード対応標準インタフェース併有型の構成にしてもよい。メモリカードとしてはセキュアディジタル(SD(登録商標))カード、マイクロSD(登録商標)カード、コンパクトフラッシュ(CF(登録商標))カード、マルチメディアカード(MMC)、xD(登録商標)カード、メモリスティック等を使用することができる。
The processed image data is stored in the
また、イメージセンサ14は、ASP及びA/Dコンバータ16の動作に同期するよう、タイミング発生器12に発する種々のクロック信号例えばローセレクト信号や画素セレクト信号に従い制御される。この例ではセンサ14のサイズが12.4メガ画素(4088×3040画素)であるので、約4000×3000画素のスチル画像データを生成することができる。また、通例に倣いセンサ14上に色フィルタアレイが重畳され、その色が異なる画素群が混在する画素アレイが形成されているので、このセンサ14でカラー画像を得ることができる。その画素アレイにおける画素色配列は様々なパターンを採りうる。その一例は、本願出願人を譲受人とする特許文献6(発明者:Bayer,名称:カラーイメージングアレイ(Color imaging array),この参照を以てその内容を本願に繰り入れる)に記載の如く、周知のベイヤ色フィルタアレイが形成される画素色配列パターンである。別例としては、本願出願人を譲受人とする特許文献25(発明者:Compton及びHamilton,出願日:2007年7月28日,名称:高光感度イメージセンサ(Image Sensor with Improved Light Sensitivity),この参照を以てその内容を本願に繰り入れる)に記載の画素色配列パターンがある。これらはいずれも例であり、画素色配列パターンとして使用可能なパターンは多様である。
The
ご理解頂けるように、これらイメージセンサ14、タイミング発生器12並びにASP及びA/Dコンバータ16は、互いに別々のICとして製造することも、CMOSイメージセンサでの通例に倣い単一のICとして製造することも可能である。そうしたICに、図1に示した機能、例えばプロセッサ20によって担われている機能の一部を担わせることもできる。
As can be understood, the
タイミング発生器12によるイメージセンサ14の駆動モードとしては、まず、低解像度画像データのモーション付時系列が生じる第1モードがある。ビデオ画像撮影時やスチル撮影に先立つプリビュー・構図検討時には、1280×720画素のHD(登録商標)解像度画像データ、640×480画素のVGA解像度画像データ等、センサ14の解像度に比べかなりカラム数及びロー数が少ないセンサ画像データがこのモード下で生成される。
As a drive mode of the
プリビュー向けのセンサ画像データには、同色隣接画素間で画素値を結合させる処理、一部画素値を無視する処理、ある色について画素値同士を結合させる一方他の色について画素値を無視する処理等が施されうる。本願出願人を譲受人とする特許文献15(発明者:Parulski, et al.,名称:ビデオ画像プリビュー中にスチル撮影を開始する電子カメラ(Electronic Camera for Initiating Capture of Still Images while Previewing Motion Images),この参照を以てその内容を本願に繰り入れる)に記載の処理を施すようにしてもよい。 For sensor image data for preview, processing for combining pixel values between adjacent pixels of the same color, processing for ignoring some pixel values, processing for combining pixel values for one color while ignoring pixel values for other colors Etc. can be applied. Patent Document 15 (inventor: Parulski, et al., Name: an electronic camera for initiating capture of still images while previewing motion images) that starts still shooting during video image preview; You may make it perform the process as described in this application).
タイミング発生器12によるイメージセンサ14の駆動モードとしては、次に、高解像度スチル画像データが生じる第2モードがある。その結果生じる最終的なセンサ画像データは、例えば4000×3000画素の解像度を有する12メガ画素の高解像度画像データである。光景輝度が高い場合はセンサ14内諸画素の画素値が最終画像データとして使用されるが、光景輝度が低い場合は信号強度ひいてはセンサ14のISO(登録商標)速度を増強すべくセンサ14内類色画素間で画素値をビニング(結合)したものが最終画像データとして使用される。
As a driving mode of the
プロセッサ20は、その際、焦点長設定が適正になり光景からの光がイメージセンサ14上に合焦するよう制御信号を発してズーム/合焦モータドライバ8を制御する。センサ14の露光レベルは、可調絞り及び可調シャッタ6によるf/ナンバー及び露光時間の制御、タイミング発生器12によるセンサ14の露光周期の制御、並びにASP及びA/Dコンバータ16による利得設定即ちISO(登録商標)速度設定の制御によって制御される。プロセッサ20は光景を照らすべくフラッシュ2も制御する。
At that time, the
上掲の第1モードでは、本願出願人を譲受人とする特許文献12(発明者:Parulski et al.、名称:プログレッシブスキャンイメージセンサ上に画像を高速自動合焦させる電子カメラ(Electronic Camera with Rapid Automatic Focus of an Image upon a Progressive Scan Image Sensor),この参照を以てその内容を本願に繰り入れる)記載の通り、ディジタルカメラ10のレンズ4をスルーザレンズ方式で自動合焦させることができる。これは、ズーム/合焦モータドライバ8を用いレンズ4の焦点位置を至近焦点位置から無限遠焦点位置に至る範囲内で様々に変化させつつ、イメージセンサ14で撮影された画像の中央領域でシャープネス値がピークを呈する焦点位置即ち最善焦点位置を、プロセッサ20にて判別することで実行される。この最善焦点位置に対応する焦点距離は、適切な光景モードの自動設定等を含め幾通りかの目的で事後使用できることから、他のレンズ設定情報及びカメラ設定情報と共に画像ファイル内にメタデータとして格納される。
In the first mode described above, Patent Document 12 (inventor: Parulski et al., Name: progressive scan image sensor) that automatically assigns an image onto a progressive scan image sensor (Electronic Camera with Rapid). As described in (Automatic Focus of an Image upon a Progressive Scan Image Sensor), the contents of which are incorporated herein by reference), the lens 4 of the
プロセッサ20は、ディスプレイメモリ36内に一時格納されていた低解像度カラー画像や作成したメニューを画像ディスプレイ32上に表示させる。このディスプレイ32は能動マトリクスカラー液晶ディスプレイ(LCD)であるが、有機発光ダイオード(OLED)ディスプレイをはじめ他種ディスプレイを使用することもできる。ディジタルカメラ10からのビデオ画像出力信号は、ビデオインタフェース44を介しビデオディスプレイ46、具体的にはフラットパネルHDTVディスプレイに供給される。ビデオ撮影モードやプリビューモードでは、バッファメモリ18から読み込まれたディジタル画像データがプロセッサ20によって操作され、一連のモーションプリビュー画像が画像ディスプレイ32上に原則としてカラーで表示される。画像表示モードでは、画像メモリ30内に格納されているディジタル画像ファイル内の画像データに基づき画像ディスプレイ32上に画像が表示される。
The
その画像ディスプレイ32上には、ユーザ用コントローラ34を介したユーザ入力で操作可能なグラフィカルユーザインタフェースが表示される。コントローラ34は、ビデオ撮影モード、スチル撮影モード、画像表示モード等をはじめとする諸カメラモードの設定や、スチル撮影開始、ビデオ記録開始等の指示に使用される。本実施形態では、コントローラ34の一種たるシャッタボタンをユーザが半押しすると上掲の第1モードに移行してスチル画像のプリビューが可能となり、全押しすると第2モードに移行してスチル撮影が実行される。コントローラ34は、更に、カメラへの電源投入、レンズ4の操作及び撮影プロセスの起動にも使用される。コントローラ34は、ボタン、ロッカスイッチ、ジョイスティック、ロータリダイアル、その任意の組合せ等のほか、ディスプレイ32に重畳されたタッチスクリーン等の形態を採りうる。ステータスディスプレイや画像ディスプレイを幾つか追加することもできる。
On the
ユーザ用コントローラ34を用いカメラをタイマーモードに設定することもできる。タイマーモードの許では、ユーザがシャッタボタンを全押しした後、若干の遅延時間例えば10secを経た後プロセッサ20によるスチル撮影が開始される。
The camera can also be set to the timer mode using the user controller 34. In the permission of the timer mode, after the user fully presses the shutter button, still shooting by the
プロセッサ20には、更に、マイクロホン24から音声信号を受け取りスピーカ26に音声信号を供給するオーディオコーデック22が接続されている。これらの部材は、オーディオトラックの記録・再生時だけでなく、ビデオ画像時系列、スチル画像等の記録・再生にも使用可能である。ディジタルカメラ10をカメラ付携帯電話等の多機能デバイスとして構成し、マイクロホン24及びスピーカ26を通話手段として使用することも可能である。
The
本実施形態ではスピーカ26がユーザインタフェースの一部としても使用される。具体的には、ユーザ用コントローラ34が操作されたことや、特定のモードが指定されたことが、スピーカ26に発する種々の可聴信号で通知される。本実施形態では、更にマイクロホン24、オーディオコーデック22及びプロセッサ20を用い音声認識が実行される。従って、ユーザは、コントローラ34の操作ではなく音声コマンドによってプロセッサ20に入力することができる。スピーカ26は、更に、電話コールの到来をユーザに通知する手段等としても使用される。この通知には、ファームウェアメモリ28内に格納されている標準的なリングトーンが使用される。ワイヤレスネットワーク58経由で画像メモリ30内にカスタムリングトーンをダウンロード済であれば、そのカスタムリングトーンを使用することもできる。更に、図示しないが、電話コールの到来をサイレントモード即ち非可聴モードで通知できるよう振動デバイスを設けてもよい。
In the present embodiment, the
本実施形態のディジタルカメラ10は加速度計27を備えているので、カメラモーションに関する情報をそこから得ることができる。好ましいことに、この加速度計27は、直交三軸それぞれについて線加速度及び角加速度を検知できるものであるので、合計6次元分の情報を取得することができる。
Since the
プロセッサ20は、また、イメージセンサ14から得られる画像データに更なる処理を施してsRGB(登録商標)画像データに変換し、それを圧縮して最終的な画像ファイル、例えば周知のExif(登録商標)−JPEG形式による画像ファイルを生成し、そのファイルを画像メモリ30内に格納する。
The
ディジタルカメラ10は、有線インタフェース38を介しインタフェース/充電器48、ひいては家庭内又は事務所内のデスクトップ乃至ポータブルコンピュータ40に接続することが可能である。この例では、そのインタフェース38として周知のUSB2.0インタフェース仕様に適合するものが使用されている。そのため、インタフェース/充電器48からインタフェース38を介し図示しないカメラ10内二次電池群へと電力を供給することができる。
The
ディジタルカメラ10は、また、ワイヤレスモデム50を介し無線周波数帯52経由でワイヤレスネットワーク58に接続することが可能である。モデム50が準拠する無線インタフェースプロトコルは、例えば、周知のBluetooth(登録商標)無線インタフェース、周知のIEEE802.11無線インタフェース等である。コンピュータ40に届いた画像は、そこからインターネット70経由でフォトサービスプロバイダ72、例えばKodak(登録商標)EasyShare(登録商標)ギャラリに登録することができる。プロバイダ72に登録された画像には、図示しない他種装置からもアクセスすることができる。
The
本発明は、ワイヤレスモデム50がワイヤレスリンク等の無線周波数リンクを介し図示しない携帯電話網例えば3GSM(登録商標)網に接続し、ディジタルカメラ10内のディジタル画像ファイルをインターネット70上に送出する形態でも実施することができる。送出されたディジタル画像ファイルはコンピュータ40やフォトサービスプロバイダ72で受信される。
In the present invention, the
次に、図2を参照しつつ本発明の一実施形態に係る方法について説明する。本方法では、まず、ディジタルビデオ撮影装置例えばディジタルカメラ10を用い、複数個のビデオフレームを有するディジタルビデオ時系列がディジタルビデオ時系列撮影ステップ210にて撮影される。
Next, a method according to an embodiment of the present invention will be described with reference to FIG. In this method, first, a digital video time series having a plurality of video frames is photographed in a digital video time
ディジタルビデオ時系列撮影時には特徴量判別ステップ220、即ちビデオフレーム群又はその一部の解析を通じ一通り又は複数通りの特徴量を判別するステップも実行される。その判別で求まる特徴量としては、まず、ビデオフレームの色特性やビデオフレーム内顔存否をはじめ、ビデオ属性に関連する特徴量がある。連続ビデオフレーム間大域モーション量や、連続ビデオフレーム内対応要素間局所モーション量をはじめ、モーションに関連する特徴量も求まる。大域モーションが一般に撮影装置の動きに対応するのに対し、局所モーションは光景内被写体の動きに対応している。いわゆる当業者にはご理解頂けるように、上掲の特徴量は一例であり、ビデオフレームに対する解析を通じて他種特徴量を判別することもできる。
At the time of digital video time series shooting, a feature
同ステップ220で判別可能な特徴量としてはオーディオ関連の特徴量もある。例えば、時間領域における信号強度、特定周波数帯域における信号強度等といった特徴量は、ディジタルビデオ時系列撮影時にマイクロホン24を介し録音され、オーディオコーデック22で処理された1個又は複数個のオーディオサンプルを、解析に供することで判別することができる。
The feature quantities that can be discriminated in
同ステップ220で判別可能な特徴量としては装置設定関連の特徴量もある。例えば、ズーム/合焦モータドライバ8の制御によるズームレンズ4のポジション調整のため、ユーザ用コントローラ34経由でユーザから与えられた指令、といった特徴量である。この種の特徴量は、ディジタルビデオ時系列撮影時におけるディジタルビデオ撮影装置の設定を解析することで判別できる。ディジタルズームでも像の倍率が変わるので、ディジタルズームを別途特徴量として判別するようにしてもよい。
The feature quantity that can be discriminated in
同ステップ220で判別可能な特徴量としては、ディジタルカメラ10の動きに関する計測結果を示す特徴量もある。この種の特徴量は、例えば、ディジタルビデオ時系列撮影時に加速度計27から得られた加速度計データを解析することで判別でき、ビデオフレームデータに基づき導出されるモーション関連特徴量の補強乃至代替として使用することができる。
The feature quantity that can be discriminated in
同ステップ220で判別可能な特徴量としては、プロセッサ20でのビデオ符号化処理適用によって生じるデータの解析結果もある。解析対象データの例としては、ビデオ符号化処理中に実行されるモーション推定処理にて生じるモーションベクトル情報等がある。大抵のビデオ符号化処理では、そうしたモーション推定処理が通常処理鎖の一部としてルーチン的に実行される。
The feature quantity that can be discriminated in
ビデオフレーム毎の特徴量判別が済んだ後は、ディジタルビデオ時系列圧縮ステップ230にてビデオフレームが圧縮される。使用するビデオ圧縮アルゴリズムは、MPEG規格、H.263規格その他、いわゆる当業者にとり周知の規格に準拠したもの等である。圧縮が済んだビデオフレームはコンテナ、具体的にはApple(登録商標)QuickTime(登録商標)で提供されるビデオファイル用のファイルフォーマットラッパによって収容される。
After the feature amount determination for each video frame is completed, the video frame is compressed in the digital video time
圧縮版ディジタルビデオ時系列格納ステップ240では、圧縮が済んだディジタルビデオ時系列がプロセッサ可アクセスメモリ内例えば画像メモリ30内に格納される。格納される圧縮版ディジタルビデオ時系列はビデオ情報やオーディオ情報を含むものである。
In the compressed version digital video time
特徴量判別ステップ220で判別された特徴量は、例えば、格納される圧縮版ディジタルビデオ時系列に係るメタデータとして格納される。そのメタデータの格納には、例えば、Apple(登録商標)QuickTime(登録商標)ファイルフォーマット仕様で規定されているユーザデータアトム等を使用することができる。
The feature quantity discriminated in the feature
これに代え、圧縮状態で格納されるディジタルビデオ時系列に関連付けられた別のファイル内に、特徴量判別ステップ220で判別された特徴量を格納するようにしてもよい。
Alternatively, the feature quantity determined in the feature
また、ディジタルビデオ時系列を圧縮状態で格納する際に、特徴量判別ステップ220で判別された特徴量が恒久格納型メモリに格納されないようにしてもよい。この場合、その特徴量はビデオサマリ生成アルゴリズム終了時点で破棄される。
Further, when the digital video time series is stored in a compressed state, the feature amount determined in the feature
こうしてビデオ撮影動作及び圧縮版ディジタルビデオ時系列の格納が済んだ後、キービデオ断片特定ステップ250では、そのディジタルビデオ時系列を代表するキービデオ断片が特定される。即ち、プロセッサを用い諸特徴量を自動解析することで、格納した圧縮版ディジタルビデオ時系列を伸張することなく、幾つかのディジタルビデオ時系列内ビデオフレームを含むキービデオ断片が1個又は複数個特定される。キービデオ断片は、原則として、そのディジタルビデオ時系列内で連なっているビデオフレーム複数個の集まりであるので、始点フレーム番号と、終点フレーム番号又はキービデオ断片長との組合せで、個々別々に特定することができる。
After the video shooting operation and the storage of the compressed digital video time series are thus completed, in the key video
関連する諸特徴量に基づきビデオ時系列内キービデオ断片を特定する手法としては、例えば、本件技術分野既知の諸手法が使用される。その一例は、まずキービデオフレームを幾つか特定し、個々のキービデオフレームを包含するようビデオ時系列の一部を選択することによって、個々のキービデオ断片を生成する手法である。特許文献26(発明者:Luo et al.,この参照を以て本願に繰り入れる)に記載の如く、ディジタルモーション推定で算出されたビデオ内モーションに基づきキービデオフレームを選択する手法や、特許文献4(発明者:Luo et al.,この参照を以て本願に繰り入れる)に記載の如く、そのビデオ撮影装置に付随する加速度計からデータとして得られるビデオ内モーションの特徴に基づきキービデオフレームを選択する手法は、本発明の実施に当たり、特徴量判別結果に基づくキービデオ断片の特定に利用可能である。 As a technique for specifying the key video fragment in the video time series based on the related feature values, for example, various techniques known in this technical field are used. One example is a technique for generating individual key video fragments by first identifying several key video frames and selecting a portion of the video time series to encompass the individual key video frames. As described in Patent Document 26 (inventor: Luo et al., Which is incorporated herein by reference), a technique for selecting a key video frame based on an in-video motion calculated by digital motion estimation, or Patent Document 4 (Invention). (Luo et al., Which is incorporated herein by reference), a method for selecting a key video frame based on the characteristics of motion in video obtained as data from an accelerometer associated with the video photographing apparatus is described in this book. In carrying out the invention, the present invention can be used to specify a key video fragment based on a feature amount discrimination result.
格納済の圧縮版ディジタルビデオ時系列に関連付けられた別のファイル内に特徴量が格納されている場合は、キービデオ断片特定ステップ250で解析すべき特徴量がそのファイルから読み込まれる。
If the feature quantity is stored in another file associated with the stored compressed digital video time series, the feature quantity to be analyzed in the key video
格納済の圧縮版ディジタルビデオ時系列に係るメタデータとして特徴量が格納されている場合は、キービデオ断片特定ステップ250にて、格納済の圧縮版ディジタルビデオ時系列に係るビデオフレーム群を伸張することなく、解析すべき特徴量がその圧縮版ディジタルビデオ時系列に係るファイルから抽出される。格納済の圧縮版ディジタルビデオ時系列に係るメタデータとして格納された特徴量の抽出が、その圧縮版ディジタルビデオ時系列の伸張と見なされるべきではないことに留意されたい。格納済の圧縮版ディジタルビデオ時系列を伸張することに該当するのは、寧ろ、圧縮版ディジタルビデオ時系列に係る一連のビデオフレームを再構築する際に使用される圧縮済ビットストリーム内データ、例えばビデオ情報やヘッダ情報を復号することである。
When the feature quantity is stored as metadata related to the stored compressed digital video time series, the video frame group related to the stored compressed digital video time series is expanded in the key video
本発明に備わる利点の一つは、格納済の圧縮版ディジタルビデオ時系列を伸張することなくキービデオ断片を特定できることである。そのため、キービデオ断片の特定やそれに後続するビデオサマリの生成が、撮影動作の終了からあまり間をおかずに終了する。格納済の圧縮版ディジタルビデオ時系列から個別のビデオフレームを抽出する手段として伸張が使用される従来の手法では、伸張タスクの実行に必要な時間の長さが桎梏となっていた。 One advantage of the present invention is that key video fragments can be identified without decompressing the stored compressed digital video time series. For this reason, the identification of the key video fragment and the generation of the video summary that follows the key video fragment are completed without much time from the end of the shooting operation. In conventional techniques where decompression is used as a means of extracting individual video frames from a stored compressed digital video time series, the length of time required to perform the decompression task has become a problem.
キービデオ断片の特定は、そのディジタルビデオ時系列の撮影時に判別された特徴量に関する解析の結果に全面的に依拠して実行することも、格納済の圧縮版ディジタルビデオ時系列から抽出された情報を解析で得た特徴量と併用して実行することも可能である。後者の場合、格納済の圧縮版ディジタルビデオ時系列に含まれる情報を部分的に復号しなければならなくなることもあり得る。 The identification of the key video fragment can be performed entirely depending on the result of the analysis on the feature amount determined at the time of shooting the digital video time series, or the information extracted from the stored compressed digital video time series. Can be executed in combination with the feature value obtained by the analysis. In the latter case, the information contained in the stored compressed digital video time series may have to be partially decoded.
例えば、格納済の圧縮版ディジタルビデオ時系列から抽出されたオーディオ情報を解析で得た特徴量と併用してキービデオ断片を特定する場合である。ただ、オーディオ情報は、圧縮版ディジタルビデオファイル全体に占める比率が小さいのが普通であり、ビデオフレームを構成する画素データの伸張に比べ迅速に抽出することができる。また、オーディオ属性関連の特徴量を撮影時に生成できなかった場合や、オーディオ属性関連その他の特徴量の判別並びに撮影したビデオの処理及び符号化に利用可能な期間がプロセッサの情報処理サイクル内になかった場合でも、格納済の圧縮版ディジタルビデオ時系列からオーディオ情報を抽出すれば、そのオーディオ情報をキービデオ断片特定に役立てることができる。これは、速度・性能間の折衷を表している。即ち、オーディオ情報を利用することで、キービデオ断片特定に要する処理時間の全体的長期化と引替に、キービデオ断片特定ステップ250の性能を高めることができる。
For example, a case where a key video fragment is specified by using audio information extracted from a stored compressed digital video time series together with a feature amount obtained by analysis. However, the audio information generally has a small ratio to the entire compressed digital video file, and can be extracted more quickly than the expansion of the pixel data constituting the video frame. Also, if audio feature-related feature values could not be generated at the time of shooting, or there was no period available for processing of audio video-related video processing and encoding, as well as audio attribute-related and other feature values. Even if the audio information is extracted from the stored compressed digital video time series, the audio information can be used for key video fragment identification. This represents a compromise between speed and performance. That is, by using the audio information, the performance of the key video
格納済の圧縮版ディジタルビデオ時系列から抽出されたビデオ情報を解析で得た特徴量と併用してキービデオ断片を特定する場合も同様である。ビデオ時系列全体を伸張してしまうと、ビデオ属性関連特徴量を撮影時に判別するメリットが概ね打ち消されてしまうので、格納済の圧縮版ディジタルビデオ時系列を構成するビデオフレームのうち復号されるものの個数を可能な限り少数にするのが望ましい。いわゆる当業者にはご理解頂けるように、他フレームに対し独立に符号化されているフレームであれば、そのフレームを圧縮版ディジタルビデオ時系列から効率的に復号することができる。これも、速度・性能間の折衷を表している。即ち、ビデオ情報を利用することで、キービデオ断片特定に要する処理時間の全体的長期化と引替に、キービデオ断片特定ステップ250の性能を高めることができる。
The same applies to the case where the key video fragment is specified by using the video information extracted from the stored compressed digital video time series together with the feature amount obtained by the analysis. If the entire video time series is expanded, the merit of discriminating the video attribute-related feature amount at the time of shooting is largely negated, so that the video frames constituting the stored compressed digital video time series are decoded. It is desirable to make the number as small as possible. As can be understood by a so-called person skilled in the art, if a frame is encoded independently of other frames, the frame can be efficiently decoded from the compressed digital video time series. This also represents a compromise between speed and performance. That is, by using the video information, the performance of the key video
キービデオ断片特定ステップ250の実行に当たり、ユーザ用コントローラ34を介したユーザ入力を受け取り、それに応じビデオサマリの諸属性を制御するようにしてもよい。例えば、ビデオサマリの長さ、個別のキービデオ断片の最短時間長、キービデオ断片の総数等に関しユーザから指定を受ける形態である。
In executing the key video
キービデオ断片特定ステップ250にて、本願出願人を譲受人とする係属中の米国特許出願第12/786471号(発明者:Deever,名称:キービデオフレーム判別方法(Method for Determining Key Video Frames))に記載の手法を用いるようにしてもよい。この手法は、ディジタルビデオ時系列を解析することで重要度の時間変化を導出し、その結果に基づきそのディジタルビデオ時系列の時間歪曲表現を生成し、その時間歪曲表現を複数個の歪曲等長期間へと分割し、各歪曲等長期間内のビデオフレームを解析することで当該歪曲等長期間毎にキービデオフレームを選択する、というものである。重要度はそのディジタルビデオ時系列に備わる大域モーション、局所モーション等の特性を反映した情報、特に特徴量判別ステップ220における特徴量判別の結果に基づき導出される情報である。時間歪曲表現は、ディジタルビデオ時系列内ビデオフレームのうちあるものを長め、他のあるものを短めにする、といった具合に加重した表現である。キービデオフレーム選択は、特徴量判別ステップ220にて判別された特徴量のうち対応する歪曲等長期間内のビデオフレーム群に係るものを解析することで行うのが望ましい。例えば、ズームイン動作終了から間もない、その中央領域における局所モーションの程度が中庸である等といった条件を満たすビデオフレームがキーフレームとして選択される。
In the key video
キービデオフレーム判別後は、個々のキービデオフレームの前後にある一群のビデオフレームを選択することで個々のキービデオ断片を特定すればよい。具体的には、キービデオフレームの前2secから後2secまで、合計4secの期間に属するビデオフレーム群を選択することでキービデオ断片を特定すればよい。 After discriminating key video frames, individual key video fragments may be specified by selecting a group of video frames before and after each key video frame. Specifically, a key video fragment may be specified by selecting a video frame group belonging to a total period of 4 seconds from 2 seconds before and 2 seconds after the key video frame.
キービデオ断片は、また、キービデオフレームに対しランク付けを行い、最高ランクキービデオフレームに関連する一群のキービデオフレームのみでキービデオ断片を生成する、といった手法でも特定することができる。キービデオフレームに対するランク付けは、ディジタルビデオ時系列を解析することでカメラ移動パターンを判別し、そのカメラ移動パターンに基づきキービデオフレームのランクを決めることで行うことができる。例えば、特徴量判別ステップ220で判別された特徴量のうち大域モーションに関連するものを解析することで、そのディジタルビデオ時系列におけるカメラ固定領域の変遷を示す大域モーション軌跡を得ることができる。ビデオ撮影の全過程長に比し高い比率でカメラが固定されていた領域、即ち高頻度固定領域に対応するビデオフレームには、高いランクが付される。このランク付け処理は各周回毎に最高ランクキービデオフレームを選択する反復的な処理として実行すればよく、またその処理の個々の周回では既選択キービデオフレームのそれと同じ固定領域を表すキービデオフレームに比しそれ以外の固定領域を表すキービデオフレームを優先的に選択するようにすればよい。キービデオフレームのランク付け後は、最高ランクキービデオフレームが包含されるようにキービデオ断片を特定すればよい。
The key video fragments can also be identified in such a manner that the key video frames are ranked and only the group of key video frames associated with the highest rank key video frame is generated. Ranking for the key video frames can be performed by determining the camera movement pattern by analyzing the digital video time series and determining the rank of the key video frame based on the camera movement pattern. For example, by analyzing the features related to the global motion among the features determined in the
上掲の通り、キービデオ断片は、各キービデオフレームの前から後にかけて一群のビデオフレームを選択することで特定することができる。これに代え、ビデオサマリの総時間長やキービデオ断片の最短許容時間長に関する条件を設定し、それらの条件を満たすように選択することでもキービデオ断片を特定することができる。更なる条件を課すこと、例えば話者音声がそのキービデオ断片の開始部分や終了部分で途切れない、といった条件を課すこともできる As described above, a key video fragment can be identified by selecting a group of video frames from before to after each key video frame. Alternatively, the key video fragment can be identified by setting conditions relating to the total time length of the video summary and the minimum allowable time length of the key video fragment, and selecting to satisfy these conditions. It is possible to impose further conditions, for example that the speaker's voice is not interrupted at the beginning or end of the key video fragment.
キービデオ断片特定後、ビデオサマリ生成ステップ260ではビデオサマリが生成される。即ち、キービデオ断片同士を結合させてひとまとまりにすることでビデオサマリが生成される。本実施形態では、ディジタルビデオ時系列における登場順序に合致する順序でキービデオ断片同士が結合される。
After identifying the key video fragment, a video
ビデオサマリ表現子格納ステップ270では、そのビデオサマリの表現子がプロセッサ可アクセスメモリ内に格納される。プロセッサ可アクセスメモリ内に格納されるビデオサマリ表現子は、例えば、ビデオサマリを組成するディジタルビデオ時系列内ビデオフレーム群を指し示すフレーム指示メタデータである。フレーム指示メタデータは格納済の圧縮版ディジタルビデオ時系列と関連付けつつ格納することが可能なデータであり、ビデオサマリを組成する諸キービデオ断片の始点及び終点フレーム等を指し示している。この形態であれば、ビデオサマリ表現子の格納に必要な物理メモリ量を、フレーム指示メタデータの格納に必要なそれに抑えることができる。
In the video summary
プロセッサ可アクセスメモリ内に格納されるビデオサマリ表現子は、或いは、そのビデオサマリに対応する融合版ビデオ時系列である。これは、特定されたキービデオ断片を組成するビデオフレーム群を格納済の圧縮版ディジタルビデオ時系列から抽出し、それらビデオフレーム同士を融合させることで、新規に生成することができる。その際には、ときとして、圧縮版ディジタルビデオ時系列を部分的に復号することや、融合版ビデオ時系列を圧縮して圧縮版ビデオ時系列を生成することが必要になる。融合版ビデオ時系列にビデオデータだけでなくオーディオデータをも含めるには、オーディオデータを圧縮版ディジタルビデオ時系列から抽出する必要もある。 The video summary representation stored in the processor-accessible memory is alternatively a fused video time series corresponding to the video summary. This can be newly generated by extracting a video frame group composing the specified key video fragment from the stored compressed digital video time series and fusing the video frames together. In that case, it is sometimes necessary to partially decode the compressed version of the digital video time series or to compress the fused version of the video time series to generate a compressed version of the video time series. In order to include not only video data but also audio data in the fused video time series, it is also necessary to extract the audio data from the compressed digital video time series.
生成された圧縮版ビデオサマリをプロセッサ可アクセスメモリ内に格納する際には、対応する圧縮版ディジタルビデオ時系列のそれとは別のディジタルビデオファイル内にその圧縮版ビデオサマリを格納する形態を採ることができる。この形態ではそのディジタルビデオファイルがビデオサマリ表現子となるので、ビデオサマリ表現子を元々の圧縮版ディジタルビデオ時系列とは独立に視聴乃至共有することが可能である。ビデオサマリ表現子たるディジタルビデオファイルのフォーマットは、標準的なビデオプレーヤで再生可能なフォーマットにするのが望ましい。 When the generated compressed video summary is stored in the processor-accessible memory, the compressed video summary is stored in a digital video file different from that of the corresponding compressed digital video time series. Can do. In this form, the digital video file becomes a video summary expression, so that the video summary expression can be viewed or shared independently of the original compressed digital video time series. It is desirable that the format of the digital video file as a video summary expression be a format that can be played back by a standard video player.
抽出されたビデオフレーム群を圧縮して圧縮版ビデオサマリを生成する際には、例えば、そのビデオフレーム群を再サンプリングすることで空間解像度を従前の値から新たな値へと変化させ、新たな空間解像度に係るビデオフレーム群を圧縮して圧縮版ビデオサマリを生成するのが望ましい。この再サンプリングは、高空間解像度で撮影されたビデオを共有する際に有益である。何故なら、含まれるビデオフレームの個数が少なくそのビデオフレームの空間解像度も低い圧縮版ビデオサマリ、即ち圧縮版ディジタルビデオ時系列よりも小サイズで共有しやすいビデオサマリが得られるからである。低空間解像度ビデオサマリは高解像度ビデオサマリ全体を伸張することなく生成することができる。伸張が必要なのは、ビデオサマリの生成に必要なビデオフレームのみである。 When generating a compressed video summary by compressing the extracted video frames, for example, by re-sampling the video frames, the spatial resolution is changed from the previous value to a new value, and a new It is desirable to generate a compressed video summary by compressing a video frame group related to the spatial resolution. This resampling is useful when sharing videos taken at high spatial resolution. This is because a compressed version video summary with a small number of video frames included and a low spatial resolution of the video frames, that is, a video summary that is smaller in size and easier to share than a compressed version digital video time series can be obtained. A low spatial resolution video summary can be generated without stretching the entire high resolution video summary. Only the video frames needed to generate the video summary need to be decompressed.
同様に、抽出されたビデオフレーム群を圧縮して圧縮版ビデオサマリを生成する際に、そのビデオサマリを組成するビデオフレームを時間軸沿いに再サンプリングして、時間解像度を従前の値から新たな値へと変化させることもできる。 Similarly, when the extracted video frames are compressed to generate a compressed video summary, the video frames that compose the video summary are resampled along the time axis, and the time resolution is changed from the previous value to a new value. It can also be changed to a value.
図3に、本発明の他の実施形態に係るビデオサマリ生成方法として、生成されたビデオサマリをユーザがプリビューすること、並びに設定調整を通じユーザがビデオサマリ生成結果の更新を要求することが可能な方法を示す。ディジタルビデオ時系列撮影ステップ210、特徴量判別ステップ220、ディジタルビデオ時系列圧縮ステップ230、圧縮版ディジタルビデオ時系列格納ステップ240、キービデオ断片特定ステップ250、ビデオサマリ生成ステップ260及びビデオサマリ表現子格納ステップ270はいずれも図2を参照して説明したものと同じ要領で実行されるが、本実施形態では、ビデオサマリ生成ステップ260にて生成されたビデオサマリがその格納に先立ちビデオサマリ表示ステップ262にてユーザ向けに表示され、そのビデオサマリに関するユーザの諾否がユーザ諾否判別ステップ264にて確認される。ユーザが満足との意向を示した場合はビデオサマリ表現子格納ステップ270に移行して図2同様の処理が実行されるが、不満足との意向を示した場合は、一通り又は複数通りの設定に関しユーザ設定調整ステップ266にてユーザによる調整を受けた上で新たなビデオサマリが生成される。ユーザ設定の調整はユーザ用コントローラ34を介し行うことができる。その対象には、ビデオサマリの時間長、キービデオ断片の最短時間長、ビデオサマリに含まれるキービデオ断片の個数等といったパラメタ群の設定が含まれうる。ユーザによる設定調整が済んだ後は、キービデオ断片特定ステップ250及びビデオサマリ生成ステップ260にて、新たなユーザ設定に基づくビデオサマリが新規生成される。いわゆる当業者にはご理解頂ける通り、ユーザは、ビデオサマリのプリビューや設定調整を、自分が満足できるビデオサマリが得られるまで繰返し実行することができる。
FIG. 3 shows a video summary generation method according to another embodiment of the present invention, in which the user can preview the generated video summary and request the user to update the video summary generation result through setting adjustment. The method is shown. Digital video time
図4に、本発明の他の実施形態に係るビデオサマリ生成方法として、ビデオサマリを特定するデータが格納済ディジタルビデオ時系列に係るメタデータとして格納される方法を示す。まず、ディジタルビデオ時系列撮影ステップ410では、複数個のビデオフレームを有するディジタルビデオ時系列がディジタルビデオ撮影装置によって撮影される。ディジタルビデオ時系列格納ステップ420では、そのディジタルビデオ時系列がプロセッサ可アクセスメモリ内に格納される。図2中の特徴量判別ステップ220で判別されるような特徴量を、そのディジタルビデオ時系列と共に格納してもよいし格納しなくてもよい。
FIG. 4 shows a video summary generation method according to another embodiment of the present invention in which data specifying a video summary is stored as metadata related to a stored digital video time series. First, in the digital video time
次いで、キービデオ断片特定ステップ430では、格納済のディジタルビデオ時系列に含まれるビデオフレームのうち1個又は複数個で組成されるキービデオ断片が1個又は複数個特定される。このステップ430は、例えば、図2を参照して説明したキービデオ断片特定ステップ250に倣い、格納済の特徴量に基づき実行される。同ステップ430を、格納済のディジタルビデオ時系列を構成するフレーム群をビデオ解析アルゴリズムに従い直接解析する過程を含む形態にすることもできる。その場合、ステップ430を実行するのに、解析上の必要性に従いディジタルビデオ時系列を伸張することが必要になろう。キービデオ断片特定には、図2を参照して前述したものを含め、本件技術分野で知られている諸手法を使用することができる。
Next, in a key video
ビデオサマリ生成ステップ440では、図2中のビデオサマリ生成ステップ260と同じく、特定されたキービデオ断片同士の結合によってビデオサマリが生成される。ビデオサマリ指示メタデータ格納ステップ450では、そのビデオサマリに相応するビデオフレーム群を指し示すメタデータを、格納済のディジタルビデオ時系列に関連付けて格納することで、プロセッサ可アクセスメモリにおけるビデオサマリの所在が特定される。
In the video
キービデオ断片特定ステップ430、ビデオサマリ生成ステップ440及びビデオサマリ指示メタデータ格納ステップ450は、ディジタルビデオ時系列撮影ステップ410やディジタルビデオ時系列格納ステップ420が実行されるものとは異なるディジタルビデオ撮影装置上やプロセッサ20上で実行することもできる。例えば、ステップ420にてディジタルビデオ時系列が格納される画像メモリ30をリムーバブルメモリカードとし、そのメモリカードを用いディジタルビデオ時系列を別の装置に運び、その装置でステップ430〜450を実行するようにしてもよい。例えば、図1に示したものに類する別のディジタルビデオ撮影装置にディジタルビデオ時系列を運ぶことや、図1に示したコンピュータ40等の他装置やビデオ編集システムといったシステムにディジタルビデオ時系列をロードしそこでの処理でビデオサマリを生成させるようにしてもよい。
The key video
キービデオ断片特定ステップ430は、格納済のディジタルビデオ時系列から1個又は複数個のビデオフレームを抽出する過程及び抽出したビデオフレームを解析することでそれらのビデオフレームに係る特徴量を判別する過程を含む形態にすることができる。ステップ430は、更に、格納済のディジタルビデオ時系列から1個又は複数個のオーディオサンプルを抽出する過程及びそれらのオーディオサンプルを解析することでそのオーディオサンプルに係る特徴量を判別する過程を含む形態にすることもできる。これらの特徴量に関する解析はキービデオ断片の特定に役立つ。
The key video
ビデオサマリ指示メタデータ格納ステップ450は、ビデオサマリを組成するディジタルビデオ時系列内ビデオフレーム群を指し示すフレーム指示メタデータを格納する形態にすることができる。この要領に従いビデオサマリをフレーム指示メタデータとして格納することは、ビデオサマリの格納に必要な物理メモリの量がフレーム指示メタデータの格納に必要な最小限の量に留まる点で有益なことである。好ましいことに、フレーム指示メタデータは、格納済の圧縮版ディジタルビデオ時系列に関連付けつつ格納することができる。例えば、ビデオサマリ内キービデオ断片を組成するフレームのうち一群の始点フレーム及び終点フレームを指し示すビデオサマリ表現子を、メタデータとして、格納済の圧縮版ディジタルビデオ時系列に係るファイル内に格納すればよい。格納済の圧縮版ディジタルビデオ時系列に係るファイルとは別のファイル内に、フレーム指示メタデータを格納してもよい。
The video summary indication
ビデオサマリ指示メタデータ格納ステップ450にて、更に、キービデオ断片を組成するオーディオサンプルのうちビデオサマリを組成するものを指し示すメタデータを格納するようにしてもよい。
In the video summary instruction
ビデオサマリ指示メタデータ格納ステップ450にて、更に、特定されたキービデオ断片間の境界に適用されるビデオトランジション効果を指し示すメタデータをも格納するようにしてもよい。ビデオトランジション効果としては、例えば、あるキービデオ断片から次のキービデオ断片へのフェーディング(クロスディゾルブ効果)、あるキービデオ断片からホワイト画面又はブラック画面を経て次のキービデオ断片へのフェーディング等を指定することができる。その他のトランジション効果、例えばクロスワイプ効果、サークル拡/縮効果、横/縦ブラインド効果、チェックボードトランジション効果等の特殊効果を指定することもできる。いわゆる当業者にはご理解頂ける通りこれらは例示に過ぎず、本発明の実施に際してはその他様々なトランジション効果も使用することができる。ビデオトランジション効果を使用することで、ディジタルビデオ時系列内セグメント間の突飛な遷移がなく視覚的品質が総合的に高いビデオサマリを得ることができる。
In the video summary instruction
ビデオサマリ指示メタデータ格納ステップ450にて、更に、キービデオ断片間の境界に適用されるオーディオトランジション効果を指し示すメタデータをも格納するようにしてもよい。オーディオトランジション効果としては、例えば、有音から無音へのフェーディングや無音から有音へのフェーディングを指定することができる。そうしたオーディオトランジション効果を使用することで、ディジタルビデオ時系列内オーディオセグメント間の突飛な遷移がなく聴覚的品質が総合的に高いビデオサマリを得ることができる。
In the video summary instruction
図5に、本発明の一実施形態に係りビデオ再生システム上で実行されるビデオサマリ表示方法の流れを示す。図示の方法は、直に表示可能なディジタルビデオファイルとして格納されているビデオサマリではなくその所在がメタデータで特定されているビデオサマリの表示に適した方法である。 FIG. 5 shows a flow of a video summary display method executed on the video playback system according to an embodiment of the present invention. The illustrated method is suitable for displaying a video summary whose location is specified by metadata, not a video summary stored as a digital video file that can be displayed directly.
まず、データ読込ステップ510では、格納済のビデオサマリに係るデータ、具体的には格納済のディジタルビデオ時系列を構成するビデオフレームのうちそのビデオサマリを組成するものを指し示すデータが読み込まれる。例えば、そのビデオサマリを組成するビデオフレームを指し示すデータが、ディジタルビデオ時系列の格納先と同じディジタルビデオファイル内に格納されているメタデータ、特にそのビデオサマリを組成するビデオフレームがどれかを示すメタデータから抽出される。或いは、格納済のディジタルビデオ時系列に関連付けられている別のファイルから抽出される。
First, in the
次に、ビデオフレーム抽出ステップ520では、ビデオフレームのうちキービデオ断片ひいてはビデオサマリを組成しているものが、格納済のディジタルビデオ時系列から抽出される。ディジタルビデオ時系列が通例に倣い圧縮状態で格納されている場合、このステップ520ではそのディジタルビデオ時系列の伸張も実行される。
Next, in a video
ビデオサマリ生成ステップ530では、キービデオ断片毎のビデオフレーム抽出結果に基づきビデオサマリが生成される。このステップ530の最も単純な実行形態は、抽出されたビデオフレームを単純に並べて途切れのないビデオクリップを生成する、というものである。
In the video
ビデオサマリ生成後、ビデオサマリ表示ステップ540では、そのビデオサマリがソフトコピーディスプレイの画面上に表示される。ソフトコピーディスプレイとしては、例えば、ディジタルビデオ撮影装置上の閲覧画面や、コンピュータに接続されているディスプレイや、テレビジョン受像機の画面を使用することができる。
After the video summary is generated, in the video
データ読込ステップ510は、ビデオサマリに相応するオーディオサンプル群を指し示す指示子をも得る形態にすることができる。この場合、ビデオフレーム抽出ステップ520にて、更に、格納済のディジタルビデオ時系列を組成するオーディオサンプル群のなかからそのビデオサマリに相応しいものを抽出するようにすればよい。
The
データ読込ステップ510にて、更に、そのビデオサマリで使用されるビデオトランジション効果を指し示す指示子、そのビデオサマリで使用されるオーディオトランジション効果を指し示す指示子等を得るようにしてもよい。ビデオトランジション効果を指し示す指示子がデータ読込ステップ510で得られていれば、ビデオサマリ生成ステップ530にて、抽出済のビデオフレーム群をその指示子に係るトランジション効果に従い変形することで、所望のトランジションを呈するように編集されたビデオサマリを生成することができる。従って、例えば、ビデオサマリ内キービデオ断片の末尾に位置する15個のフレームにブラック化フェーディング性のビデオトランジション効果を適用せよ、との指示子入りのデータが読み込まれた場合、まず、その効果を適用すべきビデオフレーム群が格納済のディジタルビデオ時系列から抽出され、緩慢なブラック化フェーディング様式に従いそれらのフレームに係るデータが修正される。更に、その次のキービデオ断片の冒頭に位置する15個のフレームが抽出され、緩慢な通常ビデオ復帰フェーディング様式に従いそれらのフレームに係るデータが修正される。
In the
ソフトコピーディスプレイにオーディオ出力用のスピーカが1個又は複数個備わっている場合、同様に、そのスピーカからのオーディオ出力に先立ちオーディオトランジション効果を適用することが可能である。例えば、キービデオ断片の末尾に位置する8000個のオーディオサンプルに無音化フェーディング性のオーディオトランジション効果を適用せよ、との指示子入りのデータが読み込まれた場合、まず、その効果を適用すべきオーディオサンプル群が格納済のディジタルビデオ時系列から抽出され、緩慢な無音化フェーディング様式に従いそれらのオーディオサンプルに係るデータが修正される。更に、その次のキービデオ断片の冒頭に位置する8000個のオーディオサンプルが抽出され、緩慢な通常オーディオ復帰フェーディング様式に従いそれらのオーディオサンプルに係るデータが修正される。 When the soft copy display has one or more speakers for audio output, it is also possible to apply an audio transition effect prior to audio output from the speakers. For example, when data with an instruction to apply a silence fading audio transition effect is read to 8000 audio samples located at the end of a key video fragment, the effect should be applied first. A group of audio samples is extracted from the stored digital video time series, and the data associated with those audio samples is modified according to a slow silence fading scheme. In addition, 8000 audio samples located at the beginning of the next key video fragment are extracted, and the data related to those audio samples is modified according to the slow normal audio return fading mode.
本発明では、ビデオサマリ生成方法として、そのビデオサマリに含まれるビデオフレーム群乃至オーディオサンプル群を指し示すメタデータや、それに適用されるビデオ乃至オーディオトランジション効果を指し示すメタデータを、ディジタルビデオ時系列の格納先と同じディジタルビデオファイル内に格納する、といった方法が使用されうる。また、本発明では、ビデオサマリ表示システムとして、ビデオサマリを組成しているため格納済のディジタルビデオ時系列から抽出する必要があるビデオフレーム及びオーディオサンプルや、ディスプレイ上でのビデオ表示及びスピーカからのオーディオ出力に先立ちデータに適用すべきビデオ及びオーディオトランジション効果を、対応するメタデータを読み込んで特定する、といったシステムが使用されうる。こうした方法及びシステムには、別のビデオファイル内にビデオサマリを格納することなくビデオサマリを表示させることができる、という利点がある。 In the present invention, as a video summary generation method, metadata indicating a video frame group or an audio sample group included in the video summary, or metadata indicating a video or audio transition effect applied thereto is stored in a digital video time series. A method such as storing in the same digital video file as before can be used. In the present invention, as the video summary display system, since the video summary is composed, it is necessary to extract from the stored digital video time series, the video frame and the audio sample, the video display on the display and the speaker. A system may be used that reads and identifies the corresponding metadata to identify video and audio transition effects to be applied to the data prior to audio output. Such a method and system has the advantage that the video summary can be displayed without storing the video summary in a separate video file.
ユーザが原ビデオ視聴かビデオサマリ視聴かを選べるよう、ビデオディスプレイの装置構成に工夫を施してもよい。例えば、ディジタルビデオカムコーダ上に、原ビデオ時系列再生用のそれとビデオサマリ再生用のそれとに分け、複数個の再生ボタンを設けてもよい。早送りボタンの操作に応じビデオサマリが再生されるようにしてもよい。即ち、従来の早送り機能に代わるビデオ時系列内高速縦貫移動手段として、ビデオサマリ再生を使用することができる。ビデオ時系列内フレーム群の単なる時間サンプリングである従来の早送りに比し、ビデオサマリの再生は、ビデオ時系列のうちユーザが視聴したいと望むであろう部分だけをユーザに提示できる点でより有用なものである。 The device configuration of the video display may be devised so that the user can select whether to watch the original video or the video summary. For example, a plurality of playback buttons may be provided on a digital video camcorder, divided into those for original video time-series playback and those for video summary playback. The video summary may be played in response to the operation of the fast forward button. In other words, video summary reproduction can be used as a high-speed vertical moving means in the video time series in place of the conventional fast-forward function. Compared to traditional fast-forwarding, which is just time sampling of frames within a video time series, video summary playback is more useful in that it can present to the user only the part of the video time series that the user would want to watch It is a thing.
図5を参照して説明したビデオ再生システムは、ビデオサマリに係るメタデータを格納済のディジタルビデオ時系列から抽出すること、そのメタデータを処理しディジタルビデオ時系列のビデオサマリ版をどのように表示すべきかを判断すること等が可能であるという意味で、スマートなビデオプレーヤである。しかも、ディジタルビデオ時系列全体を視聴したいか、それともビデオサマリ版を視聴したいかに関し、ユーザ向けに選択肢を提示することもできる。これに対し、一般的なビデオプレーヤでは、ビデオサマリとそれに対応するメタデータとの関係を認識できない。とはいえ、一般的なビデオプレーヤでも、格納済の原ディジタルビデオ時系列を読み込んで表示に供することは可能である。即ち、一般的なビデオプレーヤでは、格納済のディジタルビデオ時系列に付随するメタデータが無視される。元々のディジタルビデオ時系列全体なら再生できる。 The video playback system described with reference to FIG. 5 extracts metadata related to a video summary from a stored digital video time series, and processes the metadata to obtain a video summary version of the digital video time series. It is a smart video player in the sense that it can be determined whether or not to display. In addition, the user can be presented with options regarding whether he wants to watch the entire digital video timeline or to watch the video summary version. On the other hand, a general video player cannot recognize the relationship between the video summary and the corresponding metadata. However, even a general video player can read the stored original digital video time series for display. That is, in a general video player, the metadata accompanying the stored digital video time series is ignored. The entire original digital video time series can be played back.
また、図1及び図2に示すように、本発明には、撮影によりディジタルビデオ時系列を取得して相応のビデオサマリを生成するディジタルビデオ撮影システム(例.ディジタルカメラ10)なる実施形態がある。本実施形態のシステムは、ビデオフレーム取得用のイメージセンサ14と、光景の像をイメージセンサ上に発現させる光学系(例.レンズ4及びそれに付随する可調絞り及び可調シャッタ6)と、ビデオサマリを生成してプロセッサ可アクセスメモリ内に格納するプロセッサ20と、ディジタルビデオ時系列閲覧用の画像ディスプレイ32と、格納されているディジタルビデオ時系列及びビデオサマリの表現子のうちいずれをソフトコピーディスプレイ上に表示させるかをユーザに選択させる手段(例.ユーザ用コントローラ34)と、を備える。本システムは、例えば、ディジタルビデオカメラ、スチル撮影モード及びビデオ撮影モードを併有するディジタルカメラ、ウェブカメラ付のラップトップ乃至デスクトップコンピュータ等の形態を採りうる。
As shown in FIGS. 1 and 2, the present invention has an embodiment of a digital video shooting system (eg, digital camera 10) that acquires a digital video time series by shooting and generates a corresponding video summary. . The system of the present embodiment includes an
ディジタルビデオ撮影システム内のプロセッサ20は、図2に示した方法の諸ステップを担うソフトウェアを実行する。具体的には、ユーザからの指示に応じ、プロセッサ20が、複数個のビデオフレームを有するディジタルビデオ時系列の撮影を実行し(ディジタルビデオ時系列撮影ステップ210)、その撮影と並行しディジタルビデオ時系列内ビデオフレーム群の一部又は全体を自動解析することで一通り又は複数通りの特徴量を判別し(特徴量判別ステップ220)、そのディジタルビデオ時系列を圧縮し(ディジタルビデオ時系列圧縮ステップ230)、それにより得られた圧縮版ディジタルビデオ時系列をプロセッサ可アクセスメモリ内に格納し(圧縮版ディジタルビデオ時系列格納ステップ240)、格納済圧縮版ディジタルビデオ時系列を伸張することなく特徴量を自動解析することでディジタルビデオ時系列内ビデオフレーム群からなるキービデオ断片を1個又は複数個特定し(キービデオ断片特定ステップ250)、キービデオ断片同士を結合させることでビデオサマリを生成し(ビデオサマリ生成ステップ260)、そしてそのビデオサマリの表現子をプロセッサ可アクセスメモリ内に格納する(ビデオサマリ表現子格納ステップ270)。
The
ディジタルビデオ時系列内オーディオサンプル群の一部又は全体を自動解析し、一通り又は複数通りの特徴量を判別するステップを、ディジタルビデオ撮影システム内のプロセッサ20にディジタルビデオ時系列の撮影と並行して実行させるようにしてもよい。
The step of automatically analyzing a part or all of the audio sample group in the digital video time series and determining one or a plurality of feature amounts is performed in parallel with the digital video time series shooting in the
プロセッサ可アクセスメモリ内に判別済の特徴量を格納させるステップ、特に当該特徴量を格納済圧縮版ディジタルビデオ時系列に係るメタデータとして格納させるステップを、ディジタルビデオ撮影システム内のプロセッサ20に実行させるようにしてもよい。
The
プロセッサ可アクセスメモリ内に判別済の特徴量を格納させるステップ、特に当該特徴量を格納済の圧縮版ディジタルビデオ時系列に関連付けられた別のファイル内に格納させるステップを、ディジタルビデオ撮影システム内のプロセッサ20に実行させるようにしてもよい。
Storing the determined feature quantity in the processor-accessible memory, in particular, storing the feature quantity in another file associated with the stored compressed digital video time series. The
特徴量及びユーザ入力を自動解析して1個又は複数個のキービデオ断片を特定するステップを、ディジタルビデオ撮影システム内のプロセッサ20に実行させるようにしてもよい。ユーザ入力はユーザ用コントローラ34経由で得ることができる。ユーザ入力としては、ビデオサマリの時間長、ビデオサマリ内キービデオ断片の最短時間長、ビデオサマリ内キービデオ断片の個数等に関する条件を使用可能である。
The step of automatically analyzing the feature quantity and user input to identify one or more key video fragments may be executed by the
ビデオサマリ表現子をプロセッサ可アクセスメモリ内に格納するステップを、ディジタルビデオ撮影システム内のプロセッサ20に実行させるようにしてもよい。例えば、ディジタルビデオ時系列内ビデオフレームのうちビデオサマリを組成するものを指し示すメタデータを生成し、格納済圧縮版ディジタルビデオ時系列に関連付けて格納するステップである。
The step of storing the video summary representation in the processor accessible memory may be performed by the
そのビデオサマリは、ディジタルビデオ撮影システムに備わるユーザ用コントローラ34に対するユーザの操作に従い、ソフトコピー画像ディスプレイ32や外付けビデオディスプレイ46の画面上に表示される。そのビデオサマリが、ディジタルビデオ時系列内ビデオフレームのうちビデオサマリを組成するものをメタデータで指し示す形態で格納されている場合は、図5に示した要領でビデオサマリが抽出、表示される。具体的には、そのディジタルビデオ撮影システムがスマートなビデオプレーヤとして振る舞い、そのメタデータに相応しいビデオ及びオーディオデータを抽出する。
The video summary is displayed on the screen of the soft
ユーザがビデオサマリを視聴してその可否を判断できるようにユーザインタフェースを構成することも可能である。ユーザがビデオサマリを気に入らない場合もあるので、ビデオサマリに関する設定をユーザ自らが調整できるよう、ユーザ用コントローラ34を利用し相応の手段をディジタルビデオ撮影システムに設けるのが望ましい。調整対象になりうるユーザ設定としては、ビデオサマリの時間長、ビデオサマリ内キービデオ断片の最短時間長、ビデオサマリ内キービデオ断片の個数等がある。キービデオ断片特定ステップ250での処理内容や使用する設定を違え、ビデオサマリの候補を複数個、自動的に生成するようにシステムを構成することも可能である。この構成では、ユーザが複数個の候補から適切なビデオサマリを選べるため、納得のいくビデオサマリが生成されない確率を抑え、本発明の効果を全体として高めることができる。
It is also possible to configure the user interface so that the user can view the video summary and determine whether it is possible. Since the user may not like the video summary, it is desirable to provide a corresponding means in the digital video shooting system by using the user controller 34 so that the user himself can adjust the settings relating to the video summary. User settings that can be adjusted include the video summary time length, the minimum time length of key video fragments in the video summary, the number of key video fragments in the video summary, and the like. It is also possible to configure the system so as to automatically generate a plurality of video summary candidates by changing the processing contents and setting used in the key video
上掲のディジタルビデオ撮影システムには、格納済圧縮版ディジタルビデオ時系列を伸張することなく、またビデオサマリを符号化して新たなファイルを生成することなく、一群のビデオサマリを迅速に生成、表示できるという利点がある。 The above digital video shooting system quickly generates and displays a group of video summaries without decompressing the stored compressed digital video time series and without generating a new file by encoding the video summary. There is an advantage that you can.
ビデオサマリが別のファイル内に格納される構成では、ネットワーク上でのビデオサマリ共有や、圧縮版ディジタルビデオ時系列内メタデータを解釈してビデオサマリを抽出することが可能なスマートビデオディスプレイが実装されていない装置でのビデオサマリ参照を、より好適に実行することができる。この場合、ディジタルビデオ撮影システム内のプロセッサ20で生成されるビデオサマリ表現子の格納先を、一般的なビデオプレーヤで再生可能なフォーマットのディジタルビデオファイル内とするのが望ましい。ビデオサマリが常に別ファイルを形成する構成にしてもよいし、ユーザがユーザ用コントローラ34を操作しビデオサマリの格納形態を指定する構成、例えばユーザインタフェース上の共有ボタンをユーザが操作した場合にビデオサマリが別ファイルで格納される構成にしてもよい。
In a configuration where the video summary is stored in a separate file, a smart video display that can extract the video summary by sharing the video summary on the network and interpreting the metadata in the compressed digital video time series is implemented. It is possible to more suitably perform video summary reference with a device that has not been performed. In this case, it is desirable to store the video summary expression generated by the
ビデオサマリが別ファイルで格納されるタイプのディジタルビデオ撮影システムでは、ビデオサマリ表現子をディジタルビデオファイル化してプロセッサ可アクセスメモリ内に格納するステップを、そのプロセッサ20に実行させることもできる。例えば、格納されている圧縮版ディジタルビデオ時系列の一部又は全体を伸張することでビデオサマリに相応するビデオフレーム群を抽出し、そのビデオフレーム群を圧縮することで圧縮版ビデオサマリを生成し、その圧縮版ビデオサマリをプロセッサ可アクセスメモリ内に格納するソフトウェアを、そのプロセッサ20が実行する構成である。更に、格納されている圧縮版ディジタルビデオ時系列の一部又は全体を伸張することでビデオサマリに相応するオーディオサンプル群を抽出し、そのオーディオサンプル群を圧縮して圧縮版ビデオサマリ内に組み込むステップを、ディジタルビデオ撮影システム内のプロセッサ20に実行させるようにしてもよい。
In a digital video shooting system of a type in which the video summary is stored in a separate file, the
共有に先立ちディジタルビデオ時系列の空間乃至時間解像度を元々の値から低下させることは、コンピュータネットワーク上でのビデオファイル共有に際し有益である。元々の値と異なる空間乃至時間解像度を有するビデオフレーム群は、抽出されたビデオフレーム群をディジタルビデオ撮影システム内のプロセッサ20にて再サンプリングすることで得られる。本発明の長所の一つは、このように、元々の圧縮版ディジタルビデオ時系列全体を伸張することなく低解像度のビデオサマリを生成可能なことである。圧縮されているディジタルビデオデータのうちビデオサマリ生成に関連するものだけを伸張すればよいため、元々の圧縮版ディジタルビデオ時系列からビデオサマリへとより高速に符号変換することができる。
Decreasing the spatial or temporal resolution of the digital video time series from its original value prior to sharing is beneficial when sharing video files on a computer network. A video frame group having a spatial or temporal resolution different from the original value is obtained by re-sampling the extracted video frame group by the
ネットワーク上でのビデオファイル共有に際しては、また、圧縮の積極性を高めることで、圧縮版ディジタルビデオ時系列のサイズを抑えることができる。抽出されたビデオフレーム群を、格納されている圧縮版ディジタルビデオ時系列でのそれに比し積極的な圧縮設定に従いディジタルビデオ撮影システム内のプロセッサ20に圧縮させることで、より強く圧縮されたビデオサマリを生成することができる。本発明の長所の一つは、このように、元々の圧縮版ディジタルビデオ時系列全体を伸張することなく、より強く圧縮されたビデオサマリを生成することが可能な点にある。
When sharing a video file on a network, the size of the compressed digital video time series can be reduced by increasing the aggressiveness of compression. The extracted video frame group is compressed by the
イメージセンサ14、光学系(レンズ4)、プロセッサ20及びソフトコピーディスプレイ(画像ディスプレイ32)に加えてユーザインタフェースを備えるディジタルビデオカメラの形態でディジタルビデオ撮影システムを構成すること、特に格納済の圧縮版ディジタルビデオ時系列をそのソフトコピーディスプレイ上に表示させるかそれとも格納済のビデオサマリを表示させるかに関する選択肢をそのユーザインタフェース上でユーザ向けに提示する構成にすることも可能である。この場合、ユーザは、そのディジタルビデオカメラでビデオ撮影を行った直後に、そのビデオのサマリ版を視聴することや、そのビデオサマリに対し随意に修正を求めることや、そのビデオサマリを別ファイルで保存させ共有化することができる。
Constructing a digital video shooting system in the form of a digital video camera having a user interface in addition to the
そのディジタルビデオカメラを外部のソフトコピーディスプレイに接続し、ユーザが視聴できるよう、格納済の圧縮版ディジタルビデオ時系列や格納済のビデオサマリをその上に表示させることもできる。 The digital video camera can be connected to an external soft copy display to display a stored compressed digital video time series or stored video summary on it for viewing by the user.
格納されているディジタルビデオ時系列やビデオサマリにアクセス可能な独立したビデオ視聴システムの一構成部材としてソフトコピーディスプレイを設けることや、格納されているディジタルビデオ時系列及び格納されているビデオサマリのうちいずれをソフトコピーディスプレイ上に表示させるかに関しユーザ向けに選択肢を提示するユーザインタフェースをディジタルカメラ上に設けることも可能である。 Providing a soft copy display as a component of an independent video viewing system accessible to the stored digital video time series and video summary, and the stored digital video time series and stored video summary It is also possible to provide a user interface on the digital camera that presents options to the user regarding which to display on the softcopy display.
ディジタルビデオ撮影システム内のプロセッサ20が、キービデオ断片間にビデオトランジション効果を適用しつつビデオサマリを生成する構成にしてもよい。ビデオトランジション効果の結果は表示時に算出可能であり、格納済圧縮版ディジタルビデオ時系列に係るメタデータでビデオサマリの所在を特定する構成ではそのことが有利に働く。
The
ディジタルビデオ撮影システム内のプロセッサ20でキービデオ断片を解析し、複数個あるビデオトランジション効果のなかから幾つかを自動選択する構成にしてもよい。ホワイト化フェーディング性のトランジション効果が相応しいか、ブラック化フェーディング性のトランジション効果が相応しいか、それともそれ以外のビデオトランジション効果が相応しいかはビデオコンテンツ次第であるので、キービデオ断片の自動解析で得られる情報を利用することは、最適な視覚効果をもたらすキービデオ断片間ビデオトランジション効果を特定する上で有用なことである。
The
オーディオトランジション効果も同様に扱うことができる。ディジタルビデオ撮影システム内のプロセッサ20に、キービデオ断片間にオーディオトランジション効果を適用しつつビデオサマリを生成させるようにすればよい。オーディオトランジション効果の結果は表示時に算出可能である。
Audio transition effects can be handled similarly. What is necessary is just to make the
ディジタルビデオ撮影システム内のプロセッサ20にキービデオ断片特定ステップ250の変形版を実行させる形態、例えば特徴量を自動解析しその結果を格納済圧縮版ディジタルビデオ時系列内の情報と併用してキービデオ断片を特定する形態にて、本発明を実施することも可能である。速度が犠牲になるものの、この形態であれば、ビデオサマリを組成するキービデオ断片の特定をより多くの情報に基づき行うことができる。また、撮影時に時間的な余裕がなくプロセッサ20にて所望の特徴量を導出できない場合も多かろう。そうした場合でも、格納済圧縮版ディジタルビデオ時系列を部分的に伸張することで、キービデオ断片の導出に役立つ情報を抽出することができる。例えば、格納済圧縮版ディジタルビデオ時系列内のオーディオ情報を抽出することや、格納済圧縮版ディジタルビデオ時系列内のビデオ情報を抽出することができる。
A form in which the
本発明には、マニュアルトリミングを支援できるという特徴もある。マニュアルトリミングは多くのディジタルビデオ撮影装置に備わる編集機能であり、これを利用することで、ユーザは、撮影したビデオのリビュー結果に基づきそのビデオの始点及び終点を随意にトリミングすることができる。本発明の許では、単一のキービデオ断片で組成されたビデオサマリが生成されることがあり、そうした場合にはそのビデオサマリの始点及び終点がマニュアルトリミングの推奨点として提示される。 The present invention also has a feature that manual trimming can be supported. Manual trimming is an editing function provided in many digital video shooting apparatuses, and by using this, the user can trim the start point and end point of the video arbitrarily based on the review result of the shot video. In accordance with the present invention, a video summary composed of a single key video fragment may be generated, in which case the start and end points of the video summary are presented as recommendations for manual trimming.
注記すべきことに、撮影時に特徴量を判別し撮影後に特徴量判別結果を利用するという手順は、ビデオサマリ生成以外の用途にも適している。特徴量に基づくキービデオフレーム判別を含め、他のやり方を採る構成も本発明の技術的範囲内であるものと認められる。 It should be noted that the procedure of discriminating feature amounts at the time of shooting and using the feature amount discrimination results after shooting is also suitable for uses other than video summary generation. It is recognized that configurations employing other methods including key video frame discrimination based on feature amounts are also within the technical scope of the present invention.
また、ディジタルビデオ圧縮アルゴリズムとしては、ディジタルビデオ時系列を複数個のビデオフレーム群に分割して符号化に供するものが多々ある。個々のビデオフレーム群は、独立符号化ビデオフレーム(Iフレーム)1個と、復号の際に他のビデオフレーム1個又は複数個に関する情報が必要になる幾つかの予測符号化ビデオフレーム(Pフレーム)と、を含む構成である。そのなかではIフレーム1個が先行し、それぞれそのIフレームに基づく予測で生成されたPフレーム幾つかが後続する。ある符号化対象ビデオフレーム群が終わり次の符号化対象ビデオフレーム群が始まる時点で現れるのは後者内のIフレームである。こうした圧縮方式では、圧縮されたディジタルビデオ時系列の内部に至るアクセスポイントとしてIフレームを使用し、Iフレームを始点とするフレーム群を抽出することができる。具体的には、その符号化対象ビデオフレーム群を構成する圧縮バイトの位置及び個数を指し示すヘッダ情報を復号するのみで、圧縮版のディジタルビデオ時系列から符号化対象ビデオフレーム群全体を抽出してビデオサマリへと符号変換することができる。従って、ビデオサマリを生成する際、各キービデオ断片の冒頭フレームがIフレームになるよう求めることや、その断片に含まれる符号化対象ビデオフレーム群の個数に端数が生じないよう求めることは有益なことである。これらの制約を課すことで、元々の圧縮版ディジタルビデオ時系列をあまり伸張せずにビデオサマリを生成することが可能となる。 Many digital video compression algorithms are used for encoding by dividing a digital video time series into a plurality of video frame groups. Each group of video frames consists of one independently encoded video frame (I frame) and several predictive encoded video frames (P frames) that require information about one or more other video frames during decoding. ). Among them, one I frame precedes, followed by several P frames generated by prediction based on that I frame. It is an I frame in the latter that appears when a certain video frame group ends and the next video frame group starts. In such a compression method, an I frame is used as an access point that reaches the inside of a compressed digital video time series, and a frame group starting from the I frame can be extracted. Specifically, the entire encoding target video frame group is extracted from the compressed digital video time series only by decoding header information indicating the position and number of compressed bytes constituting the encoding target video frame group. The code can be converted into a video summary. Therefore, when generating a video summary, it is useful to obtain that the first frame of each key video fragment is an I frame, or to obtain no fractional number in the number of target video frames included in the fragment. That is. By imposing these constraints, it is possible to generate a video summary without much decompressing the original compressed digital video time series.
本発明に係る方法を実行するためのコンピュータプログラム製品は、磁気ディスク(例.フロッピーディスク)、磁気テープ等の磁気記録媒体、光ディスク、光テープ、機械可読バーコード等の光記録媒体、RAM、ROM等の固体電子記憶デバイスをはじめとする1個又は複数個の記録媒体、即ち本発明に係る方法が体現されるよう1台又は複数台のコンピュータを制御するコンピュータプログラムの格納に使用可能な諸有形デバイス乃至媒体に格納可能である。 Computer program products for executing the method according to the present invention include magnetic recording media such as magnetic disks (eg floppy disks), magnetic tapes, optical recording media such as optical disks, optical tapes, machine-readable barcodes, RAM, ROM Various tangibles that can be used to store one or more recording media including a solid-state electronic storage device such as a computer program for controlling one or more computers so that the method of the present invention is embodied. It can be stored in a device or medium.
1 フラッシュ、4 レンズ、6 可調絞り及び可調シャッタ、8 ズーム/合焦モータドライバ、10 ディジタルカメラ、12 タイミング発生器、14 イメージセンサ、16 ASP及びA/Dコンバータ、18 バッファメモリ、20 プロセッサ、22 オーディオコーデック、24 マイクロホン、25 圧力センサ、26 スピーカ、27 加速度計、28 ファームウェアメモリ、30 画像メモリ、32 画像ディスプレイ、34 ユーザ用コントローラ、36 ディスプレイメモリ、38 有線インタフェース、40 コンピュータ、42 傾斜センサ、44 ビデオインタフェース、46 ビデオディスプレイ、48 インタフェース/充電器、50 ワイヤレスモデム、52 無線周波数帯、58 ワイヤレスネットワーク、70 インターネット、72 フォトサービスプロバイダ、210,410 ディジタルビデオ時系列撮影ステップ、220 特徴量判別ステップ、230 ディジタルビデオ時系列圧縮ステップ、240 圧縮版ディジタルビデオ時系列格納ステップ、250,430 キービデオ断片特定ステップ、260,440,530 ビデオサマリ生成ステップ、262,540 ビデオサマリ表示ステップ、264 ユーザ諾否判別ステップ、266 ユーザ設定調整ステップ、270 ビデオサマリ表現子格納ステップ、420 ディジタルビデオ時系列格納ステップ、450 ビデオサマリ指示メタデータ格納ステップ、510 データ読込ステップ、520 ビデオフレーム抽出ステップ。
1 flash, 4 lens, 6 adjustable aperture and adjustable shutter, 8 zoom / focus motor driver, 10 digital camera, 12 timing generator, 14 image sensor, 16 ASP and A / D converter, 18 buffer memory, 20 processor , 22 Audio codec, 24 Microphone, 25 Pressure sensor, 26 Speaker, 27 Accelerometer, 28 Firmware memory, 30 Image memory, 32 Image display, 34 User controller, 36 Display memory, 38 Wired interface, 40 Computer, 42 Tilt sensor 44 Video interface 46
Claims (11)
複数個のビデオフレームを有するディジタルビデオ時系列をディジタルビデオ撮影装置で撮影するステップと、
そのディジタルビデオ時系列をプロセッサ可アクセスメモリ内に格納するステップと、
格納済ディジタルビデオ時系列から一群のビデオフレームに相応するキービデオ断片を1個又は複数個特定するステップと、
キービデオ断片同士を結合させることでビデオサマリを生成するステップと、
そのビデオサマリに相応するビデオフレーム群を指し示すメタデータをその格納済ディジタルビデオ時系列に関連付けて格納することでプロセッサ可アクセスメモリにおけるビデオメモリの格納先を特定するステップと、
を有する方法。 A method for storing a video summary of a digital video time series taken with a digital video camera comprising:
Photographing a digital video time series having a plurality of video frames with a digital video photographing device;
Storing the digital video time series in a processor accessible memory;
Identifying one or more key video fragments corresponding to a group of video frames from a stored digital video time series;
Generating a video summary by combining key video fragments;
Identifying the storage location of the video memory in the processor-accessible memory by storing metadata indicating a video frame group corresponding to the video summary in association with the stored digital video time series; and
Having a method.
ビデオフレーム群の表示に使用されるソフトコピーディスプレイと、
プロセッサと、
を備え、そのプロセッサが、
格納済ディジタルビデオ時系列に関連付けられているデータのうちビデオサマリに相応するビデオフレーム群を指し示すデータを読み込む読込ステップと、
ビデオサマリに相応するビデオフレーム群を格納済ディジタルビデオ時系列から抽出する抽出ステップと、
ビデオサマリに相応するビデオフレーム群をソフトコピーディスプレイ上に表示させる表示ステップと、
を実行するシステム。 A system for displaying video frames corresponding to a video summary,
A soft copy display used to display video frames,
A processor;
And the processor is
A step of reading data indicating a video frame group corresponding to the video summary among the data associated with the stored digital video time series;
Extracting a video frame group corresponding to the video summary from the stored digital video time series;
A display step for displaying a video frame group corresponding to the video summary on the soft copy display;
Running system.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/786,489 US8520088B2 (en) | 2010-05-25 | 2010-05-25 | Storing a video summary as metadata |
US12/786,489 | 2010-05-25 | ||
PCT/US2011/036711 WO2011149698A1 (en) | 2010-05-25 | 2011-05-17 | Storing a video summary as metadata |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013533669A true JP2013533669A (en) | 2013-08-22 |
JP2013533669A5 JP2013533669A5 (en) | 2014-07-03 |
Family
ID=44121278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013512654A Pending JP2013533669A (en) | 2010-05-25 | 2011-05-17 | Video summary instruction metadata storage |
Country Status (5)
Country | Link |
---|---|
US (2) | US8520088B2 (en) |
EP (1) | EP2577664B1 (en) |
JP (1) | JP2013533669A (en) |
CN (1) | CN102906818B (en) |
WO (1) | WO2011149698A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160005552A (en) * | 2014-07-07 | 2016-01-15 | 한화테크윈 주식회사 | Imaging apparatus providing video summary and method for providing video summary thereof |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11314405B2 (en) * | 2011-10-14 | 2022-04-26 | Autodesk, Inc. | Real-time scrubbing of online videos |
CN103546828B (en) * | 2012-07-16 | 2019-02-22 | 腾讯科技(深圳)有限公司 | The generation method and device of previewing programs |
TWI555407B (en) * | 2012-07-18 | 2016-10-21 | 晶睿通訊股份有限公司 | Method for setting video display |
US20160004395A1 (en) * | 2013-03-08 | 2016-01-07 | Thomson Licensing | Method and apparatus for using a list driven selection process to improve video and media time based editing |
CN103442252B (en) * | 2013-08-21 | 2016-12-07 | 宇龙计算机通信科技(深圳)有限公司 | Method for processing video frequency and device |
US10037129B2 (en) * | 2013-08-30 | 2018-07-31 | Google Llc | Modifying a segment of a media item on a mobile device |
US9418703B2 (en) | 2013-10-09 | 2016-08-16 | Mindset Systems Incorporated | Method of and system for automatic compilation of crowdsourced digital media productions |
US10079040B2 (en) | 2013-12-31 | 2018-09-18 | Disney Enterprises, Inc. | Systems and methods for video clip creation, curation, and interaction |
US9639762B2 (en) * | 2014-09-04 | 2017-05-02 | Intel Corporation | Real time video summarization |
US10108322B2 (en) * | 2015-01-02 | 2018-10-23 | Kaltura, Inc. | Dynamic video effects for interactive videos |
US10440443B2 (en) | 2015-02-04 | 2019-10-08 | Mobitv, Inc. | Intermediate key frame selection and animation |
US9471954B2 (en) | 2015-03-16 | 2016-10-18 | International Business Machines Corporation | Video sequence assembly |
CN104936046A (en) * | 2015-06-03 | 2015-09-23 | 无锡天脉聚源传媒科技有限公司 | Method and device for generating abstract picture of video collection |
US10090020B1 (en) * | 2015-06-30 | 2018-10-02 | Amazon Technologies, Inc. | Content summarization |
US20170148488A1 (en) * | 2015-11-20 | 2017-05-25 | Mediatek Inc. | Video data processing system and associated method for analyzing and summarizing recorded video data |
US10321196B2 (en) * | 2015-12-09 | 2019-06-11 | Rovi Guides, Inc. | Methods and systems for customizing a media asset with feedback on customization |
CN108431707B (en) * | 2015-12-18 | 2021-06-29 | 维谛公司 | System and method for rapid input and configuration of sensors for HVAC monitoring systems |
CN105744292B (en) * | 2016-02-02 | 2017-10-17 | 广东欧珀移动通信有限公司 | A kind of processing method and processing device of video data |
CN106056042B (en) * | 2016-05-19 | 2018-09-18 | 上海小蚁科技有限公司 | It generates video data transformation and indicates and analyze the method and system of video data |
US10291678B2 (en) | 2016-10-01 | 2019-05-14 | Facebook, Inc. | Architecture for augmenting video data obtained by a client device with one or more effects during rendering |
KR101938667B1 (en) * | 2017-05-29 | 2019-01-16 | 엘지전자 주식회사 | Portable electronic device and method for controlling the same |
US10511888B2 (en) * | 2017-09-19 | 2019-12-17 | Sony Corporation | Calibration system for audience response capture and analysis of media content |
WO2019203627A1 (en) * | 2018-04-20 | 2019-10-24 | 엘지전자 주식회사 | Method for transmitting and receiving audio data related to transition effect and device therefor |
US11373404B2 (en) * | 2018-05-18 | 2022-06-28 | Stats Llc | Machine learning for recognizing and interpreting embedded information card content |
CN108833431B (en) * | 2018-06-29 | 2020-11-17 | 腾讯科技(深圳)有限公司 | Password resetting method, device, equipment and storage medium |
IL279336B1 (en) * | 2018-11-11 | 2024-04-01 | Netspark Ltd | On-line video filtering |
US11748404B1 (en) * | 2019-06-17 | 2023-09-05 | Sighthound, Inc. | Computer video analytics processor |
US11238088B2 (en) | 2019-09-10 | 2022-02-01 | International Business Machines Corporation | Video management system |
CN113934886B (en) * | 2020-06-29 | 2023-08-22 | 抖音视界有限公司 | Transition type determining method and device, electronic equipment and storage medium |
CN113709563B (en) * | 2021-10-27 | 2022-03-08 | 北京金山云网络技术有限公司 | Video cover selecting method and device, storage medium and electronic equipment |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002142189A (en) * | 2000-11-06 | 2002-05-17 | Canon Inc | Image processor, image processing method, and storage medium |
JP2005064889A (en) * | 2003-08-13 | 2005-03-10 | Sony Corp | Editing system and its control method |
JP2005260749A (en) * | 2004-03-12 | 2005-09-22 | Casio Comput Co Ltd | Electronic camera and control program thereof |
JP2006157893A (en) * | 2004-10-27 | 2006-06-15 | Matsushita Electric Ind Co Ltd | Imaging device |
WO2008032739A1 (en) * | 2006-09-12 | 2008-03-20 | Panasonic Corporation | Content imaging device |
WO2010055627A1 (en) * | 2008-11-14 | 2010-05-20 | パナソニック株式会社 | Imaging device and digest playback method |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3971065A (en) | 1975-03-05 | 1976-07-20 | Eastman Kodak Company | Color imaging array |
US4642678A (en) | 1984-09-10 | 1987-02-10 | Eastman Kodak Company | Signal processing method and apparatus for producing interpolated chrominance values in a sampled color image signal |
US4774574A (en) | 1987-06-02 | 1988-09-27 | Eastman Kodak Company | Adaptive block transform image coding method and apparatus |
US5189511A (en) | 1990-03-19 | 1993-02-23 | Eastman Kodak Company | Method and apparatus for improving the color rendition of hardcopy images from electronic cameras |
US5493335A (en) | 1993-06-30 | 1996-02-20 | Eastman Kodak Company | Single sensor color camera with user selectable image record size |
US5668597A (en) | 1994-12-30 | 1997-09-16 | Eastman Kodak Company | Electronic camera with rapid automatic focus of an image upon a progressive scan image sensor |
US5828406A (en) | 1994-12-30 | 1998-10-27 | Eastman Kodak Company | Electronic camera having a processor for mapping image pixel signals into color display pixels |
JP3472659B2 (en) | 1995-02-20 | 2003-12-02 | 株式会社日立製作所 | Video supply method and video supply system |
US5652621A (en) | 1996-02-23 | 1997-07-29 | Eastman Kodak Company | Adaptive color plane interpolation in single sensor color electronic camera |
US5956026A (en) | 1997-12-19 | 1999-09-21 | Sharp Laboratories Of America, Inc. | Method for hierarchical summarization and browsing of digital video |
US6192162B1 (en) | 1998-08-17 | 2001-02-20 | Eastman Kodak Company | Edge enhancing colored digital images |
US6833865B1 (en) | 1998-09-01 | 2004-12-21 | Virage, Inc. | Embedded metadata engines in digital capture devices |
US6625325B2 (en) | 1998-12-16 | 2003-09-23 | Eastman Kodak Company | Noise cleaning and interpolating sparsely populated color digital image using a variable noise cleaning kernel |
US6462754B1 (en) | 1999-02-22 | 2002-10-08 | Siemens Corporate Research, Inc. | Method and apparatus for authoring and linking video documents |
US7356082B1 (en) | 1999-11-29 | 2008-04-08 | Sony Corporation | Video/audio signal processing method and video-audio signal processing apparatus |
AUPQ535200A0 (en) | 2000-01-31 | 2000-02-17 | Canon Kabushiki Kaisha | Extracting key frames from a video sequence |
US7055168B1 (en) | 2000-05-03 | 2006-05-30 | Sharp Laboratories Of America, Inc. | Method for interpreting and executing user preferences of audiovisual information |
GB0029880D0 (en) | 2000-12-07 | 2001-01-24 | Sony Uk Ltd | Video and audio information processing |
US7035435B2 (en) | 2002-05-07 | 2006-04-25 | Hewlett-Packard Development Company, L.P. | Scalable video summarization and navigation system and method |
WO2003101097A1 (en) * | 2002-05-28 | 2003-12-04 | Yesvideo, Inc. | Summarization of a visual recording |
CA2443365C (en) | 2002-11-19 | 2010-01-12 | F. Hoffmann-La Roche Ag | Methods for the recombinant production of antifusogenic peptides |
KR100708337B1 (en) * | 2003-06-27 | 2007-04-17 | 주식회사 케이티 | Apparatus and method for automatic video summarization using fuzzy one-class support vector machines |
US7483618B1 (en) | 2003-12-04 | 2009-01-27 | Yesvideo, Inc. | Automatic editing of a visual recording to eliminate content of unacceptably low quality and/or very little or no interest |
US20060092771A1 (en) * | 2004-10-29 | 2006-05-04 | Eastman Kodak Company | Automated method and system for creating an image storage device for playback on a playback mechanism |
JP4849818B2 (en) | 2005-04-14 | 2012-01-11 | イーストマン コダック カンパニー | White balance adjustment device and color identification device |
US8498520B2 (en) * | 2005-07-27 | 2013-07-30 | Vbrick Systems, Inc. | Video encoding and transmission technique for efficient, multi-speed fast forward and reverse playback |
US7889794B2 (en) | 2006-02-03 | 2011-02-15 | Eastman Kodak Company | Extracting key frame candidates from video clip |
US8031775B2 (en) | 2006-02-03 | 2011-10-04 | Eastman Kodak Company | Analyzing camera captured video for key frames |
US20070237225A1 (en) | 2006-03-30 | 2007-10-11 | Eastman Kodak Company | Method for enabling preview of video files |
EP2013777A2 (en) | 2006-04-20 | 2009-01-14 | Nxp B.V. | Data summarization system and method for summarizing a data stream |
US7509347B2 (en) * | 2006-06-05 | 2009-03-24 | Palm, Inc. | Techniques to associate media information with related information |
US8503523B2 (en) | 2007-06-29 | 2013-08-06 | Microsoft Corporation | Forming a representation of a video item and use thereof |
US9390169B2 (en) * | 2008-06-28 | 2016-07-12 | Apple Inc. | Annotation of movies |
US9628673B2 (en) * | 2010-04-28 | 2017-04-18 | Microsoft Technology Licensing, Llc | Near-lossless video summarization |
-
2010
- 2010-05-25 US US12/786,489 patent/US8520088B2/en active Active
-
2011
- 2011-05-17 WO PCT/US2011/036711 patent/WO2011149698A1/en active Application Filing
- 2011-05-17 JP JP2013512654A patent/JP2013533669A/en active Pending
- 2011-05-17 CN CN201180025762.1A patent/CN102906818B/en not_active Ceased
- 2011-05-17 EP EP11722963.3A patent/EP2577664B1/en not_active Not-in-force
-
2013
- 2013-08-20 US US13/970,948 patent/US9124860B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002142189A (en) * | 2000-11-06 | 2002-05-17 | Canon Inc | Image processor, image processing method, and storage medium |
JP2005064889A (en) * | 2003-08-13 | 2005-03-10 | Sony Corp | Editing system and its control method |
JP2005260749A (en) * | 2004-03-12 | 2005-09-22 | Casio Comput Co Ltd | Electronic camera and control program thereof |
JP2006157893A (en) * | 2004-10-27 | 2006-06-15 | Matsushita Electric Ind Co Ltd | Imaging device |
WO2008032739A1 (en) * | 2006-09-12 | 2008-03-20 | Panasonic Corporation | Content imaging device |
WO2010055627A1 (en) * | 2008-11-14 | 2010-05-20 | パナソニック株式会社 | Imaging device and digest playback method |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160005552A (en) * | 2014-07-07 | 2016-01-15 | 한화테크윈 주식회사 | Imaging apparatus providing video summary and method for providing video summary thereof |
KR102170694B1 (en) * | 2014-07-07 | 2020-10-27 | 한화테크윈 주식회사 | Imaging apparatus providing video summary and method for providing video summary thereof |
Also Published As
Publication number | Publication date |
---|---|
US20110292244A1 (en) | 2011-12-01 |
US8520088B2 (en) | 2013-08-27 |
EP2577664B1 (en) | 2016-03-23 |
CN102906818B (en) | 2015-09-09 |
CN102906818A (en) | 2013-01-30 |
US9124860B2 (en) | 2015-09-01 |
WO2011149698A1 (en) | 2011-12-01 |
US20130336633A1 (en) | 2013-12-19 |
EP2577664A1 (en) | 2013-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013533669A (en) | Video summary instruction metadata storage | |
JP5568178B2 (en) | How to summarize videos | |
US8446490B2 (en) | Video capture system producing a video summary | |
JP5857122B2 (en) | Video summary including features of interest | |
JP5877895B2 (en) | Video summary including a given person | |
JP5768126B2 (en) | Determining key video snippets using selection criteria | |
US8599316B2 (en) | Method for determining key video frames | |
JP5837922B2 (en) | Ranking key video frames based on camera position | |
JP5392244B2 (en) | Imaging apparatus, control method, and program | |
JP6463967B2 (en) | Imaging apparatus and control method thereof | |
JP6332963B2 (en) | Image processing apparatus and image processing apparatus control method | |
JP2014057330A (en) | Imaging apparatus, control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140516 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150519 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150630 |