JPH10509298A - 複数のビデオ画像の圧縮方法 - Google Patents
複数のビデオ画像の圧縮方法Info
- Publication number
- JPH10509298A JPH10509298A JP9512134A JP51213497A JPH10509298A JP H10509298 A JPH10509298 A JP H10509298A JP 9512134 A JP9512134 A JP 9512134A JP 51213497 A JP51213497 A JP 51213497A JP H10509298 A JPH10509298 A JP H10509298A
- Authority
- JP
- Japan
- Prior art keywords
- video
- image
- images
- parameter
- video images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/732—Query formulation
- G06F16/7328—Query by example, e.g. a complete video frame or video sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Auxiliary Devices For And Details Of Packaging Control (AREA)
- Color Television Systems (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
(57)【要約】
複数の画素を特徴とするビデオ画像は、主要構成要素の分析に基づいて少なくとも1つのパラメータを引き出すことにより圧縮される。それから、あるパラメータに関して各ビデオ画像の画像値が求められる。差異を決定するために、各ビデオ画像に結び付いた画像値が別のビデオ画像と結び付いた画像値に比較される。差異が閾値を下回る場合、各ビデオ画像および別のビデオ画像の画像値の内の任意の1つが破棄される。その後で残りの画像が記憶される。この圧縮法を使用すると、照会を行うビデオシーンと、それぞれのビデオシーンが複数のビデオ画像を含む複数のビデオシーンを記憶するビデオデータベースとの一致を見つけるためにビデオデータベースを検索することが可能になる。
Description
【発明の詳細な説明】
複数のビデオ画像の圧縮方法
技術分野
本発明は、結果として生じる圧縮済みビデオ画像が、従来の技術による圧縮方
法より少ない記憶容量を必要とするように、複数のビデオ画像(ビデオシーン)
を圧縮する方法に関する。さらに、本発明は、削減された数の画像又はつまり「
重要な」画像を表示し、圧縮されたビデオ画像を効率的に表示し、それによりビ
デオシーンの内容の(例えば、ユーザが見ることによる)検索を簡略化する。重
要な画像は、ビデオシーンの索引または目次と同様に動作する。
発明の背景
従来の技術で周知であるように、ビデオ画像は、デジタル化された場合、大量
の記憶容量を必要とする。映画のような複数のビデオ画像(以降「ビデオシーン
」と称する)は、圧縮されない場合、数百のメガバイトまたはギガバイトもの記
憶容量を必要とする。
ビデオシーンを圧縮する多数の方法は、従来の技術でも周知である。従来の技
術による1つの方法とは、ビデオシーンのすべての画像に関して主要な構成要素
の分析によりパラメータを引き出す方法である。各画像にN個の画素があると仮
定してみる。その後で、ビデオ画像ごとに、主要な構成要素の分析により選択さ
れるパラメータに基づいた画像値が求められる。したがって、あるパラメータの
結果として生じる記憶容量要件とは、そのパラメータの構成要素値(つまりN個
の値)と各ビデオ画像に対応する1つの画像値でいっぱいの1つの画像となる。
ビデオ画像に複数のパラメータが引き出される場合、必要とされる記憶容量の総
量はそれに応じて乗算される。
しかしながら、この方法を用いた場合にさえ、映画のようにビデ
オシーンに多くのビデオシーンが含まれる場合には、ビデオ画像のそれぞれに対
応するパラメータの1つの値に必要とされる記憶容量は依然として大きなものと
なる。ビデオ画像は、毎秒30回のようにかなり速い速度で表示されるので、2
時間のビデオ映画は216,000ビデオ画像(2x60x60x3)を必要とし、標
準TV方式では50ギガバイトの記憶容量を必要とする。したがって、この方法
に基づくと、1つのパラメータには、依然として、主要構成要素分析により引き
出されるN数のパラメータ構成要素値、およびビデオ画像のそれぞれに1つの画
像値が設定される216,000の画像値が必要とされる。
さらに、圧縮されていないビデオ画像と比較される場合、記憶容量要件はこの
方法により削減されるが、このビデオシーンのビデオ画像のレビューまたはブラ
ウズには、216,000画像のような画像の集合体全体が必要とされる。ユーザにと
って、表示された画像の集合体全体を表示もしくは検索することは、非効率かつ
厄介である。ビデオシーンのビデオ画像の集合体全体をブラウズしたり、最良の
ものを採取するには、相当量の時間と努力が要求される。
従来の技術の別の圧縮方法とは、基準フレームとしてビデオ画像から画像のい
くつかを選択する方法である。それ以降の画像または先行する画像が基準フレー
ムに比較され、差異または変更が記憶される。したがって、基準フレームおよび
それに対する変更のデータだけしか記憶する必要はない。
しかし、このような従来の技術による方法においては、n番目のフレームに基
づいて基準フレームが選択される。したがって、基準フレームの選択は最適化さ
れていない。
情報を捕捉するためにビデオ画像を使用することがさらに一般化するに伴い、
複数のビデオ画像、つまりビデオシーンを効率的に記憶、表示、および検索する
ための方法を見つけ出す必要がある。表示されたビデオ画像の集合体は、高速検
索を可能とする方法で分類
されなければならない。このように、記憶容量を最小限に抑えるためにはビデオ
画像の圧縮が重要であるだけではなく、方法により圧縮されたビデオ画像の表示
および高速検索もさらに容易にならなければならない。
したがって、本発明は、ビデオシーンからビデオ画像を表示、検索するより効
率的な方法を可能とするだけではなく、記憶容量要件を最小限に抑えるために、
ビデオ圧縮の問題に対処する。
発明の概要
本発明においては、複数のビデオ画像が圧縮される。各画像は複数の画素によ
って特徴づけられる。方法は、複数のビデオ画像に少なくとも1つのパラメータ
を引き出すステップを含む。その1つのパラメータは、主要な構成要素の分析に
基づいて引き出すことができる。画像値は、その1つのパラメータのビデオ画像
ごとに求められる。各ビデオ画像に結び付いた画像値は、差異を求めるために別
のビデオ画像に結び付いた画像値に比較される。差異は、固定されたまたは適当
な閾値に比較される。差異が閾値を下回る場合、画像値の内の1つだけが記憶さ
れる。記憶された画像値に対応するビデオ画像を、表示、検索することができる
。
前記方法は、複数のビデオ画像が記憶されるビデオデータベースの圧縮に使用
できる。1つまたは複数の「重要な」ビデオ画像が、前述の方法により選択され
る。ビデオデータベースの他のすべてのビデオ画像が「重要な」ビデオ画像と比
較され、差異が記憶される。「重要な」ビデオ画像はそれだけで、あるいは主要
構成要素分析画像および求められたパラメータ値も記憶される。この圧縮に基づ
き、ビデオデータベースのすべてのビデオ画像が忠実に復元できる。
本発明の別の方法においては、ビデオデータベースには、各データベース要素
がビデオシーンである複数のデータベース要素が記憶される。各ビデオシーンは
、前記圧縮法に基づいて圧縮される。ビ
デオデータベースは、やはり複数のビデオ画像を含む照会ビデオシーンとの一致
を見つけ出すために検索される。照会ビデオシーンも、前記圧縮法によって圧縮
できる。照会ビデオシーンとビデオデータベースのビデオシーンの1つとの一致
を見つけ出すために、照会ビデオシーンに結び付いた記憶済みの画像値が、ビデ
オデータベースの各ビデオシーンに結び付いた記憶された画像値に比較される。
図面の簡単な説明
図1は、主要構成分析に基づくビデオ画像を圧縮するための従来の技術の方法
を示す模式図である。
図2は、複数のビデオ画像が従来の技術による主要圧縮分析方法により圧縮さ
れた後の本発明の改善された方法を示す模式図である。
図3は、映画のような複数のビデオ画像を圧縮および記憶するために使用され
る本発明の方法を説明する模式図である。
図4は、照会を行うビデオシーンと、そのそれぞれがビデオシーンを構成する
ビデオデータベースの要素の内の1つの間の一致を決定するためにビデオデータ
ベースを検索する方法の概要図である。
図5は、ビデオシーンからビデオ画像の集合体を効率的かつ迅速に表示、検索
するための本発明の方法の絵による表示である。
図6は、本発明の方法に従い、重要な画像パラメータでビデオ画像を判断する
ための本発明の方法のフローチャートである。
図7は、図6に図示される方法に従い決定される重要な画像パラメータが設定
されるビデオ画像(つまり基準画像)を使用して複数のビデオ画像を圧縮するた
めの本発明の方法のフローチャートである。
図8は、本発明のさまざまな方法およびその使用の概要である。
発明の詳細な説明
図1を参照すると、従来の技術のビデオシーンの圧縮方法の模式
図が図示されている。ビデオシーンは、F1...FMとラベルが付けられた複数の
ビデオ画像つまりビデオフレームから成る。ビデオ画像のそれぞれには、P1...
PNとラベルが付けられた複数の画素がある。ビデオ画像の集合体がビデオシー
ンと呼ばれる。
従来の技術においては、ビデオシーンの主要構成要素パラメータを引き出すた
めに、主要構成要素分析の方法を使用することは既知である。この方法では、複
数のビデオ画像F1...FMに1つのパラメータを選択する。パラメータの例には
、輝度、またはある特定の色、色合い、または空間周波数などが含まれる。それ
から、その1つの選択されたパラメータに関して、N個の構成要素のような構成
要素でいっぱいの画像が引き出される。このようにして、構成要素値C1...CN
が引き出される。それから、選択されたパラメータ構成要素Cのビデオ画像ごと
に画像値I1...IMを求めることによって、ビデオ画像F1...FMのそれぞれが圧
縮される。画像値Ikは、以下に基づき引き出される。
この場合、Jは画素番号に対するインデックスであり、PkjはフレームFk内の
J番目の画素の値である。
前記から、M個のビデオ画像から成るビデオシーンには、主要構成要素分析に
より選択される構成要素のデータ(つまりN個の値)および画像値Ikが各ビデ
オ画像Fkに結び付いたM個の画像値でいっぱいの1つのビデオ画像が必要とな
ることが分かる。前記のように、2時間から構成される映画のように、ビデオシ
ーンが長く、ビデオ画像のそれぞれが毎秒の30分の1で表示される場合、216,
000(2x60x60x30)ビデオ画像が存在する。したがって、複数のビデ
オ画像から成るビデオシーンを圧縮するために主要構成要素分析の従来の技術に
よる技法を使用しても、シーンが長い場合、
主要構成要素分析から引き出されるパラメータごとに、相当量の記憶容量が必要
となる。さらに、216,000のビデオ画像の表示、概観または検索には、記憶容量
要件の削減に関係なくかなりの量の作業が必要となる。
図2を参照すると、本発明の望ましい方法が模式的に図示されている。本発明
の望ましい方法は、別のパラメータが使用される同じビデオ画像から成るさまざ
まな領域に対して局所的に、あるいは同じパラメータがビデオ画像全体で使用さ
れる大局的に、主要構成要素分析が実行される、主要構成要素分析方法を使用し
て、ビデオシーンを圧縮するという記憶容量要件を削減する。しかし、理解され
るように、本発明の方法は、主要構成要素分析の技法により制限されていない。
例えば、離散コサイン変換、Gaborフィルタ、およびwaveletsにより引き出され
る画像値も使用できる。ただし、主要構成要素分析を使用すれば、任意の数のパ
ラメータが作成される。最初、この議論は、1つのパラメータに適用される本発
明の方法に集中する。しかし、明らかになるように、本発明の方法は、主要構成
要素分析により引き出される複数のパラメータに基づいた圧縮に適用できる。
以前と同様に、主要構成要素分析に基づく圧縮方法を使用した結果、M個の画
像値が得られる結果になると仮定する。これらはI1、I2、I3...IMとして示
される。
それ以降、ビデオ画像Fkに結び付いた各画像値Ikは、ビデオ画像Fkに時間
的にすぐ隣接するビデオ画像Fk+1に結び付いた画像値Ik+1に比較される。2つ
の画像値の間の差異の絶対値が得られ、閾値の数値に比較される。2つの画像値
の間の差異が閾値を下回る場合、つまり、
|Ik-Ik+1|≦T の場合、画像値IkまたはIk+1のどちらかが破棄される。残
りの画像値が記憶される。理解されるように、閾値Tは固定された閾値または適
当な閾値となる。これは、
次に示す例で確認することができる。本発明の方法は、I1をI2に比較すること
により開始する。2つの画像値の間の差異の絶対値が閾値を下回る場合、I2が
保存されると想定する。それから、保存された画像値I1が時間的にすぐに隣接
するビデオ画像F3に結び付いた画像値I3に比較される。再び、差異の絶対値が
事前に決定された閾値を下回る場合、方法はI1またはI3のどちらかを破棄する
。再び、I1が保存されると想定してみる。この技法は、I1が、画像値の残りの
すべて、つまりI2からIMに比較されるまで続行する。
方法は、破棄されていなかった次の画像値Ikを選択することによって続行す
る。I4は記憶または保存されたI1にすぐ隣接する次の画像値である。I4は、
それから、残りの画像値のすべてがI4に比較されるまで、残りの画像値のそれ
ぞれに比較される。このプロセスは、残りの画像値の残りのすべてが互いに比較
されるまで続行する。
例えば別の画像値Ijに比較されるIkのようなある特定の画像値が閾値以上の
場合、どちらの画像値も破棄されない。比較は、Ikを採取し、それを、時間的
にそれの隣接するビデオ画像に結び付いた画像値Ij+1に比較することによって
続行する。
前記から、閾値を超える大きさの変更のある画像値Ikだけが保存されること
が分かる。複数の画像値の圧縮は、時間的にすぐに隣接する時間画像値に値的に
近いそれらの画像値を破棄することにより得られる。
前記方法は、時間的にそれにすぐ隣接するビデオ画像に対応する別の画像値Ik+1
に画像値Ikを比較することに関して説明したが、本発明の方法がそのように
制限されていないことは容易に理解できる。画像値Ikは、時間的にすぐ隣接す
るビデオ画像に結び付いた画像値Ik+1に比較する必要はない。IkはIk+2また
は、例えば、時間的にそれにすぐ隣接していない画像値を表すIk+3にも比較で
きる。
さらに、本発明の方法は、複数の異なったパラメータが主要構成
要素分析方法により引き出される従来の技術の主要構成要素分析方法で使用でき
る。例えば、このようにして、ビデオ画像F1...FMから成るビデオシーンは、
複数のパラメータCk(この場合、kには1、2などの値を設定できる)を引き
出すために、主要構成要素分析によって圧縮できる。パラメータCkのそれぞれ
に関して、画像値がビデオ画像F1...FMごとに引き出される。したがって、例
えば3つのパラメータが引き出されると、ビデオ画像F1...FMから成るビデオ
シーンは、以下に圧縮される。
(1)1つの構成要素値C11...C1Nおよびビデオ画像F1...FMの内の1つに結
び付いた画像値I11...IMでいっぱいの1つの画像
(2)1つの構成要素値C21...C2Nおよびビデオ画像F1...FMの内の1つに結
び付いた画像値I21...I2Mでいっぱいの1つの画像
(3)1つの構成要素値C31...C3Nおよびビデオ画像F1...FMの内の1つに結
び付いた画像値I31...I3Mでいっぱいの1つの画像
複数のパラメータが主要構成要素分析により引き出される場合、本発明の方法
は、以下に従い時間的にすぐ隣接するビデオ画像に結び付いた画像値の差異を計
算することによって、これらの複数のパラメータをさらに圧縮する。
kは、複数のパラメータに対するインデックスである。
Pは、パラメータの総数である。
Iikは、画像値Iiのkパラメータである。
Ijkは、画像値Ijのkパラメータである。
Wkは、パラメータkの加重因数である。
すべてのパラメータに対し、Wkは同じであるか、あるいは異なり、各パラメ
ータに違う様に重みを付ける場合がある。さらに、前記のように、画像値Iiお
よびIjのそれぞれは、時間的にすぐに隣接するビデオ画像FiとFjに結び付け
ることができるか、時間的にはす
ぐに隣接しない。
前記等式は、複数のパラメータを使用するさらなる圧縮に関して開示されたが
、本発明の方法は、画像値が主要構成要素分析により引き出されるかどうかに関
係なく、2つの画像値の差異を計算するそれ以外のアルゴリズムにより計算でき
る。
さらに、これまで説明したように差異を計算した結果、差異が事前に決定され
た閾値を下回る場合は、ビデオ画像値の一方は記憶され、もう一方の画像値は記
憶されない。結果として、ビデオ画像値のストリームのさらなる圧縮が生じる。
前記のように、閾値Tは、固定されたまたは適当な閾値とすることができる。
前記方法は、固定された閾値の使用を説明した。代わりに、本発明の方法では、
適当な閾値を提供し、ユーザ(またはコンピュータ)が記憶される画像値の数(
および対応してビデオ画像の数)を指定できるようにする。ユーザまたはコンピ
ュータは、記憶される画像値の数を、直接、または、その画像値が記憶されるビ
デオ画像を表示するための時間量を指定することにより間接的に指定することが
できる。後者の例では、ユーザは、2時間のビデオ映画の場合、例えば、表示さ
れる画像値の5分のセグメントを指定できる。したがって、(5x60x30=
9000)画像値が記憶される。
方法は、その差異を見つけ出すために、最初にすべての連続ビデオ画像の画像
値を比較することによって進行する。過去の例を使用して、画像値は、I1、I2
、I3...IMとしてラベルが付けられる。それ以降、ビデオ画像Fkに結び付いた
各画像値Ikは、時間的にビデオ画像Fkのすぐ隣に隣接するビデオ画像Fk+1に
結び付いた画像値Ik+1に比較される。2つの画像値の間の差異の絶対値が得ら
れる。つまり、D1(=|I1−I2|), D2(=|I2−I3|), D3...DM-1
(=|IM-1−IM|)となり、この場合Dが差異である。それから、最小差
異Dが選択され、それに対応する画像値の内の1つが保存される。このように、
例えば、D2が最小差異である場合、
I2またはI3が保存される。ここでは、I3が保存されると仮定する。
それから、残りの差異Dの内、次に最小の差異、つまりD3が選択され、画像
値の内の1つが破棄される。
代わりに、残る連続画像値Iの間の差異が計算し直され、最小差異が選択され
る。このようにして、前記例の場合、以下の差異が計算される。
D1(=|I1−I3|)
D3(=|I3−I4|)
D4...DM-1(=|IM-1−1M|)
最小差異が選択され、画像値の内の1つが保持される。
どちらかの場合、このプロセスは希望数のビデオ画像が残るまで繰り返される
。これにより、閾値を事前に指定する問題は排除され、閾値をビデオシーンのビ
デオコンテンツに基づいて適応して選択できるようになる。これは、ビデオシー
ンが四十九(49)のビデオ画像から成り、本発明の圧縮法を使用し、ユーザが
四(4)つのビデオ画像の希望の結果を指定する場合に四(4)つの画像がその
ように決定される図5を参照することにより確認できる。
図6を参照すると、本発明の前記に説明した方法に従い、重要な画像パラメー
タが設定されたビデオ画像、つまり「重要な」画像を選択したものを決定する方
法のフローチャートが図示されている。
前記から分かるように、本発明の圧縮方法は、ビデオシーンの記憶容量要件を
大きく削減する。しかし、加えてさらに重要なことには、この方法により、容易
に表示、ブラウズ、または検索が可能な少ない数のビデオ画像が生じる。表示さ
れる選択済みのビデオ画像には、ビデオ画像のストリーム内の「変更」の大部分
の量を示すビデオ情報が含まれる。表示される選択済みビデオ画像は、テキスト
作業の場合の索引または目次に類似する。このようにして、ビデオシーンの検索
またはブラウズは、大幅に簡略化できる。
ビデオシーン内のビデオコンテンツにおける変更の大部分の量を
表す「重要な」ビデオ画像の表示が、主要な構成要素分析により圧縮されるビデ
オ画像に基づく必要がないことに注記する必要がある。例えば、この方法をビデ
オ画像ごとに任意の数のパラメータを決定するそれ以外の方法に基づかせること
もできる。それ以降は、これまでに説明したように、連続画像値を比較し、(固
定された閾値または適当な閾値のどちらかを使用し)差異が小さい場合には画像
値の内の1つを破棄すると、多くの「重要な」画像値が計算される。「重要な」
画像値に対応するビデオ画像が表示できる。
いったん「重要な」画像値が求められると、それらの「重要な」画像値に対応
するビデオ画像は、(映画のような)複数のビデオ画像の、その中から圧縮され
ていない複数のビデオ画像を忠実度を大きく失うことなく再生できる圧縮済みデ
ータに圧縮するための索引画像として使用できる。
図3を参照すると、映画のような複数のビデオ画像を圧縮、記憶するために使
用される本発明の方法の模式図が図示されている。映画がZ個のフレームから構
成されると仮定すると、F1...Fc...Fj...FM...Fz数のビデオ画像又はフレ
ーム画像がある。フレームFC、Fj、FMおよびJzは、索引画像、つまりその重
要な画像値が前述された方法に従って求められたビデオ画像である。それ以降、
索引画像にもっとも近い各ビデオ画像が比較される。このように、
|F1−Fc|,...|Fc-1−Fc|,Fc,
|FC+1−Fj|,...
が計算される。これは、さまざまなビデオ画像と索引画像の間の差異が「画素ご
とに」計算されるという点で従来の技術による方法に類似する。それから、この
差異が索引画像とともに記憶される。代わりに、索引画像および主要構成要素分
析画像を表す「重要な」画像値とともに差異が記憶される。この圧縮技法により
、ビデオベースのすべてのビデオ画像は忠実に再生できる。この方法のフローチ
ャートは、図7に示される。
前記から分かるように、基準フレームが設定されたN個の各フレームに基づい
て選択される従来の技術による方法とは異なり、本発明のビデオデータベースの
圧縮方法は、時間的に特定位置にある基準画像または索引画像の選択を制限しな
い。本発明の方法の利点は、以下の例により確認できる。ここでは、以下に従っ
た17のビデオ画像があると仮定する。
I1,I2,I3,I4,......I17
さらに、画像I4とI5の間、および画像I12とI13の間が大量の変更(例えば
、あるカメラから別のカメラまでを使用することによるあるシーンから別のシー
ンへのシーンの突然の変更など)を表すと仮定する。I1とI4の間では、カメラ
1は固定位置にあるか、画像間の差異が最小である「パン撮り」を行う。最後に
、I13とI17の間にも最小の変更があると仮定される。したがって、画像から構
成される3つのビデオシーン
I1−14、I5−I12、およびI13−I17
が存在する。
本発明の方法を使用し、画像I1、I5、およびI13が、索引画像または基準画
像、つまりその「重要な」画像値がこれまでに説明した方法に従って決定される
画像であると決定される。画像I1−I17の圧縮とは、I1とI2...I4のそれぞ
れの間の差異を見つけ出し、その差異を記憶し、I5とI6...I1のそれぞれの間
の差異を見つけ出し、その差異を記憶し、I13とI14...I17のそれぞれの間の
差異を見つけ出し、その差異を記憶することである。さらに、言うまでもなく、
I1、I5およびI13は、画像またはそれらの引き出し元の主要構成要素分析のど
ちらかとして記憶される。
対照的に、従来の技術の方法では、設定された数の画像が基準画像として選択
される。したがって、例えば、八(8)番目のフレームごとに、つまりI1、I9
、およびI17が索引画像または基準画像として選択されると、ビデオ画像データ
内に大きな変更があるため、
I1とI5の間の差異が膨大な差異を作成する。同様に、I9とI13の間の差異は
、ビデオデータ内での大きな変更を必要とする。
対照的に、基準画像として最大変更が設定される画像を使用することにより、
圧縮は最適化できる。
さらにビデオ画像を圧縮し、記憶容量要件を削減することにより、本発明の方
法を使用すると、ビデオデータベースを検索することが本発明の別の方法で可能
となる。ビデオデータベースには複数のデータベース要素が記憶され、各データ
ベース要素が複数のビデオ画像から成るビデオシーンである。各ビデオデータベ
ース要素は、これまでに説明した本発明の方法により圧縮される。しかし、前記
説明と同様に、主要構成要素分析から、ビデオ画像ごとに任意の数のパラメータ
を引き出す必要はない。照会を行うビデオシーンも、複数のビデオ画像から成る
。本発明の方法により、照会ビデオシーンとビデオデータベースのビデオシーン
の間の一致を見つけ出すために、ビデオデータベースが検索できるようになる。
照会ビデオシーンは、これまでに説明した本発明の方法に従って圧縮できる。
照会を行うビデオシーンとビデオデータベース要素の内の1つの間に一致が発
生するかどうかを判断するために、照会ビデオシーンと結び付いた記憶済み画像
値が、画像値間で一致を見つけるための各ビデオデータベース要素に結び付いた
記憶済み画像値に比較される。一致を比較する1つの方法は、正確な一致を見つ
け出すことである。しかし、たいていの場合これは不可能である。別の技法は、
ビデオデータベースのビデオシーンのそれぞれのビデオ画像値との照会ビデオシ
ーンのビデオ画像値の統計的な一致を見つけ出す方法である。例えば、以下の比
較を行うことができる。
この場合、kは複数のパラメータのインデックスであり、iは記
憶された複数の画像値のインデックスである。
Pはパラメータの総数である。Lは記憶された画像値の総数である。
VIikは、ビデオデータベースからの画像値Iiのkパラメータである。
Iikは、照会ビデオシーンからの画像値Iiのkパラメータである。
Wkは、パラメータkの加重因数である。
計算された値が閾値を少し下回る場合、一致が宣言される。本発明のこの方法を
使用すると、「ビデオクリップ」に基づいて、ソースまたは「ビデオクリップ」
の出現元であるビデオデータベース要素を決定できるようになる。
ビデオデータベースを事前圧縮する必要がないことは言うまでもない。したが
って、ビデオデータベースは、照会ビデオ画像が圧縮されると同時に圧縮できる
。
代わりに、それぞれがビデオシーンである複数のデータベース要素を記憶する
ビデオデータベースの検索は、以下のような適応型技法に基づいて達成できる。
ユーザが、ビデオデータベース要素の内の1つに対する検索一致を処理するため
に喜んで時間期間Tの間待機し、プロセッサが既知の速度/機能を有する場合、
その時間期間Tは、ビデオ画像のS数の比較に変換できる。これまでに説明した
適応型比較方法を使用すると、ビデオデータベースのビデオシーンのそれぞれは
、ビデオ画像のS数および画像値のS数に圧縮できる。それから、ビデオデータ
ベース要素のそれぞれに関して、照会ビデオシーンの画像値と画像値S数が比較
される。その場合、最小総差異が設定されるビデオデータベース要素が、照会ビ
デオシーンと選択されたビデオデータベース要素の間のもっとも近い一致である
。照会ビデオシーンは、ビデオデータベース要素の同じ数のビデオ画像に圧縮で
きるが、圧縮する必要はない。さらに、従来の技術による検索アルゴリズムは、
照会ビデオシーンを圧縮済みビデオ画像と
比較するために使用できる。
前記から、本発明の方法を使用すると、複数のビデオ画像から成るビデオシー
ンが、記憶容量要件を節約するために大幅に圧縮できることが分かる。さらに、
記憶容量要件の削減が行われると、データベースを検索し、照会ビデオシーンに
一致するビデオデータベース要素を決定するために、ビデオデータベースへの圧
縮済みビデオシーンの照会を効率的に表示および検索できるようになる。
望ましい実施例においては、本発明の方法は、カリフォルニア、マウンテンビ
ューにあるシリコン・グラフィック社製のシリコン・グラフィックス・ワークス
テーション上で動作するコンピュータプログラムにより実施される。本発明のさ
まざまな方法の概要は、図8に示される。
Claims (1)
- 【特許請求の範囲】 1.各画像が複数の画素を特徴とする複数のビデオ画像を圧縮する方法であって 、 前記複数のビデオ画像に少なくとも1つのパラメータを引き出す工程、 前記1つのパラメータに関してビデオ画像ごとに画像値を求める工程、 差異を決定するために各ビデオ画像に結び付いた画像値を別のビデオ画像に結 び付いた画像値に比較する工程、および 前記差異が閾値を下回る場合に、前記各ビデオ画像および前記別のビデオ画像 の画像値の任意の1つを設定しないで、前記複数のビデオ画像に結び付いた複数 の画像値を記憶する工程 からなる方法。 2.前記別のビデオ画像が時間的に前記各ビデオ画像にすぐ隣接する請求項1に 記載の方法。 3.前記別のビデオ画像が時間的に前記各ビデオ画像に隣接しない請求項1に記 載の方法。 4.前記引き出す工程が、そのそれぞれが主要構成要素分析により引き出される 複数の異なるパラメータを引き出す方法。 5.前記主要構成要素分析が、各ビデオ画像の別の部分の別のパラメータで局所 的に実行される請求項4に記載の方法。 6.前記主要構成要素分析が、各ビデオ画像全体に使用される同じパラメータで 大局的に実行される請求項4に記載の方法。 7.前記決定工程が、1つのパラメータに結び付いた1つの画像値で、ビデオ画 像ごとに複数の画像値を決定する請求項6に記載の方法。 8.前記比較工程が以下に応じて前記差異を計算する請求項7に記載の方法: ここで、kは複数のパラメータのインデックスであり、 Pはパラメータの総数であり、 Iikは画像値Iiのkパラメータであり、 Ijkは画像値Ijのkパラメータであり、 Wkはパラメータkの加重因数である。 9.すべてのパラメータkの前記加重因数Wkのそれぞれが同じである請求項8 に記載の方法。 10.すべてのパラメータkの前記加重因数Wkのそれぞれが同じではない請求 項9に記載の方法。 11.IiおよびIjが時間的にすぐに隣接するビデオ画像に対応する画像値であ る請求項8に記載の方法。 12.IiおよびIjが時間的にすぐに隣接しないビデオ画像に対応する画像値で ある請求項8に記載の方法。 13.前記閾値が固定される請求項1に記載の方法。 14.前記閾値が適応して設定される請求項1に記載の方法。 15.前記1つのパラメータが離散コサイン変換により引き出される請求項1に 記載の方法。 16.前記1つのパラメータがGaborフィルタにより引き出される請求項1に記 載の方法。 17.前記1つのパラメータがwaveletsにより引き出される請求項1に記載の方 法。 18.複数のビデオ画像をさらに少ない数の重要な画像に圧縮する方法であって 、前記少ない数の重要な画像の数が指定され、各画像が複数の画素を特徴とし、 前記方法が、 前記複数のビデオ画像に少なくとも1つのパラメータを引き出す工程、 前記1つのパラメータに関して各ビデオ画像ごとの画像値を求める工程、 各ビデオ画像に結び付いた画像値を、別のビデオ画像に結び付いた画像値に比 較することにより、複数の差異を計算する工程、 最小差異および前記最小差異の画像値と結び付いたビデオ画像の1つを破棄す る工程、および ビデオ画像の数が、前記少ない数の重要な画像に等しいままとなるまで、前記 破棄する工程を継続する工程 からなる方法。 19.前記別のビデオ画像が前記各ビデオ画像に時間的にすぐ隣接する請求項1 8に記載の方法。 20.前記引き出す工程が、そのそれぞれが主要構成要素分析により引き出され る複数の異なるパラメータを引き出す請求項18に記載の方法。 21.前記主要構成要素分析が各ビデオ画像の別の部分に別のパラメータで局所 的に実行される請求項20に記載の方法。 22.前記主要構成要素分析が各ビデオ画像の全体に使用される同じパラメータ で大局的に実行される請求項20に記載の方法。 23.前記決定する工程が、1つのパラメータと結び付いた1つの画像値で、各 ビデオ画像に複数の画像値を求める請求項22に記載の方法。 24.前記計算する工程が、以下に従い前記差異を計算する請求項23に記載の 方法: kは複数のパラメータのインデックスであり、 Pはパラメータの総数であり、 Iikは、画像値Iiのkパラメータであり、 Ijkは、画像値Ijのkパラメータであり、 Wkは、パラメータkの加重因数である。 25.すべてのパラメータkの前記加重因数Wkのそれぞれが同じで ある請求項24に記載の方法。 26.すべてのパラメータkの前記加重因数Wkのそれぞれが同じではない請求 項25に記載の方法。 27.IiおよびIjが時間的に隣接するビデオ画像に結び付いた画像値である請 求項24に記載の方法。 28.IiおよびIjが時間的に隣接しないビデオ画像に結び付いた画像値である 請求項24に記載の方法。 29.前記1つのパラメータが離散コサイン変換により引き出される請求項18 に記載の方法。 30.前記1つのパラメータがGaborフィルタにより引き出される請求項18に 記載の方法。 31.前記1つのパラメータがwaveletsにより引き出される請求項18に記載の 方法。 32.重要な画像の数がユーザにより指定される請求項18に記載の方法。 33.重要な画像の数がコンピュータにより指定される請求項18に記載の方法 。 34.ユーザが、複数のビデオ画像を、前記複数のビデオ画像をさらに少ない数 の重要な画像に圧縮することによりブラウズする方法であって、前記さらに少な い数の重要な画像が指定され、各画像が複数の画素を特徴とし、前記方法が、 前記複数のビデオ画像に少なくとも1つのパラメータを引き出す工程、 前記1つのパラメータに関してビデオ画像ごとに画像値を求める工程、 各ビデオ画像に結び付いた画像値を別のビデオ画像に結び付いた画像値に比較 することにより、複数の差異を計算する工程、 最小差異および前記最小差異の画像値に結び付いたビデオ画像の1つを破棄す る工程、および ビデオ画像の数が前記さらに少ない数の重要な画像に等しいままとなるまで前 記破棄する工程を続行する工程 からなる方法。 35.さらに、ブラウズのために前記ユーザに、廃棄工程の後に残るビデオ画像 を表示する工程からなる請求項34に記載の方法。 36.さらに、印刷のために前記ユーザに、廃棄工程の後に残るビデオ画像を印 刷する工程からなる請求項34に記載の方法。 37.それぞれのシーンに複数のビデオ画像があり、前記ビデオ画像のそれぞれ が複数の画素を特徴とする複数のビデオシーンを記億するビデオデータベースに おいて、第1の複数のビデオ画像に対する一致を見つけるために前記ビデオデー タベースを検索する方法であって、前記方法が、 前記1つのパラメータのビデオ画像ごとに画像値を求め、 差異を決定するために、各ビデオ画像に結び付いた画像値を別のビデオ画像に 結び付いた画像値に比較し、 前記差異がスレッショルトを下回る場合には、前記各ビデオ画像と前記別のビ デオ画像の画像値の内の任意の1つなしに、前記ビデオシーンに前記複数のビデ オ画像に結び付いた複数の画像値を記憶する ことにより、前記ビデオの各ビデオシーンのビデオ画像を圧縮する工程、および 前記第1の複数のビデオ画像と前記ビデオシーンの内の1つの間に一致を見つ け出すために、前記第1の複数のビデオ画像に結び付いた前記画像値を各ビデオ シーンに結び付いた前記記憶された画像値に比較する工程 からなる方法。 38.前記別のビデオ画像が前記各ビデオ画像に時間的にすぐ隣接する請求項3 7に記載の方法。 39.前記別のビデオ画像が前記各ビデオ画像に時間的に隣接しな い請求項37に記載の方法。 40.前記引き出す工程が、そのそれぞれが主要構成要素分析により引き出され る複数のさまざまなパラメータを引き出す請求項37に記載の方法。 41.前記決定する工程が、1つのパラメータに結び付いた1つの画像値で、ビ デオ画像ごとに複数の画像値を決定する請求項40に記載の方法。 42.前記比較する工程が、以下に従い前記差異を計算する請求項37に記載の 方法: ここで、kは複数のパラメータに対するインデックスであり、 Pはパラメータの総数であり、 Iikは画像値Iiのkパラメータであり、 Ijkは画像値jのkパラメータであり、 Wkはパラメータkの加重因数である。 43.すべてのパラメータkの前記加重因数Wkのそれぞれが同じである請求項 42に記載の方法。 44.すべてのパラメータkの前記加重因数Wkが同じではない請求項42に記 載の方法。 45.IiおよびIjが時間的にすぐ隣接するビデオ画像に結び付いた画像値であ る請求項42に記載の方法。 46.IiおよびIjが時間的にすぐ隣接しないビデオ画像に結び付いた画像値で ある請求項42に記載の方法。 47.さらに、 前記1つのパラメータが主要構成要素分析により引き出される、前記第1の複 数のビデオ画像に少なくとも1つのパラメータを引き出し、 前記1つのパラメータに関してビデオ画像ごとの画像値を求め、 差異を決定するために、ビデオ画像に結び付いた画像値を別のビデオ値に結び 付いた画像値に比較し、 前記差異が閾値を下回る場合、前記各ビデオ画像および前記別のビデオ画像の 画像値の内の任意の1つを設定しないで、前記第1の複数のビデオ画像に結び付 いた複数の画像値を記憶する ことにより前記第1の複数のビデオ画像を圧縮する工程からなる請求項37に記 載の方法。 48.各シーンに複数のビデオ画像があり、各ビデオ画像のそれぞれが複数の画 素を特徴とする複数のビデオシーンを記憶するビデオデータベースにおいて、第 1の複数のビデオ画像に対する一致を見つけるために前記ビデオデータベースを 検索するための方法であって、前記方法が、 前記ビデオシーンに前記1つのパラメータのビデオ画像の画像値を求め、 前記ビデオシーンの各ビデオ画像に結び付いた画像値を、前記ビデオシーンの 別のビデオ画像に結び付いた画像値に比較することにより複数の差異を計算し、 最小差異および前記ビデオシーンの前記最小差異の画像値に結び付いたビデオ 画像の1つを破棄し、 ビデオ画像の数が前記より少ない数の重要な画像に等しいままとなるまで前記 破棄する工程を続行し、 残った前記ビデオ画像およびその画像値を記憶する ことによって各ビデオシーンのビデオ画像を圧縮する工程、および 前記第1の複数のビデオ画像と前記ビデオシーンの1つの間の一致を見つける ために、前記第1の複数のビデオ画像に結び付いた前記画像値を各ビデオシーン に結び付いた前記記憶された画像値に比較する工程 からなる方法。 49.シーンごとの前記別のビデオ画像が時間的に前記各ビデオが すぐに隣接する請求項48に記載の方法。 50.シーンごとの前記別のビデオ画像が前記各ビデオ画像に時間的に隣接しな い請求項48に記載の方法。 51.前記1つのパラメータが主要構成要素分析により引き出される請求項48 に記載の方法。 52.さらに、 前記第1の複数のビデオ画像に少なくとも1つのパラメータを引き出し、 前記1つのパラメータに関してビデオ画像ごとに画像値を求め、 各画像値に結び付いた画像値を別のビデオ画像に結び付いた画像値に比較する ことによって、複数の差異を計算し、 最小差異および前記最小差異の画像値に結び付いたビデオ画像の内の1つを破 棄し、 ビデオ画像の数が重要な画像の前記少ない数に等しいままとなるまで、前記破 棄する工程を続行し、 残る前記ビデオ画像およびその結び付いた画像値を記憶する ことにより、前記第1の複数のビデオ画像をさらに少ない数の重要な画像に圧縮 し、ユーザが前記さらに少ない数の重要な画像の数を指定する工程からなる請求 項48に記載の方法。 53.前記1つのパラメータが離散コサイン変換により引き出される請求項48 に記載の方法。 54.前記1つのパラメータがGaborフィルタにより引き出される請求項48に 記載の方法。 55.前記1つのパラメータがwaveletsにより引き出される請求項48に記載の 方法。 56.各画像が複数の画素を特徴とする複数のビデオ画像を圧縮する方法であっ て、前記方法が、 前記複数のビデオ画像に少なくとも1つのパラメータを引き出し、 前記1つのパラメータにビデオ画像ごとの画像値を求め、 差異を決定するために、各ビデオ画像に結び付いた画像値を別のビデオ画像に 結び付いた画像値に比較し、 さらに大きな差異のある前記複数の基準ビデオ画像のそれぞれに結び付いた画 像値に基づき、複数の基準ビデオ画像を選択する ことにより前記複数のビデオ画像から複数の基準画像を選択する工程、 複数のビデオ差異を決定するために、各ビデオ画像を前記複数の基準ビデオの 内の1つに比較する工程、および 前記ビデオ差異および前記基準ビデオ画像を記憶する工程 からなる方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US52889195A | 1995-09-15 | 1995-09-15 | |
US08/528,891 | 1995-09-15 | ||
PCT/US1996/014722 WO1997010564A1 (en) | 1995-09-15 | 1996-09-13 | A method of compressing a plurality of video images |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10509298A true JPH10509298A (ja) | 1998-09-08 |
Family
ID=24107628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9512134A Pending JPH10509298A (ja) | 1995-09-15 | 1996-09-13 | 複数のビデオ画像の圧縮方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US6009204A (ja) |
EP (1) | EP0804774B1 (ja) |
JP (1) | JPH10509298A (ja) |
AT (1) | ATE241179T1 (ja) |
AU (1) | AU7070896A (ja) |
DE (1) | DE69628282T2 (ja) |
WO (1) | WO1997010564A1 (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPQ131399A0 (en) * | 1999-06-30 | 1999-07-22 | Silverbrook Research Pty Ltd | A method and apparatus (NPAGE02) |
EP0872120A1 (en) | 1995-03-07 | 1998-10-21 | Interval Research Corporation | System and method for selective recording of information |
US6263507B1 (en) | 1996-12-05 | 2001-07-17 | Interval Research Corporation | Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data |
US5893062A (en) * | 1996-12-05 | 1999-04-06 | Interval Research Corporation | Variable rate video playback with synchronized audio |
US6340971B1 (en) * | 1997-02-03 | 2002-01-22 | U.S. Philips Corporation | Method and device for keyframe-based video displaying using a video cursor frame in a multikeyframe screen |
JP3780623B2 (ja) | 1997-05-16 | 2006-05-31 | 株式会社日立製作所 | 動画像の記述方法 |
JP4074366B2 (ja) * | 1998-02-24 | 2008-04-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体 |
US6185737B1 (en) | 1998-06-30 | 2001-02-06 | Sun Microsystems, Inc. | Method and apparatus for providing multi media network interface |
US7155735B1 (en) | 1999-10-08 | 2006-12-26 | Vulcan Patents Llc | System and method for the broadcast dissemination of time-ordered data |
US6757682B1 (en) | 2000-01-28 | 2004-06-29 | Interval Research Corporation | Alerting users to items of current interest |
GB0007784D0 (en) * | 2000-03-30 | 2000-05-17 | Sony Uk Ltd | Data compression |
US6434320B1 (en) * | 2000-10-13 | 2002-08-13 | Comtrak Technologies, Llc | Method of searching recorded digital video for areas of activity |
US7680324B2 (en) | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
US9310892B2 (en) | 2000-11-06 | 2016-04-12 | Nant Holdings Ip, Llc | Object information derived from object images |
US8224078B2 (en) | 2000-11-06 | 2012-07-17 | Nant Holdings Ip, Llc | Image capture and identification system and process |
US8817045B2 (en) | 2000-11-06 | 2014-08-26 | Nant Holdings Ip, Llc | Interactivity via mobile image recognition |
US7899243B2 (en) | 2000-11-06 | 2011-03-01 | Evryx Technologies, Inc. | Image capture and identification system and process |
US7565008B2 (en) | 2000-11-06 | 2009-07-21 | Evryx Technologies, Inc. | Data capture and identification system and process |
KR20030016406A (ko) | 2001-05-15 | 2003-02-26 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 콘텐트 분석 장치 |
US20020194193A1 (en) * | 2001-06-18 | 2002-12-19 | Gregg Edelmann | Method and system for sorting, storing, accessing and searching a plurality of audiovisual recordings |
US20050007452A1 (en) * | 2001-09-07 | 2005-01-13 | Mckay Therman Ward | Video analyzer |
EP1428389A1 (en) * | 2001-09-07 | 2004-06-16 | Intergraph Hardware Technologies Company | Method, device and computer program product for demultiplexing of video images |
US6965645B2 (en) * | 2001-09-25 | 2005-11-15 | Microsoft Corporation | Content-based characterization of video frame sequences |
US7149957B2 (en) | 2001-11-19 | 2006-12-12 | Ricoh Company, Ltd. | Techniques for retrieving multimedia information using a paper-based interface |
US7743347B2 (en) | 2001-11-19 | 2010-06-22 | Ricoh Company, Ltd. | Paper-based interface for specifying ranges |
US8539344B2 (en) * | 2001-11-19 | 2013-09-17 | Ricoh Company, Ltd. | Paper-based interface for multimedia information stored by multiple multimedia documents |
US7788080B2 (en) | 2001-11-19 | 2010-08-31 | Ricoh Company, Ltd. | Paper interface for simulation environments |
US7006701B2 (en) * | 2002-10-09 | 2006-02-28 | Koninklijke Philips Electronics N.V. | Sequential digital image compression |
WO2004061711A1 (en) * | 2003-01-06 | 2004-07-22 | Koninklijke Philips Electronics N.V. | Method and apparatus for similar video content hopping |
US20070033163A1 (en) * | 2003-05-30 | 2007-02-08 | Koninklij Philips Electronics N.V. | Search and storage of media fingerprints |
US20050044105A1 (en) * | 2003-08-19 | 2005-02-24 | Kelly Terrell | System and method for delivery of content-specific video clips |
US20060015494A1 (en) * | 2003-11-26 | 2006-01-19 | Keating Brett M | Use of image similarity in selecting a representative visual image for a group of visual images |
US20060015495A1 (en) * | 2003-11-26 | 2006-01-19 | Keating Brett M | Use of image similarity in image searching via a network of computational apparatus |
WO2005055138A2 (en) * | 2003-11-26 | 2005-06-16 | Yesvideo, Inc. | Statical modeling of a visual image for use in determining similarity between visual images |
US7697792B2 (en) * | 2003-11-26 | 2010-04-13 | Yesvideo, Inc. | Process-response statistical modeling of a visual image for use in determining similarity between visual images |
US20060020597A1 (en) * | 2003-11-26 | 2006-01-26 | Yesvideo, Inc. | Use of image similarity in summarizing a collection of visual images |
US20060015497A1 (en) * | 2003-11-26 | 2006-01-19 | Yesvideo, Inc. | Content-based indexing or grouping of visual images, with particular use of image similarity to effect same |
US20060188151A1 (en) * | 2005-02-23 | 2006-08-24 | Lexmark International, Inc. | Method for processing data for use with a video display of an imaging apparatus |
EP2764899A3 (en) | 2005-08-29 | 2014-12-10 | Nant Holdings IP, LLC | Interactivity via mobile image recognition |
US7423642B2 (en) * | 2005-12-14 | 2008-09-09 | Winbond Electronics Corporation | Efficient video frame capturing |
US20080273113A1 (en) * | 2007-05-02 | 2008-11-06 | Windbond Electronics Corporation | Integrated graphics and KVM system |
US9380256B2 (en) | 2007-06-04 | 2016-06-28 | Trover Group Inc. | Method and apparatus for segmented video compression |
FR2935498B1 (fr) * | 2008-08-27 | 2010-10-15 | Eads Europ Aeronautic Defence | Procede d'identification d'un objet dans une archive video. |
US9240073B2 (en) * | 2011-11-15 | 2016-01-19 | Pixar | File format for representing a scene |
RU2640298C1 (ru) | 2015-10-12 | 2017-12-27 | Общество С Ограниченной Ответственностью "Яндекс" | Способ обработки и хранения изображений |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54114920A (en) * | 1978-02-28 | 1979-09-07 | Kokusai Denshin Denwa Co Ltd | Television signal adaptive forecasting encoding system |
JPH03252287A (ja) * | 1990-02-28 | 1991-11-11 | Victor Co Of Japan Ltd | 動画像圧縮装置 |
US5177796A (en) * | 1990-10-19 | 1993-01-05 | International Business Machines Corporation | Image data processing of correlated images |
JPH04207788A (ja) * | 1990-11-30 | 1992-07-29 | Sony Corp | 画像信号符号化装置及び方法 |
US5305400A (en) * | 1990-12-05 | 1994-04-19 | Deutsche Itt Industries Gmbh | Method of encoding and decoding the video data of an image sequence |
US5265180A (en) * | 1991-06-13 | 1993-11-23 | Intel Corporation | Method of encoding a sequence of images of a digital motion video signal |
KR100206261B1 (ko) * | 1992-02-28 | 1999-07-01 | 윤종용 | 디지탈 vtr의 영상신호 대역 압축장치 |
CA2132515C (en) * | 1992-03-20 | 2006-01-31 | Glen William Auty | An object monitoring system |
US5974235A (en) * | 1996-10-31 | 1999-10-26 | Sensormatic Electronics Corporation | Apparatus having flexible capabilities for analysis of video information |
-
1996
- 1996-09-13 JP JP9512134A patent/JPH10509298A/ja active Pending
- 1996-09-13 AU AU70708/96A patent/AU7070896A/en not_active Abandoned
- 1996-09-13 DE DE69628282T patent/DE69628282T2/de not_active Expired - Lifetime
- 1996-09-13 EP EP96931565A patent/EP0804774B1/en not_active Expired - Lifetime
- 1996-09-13 WO PCT/US1996/014722 patent/WO1997010564A1/en active IP Right Grant
- 1996-09-13 AT AT96931565T patent/ATE241179T1/de not_active IP Right Cessation
-
1997
- 1997-10-23 US US08/956,928 patent/US6009204A/en not_active Expired - Lifetime
-
1999
- 1999-03-26 US US09/276,867 patent/US6259817B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ATE241179T1 (de) | 2003-06-15 |
US6009204A (en) | 1999-12-28 |
EP0804774A1 (en) | 1997-11-05 |
EP0804774B1 (en) | 2003-05-21 |
DE69628282T2 (de) | 2004-03-11 |
DE69628282D1 (de) | 2003-06-26 |
US6259817B1 (en) | 2001-07-10 |
AU7070896A (en) | 1997-04-01 |
EP0804774A4 (en) | 1999-02-24 |
WO1997010564A1 (en) | 1997-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10509298A (ja) | 複数のビデオ画像の圧縮方法 | |
WO1997010564A9 (en) | A method of compressing a plurality of video images | |
US6771268B1 (en) | Video skimming system utilizing the vector rank filter | |
KR101033866B1 (ko) | 화상 검색 방법, 화상 특징량 부호화 방법 및 화상 특징량복호 방법 | |
US5915038A (en) | Using index keys extracted from JPEG-compressed images for image retrieval | |
US8442384B2 (en) | Method and apparatus for video digest generation | |
JP3951556B2 (ja) | 選択されたクラスタからキーフレームを選択する方法 | |
US5821945A (en) | Method and apparatus for video browsing based on content and structure | |
US7131059B2 (en) | Scalably presenting a collection of media objects | |
JP4351994B2 (ja) | スケーラブルなビデオの要約化 | |
JP2005525034A (ja) | スケーラブルなビデオ要約およびナビゲーションのシステムおよび方法 | |
JP2002521977A (ja) | ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法 | |
JP2000516434A (ja) | 可視索引付けシステム | |
JP2002519749A (ja) | イメージ探索のスケール化可能な解決 | |
JP2001155169A (ja) | ビデオ画像の分割、分類、および要約のための方法およびシステム | |
JPH11509025A (ja) | 直流および動きの記号を用いた圧縮mpeg系列のビデオ検索 | |
JP2002117037A (ja) | 画像検索装置、並びに画像検索方法及びこれが書き込まれた記録媒体 | |
JP2002520747A (ja) | ビデオコンテントのヒストグラム式特徴付け方法 | |
US20040181545A1 (en) | Generating and rendering annotated video files | |
JP2002358515A (ja) | 変倍画像生成装置及び方法、画像特徴算出装置及び方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体、並びに画像データ構造 | |
Fernando et al. | Fade-in and fade-out detection in video sequences using histograms | |
Zong et al. | Key frame extraction based on dynamic color histogram and fast wavelet histogram | |
JP2002513487A (ja) | オブジェクト指向コンテンツに基づくビデオ・サーチ用のアルゴリズム及びシステム | |
JP3358692B2 (ja) | 映像ブロック分類方法及び装置 | |
Latecki et al. | Extraction of key frames from videos by optimal color composition matching and polygon simplification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040209 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040507 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040629 |