JP3025176B2 - 複数のメディア成分を有する情報伝達フレーム列の圧縮方法及びその装置 - Google Patents
複数のメディア成分を有する情報伝達フレーム列の圧縮方法及びその装置Info
- Publication number
- JP3025176B2 JP3025176B2 JP7149746A JP14974695A JP3025176B2 JP 3025176 B2 JP3025176 B2 JP 3025176B2 JP 7149746 A JP7149746 A JP 7149746A JP 14974695 A JP14974695 A JP 14974695A JP 3025176 B2 JP3025176 B2 JP 3025176B2
- Authority
- JP
- Japan
- Prior art keywords
- closed caption
- frames
- component
- representative
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/025—Systems for the transmission of digital non-picture data, e.g. of text during the active part of a television frame
- H04N7/035—Circuits for the digital non-picture data signal, e.g. for slicing of the data signal, for regeneration of the data-clock signal, for error detection or correction of the data signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/08—Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
- Television Systems (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Description
ーム列の圧縮方法に関し、特に、たとえばビデオプログ
ラム等の、複数のメディア(媒体)成分を有する情報を
伝達するフレーム列の圧縮方法に関する。
報源は、二つ以上の異なるメディア成分からなるマルチ
メディアデータの一つの形態である。たとえば、ビデオ
プログラムは、フルモーションのビデオ(画像)成分と
音声成分とからなる。ビデオプログラムのビデオ成分の
大きな記憶容量及び大きな伝送容量を削減する種々の方
法が知られている。
PEG)では、一つのビデオフレームを表すのに必要な
バイト数の削減を図るために、各ビデオフレーム内に存
在する空間的冗長性を利用する。さらに、連続するフレ
ームの間に存在する時間的な冗長性を利用することによ
って圧縮を行うこともできる。この方法は、MPEG等
で利用されている圧縮方法である。これらの周知の圧縮
方法は、そのビデオプログラム内に保有されている動画
情報を保持するために、単位時間あたり一定数のフレー
ムを生成する。
全体からいくつかのフレームを代表フレームとして選択
することによりビデオプログラムを圧縮する方法もあ
る。たとえば、そのビデオプログラムのある場面に収め
られた視覚情報を代表するのに、一つのフレームを使用
することがある。一つの場面とは、たとえば視覚的内容
が著しくは変化しない、ビデオプログラムのセグメント
(部分)として定義される。
伴わずに、その場面全体を代表するものとして、その場
面から選択された一つのフレームを使用することが可能
である。そのビデオプログラム内のすべての場面から抽
出されたそのような代表的フレームの列により、許容可
能な程度の情報損失を伴って、そのビデオプログラム全
体を相当程度正確に代表させることができる。
オプログラムの内容に基づくサンプリングを行うものと
いえる。前述の時間的または空間的圧縮方法では各フレ
ームが時間的に等間隔で隔てられているのに対して、内
容に基づくサンプリング方法では、そのビデオプログラ
ムの一群の代表フレームを生成するにあたり、時間的に
不等間隔のサンプリングを行う。たとえば、一つの代表
フレームは、(たとえば一人の人が長時間にわたり位置
をあまり変えずに話をする場合等では)ビデオプログラ
ムの長いセグメント(長時間部分)を代表する場合もあ
り、ビデオプログラムのごく短いセグメント(たとえば
ビデオプログラムのうちのわずか数秒間現れるだけの場
面)を代表する場合もある。
動的に生成する複数の方法が知られている。これらの方
法は、たとえば、連続するショット同士の間の境界を検
出するもので、さらには、各ショットの中で起きる場面
の変化を検出するものでもよい。複数ショット間の急激
なまたは緩慢な推移の位置を特定する方法の例として
は、米国特許出願No.08/171,136号"Method and Apparat
us for Detecting Abrupt and Gradual Scene Changes
In Image Sequences"(出願日1993年12月21日)に記載
されている。各ショットの中で起きる場面の変化を検出
する方法は、米国特許出願No.08/191,234号"Camera-Mot
ion Induced Scene Change Detection Method and Syst
em"(出願日1994年2月4日)に記載されている。
ング方法は通常、指標を与える(indexing)目的で採用さ
れる。そのような方法により生成されるフレームは、一
つのビデオプログラム内に含まれている視覚情報を効率
よく搬送できるからである。しかしこれらの方法では、
ビデオ等のマルチメディア形態に含まれている有用な情
報のすべてを伝送することはできない。これらの方法
は、一つのメディア成分(すなわち、ビデオの場合で
は、ビデオ成分)だけを圧縮し、その他のメディア成分
(たとえば音声)を除外するからである。本発明は、少
なくとも第1と第2の情報伝達メディア成分を有する一
連の複数フレームを圧縮し、またこれを復元することを
目的とする。
決するものである。一連の複数フレームの例としては、
第1の情報伝達成分がビデオ成分、第2の情報伝達成分
がクローズドキャプション成分であるようなビデオプロ
グラムがある。この発明によれば、まず、一連のフレー
ムから複数の代表フレームが選択される。代表フレーム
は、第1の情報伝達メディア成分内に収容される情報を
代表する。
ディア成分の複数のセグメントのうちの一つとの間の対
応関係が形成される。代表フレームと、第2の情報伝達
メディア成分の複数のセグメントと、これらの間の対応
関係は、後に読み出すことができるように記憶される。
は、一連のフレームから内容に基づいてサンプリングす
ることにより選択する。たとえば、第1の情報伝達メデ
ィア成分が複数の場面からなるビデオ成分である場合、
各場面から代表フレームを一つずつ選択すればよい。さ
らに、第2の情報伝達メディア成分がクローズドキャプ
ション成分である場合、代表フレームのプリントされた
文字列(renditioun)及びクローズドキャプション成分が
提供される。
(pictorial transcript)を構成し、その中で、各代表フ
レームが、それに関連するクローズドキャプションテキ
ストを含む字幕とともにプリントされる。オリジナルの
形態(たとえばビデオプログラム)の情報を理解するに
は通常、追加の機器(たとえばビデオテープレコーダと
モニタ)を必要とするのに対し、この実施例によれば、
プリントされた絵入り写本の形の情報は、追加の処理ま
たは機器無しにそれ自体で直接的に理解できる。
及び第2の情報伝達メディア成分を有する一連の複数フ
レームの圧縮された文字列を表示する方法を提供する。
この方法によれば、第1の情報伝達メディア成分に収容
された情報を代表する複数の代表フレームが受信され
る。さらに、各代表フレームと第2の情報伝達メディア
成分の一つのセグメントとの間の対応関係を形成する情
報を有する一つの信号を受信する。最後に、代表フレー
ムと、第2の情報伝達メディア成分のセグメントが、そ
れらの対応関係に基づいて表示される。
ィア成分を有する一連の複数フレームを圧縮し、またこ
れを復元することができる。
しばしば、ビデオの各フレームの一部としてクローズド
キャプション(closed-caption,字幕)成分が含まれてい
る。復号化されたとき、各フレームのクローズドキャプ
ション成分は、最大2個の英数字すなわち制御文字が含
まれている。これらの文字が数個またはそれ以上のフレ
ームにわたって連続することにより、単語および文が形
成される。
用クローズドキャプション復号器によって回復され、ビ
デオスクリーン上に表示されるフレームに重ね合わされ
る。テキストは、そのプログラムの音声部分に対応する
対話その他の情報を含んでいる。クローズドキャプショ
ン情報をビデオ源に加える技術の詳細ついては、たとえ
ば、Public Broadcasting ServiceによるReport No.E-7
709-C "Television Captionin For the Deaf:Signal an
d Display Specifications"(1980年5月、JohnLentzら
著)に記載されている。
デオプログラムの圧縮方法に関するもので、この方法で
は、プログラム内の各場面からの代表フレームが、その
ビデオプログラムのクローズドキャプション成分を復号
化することによって生成されたテキストと結合される。
ここでいう「ビデオ」は、特定のビデオ標準に限られる
ものではなく、少なくとも二つの情報伝達メディア成分
をもち、そのうちの一つが視覚情報成分であるような複
数フレームの連続を意味する。
てもよく、たとえば、フィルム、従来型ビデオや、コン
ピュータメモリ等の種々の電子形態がある。また、ここ
で「フレーム」とは、特定の形態と関係するすべてのメ
ディア成分のための記録情報の原子的要素を意味する。
プション成分をもつビデオプログラムの圧縮方法につい
て記述するが、この方法は、二つ以上のメディア成分を
有するマルチメディア情報のいかなるソースに対しても
同様に適応できる。たとえば、この方法はビデオ成分と
音声成分とを有するビデオプログラムを圧縮するのに利
用できる。音声成分は、スピーチ(話声)及びその他の
音情報(たとえば音楽)を含むことができる。必要によ
り、音声成分は、以下に述べるような絵入り写本を生成
できるように、スピーチからテキストへの変換を行って
もよい。
タ圧縮のための装置2の実施例のブロック図である。こ
の実施例では、装置2は、ビデオ入力源1からビデオ入
力を受信する。ビデオ入力源1は、たとえば、アンテナ
またはケーブルテレビに接続されたビデオチューナ、ビ
デオテープレコーダまたは、ビデオとクローズドキャプ
ション情報を提供できるその他のソースである。
ズドキャプション復号部5、デジタルコンピュータ8か
らなる。場面切り替え検出部4は、入力源1からビデオ
信号を受信するとすぐに作動してそのビデオ信号内の各
場面ごとに一つの代表フレームを生成する。代表フレー
ムを選択する場面切り替え検出部は公知であって、その
例は前出の文献にも記載されている。それぞれの代表フ
レームは、一つの場面全体の視覚情報内容を代表する視
覚情報を含んでいる。デジタル入力源の替わりにアナロ
グ入力源が使われる場合は、そのアナログ入力をデジタ
ル化するイメージデジタイザを場面切り替え検出部4に
含めてもよい。
代表フレームは、デジタルコンピュータ8に伝送され
る。入力源1からのビデオ信号はクローズドキャプショ
ン復号部5でも受信され、クローズドキャプション復号
部5はそのビデオ信号からクローズドキャプション文字
を抽出して、それを復号化した形態でデジタルコンピュ
ータ8に伝達する。デジタルコンピュータ8は、代表フ
レーム及びクローズドキャプション情報を、たとえば主
メモリ9またはハードディスク10内に取り出し可能な
形態で記憶する。
ータ8は、対応表を作ることによって、各代表フレーム
とクローズドキャプション情報の一つのセグメントとの
間の対応関係を確立する。代表フレームとクローズドキ
ャプション成分は、後に読み出され、プリンタ12また
は表示器13に送られ、または通信ネットワーク14を
通じて伝送される。
のビデオプログラム内のN個の場面のそれぞれに一つず
つの代表フレームを生成し、N個の代表フレームI1〜
INが保持される。そのような圧縮方法の例は、前出の
文献に記載されている。各代表フレームはそれぞれ一つ
の場面内に含まれる視覚情報を代表するものであるか
ら、各代表フレームは、そのフレームが選択された場面
の長さに等しい時間間隔に対応している。
隔は、i番目の場面境界の検出によって始まり、(i+
1)番目の場面境界の検出の1フレーム前で終了する。
代表フレームIiが選択された場面を構成する一連のフ
レームをVSiと表す。このとき、N個の代表フレーム
I1〜INは、そのビデオプログラムを、N個の互いに重
ならない視覚セグメントVS1〜VSNに分割する。各代
表フレームIiは視覚セグメントVSiに対応する。
ーズドキャプション成分の一部分に対応するので、一つ
の視覚セグメントVSiを構成する一連の複数フレーム
のそれぞれは、一つのクローズドキャプションセグメン
ト(これをTSiと表す)に対応する。したがって、こ
の発明の方法がそのビデオプログラムをN個の視覚セグ
メントVS1〜VSN(各セグメントは一つの代表フレー
ムによって特徴付けられる)に分割するとき、そのクロ
ーズドキャプション成分もN個のセグメントに分割され
る。
とえば、新しい視覚セグメントが場面切り替え検出部4
によって検出されるごとに、クローズドキャプション成
分がデジタルコンピュータ8によって読み出され、その
ときにその成分を時間で区切ることによって、行う。N
個のクローズドキャプションセグメントTSiは、N個
の視覚セグメントVSiと1対1に対応する。この、各
視覚セグメントVSiの代表フレームとN個のクローズ
ドキャプションセグメントTSiとの間の対応関係は、
たとえば図2に示す対応表によって確立される。
に収容されたフレームメモリ22とテキストメモリ23
を採用する。フレームメモリ22は、場面切り替え検出
部4によって作成された代表フレームI1〜INを記憶
し、テキストメモリ23は、クローズドキャプションセ
グメントTS1〜TSNを記憶する。対応表21は、少な
くとも2個の欄と、N個の代表フレームについてN行を
有する。対応表21の第1欄26は、代表フレームI1
〜INを指し示す情報を含んでいる。この情報は、たと
えば、ポインタ(図2でフレームポインタPI1〜PIN
として示されている)の形態であって、フレームメモリ
22に記憶されている代表フレームの位置を指し示して
いる。
フレームI1を指し示している。この情報は、もしその
フレームが固定サイズであるならば、フレームメモリ2
2内のそのフレームの初めと終わりの位置を決定するの
に十分である。そのフレームのサイズが変動する場合
は、複数のフレームが、連続するメモリ位置に順番に記
憶されているものと仮定することにより、ポインタPI
(i+1)によってフレームIiの終了を決定できる。
ャプションセグメントTS1〜TSNを指し示す情報を含
んでいる。この表の第1欄と同様に、フレームIiに関
する情報は、第2欄27の第i行に含まれている。この
情報もポインタの形態でよく、たとえば、クローズドキ
ャプションセグメントTSiの位置を指し示すクローズ
ドキャプションポインタPTiである。フレームIiに対
応するクローズドキャプションセグメントTSiの終わ
りは、ポインタPT(i+1)によって位置を表すことがで
きる。
ンタが示されている。すなわち、イメージ終了ポインタ
26とテキスト終了ポインタ27である。これらは、そ
れぞれ、N番目の代表フレーム及びN番目のクローズド
キャプションセグメントの終了を示す。
応表は、各代表フレームが、対応するクローズドキャプ
ション部分と適当に対応づけられて双方の成分がすぐに
読み出せるようになっているのもであれば、どのような
ものでもよい。たとえば、対応表は種々の情報を記憶す
る追加の欄を有してもよい。すなわち、代表フレームと
クローズドキャプションセグメントのサイズ、各視覚セ
グメントの初めと終わりを示すフレーム番号、各場面の
長さ、クローズドキャプションセグメント内の文字の個
数等の情報である。
るクローズドキャプションセグメントを別個のファイル
として記憶してもよい。この構成においては、この対応
表への入力は各ファイルの位置または名称を特定する。
れた対応表とから、圧縮されたビデオプログラムを構成
する代表フレーム及びクローズドキャプションセグメン
トが抽出された後に、そのデータは、後に取り出せるよ
うに、適当な方法で記録しておけばよい。その後、デー
タは、必要な形態で、プリントされ、表示され、または
伝送される。
ムのそれぞれが、クローズドキャプション・テキストの
キャプションを与えられるような絵入り写本(pictorial
transcript)の形態で、プリントされ、表示され、また
は伝送される。絵入り写本の形態の一例として、テレビ
ニュース番組の一部分について図3に示す。写本(trans
cript)は、テキスト(文字列)に絵を具合よく挿入する
ことのできるコマーシャルテキスト処理パッケージとと
もにプリントしてもよい。
ローズドキャプション信号内に含まれる、プリントでき
ない制御文字(表示機能を制御するために使用される)
を取り除くのが必要なこともある。これらの文字は、た
とえば、表示される文字の色、フォント、表示スクリー
ン上のテキスト列の位置等を制御する。
に加えて、クローズドキャプション成分を個々の場面に
基づいて上述の方法で適当に分割する上で悪い影響を及
ぼすことがある。たとえば、制御文字が、クローズドキ
ャプション成分内に収容されたテキストを文の中間で分
割することがありうる。このような、クローズドキャプ
ション成分の不適当な分割は、他の理由によっても起こ
りうる。たとえば、ビデオ成分とクローズドキャプショ
ン成分の不適当な同期によっても起こる。不適当な同期
は、場面境界の検出遅れ、または、クローズドキャプシ
ョン成分のデジタルコンピュータへの伝送遅れ等によっ
て起こる。
ず、生のテキストを処理して制御文字を削除し、また、
互いに隣接するクローズドキャプションセグメントの境
界を移動させて、一つの単語や一つの文が途中で分割さ
れている部分を結合させて完全な単語や完全な文とする
ことが望ましい。英単語が途中で分割された状態は、ス
ペース等の適当な符号(キャラクタ)で分割されていな
いクローズドキャプション・ポインタの反対側にくるキ
ャラクタの位置を探すことにより簡単に特定できる。次
に、これらのキャラクタを結合して完全な単語とすれば
よい。
ドキャプションのポインタの反対側が疑問符、感嘆符ま
たは終止符のようなキャラクタで仕切られていない単語
の位置を見いだすことによって特定できる。それから、
文の各部を結合させて一つの文にすればよい。それか
ら、一つの代表イメージに対応してクローズドキャプシ
ョンポインタが完全な単語及び文を含むように調整され
る。
を、テキスト処理段階等の、次の段階で、適当に解釈で
きる他の文字で置き換えることもできる。たとえば、ク
ローズドキャプション表示窓でフォントまたは色を変え
るのに使用される制御文字は、採用されるテキスト処理
パッケージにおいて使用される対応のフォント変更コマ
ンドによって置き換えることができる。
プション成分に伝達される文字は、典型的には、すべて
大文字で伝送される。したがって、絵入り写本をプリン
トする前に制御文字を取り除くか置き換えることに加え
て、クローズドキャプション成分から抽出された生のテ
キストをまず処理して、通常のプリントされたテキスト
と整合をとるように、大文字のいくつかを小文字に変換
するのが望ましい。
たとえば、大文字を、初めにすべて小文字に変換しても
よい。つぎに、終止符または疑問符等の区切りの符号
(文字)の次の文字は大文字にする。最後に、頭文字を
大文字で書くべき多数の固有名詞を電子的に記憶された
辞書に納めればよい。図3に示された絵入り文字は、こ
のようにして部分的に処理されたものである。文字はす
べて、上のケースから下のケースへ変換され、終止符の
次の文字を大文字とした。図からわかるように、固有名
詞は大文字になっていない。
メディア成分を有する一連の複数フレームを圧縮し、ま
たこれを復元することができる。
装置の一実施例のブロック図。
ラムの代表フレームとクローズドキャプション成分の位
置を特定するための対応表の例を示す図。
ら作られプリントされた絵入り写本の1ページの例。
Claims (16)
- 【請求項1】 視覚情報を伝達する複数のフレームの連
続を圧縮する方法であって、各フレームがテキスト情報
を表すクローズドキャプション成分を有するものにおい
て、 (A)前記複数のフレームの連続とクローズドキャプシ
ョン成分の連続を複数のセグメントに分割するステップ
と、 (B)各セグメントそれぞれから代表フレームのみを維
持するステップと、 (C)クローズドキャプション成分に含まれるプリント
できない制御文字を除去して、各セグメントのクローズ
ドキャプション成分を維持するステップと、 (D)各セグメントにつき、代表フレームとクローズド
キャプション成分を記憶するステップと、 を有することを特徴とする複数フレームの連続を圧縮す
る方法。 - 【請求項2】 請求項1に記載の方法において、 前記(A)分割するステップは、前記代表フレームを選
択するように、内容に基づいて前記フレームの連続のサ
ンプリングを行うステップを有することを特徴とする方
法。 - 【請求項3】 請求項1に記載の方法において、各セグ
メントは、単一の場面を構成することを特徴とする方
法。 - 【請求項4】 請求項2に記載の方法において、各セグ
メントは、単一の場面を構成することを特徴とする方
法。 - 【請求項5】 請求項4に記載の方法において、前記ク
ローズドキャプション成分を復号化するステップをさら
に有することを特徴とする方法。 - 【請求項6】 請求項5に記載の方法において、前記ク
ローズドキャプション成分のセグメントを各代表フレー
ムに関連付けて配置するための対応表を生成して記憶す
るステップをさらに有することを特徴とする方法。 - 【請求項7】 請求項6に記載の方法において、プリン
トされた絵入り写本を提供するために、各場面それぞれ
について、前記代表フレーム及びクローズドキャプショ
ン成分のプリントされた表現を生成するステップをさら
に有することを特徴とする方法。 - 【請求項8】 請求項6に記載の方法において、絵入り
写本を提供するために、各場面それぞれについて、前記
代表フレーム及びクローズドキャプション成分を表示す
るステップをさらに有することを特徴とする方法。 - 【請求項9】 視覚情報を伝達する複数のフレームの連
続を圧縮する方法であって、各フレームがこれに対応す
る音声成分を有するものにおいて、 (A)前記複数のフレームの連続とこれに対応する音声
成分を複数のセグメントに分割するステップと、 (B)各セグメントそれぞれから代表フレームのみを維
持するステップと、 (C)各セグメントの前記音声成分を維持するステップ
と、 (D)代表フレームそれぞれと、これに関連する音声成
分とを記憶するステップと、 を有することを特徴とする複数のフレームの連続を圧縮
する方法。 - 【請求項10】 請求項9に記載の方法において、 前記(A)分割するステップは、前記代表フレームを選
択するように、内容に基づいて前記フレームの連続のサ
ンプリングを行うステップを有することを特徴とする方
法。 - 【請求項11】 請求項9に記載の方法において、各セ
グメントは、単一の場面を構成することを特徴とする方
法。 - 【請求項12】 請求項10に記載の方法において、各
セグメントは、単一の場面を構成することを特徴とする
方法。 - 【請求項13】 請求項12に記載の方法において、前
記音声成分セグメントを各代表フレームに関連付けて配
置するための対応表を生成して記憶するステップをさら
に有することを特徴とする方法。 - 【請求項14】 請求項13に記載の方法において、 前記音声成分は音声言語成分を含み、 当該方法はその音声言語成分をテキスト成分に変換する
ステップをさらに有することを特徴とする方法。 - 【請求項15】 請求項14に記載の方法において、各
場面についてプリントされた絵入り写本を提供するため
に、前記代表フレーム及びテキスト成分のプリントされ
た表現を生成するステップをさらに有することを特徴と
する方法。 - 【請求項16】 少なくとも第1と第2の情報伝達メデ
ィア成分を有する複数のフレームの連続の圧縮された表
現を表示する方法において、 (A)第1の情報伝達メディア成分内に収容された情報
を代表する複数の代表フレームを受信するステップと、 (B)前記複数の代表フレームのそれぞれと第2の情報
伝達メディア成分のセグメントとの間の対応関係を形成
する情報を有する信号を受信するステップと、 (C)前記対応関係に基づいて、前記代表フレームと第
2の情報伝達メディア成分とを表示するステップと、 を有することを特徴とする連続の圧縮された表現を表示
する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US252861 | 1988-09-30 | ||
US08/252,861 US6271892B1 (en) | 1994-06-02 | 1994-06-02 | Method and apparatus for compressing a sequence of information-bearing frames having at least two media |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0851369A JPH0851369A (ja) | 1996-02-20 |
JP3025176B2 true JP3025176B2 (ja) | 2000-03-27 |
Family
ID=22957862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7149746A Expired - Lifetime JP3025176B2 (ja) | 1994-06-02 | 1995-05-25 | 複数のメディア成分を有する情報伝達フレーム列の圧縮方法及びその装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6271892B1 (ja) |
EP (1) | EP0685823B1 (ja) |
JP (1) | JP3025176B2 (ja) |
KR (1) | KR100340373B1 (ja) |
CA (1) | CA2146050C (ja) |
DE (1) | DE69520171T2 (ja) |
HK (1) | HK1004496A1 (ja) |
SG (1) | SG63521A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2311678B (en) * | 1996-03-27 | 2000-06-28 | Sony Uk Ltd | Script editor |
US6169789B1 (en) * | 1996-12-16 | 2001-01-02 | Sanjay K. Rao | Intelligent keyboard system |
US6209028B1 (en) | 1997-03-21 | 2001-03-27 | Walker Digital, Llc | System and method for supplying supplemental audio information for broadcast television programs |
US6473778B1 (en) * | 1998-12-24 | 2002-10-29 | At&T Corporation | Generating hypermedia documents from transcriptions of television programs using parallel text alignment |
US6647535B1 (en) * | 1999-03-18 | 2003-11-11 | Xerox Corporation | Methods and systems for real-time storyboarding with a web page and graphical user interface for automatic video parsing and browsing |
KR100634671B1 (ko) * | 1999-08-13 | 2006-10-13 | 주식회사 케이티 | 고정밀도의 실시간 점진적 장면경계 검출기 및 그 방법 |
US7412643B1 (en) | 1999-11-23 | 2008-08-12 | International Business Machines Corporation | Method and apparatus for linking representation and realization data |
US7050109B2 (en) * | 2001-03-02 | 2006-05-23 | General Instrument Corporation | Methods and apparatus for the provision of user selected advanced close captions |
US8479238B2 (en) * | 2001-05-14 | 2013-07-02 | At&T Intellectual Property Ii, L.P. | Method for content-based non-linear control of multimedia playback |
US6938047B2 (en) * | 2003-02-19 | 2005-08-30 | Maui X-Stream, Inc. | Methods, data structures, and systems for processing media data streams |
US7496676B2 (en) * | 2003-02-19 | 2009-02-24 | Maui X-Stream, Inc. | Methods, data structures, and systems for processing media data streams |
US6874160B1 (en) * | 2003-05-01 | 2005-03-29 | Nvidia Corporation | Digital video recorder and method of operating the same |
US7664292B2 (en) * | 2003-12-03 | 2010-02-16 | Safehouse International, Inc. | Monitoring an output from a camera |
US7447331B2 (en) * | 2004-02-24 | 2008-11-04 | International Business Machines Corporation | System and method for generating a viewable video index for low bandwidth applications |
US7818444B2 (en) | 2004-04-30 | 2010-10-19 | Move Networks, Inc. | Apparatus, system, and method for multi-bitrate content streaming |
WO2007053112A1 (en) * | 2005-11-07 | 2007-05-10 | Agency For Science, Technology And Research | Repeat clip identification in video data |
JP5444611B2 (ja) * | 2007-12-18 | 2014-03-19 | ソニー株式会社 | 信号処理装置、信号処理方法及びプログラム |
US8497939B2 (en) * | 2008-12-08 | 2013-07-30 | Home Box Office, Inc. | Method and process for text-based assistive program descriptions for television |
US20100188573A1 (en) * | 2009-01-29 | 2010-07-29 | Usva Kuusiholma | Media metadata transportation |
US20110125758A1 (en) * | 2009-11-23 | 2011-05-26 | At&T Intellectual Property I, L.P. | Collaborative Automated Structured Tagging |
JP2015026913A (ja) * | 2013-07-24 | 2015-02-05 | シャープ株式会社 | 印刷データ生成装置、画像形成装置、印刷データ生成方法、プログラムおよび記録媒体 |
KR101924634B1 (ko) * | 2017-06-07 | 2018-12-04 | 네이버 주식회사 | 콘텐츠 제공 서버, 콘텐츠 제공 단말 및 콘텐츠 제공 방법 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60143330A (ja) | 1983-12-29 | 1985-07-29 | Matsushita Electric Ind Co Ltd | 撮影装置 |
US4823184A (en) | 1984-04-09 | 1989-04-18 | Corporate Communications Consultants, Inc. | Color correction system and method with scene-change detection |
KR920008063B1 (ko) | 1988-11-22 | 1992-09-22 | 마쯔시다덴기산교 가부시기가이샤 | 텔레비젼신호수신장치 |
JPH02177684A (ja) * | 1988-12-27 | 1990-07-10 | Matsushita Electric Ind Co Ltd | テレビジョン信号のフレーム間符号化装置 |
JP2977829B2 (ja) | 1989-01-11 | 1999-11-15 | 株式会社東芝 | 動画像再生装置および動画像再生方法 |
US5134472A (en) | 1989-02-08 | 1992-07-28 | Kabushiki Kaisha Toshiba | Moving object detection apparatus and method |
DE69032361T2 (de) * | 1989-03-16 | 1998-10-29 | Fujitsu Ltd | Video/audiomultiplexübertragungssystem |
GB2231745B (en) | 1989-04-27 | 1993-07-07 | Sony Corp | Motion dependent video signal processing |
JP2861249B2 (ja) | 1989-05-11 | 1999-02-24 | 日本電気株式会社 | 画像変化検出方法および画像変化検出装置 |
JPH0335676A (ja) * | 1989-07-03 | 1991-02-15 | Hitachi Ltd | 動画像符号化方式とそれを用いた動画像符号化装置 |
US5099322A (en) | 1990-02-27 | 1992-03-24 | Texas Instruments Incorporated | Scene change detection system and method |
JP2711172B2 (ja) | 1990-06-15 | 1998-02-10 | アイワ株式会社 | ディジタル信号の記録再生方式 |
US5172281A (en) * | 1990-12-17 | 1992-12-15 | Ardis Patrick M | Video transcript retriever |
US5192964A (en) | 1991-03-04 | 1993-03-09 | Ricoh Company, Ltd. | Camera having blurring movement correction mechanism |
JP2677312B2 (ja) | 1991-03-11 | 1997-11-17 | 工業技術院長 | カメラワーク検出方法 |
JP3103897B2 (ja) | 1991-03-19 | 2000-10-30 | ソニー株式会社 | 手振れ補正装置および手振れ補正方法 |
AU657510B2 (en) * | 1991-05-24 | 1995-03-16 | Apple Inc. | Improved image encoding/decoding method and apparatus |
US5265180A (en) | 1991-06-13 | 1993-11-23 | Intel Corporation | Method of encoding a sequence of images of a digital motion video signal |
US5235419A (en) | 1991-10-24 | 1993-08-10 | General Instrument Corporation | Adaptive motion compensation using a plurality of motion compensators |
JPH0756652B2 (ja) * | 1992-03-24 | 1995-06-14 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 動画像のフレーム列の検索 |
GB2280778B (en) * | 1992-04-10 | 1996-12-04 | Avid Technology Inc | Digital audio workstation providing digital storage and display of video information |
US5471576A (en) * | 1992-11-16 | 1995-11-28 | International Business Machines Corporation | Audio/video synchronization for application programs |
US5440336A (en) * | 1993-07-23 | 1995-08-08 | Electronic Data Systems Corporation | System and method for storing and forwarding audio and/or visual information on demand |
US5481296A (en) * | 1993-08-06 | 1996-01-02 | International Business Machines Corporation | Apparatus and method for selectively viewing video information |
US6055025A (en) | 1993-12-21 | 2000-04-25 | Lucent Technologies, Inc. | Method and apparatus for detecting abrupt and gradual scene changes in image sequences |
US6211912B1 (en) | 1994-02-04 | 2001-04-03 | Lucent Technologies Inc. | Method for detecting camera-motion induced scene changes |
-
1994
- 1994-06-02 US US08/252,861 patent/US6271892B1/en not_active Expired - Lifetime
-
1995
- 1995-03-31 CA CA002146050A patent/CA2146050C/en not_active Expired - Fee Related
- 1995-05-24 EP EP95303498A patent/EP0685823B1/en not_active Expired - Lifetime
- 1995-05-24 DE DE69520171T patent/DE69520171T2/de not_active Expired - Lifetime
- 1995-05-25 JP JP7149746A patent/JP3025176B2/ja not_active Expired - Lifetime
- 1995-05-26 SG SG1995000530A patent/SG63521A1/en unknown
- 1995-06-02 KR KR1019950014550A patent/KR100340373B1/ko not_active IP Right Cessation
-
1998
- 1998-05-05 HK HK98103835A patent/HK1004496A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE69520171D1 (de) | 2001-04-05 |
EP0685823A3 (en) | 1996-05-01 |
CA2146050A1 (en) | 1995-12-03 |
JPH0851369A (ja) | 1996-02-20 |
KR100340373B1 (ko) | 2002-11-30 |
EP0685823A2 (en) | 1995-12-06 |
KR960003446A (ko) | 1996-01-26 |
US6271892B1 (en) | 2001-08-07 |
CA2146050C (en) | 2000-10-24 |
EP0685823B1 (en) | 2001-02-28 |
HK1004496A1 (en) | 1998-11-27 |
DE69520171T2 (de) | 2001-07-19 |
SG63521A1 (en) | 1999-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3025176B2 (ja) | 複数のメディア成分を有する情報伝達フレーム列の圧縮方法及びその装置 | |
US6952236B2 (en) | System and method for conversion of text embedded in a video stream | |
US6430357B1 (en) | Text data extraction system for interleaved video data streams | |
EP1614108B1 (en) | Recording medium having a data structure for managing reproduction of text subtitle data and methods and apparatuses of recording and reproducing | |
KR101058054B1 (ko) | 비디오 추출 | |
US8838594B2 (en) | Automatic method to synchronize the time-line of video with audio feature quantity | |
Shahraray et al. | Automatic generation of pictorial transcripts of video programs | |
Jensema et al. | Closed-captioned television presentation speed and vocabulary | |
CN100367786C (zh) | 在视频特技模式期间的闭路字幕信息显示 | |
JP4905103B2 (ja) | 動画再生装置 | |
EP1727368A2 (en) | Apparatus and method for providing additional information using extension subtitles file | |
US20030065503A1 (en) | Multi-lingual transcription system | |
WO2000041175A1 (en) | Caption mp3 player having a caption display function, caption mp3 data format and method of reproducing caption mp3 data | |
US20170188084A1 (en) | Automatic synchronization of subtitles based on audio fingerprinting | |
MXPA03002790A (es) | Mecanismo de sincronizacion para subtitulacion multimedia y descripcion de audio. | |
EP1672919B1 (en) | Apparatus for processing texts in digital broadcast receiver and method thereof | |
JP2009016910A (ja) | 映像再生装置及び映像再生方法 | |
JPH08241068A (ja) | 情報記録媒体およびビットマップデータ復号化装置とビットマップデータ復号化方法 | |
JP3998187B2 (ja) | コンテンツ解説データ生成装置、その方法及びそのプログラム、並びに、コンテンツ解説データ提示装置、その方法及びそのプログラム | |
KR20010101929A (ko) | 영상기록장치, 영상기록방법 및 영상레이트 조정장치 | |
JP2007519321A (ja) | 視聴覚データストリームのマルチメディア要約を作成する方法及び回路 | |
KR100404322B1 (ko) | 멀티모달 특징 기반의 뉴스 비디오 요약 방법 | |
JP4206445B2 (ja) | 字幕番組制作方法、及び字幕番組制作システム | |
JP4500957B2 (ja) | 字幕制作システム | |
KR100426326B1 (ko) | 디지털 만화 서비스 시스템 및 디지털 만화 재생 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080121 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090121 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100121 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100121 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110121 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120121 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130121 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140121 Year of fee payment: 14 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |