JPH08289297A - 音声付き動画データ作成装置 - Google Patents
音声付き動画データ作成装置Info
- Publication number
- JPH08289297A JPH08289297A JP8961395A JP8961395A JPH08289297A JP H08289297 A JPH08289297 A JP H08289297A JP 8961395 A JP8961395 A JP 8961395A JP 8961395 A JP8961395 A JP 8961395A JP H08289297 A JPH08289297 A JP H08289297A
- Authority
- JP
- Japan
- Prior art keywords
- data
- moving image
- image data
- picture
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
タよりデータ量が少なく、かつ、対応する動画と音声と
を同時に出力するのに適した、所望の再生時間分の音声
付き動画データを作成する。 【構成】分離処理301は、オリジナルの音声付き動画
データを動画データと音声データとに分離し、削減処理
302は、例えば、分離処理301が分離した動画デー
タが、フレーム単位に直交変換方式で符号化された動画
データである場合には、該動画データを構成する各フレ
ーム内の動画データのうちの高周波数成分を表す部分を
削除する。多重処理303は、削減処理302が削減し
た動画データのうちの、指定された再生時間に応じた個
数のフレームを符号化した動画データの部分(再生対象
動画データ)と、分離処理301が分離した音声データ
のうちの、再生対象動画データと同時に再生されるべき
部分とを多重する。
Description
タとが多重された音声付き動画データから、該音声付き
動画データよりデータ量が少なく、かつ、対応する音声
と動画とを同時に出力するのに適した、所望の再生時間
分の音声付き動画データを作成することが可能な音声付
き動画データ作成装置に関する。
Area Network)等のネットワークインフラの普及および
高性能化や、インターネットへのアクセス環境の整備に
伴い、複数の情報処理装置間で音声付き動画データをネ
ットワークを介して伝送するマルチメディア伝送システ
ムが普及する兆しがある。
音声付き動画データの供給源である情報処理装置(以
下、ビデオサーバと称す。)が、動画データと音声デー
タとを多重して作成した音声付き動画データを蓄積し、
蓄積した音声付き動画データをネットワークを介して他
の情報処理装置(以下、クライアントと称す。)に伝送
するようになっている。なお、クライアントは、ビデオ
サーバからネットワークを介して伝送された音声付き動
画データを再生するが、この際に、対応する動画と音声
とが同時に出力されることが好ましい。
テーションの性能の向上に伴い、パーソナルコンピュー
タやワークステーションをクライアントとして用い、パ
ーソナルコンピュータやワークステーションで、手軽に
音声付き動画データを再生することができるようになっ
ている。
ータ量が非常に大きいことから、その蓄積や伝送を行う
際には、圧縮処理を施すことにより、蓄積に必要な記憶
装置の記憶容量を削減したり、伝送に必要な時間を短縮
することが、一般に行われている。
式は多数あるが、そのうちの代表的なものとしては、例
えば、ISOによって勧告された、動画データを圧縮す
るMPEG1(Moving Picture experts Group Phase
1)ビデオ符号化規格や音声データを圧縮するMPEG
1オーディオ符号化規格がある。また、MPEG1規格
に準拠した動画データと音声データとの多重方法を定め
た規格として、MPEG1システム多重化規格がある。
タ構造等の概要については、「ポイント図解式最新MP
EG教科書」,1994年8月1日,アスキー社刊のP
89〜P128およびP231〜P253に記載されて
いる。
置をクライアントとして用いていたり低速なネットワー
クを用いているマルチメディア伝送システムにおいて
は、圧縮された音声付き動画データであっても、依然と
して、伝送や復号等の処理に時間がかかり、音声付き動
画データをリアルタイムで再生することができないとい
う問題点がある。
ットのデータ量を持つMPEG1準拠の音声付き動画デ
ータを、毎秒64Kビットの伝送速度のN−ISDN
(Narrow-Integrated Service Didital Network)回線
で、クライアントに伝送する場合は、再生時間の約24
倍の伝送時間が必要となるので、クライアントにおい
て、音声付き動画データをリアルタイムで再生すること
は不可能である。
ーバからネットワークを介して伝送された音声付き動画
データを、一旦記憶装置に記憶してから、後で再生する
ようにしようとすると、クライアントに大容量の記憶装
置を設ける必要がある。
5Mビットのデータ量を持つMPEG1準拠の音声付き
動画データを1時間分だけ蓄積するためには、675M
バイトの記憶容量が必要となる。
に、内容の把握を短時間で行うために、音声付き動画デ
ータを早送り再生したいというニーズがある。
るためには、復号等の処理の高速化を図ればよいが、処
理負荷の点で困難であるので、音声付き動画データのう
ちの動画データについて、その一部を再生して残りをス
キップするという処理の繰り返すことによって、動画デ
ータの早送り再生を実現することが一般的である。
生する場合に、動画データのフレーム(画面)の切れ目
といった、意味のある切れ目から再生を開始しないと、
ノイズが発生して正常に再生されない。従って、スキッ
プ終了後に動画データを正常に再生するためには、動画
データの意味のある切れ目を検出し、検出した切れ目か
ら再生を開始する必要があるので、早送り再生は、通常
再生よりも処理負荷が高いという問題点がある。
として、動画データのデータ量を削減する技術、およ
び、早送り再生専用の動画データを作成する技術が開示
されている。
いては、動画データ中の高周波成分を削除することによ
り、動画データのデータ量を削減する技術が開示されて
いる。
公報においては、事前にオリジナルの動画データを解析
して早送り再生専用の動画データを作成しておき、早送
り再生時には、早送り再生専用の動画データを再生する
ことにより、処理負荷を軽減する技術が開示されてい
る。
は、内容の把握のしやすさに大きな影響があるので、早
送り再生であっても、対応する音声と動画が同時に出力
されることが望ましい。
平6−70174号公報に記載されている技術において
は、動画データ中の高周波成分を削除することにより、
動画データのデータ量を削減する技術が開示されている
が、音声データに関する考慮はなされていない。
載されている技術においては、事前にオリジナルの動画
データを解析して早送り再生専用の動画データを作成し
ておき、早送り再生時には、早送り再生専用データを再
生することにより、処理負荷を軽減する技術が開示され
ているが、音声データに関する考慮はなされていない。
途中から再生する場合に、音声データの復号処理単位と
いった、意味のある切れ目から再生を開始しないと、ノ
イズが発生して正常に再生されない。従って、スキップ
終了後に音声データを正常に再生するためには、音声デ
ータの意味のある切れ目を検出し、検出した切れ目から
再生を開始する必要がある。
画データとが多重された音声付き動画データから、該音
声付き動画データよりデータ量が少なく、かつ、対応す
る音声と動画とを同時に出力するのに適した、所望の再
生時間分の音声付き動画データを作成することが可能な
音声付き動画データ作成装置を提供することにある。
に、本発明は、(1)複数のフレームからなる動画デー
タをフレーム単位に直交変換方式で符号化した動画デー
タと、音声データとが多重された音声付き動画データ
を、動画データと音声データとに分離する分離手段、
(2)上記分離手段が分離した動画データについて、各
フレーム内のデータのうちの高周波数成分を表すデータ
を削除することにより、各フレーム内のデータ量を削減
する削減手段、(3)上記削減手段が削減した動画デー
タのうちの、指定された再生時間に応じた個数のフレー
ムを符号化した動画データの部分である再生対象動画デ
ータと、上記分離手段が分離した音声データのうちの、
上記再生対象動画データと同時に再生されるべき部分で
ある再生対象音声データとを多重する多重手段、を有す
る音声付き動画データ作成装置を提供している。
減手段が削減した動画データについて、フレームごと
に、該フレーム内の先頭の動画データの再生開始時刻情
報を含む第1の補助データを作成する第1の作成手段、
(2)上記分離手段が分離した音声データについて、同
時に再生されるべきフレームごとに、該フレーム内の先
頭の音声データの再生開始時刻情報を含む第2の補助デ
ータを作成する第2の作成手段、(3)上記第1の作成
手段が作成した第1の補助データに基づいて、上記削減
手段が削減した動画データのうちから、指定された再生
時間に応じた個数のフレームを抽出することにより、上
記再生対象動画データを決定する第1の抽出手段、
(4)上記第1の作成手段が作成した第1の補助データ
および上記第2の作成手段が作成した第2の補助データ
に基づいて、上記分離手段が分離した音声データのうち
から、上記第1の抽出手段が決定した再生対象動画デー
タと再生開始時刻が対応するフレームを抽出することに
より、上記再生対象音声データを決定する第2の抽出手
段、を有し、上記第1の抽出手段が抽出した再生対象動
画データと上記第2の抽出手段が抽出した再生対象音声
データとを多重するようにしている。
らなる動画データをフレーム単位にフレーム間予測符号
化方式で符号化し、フレーム内の動画データを他のフレ
ーム内の動画データとは独立に符号化したフレームであ
る1個のIピクチャ,前方向にある1個のIピクチャか
ら順方向予測符号化したフレームである1個以上のPピ
クチャ,前方向にある1個のIピクチャまたはPピクチ
ャと後方向にある1個のIピクチャまたはPピクチャと
から双方向予測符号化したフレームである1個以上のB
ピクチャからなる再生処理単位であるGOP(Group Of
Picture)を複数含む動画データと、音声データとが多
重された音声付き動画データを、動画データと音声デー
タとに分離する分離手段、(2)上記分離手段が分離し
た動画データについて、上記Bピクチャ内のデータを、
所定の値のデータに置換することにより、上記Bピクチ
ャ内のデータ量を削減する削減手段、(3)上記削減手
段が削減した動画データについて、指定された再生時間
に応じた個数のGOPを抽出することにより、再生すべ
き動画データである再生対象動画データを決定すると共
に、上記再生対象動画データと、上記分離手段が分離し
た音声データのうちの、上記再生対象動画データと同時
に再生されるべき部分である再生対象音声データとを多
重する多重手段、を有する音声付き動画データ作成装置
を提供している。
減手段が削減した動画データについて、上記GOPごと
に、該GOP内の先頭の動画データの再生開始時刻情報
を含む第1の補助データを作成する第1の作成手段、
(2)上記削減手段が削減した動画データについて、上
記ピクチャごとに、該ピクチャ内の先頭の動画データの
再生開始時刻情報を含む第2の補助データを作成する第
2の作成手段、(3)上記分離手段が分離した音声デー
タについて、同時に再生されるべきフレームごとに、該
フレーム内の先頭の音声データの再生開始時刻情報を含
む第3の補助データを作成する第3の作成手段、(4)
上記第1の作成手段が作成した第1の補助データに基づ
いて、上記削減手段が削減した動画データのうちから、
指定された再生時間に応じた個数のGOPを抽出するこ
とにより、上記再生対象動画データを決定する第1の抽
出手段、(5)上記第2の作成手段が作成した第2補助
データおよび上記第3の作成手段が作成した第3の補助
データに基づいて、上記分離手段が分離した音声データ
のうちから、上記第1の抽出手段が決定した再生対象動
画データと再生開始時刻が対応するフレームを抽出する
ことにより、上記再生対象音声データを決定する第2の
抽出手段、を有し、上記第1の抽出手段が抽出した再生
対象動画データと上記第2の抽出手段が抽出した再生対
象音声データとを多重するようにしている。
目が、音声付き動画データを伝送する際の伝送処理単位
の切れ目に一致するようにして多重することが好まし
い。
段が削減した動画データのフレームレートと、当該GO
Pより前にある全てのGOPに含まれているピクチャの
数とに基づいて、上記GOPごとの再生開始時刻情報を
算出することができ、上記第2の作成手段は、上記削減
手段が削減した動画データのフレームレートと、上記G
OPごとの再生開始時刻情報と、当該ピクチャを含むG
OPにおける該ピクチャの再生順序とに基づいて、上記
ピクチャごとの再生開始時刻情報を算出することがで
き、上記第3の作成手段は、上記分離手段が分離した音
声データのサンプリング周波数と、当該フレームより前
にあるフレームの数とに基づいて、フレームごとの再生
開始時刻情報を算出することができる。
は、上記削減手段は、上記分離手段が分離した動画デー
タについて、各フレーム内のデータのうちの高周波数成
分を表すデータを削除することにより、各フレーム内の
データ量を削減する。
削減した動画データのうちの、指定された再生時間に応
じた個数のフレームを符号化した動画データの部分であ
る再生対象動画データと、上記分離手段が分離した音声
データのうちの、上記再生対象動画データと同時に再生
されるべき部分である再生対象音声データとを多重す
る。
離した動画データについて、上記Bピクチャ内のデータ
を、所定の値のデータに置換することにより、上記Bピ
クチャ内のデータ量を削減する。
タについて、指定された再生時間に応じた個数のGOP
を抽出することにより、再生すべき動画データである再
生対象動画データを決定すると共に、上記再生対象動画
データと、上記分離手段が分離した音声データのうち
の、上記再生対象動画データと同時に再生されるべき部
分である再生対象音声データとを多重する。
装置によれば、音声付き動画データから、該音声付き動
画データよりデータ量が少なく、かつ、対応する動画と
音声を同時に出力するのに適した、所望の再生時間分の
音声付き動画データを作成することができる。
て説明する。
する。
タがMPEG1形式の音声付き動画データである場合を
例にとって説明する。
バの構成を示すブロック図である。
U101と、メインメモリ102と、記憶装置103
と、伝送装置104と、バス105とを備えて構成され
ている。
装置103に格納されているMPEG1形式のオリジナ
ルの音声付き動画データから、該オリジナルの音声付き
動画データよりデータ量が少なく、かつ、対応する動画
と音声とを同時に出力するのに適した、所望の再生時間
分のMPEG1形式の音声付き動画データを作成し、作
成したMPEG1形式の音声付き動画データを記憶装置
103に格納する音声付き動画データ作成処理を行う。
声付き動画データ作成処理をソフトウェアで実現した例
である。すなわち、音声付き動画データ作成処理は、C
PU101が、記憶装置103に格納されているソフト
ウェアをメインメモリ102にロードし、メインメモリ
102上でロードしたソフトウェアを実行することによ
って実現される。
リ等の記憶媒体を用いて構成された揮発性の記憶装置で
あり、記憶装置103は、磁気記憶装置等の記憶媒体を
用いて構成された不揮発性の記憶装置である。
ータ作成処理によって作成されて記憶装置103に格納
されたMPEG1形式の音声付き動画データを、ネット
ワークを介してクライアントに伝送する。
行われるデータの転送は、全てCPU101が制御して
いるものである。
置、および、CRT等の表示装置を備えるようにしても
よい。
手順を示すフローチャートである。
成処理においては、分離処理301,削減処理302,
多重処理303という順序で処理が行われる。
るデータの流れを示す図である。
G1形式のオリジナルの音声付き動画データが格納され
たファイルを示している。
によって、ファイル201に格納されているオリジナル
の音声付き動画データから分離された動画データが格納
されたファイルを示しており、ファイル203は、分離
処理301によって、ファイル201に格納されている
オリジナルの音声付き動画データから分離された音声デ
ータが格納されたファイルを示している。
によって、ファイル202に格納されている動画データ
のデータ量が削減された動画データが格納されたファイ
ルを示している。
によって、ファイル204に格納されている動画データ
とファイル203に格納されている音声データとが多重
された、MPEG1形式の音声付き動画データが格納さ
れたファイルを示している。ファイル205に格納され
ているMPEG1形式の音声付き動画データが、ネット
ワークを介してクライアントに伝送されることとなる。
は、記憶装置103に格納されるものである。
について説明する。
び図5を用いて説明する。
タの構造図である。
付き動画データは、パック400およびパケット410
の2層からなる階層構造となっている。
システムヘッダ402と、1個以上のパケット410と
からなる。
00の先頭を示すパック開始コード(同期コードの一種
である。),後述するタイムスタンプに時間基準を与え
るためのシステム時刻基準参照値,多重化レート等から
なる。また、システムヘッダ402は、システムヘッダ
402の先頭を示すシステムヘッダ開始コード(同期コ
ードの一種である。),ビットレート,動画データのチ
ャネル数,音声データのチャネル数等からなる。
411と、データ(動画データまたは音声データ)41
2とからなる。
ト310の先頭を示すパケット開始コード(同期コード
の一種である。),対応する音声と動画とを同時に出力
するために必要な時刻情報であるタイムスタンプ等から
なる。なお、タイムスタンプには、いつ再生すべきかを
示す再生の時刻管理情報、および、いつ復号すべきかを
示す復号の時刻管理情報の2種類がある。また、パケッ
ト開始コードには、データ412のデータ種別が含まれ
ている。
動画データの終了を示す終了コード(同期コードの一種
である。)420が付加されている。
ローチャートである。
うに、まず、ファイル201に格納されているオリジナ
ルのMPEG1形式の音声付き動画データから、MPE
G1システム多重化規格で定められた同期コードを検出
する(ステップ501)。
ードが終了コード420であるか否かを判定し(ステッ
プ502)、終了コード420である場合は、処理を終
了する。
テップ501で検出した同期コードがパケット開始コー
ド(パケットヘッダ411に含まれる。)であるか否か
を判定し(ステップ503)、パケット開始コードでな
い場合は、ステップ501に戻る。
パケット開始コードに含まれているデータ種別に基づい
て、パケット410内のデータ412のデータ種別を判
定し(ステップ504)、データ412のデータ種別が
動画データである場合は、動画データ412をファイル
202に格納する(ステップ505)。
ータでない場合は、パケット開始コードに含まれている
データ種別に基づいて、パケット410内のデータ41
2のデータ種別を判定し(ステップ506)、データ4
12のデータ種別が音声データでない場合は、ステップ
501に戻る。
ータである場合は、音声データ412をファイル203
に格納する(ステップ507)。
いるオリジナルのMPEG1形式の音声付き動画データ
が、動画データと音声データとに分離され、各々、ファ
イル202およびファイル203に格納されることとな
る。
び図7を用いて説明する。
図である。
データは、シーケンス601,GOP(Group Of Pictu
re)602,ピクチャ603,スライス604,MB
(Macro Block)605,ブロック606の6層からな
る階層構造となっている。
ート等の一連の同じ属性を持つ画面グループであり、1
個以上のGOP602からなる。
グループの最小単位であり、1個以上のピクチャ(フレ
ーム)603からなる。
属性であり、Iピクチャ(Intra-Picture:フレーム内
符号化画像)、Pピクチャ(Predictive-Picture:フレ
ーム間順方向予測符号化画像)、Bピクチャ(Bidirect
ionally predictive-Picture:双方向予測符号化画像)
の3個のピクチャタイプが存在する。なお、ピクチャ6
03は、1個以上のスライス604からなる。
タについて簡単に説明する。
間予測を使わずに、その情報だけから符号化されるデー
タであり、Pピクチャを構成するデータは、前方で1番
近い位置にあるIピクチャまたはPピクチャを構成する
データからの予測を行うことによってできるデータであ
る。
後の両方向で1番近い位置にあるIピクチャまたはPピ
クチャを構成するデータからの予測を行うことによって
できるデータである。そこで、Bピクチャを構成するデ
ータは、IピクチャおよびPピクチャを構成するデータ
が符号化された後に符号化されると共に、他のピクチャ
を符号化する際の予測に用いられない。なお、Iピクチ
ャまたはPピクチャを構成するデータは、周期的に出現
するようになっている。
においては、Bピクチャを構成するデータが符号化され
る順序が異なることから、復号する順序と再生する順序
とが異なることとなる。このため、正しい順序で復号お
よび再生を行い、対応する音声と同時に出力することを
可能とするために、上述したタイムスタンプが設けられ
ている。
画面を任意の長さに分割した小画面に共通の情報であ
り、画面の走査順に連続する1個以上のMB605から
なり、MB605は、最大6個のブロック606からな
る。
607からなる。なお、可変長符号607は、空間周波
数を示す係数であり、最終の可変長符号607は、EO
B(End Of Block)符号である。
ローチャートである。
うに、まず、所定の要求符号量に基づいて、ファイル2
04に格納すべき動画データの、ブロック606当りの
可変長符号507の最大個数(以下、最大符号数と称
す。)を決定する(ステップ701)。
音声付き動画データ作成処理を行うに当たって、MPE
G1形式の音声付き動画データを伝送すべきクライアン
トの処理能力やネットワークの伝送速度に基づいて決定
しているものである。すなわち、CPU101は、クラ
イアントの処理能力やネットワークの伝送速度に基づい
て、対応する動画と音声とをクライアントで同時に出力
することが可能な動画データの最大符号量を算出し、算
出した最大符号量を要求符号量として決定する。なお、
ビデオサーバがキーボードやマウス等の入力装置を備え
ている場合は、入力装置から入力されたものであっても
よい。
動画データを、ブロック606を検出するまで走査し、
ブロック606以外の部分を抽出してファイル204に
格納する(ステップ702)。
ク606に含まれている可変長符号607の個数をカウ
ントし、符号数を取得する(ステップ703)。
号数とステップ703で取得した符号数とを比較し(ス
テップ704)、符号数が最大符号数よりも大きい場合
は、ステップ702で検出したブロック606の先頭か
ら最大符号数番目までの可変長符号607とEOB符号
とをファイル204に格納する(ステップ705)。
は、ステップ702で検出したブロック606に含まれ
ている全ての可変長符号607(EOB符号を含む。)
をファイル204に格納する(ステップ706)。
ク606の次に、MPEG1ビデオ符号化規格で定めら
れた動画データの終了を示す終了コードがあるか否かを
判定し(ステップ707)、終了コードがある場合は、
処理を終了し、終了コードがない場合は、ステップ70
2に戻る。
いる動画データの一部(ブロック606内の可変長符号
607)が削除されることによってデータ量が削減され
た動画データが、ファイル204に格納されることとな
る。
号に近い可変長符号607が削除されるようになってい
るので、結果的には、直交変換方式で符号化された動画
データ中の高周波数成分が削除されることとなる。
12を用いて説明する。
造図である。
声データは、複数のAAU(AudioAccess Unit)100
1からなる。
ある所定のサンプル数の音声データを含み、AAUヘッ
ダ1002とオーディオデータ1003とからなる。
モード,ビットレート,サンプリング周波数等からな
り、オーディオデータ1003は、符号化された音声デ
ータからなる。
フローチャートである。
ように、まず、ファイル204に格納されている動画デ
ータを解析し、GOP602ごとに、図8に示すGOP
補助データ800を作成し、ピクチャ603ごとに、図
9に示すピクチャ補助データ900を作成する(ステッ
プ1201)。
0は、GOP602の再生開始時刻803と、GOP6
02の開始アドレス801と、GOP602の終了アド
レス802とからなる。
始時刻803は、動画データのフレームレートおよび前
にある全てのGOP602に含まれているピクチャ60
3の数に基づいて算出することができる。また、開始ア
ドレス801は、GOP602の先頭の、動画データの
先頭からの位置に基づいて算出することができる。ま
た、終了アドレス802は、次のGOP602の先頭
の、動画データの先頭からの位置に基づいて算出するこ
とができる。なお、GOP602の次にGOP602が
ない場合は、終了アドレス802は、動画データの終端
の、動画データの先頭からの位置に基づいて算出するこ
とができる。
ータ900は、ピクチャ603の再生開始時刻903
と、ピクチャ603の復号開始時刻904と、ピクチャ
603のピクチャタイプ902と、ピクチャ603の開
始アドレス901とからなる。
アドレス901は、ピクチャ603の先頭の、動画デー
タの先頭からの位置に基づいて算出することができる。
また、ピクチャタイプ902には、ピクチャ603のピ
クチャタイプをそのまま設定する。また、再生開始時刻
903は、動画データのフレームレート,GOP補助デ
ータ800の再生開始時刻803,GOP602内での
ピクチャ603の表示順序に基づいて算出することがで
きる。また、復号開始時刻904は、動画データのフレ
ームレート,GOP補助データ800の再生開始時刻8
03,GOP602内でのピクチャ603の表示順序,
ピクチャタイプ902に基づいて算出することができ
る。
音声データを解析し、図11に示すAAU補助データ1
100を作成する(ステップ1202)。
100は、AAU1001の再生開始時刻1101と、
AAU1001の開始アドレス1102とからなる。
開始時刻1101は、音声データのサンプリング周波数
およびAAU1001当りのサンプル数に基づいて算出
することができる。また、開始アドレス1102は、A
AU1001の先頭の、音声データの先頭からの位置に
基づいて算出することができる。
力することを可能とするために、GOP602ごとに、
該GOP602にAAU1101を対応付ける(ステッ
プ1203)。
補助データ800の再生開始時刻803に等しいかまた
は1番近い再生開始時刻1101が設定されているAA
U補助データ1100を検索していき、検索したAUU
補助データ1100に対応するAAU1101から次に
検索したAUU補助データ1100に対応するAAU1
101までを、1個のGOP602に対応付ければよ
い。通常、1個のGOP602には、数十個のAAU1
101が対応付けられることとなる。
602、および、ステップ1203で該GOP602に
対応付けられたAAU1001を決定する(ステップ1
204)。
602とは、MPEG1形式の音声付き動画データを伝
送すべきクライアントから指定された再生速度に基づい
て決定されるものである。すなわち、例えば、クライア
ントから指定された再生速度が1倍速(通常の再生速
度)である場合は、全てのGOP602を多重対象とし
て抽出すればよい。また、例えば、クライアントから指
定された再生速度が2倍速(早送り再生の再生速度)で
ある場合は、1/2の再生時間で再生することができる
ようにするために、全てのGOP602から、GOP6
02を1個ずつスキップするようにして、半分のGOP
602を多重対象として抽出すればよい。
のGOP602を多重対象として抽出し、抽出したGO
P602の各々について、対応付けられたAAU100
1を決定することにより、オリジナルの再生時間のT/
S倍の再生時間分の音声付き動画データを作成すること
が可能である。ここで、SおよびTは、共に自然数であ
り、S≦Tである。
P602およびAAU1001を、各々、パケットに分
割してから多重することにより、MPEG1形式の音声
付き動画データを作成し、作成したMPEG1形式の音
声付き動画データをファイル205に格納する(ステッ
プ1205)。
まれるシステム時刻基準参照値、および、パケットヘッ
ダ411に含まれるタイムスタンプを、ピクチャ補助デ
ータ900の再生開始時刻903およびAAU補助デー
タ1100の再生開始時刻1101から算出して設定す
る。
ケット410に格納するデータ412の種別を、ピクチ
ャ補助データ900の再生開始時刻903および開始ア
ドレス901、並びに、AAU補助データ1100の再
生開始時刻1101および開始アドレス1102に基づ
いて決定するようにする。
いる動画データとファイル203に格納されている音声
データとが多重された、所望の再生時間分のMPEG1
形式の音声付き動画データがファイル205に格納され
ることとなる。
MPEG1形式のオリジナルの音声付き動画データか
ら、該オリジナルの音声付き動画データよりデータ量が
少なく、かつ、対応する動画と音声とを同時に出力する
のに適した、所望の再生時間分のMPEG1形式の音声
付き動画データを作成することができる。
形式の音声付き動画データを、一旦記憶装置103に格
納してからクライアントに伝送するようにしているが、
作成したMPEG1形式の音声付き動画データを、その
ままクライアントに伝送するようにしてもよい。
する。
る削減処理302の代わりに、以下に説明する削減処理
304を行うようにしたものである。
よび図14を用いて説明する。
フローチャートである。
ように、まず、ファイル202に格納されている動画デ
ータを、ピクチャ603を検出するまで走査し、ピクチ
ャ603以外の部分を抽出してファイル204に格納す
る(ステップ1401)。
チャ603のピクチャタイプに基づいて、該ピクチャ6
03がBピクチャであるか否かを判定し(ステップ14
02)、Bピクチャである場合は、Bピクチャを構成す
るデータの代わりに、図13に示すダミーデータをファ
イル204に格納する(ステップ1403)。
る。
01は、ピクチャ603の開始を示すピクチャ開始コー
ド(同期コードの一種ある。)である。また、表示順序
1302には、ピクチャ603のGOP602における
表示順序が設定される。また、ピクチャタイプ1303
は、ピクチャ603のピクチャタイプを示すデータであ
り、ここでは、ピクチャタイプ1303には、Bピクチ
ャであることを示すデータが設定される。
場合は、IピクチャまたはPピクチャを構成するデータ
をそのままファイル204に格納する(ステップ140
4)。
チャ603の次に動画データの終了を示す終了コードが
あるか否かを判定し(ステップ1405)、終了コード
がある場合は、処理を終了し、終了コードがない場合
は、ステップ1401に戻る。
いる動画データの一部(Bピクチャを構成するデータ)
をデータ量が少ない所定のデータ(ダミーデータ)に置
き換えることによってデータ量が削減された動画データ
が、ファイル204に格納されることとなる。
ャを構成するデータのみをダミーデータに置き換えてい
るのは、上述したように、Bピクチャを構成するデータ
は、他のピクチャを符号化する際の予測に用いられない
ので、Bピクチャを構成するデータを削除しても、他の
ピクチャの画質に影響を与えないからである。
MPEG1形式のオリジナルの音声付き動画データか
ら、該オリジナルの音声付き動画データよりデータ量が
少なく、かつ、対応する動画と音声とを同時に出力する
のに適した、所望の再生時間分のMPEG1形式の音声
付き動画データを作成することができる。
音声付き動画データから、該音声付き動画データよりデ
ータ量が少なく、かつ、対応する動画と音声とを同時に
出力するのに適した、所望の再生時間分の音声付き動画
データを作成することができるという効果がある。
示すブロック図。
おけるデータの流れを示す説明図。
処理手順を示すフローチャート。
図。
すフローチャート。
すフローチャート。
補助データの構造図。
ャ補助データの構造図。
補助データの構造図。
示すフローチャート。
ーデータの構造図。
示すフローチャート。
装置、104…伝送装置、105…バス、301…分離
処理、302,304…削減処理、303…多重処理。
Claims (8)
- 【請求項1】複数のフレームからなる動画データをフレ
ーム単位に直交変換方式で符号化した動画データと、音
声データとが多重された音声付き動画データを、動画デ
ータと音声データとに分離する分離手段と、 上記分離手段が分離した動画データについて、各フレー
ム内のデータのうちの高周波数成分を表すデータを削除
することにより、各フレーム内のデータ量を削減する削
減手段と、 上記削減手段が削減した動画データのうちの、指定され
た再生時間に応じた個数のフレームを符号化した動画デ
ータの部分である再生対象動画データと、上記分離手段
が分離した音声データのうちの、上記再生対象動画デー
タと同時に再生されるべき部分である再生対象音声デー
タとを多重する多重手段とを有することを特徴とする音
声付き動画データ作成装置。 - 【請求項2】請求項1記載の音声付き動画データ作成装
置において、 上記多重手段は、 上記削減手段が削減した動画データについて、フレーム
ごとに、該フレーム内の先頭の動画データの再生開始時
刻情報を含む第1の補助データを作成する第1の作成手
段と、 上記分離手段が分離した音声データについて、同時に再
生されるべきフレームごとに、該フレーム内の先頭の音
声データの再生開始時刻情報を含む第2の補助データを
作成する第2の作成手段と、 上記第1の作成手段が作成した第1の補助データに基づ
いて、上記削減手段が削減した動画データのうちから、
指定された再生時間に応じた個数のフレームを抽出する
ことにより、上記再生対象動画データを決定する第1の
抽出手段と、 上記第1の作成手段が作成した第1の補助データおよび
上記第2の作成手段が作成した第2の補助データに基づ
いて、上記分離手段が分離した音声データのうちから、
上記第1の抽出手段が決定した再生対象動画データと再
生開始時刻が対応するフレームを抽出することにより、
上記再生対象音声データを決定する第2の抽出手段とを
有し、 上記第1の抽出手段が抽出した再生対象動画データと上
記第2の抽出手段が抽出した再生対象音声データとを多
重することを特徴とする音声付き動画データ作成装置。 - 【請求項3】複数のフレームからなる動画データをフレ
ーム単位にフレーム間予測符号化方式で符号化し、フレ
ーム内の動画データを他のフレーム内の動画データとは
独立に符号化したフレームである1個のIピクチャ,前
方向にある1個のIピクチャから順方向予測符号化した
フレームである1個以上のPピクチャ,前方向にある1
個のIピクチャまたはPピクチャと後方向にある1個の
IピクチャまたはPピクチャとから双方向予測符号化し
たフレームである1個以上のBピクチャからなる再生処
理単位であるGOP(Group Of Picture)を複数含む動
画データと、音声データとが多重された音声付き動画デ
ータを、動画データと音声データとに分離する分離手段
と、 上記分離手段が分離した動画データについて、上記Bピ
クチャ内のデータを、所定の値のデータに置換すること
により、上記Bピクチャ内のデータ量を削減する削減手
段と、 上記削減手段が削減した動画データについて、指定され
た再生時間に応じた個数のGOPを抽出することによ
り、再生すべき動画データである再生対象動画データを
決定すると共に、上記再生対象動画データと、上記分離
手段が分離した音声データのうちの、上記再生対象動画
データと同時に再生されるべき部分である再生対象音声
データとを多重する多重手段とを有することを特徴とす
る音声付き動画データ作成装置。 - 【請求項4】請求項3記載の音声付き動画データ作成装
置において、 上記多重手段は、 上記削減手段が削減した動画データについて、上記GO
Pごとに、該GOP内の先頭の動画データの再生開始時
刻情報を含む第1の補助データを作成する第1の作成手
段と、 上記削減手段が削減した動画データについて、上記ピク
チャごとに、該ピクチャ内の先頭の動画データの再生開
始時刻情報を含む第2の補助データを作成する第2の作
成手段と、 上記分離手段が分離した音声データについて、同時に再
生されるべきフレームごとに、該フレーム内の先頭の音
声データの再生開始時刻情報を含む第3の補助データを
作成する第3の作成手段と、 上記第1の作成手段が作成した第1の補助データに基づ
いて、上記削減手段が削減した動画データのうちから、
指定された再生時間に応じた個数のGOPを抽出するこ
とにより、上記再生対象動画データを決定する第1の抽
出手段と、 上記第2の作成手段が作成した第2補助データおよび上
記第3の作成手段が作成した第3の補助データに基づい
て、上記分離手段が分離した音声データのうちから、上
記第1の抽出手段が決定した再生対象動画データと再生
開始時刻が対応するフレームを抽出することにより、上
記再生対象音声データを決定する第2の抽出手段とを有
し、 上記第1の抽出手段が抽出した再生対象動画データと上
記第2の抽出手段が抽出した再生対象音声データとを多
重することを特徴とする音声付き動画データ作成装置。 - 【請求項5】請求項3記載の音声付き動画データ作成装
置において、 上記多重手段は、上記GOPの切れ目が、音声付き動画
データを伝送する際の伝送処理単位の切れ目に一致する
ようにして多重することを特徴とする音声付き動画デー
タ作成装置。 - 【請求項6】請求項4または5記載の音声付き動画デー
タ作成装置において、 上記第1の作成手段は、上記削減手段が削減した動画デ
ータのフレームレートと、当該GOPより前にある全て
のGOPに含まれているピクチャの数とに基づいて、上
記GOPごとの再生開始時刻情報を算出し、 上記第2の作成手段は、上記削減手段が削減した動画デ
ータのフレームレートと、上記GOPごとの再生開始時
刻情報と、当該ピクチャを含むGOPにおける該ピクチ
ャの再生順序とに基づいて、上記ピクチャごとの再生開
始時刻情報を算出し、 上記第3の作成手段は、上記分離手段が分離した音声デ
ータのサンプリング周波数と、当該フレームより前にあ
るフレームに含まれているサンプル数とに基づいて、フ
レームごとの再生開始時刻情報を算出することを特徴と
する音声付き動画データ作成装置。 - 【請求項7】複数のフレームからなる動画データをフレ
ーム単位に直交変換方式で符号化した動画データと、音
声データとが多重された音声付き動画データを、動画デ
ータと音声データとに分離する分離手段と、 上記分離手段が分離した動画データについて、各フレー
ム内のデータのうちの高周波数成分を表すデータを削除
することにより、各フレーム内のデータ量を削減する削
減手段と、 上記削減手段が削減した動画データのうちの、指定され
た再生時間に応じた個数のフレームを符号化した動画デ
ータの部分である再生対象動画データと、上記分離手段
が分離した音声データのうちの、上記再生対象動画デー
タと同時に再生されるべき部分である再生対象音声デー
タとを多重する多重手段とを有する音声付き動画データ
作成装置と、 上記音声付き動画データ作成装置が作成した音声付き動
画データをネットワークを介してクライアントに伝送す
る伝送装置とを備えたことを特徴とするビデオサーバ。 - 【請求項8】複数のフレームからなる動画データをフレ
ーム単位にフレーム間予測符号化方式で符号化し、フレ
ーム内の動画データを他のフレーム内の動画データとは
独立に符号化したフレームである1個のIピクチャ,前
方向にある1個のIピクチャから順方向予測符号化した
フレームである1個以上のPピクチャ,前方向にある1
個のIピクチャまたはPピクチャと後方向にある1個の
IピクチャまたはPピクチャとから双方向予測符号化し
たフレームである1個以上のBピクチャからなる再生処
理単位であるGOP(Group Of Picture)を複数含む動
画データと、音声データとが多重された音声付き動画デ
ータを、動画データと音声データとに分離する分離手段
と、 上記分離手段が分離した動画データについて、上記Bピ
クチャ内のデータを、所定の値のデータに置換すること
により、上記Bピクチャ内のデータ量を削減する削減手
段と、 上記削減手段が削減した動画データについて、指定され
た再生時間に応じた個数のGOPを抽出することによ
り、再生すべき動画データである再生対象動画データを
決定すると共に、上記再生対象動画データと、上記分離
手段が分離した音声データのうちの、上記再生対象動画
データと同時に再生されるべき部分である再生対象音声
データとを多重する多重手段とを有する音声付き動画デ
ータ作成装置と、 上記音声付き動画データ作成装置が作成した音声付き動
画データをネットワークを介してクライアントに伝送す
る伝送装置とを備えたことを特徴とするビデオサーバ。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8961395A JP3547210B2 (ja) | 1995-04-14 | 1995-04-14 | 音声付き動画データ作成装置 |
US09/727,451 US20010002851A1 (en) | 1995-04-14 | 2000-12-04 | Multimedia data processing system in network |
US11/262,931 US20060114350A1 (en) | 1995-04-14 | 2005-11-01 | Multimedia data processing system in network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8961395A JP3547210B2 (ja) | 1995-04-14 | 1995-04-14 | 音声付き動画データ作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08289297A true JPH08289297A (ja) | 1996-11-01 |
JP3547210B2 JP3547210B2 (ja) | 2004-07-28 |
Family
ID=13975610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8961395A Expired - Fee Related JP3547210B2 (ja) | 1995-04-14 | 1995-04-14 | 音声付き動画データ作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3547210B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003199073A (ja) * | 2001-12-26 | 2003-07-11 | Sharp Corp | コンテンツサーバ、配信サーバ、受信端末および情報配信システム |
US7050498B2 (en) | 2001-02-06 | 2006-05-23 | Monolith Co., Ltd. | Image generating method, apparatus and system using critical points |
US7197073B2 (en) | 2000-11-09 | 2007-03-27 | Nec Corporation | Compact MPEG data processing circuit and method of controlling the same |
US7373439B2 (en) | 2003-07-30 | 2008-05-13 | Sony Corporation | System method using material exchange format (MXF) converting program for audio and video data files having routines that generates attribute data from audio and video data file |
JP2008538058A (ja) * | 2005-03-24 | 2008-10-02 | テラヨン コミュニケーションズ システムズ, インコーポレイテッド | 圧縮領域における動画像キーイング |
-
1995
- 1995-04-14 JP JP8961395A patent/JP3547210B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7197073B2 (en) | 2000-11-09 | 2007-03-27 | Nec Corporation | Compact MPEG data processing circuit and method of controlling the same |
US7050498B2 (en) | 2001-02-06 | 2006-05-23 | Monolith Co., Ltd. | Image generating method, apparatus and system using critical points |
JP2003199073A (ja) * | 2001-12-26 | 2003-07-11 | Sharp Corp | コンテンツサーバ、配信サーバ、受信端末および情報配信システム |
US7373439B2 (en) | 2003-07-30 | 2008-05-13 | Sony Corporation | System method using material exchange format (MXF) converting program for audio and video data files having routines that generates attribute data from audio and video data file |
JP2008538058A (ja) * | 2005-03-24 | 2008-10-02 | テラヨン コミュニケーションズ システムズ, インコーポレイテッド | 圧縮領域における動画像キーイング |
US8111746B2 (en) | 2005-03-24 | 2012-02-07 | Motorola Mobility, Inc. | Motion graphics keying in the compressed domain |
Also Published As
Publication number | Publication date |
---|---|
JP3547210B2 (ja) | 2004-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7023924B1 (en) | Method of pausing an MPEG coded video stream | |
US6219381B1 (en) | Image processing apparatus and method for realizing trick play | |
US6771703B1 (en) | Efficient scaling of nonscalable MPEG-2 Video | |
US20060114350A1 (en) | Multimedia data processing system in network | |
US6871006B1 (en) | Processing of MPEG encoded video for trick mode operation | |
US6327421B1 (en) | Multiple speed fast forward/rewind compressed video delivery system | |
JP3330797B2 (ja) | 動画像データ格納方式および動画像データ復号方式 | |
US5666161A (en) | Method and apparatus for creating less amount of compressd image data from compressed still image data and system for transmitting compressed image data through transmission line | |
US6937770B1 (en) | Adaptive bit rate control for rate reduction of MPEG coded video | |
US8891937B2 (en) | Encoded stream generating apparatus and method, data transmission system and method, and editing system and method | |
US6546189B1 (en) | Method and apparatus for editing compressed moving pictures and storage medium | |
US7720352B2 (en) | Systems and computer program products to facilitate efficient transmission and playback of digital information | |
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
US20020076194A1 (en) | Methods of recording/reproducing moving image data and the devices using the methods | |
JPH09107547A (ja) | 既圧縮動画データ量削減装置および既圧縮動画データ量削減システムならびに既圧縮動画データ量削減方法 | |
JPH11225168A (ja) | 画像・音声送信装置、画像・音声受信装置、データ処理装置、及びデータ処理方法、並びに、波形データの送信方法、装置、及び波形データの受信方法、装置、並びに、動画像の送信方法、装置、及び動画像の受信方法、装置 | |
JP2002135783A (ja) | ストリーミングサービスのための可変ビット率処理方法 | |
US20080033978A1 (en) | Program, data processing method, and system of same | |
EP0840517A2 (en) | Video data stream decoding method and apparatus | |
JP3547210B2 (ja) | 音声付き動画データ作成装置 | |
JP3748234B2 (ja) | Mpegデータ記録方法 | |
JP3325464B2 (ja) | 動画像処理装置 | |
JPH10276407A (ja) | ビデオ情報提供管理方法およびシステム | |
WO2007092891A2 (en) | Methods and systems for picture rate reduction of stored video while under continuous record load | |
EP1311120A2 (en) | Method for implementing low-speed playback of a digital broadcast program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040413 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120423 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120423 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |