JP2000316136A - デジタル的にエンコード及び圧縮されるビデオの編集方法 - Google Patents

デジタル的にエンコード及び圧縮されるビデオの編集方法

Info

Publication number
JP2000316136A
JP2000316136A JP2000106311A JP2000106311A JP2000316136A JP 2000316136 A JP2000316136 A JP 2000316136A JP 2000106311 A JP2000106311 A JP 2000106311A JP 2000106311 A JP2000106311 A JP 2000106311A JP 2000316136 A JP2000316136 A JP 2000316136A
Authority
JP
Japan
Prior art keywords
video
bits
encoding
encoded
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000106311A
Other languages
English (en)
Other versions
JP3321457B2 (ja
Inventor
Faramarz Azadegan
ファラマルツ・アザデガン
Jay Yogeshwar
ジェイ・ヨーグシュウォー
Sheau-Bao Ng
− バオ・ン シャウ
David Lehmann
デイビッド・レーマン
Zimberg Mikhail
ミクハイル・ツィンバーグ
Hiroaki Unno
裕明 海野
Hidenori Mimura
英紀 三村
Tetsuya Kitamura
哲也 北村
J Cookson Christopher
クリストファー・ジェイ・クックソン
Greg B Thagard
グレッグ・ビー・サガード
Andrew Drusin Rosen
アンドリュー・ドルージン・ローゼン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Time Warner Cable Enterprises LLC
Original Assignee
Toshiba Corp
Time Warner Entertainment Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Time Warner Entertainment Co LP filed Critical Toshiba Corp
Publication of JP2000316136A publication Critical patent/JP2000316136A/ja
Application granted granted Critical
Publication of JP3321457B2 publication Critical patent/JP3321457B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • H04N5/9262Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • G11B2220/91Helical scan format, wherein tracks are slightly tilted with respect to tape direction, e.g. VHS, DAT, DVC, AIT or exabyte
    • G11B2220/913Digital audio tape [DAT] format
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】編集したときに画質を劣化させないようにす
る。 【解決手段】 デジタル的にエンコード及び圧縮される
ビデオに使用されるべき未エンコードビデオの新規部分
をきめるステップと、前記未エンコードビデオの新規部
分の終わりに、未エンコードビデオの区間を加えるステ
ップと、デジタル的にエンコード及び圧縮されるビデオ
の編集ポイントの前の基準フレームをきめるステップ
と、前記未エンコードビデオの新規部分と加えられた区
間とを、加えられた区間のオリジナルエンコードに関連
した量子化レベルを用いて、エンコードするステップ
と、前記エンコードされた新規部分を、デジタル的にエ
ンコード及び圧縮したビデオビデオとするステップとを
具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、MPEGビデオ
・エンコーダのようなビデオ符号化システムに関し、よ
り詳細には、デジタル的にエンコード及び圧縮されるビ
デオの編集方法に関する。
【0002】
【従来の技術】本願は、1995年5月8日に提出さ
れ、本願に引用して組み込まれる「符号化されたビデオ
・ビットストリームのセクションを置換するための方法
およびシステム」という名称の米国特許出願第08/4
38,014号の一部継続出願である。また、本願は、
それ以外の次の4つの出願に関連し、それらの共存出願
である。それは、それぞれ1995年6月6日に提出さ
れ、本明細書に参照により取り入れられる「音声エンコ
ーダの数が削減されたオーディオビジュアル符号化シス
テム」という題の米国特許出願第08/467,991
号、「既に符号化されたビデオ・シーケンスの品質をユ
ーザが手作業で変更するための方法およびシステム」と
いう題の米国特許出願第08/469,370号、「速
度制御式デジタル・ビデオ編集方法および量子化レベル
を変化させることにより、ビデオ・エンコーダのビット
割当てを制御するシステム」という題の米国特許出願第
08/466,766号、および「ビデオ符号化方法お
よび速度量子化器モデルを使用して符号化するシステ
ム」という題の米国特許出願第08/473,783号
である。
【0003】発明の背景 圧縮法が報が利用されるようになる前は、オーディオ、
ビデオ、及びフィルムは単に一部を切り取り、必要に応
じてそのセクションを新たな又は代替えのセクションに
置き換えることにより編集が行われていた。しかし、デ
ータをエンコードする圧縮法が用いられると、単純な
「カット及び貼りつけ」編集は、ビデオフレームを構成
するのに用いられるにのは不可能である。エンコードさ
れているビデオセクションを単純に切り取ることは、変
更されていないビデオセクションを劣化ことがあり、新
たなビデオがすでにエンコードされたビットストリーム
に単純に挿入されると、デコード副成分を含むことがあ
る。
【0004】
【発明が解決しようとする課題】したがって、本発明の
目的は、編集したときに画質を劣化させないようにした
デジタル的にエンコード及び圧縮されるビデオの編集方
法を提供することである。
【0005】
【課題を解決するための手段】この発明は上記の目的を
達成するために、デジタル的にエンコード及び圧縮され
るビデオに使用されるべき未エンコードビデオの新規部
分をきめるステップと、前記未エンコードビデオの新規
部分の終わりに、未エンコードビデオの区間を加えるス
テップと、デジタル的にエンコード及び圧縮されるビデ
オの編集ポイントの前の基準フレームをきめるステップ
と、前記未エンコードビデオの新規部分と加えられた区
間とを、加えられた区間のオリジナルエンコードに関連
した量子化レベルを用いて、エンコードするステップ
と、前記エンコードされた新規部分を、デジタル的にエ
ンコード及び圧縮したビデオビデオとするステップとを
具備することを特徴とする。
【0006】またこの発明では、上述したデジタル的に
エンコード及び圧縮されるビデオ信号ビデオ信号は、M
PEG−2の規格によりエンコードされることを特徴と
する。
【0007】さらにまたこの発明では、上記した基準フ
レームを決めるときは、編集ポイントの前の予測ビデオ
フレームを構成するステップを有するものであって、前
記予測フレームは、編集ポイントの後の2つの前後予測
ビデオフレームよって参照されたものであることを特徴
とする。
【0008】又この発明では、前記エンコーディングす
るステップの量子化レベルは、前記加えられた期間のオ
リジナルエンコーディングにおいて用いられた量子化レ
ベルと同じであることを特徴とする。
【0009】さらにまた、前記期間を加えるステップの
未エンコードビデオの期間は、少なくとも、(1/2)
秒の期間を持つ1つのピクチャーグループ(GOP)を
含むことを特徴とする。
【0010】
【発明の実施の形態】以下、この発明の実施の形態を図
面を参照して説明する。
【0011】本発明は、複数の構成要素および機能を備
えるデジタルビデオエンコードシステムである。システ
ムのさまざまな構成要素をさらに容易に識別する目的
で、本明細書は、以下に示す項に編成されている。
【0012】I. はじめに II. システム構成要素 III. 汎用システム動作 IV. システム代替策 V. 最適エンコード効率を維持しながらのオーディオ
エンコーダ数の低減 VI. エンコードされたビデオの情報を記憶するため
のログファイル、ならびにログファイルおよびエンコー
ドされたビデオにアクセスするためのログインタプリタ
ユーティリティ VII. エンコードされたビデオの品質の変更 A. 期間での品質の変更 B. フレームの領域内での品質の変更 VIII. 品質変更後のビデオの再エンコード A. 品質が単独フレーム内で変更された場合のビット割
当て制御 B. 編集ポイントでのデコードを回避しながらの再エン
コード 1. 最初にエンコードしたときに使用された状態にエン
コーダを復元 2. ピクチャのグループのクローズモードでの再エンコ
ード IX. エンコードに使用されるレート量子化モデリン
グ X. データ構造を使用して、オーディオ、ビデオ、お
よびサブピクチャのデジタル信号の結合 I. はじめに 開示されたシステムは、デジタル圧縮システムとしても
知られるデジタルオーディオ映像エンコードシステムに
関する。本明細書に開示される考えは、あらゆる種類の
エンコード方式で使用可能で、特に、正式にはISO/IEC
13818-2、MPEG-2システム情報を指定するISO/IEC 1381
8-1、およびMPEG-2の前身であるMPEG-1(ISO/IEC 11172
-ビデオ)として知られるMPEG-2(エムペグ:Moving Pi
cture Experts Group)に適用できる。本明細書では、M
PEG-1およびMPEG-2は集合的に「MPEG」と呼ばれる。MPE
G規格は、圧縮されたまたはエンコードされたビデオス
トリームの構文だけを指定しているが、圧縮をどのよう
に実行するかは指定していない。MPEGエンコードされた
データストリームは圧縮済みのデータストリームである
ため、エンコードプロセスは圧縮プロセスと呼ぶことが
できるし、その逆も可能であることに注意すべきであ
る。また、システムはドルビー(登録商標)AC-3を使用
して実行できるオーディオのエンコード、つまりISO/IE
C 13818-3 に定義されるMPEG-2規格にも関する。前記規
格のそれぞれが、それらを参照することにより本明細書
の一部をなすものとする。
【0013】MPEGビデオ圧縮は、時間的な因果関係の予
測圧縮である。MPEGエンコーダは新しいビデオピクチャ
を受け取ると、新しいビデオピクチャを、エンコーダが
既にエンコードされたピクチャに基づいて作成した予測
されたピクチャと比較する。予測が以前に伝送された情
報に基づいて立てられるために「因果関係(causal)」予
測コーディングという用語が使用され、予測が時間的な
ピクチャ単位で実行されるために、「時間的(tempora
l)」因果予測コーディングという用語が使用される。予
測手順には、ビデオピクチャ内での領域の運動の予測が
必要である。したがって、時間的予測は、動き補償予測
と呼ばれることもある。
【0014】旧ピクチャと新ピクチャの比較の結果は、
後のビデオピクチャに格納される新しい情報を表す。そ
れから、「残留情報(residual information)」と呼ばれ
る新しい情報は、一連の情報圧縮プロセスを受けること
となる。まず、離散コサイン変換(DCT)と呼ばれる一次
数学変換が実行される。DCT演算により、ピクセル残留
情報が係数の列に変換される。MPEG圧縮においては、DC
Tは8x8ピクセルから成るブロックで実行される。同様
に、DCT係数も8x8配列数内に入れられる。その後、これ
らの係数は、量子化ステップサイズ,つまりq-レベルに
基づき、精度の設定された程度まで個別に量子化される
(すなわち四捨五入される)。量子化プロセスは、通
常、値ゼロが設定された多くの係数を生み出す。さもな
ければ、この量子化プロセスは、量子化雑音と呼ばれる
コーディング構造が生じさせることとなる。
【0015】量子化された係数は、その後、ゼロ値が設
定された係数でのランレングスコーディング、およびそ
れぞれが結果として生じるランレングス値とゼロ以外の
係数値をそれぞれ表す2つの数の組の可変長コーディン
グの組み合わせを使用してコーディングされる。これら
のランレングス非ゼロ値の組のコードは、他のオーバヘ
ッド情報とともに、ビデオピクチャに対応する圧縮済み
デジタルデータストリームを形成する。出力データ転送
レートや記憶容量のような物理的な制限のために、適切
な量の圧縮が達成されるように、量子化の程度を変化さ
せることが必要である。これがバッファフィードバック
と呼ばれる。
【0016】MPEGに準拠するデコーダは、エンコードさ
れたのデジタルデータストリームを読み取り、エンコー
ドプロセスと逆の演算を実行する。
【0017】一般的には、デジタルデータストリーム中
のビット総数は、実質上、ビデオピクチャを表すために
必要とされるビット総数を下回るため、圧縮が達成され
る。しかしながら、MPEGビデオコーディングによって例
証されるような圧縮が、決して歪みや人為構造(artifac
ts 加工品)を免れないことを認識することが重要であ
る。前述したように、圧縮人為構造の主要なソースは量
子化プロセスである。
【0018】開示されたシステムは、圧縮プロセスまた
はエンコードプロセスの間に量子化の程度を動的に調整
することを目的とする。特に、調整は人間のオペレータ
によって出される指示に従って行われる。調整は、より
大きなビデオシーケンスの部分に適用する場合もあれ
ば、ビデオシーケンス全体に適用することもある。
【0019】II. システム構成要素 ここで、類似した参照番号が複数の図を通して同一の部
分または対応する部分を示し、さらに特定するとその図
1Aを示す図面を参照すると、エンコーダシステムアー
キテクチャのブロック図が示されている。ビデオエンコ
ードプロセスとは、中断やエラーなくエンコードおよび
編集を達成するために同期して動作する多くの異なった
装置を必要とする1つの複雑なプロセスであることに注
記すべきである。しかし、オーディオエンコードおよび
ビデオエンコードは、適切なタイムコードが使用される
限り、別個に実行できる。図1Aには4つのワークステー
ションが描かれているが、通常、エンコードシステムの
ユーザまたはオペレータが対話するのは1台のキーボー
ドおよびワークステーションだけである。ワークステー
ションは、プロセッサ、RAM、ROM、ネットワークインタ
フェース、ハードディスク、キーボード、モニタ、およ
びそれ以外の従来の構成要素のような従来の汎用コンピ
ュータ構成要素を具備する。
【0020】ワークステーション30は、実施例ではSun
SPARC20 Unixワークステーションであるシステム制
御ステーションとして機能する。ワークステーション30
には、マウスやそれ以外のポインティングデバイスであ
るキーボード32およびポインティングデバイス33のよう
な従来のワークステーション入力装置だけではなく、グ
ラフィックコンソールディスプレイモニタ31も具備され
る。ユーザは、おもに、コンソールディスプレイ31に表
示されるグラフィックユーザインタフェース(GUI) 介し
てワークステーション30を視覚的に操作することとな
る。
【0021】ワークステーション30は、以下に説明する
別のワークステーション40、10および20に接続され、そ
れらを制御する。ワークステーション30は、やはり以下
に説明するオーディオインタフェース装置72およびデジ
タルビデオキャプチャ記憶装置60にも接続される。ワー
クステーション30は、米国電子工業会(EIA)規格RS-232
によって定義される直列インタフェースを介してワーク
ステーション40に接続される。同様に、ワークステーシ
ョン30とオーディオインタフェース装置72の間の接続も
直列RS-232規格による。ワークステーション30とデジタ
ルビデオキャプチャ記憶装置60の間の接続は、業界規格
のS-バスインタフェースを介している。
【0022】フレームジョガー41は、オペレータが、VT
R51または52どちらかのビデオを編集を実行しなければ
ならない箇所に位置決めできるようにするために、ワー
クステーション40に接続される。システムは、ビデオの
位置を制御するために、オペレータが入力するタイムコ
ードを使用することができる。ただし、ジョグ制御装置
は、ビデオを位置決めするためにジョブノブの使用を可
能にすることによって、システムのユーザフレンドリ度
を高めている。ワークステーション30は、ビデオディス
プレイモニタ61で表示されるビデオが、デジタルキャプ
チャ記憶装置60または録画VTR62、あるいはその両方か
らのビデオであるのかどうかを制御する。
【0023】ビデオエンコード装置50は、MPEG-1、MPEG
-2、またはそれ以外のビデオ圧縮規格に従って圧縮を実
行するデジタルビデオエンコーダである。市販されてい
るMPEG-1エンコーダは、ソニーRTE-3000である。MPEG-2
エンコーダは、本明細書に参照により取り入れられる19
94年12月27日に出願された日本特許明細書6-326435号に
説明される教示に従って構築することができる。ワーク
ステーション10は、業界規格S-バスインタエースを介し
てビデオエンコード装置50を直接的に制御し、ワークス
テーション10は、イーサネットネット(登録商標)ワー
クのような標準ネットワーキング装置を介してワークス
テーション30からコマンドを受け取る。エンコードプロ
セスの間、ワークステーション10は、ビデオエンコード
装置50のビデオエンコード制御プログラムのリアルタイ
ム実行をサポートする。実施例においては、ワークスス
テーション10は、Sun SPARC20 Unixワークステーショ
ンである。
【0024】ワークステーション10は中央ワークステ
ーション30からのコマンドに応え、圧縮プロセスを開
始する。圧縮プロセスの間、ワークステーション10
は、ビデオ信号の特定の領域に適用される量子化の程度
を動的に制御する。量子化が変化させられる特定の領域
は、空間的領域または時間的領域、あるいはその両方に
及び、量子化が厳密にどのように制御されるのかは以下
に説明する。
【0025】ビデオエンコード装置50への入力ビデオ
は、再生VTR51内のテープからである。再生VTR51は、職
業用のデジタルビデオ規格、ITU-R601(以前はCCIR601
ビデオ規格と呼ばれていた)ビデオテーププレーヤであ
る。この規格は、PALシステムだけではなくNTSCシステ
ムにも適用する。再生VTR51内のテープには、ビデオカ
メラまたはフィルムカメラによってキャプチャされた
か、あるいはコンピュータによって作成されたさまざま
な画像および場面を表す電磁情報が記憶されていること
が注記される。ビデオエンコード装置50からのエンコー
ドされた出力は、1つ以上のハードディスク21で記憶す
るためにワークステーション20に転送される。
【0026】ビデオエンコード装置50によりエンコード
および出力されたビデオデータを表示するためには、MP
EG-2のようなデジタルビデオデコーダが必要になる。し
かし、本明細書の作成時点では、実現されたシステム
は、このようなデコーダはシステムの初期開発段階の間
は容易に手に入らなかったため、別個のMPEG-2デコーダ
を実装していない。したがって、ビデオエンコード装置
50は、MPEG-2ビデオストリームをワークステーション20
に出力するだけではなく、MPEG-2のエンコードデータに
同等な復号化されたビデオ画像がビデオエンコード装置
50から録画VTR52へ出力される。録画VTR52は、D1インタ
フェースとして知られる業界規格のデジタルビデオ信号
コネクタによりビデオエンコード装置50に接続され、ワ
ークステーション40によって制御される。再生VTR51お
よび録画VTR52の両方共、Ampex DCT職業用ビデオテープ
レコーダを使用して適切に実現される。
【0027】オーディオは、例えばドルビーAC-3フォー
マットまたは代わりにISO/IEC 13818-3規格に記述され
るようなMPEG-2に準拠するフォーマットにエンコードさ
れ、圧縮される。エンコードシステムのオーディオソー
スは、4つのデジタルオーディオテープ(DAT)プレーヤ、
71a、71b、71cおよび71dである。スタジオ品質のDATプ
レーヤは、ソニーが市販している。DATプレーヤ71a-71d
は、ワークステーション40によって業界規格プロトコル
RS-422を介して接続され、制御される。DATプレーヤ71a
-71dによって出力されるオーディオ信号は、オーディオ
エンコーダ70a、70b、70c、および70dにそれぞれ入力さ
れる。これらのオーディオエンコーダは市販のドルビー
AC-3モデルDP525エンコーダを使用して実現され、オー
ディオインタフェース装置72によって制御される。通
常、オーディオエンコードは指定されたタイムコードで
開始、終了する。オーディオインタフェース装置72は、
ワークステーション30からその間のRS-232接続上でエン
コード開始タイムコードおよびエンコード終了タイムコ
ードのような命令を受け取る。さらに、オーディオイン
タフェース装置72は、さまざまなデジタル圧縮済みオー
ディオデータを、ワークステーション20に伝送される単
独デジタルストリームに多重化する。ワークステーショ
ン20は、オーディオエンコード装置70により出力される
圧縮済みデジタルデータに対応する複数のファイルに、
入力デジタルオーディオストリームを多重分離する。ビ
デオエンコード装置50は、そのビデオ同期信号に基づく
同期信号をオーディオインタフェース装置72に提供す
る。同期信号により、オーディオビットストリームは、
ビデオエンコード装置50により出力されるビデオビット
ストリームに同期できるようになる。
【0028】ワークステーション30は、さまざまなオー
ディオエンコード装置70a-70dのどれかからオーディオ
デコーダ73へオーディオデータの複製を提供するように
オーディオインタフェース装置72に指示する機能を備え
る。オーディオデコーダ73は、圧縮済みのオーディオ
を、ユーザがスピーカ75を介してオーディオを聞くこと
ができるように復号化する。どのオーディオエンコード
装置をモニタするかについての選択は、キーボード32ま
たはポインティングデバイス33のどちらかによってコン
ソールディスプレイ31上でのグラフィックユーザインタ
フェースを通して人間のオペレータが決定する。オーデ
ィオインタフェース装置72の構成は、前述の機能を実行
する機能を備えたハードウェアである。このハードウェ
アは、1つ以上のプログラミングされたマイクロプロセ
ッサまたは開示された機能を達成するために配列される
従来の回路要素、あるいはその両方である。
【0029】ワークステーション40はスタジオ装置制御
ステーションであり、録画ビデオテープレコーダ52とと
もに、再生ビデオテープレコーダ51およびデジタルオー
ディオテーププレーヤ71a-71dの両方を制御するために
適切なコマンドを発行する。また、ワークステーション
40は、デジタルビデオキャプチャ記憶装置60に、適切な
時点でビデオのキャプチャを開始するように命令する。
ワークステーション40とさまざまなビデオテープデッキ
およびオーディオテープデッキの間の接続は、業界規格
のRS-422プロトコルである。このプロトコルを使用する
と、各テープデッキはワークステーション40に、標準タ
イムコードフォーマットでその現在のテープロケーショ
ンを知らせることができるようになる。ワークステーシ
ョン40はこのような情報を使用して、ビデオとオーディ
オの情報が正しく、再生、記録されるように、さまざま
なテープデッキを適切に同期させる。この実施例では、
ワークステーション40は、DOSおよびカリフォルニア
州、モアパークにあるEditingTechnologies Corp.Ensem
ble Proが市販しているソフトウェアプログラムであるE
nsemble Proを実行する標準的なIBM互換パーソナルコン
ピュータである。ワークステーション30がRS-232通信ポ
ートを介してワークステーション40で実行しているEnse
mble Proと通信できるように、マイナーな改良をEnsemb
le Proプログラムに加えたことを注記する。この改良は
Editing Technologies, Corp.を介して市販されている
か、あるいは過度の実験を行わないでも当業者により実
行できるかのどちらかである。
【0030】デジタルビデオキャプチャ記憶装置60は、
エンコードシステム内で、以下に示す2つの機能を行
う。第1に、この装置は、ビデオ信号に適用されてきた
手動編集の便利な「前と後」比較を行うためにそのキャ
プチャ記憶機能を使用し、第2ビデオディスプレイにグ
ラフィックオーバレイ機能を提供する。このグラフィッ
クオーバレイ機能は、例えば、空間手動編集フェーズの
間に使用され、人間のオペレータが、量子化およびその
結果割り当てられたビットの数が変化する関心のある領
域を定義できるようにする。
【0031】本発明では、デジタルビデオキャプチャ記
憶装置は、カリフォルニア州、マウンテンビューにある
Viewgraphicsの市販されているDRAMベースのオーディオ
製品モデルVS6000として実現されている。この装置に入
力されるデジタルビデオは、ITU-R-601(旧CCIR 601)
画像解像度を備える業界規格D1による。デジタルビデオ
キャプチャ記憶装置60の出力は、ビデオ信号の赤、緑、
および青の構成要素を表す3つの別個のアナログ信号を
介してビデオディスプレイに接続される。グラフィック
オーバレイ情報は、デジタルビデオキャプチャ記憶装置
60によって出力される最終アナログ信号の作成前に、デ
ジタルビデオキャプチャ記憶装置60により処理されるた
め、他のビデオデータとともにビデオディスプレイモニ
タ61では人間のオペレータが見ることができる。
【0032】Unix環境で動作しているワークステーショ
ン30は、デジタルビデオキャプチャ記憶装置60を使用す
るビデオディスプレイモニタ61の上にそのグラフィック
ウィンドウをマップする。これによって、人間のオペレ
ータは、モニタ61に示されるディスプレイのグラフィッ
クオーバレイ面で(矩形の描画のような)グラフィック
動作を実行できるようになる。装置60は、オーバレイ機
能を実現する。オーバレイは、メモリ内の情報をモニタ
を駆動するアナログビデオ信号に変換する前に、ビデオ
メモリで実行される。システムが使用するVS6000は、ビ
デオメモリの上部に8-ビットメモリを持つ。この8-ビッ
ト面で、コンピュータはあらゆるカラーグラフィックス
およびテキストを描画できる。この8-ビット面での
「色」の1つが透明色である。透明色であるこのオーバ
レイ面上の任意のピクセルは、その下にあるビデオメモ
リの値を採る。一般的には、オーバレイ面の大部分が透
明色になり、(線、テキストなどの)グラフィックは透
明以外の色を使用する。したがって、ビデオメモリおよ
びオーバレイグラフィックメモリの両方からなるディス
プレイメモリが形成される。モニタ61で表示するために
究極的にはアナログ信号に変換されるディスプレイメモ
リである。人間のオペレータは、通常、キーボード32と
結び付いたポインティングデバイス33を使用し、この
ようなグラフィック動作およびこのようにして作成され
たグラフィックオブジェクトの操作を実行する。
【0033】ワークステーション20は、オーディオイン
タフェース装置72だけではなくビデオエンコード装置50
からデジタルデータストリームを受け取る。ワークステ
ーション20は、イーサネット接続でワークステーション
30に接続され、ワークステーション20は、業界規格のS-
バスインタフェースを介してビデオエンコード装置50お
よびオーディオインタフェース装置72にも接続される。
受け取られたデジタルデータストリームは、別個のデー
タファイルとして1つ以上のハードディスクの中に記憶
される。別個のダイレクトメモリアクセス(DMA)カード
は、キャプチャされたデジタルストリームデータをハー
ドディスク21に転送するときに使用される。結果的に大
量のデジタルデータが生じる長いビデオシーケンスの場
合、ハードディスク21は、Sun Microsystems製のSPARCs
torage Array X655A/G5のような市販されているハード
ディスクを使用して実現できる。この実施例において
は、ワークステーション20は、Sun Microsystems製の市
販されているSPARKserver 1000である。
【0034】また、ワークステーション20は、ビデオ圧
縮済みデータおよびオーディオ圧縮済みデータに対応す
るデータファイルも、復号化装置への移送または伝送に
適切な単独フォーマットファイルにフォーマットする。
最終的な媒体はディスクベースであるのが望ましく、そ
の場合フォーマットは、関連するディスクフォーマット
に準拠することになる。通常、フォーマットされたファ
イルは、デジタルテープのようななんらかの中間デジタ
ル記憶手段により、1つまたは複数の最終伝送媒体への
転送が発生する機構へ移送される。図示されているデジ
タル記憶装置22は、このような目的に使用される。本実
施例では、デジタル記憶装置22は、市販されている8 mm
Exabyteテープドライブを具備する。デジタル記憶装置
22のインタフェースは、業界規格の小型コンピュータ用
周辺機器インタフェース(SCSI)である。
【0035】複数のSCSI装置を同じSCSIバスに接続でき
ることは既知である。したがって、デジタル記憶装置22
は、市販されているデジタルリニアテープ(DLT)ドライ
ブ、磁気光学(MO)ディスクドライブ、またはフロッピー
ディスクドライブのような他のSCSI装置も具備できる。
これらの構成は容易に対応され、フォーマット段階の前
またはフォーマット段階の間に必要となる可能性がある
補助データ用の柔軟な入力機構を提供するのに役立つ。
例えば、映画の製作では、字幕情報は、大部分の場合、
前記のSCSI装置の1つを必要とする媒体内で利用でき
る。このような場合、補助データはワークステーション
20で実行中のソフトウェアプログラムによって読み取ら
れ、補助データがフォーマットされたファイルに格納さ
れるように処理される。補助データは、米国のクローズ
キャプションフォーマットである字幕データを格納する
場合がある。補助データには、プログラムコードやポス
トスクリプトデータのような希望のデータを入れること
ができる。
【0036】図1Bは、図1Aのシステムに対応し、図1
Aのシステムと同じように機能するオーディオ/映像エ
ンコードシステム98がブロック図を示している。図1B
では、エンコードシステムヘのビデオ入力がカメラ80か
ら供給され、オーディオはマイクロフォン82から供給さ
れる。映像情報およびおそらくオーディオ情報を記憶す
る映画フィルムは、フィルムを照明するためのライトお
よびフィルムから画像をキャプチャするための光検出器
を具備する転送装置88を介してエンコードシステム98に
転送される。入力装置80、82、および88からの情報は、
オーディオテープレコーダまたはビデオテープレコーダ
によってのような、エンコードシステム98によってエン
コードされる前に電磁フォーマットで記憶される。オー
ディオテープおよびビデオテープは、図1Aのシステム
によりエンコードされる。
【0037】エンコードシステムにより作り出される最
終的なデジタルビットストリームは、光ディスクをプレ
ス加工する光ディスクマスタリング装置90、光ディスク
に書き込む光ディスク書込み装置84に送られるか、ある
いはテレビジョン送信機86を介して、テレビジョン受像
器またはセットトップボックスデコーダに伝送されるこ
とがある。光ディスクのプレス加工および作成は、例え
ばマスタディスクを使用する既知で市販されている方法
で実行される。エンコードされた情報は、ビデオオンデ
マンドシステムでも使用できる。エンコードされたビッ
トストリームは、究極的には、エンコードプロセスに対
応する復号化プロセスにより復号化され、オーディオ映
像情報はテレビまたはモニタでユーザに表示される。復
号化装置は、テレビまたはモニタで表示するためにエン
コードされたディスクを復号化するデジタルビデオディ
スクプレーヤを具備する。
【0038】エンコードシステムがオーディオおよび画
像を表す電気信号を入力し、電気信号を新しいフォーマ
ットに変換し、究極的には、エンコードされた元の情報
を作成し直すために信号が復号化されることは、図1B
から明らかである。
【0039】III. システム動作 図2は、図1にブロック図されるシステムの一般的な動
作を説明するフローチャートである。図2から分かるよ
うに、システムはその動作サイクルの間に複数の「状
態」を経過する。濃い実線は標準的な操作経路を示し、
実線は中断終了経路を描き、破線はバイパス経路を示
す。
【0040】システムによる最初の動作はセットアップ
状態100で発生する。このステップによって、圧縮状態1
02が入力される前に、入力パラメータを指定することが
できる。圧縮状態102では、再生VTR51内のテープに記憶
されるビデオ画像が、ビデオエンコード装置50によりデ
ジタル圧縮されたフォーマットにエンコードされる。
【0041】圧縮状態102の後、ユーザは、編集状態104
の過去に圧縮されたデータの画質に基づいて手動で圧縮
プロセスを編集することができる。これによって、ユー
ザは、ビデオの1フレームの領域内または期間で画質を
改善または低下させることができる。「編集」という用
語が、場面自体をピクチャストリームに付加したり、削
除することを意味しないことに注意すべきである。本明
細書中では、「編集」という用語は、量子化および続い
てビデオの質を変更することを意味する。画像が編集状
態104で編集された後、新しいユーザ指定パラメータに
従ってデータをエンコードするために、圧縮状態102で
再び圧縮動作を実行することが必要である。
【0042】ユーザがビデオの編集された形式を確認し
てから、字幕のようなオーディオ、ビデオおよびそれ以
外の情報を含むすべての情報が、フォーマット状態106
で、まとめて希望のフォーマットに結合される。完了状
態108では、あらゆる一時ファイルが消去され、プロセ
スは終了状態110で終了する。図2に説明される個々の
状態に関するさらに詳細な情報は、ここでは図3から図
6を参照して説明する。
【0043】図3は、セットアップ状態100で実行され
るステップを示している。ステップ120は、セットアッ
プ状態を開始し、ステップ122はシステムを初期化し
た。このステップでは、ワークステーション30に格納さ
れるシステム制御ソフトウェアの実行が開始され、それ
以外に、コンソールディスプレイ31に表示され、キーボ
ード32およびポインティングデバイス33を介してパラメ
ータを入力させるユーザインタフェースを担当するグラ
フィックユーザインタフェース(GUI)プログラムのよう
なプログラムが起動される。また、ステップ122の間
に、ワークステーション30のシステム制御装置ソフトウ
ェアが他の装置に照会し、システムの利用可能な装置を
含むシステム状態を突き止める。
【0044】ステップ124では、GUIを通してユーザに情
報が表示される。歓迎のメッセージ、システムに関する
情報、エンコードプロセスに使用されるパラメータ、お
よび過去にエンコードされたあらゆるファイルの存在が
表示される。表示されたシステム情報には、オーディオ
エンコーダ、VTR、オーディオテープデッキ、およびそ
の構成を含むシステムに接続される装置が含まれる。シ
ステムに既にエンコードされたファイルが格納されてい
る場合は、ファイルを作成するのに使用されたオーディ
オエンコードパラメータおよびビデオエンコードパラメ
ータを記述する情報がユーザに表示される。
【0045】ステップ126では、それから、標準システ
ムパラメータまたはユーザ指定システムパラメータを使
用するエンコード、システムパラメータに対する変更、
または選択されたパラメータが受入れ可能であることの
確認を開始するためのコマンドのようなユーザからの情
報を入力する。
【0046】それから、ステップ128では、エンコード
動作と復号化動作の準備をするために、グラフィックユ
ーザインタフェースからシステム制御装置ソフトウェア
に、入力されたデータを転送することにより、入力デー
タを処理する。セットアップ状態は130で終了する。
【0047】図4には、圧縮状態102で実行されるプロ
セスがブロック図される。標準動作フローに従い、ユー
ザは、すでに、セットアップ状態で圧縮されるビデオお
よび付随オーディオシーケンスを指定した。それから、
ユーザは、システムに、自動手順、つまり自動圧縮手順
を実行するように指示する。自動圧縮手順の間のビデオ
圧縮においては、ユーザは、その期間、あるいはビデオ
の1フレームの中で動的量子化プロセスを制御すること
はできない。これは、コーディング決定がビデオエンコ
ード装置50により計算される客観的な基準に基づいて下
される、初期圧縮実行である。自動圧縮がすでに実行さ
れていた場合は、ユーザは、空間的(フレームまたはビ
デオ上で)または時間的(ビデオシーケンスで)のどち
らかで、編集圧縮モードでの量子化を手動で調整でき
る。
【0048】圧縮状態では、ステップ140で開始した
後、ステップ142で圧縮動作に備える。この動作中、ビ
デオのタイムコードおよび圧縮パラメータとともに圧縮
される付随オーディオのような圧縮プロセスのパラメー
タが、ワークステーション10を介してワークステーショ
ン30からビデオエンコード装置50にダウンロードされ
る。
【0049】それから、ステップ144では、希望の圧縮
の種類が決定される。初めて情報を圧縮するときには、
圧縮プロセスは自動的に、ユーザの介入なく実行され
る。ステップ146では、自動圧縮プロセスの準備をす
る。この準備中に、ワークステーション30は、デジタル
オーディオテーププレーヤ71a-71dおよび関連するオー
ディオエンコード装置70a-70dの内のどれを使用しなけ
ればならないかを決定する。また、ワークステーション
30は、ワークステーション20に、オーディオインターフ
ェス装置72を介した、ビデオエンコード装置50およびオ
ーディオエンコーダ70a-70dの出力からのビットストリ
ームキャプチャに備えるように命令する。さらに、再生
VTR51、録画VTR52、およびDATプレーヤ71a-71dは、テー
プを適切な開始位置まで進める。それから、ワークステ
ーション40が再生ビデオテープレコーダ51、録画テープ
レコーダ52、およびDATプレーヤ71a-71dに、ステップ14
8の移動を開始するように信号を送る。その後、ステッ
プ150で、ビデオエンコード装置50を使用するMPEG-1ま
たはMPEG-2フォーマットのような希望のフォーマットに
従ってビデオデータがエンコードされる。また、オーデ
ィオデータも、ドルビーAC-3フォーマットのような希望
のフォーマットに従ってエンコードされる。手動編集プ
ロセスを後で補助するためにログファイルを作成する必
要がある。ログファイルは、ビデオデータの後での編集
を実行するために必要となるエンコードされたビデオデ
ータのパラメータを示す。エンコードプロセスは、適切
なタイムコードに到達するステップ160で停止する。こ
のタイムコードは、エンコードされるべき情報の最後で
ある場合もあれば、ビデオシーケンスの最後ではないユ
ーザが指定したポイントである場合もある。
【0050】ステップ144で、自動圧縮プロセスがすで
に実行され、ユーザが、以下に図5に関して説明するよ
うに、編集状態の間に指定されたパラメータを使用して
ビデオの1つ以上のフレームの画質を手動で変更するこ
とを希望すると判断されると、ステップ144で、編集−
圧縮動作を実行する必要があるかどうかが判断されるだ
ろう。ステップ152では、手動編集が開始するポイント
である希望の開始ポイントへの再生VTR51の合図を含む
編集圧縮動作の準備が行われる。また、オーディオ情報
は、いったん自動圧縮動作でエンコードされると、変更
する必要はないので、オーディオ装置はディスエーブル
される。それから、ステップ154で、再生VTR51および録
画VTR52が移動する。
【0051】ステップ156では、その後、図5に説明す
る編集状態でユーザによって指定されたパラメータに従
ったビデオデータのエンコードが開始する。編集圧縮
は、終了タイムコードに達したステップ160で終了す
る。ステップ162では、ユーザに、圧縮およびエンコー
ドが完了した旨のメッセージが表示され、プロセスはス
テップ164で終了する。
【0052】図5は、編集状態104で実行されるプロセ
スを説明する。前述したように、ここで言われる編集と
は、ビデオシーケンス内で場面を削除、短縮、または移
動させる従来のビデオの編集ではない。本明細書でいう
編集状態とは、ビデオの一部またはビデオの時間シーケ
ンスの質を、手動でビデオの量子化を設定することによ
り変更することである。
【0053】ステップ170で編集状態を開始した後、ス
テップ172では、ユーザはエンコードされたビデオのビ
ット割当てを変更することによるビデオの手動の編集を
希望するかどうか尋ねられる。ユーザがビット割当ての
変更を望まない場合、プロセスはステップ188で終了す
る。ユーザがビット割当ての変更を望む場合は、ユーザ
はステップ174で編集対象のビデオセグメントを定義す
る。これは、画質を変更しなければならないビデオの期
間を選択することによって実行される。それから、ステ
ップ176で、ユーザが空間的編集または時間的編集を希
望するのかを判断する。空間的編集がビデオのフレーム
の中でビットの量子化または割当てを変更するのに対
し、時間的編集は、ビットの割当てを期間で変更する。
ユーザが空間的編集を選択すると、フローは、編集され
るフレーム内の領域を入力するステップ178に進む。ま
た、適用される変更の相対的な程度も入力される。本発
明の場合、ゼロを含む-5から+5の整数目盛りが、変更の
相対量を示すために使用される。ユーザは、キーボード
32またはポインティングデバイス33あるいはその両方を
使用してビデオの領域をマークし、-5から+5の間で-5と
+5を含む整数の内の1を指定する。ユーザは、ある領域
に以前設定された量子化レベルを変更してはならないこ
とを示すこともできる。例えば、ユーザはある一定の領
域のビット割当ての増加を希望する場合、それ以外の領
域のビット割当てを減少しなければならない必要があ
る。ユーザがある領域を「保護つき(protected)」とも
呼ばれる変更不可と設定すると、画質領域の改善に必要
となるビットは保護つきの領域からは採取されない。
【0054】ステップ176でユーザが時間的編集を希望
すると判断されると、フローは、どのように期間を編集
しなければならないのかを入力するステップ180に進
む。空間的編集と同様に、時間的編集の場合も、ユーザ
は、ビデオのある特定のシーケンスに適用される変更の
相対度を示す-5と+5の間の整数値を指定する。この変更
は、選択された期間全体で有効となる。
【0055】空間的編集または時間的編集のどちらかが
ステップ178と180で実行されてから、ステップ182で、
ビデオシーンが、手動で入力されたパラメータに従っ
て、エンコードし直され、例えばMPEG-2フォーマットに
圧縮し直される。ユーザが画質がどのように変更された
のかを詳しく比較できるように、既にエンコードされた
のデータは新規に編集されたデータの隣に表示される。
【0056】オペレータが編集対象のセグメントを示す
と、VTR52からのビデオが記憶装置60に転送され、記憶
装置60で利用可能な総メモリの多くても半分を占める。
そのセグメントは、「前の」セグメントに対応する。編
集−圧縮プロセスの間、ビットストリームはワークステ
ーション20によってキャプチャされ、マスタビデオビッ
トストリームファイルから別個のビットストリームファ
イルとして記憶される。マスタビデオビットストリーム
ファイルは、映画全体の圧縮済みビットストリームであ
る。編集−圧縮されたビデオはVTR52で録画される。エ
ンコードプロセスの間、オペレータはピクチャを、それ
がVTR52で録画されているのと同時に表示することにな
る。オペレータがエンコードした後のピクチャの表示を
希望する場合は、VTRを再生機械として使用できる。オ
ペレータが「前と後」の比較を実行したいと考える場
合、VTR52の対応するセグメントが記憶装置60に転送さ
れ、装置60の総メモリの残りの半分までを消費する。
【0057】このエンコードの後、オペレータは、変更
されたビデオを保存する必要があるかどうかを決定す
る。オペレータが「後」のセグメントを無視することを
決めた場合、マスタビットストリームは変更されずに残
され、編集−圧縮済みのビットストリームは削除され
る。VTR52がマスタビットストリームを反映できるよう
にするには、「前」のセグメントを録画する目的だけ
に、編集済みのセグメントで別の自動−圧縮が実行され
る。装置60を「前」のセグメントをVTR52に転送して戻
すために装置を使用するという代替策も可能である。オ
ペレータが「後」のセグメントを記憶することを決めた
場合、以下に説明するように、マスタビットストリーム
ファイルを更新して、編集−圧縮済みのビットストリー
ムファイルを入れる必要がある。
【0058】ユーザが、ステップ184でビデオが受け入
れられると判断した場合、既にエンコードされたデータ
は新規にエンコードされたデータで置き換えられる。こ
のステップは、以下の別項でさらに詳しく説明する。新
規にエンコードされたデータが以前エンコードされたデ
ータを置き換えると、ステップ192で、ユーザが更に編
集を希望するかどうかを判断する。さらに編集を希望す
る場合には、フローはステップ174に戻る。ユーザがビ
デオの編集を終了したら、フローは編集状態を終了する
ステップ188に進む。
【0059】ユーザが、ステップ184でビデオが受け入
れられないと判断した場合は、ユーザは、編集変更が記
録されないようにステップ186で編集動作を終了する
か、あるいはユーザはビデオを編集し直す。ビデオは、
編集で新しいパラメータを選択するユーザによって編集
し直される。ユーザが希望する場合は、編集対象の新し
いビデオセグメントを定義することも可能である。
【0060】ユーザが圧縮(自動−圧縮だけ、または編
集−圧縮とともに自動−圧縮のどちらか)に満足する
と、圧縮済みビデオ、圧縮済みオーディオ、およびそれ
以外のすべてのファイルを含む個々のデータファイル
が、最終フォーマットへのフォーマットの準備が完了し
た状態となり、フォーマット状態106に入る。補助デー
タには、最終的なフォーマット済みデータファイルに記
憶される字幕のような情報を含むことがある。図6にブ
ロック図されるフローチャートでは、ステップ200のフ
ォーマット状態の開始後、ユーザが補助データを記憶す
ることを決定すると、ワークステーション20は、フロッ
ピー(登録商標)ディスクドライブ内にフロッピーディ
スクなどを具備するデジタル記憶装置22から補助データ
を読み取る。それから、ステップ204で補助データがエ
ンコードされたオーディオおよびビデオと結合され、最
終的なフォーマット済みファイルを作り出す。システム
によって作成される最終的なデジタルビットストリーム
は、ISO/IEC13818-1に定義される「プログラムストリー
ム」として構築できる。代わりに、最終的なビットスト
リームは、直接衛星DSSフォーマット、光ディスクでの
使用に適したVBR(可変ビットレート)またはその他の
種類のフォーマットのような任意の種類のフォーマット
とすることができる。エンコードされたビデオとオーデ
ィオは別個に記憶できるため、システムは、同じエンコ
ードされたビデオとオーディオを別々の最終フォーマッ
トにエンコードすることができる。これは、さまざまな
フォーマットを作り出す機能を備える1つのフォーマッ
タを使用するか、または別個のフォーマッタによって達
成される。ステップ206では、フォーマットされたファ
イルがディスク21で記憶される。
【0061】フォーマットされたファイルがステップ21
0のデジタル記憶装置22内のテープに書き込まれるステ
ップ208で完了状態になる。その後で、もはや必要とさ
れていない一時ファイルを削除するさまざまな「ハウス
クリーニング」機能を実行するステップ122で終了状態
に入る。圧縮プロセスが終了される前のような異常終了
要求が発生した場合、打切り手順が、オーディオテープ
プレーヤおよびビデオテーププレーヤを停止し、破壊さ
れている可能性があるデータファイルもクリーンアップ
するワークステーション30で実行される。プロセスは、
それからステップ216で終了する。
【0062】IV. システム代替策 望ましいシステム構成要素およびその動作は前記に説明
したが、言うまでもなく代替ハードウェアが、図1Aお
よび図1Bに開示されるハードウェアを代用してもよ
い。ビデオエンコード装置50は、利用できる場合にはMP
EG-2ビデオエンコーダであるのが望ましい。しかし、MP
EG-1ビデオエンコーダとしても知られる市販されている
ISO/IEC1172-ビデオ標準エンコーダを使用することもで
きる。MPEG-1エンコーダに対する必要な改良は、MPEG-1
バッファ管理モジュールが、ワークステーション10のよ
うな外部ソースから制御できるようにする必要がある。
さらに、入力ビデオサポートは、ITU-R601(前CIR601)
解像度ビデオを格納するために増大されなければならな
い。このような改良は、過度の実験を行わないでもデジ
タルビデオエンコードの当業者により実行できる。
【0063】4つのオーディオテーププレーヤと4つのオ
ーディオエンコーダが図1Aに描かれているが、それ以
外の構成はオーディオシステムに容易に採用できる。例
えば、1台の市販されている8mmデジタルオーディオプレ
ーヤを複数のDATプレーヤの代わりに使用することがで
きる。1台のTASCAMデジタルオーディオプレーヤを使用
すると、ワークステーション40から必要とされるのは1
つのRS-422制御信号だけであるが、最大8つの別個のオ
ーディオチャネルを同時にサポートできる。オーディオ
エンコーダが同時に8つのオーディオ入力を受け入れる
ことが可能でなければならず、オーディオインタフェー
ス装置72もオーディオデータストリームの4つから8つへ
の増加に対処するために改良されなければならないのは
言うまでもない。
【0064】オーディオおよびビデオの同時エンコード
の代替策として、オーディオおよびビデオエンコード
は、別個の時間またはロケーション、あるいはその両方
で実行され、後で最終的なフォーマットに結合すること
ができる。これには、SMPTE(全米映画テレビジョン技
術者協会)タイムコードフォーマットのような既知のタ
イムコードの使用が必要となる。タイムコードは、ビデ
オテーププレーヤ、ワークステーション、または別個の
スタンドアロン式タイムコード作成プログラムによって
作成される。
【0065】録画VTR52は、ビデオデコーダが利用可能
で、ワークステーション20に接続されている場合には排
除できる。その場合、再構築されるビデオは、圧縮フェ
ーズ中のビデオエンコード装置50から録画される代わり
に、ディスク21内のディスクファイルから作成される。
録画VTR52を排除すると、テープ費用だけではなく装置
費用という点でも、システムの費用が大きく節約され
る。
【0066】さらに、グラフィック動作をディスプレイ
ビデオのグラフィックオーバレイ面で実行する能力は、
市販のX-端末オプションを使用して、コンソールディス
プレイ上でサポートすることができる。例えば、コンソ
ールディスプレイ31は、ビデオをオーバレイグラフィッ
クウィンドウで表示する機能を備えたX-端末で置き換え
られる。ペンシルバニア州のKing of Prussia のHuman
Designed Systems 社のHDSV View Station のような市
販されているマルチメディアディスプレイ端末は、表示
および手動編集領域定義動作のためにX-端末に接続する
ことができる。ただし、ビデオデコーダの職業用品質の
ビデオは、人間のオペレータが再構築されたビデオ信号
の質を評価できるように、図1Aに図示されるモニタ61
のような職業用モニタで表示しなければならない。
【0067】V. 最適エンコード効率を維持しながらの
オーディオエンコーダ数の低減 前述したように、図1Aは、マルチパスビデオエンコー
ド装置50および4台のワンパスオーディオエンコーダ70
a、70b、70c、および70dを備えたエンコードシステムの
ブロック図をしている。再生VTR 51は、ビデオエンコー
ド装置50にエンコードされるべきビデオ信号を供給し、
デジタルオーディオテープ(DAT) プレーヤ71a-71d が、
それぞれワンパスオーディオエンコーダ70a-70d にエン
コードされるべきオーディオ信号を供給する。
【0068】本発明の実施例では、最終フォーマット済
みオーディオ映像データストリーム内の8 つのオーディ
オトラックをエンコードする。各オーディオトラック
は、1以上のオーディオチャネルを具備する。オーディ
オトラックは他の装置でもオーディオを格納できるが、
例えば、あるオーディオトラックが左チャネルと右チャ
ネルを備える場合がある。もっとも効率的なオーディオ
映像エンコードを実行するためにオーディオエンコーダ
の数を求める方法、およびこのオーディオ映像エンコー
ドを実行する方法は、図7 に説明する。図7 では、開
始後、ステップ240 ビデオエンコードに必要とされるパ
スの数P が求められる。ビデオをMPEGフォーマットにエ
ンコードするためには、通常、2 つ以上のパスがビデオ
のエンコードに必要となる。本発明の場合、望ましいパ
ス数は2 であるが、3 つ以上のパスも可能である。それ
から、ステップ242 でエンコードされるオーディオトラ
ックの数T が求められる。本発明では、異なったオーデ
ィオトラック数も可能であるが、オーディオトラックの
数は8 が望ましい。次に、ステップ244 では、もっとも
効率的なオーディオ映像エンコードを実行するために必
要とされるワンパスオーディオエンコーダ数AEが計算さ
れる。必要なオーディオエンコーダの数は、ビデオエン
コードに必要とされるパスの数で除算されるエンコード
されるべきオーディオトラック数に等しい。実施例で
は、エンコーダの2 つのパスで除算される8 つのオーデ
ィオトラックは、必要な4 つのオーディオエンコーダに
等しい。オーディオエンコーダの計算された数が整数で
はない場合、オーディオエンコーダの計算された数は、
整数となるように切り上げる必要がある。例えば、7 つ
のオーディオトラックだけしかツーパスビデオエンコー
ダにエンコードされない場合、7/2=3.5 となり、3.5 は
次にもっとも大きい整数4 に切り上げられる。
【0069】本システムによって実行されるエンコード
プロセスの間、1 つのビデオパスはオーディオエンコー
ダの内3台しか使用しないが、それ以外のビデオエンコ
ードパスは4台のオーディオエンコーダすべてを使用す
る。ステップ240-244が、システムの初期設計時にだけ
実行される必要があり、オーディオ映像作業がエンコー
ドされるたびに必要とされるワンパスオーディオエンコ
ーダの数を計算する必要はないことに注意すべきであ
る。さらに、ステップ240 、242および244は、ワークス
テーション30のようなコンピュータによってコンピュー
タ/マシン実装されるか、あるいはユーザまたはオーデ
ィオ映像エンコードシステムの設計者により判断され
る。
【0070】オーディオエンコーダの数が求められ、オ
ーディオ映像エンコードシステムがセットアップされて
から、オーディオ映像エンコードプロセスが開始でき
る。ステップ146では、1にカウンターがセットされ
る。カウンターは、ビデオエンコードシステムの各パス
をカウントするのに用られ、可変可能である。それか
ら、ステップ248は、オーディオトラックのすべてで
はないが、いくつかでワンパスオーディオエンコードを
実行しながら、第1ビデオエンコードパスを実行する。
例えば、8つのオーディオトラックおよび1つのツーパ
スビデオエンコーダが存在する場合、第1パス中に4つ
のオーディオエンコーダを使用できる。それからステッ
プ250で、カウンターが1だけ増される。ステップ2
52では、ステップ248で使用されたのと同じオーデ
ィオエンコーダを使用して、エンコードされていないオ
ーディオトラックのワンパスオーディオエンコードを実
行しながら、次のビデオエンコードパスを実行する。例
えば、第2ビデオエンコードパスの間、ステップ249
で使用される4つのオーディオエンコーダは、オーディ
オトラック5から8をエンコードできる。それからステ
ップ254で、カウンタがP、必須ビデオエンコードパ
ス数に等しいかどうかが判断される。実施例では、2つ
のビデオエンコードパスしかないため、プロセスは終了
するだろう。終了しない場合、フローはステップ25
0、252、および254から成るループを実行するた
めに戻る。
【0071】勿論、8つのオーディオトラックがあるオ
ーディオ映像作品用のツーパスビデオエンコーダを使用
するだけではなく、それ以外の実施例も可能である。例
えば、スリーパスビデオエンコーダは、6つのオーディ
オトラックで使用できる。この状況では、オーディオエ
ンコーダのもっとも効率的な数は3(6/2=3)である。ツ
ーパスビデオエンコーダが使用され、合計6つのオーデ
ィオトラックがエンコードされる場合、オーディオエン
コーダのもっとも効率的な数は3となるだろう。代替策
として、スリーパスビデオエンコーダを、エンコードす
るオーディオトラックが5つあるシステムで使用するこ
とができる。この代替システムでは、オーディオエンコ
ーダの内の1つしか使用されず、他の2つのビデオエン
コードパスが、両方オーディオエンコーダの両方が使用
されている間に発生する一方、ビデオエンコードパスの
内のどれか1 つが動作している状態の2つのワンパスオ
ーディオエンコーダが必要である。従来の技術の当業者
によれば、ビデオエンコーダとオーディオトラック数の
これ以外の組み合わせも、本明細書に記載される教示を
考慮すると可能である。
【0072】できるかぎり効率的であるという点での本
発明の重要な一面とは、ビデオエンコードのパスが発生
している間につねにオーディオエンコードを実行し、オ
ーディオエンコードが実行している間につねにビデオエ
ンコードのパスを実行するということである。この取り
決めでは、ビデオエンコード動作の1 パスの間に、オー
ディオエンコーダの少なくともいくつかがつねに使用さ
れることになる。できるかぎり効率的であるためには、
オーディオトラック数をオーディオエンコーダの数で均
等に除算できない場合(つまり、エンコードされるオー
ディオトラックの数をビデオパス数で除算すると余りが
出る場合)、エンコードプロセス全体で、ビデオパスか
ら余りを差し引いた数に等しい数の休止していたオーデ
ィオエンコーダがある。例えば、スリーパスビデオエン
コーダおよび4 つのオーディオトラックの場合、2 つの
オーディオエンコーダが必要とされ、余り1 が出る(例
えば、4/3=1 で余りが1 )。したがって、もっとも効率
的であり、スリーパスビデオエンコードが完了されたの
と同時にオーディオエンコードを完了するためには、オ
ーディオエンコーダが休止となるのはわずか2 回である
(例えば、3 つのビデオパスから余り1 を差し引くと2
に等しい)。エンコーダが休止する2 回は、同じパスで
発生可能であり(同じビデオエンコードパスに異なった
2 つのオーディオエンコーダがある)、前記例のそれ以
外の2 回のビデオエンコードパスのそれぞれがオーディ
オエンコーダのすべてを活用するか、あるいは1 つの休
止オーディオエンコーダがある2 つのビデオエンコード
パスがあるという意味である。これらの2 つのパスで
は、同じまたは別のオーディオエンコーダが休止となる
ことがある。
【0073】VI. エンコードされたビデオの情報を
記憶するためのログファイル、ならびにログファイルお
よびエンコードされたビデオにアクセスするためのログ
インタプリタユーティリティ開示されたエンコードシス
テムは、当初、MPEG-2、MPEG-1、またはそれ以外のデジ
タルビデオエンコードフォーマットのような圧縮済みデ
ジタルフォマットにビデオをエンコードする。このエン
コードは、システム構成要素に関する第II項および汎用
システム動作に関する第III 項に説明する。したがっ
て、エンコードされたビデオデータは、例えばハードデ
ィスク上のデジタルフォーマット内で記憶される。
【0074】デジタルビデオエンコードプロセスの間、
ビデオの統計およびそれ以外の情報が作成され、ログフ
ァイルに記憶される。MPEGビデオエンコードに精通した
従来の技術の当業者は、ビデオを記述する統計および情
報の種類、およびこれらの統計および情報を作成する方
法を熟知している。従来のエンコードシステムでは、こ
の種類の情報およびデータは作成されるが、通常、ビデ
オエンコードの後に廃棄される。しかし、本発明の場
合、ピクチャをコーディングするために使用された合計
ビット、ピクチャをエンコードする平均二乗エラー、ピ
クチャあたりの平均量子化スケールなどのような作成さ
れたこの情報は、エンコードプロセスの後で、システム
RAM からログファイルにダンプされる。本発明によって
使用されるログファイルの例は、図8A-図10Bで説
明する。これらのログファイルは、VBRシステムで特に
有効であり、ビデオエンコーダの初期パス(複数の場合
がある)の間に作成される。それから、ログファイル
は、最終エンコードパスの間およびビデオの後での編集
および再エンコードの間に使用される。
【0075】本発明により使用されることがある、シー
ケンスレーヤのログファイル、ピクチャレイヤログファ
イル、およびマクロブロックレーヤのログファイルとい
う異なった3 種類のログファイルがある。これらのログ
ファイルのそれぞれが、その各レイヤの統計および情報
を記述する。図10A にブロック図される完全フォーマ
ット、および図10Bにブロック図で示される短縮フォ
ーマットという異なった2 種類のマクロブロックレーヤ
のログファイルフォーマットがある。マクロブロックレ
ーヤのの詳細な情報が必要とされる場合には、完全フォ
ーマットが使用され、マクロブロックの詳細のすべてを
追跡調査する必要がない場合には、短縮フォーマットが
使用される。2 時間の映画中のマクロブロックの数は多
数であるため、マクロブロックログファイルは大量の記
憶スペースを消費する。したがって、大きな記憶スペー
スが使用できない限り、完全または短縮フォーマットの
マクロブロックファイルを記憶することはできない可能
性がある。ただし、マクロブロック情報を入手する必要
がある場合は、エンコードビデオを復号化するか、ある
いはそれ以外の手段でこの情報を再構築することができ
る。
【0076】図8A-図10Bにブロック図されるログ
ファイルフォーマットの詳細の多くは重要ではなく、こ
れらのファイルフォーマットは、単に、エンコードプロ
セスの間に作成できるデータの例図としてのみ提供され
たことに注記すべきである。しかし、ログファイル中の
情報のいくつかは、ビデオの質を変更するプロセスの間
に使用されるので重要である。以下に説明するように、
エンコードされたビデオの編集ポイントを決定するため
には、初期のピクチャにより消費されるビット数を総計
する必要がある。合計される情報は、図9Bおよび図9C
に描かれ、ピクチャごとのビット数(generated_bit_pi
cture )、シーケンスヘッダ(bits_sequence_header)
、ピクチャのグループ(GOP) ヘッダのビット数(bits_G
OP_header) 、およびスタッフィングとして使用される
ビット数またはスペースを埋めるために使用されるビッ
ト数(stuffing_size) に関する。
【0077】図11は、ログファイルを使用して実行さ
れるさまざまな機能のフローチャートを説明する。ビデ
オセグメントの初期エンコードの後、ステップ270で
は、図8A-9Cにブロック図されるビデオエンコーダ
の自動実行から作成されたピクチャおよびシーケンスレ
ーヤのログファイルを読み込む。それから、ステップ27
2 でエンコードされたビデオに録画されるピクチャごと
のログファイルレコードのバイトオフセットを示すイン
デックステーブルを作成する。2 つのテーブルが作成さ
れる。一方はフレーム番号により、もう一方はタイムコ
ードによりインデックスが付けられる。タイムコードイ
ンデックステーブルには、ピクチャごとのログファイル
の中にオフセットされるバイトが記憶され、タイムコー
ドの昇順で並べ替えられる。同様に、ピクチャフレーム
インデックステーブルには、(エンコーダによって確認
されるように)入力されたピクチャ番号の昇順で並べ替
えられるログファイル内へのバイトオフセットが記憶さ
れる。
【0078】作成されたインデックステーブルは、任意
の希望されるピクチャまたはマクロブロックのログ情報
をすばやく選び出すのに有効である。ログファイル内の
シーケンス、ピクチャまたはマクロブロックのデータを
記憶するためには固定サイズレコードが使用されている
が、エンコーダはそれらをコーディングする前に入信ピ
クチャを並べ替える。加えて、3:2 の割合で毎秒30フレ
ームに引き下げられた映画(毎秒24フレーム)ソースを
取り扱う場合、ある種のタイムコードは省略される。イ
ンデックステーブルは、ピクチャの並べ替えおよびタイ
ムコードの省略にも関らず、適切なデータの位置をすば
やく突き止めるための手段となる。
【0079】ビデオのさまざまなフレームと期間がその
品質を手動で改変されるに従い、エンコードされたビデ
オは頻繁に変化するので、本発明によるエンコードシス
テムが、各ピクチャをコーディングする際に使用される
エンコードされたビット数のディレクトリまたはインデ
ックスを維持しないことを注記すべきである。ただし、
エンコードされたの情報を記述するログファイルは固定
サイズレコードであるため、ピクチャまたは期間の品質
が改変されても、ログファイル内の情報のディレクトリ
またはインデックスを維持することは容易である。
【0080】インデックステーブルの作成後、ステップ
274 を使用することにより、ユーザは、ブロック276 、
278 、および280 に描かれるさまざまなログファイルユ
ーティリティを使用するログファイルからさまざまな情
報をすばやく入手できる。ログファイル中のレコードが
必要とされる場合、作成されたインデックスは、ログフ
ァイル内の希望のレコードを突き止めるために使用さ
れ、完全なレコードがログファイルから引き出される。
それから、このレコードは希望される個々のパラメータ
を検索するために解析される。個々のレコードをインデ
ックステーブルを使用して解析するプロセスは、他のロ
グ解釈プログラムユーティリティのすべての基礎とな
る。解析プロセスは既知であり、従来の技術の当業者
は、編成されたファイルから希望の情報を検索する方法
を理解している。
【0081】ステップ276 は、ログファイルのカットア
ンドペーストユーティリティである。フレーム内でまた
は期間で手動で量子化(および画質)を変更した後、ロ
グファイルのオリジナルセットは、編集中に発生した変
更に対応するように更新されなければならない。ログフ
ァイルのカットアンドペーストユーティリティは、編集
済みのセグメントタイムコードに対応するログファイル
内でオフセットの位置を突き止め、ログファイル内の情
報を再エンコードされたビデオに対応する新しい情報で
置き換える。再エンコードのプロセスについては、以下
のVIII項に説明する。
【0082】ステップ278 では、デジタルでエンコード
されたビットストリームの編集を可能とするためにパラ
メータを入手するためのユーティリティを示している。
ビデオが最初にエンコードされ、ユーザがビデオのフレ
ームの品質または期間の改変を希望する場合、削除さ
れ、希望の品質を備えた新規にエンコードされたビデオ
で置き換えられなければならないエンコードされたビデ
オ内の適切な部分を突き止める必要がある。
【0083】エンコードされたビデオのビットストリー
ム内の編集ポイントのバイトオフセットは、編集ポイン
トに対応するピクチャまで各ピクチャをエンコードする
のに使用されるビットの累積項目を計算することにより
求められる。指定のピクチャが位置するファイルの最初
からのバイトまたはビットの総数を求めるために、以前
のピクチャのそれぞれをエンコードするのに使用された
ビット数が合計される。合計されたピクチャログファイ
ルから入手される情報とは、i番目のピクチャをエンコ
ードするのに使用されるビットBiの数、シーケンスヘ
ッダを構成するビットSiの数、ピクチャのグループ
(GOP)ヘッダをエンコードするのに使用されるビッ
トGiの数、スタッフィングとして使用されるビットT
iの数である。N 番目のピクチャのビットオフセット
は、次に示すように計算される。
【0084】 ΣN-1 i=1 (Bi +Si +Gi +Ti ) (1) バイトオフセットは、ビットオフセットを8 で除算する
ことによってだけ計算される。エンコードされたビデオ
ビットストリーム中のアドレスオフセットを求めるため
にログファイルを使用する代替策として、ビットストリ
ームデコーダを使用して、ピクチャオフセットのディレ
クトリを作成することができる。ただし、エンコーダ
は、ディレクトリを更新するために編集が終わるたびに
ビットストリーム全体を実行しなければならないため、
このアプローチは面倒である。
【0085】最後に、ステップ280 では、タイムコード
をもっとも近いピクチャのグループ(GOP )の最初また
は最後に四捨五入するためのユーティリティを示してい
る。エンコードされたビットストリームのすべての切取
りまたは編集は、ピクチャのグループ(GOP )の境界で
実行される。ただし、GOP 境界はビデオに編集を実行す
るオペレータにはわからない。オペレータがいったん編
集セグメントの開始ポイントおよび終了ポイントを指定
すると、システムはGOP 境界を計算する。GOP界は、各
ピクチャレコード内に記憶されるGOP 番号と呼ばれるピ
クチャレイヤパラメータを検討することにより設定され
る。ピクチャレイヤログファイルの連続レコードを通し
てトレースすることにより、図9Bの中のGOP 番号(GOP
_number)が変化すると、GOP 境界があると判断され
る。
【0086】ログファイルおよびログファイルユーティ
リティは、ビデオエンコーダに密接に関係しているの
で、ログファイルは図1Aに図示されるワークステーシ
ョン10のハードディスク内に記憶され、ログファイルユ
ーティリティはワークステーション10により実行され
る。代わりに、ワークステーション30またはそれ以外の
の任意の処理システムにログファイルが格納され、ログ
ファイルユーティリティが実行されることがある。
【0087】VII. エンコードされたビデオの品質の
変更 A. 期間での品質の変更 エンコードシステムにより作成されるエンコードされた
ビデオは、光ディスクのような最終的なデジタル記憶媒
体に書き込まれることを目的とする。ディスク上のエン
コードされたビデオは、一定ビットレート(CBR) 動作と
比較すると、ビデオの異なったセクションの間でのビッ
トレートの大きな変更の可能性を提供する可変ビットレ
ート(VBR) でエンコードされる。VBR コーディングによ
り、著しく異なるビット数を異なったピクチャに割り当
てることができるようになるため、画質は経時的に変化
する。さらにVBR は、CBR 動作では不可能なスケール内
でのユーザによって定義されたビデオのセクションにデ
ータレートを割当てし直す可能性も提供する。CBR によ
り同じことを達成する場合には、デコーダできわめて大
きなバッファが必要になるだろう。
【0088】エンコードシステムによって手動編集と呼
ばれることが可能になるが、手動編集とは、映画の中で
場面を短縮または延長したり、異なった場面を置換する
ことではなく、画質を変更することである。画質は経時
的に変更することができ、本項に説明するように時間的
編集または時間的手動編集と呼ばれる。別の項では、フ
レームのあるセクションからフレームの別のセクション
にビットをシフトすることによって、データのフレーム
内での画質を変更する、空間編集または空間手動編集と
呼ばれることについて説明する。
【0089】時間的編集、つまり編集セグメントのさま
ざまなセクションの間でのビットを再割当てで、以下に
示す3 つの主要な制約を満たす必要がある。
【0090】1.編集される映画/ビデオの総容量が割り
当てられた容量を上回らないこと。
【0091】2.編集セグメント内にバッファアンダフロ
ーがないこと。
【0092】および3.時間的編集によって生じさせられ
る編集セグメントの外側にバッファアンダフローがない
こと。
【0093】制約1 は、結果として生じる編集済みのセ
グメントが最初にエンコードされたセグメントと同じビ
ット数を消費するように編集セグメントをエンコードし
直すことにより処理される。変種セグメントが検討され
る期間全体であることを注記すべきである。編集セグメ
ント内の異なる期間には、ユーザにより品質が指定さ
れ、編集セグメントのこれらの期間は単にセクション、
または期間と呼ばれる。
【0094】アンダフロー状態が存在するかどうかを突
き止めるためには、デコーダのモデルを使用して目標ビ
ットを確認することが必要である。エンコーダのVBR 動
作では、ビデオバッファ検査機構(VBR)モデルの修正さ
れたバージョンが使用される。このモデルは、VBR の簡
略修正モデルと呼ばれ、デジタル記憶装置媒体(DSM)に
使用できる。VBR モード用のVBV は既知でありMPEG-2規
格で定義され、ISO/IEC 13818-2 の第C.3.2 項の付録C
に特に記載される。
【0095】VBR 用VBV モデルでは、デコーダのバッフ
ァはいっぱいのままであるが、アンダフローしないよう
に制限されている。さらに、バッファは一定のレートRm
axでバッファがいっぱいになるまで充填し、それからバ
ッファが空になり始めるまで、ビットはバッファに伝送
されない。各フレーム間隔ごとに、あるフレームを復号
化するために必要とされるビットがバッファから削除さ
れる。これを念頭においておくと、VBR モードでは、ピ
クチャの列に割り当てるビットが多すぎると、バッファ
アンダフローが発生することが分かる。ピクチャのビッ
トがバッファから削除されるに従い、バッファは空にな
り、高画質ピクチャのビットの大多数がバッファを充電
できるレートより早いレートで削除される場合、バッフ
ァがアンダフローする。アンダフローを防止するため
に、ピクチャをエンコードするために使用されるビット
数が低減される。ピクチャのビット数を低減すると、充
填レートは同じに保たれるが、ビットをバッファから削
除するレートが低減される。VBV 占有がいっぱいである
場合、VBV バッファヘのビットストリーム伝送は即座に
停止されるため、バッファオーバフローはVBR に関して
発生できない。つまり、バッファオーバフローではな
く、単にバッファがいっぱいな状況が存在する。ISO/IE
C 13818-2、付録C 、第C.3.2 に説明されるように、 VB
Rの簡略修正VBVモデルは以下の通りである。
【0096】1. sequence_headerでのbit_rate_fieldは
max_bit_rateを表す。
【0097】2. VBV は当初空である。VBV バッファ
(つまりVBV バッファファイル)をmax_bit_rateのレー
トでいっぱいに満たしてから、復号化プロセスが開始す
る。ピクチャデータは、MPEG-2国際規格に定義されるCB
R のVBV モデルのようにただちに削除、エンコードされ
る。
【0098】3. ビットストリームは、VBV バッファが
いっぱいになるまでmax_bit_rateのレートでVBV バッフ
ァの中に格納される。VBV バッファ占有がいっぱいの場
合、VBV へのビットストリーム転送は即座に停止され
る。次のピクチャのデータが削除されてから、ビットス
トリーム伝送は即座に開始する。
【0099】4. VBV バッファはアンダフローしないも
のとする。
【0100】5. 各vbv_delay フィールドがFFFFに設定
される。
【0101】期間でビデオの品質を変更するには、ビデ
オのフレームにビットを追加またはビデオのフレームか
らビットを削除する必要がある。ここで、ビデオのセク
ションに追加またはビデオのセクションから削除される
ビットの数についての説明を行う。ビデオのセクション
に追加またはビデオのセクションから削除できるビット
の数は、検討されているビデオのセクションの有効ビッ
トレートに依存する。有効ビットレートR は、以下のよ
うに計算される。
【0102】 R=(総割当てビット/フレーム数)*Frame_Rate (2) 総割当てビットはビットレートに正比例しているので、
割当てビット数を参照することは、異なる単位を使用す
る場合を除き、ビットレートと同じ意味を伝える。保証
された最小レート、例えばRminがビデオの任意のセクシ
ョンに適用されると仮定すると、セクション「i」から
削除できる最大ビット数は以下の通りである。
【0103】 Ti=(Ri −Rmax )*Ni /Frame Rate (3) この場合、Niはセクション「i」のフレーム数で、Ri
は同じセクションの有効レートである。保証された最小
値は、セクションに最小品質レベルを保証するために必
要とされる。同様に、指定されたセクション「j 」に追
加できる最大ビット数は、以下の通り計算される。
【0104】 Tj=(Rmax −Rj )*Nj /Frame Rate (4) この場合、Rmaxは最大レート、つまりバッファがいっぱ
いでないときに充填するレートであり、Njはセクション
j のフレーム数である。
【0105】期間で画質を変更すること(時間的編集)
についての説明は、今度は図12およびそこに参照され
る図に関して行う。開始後、ステップ281 では、第II項
および第III 項で前述したようにユーザの介入なく自動
ビデオエンコードを実行する。自動エンコードの場合、
作成されるデータストリームの最大レートおよび最小レ
ートがある。最大ビットレートは、ビデオデコーダの機
能により決定され、例えばRmaxは毎秒Mbits である。最
小ビットレートは、希望される最小画質に応じて、ユー
ザが指定できる。典型的な最小ビットレートRminは毎秒
3 Mbits である。ビデオの部分が低いビットレートとな
り、ビデオの部分が高いビデオレートとなることができ
るように、平均エンコードレートとは異なり、平均エン
コードレートをやや下回るRminを設定するのが望まし
い。Rminがビデオの平均エンコードレートをわずかに下
回って設定されると、結果として生じるエンコードビデ
オはかなり一定した画質となる。通常、Rmax= 毎秒8 Mb
its でRminが毎秒約3 Mbitsの場合、ビデオの平均値は
毎秒約3 1/2 から5 Mbits となるはずである。
【0106】自動ビデオエンコードがステップ281 で実
行された後、レート量子化関数を求める必要がある。本
発明のプロセスでは、希望の品質を獲得するのに必要な
ビット数が求められるが、再エンコード時には、希望の
ビットレートを結果的に生じさせるために量子化値を設
定しなければならない。レート量子化関数は、それぞれ
参照により本明細書に取り入れられる記事、画像処理に
関するIEEE会報、Vol.3, No.5 、1994年9 月、533-545
ページのラムチャンドラン(Ramchandran) その他による
「マルチ解像度およびMPEGビデオディスクロージャに適
用される依存量子化のためのビット割当て」、IEEE ICA
SSP 、1993年、V381-V-384、ラムチャンドランその他に
よる「MPEGビデオ符号器に適用される依存量子化のため
のビット割当て」、および1994年にプリンストンビデオ
会議で提示されたレイニンガー(Reininger) による「レ
ート−歪み曲線を使用する多重化されたMPEGビデオ用の
共同マルチチャネルビットレート制御」に説明されるよ
うな従来の方法で計算できる。
【0107】次に、ステップ284 では、選択された期間
のユーザ品質設定値を入力する。ユーザは、究極的には
ピクチャの量子化を制御するのに使用される異なったセ
クションの優先順位を入力する。量子化は、損失のある
MPEGエンコードの解像度とも呼ばれる画質を制御する。
図13には、期間でビデオの品質を変更するために情報
を収集する目的で使用されるユーザインタフェーズを説
明する。当初、ユーザは、品質を変更することになる編
集セグメント全体の期間を入力する。この応報の入力
は、図13のユーザインタフェースには図示されていな
いが、図13のユーザインタフェースが表示される前に
入力される。図13に示される例の場合、変更対象の編
集セグメントの期間が、例えば時間0 分から時間5 分ま
でとなることがある。ユーザが編集セグメントの総期間
を記述した後に、編集セグメント内のさらに短い期間
に、優先順位P を含む-5から+5までの範囲のさまざまな
優先順位が指定され、この期間の品質が保護され、改変
してはならないことを示している。優先順位「なし」
は、P という優先順位と同じ意味である。エンコードシ
ステムは前記入力スキームに限定されず、ユーザの希望
の優先順位を入力するために、それ以外の範囲または記
号を使用できるのは言うまでもない。
【0108】優先順位を指定するのに加えて、ユーザは
最小ビットレートも入力する。このビットレートは、ス
テップ281 の自動ビデオエンコードの間にビデオをエン
コードするために使用される最小ビットレートと異なっ
ている場合がある。ユーザインタフェースのもう1 つの
特徴とは、それを使用すると、ユーザが「バックグラウ
ンド優先順位」を設定できるという点である。これは、
ユーザが優先順位を指定したのではない選択済みの期間
内の期間にこのバックグラウンド優先順位が設定される
ことを意味する。例えば、図13では、バックグラウン
ド優先順位に「1 」が指定されるとすると、未指定の期
間00:03:20:01 から00:03:59:99 には、ユーザが手動で
この特定のセクションに優先順位を指定しなくても、
「1 」という優先順位が自動的に指定される。
【0109】図13に描かれるインタフェースの底部で
は、編集セグメント内で新しい期間を作成するために
「挿入」ブロックが使用され、以前に作成された期間を
変えるために「リコール」ブロックが使用され、期間に
加えられる変更を保存するために「更新」が使用され、
期間を削除するために「削除」が使用される。
【0110】光ディスクのようなエンコードされたビデ
オ用の究極のデジタル記憶装置媒体は、自動的にエンコ
ードされたデータがディスクに書き込まれる場合には、
理想的には容量まで満たされる制限された記憶領域容量
を備える、ことを認識することが重要である。したがっ
て、画質を向上させ、ある特定の期間のビットレートを
引き上げる場合には、つねに、品質が向上した期間に必
要な余分な記憶容量を確保するために、品質が低下した
ビデオのセクションが存在しなければならない。したが
って、本発明の実施例では、品質を改善するのに必要な
ビットはビデオの別のセクションから取らなければなら
ないため、別の期間に違う画質を割り当てないで、1 つ
の期間だけに高い画質を割り当てることは不可能であ
る。したがって、編集されたビデオのセグメントには、
バックグラウンドセクションとは異なり、時間的な手動
編集が適切に動作するために「保護つき」のセクション
とマークされていない少なくとも1 つのセクションがな
ければならない。さらに、ユーザが優先順位を設定した
結果、同じ画質およびビットレートが、それらが選択さ
れるたびに生じることはないが、編集セグメント内のピ
クチャのビットの修正された数を求めるためのプロセス
を理解すると明らかになるように、ある特定のセクショ
ンの品質は、他のセクションの割り当てられた優先順位
および他のセクションの長さにも依存する。
【0111】本発明によるエンコードシステムにより活
用される特徴とは、視聴者が、自動エンコードプロセス
中にまたは後日、エンコードされたビデオをレビューす
ることができるという点である。エンコードされたビデ
オが視聴者に表示されるに従って、視聴者は、ビデオを
停止したり、関心のあるタイムコードを書き残したりし
なくても、ビデオの関心のあるポイントや領域を記憶す
るために、リターンキーを押したり、画面に表示される
「ボタン」の上でグラフィックユーザインタフェースを
「クリック」するなどの機能を実行できる。これらの関
心のあるポイントは、後日、ユーザが呼び出し、映画全
体をレビューしなくても綿密に検討することができる。
これは、ユーザが変更を希望するエンコードビデオ内の
ポイントを決定する便利で、効率的な方法となる。この
機能は、関心のあるポイントや領域が発生した時点での
位置に対応して、タイムコードを記憶することによって
達成される。
【0112】ユーザがステップ284 で希望の品質設定値
を入力してから、ステップ286 でユーザの入力に基づい
てフレームごとに修正されたビットが計算される。この
プロセスは、図14-16Bに関して詳細に記述される。ビ
デオの編集セグメント内で時間のビットレートを変更す
るための一般的な手順は、図14のフローチャートに説
明される。ユーザの入力に基づいてビットレートを計算
するために、ステップ302 は、-5と+5の間の範囲内から
10と0 の間の範囲内にあったユーザの入力をマッピング
する。-5という初期入力は、10というマッピングされた
設定値に対応し、最小品質であり、+5という入力は0 と
いうマッピングされた設定値に対応し、最大画質であ
る。同様に、0 という入力された品質選択は5 というマ
ッピングされた設定値に対応するなどである。ステップ
302 で実行されるマッピングの目的とは、割り当てられ
たビット数がマッピングされた設定値により乗算される
量-1のべきまで引き上げられるe (2.71828...)に比例
することである。この場合、優先順位の設定値がさらに
小さい場合のビット数が、優先順位が高い場合より下回
るように、さらにe-10はe0を下回る。目標ビットを優先
順位-4から+4に対応して求めるプロセスは、図16A と
図16B に詳細に説明される。
【0113】ステップ304 では、「保護つき」のセクシ
ョンがあるかどうか判断される。保護つきセクションと
は、画質を以前の自動エンコードから変更してはならな
いセクションのことである。保護つきセクションがある
場合は、フローはステップ306 に進み、そこで保護つき
セクションの再エンコードに割り当てられるビット数が
最初の自動エンコードの結果生じる以前のビット数に等
しくなるように設定される。このようにして、保護つき
セクションのピクチャ品質は変化しない。
【0114】ステップ308 では、最大品質または最小品
質に設定されるセクションがあるかどうか判断される。
最大品質とは、ユーザ入力+5に対応し、最小品質とはユ
ーザ入力-5に対応する。最大画質および最小画質の場
合、依然としてビデオバッファの制約を満たし、エンコ
ードされたビデオを記憶する媒体の記憶容量を上回らず
に、それぞれ最高品質のビデオと最低品質のビデオが設
定されたエンコードされたビデオを入手するのが望まし
い。最大品質または最小品質に設定されるセクションが
ある場合は、フローは、ステップ310 に進み、そこで最
大ケースまたは最小ケースの修正ビット数が計算され
る。このプロセスは図15に詳しく示される。
【0115】図15では、最大ケースおよび最小ケース
に割り当てられたビット数を求めるプロセスが、マッピ
ングされた優先順位の10と0 にそれぞれ割り当てられた
ビデオのセクションに最小レートおよび最大レートを割
り当てることによってステップ320 で開始する。図14
のステップ302 では、このマッピングおよび時間的編集
の記述の残りの部分が実行され、それ以外の明確な指示
がないかぎり、マッピングされた優先順位が参照され
る。以下に記述されるように、最大データレートはデコ
ーダの能力により制限を受け、毎秒1 Mbits となり、最
小データレートは、示しているように図13でユーザイ
ンタフェースによりブロック図され、通常は毎秒3 Mbit
s となる自動エンコードモードの間に使用される最小ビ
ットレートを下回ることもあれば、上回ることもある。
【0116】それから、ステップ322 では、マッピング
された優先順位1 から9 が設定されたセクションがある
かどうか判断される。つまり、最大品質または最小品質
が割り当てられていることに加え、ユーザが割り当てる
それ以外の中間品質が存在するのである。それ以外のマ
ッピングされた優先順位がある場合には、フローはステ
ップ324 に進み、1 と9 の間のマッピングされた優先順
位が設定されるすべてのセクションの平均ビットレート
が計算される。この平均が許容範囲(最大ビットレート
と最小ビットレートの間)にない場合、フローはステッ
プ328 に進む。ステップ328 では、最大レート、つまり
最高の画質を実現するレートは、平均が最小レートを下
回る場合に低減される。最大レートを引き下げることに
より、非最大状況および非最小状況(マッピング優先順
位1-9 )に使用できるビット数が多くなり、それにより
平均が希望の範囲内または希望の範囲近くとなる。代わ
りに、ステップ328 では、平均が最大レートを上回る場
合、最小データレートは引き上げられ、それにより非最
大状況および非最小状況(例えば、優先順位1-9 )のビ
ット数が引き下げられる。ステップ328 の後、フローは
平均が範囲内になるまでステップ324 、326 、および32
9 が繰り返される324 に戻る。さらに、最大ビットレー
トおよび最小ビットレートは、「保護つき」セクション
が品質の調整の前と同じビットを受け取ることを確実に
するために調整される。
【0117】いったんステップ326 で平均が範囲内にあ
ると判断すると、フローはステップ330 に進み、それぞ
れマッピングされた優先順位10と0 が設定されるセクシ
ョンに計算された最小レートおよび最大レートが割り当
てられる。それから、ステップ332 で、残りのビット
は、保護つきではなく、最大状況や最小状況でもないセ
クションに分配される。マッピングされた範囲1-9 が設
定されるビデオのセクションおよびデータレートの変更
方法については、図16A および図16B に関して後で
説明する。
【0118】ステップ322 でマッピングされた優先順位
1-9 が設定されるセクションが存在しない、つまり最大
セクション、最小セクションまたは保護つきセクション
だけが存在すると判断した場合は、ステップ340 で、ビ
ットの最終割当てが自動エンコードによるビットの初期
割当てと等しくなるまで、必要に応じて最小レートおよ
び最大レートを調整する。ステップ340 を実行する2 通
りの代替方法がある。第1 に、最大ビットレートRmax
は、例えば毎秒8 Mbits で固定されている。総合的な編
集セグメントの合計ビットは理解されているため、最小
データレートであるRminは、自動エンコードの間に獲得
されると同じビット総数を達成するために調整されるだ
けである。Rminを総ビットの以前の数を達成するために
調整することができない場合には、自動エンコードの間
に獲得されるビット総数を達成するために、最大データ
レートRmaxが調整される。
【0119】代替策として、ステップ340 では最大品質
セクションに優先順位1 および最小品質セクションに優
先順位9 が指定され、編集セグメントの期間の新しいビ
ットレートを求めるために、図16A および図16B に
ブロック図されるビット割当てアルゴリズムが実行され
る。それから、ステップ342 で図16A および図16B
に従って計算されたデータレートが、以下に説明するよ
うに、最低指定品質および最高指定品質が設定されるセ
クションに割り当てられ、図15のプロセスが終了す
る。
【0120】ステップ308 およびステップ310 が、必要
な場合に実行された後で、ステップ312 で、すべてのセ
クションにマッピングされた優先順位1-9 が設定される
かどうか判断する。これが当てはまると、フローはステ
ップ314 に進み、図16A および図16B に詳説するよ
うに、マッピングされた優先順位の修正ビット数が計算
される。
【0121】図16A の最初のステップでは、使用され
る共通ビットプールのサイズを決定する。当初、保護つ
きではないマッピング優先順位1-9 が設定されるすべて
のセクションでは、一定数のビットが削除されている。
再分配深度と呼ばれる係数k1は、このために使用され、
例えば、0.4 に設定され、以前に(つまり自動エンコー
ド実行から)割り当てられたビットの40% が、保護つき
でもなく、最大品質や最小品質によりマークされてもい
ないあらゆるセクションから削除されることになること
を意味する。
【0122】次に、ステップ362 では、ユーザ選択品質
がどの程度品質に影響を及ぼすかを判断する。動的範囲
係数と呼ばれる変数k3が設定され、優先順位から生じる
ことになる品質変更を決定する。k3がどのように設定さ
れるかに応じて、例えば優先順位2 は、品質での相対的
に小さな向上、または品質での比較的に大きな向上のよ
うなさまざまな品質の変更を課す場合がある。通常、動
的範囲係数k3は、1.0設定される。
【0123】ユーザ選択優先順位をビットの再分配で使
用するには、形式exp (−優先順位/k3 )の指数的な関
係が使用される。指数内の動的範囲係数k3が、指数曲線
の形状を決定する。曲線は、動的範囲係数の値が大きく
なるほど急勾配となり、実質上、変化する優先順位が設
定されたセクションの間で割当てし直したビットでの不
均衡が強まる。この負の指数は、マッピングされた優先
順位の絶対値が増加するに従い(さらに低い優先順位セ
クション)、そのセクションに割り当てられるビットは
減少する、つまりマッピング優先順位1 は最高の優先順
位で、9 まで数を引き上げると設定される優先順位が低
くなることを意味する。
【0124】ステップ364 では、ユーザ選択優先順位が
正規化される。つまり、ユーザが選択した優先順位が、
各セクションの相対優先順位を決定するために使用され
る。まず、E1が計算される。
【0125】 Ei =exp(−pi /k3 ) (5) この場合、piとはマッピングされたユーザ選択優先順位
で、iは、保護つきまたは最大品質や最小品質が設定さ
れる期間を除く、編集セグメント内のセクション期間で
ある。次に、優先順位製機化係数k2が、以下のように計
算される。
【0126】k2 =ΣN i=1 Ei (6) この場合、N はセクション数である。優先順位正規化係
数は、優先順位に従って割当てし直されたすべてのビッ
トの合計が、つねに、ビットの使用可能な共通プールに
等しくなることを確実にするために必要とされる。
【0127】したがって、各セクションの相対優先順位
は、以下のように計算される。
【0128】Ri =Ei /k2 (7) Riはi番目のセクションの相対優先順位の端数であるの
で、すべてのRiの求和は単一となる。
【0129】ステップ366 でセクションのサイズが正規
化される。割り当てられた優先順位が設定される期間の
サイズは異なり、ビットはさまざまなセクションのサイ
ズに比例して分配されなければならないので、これが必
要である。第1 に、編集済みフレーム総数での各期間内
のフレーム数の端数Ti(保護つきではない、非最大、ま
たは非最小優先順位が設定されるフレーム)は、以下に
従い求められる。
【0130】Ti =Ni /N (8) この場合、Niはi番目の期間内のフレーム数であり、N
は編集セグメントのフレーム総数である。つまり、改変
され、保護されておらず、最大でも最小でもない優先順
位ではない)優先順位が指定されるすべてのフレームで
ある。したがって、サイズ正規家系数k3は、以下の等式
に従い計算される。
【0131】 k4 =ΣN i=1 (Ti *Ri ) (9) この場合、N はセクション数である。図16A のステッ
プ366 から、フローは図16B のステップ368 に進む。
【0132】図16B では、ステップ368 で、以下の等
式に従い、ビットの共通プールが求められる。
【0133】 C=ΣN i=1 (k1 *Bi ) (10) この場合、Biはi番目のセクションの自動エンコード手
順の間に使用されたビット数に図15のステップ332 で
分配されたあらゆるビットを加算したビット総数であ
る。求和は「N 」セクション上である。
【0134】それから、ステップ370 で、以下の等式に
従い各セクションに割り当てられるビットのターゲット
数を求める。
【0135】 Fi =C*Ti *Ri /k4 +(1−k1 )*Bi (11) 各セクションのビット総数Fiは、ビットの共通プールの
パーセンテージにビットの共通プールに与えられたビッ
ト分低減されたビット(Bi)の元の数を加算したものに等
しい。ビットの共通プールからのビットのパーセンテー
ジは、各セクションのフレーム総数の端数(Ti)、セクシ
ョンの相対優先順位(Ri)、およびセクションのそれぞれ
に総計されるフレームのその対応する端数で乗算される
セクションの優先順位に依存するサイズ正規化係数(k4)
に基づいている。
【0136】ステップ370 で計算されたセクションごと
に割り当てられたビットのターゲット数が最大データレ
ートと最小データレートの間にない場合がある。これが
当てはまると、ステップ372 で、再分配深度k1が0.01低
減され、フローは、ステップ368 のビットの共通プール
を計算し直し、ステップ370 のビットのターゲット数を
計算し直すために戻る。ステップ368 、370 、372 およ
び374 のループが、ステップ370 で計算されたビットの
ターゲット数が最大データレートと最小データレートの
間になるまで実行される。
【0137】それから、ステップ376 では、ビット位取
り因数Siおよびイントラフレームおよび非イントラフレ
ームが、希望の品質を獲得するために異なるビット数を
必要とする。まず、ビット位取り因数Siが、以下の等式
に従い計算される。
【0138】Si =Fi /Bi (12) 次に、イントラピクチャおよび非イントラピクチャの位
取り因数が計算される。イントラ位取り因数SIi は、以
下の等式い従い計算される。
【0139】 SIi =Si −(If *Si ’) (13) 大きなイントラフレームにより、バッファアンダフロー
が発生する可能性があり、イントラ因数Ifは、イントラ
ピクチャのビット割当てでの変動を、If=0.8のときに20
% に制限することによって安全率を示す(つまり、SIi
は範囲0.8<SIi<1.2に制限される)。Si'-Si-1.0であ
ることに注意する。非イントラビット位取り因数SNi
は、以下のように計算される。
【0140】 SNi =Si −(−If *Si ’*BIi /BNi ) (14) この場合、BIi およびBNi は、ピクチャタイプによって
i番目のセクションで合計される総イントラビットと非
イントラビットである。
【0141】最後に、フレームごとに使用されるビット
数は、適切な食らい取り因数(イントラ位取り因数また
は非イントラ位取り因数のどちらか)で乗算される元の
ビット数を使用して求められる。それから、図16B
(および図14)のプロセスが終了する。
【0142】この時点で、各フレームの修正されたビッ
ト数が計算され、図12のステップ286 が完了する。た
だし、フレームの変更済みビット数によりバッファアン
ダフローが生じたり、編集セグメントの立ち下がり端で
のビット数の占有が、編集セグメントの外のそれ以降の
フレームがアンダフローするように変化する場合があ
る。これらの状況は、必要ならば、図17に詳説される
図12のステップ288 で調べ、訂正される。
【0143】図17は、バッファアンダフローがないか
確認、訂正し、編集セグメントの立ち下がり縁でのビッ
ト再割当てのための問題を確認、訂正するプロセスを説
明する。図17では、ステップ390 で編集セグメントの
フレームのそれぞれのビット割当てをスキャンする。そ
れから、ステップ392 で、前述のVBV モデルを使用する
新しいビットの分配のアンダフローがないか確認する。
アンダフロー問題が存在し(u_flow リスト)、各アンダ
フローを排除するのに必要なビット数が求められ、u_va
l に記憶されるポイントのリストが作成される。アンダ
フローが、多すぎるビットによって表されるピクチャの
ために発生することを頭に入れていおくことが重要であ
る。多数のビットで表される高品質のピクチャがデコー
ダによってバッファから読み出される場合は、ピクチャ
が復号化されるときにバッファから多数のビットが削除
され、これらのビットは十分に速く再び満たすことはで
きない。したがって、アンダフローを排除するために
は、ビットはピクチャ空削除される。さらに、ステップ
392 では、バッファがいっぱいであるポイントのリスト
が作成され、これらのポイントはo_flowに記憶される。
前述したように、バッファがいっぱいになると、データ
はバッファに伝送されなくなるので、バッファがいっぱ
いであっても問題はないことに注意する。
【0144】ステップ394 では、編集セグメントの立ち
下がり縁でのバッファ占有を調べる。動作のVBR モード
では、編集済みビデオセグメントの立ち下がり縁でのバ
ッファ占有が、編集済みセグメントがまったく同じビッ
ト数で置き換えられていても、修正された実行のバッフ
ァ占有とは異なる可能性がある。これは、VBR 用のVBV
デルの特異性から生じる。したがって、バッファ占有の
制約を調べることが重要である。編集セグメントの立ち
下がり縁でのバッファ占有がビットの再分配の前とまっ
たく同じか、あるいさらに高い場合に、問題は存在しな
いことを示すのはかなり簡単である。バッファ占有が以
前とまったく同じ場合には、それ以降のフレームの占有
も、VBV 違反がないかすでに確認済みの以前の実行とま
ったく同じままとなる。占有が以前より高い場合、バッ
ファがそれ以降のフレームの間にいっぱいになる可能性
があり、それは、バッファがいっぱいな場合、データは
バッファに送られなくなり、アンダフローは発生しない
ので完全に許容できる状態である。しかし、以前の実行
と比較して、バッファ占有が立ち下がり縁でさらに低い
場合に、第3 のケースが生じる。これは、それ以降のフ
レームでバッファアンダフローを作成する可能性があ
り、密接に調べる必要がある。
【0145】編集セグメントの最後のフレームを、バッ
ファセグメントの外側でのフレームのバッファアンダフ
ローを防ぐために処理できる2 通りの方法がある。第1
のアプローチは、2 つの内で簡単な方である。編集セグ
メントの最後のフレームのビット数により、(ログファ
イルに記憶される)元のエンコードより大きいまたは元
のエンコードに等しいバッファ占有が生じる場合、アン
ダフロー問題は存在せず、したがって処置を講じる必要
はない。編集セグメントの最後のフレームのバッファ内
のビット数が、最初にエンコードされたセグメントのバ
ッファ内のビット数を下回る場合、ビットのこの低減さ
れた数により、編集セグメントの後のフレームの内容に
応じて、編集セグメントの外側のフレームのアンダフロ
ーが生じる場合もあれば、生じない場合もある。アンダ
フローが発生しないように防ぐのに必要となるビット数
を求める代わりに、編集セグメントの最後のセグメント
のバッファの占有が、元のエンコードの場合と同じにな
るように調整されるだけである。安全性の目的から、編
集セグメントの最後のバッファ占有または十分さは、ア
ンダフローの可能性がないことを保証するために元のエ
ンコードの占有の10% まで引き上げることができる。編
集セグメントの最後のフレームのバッファ占有を元のエ
ンコードのレベルになるように引き上げる必要がある場
合は、終了フレームのビット数をステップ398 で実行し
たように低減する必要がある。最後のフレームはアンダ
フローポイントとして処理され、u_flowリストに格納さ
れ、バッファレベルを元のエンコードのレベルまで引き
上げるために最後のフレームから削除する必要があるビ
ット数がu_val に付加される。
【0146】編集セグメントの再エンコードにより生じ
るアンダフローを処理するための第2 のアプローチは、
編集フレームの外側でバッファアンダフロー状況を引き
起こさない編集セグメントの最後のフレームのバッファ
の最小可能レベルを概算する反復プロセスである。これ
は、元のエンコードのバッファ占有と編集セグメントの
最後のフレームの再エンコードのバッファ占有の間の最
大差異を概算するプロセスにより実行される。
【0147】図18に示されるフローチャートを見る
と、元のエンコードバッファ占有にはB0が割り当てら
れ、元のエンコードのログファイルに記憶されていた。
i=1...nの場合に編集セグメントの境界を超えたフレー
ム「i」でのバッファ占有はBiである。この場合、「n
」はエンコードされる映画内の最後のフレームに相当
する。再エンコードのバッファ占有が、連続するフレー
ムのどれかでアンダフロー状況を引き起こさずに元のエ
ンコードからどの程度低くなることができるかは、再エ
ンコードのバッファレベルを、少なくとも、それが元の
エンコードのためであったポイントに設定するだけの第
1 アプローチとは対照的に決定されなければならない。
この条件を満たす境界での新しいさらに低いバッファ占
有をB0' にする。これは、編集セグメント境界での最小
許容バッファ占有である。以前の実行のバッファ占有よ
り低いバッファ占有を設定する可能性は、差異が、編集
セグメント後のもっと遅いフレーム間隔で吸収されるた
め、アンダフローが発生しないという事実から生じる。
【0148】図18のステップ420 で開始し、編集セグ
メントの最後のフレームの再エンコードされたビデオの
バッファ占有B0' が、将来アンダフローを引き起こすこ
となくゼロであると想定する。これは、バッファ占有
が、アンダフローを防ぐためにはより高くなければなら
ないが、バッファ占有はゼロを下回ってはならない可能
性があるため、B0' に関してもっとも自由な概算であ
る。しかし、図18のプロセスは、再エンコードされた
の編集セグメントの最後のフレームのゼロの占有により
アンダフローが生じるかどうか、および生じる場合、ア
ンダフローを引き起こさない値B0' が見つかるまで、編
集セグメントの最後でバッファ占有を増加させるかどう
かを確認するためにチェックする。
【0149】図18のプロセスでは、元のエンコードと
再エンコードの間の概算バッファ占有差異「X'」を評価
する。
【0150】X’=B0 −B0 ’ (15) 差異「X'」は、「X'」がチェックされ、必要に応じてア
ンダフローのすべての可能性が排除されるまで調整され
ていることが保証されるまで、最終的に決定できないの
で概算と呼ばれる。図18の手順は、境界フレーム直後
のフレーム、つまりi=1で開始して、一度に1 フレーム
づつ進む。B0' がゼロに等しい第1 フレームの場合、概
算差異は、ステップ422 で計算されるように、元のエン
コードの第1 フレームのバッファ占有の値であるのにす
ぎない。
【0151】X’=B0 (16) 次に、ステップ424 では、境界フレームの右側にあるフ
レームにより吸収されるビット数を求める。吸収される
ビット数とは、元のエンコードの編集セグメント後のフ
レームによりバッファの中に格納される場合もあるが、
実際には、バッファがいっぱいであるためにさらにビッ
トを受け入れることができなかったために元のエンコー
ドの間バッファに格納されなかったビットを指す場合に
使われる言い回しである。量△tiは、バッファがその間
いっぱいであったが、B0' の値が引き下げられたために
現在では追加ビットを受け入れることができる編集セグ
メントの後の元のエンコードのi番目のフレームの期間
を表す。バッファはフレーム全体でいっぱいとなること
はできず、ゼロより大きいか、ゼロに等しいため、期間
△tiはフレームの期間を下回らなければならない。元の
エンコードの間にバッファが一度もいっぱいでなかった
場合には、期間△tiはゼロである。したがって、 1/P > Δti 0 (17) この場合、「P 」は毎秒フレーム単位で測定され、通
常、毎秒30フレームであるピクチャレートである。バッ
ファがいっぱいである結果、編集セグメントの右側で吸
収されるビット総数は、以下のように計算される。
【0152】ai =Σi k=1 Δtk Rmax (18) この場合、Rmaxはバッファの充填レートである。
【0153】ステップ426 では、編集セグメントの最後
のフレームのバッファ占有レベルを求めるための手順が
終了できるかどうかを判断する。i番目のフレームによ
って吸収されるビットの合計がX'を上回る、つまりai>
X' である場合は、バッファアンダフローが発生しない
で、ステップ428 が実行されるように、バッファはもっ
と遅いフレームで満たされることができるため、手順は
停止される。代わりに、最後のフレームn に到達すると
(I=n) 、ビデオの最後までX'の概算値によりアンダフロ
ー問題が生じることはない。
【0154】ステップ426 に対する回答が「ノー」の場
合、ステップ430 で吸収されずに残るビット数biが計算
される。
【0155】bi =X’−ai (19) それから、ステップ432 では、bi>Bi であるかを判断す
る。この場合、Biとは編集セグメントの後のi番目のフ
レームのバッファ占有である。bi>Bi の場合、現在のバ
ッファ占有「Bi」が許容するより多くのビットが吸収さ
れないで残っているため、差異の概算値、X'は大きすぎ
て、アンダフローを生じさせる。したがって、吸収され
ずに残るビットの間では、「Bi」ビットだけがアンダフ
ローを引き起こさずに吸収できる。次に、差異の概算X'
はステップ434 で改訂されなければならない。ステップ
434 では、X'の改訂された概算は、吸収されずに残るビ
ットに吸収されたビットを加算したものとして計算され
る。
【0156】X’=Bi +ai (20) ステップ432 で、Bi<Bi であると判断する場合、i番目
のフレームでのバッファ占有は吸収されないで残るビッ
トより大きいので、アンダフローの問題はなく、X'の概
算を変更する必要はなく、フローはステップ436 に進
む。ステップ436では、次のフレームが調べられ(iは1
で増分される)、ステップ424 、426 、430 、432 、4
34 、および436 のループが、ステップ426 での判断に
肯定的な回答が得られるまで繰り返される。
【0157】ステップ426 に肯定的な回答が得られる
と、概算X'は受け入れられるため、ステップ428 では、
編集セグメントの境界での最小許容バッファ占有B0' は
以下の通りである。
【0158】B0 ’=B0 −X’ (21) 編集セグメントの再エンコードされた最後のフレームの
実際のバッファ占有がB0' を下回る場合、アンダフロー
状況がビットの再割当てのために発生する。この場合、
最後のフレームはu_flowリスト内のアンダフローポイン
トとしてマークされ、アンダフロー状況(変更済みビデ
オのビット数と結果的に最小許容バッファ占有を生じさ
せるビット数B0' の間の差異)を防ぐための編集セグメ
ントの最後のフレームから削除する必要があるビット数
は、ステップ392 について記述されたのと同様にu_val
の中に格納される。
【0159】本発明のエンコードシステムの場合、ビデ
オの中のすべてのポイントのバッファ占有を知っている
ことが望ましく、この情報はログファイルに記憶される
ことに注記すべきである。しかし、編集セグメントの最
後のフレームでのバッファ占有を引き下げる場合には、
編集セグメント後のフレームのバッファ占有が変更さ
れ、ログファイル内のバッファ占有情報が不正確にな
り、そのため編集セグメント後のフレームのバッファ占
有を計算し直す是正処置を講じる必要があるだろう。
【0160】図17のプロセスに戻って参照すると、ス
テップ396 では、u_flowリスト内にエントリがあるかど
うかを判断する。ない場合は、アンダフロー問題は存在
せず、図17のプロセスは終了する。u_flowリストにエ
ントリがある場合は、フローはステップ398 に進み、u_
flowリスト内の各位置の左側からもっとも近いo_flowポ
イントまでのセクションが保護つきとマークされ、u_va
l 内の対応するビット数に等しいビットがこれらのセク
ションから削除される。バッファアンダフローは1 以上
のフレーム内の多すぎるビットにより引き起こされるた
め、フレーム内のビット数を低減すると、アンダフロー
問題が解決される。アンダフローを防止するために削除
されるビットが原因で画質に著しい低下が生じないよう
にするために、ビットはアンダフローポイントだけから
削除されるのではなく、バッファがいっぱいであった最
後のポイントまで戻ってすべてのフレームから均一に削
除される。これが、アンダフローを防止しながらも最高
品質のビデオを獲得する方法となる。
【0161】その後、ステップ398 で削除されるこれら
のビットは、ステップ400 で保護つきとマークされない
セクションに均一に分配され、図17のプロセスがもう
一度開始する。ステップ400 でビットを分配しても、ア
ンダフローが問題ではなくなるという保証にはならない
ため、図17のプロセス全体を繰り返し使用して、アン
ダフロー状況がないか再度確認する必要がある。
【0162】図17のプロセスが完了した後、図12の
ステップ288 は完了し、図12のステップ290 が実行さ
れる。ステップ290 では、ステップ282 で求められるレ
ート−量子化関数を使用してフレームごとの平均量子化
値を求める。希望されるビットの数は、以前ステップ28
6 で計算され、ステップ288 でアンダフロー問題が存在
するかどうかを確認するためにチェックされたが、エン
コードされたデータに希望のビット数が設定されるよう
にデータを再エンコードするためには、量子化値を求め
なければならない。これは、レート−量子化関数を求
め、レートを捜し出すことで量子化値を求めるだけで、
決定される。
【0163】ピクチャ単位で量子化レベルを求める場合
は、レート−量子化関数(RQF) は、ステップ282 で求め
られた。この関数を概算するには、ピクチャごとに2 つ
のデータポイントが必要とされる。RQF は以下の通りで
ある。
【0164】R=X*Q(-g) +H (22) この場合、R は1 つのピクチャをコーディングするため
に使用されるビット数、Q は量子化スケール、X 、g 、
およびH はピクチャ単位のコーディング特性パラメータ
である。H は、H がヘッダにより消費されるビット、動
きベクトル、DC係数などとなるように、量子化スケール
とは独立したビットを表す。
【0165】エンコーダの最初の実行は、ビデオシーケ
ンス内のコーディングされたピクチャごとに2 つのデー
タポイントを作成するために使用できる。これは、ピク
チャ内のマクロブロックごとに使用される1 組の交互の
量子化スケールにより実行できる。これらは、レート−
量子化モデルパラメータ「X 」と「g 」を計算するため
に処理される。これらの2 つのパラメータは、H の値と
ともに、コーディングされたビデオのフレームごとに1
つ、ファイル内に記憶できる。
【0166】ビデオのある特定なコーディングされたフ
レームに割り当てられるターゲットビットを作り出す量
子化スケールを求めるために、「R 」がターゲットビッ
トを表す前記等式が使用され、(X、g、H) の値が前記のロ
グファイルである可能性がある記憶されたデータファイ
ルから読み取られる。この等式に最適の「Q 」の値が希
望の量子化スケールである。
【0167】それから、ステップ292 でステップ290 で
求められた量子化値を使用してビデオの変更されたセク
ションを再エンコードする。再エンコードの間に特別な
手順が講じられない限り、既にエンコードされたビデオ
の再エンコードセグメントによりエンコードによって問
題が生じる可能性があることに注記すべきである。エン
コード構造および復号化構造を回避するための再エンコ
ードプロセスの詳細は、以下の別個の項に説明する。ビ
デオは再エンコードされてから、以前エンコードされた
ビデオのビットストリームに代入され、プロセスは終了
する。
【0168】図5 に関して記述するように、ユーザ
は、ビデオが許容できるかどうかを判断するために、ビ
デオが再エンコードされた後でビデオを表示することが
できる。ビデオが許容できない場合には、ユーザは新規
にエンコードされたビデオを受け入れる必要はなく、既
にエンコードされたビデオの使用を続けることができ
る。ユーザが新規にエンコードされたビデオが望ましい
とわかったら、新規にエンコードされたビデオで既にエ
ンコードされたビデオは置き換えられる。それから、ユ
ーザは、図5 に説明するように、ビデオの新しいセグ
メントを、空間的に、または時間的に編集できる。
【0169】図19A および図19B では、オリジナル
ビデオエンコードからの、およびユーザが手動品質優先
順位を入力した後のビットレートの2 つの異なる例を示
している。図19A および図19B では、(メガビット
を表す106 のスケールでの)ビットレートが、ピクチャ
のグループ番号に対してプロットされる。ブロック図さ
れる例では、1 つのGOP に15のピクチャが格納され、各
GOP は0.5 秒ごとに表示される。また、実線は元のエン
コードを示し、破線はユーザが手動で画質を調整した後
のエンコードを示す。
【0170】図19A では、優先順位2 、-3、3 、0 お
よび保護つきが設定される5 種類の異なった優先順位領
域のあるエンコードを説明する。優先順位3 が設定され
る期間は、再エンコードの後に、元のエンコードに比較
してさらに多くのビットを使用する。優先順位はただ単
に互いに相関しているだけなので、優先順位2 が設定さ
れるセクションのビットレートは、著しく上昇していな
いが、-3および0 のセクションではビットレートは低下
している。保護つきセクションには、再エンコードの前
に存在したのと類似した再エンコード後のビットレート
が設定されなければならない。
【0171】図19B は、それぞれユーザが選択した優
先順位0 、2 、0 、4 、および0 が設定された領域のあ
る第2 例である。ここでも、優先順位は互いに相関して
いるので、優先順位0 は、ビットレートが未変更である
ことを意味するのではなく、単に、優先順位2 と4 が設
定されるそれ以外のセクションに相対する優先順位であ
る。優先順位4 が設定されるセクションに高いビットレ
ートを指定するために、ユーザ選択優先順位0 が設定さ
れるこれらのセクションは低減され、優先順位2 設定さ
れるセクションには、エンコードの前後とほぼ同じビッ
トレートが設定される。
【0172】時間的手動編集の処理は、本発明の実施例
の図1Aのワークステーション30で発生する。ただし、
時間的手動編集はビデオエンコードプロセスの間は発生
しないので、ワークステーション10はビデオエンコード
プロセスのレートを低下させないで時間的手動編集計算
を実行できる。
【0173】本発明が、編集セグメント内でのさまざま
な時間セグメントの画質の変更として詳しく記述される
ことに注記すべきである。言うまでもなく、同じ時間セ
グメント内にないピクチャのセクションの質の変更を許
可するためにこの概念を拡張することは明らかに可能で
ある。例えば、映画の最後の5 分間の質を最初の5 分間
を犠牲にして向上させるために、本発明の教示を適用す
ることができる。以下に説明するように、単独編集セグ
メントの外側にある期間の品質を変更することが希望さ
れる場合、ユーザは、関心のあるセグメントを連続して
表示し、チェックし、ビットを割当てし直し、各セクシ
ョンの立ち下がり縁でのバッファ占有だけではなく、映
画の合計ビットに関係する制約が規定の限度内にあるこ
とを確認する必要があるだろう。
【0174】時間的手動編集は、編集セグメントの元の
エンコードのビット数を、編集セグメントの再エンコー
ドのビット数と同じにしておくこととして記述されてき
た。しかし、希望される場合には、再エンコードされた
の編集セグメントが消費するビットをさらに少なくした
り、十分な記憶容量が存在する場合には、再エンコード
されたの編集セグメントのビット数が元のエンコードの
ビット数を上回ることがある。また、ビデオの元のエン
コードを、それにより最終デジタル記憶媒体上の使用で
きるすべての記憶スペースが消費されないように実行す
ることもできる。したがって、再エンコード後のビット
総数は、元を上回るまたは下回る任意の量、例えば5%と
1%多いまたは少ないビットを含む、0%と20% の間で多い
か少ない量を消費できる。
【0175】時間的手動編集の説明は、ビデオエンコー
ド後にビデオを変更することに関して行われてきた。し
かし、本明細書に記載される教示は、初期エンコードプ
ロセスがなかったシステムにも適用できる。さらに、共
通ビットプールの使用に関する時間的手動編集の教示
は、以下に示すビデオフレームの空間手動編集の概念に
適用できる。また、空間手動編集の個々のフレームでの
動作様式は、以下に説明するように、上質の時間的編集
を達成するためにフレームの列に適用できる。
【0176】B. フレームの領域内での品質の変更 図20には、1 つ以上のフレーム内で領域の品質を変え
るための一般的な手順を説明する。開始後、ステップ45
0 では、システム構成要素および一般的なシステム動作
に関する項に説明するように、MPEGフォーマットやそれ
以外のフォーマットのような圧縮済みデジタルフォーマ
ットに入力ビデオをエンコードする自動ビデオエンコー
ドを実行する。ステップ452 では、ユーザにエンコード
されたビデオが表示され、ステップ454 では、ユーザは
1 つ以上のフレーム内の領域の品質の変更を示すコマン
ドを入力できる。
【0177】図21には、図1 に示されるビデオディ
スプレイモニタ61のようなモニタ上で表示されるビデオ
のフレームがブロック図される。図21のビデオのフレ
ームは、木465 、人467 、鳥468 、および2 つの雲471
があるとして描かれる。
【0178】図21では、フレーム内の領域が、木465
を取り囲む領域466 、人を取り囲む領域469 、および領
域470 、重複領域469 を含めて、ならびに鳥468 および
人467 頭を含めて限定される。これらの領域は、図1A
に示されるグラフィックポインティングデバイス33を使
用して描画された。図21でユーザが設定した品質優先
順位には、木を含む領域466 の-5、人を含む領域469 の
+2、および鳥と人の頭を含む領域470 の+4が含まれる場
合がある。図21内のビデオのフレームのそれ以外の領
域には、ユーザ定義優先順位は指定されず、したがっ
て、「無定義」優先順位が指定される。後述するよう
に、「無定義」領域とは、ユーザ定義優先順位が指定さ
れるフレームのエンコードのビット総数を、フレームの
元のエンコードの結果生じるビット数に等しくなるよう
に調整する目的で、ユーザ定義領域の量子化レベルを変
更した後に最初に修正される領域のことである。ユーザ
がフレームの領域の品質の変更を希望しない場合、これ
らの領域は、ユーザによって優先順位ゼロが設定される
とマークされるだろう。
【0179】本発明の実施例では、ビデオのフレーム内
で優先順位領域を限定すると、ユーザは、当初グラフィ
ックポインティングデバイスを使用して、ビデオの表示
されたフレーム上に矩形領域を作成する。後で定義され
る領域は先に定義される領域の上に格納され、先に定義
される領域と重複することがある。本発明が矩形領域を
限定することに関して説明していても、本発明の教示
を、円や楕円のような曲線を含む領域、八角形や六角形
のような多角形の領域、またはそれ以外の、曲線または
直線あるいはその両方を含むユーザが定義する形状にも
適用できるのは言うまでもない。ユーザは、各領域を定
義してから、領域の優先順位を定義する。代わりに、ユ
ーザは、すべての領域の形状を定義し、その後にこれら
の領域に優先順位を指定することができる。
【0180】ユーザが初期に領域内で優先順位を定義す
る場合、領域はピクセル位置に対応する。ただし、以下
に示される優先順位を割り当てるプロセスは、マクロブ
ロック単位で動作し、マクロブロックはデジタルビデオ
エンコードに使用される単位である。したがって、マク
ロブロックがユーザ定義領域内または外周上にある場
合、そのマクロブロックには領域の優先順位が割り当て
られる。従来の技術の当業者は、単純な数学を利用して
ユーザ定義領域に対応するマクロブロックを求めること
ができる。ユーザ定義領域の外周の場合は、領域の外辺
部がマクロブロックに交差する場合に、ユーザ定義領域
内に単にマクロブロックを入れる代替策として、マクロ
ブロックを領域内に入れるかどうかを判断するさらに精
密なプロセスが、ユーザ定義領域内にマクロブロックの
50% 以上がある場合には、ユーザ定義領域内にマクロブ
ロックを入れて、ユーザ定義領域内にマクロブロックの
50%下がある場合には、ユーザ定義領域からマクロブロ
ックを排除することによって実行することができる。
【0181】領域およびその優先順位が定義された後
で、ユーザは、希望する場合には領域の重複を変更でき
る。例えば、ユーザは図21の領域469 の上で事前に決
定されたファンクションキーを押しながら「クリック」
して、領域469 を領域470 の上になるように変更し、人
全体に領域469 の優先順位が設定され、鳥468 だけに領
域470 に割り当てられる優先順位が設定されるようにす
る。重複領域には、ユーザによって入力されるときにス
タック優先順位が指定される。このスタック優先順位
は、ユーザ定義領域が追加、削除、または修正されると
きに、必要に応じて調整される。
【0182】領域が定義された後で、ユーザは、希望に
応じて領域のけ以上を作りなおしたり、グラフィックポ
インティングデバイス33を使用して領域を移動すること
がもできるまた、ユーザにより定義された領域は、グラ
フィックポインティングデバイス33を使用して削除でき
る。領域が削除されていても、ユーザ定義優先順位だけ
が削除されているのであり、言うまでもなく削除中の領
域内のオリジナルビデオデータは削除されていないこと
に注記すべきである。
【0183】期間で品質を変更することについて、前記
項に説明するように、自動エンコードの間または自動エ
ンコードの後で、ユーザはエンコードビデオをレビュー
することができ、関心のあるフレームまたは期間が発生
するたびに、ユーザはキーボードで単にキーを押した
り、入力を別の装置から入力し、特定のフレームまたは
期間が重要であることを示す。後で、ユーザはそのフレ
ームまたは期間に戻って、さらに時間を費やして期間を
検討し、希望に応じてその期間内で特徴を変えることが
できる。
【0184】ビデオのフレーム内の領域をユーザが定義
するプロセスは、ユーザによって修正されるデータのフ
レームが1 つしかない単純なケースについて前述され
た。しかし、ビデオシーケンス内のデータのフレームを
一度に1 フレームづつ作業するのはきわめて単調で退屈
であるため、本発明を使用すると、ユーザは最初の期間
で領域を定義し、後の期間で対応する領域を定義できる
ようになる。それ以降、最初のフレームと最後のフレー
ムの中間のビデオのすべてのフレームに、ユーザにより
最初のフレームと最後のフレームに定義される領域に対
応する領域が作成され、最初の領域または最後の領域あ
るいはその両方の領域と同じ優先順位、もしくは最初の
フレームと最後のフレームの優先順位に基づく優先順位
が指定されるように、補間プロセスが実行される。さら
に、重複領域のスタック優先順位は、補間プロセスの間
維持される。中間フレームにその領域が自動的に作成さ
れた後、ユーザは、希望に応じて、優先順位、領域の形
状を変更することにより改変したり、新しい領域を追加
したり、領域を削除することができる。
【0185】以下に、補間プロセスがどのように動作す
るのかの例を示す。ユーザに時間インスタンスt_1 とt_
n での2 つのフレームの優先順位領域を選択させる。ユ
ーザがフレームt_1 に領域を、t_n に対応する領域を割
り当てた後、これら2 つの領域の座標は、t_1 とt_n の
間のすべてのフレームの領域仕様を獲得するために中間
フレーム上で補間される。定義中の実際の領域に補間を
実行できるだけではなく、補間は品質優先順位にも実行
できる。補間プロセスには、単純な一時関数が使用され
る。ユーザがポイントa_1 のあるフレームt_1 の領域A
を定義し、フレームt_n の対応する領域A に対応するポ
イントa_n があり、中間フレームa_2 、a_3...a_(n-1)
内の対応するポイントに、以下のように定義される水平
縦軸 a_i(h)=a_1(h)+(a_n(h)-a_1(h))x(i-1)/(n-1) (23) および以下のような垂直縦軸 a_i(v)=a_1(v)+(a_n(v)-a_1(v))x(i-1)/(n-1) (24) があると仮定する。この場合、h とv は問題のポイント
の水平縦軸と垂直縦軸に対応する。このプロセスでは、
領域を限定する多角形の頂点だけが使用され、頂点は補
間される。それから、領域は頂点により限定される。線
形補間以外の他の補間技法も実行できる。
【0186】前記補間プロセスは、編集対象のセグメン
ト内のすべてのフレームのすべての領域が適切に定義さ
れるまで、必要な回数実行できる。さらにこのプロセス
は、ユーザが中間プロセスの補間で決定された領域を移
動したり、領域のサイズを変更することができ、補間プ
ロセスが最初のフレームと改変された中間プロセスに、
それから中間とフレームと最後のプロセスにもう一度実
行できるように発生する微調整プロセスにより再帰的と
なる。補間プロセスは、おもに、フレームを横切って移
動する領域を定義するために使用される。しかし、本発
明には、静止しておりフレームの列内で使用される領域
を一度定義することも含まれる。
【0187】領域が定義され、ユーザ定義優先順位が入
力された後、各マクロブロックの新しい量子化値は、ユ
ーザによって入力された優先順位およびマクロブロック
の古い量子化値に基づいて、図20のステップ456 で概
算されるか、求められる。これは、ユーザ選択優先順位
のそれぞれで使用される元の量子化値の端数を示してい
る図22に説明される関係に従って決定される。例え
ば、ユーザが優先順位ゼロを入力すると、使用される元
の量子化値の結果として生じる端数は1 であり、元の量
子化値に変更がないことを意味する。ユーザが優先順位
-3を選択すると、元の量子化値の端数は1.58となり、優
先順位3 が設定されるマクロブロックの元の量子化値
が、結果として生じる量子化値を求めるために、1.58に
より乗算されることを意味する。優先順位-3は品質の低
下を意味するので、量子化レベルは、品質の低下を達成
するために量子化レベルを引き上げる、つまりマクロブ
ロックに使用されるビットはさらに少なくなければなら
ない。反対に、3 のような正の優先順位がユーザによっ
て入力されると、元の自動号化からのマクロブロックの
量子化値は量子化レベルを引き下げる0.42で乗算され
る。引き下げられた量子化レベルは、マクロブロック内
のイメージを表すにはさらに多くのビットが必要とさ
れ、したがって、画質が向上することを意味する。図2
2に示される線上のポイントは(-5, 100) 、(-4, 1.7
5)、(-3, 1.58)、(-2, 1.42)、(-1, 1.25)、(0,1)、(1,
0.72) 、(2, 0.58) 、(3, 0.42) 、(4, 0.25) 、およ
び(5, 0.01) である。図22に説明されるマッピング
は、q-レベルと優先順位の間のこの方向の線形関係に基
づいている。図22で求められたポイントは、実験を通
して求められ、さまざまな端数は希望に応じてユーザ選
択優先順位と使用できる。
【0188】優先順位-5と5 はそれぞれ最低可能品質お
よび最高可能品質を獲得することを目的とする。最低品
質は、非線形量子化スケールが使用されるときの最大許
容量子化レベル112 、および線形量子化スケールがMPEG
-2エンコードに使用されるときの62の結果である。ま
た、最高品質を達成するために使用される最低量子化レ
ベルは1 である。したがって、図22に説明される関係
からは、実際の許容q スケールから離れた値が生じるこ
とがあるが、これらの計算されたq 値は単にその飽和レ
ベルで格納されるだけである。例えば、当初、マクロブ
ロックに量子化スケール20が設定され、ユーザがマクロ
ブロックの優先順位を-5となるように選択すると想定し
てください。100 で乗算される量子化値20が、量子化ス
ケールから離れた新しい量子化レベル2,000 を生み出す
ため、最大量子化値または飽和量子化値が使用される。
【0189】前記のように飽和レベルを使用することに
加えて、本発明では、MPEGエンコードのI フレーム、Pフ
レーム、およびB フレームの予防措置を講じる。本発明
は、I タイプフレームの最高量子化レベルを、非線形量
子化ケースの場合96となるように、線形量子化スケール
使用時には58となるように制限する。同様に、B 型フレ
ームおよびP 型フレームの最高量子化レベルは、非線形
量子化スケールの場合は112 、線形量子化スケールの場
合は62である。線形量子化スケールおよび非線形量子化
スケールは、MPEG規格で定義される。I フレーム型、P
フレーム型、およびB フレーム型のそれぞれに使用され
る最低量子化レベルは1 である。言うまでもなく、図2
2にブロック図されるユーザ定義入力および元の量子化
値の端数は、ユーザの要件を満たすために修正できる。
【0190】ステップ456 でマクロブロックごとに新規
量子化値が計算した後、ステップ458 で、ステップ456
で求められた量氏化器値の結果生じるフレームごとにビ
ット数を求める。本発明の実施例では、他の領域の品質
は低下したが、いくつかの領域の品質が向上した後で、
各フレームに同じビット数を獲得しなければならないた
め、このステップは重要である。新しい量子化値の結果
生じるビット数を求めるために、マクロブロックごとの
結果として生じるビット数に対する量子化レベルを適切
に概算する関数を設定する必要がある。結果として生じ
るビット数と量子化レベルの間の関係正を求めるため
に、MPEG-2エンコーダのようなビデオエンコーダの経験
的な結果の検討が実施され、求められた関係は実際の経
験的な結果に基づいている。多くのビデオシーケンスを
使用するさまざまな量子化レベルおよびフレームタイプ
のシミュレーション結果が実施された。これらの結果に
基づき、マクロブロックの量子化レベル(q) とそのマク
ロブロックをエンコードする際に使用されるビット数
(b) の間の以下の関係性は、フレームタイプに応じて、
以下の通りであると判断された。
【0191】 log(b)=mlog(q)+n (25) この場合、I タイプフレームの場合m=-0.75 で、B タイ
プフレームとP タイプフレームの場合、m=01.0である。
さらに、I フレーム、P フレーム、およびB フレームの
場合それぞれn=15、14.5、および13.8である。これらの
値は、前記に注記されるように、多数のビデオシーケン
スで平均化される。前記等式は、エンコーダの動作を予
測するための優れた近似基準として働き、ビット数と量
子化レベルの間の関係はログ領域内で線形である。言う
までもなく、正確であるなら、量子化レベルと結果とし
て生じるビット数の間のそれ以外の関係も、本明細書に
記載されるその他のレート−量子化関数を含む、指定さ
れた量子化レベルから生じるビット数を求める場合に使
用できる。
【0192】前記プロセスは、指定された指定量子化レ
ベルから生じるビット数を求める方法を説明する。しか
し、複数のエンコードが使用される場合は、新規エンコ
ードからの情報を使用して、量子化関数に対してデータ
レートをさらに正確にすることができる。初期自動エン
コードプロセスの間に、エンコードされるべきビデオの
統計を収集するのに使用される第1 ビデオエンコードパ
スがある。それから、実際のエンコードである第2 パス
の間に、量子化関数に対するデータレートの別の実際の
ポイントが、指定されたq-レベルから作成されるビット
数b を記述する前記等式に対応するq プロットに対する
b においてのように獲得される。データが、以下に説明
するように、ユーザ指定選択に従ってエンコードされた
後、結果として生じるビデオは、それが希望される品質
の改善を満たすかどうかに応じて、ユーザによって受け
入れられるか、拒絶される。再エンコードするたびに、
概算されたビットに対するq-レベル関係の実際データが
作成される。新しいq-レベル割当てq'が指定されると、
求められたデータレートは、再エンコードによって得ら
れる追加データに基づいて、このポイントに関してさら
に正確に成る。新規量子化レベル、q' が以前に得られた
2 つのポイントの間に該当する場合、新規q-レベルで出
力されるビット数の概算を得るために、ログ領域内で線
形補間を実行することができる。新規量子化レベル「q」
が2 つの事前に決定されたq-レベルの間に該当しない場
合には、モデルは、もっとも近いq-レベルから新しい量
子化レベルq'に補外し、エンコード時に作成されるビッ
ト数を概算するのに使用できる。データが再エンコード
される時間が長いほど、エンコーダからの出力ビットに
対してより優れた概算を得る確率が高くなることを注記
する。
【0193】概算された量子化値から生じる各フレーム
のビット数が図20のステップ458で求められた後、ス
テップ460 で、ビット概算数がフレームの元のビット数
に十分近いかどうか判断し、必要ならビット数を訂正す
る。これは、図23-25Cでブロック図されるプロセスに
従い実行される。
【0194】ステップ460 が実行されると、図23のス
テップ472 が、最初に、ビット概算数と元のエンコード
のビット数の差異を求める。これは、以下の等式に従い
計算される。
【0195】D=B’−B (26) この場合、B'は、修正されたフレームの概算ビット数、
B は元のエンコードから結果として生じるフレームのビ
ット数、およびD は差異である。元のエンコードから結
果として生じるビット数以外のB の値を使用することが
できるのは言うまでもない。例えば、ユーザは、フレー
ムの総ビット数の増加を希望する場合、元のエンコード
から結果として生じるビット数より大きい事前に決定さ
れた量である数にB を設定できる。同様にして、ユーザ
は、フレームの元のビット数を下回るようにB を設定す
ることもできる。したがって、記録されたフレームは、
記憶領域の制約、最小品質制約、およびビデオバファア
ンダフローの可能性に応じて、元のエンコードより多い
ビットまたは少ないビットを消費することがある。ま
た、フレーム内の領域の量子化値が改変されていない場
合、その量子化値を改変された領域から結果として生じ
るビット数だけを分析し、変更されなかった領域を無視
することができる。それから、ステップ474 でこの差異
を分析し、ビットが多すぎると判断されると、フロー
は、ビット数を低減するためにマクロブロックの量子化
レベルを引き上げる目的の図24A-24C に説明されるプ
ロセスのために、B 進む。ステップ474 で修正されたフ
レーム内のビットが少なすぎると判断されると、新規フ
レームのマクロブロックの量子化レベルは、図25A-25
C にブロック図されるプロセスF に従ってさらに多くの
ビットを作成するために引き下げられる必要がある。そ
れ以外の場合、差異が許容できるスレッショルド内にあ
る場合は、マクロブロックの量子化レベルを修正する必
要はなく、プロセスは図20のステップ462 を実行する
ために戻る。フレーム内のビット数を再エンコードされ
たビデオに対し同じに保つ場合、ビットは、ある領域か
ら別の領域にシフトされると考えることができる。
【0196】ステップ474 では、差異D は、差異をスレ
ッショルドT に比較することで分析される。スレッショ
ルドは、領域の品質の変更の結果生じるビット数が総ビ
ット数の0.001 以内である場合、差異は許容でき、プロ
セスは停止できることを意味する0.001xB に設定され
る。言うまでもなく、差異が許容できることを示す停止
スレッショルドは、別の方法で求められ、希望に応じて
引き上げたり、引き下げたり、フレームの元のビット数
とユーザ選択優先順位から結果的に生じるビット数の両
方に基づくことができる。
【0197】図24A-24C 、および図25A-25C に説明
されるプロセスは、図24A-24B がユーザ選択品質の結
果として生じるビット数を低減するために使用され、図
25A-25C がユーザ選択品質の結果として生じるビット
数を増加させるために使用されるという点を除き、きわ
めて類似している。図24A-25C で実行されるプロセス
の一般的な概要は、これらのプロセスの詳細を説明する
前にここで記述する。当初、ビデオのフレーム内のマク
ロブロックは、「無定義」、「負の優先順位」、「正の
優先順位」、「変更不可」の4 種類の内の1 つとしてラ
ベルが付けられる。領域にユーザによる優先順位が指定
されていない場合、またはシステムによってユーザが
「無定義」ステータスを割り当てることができる場合、
その領域は「無定義」タイプであると見なされる。ユー
ザが-5と-1の間の、および-5と-1を含む優先順位を割り
当てると、これらの領域内のマクロブロックは「負の優
先順位」であると考えられる。領域に1 と5 の間の、お
よび1 と5 を含む優先順位が割り当てられると、それら
の領域には「正の優先順位」が設定されていると考えら
れる。最後に、優先順位0 で割り当てられるすべての領
域、またはシステムによってユーザが他のなんらかの方
法で、領域の品質を変更させてはならないことを示すこ
とができる場合には、それらの領域のマクロブロックは
「変更不可」タイプと見なされる。
【0198】4 種類のマクロブロックのそれぞれの中で
のマクロブロックのそれぞれには、4 種類の内のそれぞ
れに独自のインデックスのセットが備えられるように、
インデックスiでラベルが付けられる。ゼロのインデッ
クスiは、最初のマクロブロックに割り当てられ、イン
デックスn-1 は最後のマクロブロックに割り当てられ
る。この場合、N はある領域種類内のマクロブロックの
総数である。例えば、「無定義」領域のすべてに対し、
これらの領域内のマクロブロックのそれぞれに0 からn-
1 のインデックスが付けられる。3 つ以上の「無定義」
領域がある場合、「無定義」領域に2 つの異なるインデ
ックスi=0 がないことに注記する。すべての「無定
義」領域に対しては、インデックス0 が付いたマクロブ
ロックは1つだけ、インデックス1 がついたマクロブロ
ックは1 つなどである。
【0199】ユーザが領域の優先順位を決定した後にフ
レーム内のビットが多すぎる場合、フレームの量子化レ
ベルは、フレームのビット数を低減するために引き上げ
られなければならない。マクロブロックの元の量子化値
が、図10A または10B のどちらかにブロック図される
フォーマットを持つマクロブロックレーヤのログファイ
ルから削除される。代わりに、エンコーダは再実行し、
量子化値がエンコーダの元の実行の後に記憶されていな
かった場合には、量子化値を求める。しかし、別の代替
策では、エンコードされたビットストリームを復号化
し、元のエンコードの量子化値を求める。ビット数を低
減するために、手順は、「無定義」タイプのマクロブロ
ックごとの量子化レベルを1 量子化レベル、一度に1 マ
クロブロックづつ引き上げることで動作する。これで問
題が解決されない場合、「無定義」の各マクロブロック
のq レベルは、一度に1 マクロブロックづつ再度1 増加
される。事前に決定された最大量子化レベルが設定さ
れ、無マクロブロックの量子化レベルを超えて増加でき
る。「無定義」タイプのすべてのマクロブロックがこの
最大レベルに達すると、「負の優先順位」および「正の
優先順位」の領域は、同じように1 増加される。まず、
すべての負の優先順位マクロブロックが1 量子化レベル
引き上げられ、これでビット差の問題が解決されない場
合、「正の優先順位」マクロブロックのマクロブロック
の量子化レベルが1 増加される。これで問題が解決しな
い場合、「負の優先順位」マクロブロックの量子化レベ
ルは再び1増加され、これで問題が解決しない場合に
は、「正の優先順位」タイプのマクロブロックの量子化
レベルが1 増加される。このプロセスは「負の優先順
位」タイプおよび「正の優先順位」タイプのすべてのマ
クロブロックの量子化レベルが前記最大レベルに引き上
げられるまで続行する。これでビット差問題が解決しな
い場合には、「変更不可」タイプのマクロブロックの量
子化レベルが、ビット差問題が解決されるまで、一度に
1 量子化レベル引き上げられる。十中八九、ビット差問
題は、「変更不可」タイプの量子化レベルが変更され始
める前に訂正されるだろう。ユーザ選択優先順位が設定
されるフレームのビット数が少なすぎて、図25A-25C
のプロセスに従ってビット数を増加するために、マクロ
ブロックの量子化レベルを引き下げる必要がある場合、
類似したプロセスが発生する。
【0200】今度は、生じたビットが多すぎてしまった
ときに図23によって実行される図24A に示されるフ
ローチャートを参照すると、プロセスはブロックタイプ
を「無定義」タイプに設定する図24A のステップ480
で開始する。それから、ステップ482 で、マクロブロッ
クインデックスを、インデックスiがゼロに等しく設定
されることを意味する開始ポイントに設定する。それか
ら、設定されていたマクロブロックタイプ(フローチャ
ートで初めて、「無定義」タイプの第1 マクロブロッ
ク)の問題のマクロブロック(インデックス=i内のマ
クロブロック)の量子化レベルに最大事前定義量子化レ
ベルが設定されているかどうかを判断する、ステップ48
6 が実行される。この訂正プロセスの最大量子化レベル
は、訂正されるマクロブロックの品質で大きな劣化がな
いように高すぎて設定してはならない。可能であるな
ら、マクロブロックの質に大きな差が出ないように、均
一のビット数を減少させる目的で品質を劣化させようと
することが望ましい。したがって、この最大値は線形量
子化スケールが使用されるときには量子化レベル62に、
非線形量子化スケールがMPEG-2エンコードなどに使用さ
れるときには112 に設定される。ただし、最大量子か器
値には、それ以外の値も使用できる。問題のマクロブロ
ックの量子化レベルがステップ486 で最大ではないと判
断されると、ステップ488 で問題のマクロブロックの量
子化レベルを1 量子化レベル増分する。それから、ステ
ップ490 で前記のビットレート−量子化機能を使用して
フレームのビット概算を計算し直す。それからステップ
490 では、マクロブロックのインデックスをゾウ文す
る。マクロブロックのインデックスがマクロブロックタ
イプの最後のマクロブロックが処理されていないことを
示す場合は、フローはステップ484 ループバックする。
それ以外の場合は、フローはステップ492 から、ブロッ
クインデックスをゼロにリセットするステップ498 に進
み、第1 マクロブロックを示す。
【0201】フローがステップ484 に戻ると、ステップ
490 で計算し直されるビット概算は、前述するように、
スレッショルドに比較される前記の差D を計算し直すた
めに使用される。ビット概算が高すぎない場合、ユーザ
選択優先順位を指定されるフレームのビット数が訂正さ
れ、フローは呼び出しプロセスに戻る。それ以外の場
合、フローは、問題の(インデックス1 が設定される)
マクロブロックの量子化値が最大であるかどうかをもう
一度判断するステップ486 に進む。
【0202】ステップ486 で、問題のマクロブロックの
量子化値が最大であると判断すると、そのブロックの量
子化レベルは引き上げる必要はなく、ステップ494 では
1 ブロックインデックスiを増分する。ステップ496 で
マクロブロックタイプのインデックスが最後のブロック
を通り過ぎていないと判断すると、フローはステップ48
6 に進み、増分されたインデックスの付いたブロックに
最大量子化値が設定されているかどうかを判断する。そ
れ以外の場合、ステップ496 でマクロブロックが問題の
マクロブロックタイプの最後のマクロブロックであると
判断すると、ステップ498 が実行され、ブロックインデ
ックスが第1 マクロブロック(i=0)にリセットされ
る。それから、フローは図24B に説明されるプロセス
C に進む。
【0203】図24B では、ステップ500 で、ブロック
タイプが「無定義」タイプであるかどうか調べる。「無
定義」タイプである場合は、ステップ502 ですべての
「無定義」マクロブロックに最大q レベルが設定されて
いるかどうかを判断する。「無定義」マクロブロックの
すべてに最大q レベルが設定される場合、「無定義」タ
イプのマクロブロックにさらに調整を実行することは不
可能であるため、マクロブロックタイプは、ステップ50
4 で「負の優先順位」に変更され、フローは図24A に
ブロック図されるプロセスD に戻り、ステップ484 が実
行される。それ以外の場合、ステップ502 で、「無定
義」タイプのすべてのマクロブロックに最大q レベルが
設定されていないと判断すると、フローは修正中のマク
ロブロックのタイプを変更しないで、プロセスに戻る。
この手順は、フレームの結果として生じる数がスレッシ
ョルド範囲内になるまで続行するか、あるいは「無定
義」型のすべてのマクロブロックが「負の優先順位」に
変更されるブロックタイプを結果的に生じさせる最大量
子化レベルに設定される。
【0204】ステップ500 でブロックタイプが「無定
義」ではないと判断するとステップ506 がブロックタイ
プが「負の優先順位」であるか判断する。ブロックタイ
プが「負の優先順位」の場合、ステップ506 は、「正の
優先順位」のすべてのブロックに最大q レベルが設定さ
れるかどうか判断する。ステップ508 の判断の結果が負
である場合、ステップ510 が実行され、ブロックタイプ
が「正の優先順位」に設定され、フローは図24A にブ
ロック図されるプロセスD に進む。
【0205】ステップ508 で「正の優先順位」のすべて
のマクロブロックに最大q レベルが設定されると判断す
ると、ステップ512 で「負の優先順位」タイプのすべて
のブロックに最大qレベルが設定されるかどうか調べ
る。設定されていない場合、ブロックタイプは変更され
ず、フローは図24A のプロセスD に戻る。「負の優先
順位」タイプのすべてのマクロブロックに、ステップ51
2 で、最大q レベルが設定されていると判断される場
合、すべての「無定義」、「負の優先順位」および「正
の優先順位」のマクロブロックに最大量子化レベルが設
定され、ブロックタイプがステップ512 で「変更不可」
に設定される。それから、フローは図24A のプロセス
D に進む。
【0206】図24B のステップ506 が負と判断されて
から、プロセスE および図24C のステップ520 が実行
される。ステップ520 でブロックタイプが「正の優先順
位」であるかどうか判断する。そうである場合は、ステ
ップ522 で「負の優先順位」のすべてのブロックに最大
Q レベルが設定されるかどうかが判断される。設定され
ていない場合、ブロックタイプは「負の優先順位」に設
定され、フローは図24A にブロック図されるプロセス
D に戻る。ステップ522 で「負の優先順位」タイプのす
べてのブロックに最大q レベルが設定されていると判断
すると、ステップ526 「正の優先順位」タイプのすべて
のブロックに最大q レベルが設定されるかどうかを調べ
る。設定されていない場合、フローは図24A にブロッ
ク図されるプロセスD に戻る。それ以外の場合、すべて
の「無定義」ブロックとともにすべての 「負の優先順
位」および「正の優先順位」に最大量子化レベルが設定
され、ステップ526 でブロックタイプが「変更不可」に
設定され、フローは図24A にブロック図されるプロセ
スD に戻る。
【0207】ステップ520 でブロックタイプが「正の優
先順位」ではないと判断すると、ブロックタイプはそれ
ゆえ「変更不可」でなければならず、ステップ530 で
「変更不可」タイプのすべてのブロックに最大q レベル
が設定されるかどうかが判断される。設定されている場
合、ユーザ選択優先順位が設定されるフレーム内のビッ
トが多すぎるという問題を解決しないで、すべてのブロ
ックタイプが最大量子化レベルに設定されたので、エラ
ーが生じる。すべてのブロックを最大事前定義qレベル
に設定すると、フレームの元のエンコードを上回らない
ビット数が生じるはずである。ステップ530 での判断が
負である場合、フローは図24A に説明されるプロセス
D に戻る。
【0208】図23のプロセスが、ユーザ選択優先順位
領域のあるフレーム内のビット数が少なすぎると判断す
ると、図25A-25C のプロセスが実行される。図25A-
25Cは、量子化レベルがフレームのビット数を増加させ
るために引き上げられる代わりに引き下げられ、マクロ
ブロックの量子化レベルが、引き下げられたときに量子
化Rレベルの1 のような事前に決定される最小レベルを
超えることができないという点を除き、図24A-24C に
ブロック図されるプロセスに基づいている。前記に注記
した相違点を除き、図25A-25C のプロセスが図24A-
24C のプロセスに同一であるため、図25A-25C のさら
なる説明は簡略を期すために行わない。
【0209】図23-25Cに記述される訂正プロセスは、
本発明が動作する1 つの様式である。ただし、異なった
種類のマクロブロックの量子化レベルを調整する代替手
段も可能である。例えば、「負の優先順位」および「正
の優先順位」のマクロブロックの量子化レベルを、前述
のように同時に変更する代わりに、「負の優先順位」タ
イプ、「正の優先順位」タイプおよび「変更不可」タイ
プのマクロブロックは均一に増加できる。代わりに、ビ
ットが多すぎる場合には、「負の優先順位」タイプの量
子化レベルが、最大量子レベルに達するまで引き上げら
れてから、「正の優先順位」タイプのマクロブロックの
量子化レベルが引き上げられる。反対に、ユーザ選択優
先順位が設定されるビット数が少なすぎる場合、「負の
優先順位」タイプのマクロブロックのレベルが引き下げ
られる前にビット数を増加するために、「正の優先順
位」タイプのマクロブロックの量子化レベルが引き下げ
られる場合がある。後者の2 つのケースでは、「無定
義」タイプのマクロブロックの改変は、「負の優先順
位」または「正の優先順位」タイプのマクロブロックの
前、間、または後に発生する可能性がある。
【0210】図23A-25C のプロセスが実行された後、
フローは、新しい量子化値を使用してビデオを再エンコ
ードする図20のステップ462 に戻る。この再エンコー
ドは、再エンコードされたのフレームの結果として生じ
るビット数を、フレームの元のエンコードのビット数に
できる限り近づける目的で、レート−制御関数を使用し
て、量子化値を微調整する間に実行される。レート−制
御装置プロセスは、以下の別項に詳しく説明する。ま
た、再エンコードの間、エンコード人為構造が発生する
可能性があるため、以下の別項に説明するように、これ
らのエンコード人為構造を低減する目的で特殊な手段を
実行できる。
【0211】空間手動編集のプロセスは、本発明の実施
例の図1Aのワークステーション30で発生する。しか
し、空間手動編集がビデオエンコードプロセスと同時に
発生しない場合、ワークステーション10は、ビデオエン
コードプロセスのレートを劣化させないで時間的手動編
集を事項できる。本発明がフレーム内のさまざまな領域
の画質を変更することとして詳しく記述されることに注
記すべきである。本明細書の概念を、あるフレームの領
域内のビットを別のフレームの領域にシフトすることに
拡大することができるのは言うまでもない。さらに、空
間手動編集は、前記の時間的手動編集と合わせて適用で
きる。
【0212】空間手動編集は、ユーザ指定領域優先順位
が設定されるフレームのビット数をフレームの元のエン
コードと同じに保つこととして説明された。ただし、希
望される場合、再エンコードされた編集セグメントは、
十分な記憶領域容量がある場合には、フレームの元のビ
ット数より多いか少ない事前に決定されるビット数を消
費できる。これらのケースでは、改変されたフレームを
変更できるビット数を理解しておくことが望ましく、そ
のため図24A-25C にブロック図されるプロセスは、設
定された差が達成されるまで動作するだろう。したがっ
て、任意のフレームの再エンコードのビット総数は、5%
と1%多いまたは少ないビットの両方を含む0%と20% の間
で多くまたは少なく、元のエンコードを上回るか、下回
る任意の量を消費する。
【0213】空間手動編集の説明は、ビデオがエンコー
ドされた後のビデオの変更に関して行われた。しかし、
本明細書に記載される教示は、初期エンコードプロセス
がなかったシステムにも適用できる。
【0214】空間手動編集は、以前に取得されたフレー
ムと同じビット数を達成するために、ユーザ選択優先順
位に基づいて量子化値を割り当ててから、必要に応じ
て、フレームのマクロブロックの量子化レベルを調整す
ることによって動作する。対照的に、前記の項に記述さ
れた時間的手動編集は、ビデオのセクションからビット
の共通プールを削除し、それらのビットを、ユーザ選択
優先順位に従って、共通プールから分配し直す。あるフ
レームに関して空間手動編集が実行されるプロセスにつ
いてのすべての教示は、時間的手動編集の項に説明され
るように、時間でビデオのフレームの品質を変更すると
いう概念に適用でき、逆の場合も同じである。例えば、
空間編集は、品質の変更を達成するために量子化レベル
を修正することとして説明されてきたが、ビット数は時
間的編集の項で調整される。フレームまたはマクロブロ
ックのビット数は、直接、量子化レベルに依存するた
め、ビット数および量子化レベルの修正は、同じ結果を
達成し、そのため時間的編集および空間編集は、ビット
数または量子化レベルあるいはその両方を修正できる。
【0215】VIII. 品質変更後のビデオの再エンコ
ード A. 品質が単独フレーム内で変更された場合のビット割
当て制御 図1Aにブロック図されるビデオエンコード装置50のビ
ットレートを制御するために、ワークステーション10ま
たは同じ制御機能を実行できるあらゆる専門ハードウェ
アのような制御装置が、量子化レベル、つまりq-レベル
およびレート制御式エンコーダ内ヘのスライスごとの概
算ビット数または予想ビット数をロードする。それか
ら、エンコーダはエンコードを開始し、量子化レベル
は、以前に求められた予想ビット数に比較して、作成さ
れたビット数の精度を測定してから調整される。予想ビ
ット数は、空間手動編集および時間的手動編集に関する
項で前述されるように、レート−量子化関数を使用して
求められる。このプロセスは、一度のn 個のマクロブロ
ックの集合に対して連続して実行され、各集合はMB(
i) 示され、以下の通りである。
【0216】 1(マクロブロックの合計数#/n ) (27) マクロブロックの最後の集合を再エンコードする場合、
作成されるビット数のマイナーな過剰予想が、ビットス
タッフィングを使用して吸収できるため、レート−制御
装置が、再エンコードプロセス中で作成されたビットの
総数が最初にエンコードされた長さより短くなることを
保証する。
【0217】図26は、事前に割り当てられる量子化レ
ベルでデジタルビデオの集合を再エンコードするための
方法を説明するフローチャートである。調整は、量子化
モデルが、再エンコードにより作成されるビット数を、
作成されたビットの実際の数に対してどれほど正確に予
想下のかに基づいて、事前に割り当てられた量子化レベ
ルに加えられる。図26では、レート制御式コーディン
グプロセスは、ステップ700 で開始してから、ステップ
702 でi=1を設定することによって、n マクロブロック
の第1 集合をマクロブロックの現在の集合として指定す
る。ステップ704 では、マクロブロックの各集合MB
(i)の再エンコードで使用される、ビット予想数の完
全な集合、EB(i)をロードする。それから、MB(I) は
ステップ706で再エンコードされ、実際に作成されたビ
ットの数がGB(i)として記憶される。作成済みビット
GB(i)、予想ビットEB(i)の間のパーセンテージ差
は、ステップ708 で予想率、PB(i)=GB(i)/EB
(i)として計算される。さらに、システムは、累積ビ
ットの予想数EB' (i)、累積作成ビット数、GB'
(i)をマクロブロックのすべてお再エンコードされた
集合に対して計算することが可能で、この場合、EB'(1)
=EB(1)、GB'(1)=GB(1)、EB' (i)=EB'(i-1)+EB
(i)およびi>2の場合、BG'(1)=GB'(i-1)+GB
(i)である。したがって、PB(i)/EB'(i)を使用
することによって、説明されたステップ708 の代替策と
して、PB(i)は、累積ビット予想数EB' (i)および
累積作成ビット数GB' (i)を使用して計算できる。こ
れは、マクロブロックのある特定の集合がどれほど正確
にエンコードされたのかを示す代わりに、全体としての
再エンコードプロセスがどのようにターゲットビット数
を満たしているのかのより正確な表示となる。ステップ
710 では、概算率が使用され、マクロブロックの次の集
合、MB( i+1) 内のq-レベルの訂正係数を判断する。
【0218】この訂正係数は、2 通りの方法の内の1 つ
を使用して求められる。第1 の訂正係数決定方法は、割
合ルックアップテーブルと呼ばれる割合値のテーブル内
の率の単純並べ替え済みリストを進み、どの2 つの割合
オ間に概算率が該当するのかを判断する。テーブル内の
2 つの数の大きい方のインデックスj は、訂正係数イン
デックスとして使用される。訂正係数インデックスは、
テーブル内のj 番目の要素を訂正係数として選択するこ
とにより訂正係数テーブル内で訂正係数△(i)を探す
ために使用され、マクロブロックの次の集合は△(i)
によって調整される。割合ルックアップテーブル、RTに
は、例えば、以下のような並べ替えられた値が指定され RT={0.85,0.90,0.95,1.0,1.05,1.10,1.15,1.2,1.5
} 訂正係数テーブルCTには、以下の値が指定される。
【0219】CT={-3,-2,-1,0,1,2,3,4,9}. 図30は、概算率を使用して訂正係数インデックスを割
合ルックアップテーブルから求めるプロセスを説明する
フローチャートである。ブロック図のためだけに、PB
(i)=0.87であると想定する。インデックスj は、当
初、ステップ722で設定される。PB(i)をRT(j) に比
較するプロセスが開始し、前記ルックアップテーブルに
定義されるように、ステップ724 では、PB( i)=0.87が
RT(1)=0.85に比較される。0.87が0.85を上回る場合、プ
ロセスはステップ726 に続く。ステップ726 で残りのイ
ンデックスがあると判断されているので、制御はステッ
プ728 に渡され、j は1 増分される。ステップ724 に戻
ると、PB (i)=0.87 は現在RT(2)=0.90であるため、制
御は、訂正係数インデックスの検索を終了するステップ
730 に渡される。
【0220】図31は、テーブルヘのインデックスが指
定されるルックアップテーブル内で値を捜し出す方法を
説明するフローチャートである。図31では、第1 の方
法に従って訂正係数を求めるために、2 であるインデッ
クスj が使用され、CT内の対応するエントリを捜し出
す。CT内の第2 位置から読み取ると、訂正係数は、ステ
ップ736 で-2であると判断される。したがって、MB(I+
1) のq-レベルは-2で変更される。同様に、PB(i)=1.
12 の場合、インデックス7 はPB(i)より大きいRT内
の最初の入力に対応するため、7 番目の位置にあるCTの
訂正係数は3 である。したがって、MB(i+1)のq-レベ
ルは3 を追加することによって、例えば3 をMB (i+
1)に加算することにより変更される。
【0221】第2 の訂正係数決定方法では、再エンコー
ドされたマクロブロックの集合のパーセンテージが訂正
係数を求める際に第2 パラメータとして使用される点を
除き、第1 方法に類似したプロセスを使用する。さら
に、テーブルから訂正係数を読み取る代わりに、訂正係
数はマトリックスから読み取られる。再エンコードされ
たマクロブロックの集合のパーセンテージ、または再エ
ンコードされていないマクロブロックの集合のパーセン
テージを使用することにより、フレームの列の最初でよ
り漸進的な訂正を加え、必要なら、最後でより著しい訂
正を加えることができる。これによって、システムは量
子化モデルと実際に作成されたビット数の間の変動をよ
り正確に訂正できるようになる。再エンコードされずに
残っているマクロブロックの集合の数と訂正の意義の間
の反転関係を使用し、マクロ部アロックのある集合内で
の過剰予想がマクロブロックの別の集合での過少予想に
より相殺されると仮定すれば、不必要な訂正は回避され
る。
【0222】第2 訂正係数方法の訂正係数マトリックス
CTM の例として、CTM が以下のように定義されると想定
する。
【0223】 −1 −1 0 0 0 1 1 2 4 CTM= −2 −1 0 0 0 1 1 2 5 : : −3 −2 −1 0 1 2 3 4 8 −3 −2 −1 0 1 2 3 4 9 フレームの列の最初で、概算比が必要なビット数の過剰
評価を示す場合、すべての未使用のビットをただちに次
のスライスに割り当てし直す必要はない。未使用のビッ
トがただちにMB(i+1)によって消費された場合、k i
+1の場合、予想以上のビットを消費するMB(k) により、
MB(k+1) は強制的に不必要にさらに高い量子化レベルに
引き上げられるだろう。未使用のビットは、必要とさ
れ、MB(k)によって使用されるまで、再エンコードプロ
セスでMB(i)から前方に運ばれる。
【0224】図32は、概算比および残っている再エン
コードされていないマクロブロックの集合の数の両方を
使用して訂正係数がどのように計算されるのかを説明す
るフローチャートである。必要となるビット数の過剰評
価のケース、つまり訂正係数j PB(i)=0.87 の場合に
2 に等しいと以前に判断した場合、図32のステップ74
4 過剰評価が再エンコードプロセスの最初のパーセント
デ発生するかどうか判断する。CTM の(2,1) での要素は
-1であり、したがって訂正係数として選択される。これ
により、第1 方法では-2がであった再エンコードプロセ
スの初期に訂正効果は鈍る。しかし、再エンコードプロ
セスの99パーセントは実行され、概算比がPB(i)=1.
12である場合、3 である要素(9,77)が選択されるの
で、再エンコードプロセスの最後で完全に訂正する。
【0225】図27A-27C に戻ると、q-レベルが事前に
割り当てられたフレームがある集合内のマクロブロック
の数が1 つのスライスの中のマクロブロックの数に等し
い別の例として説明される。ビットの概算数EB(i)が
前述のように計算され、図27A MB(i)、マクロブロ
ックiのレート制御プロセスで使用されるメモリの中に
ロードされてから、MB(i)が実際に再エンコードされ
る。作成ビット数、GB(i)が求められ、概算比が計算
され、訂正係数捜し出される。図27B に示されるよう
に、それからMB(i+1) は△(i)によって訂正され、
プロセスはMB(i+1) のために繰り返される。図27C
には、MB(i+1) が概算され、計算され、その概算比が
求められた後のMB(i+2) の変化が示される。このプロ
セスは、すべてのマクロブロックおよび部分的なマクロ
ブロックが再エンコードされ、訂正されるまで続行され
る。
【0226】図27A および27D を参照して別の例が示
される。この例では、集合あたりのマクロブロック数
は、2 つのスライスの仲のマクロブロックの数である。
EB(i)、GB( i)、およびPB(i)を計算した後で、
2 つのスライスを構成するMB(i+1) のマクロブロック
は、図27D に説明されるように、△(i)により訂正
される。この再エンコードおよび訂正プロセスは、すべ
てのマクロブロックが再エンコードされるまで以前の例
で続行される。
【0227】再エンコードプロセスにより生じる変更
は、図28A および図28B に説明される。フレームN
の2 つの等しい面積の領域である領域A と領域B は、当
初ほぼ等しい数のビットを使用してエンコードされる。
ユーザは、領域A の品質が劣化され、領域B の品質が向
上されなければならないと指定する。しかし、元のエン
コードに使用されたビット数が再エンコードのビット数
にできる限り近くなるようにすることが望ましい。フレ
ームN を再エンコードした後、フレームN には元のエン
コードから作成された同じバイト数が格納されるが、領
域A はより少ない数のビットでコーディングされ、領域
B は追加ビットを使用する。これにより、ユーザが要求
したように、領域A の品質は劣化し、領域B の品質は向
上する。本発明のレート制御プロセスでは、レート量子
化関数を使用して求められた概算数でのマイナーな誤差
を訂正することにより、フレームの再エンコードされた
ビット数はできる限り元のビット数に近づけられる。
【0228】図29では、複数のフレームからのビット
を割当てし直し、それらを第2 の複数のフレームに与え
ることにより、デジタルビデオストリームに加えられる
変更を説明する。個々のフレーム面積は変化しても、フ
レームの集合の総面積は同じままでなければならない。
レート制御装置により、複数のフレームの再エンコード
のビット数は、ビット概算数を求めるために使用される
レート量子化関数がわずかに間違っていても、元のエン
コードからのビット数と同じになるように微調整できる
ようになる。
【0229】B. 編集ポイントで復号化人為構造を回避
しながら再エンコードする 1. 最初にエンコードしたときに使用された状態にエン
コーダを復元する 前述の時間的品質編集動作および空間品質編集動作は、
ビデオ品質を新規量子化値でビデオを再エンコードする
ことによって変更できるようにする。ただし、再エンコ
ードされたビデオを単にオリジナルビデオに代入するだ
けでは、ビデオの編集ポイントでの可視グリッチとして
出現する受け入れられない復号化人為構造が生じる場合
がある。これらの可視グリッチは、代入されている新規
セグメントにMPEG-2構文のような適切な構文が設定さ
れ、編集境界でのバッファ制約事項が満たされていても
発生する。問題は、編集セグメントの前に来る最後の基
準フレーム(最後のP-フレーム)および編集セグメント
の最後にある別の基準フレーム(最後のP-フレーム)の
非可用性の結果生じる。これにより、編集セグメントの
最初にあるB-フレームの第1 集合と編集セグメント直後
B フレームの第1 集合のエンコードと復号化の間に格差
が生じる。
【0230】デジタルエンコード圧縮ビデオの編集を適
切に実行するためには、まず、希望の編集ポイントに対
応するエンコードビットストリームの適切な位置を決定
する必要がある。このプロセスは、エンコードされたビ
デオにアクセスするためのユーティリティを説明する第
VI項に前述された。前述するように、これは、問題のピ
クチャのビットオフセットを求めるために、既にエンコ
ードされたフレームのそれぞれい使用されるビット数を
合計することで実行される。代わりに、エンコードされ
たビットストリーム内のある特定のフレームや期間の厳
密なロケーションを示す情報を維持するために、ディレ
クトリも使用できる。
【0231】今度は図33A-33E を見ると、本発明の動
作を説明するための例として使用されるビデオの期間が
ブロック図されている。図33A では、エンコードされ
たビデオの元のセクション0 がブロック図される。エン
コードされた期間5 m 0sから10m 0s(5 分、ゼロ秒から
10分、ゼロ秒まで)を別のビデオセクションで置き換え
ることが希望される。図33B では、図33A のエンコ
ードされたビデオに代入しなければならない未エンコー
ドビデオの新しいセクションがブロック図される。図3
3B および33C の破線は、未エンコードビデオを表すの
に使用され、図33A 、33D よび33E の実線はエンコー
ドされたビデオを示すのに使用される。
【0232】図33B に示される新しいビデオのセクシ
ョンだけが、GOP が以前のGOP を参照する標準MPEG-2を
使用してエンコードされ、図33A に示されるビデオに
代入される場合、復号化人為構造が、MPEG-2ビデオ圧縮
で使用される双方向復号化に必要な正確な基準フレーム
が欠如しているため、編集ポイント5m 0s と10m 0sで存
在するだろう。GOP の始まりは以前のGOP に戻って参照
するが、GOP の最後は次のGOP に進んで参照しないとい
う事実のため、この問題は本発明により違うように処理
される5 分ポイントおよび10分ポイントの両方で存在す
る。
【0233】復号化人為構造をGOP の始まりで防ぐに
は、GOP の最初の2 つのB-フレームの基準フレームとし
て使用される先行するGOP の最後のP-フレームを作成し
直すことである。これは、例えば、オリジナルビデオの
1 つのGOP を挿入対象のビデオの始めに格納することに
より達成され、この追加されたビデオは図1 の4 m 58.
5s から4 m 59s に示される。例では、GOP の他の期間
も可能ではあるが、あるGOP は1 秒の2 分の1 に等し
い。エンコーダは、4m 59sの直前にGOP の最後のP-フレ
ームを作成するために、元のエンコードに使用される同
じ量子化値でこのセクションに関して再実行される。最
後のP-フレームを除く、ビデオのこの短いセクションの
再エンコードの結果生じるすべての情報は廃棄されるこ
とがある。
【0234】編集セグメントの最後での復号化人為構造
を防ぐために、オリジナルビデオの1 秒という期間(例
えば、図33C の10 m 0s から10m 1s)が置換される新
規ビデオの最後に付加され、この1 秒セグメントは、元
のエンコードの間に使用されたのと同じ量子化値を使用
してエンコードされる。この1 秒期間がビデオの最後に
付加されなかった場合、10m 0sマーク直後の2 つのB-ピ
クチャは、10m 0sは2つのGOP の間の分割ポイントであ
ると仮定し、編集の前と編集の後で異なる基準ピクチャ
に戻って参照する。例は、ビデオの2 分の1 秒期間また
は1 秒期間の新規セクションへの付加として説明した
が、概念はGOP の付加に一般化できる。
【0235】現在では、最後にある編集ポイントが10m
1sポイントであるため、復号化人為構造は10分マークで
は出現しなくなるが、人は復号化人為構造が10m 1sで生
じるかどうかを考慮しなければならない。10m 1sマーク
直後の2 つのB-フレームが、それらが以前に参照した本
質的に同じ基準フレームに戻って参照するため、可視復
号化人為構造は生じない。10m 0sマーク直後の2 つのB-
フレームが、それらが過去に参照した同じ基準フレーム
に戻って参照しなくても、2 つのB-フレームは再エンコ
ードされていたため、適切に新しい基準フレームに戻っ
て参照する。したがって、可視復号化人為構造は10m 0s
ポイントまたは10m 1sポイントでは存在しない。
【0236】図33の最後に追加された2 つのGOP (1
秒)は、最後のP-フレームが元のエンコードにほぼ同等
となるのに十分な時間でなければならない。10分ポイン
トの後のオリジナルビデオを再エンコードするときにま
ったく同じ量子化値が使用されることが保証できる場合
には、1GOP(2 分の1 秒)で正確にエンコードされた基
準ピクチャを適切に作成するのに十分であるはずであ
る。ただし、適正な品質を保証するためには、2 つのGO
P が好ましい。最初に使用されたのと同じ量子化値を使
用することが希望されても、実際には、元の量子化値か
らマイナーな偏差が生じうる場合があるため、2 つのGO
P が望ましい。
【0237】4m 58.5sから4m 59sおよび10m 0sから10m
1sまで使用されるビデオの元の期間に加えて、図33C
は、4m 59sから5m 0s までの追加オリジナルビデオを示
している。このビデオは復号化人為構造の防止には必須
ではないため、最後のP-フレームを決定するための2 分
の1 秒が5m 0s マークの直前(例えば4m 59.5sから5m0s
まで)に使用できる。ただし、4m 59sから5m 0s 期間
は、オペレータによる、品質の手動変更が編集境界を超
えて影響したという認知の機会を排除するために新規ビ
デオに付加される。この誤認は、MPEG GOPの最初でのフ
レームのコーディング順序はIBB だが、フレームはBBI
として表示されるという事実のためである。1 秒期間
は、その期間の元のエンコードの間に使用されたのと同
じ量子化値を使用してエンコードされる。以前使用され
た量子化値を得る方法を以下に説明する。1 秒期間が4m
59sから5m 0s に付加されないと、図33D にブロック
図される代わりのエンコードされたビデオは、5m 0s で
開始するだろう。
【0238】図33C のビデオをエンコードした結果生
じる有効なデータは、4m 59sから10m 1sまで実行する代
替データS として図33D に氏得される。それから、こ
の代替データS は、図33E に示すような最終ビットス
トリームを結果的に生じさせる図33A にブロック図さ
れる元のエンコードされたデータに代入される。
【0239】図33A に示されるエンコードされていな
い情報およびエンコードされた情報は、実施例のビデオ
であるが、エンコードされた情報を復号化するために、
以前のまたは以降の、あるいはその両方の情報を使用す
るオーディオまたはその他の種類の情報となる場合があ
る。
【0240】図33B のビデオの新しいセクションは、
任意のビデオソースから得られ、前記の時間的編集プロ
セスまたは空間編集プロセスによって作成されるビデオ
である可能性がある。4m 59sから5m 0s までおよび10m
0sから10m 1sまでの図33Cのオリジナルビデオは、元
のエンコードに使用されたのと同じ量子化値が設定され
るオリジナルビデオである。図33C の新しいビデオN
の両端にあるこのビデオは、時間的編集プロセスを使用
し、最後のセクションの品質を、時間的手動編集の項に
説明した保護つきに設定するだけで得られ、量子化値が
同じで留まる必要があることを示す。代わりに、図33
A のビデオは、図33A のビデオに関係なく完了され、
異なった長さとなる場合がある。さらに、ビデオのセク
ションをカットアウトし、新しいビデオを付加しないた
めに本発明を使用することもできる。この場合、図33
B にビデオは存在せず、「N 」セグメントとその対応す
るエンコードは、図33C-33E には記載されていない。
編集セグメントの前の最後のP-フレームが適切に構築さ
れ、オリジナルビデオの2 分の1 秒から1 秒の(1つま
たは2 つのGOP)がエンコードされるべき新しいビデオの
最後に付加され、元のエンコードで使用された同じ量子
化スケールでエンコードされる限り、可視復号化人為構
造はどのような状況でも発生しない。
【0241】図34は、図33A-33E に関して記述され
るプロセスを説明するフローチャートである。開始後、
ステップ780 で、ビデオは圧縮フォーマットにエンコー
ドされ、図33A に示されるエンコードされたビデオが
作成される。ステップ782 では、エンコードされたビデ
オに代入されなければならないエンコードされていない
フォーマットのビデオの新しいセクションが決定され
る。ビデオのこの新しいセクションは、図33B と33C
でN として示され、オリジナルフレームに関連する、オ
リジナルフレームに関連しない、またはオリジナルフレ
ームとは異なった期間がセ設定される場面を表すことが
ある。置換されるビデオの開始ポイントおよび終了ポイ
ントは、それぞれ5m 0s と10m 0sである。ただし、置換
対象の最終エンコードの実際の開始ポイントおよび最終
ポイントは、図33D にブロック図されるように異なっ
ている場合がある。
【0242】ステップ784 では、編集ポイント5m 0s お
よび10m 0sでの復号化人為構造を防止するために、前記
の理由からエンコードされていないビデオの期間をビデ
オのエンコードされた新しいセクションの最後に付加す
る。これらの付加された期間は4m 59sから5m 0s および
10m 0sから10m 1sまでである。ただし、4m 59sから5m0s
までの期間は必須ではない。
【0243】ステップ786 では、編集ポイントの直前の
Pーフレームを決定する。図33E で置換されるビデオは
4m 50sから10m 1sなので、4m 50sの直前の最後のP-フレ
ームを突き止める必要がある。このP-フレームは、4m 5
8.5sから4m 50sまでの期間のためのエンコーダを、P-フ
レームを最初にエンコードするために使用された量子化
値で実行することにより決定される。量子化値は、図1
0A または図10B のどちらかに示されるフォーマットを
持つマクロブロックログファイルから元の量子化値を検
索することにより求められる。ただし、映画全体の各マ
クロブロックの量子化値は、大量の記憶領域容量を消費
するので、量子化値を記憶するのは望ましくない場合が
ある。代替策として、量子化値を、I フレーム、P フレ
ーム、およびB フレーム用ビデオバッファ、allocated_
bit として図9Bにピクチャレイヤログファイルに図示
されるピクチャのターゲットビット、図9Cにmean_acti
vity として記憶されるピクチャの活動レベル、および
エンコードの間にエンコーダにより計算されるマクロブ
ロックの活動レベルに関するレート制御ステータスを使
用して単に作り出すことができる。レート制御ステータ
スは、それぞれI ビデオバッファ、P ビデオバッファ、
およびB ビデオバッファのレート制御ステータス情報を
記憶する、図9Cの底部でS1_ i、S2_ i、S1_ p、S2_
p、S1_b、およびS2_bとしてブロック図されるピクチャ
レイヤログファイルに記憶される。ビデオエンコード技
術の当業者は、本明細書に記載される教示に基づき、過
度の実験を行わないで希望のP-フレームの量子化値を求
めることができるだろう。
【0244】基準フレームの量子化値またはエンコード
された基準フレーム自体を求める代わりの方法として、
エンコードされた基準ストリーム内の基準フレームのエ
ンコードバージョンは既知の方法で複合化できる。さら
に、必要とされる基準フレームを得るそれ以外の方法も
実行できる。
【0245】基準P-フレームが得られた後、ビデオは、
最後のセクションの元のエンコードと同じ量子化レベル
を維持しながら、ステップ788 でエンコードされる。量
子化レベルは、前述のように得られる。結果として生じ
るエンコードされたビデオは、図33D に示される。
【0246】それから、ステップ790 で、新規にエンコ
ードされたビデオを最初にエンコードされたビデオに代
入し、図33E に説明するように、最終製品が得られ
る。置換されたエンコードされたビデオを含むこのエン
コードされたビデオには、編集ポイントで最小の復号化
人為構造がある。
【0247】2. ピクチャのグループの閉鎖モードでの
再エンコード 図33A-34に説明される手順の代替策として、復号化人
為構造を低減しつつも新しいビデオの始まりのエンコー
ドのために別の手順を実行できる。この手順では、ビデ
オの立ち下がり端を処理する方法は、図33A-34に関し
て前記と同じである。
【0248】この代替実施例の例として、図33A を元
のエンコードされたビデオとして、図33B を図33A
に代入されなければならないエンコードされていないビ
デオとして使用する。元のエンコードされていないビデ
オは図33B の始まり縁で追加されず、図33C に記述
されるように、対応する元のエンコードされていないビ
デオの2 つのGOP (1 秒)は、図33B の最後に追加さ
れ、エンコードされるべきビデオは図35A に示される
通りである。
【0249】エンコーダが、第2 基準ピクチャのないB-
フレームのビットを増加させながら、図35A のビデオ
をGOP 閉鎖モードでビデオの第1GOPのためにエンコード
すると、開始編集ポイントでの可視復号化人為構造は排
除される。10m 0sから10m 1sまでの元のエンコードに使
用されたのと同じ量子化レベルを使用する最後の部分の
エンコードは、図33A-34に関して前述されるのと同じ
であり、その結果生じるエンコードビデオは図35B に
ブロック図される。GOP 閉鎖モードは、第6.3.8 項での
MPEG規格に説明される。ピクチャのグループの閉鎖モー
ドフラグは1 にセットされ、エンコードされたB-フレー
ムが、逆方向予測だけを使用してエンコードされ、以前
のGOP の基準フレームが使用されていないことを示す。
しかし、双方向フレームに通常使用される基準フレーム
の内の1 つが使用できないため、引き下げられた品質を
排除するために手順が実行されない限り、B-フレーム
は、品質を劣化させてしまうだろう。
【0250】GOP 閉鎖モードでのB-フレームの品質劣化
の問題を解決するために、単一方向だけの予測が設定さ
れるB-フレームのビット数は、フレームの品質が大幅に
引き下げられないように増加される。B-フレームには単
一方向だけの予測が設定されているので、ビット数は、
ほぼ通常のP-フレームに使用されるビット数に増加する
のが好ましい。ただし、ビット数は、希望される画質に
応じて変化する。
【0251】図35B のエンコードされたのビデオは、
図35C でブロック図されるように、既にエンコードさ
れたビデオに直接代入できる。
【0252】GOP 閉鎖モードを使用するプロセスを説明
するフローチャートは、図36に示される。図36で
は、ビデオはステップ800 での圧縮フォーマットにエン
コードされ、エンコードされたビデオに代入される必要
があるビデオの新しいセクションは、ステップ780 と78
2 に関して記述されるのと類似した方法でステップ802
で決定される。次に、ステップ804 では、必要に応じ
て、エンコードされていないオリジナルビデオのGOP
(1 つまたは2 つのGOP )を、ビデオの新しいセクショ
ンの立ち下がり端に付加する。
【0253】それから、ステップ786 でビデオをエンコ
ードする。新しいビデオの第1GOPは、ピクチャのグルー
プの閉鎖モードでエンコードされ、基準フレームを見失
った双方向に予測されるフレームのビット数が、ほぼ単
一方向予想フレームであるP-フレームに使用されるビッ
ト数に増加される。エンコードされたビデオのビット総
数が同じままとなる場合、二方向フレームに必要となる
余分なビットは他のフレームから削除されなければなら
ない。これは、空間手動編集または時間的手動編集、あ
るいはその両方についての項に前述するように達成され
る。次に、ビデオの新しいセクションの残りは普通にエ
ンコードされる。最後に、新規ビデオの立ち下がり端で
付加された期間は、編集セグメントの終了ポイントでの
復号化人為構造を防ぐために、追加された期間の元のエ
ンコードの間に使用されたのと同じ量子化値を使用し
て、エンコードされる。最後に、新規にエンコードされ
たビデオが、ステップ808 で最初にエンコードされたビ
デオに代入される。
【0254】前述のプロセス、および図34と36にブロ
ック図されたプロセスのいずれかによって、代わりのエ
ンコードされたセクションを含むエンコードされたビデ
オの最終バージョンでは、復号化人為構造の数が低減さ
れるため、可視ビデオグリッチは減少し、復号化人為構
造を防ぐためになんの訂正処置も講じられない場合と比
較してビデオの品質が向上する。前記を説明する例は、
GOP の境界での編集ポイントに関係する。ただし、前記
教示は、GOP 境界にない編集にも適用できる。
【0255】復号化人為構造を低減するプロセスは、再
生VTR51 およびビデオエンコーダ50とともに、ワークス
テーション10、30、および40を使用して実行される。し
かし、それ以外のハードウェア代替策も可能であり、発
明の前述した面は、プロセスを実行するために、任意の
汎用コンピュータまたは特定のハードウェアを使用して
実現できる。編集ポイントを決定するため、およびエン
コードされるべきビデオの新規セクションの最後に付加
されるビデオを決定するために使用される計算は、ワー
クステーション10またはワークステーション30のどちら
かで実行される。
【0256】IX. エンコードに使用されるレート量
子化モデリング エンコードプロセスから生じるマクロブロックの列を表
すのに必要とされるビット数を正確に概算するために、
フレームは、フレームの標準量子化レベルを表す複数の
量子化レベルを使用して事前にエンコードできる。それ
から、フレームは、他の量子化レベルだけではなく、代
表的な量子化レベルを使用して実際にエンコードでき
る。図1Aに示される実施例では、ワークステーション1
0は事前に決定された量子化レベルをビデオエンコード
装置50にロードする。それから、ビデオエンコード装置
50は、事前エンコードを実行する。量子化モデルを作成
するもっとも正確な方法では、可能な量子化レベルごと
に各フレームをエンコードし、結果として生じる使用ビ
ット数に関する統計を記録することが必要となる。しか
し、このプロセスには、未処理ビデオでのn 会のパスが
必要となる。この場合、n は未処理ビデオのエンコード
に使用される量子化レベルの総数である。この方法はひ
どく長いので、本発明は、従来の方法に要した時間の少
しで最適の方法に類似した結果を作成する改善された方
法となる。方法には、量子化レベルに対する代表的なビ
ットレートを、事前エンコードフェーズの間に複数のフ
レームのそれぞれに計算できるように、複数のフレーム
のさまざまなパーツに異なった量子化レベルを割り当て
ることが必要になる。これにより、正確なビットレート
対量子化レベルの統計を作成しながらも、各フレームの
n-1 の事前エンコードが節約される。それから、これら
の統計を補間し、そのビットレート対量子化レベルが事
前エンコードプロセスで決定されなかったマクロブロッ
クによって使用されるビット数を概算する。2 つの代替
実施例では、方法は未処理ビデオまたは未処理ビデオの
すべてのフレームから過半数のフレームを事前エンコー
ドする。
【0257】図37A には、2 ポイントビットレート対
量子化レベル線が複数のフレームに作成され、結果が複
数のフレームに記憶されるように、事前エンコードプロ
セス内でマクロブロックに基づいて2 つの異なった量子
化レベルをマクロブロックに割り当てられる未処理ビデ
オのフレームが示される。代替例では、量子化レベル
は、マクログループのグループまたはストリップで割り
当てられる。図37B では、量子化レベルが、位置に基
づく統計上の異常を回避するために、フレーム内のさま
ざまな場所に割り当てられるフレームでの4 つの量子化
レベルの均一な分配を説明する。図示されたフレームで
は、各行のj 、行内の最初の量子化レベルは、qj mod4
である。この結果、4 ポイントビットレート対量子化レ
ベルの曲線が生じる。図37C では、図37B と同じプ
ロセスが示されるが、量子化レベルはブロック様式で割
り当てられている。このプロセスのシングルパスは正確
なビットレート対量子化レベル曲線を作り出すが、代替
実施例では、このプロセスは、量子化レベルごとに各フ
レームを分析することによって収集される統計に近づく
さらに正確な統計を作成するために、複数のフレームで
何度も繰り返される。
【0258】図38では、複数のフレームの量子化レベ
ル対ビットレート特性を決定する一般的なプロセスを説
明する。プロセスはステップ850 で開始し、事前エンコ
ードされる未処理ビデオを表すビデオ信号を獲得するこ
とにより、ステップ852 で続行する。ステップ854 で
は、プロセスは、第1 フレーム、iがフレームインデッ
クスであるところのi=1 が事前エンコードされなければ
ならないことを示す。ステップ856 に続けると、フレー
ムi=1 の量子化レベルは、統計学上の異常を防止するた
めにフレームで均一に割り当てられる。ステップ858 で
は、フレームi=1は、ステップ856 で割り当てられる量
子化レベルを使用して事前エンコードされる。ステップ
858 の結果は、ステップ856 で割り当てられる量子化レ
ベルごとのビットレートがフレームi=1 に記録されるよ
うに、ステップ860 で求められる。ステップ862 では、
方法が、複数のフレームのすべてが事前にエンコードさ
れているかどうかを判断する。事前にエンコードされて
いたフレームは1 つだけであったので、プロセスは、フ
レームインデックスiに1を加算してエンコードされる
べきフレームとして第2 フレームを指定するステップ86
6 まで続く。それから、制御は、量子化レベルをフレー
ムi=2に割り当てるステップ856 に戻される。ステップ
856 、858 、860 、および862 で割り当て、事前にエン
コードし、ビットレートを決定するプロセスは、すべて
の残りのフレームについて続行される。ステップ862
で、複数のフレームのすべてが事前にエンコードされて
いたと判断される場合、プロセスはステップ864 に移動
することにより終了する。ステップ864 到達すると、ビ
ットレート対量子化レベル曲線は、ステップ856 で割り
当てられる量子化レベルおよびその対応するビットレー
トを使用することにより、近似される。
【0259】未処理ビデオの複数のフレームにビットレ
ート対量子化レベル曲線を作成したので、事前エンコー
ドプロセスは、未処理ビデオの一部がデジタル記憶装置
媒体、つまりコンパクトディスクに適合するようにエン
コードされるエンコードプロセスに移動する。未処理ビ
デオセグメントの1 つ、複数、過半数またはすべてが、
この第2 フェーズでエンコードされる。未処理ビデオセ
グメントを自動的にエンコードする必要がある場合は、
エンコーダは、セグメント内の各フレームのマクロブロ
ックに割り当てられる量子化レベルを決定するために、
対応するビットレート対量子化レベル曲線と結び付いた
各マクロブロックの活動基準を使用する。それから、セ
グメントの各フレームがエンコードされ、その結果とし
て生じるビット数は、割り当てられた量子化レベルに基
づいてビット概算数と比較される。結果として生じるビ
ット数がビット予測数から大きく異なる場合、自動エン
コーダは、エンコードされるマクロブロックの次の集合
の量子化レベルを変更することによって、変動を補償し
ようと試みる。この連続プロセスにより、自動エンコー
ダはターゲットビット数に一致するように未処理ビデオ
全体のセグメントをエンコードする。
【0260】さらに、ビデオシーケンスのもっと後のフ
レームのビットレート対量子化レベル曲線は、結果とし
て生じるエンコードされたデジタルビデオを通して品質
を調整する場合に使用できる。図39に図示されるよう
に、フレームN は同じ量子化レベルにフレームM より少
ないビットを作成すると知られている。したがって、フ
レームM は、フレームN 内と同じ品質の画像を作成する
ためにはさらに多くのビットを必要とする。フレームN
がそのすべての割り当てられたビットを使用しないで希
望の品質でエンコードされると、エンコーダは、同じ品
質のために、ユニット時間あたりさらに多くのビットを
必要とするフレームM をエンコードする際に使用される
余分なビットを前方に運ぶことができる。この機能は、
M+N>1 の場合にフレーム先読みバッファが1 つしかない
システムでは利用できない。
【0261】X. データ構造を使用して、オーディオ、
ビデオ、およびサブピクチャのデジタル信号を結合する 本特許明細書の前記部分は、おもに、エンコード圧縮デ
ジタルオーディオ映像信号を作成するために、オーディ
オ映像情報のエンコードの間に使用される技法に関す
る。しかし、オーディオ情報およびビデオ情報が結合、
記憶、およびテレビの上などで、オーディオ映像情報を
作成し直す、または構築し直すために後で復号化される
ためには、オーディオ情報、ビデオ情報、およびそれ以
外の記憶され、後で復号化できるようにエンコードされ
ていた情報を結合し、インタリーブする必要がある。オ
ーディオ情報、視覚情報、およびそれ以外の情報の結合
は、図1Aに図示されるワークステーション20で発生す
るフォーマットプロセスとして、前記に簡略に説明し
た。フォーマットプロセスならびに結果として生じるデ
ータ構造および信号について、ここで詳しく説明する。
【0262】ここで図1Aを見ると、MPEGビデオおよび
エンコードされたオーディオはディスク21に記憶され
る。さらに、ビデオの上に表示またはオーバレイあるい
はその両方を行われる字幕または図形表記、あるいはそ
の両方を含むサブピクチャ情報は、例えば、別個のワー
クステーションにより初期にエンコードされ、エンコー
ドされたサブピクチャ情報は、フロッピーディスク、テ
ープまたはその他の種類のディスクのようなデジタル記
憶装置媒体に記憶される。この記憶されたサブピクチャ
情報は、デジタル記憶装置22の内の1 つにより読み取ら
れ、フォーマットプロセスでディスク21内のエンコード
されたオーディオとビデオと結合され、ワークステーシ
ョン20により1 つのデータストリームにフォーマットさ
れる。フォーマットプロセスの出力は、ディスク21に記
憶されてから、デジタル記憶装置22のデジタルテープに
書き込まれる。それから、テープは既知の光ディスク製
造法により光ディスクを作成するために使用される。し
たがって、本発明は、オーディオおよび視覚データのエ
ンコードに関係するだけではなく、エンコードデータ、
オーディオデータ、ビデオデータおよびサブピクチャデ
ータを1 つのデータストリーム、デジタル記憶装置媒体
およびフォーマットされたオーディオ情報、ビデオ情
報、およびサブピクチャ情報を記憶するその上でのデー
タ構造に結合するためのプロセスおよびシステムに関
し、復号化プロセスおよびユーザまたは消費者に表示す
るためにオーディオ情報、ビデオ情報およびサブピクチ
ャ情報を分離し、再構築するデコーダにも関する。光デ
ィスク上またはフォーマットされたデータ内でのデータ
構造が、メモリ内に記憶される情報の物理的な編成を分
け与える特殊電子構造要素に関係することを注記すべき
である。これらの特殊電子構造要素は、ビデオオンデマ
ンドシステムに使用できるまたはデジタルビデオディス
クプレーヤを使用してユーザまたは消費者のために復号
化される光ディスク内に記憶される。
【0263】エンコードされたのオーディオ映像情報用
のディスクまたはそれ以外の記憶装置媒体のフォーマッ
ト構造の特定な特徴を説明する前に、本発明により改善
される既知の規格について説明する。ISO/IEC 13818-1
は、そこに引用される参考とともに、参照により本明細
書に取り入れられるMPEGビデオおよびオーディオのシス
テム面を記述する。これ以降MPEGシステム説明と呼ばれ
るISO/IEC 13818-1 は、ビデオストリームおよびオーデ
ィオストリームの基本的な多重化アプローチを説明す
る。これらのストリームは、パケット化基本ストリーム
(PES )パケットと呼ばれるパケットに分割される。ま
た、MPEGシステム説明には、1 つ以上の独立したタイム
ベースのある1 つ以上のプログラムを1 つのストリーム
に結合する移送ストリームの使用についても説明され
る。MPEGシステム説明は、複数の基本ストリームを同期
させるために使用されるプレゼンテーション時刻記録
(PTS )の使用について説明する。時刻記録は、一般的
には90kHz という単位で、システムクロックリファレン
ス(SCR) 、プログラムクロックリファレンス(PCR) 、お
よびオプションの基本ストリームクロックリファレンス
(ESCR)といっしょに使用される。データがMPEGシステム
説明に従い、どのようにフォーマットされるのかについ
ての詳細の完全な説明は、ISO/IEC 13818-1 に記載され
る。
【0264】ISO/IEC 13818-1 に基づいたフォーマット
プロセスを使用するのに加えて、データは、また、ISO
9660, 1988、情報処理−−ボリューム、および本明細書
に参考により取り入れられる情報交換用CD-ROMのファイ
ル構造に従ってフォーマットおよび記憶される。この規
格は、ディスクボリューム(音量ではなく、ディスクの
内容)およびファイル構造がどのように編成されるのか
を記述する。
【0265】オーディオデータ、ビデオデータ、および
サブピクチャデータを記憶するために使用される光ディ
スクの現在の時刻での実施例は、片面あたり5 ギガバイ
トの容量で、総記憶容量10ギガバイトの単層両面ディス
クである。将来のフォーマットでは、記憶容量を増加す
るために多層ディスクを見越し、読み取り専用ディスク
の使用に加えて、追記技術および上書き技術も使用でき
る。本発明とともに使用できるディスクのそれ以外の面
については、1994年9 月13日に提出された「光ディスク
および光ディスク装置」という米国特許明細書08/304,8
48に説明する。ディスクの外径は120 mmであるのが好ま
しい。
【0266】図40では、究極的には光ディスクに具備
されるワークステーション20のフォーマットされた出力
の構造を説明する。この構造900 は、リードイン領域90
2 を含む。リードイン領域にはディスクから読み取られ
るデータのそれ以降の処理を制御する個々のフィールド
が含まれる。リードイン領域900 に記憶される例示的な
引込み情報は、本明細書に参考により取り入れられるク
ックソン(Cookson) その他の米国特許5,400,077 の図3
にブロック図される。
【0267】システム領域904 およびボリューム管理情
報906 はISO 9660に準拠する。ボリューム管理情報906
には、主要なボリューム記述子、ボリューム記述子設定
終止プログラム、ディレクトリレコード、およびパステ
ーブルレコードが含まれる。主要なボリューム記述子に
は、ディスクがビデオディスクであるのか、またはオー
ディオディスクであるのかを示す記述子型、ディスクが
どの規格に準拠しているのかを示す標準識別子、システ
ム識別子、ボリューム識別子、ボリュームサイズ、論理
ブロックサイズ、パステーブルサイズなどのディスクボ
リュームの基本的な情報が記憶される。システムのこれ
らのフィールドおよびそれ以外のフィールド、およびボ
リューム管理情報は、ISO 9660に詳説されているので、
その説明は簡略さを期すために省略される。さらに、希
望する場合には、ISO 9660に準拠する補足ボリューム記
述子もある。
【0268】ボリューム記述子設定終止プログラムに
は、ボリューム記述子型、標準識別子、およびボリュー
ム記述子バージョンが記憶される。ディレクトリレコー
ドには、ISO 9660に従ったディスクのさまざまなディレ
クトリ情報が記憶される。パステーブルレコードには、
ISO 9660に記述されるように、L 型パステーブルおよび
M パステーブルが記憶される。
【0269】ディスク情報ファイル908 は、ディスクの
内容についてのさらなる情報および光ディスクをプレイ
するときにユーザが選択できるメニュー情報にが記憶さ
れる。ディスク情報ファイル908 の詳細は、図41に関
して説明される。
【0270】各ディスクには、最大99データファイルま
で最小1 データファイル910 が格納される。例えば、デ
ィスク上に2 つの異なったオーディオ映像プログラムが
記憶されている場合、ディスク情報ファイル908 には、
ユーザが使用を希望するデータファイルのどれかをユー
ザが選択するためのメニューを作成するのに必要な情報
が記憶される。データファイルは、図42-56 に関連し
て詳説される。リードアウト領域16は、ディスク、処理
がどのように実行されるのかを記述するそれ以外の情
報、または関連するディスクに関する情報が記憶される
ことがある。
【0271】図41は、図40のディスク情報ファイル
908 を説明する。ディスク情報ファイル908 には、ファ
イル管理情報920 およびユーザが対話するメニューを構
成する情報であるメニューデータ922 が格納される。メ
ニューデータは、ビデオデータ、オーディオデータ、お
よびサブピクチャデータを含む。ファイル管理情報920
は、ファイル管理テーブル924 、ディスク構造情報926
、メニュー構造情報928 、および複数オメニューセル
情報フィールド932 と934 が含まれるメニューセル情報
テーブル930 を格納する。
【0272】ファイル管理テーブル924 には、ディスク
情報ファイルのあらゆる面に関する情報が含まれる。フ
ァイル管理テーブル924 内には、ファイル名を識別する
ためのボリューム管理情報906 の対応するディレクトリ
レコード内の対応するファイル識別子と同じ内容を記述
するファイル名が記憶される。論理ブロックの数を使用
してファイルのサイズを記述するフィールドがある。本
明細書全体で、「論理ブロック」という用語は、ISO 96
60に定義されるように使用される。論理ブロック数を使
用するファイル管理テーブルのサイズ、ファイルの先頭
からの相対論理ブロック番号を使用するディスク構造情
報926 の開始アドレス、ファイルの先頭からの相対論理
ブロック番号を使用して記述されるメニュー構造情報92
8 の開始アドレス、ファイルの先頭からの相対論理ブロ
ック番号を使用するメニューセル情報テーブル930 の開
始アドレスを記述するエントリがある。メニューデータ
がない場合は、このフィールドの値はゼロになる。ファ
イルの先頭からの相対論理ブロック番号を使用するメニ
ューデータ922 の開始アドレスを記述するフィールドが
ある。メニューデータが存在しない場合、このエントリ
はゼロである。
【0273】ファイル管理テーブル924 には、メニュー
データ用のビデオのビデオ属性を記述するフィールドも
ある。この情報は、ビデオ圧縮モードがMPEG-1であった
のか、MPEG-2であったのか、ビデオのフレームレート
(毎秒29.97 フレームまたは毎秒25フレームのどちら
か)、表示アスペクト比が3/4 であるか、または9/16で
あるのかを示すフィールド、およびパンスキャンとレタ
ーボックスモードの両方が許可されていることを示す
か、パンスキャンモードがは許可されているが、レター
ボックスモードが禁止されていることを示すか、あるい
はパンスキャンモードが禁止され、レターボックスモー
ドが許可されていることを示すディスプレイモードフィ
ールドを含む。
【0274】ビデオ属性を記述するフィールドと同様
に、ファイル管理テーブル924 のオーディオストリーム
を記述するフィールドもある。このフィールドには、オ
ーディオがドルビーAC-3に従ってエンコードされたのか
どうか、オーディオがMPEGオーディオであるのかどう
か、あるいはオーディオが線形PCM オーディオ(48 kHz
で16ビット)を含むオーディオコーディングモードの表
示が指定される。また、オーディオがモノラル、ステレ
オ、またはデジタルサラウンドであるのかを含むオーデ
ィオコーディングモードの表示も指定される。
【0275】ファイル管理テーブル924 には、さらに、
メニューデータ922 のサブピクチャストリーム属性を記
述するフィールドも入る。このフィールドは、以下に説
明するように、ランレングスサブピクチャコーディング
モードがサブピクチャに使用されることを示す。フィー
ルド管理テーブル924 には、メニューのためのすべての
サブピクチャに使用される16セットのカラーパレットを
記述するフィールドも入る。パレット番号1 から16に
は、輝度信号Y 、カラー差異信号Cr=R-Y、およびカラー
差異信号Cb=B-Yが指定される。
【0276】ディスク構造情報926 には、ディスクに記
憶されるビデオファイルおよびオーディオファイルの構
成情報が含まれる。ディスク構造情報926 には、ファイ
ル名を識別するために使用されるディレクトリレコード
内での対応するファイル識別子と同じ内容を記述するフ
ァイル名が含まれる。ファイルをディスク構造情報ファ
イルとして識別するファイル識別子フィールドがある。
図40に示されるデータファイル910 および914 のよう
なディスク上のデータファイルの数を示すフィールドが
ある。また、ファイルにビデオ情報とオーディオ情報の
両方が記憶されるのか、あるいはオーディオ情報だけが
記憶されるのか、およびアイルがカラオケファイルであ
るかどうかを含むデータファイルのそれぞれのタイプを
示すフィールドもある。
【0277】ディスク構造情報926 には、データファイ
ル内のサブピクチャとオーディオ情報を含むフィールド
も含まれる。このフィールド内には、サブピクチャチャ
ネル数も示される。各サブピクチャチャネルは、異なっ
たサブピクチャ言語のようなさまざまなサブピクチャ情
報を表示する場合に使用できる。また、オーディオスト
リーム数の表示、チャネル番号順の各サブピクチャチャ
ネルの言語コードの表示、オーディオストリーム番号順
のオーディオストリームの言語コードの連続記述、およ
びファイルのパレンタル管理とアングル情報の記述もあ
る。パレンタル管理情報は、表示される情報のある特定
のシーケンスを記述する場合に使用される。パレンタル
管理情報は、シーケンス内に含まれる特定のセルの最大
親レベルである。レベルは、1 から5 で変化し、レベル
が高いほど、見聞きされる内容に対する制限が多くな
る。シーケンスとセル、およびパレンタル管理スキーム
の詳細は、以下に説明する。ビデオシーケンスのアング
ルの数を記述するフィールドもある。例えば、ミュージ
ックビデオに、ミュージックビデオ全体を通して3 つの
異なったカメラビューがある場合、ユーザはどの特定の
カメラアングルを表示に希望するのかを選択できる。ま
た、シーケンス内のプログラム数を示すフィールドもあ
る。
【0278】メニュー構造情報928 には、各メニュータ
イプの開始セル番号が含まれる。ディスプレイシーケン
スには複数のセルがある。例えば、1 つのシーケンスは
最高256 のセルを格納できる。セルは、後述する再生情
報(PBI )パックと次のPBI直前のパックの間のGOP
(ピクチャのグループ)の整数である。ビデオ用データ
は、データを連続して再生する必要があるレコード単位
としてセルの中に分離される。セルには、表示のための
情報が含まれ、その目的に応じて分割される。セル内の
第1 オーディオパックとおよび第1 サブピクチャパック
が、セルの先頭にあるPBI パックの後ろ手記録されるビ
デオヘッドパック中のPTS に近いプレゼンテーション時
刻記録(PTS) を含むのが望ましい。異なったセルは、希
望されるアングルおよびプログラムの親制約に応じて表
示される。例えば、より若年層の視聴者向けには不適切
であった映画のあるセクションがあったと仮定する。表
示できるパレンタル管理レベルに応じて、2 つのシーケ
ンス共用セルが存在する。例えば、制約されていない表
示の場合、ある特定のシーケンスにセル1 、2 、3 、お
よび5 を表示できる。制約レベルの表示の場合は、その
シーケンスに表示されるセルは1 、2 、4 、および5 で
ある場合がある。
【0279】異なったアングルに関しては、同時進行
し、その再生に要する時間が実質上等しい、複数のカメ
ラアングルで各ビデオを記録させることができる。各ア
ングルは、アングルセルと呼ばれる1 つのセルから構成
される。同時に先行する複数のアングルセルの集合が、
アングルブロックと呼ばれる。シーケンス内の複数オロ
ケーションでアングルブロックが限定される場合、各ア
ングル番号のアングルセル数およびカメラアングルは、
アングルブロックを通して同じでなければならない。
【0280】メニューセルとは、ユーザに、ボリューム
内の各ビデオファイルまたはオーディオファイルの内容
を知らせるメニュー画面を構成するセルである。メニュ
ーセルの集合は、メニュー用データとしてディスク情報
ファイルにともに記録される。メニュータイプ共呼ばれ
る、メニューセルタイプは、タイトルメニュー、プログ
ラムメニュー、オーディオメニュー、サブピクチャメニ
ュー、およびアングルメニューに分類される。メニュー
画面には、メニュー用ビデオが備えられる。再生装置の
画面上に表示される選択用アイテムは、メニューセルの
サブピクチャデータとして記録される。
【0281】メニューセル情報テーブル930 は、図41
の932 と934 のような複数のメニューセル情報が記憶さ
れるテーブルである。1 つのメニュー画面に1 つのメニ
ューセルが具備される。メニューセル情報は、複数のフ
ィールドを含む。第1 フィールドは、ディスクの情報の
コピーが許可されているかどうか、パレンタル管理のレ
ベル、メニューがタイトルメニューであるかどうかなど
のメニューセルタイプ、プログラムメニュー、オーディ
オメニュー、サブピクチャメニュー、またはアングルメ
ニューおよびメニューの言語コードを示す。各言語には
コードが割り当てられ、言語コードサブフィールド内に
現れる特殊コードが、メニューと使用される言語を示
す。
【0282】メニュー画面上のサブピクチャによって表
示される選択アイテムの開始番号および選択アイテム数
を記述するフィールドもある。選択アイテム開始番号
は、メニュー画面上の選択アイテムの最小数を記述し、
メニューの次のページが存在するかどうかを示すフィー
ルド、および選択できる1 と16の間のアイテム数を記述
する番号がある。メニューセル情報は、メニューセルの
開始パックのシステムクロックリファレンス(SCR) の下
位32ビット、メニューセルの開始アドレスをファイルの
先頭からの相対論理番号で記述するフィールド、および
メニューセルを構築する論理ブロック数を記述するフィ
ールドも含む。
【0283】メニューデータ922 は、メニューのために
表示される実際の情報を含む。この情報は、図40のデ
ータファイル910 と914 の情報が構築されるのと同じよ
うに構築され、したがって各面の綿密な記述は冗長な記
述を防ぐために省略される。メニュー画面で選択される
アイテムは、サブピクチャ情報で形成される。ディスク
プレーヤによるメニュー選択の処理は、コンピュータコ
ードを実行するマイクロプロセッサを使用して実行され
る。タイトルのためのメニュー選択が行われると、選択
の結果はファイルの最初または選択されたタイトル番号
に対応するシーケンス番号から再生される。プログラム
メニュー選択の場合、選択されたプログラムは選択され
たプログラムの最初から再生される。メニューからのオ
ーディオ選択の場合、オーディオストリームは選択され
たオーディオストリームに対応するように設定される。
同様に、サブピクチャメニュー選択の場合、チャネル番
号は選択されたサブピクチャチャネルに等しく設定され
る。最後に、メニューからのアングル選択は、アングル
セル番号を選択された番号に等しくなるように変更す
る。それ以外の情報は、希望に応じて含まれ、メニュー
を通して選択できる。
【0284】図40のデータファイル910 のようなデー
タファイルには、図42にブロック図されるような2 つ
のセクション、つまりデータファイル管理情報940 およ
びオーディオ情報、ビデオ情報およびサブピクチャ情報
を表示するために使用される実際のデータ942 が記憶さ
れる。データファイル管理情報940 には、4 つの主要な
構成要素、つまりデータファイル管理テーブル944 、シ
ーケンス情報テーブル946 セル情報テーブル948 および
データ検索マップ950 を含む。
【0285】データファイル管理テーブル944 は、デー
タファイル910 の各面に関する情報を含む。この情報に
は、ファイル名を識別するためのディレクトリレコード
内の対応するファイル識別子と同じ内容であるファイル
名のフィールド、オーディオ情報とビデオ情報の両方が
ファイルに記憶されることを示すファイル識別子、論理
ブロック数により定義されるファイルのサイズ、ファイ
ル管理テーブルのサイズ、ファイルのシーケンス番号、
ファイルのセルの数、ディスク構造情報(DSI)ックの
数、シーケンス情報テーブル946 の開始アドレス、セル
情報テーブル948開始アドレス、データ検索マップの開
始アドレス、データ942 の開始アドレス、MPEG-1または
MPEG-2のようなビデオ圧縮モードを含むデータ942 のビ
デオ属性を記述するフィールド、レートが毎秒29.97 フ
レームであるのか、毎秒25フレームであるのかを含むフ
レームレート、表示アスペクト比が3/4 であるのか、9/
16であるのか、またはディスプレイモードによってパン
スキャンフォーマットとレターボックスフォーマットの
1 つが可能とされるのか、両方が可能とされるのかを示
す表示アスペクト比を含む。
【0286】データファイル管理情報は、さらに、ファ
イル内のオーディオストリーム数を、オーディオコーデ
ィングモードのようなオーディオストリーム属性、モノ
ラル、ステレオ、またはデジタルサラウンドのようなオ
ーディオモード、特殊言語が含まれているのかどうかを
示すオーディオタイプを記述するフィールド、および言
語のコード番号を示す特殊コードのフィールドも含む。
【0287】データファイル管理テーブル944 は、さら
に、サブピクチャチャネル数を記述するフィールド、サ
ブピクチャのランレングスコーディングが使用されるこ
と、および指定言語および指定される言語があるかどう
かを示すフィールドのようなサブピクチャチャネル属性
を記述するフィールドを含む。さらに、ファイルのすべ
てのサブピクチャチャネルで使用される16のカラーパレ
ットのY 、Cr、およびCBカラーを示すフィールドがあ
る。また、シーケンス情報テーブルのサイズ、最小セル
番号と後続の連続セルの数を記述するフィールド、およ
びファイルの1 つのシーケンス内で使用されるセル番号
の範囲を記述するフィールドもある。1 つのシーケンス
内で使用されるセル番号は、32の連続番号で1 つの集合
を作り、最小セル番号を集合の最初の番号となるように
格納することにより計算される数の集合に入れられなけ
ればならない。このフィールドには、シーケンスで使用
されるセル数、およびシーケンスで使用される最小セル
数を含むサブフィールドがある。
【0288】シーケンス情報テーブル946 には、複数の
シーケンス情報エントリ952 と954含む。シーケンスと
は、このシーケンスにより指定される範囲内のセルが選
択式で再生される順序のことである。完全および接続と
いう2 種類のシーケンスがある。完全型シーケンスは、
それ自体を再生した後に終了する。接続型シーケンス
は、連続して再生される。参照番号952 により示される
シーケンス情報1 および954 により示されるシーケンス
情報iのようなシーケンス情報番号は、シーケンス番号
に等しく、1 で開始するシーケンス情報テーブルい、記
述順序で番号が付けられる。シーケンス情報テーブルの
シーケンス情報エントリは、完全型シーケンスまたは接
続型シーケンスの順序で記述されている。各シーケンス
情報テーブルは、完了型シーケンスまたは接続型シーケ
ンスの順序で記述される。各シーケンス情報には、シー
ケンスタイプ、格納されるプログラム数、格納されるセ
ル数、シーケンス再生時間、接続型シーケンス数、接続
可能シーケンス番号、およびシーケンス制御情報を示す
フィールドを示すフィールドを含む。
【0289】シーケンス情報のシーケンスタイプフィー
ルドは、シーケンスのコピーおよびパレンタル管理を記
述する。コピーが許可されているのか、または禁止され
ているのかを示すサブフィールド、パレンタル管理のレ
ベルを1-5 で指定するサブフィールド、完了型シーケン
ス、接続型ヘッドシーケンス、接続型中間シーケンスま
たは接続タイプとシーケンス内の1つである可能性があ
るシーケンスタイプを示すサブフィールドある。また、
シーケンスが、カラオケアプリケーションで使用するか
どうかを示すアプリケーション型サブフィールドもあ
る。
【0290】格納プログラム数フィールドは、最高1 つ
のシーケンス内に100 というプログラム数を記述する。
格納セル数フィールドは、ある特定のシーケンス内で
の、合計256 セルまでのセル総数を記述する。シーケン
スまたは再生時間は、時、分、秒およびビデオフレーム
による単位でこのシーケンスの総再生時間を記述する。
【0291】接続型シーケンス数フィールドには、最大
数が8 であるその直後に接続可能なシーケンス数を指定
する。接続可能シーケンス番号フィールドは、接続可能
シーケンスのシーケンス番号と指定される数のシーケン
スのパレンタル管理のレベルを記述する。接続可能シー
ケンスの選択番号は、記述された順序で1 から割り当て
られる。このフィールドには、パレンタル管理番号のサ
ブフィールド、およびシーケンス番号のサブフィールド
が指定される。シーケンス情報の最後のフィールドは、
再生順でシーケンスに含まれるセルを記述するシーケン
ス制御情報である。このフィールドも、複数のセルの集
合であるアングルブロックの記述に使用される。それら
のセルの再生時間は、実質上等しい。各再生セクション
は、1 つのセルで構成される。アングルブロックは、多
くても9 個のセルを含み、第1 セルに1 という番号が付
けられる。シーケンス制御情報のサブフィールドには、
実質上再生される複数のセルを結合する再生単位として
プログラムを定義するプログラム番号を指定する。以下
のセルに連続して進むのか、休止するのか、あるいはシ
ーケンスの最後に到達したかを示すセル再生制御のサブ
フィールドがあり、ブロックが構成セルではないかどう
か、ブロック構成の第1 セルがあるかどうか、それがブ
ロック構成内のセルなのか、ブロック構成内の最後のセ
ルであるのかを示すブロックモードサブフィールドがあ
る。ブロックがないかどうか、またはアングルブロック
があるかどうかを示すブロック型サブフィールドがあ
る。最後に、再生対象のセルのセル番号を示すサブフィ
ールドがある。
【0292】データファイル管理情報940 は、さらに、
複数のセル情報エントリ956 と958含むセル情報テーブ
ル948 を含む。各セル情報エントリは、コピーが許可さ
れているのか、禁止されているのかを示すセルタイプ情
報、およびパレンタル管理レベルを含む。また、時、
分、秒およびビデオフレームによりセルのセル再生総時
間を記述するセル再生時間を示すフィールドもある。セ
ルの第1 パックに記述されるシステムクロックリファレ
ンスの下位32ビットを記述するフィールド、ファイルの
始めからの相対論理ブロック番号でセルの開始ポイント
得のアドレスを記述するフィールド、およびセル内に含
まれる論理ブロック数を記述するフィールドがある。
【0293】データファイル管理情報940 の最後のセク
ションは、データ検索マップ950 ある。データ検索マッ
プは、データ検索情報パック960 と962 の複数のポイン
タを備える。再生情報(PBI) パックポインタと呼ばれる
これらのポインタは、データ942 内に存在する再生情報
のアドレスを指定する。高速順方向モードまたは高速反
転モードを実行し、情報の表示を可能にするためには、
MPEG-2ビデオシーケンスのイントラピクチャに依存する
のが最適です。これらのイントラピクチャは、そのアド
レスがデータ検索マップ内に記憶されるデータ942 内の
再生情報パックを使用して配置される。PBI パックの詳
説は、以下で行う。
【0294】図43にブロック図されるデータファイル
910 のデータ942 は、再生情報(PBI) ビデオ情報、サブ
ピクチャ情報、およびオーディオ情報のインタリーブさ
れたパックを含む。例えば、図43では、データは再生
情報940 、ビデオ情報942 と944 サブピクチャ情報946
、オーディオ情報948 などを含む。データ942 内の情
報の構造、およびプレゼンテーションタイミングは、MP
EGシステム説明(ISO/IEC 13818-1 )に定義されるプロ
グラムストリームに準拠する。しかし、再生情報および
サブピクチャ情報、ならびにこの情報が、記憶、エンコ
ード、および復号化される方法が、本発明の一部を構成
する。
【0295】図43でデータ942 から構成されるさまざ
まな情報は、情報パックを含む。例示的なパック970Aお
よび980Aが、図44A と44B に示される。各パックは、
パックヘッダ972Aまたは972B、およびビデオ情報、オー
ディオ情報、サブピクチャ情報、または再生情報から構
成される。
【0296】パック970Aの構造は、パケット982Aが2034
バイトと2027バイトの間で占有するときに使用される。
スタッフィングフィールド980Aによって、1 から8 バイ
トのスタッフィングがパック総サイズを2048バイトにで
きるようにする。ビデオ情報、オーディオ情報、サブピ
クチャ情報または再生情報が2027バイトを下回るとき、
図44B に示されるパック構造970Bが使用され、1 バイ
トのスタッフィング970Bおよびパケット982Bと984Bのビ
ット総数を2034バイトにあるようにする埋め込み984 の
パケットがある。パケットヘッダ972Aと972Bのそれぞれ
には、パック開始フィールド974 、システムクロックリ
ファレンス976 、多重化(MUX)レートフィールド978 、
およびスタッフィングフィールド980 がある。図44A
と44B のパケットは、ISO/IEC13818に従って構築され、
プログラムストリームパック内のフィールドのセマンテ
ィック定義に関するその第2.5.3.4 項に説明される。
【0297】図45は、再生情報(PBI) パックを示して
いる。パックヘッダ972 は、図44A と44B に関して記
述されるように、構築される。図45のシステムヘッダ
986は、ISO/IEC 13818-1 に記述されるプログラムスト
リームシステムヘッダの要件に準じて構築される。シス
テムヘッダ内のフィールドのセマンティック定義は、IS
O/IEC 13818-1 の第2.5.3.6 項に説明される。
【0298】パケットヘッダ988 は、ISO/IEC 13818-1
の第2.4.3 項に記述されるPES パケット内のフィールド
のセマンティック定義に説明されるフィールドに従って
構築される。ただし、パケットヘッダ988 では、プレゼ
ンテーション時刻記録までのフィールドだけが必要とさ
れる。
【0299】再生情報パックは、さらに、サブストリー
ムIDフィールド990 を含む。これは、サブストリームの
識別を示す8 ビットのフィールドである。使用できる別
の識別は、サブピクチャストリーム、ビデオ空白化情報
(VBI)ストリーム、AC-3ストリーム、または線形PCM ス
トリームである。MPEGオーディオサブストリームなどの
他のストリームタイプを入れることも可能である。サブ
ストリームID990 はビデオ空白化情報992 のデータを先
行するので、サブストリームIDは、後続の情報がビデオ
空白化情報ストリームであることを示すように設定され
る。ビデオ空白化情報992 のデータは、ISO/IEC 13818-
1 に従って構築され、ISO/IEC 13818-1必要となる意味
論に準拠する。
【0300】図45に示される再生情報パックの中に
は、データ検索情報996 のデータを格納するデータ検索
情報パケットのパケットヘッダ994 も示される。パケッ
トヘッダ994 には、24ビット値000001h が設定されるパ
ケット開始コードプレフィックス、データ検索情報996
が以前に定義された規格に準拠していないことを示すス
トリーム識別、パケット長を示すフィールドを含む。デ
ータ検索情報996 はMPEG規格では開示されていないの
で、ストリームIDは、後続の情報がデータストリームの
私的なタイプであることを示す。
【0301】図45を説明するデータ検索情報996 のデ
ータの特定の内容が図46に示される。データ検索情報
996 は、一般情報1000、アングルアドレス情報1020、ハ
イライト情報1022、同期再生情報1024、およびPBI パッ
クアドレス情報1036を含む。
【0302】一般情報1000は、図47にさらに詳細にブ
ロック図される。前記のように、データ検索情報の目的
とは、デジタルエンコードされた情報の迅速な検索を可
能にすることであり、特に、ビデオ復号化中に実行され
るトリックモード用イントラピクチャオ高速位置発見を
可能にする。したがって、図46に示される再生情報パ
ックは、ピクチャのグループ(GOP) のそれぞれのヘッド
パックであり、I-ピクチャで開始するビデオヘッドパッ
クの直前に割り当てられる。一般情報1000は、I-ピクチ
ャの再生開始時刻であるGOP1002 の時刻記録である。次
に、PBI のシステムクロックリファレンス(SCR) があ
る。これは、PBI パックヘッダに記述されるSCR の下位
32ビットを記述する。1006は、I-ピクチャの最終アドレ
スを示し、ファイルの初めからの相対論理ブロック番号
によりI-ピクチャの最終データが記録されるパックのア
ドレスを記述する。セル番号はフィールド1008に記憶さ
れ、GOP 属するセル番号を記述する。フィールド1010
は、制約のレベルおよびコピーが許可されているかどう
かも含むパレンタル管理情報を記述する。最後に、フィ
ールド1012は、ファイルのヘッドからの相対論理ブロッ
ク番号を使用するこのPBI パックのアドレスであるPBI
パックアドレスを記述する。
【0303】図46に示されるデータ検索情報996 のフ
ィールド1020は、アングルアドレス情報である。アング
ルアドレス情報には、その他のアングルのアドレス情報
が含まれる。アングルアドレス情報には、それぞれが異
なったアングルセル番号に関する9 つのフィールドが含
まれる。アングルアドレス情報1020の各フィールドの場
合、ある特定のPBI パックが属するセルがアングルブロ
ックを構成する場合、アングルアドレス情報のフィール
ドは、対応するデータ検索情報のビデオ開始プレゼンテ
ーション時刻記録を超えないもっとも近いビデオ開始プ
レゼンテーション時刻記録を持つアングルセル番号のPB
I パックのアドレスを記述する。アングルセルが存在し
ない場合、またはアングルブロックが構成されない場
合、特定のセルのアングルアドレス情報ははゼロに設定
される。
【0304】データ検索情報996 の第3 セクションは、
ハイライト情報1022である。ハイライト情報は、メニュ
ー画面上での選択アイテムの位置、および選択時に変更
されるその色とコントラストを記述する。この情報は、
セルがメニューの一部である場合にだけ使用される。ハ
イライト情報には、選択アイテム開始番号およびメニュ
ー画面上でサブピクチャにより表示されるアイテム数を
記述するフィールドがある。選択アイテム開始番号およ
びアイテム数の特定のサブフィールドには、メニュー画
面上での選択アイテムの最小数を記述するサブフィール
ド、メニューの次ページが存在するかどうかを記述する
サブフィールド、およびメニュー画面上での選択アイテ
ムの数を記述するサブフィールドがある。ハイライト情
報の第2フィールドには、選択アイテムの位置、色、お
よびコントラストが含まれる。このフィールドは、メニ
ュー画面上の選択アイテムごとの矩形表示領域、および
選択時に変更される対応する色とコントラストを記述す
る。矩形表示領域は、X-Y座標面内に限定される。選択
アイテムの位置、色、およびコントラストを記述するこ
のフィールド内の情報には、メニューの矩形領域を限定
すること、およびさまざまなタイプのピクセルが、選択
時にどのようにして変更されるのかを記述する情報を含
む。さらに詳細に後述するように、サブピクチャは4 種
類の異なったピクセルを酌量する。テキストやそれ以外
の情報を表示するために使用できる第1 強調ピクセルと
第2 強調ピクセル、線描画またはその他の図形パターン
のようなパターンを表示するために使用されるパターン
ピクセル、およびバックグラウンドピクセルがある。以
上4 種類の異なった情報がハイライトまたは選択される
場合、アイテムがハイライトされるときに選択される
色、およびハイライトされたときのピクセルのコントラ
ストも知っておく必要がある。したがって、4 種類の異
なったピクセルが選択されたときの、その色およびコン
トラストを記述するハイライト情報内に8 つのサブフィ
ールドがある。
【0305】データ検索情報996 内の5 番目のアイテム
は同期再生情報1024である。同期再生情報1024は、図4
8に詳しくブロック図される。同期再生情報の目的と
は、ビデオデータと同期するオーディオとサブピクチャ
の開始時間とアドレス情報を検出できるようにすること
である。図48に示される同期再生情報1024には、オー
ディオのプレゼンテーション時刻記録のターゲットであ
るオーディオパックアドレスが含まれる。このフィール
ドの最上位ビットは、オーディオパックがこのPBI の前
に位置しているのか、このPBI の後に位置しているのか
を示す。オーディオ1028のプレゼンテーション時刻記録
(PTS )は、ビデオ開始PTS からの相対プレゼンテーシ
ョン時刻記録により、I-ピクチャの再生開始時間の直後
に再生開始時間が設定されたオーディオパケットのPTS
を記述する。オーディオのプレゼンテーション時刻記録
は、プレゼンテーション時刻記録をそのために記憶させ
るために、最高8 つのオーディオストリームを酌量す
る。さらに、GOP の間に再生されるオーディオフレーム
を構成するオーディオパケットがするかどうかを示すサ
ブフィールドがある。ピクチャにオーディオがない場合
には、オーディオのプレゼンテーション時刻記録を記憶
したり、復号化する必要はない。最高8 つのオーディオ
チャネルがあるので、各オーディオチャネルには対応す
るアドレスフィールドと時刻記録フィールドがある。
【0306】データ構造1024も、問題のサブピクチャパ
ックの、PBI パックに相対したアドレスを記述するサブ
ピクチャパックアドレス1030を含む。サブピクチャのプ
レゼンテーション時刻記録は、対応するサブピクチャ情
報の同期を記述する。GOP 再生の間に再生される必要が
あるサブピクチャユニットが存在するかどうか、サブピ
クチャの再生開始時間がビデオプレゼンテーション時刻
記録の前かどうか、GOP 再生中に再生されるサブピクチ
ャユニットの製作開始時間、およびGOP 再生中に再生さ
れるサブピクチャユニットの再生終了時間を示すサブフ
ィールドがある。1 つのデータストリームに含めること
ができる最高32のサブピクチャのように、存在するそれ
ぞれのサブピクチャには、対応するアドレスと時刻記録
のフィールドがある。
【0307】データ検索情報996 の図46に示される最
後のセクションは、PBI パックアドレス情報である。PB
I パックアドレス情報は、ファイル内の他のPBI パック
のアドレスを構成し、他のPBI パックの位置が迅速に見
つけられるようにする。PBIパックアドレス情報は、相
対論理ブロック番号を使用して周囲のPBI パックのアド
レスを記述する。PBI パックアドレス情報には、それぞ
れ次のPBI パックアドレスと前のPBI パックアドレスを
記述する2 つのフィールドがある。現在のPBIパックア
ドレスからの相対論理ブロック番号を使用して、GOP の
すぐ先にあるGOP 属するPBI パックのアドレスを、nx0.
5 秒と(n+1)x0.5 秒の間であるその累積した再生時間で
定義し、複数のPBI パックがこの範囲に該当する場合
は、n x 0.5 秒、1 ≦n ≦15を選択する15のフィールド
がある。
【0308】現在のPBI パックアドレスからの相対論理
ブロック番号を使用して、GOP に属するPBI パックのア
ドレスを、n x 0.5 秒と(n+1) x 0.5 秒の間のその累積
再生時間で定義し、1つ以上のパックがこの範囲に該当
する場合には、n x 0.5 秒、-15 ≦n ≦-1にもっとも近
いPBI パックを選択する15のフィールドがある。
【0309】現在のPBI パックアドレスからの相対論理
ブロック番号を使用して、GOP のすぐ先のGOP に属する
PBI パックアドレスをn x 0.5 秒と[n x 0.5 +1]秒の間
のその累積再生時間で定義し、1つ以上のPBI パックが
この範囲に該当する場合には、n x 0.5 秒、n=20または
n=60にもっとも近いPBI パックを選択する2 つのフィー
ルドがある。
【0310】現在のPIパックアドレスからの相対論理ブ
ロック番号を使用して、GOP に属するPBI のアドレスを
n x 0.5 秒と[n x 0.5 +1]秒の間のその累積再生時間で
定義し、複数のPBI パックがこの範囲に該当する場合
は、PBI パックをn x 0.5 秒、n=- 20またはn=-60 にも
っとも近いPBI パックを選択する2 つのフィールドがあ
る。
【0311】ビデオパック1040の構造は図49にブロッ
ク図される。ビデオパックは、図44A 44B に示される
ヘッダ972Aまたは972Bに従って構築されたパックヘッダ
972を備える。ビデオ用のパケットヘッダ1046は、ビデ
オデータ1048でのように、ISO/IEC 13818-1 に従って構
築される。ただし、MPEGビデオ信号として表記されるビ
デオデータ1048は、前記技法に従いエンコードするのが
好ましい。
【0312】MPEGエンコードされたピクチャのグループ
は、図50の1050として示される。このGOP 1050を複数
のビデオパック1040に分割し、ビデオストリーム1060を
作成する方法は、図50の底部にブロック図される。ピ
クチャオグループ1050は、ビデオパックに適合するため
に適切なユニットに分割される。最後のビデオパック10
40G 、ビデオパックj は、パックのそれぞれに使用され
る完全な2048バイトを使用しないので、最後のパックj
を2048バイトに等しくするには、スタッフィングが使用
される。
【0313】図51A は、MPEGオーディオのビデオパッ
クを示している。このビデオパックは、パックヘッダ97
2 、MPEG要件に準拠して構築されるパケットヘッダ108
4、およびエンコードされたMPEGオーディオデータ1086
を含む。
【0314】図51B は、線形PCM オーディオまたはド
ルビーAC-3オーディオのどちらかと準拠して構築される
オーディオパック1090を示している。図51B にブロッ
ク図されるパケットの場合、パックヘッダ972 は前記の
ように配列され、パケットヘッダ1094はMPEG要件に準拠
して構築され、stream_id フィールドは線形PCM または
AC-3のどちらかに対応する私的オーディオデータストリ
ームを示す。サブストリームid 1096 は、オーディオデ
ータが線形PCM 用であるか、AC-3(またはMPEG)用であ
るかを示す。オーディオフレームポインタ1098は、オー
ディオパケット内のオーディオフレームヘッダ数を示す
フレームヘッダ数を具備し、ポインタの最後のバイトか
らの相対バイト数を使用して、オーディオフレームの第
1 アクセス装置の先頭を示す第1 アクセス装置ポインタ
も備える。線形PCM オーディオにとって、各フレームが
フレームヘッダとフレームデータを備えるオーディオフ
レームに分割されるのは普通のことである。オーディオ
フレームポインタ1098も同様にドルビーAC-3で使用でき
る。オーディオデータ1100は、対応するオーディオエン
コード方法に従って構築される。
【0315】図52は、エンコードされたオーディオス
トリーム1100を示す。このオーディオストリームは、個
々のパック1122を構成するオーディオパックのストリー
ム1120に変換される。各パックの長さは2048バイトで、
最後のオーディオパック1122G オーディオパックj は、
長さを2048バイトにするために、スタッフィングビット
を付加することによって調整される。
【0316】本発明の新規の特徴とは、サブピクチャの
使用およびサブピクチャパックのオーディオ情報とビデ
オ情報とのインタリーブである。サブピクチャ情報を使
用すると、グラフィック情報の表示が可能になり、MPEG
ビデオでのサブピクチャ情報の重複が酌量できる。ホン
発明により使用されるサブピクチャ情報と従来のクロー
ズキャプション字幕の間の大きな相違点とは、サブピク
チャ情報がビットマップ化されたグラフィックであるの
に対し、クローズキャプションでは、デコーダに記憶さ
れている文字セット内の文字を表示するために文字符号
が伝送されるという点である。したがって、従来のクロ
ーズキャプションは、デコーダ内の文字セットによって
制限される。しかし、サブピクチャ情報はビットマップ
化しているため、外国語文字を含む任意のタイプの文字
は、言語ごとにデコーダ内の文字セットを記憶する必要
なしに表示することができる。
【0317】サブピクチャ情報の各表示画面が、サブピ
クチャユニットと呼ばれる。図53にサブピクチャユニ
ット1140がブロック図される。サブピクチャユニット
は、ビットマップ化されたピクセルデータから成る1 つ
の画面を具備し、このピクセルデータの画面が複数のビ
デオフレームで表示される。サブピクチャユニット1140
は、サブピクチャユニットヘッダ1142を備える。サブピ
クチャユニットヘッダ1142には、サブピクチャ装置の先
頭からのバイト数に相対して、サブピクチャユニットの
サイズおよび表示制御シーケンステーブル1146を記述す
るフィールドがある。
【0318】ピクセルデータ1144は、ランレングス圧縮
済みビットマップ化情報である。ピクセルは表示された
情報のバックグラウンドを形成するバックグラウンドピ
クセル、図形線描画を含むサブピクチャ内の表示パター
ンを可能にするパターンピクセル、および2 つの異なっ
た属性を持つ図形または文字が表示できるようにする2
種類の強調ピクセルとなる場合がある。ビットマップ化
情報は、従来のグラフィック作成技法を使用して作成で
きる。ランレングス圧縮は、以下の規則に従って実行さ
れる。同種の1 ピクセルから3 ピクセルが続く場合、最
初の2 ビットにはピクセル数を、続く2 ビットにはピク
セルデータを入力する。4 ビットが1 つの単位と見なさ
れる。同種の4 から15のピクセルが続く場合は、最初の
2 ビットにゼロを指定し、続く4 ビットにピクセル数、
次の2 ビットにピクセルデータを入力する。8 ビットが
1 つの単位と見なされる。同種の16から63ピクセルが続
く場合、最初の4 ビットにゼロを指定し、続く6 ビット
にピクセル数、次の2 ビットにピクセルデータを入力す
る。12ビットが1 つの単位と見なされる。同種の64から
255 のピクセルが続く場合は、最初の6 ビットにゼロを
指定し、続く8 ビットにピクセル数、接ぎの2 ビットに
ピクセルデータを入力する。16ビットが1 つの単位と見
なされる。同じピクセルが行末まで続く場合は、最初の
14ビットにゼロを指定し、次の2 ビットにピクセルデー
タを記述する。16ビットが1 つの単位と考えられる。1
行でのピクセルの記述が完了するときにバイト割当てが
生じない場合、調整のために4 ビットのダミーデータを
挿入する。希望に応じて、画像データを表すために他の
圧縮機構を使用することも可能である。例えば、JPEGフ
ォーマットやGIFFフォーマットを使用して、サブピクチ
ャ画像を表すことができる。
【0319】表示制御シーケンステーブル1146には、制
御シーケンスが発生する年代順を記述する複数の表示制
御シーケンス1146A 、1146B 、1146C などが含まれる。
表示制御シーケンステーブルには、サブピクチャユニッ
ト内の情報がどのように表示されるのかに関する情報が
含まれる。例えば、1 つのサブピクチャを形成するワー
ドは、1 つづつまたは経時的にグループとして表示され
るか、その色が変化することがある。これは、カラオケ
情報を表示するためにサブピクチャを使用する場合に役
立つ。
【0320】各表示制御シーケンス(DCSQ)は、サブピク
チャユニットが表示されている期間で実行されるピクチ
ャデータを変更するコマンドを酌量する。表示制御シー
ケンスの第1 フィールドは表示開始時間である。このフ
ィールドは、サブピクチャユニットヘッダによりサブピ
クチャパケット内で記述されるPTS からの相対PTS のあ
るDCSQに含まれる表示制御コマンドの実行開始時間を記
述する。記述された実行開始時間の後の第1 ビデオフレ
ームから、表示制御緒は、DCSQ表示制御開始時間に従っ
て開始される。各DCSQの第2 フィールドは、後続の表示
制御シーケンスのアドレスである。このフィールドは、
第1 サブピクチャユニットからの相対バイト数により後
続のDCSQの開始アドレスを記述する。後続のDCSQが存在
しない場合には、このフィールドは、第1 サブピクチャ
ユニットからの相対バイト数によりこのDCSQの開始アド
レスを記述する。それ以降、DCSQには1 つ以上の表示制
御コマンドが格納される。これらのコマンドにより、ピ
クセルデータの属性および表示を制御、変更できるよう
になる。コマンドには、サブピクチャのオン/オフ状態
に関係なく、強制的にサブピクチャ装置の表示を開始す
るコマンドが含まれる。例えば、ユーザがサブピクチャ
をオフにするためにメニューを使用する場合、このコマ
ンドを設定してユーザの設定値を無視することができ
る。別のコマンドは、更新されたサブピクチャ装置の表
示を開始する。このコマンドは、各DCSQで一度表示され
なければならない。2 種類の強調ピクセル、パターンピ
クセル、およびバックグラウンドピクセルを含む前記の
4 種類のピクセルの色とコントラストを設定するための
コマンドがある。サブピクチャを構成するピクセルデー
タの矩形領域表示および位置を設定するコマンドが存在
する。このコマンドは、上部および下部のX 座標とY 座
標の設定を可能にする。また、表示に使用されるピクセ
ルデータのヘッドアドレスを設定するために使用される
コマンドもある。このコマンドを使用すると、上部フィ
ールドと下部フィールドの両方のヘッドアドレスを入力
できる。拡大されたフィールドでは、装置のヘッドから
の相対バイト数による上部フィールドと下部フィールド
のピクセルデータの各ヘッドアドレスが使用される。第
1 ピクセルデータは、行の第1 ピクセルを表す。このコ
マンドは、少なくとも第1DCSQ 、DCSQ0 で使用されなけ
ればならない。
【0321】ピクセルデータの色とコントラストを変更
するためのDCSQの中に表示されるコマンドがある。デー
タ検索情報のハイライト情報が使用される場合には、こ
のコマンドは使用してはならない。ピクセルデータの色
とコントラストを変更するためのコマンドは、表示中に
ピクセルデータの色とコントラストを制御するためのピ
クセル制御データを含む。ピクセル制御データに記述さ
れる制御の内容は、指定された開始時間の後にビデオフ
レームごとに実行され、新規ピクセル制御データが検出
されるか、新規サブピクチャユニットが検出されるまで
続行する。ピクセル制御データは、同じ変更が加えられ
る線を指定するために使用される線制御情報を含む。ま
た、ピクセル制御情報は、変更が加えられる線上の位置
を指定するために使用することもできる。線制御コマン
ドにより、開始線番号、変更ポイント数、および変更終
了線番号の変更が可能になる。ピクセル制御情報は、変
更開始ピクセル番号、および強調ピクセル1 と2 、パタ
ーンピクセル、およびバックグラウンドピクセルの新し
い色とコントラストを含む。また、表示制御シーケンス
の最後を示すコマンドもある。各DCSQは、このコマンド
で終了しなければならない。
【0322】映画の場合のようなビデオフレームの期間
で、使用できる多くの異なったサブピクチャユニットが
存在する。図54に図示されるように、サブピクチャユ
ニットは、サブピクチャパック1150に分割される。サブ
ピクチャパックには、前記のパックヘッダ972 、MPEGシ
ステム要件に準拠するパックヘッダ、後続のデータがサ
ブピクチャデータであることを示すサブストリームID、
およびサブピクチャデータ1158それ自体がある。
【0323】サブピクチャユニット1140のようなサブピ
クチャユニットは、図55にブロック図されるようにサ
ブピクチャパック150 に分割される。最後のサブピクチ
ャパック1050G には、その長さを2048バイトにする埋込
みが含まれる。
【0324】図56では、連続サブピクチャユニットが
表示される方法を説明する。時間が新しいサブピクチャ
パケットに記述されるPTS の時間に等しくなる場合、現
在表示中(1160)のサブピクチャユニットがクリアされ(1
162)、次のサブピクチャユニットの表示制御シーケンス
によって指定される時間が発生すると、そのサブピクチ
ャが表示される(1164)。1160と1162の間に、サブピクチ
ャユニットn とサブピクチャユニットn+1 の間の境界線
がある。この境界線は、サブピクチャユニットn+1 のパ
ケットヘッダに記述されるPTS で発生する。サブユニッ
トn+1 の実際の表示時間は、サブピクチャn+1 のDCSQに
説明される。
【0325】サブピクチャ情報に使用されるピクセルデ
ータの作成は、表示が希望される情報のビットマップを
作成するためにコンピュータを使用して実行できる。ビ
ットマップ化情報のプロセスは、技術で周知である。
【0326】図40-56 は、オーディオ情報、ビデオ情
報、およびサブピクチャ情報をエンコードするために使
用されるデータ構造を強調する。ただし、図40-56 で
のデータ構造の開示により、MPEGエンコードの従来の技
術の当業者は、特にMPEGシステム説明ISO/IEC 13818-1
の力を借りて、エンコードされたオーディオ、ビデオ、
およびサブピクチャをデータ構造にフォーマットでき
る。同様に、データを記憶する構造についての知識があ
れば、ビデオ情報、オーディオ情報、およびサブピクチ
ャ情報を作成するためのデータ構造の復号化は、従来の
技術の当業者により実行できる。
【0327】本発明の一部を成す例示的なビデオデコー
ダは、光ディスクに記憶されたデータを読み取る光ディ
スク読取り装置を具備する。読み取られた情報は、情報
を復号化するために、従来の解析技法を使用して解析さ
れる。ビデオ、オーディオ、サブピクチャ、およびPBI
パックのすべてを復号化しなければならない。ビデオ
は、オーディオパックが従来のデコーダを使用して復号
化されるように、市販されているMPEGデコーダを使用し
て復号化することができる。サブピクチャ情報は、サブ
ピクチャユニットをサブピクチャパックから、それらが
エンコードされたのと逆転して構築することで復号化さ
れる。特別に構築されたハードウェアまたはソフトウェ
アコーディングを使用してプログラミングされた汎用マ
イクロプロセッサは、サブピクチャ情報を復号化するた
めに使用できる。図45にブロック図される再生情報パ
ックには、データ検索情報996 が含まれる。データ検索
情報は、プログラミングされたマイクロプロセッサを使
用して処理され、オーディオデコーダ、ビデオデコー
ダ、およびサブピクチャデコーダとは異なる。メニュー
機能もプログラミングされたマイクロプロセッサによっ
て実行されるので、データ検索情報の中に含まれるハイ
ライト情報1022および他のすべてのメニュー機能は、サ
ブピクチャデコーダによってではなく、プログラミング
されたマイクロプロセッサによって実行される。本発明
の動作、データ構造、エンコードプロセスと復号化プロ
セスに関する追加情報は、両方とも本明細書に参考によ
り取り入れられる日本国特許出願明細書7ー8298、および
7-85693 に記載される。
【0328】本発明のエンコードシステムを使用する
と、ピクチャ内で品質を制御できる。この制御は、最終
ビデオ製品の作成者がエンコードシステムの最終製品を
密接に制御できるようになるため重要である。したがっ
て、デジタルビデオエンコードによりアナログビデオ内
に存在しない復号化人為構造が生じても、最終デジタル
製品はきわめて良好だろう。前記項のどれかの教示は、
他の項に適用できる。
【0329】本発明の決定、計算および処置は、コンピ
ュータ技術の当業者に明らかとなるように、本発明の教
示に従ってプログラミングされた従来の汎用デジタルコ
ンピュータを使用して、実現できる。適切なソフトウェ
アコーディングは、ソフトウェア技術の当業者に明らか
となるように、本開示の教示に基づいて技能のあるプロ
グラマにより容易に作成できる。
【0330】本発明は、当業者に容易に明らかになるよ
うに、アプリケーションに特殊な集積回路を作成した
り、従来の構成部品回路の適切なネットワークの相互接
続によっても、実現される。
【0331】本発明は、本発明のプロセスを実行するた
めにコンピュータをプログラミングする場合に使用でき
る指示を格納する記憶装置媒体であるコンピュータプロ
グラム製品を含む。記憶装置媒体は、フロッピーディス
ク、光ディスク、CD-ROM、および磁気光学ディスク、RO
M 、RAM 、EPROM 、EEPROM、磁気カードや光カード、あ
るいは電子指示を記憶するために適当な任意のタイプの
媒体を含む任意のタイプのディスクを含むが、それらに
限定されない。本発明は、さらに、電子指示またはデー
タを記憶するのに適当な前記媒体のどれかで記憶され
る、本発明により出力されるエンコードデータを含む記
憶装置媒体であるコンピュータプログラム製品も含む。
【0332】前記教示という観点から、本発明の数多く
の改良および変化が可能であることは明らかである。し
たがって、付属請求項の範囲内であれば、本発明は、本
明細書に明確に指示がある場合を除き実施できる。
【0333】
【発明の効果】以上説明したようにこの発明によれば、
編集したときに画質を劣化させないようにすることがで
きる。
【図面の簡単な説明】
【図1A】エンコーダシステムアーキテクチャのブロッ
ク図。
【図1B】エンコードされるべきオーディオおよびビデ
オを得るための装置、ならびにエンコードシステムによ
り作成されるエンコードされたオーディオ映像データを
書き込み、伝送するための装置を示す図。
【図2】図1のシステムの一般的な動作を示すフローチ
ャート。
【図3】セットアップ状態で実行されるプロセスを示す
フローチャート。
【図4】圧縮状態で実行されるプロセスを示す図。
【図5】編集状態で実行されるプロセスを示す図。
【図6】開始状態、完了状態、および終了状態のために
実行されるプロセスを示す図。
【図7】マルチパスビデオエンコーダを使用しながら所
定数のオーディオトラックをエンコードするのに必要と
されるオーディオエンコーダの数を決定する方法、なら
びにオーディオエンコードおよびマルチパスビデオエン
コードを同時に実行するプロセスを示すフローチャー
ト。
【図8A】シーケンスレーヤのログファイルフォーマッ
トを示す図。
【図8B】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。
【図8C】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。
【図8D】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。
【図9A】ピクチャレイヤのログファイルフォーマット
を示す図。
【図9B】同じくピクチャレイヤのログファイルフォー
マットを示す図。
【図9C】同じくピクチャレイヤのログファイルフォー
マットを示す図。
【図10】マクロブロックレーヤのログファイルのフル
フォーマット、およびマクロブロックレーヤのログファ
イルのショートフォーマットを示す図。
【図11】ログファイル内の情報を活用するためのプロ
セスを示す図。
【図12】異なる期間に対する画質の手動調整中に実行
される一般プロセスを示す図。
【図13】様々な期間で画質を変更するためのパラメー
タを入力するために使用されるユーザインタフェースを
示す図。
【図14】所望の画質に対応するビット数を計算するた
めの一般的な手段を示す図。
【図15】最大または最小のユーザ選択優先順位が設定
されるセクションを処理するために使用されるプロセス
を示す図。
【図16A】最大または最小の優先順位ではない希望の
画質に対応するビット数を計算するためのフローチャー
トを示す図。
【図16B】同じく最大または最小の優先順位ではない
希望の画質に対応するビット数を計算するためのフロー
チャートを示す図。
【図17】画質を変更した結果、アンダフローが生じる
場合に確認するために使用されるプロセスのフローチャ
ートを示す図。
【図18】バッファアンダフローが、編集セグメント内
で加えられた変更のために、編集セグメントの後のフレ
ームで発生するかどうかを判断するためのフローチャー
トを示す図。
【図19】ユーザが選択した品質によってエンコードさ
れたビデオのビットレートがどのように変更されるのか
についての例、および同じくユーザが選択した品質によ
ってエンコードされたビデオのビットレートがどのよう
に変更されるのかについての例を示す図。
【図20】1つのフレーム内のさまざまな領域の画質の
手動調整の間に実行される一般的なプロセスを示す図。
【図21】ビデオの1フレーム内にユーザが選択した優
先度が設定されたさまざまな領域の例を示す図。
【図22】選択された優先順位に使用される元の量子化
の端数小数部に対するユーザ選択優先順位のグラフを示
す図。
【図23】ユーザ選択優先順位の結果生じるビット数
と、フレームの元のエンコードの結果生じるビット数の
間の差異が許容できるかどうか、あるいは訂正手順を実
行しなければならないかどうかを判断するためのプロセ
スを示す図。
【図24A】設定されたビットが多すぎると判断される
ために、ビット数を低減する目的でマクロブロックの量
子化レベルが増分される場合に、フレームを訂正するた
めのプロセスを示す図。
【図24B】同じく設定されたビットが多すぎると判断
されるために、ビット数を低減する目的でマクロブロッ
クの量子化レベルが増分される場合に、フレームを訂正
するためのプロセスを示す図。
【図24C】同じく設定されたビットが多すぎると判断
されるために、ビット数を低減する目的でマクロブロッ
クの量子化レベルが増分される場合に、フレームを訂正
するためのプロセスを示す図。
【図25A】ビット数を増加するために1つのフレーム
内のマクロブロックの量子化レベルを引き下げることに
よってフレーム内の少なすぎるビットを訂正するための
プロセスを示す図。
【図25B】同じくビット数を増加するために1つのフ
レーム内のマクロブロックの量子化レベルを引き下げる
ことによってフレーム内の少なすぎるビットを訂正する
ためのプロセスを示す図。
【図25C】同じくビット数を増加するために1つのフ
レーム内のマクロブロックの量子化レベルを引き下げる
ことによってフレーム内の少なすぎるビットを訂正する
ためのプロセスを示す図。
【図26】n個のマクロブロックの集合のそれぞれで使
用されるビットの予想数をメモリからロードしてから、
n個のマクロブロックの集合ごとにビットの結果数をカ
ウントし、ビットの予想数および作成数に基づいた概算
の精度を計算し、フレームの列のターゲットサイズに近
く留まるために、次のn個のマクロブロックの予め割り
当てられた量子化レベルを調整する一般的なプロセスを
示しているフローチャート。
【図27】 (A)は、固定割当てされた量子化レベル
を示しているフレームのピクチャを示す図、(B)はマ
クロブロックの各集合に1 スライスが含まれ、マクロブ
ロックの第1 集合が再エンコードされた後で、第1 訂正
係数が計算され、第1 訂正係数がマクロブロックの第2
集合に加算された場合の、図27Aのフレームのピクチ
ャを示す図、(C)はマクロブロックの第2集合が再エ
ンコードされた後で、第2訂正係数が計算され、第2訂正
係数がマクロブロックの第3 集合に追加された、図27
B のフレームのピクチャを示す図、(D)はマクロブロ
ックの第1 集合に2 つのスライスが含まれ、マクロブロ
ックの第1 集合が再エンコードされてから、第1 訂正係
数が計算され、第1 訂正係数がマクロブロックの第2 集
合に加算された場合の図27A のフレームのピクチャ
を示す図。
【図28】その量子化レベルが変更される2 つの異なっ
た領域を含む1 フレームを示す図と、その量子化レベル
が変更された2 つの異なった領域を表すために使用され
るビデオストリーム内でのビット数の変更を示している
図28A のフレームの2 つの考えられるエンコードの
ピクチャを示す図。
【図29】再エンコードされた列の総長が列の元の長さ
に等しい、一連の画像を表すために使用されるビット数
の変更を示しているビデオストリームを示す図。
【図30】訂正係数指数が、どのようにして概算率を使
用して比例ルックアップテーブルから求められるのかを
説明するフローチャートを示す図。
【図31】訂正係数が、訂正係数指数を使用して訂正係
数テーブルからどのようにして選択されるのかを説明す
るフローチャートを示す図。
【図32】訂正係数が、概算割合およびマクロブロック
の再エンコードされていない残りの集合数を使用してど
のようにして計算されるのかを説明するフローチャート
を示す図。
【図33】(A)はエンコードされたフォーマットを取
るオリジナルビデオのセクションを示す図、(B)は元
のエンコードされたビデオに置き換えられなければなら
ないエンコードされていないフォーマットにおけるビデ
オの新たなセクションを示す図、(C)はオリジナルビ
デオのエンコードされていないセクションがその両端に
あるビデオのエンコードされていない新たなセクション
を示す図、(D)は元のエンコードされたビデオに置き
換えられなければならないエンコードされたフォーマッ
トにおける図33Cのビデオを示す図、(E)は置き換
えられたエンコードされたビデオがその中に含まれる、
元のエンコードされたビデオを示す図。
【図34】減少されたデコード構造を有するビデオとな
るエンコードビデオデータストリームにビデオのセクシ
ョンを置き換えるプロセスを示す図。
【図35】(A)は立ち下がり端でのオリジナルビデオ
のエンコードされていないセクションを有するビデオの
エンコードされていない新しいセクションを示す図、
(B)は図33Aのブロック図にある最初にエンコード
されたビデオに置き換えられるエンコードされたビデオ
のセクションを示す図、(C)は図35Bの置き換えら
れたエンコードされたビデオを含む図33Aの最初にエ
ンコードされたビデオを示す図。
【図36】クローズグループのピクチャモードを使用し
て置き換えられるビデオをエンコードすることによっ
て、エンコードされたビデオビットストリームを編集す
る場合に、デコード構造を減少させるためのプロセスを
説明する図。
【図37】(A)は事前エンコードプロセスでビットレ
ートモデルに対する量子化レベルを作成するために、そ
れに割り当てられる2つの量子化レベルが設定される未
処理ビデオのフレームを示す図、(B)は回転パターン
で割り当てられる4つの量子化レベルのあるフレームを
示す図、(C)はブロックフォーメーションで分散され
る4 つの量子化レベルのあるフレームを示す図。
【図38】ビデオ信号を得て、それらの信号を事前エン
コードし、事前エンコードフェーズで特定された量子化
レベルに対するビットレートを決定するプロセスを説明
するフローチャート。
【図39】2つの記録済みフレーム、およびビットレー
トに対するそれらの対応する量子化レベルを示す図。
【図40】最終的には光ディスクに格納されるエンコー
ドされたデータの最終フォーマットの概略を示す図。
【図41】図40のディスク情報ファイル908を説明す
る図。
【図42】図40にブロック図されるデータファイルの
データファイル管理情報の内容を示す図。
【図43】図40のデータファイルに記憶されるデータ
の詳細を示す図。
【図44】その中でそのデータがスタッフィングパケッ
トを必要としないデータパックを示す図とパディングの
ためにパケットを必要とするデータパックを示す図。
【図45】再生情報パックを示す図。
【図46】図45のデータ検索情報996の中に含まれる
情報を示す図。
【図47】図46の一般情報を示す図。
【図48】図46にブロック図される同期再生情報を示
す図。
【図49】ビデオパックを示す図。
【図50】ピクチャのグループ(GOP)とビデオパックの
列の間の関係を説明する図。
【図51】MPEGオーディオエンコード仕様に従ってエン
コードされたオーディオパックを示す図と、AC-3または
リニアPCMオーディオエンコードに従って構築されたオ
ーディオパックを示す図。
【図52】エンコードされたオーディオストリームとオ
ーディオパックの間の関係を示す図。
【図53】サブピクチャユニットの構造を示す図。
【図54】サブピクチャパックの構造を示す図。
【図55】サブピクチャパックに関連したサブピクチャ
装置の構造を説明する図。
【図56】表示サブピクチャユニットnとサブピクチャ
ユニットn+1の間の変化を示す図。
【符号の説明】
10、20、30、40…ワークステーション、21…
ハードディスク、22…デジタル記憶装置、31…コン
ソールディスプレイ、50…ビデオエンコード装置、5
1…再生VTR、52…録画VTR、60…デジタルキ
ャプチャ記憶装置、70a〜70d…オーディオエンコ
ーダ、72…オーディオインタフェース装置、73…オ
ーディオデコーダ。
フロントページの続き (72)発明者 ファラマルツ・アザデガン アメリカ合衆国、マサチューセッツ州 02154、ウォルサム、ステアーンズ・ヒ ル・ロード 5506 (72)発明者 ジェイ・ヨーグシュウォー アメリカ合衆国、ニュージャージー州 08648、ローレンスビル、アンソニー・レ ーン 34 (72)発明者 シャウ − バオ・ン アメリカ合衆国、ニュージャージー州 08512、クランベリー、ペティー・ロード 4 (72)発明者 デイビッド・レーマン アメリカ合衆国、ニュージャージー州 08060、マウント・ホリー、アシュレイ・ レーン 215 (72)発明者 ミクハイル・ツィンバーグ アメリカ合衆国、ニューヨーク州 10463、 リバーデイル、アーリントン・アベニュー 2743 (72)発明者 海野 裕明 日本国千葉県市川市八幡1−20−9 (72)発明者 三村 英紀 日本国神奈川県横浜市金沢区並木2−3− 1−403 (72)発明者 北村 哲也 日本国東京都狛江市中和泉1−15−12− 301 (72)発明者 クリストファー・ジェイ・クックソン アメリカ合衆国、カリフォルニア州 90046、ロサンゼルス、トーレイソン・ド ライブ 7825 (72)発明者 グレッグ・ビー・サガード アメリカ合衆国、カリフォルニア州 90277、レドンド・ビーチ、エメラルド・ ストリート 601 (72)発明者 アンドリュー・ドルージン・ローゼン アメリカ合衆国、カリフォルニア州 91304−3654、キャノガ・パーク、フォー ルブルック・アベニュー 7815

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 デジタル的にエンコード及び圧縮される
    ビデオに使用されるべき未エンコードビデオの新規部分
    をきめるステップと、 前記未エンコードビデオの新規部分の端部に、未エンコ
    ードビデオの区間を加えるステップと、 デジタル的にエンコード及び圧縮されるビデオの編集ポ
    イントの前の基準フレームをきめるステップと、 前記未エンコードビデオの新規部分と加えられた区間と
    を、前記加えられた区間のオリジナルエンコードに関連
    した量子化レベルを用いてエンコードするステップと、 前記エンコードされた新規部分を、デジタル的にエンコ
    ード及び圧縮したビデオビデオとするステップとを具備
    することを特徴とするデジタル的にエンコード及び圧縮
    されるビデオの編集方法。
  2. 【請求項2】 請求項1に記載の方法において、 上述したデジタル的にエンコード及び圧縮されるビデオ
    信号は、MPEG−2の規格によりエンコードされるこ
    とを特徴とするデジタル的にエンコード及び圧縮される
    ビデオの編集方法。
  3. 【請求項3】 請求項2に記載の方法において、 上記した基準フレームを決めるときは、編集ポイントの
    前の予測ビデオフレームを構成するステップを有するも
    のであって、前記予測フレームは、編集ポイントの後の
    2つの前後予測ビデオフレームよって参照されたもので
    あることを特徴とするデジタル的にエンコード及び圧縮
    されるビデオの編集方法。
  4. 【請求項4】 請求項1に記載の方法において、 前記エンコーディングするステップの量子化レベルは、
    前記加えられた期間のオリジナルエンコーディングにお
    いて用いられた量子化レベルと同じであることを特徴と
    するデジタル的にエンコード及び圧縮されるビデオの編
    集方法。
  5. 【請求項5】 請求項1に記載の方法において、 前記期間を加えるステップの未エンコードビデオの期間
    は、少なくとも、(1/2)秒の期間を持つ1つのピク
    チャーグループ(GOP)を含むことを特徴とするデジ
    タル的にエンコード及び圧縮されるビデオの編集方法。
JP2000106311A 1995-05-08 2000-04-07 デジタル的にエンコード及び圧縮されるビデオの編集方法 Expired - Fee Related JP3321457B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US43801495A 1995-05-08 1995-05-08
US438014 1995-05-08
US08/466,391 US5819004A (en) 1995-05-08 1995-06-06 Method and system for a user to manually alter the quality of previously encoded video frames
US466391 1995-06-06

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP53407196A Division JP3253971B2 (ja) 1995-05-08 1996-04-19 既に符号化されたビデオ・フレームの品質をユーザが手作業で変更するための方法およびシステム

Publications (2)

Publication Number Publication Date
JP2000316136A true JP2000316136A (ja) 2000-11-14
JP3321457B2 JP3321457B2 (ja) 2002-09-03

Family

ID=27031504

Family Applications (2)

Application Number Title Priority Date Filing Date
JP53407196A Expired - Fee Related JP3253971B2 (ja) 1995-05-08 1996-04-19 既に符号化されたビデオ・フレームの品質をユーザが手作業で変更するための方法およびシステム
JP2000106311A Expired - Fee Related JP3321457B2 (ja) 1995-05-08 2000-04-07 デジタル的にエンコード及び圧縮されるビデオの編集方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP53407196A Expired - Fee Related JP3253971B2 (ja) 1995-05-08 1996-04-19 既に符号化されたビデオ・フレームの品質をユーザが手作業で変更するための方法およびシステム

Country Status (8)

Country Link
US (1) US5819004A (ja)
EP (1) EP0824824B1 (ja)
JP (2) JP3253971B2 (ja)
KR (1) KR100283384B1 (ja)
AU (1) AU708027B2 (ja)
CA (1) CA2201516C (ja)
DE (1) DE69636337T2 (ja)
WO (1) WO1996036170A1 (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2173812C (en) * 1995-04-11 2000-02-08 Shinichi Kikuchi Recording medium, recording apparatus and recording method for recording data into recording medium, and reproducing apparatus and reproduction method for reproducing data from recording medium
US6026232A (en) * 1995-07-13 2000-02-15 Kabushiki Kaisha Toshiba Method and system to replace sections of an encoded video bitstream
US5838874A (en) * 1995-05-08 1998-11-17 Kabushiki Kaisha Toshiba Audiovisual encoding system with a reduced number of audio encoders
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US5612900A (en) * 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US6324334B1 (en) * 1995-07-07 2001-11-27 Yoshihiro Morioka Recording and reproducing apparatus for recording and reproducing hybrid data including text data
MX9702856A (es) * 1995-08-21 1997-07-31 Matsushita Electric Ind Co Ltd Disco optico, dispositivo de reproduccion y metodo de reproduccion que pueden lograr una conmutacion dinamica del contenido reproducido.
JP3345019B2 (ja) 1996-03-29 2002-11-18 松下電器産業株式会社 インタラクティブな再生進行の性能を向上させた記録媒体の記録方法、再生装置および再生方法
JP4059355B2 (ja) * 1996-04-04 2008-03-12 パイオニア株式会社 情報記録装置及び情報記録方法並びに情報再生装置及び情報再生方法
US6161115A (en) * 1996-04-12 2000-12-12 Avid Technology, Inc. Media editing system with improved effect management
EP0814619A3 (en) * 1996-06-21 1999-05-12 Hitachi, Ltd. Magnetic recording and reproducing control apparatus
US6134378A (en) * 1997-04-06 2000-10-17 Sony Corporation Video signal processing device that facilitates editing by producing control information from detected video signal information
US6160953A (en) * 1997-04-21 2000-12-12 Victor Company Of Japan, Ltd. DVD-compatible optical recording disk conveying audio signals encoded both as PCM data and as single bit stream data generated by sigma-delta modulation, and encoder apparatus and decoder apparatus for same
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
US6507672B1 (en) * 1997-09-10 2003-01-14 Lsi Logic Corporation Video encoder for digital video displays
EP1300850A3 (en) * 1997-09-17 2004-06-09 Matsushita Electric Industrial Co., Ltd. Video data editing apparatus, optical disc for use a recording medium of a video data editing apparatus, and computer-readable recoding medium storing an editing program
US6487364B2 (en) 1997-09-17 2002-11-26 Matsushita Electric Industrial Co., Ltd. Optical disc, video data editing apparatus, computer-readable recording medium storing an editing program, reproduction apparatus for the optical disc, and computer-readable recording medium storing a reproduction program
TW432372B (en) * 1997-09-17 2001-05-01 Matsushita Electric Ind Co Ltd Optical disc, video data editing apparatus, computer -readable recording medium storing an editing program, reproduction apparatus for the optical disc, and computer -readable recording medium storing an reproduction program
JP3597689B2 (ja) * 1998-01-21 2004-12-08 株式会社東芝 情報記録媒体及び情報記録媒体処理装置
EP2261920A3 (en) * 1998-02-23 2011-03-09 Kabushiki Kaisha Toshiba Information storage medium, information playback method and apparatus and information recording method
US6178204B1 (en) * 1998-03-30 2001-01-23 Intel Corporation Adaptive control of video encoder's bit allocation based on user-selected region-of-interest indication feedback from video decoder
US7360230B1 (en) 1998-07-27 2008-04-15 Microsoft Corporation Overlay management
CA2343751A1 (en) * 1998-07-27 2000-02-10 Webtv Networks, Inc. Remote computer access
US8189662B2 (en) * 1999-07-27 2012-05-29 Microsoft Corporation Selection compression
JP2000125136A (ja) * 1998-10-19 2000-04-28 Internatl Business Mach Corp <Ibm> 画像データ圧縮装置およびその方法
US6850565B2 (en) 1998-12-18 2005-02-01 Intel Corporation Real time bit rate control system
US6400852B1 (en) * 1998-12-23 2002-06-04 Luxsonor Semiconductors, Inc. Arbitrary zoom “on -the -fly”
EP1021048A3 (en) * 1999-01-14 2002-10-02 Kabushiki Kaisha Toshiba Digital video recording system and its recording medium
JP3715533B2 (ja) * 1999-02-05 2005-11-09 株式会社東芝 ストリーム情報の情報記憶媒体、その記録方法、再生方法、記録装置および再生装置
US6614470B1 (en) * 1999-02-26 2003-09-02 Sony Corporation Devices and methods for processing digital image data compatible with a television receiver
CN1204751C (zh) * 1999-04-13 2005-06-01 松下电器产业株式会社 编码数据变换方法、再编码方法、再编码系统以及数据记录媒体
JP2001014837A (ja) * 1999-06-29 2001-01-19 Funai Electric Co Ltd 記録媒体再生装置
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US6532593B1 (en) * 1999-08-17 2003-03-11 General Instrument Corporation Transcoding for consumer set-top storage application
JP4211153B2 (ja) * 1999-09-17 2009-01-21 ソニー株式会社 記録装置および方法
GB2356508B (en) * 1999-11-16 2004-03-17 Sony Uk Ltd Data processor and data processing method
JP2001285765A (ja) * 2000-03-29 2001-10-12 Nec Corp 放送番組蓄積方式
US6553150B1 (en) * 2000-04-25 2003-04-22 Hewlett-Packard Development Co., Lp Image sequence compression featuring independently coded regions
US6693648B1 (en) 2000-11-22 2004-02-17 Campus Crusade For Christ, Inc. Pointer interactive apparatus
US7248778B1 (en) * 2001-03-16 2007-07-24 Gateway Inc. Automated video editing system and method
JP3918447B2 (ja) * 2001-03-30 2007-05-23 三菱電機株式会社 動画像受信装置および動画像送信装置
WO2002100112A1 (en) * 2001-06-03 2002-12-12 Seelive Ltd. System and method for rapid video compression
US7194195B1 (en) * 2001-07-17 2007-03-20 Advanced Micro Devices, Inc. Software based digital video recorder device
US20030093515A1 (en) * 2001-11-14 2003-05-15 Kauffman Marc W. Quality of service control of streamed content delivery
US20030174228A1 (en) * 2002-03-14 2003-09-18 Brake Wilfred F. System for user-selectable image pre-processing in a digital camera
US7787741B2 (en) * 2002-04-23 2010-08-31 Gateway, Inc. Prioritized content recording and storage management
US7433532B2 (en) * 2002-05-01 2008-10-07 Kestrel Corporation Max entropy optimized retinal camera
JP4010284B2 (ja) * 2002-07-31 2007-11-21 富士通株式会社 動画再生装置及び動画再生方法
US8250034B2 (en) * 2004-04-14 2012-08-21 Verisign, Inc. Method and apparatus to provide visual editing
US8577683B2 (en) * 2008-08-15 2013-11-05 Thomas Majchrowski & Associates, Inc. Multipurpose media players
FR2889381A1 (fr) * 2005-07-28 2007-02-02 Thomson Licensing Sas Procede et dispositif de determination de parametres de quantification dans une image
TWI297994B (en) * 2005-12-08 2008-06-11 Inst Information Industry Encoder, method for adjusting decoding calculation, and computer readable record medium therefor
US7817557B2 (en) * 2006-08-29 2010-10-19 Telesector Resources Group, Inc. Method and system for buffering audio/video data
US7940653B2 (en) * 2006-08-29 2011-05-10 Verizon Data Services Llc Audiovisual data transport protocol
US9239958B2 (en) * 2007-11-09 2016-01-19 The Nielsen Company (Us), Llc Methods and apparatus to measure brand exposure in media streams
US20090162024A1 (en) * 2007-12-20 2009-06-25 Geevee, Inc. Intra-Media Demarcation
JP5676610B2 (ja) * 2009-08-12 2015-02-25 トムソン ライセンシングThomson Licensing 画像シーケンスの関心領域に基づくアーティファクト低減のためのシステム及び方法
US9924164B2 (en) * 2013-01-03 2018-03-20 Disney Enterprises, Inc. Efficient re-transcoding of key-frame-aligned unencrypted assets
US11553211B2 (en) * 2013-01-03 2023-01-10 Disney Enterprises, Inc. Heuristic detection of potential digital media artifacts and defects in digital media assets
EP3033872B1 (en) * 2013-08-13 2019-02-20 Beamr Imaging Ltd. Quality driven video re-encoding
US10070173B2 (en) 2016-12-22 2018-09-04 Arris Enterprises Llc Video encoder customization through use of crowdsourcing and program metadata
CN107274291B (zh) * 2017-06-21 2020-08-04 况客科技(北京)有限公司 跨平台的估值表解析方法、存储介质及应用服务器
US11645234B2 (en) * 2019-04-17 2023-05-09 International Business Machines Corporation Rule-based collections of subset(s) of metadata in response to a trigger event occurring
US11184648B2 (en) * 2019-08-30 2021-11-23 Rovi Guides, Inc. Systems and methods for providing content during reduced streaming quality
US11704891B1 (en) 2021-12-29 2023-07-18 Insight Direct Usa, Inc. Dynamically configured extraction, preprocessing, and publishing of a region of interest that is a subset of streaming video data
US11509836B1 (en) 2021-12-29 2022-11-22 Insight Direct Usa, Inc. Dynamically configured processing of a region of interest dependent upon published video data selected by a runtime configuration file
US11778167B1 (en) 2022-07-26 2023-10-03 Insight Direct Usa, Inc. Method and system for preprocessing optimization of streaming video data

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1197005A (en) * 1981-09-29 1985-11-19 Norio Suzuki System comprising a preliminary processing device controlled in accordance with an amount of information stored in a buffer
US4729044A (en) * 1985-02-05 1988-03-01 Lex Computing & Management Corporation Method and apparatus for playing serially stored segments in an arbitrary sequence
US4746994A (en) * 1985-08-22 1988-05-24 Cinedco, California Limited Partnership Computer-based video editing system
JPH0720228B2 (ja) * 1987-04-30 1995-03-06 日本電気株式会社 画像の圧縮記録システム
US4785349A (en) * 1987-10-05 1988-11-15 Technology Inc. 64 Digital video decompression system
US4951140A (en) * 1988-02-22 1990-08-21 Kabushiki Kaisha Toshiba Image encoding apparatus
US5016113A (en) * 1988-04-04 1991-05-14 Pioneer Electronic Corporation Apparatus for reproducing and processing picture information including graphic codes from a recording medium
US5164839A (en) * 1988-12-27 1992-11-17 Explore Technology, Inc. Method for handling audio/video source information
US5128776A (en) * 1989-06-16 1992-07-07 Harris Corporation Prioritized image transmission system and method
JPH03129987A (ja) * 1989-10-14 1991-06-03 Sony Corp 映像信号符号化装置及び映像信号符号化方法
EP0423979B1 (en) * 1989-10-20 1997-07-09 Sony Corporation High definition video signal recording systems
US5218672A (en) * 1990-01-19 1993-06-08 Sony Corporation Of America Offline editing system with user interface for controlling edit list generation
JP2969782B2 (ja) * 1990-05-09 1999-11-02 ソニー株式会社 符号化データ編集方法及び符号化データ編集装置
US5237648A (en) * 1990-06-08 1993-08-17 Apple Computer, Inc. Apparatus and method for editing a video recording by selecting and displaying video clips
US5390027A (en) * 1990-08-23 1995-02-14 Matsushita Electric Industrial Co., Ltd. Television program recording and reproducing system using program data of text broadcast signal
US5150208A (en) * 1990-10-19 1992-09-22 Matsushita Electric Industrial Co., Ltd. Encoding apparatus
JP3012698B2 (ja) * 1991-01-29 2000-02-28 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
US5249053A (en) * 1991-02-05 1993-09-28 Dycam Inc. Filmless digital camera with selective image compression
US5191645A (en) * 1991-02-28 1993-03-02 Sony Corporation Of America Digital signal processing system employing icon displays
US5333212A (en) * 1991-03-04 1994-07-26 Storm Technology Image compression technique with regionally selective compression ratio
JPH05508281A (ja) * 1991-04-18 1993-11-18 イーストマン・コダック・カンパニー 最小視覚ひずみのためのディジタル画像信号の二次量子化
JP3189861B2 (ja) * 1992-11-13 2001-07-16 ソニー株式会社 動画像符号化装置および方法
EP0526064B1 (en) * 1991-08-02 1997-09-10 The Grass Valley Group, Inc. Video editing system operator interface for visualization and interactive control of video material
US5144424A (en) * 1991-10-15 1992-09-01 Thomson Consumer Electronics, Inc. Apparatus for video data quantization control
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5355450A (en) * 1992-04-10 1994-10-11 Avid Technology, Inc. Media composer with adjustable source material compression
JP3298915B2 (ja) * 1991-12-28 2002-07-08 ソニー株式会社 符号化装置
KR100206261B1 (ko) * 1992-02-28 1999-07-01 윤종용 디지탈 vtr의 영상신호 대역 압축장치
US5283646A (en) * 1992-04-09 1994-02-01 Picturetel Corporation Quantizer control method and apparatus
EP0567697A1 (en) * 1992-04-29 1993-11-03 Yiu Keung Chan Method for spatial domain image compression
JP3093458B2 (ja) * 1992-07-23 2000-10-03 株式会社東芝 可変レート符・復号化装置
US5404316A (en) * 1992-08-03 1995-04-04 Spectra Group Ltd., Inc. Desktop digital video processing system
US5367341A (en) * 1992-10-20 1994-11-22 Canon Information Systems, Inc. Digital video editor having lost video frame protection
JP3106749B2 (ja) * 1992-12-10 2000-11-06 ソニー株式会社 適応型ダイナミックレンジ符号化装置
US5373327A (en) * 1993-02-25 1994-12-13 Hewlett-Packard Company Detection, correction and display of illegal color information in a digital video signal
JPH06326435A (ja) * 1993-05-11 1994-11-25 Noritake Co Ltd 半導体装置搭載基板
JPH0785693A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd 半導体記憶装置
US5463565A (en) * 1993-10-29 1995-10-31 Time Warner Entertainment Co., L.P. Data block format for software carrier and player therefor
DE69319353T3 (de) * 1993-10-29 2001-06-13 Toshiba Kawasaki Kk Aufzeichnungsmedium, wiedergabeverfahren und wiedergabegerät für mehrfachszenen
US5400077A (en) * 1993-10-29 1995-03-21 Time Warner Entertainment Co., L.P. System for generating multiple aspect ratio video signals from motion picture disk recorded in a single aspect ratio
JPH07212767A (ja) * 1994-01-21 1995-08-11 Matsushita Electric Ind Co Ltd 画像データ圧縮装置
JP3005147B2 (ja) * 1994-02-24 2000-01-31 シャープ株式会社 動画像符号化装置
CA2145914A1 (en) * 1994-05-27 1995-11-28 Alexandros Eleftheriadis Model-assisted coding of video sequences at low bit rates
JP3734286B2 (ja) * 1994-12-27 2006-01-11 株式会社東芝 動画像符号化装置及び動画像伝送装置
JPH08331561A (ja) * 1995-03-30 1996-12-13 Canon Inc 画像処理装置
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US5612900A (en) * 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
US5838874A (en) * 1995-05-08 1998-11-17 Kabushiki Kaisha Toshiba Audiovisual encoding system with a reduced number of audio encoders
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
US6026232A (en) * 1995-07-13 2000-02-15 Kabushiki Kaisha Toshiba Method and system to replace sections of an encoded video bitstream

Also Published As

Publication number Publication date
KR100283384B1 (ko) 2001-03-02
EP0824824A4 (en) 1998-09-09
JP3321457B2 (ja) 2002-09-03
CA2201516C (en) 2003-06-10
EP0824824A1 (en) 1998-02-25
EP0824824B1 (en) 2006-07-12
WO1996036170A1 (en) 1996-11-14
JPH11505092A (ja) 1999-05-11
US5819004A (en) 1998-10-06
CA2201516A1 (en) 1996-11-14
JP3253971B2 (ja) 2002-02-04
AU5547596A (en) 1996-11-29
DE69636337D1 (de) 2006-08-24
DE69636337T2 (de) 2007-10-11
AU708027B2 (en) 1999-07-29

Similar Documents

Publication Publication Date Title
JP3321457B2 (ja) デジタル的にエンコード及び圧縮されるビデオの編集方法
JP3481629B2 (ja) エンコードされているビデオシーケンスの品質を手動によりユーザが変更できるようにした方法及びシステム
JP3842537B2 (ja) エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム
JP3512812B2 (ja) 量子化レベルを変化させることによりビデオ・エンコーダのビット割当てを制御する速度制御式デジタル・ビデオ編集方法およびシステム
US5612900A (en) Video encoding method and system which encodes using a rate-quantizer model
JP3710820B2 (ja) オーディオエンコーダの数が低減されるオーディオ映像エンコードシステム
JP2001128126A6 (ja) エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム
JP3445278B6 (ja) エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム
AU735683B2 (en) Method and system to replace sections of an encoded video bitstream

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080621

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090621

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100621

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110621

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110621

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120621

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120621

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130621

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees