JP2005535200A - Personal TV optimization - Google Patents
Personal TV optimization Download PDFInfo
- Publication number
- JP2005535200A JP2005535200A JP2004525618A JP2004525618A JP2005535200A JP 2005535200 A JP2005535200 A JP 2005535200A JP 2004525618 A JP2004525618 A JP 2004525618A JP 2004525618 A JP2004525618 A JP 2004525618A JP 2005535200 A JP2005535200 A JP 2005535200A
- Authority
- JP
- Japan
- Prior art keywords
- model
- computer
- television system
- personal television
- video signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000005457 optimization Methods 0.000 title description 28
- 238000012545 processing Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims abstract description 35
- 230000006870 function Effects 0.000 claims abstract description 31
- 230000006835 compression Effects 0.000 claims description 22
- 238000007906 compression Methods 0.000 claims description 22
- 230000002068 genetic effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013442 quality metrics Methods 0.000 claims description 6
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 5
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 5
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 101150067537 AMD2 gene Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003094 perturbing effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/4147—PVR [Personal Video Recorder]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Picture Signal Circuits (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
パーソナルテレビシステムをモデル化するための方法、システムおよびコンピュータ読取可能な媒体が提供される。パーソナルテレビシステムにより受信映像信号に実行される処理工程を含む、映像処理チェーンのコンピュータ実装モデルが形成され、パーソナルテレビシステム内における記憶前の映像信号の符号化に相当する第1の機能部分と、パーソナルテレビシステム内における記憶された符号化済映像データの復号に相当する第2の機能部分とを含む、1つまたは複数の追加機能が、そのモデルに挿入される。Methods, systems, and computer readable media are provided for modeling personal television systems. A first functional portion corresponding to encoding of a video signal before storage in a personal television system, wherein a computer-implemented model of a video processing chain is formed, including processing steps performed on a received video signal by a personal television system; One or more additional functions are inserted into the model, including a second functional part corresponding to the decoding of the stored encoded video data in the personal television system.
Description
本発明は、テレビのためのモデル化および最適化技術に関するものである。 The present invention relates to modeling and optimization techniques for televisions.
無線送信されているかケーブルテレビ(CATV)システムを介して配信されているかにかかわらず、アナログテレビ放送信号を受信することができ、後に視聴者が再生できるようにそれらを記録するため、デジタル圧縮および記憶技術を使用することができる、数多くの「パーソナルテレビ」(PTV)システムが、市場に投入されている。3つのそのようなシステムとして、フィリップスおよびソニーが販売している「TiVoTM」、松下(パナソニック)が販売している「Replay−TVTM」、およびマイクロソフトが販売している「Ultimate−TVTM」が挙げられる。これらのシステムは、視聴者が従来はビデオ・カセット・レコーダー(VCR)を用いてきた機能である同一の主機能、すなわち放送番組のタイムシフトを実行するが、視聴者が第2の番組を録画しながら第1の番組を見ることを可能にするというさらなる利点を提供し、また、直線的なビデオテープ内における録画された番組の位置や、新しい番組を録画できる使用可能なテープの位置および長さを覚えておくことから、ユーザーを解放するものである。そのため、これらのシステムは、ますます人気が出てきており、アナログ形式の放送映像の送信および配信が利用され続ける限り、この傾向はおそらく続くであろう。 Regardless of whether it is being transmitted wirelessly or distributed via a cable television (CATV) system, analog television broadcast signals can be received and recorded for later playback by the viewer using digital compression and A number of “personal television” (PTV) systems that can use storage technology are on the market. Three such systems include “TiVo ™ ” sold by Philips and Sony, “Replay-TV ™ ” sold by Matsushita (Panasonic), and “Ultimate-TV ™ ” sold by Microsoft. Is mentioned. These systems perform the same main function that viewers have traditionally used video cassette recorders (VCRs), ie time-shifting broadcast programs, but viewers record a second program. While providing the additional advantage of allowing the first program to be viewed, and the position of the recorded program within a linear videotape, and the position and length of the tape available to record a new program It's freed up by remembering that. As such, these systems are becoming increasingly popular and this trend will likely continue as long as analog form broadcast video transmission and distribution continues to be utilized.
PTVシステムは、典型的には、アナログ高周波(RF)放送信号を受信し(衛星テレビ・デコーダのアナログ出力を用いてもよいが)、それらの信号を、復調およびアナログ映像復号処理(NTSC、PAL等)の後、デジタルフォーマットに変換する。これらの信号は、その後、MPEG1や2等の、損失を伴うデジタル映像圧縮方式を用いて圧縮され、高密度ハードディスクドライブ(HDD)等の大量記憶装置に記録される。近年の記憶装置の高いデータ容量(時と共に非常に急速に増え続けている)と共に圧縮技術を使用することにより、何時間もの放送映像をHDDに記録することが可能となり、それにより、アナログビデオ録画用テープの必要がなくなり、上記のデジタル記憶の利点が提供されるようになった。
A PTV system typically receives analog radio frequency (RF) broadcast signals (although the analog output of a satellite television decoder may be used), and those signals are demodulated and analog video decoded (NTSC, PAL). Etc.) and then convert to digital format. These signals are then compressed using a lossy digital video compression scheme, such as
一般的に、映像処理システムは、アナログ放送またはデジタル映像のいずれかとして送信されたが、両方としてではないソースの、画質を改善するように要請されている。アナログ放送映像の場合には、画質は、典型的には、たとえば、送信チャネルと映像信号の復調およびアナログ復号とによってスペクトル形状が決まるガウシアンノイズを含み得る、チャネルノイズによって劣化させられる。色精度や画像の鮮鋭度といった他の特徴も、この処理によって影響を受け得る。デジタル映像の場合には、ノイズは存在せず(映像信号のデジタル化前に取り込まれた少量のノイズを除く)、色精度は影響を受けない。しかしながら、損失を伴う圧縮およびそれに続く復号処理により、ブロック劣化(block impairment)等の多くの映像アーティファクトが取り込まれる可能性があり、また、画像の鮮鋭度も影響を受け得る。逆に、そのようなアーティファクトは、アナログ放送映像ソースには存在し得ない(そのソースがもとはデジタル形式である場合を除く。そのような場合、ソースは通常、低い圧縮比を用いて符号化されたものであり、したがって、高画質で、上記の画質劣化がほとんどないものである)。したがって、従来は、どちらか一方のカテゴリーの画質劣化のみが、受信された映像放送に現れ、両方が現れることはなかった。 In general, video processing systems are required to improve the image quality of sources that are transmitted as either analog broadcast or digital video, but not both. In the case of analog broadcast video, image quality is typically degraded by channel noise, which can include, for example, Gaussian noise whose spectral shape is determined by the transmission channel and the demodulation and analog decoding of the video signal. Other features such as color accuracy and image sharpness can also be affected by this process. In the case of digital video, there is no noise (except for a small amount of noise captured before digitization of the video signal), and color accuracy is not affected. However, lossy compression and subsequent decoding can introduce many video artifacts, such as block impairments, and can also affect image sharpness. Conversely, such artifacts cannot exist in an analog broadcast video source (except when the source is originally in digital form. In such cases, the source is typically encoded using a low compression ratio. Therefore, the image quality is high and there is almost no deterioration of the image quality). Therefore, conventionally, only the image quality degradation of one of the categories has appeared in the received video broadcast, but not both.
しかしながら、PTVシステムでは、アナログ放送信号は、従来のやり方で復調および復号されるので、従来のアナログ形式の画質劣化のうち、任意のまたはすべての画質劣化を有し得る。その後、その信号は、可能な限り少ないHDD領域を使用するために、許容できる最も高い圧縮比で圧縮される。これにより、後に映像がHDDから読み出され復号される際に、上記で述べたデジタル形式の画質劣化のうち、任意のまたはすべての画質劣化が映像に取り込まれる。かかる画像劣化は、これらのシステムで一般に使用される高い圧縮比では顕著となり得る。結果として、ユーザーが見る際には、同一の映像シーケンスが、アナログ放送の画質劣化とデジタル符号化の画質劣化との両方を持つこととなり、それらの画質劣化のいずれかまたは両方が極めて顕著なものとなるかもしれない。これは、従来の状況とは明らかに異なる状況である。 However, in a PTV system, analog broadcast signals are demodulated and decoded in a conventional manner, and thus can have any or all of the image quality degradation of conventional analog formats. The signal is then compressed at the highest acceptable compression ratio to use as little HDD space as possible. As a result, when the video is later read from the HDD and decoded, any or all of the image quality degradations in the digital format described above are captured in the video. Such image degradation can be significant at the high compression ratios commonly used in these systems. As a result, when viewed by the user, the same video sequence will have both analog broadcast image quality degradation and digital encoding image quality degradation, and either or both of these image quality degradations will be extremely prominent. It may become. This is a situation that is clearly different from the conventional situation.
映像処理システムにおいて画質を最適化するため、多くの方法が提案されてきた。自動映像チェーン最適化のための一般的な方法が、Van Zon,KeesならびにAli,Walidの「自動映像チェーン最適化(Automated Video Chain Optimization)」、コンシューマー・エレクトロニクス国際会議(International Conference on Consumer Electronics;ICCE)、2001年、および、Ali,WalidならびにVan Zon,Keesの「並列的な進化モデル化による、直列接続された映像処理モジュールのランダムなシステムの最適化(Optimizing a Random System of Cascaded Video Processing Modules by Parallel Evolution Modeling)」、画像処理国際会議(International Conference on Image Processing)、2001年に記載されている。これらの文献はいずれも、参照によりその全内容が本明細書に含まれているものとする。参照映像シーケンスが、処理動作の初期映像処理チェーンを用いて処理され、画質が測定される。通常、大きなパラメータ探索空間に亘って全体的な最適化を行うことを可能とする遺伝アルゴリズム等の最適化技術が、結果として得られる映像の客観的画質(objective image quality;OIQ)を特定する方法と共に適用される。かかる方法は、アナログ放送映像の画質を改善するように設計されたアナログ映像処理システム、またはデジタル符号化された映像用に設計されたデジタル映像システムに、適用または提案されてきた。 Many methods have been proposed to optimize image quality in video processing systems. General methods for automatic video chain optimization are “Automated Video Chain Optimization” by Van Zon, Kees and Ali, Walid, International Conference on Consumer Electronics; ICCE ), 2001, and Ali, Walid and Van Zon, Kees, “Optimizing a Random System of Cascaded Video Processing Modules by Serially Connected Video Processing Modules.” Parallel Evoluti on Modeling ”, International Conference on Image Processing, 2001. All of these documents are hereby incorporated by reference in their entirety. The reference video sequence is processed using the initial video processing chain of processing operations and the image quality is measured. Usually, an optimization technique such as a genetic algorithm that makes it possible to perform overall optimization over a large parameter search space is a method for specifying an objective image quality (OIQ) of a resultant image. Applied with. Such methods have been applied or proposed for analog video processing systems designed to improve the quality of analog broadcast video or digital video systems designed for digitally encoded video.
アナログ映像の場合、チャネルノイズ低減(時間的および/または空間的)や、鮮鋭度強調のためのピーキング(水平方向、および場合によっては垂直方向)といった技術が、画質の改善によく用いられ、典型的には、映像処理の「チェーン」がこれらおよびその他のビデオ機能を実施する。そのようなチェーンの最適化は、所与の機能に対して可能な限りの最良の画質を同時にもたらすような、これらすべての機能についてのパラメータの設定を必要とする。 For analog video, techniques such as channel noise reduction (temporal and / or spatial) and peaking for sharpness enhancement (horizontal and sometimes vertical) are often used to improve image quality. Specifically, a “chain” of video processing performs these and other video functions. Such chain optimization requires the setting of parameters for all these functions so as to simultaneously provide the best possible image quality for a given function.
デジタル映像については、異なる画像の対応領域間にノイズの結果として微小差分(small differentials)が現れるというよく知られた現象があり、それがやはり符号化を免れず、それにより限られたデータ帯域幅を無駄にしてしまうため、圧縮符号化に先立って何らかの形式のノイズ低減が使用されることが多い。ノイズの保持に加えてのこの結果は、有効符号化データレートを減少させることと等価であり、さらには圧縮比を増大させることと等価である。通常、かかる低いノイズレベルの直接的な結果である画質の視覚上の劣化は、これらのシステムにおいて考えるべき副次的な事項である。また、いくつかのシステムでは、復号後において高い圧縮比での符号化の結果として現れるブロック劣化の効果を、低減する方法が用いられている。やはりこれらの高い比において生じ得る高周波成分を破棄することにより、画像の鮮鋭度も顕著に減少し、何らかの形式の鮮鋭度強調が望ましくなる可能性がある。 For digital video, there is a well-known phenomenon that small differentials appear as a result of noise between corresponding regions of different images, which are still subject to encoding and thereby limited data bandwidth In some cases, some form of noise reduction is used prior to compression coding. This result in addition to noise retention is equivalent to reducing the effective encoded data rate and is equivalent to increasing the compression ratio. The visual degradation of image quality, which is usually a direct result of such low noise levels, is a secondary matter to consider in these systems. In some systems, a method of reducing the effect of block deterioration that appears as a result of encoding at a high compression ratio after decoding is used. By discarding the high frequency components that can also occur at these high ratios, the sharpness of the image is also significantly reduced, and some form of sharpness enhancement may be desirable.
したがって、PTVのための最適化方法が望まれている。 Therefore, an optimization method for PTV is desired.
パーソナルテレビシステムをモデル化するための方法、システムおよびコンピュータ読取可能な媒体が提供される。パーソナルテレビシステムにより受信映像信号に実行される処理工程を含む、映像処理チェーンのコンピュータ実装モデルが形成され、パーソナルテレビシステム内における記憶前の映像信号の符号化に相当する第1の機能部分と、パーソナルテレビシステム内における記憶された符号化済映像データの復号に相当する第2の機能部分とを含む、1つまたは複数の追加機能が上記のモデルに挿入される。 Methods, systems, and computer readable media are provided for modeling personal television systems. A first functional portion corresponding to encoding of a video signal before storage in a personal television system, wherein a computer-implemented model of a video processing chain is formed, including processing steps performed on a received video signal by a personal television system; One or more additional functions are inserted into the model, including a second functional part corresponding to the decoding of the stored encoded video data in the personal television system.
デジタル映像の符号化、記憶、読出し、復号および処理の機能を有する完全なPTVシステムは、上記の最初から4つ目までの要素(PTV内における符号化、記憶、読出しおよび復号)を映像処理チェーンの一部として取り扱うことにより、アナログ映像システムについて上記に述べたことに基づく技術を用いて最適化することができる。特に符号化は、典型的には、主たる(かつ、オプションとして唯一の)システムパラメータとして、所望のデータレート(または圧縮比)を用いて行われる。一方、復号は、あくまで取り出された映像データストリームの関数であって、したがって、調整可能なパラメータを有さない。 A complete PTV system having the functions of encoding, storing, reading, decoding and processing of digital video has the above-mentioned first to fourth elements (encoding, storing, reading and decoding in PTV) as a video processing chain. , The analog video system can be optimized using techniques based on what has been described above. In particular, encoding is typically performed using the desired data rate (or compression ratio) as the main (and optionally only) system parameter. On the other hand, decoding is a function of the extracted video data stream, and therefore has no adjustable parameters.
最後に、最近ますます一般的となってきているように、映像データのデータフロー表現が当該最適化方法で使用される場合には、記憶媒体の書込みおよび読出しは、単に映像データストリームの時間遅延を構成するものであり、したがって完全に無視できる。MPEG形式の符号化および復号は、この最適化の状況においてそれとしてモデル化され得るデジタル処理アルゴリズムであるが、それに加えて、この方法はデータ主導の方法であるので、ハードディスクにデータを記憶させてその後データを読み出す際には、時間の概念がない。したがって、後に読出しが続くデータの書込みは、時間遅延に過ぎない。符号化、記憶、読出しおよび復号は、常に直接連続したものとして実行されるので、デジタル処理システムのこれら4つの要素を、単一の機能として取り扱うことが可能である。 Finally, as the data flow representation of video data is used in the optimization method, as recently more and more common, storage media writing and reading are simply time delays in the video data stream. Therefore, it can be completely ignored. MPEG format encoding and decoding is a digital processing algorithm that can be modeled as such in the context of this optimization, but in addition, since this method is a data driven method, the data can be stored on a hard disk. When reading data thereafter, there is no concept of time. Therefore, writing data that is followed by reading is only a time delay. Since the encoding, storing, reading and decoding are always performed as directly continuous, these four elements of the digital processing system can be treated as a single function.
さらには、PTVの符号化、記憶、読出しおよび復号の処理動作の比較的単純なモデルでは、最適化処理中において単一のパラメータを変化させて、有効な最適化をもたらすことが可能である。かかる単一のパラメータの一例は、圧縮比である。圧縮比とデータレートとの間には1対1の関係があるので、圧縮比の代わりとしてデータレートを用いてもよい。あるいは、最適化処理中において2つ以上のパラメータを変化させる、より複雑なPTVの符号化、記憶、読出しおよび復号の処理動作のモデルを用いてもよい。図1は、PTVシステムの最適化のためのシステムを示したブロック図である。 Furthermore, a relatively simple model of PTV encoding, storing, reading and decoding processing operations can change a single parameter during the optimization process to provide effective optimization. An example of such a single parameter is the compression ratio. Since there is a one-to-one relationship between the compression ratio and the data rate, the data rate may be used instead of the compression ratio. Alternatively, a more complex model of PTV encoding, storage, reading and decoding processing operations that changes two or more parameters during the optimization process may be used. FIG. 1 is a block diagram illustrating a system for optimizing a PTV system.
PTVシステムは、各タイプのシステム(すなわち、アナログおよびデジタル)について上記に述べたそれぞれの機能の組合せを用いて、モデル化され得る。しかしながら、PTVシステムでは、ノイズ低減は、アナログチャネルノイズの低減とデジタル符号化効率の改善との2つの機能を果たす。また、鮮鋭度強調は、チャネル、復調および復号によるアナログ周波数の歪みと、デジタル圧縮による高周波情報の破棄との、両方の効果を打ち消す必要がある。 A PTV system can be modeled using a combination of the respective functions described above for each type of system (ie, analog and digital). However, in PTV systems, noise reduction serves two functions: reducing analog channel noise and improving digital coding efficiency. In addition, the sharpness enhancement needs to cancel both the effects of the distortion of the analog frequency due to channel, demodulation and decoding, and the discarding of high frequency information due to digital compression.
そのようなシステムの適切な最適化は、アナログシステムとデジタルシステムとの個々の最適化を、単純に組み合わせるだけよりも多くの要請を必然的に伴う。映像処理チェーン内で実行される機能は非直線的であるので、モデル内において複数の機能が実行される順序は、実際の映像処理チェーン内でそれらの機能が実行される順序を反映したものとされるべきであり、処理動作の順序(それらのアルゴリズム・パラメータおよびデータビット精度に加えて)は最適化され得る。PTVシステムは、従来型の映像処理チェーンの要素、すなわち、符号化、記憶、読出しおよび復号機能の要素に対して、たった1つの追加要素を加えることによって、モデル化することができる。この要素はまた、たった1つのパラメータ(具体的には圧縮比)しか有していない。したがって、最適化の複雑さを著しく増大させることなく、従来型の映像処理チェーンにおいて提案され使用されてきたモデル化方法を変更して、PTVシステムをモデル化することができる。そのため、かかる方法を用いて、商業的意義がますます増大していると見られるタイプの映像処理システムの、全体的な画質を最適化することができる。 Proper optimization of such a system entails more demand than simply combining individual optimizations of analog and digital systems. Since the functions executed in the video processing chain are non-linear, the order in which multiple functions are executed in the model reflects the order in which those functions are executed in the actual video processing chain. Should be done and the order of processing operations (in addition to their algorithm parameters and data bit precision) can be optimized. The PTV system can be modeled by adding only one additional element to the elements of the conventional video processing chain, ie the elements of encoding, storing, reading and decoding functions. This element also has only one parameter, specifically the compression ratio. Thus, the PTV system can be modeled by modifying the modeling methods that have been proposed and used in conventional video processing chains without significantly increasing the optimization complexity. For this reason, such methods can be used to optimize the overall image quality of a type of video processing system that is expected to be of increasing commercial significance.
図1を参照すると、例示的な最適化システムが示されている。このシステムは、映像処理チェーン・シミュレータ100を含んでいる。シミュレータ100は、イベント主導のシミュレーションとは対照的に、データ主導のものである。シミュレータ100は、入力参照映像に対して、PTV内の実際の映像処理システムが実行する処理動作と実質的に同一のデジタル信号処理動作を実行する。ただし、シミュレータ100は、それらの処理動作をリアルタイムで実行しなくてもよい点のみが、実際の映像処理システムと異なる。
Referring to FIG. 1, an exemplary optimization system is shown. This system includes a video
映像処理チェーン・シミュレータ100に入力されるデータは、デジタルフォーマットのデータである。PTVがアナログ送信信号を受信する場合は、映像入力データは、ベース帯域映像信号への復調とデジタル化とが実行された後のアナログ送信信号を表すものとなる。最適化の際には、反復モデル化および最適化の処理全体に亘って、同一の映像シーケンスが入力として用いられる。
Data input to the video
映像処理チェーン・シミュレータ100は、複数の映像処理アルゴリズム110a−110nを含んでいる。たとえば、アルゴリズム1(ブロック110a)はノイズ低減であってもよく、アルゴリズム2(ブロック110b)は鮮鋭度強調であってもよく、そのようにしてアルゴリズムN(ブロック110n)まで続き、アルゴリズムN(ブロック110n)はMPEGブロッキング効果の除去であってもよい。アルゴリズムの選択は、モデル化されるべきPTVシステム内で用いられているアルゴリズムに主導される。
The video
符号化、記憶、読出しおよび復号機能の間に実行される処理を表すため、少なくとも1つの追加機能120が追加される。この機能120の符号化部分は、最適化されたPTVシステム内で使用される実際の符号化ハードウェアをモデル化したものとされるべきである。実際には、MPEG形式のエンコーダ・チップが使用され得る。かかるチップは、ある決まった符号化アルゴリズムを用いるものであるので、そのチップにより実装されるアルゴリズムのソフトウェアモデルが用いられる。MPEGの1つの目的はできるだけ良好な圧縮を得ること、すなわちできるだけ良好な画像の忠実度を得ることであるので、MPEG形式のエンコーダを用いた、種々の異なるモデルが存在する。このことは、できるだけ多くの画素を効率的に処理すること、すなわち、最小限の数の符号化されたビットを用いてできるだけ多くの画素情報を処理することを必要とする。任意の映像シーケンスに対して、可能かつ適正な符号化は多数存在する。そのため、エンコーダ・モデルは、システム内で使用される実際のハードウェアをモデル化したものとされるべきである。
At least one
機能120のデコーダ部分は、MPEG1規格(ISO/IEC 11172−1(から−5まで):1993)またはMPEGII規格(ISO/IEC 13818−4:1998/Amd2:2000)から直接実装されたものであってもよい。これらの規格は、参照により、その内容が本明細書に含まれているものとする。MPEG規格の様々な部分は、Cコードのセグメントまたはブロックとして規定されているので、当業者においては、MPEGデコーダをモデル化するためのデコーダ・Cコードを容易に採用できるであろう。
The decoder part of
上記に述べたように、記憶および取出しの処理動作は遅延に相当するのみであり、シミュレーション中ではモデル化されない。いずれの処理動作も、データを変換したり、画質に影響を与えたりするものではない。映像処理チェーン・シミュレータ100からの復号された出力データは、客観的画質測定ブロック130へと供給される。客観的画質測定基準は、典型的には、予め決められた画像または映像シーケンスの組を用いた画像または映像シーケンスについての、客観的測定基準により与えられた画質尺度と、視聴者の集団による主観的な画像評価との間に、良好な相関付けを与えることにより、選択され調整される。客観的画質測定基準は、たとえば、アナログノイズ、ブロッキング、リンギング、モスキート状アーティファクトおよびその他のタイプのアーティファクトを考慮に入れた、画質の尺度を付与するものであってもよい。この測定基準は、上記の要素の各々が画質に及ぼす影響に対する互いに異なる重み付けにも適用可能なものである。その場合、重みを調整することにより、客観的な測定基準と主観的な評価とによって与えられた尺度の間の相関付けを、改善することができる。
As described above, the storage and retrieval processing operations only correspond to delays and are not modeled during simulation. Neither processing operation converts data or affects image quality. The decoded output data from the video
アルゴリズム・パラメータ、処理の順序付け、データビット精度、および結果として得られる客観的画質測定値が、最適化の目的に関係するパラメータである。実際の映像出力データは、最適化目的のために記憶されなくてもよい。 Algorithm parameters, processing ordering, data bit accuracy, and resulting objective image quality measurements are parameters that are relevant to the purpose of the optimization. Actual video output data may not be stored for optimization purposes.
ブロック140は、映像処理システム最適化ブロックである。この最適化ブロック140の望ましい属性には、精度とスピードが含まれる。パラメータ値と処理の順序付けとの異なる組合せは極めて多数存在するので、全体的な最適条件を見つけるために1つ1つすべての組合せを実行してみるのは現実的でない。一方、より大きな全体的な最大値またはより小さな全体的な最小値がある場合でも、極大値または極小値に収束する傾向のあるアルゴリズム(たとえばニュートン法)も、使用されるべきではない。
遺伝アルゴリズムは、映像処理チェーン最適化ブロック140のための、1つの好ましいアプローチである。遺伝アルゴリズムは、探索空間に関する事前情報を要さずに、全体的な最適条件に向かって進化していくことのできる、進化論に基づいた反復的かつ非限定的なアプローチを用いている。遺伝アルゴリズムは、それぞれが複数の「遺伝子」からなる「染色体」と呼ばれる解候補の組を生成する。各遺伝子は、特定のアルゴリズム・パラメータ値(またはアルゴリズム・パラメータ値のサブセット)、処理の順序付け、またはデータビット精度に対応する。
A genetic algorithm is one preferred approach for the video processing
1つの世代内の各染色体について、映像チェーンが形成される。これは、所与の所望の順序に並べられたすべてのブロック、所与のデータビット精度値の組、および所与のアルゴリズム・パラメータ値の組が選択され、シミュレーション100が実行され、客観的画質測定130の番号(「適合値(fitness value)」)がその遺伝アルゴリズムに与えられることを意味する。客観的画質測定130の値に基づいて、最適な画質測定値を有する染色体のサブセットが選択され、「クロスオーバー」によって組み合わされて、次の世代が形成される。クロスオーバーでは、アルゴリズム・パラメータ値のサブセット、パラメータの順序付け、およびデータビット精度(すなわち遺伝子のサブセット)が、染色体間で交換される。その後、ユーザー定義された何らかの(通常は低い)確率によって遺伝子のいくつかを乱すことにより、「変異(mutation)」が導入される。変異は、探索空間において探索される可能性がゼロである部分がなくなるように保証し、それによって、よりよい全体的な最適条件の解が存在しているときに極小値または極大値に収束してしまう可能性を低減させる。次の世代の染色体の全体の組は、直ちに処理され評価される準備が整っている。
A video chain is formed for each chromosome within a generation. This is because all blocks in a given desired order, a given set of data bit precision values, and a given set of algorithm parameter values are selected, and a
次の世代に使用される値が選択されると、映像処理チェーン制御ブロック150が、処理の順序付けおよびデータビット精度に加え、映像処理アルゴリズム110a−110nのそれぞれについて、さらに符号化、記憶、読出しおよび復号機能120について、パラメータ値を設定する。これにより、次の世代の染色体のそれぞれについて、同一の入力映像データの組を用いて、映像処理チェーン・シミュレータ100を再実行させることが可能となる。
Once the value to be used for the next generation is selected, the video processing chain control block 150 further encodes, stores, reads and stores each of the video processing algorithms 110a-110n in addition to processing ordering and data bit precision. A parameter value is set for the
反復処理の終了基準は、許容できる近似解または安定解への到達に基づく基準であってもよいし、予め決められた回数の変異分の反復や、予め決められた数の世代分の反復等に基づく基準であってもよい。 The criterion for termination of the iterative process may be a criterion based on the arrival of an acceptable approximate solution or a stable solution, or a predetermined number of mutation iterations, a predetermined number of generation iterations, etc. It may be a criterion based on.
遺伝アルゴリズムは、探索空間全体の比較的小さな部分の評価しか必要としないにもかかわらず(その結果、早い収束をもたらす)、精確な結果を与えるので、魅力的である。しかしながら、当業者においては、映像処理システム最適化ブロック140に、他の最適化アルゴリズムを使用することもできるであろう。
Genetic algorithms are attractive because they give accurate results despite requiring only a relatively small portion of the entire search space to be evaluated (resulting in fast convergence). However, those skilled in the art could use other optimization algorithms for the video processing
図2は、パーソナルテレビシステムをモデル化するための1つの方法を示している。 FIG. 2 illustrates one method for modeling a personal television system.
ステップ200において、パーソナルテレビシステムにより受信映像信号に実行される処理工程110a−110nを含む、映像処理チェーンのコンピュータ実装モデル100が形成される。このモデルは、アルゴリズム・パラメータ、処理の順序付けおよびデータビット精度の、調整を許容するものである。
In
ステップ202では、パーソナルテレビシステム内における記憶前の映像信号の符号化に相当する、エンコーダ固有の機能部分が、映像処理チェーン・モデル100に挿入される。
In
ステップ204では、シミュレーションは、記憶および取出しを無視することができる。これは、これらの処理動作のいずれも、画像データを変換したり、画質に影響を与えたりしないためである。
In
ステップ206では、PTV内に記憶されているデータの、MPEG1形式またはMEPG2形式の復号に相当する機能部分が、映像処理チェーン・モデル100に挿入される。実施形態によっては、ステップ202および206が統合されて、符号化および復号に相当する単一の機能が形成され、記憶および読出しは無視される。
In
ステップ208−214は、反復による最適化を提供する。ステップ208では、映像処理チェーン・モデル100が実行される。
Steps 208-214 provide iterative optimization. In step 208, the video
ステップ210では、客観的画質測定基準と対照して、シミュレーションの結果が評価される。
In
ステップ212では、たとえば遺伝アルゴリズムであってもよい最適化アルゴリズムに従って、モデルが調整される。この調整は、ステップ214において、調整パラメータとして圧縮比(またはデータレート)を用いた符号化/復号機能の調整であって、この圧縮比(またはデータレート)が唯一の調整パラメータであってもよい調整を含んでいてもよい。
In
ステップ208−214は、終了基準が満たされるまで繰り返される。 Steps 208-214 are repeated until the termination criteria are met.
本発明は、コンピュータ実装された処理、およびそれらの処理を実行するための装置の形態で、実施されてもよい。本発明はまた、ランダム・アクセス・メモリ(RAM)、フロッピー・ディスク、読出専用メモリ(ROM)、CD−ROM、DVD−ROM、ハードドライブ、高密度(たとえば「ZIPTM」または「JAZZTM」)リムーバブル・ディスク、または、コンピュータがその媒体からコンピュータ・プログラム・コードをロードし実行すると、そのコンピュータが本発明を実施する装置となるような、その他の任意のコンピュータ読取可能な記憶媒体といった、有形の媒体内に組み入れられたコンピュータ・プログラム・コードの形態で実施されてもよい。本発明はまた、たとえば、記憶媒体に記憶されたものであるか、コンピュータによりロードおよび/または実行されるものであるか、電気的な導線またはケーブル、光ファイバー、または電磁放射といった、何らかの伝送媒体を介して伝送されるものであるかにかかわらず、コンピュータがそのコンピュータ・プログラム・コードをロードし実行すると、そのコンピュータが本発明を実施する装置となるような、コンピュータ・プログラム・コードの形態で実施されてもよい。汎用プロセッサに実装される場合には、コンピュータ・プログラム・コードのセグメントによって、特定の論理回路が形成されるように、そのプロセッサが設定される。本発明は、例示的な実施形態の形で説明されてきたが、それらの形態に限定されるものではない。むしろ、本発明の範囲およびその均等の範囲から逸脱することなく当業者が考えつくであろう、本発明の他のバリエーションおよび実施形態を包含するように、各請求項は広く解釈されるべきである。 The present invention may be implemented in the form of computer-implemented processes and apparatuses for performing the processes. The present invention also includes random access memory (RAM), floppy disk, read only memory (ROM), CD-ROM, DVD-ROM, hard drive, high density (eg, “ZIP ™ ” or “JAZZ ™ ”). Tangible, such as a removable disk or any other computer-readable storage medium that, when the computer loads and executes the computer program code from the medium, makes the computer an apparatus embodying the invention It may be implemented in the form of computer program code embedded in the medium. The invention also includes any transmission medium, such as stored in a storage medium, loaded and / or executed by a computer, electrical conductors or cables, optical fiber, or electromagnetic radiation. Implemented in the form of computer program code such that when the computer loads and executes the computer program code, whether or not it is transmitted via the computer, the computer becomes an apparatus embodying the present invention. May be. When implemented on a general-purpose processor, the computer program code segments configure the processor so that a specific logic circuit is formed. Although the invention has been described in the form of exemplary embodiments, it is not limited to those forms. Rather, the claims should be construed broadly to include other variations and embodiments of the invention that would occur to those skilled in the art without departing from the scope of the invention and its equivalents. .
Claims (27)
(a)前記パーソナルテレビシステムにより受信映像信号に実行される処理工程を含む、映像処理チェーンのコンピュータ実装モデルを形成する工程と、
(b)前記パーソナルテレビシステム内における記憶前の前記映像信号の符号化に相当する第1の機能部分と、前記パーソナルテレビシステム内における記憶された符号化済映像データの復号に相当する第2の機能部分とを含む、1つまたは複数の追加機能を、前記モデルに挿入する工程とを含むことを特徴とする方法。 A method of modeling a personal television system,
(A) forming a computer-implemented model of a video processing chain including processing steps performed on the received video signal by the personal television system;
(B) a first functional part corresponding to the encoding of the video signal before storage in the personal television system, and a second functional part corresponding to decoding of the encoded video data stored in the personal television system. Inserting one or more additional functions, including functional parts, into the model.
(d)前記工程(c)により生成された出力に基づいて、前記映像処理チェーンの該モデルを調整する工程とをさらに含むことを特徴とする請求項1記載の方法。 (C) after the step (b), executing the computer-implemented model;
The method of claim 1, further comprising: (d) adjusting the model of the video processing chain based on the output generated by step (c).
(a)前記パーソナルテレビシステムにより受信映像信号に実行される処理工程を含む、映像処理チェーンのコンピュータ実装モデルを形成する工程と、
(b)前記パーソナルテレビシステム内における記憶前の前記映像信号の符号化に相当する第1の機能部分と、前記パーソナルテレビシステム内における記憶された符号化済映像データの復号に相当する第2の機能部分とを含む、1つまたは複数の追加機能を、前記モデルに挿入する工程とを含むものであることを特徴とするコンピュータ読取可能な媒体。 A computer on which the computer program code is encoded and stored such that when the computer program code is executed by a processor, the processor executes a method for modeling a video processing chain in a personal television system. A readable medium, the method comprising:
(A) forming a computer-implemented model of a video processing chain including processing steps performed on the received video signal by the personal television system;
(B) a first functional part corresponding to the encoding of the video signal before storage in the personal television system, and a second functional part corresponding to decoding of the encoded video data stored in the personal television system. A computer-readable medium comprising: inserting one or more additional functions, including functional parts, into the model.
(c)前記工程(b)の後に、前記コンピュータ実装モデルを実行する工程と、
(d)前記工程(c)により生成された出力に基づいて、前記映像処理チェーンの該モデルを調整する工程とをさらに含むことを特徴とする請求項10記載のコンピュータ読取可能な媒体。 Said method comprises
(C) after the step (b), executing the computer-implemented model;
11. The computer readable medium of claim 10, further comprising: (d) adjusting the model of the video processing chain based on the output generated by the step (c).
前記パーソナルテレビシステムにより受信映像信号に実行される処理工程を含む、映像処理チェーンのモデルがプログラムされたコンピュータを含み、
該コンピュータが、前記モデル内に、前記パーソナルテレビシステム内における記憶前の前記映像信号の符号化に相当する第1の機能部分と、前記パーソナルテレビシステム内における記憶された符号化済映像データの復号に相当する第2の機能部分とを含む、1つまたは複数の追加機能を含んでいることを特徴とするシステム。 A system for modeling a personal television system,
Including a computer programmed with a model of a video processing chain, including processing steps performed on the received video signal by the personal television system;
The computer includes, in the model, a first functional part corresponding to encoding of the video signal before storage in the personal television system, and decoding of encoded video data stored in the personal television system. A system comprising one or more additional functions including a second functional part corresponding to.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/210,836 US20040025183A1 (en) | 2002-07-31 | 2002-07-31 | Optimization of personal television |
PCT/IB2003/003001 WO2004014076A2 (en) | 2002-07-31 | 2003-07-07 | Video signal processing optimization in a pvr |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005535200A true JP2005535200A (en) | 2005-11-17 |
Family
ID=31187440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004525618A Withdrawn JP2005535200A (en) | 2002-07-31 | 2003-07-07 | Personal TV optimization |
Country Status (7)
Country | Link |
---|---|
US (1) | US20040025183A1 (en) |
EP (1) | EP1527604A2 (en) |
JP (1) | JP2005535200A (en) |
KR (1) | KR20050026039A (en) |
CN (1) | CN1672413A (en) |
AU (1) | AU2003281822A1 (en) |
WO (1) | WO2004014076A2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010165360A (en) * | 2004-11-16 | 2010-07-29 | Seiko Epson Corp | Image evaluation method, image evaluation device and printer |
JP2020504374A (en) * | 2016-12-30 | 2020-02-06 | 山東大学 | Feedback-based self-adaptive objective weighted context awareness system and method of operation. |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8418216B2 (en) * | 2010-05-30 | 2013-04-09 | Arris Solutions, Inc. | Forecasting and cable television network—planning of narrowcast services |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6400996B1 (en) * | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US7082222B2 (en) * | 2001-01-10 | 2006-07-25 | Koninklije Philips Electronics N.V. | System and method for optimizing control parameter settings in a chain of video processing algorithms |
-
2002
- 2002-07-31 US US10/210,836 patent/US20040025183A1/en not_active Abandoned
-
2003
- 2003-07-07 EP EP03740924A patent/EP1527604A2/en not_active Withdrawn
- 2003-07-07 JP JP2004525618A patent/JP2005535200A/en not_active Withdrawn
- 2003-07-07 WO PCT/IB2003/003001 patent/WO2004014076A2/en not_active Application Discontinuation
- 2003-07-07 KR KR1020057001591A patent/KR20050026039A/en not_active Application Discontinuation
- 2003-07-07 CN CNA038182173A patent/CN1672413A/en active Pending
- 2003-07-07 AU AU2003281822A patent/AU2003281822A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010165360A (en) * | 2004-11-16 | 2010-07-29 | Seiko Epson Corp | Image evaluation method, image evaluation device and printer |
JP4678067B2 (en) * | 2004-11-16 | 2011-04-27 | セイコーエプソン株式会社 | Image evaluation method, image evaluation apparatus, and printing apparatus |
JP2020504374A (en) * | 2016-12-30 | 2020-02-06 | 山東大学 | Feedback-based self-adaptive objective weighted context awareness system and method of operation. |
Also Published As
Publication number | Publication date |
---|---|
KR20050026039A (en) | 2005-03-14 |
WO2004014076A3 (en) | 2004-06-03 |
EP1527604A2 (en) | 2005-05-04 |
CN1672413A (en) | 2005-09-21 |
US20040025183A1 (en) | 2004-02-05 |
AU2003281822A8 (en) | 2004-02-23 |
AU2003281822A1 (en) | 2004-02-23 |
WO2004014076A2 (en) | 2004-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8428127B2 (en) | Method of performing rate control for a compression system | |
US8036280B2 (en) | Image coding and decoding method and apparatus considering human visual characteristics | |
US7272183B2 (en) | Image processing device, method and storage medium thereof | |
US9258605B2 (en) | System and method for transrating based on multimedia program type | |
US7295757B2 (en) | Advancing playback of video data based on parameter values of video data | |
US7359615B2 (en) | Method and device for ensuring storage time for digital broadcast | |
US20030159152A1 (en) | Fast motion trick mode using dummy bidirectional predictive pictures | |
US20070112826A1 (en) | Multimedia transcoding based on remaining storage capacity | |
US20050265448A1 (en) | Image processing apparatus | |
CN101969557B (en) | Image recording device, and image recording method | |
US20110182498A1 (en) | Image Processing Apparatus, Image Processing Method, and Program | |
US7940843B1 (en) | Method of implementing improved rate control for a multimedia compression and encoding system | |
JP2005535200A (en) | Personal TV optimization | |
US7257312B2 (en) | Fast motion trick mode using dummy predictive pictures | |
JP3807225B2 (en) | Compressed video signal recording device | |
JP4267036B2 (en) | Display control apparatus and display control method | |
US7643724B2 (en) | Fast motion trick mode using non-progressive dummy predictive pictures | |
US6990287B2 (en) | Fast motion trick mode using dummy bidirectional predictive pictures | |
JP4301237B2 (en) | Encoding apparatus and method thereof, recording apparatus and method thereof, and recording medium | |
JP2008526077A (en) | Video stream changing device | |
US20100054326A1 (en) | Method and apparatus for detecting start and end of a video sequence | |
CA2451995A1 (en) | Modifying video by inserting shadow intra pictures | |
US20060187356A1 (en) | Video playback apparatus and video playback method | |
EP0838952A2 (en) | Method and apparatus for processing encoded image sequence data | |
US8630533B2 (en) | Editing apparatus, editing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060706 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070522 |