JP5369599B2 - 映像符号化装置、映像符号化方法 - Google Patents

映像符号化装置、映像符号化方法 Download PDF

Info

Publication number
JP5369599B2
JP5369599B2 JP2008269359A JP2008269359A JP5369599B2 JP 5369599 B2 JP5369599 B2 JP 5369599B2 JP 2008269359 A JP2008269359 A JP 2008269359A JP 2008269359 A JP2008269359 A JP 2008269359A JP 5369599 B2 JP5369599 B2 JP 5369599B2
Authority
JP
Japan
Prior art keywords
compressed data
video
random access
access point
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008269359A
Other languages
English (en)
Other versions
JP2010098627A (ja
Inventor
美智子 溝口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008269359A priority Critical patent/JP5369599B2/ja
Priority to US12/548,885 priority patent/US20100098161A1/en
Priority to KR20090088503A priority patent/KR101065819B1/ko
Publication of JP2010098627A publication Critical patent/JP2010098627A/ja
Application granted granted Critical
Publication of JP5369599B2 publication Critical patent/JP5369599B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Description

本発明は、入力された映像の符号化を行う映像符号化装置、映像符号化方法に関するものである。
コンピュータによる映像(動画像)編集においては、通常、フレーム単位で切り出す編集が行われるため、非圧縮のデータが最も扱い易い。しかしながら、映像は、データ量が多いため、ディスクなどの記憶媒体に保存することを考慮すると圧縮して記録することが一般的である。また、映像を伝送する場合、ネットワーク帯域を考慮し、映像を圧縮して伝送する。
従来、映像編集においては、非圧縮の映像データか、フレーム単位で切り出し可能なフレーム内圧縮の映像データを、取り扱うシステムが多かった。しかし、非圧縮やフレーム内圧縮の映像データがHD(High Definition)映像である場合、データ量や処理量が膨大となる。
従って、高圧縮が可能なMPEG(Moving Picture Experts Group)等のフレーム間圧縮を採用し、デコードしつつ編集するシステムや、必要に応じて編集用のプロキシファイルを別途作成し、そのファイルで編集するシステムが出てきている。
映像伝送においては、MPEG等のフレーム間圧縮を使用するシステムがある。その中には、データ伝送後に前述の編集システムで加工するシステムや、データ伝送しつつ、リアルタイムにデコードし、編集システムにデータを受け渡すシステムがある。
なお、従来技術として、圧縮動画像ストリームの任意指定フレームからの高速頭出しを提供する圧縮動画像の復号・表示装置、編集装置がある(例えば、特許文献1参照)。
特開平9−139915号公報
テレビを始め、取り扱う映像のHD化が進み、映像のデータ量が膨大になってきている。
全てのフレームから切り出し可能で編集が容易であるフレーム内圧縮は、圧縮が十分でなく、編集機器で表示するにもCPU(Central Processing Unit)負荷が高い。また、圧縮した映像データからプロキシファイルを作成する編集システムがある。ただし、プロキシファイル作成には、CPU処理性能および時間を要する。
また、映像伝送においては、HD映像を圧縮しても数Mbpsのスループットが必要である為、一部だけ切り出して送受信できれば、データ送受信に必要な時間も通信帯域も削減できる。しかし、同一の映像に対しても、受信側の用途によって必要な映像の箇所は異なるため、送信側で予め、切り出し対象とすべき映像の箇所を特定することは難しい。また運用上、送信側に設備を置くことが出来ない、あるいは編集者がいない場合が多く、受信側で編集する必要が出てくる。
送りたいというニーズが高い。その場合、送信側で編集する必要がある。
また、送信側が圧縮率(映像品質)を異ならせた複数種類の映像データを伝送するシステムもある。このシステムは、通常、高圧縮の映像データを伝送し、その映像データのフレームを指定して高品質の映像データ(すなわち低圧縮の映像データ)を取り出す。
しかし、フレーム間圧縮を用いて圧縮された映像データには、デコードする際に、前もしくは後のフレームのデータを用いる必要があるフレームと、1のフレーム内のデータのみでデコードできるフレームとがある。映像の切り出しの開始位置として指定できるのは、1のフレーム内のデータのみでデコードできるフレーム(すなわちランダムアクセスポイント)である。高圧縮の映像データと高品質の映像データとにおけるランダムアクセスポイントの出現位置は同期していないため、高圧縮の映像データで指定したフレームと厳密に同じタイミングのフレームを高品質の映像データから取り出すことは出来ない。例えば、映像伝送で使われる多くのリアルタイム映像符号化装置では、500msをグループとするピクチャー構造を持つので、複数の圧縮データの切出しポイントが数百msずれる可能性がある。
本発明は上述した問題点を解決するためになされたものであり、帯域の異なる2つの圧縮データのタイミングを正確に対応付けることができる映像符号化装置、映像符号化方法を提供することを目的とする。
上述した課題を解決するため、本発明の一態様は、入力される映像の符号化を行う映像符号化装置であって、クロックを生成するクロック生成部と、符号化の開始タイミングを指示する指示部と、入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成すると共に、指示部により指示された開始タイミングに第1圧縮データのランダムアクセスポイントを同期させ、クロック生成部により生成されたクロックに基づく時刻情報を第1圧縮データのランダムアクセスポイントへ付与する第1符号化部と、入力される映像の符号化を行って第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、指示部により指示された開始タイミングに第2圧縮データのランダムアクセスポイントを同期させ、第1圧縮データのランダムアクセスポイントの時刻情報を取得して、該ランダムアクセスポイントに同期する第2圧縮データのランダムアクセスポイントへ付与する第2符号化部とを有する。
また、本発明の一態様は、入力される映像の符号化をコンピュータにより行う映像符号化方法であって、符号化の開始タイミングを指示し、入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成すると共に、指示された開始タイミングに第1圧縮データのランダムアクセスポイントを同期させ、クロック生成部により生成されたクロックに基づく時刻情報を第1圧縮データのランダムアクセスポイントへ付与し、入力される映像の符号化を行って第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、指示された開始タイミングに第2圧縮データのランダムアクセスポイントを同期させ、第1圧縮データのランダムアクセスポイントの時刻情報を取得して、該ランダムアクセスポイントに同期する第2圧縮データのランダムアクセスポイントへ付与する。
また、本発明の構成要素、または構成要素の任意の組合せを、方法、装置、システム、記録媒体、データ構造などに適用したものも本発明に含む。
開示の映像符号化装置、映像符号化方法によれば、帯域の異なる2つの圧縮データのタイミングを正確に対応付けることができる。
以下、本発明の実施の形態について図面を参照しつつ説明する。
本発明に係る映像伝送システムの構成について説明する。
図1は、本発明に係る映像伝送システムの構成の一例を示すブロック図である。この映像伝送システムは、カメラ11、映像送信部12(映像符号化装置)、蓄積部13、映像受信部14を有する。映像送信部12と映像受信部14は、ネットワーク15を介して接続される。
カメラ11により生成されるソースである映像ソース及び音声ソースは、映像送信部12に入力される。映像ソースは、カメラ11により撮影されたデータであり、音声ソースは、カメラ11により録音されたデータである。
映像送信部12は、映像ソース及び音声ソースに対して2種類の圧縮を同時に行う。これにより得られる2種類の圧縮データは、例えばテレビ放送などの映像素材として求められる品質を満たす高ビットレート(広帯域、高品質、低圧縮)の圧縮映像データを有する高品質データ(第1圧縮データ)と、低ビットレート(狭帯域、低品質、高圧縮)の圧縮映像データを有するプロキシデータ(第2圧縮データ)とである。
プロキシデータは、例えば数百kbps程度の圧縮映像データを有し、リアルタイムにネットワーク15を介して遠隔地の映像受信部14に伝送される。また、映像送信部12は、プロキシデータと高品質データとを同時に蓄積部13へ保存する。従って、映像送信部12は、後から映像受信部14へ伝送することも可能である。蓄積部13は、ストレージ装置で実現される。
映像受信部14は、PC(Personal Computer)で実現され、編集プログラムを実行する。また、映像受信部14は、編集プログラムにより、受信データの保存、受信データのデコード及びデコードされた映像及び音声の表示、表示された映像中のフレームの指定、等を行う。
プロキシデータを受信した映像受信部14は、受信したプロキシデータをデコードして表示する。ユーザは、映像受信部14により表示されたプロキシデータを閲覧し、プロキシデータ中のフレームを指定して高品質データの開始フレームとする。開始フレームが指定されると、映像受信部14は、開始フレーム以降の高品質データの要求(指定情報)を、映像送信部12へ送信する。要求を受信した映像送信部12は、開始フレーム以降の高品質データを映像受信部14へ送信する。高品質データを受信した映像受信部14は、受信した高品質データをデコードして表示する。
また、ユーザは、映像受信部14に表示されるプロキシデータ中の2つのフレームを指定して開始フレームと終了フレームとしても良い。その場合、映像受信部14は、開始フレームから終了フレームまでの高品質データの要求を、映像送信部12へ送信する。要求を受信した映像送信部12は、開始フレームから終了フレームまでの高品質データを映像受信部14へ送信する。
また、ユーザは、映像受信部14に表示されるプロキシデータ中の1つのフレームを指定して開始フレームとし、更に時間長を指定しても良い。その場合、映像受信部14は、開始フレームから時間長分の高品質データの要求を、映像送信部12へ送信する。要求を受信した映像送信部12は、開始フレームから時間長分の高品質データを映像受信部14へ送信する。
ここで、圧縮映像データは、MPEG等のフレーム間符号化方式により圧縮されたデータである。圧縮映像データのピクチャー構造は、GOP(Group Of Pictures)を単位として、各GOPにI(Intra-coded:フレーム内符号化)フレームを有し、更に、P(Predicted)フレーム、B(Bi-directional Predicted)フレームを含むことができる。
また、ユーザにより開始フレームまたは終了フレームとして指定されることが可能なポイントであるランダムアクセスポイント(RAP:Random Access Point)は、Iフレームである。開始フレームだけが指定された場合、映像送信部12は、開始フレームのGOP以降の高品質データを映像受信部14へ送信する。開始フレームと終了フレームが指定された場合、映像送信部12は、開始フレームのGOPから終了フレームの直前のGOPまでの高品質データを映像受信部14へ送信する。
高品質データは、例えば数Mbps程度であり、指定されたフレーム以降が映像送信部12から映像受信部14へダウンロードされる。このように、高品質データの必要な部分のみが伝送されることにより、ネットワーク15を効率的に利用することができる。
図2は、本発明に係る映像送信部12の構成の一例を示すブロック図である。映像送信部12は、エンコーダ21a(第2符号化部),21b(第1符号化部)、CPU23(指示部)、フレームメモリ24、オーディオメモリ25、ネットワークI/F(Interface)26(送信部及び受信部)、共有メモリ27(記憶部)、動作クロック発生部28(クロック生成部)を有する。
CPU23は、エンコーダ21a,21bの制御を行う。フレームメモリ24は、フレームを単位とするリングバッファのような構成であり、複数のフレームの映像ソースを格納する。オーディオメモリ25は、音声ソースを格納する。ネットワークI/F26は、蓄積部13に蓄積された圧縮データの送信や、圧縮データの要求の受信を、ネットワーク15を介して行う。共有メモリ27は、タイムスタンプに関する情報を格納する。この情報は、エンコーダ21bにより書き込まれ、エンコーダ21aにより読み出される。
エンコーダ21a,21bは、それぞれDSP(Digital Signal Processor)で実現され、それぞれCPU23に従って独立に動作し、ソースを圧縮してそれぞれ異なる圧縮率(帯域)を有する圧縮データを生成する。
エンコーダ21aは、ビデオ符号化部31a、オーディオ符号化部32a、多重化部33aを有する。ビデオ符号化部31aは、フレームメモリ24に格納された映像ソースを圧縮して圧縮映像データを生成する。オーディオ符号化部32aは、オーディオメモリ25に格納された音声ソースを圧縮して圧縮音声データを生成する。多重化部33aは、圧縮映像データと圧縮音声データとの多重化を行って圧縮データを生成する。
エンコーダ21bは、ビデオ符号化部31b、オーディオ符号化部32b、多重化部33bを有する。ビデオ符号化部31b、オーディオ符号化部32b、多重化部33bはそれぞれ、上述のビデオ符号化部31a、オーディオ符号化部32a、多重化部33aと同様のハードウェアである。但し、エンコーダ21a,21bは、CPU23により与えられる設定値が異なる。
動作クロック発生部28は、エンコーダ21a,21bのビデオ符号化部31、オーディオ符号化部32、多重化部33へ動作クロックを供給する。
映像送信部12の動作について以下に説明する。
図3は、本発明に係る映像送信部12における各部の動作の一例を示すシーケンス図である。このシーケンス図は、上から下へ時間の流れを示し、左から順に、CPU23、エンコーダ21b、エンコーダ21aの動作を示す。
まず、CPU23は、エンコーダ21bに圧縮パラメータbを設定し(S11)、エンコーダ21aに圧縮パラメータaを設定する(S12)。圧縮パラメータaは、フレームレートFa、GOPフレーム数Gaを有する。同様に、圧縮パラメータbは、フレームレートFb、GOPフレーム数Gbを有する。
パラメータbは、高品質データを生成するためのパラメータであり、パラメータaは、プロキシデータを生成するためのパラメータである。また、パラメータbのフレームレートは、パラメータaのフレームレートの整数倍である。また、パラメータbのGOPフレーム数は、パラメータaのGOPフレーム数の整数倍である。
次に、CPU23は、エンコーダ21a,21bに符号化開始の指示を行い(S13)、スリープする(S14)。
符号化開始の指示を受けたビデオ符号化部31bは、カメラ11からの映像ソースにおけるフレーム毎の同期信号のタイミングと、動作クロック発生部28からの動作クロックとに基づいて、映像ソースの符号化を行って圧縮映像データを生成する(S21b)。ここで、ビデオ符号化部31bは、同期信号のタイミングで、フレームメモリ24からフレームを取り込む。また、ビデオ符号化部31bは、動作クロックのカウント値に基づくPTS(Presentation Time Stamp)またはタイムコードを圧縮映像データに付加する。
同時に、オーディオ符号化部32bは、動作クロック発生部28からの動作クロックに従って、音声ソースの符号化を行って圧縮音声データを生成する。
同時に、符号化開始の指示を受けたビデオ符号化部31aは、カメラ11からの映像ソースにおけるフレーム毎の同期信号のタイミングと、動作クロック発生部28からの動作クロックとに基づいて、映像ソースの符号化を行って圧縮映像データを生成する(S21a)。
同時に、オーディオ符号化部32aは、動作クロック発生部28からの動作クロックに従って、音声ソースの符号化を行って圧縮音声データを生成する。
ここで、ビデオ符号化部31a,31bは、符号化開始の指示を受けると、必ずIフレームから符号化を開始する。
次に、多重化部33bは、圧縮データに付加されたPTS及びIフレームであるか否かを示すIフレームフラグを共有メモリ27へ書き込む(S23)。次に、多重化部33bは、ビデオ符号化部31bにより生成された圧縮映像データとオーディオ符号化部32bにより生成された圧縮音声データとの多重化(システム多重)を行って圧縮データである高品質データを生成する(S24)。次に、多重化部33bは、生成された高品質データを蓄積部13へ蓄積する(S25)。
次に、多重化部33aは、ビデオ符号化部31aにより生成された圧縮映像データとオーディオ符号化部32aにより生成された圧縮音声データとの多重化(システム多重)を行って圧縮データであるプロキシデータを生成する(S26)。次に、多重化部33aは、共有メモリ27に格納されたPTS及びIフレームフラグを読み出し、プロキシデータのPTSを、共有メモリ27から読み出されたPTSに書き換える(S27)。ここで、多重化部33aは、読み出されたIフレームフラグとプロキシデータのIフレームフラグとに基づいて、読み出されたフレームに同期するプロキシデータのフレームを特定し、PTSを書き換える。次に、ネットワークI/F26は、多重化部33aにより書き換えられたプロキシデータを映像受信部14へ送信する(S28)。
高品質データとプロキシデータに互いに異なるPTSが付加されたとしても、多重化部33aがPTSを書き換えることにより、高品質データとプロキシデータの対応するフレーム同士のPTSを同一にすることができる。
次に、ビデオ符号化部31bは、符号化終了の指示を受けたか否かの判定を行う(S31b)。符号化終了の指示を受けていない場合(S31b,N)、このフローは処理S21bへ戻る。符号化終了の指示を受けた場合(S31b,Y)、このフローは終了する。
同様に、ビデオ符号化部31aは、符号化終了の指示を受けたか否かの判定を行う(S31a)。符号化終了の指示を受けていない場合(S31a,N)、このフローは処理S21aへ戻る。符号化終了の指示を受けた場合(S31a,Y)、このフローは終了する。
なお、ビデオ符号化部31aが共有メモリ27に格納されたPTS及びIフレームフラグを読み出し、共有メモリ27から読み出されたPTSを同期するそれに同期するプロキシデータのPTSとして付与しても良い。
ピクチャー構造について以下に説明する。
図4は、本発明を適用しない映像伝送システムにおけるピクチャー構造の一例を示すタイムチャートである。この図において、上段は、高品質データのPTS及びピクチャー構造を示し、下段は、プロキシデータのPTS及びピクチャー構造を示す。また、この図の横軸は、時間を表す。ピクチャー構造において、各フレームに記されたアルファベットは、IフレームまたはPフレームの種別を示す。ここでは、高品質データのGOPフレーム数を4フレーム、高品質データのフレームレートを8fps、プロキシデータのGOPフレーム数を1フレーム、プロキシデータのフレームレートを2fpsとする。つまり、高品質データのGOP時間長とプロキシデータのGOP時間長とは、等しく、500msecである。
本発明を適用しない映像伝送システムにおいて、プロキシデータのIフレームとそれにより指定される高品質データのIフレームとが撮影された時刻は、異なる場合がある。
図5は、本発明の映像伝送システムにおけるピクチャー構造の第1の例を示すタイムチャートである。この図において、上段は、高品質データのPTS及びピクチャー構造を示し、下段は、プロキシデータのPTS及びピクチャー構造を示す。また、この図の横軸は、時間を表す。ピクチャー構造において、各フレームに記されたアルファベットは、IフレームまたはPフレームの種別を示す。ここでは、高品質データのGOPフレーム数を4フレーム、高品質データのフレームレートを8fps、プロキシデータのGOPフレーム数を1フレーム、プロキシデータのフレームレートを2fpsとする。つまり、高品質データのGOP時間長とプロキシデータのGOP時間長とは、等しく、500msecである。
ピクチャー構造の第1の例において、プロキシデータのIフレームとそれにより指定される高品質データのIフレームとが撮影された時刻は等しく、プロキシデータと高品質データは同期している。
図6は、本発明の映像伝送システムにおけるピクチャー構造の第2の例を示すタイムチャートである。この図において、上段は、高品質データのPTS及びピクチャー構造を示し、下段は、プロキシデータのPTS及びピクチャー構造を示す。また、この図の横軸は、時間を表す。ピクチャー構造において、各フレームに記されたアルファベットは、IフレームまたはPフレームの種別を示す。ここでは、高品質データのGOPフレーム数を4フレーム、高品質データのフレームレートを8fps、プロキシデータのGOPフレーム数を2フレーム、プロキシデータのフレームレートを4fpsとする。つまり、高品質データのGOP時間長とプロキシデータのGOP時間長とは、等しく、500msecである。
ピクチャー構造の第2の例において、プロキシデータのIフレームとそれにより指定される高品質データのIフレームとが撮影された時刻は等しく、プロキシデータと高品質データは同期している。
図7は、本発明の映像伝送システムにおけるピクチャー構造の第3の例を示すタイムチャートである。この図において、上段は、高品質データのPTS及びピクチャー構造を示し、下段は、プロキシデータのPTS及びピクチャー構造を示す。また、この図の横軸は、時間を表す。ピクチャー構造において、各フレームに記されたアルファベットは、IフレームまたはPフレームまたはBフレームの種別を示す。ここでは、高品質データのGOPフレーム数を15フレーム、高品質データのフレームレートを30fps、プロキシデータのGOPフレーム数を5フレーム、プロキシデータのフレームレートを10fpsとする。つまり、高品質データのGOP時間長とプロキシデータのGOP時間長とは、等しく、500msecである。
ピクチャー構造の第3の例において、プロキシデータのピクチャー構造は、IフレームのほかにPフレームを含む。エンコーダ21aがプロキシデータにPフレームやBフレームを含めることにより、プロキシデータは、容量を抑えつつ、フレームレートが高く、滑らかに表示されるものとなる。このようにプロキシデータのフレームレートを高くすることにより、プロキシデータを視聴用としても利用することができる。
ピクチャー構造の第3の例において、プロキシデータのIフレームとそれにより指定される高品質データのIフレームとが撮影された時刻は等しく、プロキシデータと高品質データは同期している。
本実施の形態によれば、カメラ11(撮影地点)や映像送信部12(送信地点)から離れた映像受信部14(受信地点)において、プロキシデータを用いて高品質データの開始フレームを正確に指定することができる。
本実施の形態によれば、映像の切り出しの為のプロキシデータをリアルタイムに作成することで、高品質データの伝送または編集を効率的に行うことができる。すなわち、映像圧縮時に高品質データとプロキシデータにおけるPTSとランダムアクセスポイント(RAP)を同期させておくことにより、巨大な高品質データをサーチすることや、RAPを示す参照テーブルを作成することを必要とせずに、編集を行うことが可能となる。また、映像伝送においても同期したプロキシデータを使うことにより、必要な部分だけの高品質データを正確に伝送することが可能となる。その際に、正確なフレームを指定することが出来、遠隔地からの映像編集も可能であり、映像の送出システムにも応用する事が考えられる。
本発明は、その精神または主要な特徴から逸脱することなく、他の様々な形で実施することができる。そのため、前述の実施の形態は、あらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は、特許請求の範囲によって示すものであって、明細書本文には、何ら拘束されない。更に、特許請求の範囲の均等範囲に属する全ての変形、様々な改良、代替および改質は、全て本発明の範囲内のものである。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
入力される映像の符号化を行う映像符号化装置であって、
クロックを生成するクロック生成部と、
前記符号化の開始タイミングを指示する指示部と、
前記入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成すると共に、前記指示部により指示された前記開始タイミングに前記第1圧縮データのランダムアクセスポイントを同期させ、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与する第1符号化部と、
前記入力される映像の符号化を行って前記第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、前記指示部により指示された前記開始タイミングに前記第2圧縮データのランダムアクセスポイントを同期させ、前記第1圧縮データのランダムアクセスポイントの前記時刻情報を取得して、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与する第2符号化部と、
を備える映像符号化装置。
(付記2)
前記第1符号化部は、前記第1圧縮データにおいて所定の時間間隔のランダムアクセスポイントを生成し、
前記第2符号化部は、前記第2圧縮データにおいて前記所定の時間間隔でランダムアクセスポイントを生成する、
付記1に記載の映像符号化装置。
(付記3)
前記第1圧縮データの前記所定の時間間隔におけるフレーム数は、前記第2圧縮データの前記所定の時間間隔におけるフレーム数の複数倍である、
付記2に記載の映像符号化装置。
(付記4)
更に、前記時刻情報を記憶する記憶部を備え、
前記第1符号化部は、前記第1圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与すると共に前記記憶部へ格納し、
前記第2符号化部は、前記記憶部に格納された前記第1圧縮データのランダムアクセスポイントの前記時刻情報を読み出して該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与する、
付記1に記載の映像符号化装置。
(付記5)
更に、前記時刻情報を記憶する記憶部を備え、
前記第1符号化部は、前記第1圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮映像データのランダムアクセスポイントへ付与すると共に前記記憶部へ格納し、
前記第2符号化部は、前記第2圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第2圧縮映像データのランダムアクセスポイントへ付与し、前記記憶部に格納された前記第1圧縮データのランダムアクセスポイントの前記時刻情報を読み出し、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントの時刻情報を前記記憶部から読み出された時刻情報に書き換える、
付記1に記載の映像符号化装置。
(付記6)
更に、
前記第2符号化部により生成された前記第2圧縮データを外部の復号化装置へ送信する送信部と、
前記第1符号化部により生成された前記第1圧縮データを蓄積する蓄積部と
を備える、
付記5に記載の映像符号化装置。
(付記7)
更に、
前記復号化装置から少なくとも1つのランダムアクセスポイントを指定する情報である指定情報を受信する受信部を備え、
開始点のランダムアクセスポイントを指定する前記指定情報を前記受信部が受信した場合、前記送信部は、前記指定情報により指定された前記開始点以降の前記第1圧縮データを送信する、
付記6に記載の映像符号化装置。
(付記8)
開始点のランダムアクセスポイント及び終了点のランダムアクセスポイントを指定する前記指定情報を前記受信部が受信した場合、前記送信部は、前記指定情報により指定された前記開始点から前記終了点までの前記第1圧縮データを送信する、
付記6に記載の映像符号化装置。
(付記9)
前記第1符号化部は、所定のフレーム間符号化方式により前記第1圧縮データを生成し、
前記第2符号化部は、前記所定のフレーム間符号化方式により前記第2圧縮データを生成する、
付記1に記載の映像符号化装置。
(付記10)
前記第1圧縮データのGOPの時間長と前記第2圧縮データのGOPの時間長とは、等しい、
付記9に記載の映像符号化装置。
(付記11)
前記第1圧縮データのGOPは、フレーム内符号化されたフレームとフレーム間符号化されたフレームを有し、
前記第2圧縮データのGOPは、フレーム内符号化されたフレームだけを有する、
付記9に記載の映像符号化装置。
(付記12)
入力される映像の符号化をコンピュータにより行う映像符号化方法であって、
前記符号化の開始タイミングを指示し、
前記入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成すると共に、指示された前記開始タイミングに前記第1圧縮データのランダムアクセスポイントを同期させ、クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与し、
前記入力される映像の符号化を行って前記第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、指示された前記開始タイミングに前記第2圧縮データのランダムアクセスポイントを同期させ、前記第1圧縮データのランダムアクセスポイントの前記時刻情報を取得して、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与する、
映像符号化方法。
(付記13)
前記第1圧縮データにおいて所定の時間間隔のランダムアクセスポイントを生成し、
前記第2圧縮データにおいて前記所定の時間間隔でランダムアクセスポイントを生成する、
付記12に記載の映像符号化方法。
(付記14)
前記第1圧縮データの前記所定の時間間隔におけるフレーム数は、前記第2圧縮データの前記所定の時間間隔におけるフレーム数の複数倍である、
付記13に記載の映像符号化方法。
(付記15)
前記第1圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与すると共に記憶部へ格納し、
前記記憶部に格納された前記第1圧縮データのランダムアクセスポイントの前記時刻情報を読み出して該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与する、
付記12に記載の映像符号化方法。
(付記16)
前記第1圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮映像データのランダムアクセスポイントへ付与すると共に記憶部へ格納し、
前記第2圧縮データを生成すると共に、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第2圧縮映像データのランダムアクセスポイントへ付与し、前記記憶部に格納された前記第1圧縮データのランダムアクセスポイントの前記時刻情報を読み出し、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントの時刻情報を前記記憶部から読み出された時刻情報に書き換える、
付記12に記載の映像符号化方法。
(付記17)
更に、
前記第2符号化部により生成された前記第2圧縮データを外部の復号化装置へ送信し、
前記第1符号化部により生成された前記第1圧縮データを蓄積する、
付記16に記載の映像符号化方法。
(付記18)
更に、
前記復号化装置から少なくとも1つのランダムアクセスポイントを指定する情報である指定情報を受信し、
開始点のランダムアクセスポイントを指定する前記指定情報を受信した場合、前記指定情報により指定された前記開始点以降の前記第1圧縮データを送信する、
付記17に記載の映像符号化方法。
(付記19)
開始点のランダムアクセスポイント及び終了点のランダムアクセスポイントを指定する前記指定情報を受信した場合、前記指定情報により指定された前記開始点から前記終了点までの前記第1圧縮データを送信する、
付記18に記載の映像符号化方法。
(付記20)
所定のフレーム間符号化方式により前記第1圧縮データを生成し、
前記所定のフレーム間符号化方式により前記第2圧縮データを生成する、
付記12に記載の映像符号化方法。
本発明に係る映像伝送システムの構成の一例を示すブロック図である。 本発明に係る映像送信部12の構成の一例を示すブロック図である。 本発明に係る映像送信部12における各部の動作の一例を示すシーケンス図である。 本発明を適用しない映像伝送システムにおけるピクチャー構造の一例を示すタイムチャートである。 本発明の映像伝送システムにおけるピクチャー構造の第1の例を示すタイムチャートである。 本発明の映像伝送システムにおけるピクチャー構造の第2の例を示すタイムチャートである。 本発明の映像伝送システムにおけるピクチャー構造の第3の例を示すタイムチャートである。
符号の説明
11 カメラ、12 映像送信部、13 蓄積部、14 映像受信部、21a,21b エンコーダ、23 CPU、24 フレームメモリ、25 オーディオメモリ、26 ネットワークI/F、27 共有メモリ、28 動作クロック発生部

Claims (4)

  1. 入力される映像の符号化を行う映像符号化装置であって、
    クロックを生成するクロック生成部と、
    前記符号化の開始タイミングを指示する指示部と、
    前記入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成して蓄積すると共に、前記指示部により指示された前記開始タイミングに前記第1圧縮データのランダムアクセスポイントを同期させ、前記クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与して記憶部へ格納する第1符号化部と、
    前記入力される映像の符号化を行って前記第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、前記指示部により指示された前記開始タイミングに前記第2圧縮データのランダムアクセスポイントを同期させ、前記第1圧縮データのランダムアクセスポイントの前記時刻情報を前記記憶部から取得して、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与する第2符号化部と
    前記第2符号化部により生成された前記第2圧縮データを外部の復号化装置へ送信する送信部と、
    前記復号化装置から開始点のランダムアクセスポイント及び終了点のランダムアクセスポイントを指定する指定情報を受信する受信部とを備え、
    前記送信部は、前記指定情報を前記受信部が受信した場合、前記指定情報により指定された前記開始点から前記終了点までの前記第1圧縮データを前記復号化装置へ送信する、映像符号化装置。
  2. 前記第1符号化部は、前記第1圧縮データにおいて所定の時間間隔のランダムアクセスポイントを生成し、
    前記第2符号化部は、前記第2圧縮データにおいて前記所定の時間間隔でランダムアクセスポイントを生成する、
    請求項1に記載の映像符号化装置。
  3. 前記第1圧縮データの前記所定の時間間隔におけるフレーム数は、前記第2圧縮データの前記所定の時間間隔におけるフレーム数の複数倍である、
    請求項2に記載の映像符号化装置。
  4. 入力される映像の符号化をコンピュータにより行う映像符号化方法であって、
    前記符号化の開始タイミングを指示し、
    前記入力される映像の符号化を行って所定の第1帯域を有する第1圧縮データを生成して蓄積すると共に、指示された前記開始タイミングに前記第1圧縮データのランダムアクセスポイントを同期させ、クロック生成部により生成されたクロックに基づく時刻情報を前記第1圧縮データのランダムアクセスポイントへ付与して記憶部へ格納し、
    前記入力される映像の符号化を行って前記第1帯域より狭い第2帯域を有する第2圧縮データを生成すると共に、指示された前記開始タイミングに前記第2圧縮データのランダムアクセスポイントを同期させ、前記記憶部から前記第1圧縮データのランダムアクセスポイントの前記時刻情報を取得して、該ランダムアクセスポイントに同期する前記第2圧縮データのランダムアクセスポイントへ付与し、
    前記第2圧縮データを外部の復号化装置へ送信し、
    前記復号化装置から開始点のランダムアクセスポイント及び終了点のランダムアクセスポイントを指定する指定情報を受信し、
    受信した前記指定情報により指定された前記開始点から前記終了点までの前記第1圧縮データを前記復号化装置へ送信する、
    映像符号化方法。
JP2008269359A 2008-10-20 2008-10-20 映像符号化装置、映像符号化方法 Expired - Fee Related JP5369599B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008269359A JP5369599B2 (ja) 2008-10-20 2008-10-20 映像符号化装置、映像符号化方法
US12/548,885 US20100098161A1 (en) 2008-10-20 2009-08-27 Video encoding apparatus and video encoding method
KR20090088503A KR101065819B1 (ko) 2008-10-20 2009-09-18 영상 부호화 장치, 영상 부호화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008269359A JP5369599B2 (ja) 2008-10-20 2008-10-20 映像符号化装置、映像符号化方法

Publications (2)

Publication Number Publication Date
JP2010098627A JP2010098627A (ja) 2010-04-30
JP5369599B2 true JP5369599B2 (ja) 2013-12-18

Family

ID=42108654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008269359A Expired - Fee Related JP5369599B2 (ja) 2008-10-20 2008-10-20 映像符号化装置、映像符号化方法

Country Status (3)

Country Link
US (1) US20100098161A1 (ja)
JP (1) JP5369599B2 (ja)
KR (1) KR101065819B1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110286533A1 (en) * 2010-02-23 2011-11-24 Fortney Douglas P Integrated recording and video on demand playback system
JP5652066B2 (ja) * 2010-09-03 2015-01-14 ヤマハ株式会社 動画圧縮制御装置、動画記録装置及び動画記録再生装置
JP5853142B2 (ja) * 2011-01-24 2016-02-09 パナソニックIpマネジメント株式会社 動画伝送システム
US11284133B2 (en) * 2012-07-10 2022-03-22 Avago Technologies International Sales Pte. Limited Real-time video coding system of multiple temporally scaled video and of multiple profile and standards based on shared video coding information
JP6436818B2 (ja) * 2015-03-10 2018-12-12 キヤノン株式会社 記録装置及び方法
JP6952339B2 (ja) * 2018-01-12 2021-10-20 ザインエレクトロニクス株式会社 映像信号受信装置および映像信号送受信システム
KR102072615B1 (ko) * 2018-09-19 2020-02-03 인하대학교 산학협력단 Hevc의 복호화 지연 감소 기술을 적용한 임의 접근 영상 스트리밍 방법 및 장치
CN113491122A (zh) * 2020-10-20 2021-10-08 深圳市大疆创新科技有限公司 视频处理方法、装置和设备、无人机、图传系统
CN113452961A (zh) * 2021-06-21 2021-09-28 上海鹰觉科技有限公司 基于边缘计算的水面监控告警系统和方法、介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH087535A (ja) * 1994-06-24 1996-01-12 Max World:Kk ビデオ編集方法およびその装置
EP1588548B1 (en) * 2003-01-28 2010-10-13 Thomson Licensing Robust mode staggercasting
KR100537305B1 (ko) * 2003-03-20 2005-12-16 원태영 네트워크 디지털 비디오 레코더의 동영상 압축 저장 방법
JP4174718B2 (ja) * 2003-06-13 2008-11-05 ソニー株式会社 編集装置及び編集方法
JP4689231B2 (ja) * 2004-10-25 2011-05-25 池上通信機株式会社 トランスポートストリーム切換装置
KR100643291B1 (ko) * 2005-04-14 2006-11-10 삼성전자주식회사 랜덤 엑세스의 지연을 최소화하는 비디오 복부호화 장치 및방법
JP2007049504A (ja) * 2005-08-10 2007-02-22 Mitsubishi Electric Corp 記録媒体、再生装置および再生方法
KR100746076B1 (ko) * 2005-11-07 2007-08-06 엘지전자 주식회사 멀티미디어 신호의 시간정보 전송방법
US20090103835A1 (en) * 2006-01-13 2009-04-23 Yahoo! Inc. Method and system for combining edit information with media content
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
KR100831704B1 (ko) * 2006-10-13 2008-05-26 주식회사 엠아이비전 듀얼코덱을 이용한 영상처리보드 및 이를 이용한 고화질의영상표시 방법
CA2668670C (en) * 2006-11-14 2013-04-30 Qualcomm Incorporated Systems and methods for channel switching
US8630355B2 (en) * 2006-12-22 2014-01-14 Qualcomm Incorporated Multimedia data reorganization between base layer and enhancement layer

Also Published As

Publication number Publication date
KR101065819B1 (ko) 2011-09-20
JP2010098627A (ja) 2010-04-30
US20100098161A1 (en) 2010-04-22
KR20100044090A (ko) 2010-04-29

Similar Documents

Publication Publication Date Title
JP5369599B2 (ja) 映像符号化装置、映像符号化方法
JP6793231B2 (ja) 受信方法
KR100711635B1 (ko) 화상 부호화 방법
KR100557103B1 (ko) 데이터 처리방법 및 데이터 처리장치
JP4816667B2 (ja) データ処理装置及び方法、ならびに編集システム及び方法
US20090310934A1 (en) Picture interdependencies signals in context of mmco to assist stream manipulation
JP7067653B2 (ja) 復号装置
US20190373213A1 (en) Information processing device and method
JP4526294B2 (ja) ストリームデータ送信装置、受信装置、プログラムを記録した記録媒体、およびシステム
JP4613860B2 (ja) Mpeg符号化ストリーム復号装置
JP4174960B2 (ja) 信号処理装置及び方法並びにファイル生成方法
KR20040065170A (ko) 화상 정보 복호 장치 및 방법
JP6641344B2 (ja) 符号化装置
JP2004158929A (ja) 動画像処理方法および動画像処理装置ならびに動画像伝送装置
JP6825075B2 (ja) 復号装置
JP4237129B2 (ja) ネットワーク対応映像機器及びネットワーク対応映像システム
JP6446347B2 (ja) サムネイル提供装置、表示装置、サムネイル映像表示システム、サムネイル映像表示方法、及びプログラム
JP7003308B2 (ja) 復号装置
JP6464647B2 (ja) 動画像処理方法、動画像の送信装置、動画像処理システムおよび動画像処理プログラム
JP4967402B2 (ja) 多重化ストリーム変換装置および方法
JP6257448B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP2007195064A (ja) 画像情報伝送装置、画像情報伝送方法、プログラム及び記憶媒体
JP3897753B2 (ja) 記憶出力装置
JP2004180224A (ja) 動画像通信システム、動画再生端末、動画像配信装置及び動画像再生方法
JP5100852B2 (ja) デジタル信号記録再生装置および方法、デジタル信号再生装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130527

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130902

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees