JP5092028B2 - Video processing apparatus and video processing method - Google Patents

Video processing apparatus and video processing method Download PDF

Info

Publication number
JP5092028B2
JP5092028B2 JP2011066570A JP2011066570A JP5092028B2 JP 5092028 B2 JP5092028 B2 JP 5092028B2 JP 2011066570 A JP2011066570 A JP 2011066570A JP 2011066570 A JP2011066570 A JP 2011066570A JP 5092028 B2 JP5092028 B2 JP 5092028B2
Authority
JP
Japan
Prior art keywords
pictures
picture
processing unit
gop
played back
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011066570A
Other languages
Japanese (ja)
Other versions
JP2011172252A (en
Inventor
文俊 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011066570A priority Critical patent/JP5092028B2/en
Publication of JP2011172252A publication Critical patent/JP2011172252A/en
Application granted granted Critical
Publication of JP5092028B2 publication Critical patent/JP5092028B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、動画像データを再生する映像処理装置及び映像処理方法に関する。   The present invention relates to a video processing apparatus and video processing method for reproducing moving image data.

近年、パーソナルコンピュータ、ビデオレコーダ等の電子機器で動画像データを再生し、視聴する機会が増加している。再生される動画像データには、DVDに収録された動画像データやテレビジョン放送信号によって放送される放送番組データを録画した動画像データの他、インターネット上の動画像データ共有サイト等から入手された動画像データ等がある。このため、パーソナルコンピュータ、ビデオレコーダ等の電子機器には、MPEG−2(H.262|MPEG−2),MPEG−4,MPEG−4 AVC(H.264|MPEG−4 AVC)等、さまざまな形式の動画像データに対応した再生機能が要求される。   In recent years, opportunities to reproduce and view moving image data on electronic devices such as personal computers and video recorders have increased. The moving image data to be reproduced is obtained from moving image data sharing sites on the Internet in addition to moving image data recorded on a DVD or moving image data recorded by broadcast program data broadcasted by a television broadcast signal. Moving image data. For this reason, there are various electronic devices such as a personal computer and a video recorder such as MPEG-2 (H.262 | MPEG-2), MPEG-4, MPEG-4 AVC (H.264 | MPEG-4 AVC). A reproduction function corresponding to the moving image data in the format is required.

特許文献1には、ビデオデータに記載されているフレームレートを使用しないで、オーディオとビデオの同期合わせを制御できるオーディオ・ビデオ同期再生方法が開示されている。このオーディオ・ビデオ同期再生方法は、ビデオデータ内においてタイムスタンプが付加されたフレームを用いて、最新のタイムスタンプと一つ前のタイムスタンプとの間の差分時間及びフレーム数を算出し、これら差分時間とフレーム数とを用いて、フレームレートを算出する。   Patent Document 1 discloses an audio / video synchronized reproduction method capable of controlling synchronization between audio and video without using a frame rate described in video data. In this audio / video synchronized playback method, a difference time and the number of frames between the latest time stamp and the previous time stamp are calculated using a frame with a time stamp added in the video data. The frame rate is calculated using the time and the number of frames.

特開平11−355726号公報Japanese Patent Laid-Open No. 11-355726

ところで、動画像データに対して、再生のタイミングに関する情報をGOPのような処理単位毎に付加することは、動画像データの形式によっては必須でない場合がある。例えば、MPEG−4 AVC(H.264|MPEG−4 AVC)の動画像データは、再生のタイミングに関する情報を含まないGOPも使用し得る。このため、例えば、ライブストリームのような動画像データを途中から再生する場合、ピクチャの表示タイミングが分からず、滑らかに再生することができない可能性がある。   By the way, it may not be essential to add the information regarding the reproduction timing to the moving image data for each processing unit such as GOP depending on the format of the moving image data. For example, MPEG-4 AVC (H.264 | MPEG-4 AVC) moving image data may use a GOP that does not include information related to playback timing. For this reason, for example, when moving image data such as a live stream is reproduced from the middle, there is a possibility that the display timing of the picture is not known and cannot be reproduced smoothly.

また、インターネット上で配信された動画像データ等には、厳密には規格に準拠しておらず、再生のタイミングに関する情報が付加されていない動画像データが存在する可能性がある。このような動画像データも、再生のタイミングが不明であるため、滑らかに再生することが困難である。   In addition, there is a possibility that moving image data distributed on the Internet does not strictly conform to the standard, and there is moving image data to which information regarding reproduction timing is not added. Such moving image data is also difficult to reproduce smoothly because the reproduction timing is unknown.

本発明は上述の事情を考慮してなされたものであり、再生のタイミングが不明である動画像データを滑らかに再生できる映像処理装置及び映像処理方法を提供することを目的とする。   The present invention has been made in consideration of the above-described circumstances, and an object thereof is to provide a video processing apparatus and a video processing method capable of smoothly reproducing moving image data whose reproduction timing is unknown.

上述の課題を解決するため、本発明の映像処理装置は、所定の再生時間に対応する複数のピクチャをそれぞれ含む複数の処理単位から構成される符号化された動画像データを復号する復号手段と、前記復号手段によって前記動画像データ内の再生対象の処理単位が復号される際に、前記再生対象の処理単位内に含まれるピクチャをカウントすることによってピクチャの数を検出し、前記再生対象の処理単位内に含まれるプログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合を検出する検出手段と、前記再生対象の処理単位内にタイミング情報が含まれていない場合、前記再生対象の処理単位の一つ前の再生済みの処理単位の復号時に前記検出手段によって検出されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合と、前記所定の再生時間とに基づいて再生フレームレートを算出するフレームレート算出手段と、前記算出された再生フレームレートに基づいて、前記再生対象の処理単位内に含まれる複数のピクチャの表示タイミングを決定する表示タイミング決定手段とを具備する。
In order to solve the above-described problem, a video processing apparatus according to the present invention includes decoding means for decoding encoded moving image data including a plurality of processing units each including a plurality of pictures corresponding to a predetermined reproduction time. When the processing unit to be reproduced in the moving image data is decoded by the decoding unit, the number of pictures included in the processing unit to be reproduced is counted to detect the number of pictures to be reproduced. Detecting means for detecting a ratio between a progressive frame picture and an interlaced field picture included in the processing unit; and when the timing information is not included in the playback target processing unit, the playback target processing unit the number and the progressive previous picture detected by said detecting means at the time of decoding the reproduced processing units of And percentage of the field picture of the frame picture and an interlace method in the method, the frame rate calculating means for calculating a reproduction frame rate based on said predetermined reproduction time, on the basis of the reproduction frame rate the calculated, the reproduction object Display timing determining means for determining the display timing of a plurality of pictures included in the processing unit.

本発明によれば、再生のタイミングが不明である動画像データを滑らかに再生できる映像処理装置および映像処理方法を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the video processing apparatus and video processing method which can reproduce smoothly the moving image data whose reproduction timing is unknown can be provided.

本発明の一実施形態に係る映像処理装置の外観の例を示す斜視図。The perspective view which shows the example of the external appearance of the video processing apparatus which concerns on one Embodiment of this invention. 同実施形態の映像処理装置の構成例を示すブロック図。The block diagram which shows the structural example of the video processing apparatus of the embodiment. 同実施形態の映像処理装置で用いられる映像処理アプリケーションの機能構成の例を示すブロック図。2 is an exemplary block diagram showing an example of the functional configuration of a video processing application used in the video processing apparatus of the embodiment. FIG. 同実施形態の映像処理装置に入力される動画像データの構成例を示す図。The figure which shows the structural example of the moving image data input into the video processing apparatus of the embodiment. 図5の動画像データの具体的な構成例を示す図。The figure which shows the specific structural example of the moving image data of FIG. 図5の動画像データの表示タイミングを算出する方法を説明するための図。The figure for demonstrating the method of calculating the display timing of the moving image data of FIG. 図5の動画像データの表示タイミングを算出する具体例を示す図。The figure which shows the specific example which calculates the display timing of the moving image data of FIG. 図5の動画像データの表示タイミングを算出する別の具体例を示す図。The figure which shows another specific example which calculates the display timing of the moving image data of FIG. 同実施形態の映像処理装置によって実行される表示タイミング算出処理の手順を示すフローチャート。6 is an exemplary flowchart illustrating a procedure of display timing calculation processing executed by the video processing apparatus according to the embodiment.

以下、図面を参照して、本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

まず、図1および図2を参照して、本発明の一実施形態に係る映像処理装置の構成を説明する。本実施形態の映像処理装置は、例えば、情報処理装置として機能するノートブック型の携帯型パーソナルコンピュータ10から実現されている。   First, with reference to FIG. 1 and FIG. 2, the structure of the video processing apparatus which concerns on one Embodiment of this invention is demonstrated. The video processing apparatus according to the present embodiment is realized by, for example, a notebook portable personal computer 10 that functions as an information processing apparatus.

このパーソナルコンピュータ10は、放送番組データ、外部機器から入力されるビデオデータ、インターネットのようなネットワークを通じて配信されるビデオデータといった、映像コンテンツデータ(オーディオビジュアルコンテンツデータ)を再生することができる。   The personal computer 10 can reproduce video content data (audio visual content data) such as broadcast program data, video data input from an external device, and video data distributed through a network such as the Internet.

図1はコンピュータ10のディスプレイユニットを開いた状態における斜視図である。本コンピュータ10は、コンピュータ本体11と、ディスプレイユニット12とから構成されている。ディスプレイユニット12には、TFT−LCD(Thin Film Transistor Liquid Crystal Display)17から構成される表示装置が組み込まれている。   FIG. 1 is a perspective view of the computer 10 with the display unit opened. The computer 10 includes a computer main body 11 and a display unit 12. The display unit 12 incorporates a display device including a TFT-LCD (Thin Film Transistor Liquid Crystal Display) 17.

ディスプレイユニット12は、コンピュータ本体11に対し、コンピュータ本体11の上面が露出される開放位置とコンピュータ本体11の上面を覆う閉塞位置との間を回動自在に取り付けられている。コンピュータ本体11は薄い箱形の筐体を有しており、その上面にはキーボード13、本コンピュータ10をパワーオン/パワーオフするためのパワーボタン14、入力操作パネル15、タッチパッド16、およびスピーカ18A,18Bなどが配置されている。   The display unit 12 is attached to the computer main body 11 so as to be rotatable between an open position where the upper surface of the computer main body 11 is exposed and a closed position covering the upper surface of the computer main body 11. The computer main body 11 has a thin box-shaped housing, and has a keyboard 13 on its upper surface, a power button 14 for powering on / off the computer 10, an input operation panel 15, a touch pad 16, and a speaker. 18A, 18B, etc. are arranged.

次に、図2を参照して、本コンピュータ10のシステム構成について説明する。   Next, the system configuration of the computer 10 will be described with reference to FIG.

本コンピュータ10は、図2に示されているように、CPU101、ノースブリッジ102、主メモリ103、サウスブリッジ104、グラフィクスプロセッシングユニット(GPU)105、ビデオメモリ(VRAM)105A、サウンドコントローラ106、BIOS−ROM109、LANコントローラ110、ハードディスクドライブ(HDD)111、DVDドライブ112、ビデオプロセッサ113、メモリ113A、ネットワークコントローラ114、IEEE 1394コントローラ115、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116、TVチューナ117、およびEEPROM118等を備えている。   As shown in FIG. 2, the computer 10 includes a CPU 101, a north bridge 102, a main memory 103, a south bridge 104, a graphics processing unit (GPU) 105, a video memory (VRAM) 105A, a sound controller 106, a BIOS- ROM 109, LAN controller 110, hard disk drive (HDD) 111, DVD drive 112, video processor 113, memory 113A, network controller 114, IEEE 1394 controller 115, embedded controller / keyboard controller IC (EC / KBC) 116, TV tuner 117, And an EEPROM 118 and the like.

CPU101は本コンピュータ10の動作を制御するプロセッサであり、ハードディスクドライブ(HDD)111から主メモリ103にロードされる、オペレーティングシステム(OS)201、および映像処理アプリケーションプログラム202のような各種アプリケーションプログラムを実行する。映像処理アプリケーションプログラム202は動画像データを再生するためのソフトウェアである。この映像処理アプリケーションプログラム202は、TVチューナ117によって受信された放送番組データを記録した動画像データ、HDD111やDVDドライブ112に格納されたDVD等に記録された動画像データ、LANコントローラ110によって受信されるネットワーク上のサーバから配信される動画像データ等を再生することができる。また、CPU101は、BIOS−ROM109に格納されたBIOS(Basic Input Output System)も実行する。BIOSはハードウェア制御のためのプログラムである。   The CPU 101 is a processor that controls the operation of the computer 10 and executes various application programs such as an operating system (OS) 201 and a video processing application program 202 that are loaded from the hard disk drive (HDD) 111 to the main memory 103. To do. The video processing application program 202 is software for reproducing moving image data. The video processing application program 202 is received by the LAN controller 110, moving image data recorded on the broadcast program data received by the TV tuner 117, moving image data recorded on a DVD or the like stored in the HDD 111 or the DVD drive 112, and the like. Video data distributed from a server on the network can be reproduced. The CPU 101 also executes a BIOS (Basic Input Output System) stored in the BIOS-ROM 109. The BIOS is a program for hardware control.

ノースブリッジ102はCPU101のローカルバスとサウスブリッジ104との間を接続するブリッジデバイスである。ノースブリッジ102には、主メモリ103をアクセス制御するメモリコントローラも内蔵されている。また、ノースブリッジ102は、PCI EXPRESS規格のシリアルバスなどを介してGPU105との通信を実行する機能も有している。   The north bridge 102 is a bridge device that connects the local bus of the CPU 101 and the south bridge 104. The north bridge 102 also includes a memory controller that controls access to the main memory 103. The north bridge 102 also has a function of executing communication with the GPU 105 via a PCI EXPRESS standard serial bus or the like.

GPU105は、本コンピュータ10のディスプレイモニタとして使用されるLCD17を制御する表示コントローラである。このGPU105によって生成される表示信号はLCD17に送られる。また、GPU105は、HDMI制御回路3およびHDMI端子2を介して、外部ディスプレイ装置1にデジタル映像信号を送出することもできる。   The GPU 105 is a display controller that controls the LCD 17 used as a display monitor of the computer 10. A display signal generated by the GPU 105 is sent to the LCD 17. The GPU 105 can also send a digital video signal to the external display device 1 via the HDMI control circuit 3 and the HDMI terminal 2.

HDMI端子2は外部ディスプレイ接続端子である。HDMI端子2は、非圧縮のデジタル映像信号と、デジタルオーディオ信号とを一本のケーブルでテレビのような外部ディスプレイ装置1に送出することができる。HDMI制御回路3は、HDMIモニタと称される外部ディスプレイ装置1にデジタル映像信号をHDMI端子2を介して送出するためのインタフェースである。   The HDMI terminal 2 is an external display connection terminal. The HDMI terminal 2 can send an uncompressed digital video signal and a digital audio signal to the external display device 1 such as a television with a single cable. The HDMI control circuit 3 is an interface for sending a digital video signal to the external display device 1 called an HDMI monitor via the HDMI terminal 2.

サウスブリッジ104は、LPC(Low Pin Count)バス上の各デバイス、およびPCI(Peripheral Component Interconnect)バス上の各デバイスを制御する。また、サウスブリッジ104は、ハードディスクドライブ(HDD)111およびDVDドライブ112を制御するためのIDE(Integrated Drive Electronics)コントローラを内蔵している。さらに、サウスブリッジ104は、サウンドコントローラ106との通信を実行する機能も有している。   The south bridge 104 controls each device on an LPC (Low Pin Count) bus and each device on a PCI (Peripheral Component Interconnect) bus. The south bridge 104 includes an IDE (Integrated Drive Electronics) controller for controlling the hard disk drive (HDD) 111 and the DVD drive 112. Further, the south bridge 104 has a function of executing communication with the sound controller 106.

またさらに、サウスブリッジ104には、PCI EXPRESS規格のシリアルバスなどを介してビデオプロセッサ113が接続されている。   Furthermore, a video processor 113 is connected to the south bridge 104 via a PCI EXPRESS standard serial bus or the like.

サウンドコントローラ106は音源デバイスであり、再生対象のオーディオデータをスピーカ18A,18BまたはHDMI制御回路3に出力する。   The sound controller 106 is a sound source device, and outputs audio data to be reproduced to the speakers 18A and 18B or the HDMI control circuit 3.

LANコントローラ110は、例えばIEEE 802.3規格の通信を実行する通信デバイスである。ネットワークコントローラ114は、たとえばIEEE 802.11規格の無線通信を実行する無線通信デバイスである。IEEE 1394コントローラ115は、IEEE 1394規格のシリアルバスを介して外部機器との通信を実行する。   The LAN controller 110 is a communication device that executes, for example, IEEE 802.3 standard communication. The network controller 114 is a wireless communication device that performs wireless communication of, for example, the IEEE 802.11 standard. The IEEE 1394 controller 115 executes communication with an external device via an IEEE 1394 standard serial bus.

エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、電力管理のためのエンベデッドコントローラと、キーボード(KB)13およびタッチパッド16を制御するためのキーボードコントローラとが集積された1チップマイクロコンピュータである。このエンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、ユーザによるパワーボタン14の操作に応じて本コンピュータ10をパワーオン/パワーオフする機能を有している。さらに、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、リモコンユニットインタフェース20との通信を実行する機能を有している。   The embedded controller / keyboard controller IC (EC / KBC) 116 is a one-chip microcomputer in which an embedded controller for power management and a keyboard controller for controlling the keyboard (KB) 13 and the touch pad 16 are integrated. . The embedded controller / keyboard controller IC (EC / KBC) 116 has a function of powering on / off the computer 10 in accordance with the operation of the power button 14 by the user. Further, the embedded controller / keyboard controller IC (EC / KBC) 116 has a function of executing communication with the remote control unit interface 20.

TVチューナ117はテレビジョン(TV)放送信号によって放送される放送番組データを受信する受信装置であり、アンテナ端子19に接続されている。このTVチューナ117は、例えば、地上波デジタルTV放送のようなデジタル放送番組データを受信可能なデジタルTVチューナとして実現されている。また、TVチューナ117は、外部機器から入力されるビデオデータをキャプチャする機能も有している。   The TV tuner 117 is a receiving device that receives broadcast program data broadcast by a television (TV) broadcast signal, and is connected to the antenna terminal 19. The TV tuner 117 is realized as a digital TV tuner capable of receiving digital broadcast program data such as terrestrial digital TV broadcast. The TV tuner 117 also has a function of capturing video data input from an external device.

図3は、映像処理アプリケーションプログラム202の構成を示すブロック図である。映像処理アプリケーションプログラム202は、上述したように、TVチューナ117によって受信された放送番組データを記録した動画像データ、HDD111やDVDドライブ112に格納されたDVD等に記録された動画像データ、インターネット上のサーバから配信される動画像データ等を再生することができる。以下では、HDD111に格納された動画像データ111Aを再生する場合の例について説明する。   FIG. 3 is a block diagram showing the configuration of the video processing application program 202. As described above, the video processing application program 202 is the moving image data that records the broadcast program data received by the TV tuner 117, the moving image data that is recorded on the DVD stored in the HDD 111 or the DVD drive 112, the Internet The moving image data distributed from the server can be reproduced. Hereinafter, an example in which the moving image data 111A stored in the HDD 111 is reproduced will be described.

映像処理アプリケーションプログラム202は、符号化(圧縮符号化)された動画像データ111Aを復号および再生する。動画像データ111Aは、例えば、H.264|MPEG−4 AVC(以下、H.264/AVCと云う)やMPEG−2,MPEG−4のような符号化方式で符号化された動画像ストリームから構成されている。この動画像データ111Aは複数のGOPから構成されている。各GOPは、所定の再生時間に対応する複数のピクチャを含む処理単位である。映像処理アプリケーションプログラム202は、制御部31、コンテンツ復号部32、表示タイミング算出部33、再生処理部34、データ保存部35、ピクチャ群情報検出部36、及びフレームレート算出部37を備える。   The video processing application program 202 decodes and reproduces the encoded (compressed) moving image data 111A. The moving image data 111A is, for example, H.264. H.264 | MPEG-4 AVC (hereinafter referred to as H.264 / AVC), MPEG-2, and MPEG-4. This moving image data 111A is composed of a plurality of GOPs. Each GOP is a processing unit including a plurality of pictures corresponding to a predetermined reproduction time. The video processing application program 202 includes a control unit 31, a content decoding unit 32, a display timing calculation unit 33, a reproduction processing unit 34, a data storage unit 35, a picture group information detection unit 36, and a frame rate calculation unit 37.

制御部31は、映像処理アプリケーションプログラム202内の各部を制御する。コンテンツ復号部32は、HDD111内に格納されている圧縮符号化された動画像データ111Aを読み出し、読み出した動画像データ111Aを復号する。動画像データ111Aの復号は例えばGOP単位で実行することができる。   The control unit 31 controls each unit in the video processing application program 202. The content decoding unit 32 reads the compressed and encoded moving image data 111A stored in the HDD 111, and decodes the read moving image data 111A. The decoding of the moving image data 111A can be executed in units of GOP, for example.

図4は、動画像データ111Aの構成の例を示す図である。動画像データ111Aは、GOP(Group of Pictures)41と呼ばれる単位で構成される。GOP41は、所定の期間中(例えば、0.5秒間)に再生される複数のピクチャのデータを含む。GOP41は、複数のアクセスユニット(AU)42で構成される。   FIG. 4 is a diagram illustrating an example of the configuration of the moving image data 111A. The moving image data 111A is configured in a unit called GOP (Group of Pictures) 41. The GOP 41 includes data of a plurality of pictures that are reproduced during a predetermined period (for example, 0.5 seconds). The GOP 41 is composed of a plurality of access units (AU) 42.

アクセスユニット42は、符号化された動画像データのビット・ストリーム中の情報をピクチャ毎にアクセスするための単位である。各アクセスユニット42は、複数のNALユニット43で構成される。   The access unit 42 is a unit for accessing information in the bit stream of the encoded moving image data for each picture. Each access unit 42 includes a plurality of NAL units 43.

各NALユニット43は、NALヘッダ431と圧縮された動画像データ432とを含む。NALヘッダ431は、そのNALユニットが参照ピクチャであるかどうか示す情報であるnal_ref_idcと、NALユニットの種類を示す識別子であるnal_unit_typeとを含む。   Each NAL unit 43 includes a NAL header 431 and compressed moving image data 432. The NAL header 431 includes nal_ref_idc that is information indicating whether the NAL unit is a reference picture, and nal_unit_type that is an identifier indicating the type of the NAL unit.

なお、NALユニット43には、VCL NALユニットと非VCL NALユニットとがある。VCL NALユニットは、画像データであるピクチャ(スライス)のデータを含むNALユニットである。非VCL NALユニットは、SPS(Sequence Parameter Set)やPPS(Picture Parameter Set)等のパラメータ・セット、SEI(Supplemental Enhancement Information)、AUデリミタなどのメタデータを含むNALユニットである。   The NAL unit 43 includes a VCL NAL unit and a non-VCL NAL unit. The VCL NAL unit is a NAL unit including picture (slice) data that is image data. The non-VCL NAL unit is a NAL unit including metadata such as a parameter set such as SPS (Sequence Parameter Set) and PPS (Picture Parameter Set), SEI (Supplemental Enhancement Information), and AU delimiter.

図5は、アクセスユニット42に含み得る幾つかのNALユニット51の例を示す図である。   FIG. 5 is a diagram illustrating examples of several NAL units 51 that can be included in the access unit 42.

アクセスユニット42は、AUデリミタ511、SPS512、PPS513、SEI514、主ピクチャ515、冗長ピクチャ516、EOS(End of Sequence)517、EOS(End of Stream)518等から構成される。   The access unit 42 includes an AU delimiter 511, SPS 512, PPS 513, SEI 514, main picture 515, redundant picture 516, EOS (End of Sequence) 517, EOS (End of Stream) 518, and the like.

AUデリミタ511は、アクセスユニットの先頭を示す開始符号である。SPS512は、プロファイル、レベルやシーケンス全体の符号化モード等、シーケンス全体の符号化に関わる情報を含むヘッダである。但し、SPS512は、シーケンスの先頭に付加されるわけではなく、シーケンスの先頭までに送られたSPS512がヘッダ情報として用いられる。PPS513は、ピクチャ全体の符号化モード(例えば、エントロピー符号化モード、ピクチャ単位の量子化パラメータ初期値等)を示すヘッダ情報である。但し、PPS513は、全てのピクチャに付加されるわけではなく、PPS513がない場合には、ピクチャの先頭までに送られたPPS513がヘッダ情報として用いられる。SEI514は、シーケンスの復号に必須ではない付加情報を示す。例えば、ピクチャのタイミング情報、ランダム・アクセスに用いられる情報、ユーザにより定義される情報等が記述される。主ピクチャ515は、通常のピクチャの情報を含む。主ピクチャ515に含まれる情報を復号することで、シーケンス内のピクチャを復元することができる。冗長ピクチャ516は、伝送エラー等が発生した場合に利用されるピクチャの情報を含む。したがって、冗長ピクチャ516は、伝送エラー等により主ピクチャ515のデータの一部が失われた際等に利用される。EOS517は、ひとつのシーケンスの終端を示す符号である。EOS518は、ストリームの終端を示す符号である。   The AU delimiter 511 is a start code indicating the head of the access unit. The SPS 512 is a header including information related to encoding of the entire sequence such as a profile, a level, and an encoding mode of the entire sequence. However, the SPS 512 is not added to the head of the sequence, but the SPS 512 sent up to the head of the sequence is used as header information. The PPS 513 is header information indicating a coding mode (for example, an entropy coding mode, a quantization parameter initial value for each picture) of the entire picture. However, the PPS 513 is not added to all pictures. When there is no PPS 513, the PPS 513 sent up to the head of the picture is used as header information. SEI 514 indicates additional information that is not essential for decoding the sequence. For example, picture timing information, information used for random access, information defined by the user, and the like are described. The main picture 515 includes normal picture information. By decoding the information included in the main picture 515, the pictures in the sequence can be restored. The redundant picture 516 includes information on a picture used when a transmission error or the like occurs. Therefore, the redundant picture 516 is used when a part of data of the main picture 515 is lost due to a transmission error or the like. EOS 517 is a code indicating the end of one sequence. The EOS 518 is a code indicating the end of the stream.

コンテンツ復号部32は、動画像データ111Aを復号して、上述のようなGOP41、アクセスユニット42、NALユニット43等の構造を解析し、解析結果を表示タイミング算出部33へ出力する。また、コンテンツ復号部32内に設けられたピクチャ群情報検出部36は、再生対象のGOPが復号される時に、その再生対象のGOPに含まれるピクチャ群に関するピクチャ群情報を検出する。ピクチャ群情報は、再生対象のGOPに含まれるピクチャの数、及びその再生対象の処理単位内に含まれるプログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合、等を示す。ピクチャ群情報検出部36は、検出したピクチャ群情報をデータ保存部35へ出力する。   The content decoding unit 32 decodes the moving image data 111A, analyzes the structure of the GOP 41, the access unit 42, the NAL unit 43, and the like as described above, and outputs the analysis result to the display timing calculation unit 33. Also, the picture group information detection unit 36 provided in the content decoding unit 32 detects picture group information related to a picture group included in the reproduction target GOP when the reproduction target GOP is decoded. The picture group information indicates the number of pictures included in the GOP to be played back, the ratio of progressive frame pictures and interlaced field pictures contained in the processing unit to be played back, and the like. The picture group information detection unit 36 outputs the detected picture group information to the data storage unit 35.

データ保存部35は、入力されたピクチャ群情報を主メモリ103等へ保存する。ピクチャ群情報は、再生対象のGOPが復号される度に保存される。したがって、データ保存部35は、前の再生対象のGOPのピクチャ群情報が保存されている場合、このピクチャ群情報を、新たな再生対象のGOPのピクチャ群情報で更新する。   The data storage unit 35 stores the input picture group information in the main memory 103 or the like. The picture group information is saved every time the GOP to be reproduced is decoded. Accordingly, when the picture group information of the previous GOP to be reproduced is stored, the data storage unit 35 updates this picture group information with the picture group information of the new GOP to be reproduced.

表示タイミング算出部33は、コンテンツ復号部32による解析結果に基づき、再生対象のGOP内のピクチャそれぞれの表示タイミングを決定する。表示タイミング算出部33は、アクセスユニット423を再生する場合、SPS512やSEI514に含まれるパラメータに基づき、主ピクチャ515に格納されたピクチャを表示するタイミングを決定する。表示タイミングは、例えば、SEI514の一部であるPicture Timing SEIと、SPS512の一部であるVUI(Video Usability Information)とを用いて算出される。   The display timing calculation unit 33 determines the display timing of each picture in the GOP to be played based on the analysis result by the content decoding unit 32. When reproducing the access unit 423, the display timing calculation unit 33 determines the timing for displaying the picture stored in the main picture 515 based on the parameters included in the SPS 512 and the SEI 514. The display timing is calculated using, for example, Picture Timing SEI which is a part of SEI 514 and VUI (Video Usability Information) which is a part of SPS 512.

Picture Timing SEIには、ピクチャの構造情報等が記述される。Picture Timing SEIには、例えば、pic_structの情報が記述される。   In the Picture Timing SEI, picture structure information and the like are described. In Picture Timing SEI, for example, information of pic_struct is described.

pic_structには、ピクチャの構造が記述される。例えば、インターレース方式の奇数ラインに対応するピクチャと偶数ラインに対応するピクチャのデータ内での順序や、各ピクチャの表示回数等が記述される。   pic_struct describes the structure of a picture. For example, the order in the data of the picture corresponding to the odd-numbered line and the picture corresponding to the even-numbered line in the interlace system, the number of times of displaying each picture, and the like are described.

VUIには、ビデオの表示情報に関連するパラメータが記述される。VUIには、例えば、time_scale及びnum_units_in_tickの値が設定される。time_scaleは、1秒間の時間単位の数を示す。例えば、27MHzのクロックの場合、time_scaleには27000という値が設定される。   In the VUI, parameters related to video display information are described. For example, values of time_scale and num_units_in_tick are set in the VUI. time_scale indicates the number of time units per second. For example, in the case of a 27 MHz clock, a value of 27000 is set in time_scale.

また、num_units_in_tickは、クロック動作周波数time_scale[Hz]での時間単位の数を示す。この値がクロックカウンタ(clock tick counter)での1インクリメントとなる。1clock tickは、符号化データ内で表現可能な時間の最小単位となる。例えば、ビデオのクロック周波数が30000/1001[Hz]である場合、time_scaleには30000が設定され、num_units_in_tickには1001が設定される。   Num_units_in_tick indicates the number of time units at the clock operating frequency time_scale [Hz]. This value becomes 1 increment in the clock counter (clock tick counter). One clock tick is a minimum unit of time that can be expressed in the encoded data. For example, when the video clock frequency is 30000/1001 [Hz], 30000 is set to time_scale, and 1001 is set to num_units_in_tick.

表示タイミング算出部33は、上述したPicture Timing SEIのpic_struct,VUIのtime_scale及びnum_units_in_tick等を用いることで、複数のアクセスユニット42から構成される、GOP41に含まれるピクチャそれぞれの表示タイミングを決定する。   The display timing calculation unit 33 determines the display timing of each of the pictures included in the GOP 41 including the plurality of access units 42 by using the above-described Picture Timing SEI pic_struct, VUI time_scale, num_units_in_tick, and the like.

しかし、アクセスユニット42に必須のNALユニットは主ピクチャ515のみであり、SPS512やSEI514等の他のNALユニットは必要に応じてアクセスユニットに格納されるオプションのNALユニットである。つまり、動画像データ111Aに対して、再生のタイミングに関する情報をアクセスユニット42毎又はGOP41毎に付加することは必須ではない。また、インターネット上で配信された動画像データ等には、厳密には規格に準拠しておらず、再生のタイミングに関する情報が適切に付加されていないアクセスユニット42やGOP41が存在する可能性がある。したがって、ライブストリームのような動画像データを途中から再生する場合や、アクセスユニット42(GOP41)に再生のタイミングの情報が格納されたNALユニットが含まれていない場合には、ピクチャの表示タイミングが分からず、滑らかに再生することは困難である。   However, the only NAL unit essential for the access unit 42 is the main picture 515, and other NAL units such as the SPS 512 and the SEI 514 are optional NAL units stored in the access unit as necessary. That is, it is not indispensable to add information related to the reproduction timing to the moving image data 111A for each access unit 42 or for each GOP 41. In addition, there is a possibility that moving image data distributed on the Internet does not strictly conform to the standard and there is an access unit 42 or GOP 41 to which information regarding reproduction timing is not appropriately added. . Accordingly, when moving image data such as a live stream is reproduced from the middle, or when the NAL unit storing the reproduction timing information is not included in the access unit 42 (GOP 41), the picture display timing is set. It is difficult to reproduce smoothly without knowing.

このため、コンテンツ復号部32は、復号された再生対象のGOPが表示タイミングに関する情報を含んでいるかどうかを判定する。再生対象のGOPが表示タイミングに関する情報を含んでいない場合、表示タイミング算出部33は、処理対象のGOPの一つ前の再生済みのGOP(一つ前のGOP)の情報(ピクチャ群情報)を利用して、処理対象のGOPの表示タイミング(タイムスタンプの値)を算出する。   For this reason, the content decryption unit 32 determines whether or not the decrypted GOP to be reproduced includes information regarding display timing. When the GOP to be played back does not include information related to the display timing, the display timing calculation unit 33 uses the information (picture group information) of the GOP that has been played back immediately before the GOP to be processed (the previous GOP). Using this, the display timing (time stamp value) of the GOP to be processed is calculated.

一つ前のGOPの情報は、データ保存部35により主メモリ103等に格納される。一つ前のGOPの情報は、上述したように、一つ前のGOPに含まれるピクチャ数、一つ前のGOPに含まれるフレームピクチャとフィールドピクチャとの割合、等である。また、一つ前のGOPの情報は、例えば、一つ前のGOPの再生時間、ピクチャの表示回数等の情報をさらに含み得る。   Information on the previous GOP is stored in the main memory 103 or the like by the data storage unit 35. As described above, the previous GOP information includes the number of pictures included in the previous GOP, the ratio between the frame picture and the field picture included in the previous GOP, and the like. Also, the information on the previous GOP may further include information such as the playback time of the previous GOP, the number of times the picture is displayed, and the like.

表示タイミング算出部33に設けられたフレームレート算出部37は、例えば、図6に示すような一つ前のGOP411の再生時間と一つ前のGOP411に含まれるピクチャ数とに基づき、一つ前のGOP411のフレームレート、つまり単位時間当たりの再生フレーム数[フレーム/秒]を次式により算出する。   The frame rate calculation unit 37 provided in the display timing calculation unit 33 is, for example, based on the playback time of the previous GOP 411 and the number of pictures included in the previous GOP 411 as shown in FIG. The frame rate of the GOP 411, that is, the number of reproduced frames per unit time [frame / second] is calculated by the following equation.

一つ前のGOPに含まれるピクチャ数/一つ前のGOPの再生時間
このように、フレームレート算出部37は、データ保存部35によって主メモリ103等に格納されたピクチャ群情報(一つ前のGOPのピクチャ群情報)を用いて、フレームレートを算出する。
The number of pictures included in the previous GOP / the playback time of the previous GOP In this way, the frame rate calculation unit 37 has the picture group information (the previous one stored in the main memory 103 or the like by the data storage unit 35). The frame rate is calculated using the GOP picture group information).

図7は、一つ前のGOP411の再生時間とピクチャ数とに基づいて、表示タイミングを決定する例を示す。図7に示す例では、一つ前のGOP411の再生時間は0.5秒であり、一つ前のGOP411に含まれるピクチャ61の数は15枚である。なお、一つ前のGOP411に含まれるピクチャ61が、全てプログレッシブ方式のピクチャ(フレームピクチャ)である場合を想定する。   FIG. 7 shows an example in which the display timing is determined based on the playback time of the previous GOP 411 and the number of pictures. In the example shown in FIG. 7, the playback time of the previous GOP 411 is 0.5 seconds, and the number of pictures 61 included in the previous GOP 411 is fifteen. It is assumed that all pictures 61 included in the immediately preceding GOP 411 are progressive pictures (frame pictures).

この場合、単位時間当たりの再生フレーム数は30フレーム/秒となる。表示タイミング算出部33は、算出した単位時間当たりの再生フレーム数に基づいて、処理対象のGOPに含まれるピクチャの表示タイミングを決定する。表示タイミング算出部33は、単位時間当たりの再生フレーム数が30フレーム/秒である場合には、1/30秒毎にピクチャが表示されるように表示タイミングを決定する。   In this case, the number of playback frames per unit time is 30 frames / second. The display timing calculation unit 33 determines the display timing of the picture included in the GOP to be processed based on the calculated number of playback frames per unit time. When the number of playback frames per unit time is 30 frames / second, the display timing calculation unit 33 determines the display timing so that a picture is displayed every 1/30 seconds.

また、図8は、表示タイミング算出部33により表示タイミングを決定する別の例を示す。図8に示す例では、一つ前のGOP411の再生時間は0.5秒である。一つ前のGOP411に含まれるピクチャ71は、奇数ラインを表示するための12枚のピクチャと偶数ラインを表示するための12枚のピクチャからなる、24枚のインターレース方式のフィールドピクチャ71である。1フレームの表示には、奇数ラインのピクチャと偶数ラインのピクチャの2枚のピクチャが使用される。このため、24枚のインターレース方式のピクチャ71により、12フレームの画像がLCD17に表示される。したがって、単位時間当たりの再生フレーム数は24フレーム/秒となる。表示タイミング算出部33は、単位時間当たりの再生フレーム数が24フレーム/秒である場合には、1/24秒毎に奇数ラインのピクチャと偶数ラインのピクチャとが表示されるように表示タイミングを決定する。   FIG. 8 shows another example in which the display timing calculation unit 33 determines the display timing. In the example shown in FIG. 8, the playback time of the previous GOP 411 is 0.5 seconds. The picture 71 included in the previous GOP 411 is 24 interlaced field pictures 71 composed of 12 pictures for displaying odd lines and 12 pictures for displaying even lines. For the display of one frame, two pictures of an odd line picture and an even line picture are used. Therefore, a 12-frame image is displayed on the LCD 17 by 24 interlaced pictures 71. Therefore, the number of playback frames per unit time is 24 frames / second. When the number of playback frames per unit time is 24 frames / second, the display timing calculation unit 33 sets the display timing so that an odd line picture and an even line picture are displayed every 1/24 second. decide.

また、図8下部に、一つ前のGOP411に含まれるピクチャ71が3:2プルダウン方式で表示される場合のピクチャ72を示す。図に示すように、一部のピクチャを二度表示することで、表示されるフレーム数を増加させている。このため、0.5秒の再生時間中に、15フレームの画像がLCD17に表示される。したがって、単位時間当たりの再生フレーム数は30フレーム/秒となる。表示タイミング算出部33は、単位時間当たりの再生フレーム数が30フレーム/秒である場合には、1/30秒毎に奇数ラインのピクチャと偶数ラインのピクチャとが表示されるように表示タイミングを決定する。   8 shows a picture 72 when the picture 71 included in the previous GOP 411 is displayed by the 3: 2 pull-down method. As shown in the figure, the number of frames to be displayed is increased by displaying some pictures twice. For this reason, an image of 15 frames is displayed on the LCD 17 during a reproduction time of 0.5 seconds. Therefore, the number of playback frames per unit time is 30 frames / second. When the number of playback frames per unit time is 30 frames / second, the display timing calculation unit 33 sets the display timing so that an odd line picture and an even line picture are displayed every 1/30 seconds. decide.

表示タイミング算出部33は、決定した表示タイミングの情報を再生処理部34へ出力する。   The display timing calculation unit 33 outputs the determined display timing information to the reproduction processing unit 34.

再生処理部34は、決定された表示タイミングの情報に基づいて、処理対象のGOPに含まれるピクチャをLCD17に表示する。つまり、再生処理部34は、処理対象のGOPに含まれるピクチャに、表示タイミングに基づくタイムスタンプ情報を付加する。ピクチャは、付加されたタイムスタンプ情報に応じてLCD17に表示される。   The reproduction processing unit 34 displays the picture included in the GOP to be processed on the LCD 17 based on the determined display timing information. That is, the reproduction processing unit 34 adds time stamp information based on the display timing to the picture included in the GOP to be processed. The picture is displayed on the LCD 17 according to the added time stamp information.

以上の構成により、表示タイミングに関する情報が付加されていないGOPを再生する場合にも、構造が同一、又は類似すると推定される一つ前のGOP411の情報を用いて、処理対象のGOPの表示タイミングを推定し、推定した表示タイミングに従って、処理対象のGOPに含まれるピクチャを再生することで、動画像データ111Aを滑らかに再生することができる。   With the above configuration, even when playing back a GOP to which information about display timing is not added, the display timing of the GOP to be processed using the information of the previous GOP 411 estimated to be the same or similar in structure. The moving image data 111A can be smoothly reproduced by reproducing the picture included in the processing target GOP according to the estimated display timing.

図9は、映像処理アプリケーション202による表示タイミング算出処理の手順を示すフローチャートである。   FIG. 9 is a flowchart illustrating a procedure of display timing calculation processing by the video processing application 202.

まず、映像処理アプリケーション202は、動画像データ111A内の再生対象のGOPを復号し、その復号したGOPにPicture Timing SEIやVUI等の表示タイミングに関する情報が含まれているかどうかを判定する(ステップS101)。また、再生対象のGOPの復号時には、映像処理アプリケーション202は、再生対象のGOPに含まれるピクチャ数をカウントする処理と、再生対象のGOPに含まれるフレームピクチャ数およびフィールドピクチャ数をカウントする処理とを実行する。   First, the video processing application 202 decodes the GOP to be reproduced in the moving image data 111A, and determines whether or not the decoded GOP includes information about display timing such as Picture Timing SEI and VUI (step S101). ). Further, at the time of decoding the GOP to be played back, the video processing application 202 counts the number of pictures included in the GOP to be played back, and the process of counting the number of frame pictures and field pictures included in the GOP to be played back. Execute.

再生対象のGOPに表示タイミングに関する情報が含まれている場合(ステップS101のYES)、映像処理アプリケーション202は、Picture Timing SEI及びVUI等を用いて、再生対象のGOPに含まれるピクチャの表示タイミングを算出する(ステップS102)。   When information about display timing is included in the GOP to be played back (YES in step S101), the video processing application 202 uses the Picture Timing SEI, VUI, and the like to display the display timing of the pictures included in the GOP to be played back. Calculate (step S102).

再生対象のGOPに表示タイミングに関する情報が含まれていない場合(ステップS101のNO)、映像処理アプリケーション202は、再生対象のGOPの一つ前に位置する再生済みのGOP(一つ前のGOP)411の情報(ピクチャ群情報)に基づいて、表示タイミングを算出する(ステップS103)。映像処理アプリケーション202は、保存された一つ前のGOP411の再生時間、ピクチャ枚数、及びピクチャ構造(フレームピクチャとフィールドピクチャとの割合)に基づいて、表示タイミングを算出する。具体的には、映像処理アプリケーション202は、一つ前のGOP411の再生時間と、この再生時間中にLCD17に表示されるフレーム数とから、単位時間当たりのフレーム数(フレームレート)を算出する。そして、映像処理アプリケーション202は、各ピクチャがプログレッシブ方式のピクチャであるかインターレース方式のピクチャであるか等を考慮して、各ピクチャを表示するタイミングを決定する。   When the information on display timing is not included in the reproduction target GOP (NO in step S101), the video processing application 202 reproduces the reproduced GOP (one previous GOP) positioned immediately before the reproduction target GOP. Based on the information 411 (picture group information), the display timing is calculated (step S103). The video processing application 202 calculates the display timing based on the saved playback time, the number of pictures, and the picture structure (ratio of frame picture to field picture) of the previous GOP 411. Specifically, the video processing application 202 calculates the number of frames (frame rate) per unit time from the playback time of the previous GOP 411 and the number of frames displayed on the LCD 17 during this playback time. Then, the video processing application 202 determines the timing for displaying each picture in consideration of whether each picture is a progressive picture or an interlace picture.

そして、映像処理アプリケーション202は、算出された表示タイミングに合わせて、再生対象のGOPに含まれるピクチャをLCD17に表示する(ステップS104)。つまり、映像処理アプリケーション202は、再生対象のGOPに含まれるピクチャに表示タイミングに応じたタイムスタンプ情報を付加する。再生対象のGOPに含まれるピクチャは、タイムスタンプ情報に従って再生される。   Then, the video processing application 202 displays the picture included in the GOP to be reproduced on the LCD 17 in accordance with the calculated display timing (step S104). That is, the video processing application 202 adds time stamp information corresponding to the display timing to the picture included in the GOP to be reproduced. Pictures included in the GOP to be played are played according to the time stamp information.

また、映像処理アプリケーション202は、再生対象のGOPに含まれるピクチャ枚数とピクチャ構造の情報とを、ピクチャ群情報として主メモリ103等に保存する(ステップS105)。   In addition, the video processing application 202 stores the number of pictures included in the GOP to be played back and the picture structure information in the main memory 103 or the like as picture group information (step S105).

次いで、映像処理アプリケーション202は、動画像データ111Aに、再生対象のGOPの次のGOPが存在するかどうかを判定する(ステップS106)。   Next, the video processing application 202 determines whether or not a GOP next to the GOP to be reproduced exists in the moving image data 111A (step S106).

再生対象のGOPの次のGOPが存在する場合(ステップS106のYES)、この次のGOPを新たな再生対象のGOPに設定し(ステップS107)、ステップS101以降の処理を実行する。   If there is a GOP next to the GOP to be played back (YES in step S106), the next GOP is set as a new GOP to be played back (step S107), and the processes after step S101 are executed.

再生対象のGOPの次のGOPが存在しない場合(ステップS106のNO)、動画像データ111Aが最後まで再生されたと判断し、処理を終了する。   If there is no GOP next to the GOP to be reproduced (NO in step S106), it is determined that the moving image data 111A has been reproduced to the end, and the process ends.

以上の処理により、再生対象のGOPに表示タイミングに関する情報が含まれていない場合にも、動画像データ111Aを滑らかに再生することができる。映像処理アプリケーション202は、再生対象のGOPに表示タイミングに関する情報が含まれている場合には、その情報を用いてピクチャの表示タイミングを算出し、再生対象のGOPに表示タイミングに関する情報が含まれていない場合には、構造が同一、又は類似すると推定される一つ前のGOP411の情報を用いて、再生対象のGOPの表示タイミングを算出する。   Through the above processing, the moving image data 111A can be smoothly reproduced even when the GOP to be reproduced does not include information regarding display timing. When the GOP to be reproduced includes information related to the display timing, the video processing application 202 calculates the display timing of the picture using the information, and the GOP to be reproduced includes information related to the display timing. If not, the display timing of the GOP to be reproduced is calculated using the information of the previous GOP 411 estimated to have the same or similar structure.

なお、再生対象のGOPが、動画像データ111Aのシーケンスの先頭のGOPである場合には、所定の表示タイミングに従ってGOPに含まれるピクチャを表示し、以降のGOPを表示する場合に、再生済みの一つ前のGOPのピクチャ枚数、ピクチャ構造等を用いて表示タイミングを決定し、処理対象のGOPに含まれるピクチャを表示してもよい。   When the GOP to be reproduced is the first GOP of the sequence of the moving image data 111A, the picture included in the GOP is displayed according to a predetermined display timing, and the reproduced GOP is displayed when the subsequent GOP is displayed. The display timing may be determined using the number of pictures of the previous GOP, the picture structure, etc., and the pictures included in the GOP to be processed may be displayed.

以上説明したように、本実施形態によれば、再生のタイミングが不明である動画像データを滑らかに再生できる。映像処理アプリケーション202の表示タイミング算出部33は、再生対象のGOPに表示タイミングに関する情報が含まれている場合には、この情報を用いて再生対象のGOPに含まれるピクチャの表示タイミングを決定し、再生対象のGOPに表示タイミングに関する情報が含まれていない場合には、再生対象のGOPの一つ前に位置する再生済みのGOPを再生した際に得られた一つ前のGOPのピクチャ数、ピクチャ構造等に基づいて、再生対象のGOPに含まれるピクチャの表示タイミングを決定する。   As described above, according to this embodiment, it is possible to smoothly reproduce moving image data whose reproduction timing is unknown. The display timing calculation unit 33 of the video processing application 202 determines the display timing of the picture included in the reproduction target GOP using this information when the information about the display timing is included in the reproduction target GOP. If the GOP to be played back does not contain information related to display timing, the number of pictures of the previous GOP obtained when playing the played GOP located immediately before the GOP to be played back, Based on the picture structure or the like, the display timing of the picture included in the GOP to be reproduced is determined.

再生対象のGOPと再生対象のGOPの一つ前のGOPとは、ピクチャの表示タイミングが同一又は類似しているものと推定される。このため、再生対象のGOPに表示タイミングに関する情報が含まれていない場合に、一つ前のGOP411のピクチャ数、ピクチャ構造等に基づいて表示タイミングを決定し、決定した表示タイミングに従って、再生対象のGOPに含まれるピクチャを表示することで、再生のタイミングが不明である動画像データを滑らかに再生することができる。   It is presumed that the GOP to be reproduced and the GOP immediately before the reproduction GOP have the same or similar picture display timing. For this reason, when information about display timing is not included in the GOP to be reproduced, the display timing is determined based on the number of pictures, the picture structure, etc. of the previous GOP 411, and the reproduction target GOP 411 is determined according to the determined display timing. By displaying the picture included in the GOP, it is possible to smoothly reproduce moving image data whose reproduction timing is unknown.

なお、動画像データ111Aの再生にはリアルタイムでの処理が要求されるため、本実施形態では、再生対象のGOPを復号する毎にその再生対象のGOPのピクチャ数、ピクチャ構造を検出し、現在の再生対象のGOPに表示タイミング情報が含まれない場合には、再生済みの一つ前のGOPの復号時に検出されたピクチャ数、ピクチャ構造等の情報に基づいて、現在の再生対象のGOPの表示タイミングを算出している。したがって、ネットワークを介して動画像データを受信しながら再生するといったストリーミング再生を行う場合やライブストリームのような動画像データを途中から再生する場合であっても、動画像データをリアルタイム且つ滑らかに再生することができる。   Since reproduction of the moving image data 111A requires real-time processing, the present embodiment detects the number of pictures and the picture structure of the reproduction target GOP each time the reproduction target GOP is decoded. If the display timing information is not included in the GOP to be played back, the current GOP to be played back is based on information such as the number of pictures and the picture structure detected when decoding the previous GOP that has been played back. Display timing is calculated. Therefore, even when streaming playback such as playback while receiving moving image data via a network or when playing moving image data such as a live stream from the middle, moving image data is played back smoothly in real time. can do.

また、本実施形態の表示タイミング算出処理の手順は全てソフトウェアによって実行することができる。このため、表示タイミング算出処理の手順を実行するプログラムをコンピュータ読み取り可能な記憶媒体を通じて通常のコンピュータにインストールして実行するだけで、本実施形態と同様の効果を容易に実現することができる。   In addition, the procedure of the display timing calculation process of this embodiment can be executed entirely by software. For this reason, the effect similar to this embodiment can be easily realized only by installing and executing a program for executing the procedure of the display timing calculation process on a normal computer through a computer-readable storage medium.

また本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   Further, the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

202…映像処理アプリケーション、31…制御部、32…コンテンツ解析部、33…表示タイミング算出部、34…再生処理部、35…データ保存部、36…ピクチャ群情報検出部、37…フレームレート算出部、111…HDD、111A…動画像データ。 202 ... Video processing application, 31 ... Control unit, 32 ... Content analysis unit, 33 ... Display timing calculation unit, 34 ... Playback processing unit, 35 ... Data storage unit, 36 ... Picture group information detection unit, 37 ... Frame rate calculation unit 111, HDD, 111A, moving image data.

Claims (6)

所定の再生時間に対応する複数のピクチャをそれぞれ含む複数の処理単位から構成される符号化された動画像データを復号する復号手段と、
前記復号手段によって前記動画像データ内の再生対象の処理単位が復号される際に、前記再生対象の処理単位内に含まれるピクチャをカウントすることによってピクチャの数を検出し、前記再生対象の処理単位内に含まれるプログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合を検出する検出手段と、
前記再生対象の処理単位内にタイミング情報が含まれていない場合、前記再生対象の処理単位の一つ前の再生済みの処理単位の復号時に前記検出手段によって検出されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合と、前記所定の再生時間とに基づいて再生フレームレートを算出するフレームレート算出手段と、
前記算出された再生フレームレートに基づいて、前記再生対象の処理単位内に含まれる複数のピクチャの表示タイミングを決定する表示タイミング決定手段とを具備する映像処理装置。
Decoding means for decoding encoded moving image data composed of a plurality of processing units each including a plurality of pictures corresponding to a predetermined reproduction time;
When the processing unit to be played back in the moving image data is decoded by the decoding means, the number of pictures is detected by counting the pictures included in the processing unit to be played back, and the processing to be played back Detecting means for detecting a ratio between a progressive frame picture and an interlace field picture included in a unit;
When timing information is not included in the processing unit to be played back, the number of pictures detected by the detecting means when decoding the played back processing unit immediately before the processing unit to be played back and the progressive method Frame rate calculating means for calculating a playback frame rate based on a ratio between the frame picture of the first frame picture and the interlaced field picture and the predetermined playback time;
A video processing apparatus comprising: display timing determining means for determining display timings of a plurality of pictures included in the processing unit to be reproduced based on the calculated reproduction frame rate.
前記表示タイミング決定手段は、前記再生対象の処理単位内に前記タイミング情報が含まれている場合、前記タイミング情報に基づいて前記表示タイミングを決定する請求項1記載の映像処理装置。   The video processing apparatus according to claim 1, wherein the display timing determining unit determines the display timing based on the timing information when the timing information is included in the processing unit to be reproduced. 前記検出されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合をメモリに保存する保存手段をさらに具備し、
前記フレームレート算出手段は、前記メモリに保存されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合前記所定の再生時間とに基づいて前記再生フレームレートを算出する請求項1記載の映像処理装置。
A storage unit that stores the number of the detected pictures and the ratio of the progressive frame picture and the interlaced field picture in a memory;
The frame rate calculation means calculates a ratio of the field picture of the frame picture and an interlace method in the number and the progressive system of pictures stored in the memory, the reproduction frame rate based on the predetermined reproduction time The video processing apparatus according to claim 1.
所定の再生時間に対応する複数のピクチャをそれぞれ含む複数の処理単位から構成される符号化された動画像データを復号し、
前記復号することによって前記動画像データ内の再生対象の処理単位が復号される際に、前記再生対象の処理単位内に含まれるピクチャをカウントすることによってピクチャの数を検出し、前記再生対象の処理単位内に含まれるプログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合を検出し、
前記再生対象の処理単位内にタイミング情報が含まれていない場合、前記再生対象の処理単位の一つ前の再生済みの処理単位の復号時に前記検出することによって検出されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合と、前記所定の再生時間とに基づいて再生フレームレートを算出し、
前記算出された再生フレームレートに基づいて、前記再生対象の処理単位内に含まれる複数のピクチャの表示タイミングを決定する映像処理方法。
Decoding encoded moving image data composed of a plurality of processing units each including a plurality of pictures corresponding to a predetermined reproduction time;
When the processing unit to be played back in the moving image data is decoded by the decoding, the number of pictures is detected by counting the pictures included in the processing unit to be played back , and the playback target Detect the proportion of progressive frame pictures and interlaced field pictures included in the processing unit,
When timing information is not included in the processing unit to be played back, the number of pictures detected by the detection at the time of decoding the played back processing unit immediately before the processing unit to be played back and the progressive A playback frame rate is calculated based on the ratio of the frame picture of the system and the field picture of the interlace system and the predetermined playback time;
A video processing method for determining display timings of a plurality of pictures included in the processing unit to be reproduced based on the calculated reproduction frame rate.
前記決定することは、前記再生対象の処理単位内に前記タイミング情報が含まれている場合、前記タイミング情報に基づいて前記表示タイミングを決定する請求項記載の映像処理方法。 The video processing method according to claim 4, wherein the determining includes determining the display timing based on the timing information when the timing information is included in the processing unit to be reproduced. 前記検出されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合をメモリに保存することをさらに具備し、
前記算出することは、前記メモリに保存されたピクチャの数及び前記プログレッシブ方式のフレームピクチャとインターレース方式のフィールドピクチャとの割合前記所定の再生時間とに基づいて前記再生フレームレートを算出する請求項記載の映像処理方法。
Storing the number of detected pictures and the ratio of the progressive frame picture and the interlaced field picture in a memory;
The calculating includes calculating the reproduction frame rate based on the number of pictures stored in the memory, a ratio between the progressive frame picture and the interlaced field picture, and the predetermined reproduction time. Item 5. The video processing method according to Item 4 .
JP2011066570A 2011-03-24 2011-03-24 Video processing apparatus and video processing method Expired - Fee Related JP5092028B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011066570A JP5092028B2 (en) 2011-03-24 2011-03-24 Video processing apparatus and video processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011066570A JP5092028B2 (en) 2011-03-24 2011-03-24 Video processing apparatus and video processing method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009150043A Division JP2011009949A (en) 2009-06-24 2009-06-24 Video processor and video processing method

Publications (2)

Publication Number Publication Date
JP2011172252A JP2011172252A (en) 2011-09-01
JP5092028B2 true JP5092028B2 (en) 2012-12-05

Family

ID=44685819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011066570A Expired - Fee Related JP5092028B2 (en) 2011-03-24 2011-03-24 Video processing apparatus and video processing method

Country Status (1)

Country Link
JP (1) JP5092028B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005123907A (en) * 2003-10-16 2005-05-12 Matsushita Electric Ind Co Ltd Data reconstruction apparatus

Also Published As

Publication number Publication date
JP2011172252A (en) 2011-09-01

Similar Documents

Publication Publication Date Title
JP6562992B2 (en) Trick playback in digital video streaming
JP4076067B2 (en) Recording / playback system
US8625668B2 (en) Information processing apparatus and video decoding method of information processing apparatus
CN107197340B (en) Wireless communication apparatus and method for transmitting and receiving data using wireless local area network
US20150156557A1 (en) Display apparatus, method of displaying image thereof, and computer-readable recording medium
TW201246916A (en) Techniques for synchronization of audio and video
WO2019170073A1 (en) Media playback
JP2008042566A (en) Information processor and decoding control method of the information processor
US9872054B2 (en) Presentation of a multi-frame segment of video content
US8358918B2 (en) Video processing apparatus and video processing method
JP2007174195A (en) Electronic equipment, and automatic scene skipping method, and program
US20090193355A1 (en) Information processing apparatus and display control method
CN105052060A (en) Device and method for switching from a first data stream to a second data stream
US8385431B2 (en) Moving picture data decoding device
JP5093233B2 (en) Signal output device, information device, signal output method, and signal output program
CN113490047A (en) Android audio and video playing method
JP4314315B1 (en) Information processing apparatus and decoding control method
JP2006279709A (en) Information processor and image processing method
US20210400334A1 (en) Method and apparatus for loop-playing video content
JP4592805B1 (en) Moving picture decoding apparatus, program, and decoding process simplification method
JP5092028B2 (en) Video processing apparatus and video processing method
KR20140117889A (en) Client apparatus, server apparatus, multimedia redirection system and the method thereof
JP4751413B2 (en) Information processing apparatus and determination mode setting method for decoder
JP5106671B1 (en) Electronic device and reproduction control method
JP2008311784A (en) Device and method for decoding motion picture

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees