JP2010148048A - 動画像再圧縮装置および動画像再圧縮方法 - Google Patents

動画像再圧縮装置および動画像再圧縮方法 Download PDF

Info

Publication number
JP2010148048A
JP2010148048A JP2008326228A JP2008326228A JP2010148048A JP 2010148048 A JP2010148048 A JP 2010148048A JP 2008326228 A JP2008326228 A JP 2008326228A JP 2008326228 A JP2008326228 A JP 2008326228A JP 2010148048 A JP2010148048 A JP 2010148048A
Authority
JP
Japan
Prior art keywords
moving image
stream
data
subtitle
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008326228A
Other languages
English (en)
Inventor
Yuji Kawashima
裕司 川島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008326228A priority Critical patent/JP2010148048A/ja
Publication of JP2010148048A publication Critical patent/JP2010148048A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract


【課題】字幕の表示、非表示を切り替えることが可能になるストリームを生成すること。
【解決手段】第1動画像ストリームを復号することによって第1動画像データを生成する動画像復号モジュール311と、第1動画像データを設定された解像度を有する第2動画像データに変換するスケーリングモジュール312と、字幕文ストリームを復号して第1字幕プレーンを生成する字幕文データ復号モジュール321と、第1字幕プレーンを設定された解像度に変換した第2字幕プレーンを生成する字幕文データ変換モジュール322と、基本階層に第2動画像データを用い、拡張階層に第2字幕プレーンを用いて、第2動画像データおよび第2字幕プレーンを階層符号化法を用いて符号化することによって第2動画像ストリームを生成する動画像符号化モジュール330とを具備する。
【選択図】 図2

Description

本発明は、映像ストリームを再圧縮符号化する動画像再圧縮装置および動画像再圧縮方法に関する。
HDDレコーダ装置等で記録した地上デジタル放送の番組を、携帯機器で再生したいという需要が高まっている。これを実現するために、地上デジタル放送ストリームを携帯機器で再生可能なストリームに変換する必要がある。このような高レートから低レートのストリームに変換(トランスコード)する際、動画像データおよび音声データはサンプリングレート変換などで圧縮する。一方、字幕文データは、文字数を圧縮することは不可能で、また文を解析し要約するのも困難である。
特許文献1は、ブルーレイディスク(Blu-ray Disc 登録商標)のような大容量の記録媒体に記録されたプログラムにおける字幕表示を、ユーザのインタラクティブな操作に対して適切に行う技術を開示している。
特開2007−228181号公報
字幕文を表示するために、字幕文を映像に埋め込み、動画像として符号化する方法が考えられる。ところが、字幕文データを非表示にすることが不可能になる。
本発明の目的は、字幕の表示、非表示を切り替えることが可能になるストリームを生成することが可能な動画像再圧縮装置および動画像再圧縮方法を提供することにある。
本発明の一例に係わる動画像再圧縮装置は、第1映像ストリームを第1音声ストリーム、第1動画像ストリーム、および字幕文ストリームに分離する手段と、前記第1音声ストリームを復号することによって第1音声データを生成する手段と、前記第1音声データを元のサンプリングレートより低い第2音声データに変換する手段と、前記第2音声データを設定された符号化方式を用いて符号化することによって第2音声ストリームを生成する手段と、前記第1動画像ストリームを復号することによって第1動画像データを生成する手段と、前記第1動画像データを設定された解像度を有する第2動画像データに変換する手段と、前記字幕文ストリームを復号して第1字幕プレーンを生成する手段と、前記第1字幕プレーンを設定された解像度に変換した第2字幕プレーンを生成する手段と、基本階層に前記第2動画像データを用い、拡張階層に前記第2字幕プレーンを用いて、前記第2動画像データおよび前記第2字幕プレーンを階層符号化方式を用いて符号化することによって第2動画像ストリームを生成する手段と、前記第2音声ストリームおよび前記第2動画像ストリームを多重化することによって第2映像ストリームを生成する手段とを具備することを特徴とする。
本発明によれば、字幕の表示、非表示を切り替えることが可能になるストリームを生成することが可能になる。
本発明の実施の形態を以下に図面を参照して説明する。
まず、図1を参照して、本発明の一実施形態に係る動画像再圧縮装置の構成について説明する。この動画像再圧縮装置は、例えば、ノートブック型パーソナルコンピュータ10として実現されている。
次に、図1のブロック図を参照して、本コンピュータ10のシステム構成について説明する。
本コンピュータ10は、図1に示されているように、CPU101、ノースブリッジ102、主メモリ103、サウスブリッジ104、グラフィクスプロセッシングユニット(GPU)105、ビデオメモリ(VRAM)105A、サウンドコントローラ106、BIOS−ROM109、LANコントローラ110、ハードディスクドライブ(HDD)111、High Definition Digital Versatile Disc(HD DVD)/DVDドライブ(ODD)112、カードコントローラ113、無線LANコントローラ114、IEEE 1394コントローラ115、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116、およびデジタルTVチューナ117等を備えている。
CPU101は本コンピュータ10の動作を制御するプロセッサであり、ハードディスクドライブ(HDD)111から主メモリ103にロードされる、オペレーティングシステム(OS)151、TVアプリケーションプログラム152、トランスコードアプリケーションプログラム201のような各種アプリケーションプログラムを実行する。TVアプリケーションプログラム152はTV機能を実行するためのソフトウェアである。このTVアプリケーションプログラム152は、TVチューナ117によって受信された放送番組データを視聴するためのライブ再生処理、受信された放送番組データをHDD111に記録する録画処理、およびHDD111に記録された放送番組データ/ビデオデータを再生する再生処理等を実行する。トランスコードアプリケーションプログラム201はハードディスクドライブ111に記録されている放送番組データ/ビデオデータをトンランスコート処理するためのプログラムである。また、CPU101は、BIOS−ROM109に格納されたBIOS(Basic Input Output System)も実行する。BIOSはハードウェア制御のためのプログラムである。
ノースブリッジ102はCPU101のローカルバスとサウスブリッジ104との間を接続するブリッジデバイスである。ノースブリッジ102には、主メモリ103をアクセス制御するメモリコントローラも内蔵されている。また、ノースブリッジ102は、PCI EXPRESS規格のシリアルバスなどを介してGPU105との通信を実行する機能も有している。
GPU105は本コンピュータ10のディスプレイモニタとして使用されるLCD17を制御する表示コントローラである。このGPU105によって生成される表示信号はLCD17に送られる。また、表示信号は、コンピュータ本体11に設けられたインタフェース3、4をそれぞれ介して外部のTV1、外部のHDMIモニタに送出することもできる。
サウスブリッジ104は、LPC(Low Pin Count)バス上の各デバイス、およびPCI(Peripheral Component Interconnect)バス上の各デバイスを制御する。また、サウスブリッジ104は、HDD111、ODD112を制御するためのIDE(Integrated Drive Electronics)コントローラを内蔵している。さらに、サウスブリッジ104は、サウンドコントローラ106との通信を実行する機能も有している。
サウスブリッジ104は、外部機器と通信を行うためのインタフェースとしてUSBコントローラ104Aを有する。USBコントローラ104Aは、例えば携帯型再生装置20に接続される。
サウンドコントローラ106は音源デバイスであり、再生対象のオーディオデータをスピーカ19に出力する。
カードコントローラ113は、PCカード、SD(Secure Digital)カードのようなカードを制御する。無線LANコントローラ114は、たとえばIEEE 802.11規格の無線通信を実行する無線通信デバイスである。IEEE 1394コントローラ115は、IEEE 1394規格のシリアルバスを介して外部機器との通信を実行する。エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、電力管理のためのエンベデッドコントローラと、キーボード(KB)13およびタッチパッド15を制御するためのキーボードコントローラとが集積された1チップマイクロコンピュータである。このエンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、ユーザによるパワーボタン14の操作に応じて本コンピュータ10をパワーオン/パワーオフする機能を有している。
TVチューナ117はテレビジョン(TV)放送信号によって放送される放送番組データを受信する受信装置である。このTVチューナ117は、例えば、地上波デジタルTV放送のようなデジタル放送番組データを受信可能なデジタルTVチューナとして実現されている。また、TVチューナ117は、外部機器から入力されるビデオデータをキャプチャする機能も有している。
次に、トランスコードアプリケーションプログラム201の構成を図2を参照して説明する。
トランスコードアプリケーションプログラム201は、ストリーム分離モジュール300、音声復号モジュール301、サンプリングレート変換モジュール302、音声符号化モジュール303、動画像復号モジュール311、スケーリングモジュール312、字幕文データ復号モジュール321、字幕文データ変換モジュール322、動画像符号化モジュール330、およびストリーム多重モジュール340等を備えている。
ストリーム分離モジュール300は、映像ストリームを音声ストリーム、動画像ストリーム、および字幕文ストリームに分離する。ストリーム分離モジュール300は、音声ストリームを音声復号モジュール301に出力する。ストリーム分離モジュール300は、動画像ストリームを動画像復号モジュール311に出力する。ストリーム分離モジュール300は、字幕文ストリームを字幕文データ復号モジュール321に出力する。
音声復号モジュール301は、例えばMPEG−2 AAC規格によって符号化されている音声ストリームを符号化方式に対応する復号方法にしたがって復号し、音声データ(PCMなど)をサンプリングレート変換モジュール302に出力する。サンプリングレート変換モジュール302では、復号された音声データを指定のサンプリング周波数に従ってサンプリング変換し、変換された音声データを音声符号化モジュール313に出力する。音声符号化モジュール313は、サンプリング変換後の音声データを所定の符号化方式にしたがい符号化し、音声ストリームをストリーム多重モジュール340出力する。
動画像復号モジュール311は、例えばMPEG−2 TS規格で符号化されている動画像ストリームを符号化方式に対応する復号方法にしたがって復号することによって動画像データ(YUVフォーマットなど)を生成し、動画像データをスケーリングモジュール312に出力する。動画像データの解像度は、例えば1440×1080である。スケーリングモジュール312は、例えばYUVフォーマットの動画像データを、指定のサイズ(解像度)、例えば320×240に変換した動画像データを生成し、動画像データを動画像符号化モジュール330に出力する。
字幕文データ復号モジュール321は、ストリーム分離モジュール300が出力した符号化されている字幕文ストリームを符号化方式に対応する復号方法にしたがって復号し、字幕プレーンを生成し、字幕文データ変換モジュール322に出力する。字幕文データ変換モジュール322は、字幕文データ復号モジュール321が出力した字幕プレーンを、指定のサイズへ変換した字幕プレーンを生成し、字幕プレーンを動画像符号化モジュール330に出力する。
動画像符号化モジュール330は、サイズ変換後の動画像データおよび字幕プレーンを、所定の階層符号化方式にしたがって符号化することによって動画像ストリームを生成し、動画像ストリームをストリーム多重モジュール340に出力する。なお、動画像符号化モジュール330は、動画像データを基本階層の動画像とし、字幕プレーンを拡張階層の動画像として符号化する。動画像符号化モジュール330は、例えばH.264/AVC規格を用いて動画像データおよび字幕プレーンを符号化する。階層符号化方式を用いたH.264/AVC規格による符号化は、例えば特開2007−174568号公報に記載されている。
ストリーム多重モジュール340は、音声ストリームおよび動画像ストリームを入力とし、所定の多重化方式にしたがい多重したストリームを出力する。このストリームは、ハードディスクドライブ111に格納される。
そして、ストリームは、USBコントローラ104Aを介して、携帯型再生装置20に伝送される。この携帯型再生装置20は、ストリームの基本階層のみの再生、或いは基本階層および拡張階層の再生を切り替えて行うことができる。また、ユーザは、字幕文を表示させたい場合、携帯型再生装置20に基本階層および拡張階層を再生させる。ユーザは、字幕文を表示させたくない場合、携帯型再生装置20に基本階層だけを再生させる。このように、字幕文表示/非表示を切り替えることができる。
字幕文データを動画像に埋め込み符号化する際、元の動画像を基本階層に、字幕文に対するデータを拡張階層に符号化することで、復号側で復号するストリームを選択することで、字幕文の表示・非表示の切り替えが可能となる。
なお、トランスコードアプリケーションプログラム201の構成の一部は、ハードウエアによって実現することが可能である。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
本発明の一実施形態に係る動画像再圧縮装置のシステム構成を示すブロック図。 トランスコードアプリケーションプログラムの構成を示すブロック図。
符号の説明
300…ストリーム分離モジュール,301…音声復号モジュール,302…サンプリングレート変換モジュール,303…音声符号化モジュール,311…動画像復号モジュール,312…スケーリングモジュール,313…音声復号化モジュール,321…字幕文データ復号モジュール,322…字幕文データ変換モジュール,330…動画像符号化モジュール,340…ストリーム多重モジュール。

Claims (7)

  1. 第1映像ストリームを第1音声ストリーム、第1動画像ストリーム、および字幕文ストリームに分離する手段と、
    前記第1音声ストリームを復号することによって第1音声データを生成する手段と、
    前記第1音声データを元のサンプリングレートより低い第2音声データに変換する手段と、
    前記第2音声データを設定された符号化方式を用いて符号化することによって第2音声ストリームを生成する手段と、
    前記第1動画像ストリームを復号することによって第1動画像データを生成する手段と、
    前記第1動画像データを設定された解像度を有する第2動画像データに変換する手段と、
    前記字幕文ストリームを復号して第1字幕プレーンを生成する手段と、
    前記第1字幕プレーンを設定された解像度に変換した第2字幕プレーンを生成する手段と、
    基本階層に前記第2動画像データを用い、拡張階層に前記第2字幕プレーンを用いて、前記第2動画像データおよび前記第2字幕プレーンを階層符号化方式を用いて符号化することによって第2動画像ストリームを生成する再符号化手段と、
    前記第2音声ストリームおよび前記第2動画像ストリームを多重化することによって第2映像ストリームを生成する手段と
    を具備することを特徴とする動画像再圧縮装置。
  2. 放送信号を受信し、当該放送信号を復調して放送番組データを出力するチューナ部と、
    前記番組信号を前記第1映像ストリームとして格納する記憶装置と
    を更に具備することを特徴とする請求項1に記載の動画像再圧縮装置。
  3. 前記再符号化手段は、H.264/AVC規格を用いて前記第2動画像データおよび前記第2字幕プレーンを符号化することを特徴とする請求項1に記載の動画像再圧縮装置。
  4. 前記第2動画像ストリームを、前記第2動画像ストリームの基本階層だけを再生する機能と、前記第2動画像ストリームの基本階層および拡張階層を再生する機能とを有する再生装置に伝送するためのインタフェースを更に具備することを特徴とする請求項1に記載の動画像再圧縮装置。
  5. 第1映像ストリームを第1音声ストリーム、第1動画像ストリーム、および字幕文ストリームに分離し、
    前記第1音声ストリームを復号することによって第1音声データを生成し、
    前記第1音声データを元のサンプリングレートより低い第2音声データに変換し、
    前記第2音声データを設定された符号化方式を用いて符号化することによって第2音声ストリームを生成し、
    前記第1動画像ストリームを復号することによって第1動画像データを生成し、
    前記第1動画像データを設定された解像度を有する第2動画像データに変換し、
    前記字幕文ストリームを復号して第1字幕プレーンを生成し、
    前記第1字幕プレーンを設定された解像度に変換した第2字幕プレーンを生成し、
    基本階層に前記第2動画像データを用い、拡張階層に前記第2字幕プレーンを用いて、前記第2動画像データおよび前記第2字幕プレーンを階層符号化方式を用いて符号化することによって第2動画像ストリームを生成する再符号化処理を実行し、
    前記第2音声ストリームおよび前記第2動画像ストリームを多重化することによって第2映像ストリームを生成する
    ことを特徴とする動画像再圧縮方法。
  6. 前記第1映像ストリームは、放送信号を復調して得られる放送番組データであることを特徴とする請求項5に記載の動画像再圧縮方法。
  7. 前記再符号化処理は、H.264/AVC規格を用いて前記第2動画像データおよび前記第2字幕プレーンを符号化することを特徴とする請求項5に記載の動画像再圧縮方法。
JP2008326228A 2008-12-22 2008-12-22 動画像再圧縮装置および動画像再圧縮方法 Withdrawn JP2010148048A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008326228A JP2010148048A (ja) 2008-12-22 2008-12-22 動画像再圧縮装置および動画像再圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008326228A JP2010148048A (ja) 2008-12-22 2008-12-22 動画像再圧縮装置および動画像再圧縮方法

Publications (1)

Publication Number Publication Date
JP2010148048A true JP2010148048A (ja) 2010-07-01

Family

ID=42567953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008326228A Withdrawn JP2010148048A (ja) 2008-12-22 2008-12-22 動画像再圧縮装置および動画像再圧縮方法

Country Status (1)

Country Link
JP (1) JP2010148048A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014060529A (ja) * 2012-09-14 2014-04-03 Toshiba Corp マルチフォーマット出力装置、マルチフォーマット出力装置の制御方法
JP6147451B1 (ja) * 2016-01-14 2017-06-14 日本放送協会 受信装置、送信装置、およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014060529A (ja) * 2012-09-14 2014-04-03 Toshiba Corp マルチフォーマット出力装置、マルチフォーマット出力装置の制御方法
JP6147451B1 (ja) * 2016-01-14 2017-06-14 日本放送協会 受信装置、送信装置、およびプログラム
JP2017130922A (ja) * 2016-01-14 2017-07-27 日本放送協会 受信装置、送信装置、およびプログラム
JP2017139814A (ja) * 2016-01-14 2017-08-10 日本放送協会 受信装置、送信装置、およびプログラム
JP2017147763A (ja) * 2016-01-14 2017-08-24 日本放送協会 受信装置、送信装置、およびプログラム

Similar Documents

Publication Publication Date Title
JP4469788B2 (ja) 情報処理装置および再生方法
US7929615B2 (en) Video processing apparatus
JP4564565B2 (ja) 再生装置および再生装置の制御方法
JP4413977B2 (ja) 情報処理装置及び映像再生方法
US9014547B2 (en) Playback apparatus and method of controlling the playback apparatus
JP2008090889A (ja) 情報処理装置および再生方法
JP4346663B2 (ja) 情報処理装置、及びプログラム
JP2010148048A (ja) 動画像再圧縮装置および動画像再圧縮方法
JP2008301208A (ja) 映像記録装置
JP4751413B2 (ja) 情報処理装置およびデコーダの判定モード設定方法
JP2008092107A (ja) 情報処理装置及び音声/映像データ再生方法
JP4922418B2 (ja) 再生装置および再生装置の制御方法
JP3540761B2 (ja) コンピュータシステムおよび動画再生方法
JP4738524B2 (ja) 情報処理装置及び映像再生方法
JP2008299972A (ja) 音声映像情報記録装置、および記録制御方法
JP3436818B2 (ja) コンピュータシステムおよび動画再生方法
JP4960321B2 (ja) 再生装置および再生装置の制御方法
JP5238850B2 (ja) 情報処理装置および動画像ストリームの復号方法
JP5275402B2 (ja) 情報処理装置、映像再生方法及び映像再生プログラム
JP5148655B2 (ja) 情報処理装置および情報処理装置の制御方法
JP2011090110A (ja) 再生装置および再生装置の制御方法
GB2424783A (en) Displaying broadcase video signals on a computer display where a picture-in-picture (PIP) format is used
JP2008252445A (ja) 情報処理装置
JP2010045595A (ja) 再生装置および再生装置の制御方法
JP2006033738A (ja) 電子機器および映像データ受信装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120306