JP5039976B2 - トランスコーダ - Google Patents

トランスコーダ Download PDF

Info

Publication number
JP5039976B2
JP5039976B2 JP2008075050A JP2008075050A JP5039976B2 JP 5039976 B2 JP5039976 B2 JP 5039976B2 JP 2008075050 A JP2008075050 A JP 2008075050A JP 2008075050 A JP2008075050 A JP 2008075050A JP 5039976 B2 JP5039976 B2 JP 5039976B2
Authority
JP
Japan
Prior art keywords
input image
image
code amount
scene change
transcoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008075050A
Other languages
English (en)
Other versions
JP2009232148A (ja
Inventor
誠 斉藤
弘 長谷川
みゆき 柳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Electronics Corp
MegaChips Corp
Original Assignee
NTT Electronics Corp
MegaChips Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Electronics Corp, MegaChips Corp filed Critical NTT Electronics Corp
Priority to JP2008075050A priority Critical patent/JP5039976B2/ja
Priority to US12/400,132 priority patent/US20090237569A1/en
Publication of JP2009232148A publication Critical patent/JP2009232148A/ja
Application granted granted Critical
Publication of JP5039976B2 publication Critical patent/JP5039976B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Description

本発明は、入力画像を復号画像に復号化して、復号画像を出力画像に符号化するトランスコーダに関する。
画像圧縮技術は、画像データの伝送負担および記憶負担を低減させるため、広範囲に利用されている。従来の符号化方式としてMPEG2などが存在しており、新規の符号化方式としてH.264などが存在している。トランスコーダは、画像データの伝送負担および記憶負担を低減させるため、異なる符号化方式間における方式変換を実行する。
トランスコーダは、第1段階として、第1符号化方式による圧縮画像を入力して、第1符号化方式により伸張画像を生成する。トランスコーダは、第2段階として、第2符号化方式により伸張画像を圧縮して、第2符号化方式による圧縮画像を出力する。
トランスコーダは、シーンチェンジを検出できる。例えば、トランスコーダは、動画像が平坦な画像から精細な画像に変化したことを検出できる。トランスコーダは、シーンチェンジを検出したときに、出力符号量の変動を抑制しながら、シーンチェンジ時の画質劣化を抑制できる。例えば、トランスコーダは、動画像が平坦な画像から精細な画像に変化したことを検出したときに、出力符号量の増加を抑制しながら、シーンチェンジ時の画質劣化を抑制できる。
符号化装置は、入力画像を圧縮して圧縮画像を出力する。一般的な符号化装置は、入力画像を先読みすることにより、シーンチェンジを検出できる。特許文献1が開示する符号化装置は、出力符号量の変動を検出することにより、シーンチェンジを検出できる。
特開2001−251630号公報
一般的な符号化装置は、入力画像を先読みすることにより、シーンチェンジを検出する。符号化装置は、先読みしていない入力画像について、出力符号量の変動を抑制する制御をいまだ実行できない。符号化装置は、先読みしている入力画像について、出力符号量の変動を抑制する制御をようやく実行できる。符号化装置は、先読み部分および符号化部分をともに備える必要があるため、回路規模の増大および制御処理の遅延を生ずる。
特許文献1が開示する符号化装置は、出力符号量の変動を検出することにより、シーンチェンジを検出する。符号化装置は、出力符号量の変動を検出した圧縮画像について、出力符号量の変動を抑制する制御をもはや実行できない。符号化装置は、出力符号量の変動を検出した圧縮画像に後続する入力画像について、出力符号量の変動を抑制する制御をようやく実行できる。符号化装置は、シーンチェンジを検出したときに、出力符号量の変動を効果的に抑制しながら、シーンチェンジ時の画質劣化を効果的に抑制できない。
そこで、本発明は前記問題点に鑑み、回路規模の増大および制御処理の遅延を生じないトランスコーダを提供することを目的とする。また、シーンチェンジを検出したときに、出力符号量の変動を効果的に抑制しながら、シーンチェンジ時の画質劣化を効果的に抑制するトランスコーダを提供することを目的とする。
上記課題を解決するため、請求項1記載の発明は、入力画像を復号画像に復号化して、前記復号画像を出力画像に符号化するトランスコーダであって、前記入力画像の特性量を検出する特性量検出部と、先行入力画像の特性量と後続入力画像の特性量の差分幅が所定特性量差分幅より大きいときに、前記先行入力画像と前記後続入力画像の間にシーンチェンジが発生したと判断するシーンチェンジ検出部と、前記入力画像の特性量に基づいて、前記出力画像の目標符号量を設定する目標符号量設定部と、前記シーンチェンジが発生したときに、前記先行入力画像に対応する先行出力画像の出力符号量から前記後続入力画像に対応する後続出力画像の出力符号量までの変動幅が抑制されるように、前記先行出力画像の目標符号量と前記後続出力画像の目標符号量の差分幅を小さくする補正符号量を設定し、前記後続出力画像の目標符号量を、設定した補正符号量を用いて補正する目標符号量補正部と、を備えることを特徴とする。
また、請求項2記載の発明は、入力画像を復号画像に復号化して、前記復号画像を出力画像に符号化するトランスコーダであって、前記入力画像の特性量を検出する特性量検出部と、先行入力画像の特性量と後続入力画像の特性量の特性量差分幅が所定特性量差分幅よりも大きいときに、前記先行入力画像と前記後続入力画像の間にシーンチェンジが発生したと判断するシーンチェンジ検出部と、前記シーンチェンジが発生したときに、前記特性量差分幅に基づいて前記シーンチェンジの種別を決定するシーンチェンジ種別決定部と、前記入力画像の特性量に基づいて、前記出力画像の目標符号量を設定する目標符号量設定部と、前記シーンチェンジが発生したときに、前記先行入力画像に対応する先行出力画像の出力符号量から前記後続入力画像に対応する後続出力画像の出力符号量までの変動幅が抑制されるように、前記目標符号量を増加させる補正符号量及び前記目標符号量を減少させる補正符号量のいずれかを前記シーンチェンジの種別に基づいて設定し、前記後続出力画像の目標符号量を、設定した補正符号量を用いて補正する目標符号量補正部と、を備えることを特徴とする。
請求項記載の発明は、請求項1または請求項2に記載のトランスコーダにおいて、前記目標符号量補正部は、前記出力画像の目標符号量の補正が開始されてから時間が経過するにつれて、前記補正符号量の絶対値を減少させ、補正が開始されてから第1所定期間が経過したときに前記出力画像の目標符号量の補正を終了する目標符号量補正終了部、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項3のいずれかに記載のトランスコーダにおいて、前記出力画像の目標符号量は、前記入力画像の所定単位における特性量に基づいて設定される第1目標符号量、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項3のいずれかに記載のトランスコーダにおいて、前記出力画像の目標符号量は、前記入力画像の全体における平均的な特性量に基づいて設定される第2目標符号量、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、前記補正符号量は、前記先行入力画像の特性量と前記後続入力画像の特性量の差分幅に基づいて設定される符号量、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、前記特性量は、前記入力画像の各隣接画素間における画素値の差分絶対値を、前記入力画像の全隣接画素間について加算した値に対して、前記入力画像の全ブロック数により除算した値、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、前記特性量は、前記入力画像の各ブロックにおける量子化ステップ値を、前記入力画像の全ブロックについて平均した値に対して、前記入力画像の符号量を乗算した値、を含むことを特徴とする。
請求項記載の発明は、請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、前記特性量は、前記入力画像の各ブロックにおける動きベクトルの符号量を、前記入力画像の全ブロックについて加算した値に対して、前記入力画像の全ブロック数により除算した値、を含むことを特徴とする。
請求項10記載の発明は、請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、前記特性量は、前記入力画像の各ブロックにおける動きベクトルの長さを、前記入力画像の全ブロックについて加算した値に対して、前記入力画像の全ブロック数により除算した値、を含むことを特徴とする。
請求項11記載の発明は、請求項1ないし請求項10のいずれかに記載のトランスコーダにおいて、前記後続入力画像は、参照画像と順方向予測画像と双方向予測画像のうち1種類の画像、を含み、前記先行入力画像は、参照画像と順方向予測画像と双方向予測画像のうち前記1種類の画像であって、前記後続入力画像の直近の画像、を含むことを特徴とする。
請求項12記載の発明は、請求項11に記載のトランスコーダにおいて、前記特性量は、参照画像と順方向予測画像と双方向予測画像の各々について検出される個別特性量、を含み、前記所定特性量差分幅は、参照画像と順方向予測画像と双方向予測画像の各々について設定される個別差分幅、を含むことを特徴とする。
請求項13記載の発明は、請求項1ないし請求項12のいずれかに記載のトランスコーダにおいて、前記シーンチェンジ検出部は、前記シーンチェンジが発生したと判断したときから第2所定期間後に、シーンチェンジ検出を再開するシーンチェンジ検出再開部、を含み、前記第2所定期間は、前記先行入力画像が参照する参照画像が、前記シーンチェンジが発生したシーンチェンジ発生画像より、時間軸方向に後に配置されるようになるまでの期間、を含むことを特徴とする。
本発明に係るトランスコーダは、入力画像を復号画像に復号化して、復号画像を出力画像に符号化する。トランスコーダは、シーンチェンジ検出部、目標符号量設定部、量子化ステップ値設定部を備える。シーンチェンジ検出部は、入力画像の特性量に基づいて、シーンチェンジを検出する。目標符号量設定部は、シーンチェンジ前後において、出力符号量の変動を抑制するため、あらかじめ設定した目標符号量に対して、補正符号量分の補正を実行する。量子化ステップ値設定部は、目標符号量に基づいて、量子化ステップ値を設定する。
トランスコーダは、入力画像を先読みすることにより、シーンチェンジを検出することはない。そのため、トランスコーダは、回路規模の増大および制御処理の遅延を生じない。トランスコーダは、出力符号量の変動を検出することにより、シーンチェンジを検出することはない。そのため、トランスコーダは、シーンチェンジを検出したときに、出力符号量の変動を効果的に抑制しながら、シーンチェンジ時の画質劣化を効果的に抑制できる。
{トランスコーダの構成要素}
以下、図面を参照しつつ、本発明の実施の形態について説明する。図1は、トランスコーダ1の構成要素を示すブロック図である。トランスコーダ1は、デコーダ11、エンコーダ12、アクティビティ検出部114などから構成される。
デコーダ11は、トランスコーダ1の外部から、入力画像を入力する。デコーダ11は、自身における符号化方式により、入力画像を復号画像に復号化する。デコーダ11は、エンコーダ12に、復号画像を出力する。
エンコーダ12は、デコーダ11から、復号画像を入力する。エンコーダ12は、自身における符号化方式により、復号画像を出力画像に符号化する。エンコーダ12は、トランスコーダ1の外部に、出力画像を出力する。
デコーダ11は、復号画像生成部111、量子化ステップ平均値検出部112、入力画像符号量検出部113などから構成される。エンコーダ12は、周波数変換部121、量子化部122、符号化部123、シーンチェンジ検出部124、目標符号量設定部125、量子化ステップ値設定部126などから構成される。
復号画像生成部111は、入力画像について、復号化、逆量子化、周波数逆変換を実行することにより、復号画像を生成する。
量子化ステップ平均値検出部112は、入力画像について、量子化ステップ平均値を検出する。量子化ステップ平均値については、図2において後述する。
入力画像符号量検出部113は、入力画像について、入力画像符号量を検出する。入力画像符号量については、図2において後述する。
アクティビティ検出部114は、復号画像について、アクティビティを検出する。アクティビティについては、図2において後述する。
周波数変換部121は、復号画像について、周波数変換を実行する。量子化部122は、後述の量子化ステップ値設定部126により設定された量子化ステップ値に基づいて、周波数変換後の復号画像について、量子化を実行する。符号化部123は、周波数変換後および量子化後の復号画像について、符号化を実行する。
シーンチェンジ検出部124は、アクティビティ、量子化ステップ平均値、入力画像符号量に基づいて、シーンチェンジを検出する。例えば、シーンチェンジ検出部124は、動画像が平坦な画像から精細な画像に変化したことを検出する。
目標符号量設定部125は、シーンチェンジ情報に基づいて、目標符号量を設定する。例えば、目標符号量設定部125は、動画像が平坦な画像から精細な画像に変化したときに、出力符号量の増加を抑制するため、あらかじめ設定した目標符号量に対して、補正符号量分の減少補正を実行する。
量子化ステップ値設定部126は、目標符号量に基づいて、量子化ステップ値を設定する。例えば、量子化ステップ値設定部126は、動画像が平坦な画像から精細な画像に変化したときに、出力符号量の増加を抑制するため、量子化ステップ値を急激に小さくしないように、量子化ステップ値を設定する。
{シーンチェンジ検出の処理の流れ}
図2は、シーンチェンジを検出する処理の流れを示すフローチャートである。シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと比較する。シーンチェンジ検出部124は、後続入力画像の精細さが先行入力画像の精細さから大きく変化しているときには、先行入力画像および後続入力画像の間にシーンチェンジが発生していると判断する。シーンチェンジ検出部124は、後続入力画像の精細さが先行入力画像の精細さから大きく変化していないときには、先行入力画像および後続入力画像の間にシーンチェンジが発生していないと判断する。
シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと比較することを、以下に示す連続する第1の処理および第2の処理のように繰り返す。
第1の処理において、シーンチェンジ検出部124は、第1入力画像の精細さについて、情報をすでに格納している。シーンチェンジ検出部124は、第1入力画像の後続入力画像である第2入力画像の精細さについて、情報を新たに取得する。シーンチェンジ検出部124は、第2入力画像の精細さを第1入力画像の精細さと比較する。
第2の処理において、シーンチェンジ検出部124は、第2入力画像の精細さについて、情報をすでに格納している。シーンチェンジ検出部124は、第2入力画像の後続入力画像である第3入力画像の精細さについて、情報を新たに取得する。シーンチェンジ検出部124は、第3入力画像の精細さを第2入力画像の精細さと比較する。
第1の処理における先行入力画像および後続入力画像は、それぞれ、第1入力画像および第2入力画像である。第2の処理における先行入力画像および後続入力画像は、それぞれ、第2入力画像および第3入力画像である。連続する第1の処理および第2の処理を比較すれば、先行入力画像および後続入力画像が時々刻々と更新されていることが分かる。
シーンチェンジ検出部124は、量子化ステップ平均値を量子化ステップ平均値検出部112から取得する。シーンチェンジ検出部124は、入力画像符号量を入力画像符号量検出部113から取得する。シーンチェンジ検出部124は、量子化ステップ平均値および入力画像符号量を乗算して乗算値を計算する(ステップS1)。量子化ステップ平均値は、入力画像の各ブロックにおける量子化ステップ値を、入力画像の全ブロックについて平均した値である。乗算値は、入力画像の精細さを示す量となる。
シーンチェンジ検出部124は、アクティビティをアクティビティ検出部114から取得する(ステップS2)。アクティビティは、復号画像の各隣接画素間における画素値の差分絶対値を、復号画像の全隣接画素間について加算した値に対して、復号画像の全ブロック数により除算した値である。アクティビティは、入力画像の精細さを示す量となる。
シーンチェンジ検出部124は、後続入力画像のアクティビティから、先行入力画像のアクティビティを減算する(ステップS3)。ステップS3における減算値が、正の所定閾値より大きいときには(ステップS3においてYES)、シーンチェンジ検出部124は、先行入力画像および後続入力画像の間に第1シーンチェンジが発生していると判断する(ステップS8)。ステップS3における減算値が、正の所定閾値以下であるときには(ステップS3においてNO)、シーンチェンジ検出部124は、ステップS4に進む。
シーンチェンジ検出部124は、後続入力画像の乗算値から、先行入力画像の乗算値を減算する(ステップS4)。ステップS4における減算値が、正の所定閾値より大きいときには(ステップS4においてYES)、シーンチェンジ検出部124は、先行入力画像および後続入力画像の間に第1シーンチェンジが発生していると判断する(ステップS8)。ステップS4における減算値が、正の所定閾値以下であるときには(ステップS4においてNO)、シーンチェンジ検出部124は、ステップS5に進む。
第1シーンチェンジにおいては、後続入力画像の精細さは、先行入力画像の精細さより際立って高い。シーンチェンジ検出部124は、アクティビティおよび乗算値の両方に基づいて、第1シーンチェンジを検出できる。
シーンチェンジ検出部124は、先行入力画像のアクティビティから、後続入力画像のアクティビティを減算する(ステップS5)。ステップS5における減算値が、正の所定閾値より大きいときには(ステップS5においてYES)、シーンチェンジ検出部124は、先行入力画像および後続入力画像の間に第2シーンチェンジが発生していると判断する(ステップS9)。ステップS5における減算値が、正の所定閾値以下であるときには(ステップS5においてNO)、シーンチェンジ検出部124は、ステップS6に進む。
シーンチェンジ検出部124は、先行入力画像の乗算値から、後続入力画像の乗算値を減算する(ステップS6)。ステップS6における減算値が、正の所定閾値より大きいときには(ステップS6においてYES)、シーンチェンジ検出部124は、先行入力画像および後続入力画像の間に第2シーンチェンジが発生していると判断する(ステップS9)。ステップS6における減算値が、正の所定閾値以下であるときには(ステップS6においてNO)、シーンチェンジ検出部124は、先行入力画像および後続入力画像の間に、第1シーンチェンジおよび第2シーンチェンジのいずれも発生していないと判断する(ステップS7)。
第2シーンチェンジにおいては、後続入力画像の精細さは、先行入力画像の精細さより際立って低い。シーンチェンジ検出部124は、アクティビティおよび乗算値の両方に基づいて、第2シーンチェンジを検出できる。
トランスコード開始時において、シーンチェンジ検出部124は、最初の入力画像のアクティビティと比較すべきアクティビティについて、情報を格納していない。トランスコード開始時において、シーンチェンジ検出部124は、最初の入力画像の乗算値と比較すべき乗算値について、情報を格納していない。
シーンチェンジ検出部124は、N番目の入力画像を入力したときから、後続入力画像のアクティビティおよび乗算値を、先行入力画像のアクティビティおよび乗算値と比較し始めればよい。ここで、Nは、2以上の自然数である。
シーンチェンジ検出部124は、後続入力画像の動きの激しさを先行入力画像の動きの激しさと比較してもよい。シーンチェンジ検出部124は、後続入力画像の動きの激しさが先行入力画像の動きの激しさから大きく変化しているときには、先行入力画像および後続入力画像の間にシーンチェンジが発生していると判断すればよい。シーンチェンジ検出部124は、後続入力画像の動きの激しさが先行入力画像の動きの激しさから大きく変化していないときには、先行入力画像および後続入力画像の間にシーンチェンジが発生していないと判断すればよい。
入力画像の動きの激しさは、入力画像の各ブロックにおける動きベクトルの符号量または長さを、入力画像の全ブロックについて加算した値に対して、入力画像の全ブロック数により除算した値とすればよい。
{目標符号量設定の処理の流れ}
図3は、目標符号量を設定する処理の流れを示すフローチャートである。目標符号量設定部125は、シーンチェンジ情報をシーンチェンジ検出部124から取得する(ステップS11)。目標符号量設定部125は、後続入力画像の精細さが先行入力画像の精細さと比較して大きく異なるときには、あらかじめ設定した目標符号量に対して、補正符号量分の補正を実行する。目標符号量設定部125は、後続入力画像の精細さが先行入力画像の精細さと比較して大きく異ならないときには、あらかじめ設定した目標符号量をそのまま保持する。
第1シーンチェンジまたは第2シーンチェンジが発生していないときについて考える(ステップS12においてNO)。すなわち、後続入力画像の精細さが、先行入力画像の精細さより、際立って高くも低くもないときについて考える。目標符号量設定部125は、あらかじめ設定した目標符号量をそのまま保持する(ステップS13)。
第1シーンチェンジが発生しているときについて考える(ステップS12においてYES、ステップS14において「第1」)。すなわち、後続入力画像の精細さが、先行入力画像の精細さより、際立って高いときについて考える。目標符号量設定部125は、あらかじめ設定した目標符号量に対して、補正符号量分の減少補正を強制的に実行する(ステップS15)。すなわち、目標符号量設定部125は、出力符号量の増加を抑制しようとする。そして、目標符号量設定部125は、第1シーンチェンジ後の定常状態に向けて、強制的な減少補正を徐々に解除する(ステップS16)。
第2シーンチェンジが発生しているときについて考える(ステップS12においてYES、ステップS14において「第2」)。すなわち、後続入力画像の精細さが、先行入力画像の精細さより、際立って低いときについて考える。目標符号量設定部125は、あらかじめ設定した目標符号量に対して、補正符号量分の増加補正を強制的に実行する(ステップS17)。すなわち、目標符号量設定部125は、出力符号量の減少を抑制しようとする。そして、目標符号量設定部125は、第2シーンチェンジ後の定常状態に向けて、強制的な増加補正を徐々に解除する(ステップS18)。
補正符号量は、シーンチェンジ前後における入力画像の精細さの差異、または、シーンチェンジ前後における入力画像の動きの激しさの差異に基づいて設定される。
補正符号量は、シーンチェンジ前後において、入力画像の精細さについて差異が大きいとき、または、入力画像の動きの激しさについて差異が大きいときには、絶対値を大きめに設定されればよい。
補正符号量は、シーンチェンジ前後において、入力画像の精細さについて差異が小さいとき、または、入力画像の動きの激しさについて差異が小さいときには、絶対値を小さめに設定されればよい。
{トランスコーダによる処理の流れの第1具体例}
図4は、トランスコーダ1による処理の流れの第1具体例を示すタイムチャートである。図4(a)は、アクティビティまたは乗算値の時間変化を示すタイムチャートである。図4(b)は、目標符号量の時間変化を示すタイムチャートである。図4(c)は、出力符号量の時間変化を示すタイムチャートである。図4を上下方向に貫通する4本の破線は、左側から右側までの順序で、時刻T1、T2、T3、T4を示す。
アクティビティまたは乗算値は、時々刻々と変化する。しかし、図4においては、説明を簡単にするため、アクティビティまたは乗算値は、時刻T1、T2、T3、T4においてのみ、値を変化させることとする。
第1具体例においては、ステップS13、S15、S17におけるあらかじめ設定された目標符号量は、GOP単位などの所定単位に含まれる入力画像の精細さに基づいて各所定単位について設定された、補正されていない目標符号量である。
時刻T1までにおいては、アクティビティまたは乗算値は、線分A1で示した値をとる。目標符号量は、線分A1で示した値に従って、線分B1で示した値に設定されている。出力符号量は、線分B1で示した値に従って、線分C1で示した値をとる。
時刻T1においては、アクティビティまたは乗算値は、矢印A12で示した値だけ増加する。矢印A12で示した増加分は、正の所定閾値以下である(ステップS3、S4、S5、S6においてNO)。シーンチェンジが発生していないと判断される(ステップS7、ステップS12においてNO)。
時刻T1から時刻T2までにおいては、アクティビティまたは乗算値は、線分A2で示した値をとる。目標符号量は、線分A2で示した値に従ってあらかじめ設定された線分B2で示した値に、そのまま設定されている(ステップS13)。出力符号量は、線分B2で示した値に従って、線分C2で示した値をとる。
時刻T2においては、アクティビティまたは乗算値は、矢印A23で示した値だけ増加する。矢印A23で示した増加分は、正の所定閾値より大きい(ステップS3、S4においてYES)。第1シーンチェンジが発生していると判断される(ステップS8、ステップS12においてYES、ステップS14において「第1」)。
時刻T2から時刻T3までにおいては、アクティビティまたは乗算値は、線分A3で示した値をとる。目標符号量は、時刻T2において、線分A3で示した値に従ってあらかじめ設定された線分B4で示した値に対して、矢印B23で示した補正符号量分の減少補正を強制的に実行された値に設定されている(ステップS15)。目標符号量は、時間TB3の経過前において、曲線B3で示したように、線分B4で示した値に徐々に増加するように設定されている(ステップS16)。目標符号量は、時間TB3の経過後において、線分B4で示した値に設定されている。
出力符号量は、時刻T2において、線分B4で示した値に従って線分C4で示した値をとるのではなく、線分C4で示した値に対して矢印C23で示した値を加算された値をとる。出力符号量は、時間TC3の経過前において、曲線C3で示したように、線分C4で示した値に徐々に減少する。出力符号量は、時間TC3の経過後において、線分C4で示した値をとる。
アクティビティまたは乗算値が、矢印A23で示した値だけ増加したにもかかわらず、出力符号量は、線分C4で示した値からの増加量を、高々矢印C23で示した値に留めている。すなわち、トランスコーダ1は、動画像が平坦な画像から精細な画像に変化したことを検出したときに、出力符号量の増加を抑制しながら、シーンチェンジ時の画質劣化を抑制できている。
時刻T3においては、アクティビティまたは乗算値は、矢印A34で示した値だけ減少する。矢印A34で示した減少分は、正の所定閾値以下である(ステップS3、S4、S5、S6においてNO)。シーンチェンジが発生していないと判断される(ステップS7、ステップS12においてNO)。
時刻T3から時刻T4までにおいては、アクティビティまたは乗算値は、線分A4で示した値をとる。目標符号量は、線分A4で示した値に従ってあらかじめ設定された線分B5で示した値に、そのまま設定されている(ステップS13)。出力符号量は、線分B5で示した値に従って、線分C5で示した値をとる。
時刻T4においては、アクティビティまたは乗算値は、矢印A45で示した値だけ減少する。矢印A45で示した減少分は、正の所定閾値より大きい(ステップS3、S4においてNO、ステップS5、S6においてYES)。第2シーンチェンジが発生していると判断される(ステップS9、ステップS12においてYES、ステップS14において「第2」)。
時刻T4からにおいては、アクティビティまたは乗算値は、線分A5で示した値をとる。目標符号量は、時刻T4において、線分A5で示した値に従ってあらかじめ設定された線分B7で示した値に対して、矢印B67で示した補正符号量分の増加補正を強制的に実行された値に設定されている(ステップS17)。目標符号量は、時間TB6の経過前において、曲線B6で示したように、線分B7で示した値に徐々に減少するように設定されている(ステップS18)。目標符号量は、時間TB6の経過後において、線分B7で示した値に設定されている。
出力符号量は、時刻T4において、線分B7で示した値に従って線分C7で示した値をとるのではなく、線分C7で示した値に対して矢印C67で示した値を減算された値をとる。出力符号量は、時間TC6の経過前において、曲線C6で示したように、線分C7で示した値に徐々に増加する。出力符号量は、時間TC6の経過後において、線分C7で示した値をとる。
アクティビティまたは乗算値が、矢印A45で示した値だけ減少したにもかかわらず、出力符号量は、線分C7で示した値からの減少量を、高々矢印C67で示した値に留めている。すなわち、トランスコーダ1は、動画像が精細な画像から平坦な画像に変化したことを検出したときに、出力符号量の減少を抑制しながら、シーンチェンジ時の画質劣化を抑制できている。
{トランスコーダによる処理の流れの第2具体例}
図5は、トランスコーダ1による処理の流れの第2具体例を示すタイムチャートである。図5(a)は、アクティビティまたは乗算値の時間変化を示すタイムチャートである。図5(b)は、目標符号量の時間変化を示すタイムチャートである。図5(c)は、出力符号量の時間変化を示すタイムチャートである。図5を上下方向に貫通する4本の破線は、左側から右側までの順序で、時刻T1、T2、T3、T4を示す。
アクティビティまたは乗算値は、時々刻々と変化する。しかし、図5においては、説明を簡単にするため、アクティビティまたは乗算値は、時刻T1、T2、T3、T4においてのみ、値を変化させることとする。
第2具体例においては、ステップS13、S15、S17におけるあらかじめ設定された目標符号量は、GOP単位などの所定単位に含まれる入力画像の精細さに依存せず、全ストリームに含まれる入力画像の平均的な精細さに基づいて、全ストリームについて設定された、補正されていない目標符号量である。
時刻T1までにおいては、アクティビティまたは乗算値は、線分A1で示した値をとる。目標符号量は、線分D1で示した全ストリームについて設定された値をとる。出力符号量は、線分D1で示した値に従って、線分E1で示した値をとる。
時刻T1においては、図4(a)と同様に、シーンチェンジが発生していないと判断される(ステップS7、ステップS12においてNO)。
時刻T1から時刻T2までにおいては、アクティビティまたは乗算値は、線分A2で示した値をとる。目標符号量は、線分D1で示した全ストリームについて設定された値をとり続ける(ステップS13)。出力符号量は、線分D1で示した値に従って、線分E1で示した値をとり続ける。
時刻T2においては、図4(a)と同様に、第1シーンチェンジが発生していると判断される(ステップS8、ステップS12においてYES、ステップS14において「第1」)。
時刻T2から時刻T3までにおいては、アクティビティまたは乗算値は、線分A3で示した値をとる。目標符号量は、時刻T2において、線分D3で示した全ストリームについて設定された値に対して、矢印D12で示した補正符号量分の減少補正を強制的に実行された値をとる(ステップS15)。目標符号量は、時間TD2の経過前において、曲線D2で示したように、線分D3で示した値に徐々に増加する(ステップS16)。目標符号量は、時間TD2の経過後において、線分D3で示した値をとる。
出力符号量は、時刻T2において、線分D3で示した値に従って線分E3で示した値をとるのではなく、線分E3で示した値に対して矢印E12で示した値を加算された値をとる。出力符号量は、時間TE2の経過前において、曲線E2で示したように、線分E3で示した値に徐々に減少する。出力符号量は、時間TE2の経過後において、線分E3で示した値をとる。
アクティビティまたは乗算値が、矢印A23で示した値だけ増加したにもかかわらず、出力符号量は、線分E3で示した値からの増加量を、高々矢印E12で示した値に留めている。すなわち、トランスコーダ1は、動画像が平坦な画像から精細な画像に変化したことを検出したときに、出力符号量の増加を抑制しながら、シーンチェンジ時の画質劣化を抑制できている。
時刻T3においては、図4(a)と同様に、シーンチェンジが発生していないと判断される(ステップS7、ステップS12においてNO)。
時刻T3から時刻T4までにおいては、アクティビティまたは乗算値は、線分A4で示した値をとる。目標符号量は、線分D3で示した全ストリームについて設定された値をとり続ける(ステップS13)。出力符号量は、線分D3で示した値に従って、線分E3で示した値をとり続ける。
時刻T4においては、図4(a)と同様に、第2シーンチェンジが発生していると判断される(ステップS9、ステップS12においてYES、ステップS14において「第2」)。
時刻T4からにおいては、アクティビティまたは乗算値は、線分A5で示した値をとる。目標符号量は、時刻T4において、線分D5で示した全ストリームについて設定された値に対して、矢印D34で示した補正符号量分の増加補正を強制的に実行された値をとる(ステップS17)。目標符号量は、時間TD4の経過前において、曲線D4で示したように、線分D5で示した値に徐々に減少する(ステップS18)。目標符号量は、時間TD4の経過後において、線分D5で示した値をとる。
出力符号量は、時刻T4において、線分D5で示した値に従って線分E5で示した値をとるのではなく、線分E5で示した値に対して矢印E34で示した値を減算された値をとる。出力符号量は、時間TE4の経過前において、曲線E4で示したように、線分E5で示した値に徐々に増加する。出力符号量は、時間TE4の経過後において、線分E5で示した値をとる。
アクティビティまたは乗算値が、矢印A45で示した値だけ減少したにもかかわらず、出力符号量は、線分E5で示した値からの減少量を、高々矢印E34で示した値に留めている。すなわち、トランスコーダ1は、動画像が精細な画像から平坦な画像に変化したことを検出したときに、出力符号量の減少を抑制しながら、シーンチェンジ時の画質劣化を抑制できている。
{先行入力画像および後続入力画像の選択方法}
動画像は、GOP(Group of Pictures)から構成される。GOPは、Iピクチャ、Pピクチャ、Bピクチャから構成される。Iピクチャ、Pピクチャ、Bピクチャにおける量子化ステップ平均値は、通常はこの順序で大きくなる。Iピクチャ、Pピクチャ、Bピクチャにおける符号量割り振りは、通常はこの順序で小さくなる。
シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと正確に比較できることが望ましい。そのため、シーンチェンジ検出部124は、先行入力画像および後続入力画像として、同種類のピクチャを選択する。すなわち、シーンチェンジ検出部124は、先行入力画像としてIピクチャ、Pピクチャ、Bピクチャを選択するときには、それぞれ、後続入力画像としてIピクチャ、Pピクチャ、Bピクチャを選択する。
図6は、シーンチェンジ検出において利用されるピクチャを示す図である。ピクチャP1からピクチャP15までは、動画像を構成するピクチャの一部である。ピクチャP4からピクチャP12までは、GOP単位を構成するピクチャである。左側のピクチャが先行するピクチャであり、右側のピクチャが後続するピクチャである。
シーンチェンジ検出部124が、先行入力画像および後続入力画像として、Iピクチャのみを選択して、Pピクチャ、Bピクチャを選択しないと仮定する。シーンチェンジ検出部124は、ピクチャP4およびピクチャP13の間にシーンチェンジが発生しているかどうかを判断する。しかし、シーンチェンジ検出部124は、真のシーンチェンジがピクチャP4およびピクチャP13の間に発生しているときには、シーンチェンジを遅れて検出することになる。
シーンチェンジ検出部124が、先行入力画像および後続入力画像として、Iピクチャ、Pピクチャのみを選択して、Bピクチャを選択しないと仮定する。シーンチェンジ検出部124は、ピクチャP7およびピクチャP10の間にシーンチェンジが発生しているかどうかを判断する。しかし、シーンチェンジ検出部124は、真のシーンチェンジがピクチャP7およびピクチャP10の間に発生しているときには、シーンチェンジを若干遅れて検出することになる。
そこで、シーンチェンジ検出部124は、先行入力画像としてIピクチャ、Pピクチャ、Bピクチャを選択するときには、それぞれ、後続入力画像としてIピクチャ、Pピクチャ、Bピクチャを選択する。シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと正確に比較できて、シーンチェンジをリアルタイムに検出できる。
ステップS3、S5におけるアクティビティの減算値の所定閾値、および、ステップS4、S6における乗算値の減算値の所定閾値は、Iピクチャ、Pピクチャ、Bピクチャのそれぞれについて、異なる値であっても同一の値であってもよい。前者の場合には、シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと正確に比較できる。後者の場合には、シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと容易に比較できる。
ステップS3、S5において比較されるピクチャは、Iピクチャ、Pピクチャ、Bピクチャのうち、同種類のピクチャから選択されても異種類のピクチャから選択されてもよい。前者の場合には、シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと正確に比較できる。後者の場合には、シーンチェンジ検出部124は、後続入力画像の精細さを先行入力画像の精細さと容易に比較できる。
{シーンチェンジ検出後のシーンチェンジ検出再開方法}
シーンチェンジ検出部124は、シーンチェンジ検出の直後に、シーンチェンジ検出の再開をすると仮定する。シーンチェンジ検出部124は、図7(a)、図7(c)、図7(e)に示すように、シーンチェンジを誤って検出する可能性が高くなる。
そこで、シーンチェンジ検出部124は、シーンチェンジ検出の直後に、シーンチェンジ検出の再開をしない。シーンチェンジ検出部124は、図7(b)、図7(d)、図7(f)に示すように、シーンチェンジを誤って検出する可能性が低くなる。
図7(a)、図7(b)は、シーンチェンジ検出部124が後続入力画像としてIピクチャP4を選択したときにシーンチェンジを検出した場合に、シーンチェンジ検出後のシーンチェンジ検出再開方法を示す図である。IピクチャP4は、砂地で示されている。
図7(a)において、シーンチェンジ検出部124は、後続入力画像として、IピクチャP4から1ピクチャ分後続のBピクチャP5を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP5から直近のBピクチャP3を選択する。
BピクチャP5は、IピクチャP4およびPピクチャP7を参照する予測画像である。BピクチャP3は、PピクチャP1およびIピクチャP4を参照する予測画像である。ここで、BピクチャP3が参照するPピクチャP1は、シーンチェンジ前の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを検出したばかりであるが、シーンチェンジを誤って検出する可能性が高くなる。
図7(b)において、シーンチェンジ検出部124は、後続入力画像として、IピクチャP4から5ピクチャ分後続のBピクチャP9を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP9から直近のBピクチャP8を選択する。
BピクチャP9は、PピクチャP7およびPピクチャP10を参照する予測画像である。BピクチャP8は、PピクチャP7およびPピクチャP10を参照する予測画像である。ここで、BピクチャP8およびBピクチャP9が参照するPピクチャP7は、シーンチェンジ後の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを誤って検出する可能性が低くなる。そして、シーンチェンジ検出部124は、図7(b)に示した状態から、シーンチェンジ検出を再開すればよい。
図7(c)、図7(d)は、シーンチェンジ検出部124が後続入力画像としてBピクチャP5を選択したときにシーンチェンジを検出した場合に、シーンチェンジ検出後のシーンチェンジ検出再開方法を示す図である。BピクチャP5は、砂地で示されている。
図7(c)において、シーンチェンジ検出部124は、後続入力画像として、BピクチャP5から1ピクチャ分後続のBピクチャP6を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP6から直近のBピクチャP5を選択する。
BピクチャP6は、IピクチャP4およびPピクチャP7を参照する予測画像である。BピクチャP5は、IピクチャP4およびPピクチャP7を参照する予測画像である。ここで、BピクチャP5およびBピクチャP6が参照するIピクチャP4は、シーンチェンジ前の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを検出したばかりであるが、シーンチェンジを誤って検出する可能性が高くなる。
図7(d)において、シーンチェンジ検出部124は、後続入力画像として、BピクチャP5から4ピクチャ分後続のBピクチャP9を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP9から直近のBピクチャP8を選択する。
BピクチャP9は、PピクチャP7およびPピクチャP10を参照する予測画像である。BピクチャP8は、PピクチャP7およびPピクチャP10を参照する予測画像である。ここで、BピクチャP8およびBピクチャP9が参照するPピクチャP7は、シーンチェンジ後の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを誤って検出する可能性が低くなる。そして、シーンチェンジ検出部124は、図7(d)に示した状態から、シーンチェンジ検出を再開すればよい。
図7(e)、図7(f)は、シーンチェンジ検出部124が後続入力画像としてPピクチャP7を選択したときにシーンチェンジを検出した場合に、シーンチェンジ検出後のシーンチェンジ検出再開方法を示す図である。PピクチャP7は、砂地で示されている。
図7(e)において、シーンチェンジ検出部124は、後続入力画像として、PピクチャP7から1ピクチャ分後続のBピクチャP8を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP8から直近のBピクチャP6を選択する。
BピクチャP8は、PピクチャP7およびPピクチャP10を参照する予測画像である。BピクチャP6は、IピクチャP4およびPピクチャP7を参照する予測画像である。ここで、BピクチャP6が参照するIピクチャP4は、シーンチェンジ前の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを検出したばかりであるが、シーンチェンジを誤って検出する可能性が高くなる。
図7(f)において、シーンチェンジ検出部124は、後続入力画像として、PピクチャP7から5ピクチャ分後続のBピクチャP12を選択する。シーンチェンジ検出部124は、先行入力画像として、BピクチャP12から直近のBピクチャP11を選択する。
BピクチャP12は、PピクチャP10およびIピクチャP13を参照する予測画像である。BピクチャP11は、PピクチャP10およびIピクチャP13を参照する予測画像である。ここで、BピクチャP11およびBピクチャP12が参照するPピクチャP10は、シーンチェンジ後の入力画像である。そのため、シーンチェンジ検出部124は、シーンチェンジを誤って検出する可能性が低くなる。そして、シーンチェンジ検出部124は、図7(f)に示した状態から、シーンチェンジ検出を再開すればよい。
図7の実施例において、シーンチェンジ検出が再開されるGOPは、シーンチェンジが検出されたGOPと同一のGOPである。他の実施例において、シーンチェンジ検出が再開されるGOPは、シーンチェンジが検出されたGOPの直後のGOPであってもよい。予測誤差が時間軸方向に広範囲に影響しないように、動画像は複数のGOPから構成されることを考慮すれば、シーンチェンジ検出部124は、シーンチェンジを誤って検出する可能性がより低くなることが分かる。
トランスコーダの構成要素を示すブロック図である。 シーンチェンジを検出する処理の流れを示すフローチャートである。 目標符号量を設定する処理の流れを示すフローチャートである。 トランスコーダによる処理の流れを示すタイムチャートである。 トランスコーダによる処理の流れを示すタイムチャートである。 シーンチェンジ検出において利用されるピクチャを示す図である。 シーンチェンジ検出再開において利用されるピクチャを示す図である。
符号の説明
1 トランスコーダ
11 デコーダ
12 エンコーダ
111 復号画像生成部
112 量子化ステップ平均値検出部
113 入力画像符号量検出部
114 アクティビティ検出部
121 周波数変換部
122 量子化部
123 符号化部
124 シーンチェンジ検出部
125 目標符号量設定部
126 量子化ステップ値設定部

Claims (13)

  1. 入力画像を復号画像に復号化して、前記復号画像を出力画像に符号化するトランスコーダであって、
    前記入力画像の特性量を検出する特性量検出部と、
    先行入力画像の特性量と後続入力画像の特性量の差分幅が所定特性量差分幅より大きいときに、前記先行入力画像と前記後続入力画像の間にシーンチェンジが発生したと判断するシーンチェンジ検出部と、
    前記入力画像の特性量に基づいて、前記出力画像の目標符号量を設定する目標符号量設定部と、
    前記シーンチェンジが発生したときに、前記先行入力画像に対応する先行出力画像の出力符号量から前記後続入力画像に対応する後続出力画像の出力符号量までの変動幅が抑制されるように、前記先行出力画像の目標符号量と前記後続出力画像の目標符号量の差分幅を小さくする補正符号量を設定し、前記後続出力画像の目標符号量を、設定した補正符号量を用いて補正する目標符号量補正部と、
    を備えることを特徴とするトランスコーダ。
  2. 入力画像を復号画像に復号化して、前記復号画像を出力画像に符号化するトランスコーダであって、
    前記入力画像の特性量を検出する特性量検出部と、
    先行入力画像の特性量と後続入力画像の特性量の特性量差分幅が所定特性量差分幅よりも大きいときに、前記先行入力画像と前記後続入力画像の間にシーンチェンジが発生したと判断するシーンチェンジ検出部と、
    前記シーンチェンジが発生したときに、前記特性量差分幅に基づいて前記シーンチェンジの種別を決定するシーンチェンジ種別決定部と、
    前記入力画像の特性量に基づいて、前記出力画像の目標符号量を設定する目標符号量設定部と、
    前記シーンチェンジが発生したときに、前記先行入力画像に対応する先行出力画像の出力符号量から前記後続入力画像に対応する後続出力画像の出力符号量までの変動幅が抑制されるように、前記目標符号量を増加させる補正符号量及び前記目標符号量を減少させる補正符号量のいずれかを前記シーンチェンジの種別に基づいて設定し、前記後続出力画像の目標符号量を、設定した補正符号量を用いて補正する目標符号量補正部と、
    を備えることを特徴とするトランスコーダ。
  3. 請求項1または請求項2に記載のトランスコーダにおいて、
    前記目標符号量補正部は、
    前記出力画像の目標符号量の補正が開始されてから時間が経過するにつれて、前記補正符号量の絶対値を減少させ、補正が開始されてから第1所定期間が経過したときに前記出力画像の目標符号量の補正を終了する目標符号量補正終了部、
    を含むことを特徴とするトランスコーダ。
  4. 請求項1ないし請求項3のいずれかに記載のトランスコーダにおいて、
    前記出力画像の目標符号量は、
    前記入力画像の所定単位における特性量に基づいて設定される第1目標符号量、
    を含むことを特徴とするトランスコーダ。
  5. 請求項1ないし請求項3のいずれかに記載のトランスコーダにおいて、
    前記出力画像の目標符号量は、
    前記入力画像の全体における平均的な特性量に基づいて設定される第2目標符号量、
    を含むことを特徴とするトランスコーダ。
  6. 請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、
    前記補正符号量は、
    前記先行入力画像の特性量と前記後続入力画像の特性量の差分幅に基づいて設定される符号量、
    を含むことを特徴とするトランスコーダ。
  7. 請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、
    前記特性量は、
    前記入力画像の各隣接画素間における画素値の差分絶対値を、前記入力画像の全隣接画素間について加算した値に対して、前記入力画像の全ブロック数により除算した値、
    を含むことを特徴とするトランスコーダ。
  8. 請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、
    前記特性量は、
    前記入力画像の各ブロックにおける量子化ステップ値を、前記入力画像の全ブロックについて平均した値に対して、前記入力画像の符号量を乗算した値、
    を含むことを特徴とするトランスコーダ。
  9. 請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、
    前記特性量は、
    前記入力画像の各ブロックにおける動きベクトルの符号量を、前記入力画像の全ブロックについて加算した値に対して、前記入力画像の全ブロック数により除算した値、
    を含むことを特徴とするトランスコーダ。
  10. 請求項1ないし請求項のいずれかに記載のトランスコーダにおいて、
    前記特性量は、
    前記入力画像の各ブロックにおける動きベクトルの長さを、前記入力画像の全ブロックについて加算した値に対して、前記入力画像の全ブロック数により除算した値、
    を含むことを特徴とするトランスコーダ。
  11. 請求項1ないし請求項10のいずれかに記載のトランスコーダにおいて、
    前記後続入力画像は、
    参照画像と順方向予測画像と双方向予測画像のうち1種類の画像、
    を含み、
    前記先行入力画像は、
    参照画像と順方向予測画像と双方向予測画像のうち前記1種類の画像であって、前記後続入力画像の直近の画像、
    を含むことを特徴とするトランスコーダ。
  12. 請求項11に記載のトランスコーダにおいて、
    前記特性量は、
    参照画像と順方向予測画像と双方向予測画像の各々について検出される個別特性量、
    を含み、
    前記所定特性量差分幅は、
    参照画像と順方向予測画像と双方向予測画像の各々について設定される個別差分幅、
    を含むことを特徴とするトランスコーダ。
  13. 請求項1ないし請求項12のいずれかに記載のトランスコーダにおいて、
    前記シーンチェンジ検出部は、
    前記シーンチェンジが発生したと判断したときから第2所定期間後に、シーンチェンジ検出を再開するシーンチェンジ検出再開部、
    を含み、
    前記第2所定期間は、
    前記先行入力画像が参照する参照画像が、前記シーンチェンジが発生したシーンチェンジ発生画像より、時間軸方向に後に配置されるようになるまでの期間、
    を含むことを特徴とするトランスコーダ。
JP2008075050A 2008-03-24 2008-03-24 トランスコーダ Expired - Fee Related JP5039976B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008075050A JP5039976B2 (ja) 2008-03-24 2008-03-24 トランスコーダ
US12/400,132 US20090237569A1 (en) 2008-03-24 2009-03-09 Transcoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008075050A JP5039976B2 (ja) 2008-03-24 2008-03-24 トランスコーダ

Publications (2)

Publication Number Publication Date
JP2009232148A JP2009232148A (ja) 2009-10-08
JP5039976B2 true JP5039976B2 (ja) 2012-10-03

Family

ID=41088503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008075050A Expired - Fee Related JP5039976B2 (ja) 2008-03-24 2008-03-24 トランスコーダ

Country Status (2)

Country Link
US (1) US20090237569A1 (ja)
JP (1) JP5039976B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6062356B2 (ja) 2011-02-28 2017-01-18 株式会社メガチップス 画像符号化装置
US9071842B2 (en) * 2012-04-19 2015-06-30 Vixs Systems Inc. Detection of video feature based on variance metric
US9930346B2 (en) * 2014-04-15 2018-03-27 Qualcomm Incorporated System and method for flatness detection for display stream compression (DSC)
JP6579007B2 (ja) * 2016-03-18 2019-09-25 船井電機株式会社 制御装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69222332T2 (de) * 1991-02-21 1998-01-29 Nec Corp Kodierungsgerät zur Kompression von bewegten Bilddaten
JPH09331531A (ja) * 1996-06-13 1997-12-22 Matsushita Electric Ind Co Ltd 画像符号化装置
JPH1023421A (ja) * 1996-07-09 1998-01-23 Toshiba Corp 動画像処理方法
JP3738939B2 (ja) * 1998-03-05 2006-01-25 Kddi株式会社 動画像のカット点検出装置
US6226328B1 (en) * 1998-05-01 2001-05-01 Boom Corporation Transcoding apparatus for digital video networking
JP2000358247A (ja) * 1999-01-19 2000-12-26 Matsushita Electric Ind Co Ltd レート制御装置、レート制御方法及び符号化装置
US6567554B1 (en) * 1999-03-12 2003-05-20 Victor Company Of Japan, Limited Data coding method and apparatus therefor
US6590936B1 (en) * 1999-04-13 2003-07-08 Matsushita Electric Industrial Co., Ltd. Coded data transform method, transcoding method, transcoding system, and data storage media
JP2000308047A (ja) * 1999-04-19 2000-11-02 Matsushita Electric Ind Co Ltd 画像符号化方法、画像符号化装置、及びデータ記憶媒体
JP2000350211A (ja) * 1999-06-07 2000-12-15 Toshiba Corp 動画像符号化方法及び動画像符号化装置
JP2001204018A (ja) * 2000-01-18 2001-07-27 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置及び符号化方法
JP3812267B2 (ja) * 2000-02-21 2006-08-23 日本ビクター株式会社 動画像符号化装置及びその方法
JP3960451B2 (ja) * 2000-03-06 2007-08-15 Kddi株式会社 シーン特性検出型動画像符号化装置
US6834080B1 (en) * 2000-09-05 2004-12-21 Kabushiki Kaisha Toshiba Video encoding method and video encoding apparatus
JP2002152759A (ja) * 2000-11-10 2002-05-24 Sony Corp 画像情報変換装置および画像情報変換方法
JP2002209215A (ja) * 2001-01-09 2002-07-26 Sony Corp 符号量制御装置及び方法、並びに画像情報変換装置及び方法
JP2002232893A (ja) * 2001-02-05 2002-08-16 Matsushita Electric Ind Co Ltd 画像符号化装置
US7751474B2 (en) * 2003-06-30 2010-07-06 Mitsubishi Denki Kabushiki Kaisha Image encoding device and image encoding method
JP4366571B2 (ja) * 2003-09-18 2009-11-18 日本電気株式会社 動画像符号化装置及び方法
JP2005167962A (ja) * 2003-11-11 2005-06-23 Secom Co Ltd 符号化信号分離装置、符号化信号合成装置および符号化信号分離合成システム
JP2005303576A (ja) * 2004-04-09 2005-10-27 Sony Corp 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ
JP3846488B2 (ja) * 2004-05-10 2006-11-15 セイコーエプソン株式会社 画像データ圧縮装置、エンコーダ、電子機器及び画像データ圧縮方法
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
US8634458B2 (en) * 2005-02-23 2014-01-21 Canon Kabushiki Kaisha Image processing apparatus
JP4485996B2 (ja) * 2005-06-13 2010-06-23 株式会社日立製作所 画像符号化装置及び画像符号化プログラム
JP4606278B2 (ja) * 2005-09-07 2011-01-05 日本電信電話株式会社 映像構造化方法及び装置及びプログラム
JP2008042660A (ja) * 2006-08-08 2008-02-21 Victor Co Of Japan Ltd 映像信号再符号化装置及び映像信号再符号化方法

Also Published As

Publication number Publication date
US20090237569A1 (en) 2009-09-24
JP2009232148A (ja) 2009-10-08

Similar Documents

Publication Publication Date Title
JP4529919B2 (ja) 適応量子化装置及び適応量子化プログラム
US8401311B2 (en) Image processing device, method, and program
JP5133290B2 (ja) 動画像符号化装置および復号装置
JP5039976B2 (ja) トランスコーダ
US6748114B1 (en) Moving picture encoding method and moving picture encoding apparatus
JP5076083B2 (ja) トランスコーダ
JP4790669B2 (ja) トランスコーダ
KR101167645B1 (ko) 장면 전환 검출 방법 및 장치
JPWO2010050089A1 (ja) 動画像圧縮符号化における符号化処理方法及び符号化処理装置
KR20100029148A (ko) 화상 신호 처리 장치
WO2011114654A1 (ja) 画像符号化装置及びカメラシステム
US8615040B2 (en) Transcoder for converting a first stream into a second stream using an area specification and a relation determining function
JP5256803B2 (ja) トランスコーダ
EP2571267B1 (en) Code amount control method and apparatus
JP2008252562A (ja) 動画像符号化制御方法および動画像符号化装置
JP2004274628A (ja) 動き検出装置、動き検出方法及びプログラム
EP1734770A1 (en) Image signal processing apparatus and method, recording medium, program and video camera
JP2009206543A (ja) トランスコーダ
JP5050158B2 (ja) トランスコーダ
JP5435452B2 (ja) 画像処理装置および画像変換装置
WO2008079330A1 (en) Video compression with complexity throttling
JP4585981B2 (ja) 画像符号化方法及び画像符号化装置
JP5076085B2 (ja) トランスコーダ
JP2007074634A (ja) 動画像圧縮装置
JP2006129375A (ja) 動画データ生成装置及び動画データ生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120614

R150 Certificate of patent or registration of utility model

Ref document number: 5039976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees