JP2005234122A - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP2005234122A
JP2005234122A JP2004041776A JP2004041776A JP2005234122A JP 2005234122 A JP2005234122 A JP 2005234122A JP 2004041776 A JP2004041776 A JP 2004041776A JP 2004041776 A JP2004041776 A JP 2004041776A JP 2005234122 A JP2005234122 A JP 2005234122A
Authority
JP
Japan
Prior art keywords
frame
audio
stream
audio stream
illegal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004041776A
Other languages
English (en)
Inventor
Hiroshi Segawa
浩 瀬川
Yoshinori Matsuura
慶典 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Technology Corp
Original Assignee
Renesas Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Technology Corp filed Critical Renesas Technology Corp
Priority to JP2004041776A priority Critical patent/JP2005234122A/ja
Publication of JP2005234122A publication Critical patent/JP2005234122A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

【課題】 再生不能な不正フレームが含まれたオーディオストリームを正常に再生することが可能な画像符号化装置を提供する。
【解決手段】 不正フレームが含まれていないときには、不正検出回路10によってマルチプレクサ11はオーディオストリーム側に入力を切り換え、外部から入力されるオーディオストリームをシステム多重化装置8に出力する。不正フレームが含まれるときは、不正フレームが外部から送られる間、不正検出回路10によってマルチプレクサ11はオーディオ圧縮装置9側に入力を切り換え、マルチプレクサ12は無音のオーディオ信号側に入力を切り換える。オーディオ圧縮装置9は、無音のオーディオ信号を圧縮して無音フレームを出力し、不正フレームが無音フレームに変換されたオーディオストリームがシステム多重化装置8に出力される。
【選択図】 図5

Description

本発明は画像符号化装置に関するものであり、特に再生不能なフレームが含まれるオーディオストリームが入力された場合に正常に再生されるよう変換処理を行なう画像符号化装置に関するものである。
近年、デジタルAV機器に多く用いられる画像符号化装置として、国際標準画像圧縮規格であるMPEG(Moving Picture Experts Group)2に準拠した画像符号化装置がある。
MPEG2規格に準じた画像符号化処理は、ビデオ圧縮処理と、オーディオ圧縮処理と、システム多重化処理の3つの階層(レイヤ)から構成される。画像符号化装置とは、ビデオ圧縮装置、オーディオ圧縮薮置、システム多重化装置から構成される装置の総称である。
図16は、画像符号化装置の構成の一例を示すブロック図である。図16を参照して、画像符号化装置101は、デジタル化されたビデオ信号を圧縮してビデオストリームを出力するビデオ圧縮装置102と、デジタル化されたオーディオ信号を圧縮してオーディオストリームを出力するオーディオ圧縮装置103と、ビデオストリームとオーディオストリームとを多重化して多重化ストリームを出力するシステム多重化装置104とを備える。
MPEG2規格では、MPEG2規格で定めた以外のオーディオ圧縮の方式も許容される。よって、MPEG2規格に対応したデジタルAV機器の多くは、MPEG2規格の方式を採用せず、MPEG1(layer2)やDOLBY AC−3(R)(以後、AC−3と称する)やリニアPCM(以後、LPCMと称する)といった方式を採用している。
画像符号化処理は、信号圧縮やシステム多重化に膨大な処理能力を費やす。よって、画像符号化処理装置の有する機能は予め制限される場合が多い。特に、オーディオ圧縮処理について、多くの画像符号化装置は、通常の再生で必要な2チャネル分のオーディオデータの圧縮のみ対応し、拡張的な機能である多チャネルのオーディオデータの圧縮処理は対応していない。
ただし、画像符号化装置の利用形態が将来的に拡張されることが予想される。よって、画像符号化装置は、圧縮された多チャネルのオーディオデータも出力できなくてはならない。このような要請への対応のため、画像符号化装置は外部装置から受けた多チャネルのオーディオストリームを、そのまま出力する。
図17は、機能を拡張した画像符号化装置の構成の一例を示すブロック図である。図17を参照して、画像符号化装置101は、ビデオ圧縮装置102と、オーディオ圧縮装置103と、システム多重化装置104と、外部からオーディオ入力モード信号を受けて、オーディオ圧縮装置103から受けたオーディオストリームを出力するか、外部から受けたオーディオストリームをそのまま出力するかを選択するマルチプレクサ107とを備える。
ビデオストリームとオーディオストリームとを多重化して多重化ストリームを出力する装置の例として、特開平11−112944号公報(特許文献1)では受信データを複数のデータに分離して他のデータと結合する際に、分離されたそれぞれのデータの処理単位が異なることによって生じるギャップを補完してデータの連続性を確保することが可能な情報処理装置が開示される。
特開平11−112944号公報
衛星放送受信機のセットトップボックスは、電波として受信した多重化ストリームを分離してオーディオストリームを取り出し、伸張処理によってオーディオ信号に復号する機能を備えている。
ただし、セットトップボックスで伸張処理が可能なオーディオ圧縮方式は限定される場合がある。たとえば、セットトップボックスで伸張処理未対応な多チャネルのストリームが入力されると、オーディオストリームは外部端子からそのまま出力される。
従来の画像符号化装置は、特定の外部オーディオ圧縮装置と接続されていたので、入力されるオーディオストリームの圧縮方式や設定モードはあらかじめ決定されていた。よって、従来の画像符号化装置は定められた圧縮方式や設定モードに従って、オーディオストリームにシステム多重化処理を行なっていた。
しかし、従来の画像符号化装置にセットトップボックスを接続した場合には、以下に示すような課題がある。
まず、画像符号化装置には想定外の種別のオーディオストリームが画像符号化装置に入力されたときの対応がなされていないという課題がある。セットトップボックスからはAC−3、LPCM、MPEG、DTS(Digital Theater System) (R)といった種別のオーディオストリームが入力される。また、同一のオーディオストリームの種別であってもビットレートやチャネルといったモードが異なる場合がある。
次に、セットトップボックスから受けるオーディオストリームの種別やモードが受信途中で変化することにより、画像符号化装置から出力される多重化ストリームが再生装置において伸張できなくなるという課題がある。オーディオストリームの種別やモードが受信途中で変化する場合とは、たとえば放送受信中に番組を切り換えたような場合である。この場合、特に、記録途中でオーディオストリームの種別やモードが変化することが禁止されるDVDでは記録内容が再生できないという課題が生じる。
さらに、電波障害によって破壊されたデータを含むオーディオストリームが画像符号化装置に入力される場合がある。この場合も、想定外の種別のオーディオストリームが画像符号化装置に入力された場合と同様に、画像符号化装置の対応がなされていないという課題がある。
以後において、このようなオーディオストリームの入力中にストリーム種別やモードが変化して規格違反のフォーマットとなる多重化ストリームが生成される場合、または電波障害等で破壊されたデータを含むオーディオストリームが入力された場合を不正ストリームが入力された場合と定義する。
従来の画像符号化装置は、入力されたストリームが不正ストリームであるときの処理は考慮されていない。よって特許文献1には、このような不正ストリームが入力されたときの処理は開示されていない。
本発明は上記の問題点を解決するためになされたものであって、その目的は、オーディオストリームを外部から入力することができるような画像符号化装置において、上記のような不正ストリームが入力された場合においても正常な多重化ストリームあるいは再生動作上問題ない多重化ストリームを生成することを可能とすることである。
本発明は要約すれば画像符号化装置であって、ビデオストリーム生成手段と、オーディオストリーム生成手段と、多重化手段とを備える。
ビデオストリーム生成手段は、ビデオ信号が圧縮されたビデオストリームを出力する。
オーディオストリーム生成手段は、受けたオーディオストリームが正常フレームと音声が再生されない不正フレームとを含む不正オーディオストリームであった場合は不正フレームを無音に再生される無音フレームに変換して出力し、オーディオストリームが正常フレームのみを含む正常オーディオストリームであった場合はオーディオストリームをそのまま出力する。
多重化手段は、ビデオストリームとオーディオストリームとを受けて多重化ストリームを生成する。
本発明の画像符号化装置は、不正ストリームが入力された場合においても正常な多重化ストリームあるいは再生動作上問題ない多重化ストリームを生成することができる。
以下において、本発明の実施の形態について図面を参照して詳しく説明する。なお、図中同一符号は同一または相当部分を示す。
[実施の形態1]
図1は、本発明の画像符号化装置の応用例を示すブロック図である。図1を参照して、画像符号化装置1は、セットトップボックス2から送られるビデオ信号と、オーディオ信号かオーディオストリームのいずれかを受けて多重化ストリームを出力する。セットトップボックス2は、アンテナ3によって受信された多重化ストリームを分離する機能と、分離されたストリームを伸長する機能を備える。
セットトップボックス2は、受信した多重化ストリームをビデオストリームとオーディオストリームとに分離する。各々のストリームは、伸長処理が行われてアナログ信号として出力される。出力されたアナログ形式のビデオ信号およびオーディオ信号は、A/D変換器4,5によってデジタル形式の信号に変換される。デジタル信号に変換されたオーディオ信号とビデオ信号は画像符号化装置1に送られる。
セットトップボックス2は、受信した多重化ストリームに対応していない圧縮方式のオーディオストリームが含まれる場合には、オーディオストリームを画像符号化装置1に直接送る。
セットトップボックス2は、さらに、オーディオ信号を出力したかオーディオストリームを出力したかを知らせる入力モード信号を画像符号化装置1に送る。
図2は、本発明の画像符号化装置において生成される多重化ストリームの模式図である。図2を参照して、まず、画像符号化装置1にデジタル形式のオーディオ信号とデジタル形式のビデオ信号が入力される。ビデオ信号とオーディオ信号は、フレームと称される圧縮処理の単位ごとに生成されたデータを複数備える。図2では、ビデオ信号はフレームV1〜V8を含み、オーディオ信号はフレームA1〜A4を含む。
次に、画像符号化装置1は、フレーム単位にビデオ信号を圧縮してビデオストリームを生成する。また、画像符号化装置1は、同様にフレーム単位にオーディオ信号を圧縮してオーディオストリームを生成する。
続いて、ビデオストリームとオーディオストリームとが時分割多重化されて多重化ストリームが生成される。
図3は、本発明の画像符号化装置によるストリーム変換処理を示す模式図である。図3を参照して、オーディオストリームは8個のフレームを含む。図3において、「フレーム変換前」と示されるオーディオストリームA01は、伸張処理後に音声が正しく再生されないフレームB1を含む。セットトップボックス2からこのようなフレームを含むオーディオストリームが入力されると、本発明の画像符号化装置1は、該当のフレームを再生時に無音で再生されるフレームに変換する。
図3において、「フレーム変換後」と示されるオーディオストリームA02は、無音で再生されるフレームC1を含む。フレームC1は、画像符号化装置1によってフレームB1が変換されたフレームである。
なお、説明の便宜のため以後においては、伸張処理後に音声が正しく再生されないフレームは「不正フレーム」と称され、再生時に無音で再生されるフレームは「無音フレーム」と称される。
図4は、MPEG方式のオーディオフレームの構成を示す図である。図4を参照して、オーディオストリームは、複数のAAU(Audio Access Unit、オーディオ復号単位)と称されるフレームから構成される。AAUは、圧縮されたデータをオーディオ信号に復号できる最小の単位のデータである。AAUは、ヘッダと、データのエラーをチェックするCRC(Cyclic Redundancy Check、巡回冗長検査)コードと、オーディオデータと、オーディオ以外の任意のデータが含まれる外部データとから構成される。
CRCコードは、オーディオデータから生成される16ビットのコードである。元のデータが変更されると、生成されるCRCコードは元のCRCコードと異なる。この特徴を利用して予めAAUに含まれるCRCコードと、受信したフレームに含まれるオーディオデータから生成したCRCコードを比較して、フレームが正常かどうかが判断される。
図5は、実施の形態1の画像符号化装置の構成の一例を示すブロック図である。図5を参照して、画像符号化装置1は、デジタル形式のビデオ信号を圧縮してビデオストリームを出力するビデオ圧縮装置6と、オーディオ信号あるいはオーディオストリームのいずれかを受けてオーディオストリームを出力するオーディオストリーム生成部7と、ビデオ圧縮装置6から出力されたビデオストリームと、オーディオストリーム生成部7から出力されたオーディオストリームとを受けて多重化ストリームを出力するシステム多重化装置8とを備える。
オーディオストリーム生成部7は、デジタル形式のオーディオ信号を受けてオーディオ信号を圧縮してオーディオストリームを生成するオーディオ圧縮装置9と、外部からオーディオ入力モード信号を受けてオーディオストリーム入力が指示されると入力されたオーディオストリームを解析し、圧縮方式やフレームに誤りがないかを検出する不正検出回路10と、不正検出回路から送られる選択信号1を受けてオーディオ圧縮装置9が生成したオーディオストリームか、外部から入力されたオーディオストリームかのいずれかを出力するよう選択するマルチプレクサ11を含む。
オーディオストリーム生成部7は、さらに、不正検出回路10から送られる選択信号2を受けて、外部から受けたオーディオ信号か、画像符号化装置1の図示しない内部で生成される無音のオーディオ信号をオーディオ圧縮装置9に送るかを選択するマルチプレクサ12を含む。なお、無音のオーディオ信号は、図中では“0”と示される。
図1の画像符号化装置1のオーディオストリーム変換処理について説明する。不正検出回路10はオーディオストリームを受けて、オーディオストリームに不正フレームが含まれていないかどうかを検知する。不正フレームが含まれていないときには、不正検出回路10によってマルチプレクサ11はオーディオストリーム側に入力を切り換え、外部から入力されるオーディオストリームをシステム多重化装置8に出力する。不正フレームが含まれるときは、不正フレームが外部から送られる間、不正検出回路10によってマルチプレクサ11はオーディオ圧縮装置9側に入力を切り換え、マルチプレクサ12は無音のオーディオ信号側に入力を切り換える。オーディオ圧縮装置9は、無音のオーディオ信号を圧縮して無音フレームを出力し、不正フレームが無音フレームに変換されたオーディオストリームがシステム多重化装置8に出力される。
なお、無音のオーディオ信号とはデジタルの値が「0」の信号である。したがって無音のオーディオ信号は、さまざまな方法によって生成される。たとえば、不正検出回路10から信号出力の指示を受けてLレベルの信号を発生させる、図示されない信号発生回路によって無音のオーディオ信号が生成することが可能である。
また、オーディオ圧縮装置9は不正検出回路10から、ビットレートやチャネルモード等に関する情報を示すモード信号を受けて、モードごとに異なる無音フレームを出力する。不正検出回路10は、図4に示される、入力されるオーディオストリームのヘッダを解析する機能を備える。この機能によって圧縮方式やモード(ビットレートやチャネルモードなど)の変化を検出し、入力されるオーディオストリームが不正か否かを判断する。
図6は、実施の形態1の画像符号化装置の変形例を示すブロック図である。
図6を参照して、画像符号化装置1Aは、ビデオ圧縮装置6と、オーディオストリーム生成部7Aと、システム多重化装置8とを備える。これらの各部の機能は、図5における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Aは、オーディオ圧縮装置9と、不正検出回路10と、マルチプレクサ11とを含む。これらの各部の機能は図5における各部の機能と同様であるので説明は繰り返さない。
なお、マルチプレクサ11は外部からオーディオ入力モード信号を直接受けて、オーディオ圧縮装置9が生成したオーディオストリームか、外部から入力されたオーディオストリームかのいずれかを出力するよう選択する。図6ではオーディオ入力モード信号は選択信号1と表わされる。
オーディオストリーム生成部7Aは、さらに、不正フレームを含むオーディオストリームが入力されると不正フレームを無音フレームに変換して、オーディオストリームを出力するストリーム変換部13を含む。
ストリーム変換部13は、圧縮方式ごとに各々対応する無音フレームを保持するROM14と、不正検出回路10から選択信号2を受けて、入力されるオーディオストリームが正常であれば入力されたオーディオストリームをそのまま出力し、不正フレームが含まれるオーディオストリームが入力されると、ROM14によって不正フレームが無音フレームに変換されたオーディオストリームを出力するよう選択するマルチプレクサ15を含む。
なお、ROM14は、不正検出回路10から圧縮方式に関する情報を示すモード信号を受けて、圧縮方式ごとに異なる無音フレームを出力する。また、ROM14に保持される無音フレームは、予めコンピュータ等で生成されてROM14に書込まれる。
図7は、実施の形態1の画像符号化装置の別の変形例を示すブロック図である。
図7を参照して、画像符号化装置1Bは、ビデオ圧縮装置6と、オーディオストリーム生成部7Bと、システム多重化装置8とを備える。これらの各部の機能は、図5における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Bは、オーディオ圧縮装置9と、不正検出回路10と、マルチプレクサ11とを含む。これらの各部の機能は、図6における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Bは、さらに、不正フレームを含むオーディオストリームが入力されると、不正検出回路10から変更指示を受けて該当のフレームに含まれるCRCコードを書換えるCRCコード変更回路16を含む。
オーディオストリームを再生する伸長装置は、CRCコードエラーのフレームがオーディオストリームに含まれる場合、該当のフレームが無音で出力されるよう処理を行なう。したがってCRCコードが書き換えられたフレームは無音フレームになる。
図6のROM14は不正フレームを無音フレームに変換するため、複数の再生モードにそれぞれ応じた複数の無音フレームを保持するだけの記憶容量を有する必要がある。一方、図7のCRCコード変更回路16は不正フレームに含まれるCRCコードを、たとえば1ビット書き換えることで不正フレームを無音フレームに変換できる。よって、図7のCRCコード変更回路16は、図6のROM14よりも小規模の回路で構成することが可能である。
図8は、実施の形態1の画像符号化装置のさらに別の変形例を示すブロック図である。図8を参照して、画像符号化装置1Cは、ビデオ圧縮装置6と、オーディオストリーム生成部7Cと、システム多重化装置8とを備える。これらの各部の機能は、図5における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Cは、オーディオ圧縮装置9と、不正検出回路10と、マルチプレクサ11とを含む。これらの各部の機能は、図6における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Cは、さらに、不正なフレームを含むオーディオストリームが入力されたときに不正なフレームを無音で再生されるフレームに置き換えるストリーム変換部13を含む。
ストリーム変換部13は、不正フレームを受けてフレームに含まれるデータをダミーデータに変換するダミーデータ生成回路17と、不正検出回路10から選択信号2を受けて、入力されるオーディオストリームが正常であれば入力されたオーディオストリームをそのまま出力し、不正フレームが含まれるオーディオストリームが入力されると、不正フレームがダミーデータ生成回路によって無音フレームに変換されたオーディオストリームを出力するよう選択するマルチプレクサ15を含む。
図8の画像符号化装置1Cのオーディオストリーム変換処理について説明する。不正フレームを含むオーディオストリームが入力されると、ダミーデータ生成回路17は、不正検出回路10から再生モードに関する情報を示すモード信号を受けて、ダミーデータを含むフレームを出力する。ダミーデータは、フレームがCRCコードチェックでエラーとなるように生成される。
ダミーデータ生成回路17から出力されるフレームは、たとえば、不正フレームに含まれるオーディオデータがすべてデジタルの「0」となるダミーデータに変換されたフレームである。また、たとえばダミーデータ生成回路17に予め保持されるヘッダと上述のダミーデータを合わせたフレームが、ダミーデータ生成回路17から出力されるフレームの別の例として考えられる。
図8の画像符号化装置のダミーデータ生成回路17は、図7におけるCRCコード変更回路16と同様に、図6のROM14よりも小規模の回路で構成することが可能であるという利点を有する。
図9は、実施の形態1の画像符号化装置のさらに別の変形例を示すブロック図である。図9を参照して、画像符号化装置1Dは、ビデオ圧縮装置6と、オーディオストリーム生成部7Dと、システム多重化装置8とを備える。これらの各部の機能は、図5における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Dは、オーディオ圧縮装置9と、不正検出回路10と、マルチプレクサ11とを含む。これらの各部の機能は、図6における各部の機能と同様であるので説明は繰り返さない。
オーディオストリーム生成部7Dは、さらに、不正なフレームを含むオーディオストリームが入力されたときに不正なフレームを無音で再生されるフレームに置き換えるストリーム変換部13を含む。
ストリーム変換部13は、オーディオストリームを一旦保持するバッファ21と、不正検出回路10から選択信号3を受けて、入力されるオーディオストリームが正常であれば入力されたオーディオストリームをそのまま出力し、入力されるオーディオストリームに不正フレームが含まれる場合には、フレーム変換処理を行なうようオーディオストリームの出力先を切り換えるセレクタ22と、セレクタ22から受けるオーディオストリームを所定の再生モードのオーディオストリームに変換する音声復号部23と、不正検出回路10から通知信号を受けて音声復号部23で変換されたオーディオストリームの不正フレームを所定の圧縮方式の無音フレームに変換する音声符号部24とを含む。なお、音声復号部23と音声符号部24とは音声修正部を構成する。
ストリーム変換部13は、さらに、マルチプレクサ15を含む。図9におけるマルチプレクサ15の機能は、図6におけるマルチプレクサ15の機能と同様であるので以後の説明は繰り返さない。
図9の画像符号化装置1Dのオーディオストリーム変換処理について説明する。正常なオーディオストリームはバッファ21からセレクタ22に送られ、マルチプレクサ15とマルチプレクサ11とを経由してシステム多重化装置8に出力される。不正フレームを含むオーディオストリームのうち正しいフレームは、音声復号部23で所定の圧縮方式に従い、オーディオ信号に変換されて、音声符号部24に送られる。音声符号部24では不正フレームは無音フレームに変換される。
オーディオストリームに不正フレームが一定数以上連続して含まれる場合には、連続する不正フレームは、ビットレートがより低い圧縮方式の無音フレームに変換される。不正フレームがビットレートのより低い無音フレームに変換されることにより、たとえばDVDなどの記録メディアに多重化ストリームをより長時間記録することができる。
音声符号部24による不正フレームのビットレートの変換例には、たとえばLPCM(ビットレート1536Kbps)方式から、AC−3(ビットレート256Kbps)方式への変換がある。また、音声符号部24では圧縮方式を変えずにビットレートを下げることも行なわれる。再生モードを変えずにビットレートを下げた変換例には、たとえば、AC−3(ビットレート256Kbps)方式からAC−3(ビットレート64Kbps)方式への変換がある。
図10は、図9の画像符号化装置によって処理されるオーディオストリームの模式図である。図10を参照して、「入力ストリーム」と示されるLPCM方式のオーディオストリームA10は、不正フレームB10,B11を含む。不正フレームB10は再生時間が所定の時間未満となるフレームであり、不正フレームB11は再生時間が所定の再生時間以上となるフレームである。
所定の再生時間は、たとえば1GOP(Group of Picture)の再生時間に設定される。GOPとはビデオストリームに含まれるピクチャデータが一定数(たとえば15枚)まとめられた、画像再生の1単位を示す。1GOPの再生時間は約0.5秒である。
図10において、「フレーム変換後ストリーム」と示されるオーディオストリームA11は、不正フレームが音声符号部24によって無音フレームに変換された後のオーディオストリームを示す。不正フレームB10は同一の圧縮方式、すなわちLPCM方式の無音フレームC10に変換される。不正フレームB11は、よりビットレートの低い圧縮方式、たとえば、AC−3方式の無音フレームC11に変換される。
音声再生時における無音状態は情報量を必要としていない。したがってデータを高圧縮することが可能となる。すなわち、オーディオストリームA10と比較するとオーディオストリームA11のデータ長は短くなる。よって、記録メディアにより長時間の多重化ストリームを記録することができる。
図11は、図9の画像符号化装置1Dによるフレーム変換処理を示すフローチャートである。フレーム変換処理は、たとえば、ソフトウェアがコンピュータに実行させることで実現される。
図11を参照して、まず処理が開始されるとステップS1ではオーディオ信号が入力されるかオーディオストリームが入力されるかを示す選択信号1が画像符号化装置1Dに入力される。
続いてステップS2では、マルチプレクサ11によって選択信号1がオーディオ信号の入力を示すかオーディオストリームの入力を示すかが判断される。ステップS2において、選択信号1がオーディオ信号の入力を示す場合はステップS3に進む。
ステップS3では、オーディオ信号の入力を示す選択信号1を受けたマルチプレクサ11が、オーディオ圧縮装置9からオーディオストリームを受けるよう設定される。ステップS3に続いてステップS12では、オーディオ信号がオーディオ圧縮装置9によって圧縮され、オーディオ圧縮装置9からオーディオストリームが出力される。ステップS12においてオーディオ圧縮装置9によるオーディオ信号圧縮処理が行なわれると後述するステップS15に進む。
一方、ステップS2において選択信号1がオーディオストリームの入力を示す場合はステップS4に進む。ステップS4では、オーディオストリームの入力を示す選択信号1を受けたマルチプレクサ11が、ストリーム変換部13から出力されるオーディオストリームを受けるよう設定される。続いてステップS5では、外部から入力されるオーディオストリームが正常であるか、すなわち不正フレームを含まないかどうかが不正検出回路10によって検知される。
ステップS5において、オーディオストリームが正常、すなわち不正フレームを含まないと不正検出回路10によって検知される場合はステップS6に進む。
ステップS6では、セレクタ22は不正検出回路10から選択信号3を受けてバッファ21から受けるオーディオストリームの出力先をマルチプレクサ15に選択する。ステップS6に続いてステップS8では、マルチプレクサ15は選択信号2を受けてセレクタ22からオーディオストリームを受けるよう設定される。
ステップS8に続いてステップS14では、外部から入力されたオーディオストリームがバッファ21とセレクタ22を経由してマルチプレクサ15から出力される。ステップS14においてマルチプレクサ15からオーディオストリームが出力されると、後述するステップS15に進む。
ステップS5において、オーディオストリームが不正フレームを含むと不正検出回路10によって検知される場合は、ステップS7に進む。
ステップS7では、セレクタ22は不正検出回路10から選択信号3を受けてバッファ21から受けるオーディオストリームの出力先を音声復号部23に選択する。ステップS7に続いてステップS9では、マルチプレクサ15は選択信号2を受けて音声符号部24からオーディオストリームを受けるよう設定される。
ステップS9に続いてステップS10では、不正検出回路10によって不正フレームの再生時間が所定時間以上連続するかかどうかが判断される。再生時間の基準は、たとえば上述の1GOPに設定される。
ステップS10において、不正フレームの再生時間が所定時間以上連続すると判断されると、ステップS11に進む。ステップS11では、不正フレームはストリーム変換部13によって、ビットレートのより低い圧縮方式のフレームに変換される。ステップS11で不正フレームが変換されると、ステップS13に進む。
また、ステップS10において、不正フレームの再生時間が所定時間未満であると判断されると、ステップS11と同様にステップS13に進む。
ステップS13では、不正フレームは音声符号部24によって無音フレームに変換される。ステップS13で不正フレームが無音フレームに変換されると、続いてステップS14に進む。
ステップS14では、音声符号部24によってビットレートの低い無音フレームに変換された不正フレームを含むオーディオストリームがマルチプレクサ15から出力される。ステップS14においてマルチプレクサ15からオーディオストリームが出力されると、ステップS15に進む。
ステップS15では、マルチプレクサ11がオーディオストリームを出力する。マルチプレクサ11は、ステップS12においてオーディオ圧縮装置9から出力されるオーディオストリームか、ステップS14においてマルチプレクサ15から出力されるオーディオストリームかのいずれかのオーディオストリームを出力する。
ステップS15でオーディオストリームが出力されると処理が終了する。
図12は、ストリーム変換部13の変形例を示す図である。図12を参照して、ストリーム変換部13は、バッファ21と、セレクタ22と、マルチプレクサ15とを含む。これらの各部の機能は図9における各部の機能と同様であるので説明は繰り返さない。
ストリーム変換部13は、さらに、LPCM方式の無音フレームを生成するLPCMデータ生成部31と、AC−3方式の無音フレームのデータを生成するAC−3データ生成部32とを含む。LPCMデータ生成部31やAC−3データ生成部32は、たとえばROMから構成される。
セレクタ22は、不正検出回路10から選択信号3を受けて、不正フレームをLPCMデータ生成部31かAC−3データ生成部32のいずれかに出力するよう選択する。LPCMデータ生成部31とAC−3データ生成部32は不正検出回路10から通知信号を受けて、不正フレームと同一の圧縮方式でよりビットレートの低い無音フレームや、不正フレームの圧縮方式よりもビットレートの低い圧縮方式の無音フレームを出力する。
図13は、ストリーム変換部13のさらに別の変形例を示す図である。不正フレームを単純に無音のフレームに置き換えただけでは切り換え前後で再生音が不連続となりノイズが発生する。図13のストリーム変換部13はこのような問題を解決する。
図13を参照して、ストリーム変換部13は、バッファ21と、セレクタ22と、マルチプレクサ15とを含む。これらの各部の機能は図9における各部の機能と同様であるので説明は繰り返さない。
ストリーム変換部は、さらに、該当の不正フレームの直後のフレームにフェードイン処理を施すフェードイン回路41と、該当の不正フレームの直前のフレームにフェードアウト処理を施すフェードアウト回路42とを含む。フェードイン処理とは再生音の音量を時間経過とともに増加させる処理である。フェードアウト処理とは再生音の音量を時間経過とともに減衰させる処理である。
図13のストリーム変換部13について、特に不正フレームを含むオーディオストリームが入力された場合の動作を説明する。不正検出回路10によってオーディオストリームに含まれる不正フレームが検出されると、不正フレームの直前のフレームがフェードアウト処理の対象としてバッファ21から出力される。バッファから出力された不正フレームの直前のフレームおよび不正フレームのオーディオデータはフェードアウト回路42によってフェードアウト処理がなされる。不正フレームの出力が終了すると、直後のフレームに対してフェードイン回路41によるフェードイン処理がなされる。
なお、不正フレームの直前のフレームはフェードアウト回路42によってオーディオデータの一部が無音化される。続いて不正フレームに含まれるオーディオデータはフェードアウト回路42によって、すべて無音化される。
図14は、図13のストリーム変換部13の処理を示す模式図である。図14を参照して、まず、時刻t2において不正フレームが検出されると、ストリーム変換部13は不正フレームの直前のフレームに対してフェードアウト処理を行なうため、バッファ21に蓄積されたデータから直前のフレームを取り出す。
次に、フェードアウト回路42によって、所定のフェードアウト時間に相当するデータに対してフェードアウト処理が行なわれる。なお、フェードインやフェードアウトの時間はさまざまに設定されるが、一例としては5〜10ミリ秒に設定される。
時刻t1から時刻t2までにフェードアウト回路42に入力される再生処理前のデータ、および時刻t5から時刻t6までにフェードイン回路41に入力される再生処理前のデータの再生音量VL2はほぼ一定である。
時刻t1〜t2にフェードアウト回路42に入力されるデータは、時刻t3〜t4においてフェードアウト回路42から出力される。フェードアウト回路42から出力される再生処理後のデータの再生音量は時刻t3〜t4において再生音量VL4から再生音量VL3に減衰する。
次に、時刻t5〜t6にフェードイン回路41に入力されるデータは、時刻t7〜t8においてフェードイン回路41から出力される。フェードイン回路41から出力される再生処理後のデータの再生音量は時刻t7〜t8において再生音量VL3から再生音量VL4へと増加する。
図15は、図13のストリーム変換部13の別の変形例を示す図である。図15を参照して、ストリーム変換部13は、バッファ21と、セレクタ22と、マルチプレクサ15と、音声復号部23と、音声符号部24とを含む。これらの各部の機能は図9における各部の機能と同様であるので説明は繰り返さない。
ストリーム変換部は、さらに、フェードアウト回路42と、フェードイン回路41と、セレクタ43と、マルチプレクサ44とを含む。フェードアウト回路42、フェードイン回路41の機能は図13における各々の機能と同様であるので説明は繰り返さない。
セレクタ43の機能は、図13におけるセレクタ22の機能と同様である。また、マルチプレクサ44の図13におけるマルチプレクサ15の機能と同様である。よって以後の説明は繰り返さない。
図15のストリーム変換部13について説明する。音声復号部23は入力されるオーディオストリームの圧縮方式を解析し、所定の圧縮方式のオーディオストリームに変換する。音声復号部23による圧縮方式の変換例としては、たとえば、AC−3方式からLPCM方式への変換である。なお、所定の圧縮方式と同一方式のオーディオストリームが音声復号部23に入力された場合、オーディオストリームは圧縮方式を変えずに出力される。
次に、オーディオストリームが不正フレームを含む場合には、フェードアウト回路42によって不正フレームの直前のフレームにフェードアウト処理がなされ、フェードイン回路41によって不正フレームの直後のフレームにフェードイン処理がなされる。フェードアウト処理とフェードイン処理は、図13における処理と各々同様であるので説明は繰り返さない。
続いて、音声符号部24によって不正フレームがビットレートのより低い無音フレームに変換されて出力される。
図13のストリーム変換部13は、単一の圧縮方式(たとえばLPCM)のオーディオストリームに対応可能である。これに対し、図15のストリーム変換部13は種々の圧縮方式のオーディオストリームに対応可能であるという利点を有する。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の画像符号化装置の応用例を示すブロック図である。 本発明の画像符号化装置において生成される多重化ストリームの模式図である。 本発明の画像符号化装置によるストリーム変換処理を示す模式図である。 MPEG方式のオーディオフレームの構成を示す図である。 実施の形態1の画像符号化装置の構成の一例を示すブロック図である。 実施の形態1の画像符号化装置の変形例を示すブロック図である。 実施の形態1の画像符号化装置の別の変形例を示すブロック図である。 実施の形態1の画像符号化装置のさらに別の変形例を示すブロック図である。 実施の形態1の画像符号化装置のさらに別の変形例を示すブロック図である。 図9の画像符号化装置によって処理されるオーディオストリームの模式図である。 図9の画像符号化装置1Dによるフレーム変換処理を示すフローチャートである。 ストリーム変換部13の変形例を示す図である。 ストリーム変換部13のさらに別の変形例を示す図である。 図13のストリーム変換部13の処理を示す模式図である。 図13のストリーム変換部13の別の変形例を示す図である。 画像符号化装置の構成の一例を示すブロック図である。 機能を拡張した画像符号化装置の構成の一例を示すブロック図である。
符号の説明
1,1A,1B,1C,1D,101 画像符号化装置、2, セットトップボックス、3 アンテナ、4,5 A/D変換器、6,102 ビデオ圧縮装置、7,7A,7B,7C,7D, オーディオストリーム生成部、8,104 システム多重化装置、9,103 オーディオ圧縮装置、10 不正検出回路、11,107 マルチプレクサ、12 マルチプレクサ、13 ストリーム変換部、14 ROM、15 マルチプレクサ、16 CRCコード変更回路、17 ダミーデータ生成回路、21 バッファ、22 セレクタ、23 音声復号部、24 音声符号部、31 LPCMデータ生成部、32 AC−3データ生成部、41 フェードイン回路、42 フェードアウト回路、43 セレクタ、44 マルチプレクサ、A01,A02,A10,A11 オーディオストリーム、B1,C1 フレーム、B10,B11 不正フレーム、C10,C11 無音フレーム、S1〜S15 ステップ、VL2〜VL4 再生音量。

Claims (9)

  1. ビデオ信号が圧縮されたビデオストリームを出力するビデオストリーム生成手段と、
    受けたオーディオストリームが正常フレームと音声が再生されない不正フレームとを含む不正オーディオストリームであった場合は前記不正フレームを無音に再生される無音フレームに変換して出力し、前記オーディオストリームが正常フレームのみを含む正常オーディオストリームであった場合は前記オーディオストリームをそのまま出力するオーディオストリーム生成手段と、
    前記ビデオストリームと前記オーディオストリームとを受けて多重化ストリームを生成する多重化手段とを備える、画像符号化装置。
  2. 前記オーディオストリーム生成手段は、
    前記オーディオストリームを受けて前記正常オーディオストリームか前記不正オーディオストリームかを検知する検知手段と、
    前記検知手段の指示を受けて無音のオーディオ信号を圧縮して前記無音フレームを生成するオーディオ圧縮手段と、
    前記検知手段の指示を受けて前記オーディオストリームと前記オーディオ圧縮手段の出力のいずれか一方を選択して出力する選択手段とを含む、請求項1に記載の画像符号化装置。
  3. 前記オーディオ圧縮手段は、
    前記検知手段の指示を受けて通常のオーディオ信号の入力と前記無音のオーディオ信号の入力とを選択するセレクタと、
    前記セレクタから出力されるオーディオ信号を圧縮してフレームを出力するオーディオ圧縮部とを有する、請求項2に記載の画像符号化装置。
  4. 前記オーディオストリーム生成手段は、
    前記オーディオストリームを受けて前記正常オーディオストリームか前記不正オーディオストリームかを検知する検知手段と、
    オーディオ信号を圧縮して第1のオーディオストリームを生成するオーディオ圧縮手段と、
    前記オーディオストリームを受けて第2のオーディオストリームを出力するストリーム変換部と、
    前記検知手段の指示を受けて前記第1のオーディオストリームと前記第2のオーディオストリームのいずれか一方を選択して出力する選択手段とを含む、請求項1に記載の画像符号化装置。
  5. 前記ストリーム変換部は、圧縮方式に応じた前記無音フレームを不揮発的に保持し、前記不正フレームを前記無音フレームに置き換えて前記第2のオーディオストリームを出力するフレーム記憶部を有する、請求項4に記載の画像符号化装置。
  6. 前記ストリーム変換部は、前記不正フレームが有する巡回冗長検査コードを書き換えて前記第2のオーディオストリームを出力するコード変更回路を有する、請求項4に記載の画像符号化装置。
  7. 前記ストリーム変換部は、前記不正フレームが有するデータから生成される巡回冗長検査コードが前記巡回冗長検査コードと一致しないように前記データを書き換えて前記第2のオーディオストリームを出力するデータ変換回路を有する、請求項4に記載の画像符号化装置。
  8. 前記ストリーム変換部は、前記不正フレームの再生時間が所定時間以上連続する場合には前記不正フレームをビットレートのより低い圧縮形式の前記無音フレームに変換し、前記不正フレームの再生時間が前記所定時間未満であれば前記不正フレームと同一の圧縮形式でビットレートのより低い前記無音フレームに変換して前記第2のオーディオストリームを出力する音声修正部を有する、請求項4に記載の画像符号化装置。
  9. 前記ストリーム変換部は、
    前記不正フレームの直前のフレームのデータに時間経過とともに再生音量が減衰するフェードアウト処理を行なうフェードアウト回路と、
    前記不正フレームの直後のフレームに時間経過とともに再生音量が増加するフェードイン処理を行なうフェードイン回路とを有する、請求項4に記載の画像符号化装置。
JP2004041776A 2004-02-18 2004-02-18 画像符号化装置 Withdrawn JP2005234122A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004041776A JP2005234122A (ja) 2004-02-18 2004-02-18 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004041776A JP2005234122A (ja) 2004-02-18 2004-02-18 画像符号化装置

Publications (1)

Publication Number Publication Date
JP2005234122A true JP2005234122A (ja) 2005-09-02

Family

ID=35017158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004041776A Withdrawn JP2005234122A (ja) 2004-02-18 2004-02-18 画像符号化装置

Country Status (1)

Country Link
JP (1) JP2005234122A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007221211A (ja) * 2006-02-14 2007-08-30 Matsushita Electric Ind Co Ltd 音声処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007221211A (ja) * 2006-02-14 2007-08-30 Matsushita Electric Ind Co Ltd 音声処理装置
JP4735311B2 (ja) * 2006-02-14 2011-07-27 パナソニック株式会社 音声処理装置

Similar Documents

Publication Publication Date Title
JP2006295344A (ja) コンテンツ処理装置
US9153241B2 (en) Signal processing apparatus
JP3504216B2 (ja) デジタルインターフェースを利用した音声ストリーム送受信装置及び方法
WO2006129546A1 (ja) 記録再生装置、記録媒体、及び集積回路
JP4013800B2 (ja) データ作成方法及びデータ記録装置
JP3596978B2 (ja) 音声再生装置
JP3416403B2 (ja) Mpegオーディオデコーダ
JP2008154132A (ja) 音声映像ストリーム圧縮装置及び音声映像記録装置
JP2005234122A (ja) 画像符号化装置
JP4735311B2 (ja) 音声処理装置
JP2006050387A (ja) データ再生方法、およびデータ再生装置
EP1497983B1 (en) Reproduction speed conversion apparatus
JP3926102B2 (ja) Mpeg方式の映像・音声データ記録システム及びその編集システム
US8719040B2 (en) Signal processing apparatus, signal processing method, and computer program
JP2008245122A (ja) データ符号化方法および装置、ならびにデータ符号化プログラム
JPH07177121A (ja) 情報多重装置
JP2000347697A (ja) 音声記録再生装置および記録媒体
KR100191314B1 (ko) 멀티채널 오디오신호의 재생장치
JP2005244303A (ja) データ遅延装置及び同期再生装置並びにデータ遅延方法
KR100839695B1 (ko) 디지털 레코더의 리핑장치 및 방법
JP2006276132A (ja) 情報記録装置
JPH09294077A (ja) 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置
JP2002014698A (ja) 音声再生装置および映像音声復号装置
JP2002351499A (ja) 音声符号化データの編集方法、及び音声符号化信号編集装置
JP2004362747A (ja) 信号処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070501